KR20240069672A - 대규모 염색체 전달 방법 및 이를 이용한 변형 염색체 및 유기체 - Google Patents
대규모 염색체 전달 방법 및 이를 이용한 변형 염색체 및 유기체 Download PDFInfo
- Publication number
- KR20240069672A KR20240069672A KR1020237045065A KR20237045065A KR20240069672A KR 20240069672 A KR20240069672 A KR 20240069672A KR 1020237045065 A KR1020237045065 A KR 1020237045065A KR 20237045065 A KR20237045065 A KR 20237045065A KR 20240069672 A KR20240069672 A KR 20240069672A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- cells
- chromosome
- target
- cell
- Prior art date
Links
- 210000000349 chromosome Anatomy 0.000 title claims abstract description 416
- 238000000034 method Methods 0.000 title claims abstract description 222
- 238000012546 transfer Methods 0.000 title claims description 22
- 210000004027 cell Anatomy 0.000 claims abstract description 455
- 239000012634 fragment Substances 0.000 claims abstract description 46
- 230000008711 chromosomal rearrangement Effects 0.000 claims abstract description 21
- 108090000623 proteins and genes Proteins 0.000 claims description 259
- 241000699666 Mus <mouse, genus> Species 0.000 claims description 208
- 241000282414 Homo sapiens Species 0.000 claims description 168
- 108010042407 Endonucleases Proteins 0.000 claims description 167
- 102000004533 Endonucleases Human genes 0.000 claims description 167
- 150000007523 nucleic acids Chemical class 0.000 claims description 166
- 102000039446 nucleic acids Human genes 0.000 claims description 163
- 108020004707 nucleic acids Proteins 0.000 claims description 163
- 239000003550 marker Substances 0.000 claims description 146
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 77
- 239000002773 nucleotide Substances 0.000 claims description 68
- 125000003729 nucleotide group Chemical group 0.000 claims description 68
- 230000005782 double-strand break Effects 0.000 claims description 52
- 102000034287 fluorescent proteins Human genes 0.000 claims description 50
- 108091006047 fluorescent proteins Proteins 0.000 claims description 50
- 239000013612 plasmid Substances 0.000 claims description 44
- 108091033409 CRISPR Proteins 0.000 claims description 41
- 238000011144 upstream manufacturing Methods 0.000 claims description 37
- 108010043121 Green Fluorescent Proteins Proteins 0.000 claims description 34
- 102000004144 Green Fluorescent Proteins Human genes 0.000 claims description 34
- 239000005090 green fluorescent protein Substances 0.000 claims description 34
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 claims description 34
- 241000894007 species Species 0.000 claims description 31
- 241000700159 Rattus Species 0.000 claims description 30
- 241000282693 Cercopithecidae Species 0.000 claims description 29
- 230000004927 fusion Effects 0.000 claims description 29
- 239000000427 antigen Substances 0.000 claims description 28
- 108091007433 antigens Proteins 0.000 claims description 28
- 102000036639 antigens Human genes 0.000 claims description 28
- 238000003780 insertion Methods 0.000 claims description 28
- 230000037431 insertion Effects 0.000 claims description 28
- 230000027455 binding Effects 0.000 claims description 27
- 238000011830 transgenic mouse model Methods 0.000 claims description 24
- 108020005004 Guide RNA Proteins 0.000 claims description 23
- 241000283973 Oryctolagus cuniculus Species 0.000 claims description 23
- 210000004754 hybrid cell Anatomy 0.000 claims description 23
- 241000283690 Bos taurus Species 0.000 claims description 22
- 241000283707 Capra Species 0.000 claims description 22
- 241000699800 Cricetinae Species 0.000 claims description 22
- 241000283074 Equus asinus Species 0.000 claims description 22
- 241000287828 Gallus gallus Species 0.000 claims description 22
- 241001494479 Pecora Species 0.000 claims description 22
- 108091008874 T cell receptors Proteins 0.000 claims description 22
- -1 CSEI Proteins 0.000 claims description 21
- 241000282836 Camelus dromedarius Species 0.000 claims description 21
- 241000700199 Cavia porcellus Species 0.000 claims description 21
- 241000283073 Equus caballus Species 0.000 claims description 21
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 20
- 238000012217 deletion Methods 0.000 claims description 19
- 230000037430 deletion Effects 0.000 claims description 19
- 210000003917 human chromosome Anatomy 0.000 claims description 19
- 108060003951 Immunoglobulin Proteins 0.000 claims description 18
- 102000018358 immunoglobulin Human genes 0.000 claims description 18
- 229950010131 puromycin Drugs 0.000 claims description 17
- 230000008685 targeting Effects 0.000 claims description 17
- 238000012258 culturing Methods 0.000 claims description 16
- 238000001943 fluorescence-activated cell sorting Methods 0.000 claims description 15
- 238000004519 manufacturing process Methods 0.000 claims description 15
- 230000004048 modification Effects 0.000 claims description 15
- 238000012986 modification Methods 0.000 claims description 15
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 14
- 210000001671 embryonic stem cell Anatomy 0.000 claims description 14
- 108010054624 red fluorescent protein Proteins 0.000 claims description 14
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 claims description 13
- 210000002230 centromere Anatomy 0.000 claims description 13
- 238000010459 TALEN Methods 0.000 claims description 12
- 108010022394 Threonine synthase Proteins 0.000 claims description 12
- 102000004419 dihydrofolate reductase Human genes 0.000 claims description 12
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 11
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- NNJPGOLRFBJNIW-HNNXBMFYSA-N (-)-demecolcine Chemical compound C1=C(OC)C(=O)C=C2[C@@H](NC)CCC3=CC(OC)=C(OC)C(OC)=C3C2=C1 NNJPGOLRFBJNIW-HNNXBMFYSA-N 0.000 claims description 9
- NNJPGOLRFBJNIW-UHFFFAOYSA-N Demecolcine Natural products C1=C(OC)C(=O)C=C2C(NC)CCC3=CC(OC)=C(OC)C(OC)=C3C2=C1 NNJPGOLRFBJNIW-UHFFFAOYSA-N 0.000 claims description 9
- 108020002494 acetyltransferase Proteins 0.000 claims description 9
- 102000005421 acetyltransferase Human genes 0.000 claims description 9
- 238000005119 centrifugation Methods 0.000 claims description 9
- 229930193140 Neomycin Natural products 0.000 claims description 8
- 108091005948 blue fluorescent proteins Proteins 0.000 claims description 8
- 108010082025 cyan fluorescent protein Proteins 0.000 claims description 8
- 210000005260 human cell Anatomy 0.000 claims description 8
- 229960004927 neomycin Drugs 0.000 claims description 8
- 108091005957 yellow fluorescent proteins Proteins 0.000 claims description 8
- 108700004991 Cas12a Proteins 0.000 claims description 7
- 108010051219 Cre recombinase Proteins 0.000 claims description 7
- 210000002459 blastocyst Anatomy 0.000 claims description 7
- 101150018129 CSF2 gene Proteins 0.000 claims description 6
- 108010083912 bleomycin N-acetyltransferase Proteins 0.000 claims description 6
- 210000002257 embryonic structure Anatomy 0.000 claims description 6
- 108010085336 phosphoribosyl-AMP cyclohydrolase Proteins 0.000 claims description 6
- 108010025815 Kanamycin Kinase Proteins 0.000 claims description 5
- 108091000080 Phosphotransferase Proteins 0.000 claims description 5
- 208000035199 Tetraploidy Diseases 0.000 claims description 5
- 102000006646 aminoglycoside phosphotransferase Human genes 0.000 claims description 5
- 108010002685 hygromycin-B kinase Proteins 0.000 claims description 5
- 102000020233 phosphotransferase Human genes 0.000 claims description 5
- 101150084750 1 gene Proteins 0.000 claims description 4
- 102100027652 COP9 signalosome complex subunit 2 Human genes 0.000 claims description 4
- 101150119033 CSE2 gene Proteins 0.000 claims description 4
- 101150017047 CSM3 gene Proteins 0.000 claims description 4
- 102100036912 Desmin Human genes 0.000 claims description 4
- 101100007792 Escherichia coli (strain K12) casB gene Proteins 0.000 claims description 4
- 101000947120 Homo sapiens Beta-casein Proteins 0.000 claims description 4
- 101000726004 Homo sapiens COP9 signalosome complex subunit 2 Proteins 0.000 claims description 4
- 101000928044 Homo sapiens Desmin Proteins 0.000 claims description 4
- 230000003213 activating effect Effects 0.000 claims description 4
- 101150100788 cmr3 gene Proteins 0.000 claims description 4
- 101150040342 cmr4 gene Proteins 0.000 claims description 4
- 101150085344 csa5 gene Proteins 0.000 claims description 4
- 101150088639 csm4 gene Proteins 0.000 claims description 4
- 101150022488 csm5 gene Proteins 0.000 claims description 4
- 101150064365 csm6 gene Proteins 0.000 claims description 4
- 102000005396 glutamine synthetase Human genes 0.000 claims description 4
- 108020002326 glutamine synthetase Proteins 0.000 claims description 4
- 230000001939 inductive effect Effects 0.000 claims description 3
- 230000003612 virological effect Effects 0.000 claims description 3
- 101150078885 CSY3 gene Proteins 0.000 claims description 2
- 102000004357 Transferases Human genes 0.000 claims description 2
- 108090000992 Transferases Proteins 0.000 claims description 2
- 229930189065 blasticidin Natural products 0.000 claims description 2
- 101150016576 csy2 gene Proteins 0.000 claims description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 2
- 241001265801 Amynthas fusing Species 0.000 claims 1
- 101150050733 Gnas gene Proteins 0.000 claims 1
- 239000002253 acid Substances 0.000 claims 1
- 150000007513 acids Chemical class 0.000 claims 1
- 241001465754 Metazoa Species 0.000 abstract description 29
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 abstract description 22
- 230000009261 transgenic effect Effects 0.000 abstract description 14
- 230000037361 pathway Effects 0.000 abstract description 11
- 230000012361 double-strand break repair Effects 0.000 abstract description 10
- 102000004169 proteins and genes Human genes 0.000 description 67
- 102000053602 DNA Human genes 0.000 description 42
- 108020004414 DNA Proteins 0.000 description 42
- 101710163270 Nuclease Proteins 0.000 description 37
- 239000013598 vector Substances 0.000 description 35
- 238000011577 humanized mouse model Methods 0.000 description 27
- 230000001404 mediated effect Effects 0.000 description 25
- 230000014509 gene expression Effects 0.000 description 24
- 108091028043 Nucleic acid sequence Proteins 0.000 description 23
- 239000000047 product Substances 0.000 description 23
- 230000001105 regulatory effect Effects 0.000 description 23
- 241000699670 Mus sp. Species 0.000 description 19
- 235000013330 chicken meat Nutrition 0.000 description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 18
- 201000010099 disease Diseases 0.000 description 16
- 210000000130 stem cell Anatomy 0.000 description 16
- 108091026890 Coding region Proteins 0.000 description 13
- 229920002477 rna polymer Polymers 0.000 description 13
- 230000008707 rearrangement Effects 0.000 description 12
- 230000006798 recombination Effects 0.000 description 12
- 238000012070 whole genome sequencing analysis Methods 0.000 description 12
- 230000004568 DNA-binding Effects 0.000 description 11
- 102100039087 Peptidyl-alpha-hydroxyglycine alpha-amidating lyase Human genes 0.000 description 11
- 239000002609 medium Substances 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000005215 recombination Methods 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 9
- 238000003776 cleavage reaction Methods 0.000 description 9
- 238000011161 development Methods 0.000 description 9
- 230000018109 developmental process Effects 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 230000006780 non-homologous end joining Effects 0.000 description 9
- 230000007017 scission Effects 0.000 description 9
- 241000206602 Eukaryota Species 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 8
- 102000004389 Ribonucleoproteins Human genes 0.000 description 8
- 108010081734 Ribonucleoproteins Proteins 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 230000007910 cell fusion Effects 0.000 description 8
- 238000005304 joining Methods 0.000 description 8
- 230000020520 nucleotide-excision repair Effects 0.000 description 8
- 230000008439 repair process Effects 0.000 description 8
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 7
- 241000124008 Mammalia Species 0.000 description 7
- 241000699660 Mus musculus Species 0.000 description 7
- 210000001744 T-lymphocyte Anatomy 0.000 description 7
- 125000003275 alpha amino acid group Chemical group 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 238000003205 genotyping method Methods 0.000 description 7
- 230000012010 growth Effects 0.000 description 7
- 102000005962 receptors Human genes 0.000 description 7
- 108020003175 receptors Proteins 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 230000033616 DNA repair Effects 0.000 description 6
- 241000282412 Homo Species 0.000 description 6
- 208000026350 Inborn Genetic disease Diseases 0.000 description 6
- 102000006601 Thymidine Kinase Human genes 0.000 description 6
- 108020004440 Thymidine kinase Proteins 0.000 description 6
- 102000040945 Transcription factor Human genes 0.000 description 6
- 108091023040 Transcription factor Proteins 0.000 description 6
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 238000010171 animal model Methods 0.000 description 6
- 239000006143 cell culture medium Substances 0.000 description 6
- 239000003623 enhancer Substances 0.000 description 6
- 208000016361 genetic disease Diseases 0.000 description 6
- 239000003102 growth factor Substances 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 102000004127 Cytokines Human genes 0.000 description 5
- 108090000695 Cytokines Proteins 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 5
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 5
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 5
- 102100040247 Tumor necrosis factor Human genes 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 230000002759 chromosomal effect Effects 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000004520 electroporation Methods 0.000 description 5
- 230000006801 homologous recombination Effects 0.000 description 5
- 238000002744 homologous recombination Methods 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 108010079892 phosphoglycerol kinase Proteins 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 125000006850 spacer group Chemical group 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- 238000010361 transduction Methods 0.000 description 5
- 230000026683 transduction Effects 0.000 description 5
- 108091079001 CRISPR RNA Proteins 0.000 description 4
- 102000019034 Chemokines Human genes 0.000 description 4
- 108010012236 Chemokines Proteins 0.000 description 4
- 230000005778 DNA damage Effects 0.000 description 4
- 231100000277 DNA damage Toxicity 0.000 description 4
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 4
- 241000270322 Lepidosauria Species 0.000 description 4
- 239000002202 Polyethylene glycol Substances 0.000 description 4
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 230000033590 base-excision repair Effects 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 229940072221 immunoglobulins Drugs 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 238000011065 in-situ storage Methods 0.000 description 4
- 238000001638 lipofection Methods 0.000 description 4
- 230000033607 mismatch repair Effects 0.000 description 4
- 229920001223 polyethylene glycol Polymers 0.000 description 4
- 230000033443 single strand break repair Effects 0.000 description 4
- 230000000153 supplemental effect Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000005945 translocation Effects 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 3
- 208000031404 Chromosome Aberrations Diseases 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 3
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- 108010002386 Interleukin-3 Proteins 0.000 description 3
- 102000000646 Interleukin-3 Human genes 0.000 description 3
- 102000004889 Interleukin-6 Human genes 0.000 description 3
- 108090001005 Interleukin-6 Proteins 0.000 description 3
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 3
- 108700020796 Oncogene Proteins 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 241000589634 Xanthomonas Species 0.000 description 3
- 210000003719 b-lymphocyte Anatomy 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 239000000306 component Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000005684 electric field Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- 229940126864 fibroblast growth factor Drugs 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- 229940076264 interleukin-3 Drugs 0.000 description 3
- 229940100601 interleukin-6 Drugs 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000002271 resection Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 230000000392 somatic effect Effects 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- IAKHMKGGTNLKSZ-INIZCTEOSA-N (S)-colchicine Chemical compound C1([C@@H](NC(C)=O)CC2)=CC(=O)C(OC)=CC=C1C1=C2C=C(OC)C(OC)=C1OC IAKHMKGGTNLKSZ-INIZCTEOSA-N 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 description 2
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 description 2
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 2
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 2
- 101150069031 CSN2 gene Proteins 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 2
- 108010005939 Ciliary Neurotrophic Factor Proteins 0.000 description 2
- 102100031614 Ciliary neurotrophic factor Human genes 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 2
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 2
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 2
- 101000634835 Homo sapiens M1-specific T cell receptor alpha chain Proteins 0.000 description 2
- 101000763322 Homo sapiens M1-specific T cell receptor beta chain Proteins 0.000 description 2
- 101000634836 Homo sapiens T cell receptor alpha chain MC.7.G5 Proteins 0.000 description 2
- 101000763321 Homo sapiens T cell receptor beta chain MC.7.G5 Proteins 0.000 description 2
- 108091008036 Immune checkpoint proteins Proteins 0.000 description 2
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 2
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 2
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 2
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 108010038501 Interleukin-6 Receptors Proteins 0.000 description 2
- 102100037792 Interleukin-6 receptor subunit alpha Human genes 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 101150008942 J gene Proteins 0.000 description 2
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 2
- 108010057466 NF-kappa B Proteins 0.000 description 2
- 102000003945 NF-kappa B Human genes 0.000 description 2
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 102000043276 Oncogene Human genes 0.000 description 2
- 102000004140 Oncostatin M Human genes 0.000 description 2
- 108090000630 Oncostatin M Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 2
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 2
- 102100029454 T cell receptor alpha chain MC.7.G5 Human genes 0.000 description 2
- 102100026967 T cell receptor beta chain MC.7.G5 Human genes 0.000 description 2
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 2
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 229940112869 bone morphogenetic protein Drugs 0.000 description 2
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 230000011712 cell development Effects 0.000 description 2
- 230000024245 cell differentiation Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 101150055601 cops2 gene Proteins 0.000 description 2
- 238000012136 culture method Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 210000002744 extracellular matrix Anatomy 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 201000010536 head and neck cancer Diseases 0.000 description 2
- 208000014829 head and neck neoplasm Diseases 0.000 description 2
- 230000016784 immunoglobulin production Effects 0.000 description 2
- 238000007901 in situ hybridization Methods 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000009545 invasion Effects 0.000 description 2
- 239000010410 layer Substances 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 108010065781 myosin light chain 2 Proteins 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000008506 pathogenesis Effects 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 230000005783 single-strand break Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 230000004936 stimulating effect Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 238000013520 translational research Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- NFGXHKASABOEEW-UHFFFAOYSA-N 1-methylethyl 11-methoxy-3,7,11-trimethyl-2,4-dodecadienoate Chemical compound COC(C)(C)CCCC(C)CC=CC(C)=CC(=O)OC(C)C NFGXHKASABOEEW-UHFFFAOYSA-N 0.000 description 1
- SQDAZGGFXASXDW-UHFFFAOYSA-N 5-bromo-2-(trifluoromethoxy)pyridine Chemical compound FC(F)(F)OC1=CC=C(Br)C=N1 SQDAZGGFXASXDW-UHFFFAOYSA-N 0.000 description 1
- 102100023990 60S ribosomal protein L17 Human genes 0.000 description 1
- 101800000263 Acidic protein Proteins 0.000 description 1
- 102100036601 Aggrecan core protein Human genes 0.000 description 1
- 108010067219 Aggrecans Proteins 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 108020005098 Anticodon Proteins 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 102100029822 B- and T-lymphocyte attenuator Human genes 0.000 description 1
- 239000012583 B-27 Supplement Substances 0.000 description 1
- 210000002237 B-cell of pancreatic islet Anatomy 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 102000004954 Biglycan Human genes 0.000 description 1
- 108090001138 Biglycan Proteins 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 101000999355 Bos taurus Interferon alpha-G Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 108010046080 CD27 Ligand Proteins 0.000 description 1
- 108010017987 CD30 Ligand Proteins 0.000 description 1
- 108010029697 CD40 Ligand Proteins 0.000 description 1
- 102100032937 CD40 ligand Human genes 0.000 description 1
- 102100025221 CD70 antigen Human genes 0.000 description 1
- 108091007914 CDKs Proteins 0.000 description 1
- 108010021064 CTLA-4 Antigen Proteins 0.000 description 1
- 229940045513 CTLA4 antagonist Drugs 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 229920001287 Chondroitin sulfate Polymers 0.000 description 1
- 208000011359 Chromosome disease Diseases 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 206010053138 Congenital aplastic anaemia Diseases 0.000 description 1
- IVOMOUWHDPKRLL-KQYNXXCUSA-N Cyclic adenosine monophosphate Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-KQYNXXCUSA-N 0.000 description 1
- 102000016736 Cyclin Human genes 0.000 description 1
- 108050006400 Cyclin Proteins 0.000 description 1
- 102000003903 Cyclin-dependent kinases Human genes 0.000 description 1
- 108090000266 Cyclin-dependent kinases Proteins 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 1
- 101150097493 D gene Proteins 0.000 description 1
- 108010076804 DNA Restriction Enzymes Proteins 0.000 description 1
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 1
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 1
- 102000004237 Decorin Human genes 0.000 description 1
- 108090000738 Decorin Proteins 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 229920000045 Dermatan sulfate Polymers 0.000 description 1
- 108700029231 Developmental Genes Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 102000009024 Epidermal Growth Factor Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 101100179475 Equus asinus IGHA gene Proteins 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 108010022894 Euchromatin Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 201000004939 Fanconi anemia Diseases 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 1
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 208000034951 Genetic Translocation Diseases 0.000 description 1
- 102100039289 Glial fibrillary acidic protein Human genes 0.000 description 1
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 1
- 108090000079 Glucocorticoid Receptors Proteins 0.000 description 1
- 102100033417 Glucocorticoid receptor Human genes 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102100036646 Glutamyl-tRNA(Gln) amidotransferase subunit A, mitochondrial Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 229920002971 Heparan sulfate Polymers 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 description 1
- 101710083479 Hepatitis A virus cellular receptor 2 homolog Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 101000864344 Homo sapiens B- and T-lymphocyte attenuator Proteins 0.000 description 1
- 101001072655 Homo sapiens Glutamyl-tRNA(Gln) amidotransferase subunit A, mitochondrial Proteins 0.000 description 1
- 101000959820 Homo sapiens Interferon alpha-1/13 Proteins 0.000 description 1
- 101001034829 Homo sapiens Interferon alpha-10 Proteins 0.000 description 1
- 101001002634 Homo sapiens Interleukin-1 alpha Proteins 0.000 description 1
- 101001033249 Homo sapiens Interleukin-1 beta Proteins 0.000 description 1
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 1
- 101000830565 Homo sapiens Tumor necrosis factor ligand superfamily member 10 Proteins 0.000 description 1
- 101150002873 IGHA gene Proteins 0.000 description 1
- 101150014496 IGHE gene Proteins 0.000 description 1
- 101150047070 Ighg gene Proteins 0.000 description 1
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 1
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 1
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 1
- 101000668058 Infectious salmon anemia virus (isolate Atlantic salmon/Norway/810/9/99) RNA-directed RNA polymerase catalytic subunit Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 102100039734 Interferon alpha-10 Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 102100020881 Interleukin-1 alpha Human genes 0.000 description 1
- 102100039065 Interleukin-1 beta Human genes 0.000 description 1
- 102000013462 Interleukin-12 Human genes 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 102100036701 Interleukin-12 subunit beta Human genes 0.000 description 1
- 101710187487 Interleukin-12 subunit beta Proteins 0.000 description 1
- 108090000176 Interleukin-13 Proteins 0.000 description 1
- 102000049772 Interleukin-16 Human genes 0.000 description 1
- 101800003050 Interleukin-16 Proteins 0.000 description 1
- 108050003558 Interleukin-17 Proteins 0.000 description 1
- 102000013691 Interleukin-17 Human genes 0.000 description 1
- 101710205006 Interleukin-18-binding protein Proteins 0.000 description 1
- 102100035017 Interleukin-18-binding protein Human genes 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 108010065637 Interleukin-23 Proteins 0.000 description 1
- 108010067003 Interleukin-33 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 102000000585 Interleukin-9 Human genes 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 102000016267 Leptin Human genes 0.000 description 1
- 108010092277 Leptin Proteins 0.000 description 1
- 108090000543 Ligand-Gated Ion Channels Proteins 0.000 description 1
- 102000004086 Ligand-Gated Ion Channels Human genes 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 102000005431 Molecular Chaperones Human genes 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 101100504121 Mus musculus Ighg gene Proteins 0.000 description 1
- 101100096028 Mus musculus Smok1 gene Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 102100035593 POU domain, class 2, transcription factor 1 Human genes 0.000 description 1
- 101710084414 POU domain, class 2, transcription factor 1 Proteins 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 241000973051 Paraburkholderia rhizoxinica Species 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 101710098940 Pro-epidermal growth factor Proteins 0.000 description 1
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 description 1
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 241000232299 Ralstonia Species 0.000 description 1
- 101100272715 Ralstonia solanacearum (strain GMI1000) brg11 gene Proteins 0.000 description 1
- 101100087805 Ralstonia solanacearum rip19 gene Proteins 0.000 description 1
- 208000035977 Rare disease Diseases 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 208000016624 Retinal neoplasm Diseases 0.000 description 1
- 239000006146 Roswell Park Memorial Institute medium Substances 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 241000242583 Scyphozoa Species 0.000 description 1
- 241000710961 Semliki Forest virus Species 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 1
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 206010041067 Small cell lung cancer Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 108700042074 T-Cell Receptor delta Genes Proteins 0.000 description 1
- 229940126547 T-cell immunoglobulin mucin-3 Drugs 0.000 description 1
- 102000007000 Tenascin Human genes 0.000 description 1
- 108010008125 Tenascin Proteins 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical class O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 208000026487 Triploidy Diseases 0.000 description 1
- 102100024598 Tumor necrosis factor ligand superfamily member 10 Human genes 0.000 description 1
- 102100032100 Tumor necrosis factor ligand superfamily member 8 Human genes 0.000 description 1
- 206010054094 Tumour necrosis Diseases 0.000 description 1
- IVOMOUWHDPKRLL-UHFFFAOYSA-N UNPD107823 Natural products O1C2COP(O)(=O)OC2C(O)C1N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-UHFFFAOYSA-N 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 101150117115 V gene Proteins 0.000 description 1
- 108700029233 VDJ Exons Proteins 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 108010031318 Vitronectin Proteins 0.000 description 1
- 102100035140 Vitronectin Human genes 0.000 description 1
- 241000589636 Xanthomonas campestris Species 0.000 description 1
- 241000589655 Xanthomonas citri Species 0.000 description 1
- 241000815873 Xanthomonas euvesicatoria Species 0.000 description 1
- 241000411046 Xanthomonas perforans Species 0.000 description 1
- 241000589643 Xanthomonas translucens Species 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 108091007916 Zinc finger transcription factors Proteins 0.000 description 1
- 102000038627 Zinc finger transcription factors Human genes 0.000 description 1
- 231100000071 abnormal chromosome number Toxicity 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 210000002798 bone marrow cell Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 108700021031 cdc Genes Proteins 0.000 description 1
- 230000018486 cell cycle phase Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 238000003163 cell fusion method Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 229940059329 chondroitin sulfate Drugs 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 208000024971 chromosomal disease Diseases 0.000 description 1
- 231100000005 chromosome aberration Toxicity 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 229960001338 colchicine Drugs 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229940095074 cyclic amp Drugs 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- AVJBPWGFOQAPRH-FWMKGIEWSA-L dermatan sulfate Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@H](OS([O-])(=O)=O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](C([O-])=O)O1 AVJBPWGFOQAPRH-FWMKGIEWSA-L 0.000 description 1
- 229940051593 dermatan sulfate Drugs 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 230000012173 estrus Effects 0.000 description 1
- 210000000632 euchromatin Anatomy 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 239000012894 fetal calf serum Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 210000001368 germline stem cell Anatomy 0.000 description 1
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- XLXSAKCOAKORKW-AQJXLSMYSA-N gonadorelin Chemical class C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 XLXSAKCOAKORKW-AQJXLSMYSA-N 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000003630 histaminocyte Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 210000003016 hypothalamus Anatomy 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000035990 intercellular signaling Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 230000001057 ionotropic effect Effects 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 229940039781 leptin Drugs 0.000 description 1
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 101150000296 luxA gene Proteins 0.000 description 1
- 101150065800 luxB gene Proteins 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 210000003519 mature b lymphocyte Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012533 medium component Substances 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 230000034217 membrane fusion Effects 0.000 description 1
- 230000025090 microtubule depolymerization Effects 0.000 description 1
- 230000029115 microtubule polymerization Effects 0.000 description 1
- 230000036456 mitotic arrest Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 210000003101 oviduct Anatomy 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000003169 placental effect Effects 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920002523 polyethylene Glycol 1000 Polymers 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 201000008933 retinal cancer Diseases 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 239000007320 rich medium Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000004017 serum-free culture medium Substances 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 208000000587 small cell lung carcinoma Diseases 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000019130 spindle checkpoint Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 230000002992 thymic effect Effects 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 230000009258 tissue cross reactivity Effects 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- OGWKCGZFUXNPDA-XQKSVPLYSA-N vincristine Chemical compound C([N@]1C[C@@H](C[C@]2(C(=O)OC)C=3C(=CC4=C([C@]56[C@H]([C@@]([C@H](OC(C)=O)[C@]7(CC)C=CCN([C@H]67)CC5)(O)C(=O)OC)N4C=O)C=3)OC)C[C@@](C1)(O)CC)CC1=C2NC2=CC=CC=C12 OGWKCGZFUXNPDA-XQKSVPLYSA-N 0.000 description 1
- 229960004528 vincristine Drugs 0.000 description 1
- OGWKCGZFUXNPDA-UHFFFAOYSA-N vincristine Natural products C1C(CC)(O)CC(CC2(C(=O)OC)C=3C(=CC4=C(C56C(C(C(OC(C)=O)C7(CC)C=CCN(C67)CC5)(O)C(=O)OC)N4C=O)C=3)OC)CN1CCC1=C2NC2=CC=CC=C12 OGWKCGZFUXNPDA-UHFFFAOYSA-N 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0603—Embryonic cells ; Embryoid bodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0603—Embryonic cells ; Embryoid bodies
- C12N5/0606—Pluripotent embryonic cells, e.g. embryonic stem cells [ES]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
- C12N5/12—Fused cells, e.g. hybridomas
- C12N5/16—Animal cells
- C12N5/166—Animal cells resulting from interspecies fusion
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2207/00—Modified animals
- A01K2207/15—Humanized animals
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/072—Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/20—Immunoglobulins specific features characterized by taxonomic origin
- C07K2317/21—Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/30—Immunoglobulins specific features characterized by aspects of specificity or valency
- C07K2317/31—Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/60—Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
- C07K2317/62—Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
- C07K2317/622—Single chain antibody (scFv)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
- C12N2015/8518—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic expressing industrially exogenous proteins, e.g. for pharmaceutical use, human insulin, blood factors, immunoglobulins, pseudoparticles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/30—Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Veterinary Medicine (AREA)
- Environmental Sciences (AREA)
- Medicinal Chemistry (AREA)
- Developmental Biology & Embryology (AREA)
- Gynecology & Obstetrics (AREA)
- Reproductive Health (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Animal Husbandry (AREA)
- Animal Behavior & Ethology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 염색체 간에 큰 서열 단편을 전달하고, 이중가닥 절단 복구 경로 및 상동성 지시 복구를 사용하여 염색체 재배열을 생성하는 방법에 관한 것이다. 추가적으로, 본 발명은 이러한 방법에 의해 생성된 염색체, 및 이들 염색체를 포함하는 세포 및 형질전환 동물에 관한 것이다.
Description
본 출원에는 EFS-WEB를 통해 ASCII 형식으로 제출된 시퀀스 목록이 포함되어 있으며, 이에 따라 전체를 참조하여 통합된다.
본 발명은 염색체 간에 큰 서열 단편을 전달하고, 이중가닥 절단 복구 경로 및 상동성 지시 복구를 사용하여 염색체 재배열을 생성하는 방법에 관한 것이다. 추가적으로, 본 발명은 이러한 방법에 의해 생성된 염색체, 및 이들 염색체를 포함하는 세포 및 형질전환 동물에 관한 것이다.
유전자 또는 염색체의 큰 조각을 조작하는 것은 기초적이고 번역적인 연구뿐만 아니라 치료법의 개발을 위한 강력한 도구이다. 인간 유전자의 크기는 수백 개의 염기에서 최소 2,300 킬로베이스(KB)까지이고, 인간 염색체의 크기는 38 메가베이스 쌍(MB)에서 거의 250 MB까지이다. 따라서, 큰 유전자, 다수의 유전자에 걸쳐 있는 영역 및 염색체의 일부에 대한 효과적인 연구는 큰 서열 조각을 조작하는 것을 필요로 한다. 그러나, 큰 단편 조작은 유전자 편집 분야에서 가장 중요한 과제 중 하나로 남아 있다. 본 발명의 목적은 큰 서열을 조작하는 방법을 제공하는 것이다.
본 발명은 하기 단계를 포함하는 조작된 염색체의 제조방법을 제공한다: (a) 표적서열을 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계; (b) 상기 세포를 하기 핵산분자와 접촉시키는 단계: (i) 표적서열의 5' 말단의 상류(upstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암(homology arm), 적어도 하나의 제1 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 제1 핵산분자; 및 (ii) 주형서열의 3' 말단의 하류(downstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암, 적어도 하나의 제2 마커, 및 표적서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5' 에서 3' 으로 포함하는 제2 핵산분자; (c) 주형서열 및 상기 제1 및 제2 마커가 표적 염색체 내로 삽입되도록, 표적서열의 양 측면, 및 주형서열의 5' 말단 및 3' 말단에서 이중가닥 절단(double strand break)을 생성하는 단계; 및 (d) 상기 제1 및 제2 마커를 발현하는 세포 또는 세포들을 선별하는 단계.
일부 실시예들에서, 제1 마커는 주형서열의 5' 말단에 위치하고 제2 마커는 주형서열의 삽입 이후 주형서열의 3' 말단에 위치한다.
일부 실시예들에서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 20 내지 2,000 bp, 약 50 내지 1,500 bp, 약 100 내지 1,400 bp, 약 150 내지 1,300 bp, 약 200 내지 1,200 bp, 약 300 내지 1,100 bp, 약 400 내지 1,000 bp, 또는 약 500 내지 900 bp, 또는 약 600 bp 내지 약 800 bp이다. 일부 실시예들에서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 400 내지 1,500 bp, 길이가 약 500 내지 1,300 bp, 또는 길이가 약 600 내지 1,000 bp이다. 일부 실시예들에서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 600 내지 1,000 bp이다.
일부 실시예들에서, 주형서열의 길이가 적어도 25 KB(kilobasepairs), 적어도 50 KB, 적어도 100 KB, 적어도 200 KB, 적어도 400 KB, 적어도 500 KB, 적어도 600 KB, 적어도 700 KB, 적어도 800 KB, 적어도 900 KB, 적어도 1 MB(megabasepair), 적어도 2 MB, 적어도 3 MB, 적어도 4 MB, 적어도 5 MB, 적어도 6 MB, 적어도 7 MB, 적어도 8 MB, 적어도 9 MB, 적어도 10 MB, 적어도 15 MB, 적어도 20 MB, 적어도 25 MB, 적어도 30 MB, 적어도 40 MB, 적어도 50 MB, 적어도 60 MB, 적어도 70 MB, 적어도 80 MB, 적어도 90 MB, 적어도 100 MB, 적어도 120 MB, 적어도 140 MB, 적어도 160 MB, 적어도 180 MB, 적어도 200 MB, 적어도 220 MB, 또는 적어도 250 MB이다. 일부 실시예들에서, 주형서열의 길이가 50 KB 내지 250 MB, 50 KB 내지 100 MB, 50 KB 내지 50 MB, 50 KB 내지 20 MB, 50 KB 내지 10 MB, 50 KB 내지 5 MB, 50 KB 내지 3 MB, 50 KB 내지 2 MB, 50 KB 내지 1 MB, 100 KB 내지 200 MB, 100 KB 내지 100 MB, 100 KB 내지 50 MB, 100 KB 내지 20 MB, 100 KB 내지 10 MB, 100 KB 내지 5 MB, 100 KB 내지 3 MB, 100 KB 내지 2 MB, 100 KB 내지 1 MB, 100 KB 내지 500 KB, 200 KB 내지 100 MB, 200 KB 내지 50 MB, 200 KB 내지 20 MB, 200 KB 내지 10 MB, 200 KB 내지 5 MB, 200 KB 내지 3 MB, 200 KB 내지 2 MB, 200 KB 내지 1 MB, 200 KB 내지 500 KB, 500 KB 내지 100 MB, 500 KB 내지 50 MB, 500 KB 내지 20 MB, 500 KB 내지 10 MB, 500 KB 내지 5 MB, 500 KB 내지 3 MB, 500 KB 내지 2 MB, 500 KB 내지 1 MB, 1 MB 내지 100 MB, 1 MB 내지 50 MB, 1 MB 내지 20 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 1 MB 내지 2 MB, 3 MB 내지 100 MB, 3 MB 내지 50 MB, 3 MB 내지 20 MB, 3 MB 내지 10 MB, 3 MB 내지 5 MB, 5 MB 내지 100 MB, 5 MB 내지 50 MB, 5 MB 내지 20 MB, 5 MB 내지 10 MB, 10 MB 내지 100 MB, 10 MB 내지 50 MB, 또는 10 MB 내지 20 MB이다. 일부 실시예들에서, 주형서열의 길이가 200 KB 내지 50 MB, 1 MB 내지 20 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 3 MB 내지 20 MB, 3 MB 내지 10 MB, 3 MB 내지 7 MB, 또는 3 MB 내지 5 MB이다.
일부 실시예들에서, 상기 단계 (c)에서 이중가닥 절단을 생성하는 단계는 이중가닥 절단을 유도하기 위해 CRISPR/Cas 엔도뉴클레아제 및 하나 이상의 가이드 핵산(guide nucleic acids, gNAs), 하나 이상의 아연 핑거 뉴클레아제(zinc finger nucleases), 하나 이상의 전사 활성화제 유사 이펙터 뉴클레아제(Transcription Activator-Like Effector Nucleases, TALEN), 또는 하나 이상의 CRE 재조합효소(CRE recombinase)를 사용하는 단계를 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas12b, Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체(homolog), 동원체(ortholog), 또는 변형된 버전을 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 Cas9, Cpf1, CasX, CasY, C2c1, C2c3, 또는 이의 동족체, 동원체 또는 변형된 버전을 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 Cas9을 포함한다. 일부 실시예들에서, gNA는 단일 가이드 RNA(single guide RNA, sgRNA)를 포함한다.
일부 실시예들에서, 표적 염색체는 제1 핵산분자의 5' 상동성 암의 서열, 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5' 에서 3'으로 포함한다. 일부 실시예들에서, 주형 염색체는 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 및 제2 핵산분자의 5' 상동성 암의 서열을, 5'에서 3'으로 포함한다.
일부 실시예들에서, 표적서열은 적어도 1개의 유전자, 적어도 2개의 유전자, 적어도 3개의 유전자, 적어도 5개의 유전자, 적어도 10개의 유전자, 적어도 20개의 유전자, 적어도 30개의 유전자, 적어도 40개의 유전자, 적어도 50개의 유전자, 적어도 100개의 유전자, 또는 적어도 200개의 유전자를 포함한다. 일부 실시예들에서, 표적서열은 주형서열의 하나 이상의 유전자와 상동성(homologous)인 하나 이상의 유전자를 포함한다.
일부 실시예들에서, 주형서열은 자연적으로 발생하는 서열을 포함한다. 일부 실시예들에서, 주형서열은 적어도 1개의 유전자, 적어도 2개의 유전자, 적어도 3개의 유전자, 적어도 5개의 유전자, 적어도 10개의 유전자, 적어도 20개의 유전자, 적어도 30개의 유전자, 적어도 40개의 유전자, 적어도 50개의 유전자, 적어도 100개의 유전자, 또는 적어도 200개의 유전자를 포함한다. 일부 실시예들에서, 주형서열은 인공 서열을 포함한다. 일부 실시예들에서, 인공 서열은 하나 이상의 항체 또는 이의 항원 결합 단편을 코딩하는 서열을 포함한다. 일부 실시예들에서, 하나 이상의 항체 또는 이의 항원 결합 단편은 scFv, 이중-특이적 항체, 또는 다중-특이적 항체를 포함한다.
일부 실시예들에서, 주형서열의 삽입에 의해 표적서열이 결실된다. 일부 실시예들에서, (a) 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 표적서열, 제2 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고; (b) 주형 염색체가 제3 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제4 sgRNA 표적서열을, 5'에서 3'으로 포함한다. 일부 실시예들에서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, 및 제1, 제2, 제3 및 제4 sgRNA와 접촉시키는 단계를 포함한다. 일부 실시예들에서, 제1, 제2, 제3 및 제4 sgRNA는 제1, 제2, 제3 및 제4 sgRNA 표적서열에 특이적인 표적서열을 포함한다.
일부 실시예들에서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함한다.
일부 실시예들에서, 주형서열의 삽입은 표적서열의 결실을 거의 또는 전혀 포함하지 않는다. 일부 실시예들에서, 주형서열의 삽입은 표적서열의 하나 이상의 기능을 파괴한다. 일부 실시예들에서, 주형서열의 삽입은 표적서열에서의 유전자를 파괴한다. 일부 실시예들에서, (a) 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고; (b) 주형 염색체가 제2 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제3 sgRNA 표적서열을, 5'에서 3'으로 포함한다. 일부 실시예들에서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, 및 제1, 제2, 및 제3 sgRNA와 접촉시키는 단계를 포함한다. 일부 실시예들에서, 제1, 제2, 및 제3 sgRNA는 제1, 제2, 및 제3 sgRNA 표적서열에 특이적인 표적서열을 포함한다. 일부 실시예들에서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함한다.
일부 실시예들에서, 제1 또는 제2 마커는 세포 내에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 형광 단백질을 포함한다. 형광 단백질은 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 적색 형광 단백질(RFP), 시안 형광 단백질(CFP), 청색 형광 단백질(BFP), dsRed, mCherry 또는 tdTomato를 포함한다. 일부 실시예들에서, 형광 단백질은 GFP를 포함한다. 일부 실시예들에서, 제1 마커는 선택가능한 마커를 추가로 포함한다. 일부 실시예들에서, 제2 마커는 선택가능한 마커를 추가로 포함한다. 일부 실시예들에서, 선택가능한 마커는 다이하이드로폴레이트 환원효소(Dihydrofolate reductase, DHFR), 글루타민 합성효소(Glutamine synthase, GS), 푸로마이신 아세틸트랜스퍼라제(Puromycin acetyltransferase), 블라스티딘 탈아미노화효소(Blasticidin deaminase), 히스티디놀 탈수소효소(Histidinol dehydrogenase), 하이그로마이신 포스포트랜스퍼라제(Hygromycin phosphotransferase, hph), 블레오마이신 내성 유전자(Bleomycin resistance gene) 및 아미노글리코사이드 포스포트랜스퍼라제(Aminoglycoside phosphotransferase, 네오마이신 내성)으로 구성된 군에서 선택된다. 일부 실시예들에서, 제1 및 제2 마커는 동일한 선택가능한 마커가 아니다. 일부 실시예들에서, 제1 마커는 세포 내에서 GFP를 발현할 수 있는 프로모터에 작동 가능하게 연결된 GFP 및 푸로마이신 아세틸트랜스퍼라제를 포함하고, 제2 마커는 하이그로마이신 포스포트랜스퍼라제를 포함한다.
일부 실시예들에서, 상기 (d) 단계 이후에 추가로, (e) 제1 또는 제2 마커의 전부 또는 일부를 삭제하는 단계를 포함한다. 일부 실시예들에서, 제1 또는 제2 마커를 삭제하는 단계는 CRISPR/Cas 엔도뉴클레아제 및 마커를 코딩하는 서열에 특이적인 표적서열을 포함하는 gNA로 결실을 유도하는 단계를 포함한다.
일부 실시예들에서, 세포는 하이브리드 세포(hybrid cells), 배아 하이브리드 줄기(embryonic hybrid stem, EHS) 세포 또는 접합체(zygotes)를 포함한다. 일부 실시예들에서, EHS 세포는 마우스(mouse), 래트(rat), 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 임의의 두 종의 ES 세포를 융합하여 제조된다. 일부 실시예들에서, EHS 세포는 인간 배아 줄기세포를 인간이 아닌 종의 배아 줄기세포에 융합하여 제조된다. 일부 실시예들에서, 인간이 아닌 종은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 또는 원숭이다. 일부 실시예들에서, EHS 세포는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 임의의 상이한 두 종의 ES 세포를 융합하여 제조된다. 일부 실시예들에서, 융합은 전기 융합(electrofusion), 바이러스 유도 융합(viral induced fusion), 또는 화학적 유도 융합(chemically induced fusion)을 포함한다.
일부 실시예들에서, 세포는 하이브리드 세포를 포함한다. 일부 실시예들에서, 하이브리드 세포를 제조하는 단계는 하기 단계를 포함한다: (a) 소핵(micronucleated) 인간 세포를 제조하는 단계; 및 (b) 하이브리드 세포를 제조하기 위해, 상기 소핵 인간 세포와 인간이 아닌 종의 세포를 융합하는 단계. 일부 실시예들에서, 소핵 인간 세포는 소핵을 유도하기에 충분한 조건하에서 인간 세포 콜세미드(colcemid)를 노출시키는 단계 및 원심분리를 이용하여 소핵 세포를 수집하는 단계에 의해 제조된다. 일부 실시예들에서, 인간이 아닌 종은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 또는 원숭이다. 일부 실시예들에서, 인간이 아닌 종의 세포는 ES 세포이고, 하이브리드 세포는 EHS 세포이다.
일부 실시예들에서, 표적서열은 면역글로불린 또는 T 세포 수용체 서브유닛(subunit)을 코딩하는 유전자를 포함한다. 일부 실시예들에서, 표적 염색체는 마우스 염색체 12(mouse chromosome 12)를 포함하고 주형 염색체는 인간 염색체 14(human chromosome 14)를 포함하거나, 표적 염색체는 마우스 염색체 6(mouse chromosome 6)을 포함하고 주형 염색체는 인간 염색체 2(human chromosome 2)를 포함한다. 일부 실시예들에서, 표적서열은 마우스 Igh 가변영역 서열을 포함한다. 일부 실시예들에서, 마우스 Igh 가변영역 서열은 마우스 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재(intervening) 비-코딩 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGH 가변영역 서열을 포함한다. 일부 실시예들에서, 인간 IGH 가변영역 서열은 인간 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 표적서열은 마우스 Igl 가변영역 서열을 포함한다. 일부 실시예들에서, 표적서열은 마우스 Igk 가변영역 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGL 가변영역 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGK 가변영역 서열을 포함한다. 일부 실시예들에서, 마우스 Igk 가변영역 서열은 마우스 Vk, 및 Jk1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGK 가변영역 서열을 포함한다. 일부 실시예들에서, 인간 IGK 가변영역 서열은 인간 Vk, 및 Jk1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다.
일부 실시예들에서, 방법은 상기 단계 (d)에서 선별된 세포로부터 조작된 염색체를 회수하는 단계를 추가적으로 포함한다. 일부 실시예들에서, 조작된 염색체를 회수하는 단계는 소핵을 유도하기에 충분한 조건하에서 세포를 콜세미드에 노출시키는 단계 및 원심분리를 이용하여 소핵 세포를 수집하는 단계를 포함한다.
일부 실시예들에서, 제1 및 제2 핵산분자는 플라스미드이다.
본 발명은 본 발명의 방법에 의해 제조된 조작된 염색체를 제공한다.
일부 실시예들에서, 조작된 염색체는 마우스 Igh 가변영역을 대신하여 인간 IGH 가변영역의 서열을 포함하는 마우스 염색체 12이다. 일부 실시예들에서, 마우스 Igh 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 인간 IGH 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 조작된 염색체는 마우스 Igk 가변영역을 대신하여 인간 IGK 가변영역의 서열을 포함하는 마우스 염색체 6이다.
일부 실시예들에서, 마우스 Igk 가변영역 서열은 마우스 Vk, 및 Jk1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGK 가변영역 서열을 포함한다. 일부 실시예들에서, 인간 IGK 가변영역 서열은 인간 Vk, 및 Jk1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다.
본 발명은 본 발명의 조작된 염색체를 포함하는 세포를 제공한다.
일부 실시예들에서, 세포는 마우스 ES 세포와 혼성화할 수 있는 세포이다. 일부 실시예들에서, 세포는 배아줄기(ES) 세포, 배아 하이브리드 줄기(EHS) 세포, 또는 접합체(zygote)인 세포이다. 일부 실시예들에서, EHS 세포는 인간 및 마우스 ES 세포의 하이브리드인 세포이다. 일부 실시예들에서, ES 세포는 마우스 ES 세포인 세포이다. 일부 실시예들에서, 세포는 소핵 세포인 세포이다.
본 발명은 하기 단계를 포함하는 마우스 배아줄기(ES) 세포의 제조방법을 제공한다: (a) 본 발명의 어느 방법 중 하나의 방법에 의해 제조된 조작된 염색체를 포함하는 소핵 세포를 융합시키는 단계, 여기서: (i) 마우스 ES 세포는 조작된 염색체와 상동 염색체를 포함하고, 상동 염색체는 ES 세포에서 형광 단백질을 발현할 수 있는 프로모터와 작동 가능하게 연결된 제1 형광 단백질을 포함함; 및 (ii) 소핵 세포의 적어도 하나의 서브세트는 조작된 염색체를 포함하고, 조작된 염색체는 제1 형광 단백질과 상이한 제2 형광 단백질을 포함하며, 제2 형광 단백질은 ES 세포에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 것임; (b) 제1 및 제2 형광 단백질을 모두 발현하는 ES 세포를 선별하는 단계; (c) 상동 염색체가 ES 세포의 적어도 하나의 서브세트에 의해 소실될 때까지 단계 (c)에서 선별된 ES 세포를 배양하는 단계; 및 (d) 제2 형광 단백질을 발현하고 제1 형광 단백질을 발현하지 않는 ES 세포를 선별하는 단계.
일부 실시예들에서, 상기 단계 (c)에서 세포를 배양하는 단계는 적어도 5일, 적어도 7일, 적어도 10일, 또는 적어도 14일 동안 세포를 배양하는 단계를 포함한다. 일부 실시예들에서, 상기 단계 (b) 및 (d)에서 세포를 선별하는 단계는 형광 활성화 세포 분류(fluorescence activated cell sorting, FACS)를 포함한다.
본 발명은 본 발명의 방법에 의해 제조된 마우스 ES 세포를 제공한다.
본 발명은 본 발명의 마우스 ES 세포로부터 제조된 형질전환(transgenic) 마우스를 제공한다.
일부 실시예들에서, 형질전환 마우스를 생산하는 단계는 ES 세포를 이배체 배반포(diploid blastocyst)에 주입하는 단계, ES 세포에서 핵이 제거된(enucleated) 마우스 배아로의 핵 이식, 또는 4배체 배아 보완을 포함한다. 일부 실시예들에서, 마우스 염색체 12는 마우스 Igh 가변영역 대신 인간 IGH 가변영역의 서열을 포함한다. 일부 실시예들에서, 마우스 Igh 가변영역은 마우스 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 인간 IGH 가변영역은 인간 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 마우스 염색체 6은 마우스 Igk 가변영역 대신 인간 IGK 가변영역의 서열을 포함한다. 일부 실시예들에서, 마우스 Igk 가변영역 서열은 마우스 Vk, 및 Jk1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGK 가변영역 서열을 포함한다. 일부 실시예들에서, 인간 IGK 가변영역 서열은 인간 Vk, 및 Jk1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다.
본 발명은 하기 단계를 포함하는 항체의 제조방법을 제공한다: (a) 형질전환 마우스가 인간 IGH 가변영역으로부터 인간 V, D 및 J 세그먼트를 포함하는 복수의 항체가 제조되도록, 본 발명의 형질전환 마우스에 항원을 자극하는(challenging) 단계; 및 (b) 항원에 특이적인 항체를 분리하는 단계.
본 발명은 하기 단계를 포함하는 항체의 제조방법을 제공한다: (a) 형질전환 마우스가 인간 IGK 또는 IGL 가변영역으로부터 인간 V, 및 J 세그먼트를 포함하는 복수의 항체가 제조되도록, 본 발명의 형질전환 마우스에 항원을 자극하는(challenging) 단계; 및 (b) 항원에 특이적인 항체를 분리하는 단계.
본 발명은 본 발명의 형질전환 마우스에 의해 제조된 항체로부터 유도된 항체를 제공한다. 일부 실시예들에서, 항체는 단일 사슬 가변 단편(scFv), 이중-특이적 항체 또는 다중-특이적 항체를 포함한다.
본 발명은 하기 단계를 포함하는 염색체 재배열(rearrangement)의 제조방법을 제공한다: (a) 표적 위치를 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계; (b) 표적 위치의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 5' 상동성 암, 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 핵산분자와 상기 세포를 접촉시키는 단계; (c) 상기 마커가 5' 상동성 암의 서열의 표적 염색체 3' 내로 삽입되고 염색체 재배열이 제조되도록, 표적 위치, 및 주형서열의 5' 말단에서 이중가닥 절단을 제조하는 단계; 및 (d) 상기 마커를 발현하는 세포 또는 세포들을 선별하는 단계.
일부 실시예들에서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 20 내지 2,000 bp, 약 50 내지 1,500 bp, 약 100 내지 1,400 bp, 약 150 내지 1,300 bp, 약 200 내지 1,200 bp, 약 300 내지 1,100 bp, 약 400 내지 1,000 bp, 또는 약 500 내지 900 bp, 또는 약 600 bp 내지 약 800 bp이다. 일부 실시예들에서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 400 내지 1,500 bp, 길이가 약 500 내지 1,300 bp, 또는 길이가 약 600 내지 1,000 bp이다. 일부 실시예들에서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 600 내지 1,000 bp이다.
일부 실시예들에서, 상기 단계 (c)에서 이중가닥 절단을 생성하는 단계는 이중가닥 절단을 유도하기 위해 CRISPR/Cas 엔도뉴클레아제 및 적어도 하나의 sgRNA, 하나 이상의 아연 핑거 뉴클레아제, 하나 이상의 전사 활성화제 유사 이펙터 뉴클레아제(TALEN), 또는 하나 이상의 CRE 재조합효소를 사용하는 단계를 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas12b, Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체, 동원체, 또는 변형된 버전을 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 Cas9, Cpf1, CasX, CasY, C2c1, C2c3, 또는 이의 동족체, 동원체 또는 변형된 버전을 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 Cas9을 포함한다. 일부 실시예들에서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, CRISPR/Cas 엔도뉴클레아제가 표적 위치를 절단도록 표적 위치에 특이적인 표적서열을 포함하는 적어도 하나의 제1 gNA, 및 주형서열의 5' 말단에 특이적인 표적서열을 포함하는 제2 gNA와 접촉시키는 단계를 포함한다. 일부 실시예들에서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함한다.
일부 실시예들에서, 마커는 세포 내에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 형광 단백질을 포함한다. 일부 실시예들에서, 형광 단백질은 GFP, YFP, RFP, CFP, BFP, dsRed, mCherry 또는 tdTomato를 포함한다. 일부 실시예들에서, 마커는 선택가능한 마커를 추가로 포함한다. 일부 실시예들에서, 선택가능한 마커는 다이하이드로폴레이트 환원효소(DHFR), 글루타민 합성효소(GS), 푸로마이신 아세틸트랜스퍼라제, 블라스티딘 탈아미노화효소, 히스티디놀 탈수소효소, 하이그로마이신 포스포트랜스퍼라제(hph), 블레오마이신 내성 유전자 및 아미노글리코사이드 포스포트랜스퍼라제(네오마이신 내성)으로 구성된 군에서 선택된다.
일부 실시예들에서, 세포는 배아줄기(ES) 세포를 포함한다.
일부 실시예들에서, 핵산분자는 플라스미드이다.
본 발명은 본 발명의 방법에 의해 제조된 염색체 재배열을 포함하는 세포를 제공한다. 일부 실시예들에서, 세포는 마우스 ES 세포인 세포이다.
본 발명은 본 발명의 방법에 의해 제조된 마우스 ES 세포로부터의 형질전환 마우스를 제공한다.
본 개시내용의 특징들 및 이점들에 대한 더 나은 이해는 예시적인 실시예들을 규정하는 이하의 상세한 설명 및 그에 수반되는 도면들을 참조함으로써 얻어질 것이다:
도 1은 위에서 아래 순으로, 가변 도메인(VH, DH 및 JH1-6)이 인간화된, 마우스 면역글로불린 중쇄 복합체(Igh), 인간 Igh 및 마우스 Igh를 나타낸 것이다. Chro: 염색체.
도 2는 전기 융합을 통한 조작된 마우스와 인간 배아줄기세포(ES)의 혼성화를 나타낸 것이다. 마우스 ES 세포는 마커 네오마이신을 발현하고, 인간 ES는 mCherry를 발현한다. 배아 하이브리드 줄기세포(하이브리드마 세포)는 G418에 내성이 있으며, mCherry에 양성이다.
도 3a는 인간 Igh 유전자 VH, DH 및 JH1-6 영역에 3쌍의 PCR 프라이머(화살표로 표시)가 배치된 것을 보여주는 모식도로, 배아 하이브리드 줄기(EHS) 세포의 유전자형을 분석하는데 사용되었다.
도 3b는 도 3a에 도시된 프라이머를 이용하여 유전자형을 분석한 12개의 배아 하이브리드 줄기(EHS) 세포 클론에 대한 PCR 결과를 나타낸 예시적인 겔이다.
도 4a 내지 도 4b는 HDR-매개 염색체 재배열(HCMR) HDR: 상동성 지시 복구를 통해 EHS 세포(도 4a)에서 조작된 인간화 염색체를 확립하기 위한 파이프라인을 나타낸 도면이다. EHS 세포는 마우스 Igh 유전자의 5'에 상동성인 5' 암, 인간 Igh 유전자의 5'에 상동성인 3' 암 및 pCMV-EGFP-polyA-PGK-Puromycin-polyA 카세트를 포함하는 5' HMCR 플라스미드; 인간 Igh 가변 유전자좌의 3' 말단에 상동성인 5' 암, 마우스 Igh 가변 유전자좌의 3'에 상동성인 3' 암 및 PGK-하이그로마이신-polyA 카세트를 포함하는 3' HMCR 플라스미드 및 (*)에 나타난 바와 같이, 마우스 Igh 및 인간 Igh의 5' 및 3' 가변 도메인을 표적으로 하는 Cas9 및 sgRNA를 포함하는 4개의 플라스미드로 공동 형질감염되었다. 또는 (도 4b) CRE-Loxp 매개 염색체 재배열 (CMCR): CMCR 과정을 매개하기 위해 4개의 플라스미드가 설계되었다. 마우스 Igh 5' (pCMV-GFP-BGH PolyA-Loxp) 및 3' (BGH polyA-Loxp-511-Hygromycin-BGH polyA-PGK-BSD-BGH PolyA) 플라스미드는 마우스 Igh 변수 유전자좌의 5' 및 3' 말단에 각각 삽입되도록 설계되었다. 동시에, 인간 IGH 5' (BGH polyA-Loxp-BGH PolyA-PGP-Neomycin-BGH PolyA) 및 3' (pCMV-BGP-BGH PolyA-PGK-Loxp-511) 플라스미드는 인간 IGH 변수 유전자좌의 5' 및 3' 말단에 각각 삽입되도록 설계되었다. Cre는 CMCR을 위해 성공적으로 통합된 EHS 세포로 형질감염되었다.
도 5a는 조작된 인간 염색체의 검증에 사용되는 PCR 프라이머(화살표로 표시)의 배치를 나타낸 도면이다.
도 5b는 도 5a에 나열된 4쌍의 프라이머를 이용한 PCR 결과를 나타낸다. 192개의 단일 클론에 대한 결과를 나타낸다.
도 6은 마우스 ES 세포에서 마우스 염색체를 조작된 인간 염색체로 치환한 것을 보여주는 도면이다. GFP로 표지된 조작된 인간 염색체를 운반하는 EHS 세포를 콜세미드에 노출시켜 미세화하고, 원심분리에 의해 마이크로 세포를 수집하고, 상응하는 마우스 염색체가 mCherry로 표지된 마우스 ES 세포에 전기 융합하였다. GFP+ mCherry+ 세포를 형광 활성화 세포 분류(FACS)에 의해 분리하였다. 그 후 세포를 배양하고, 마우스 염색체를 상실한 GFP+ mCherry- 세포를 FACS에 의해 분리하였다.
도 7a는 Igh 인간화 마우스를 검증하기 위해 사용된 PCR 프라이머(화살표로 나타낸 것)의 배치를 나타낸다.
도 7b는 도 7a에 도시된 7쌍의 프라이머를 이용한 예시적인 Igh 인간화 마우스에 대한 PCR 결과를 나타낸다.
도 8a는 Igh 인간화 마우스에 대한 형광 제자리 혼성화(FISH) 결과를 나타낸다.
도 8b는 Igh 인간화 마우스에 대한 G-banding 핵형 분석을 나타낸다.
도 9a는 Igh 인간화 마우스의 IGH-V에 대한 전체 게놈 시퀀싱(WGS) 분석을 나타낸다. 인간 Igh의 VH 영역에 위치한 각 가변(V) 유전자 세그먼트에 대한 WGS 서열의 카피 수를 나타낸다.
도 9b는 Igh 인간화 마우스의 IGH-D 및 IGH-J에 대한 WGS 분석을 나타낸 것이다. 인간 Igh의 DH 및 JH1-6 영역에 위치한 다이버시티(D) 유전자 세그먼트 및 6개의 접합(J) 세그먼트에 대한 WGS 서열의 카피 수를 나타낸다.
도 10은 마우스 Igk 유전자의 가변 도메인의 인간화를 나타낸다.
도 11a 내지 도 11b는 Igk 인간화 마우스의 PCR 검증 결과를 나타낸다. 도 11a, PCR 실험에 사용된 디자인 프라이머의 위치. 도 11b, Igk 인간화 mcie에 대해 panel A에 나열된 프라이머 5쌍을 사용한 PCR 결과를 나타낸다.
도 12는 Igk 인간화 마우스의 WGS 분석 결과를 나타낸다. 인간 IGK 유전자의 VK 및 Jk 세그먼트 상에 위치한 각각의 항체 유전자에 대한 WGS 서열로부터의 카피 번호를 나타낸다.
도 1은 위에서 아래 순으로, 가변 도메인(VH, DH 및 JH1-6)이 인간화된, 마우스 면역글로불린 중쇄 복합체(Igh), 인간 Igh 및 마우스 Igh를 나타낸 것이다. Chro: 염색체.
도 2는 전기 융합을 통한 조작된 마우스와 인간 배아줄기세포(ES)의 혼성화를 나타낸 것이다. 마우스 ES 세포는 마커 네오마이신을 발현하고, 인간 ES는 mCherry를 발현한다. 배아 하이브리드 줄기세포(하이브리드마 세포)는 G418에 내성이 있으며, mCherry에 양성이다.
도 3a는 인간 Igh 유전자 VH, DH 및 JH1-6 영역에 3쌍의 PCR 프라이머(화살표로 표시)가 배치된 것을 보여주는 모식도로, 배아 하이브리드 줄기(EHS) 세포의 유전자형을 분석하는데 사용되었다.
도 3b는 도 3a에 도시된 프라이머를 이용하여 유전자형을 분석한 12개의 배아 하이브리드 줄기(EHS) 세포 클론에 대한 PCR 결과를 나타낸 예시적인 겔이다.
도 4a 내지 도 4b는 HDR-매개 염색체 재배열(HCMR) HDR: 상동성 지시 복구를 통해 EHS 세포(도 4a)에서 조작된 인간화 염색체를 확립하기 위한 파이프라인을 나타낸 도면이다. EHS 세포는 마우스 Igh 유전자의 5'에 상동성인 5' 암, 인간 Igh 유전자의 5'에 상동성인 3' 암 및 pCMV-EGFP-polyA-PGK-Puromycin-polyA 카세트를 포함하는 5' HMCR 플라스미드; 인간 Igh 가변 유전자좌의 3' 말단에 상동성인 5' 암, 마우스 Igh 가변 유전자좌의 3'에 상동성인 3' 암 및 PGK-하이그로마이신-polyA 카세트를 포함하는 3' HMCR 플라스미드 및 (*)에 나타난 바와 같이, 마우스 Igh 및 인간 Igh의 5' 및 3' 가변 도메인을 표적으로 하는 Cas9 및 sgRNA를 포함하는 4개의 플라스미드로 공동 형질감염되었다. 또는 (도 4b) CRE-Loxp 매개 염색체 재배열 (CMCR): CMCR 과정을 매개하기 위해 4개의 플라스미드가 설계되었다. 마우스 Igh 5' (pCMV-GFP-BGH PolyA-Loxp) 및 3' (BGH polyA-Loxp-511-Hygromycin-BGH polyA-PGK-BSD-BGH PolyA) 플라스미드는 마우스 Igh 변수 유전자좌의 5' 및 3' 말단에 각각 삽입되도록 설계되었다. 동시에, 인간 IGH 5' (BGH polyA-Loxp-BGH PolyA-PGP-Neomycin-BGH PolyA) 및 3' (pCMV-BGP-BGH PolyA-PGK-Loxp-511) 플라스미드는 인간 IGH 변수 유전자좌의 5' 및 3' 말단에 각각 삽입되도록 설계되었다. Cre는 CMCR을 위해 성공적으로 통합된 EHS 세포로 형질감염되었다.
도 5a는 조작된 인간 염색체의 검증에 사용되는 PCR 프라이머(화살표로 표시)의 배치를 나타낸 도면이다.
도 5b는 도 5a에 나열된 4쌍의 프라이머를 이용한 PCR 결과를 나타낸다. 192개의 단일 클론에 대한 결과를 나타낸다.
도 6은 마우스 ES 세포에서 마우스 염색체를 조작된 인간 염색체로 치환한 것을 보여주는 도면이다. GFP로 표지된 조작된 인간 염색체를 운반하는 EHS 세포를 콜세미드에 노출시켜 미세화하고, 원심분리에 의해 마이크로 세포를 수집하고, 상응하는 마우스 염색체가 mCherry로 표지된 마우스 ES 세포에 전기 융합하였다. GFP+ mCherry+ 세포를 형광 활성화 세포 분류(FACS)에 의해 분리하였다. 그 후 세포를 배양하고, 마우스 염색체를 상실한 GFP+ mCherry- 세포를 FACS에 의해 분리하였다.
도 7a는 Igh 인간화 마우스를 검증하기 위해 사용된 PCR 프라이머(화살표로 나타낸 것)의 배치를 나타낸다.
도 7b는 도 7a에 도시된 7쌍의 프라이머를 이용한 예시적인 Igh 인간화 마우스에 대한 PCR 결과를 나타낸다.
도 8a는 Igh 인간화 마우스에 대한 형광 제자리 혼성화(FISH) 결과를 나타낸다.
도 8b는 Igh 인간화 마우스에 대한 G-banding 핵형 분석을 나타낸다.
도 9a는 Igh 인간화 마우스의 IGH-V에 대한 전체 게놈 시퀀싱(WGS) 분석을 나타낸다. 인간 Igh의 VH 영역에 위치한 각 가변(V) 유전자 세그먼트에 대한 WGS 서열의 카피 수를 나타낸다.
도 9b는 Igh 인간화 마우스의 IGH-D 및 IGH-J에 대한 WGS 분석을 나타낸 것이다. 인간 Igh의 DH 및 JH1-6 영역에 위치한 다이버시티(D) 유전자 세그먼트 및 6개의 접합(J) 세그먼트에 대한 WGS 서열의 카피 수를 나타낸다.
도 10은 마우스 Igk 유전자의 가변 도메인의 인간화를 나타낸다.
도 11a 내지 도 11b는 Igk 인간화 마우스의 PCR 검증 결과를 나타낸다. 도 11a, PCR 실험에 사용된 디자인 프라이머의 위치. 도 11b, Igk 인간화 mcie에 대해 panel A에 나열된 프라이머 5쌍을 사용한 PCR 결과를 나타낸다.
도 12는 Igk 인간화 마우스의 WGS 분석 결과를 나타낸다. 인간 IGK 유전자의 VK 및 Jk 세그먼트 상에 위치한 각각의 항체 유전자에 대한 WGS 서열로부터의 카피 번호를 나타낸다.
본 발명은 염색체들 사이에서 서열의 큰 단편들을 전달하는 단계를 포함하는 염색체 공학용 방법들을 제공한다. 본원에 개시된 방법들을 사용하여, 적어도 5 메가베이스 쌍들(MB)의 서열들은 염색체 주형으로부터 표적 염색체로 전달될 수 있다. 본원에 개시된 방법들은 또한 역전 및 전위와 같은 염색체 재배열들을 생성하기 위해 사용될 수 있다. 또한 본원에 제공된 것은 본 발명의 방법들에 의해 생성된 조작된 염색체들 뿐만 아니라, 이들 조작된 염색체들을 포함하는 세포 및 동물들, 및 이들을 사용하는 방법들이다.
유전자 또는 염색체의 큰 조각의 조작은 치료법의 개발뿐만 아니라 기초 및 번역 연구 모두에 큰 가능성을 가지고 있다. 유전자 인간화는 가장 인기 있는 응용 분야 중 하나로, 예를 들어, 마우스와 같은 모델 유기체의 유전자가 인간 대응물로 대체된다. 예를 들어, 인간화된 Ig 유전자를 운반하는 마우스는 마우스 배경에서 인간 항체 생산을 위한 강력한 플랫폼을 제공한다. 그러나, 최대 백만 염기쌍(MB)의 염색체의 큰 조각을 운반할 수 있는 전달 벡터를 이용할 수 없기 때문에, 큰 조각 조작은 유전자 편집 분야에서 가장 중요한 과제 중 하나로 남아 있다. 아데노-연관 바이러스 벡터 또는 다른 바이러스 벡터와 같은 종래의 전달 벡터의 페이로드는 벡터가 유래되는 바이러스 유전체의 크기에 의해 제한된다.
본 명세서에 개시된 방법들은 염색체 간에 큰 서열의 효율적인 in situ 치환을 가능하게 한다. MASIRT(Massive fragment Across Species In situ Replacement Technology)라고 하는 이러한 방법들은 단일 편집 단계, 경우에 따라 서열의 메가베이스 쌍(MB)까지 염색체의 많은 부분을 대체하는 데 사용될 수 있다. 이러한 방법들은 종 간 또는 단일 종 내의 염색체 간에 큰 서열을 효율적으로 전달하는 데 사용될 수 있다. 일 실시예에서, MASIRT를 사용하여 마우스 Igh 유전자의 가변 도메인에 대해 인간화된 마우스를 수득하였다. 인간과 마우스는 항체 유전자의 배열 및 발현에서 높은 유사성을 나타내고, 중쇄의 유전체 조직 또한 이들 종 간에 유사하다. 따라서, 모든 VH, DH 및 JH 유전자 세그먼트를 포함하는 마우스 유전체 서열의 약 3MB를 동등한 인간 유전자 단편을 포함하는 연속 인간 유전체 서열의 약 1MB로 대체하기 위해 MASIRT를 사용하여 인간화된 마우스 Igh 유전자를 수득하였다.
배아 줄기세포에만 작용하는 다른 방법들과 달리, 본 발명의 방법들은 유리하게는 접합체의 큰 서열을 대체하는 데 사용될 수 있다. 배아 줄기세포주는 일반적으로 쥐 이외의 종에 대해서는 이용 가능하지 않다. 대조적으로, 접합체는 많은 포유동물에 이용 가능하므로, 본 발명의 방법들은 유전자 또는 유전자 단편에 대해 인간화된 토끼 또는 소와 같은 동물을 수득하는 데 사용될 수 있다. 추가로, 본 명세서에 개시된 방법들은 큰 서열 단편, 예를 들어, 당업계에 공지된 다른 방법에 의해 사용되는 방법보다 약 5배 큰 적어도 5MB까지의 서열을 한 번에 대체하는 데 사용될 수 있다. 이는 효율을 증가시키고, 인간화된 유전자를 갖는 동물을 생성하는 데 필요한 시간 및 비용을 감소시킨다. 예를 들어, Igh 인간화 마우스는 단 3회의 교체만으로 제조될 수 있다. 추가적인 이점은 마우스에서 사용될 때, 각 교체에 1-3개월만 소요되며, 이는 당업계에 공지된 다른 방법에 대해 필요한 시간의 1/2 또는 1/3에 불과하다는 것이다.
정의
염색체는 유기체의 유전물질 전부 또는 일부를 포함하는 긴 DNA 분자이다. 대부분의 진핵염색체는 샤페론 단백질의 도움을 받아 DNA 분자에 결합하고 응축하여 무결성을 유지하는 히스톤이라는 포장 단백질을 포함한다. 진핵염색체는 단백질과 연결된 긴 선형 DNA 분자로 구성되어 있으며, 염색질이라고 불리는 단백질과 DNA의 조밀한 복합체를 형성한다. 각 염색체에는 하나의 중심체가 있고, 하나 또는 두 개의 팔이 중심부에서 돌출되어 있다. 염색체의 팔은 텔로미어로 끝나는데, 텔로미어는 반복적인 뉴클레오타이드 서열로 특화된 단백질과 관련되어 있으며, DNA 복구 시스템이 DNA 가닥의 맨 끝 부분을 이중가닥 절단으로 오인하는 것을 방지하여 염색체 DNA의 말단 부위를 점진적인 분해로부터 보호하고 선형 염색체의 무결성을 보장한다.
"유전자"는 유전자 산물(예를 들어, 단백질, 또는 비-코딩 RNA)을 코딩하는 DNA 영역뿐만 아니라, 이러한 조절 서열이 코딩 및/또는 전사된 서열에 인접하는지 여부에 관계없이 유전자 산물의 생산을 조절하는 모든 DNA 영역을 포함한다. 따라서, 유전자는 프로모터 서열, 터미네이터, 리보솜 결합 부위 및 내부 리보솜 진입 부위와 같은 번역 조절 서열, 인핸서, 소음기, 절연체, 경계 요소, 복제 기원, 매트릭스 부착 부위 및 유전자좌 조절 영역을 포함하지만 반드시 이에 제한되지는 않는 조절 요소 서열을 포함할 수 있다. 코딩 서열은 전사 또는 전사 및 번역 시에 유전자 산물을 코딩한다. 본 발명의 코딩 서열은 단편을 포함할 수 있으며, 전체 길이 오픈 리딩 프레임을 포함할 필요는 없다. 유전자는 안티코돈을 포함하는 상보적인 가닥뿐만 아니라 전사되는 가닥 모두를 포함할 수 있다. 유전자는 또한 단백질 코딩 서열 및 비-번역 영역을 포함할 수 있는 엑손뿐만 아니라, 최종 RNA 산물로부터 스플라이싱에 의해 제거된 인트론을 포함할 수 있다.
본 명세서에서 "프로모터"란 재조합 산물을 코딩하는 DNA 서열에 인접하여 위치하는 DNA 서열을 의미할 수 있다. 프로모터는 바람직하게는 인접한 DNA 서열에 작동적으로 연결된다. 프로모터는 전형적으로 프로모터가 존재하지 않을 때 발현되는 양에 비해 DNA 서열로부터 발현되는 단백질 또는 RNA 산물의 양을 증가시킨다. 한 유기체로부터의 프로모터는 다른 유기체로부터 유래된 DNA 서열로부터 단백질 발현을 향상시키는데 사용될 수 있다. 예컨대, 척추동물에서 해파리 GFP의 발현을 위해 척추동물 프로모터를 사용할 수 있다. 뿐만 아니라, 하나의 프로모터 요소는 나란히 부착된 다수의 DNA 서열에 대해 발현되는 재조합 산물의 양을 증가시킬 수 있다. 따라서, 하나의 프로모터 요소는 하나 이상의 재조합 산물의 발현을 향상시킬 수 있다. 다수의 프로모터 요소는 당업계의 통상의 기술자에게 공지되어 있다.
본 명세서에서 말하는 "인핸서"는 단백질 또는 RNA 생성물을 코딩하는 DNA 서열에 인접하여 위치하거나, 단백질 또는 RNA 생성물을 코딩하는 DNA 서열로부터 먼 쪽에 위치하는 DNA 서열을 지칭할 수 있다. 인핸서 요소는 전형적으로 프로모터 요소의 상류에 위치하지만, 코딩 DNA 서열의 하류 또는 인트론 내와 같이 그 내에 위치할 수 있다. 경우에 따라, 인핸서는 그 발현을 조절하는 유전자로부터 킬로베이스 또는 심지어 수십 킬로베이스에 위치할 수 있다. 인핸서 요소는 프로모터 요소에 의해 제공되는 상기 DNA 서열로부터 발현되는 단백질 또는 RNA 생성물의 양을 증가시킬 수 있다. 다수의 인핸서 요소는 당업계의 통상의 기술자에 의해 용이하게 이용가능하다.
본 명세서에서 말하는 '외인성 염색체' 또는 '외인성 서열'은 동물의 유전체에 대한 외래 염색체 또는 외래 서열을 의미한다. 예를 들어, 단일 인간 염색체를 제외한 모든 염색체가 마우스 염색체인 마우스 세포에서 인간 염색체는 외인성 염색체이다. 마찬가지로, 마우스 서열의 일부가 인간 서열로 대체된 마우스 염색체에서 인간 서열을 외인성 서열이라고 한다. 마찬가지로, '내인성'은 해당 유기체에서 유래한 염색체 또는 서열, 예컨대 마우스 염색체 또는 위에 기재된 서열을 의미한다.
본 명세서에서 사용되는 바와 같이, "상동 재조합"은 상동 서열 또는 상동 암으로 알려진 유사하거나 동일한 두 분자의 DNA 사이에서 뉴클레오티드 서열이 교환되는 유형의 유전자 재조합을 의미한다. 상동 재조합은 종종 다음과 같은 기본 단계를 포함한다: DNA의 양 가닥 상에서 이중가닥 절단(double-strand break; DSB)이 발생한 후, DSB의 5' 말단 주위의 DNA 부분이 절제(resection)라고 불리는 과정에서 절단된다. 이어서, 가닥 침입 단계에서, 절단된 DNA 분자의 돌출된 3' 말단이 절단되지 않은 유사하거나 동일한(또는 상동) DNA 분자, 예를 들어, 상동 암을 "침입"한다. 가닥 침입 후, 이벤트의 추가적인 순서는 DSBR(double-strand break repair; 이중가닥 절단 복구) 경로 또는 SDSA(synthesis-dependent strand annealing; 합성 의존적 가닥 어닐링) 경로 중 어느 하나의 경로를 따를 수 있다.
본 명세서에서 사용되는 "DNA 복구 경로"는 DNA의 단일 또는 이중가닥 절단과 같은 DNA 손상 검출에 반응하여 세포가 유전체 무결성 기능을 유지할 수 있도록 하는 세포 메커니즘을 의미한다. DNA 복구 경로는 DNA 손상의 유형 및 정도, 세포 주기 단계에 따라 절제, 표준 상동성 지시 복구(캐노니컬 HDR), 상동 재조합(HR), 대체 상동성 지시 복구(alt-HDR), 이중가닥 절단 복구(DSBR), 단일가닥 어닐링(SSA), 합성 의존성 가닥 어닐링(SDSA), 절단-유도 복제(BIR), 대체 엔드 접합(alt-EJ), 마이크로호몰로지 매개 엔드 접합(MMEJ), DNA 합성 의존성 마이크로호몰로지 매개 엔드 접합(SD-MMEJ), 표준 비상동성 엔드 접합(C-NHEJ)와 같은 비동종 말단 접합(NHEJ) 복구, 대체 비-호몰로지 엔드 접합(A-NHEJ) 경로, 트랜슬리온 DNA 합성(TLS) 복구, 염기 절제 복구(BER), 뉴클레오티드 절제 복구(NER), 불일치 복구(MMR), DNA 손상 반응성(DDR), 블런트 엔드 접합(Blunt End Jointing), 단일가닥 절단 복구(SSBR), 인터스트랜드 크로스링크 복구(ICL) 및 판코니 빈혈 경로(FA)를 포함할 수 있다.
본 명세서에서 사용된 바와 같이, 상동성 지시 복구(HDR)는 상동성 핵산(예를 들어, 자매 염색질 또는 외인성 핵산)을 이용하여 DNA 손상을 복구하는 과정을 의미한다. 정상 세포에서, HDR은 전형적으로 절단의 인식, 절단의 안정화, 절제, 단일가닥 DNA의 안정화, DNA 교차 중간체의 형성, 교차 중간체의 분해 및 결찰과 같은 일련의 단계를 포함한다.
본 명세서에서 "상동체"란 동일한 생물학적 기능을 수행하는 단백질 군의 단백질, 예를 들어, 동일한 단백질 군에 속하며 공통된 형질을 제공하거나 동일 또는 유사한 생물학적 기능을 수행하는 단백질을 의미한다. 상동체는 상동 유전자에 의해 발현된다. 상동 유전자는 제2 유전자에 의해 암호화된 단백질과 동일 또는 유사한 생물학적 기능을 갖는 단백질을 암호화하는 유전자이다. 상동 유전자는 종분화(ortholog)의 발생 또는 유전적 복제(paralogs)의 발생에 의해 생성될 수 있다. "동원체(ortholog)"란 종분화에 의해 공통의 조상 유전자로부터 진화된 상이한 종들의 상동 유전자들의 세트를 의미한다. 일반적으로, 동원체는 진화가 진행되는 동안 동일한 기능을 유지한다. "이원체(paralog)"는 유전적 복제의 결과로 서로 분기된 같은 종의 상동 유전자들의 집합을 가리킨다. 따라서 상동 유전자는 같은 생물체일 수도 있고 다른 생물체일 수도 있다. 상동 유전자는 자연적으로 발생하는 대립유전자와 인공적으로 만들어진 변이체를 포함한다. 상동 단백질 간의 동일성 백분율은 단백질의 출처와 단백질이 유래된 종이 분기된 정도에 따라 달라진다. 더 밀접하게 관련된 종의 상동 단백질은 일반적으로 더 멀리 관련된 종의 단백질보다 더 유사할 것이다. 최적으로 정렬된 경우, 상동 단백질은 전형적으로 단백질의 전체 길이에 걸쳐 적어도 약 40%의 동일성, 약 50%의 동일성, 약 60%의 동일성, 일부 경우에 적어도 약 70%, 예를 들어 약 80% 및 심지어 약 90%의 동일성을 갖는다. 다른 경우, 예를 들어 고도로 상이한 종으로부터의 단백질을 비교할 때, 상동 단백질은 DNA 결합 도메인과 같은 보존된 단백질 도메인의 길이에 걸쳐 적어도 약 40%의 동일성, 약 50%의 동일성, 약 60%의 동일성, 약 70%의 동일성 또는 약 90%의 동일성을 가질 것이다.
상동 유전자 또는 단백질은 DNA 또는 아미노산 서열의 비교, 예를 들어 수동으로 또는 BLAST, FASTA, Smith-Waterman 등으로 알려진 상동 기반 검색 알고리즘을 사용하여 컴퓨터 기반 도구를 사용하여 식별된다. 유사한 서열을 찾기 위한 서열 데이터베이스는 로컬 서열 정렬 프로그램, 예를 들어 BLAST를 사용하여 검색할 수 있으며, 서열 염기 유사성을 측정하는 데 사용되는 요약 기대 값(E-value)을 사용한다. 특정 유기체에 대해 가장 좋은 E-value를 갖는 히트 단백질이 반드시 동원체일 필요는 없기 때문에, 즉 동일한 기능을 갖거나 또는 유일한 동원체일 수 있으므로, 호혜적 쿼리(reciprocal query)를 사용하여 동원체 식별을 위해 중요한 E-value를 갖는 히트 서열을 필터링할 수 있다. 호혜적 쿼리는 쿼리 단백질의 서열과 유사한 기본 유기체의 아미노산 서열 데이터베이스에 대한 중요한 히트의 검색을 수반한다. 호혜적 쿼리의 최고 히트는 쿼리 단백질 자체 또는 사양화 후 복제된 유전자에 의해 암호화된 단백질일 때, 히트를 동원체로 식별할 수 있다.
본원에서 사용되는 바와 같이, "동일성 백분율"이란, 2개의 최적으로 정렬된 DNA 또는 단백질 세그먼트가 구성요소의 정렬 윈도우 전체에 걸쳐 불변인 정도, 예를 들어, 뉴클레오티드 서열 또는 아미노산 서열을 의미한다. 시험 서열 및 참조 서열의 정렬된 세그먼트에 대한 "동일성 분율"은 2개의 정렬된 세그먼트의 서열에 의해 공유되는 동일한 구성요소의 수를 전체 시험 서열 또는 참조 서열 중 더 작은 정렬 윈도우 전체의 서열 구성요소의 수로 나눈 값이다. "동일성 백분율"("동일성 백분율")은 동일성 분율 100배이다. 이러한 최적 정렬은 DNA 서열의 국소 정렬로서 간주되는 것으로 이해된다. 단백질 정렬을 위해, 단백질 서열의 국소 정렬은 최적 정렬을 달성하기 위해 갭의 도입을 허용해야 한다. 동일성 백분율은 정렬 자체에 의해 도입된 갭을 포함하지 않는 정렬된 길이에 걸쳐 계산될 수 있다.
본 명세서에서 "특이적"이라 함은 가이드 RNA의 상동성 팔 또는 표적화 서열 등의 염기서열과 동일하거나 실질적으로 동일한 염기서열을 의미한다. 다른 염기서열에 "특이적"인 염기서열은 왓슨-크릭 염기쌍화를 통하여 다른 염기서열 또는 그 역보체에 혼성화할 수 있다. 따라서, 다른 염기서열에 특이적인 염기서열은 다른 염기서열 또는 그 역보체와 매우 유사하지만 완전히 동일할 필요는 없는 염기서열임을 당업자는 인식할 것이다. 예를 들어, 다른 염기서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 또는 99% 동일한 염기서열은 다른 염기서열에 혼성화할 수 있는 경우 여전히 해당 염기서열에 특이적이다. 추가적인 예로, 가이드 핵산 표적화 서열은 표적서열의 불일치 위치에 따라 표적서열에 1, 2, 3 이상의 불일치를 포함할 수 있지만, 표적서열에 대한 gNA 및 엔도뉴클레아제를 포함하는 리보뉴클레오단백질 복합체를 표적화할 수 있는 경우 여전히 표적서열에 특이적이다.
본 명세서에서 사용되는 "선별"은 당업계에 공지된 임의의 방법을 사용하여 별개의 생성물의 2개 집단을 분리하는 것을 의미한다. 세포, 염색체 또는 서열에 적용되는 바와 같이 선택은 선택가능한 마커와 같은 마커에 기초하여 수행될 수 있다. 선택가능한 마커를 발현하는 세포를 선별하는 것은 마커를 발현하는 세포 및 마커를 발현하지 않는 세포를 선택 배지에서 배양하는 것을 포함하여, 마커를 발현하지 않는 세포가 사멸되거나 그 성장이 억제된다. 마커를 포함하는 서열 또는 염색체는 유사하게 세포 내에 배치하고 선택적 요법을 적용함으로써 선별될 수 있다. 유사하게, 선별은 검출가능한 마커, 예컨대 형광 단백질에 기초하여 수행될 수 있다. 검출가능한 마커를 발현하는 세포는 당업계에 공지된 방법, 예컨대 형광 활성화 세포 분류(FACS)를 사용하여 검출가능한 마커에 기초하여 세포의 혼합 집단으로부터 물리적으로 제거될 수 있다. 대안적으로, 또는 대안적으로, 세포의 혼합 집단은 단일 세포가 분리하여 배양될 수 있도록 희석될 수 있고, 마커와 같은 하나 이상의 형질의 존재에 대해 분석된 단리된 세포 유래 클론이다.
본 명세서에서 사용되는 "유도된 (derived from)"는 분자 실체, 예를 들어 핵산 또는 단백질의 출처(source) 또는 출처(origin)를 나타낸다. 분자 실체의 출처는 자연 발생적, 재조합적, 비정제적, 또는 정제된 분자 실체일 수 있다. 예를 들어, 제2 폴리펩티드로부터 유도된 폴리펩티드는 예를 들어, 제2 단백질의 아미노산 서열과 동일하거나 실질적으로 유사한 아미노산 서열, 예를 들어, 50% 초과 상동인 아미노산 서열을 포함할 수 있다. 유도된 분자 실체, 예를 들어, 핵산 또는 단백질은 하나 이상의 변형, 예를 들어, 하나 이상의 아미노산 또는 뉴클레오티드 변화를 포함할 수 있다.
"단리된 (isolated from)"은 그 출처(source) 또는 출처(origin)로부터 정제, 제거 또는 분리된 분자 개체를 의미한다.
"자연적으로 발생하는 (naturally occurring)" 서열은 자연에서 발견되는 적어도 하나의 종에서 발견되는 것을 말한다.
"인공 서열"은 자연에서 발견되지 않는 서열을 의미한다. 인공 서열은 자연적으로 발생하는 서열과 유사할 수 있지만, 자연적으로 발생하는 서열에 비해 하나 이상의 변경을 포함한다. 대안적으로, 인공 서열은 임의의 자연적으로 발생하는 서열과 거의 또는 전혀 유사성을 갖지 않을 수 있다. 키메라, 또는 재조합 서열은 서로 인접하여 발견되지 않거나 상이한 출처의 두 서열이 작동 가능하게 함께 연결된 일종의 인공 서열이다.
"작동적으로 연결된" 또는 "작동 가능하게 연결된"은 유전적 요소의 병치로서, 그 요소들은 예상되는 방식으로 작동하는 것을 허용하는 관계에 있다. 예를 들어, 프로모터가 코딩 서열의 전사를 개시하는 것을 돕는 경우, 프로모터는 코딩 영역에 작동적으로 연결된다. 이러한 기능적 관계가 유지되는 한, 프로모터와 코딩 영역 사이에는 개재 잔기들이 존재할 수 있다.
본 명세서에서는 줄기세포를 지칭하는 용어로 다음과 같은 분류를 사용한다. 발달 단계로 볼 때, 가장 다능하고 빠른 것은 "배아줄기세포" 또는 "ES세포"이다. ES세포는 갓 유래된 1차 세포일 수도 있고, ES세포주로부터 유래된 세포일 수도 있다. 체세포 조직(배아세포 조직을 제외한 모든 조직)의 다른 모든 줄기세포는 일반적으로 "체세포"로 정의되지만 일반적으로 다음 중 일부 또는 전부로 알려져 있다: "성체줄기세포(adult stem cell)", "성숙줄기세포(mature stem cells)", "간세포(progenitor cells)", "간줄기세포(progenitor stem cells)", "전구세포(precursor cells)" 및 "전구줄기세포(precursor stem cells)". 비-ES세포의 다른 부류를 "생식줄기세포(germ line stem cells)"라고 정의한다. 마지막으로, 비-줄기세포를 "성체세포(mature cells)"라고 정의하지만, "분화세포(differentiated cells)", "성숙분화세포(mature differentiated cells)", "최종분화세포(terminally differentiated cells)", "체세포(somatic cells)"라고도 한다. 성숙세포는 또한 조직 또는 불멸의 세포주 또는 종양 유래 세포주로부터 유래된 1차 단리된 세포일 수 있다. 본 발명은 줄기세포 또는 성숙세포 중 어느 하나에 대해 일반적으로 사용되는 과학적 정의를 충족하지 못하는 모든 세포를 포함하는 "성숙세포의 전구체 형태"를 추가로 포함한다. ES 세포는 시험관 내에서 장기간 배양될 수 있으며, 정상 배반포의 공동에 삽입/주입되기 전에 생식세포를 포함한 성체 동물의 모든 세포 유형으로 분화하기 위해 정상적인 배아 발달 프로그램을 재개하도록 유도된다.
본 명세서에서 사용되는 "하이브리드 세포"는 두 개의 유전체에서 나온 원소들을 포함하는 세포를 의미한다. 숙련된 기술자는 하이브리드 세포가 서로 다른 소스에서 나온 두 개의 완전한 또는 거의 완전한 유전체를 포함할 수 있다는 것을 이해할 것이다. 또는 하이브리드 세포는 한 소스에서 나온 완전한 유전체와 두 번째 소스에서 나온 몇 개의 염색체, 하나의 염색체, 또는 하나의 염색체의 일부만을 포함할 수 있다. 여전히 하이브리드 세포는 상술한 양 극단의 상라 사이에 있는 두 개의 유전체에서 나온 임의의 원소 혼합물을 포함하는 세포로 간주된다. 하이브리드 세포는 서로 다른 개체, 동일한 종의 서로 다른 균주, 또는 서로 다른 종의 것일 수 있다. 하이브리드 세포는 당업계에 공지된 임의의 방법에 의해 생성될 수 있다. 이들은 세포 융합 및 한 세포에서 다른 세포로 적은 수의 염색체를 전달하는 미세세포 매개 염색체 전달(MMCT)을 포함하지만 이에 국한되지 않는다.
본 명세서에서 '하이브리드 배아줄기(Hybrid Embry Stem, EHS)' 세포란 배아줄기세포의 특성을 갖는 하이브리드 세포를 의미한다. EHS 세포는 서로 다른 두 종의 ES 세포가 융합되어 생성될 수도 있고, MMCT 매개 염색체가 한 종의 세포에서 다른 종의 줄기세포로 전달되어 생성될 수도 있다.
본원에서 사용되는 "암"은 당업계에 공지된 바와 같이 조절되지 않는 세포 성장 또는 복제를 특징으로 하는 질병, 상태, 형질, 유전자형 또는 표현형을 의미한다. 암은 고형 종양 및 액체 종양 모두를 포함한다. 예시적인 암은 백혈병, 유방암, 골암, 뇌암, 두경부암, 망막암, 식도암, 위암, 다발성 골수종, 난소암, 자궁암, 갑상선암, 고환암, 자궁내막암, 흑색종, 대장암, 폐암, 방광암, 전립선암(소세포 및 비소세포 폐암 둘 모두 포함), 췌장암, 육종, 암종, 자궁경부암, 두경부암, 피부암을 포함하지만 이에 제한되지 않는다.
본 명세서에서 언급된 모든 출판물, 특허 및 특허 출원은 각각의 개별 출판물, 특허 또는 특허 출원이 참조에 의해 구체적으로 그리고 개별적으로 통합될 것을 표시한 것과 동일한 범위 내에서 본 명세서에 언급된 모든 출판물, 특허 및 특허 출원이 참조에 의해 통합된다.
염색체 조작 방법
본 발명은 주형 염색체, 표적 염색체, 벡터 또는 플라스미드와 같은 하나 이상의 핵산분자 및 상동성 지시 복구를 사용하여 염색체를 조작하는 방법을 제공한다. 뉴클레아제는 주형 염색체에서 주형서열을 측면에 두고, 표적서열을 측면에 또는 표적 염색체의 표적 위치에서 이중가닥 절단을 생성하는 데 사용된다. 표적 및 주형 염색체의 서열을 포함하는 마커 및 상동성 암을 포함하는 하나 이상의 핵산분자는 표적서열을 주형서열로 대체하거나, 표적 위치에서 주형서열을 삽입하거나, 또는 이중가닥 절단 부위에서 표적 및 주형서열을 결합하여 염색체 재배열을 생성하는 데 사용된다.
일부 실시예들에서, 방법들은 표적서열을 주형서열로 대체하는 단계를 포함하며, 즉 표적서열은 주형서열의 삽입에 의해 삭제된다.
일부 실시형태에서, 방법들은 표적서열을 주형서열로 대체하는 단계를 포함한다. 임의의 적절한 주형서열, 및 임의의 적절한 표적서열이 본원에 기술된 방법에 사용될 수 있다. 예를 들어, 상기 방법들은 모델 유기체로부터의 염색체의 일부를 상동 인간 서열로 대체하는 데 사용될 수 있으며, 이에 의해 모델 유기체의 게놈의 그 부분을 인간화한다. 대안적으로, 큰 서열이 표적서열의 거의 또는 전혀 결실 없이 표적 위치에 삽입될 수 있다.
일부 실시형태에서, 본 발명은 하기 단계를 포함하는 조작된 염색체의 제조방법을 제공한다: (a) 표적서열을 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계; (b) 상기 세포를 하기 핵산분자와 접촉시키는 단계 (i) 표적서열의 5' 말단의 상류(upstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암(homology arm), 적어도 하나의 제1 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 제1 핵산분자; 및 (ii) 주형서열의 3' 말단의 하류(downstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암, 적어도 하나의 제2 마커, 및 표적서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5' 에서 3' 으로 포함하는 제2 핵산분자; (c) 주형서열 및 상기 제1 및 제2 마커가 표적 염색체 내로 삽입되어, 표적서열의 양 측면, 및 주형서열의 5' 말단 및 3' 말단에서 이중가닥 절단(double strand break)을 생성하는 단계; 및 (d) 상기 제1 및 제2 마커를 발현하는 세포 또는 세포들을 선별하는 단계. 일부 구현예에서, 제1 핵산분자 및/또는 제2 핵산분자는 플라스미드이다. 본 명세서에 기재된 방법의 일부 구현예에 대한 제1 핵산분자, 표적서열 및 제2 핵산분자의 상동성 암의 배열을 도 4a-4b에 나타내었다. 일부 구현예에서, 제1 마커는 주형서열의 5' 말단에 위치하고 제2 마커는 주형서열의 삽입 후 주형서열의 3' 말단에 위치한다. 예를 들어, 본 명세서에 기재된 방법으로 생산된 조작된 염색체는 주형서열의 삽입 및 표적서열의 결손 후, 표적서열의 상류에 있는 표적 염색체 서열, 제1 마커, 주형서열, 제2 마커, 및 표적서열의 하류에 있는 표적 염색체 서열을 포함한다.
숙련된 기술자는 많은 길이의 주형서열이 본 명세서에 기술된 방법에 적합하다는 것을 인식할 것이다. 적합한 주형서열은 수백 개의 염기쌍만큼 작을 수 있거나, 또는 염색체의 대부분을 포함할 수 있고, 따라서 최대 수백 메가베이스 쌍의 길이일 수 있다. 본 발명의 방법의 일부 구현예에서, 주형서열은 길이가 적어도 25 KB, 적어도 50 KB, 적어도 100 KB, 적어도 200 KB, 적어도 400 KB, 적어도 500 KB, 적어도 600 KB, 적어도 700 KB, 적어도 800 KB, 적어도 900 KB, 적어도 1 MB, 적어도 2 MB, 적어도 3 MB, 적어도 4 MB, 적어도 5 MB, 적어도 10 MB, 적어도 15 MB, 적어도 20 MB, 적어도 50 MB, 적어도 100 MB, 적어도 150 MB, 적어도 200 MB, 또는 적어도 250 MB이다. 일부 구현예에서, 주형서열의 길이가 50 KB 내지 250 MB, 10 KB 내지 200 MB, 200 KB 내지 50 MB, 500 KB 내지 50 MB, 1 MB 내지 100 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 5 MB 내지 50 MB, 5 MB 내지 10 MB, 3 MB 내지 10 MB, 또는 5 MB 내지 50 MB이다.
본 발명의 방법의 일부 구현예에서, 주형 염색체는 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 및 제2 핵산분자의 5' 상동성 암의 서열을, 5'에서 3'으로 포함한다. 일부 구현예에서, 주형 염색체는 제1 핵산분자의 3' 상동성 암의 서열, 제3 엔도뉴클레아제 부위, 주형서열, 제4 엔도뉴클레아제 부위, 및 제2 핵산분자의 5' 상동성 암의 서열을, 5'에서 3'으로 포함한다.
숙련된 기술자는 많은 길이의 표적서열이 본원에 기술된 방법에 적합하다는 것을 인식할 것이다. 적합한 표적서열은 이중가닥 절단(표적 위치)을 생성하는데 사용되는 엔도뉴클레아제 부위만큼 작거나, 염색체의 대부분을 포함할 수 있고, 따라서 최대 수백 메가베이스 쌍의 길이일 수 있다. 본 발명의 방법의 일부 구현예에서, 표적서열은 길이가 적어도 25 KB, 적어도 50 KB, 적어도 100 KB, 적어도 200 KB, 적어도 400 KB, 적어도 500 KB, 적어도 600 KB, 적어도 700 KB, 적어도 800 KB, 적어도 900 KB, 적어도 1 MB, 적어도 2 MB, 적어도 3 MB, 적어도 4 MB, 적어도 5 MB, 적어도 10 MB, 적어도 15 MB, 적어도 20 MB, 적어도 50 MB, 적어도 100 MB, 적어도 150 MB, 적어도 200 MB, 또는 적어도 250 MB이다. 일부 구현예에서, 표적서열의 길이가 50 KB 내지 250 MB, 10 KB 내지 200 MB, 200 KB 내지 50 MB, 500 KB 내지 50 MB, 1 MB 내지 100 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 5 MB 내지 50 MB, 5 MB 내지 10 MB, 3 MB 내지 10 MB, 또는 5 MB 내지 50 MB이다.
본 발명의 방법의 일부 구현예에서, 표적 염색체는 제1 핵산분자의 5' 상동성 암의 서열, 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5' 에서 3'으로 포함한다. 일부 구현예에서, 표적 염색체는 제1 핵산분자의 5' 상동성 암의 서열, 제1 엔도뉴클레아제 부위, 표적서열, 제2 엔도뉴클레아제 부위 및 제2 핵산분자의 3' 상동성 암의 서열을, 5' 에서 3'으로 포함한다.
일부 구현예에서, 본 명세서에 기재된 방법에 사용된 핵산분자는 DNA 분자이다. 일부 구현예에서, 본 명세서에 기재된 방법에 사용된 핵산분자는 원형, 예를 들어 플라스미드이다. 대안적으로, 추가의 엔도뉴클레아제 부위를 사용하여 본 발명의 핵산분자를 선형화할 수 있다. 예시적인 엔도뉴클레아제 부위는 제한 엔도뉴클레아제 뿐만 아니라 본 명세서에 기재된 CRISPR/Cas 엔도뉴클레아제, ZFN 및 TALEN을 포함하지만 이에 제한되지는 않는다. 숙련된 기술자는 적합한 엔도뉴클레아제 부위를 핵산분자 내에, 예를 들어 핵산분자의 어느 하나 또는 양쪽 상동성 암에 인접하거나 그 근처에 통합할 수 있을 것이다. 숙련된 기술자는 적합한 CRE 재조합 부위를 핵산분자 내에 통합할 수 있을 것이다.
일부 구현예에서, 표적서열은 주형서열의 삽입에 의해 삭제되고, 주형 및 표적 염색체는 CRISPR/Cas 리보뉴클레오단백질에 의해 주형 및 표적서열의 어느 한쪽에서 절단된다. 일부 구현예에서, (a) 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 표적서열, 제2 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고, (b) 주형 염색체가 제3 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제4 sgRNA 표적서열을, 5'에서 3'으로 포함한다. 일부 구현예에서, 제1, 제2, 제3 및 제4 sgRNA는 상이한 표적서열을 포함한다. 예를 들어, 제1 sgRNA는 표적 염색체 상의 제1 sgRNA 표적서열에 특이적인 표적서열을 포함하고, 제2 sgRNA는 표적 염색체 상의 제2 sgRNA 표적서열에 특이적인 표적서열을 포함하고, 제3 sgRNA는 주형 염색체 상의 제3 sgRNA 표적서열에 특이적인 표적서열을 포함하고, 제4 sgRNA는 표적 염색체 상의 제4 sgRNA 표적서열에 특이적인 표적서열을 포함한다. 대안적으로, sgRNA 표적서열, 및 대응하는 sgRNA 표적서열 중 하나 이상은 동일한 서열일 수 있다.
일부 실시형태에서, 주형서열을 삽입하는 것은 표적서열의 서열의 거의 또는 전혀 결실을 포함하지 않는다. 당업자는 이중가닥 절단 수리의 많은 메커니즘에서 절단의 말단의 절제를 수반하고, 따라서 본원에 기술된 엔도뉴클레아제 부위 주변에서 결손을 생성할 것임을 인식할 것이다. 예를 들어, 표적 위치 주변의 약 5bp, 10bp, 15bp, 20bp, 20bp, 25bp, 30bp, 35bp, 40bp, 45bp 또는 50bp의 결손 또는 표적서열의 측면에 있는 엔도뉴클레아제 부위는 본원에 기술된 방법에 의해 생성될 수 있다.
일부 실시예들에서, 예를 들어, 본 명세서에 기술된 방법들에 의해 표적서열이 거의 또는 전혀 삭제되지 않는 실시예들이고, (a) 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고; (b) 주형 염색체가 제2 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제3 sgRNA 표적서열을, 5'에서 3'으로 포함한다. 일부 구현예에서, 제1, 제2 및 제3 sgRNA는 상이한 표적서열을 포함한다. 예를 들어, 제1 sgRNA는 표적 염색체 상의 제1 sgRNA 표적서열에 특이적인 표적서열을 포함하고, 제2 sgRNA는 표적 염색체 상의 제2 sgRNA 표적서열에 특이적인 표적서열을 포함하고, 제3 sgRNA는 주형 염색체 상의 제3 sgRNA 표적서열에 특이적인 표적서열을 포함한다.
일부 구현예에서, 주형열을 삽입하는 것은 표적서열의 하나 이상의 기능을 방해한다. 예를 들어, 유전자의 코딩 서열에 주형서열을 삽입하는 것은 조기 정지 코돈의 생성, 단백질 코딩 서열의 돌연변이, 비정상 스플라이스 생성물 등을 통해 적절한 유전자 생성물의 발현을 방지할 수 있다. 유사하게, 인핸서 또는 프로모터와 같은 유전자의 조절 서열에 템플릿 서열을 삽입하는 것은 유전자가 발현되는 것을 방지할 수 있다.
일부 구현예에서, 본 발명의 방법은 표적서열의 삽입 후에 제1 및/또는 제2 마커를 삭제하는 단계를 포함한다. 마커는 당업계에 공지된 임의의 적합한 방법에 의해 삭제될 수 있다. 예를 들어, 조작된 염색체를 포함하는 세포는 마커를 코딩하는 서열에 특이성이 있는 gNA 표적서열을 포함하는 CRISPR/Cas 리보뉴클레오단백질과 접촉될 수 있으며, 이에 의해 마커 서열의 전부 또는 일부의 삭제를 유도한다.
본 발명의 방법은 염색체의 재배열, 예컨대 역전 및 전위를 생성하는 데 사용될 수 있다. 많은 염색체의 재배열은 인간의 질병 또는 질병, 예를 들어 암에 있어서 역할을 한다. 마우스와 같은 모델 유기체에서 이러한 재배열을 재창조하는 것은 이러한 질병 또는 질병에 대한 연구를 용이하게 할 수 있다. 관련된 염색체 이상은 당업자에게 공지될 것이고, mitelmandatabase.isb-cgc.org/ 에서 제공되는 미텔만 데이터베이스에 기재된다. 인간의 질병에 관련된 염색체 이상에 관한 추가 정보는 또한 rarediseases.info.nih.gov/diseases/diseases-by-category/36/chromosome-disorders 에서 이용 가능하다.
따라서, 본 발명은 하기 단계를 포함하는 염색체 재배열(rearrangement)의 제조방법을 제공한다: (a) 표적 위치를 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계; (b) 표적 위치의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 5' 상동성 암, 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 핵산분자와 상기 세포를 접촉시키는 단계; (c) 상기 마커가 5' 상동성 암의 서열의 표적 염색체 3' 내로 삽입되고 염색체 재배열이 제조되도록, 표적 위치, 및 주형서열의 5' 말단에서 이중가닥 절단을 제조하는 단계; 및 (d) 상기 마커를 발현하는 세포 또는 세포들을 선별하는 단계. 대안적으로, 방법은 (a) 표적 위치를 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계; (b) 표적서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 5' 상동성 암, 마커, 및 주형서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 핵산분자와 상기 세포를 접촉시키는 단계; (c) 상기 마커가 5' 상동성 암의 서열의 표적 염색체 3' 내로 삽입되도록, 표적 위치, 및 주형서열의 3' 말단에서 이중가닥 절단을 제조하는 단계; 및 (c) 상기 마커를 발현하는 세포 또는 세포들을 선별하는 단계를 포함한다. 일부 실시형태에서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, CRISPR/Cas 엔도뉴클레아제가 표적 위치를 절단하도록 표적 위치에 특이적인 표적서열을 포함하는 적어도 하나의 제1 gNA, 및 주형서열의 5' 말단에 특이적인 표적서열을 포함하는 제2 gNA와 접촉시키는 단계를 포함한다. 일부 실시형태에서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, CRISPR/Cas 엔도뉴클레아제가 표적 위치를 절단하도록 표적 위치에 특이적인 표적서열을 포함하는 적어도 하나의 제1 gNA, 및 주형서열의 3' 말단에 특이적인 표적서열을 포함하는 제2 gNA와 접촉시키는 단계를 포함한다. 일부 실시형태에서, 핵산분자는 DNA를 포함한다. 일부 실시형태에서, 핵산분자는 플라스미드를 포함한다.
당업계에 공지된 적절한 방법을 사용하여 표적 및 주형 염색체에서 이중가닥 절단을 생성할 수 있다. 이는 특히 표적 및 주형 염색체 상의 엔도뉴클레아제 부위에 중첩하거나 포함하는 사용된 핵산분자(예를 들어, 플라스미드)에 대한 상동성 암 서열의 선택을 통해 달성될 수 있다. 일부 실시형태에서, 상기 단계 (c)에서 이중가닥 절단을 생성하는 단계는 이중가닥 절단을 유도하기 위해 CRISPR/Cas 엔도뉴클레아제 및 하나 이상의 가이드 핵산(gNAs), 하나 이상의 아연 핑거 뉴클레아제, 하나 이상의 전사 활성화제 유사 이펙터 뉴클레아제(TALEN), 또는 하나 이상의 CRE 재조합효소를 사용하는 단계를 포함한다. 예를 들어, Cre 재조합효소는 두 LoxP 부위 사이의 염색체 영역의 역전을 유도하고, 이로써 주형서열과 제1 및 제2 마커가 표적 염색체에 삽입된다. 일부 실시형태에서, CRISPR/Cas 엔도뉴클레아제는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체, 동원체, 또는 변형된 버전을 포함한다. 일부 실시형태에서, CRISPR/Cas 엔도뉴클레아제는 Cas9, Cas12a (Cpf1), Cas13a, CasX, CasY, C2c1, 또는 C2c3을 포함한다. 일부 실시형태에서, CRISPR/Cas 엔도뉴클레아제는 Cas9을 포함한다. 일부 실시형태에서,gNA는 단일 가이드 RNA(sgRNA)를 포함한다.
본 명세서에 기재된 엔도뉴클레아제와 세포를 접촉시키기 위해 당업계에 공지된 임의의 적절한 방법이 사용될 수 있다. 예를 들어, 엔도뉴클레아제를 포함하는 핵산분자(예를 들어, 플라스미드 등), 및 CRISPR/Cas 엔도뉴클레아제에 대한 gNA를 코딩하는 서열이 세포를 형질감염시키는데 사용될 수 있다. 대안적으로, 엔도뉴클레아제, 또는 엔도뉴클레아제를 코딩하는 핵산분자는 전기천공법(electroporation), 지방감염(lipofection), 형질도입(transduction) 등에 의해 세포 내로 도입될 수 있다.
본 명세서에 기재된 방법을 수행하기 위해 사용되는 세포는 당업계에 공지된 임의의 적합한 세포일 수 있다. 일부 구현예에서, 세포는 배아줄기(ES) 세포를 포함한다. 일부 구현예에서, 세포는 배아 하이브리드 줄기(EHS) 세포를 포함한다. EHS 세포는 인간과 쥐, 인간과 래트, 또는 쥐와 원숭이 등 서로 다른 두 종의 ES 세포를 융합하여 만들 수 있다. 당업계에 공지된 모든 융합 방법은 전기 융합, 바이러스 유도 융합 및 화학 유도 융합을 포함하지만 이에 제한되지 않는 본 발명의 범위 내에서 예상된다. 일부 구현예에서, 방법은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 EH 세포에 인간 EH 세포를 융합하는 단계를 포함한다. 일부 구현예에서, 방법은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 상이한 두 종의 ES 세포를 융합하는 단계를 포함한다.
일부 구현예에서, 상기 세포는 접합체(zygotes)를 포함한다. 본원에 사용되는 바와 같이, 용어 "접합체"는 포유동물의 난자와 정자와 같은 두 생식체 사이의 수정 사건에 의해 형성된 진핵세포를 의미한다. 단일 세포, 2 세포, 4 세포, 8 세포 또는 그 이상의 단계에서의 접합체는 본원에 기술된 방법에 적합할 수 있다.
본원에 기술된 바와 같이 조작된 염색체를 생성한 후, 조작된 염색체를 회수하기 위해 임의의 적합한 방법이 사용될 수 있다. 일부 실시형태에서, 본 발명의 조작된 염색체를 회수하는 것은 마이크로-세포 매개 염색체 전달(MMCT)을 포함한다. 조작된 염색체를 포함하는 소핵 세포를 ES 세포와 같은 표적 세포로 융합함으로써 다운스트림 적용을 위해 임의의 적합한 세포 유형으로 전달된 회수된 염색체. 이들 방법은 하기에 더 상세하게 기술되어 있다.
주형 염색체
본 발명은 본원에 기술된 방법들에 사용하기 위해, 주형서열들을 포함하는 주형 염색체들을 제공한다.
본원에서 사용되는 바와 같이, "주형 염색체"는 "주형서열"을 포함하는 염색체를 지칭한다. 주형서열은 본 발명의 방법을 사용하여 표적 염색체, 또는 표적 위치에 도입될 서열을 지칭한다.
주형 염색체는 임의의 적합한 공급원으로부터 분리되거나 유래될 수 있다. 일부 구현예에서, 주형 염색체는 진핵생물로부터 유래된다. 일부 구현예에서, 진핵생물은 척추동물, 예를 들어, 새, 파충류 또는 포유류이다. 일부 구현예에서, 주형 염색체는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭으로부터 유래된다. 일부 구현예에서, 주형 염색체는 인간으로부터 유래된다.
일부 실시형태에서, 주형 염색체는 외인성 염색체이고, 주형서열은 외인성 서열이다. 예를 들어, 표적 염색체는 마우스 염색체이고, 주형 염색체 및 상응하는 주형서열은 인간과 같은 비-마우스 종으로부터의 것이다.
일부 구현예에서, 주형 염색체는 내인성 염색체이고, 주형서열은 내인성 서열이다. 예컨대, 주형 염색체는 마우스 염색체이고, 표적 염색체는 제2의 상이한 마우스 염색체이다.
일부 구현예에서, 주형 염색체는 인공 염색체이다.
일부 구현예에서, 주형 염색체는 자연적으로 발생하는 염색체이다.
일부 구현예에서, 주형 염색체는 자연적으로 발생하는 염색체에 대한 하나 이상의 변형을 포함한다. 변형은 특히, 서열의 삽입, 결손 및 재배열을 포함한다. 주형 염색체에 삽입된 서열의 예는 특히, 마커, 프로모터, cDNA 서열, 비코딩 등을 포함한다.
일부 구현예에서, 주형 염색체는 주형서열의 5'에 위치한 엔도뉴클레아제 부위를 포함한다. 일부 구현예에서, 주형 염색체는 주형서열의 3'에 위치한 엔도뉴클레아제 부위를 포함한다. 일부 구현예에서, 엔도뉴클레아제 부위는 주형서열에 바로 인접하게 위치한다. 일부 구현예에서, 엔도뉴클레아제 부위는 주형서열 근처에 위치한다.
일부 구현예에서, 주형 염색체는 주형서열의 양 측 상의 엔도뉴클레아제 부위를 포함한다. 예를 들어, 주형 염색체는 주형서열의 5'에 위치한 제1 엔도뉴클레아제 부위 및 주형서열의 3'에 위치한 제2 엔도뉴클레아제 부위를 포함한다. 일부 구현예에서, 제1 및 제2 엔도뉴클레아제 부위 모두는 동일한 엔도뉴클레아제에 의해 인식되고 절단된다. 예를 들어, 제1 및 제2 엔도뉴클레아제 부위 모두는 동일한 엔도뉴클레아제에 의해 인식되는 동일한 DNA 서열을 포함한다. 일부 구현예에서, 제1 엔도뉴클레아제 부위는 제1 엔도뉴클레아제에 의해 절단되고, 제2 엔도뉴클레아제 부위는 제2 엔도뉴클레아제에 의해 절단된다. 예를 들어, 제1 및 제2 엔도뉴클레아제 부위는 상이한 표적서열을 포함하는 가이드 핵산(gNA)을 포함하는 CRISPR/Cas 리보뉴클레오단백질 복합체에 의해 인식되는 상이한 DNA 서열 또는 상이한 표적서열을 포함한다. 일부 구현예에서, 제1 및/또는 제2 엔도뉴클레아제 부위는 주형서열에 바로 인접하여 위치한다. 일부 구현예에서, 제1 및/또는 제2 엔도뉴클레아제 부위는 주형서열 근처에 위치한다.
주형서열의 5bp 내에, 10bp 내에, 15bp 내에, 20bp 내에, 30bp 내에, 40bp 내에, 50bp 내에, 70bp 내에, 80bp 내에, 100bp 내에, 120bp 내에, 140bp 내에, 180bp 내에, 200bp 내에, 300bp 내에, 400bp 내에, 또는 500bp 내에 있는 서열은 주형서열 근처에 있는 것으로 간주될 수 있다.
일부 구현예에서, 주형 염색체는 상동성 지시 복구를 용이하게 하기 위해 사용되는 핵산분자의 상동성 암의 하나 이상의 서열을 포함한다. 일부 구현예에서, 주형 염색체는 주형서열의 5' 말단 또는 그 근처에 위치한 상동성 암의 서열을 포함한다. 일부 구현예에서, 상동성 암은 주형서열의 상류, 즉 5'에 위치한다. 일부 구현예에서, 주형 염색체는 5' 내지 3', 엔도뉴클레아제 부위, 상동성 암 서열 및 주형서열을 포함한다. 일부 구현예에서, 주형 염색체는 주형서열의 3' 말단 또는 그 근처에 위치한 상동성 암의 서열을 포함한다. 일부 구현예에서, 상동성 암은 주형서열의 하류, 즉 3'에 위치한다. 일부 구현예에서, 주형 염색체는 5' 내지 3', 주형서열, 상동성 암 서열 및 엔도뉴클레아제 부위를 포함한다. 일부 구현예에서, 상동성 암 서열은 엔도뉴클레아제 부위와 주형서열 사이에 위치한다.
일부 구현예에서, 주형 염색체는 주형서열의 5'에 위치하거나 그 근처에 위치한 제1 상동성 암 서열 및 주형서열의 3'에 위치하거나 그 근처에 위치한 제2 상동성 암 서열을 포함한다. 즉, 주형 염색체는 주형서열의 상류 및 하류에 상동성 암을 포함한다. 일부 구현예에서, 제1 상동성 암은 5' 내지 3', 표적서열의 5' 말단의 상류에 뉴클레오티드 서열, 적어도 제1 마커의 서열 및 제1 상동성 암 서열을 포함하는 5' 상동성 암인 제1 핵산분자의 3' 상동성 암이다. 일부 구현예에서, 제2 상동성 암은 5' 내지 3', 제2 상동성 암 서열, 적어도 제2 마커의 서열, 및 표적서열의 3' 말단의 뉴클레오티드 서열을 포함하는 3' 상동성 암인 제2 핵산분자의 5' 상동성 암이다. 일부 구현예에서, 주형 염색체는 5' 내지 3', 제1 엔도뉴클레아제 부위, 제1 상동성 암 서열, 주형서열, 제2 상동성 암 서열, 및 제2 엔도뉴클레아제 부위를 포함한다.
일부 실시형태에서, 제1 및/또는 제2 상동성 암 서열은 제1 및/또는 제2 엔도뉴클레아제 부위에 바로 인접하여 위치한다. 일부 실시형태에서, 제1 상동성 암 서열은 제1 엔도뉴클레아제 부위에 바로 인접하여 위치하고, 제2 상동성 암 서열은 제2 엔도뉴클레아제 부위에 바로 인접하여 위치하며, 여기서 제1 상동성 암은 제1 엔도뉴클레아제 부위와 주형서열 사이에 있고, 제2 상동성 암은 주형서열과 제2 주형서열 사이에 있다. 일부 실시형태에서, 제1 상동성 암은 제1 엔도뉴클레아제 부위와 주형서열 사이에 있고, 제2 상동성 암은 주형서열과 제2 주형서열 사이에 있다.
일부 실시형태에서, 제1 및/또는 제2 상동성 암 서열은 주형서열 근처에 위치한다. 0bp 내, 5bp, 10bp 내, 15bp 내, 20bp 내, 30bp 내, 40bp 내, 50bp 내, 70bp 내, 80bp 내, 90bp 내, 120bp 내, 160bp 내, 200bp 내 또는 250bp 내에 있는 상동성 암은 주형서열 근처에 있는 것으로 간주될 수 있다.
일부 실시형태에서, 주형 염색체는, 5' 내지 3', 제1 엔도뉴클레아제 부위, 제1 상동성 암, 주형서열, 제2 상동성 암, 및 제2 엔도뉴클레아제 부위를 포함한다.
일부 실시형태에서, 주형 염색체의 제1 및/또는 제2 상동성 서열의 길이가 약 20 내지 2,000bp, 약 50 내지 1,500bp, 약 100 내지 1,400bp, 약 150 내지 1,300bp, 약 300 내지 1,200bp, 약 300 내지 1,100bp, 약 400 내지 1,000bp, 또는 약 500 내지 900bp, 또는 약 600bp 내지 약 800bp이다. 일부 실시양태에서, 주형 염색체의 상동성 서열은 길이가 약 400 내지 1,500bp이다. 일부 실시양태에서, 주형 염색체의 상동성 서열은 길이가 약 500 내지 1,300bp이다. 일부 실시양태에서, 주형 염색체의 상동성 서열은 길이가 약 600 내지 1,000bp이다.
주형서열
주형 염색체는 주형서열을 포함하고, 조작된 염색체 및 본 명세서에 기술된 방법에서 주형서열의 소스 역할을 한다. 주형서열은 주형 염색체 상의 임의의 적합한 위치에 위치될 수 있다. 예를 들어, 이론에 의해 결합되기를 원하지 않으면서 주형서열은 euchromatin을 특징으로 하는 주형 염색체의 영역에 위치될 수 있다.
주형서열은 임의의 적합한 소스로부터 분리되거나 유도될 수 있다. 일부 구현예에서, 주형서열은 내인성 서열, 예를 들어 주형 염색체에 내인성 서열, 또는 표적 염색체에 생성된 종에 내인성 서열을 포함한다. 일부 구현예에서, 주형서열은 외인성 서열이다. 예를 들어, 주형서열은 표적 염색체에 생성된 종에 외인성 서열로부터 유래한다. 일부 구현예에서, 주형서열은 자연적으로 발생하는 서열을 포함한다. 일부 실시형태에서, 주형서열은 자연적으로 발생하는 서열에 대한 하나 이상의 변형을 포함한다. 변형은 특히, 인공 서열 또는 마커와 같은 서열의 삽입, 삭제, 재배열을 포함한다. 일부 실시형태에서, 주형서열은 인공 서열을 포함한다. 일부 실시형태에서, 주형서열은 자연적으로 발생하는 서열 및 인공 서열 모두를 포함한다. 예시적인 인공 서열은 특히, 마커, cDNA 서열, 프로모터, 재조합 서열을 포함한다. 예시적인 마커는 녹색 형광 단백질(GFP), mCherry 등과 같은 검출가능한 마커뿐만 아니라 하기 표 3에 개시된 선택가능한 마커를 포함하지만, 이에 제한되지는 않는다.
일부 구현예에서, 주형서열은 진핵생물로부터 유래한다. 일부 구현예에서, 진핵생물은 조류, 파충류 또는 포유류와 같은 척추동물이다. 일부 구현예에서, 주형서열은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭 서열을 포함한다. 일부 구현예에서, 주형서열은 인간 서열을 포함한다.
일부 실시예들에서, 주형서열은 길이가 적어도 25KB, 적어도 50KB, 적어도 100KB, 적어도 200KB, 적어도 400KB, 적어도 500KB, 적어도 600KB, 적어도 700KB, 적어도 800KB, 적어도 900KB, 적어도 1MB, 적어도 2MB, 적어도 3MB, 적어도 4MB, 적어도 5MB, 적어도 6MB, 적어도 7MB, 적어도 8MB, 적어도 9MB, 적어도 10MB, 적어도 15MB, 적어도 20MB, 적어도 25MB, 적어도 60MB, 적어도 70MB, 적어도 80MB, 적어도 90MB, 적어도 100MB, 적어도 140MB, 적어도 160MB, 적어도 180MB, 적어도 200MB, 적어도 200MB, 적어도 220MB, 또는 적어도 250MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 50KB, 적어도 100KB, 적어도 200KB, 적어도 500KB, 적어도 700KB, 적어도 1MB, 적어도 2MB, 적어도 3MB, 적어도 4MB, 적어도 5MB, 적어도 6MB, 적어도 7MB, 적어도 8MB, 적어도 9MB, 적어도 10MB, 적어도 20MB, 적어도 30MB, 적어도 40MB, 또는 50MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 1MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 2MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 2MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 3MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 3MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 4MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 4MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 5MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 10MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 20MB이다.
일부 실시예들에서, 주형서열은 길이가 50KB 내지 250MB, 50KB 내지 100MB, 50KB 내지 100MB, 50KB 내지 50MB, 50KB 내지 20MB, 50KB 내지 10MB, 50KB 내지 10MB, 50KB 내지 5MB, 50KB 내지 3MB, 50KB 내지 2MB, 50KB 내지 1MB, 100KB 내지 1MB, 100KB 내지 200MB, 100KB 내지 100MB, 100KB 내지 20MB, 100KB 내지 10MB, 100KB 내지 10MB, 100KB 내지 5MB, 100KB 내지 3MB, 100KB 내지 2MB, 100KB 내지 2MB, 100KB 내지 1MB, 200KB 내지 100MB, 200KB 내지 100MB, 200KB 내지 100MB, 200KB 내지 50MB, 200KB 내지 20MB, 200KB 내지 10MB, 200KB 내지 5MB, 200KB 내지 3MB, 200KB 내지 2MB, 200KB 내지 2MB, 200KB 내지 1MB, 200KB 내지 1MB, 500KB 내지 100MB, 500KB 내지 50MB, 500KB 내지 50MB, 500KB 내지 50MB, 500KB 내지 10MB, 500KB 내지 5MB, 500KB 내지 3MB, 1MB 내지 100MB, 1MB 내지 50MB, 1MB 내지 50MB, 1MB 내지 10MB, 1MB 내지 10MB, 1MB 내지 5MB, 1MB 내지 5MB, 1MB 내지 2MB, 1MB 내지 2MB, 3MB 내지 10MB, 3MB 내지 10MB, 3MB 내지 10MB, 3MB 내지 10MB, 3MB 내지 5MB, 5MB 내지 50MB, 5MB 내지 50MB, 5MB 내지 50MB, 5MB 내지 10MB 내지 10MB, 10MB 내지 50MB, 또는 10MB 내지 20MB이다. 일부 실시예들에서, 주형서열은 길이가 50KB 내지 250MB이다. 일부 실시예들에서, 주형서열은 길이가 500KB 내지 200MB이다. 일부 실시예들에서, 주형서열은 200KB 내지 50MB, 1MB 내지 20MB, 1MB 내지 10MB, 1MB 내지 5MB, 1MB 내지 3MB, 3MB 내지 20MB, 3MB 내지 10MB, 3MB 내지 7MB, 또는 3MB 내지 5MB이다. 일부 실시예들에서, 주형서열은 길이가 1MB 내지 10MB이다. 일부 실시예들에서, 주형서열은 길이가 1MB 내지 10MB이다. 일부 실시예들에서, 주형서열은 길이가 1MB 내지 5MB이다. 일부 실시예들에서, 주형서열은 길이가 1MB 내지 5MB이다. 일부 실시예들에서, 주형서열은 길이가 3MB 내지 5MB이다.
일부 구현예에서, 주형서열은 하나 이상의 유전자의 서열을 포함한다. 일부 구현예에서, 주형서열은 다수의 유전자의 서열을 포함한다. 일부 구현예에서, 주형서열은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 900, 1000, 1500 또는 2000 유전자의 서열을 포함한다.
일부 실시형태에서, 주형서열은 하나 이상의 인간 유전자의 서열과 같은 인간 서열을 포함한다. 일부 실시형태에서, 주형서열은 인간 유전자의 서브시퀀스를 포함한다. 일부 실시형태에서, 주형서열은 인간 유전자 및 마커 또는 융합 단백질과 같은 인공 서열의 서브시퀀스를 포함한다. 일부 실시형태에서, 주형서열은 하나 이상의 인간 유전자 및 인공 서열의 서열을 포함한다.
일부 구현예에서, 주형서열은 인간 유전자의 서열을 포함한다. 모든 인간 유전자는 본 명세서의 범위 내에서 예상된다. 이론에 의해 구속되기를 바라지 않고, 질병 발병에 관여하는, 또는 잠재적인 치료 표적인 인간 유전자를 마우스와 같은 모델 유기체로 옮기는 것은 질병에 대한 연구 및 적절한 치료법의 개발을 용이하게 할 수 있다.
주형서열에 포함하기 위한 예시적인 유전자는 면역글로불린 유전자, T 세포 수용체(TCR) 유전자, 면역 체크포인트 유전자, 사이토카인, 케모카인, 수용체, 전사 인자, 세포골격계 유전자, 세포주기 체크 유전자, 종양 유전자 및 발달, 면역학 또는 신경생물학에 관여하는 유전자를 포함하나 이에 제한되지는 않는다. 예시적인 면역 체크포인트 유전자는 BTLA, CTLA-4, TIM-3, PD-1 및 PD-L1을 포함한다. 예시적인 사이토카인은 인터루킨(CTNF, IL-16, IL-1B, IL-6, IL-12, IL-17F, IL-2, IL-3, IL-9, IL-12B, IL-18BP, IL-21, IL-33, 렙틴, IL-13, IL-1A, IL-23, IL-4), 인터페론(IFNA10, IFN-알파7, IFN 베타, IFN 감마, IFN 감마, IFN 오메가) 및 종양 괴사 인자(TNF, 예를 들어, BAFF, TNF 베타, CD30 리간드, TNF 알파, CD40 리간드, TNFSF10, CD27 리간드)를 포함한다. 예시적인 케모카인은 CXC, CC CX3C 및 C 계열 케모카인을 포함한다. 예시적인 수용체는 G 단백질 결합 수용체, 리간드-게이트 이온 채널(이온성 수용체), 키나제-연결된 수용체 및 관련 수용체, 및 핵 수용체를 포함한다. 예시적인 전사 인자는 나선-회전-나선 전사 인자(예를 들어, 10월-1), 나선-루프-나선 전사 인자(예를 들어, E2A), 징크 핑거 전사 인자(예를 들어, 글루코코르티코이드 수용체, GATA 단백질), 염기성 단백질-류신 지퍼 전사 인자(예를 들어, 순환 AMP 반응 요소 결합 인자(CREB) 및 활성화 단백질-1(AP-1)), 및 β-시트 모티프 전사 인자(예를 들어, 핵 인자-κB(NF-κB)를 포함한다. 예시적인 세포 주기 조절 유전자는 사이클린, 사이클린 의존성 키나제 및 세포 주기 체크포인트 유전자를 포함하나, 이에 제한되지 않는다.
일부 구현예에서, 주형서열은 종양 유전자 또는 종양 억제 유전자를 포함한다. 주형서열에 포함하기에 적합한 예시적인 종양 유전자 및 종양 억제 유전자는 하기 표 1에 제시되어 있다.
일부 구현예에서, 주형서열은 유전적 질병 또는 장애와 연관된 인간 유전자의 서열을 포함한다. 일부 구현예에서, 주형서열은 유전적 질병 또는 장애와 연관된 인간 염색체 영역의 서열을 포함한다. 질병 또는 장애와 연관된 유전자, 및 염색체 영역의 비제한적인 예를 하기 표 2에 제시한다.
일부 구현예에서, 주형서열은 면역글로불린 서열을 포함한다. 표면 및 분비된 면역글로불린 둘 모두가 본 발명의 범위 내에서 예상된다. 면역글로불린은 외래 항원을 인식하고 면역 반응을 개시한다. 인간에서, 각각의 면역글로불린 분자는 염색체 14 상의 IGH 유전자좌에 의해 암호화되는 2개의 동일한 중쇄 및 염색체 2 상의 면역글로불린 카파 유전자좌(IGK) 및 염색체 22 상의 면역글로불린 람다 유전자좌(IGL)에 의해 암호화되는 2개의 동일한 경쇄로 구성된다. 상기 IGH 유전자좌는 V(가변), D(다양성), J(접합), C(불변) 영역을 포함한다. 상기 V, D 및 J 영역은 각각 상이한 다수의 유전자 세그먼트를 포함하며, 본 명세서에서는 IGH 가변 영역으로 통칭한다. B 세포 발달 과정에서, DNA 수준에서의 재조합 이벤트는 단일 D 세그먼트와 J 세그먼트를 결합한다; 그리고 나서 이 부분적으로 재배열된 D-J 영역의 융합된 D-J 엑손은 V 세그먼트에 결합된다. 그리고 나서, 융합된 V-D-J 엑손을 포함하는 재배열된 V-D-J 영역은 전사되고 RNA 스플라이싱에 의해 불변 영역으로 융합된다. 이 전사체는 mu 중쇄를 암호화한다. 이후 발달 단계에서 B 세포는 V-D-J-Cmu-Cdelta pre-messenger RNA를 생성하며, 이는 대안적으로 mu 또는 delta 중쇄를 암호화하도록 스플라이싱된다. 림프절의 성숙 B 세포는 스위치 재조합을 거치므로 융합된 VDJ 유전자 세그먼트가 IGHG, IGHA 또는 IGHE 유전자 세그먼트 중 하나에 근접하게 되고 각 세포는 감마, 알파 또는 엡실론 중쇄를 발현한다. 여러 J 세그먼트와 여러 다른 V 세그먼트의 잠재적 재조합은 광범위한 항원 인식을 제공한다. 추가적인 다양성은 말단 데옥시뉴클레오티딜 전달효소에 의한 뉴클레오티드의 무작위 추가 및 체세포 과돌연변이에 의해 달성되는 접합 다양성에 의해 달성된다. 각각의 경쇄는 2개의 직렬 면역글로불린 도메인, 즉 불변 도메인(CL) 및 가변 도메인(VL)으로 구성된다. 경쇄의 경우, V 도메인은 2개의 별개의 DNA 세그먼트에 의해 암호화된다. 제1 세그먼트는 V 도메인의 대부분을 암호화하기 때문에 V 유전자 세그먼트라고 불린다. 제2 세그먼트는 V 도메인의 나머지를 암호화하고, 접합 또는 J 유전자 세그먼트라고 불린다. 중쇄와 마찬가지로, 경쇄는 재배열을 거쳐 V 세그먼트를 J 유전자 세그먼트에 결합하고, 이후 인트론에 의해서만 분리되는 불변 영역 서열에 근접시킨다. IGHV, IGHD, IGHJ, IGHG 또는 IGHA 중 임의의 것의 IGH 서열, 또는 이들의 임의의 조합이 본 발명의 주형서열의 범위 내에서 예상된다. IGK 또는 IGL 중 어느 하나의 경쇄 서열, 또는 이들의 조합이 본 발명의 주형서열의 범위 내에서 예상된다.
일부 구현예에서, 조작된 염색체는 하나 이상의 비코딩 서열이 상기 염색체에 도입되었을 수 있는 마우스 염색체를 포함한다. 예컨대, 항체 생성, 성숙 및/또는 다양화를 조절할 수 있는 하나 이상의 비코딩 서열이 상기 염색체에 도입되었을 수 있다. 예를 들어, 항체 다양화를 조절할 수 있는 하나 이상의 비코딩 서열이 상기 염색체에 도입되었을 수 있다. 예를 들어, 항체 그룹 전환을 조절할 수 있는 하나 이상의 비코딩 서열이 상기 염색체에 도입되었을 수 있다. 예를 들어, 스위치 영역 내의 하나 이상의 비코딩 서열이 상기 염색체에 도입되었을 수 있다. 예를 들어, 상기 하나 이상의 비코딩 서열이 상기 염색체에 도입된 경우, 그룹 스위치 재조합, 체세포 과돌연변이 및/또는 활성화-유도된 시티딘 탈아미노화효소가 조절될 수 있다. 예를 들어, 상기 하나 이상의 비코딩 서열이 상기 염색체에 도입된 경우, Ig 서열의 레퍼토리의 다양성이 조절될 수 있다. 예를 들어, 중쇄, κ경쇄 및 λ 경쇄 유전자좌 상의 재배열된 유전자를 포함하는 약 2kb의 가변 영역 및/또는 중쇄 유전자좌 상의 광범위한 G:C rich DNA를 포함하는 약 4kb의 스위치 영역이 상기 염색체에 도입되었을 수 있다.
일부 구현예에서, 주형서열은 인간 IGH 서열을 포함한다. 인간 IGH는 인간 게놈의 GRCh38.p13 어셈블리의 뉴클레오티드 위치 105,586,437 내지 106,879,844 염색체 14에 걸쳐 있다. 당업자는 상기 기재된 것으로부터 예를 들어 적어도 100bp, 500bp, 1,000bp, 2,000bp, 5,000bp, 10,000bp 이상 벗어난 5' 및 3' 경계를 갖는 인간 IGH 서열이 적합한 주형서열임을 인식할 것이다.
일부 구현예에서, 주형서열은 인간 IGH 가변 영역 서열을 포함한다. 일부 구현예에서, 인간 IGH 가변 영역 서열은 인간 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 구현예에서, 인간 IGH 가변 영역 서열은 인간 게놈의 GRCh38.p13 어셈블리의 염색체 14의 뉴클레오티드 위치 105,862,994 내지 106,811,028을 포함한다. 일부 구현예에서, 인간 IGH 가변 영역 서열은 인간 게놈의 GRCh38.p13 어셈블리의 염색체 14의 뉴클레오티드 위치 105,862,994 내지 106,811,028, 여기서 적어도 약 50bp, 100bp, 500bp, 1,000bp, 2,000bp, 5,000bp, 7,000bp, 10,000bp, 15,000bp, 20,000bp 또는 50,000bp를 포함한다. 일부 구현예에서, 인간 IGH 가변 영역 서열은 인간 게놈의 GRCh38.p13 어셈블리의 염색체 14의 뉴클레오티드 위치 105,862,994 내지 106,811,028, 그리고 적어도 약 50bp, 100bp, 500bp, 1,000bp, 5,000bp, 7,000bp, 10,000bp, 15,000bp, 20,000bp 또는 50,000bp를 포함한다. 일부 구현예에서, 인간 IGH 가변 영역 서열은 인간 게놈의 GRCh38.p13 어셈블리의 염색체 14의 뉴클레오티드 위치 105,862,994 내지 106,811,028, 및 이에 대한 하나 이상의 변형을 포함한다. 예시적인 변형은 하나 이상의 V, D 또는 J 세그먼트의 결손과 같은 결손, 마커의 삽입, 재배열 또는 이들의 조합을 포함하지만 이에 제한되지 않는다.
일부 구현예에서, 주형서열은 T 세포 수용체 서브유닛(TCR)의 서열을 포함한다. T 세포 수용체(TCR)는 T 세포, 또는 T 림프구, [1]의 표면에서 발견되는 단백질 복합체로, 주요 조직적합성 복합체(MHC) 분자에 결합된 펩티드로서 항원 단편을 인식하는 역할을 한다. TCR은 이황화 결합 막 결합 이종이량체 단백질을 포함하며, 대부분의 경우 불변 CD3 사슬 분자(CD3 δ, CD3 ε, CD3 γ 및 CD3 ζ)와의 복합체의 일부로 발현되는 고도로 가변적인 α 및 β 사슬로 구성된다. 이 두 사슬을 발현하는 T 세포를 α:β(또는 αβ) T 세포라고 한다. 소수의 T 세포는 가변 γ 및 σ 사슬에 의해 형성되는 대체 수용체를 발현하며, 이는 흉선 T 세포라고 한다. TCR 발달은 림프구 특정 유전자 재조합 과정을 통해 발생하며, 이는 흉선의 T 세포에서 TCR 유전자 세그먼트의 재조합을 통해 발생하는 많은 수의 잠재적 세그먼트로부터 최종 서열을 조립한다. TCRα 유전자 좌위는 가변(V) 및 접합(J) 유전자 분절(Vβ 및 Jβ)을 포함하는 반면, TCRβ 좌위는 Vα 및 Jα 분절 외에 D 유전자 분절을 포함한다. 따라서, α 사슬은 VJ 재조합에서 생성되고 β 사슬은 VDJ 재조합에 관여한다. 이는 TCR γ 사슬이 VJ 재조합에 관여하고 TCR δ 유전자는 VDJ 재조합에서 생성되는 γδ TCR의 개발에서도 유사하다. TCRα 사슬 유전자 좌위는 46개의 가변 분절, 8개의 접합 분절 및 일정 영역으로 구성된다. TCRβ 사슬 유전자 좌위는 48개의 가변 분절, 그 다음 2개의 다양성 분절, 12개의 접합 분절 및 2개의 일정 영역으로 구성된다. 본원에 기술된 임의의 TCR 서브유닛들의 서열, 그 서브유닛들의 서열, 또는 그 서브유닛들의 조합을 포함하는 주형서열이 본 개시내용의 범위 내에서 고려된다. 일부 구현예에서, 주형서열은 TCR 알파 사슬 가변 영역 서열(T-cell receptor alpha locus 또는 TRA에 의해 인코딩됨), TCR 베타 사슬 가변 영역 서열(T-cell receptor beta locus 또는 TRB에 의해 인코딩됨), TCR 감마 가변 영역 서열(T-cell receptor gamma locus 또는 TRG에 의해 인코딩됨), 또는 TCR 델타 가변 영역 서열(T-cell receptor delta locus 또는 TRD에 의해 인코딩됨)을 포함한다.
일부 구현예에서, 주형서열은 항체, 또는 항원 결합 단편을 코딩하는 서열을 포함한다.
본원에서 사용되는 바와 같이, 용어 "항체"는 특정 항원에 특이적으로 결합하거나 그와 면역학적으로 반응하는 면역글로불린 분자를 의미하며, 키메라 항체, 인간화 항체, 이종접합체 항체(예를 들어, 바이-트리- 및 쿼드-특이적 항체, 디아바디, 트라이-바디 및 테트라바디)를 포함하지만 이에 제한되지 않는 항체의 항원 결합 단편 및 예를 들어 Fab', F(ab')2, Fab, Fv, rlgG 및 scFv 단편을 포함하는 항체의 항원 결합 단편을 포함한다. 달리 표시되지 않는 한, 용어 "단클론 항체"(mAb)는 온전한 분자뿐만 아니라 표적 단백질에 특이적으로 결합할 수 있는 항체 단편(예를 들어, Fab 및 F(ab')2 단편 포함)을 모두 포함하는 것을 의미한다. 본원에서 사용되는 바와 같이, Fab 및 F(ab')2 단편은 온전한 항체의 Fc 단편이 결여된 항체 단편을 의미한다. 이러한 항체 단편의 예를 본원에 기술한다.
본 명세서에서 사용되는 용어 "항원 결합 단편"은 표적 항원에 특이적으로 결합하는 능력을 보유하는 항체의 하나 이상의 단편을 의미한다. 항체의 항원 결합 기능은 전장 항체의 단편에 의해 수행될 수 있다. 항체 단편은 예를 들어 Fab, F(ab')2, scFv, 디아바디, 트라이바디, 어피바디, 나노바디, 압타머 또는 도메인 항체일 수 있다. 항체의 "항원 결합 단편"으로 포괄되는 결합 단편의 예는 (i) VL, VH, CL 및 CH1 도메인으로 구성된 1가 단편인 Fab 단편; (ii) F(ab')2 단편, (iii) 힌지 영역에서 이황화 브릿지에 의해 연결된 2개의 Fab 단편을 포함하는 2가 단편; (iii) VH 및 CH1 도메인으로 구성된 Fd 단편; (iv) 항체의 단일 아암의 VL 및 VH 도메인으로 구성된 Fv 단편, (v) VH 및 VL 도메인을 포함하는 dAb; (vi) VH 도메인으로 구성된 dAb 단편; (vi) VH 도메인 또는 VL 도메인으로 구성된 dAb 단편; (vi) VH 또는 VL 도메인으로 구성된 dAb; (viii) 분리된 상보성 결정 영역(CDR) 및 (ix) 선택적으로 합성 링커에 의해 결합될 수 있는 2종 이상의 분리된 CDR의 조합이 있다. 또한, Fv 단편의 2개의 도메인인 VL 및 VH는 별개의 유전자에 의해 코딩되지만, 이들은 재조합 방법을 사용하여 VL 및 VH 영역이 쌍을 이루어 1가 분자를 형성하는 단일 단백질 사슬로 만들어질 수 있게 하는 링커에 의해 결합될 수 있다(예를 들어, Bird et al., Science 242:423-426, 1988 및 Huston et al., Proc. Natl. Acad. Sci. USA 85:5879-5883, 1988). 이러한 항체 단편은 당업자에게 공지된 종래 기술을 사용하여 수득될 수 있으며, 온전한 항체와 동일한 방법으로 단편의 유용성을 스크리닝할 수 있다. 항원 결합 단편은 재조합 DNA 기술, 온전한 면역글로불린의 효소적 또는 화학적 절단, 또는 특정 경우 당업자에게 공지된 화학적 펩티드 합성 방법에 의해 생성될 수 있다.
본원에서 사용되는 바와 같이, 용어 "상보성 결정 영역"(CDR)은 항체의 경쇄 및 중쇄 가변 도메인 둘 모두에서 발견되는 초가변 영역을 지칭한다. 가변 도메인의 보다 고도로 보존된 부분을 프레임워크 영역(FR)이라고 지칭한다. 항체의 초가변 영역을 기술하는 아미노산 위치는 문맥 및 당업계에 공지된 다양한 정의에 따라 달라질 수 있다. 가변 도메인 내의 일부 위치는 이들 위치가 하나의 기준 하에서 초가변 영역 내에 있는 것으로 간주될 수 있고 다른 기준 세트 하에서 초가변 영역 외부에 있는 것으로 간주될 수 있다는 점에서 하이브리드 초가변 위치로 볼 수 있다. 이러한 위치 중 하나 이상은 확장된 초가변 영역에서도 발견될 수 있다. 본원에 기술된 항체는 이러한 하이브리드 초가변 위치의 변형을 포함할 수 있다. 천연 중쇄 및 경쇄의 가변 도메인은 각각 연결되는 루프를 형성하고, 경우에 따라서는 β-시트 구조의 일부를 형성하는 3개의 CDR에 의해 연결된 β-시트 구성을 주로 채택하는 4개의 프레임워크 영역을 포함한다. 각 사슬의 CDR은 FR1-CDR1-FR2-CDR2-FR3-FR4 순서의 프레임워크 영역에 의해 밀접하게 함께 유지되며, 다른 항체 사슬의 CDR과 함께 항체의 표적 결합 부위의 형성에 기여한다(Kabat et al., Sequences of Proteins of Immunological Interest, National Institute of Health, Bethesda, Md, 1987 참조). 본원에서 사용되는 바와 같이, 면역글로불린 아미노산 잔기의 넘버링은 달리 표시되지 않는 한, Kabat et al. 의 면역글로불린 아미노산 잔기 넘버링 시스템에 따라 수행된다.
일부 구현예에서, 항체, 또는 항원 결합 단편은 인간 항체 또는 항원 결합 단편을 포함한다. 일부 구현예에서, 항체 또는 항원 결합 단편은 인간화된다.
본원의 통상의 기술자는 주형서열이 특정 조직, 세포 유형 또는 유기체에서 유전자의 발현에 필요한 서열, 예를 들어 항체를 포함할 수도 있음을 이해할 것이다. 이러한 서열은 프로모터, 인핸서, 전령 RNA(mRNA)의 5' 및 3' 비번역 영역과 같은 비번역 서열, 폴리아데닐화(polyA) 서열, 인트론, 내부 리보솜 진입 부위(IRES) 등을 포함하나 이에 제한되지 않는다. 적절한 서열의 선택은 본원의 통상의 기술자에게 명백할 것이다.
일부 구현예에서, 주형서열은 프로모터를 포함한다. 일부 구현예에서, 프로모터는 내인성 프로모터, 즉 프로모터는 주형서열 내에 포함된 유전자와 정상적으로 연관된 프로모터이다. 일부 구현예에서, 프로모터는 내인성 프로모터, 예를 들어 프로모터가 작동 가능하게 연결된 주형서열의 유전자보다 다른 유전자 또는 유기체로부터 분리되거나 유래된 프로모터가 아니다. 예를 들어, 주형서열은 면역글로불린 프로모터가 아닌 프로모터와 작동 가능하게 연결된 항체 또는 항원 결합 단편을 코딩하는 서열을 포함한다. 일부 구현예에서, 프로모터는 구성적 프로모터, 유도성 프로모터, 또는 조직 특이적 프로모터이다. 일부 구현예에서, 프로모터는 포유동물 유전자, 예를 들어 림프구에서 발현된 유전자로부터 분리되거나 유래된다.
주형서열의 유전자를 발현하는데 사용될 수 있는 예시적인 프로모터는 SV40 초기 프로모터 영역, Rous 육종 바이러스의 3' 긴 말단 반복에 포함된 프로모터, 메탈로티오네인 유전자의 조절 서열, 테트라사이클린(Tet) 프로모터, 효모 또는 Gal4 프로모터, ADC(알코올 탈수소효소) 프로모터, PGK(포스포글리세롤 키나제) 프로모터, 알칼리성 포스파타제 프로모터 및 하기 동물 전사 조절 영역을 포함하지만 이에 제한되지는 않는다: 췌장 포상세포에서 활성화된 엘라스타제I 유전자 조절 영역 췌장 베타세포에서 활성화된 인슐린 유전자 조절 영역, 림프세포에서 활성화된 면역글로불린 유전자 조절 영역, 고환, 유방, 림프, 비만세포에서 활성화된 마우스 유방종양 바이러스 조절 영역, 간에서 활성화된 알부민 유전자 조절 영역, 간에서 활성화된 알파태아단백 유전자 조절 영역, 간에서 활성화된 알파1-항트립신 유전자 조절 영역, 골수세포에서 활성화된 베타글로빈 유전자 조절 영역, 뇌의 올리고당 세포에서 활성화된 미오신 경쇄-2 유전자 조절 영역, 골격근에서 활성화된 미오신 경쇄-2 유전자 조절 영역, 신경세포에서 활성화된 신경특이적 에놀라제(NSE) 유전자 조절 영역, 신경세포에서 활성화된 뇌유래신경영양인자(BDNF) 유전자 조절 영역, 성상세포에서 활성화된 신경섬유상산성단백질(GFAP) 프로모터, 시상하부에서 활성화된 성선자극방출호르몬 유전자 조절 영역 등.
표적 염색체
본 발명은 본 명세서에 기재된 방법에 사용하기 위해, 표적서열을 포함하는 표적 염색체를 제공한다.
본원에서 사용되는 바와 같이, "표적 염색체"는 "표적서열"을 포함하는 염색체를 의미하거나, 주형서열의 삽입에 의한 표적서열의 유의미한 결손이 없는 경우, "표적 위치"를 포함하는 염색체를 의미한다. 표적서열은 본원에 기술된 방법을 사용하여 주형서열의 삽입에 의해 결손된 표적 염색체의 서열을 의미한다. 표적 위치는 주형서열이 (삽입을 위해) 삽입되거나 그에 결합되는 (염색체 전위 또는 재배열을 위해) 표적 염색체 내의 위치를 의미한다.
표적 염색체는 임의의 적합한 공급원으로부터 분리되거나 유래될 수 있다. 일부 실시형태에서, 표적 염색체는 진핵생물로부터 유래된다. 일부 실시형태에서, 진핵생물은 척추동물, 예를 들어, 조류, 파충류 또는 포유류이다. 일부 실시형태에서, 표적 염색체는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭으로부터 유래된다. 일부 실시형태에서, 표적 염색체는 마우스로부터 유래된다. 일부 실시형태에서, 표적 염색체는 래트로부터 유래된다. 일부 실시형태에서, 표적 염색체는 원숭이로부터 유래된다.
일부 구현예에서, 주형 염색체 및 표적 염색체는 상이한 종으로부터 유래한다. 예를 들어, 주형 염색체는 인간으로부터 유래하고, 표적 염색체는 마우스로부터 유래한다. 일부 구현예에서, 주형 염색체 및 표적 염색체는 동일한 종으로부터 유래한다.
일부 실시형태에서, 표적 염색체는 인공 염색체이다.
일부 실시형태에서, 표적 염색체는 자연적으로 발생하는 염색체이다.
일부 구현예에서, 표적 염색체는 자연적으로 발생하는 염색체에 대한 하나 이상의 변형을 포함한다. 변형은 특히, 서열의 삽입, 결실, 재배열 등을 포함한다. 표적 염색체에 삽입된 서열의 예는 특히, 마커, 프로모터, cDNA 서열, 비코딩 등을 포함한다. 적합한 마커는 표 3에 개시된 것과 같은 선택 가능한 마커뿐만 아니라, GFP, mCherry 등과 같은 검출 가능한 마커를 포함한다.
일부 구체예에서, 표적 염색체는 주형서열의 5'에 위치한 엔도뉴클레아제 부위를 포함한다. 일부 구체예에서, 표적 염색체는 표적서열의 3'에 위치한 엔도뉴클레아제 부위를 포함한다. 일부 구체예에서, 엔도뉴클레아제 부위는 표적서열에 바로 인접하게 위치한다. 일부 구체예에서, 엔도뉴클레아제 부위는 표적서열의 근처에 위치한다.
일부 구체예에서, 표적 염색체는 표적서열의 양 측의 엔도뉴클레아제 부위를 포함한다. 예를 들어, 표적 염색체는 표적서열의 5'에 위치한 제1 엔도뉴클레아제 부위 및 표적서열의 3'에 위치한 제2 엔도뉴클레아제 부위를 포함한다. 일부 구체예에서, 제1 및 제2 엔도뉴클레아제 부위는 모두 동일한 엔도뉴클레아제에 의해 인식되고 절단된다. 예를 들어, 제1 및 제2 엔도뉴클레아제 부위는 모두 동일한 엔도뉴클레아제에 의해 인식되는 동일한 DNA 서열을 포함한다. 일부 구체예에서, 제1 엔도뉴클레아제 부위는 제1 엔도뉴클레아제에 의해 절단되고, 제2 엔도뉴클레아제 부위는 제2 엔도뉴클레아제에 의해 절단된다. 예를 들어, 제1 및 제2 엔도뉴클레아제 부위는 2개의 상이한 징크 핑거 뉴클레아제(ZFN)에 의해 인식되는 상이한 DNA 서열, 또는 상이한 표적서열을 포함하는 가이드 핵산(gNA)을 포함하는 CRISPR/Cas 리보뉴클레오단백질 복합체에 의해 인식되는 2개의 상이한 CRISPR/Cas 표적서열을 포함한다. 일부 구체예에서, 제1 및/또는 제2 엔도뉴클레아제 부위는 표적서열에 바로 인접하여 위치한다. 일부 구체예에서, 제1 및/또는 제2 엔도뉴클레아제 부위는 표적서열 근처에 위치한다.
주형서열로부터 5bp 내에, 10bp 내에, 15bp 내에, 20bp 내에, 30bp 내에, 40bp 내에, 50bp 내에, 70bp 내에, 80bp 내에, 100bp 내에, 120bp 내에, 140bp 내에, 180bp 내에, 250bp 내에, 300bp 내에, 또는 500bp 내에, 또는 500bp 내에 있는 엔도뉴클레아제 부위는 표적서열에 근접한 것으로 간주될 수 있다.
일부 구현예에서, 표적 염색체는 상동성 지시 복구를 용이하게 하기 위해 사용되는 핵산분자의 상동성 암의 하나 이상의 서열을 포함한다. 일부 구현예에서, 표적 염색체는 표적서열의 5'에 위치한 상동성 암의 서열을 포함한다. 일부 구현예에서, 표적 염색체는 5' 내지 3'의 상동성 암 서열, 엔도뉴클레아제 부위 및 표적서열을 포함한다. 일부 구현예에서, 표적 염색체는 표적서열의 3'에 위치한 상동성 암의 서열을 포함한다. 일부 구현예에서, 표적 염색체는 5' 내지 3'의 표적서열, 엔도뉴클레아제 부위 및 상동성 암 서열을 포함한다. 일부 구현예에서, 엔도뉴클레아제 부위는 상동성 암 서열과 표적서열 사이에 위치한다.
일부 구현예에서, 표적 염색체는 표적서열의 제1 상동성 암 서열 5', 및 표적서열의 제2 상동성 암 서열 3'을 포함한다. 즉, 표적 염색체는 표적서열의 상류 및 하류 모두 상동성 암을 포함한다. 일부 구현예에서, 제1 상동성 암은 5' 내지 3', 제1 상동성 암, 적어도 제1 마커의 서열 및 주형서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 3' 상동성 암이다. 일부 구현예에서, 제2 상동성 암은 5' 내지 3', 주형서열의 3' 말단의 뉴클레오티드 서열, 적어도 제2 마커의 서열 및 제2 상동성 암을 포함하는 제2 핵산분자의 3' 상동성 암이다. 일부 구현예에서, 표적 염색체는 5' 내지 3', 제1 상동성 암 서열, 제1 엔도뉴클레아제 부위, 표적서열, 제2 엔도뉴클레아제 부위, 및 제2 상동성 암 서열을 포함한다.
일부 실시형태에서, 표적 염색체의 제1 및/또는 제2 상동성 암 서열은 제1 및/또는 제2 엔도뉴클레아제 부위에 바로 인접하여 위치한다. 일부 실시형태에서, 제1 상동성 암 서열은 제1 엔도뉴클레아제 부위에 바로 인접하여 위치하고, 제2 상동성 암 서열은 제2 엔도뉴클레아제 부위에 바로 인접하여 위치하며, 여기서 제1 엔도뉴클레아제 부위는 제1 상동성 암과 표적서열 사이에 있고, 제2 엔도뉴클레아제 부위는 표적서열과 제2 상동성 암 사이에 있다.
일부 실시형태에서, 제1 및/또는 제2 상동성 암 서열은 표적서열 근처에 위치한다. 표적서열의 5 bp 내, 10 bp 내, 15 bp 내, 20 bp 내, 30 bp 내, 40 bp 내, 50 bp 내, 70 bp 내, 80 bp 내, 90 bp 내, 120 bp 내, 140 bp 내, 180 bp 내, 200 bp 내 또는 250 bp 내인 엔도뉴클레아제 부위는 표적서열 근처에 있는 것으로 간주될 수 있다.
일부 실시양태에서, 표적 염색체는 제1 상동성 암, 제1 엔도뉴클레아제 부위, 표적서열, 제2 엔도뉴클레아제 부위, 및 제2 상동성 암을, 5' 에서 3'으로 포함한다.
일부 구현예에서, 주형서열이 삽입될 때 표적 염색체의 서열이 거의 또는 전혀 결실되지 않고, 표적서열은 본원에서 "표적 부위" 또는 "표적 위치"로서 상호 교환가능하게 지칭된다. 통상의 기술자는 이러한 경우 상동성 암 및 엔도뉴클레아제 부위의 배열이 상동성 암이 엔도뉴클레아제 부위에 의해 측면에 있는 표적서열 그 자체가 아니라 표적 위치의 엔도뉴클레아제 부위에 측면에 있다는 점을 제외하고는 상동성 암 및 엔도뉴클레아제 부위의 배열이 기재된 것과 유사하다는 것을 인식할 것이다. 일부 구현예에서, 표적 염색체는 제1 상동성 암의 서열, 엔도뉴클레아제 부위의 서열 및 제2 상동성 암의 서열을, 5'에서 3'으로 포함한다. 일부 구현예에서, 제1 상동성 암은, 제1 상동성 암, 적어도 제1 마커 서열 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함하는 제2 핵산분자의 5' 상동성 암이다. 일부 구현예에서, 제2 상동성 암은, 주형서열의 3' 말단의 하류 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제2 마커 서열 및 제2 상동성 암을, 5'에서 3'으로 포함하는 제2 핵산분자의 3' 상동성 암이다.
일부 구현예에서, 주형서열은 염색체 재배열 또는 전위를 생성하기 위해 표적서열에 결합된다. 일부 구현예에서, 표적 염색체는, 표적 염색체 상동성 암 서열 및 엔도뉴클레아제 부위를, 5'에서 3'으로 포함한다. 일부 구현예에서, 표적 염색체 상동성 암은, 표적서열 상동성 암, 적어도 하나의 마커 및 주형서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5' 내지 3'으로 포함한다. 일부 구현예에서, 표적 염색체는, 엔도뉴클레아제 부위 및 표적 염색체 상동성 암 서열을, 5' 내지 3'으로 포함한다. 일부 구현예에서, 표적 염색체 상동성 암은, 주형서열의 3' 말단의 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제1 마커 및 표적서열 상동성 암을 포함하는 핵산분자의 3' 상동성 암을, 5' 내지 3'으로 포함한다.
일부 실시양태에서, 표적 염색체의 제1 및/또는 제2 상동성 암 서열은 길이가 약 20 내지 2,000bp, 약 50 내지 1,500bp, 약 100 내지 1,400bp, 약 150 내지 1,300bp, 약 300 내지 1,200bp, 약 300 내지 1,100bp, 약 400 내지 1,000bp, 또는 약 500 내지 900bp, 또는 약 600bp 내지 800bp이다. 일부 실시양태에서, 표적 염색체의 상동성 서열은 길이가 약 400 내지 1,500bp이다. 일부 실시양태에서, 표적 염색체의 상동성 서열은 길이가 약 500 내지 1,300bp이다. 일부 실시양태에서, 표적 염색체의 상동성 서열은 길이가 약 600 내지 1,000bp이다.
표적서열 및 표적 위치
표적 염색체는 주형서열이 삽입되는 표적서열 또는 위치, 또는 본원에 기술된 방법에 의해 주형서열이 결합되는 위치를 포함한다. 표적서열은 표적 염색체 상의 임의의 적합한 위치에 위치될 수 있다.
표적서열은 임의의 적합한 소스로부터 분리되거나 유도될 수 있다. 일부 실시형태에서, 표적서열 및 주형서열은 상이한 종으로부터 유래된다. 예컨대, 주형서열은 인간으로부터 유래되고, 표적서열은 마우스로부터 유래된다. 일부 실시형태에서, 표적서열 및 주형서열은 동일한 종으로부터 유래된다.
일부 실시형태에서, 표적서열은 자연적으로 발생하는 서열을 포함한다. 일부 실시형태에서, 표적서열은 자연적으로 발생하는 서열에 대한 하나 이상의 변형을 포함한다. 변형은 특히, 인공 서열 또는 마커와 같은 서열의 삽입, 삭제, 재배열을 포함한다. 일부 실시형태에서, 표적서열은 인공 서열을 포함한다. 일부 실시형태에서, 표적서열은 자연적으로 발생하는 서열 및 인공 서열 모두를 포함한다. 예시적인 인공 서열은 특히, 마커, cDNA 서열, 프로모터, 재조합 서열을 포함한다. 예시적인 마커는 녹색 형광 단백질(GFP), mCherry 등과 같은 검출가능한 마커뿐만 아니라 하기 표 3에 개시된 선택가능한 마커를 포함하지만, 이에 제한되지는 않는다.
일부 구현예에서, 표적서열은 진핵생물로부터 유래한다. 일부 구현예에서, 진핵생물은 척추동물, 예컨대, 조류, 파충류 또는 포유류이다. 일부 구현예에서, 주형서열은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭 서열을 포함한다. 일부 구현예에서, 표적서열은 마우스 서열을 포함한다. 일부 구현예에서, 표적서열은 마우스 서열을 포함한다. 일부 구현예에서, 표적서열은 래트 서열을 포함한다. 일부 구현예에서, 표적서열은 원숭이 서열을 포함한다.
일부 실시예들에서, 표적서열은 길이가 적어도 25KB, 적어도 50KB, 적어도 100KB, 적어도 200KB, 적어도 400KB, 적어도 500KB, 적어도 600KB, 적어도 700KB, 적어도 800KB, 적어도 900KB, 적어도 1MB, 적어도 2MB, 적어도 3MB, 적어도 4MB, 적어도 5MB, 적어도 6MB, 적어도 7MB, 적어도 8MB, 적어도 9MB, 적어도 10MB, 적어도 15MB, 적어도 20MB, 적어도 25MB, 적어도 30MB, 적어도 70MB, 적어도 80MB, 적어도 90MB, 적어도 100MB, 적어도 120MB, 적어도 160MB, 적어도 160MB, 적어도 180MB, 적어도 200MB, 적어도 200MB, 적어도 220MB, 또는 적어도 250MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 50KB, 적어도 100KB, 적어도 200KB, 적어도 500KB, 적어도 700KB, 적어도 1MB, 적어도 2MB, 적어도 3MB, 적어도 4MB, 적어도 5MB, 적어도 6MB, 적어도 7MB, 적어도 8MB, 적어도 9MB, 적어도 10MB, 적어도 20MB, 적어도 30MB, 적어도 40MB, 또는 50MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 1MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 2MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 2MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 3MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 3MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 4MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 5MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 5MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 10MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 20MB이다.
일부 실시예들에서, 표적서열은 길이가 50KB 내지 250MB, 50KB 내지 100MB, 50KB 내지 50MB, 50KB 내지 20MB, 50KB 내지 10MB, 50KB 내지 5MB, 50KB 내지 3MB, 50KB 내지 2MB, 50KB 내지 1MB, 100KB 내지 200MB, 100KB 내지 100MB, 100KB 내지 50MB, 100KB 내지 20MB, 100KB 내지 10MB, 100KB 내지 5MB, 100KB 내지 3MB, 100KB 내지 2MB, 100KB 내지 1MB, 100KB 내지 500KB, 200KB 내지 100MB, 200KB 내지 50MB, 200KB 내지 20MB, 200KB 내지 10MB, 200KB 내지 5MB, 200KB 내지 3MB, 200KB 내지 2MB, 200KB 내지 1MB, 200KB 내지 500KB, 500KB 내지 100MB, 500KB 내지 50MB, 500KB 내지 20MB, 500KB 내지 10MB, 500KB 내지 5MB, 500KB 내지 3MB, 500KB 내지 2MB, 500KB 내지 1MB, 1MB 내지 100MB, 1MB 내지 50MB, 1MB 내지 20MB, 1MB 내지 10MB, 1MB 내지 5MB, 1MB 내지 3MB, 1MB 내지 2MB, 3MB 내지 100MB, 3MB 내지 50MB, 3MB 내지 20MB, 3MB 내지 10MB, 3MB 내지 5MB, 5MB 내지 100MB, 5MB 내지 50MB, 5MB 내지 20MB, 5MB 내지 10MB, 10MB 내지 100MB, 10MB 내지 50MB, 또는 10MB 내지 20MB이다. 일부 실시예들에서, 표적서열은 길이가 200KB 내지 50MB, 1MB 내지 20MB, 1MB 내지 10MB, 1MB 내지 5MB, 1MB 내지 3MB, 3MB 내지 20MB, 3MB 내지 10MB, 3MB 내지 7MB, 또는 3MB 내지 5MB이다. 일부 실시예들에서, 표적서열은 길이가 1MB 내지 10MB이다. 일부 실시예들에서, 표적서열은 길이가 1MB 내지 5MB이다. 일부 실시예들에서, 표적서열은 길이가 3MB 내지 5MB이다.
일부 구현예에서, 표적서열은 하나 이상의 유전자의 서열을 포함한다. 일부 구현예에서, 표적서열은 다수의 유전자의 서열을 포함한다. 일부 구현예에서, 표적서열은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 80, 90, 100, 150, 200, 300, 350, 400, 450, 500, 600, 700, 900, 1000, 1500 또는 2000 유전자의 서열을 포함한다.
일부 구현예에서, 표적서열은 주형서열과 상동인 서열을 포함한다. 예를 들어, 주형 염색체는 표 1 및 표 2에 기재된 유전자 중 하나 이상을 포함하는 인간 주형서열을 포함하는 인간 염색체인 반면, 표적 염색체는 마우스 표적서열을 포함하는 마우스 염색체이고, 마우스 표적서열은 인간 주형서열과 상동인 마우스 서열을 포함한다. 추가 예로서, 주형 염색체는 인간 IGH 서열을 포함하는 인간 염색체인 반면, 표적 염색체는 마우스 염색체이고, 표적서열은 상동 마우스 Igh 서열을 포함한다. 또 다른 예로서, 주형 염색체는 인간 TCR 서열을 포함하는 인간 염색체인 반면, 표적 염색체는 마우스 염색체이고, 표적서열은 상동 마우스 TCR 서열을 포함한다.
일부 실시형태에서, 표적 염색체는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭으로부터 유래하고, 표적서열은 주형서열의 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭 동족체를 포함한다.
일부 구현예에서, 표적서열은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭 유전자의 서열을 포함한다. 모든 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 또는 닭 유전자가 본 명세서의 범위 내에서 예상된다. 이론에 의해 결합되기를 원하지 않고, 질병 발병에 관여하거나 잠재적인 치료 표적인 인간 유전자를 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭과 같은 모델 유기체로 전달하면 질병에 대한 연구 및 적절한 치료법의 개발을 용이하게 할 수 있다. 일부 구현예에서, 표적서열은 인간 주형서열과 상동인 마우스 서열을 포함한다. 일부 구현예에서, 표적서열은 인간 주형서열과 상동인 래트 서열을 포함한다. 일부 구현예에서, 표적서열은 인간 주형서열과 상동인 원숭이 서열을 포함한다.
일부 구체예에서, 표적서열은 마우스 면역글로불린 서열과 같은 면역글로빈 서열을 포함한다. 일부 구체예에서, 표적서열은 마우스 Igh 서열을 포함한다. 마우스 Igh는 마우스 게놈의 GRCm39 어셈블리의 염색체 12의 뉴클레오티드 위치 1112,947,269 내지 116,248,693에 걸쳐 있다. 당업자는 상기 기재된 것으로부터 예를 들어 적어도 100bp, 500bp, 1,000bp, 2,000bp, 5,000bp, 10,000bp 이상 벗어난 5' 및 3' 경계를 갖는 마우스 Igh 서열이 적합한 주형서열임을 인식할 것이다.
일부 구현예에서, 표적서열은 마우스 Igh 가변 영역 서열을 포함한다. 일부 구현예에서, 마우스 Igh 가변 영역 서열은 VH, DH 및 JH1-6 유전자 세그먼트의 마우스 상동체를 코딩하는 서열 및 개입하는 비코딩 서열을 포함한다. 일부 구현예에서, 마우스 Igh 가변 영역 서열은 마우스 유전체의 GRCm39 어셈블리의 염색체 12의 뉴클레오티드 위치 113,391,842 내지 115,973,952를 포함한다. 일부 구체예에서, 마우스 Igh 가변 영역 서열은 마우스 유전체의 GRCm39 어셈블리의 염색체 12의 뉴클레오티드 위치 113,391,842 내지 115,973,952에서 적어도 약 50bp, 100bp, 500bp, 1,000bp, 1,000bp, 2,000bp, 5,000bp, 7,000bp, 10,000bp, 15,000bp, 20,000bp 또는 5,000bp의 말단, 또는 둘 모두를 포함한다. 일부 구체예에서, 인간 IGH 가변 영역 서열은 마우스 유전체의 GRCm39 어셈블리의 염색체 12의 뉴클레오티드 위치 113,391,842 내지 115,973,952 및 5' 말단의 추가 측면 서열의 적어도 약 50bp, 100bp, 500bp, 1,000bp, 2,000bp, 5,000bp, 7,000bp, 10,000bp, 15,000bp, 20,000bp 또는 50,000bp의 말단, 또는 둘 모두를 포함한다. 일부 구현예에서, 마우스 Igh 가변 영역 서열은 마우스 게놈의 GRCm39 어셈블리의 염색체 12의 뉴클레오티드 위치 113,391,842 내지 115,973,952, 및 이에 대한 하나 이상의 변형을 포함한다. 예시적인 변형은 하나 이상의 V, D 또는 J 세그먼트의 결손과 같은 삭제, 마커의 삽입, 재배열, 또는 이들의 조합을 포함하지만 이에 제한되지는 않는다. 일부 구체예에서, 표적서열은 마우스 Igl 가변 영역 서열을 포함한다. 일부 구체예에서, 표적서열은 마우스 Igk 가변 영역 서열을 포함한다. 일부 구체예에서, 주형서열은 인간 IGL 가변 영역 서열을 포함한다. 일부 구체예에서, 주형서열은 인간 IGK 가변 영역 서열을 포함한다.
일부 구현예에서, 예를 들어, 본 명세서에 기재된 방법에 의해 표적 염색체 서열이 거의 또는 전혀 삭제되지 않은 구현예에서, 표적 염색체는 표적 위치를 포함한다. 표적 위치는 주형서열이 삽입되는 위치, 또는 주형서열이 결합되는 위치이다. 표적 염색체 상의 임의의 위치가 적합한 위치일 수 있다. 일부 구현예에서, 표적 위치는 표적 위치에서 이중가닥 절단을 생성하기 위한 엔도뉴클레아제 부위를 포함한다.
조작된 염색체
본 발명은 본원에 기술된 방법에 의해 제조된 조작된 염색체를 제공한다.
일부 실시형태에서, 조작된 염색체는 하나 이상의 인간화된 서열을 포함하는 마우스 염색체를 포함한다. 일부 실시형태에서, 인간화된 서열은 인간의 질병 또는 장애와 연결된 하나 이상의 유전자, 예를 들어, 유전적 질병 또는 장애와 연결된 유전자, 또는 온콘젠을 포함한다. 일부 실시형태에서, 조작된 염색체는 하나 이상의 인간화된 서열을 포함하는 래트 염색체를 포함한다. 일부 실시형태에서, 조작된 염색체는 하나 이상의 인간화된 서열을 포함하는 원숭이 염색체를 포함한다.
일부 구현예에서, 조작된 염색체는 하나 이상의 면역글로불린 서열이 인간화된 마우스 염색체를 포함한다. 일부 구현예에서, 면역글로불린 서열은 IGH 가변 영역과 같은 IGH 서열을 포함한다. 일부 구현예에서, 조작된 염색체는 마우스 염색체 12를 포함하며, 여기서 마우스 Igh 가변 영역은 염색체 14로부터 인간 IGH 가변 영역으로 대체되었다. 일부 구현예에서, 마우스 Igh 가변 영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재하는 비-코딩 서열들을 포함한다. 일부 구현예에서, 인간 IGH 가변 영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개입하는 비-코딩 서열을 포함한다. 일부 구현예에서, 조작된 염색체는 마우스 염색체 12를 포함하며, 여기서 마우스 유전체의 GRCm39 어셈블리의 염색체 12의 대략 113,391,842 내지 115,973,952의 뉴클레오티드 서열을 포함하는 마우스 Igh 가변 영역은 인간 유전체의 GRCh38.p13 어셈블리의 염색체 14의 대략 105,862,994 내지 106,811,028의 뉴클레오티드 서열을 포함하는 인간 IGH 가변 영역으로 대체되었다. 일부 구현예에서, 조작된 염색체는 마우스 Igk 가변 영역을 대신하여 인간 IGK 가변 영역의 서열을 포함하는 마우스 염색체 6이다. 일부 구현예에서, 마우스 Igk 가변 영역 서열은 마우스 Vk 및 Jk1-5 유전자 세그먼트들을 코딩하는 서열 및 개재하는 비-코딩 서열을 포함한다. 일부 구현예에서, 주형서열은 인간 IGK 가변 영역 서열을 포함한다. 일부 구현예에서, 인간 IGK 가변 영역 서열은 인간 Vk 및 Jk1-5 유전자 세그먼트들을 코딩하는 서열 및 개재하는 비-코딩 서열을 포함한다.
핵산분자, 플라스미드 및 벡터
본 발명은 본 명세서에 기술된 방법에 사용하기 위한 핵산분자를 제공한다. 핵산분자는 때때로 폴리뉴클레오티드로 지칭되며, 단일 분자를 구성하는 연결된 뉴클레오티드의 사슬을 지칭한다. 본 발명의 핵산분자는 디옥시리보핵산(DNA), 또는 리보핵산(RNA)일 수 있다. 본 발명의 예시적인 핵산분자는 표적서열 내로 주형서열의 삽입, 또는 이중가닥 절단 복구에 의한 주형 및 표적서열의 결합을 용이하게 하기 위하여 표적 및 주형서열 둘 모두에 특이적이거나 인접한 상동성 암을 포함한다.
본 발명은 본 명세서에 기재된 HDR-매개 염색체 재배열을 용이하게 하는 표적 및 주형 염색체에 특이적인 상동성 암을 포함하는 핵산분자를 제공한다. 일부 구현예에서, 핵산분자는, 표적서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제1 마커, 및 주형서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함한다. 일부 구체예에서, 핵산분자는, 주형서열의 3' 말단의 하류에 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제2 마커, 및 표적서열의 3' 말단의 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함한다.
본 발명은 본 명세서에 기재된 핵산분자를 포함하는 벡터를 제공한다. 본 발명에 따른 벡터는 이것이 연결된 다른 핵산을 운반할 수 있는 핵산분자이다. 플라스미드는 예를 들어 벡터의 한 종류이다. 벡터 서열은 그 중에서도 박테리아, 예를 들어 기원 또는 복제로부터 벡터의 생산에 필요한, 서열 및 선택가능한 마커를 포함한다.
일부 구현예에서, 벡터는 플라스미드(plasmid)이다. 일부 구현예에서, 플라스미드는, 표적서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제1 마커, 및 주형서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함한다. 일부 구현예에서, 플라스미드는, 주형서열의 3' 말단의 하류에 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제2 마커, 및 표적서열의 3' 말단의 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함한다.
일부 실시형태에서, 벡터는 주형서열의 5' 말단에 또는 그 근처에 위치한 상동성 암의 서열을 포함한다. 일부 실시형태에서, 상동성 암은 주형서열의 상류, 즉 5'에 위치한다. 일부 실시형태에서, 벡터는 주형서열의 3' 말단에 또는 그 근처에 위치한 상동성 암의 서열을 포함한다. 일부 실시형태에서, 상동성 암은 주형서열의 하류, 즉 3'에 위치한다. 일부 실시형태에서, 벡터에서의 주형 상동성 암의 서열은 주형서열에서의 상동성 암의 서열과 동일하거나, 실질적으로 동일하다.
일부 실시형태에서, 벡터는 표적서열 또는 위치의 5'에 위치된 상동성 암의 서열, 즉 표적서열 또는 위치의 상류를 포함한다. 일부 실시형태에서, 벡터는 표적서열 또는 위치의 3'에 위치된 상동성 암의 서열, 즉 표적서열 또는 위치의 하류를 포함한다.
본원의 기술자는 벡터 내의 상동성 암 서열과 주형 또는 표적 염색체 내의 동등한 서열 사이에 어느 정도 불일치가 있을 수 있음을 이해할 것이고, 벡터는 여전히 벡터로부터 주형 또는 표적 염색체 내의 이중가닥 절단의 복구를 용이하게 할 것이다. 예컨대, 주형 염색체 내의 동등한 서열과 95% 이상 동일, 96% 이상 동일, 97% 이상 동일, 98% 이상 동일 또는 99% 이상 동일한 벡터 상동성 암 서열이 본 발명의 방법에 적합할 것이다.
일부 구현예에서, 본 명세서에 기재된 핵산분자, 플라스미드 또는 벡터는 하나 이상의 엔도뉴클레아제 부위를 포함한다.
일부 구현예에서, 본 발명은 (i) 표적서열의 5' 말단의 상류(upstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암(homology arm), 적어도 하나의 제1 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 제1 핵산분자; 및 (ii) 주형서열의 3' 말단의 하류(downstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암, 적어도 하나의 제2 마커, 및 표적서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5' 에서 3' 으로 포함하는 제2 핵산분자를 제공한다. 일부 구현예에서, 제1 및 제2 핵산분자는 플라스미드이다. 일부 구현예에서, 제1 핵산분자는, 표적서열의 5' 말단의 상류 뉴클레오티드 서열, 제1 엔도뉴클레아제 부위, 적어도 제1 마커, 제2 엔도뉴클레아제 부위, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함하고, 여기서, 제1 및 제2 엔도뉴클레아제 부위는 핵산분자 상의 제1 및 제2 엔도뉴클레아제 부위, 및 주형 및 표적 염색체 상의 상응하는 엔도뉴클레아제 부위가 동일한 엔도뉴클레아제에 의해 절단되도록 상동성 암에 중첩된다. 일부 실시형태에서, 제2 핵산분자는, 주형서열의 3' 말단의 뉴클레오티드 서열 하류를 포함하는 5' 상동성 암, 제3 엔도뉴클레아제 부위, 적어도 제2 마커, 제4 엔도뉴클레아제 부위, 및 표적서열의 3' 말단의 뉴클레오티드 서열 하류를 포함하는 3' 상동성 암을, 5'에서 3'으로 포함하고, 여기서, 제2 및 제3 엔도뉴클레아제 부위는 핵산분자 상의 제3 및 제4 엔도뉴클레아제 부위, 및 주형 및 표적 염색체 상의 상응하는 엔도뉴클레아제 부위가 동일한 엔도뉴클레아제에 의해 절단되도록 상동성 암에 중첩된다. 일부 실시양태에서, 제1 마커 및 제2 마커는 동일한 마커가 아니다. 일부 실시양태에서, 제1 핵산분자 상의 제1 마커는 선택가능한 마커 및 검출가능한 마커의 조합을 포함한다. 일부 실시양태에서, 제1 마커는 eGFP 및 푸로마이신 내성을 포함한다. 일부 실시양태에서, 제2 마커는 선택가능한 마커를 포함한다. 일부 실시양태에서, 제2 마커는 하이그로마이신 내성을 포함한다.
일부 실시형태에서, 핵산분자 상의 상동성 암 서열은 주형서열, 표적서열 또는 표적 위치 근처에 위치하는 서열에 대응한다. 0bp, 5bp, 10bp, 15bp, 20bp, 30bp, 40bp, 50bp, 70bp, 80bp, 90bp, 100bp, 140bp, 160bp, 200bp 또는 250bp 내에 위치하는 상동성 암은 상기 주형서열에 근접한 것으로 간주될 수 있다.
일부 실시양태에서, 주형 또는 표적 염색체 서열에 대응하는 핵산분자 상동성 서열은 길이가 약 20 내지 2,000bp, 약 50 내지 1,500bp, 약 100 내지 1,400bp, 약 150 내지 1,300bp, 약 300 내지 1,200bp, 약 300 내지 1,100bp, 약 400 내지 1,000bp, 또는 약 500 내지 900bp, 또는 약 600bp 내지 800bp이다. 일부 실시양태에서, 핵산분자 상동성 서열은 길이가 약 400 내지 1,500bp이다. 일부 실시양태에서, 핵산분자 상동성 서열은 길이가 약 500 내지 1,300bp이다. 일부 실시양태에서, 핵산분자 상동성 서열은 길이가 약 600 내지 1,000bp이다.
일부 구현예에서, 핵산분자는 포유동물 세포에서의 발현에 적합한 마커를 포함한다. 일부 구체예에서, 마커는 핵산분자 내 상동성 암 사이에 있으며, 이에 의해 마커가 표적서열에 삽입된다. 일부 구체예에서, 마커는 선택 가능한 마커이다. 적합한 선택된 마커는 디히드로폴레이트 환원효소(DHFR), 글루타민 합성효소(GS), 푸로마이신 아세틸트랜스퍼라제, 블라스티딘 탈아미노화효소, 히스티디놀 탈수소효소, 하이그로마이신 포스포트랜스퍼라제(hph), 블레오마이신 내성 유전자, 아미노글리코시다제 포스포트랜스퍼라제(네오마이신 내성 유전자) 및 하기 표 3에 추가로 기재되어 있다.
일부 실시형태에서, 마커는 검출가능한 마커(또는 리포터)를 포함한다. 검출가능한 마커는 발광 반응을 매개하는 효소(luxA, luxB, luxAB, luc, rue, nluc), 비색 반응을 매개하는 효소(lacZ, HRP) 및 녹색 형광 단백질(GFP), eGFP, 황색 형광 단백질(YFP), 적색 형광 단백질(RFP), 시안 형광 단백질(CFP), 청색 형광 단백질(BFP), dsRed, mCherry, tdTomato, 근적외선 형광 단백질 등과 같은 형광 단백질을 포함하지만 이에 제한되지 않는다. 적합한 검출가능한 마커의 선택은 당업계의 통상의 기술자에게 공지될 것이다.
마커는 CMV(cytomegalovirus early) 프로모터, PGK 프로모터 및 EF1a 프로모터를 포함하지만 이에 제한되지 않는 당업계에 공지된 임의의 적합한 프로모터를 사용하여 발현될 수 있다.
일부 구현예에서, 예를 들어, 제1 마커를 갖는 제1 핵산분자 및 제2 마커를 갖는 제2 핵산분자, 제1 또는 제2 마커는 세포에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 형광 단백질을 포함한다. 일부 구현예에서, 형광 단백질은 녹색 형광 단백질(GFP)을 포함한다. 일부 구현예에서, 제1 마커는 선택가능한 마커를 더 포함한다. 일부 구현예에서, 제2 마커는 선택가능한 마커를 더 포함한다. 일부 구현예에서, 선택가능한 마커는 디히드로폴레이트 환원효소(DHFR), 글루타민 합성효소(GS), 푸로마이신 아세틸트랜스퍼라제, 블라스티딘 탈아미노화효소, 히스티디놀 탈수소효소, 하이그로마이신 포스포트랜스퍼라제(hph), 블레오마이신 내성 유전자 및 아미노글리코사이드 포스포트랜스퍼라제로 구성된 군에서 선택된다. 일부 구현예에서, 제1 마커 및 제2 마커는 동일한 선택가능한 마커가 아니다. 일부 구현예에서, 제1 마커는 세포 내 GFP를 발현할 수 있는 프로모터에 작동 가능하게 연결된 GFP 및 푸로마이신 아세틸트랜스퍼라제를 포함하고, 제2 마커는 하이그로마이신 포스포트랜스퍼라제를 포함한다.
이중가닥 절단의 생성 방법
본원에 제공되는 것은 주형 및 표적 염색체에서 이중가닥 절단을 생성하는 방법이다. 본원에 제공되는 방법은 염색체 간의 큰 서열의 전달을 용이하게 하기 위해 세포 환경에서 이중가닥 절단 복구를 위한 복구 경로를 사용한다.
당업계에 공지된 DNA 서열에서 이중가닥 절단을 생성하는 임의의 방법 및 이들 이중가닥 절단을 복구하는 임의의 복구 경로가 본 발명의 범위 내에서 고려된다.
일부 구현예에서, 주형 및 표적 염색체 내의 이중가닥 절단은 하나 이상의 엔도뉴클레아제를 사용하여 생성된다. 일부 구현예에서, 엔도뉴클레아제는 또한 본원에 기술된 방법에 사용되는 상동성 암을 포함하는 하나 이상의 핵산분자를 절단한다. 일부 구현예에서, 하나 이상의 엔도뉴클레아제는 CRISPR/Cas 엔도뉴클레아제 및 하나 이상의 가이드 핵산(gNA), 하나 이상의 징크 핑거 뉴클레아제(ZFN), 또는 하나 이상의 전사 활성제-유사 이펙터 뉴클레아제(TALEN)로 구성된 군에서 선택된다. 일부 구현예에서, 주형 및 표적 염색체 내의 이중가닥 절단은 염색체 재배열을 생성하기 위해 하나 이상의 CRE 재조합효소를 사용하여 생성된다.
상이한 분자는 유전체 핵산에 이중 및/또는 단일가닥 분열을 도입할 수 있다. 본 발명의 뉴클레아제는 호밍 엔도뉴클레아제, 제한 효소, 아연-손가락 뉴클레아제 또는 아연-손가락 뉴클레아제, 메가뉴클레아제 또는 메가니카제, 전사 활성화제-유사 이펙터(TALE) 뉴클레아제, 특히 RNA-유도 뉴클레아제, DNA-유도 뉴클레아제, 메가TAL 뉴클레아제, BurH-뉴클레아제, 변형 또는 키메라 버전 또는 변이체, 및 이들의 조합을 포함하지만, 이에 제한되지는 않는다. 상기 RNA-유도 뉴클레아제 또는 RNA-유도 뉴클레아제는 선택적으로 CRISPR-기반 시스템의 일부이다.
뉴클레아제는 핵산의 단량체들 사이의 포스포디에스테르 결합을 절단할 수 있다. 많은 뉴클레아제는 손상 부위를 인식하고 주변 DNA로부터 절단함으로써 DNA 복구에 참여한다. 이들 효소는 복합체의 일부일 수도 있다. 엔도뉴클레아제는 표적분자의 중심 영역에 작용하는 뉴클레아제이다. 디옥시리보뉴클레아제는 DNA에 작용한다. DNA 복구에 관여하는 많은 뉴클레아제는 서열 특이적이지 않다. 그러나, 현재 맥락에서, 서열 특이적 뉴클레아제가 바람직하다. 일부 구체예에서, 서열 특이적 뉴클레아제(들)는 표적 유전체 내의 상당히 큰 스트링의 뉴클레오티드, 예컨대 10개 이상의 뉴클레오티드, 또는 15, 20, 25, 30, 35, 40, 45 또는 심지어 50개 이상의 뉴클레오티드에 대해 특이적이며, 표적 유전체 내의 표적서열로서 5-50, 10-50, 15-50, 15-40, 15-30의 범위가 바람직하다. 이러한 "인식 서열"이 클수록, 유전체 내의 표적 부위가 적고, 뉴클레아제가 유전체 내로 절단되는 것이 더 특이적일수록, 절단 부위는 부위 특이적이 된다. 부위 특이적 뉴클레아제는 일반적으로, 유전체 내의 표적 부위가 10, 5, 4, 3, 2 미만이거나 또는 단지 하나의 (1) 표적 부위를 갖는다. 본 명세서에서, 특정한 유전체 표적서열을 절단하는 것을 포함하여, 유전체 핵산(들)을 변경하기 위해 조작된 뉴클레아제를 조작된 뉴클레아제라고 한다. CRISPR 기반 시스템은 조작된 뉴클레아제(들)의 한 유형이다. 그러나, 이러한 조작된 뉴클레아제는 본 명세서에 기재된 임의의 뉴클레아제에 기초할 수 있다.
12개 이상의 염기쌍을 인식하는 엔도뉴클레아제를 메가뉴클레아제라 한다. 메가뉴클레아제/-니카제는 큰 인식 부위(예를 들어, 20-40개 또는 30-40개 염기쌍과 같은 12-40개 염기쌍의 이중가닥 DNA 서열)를 특징으로 하는 엔도데옥시리보뉴클레아제이며, 결과적으로 이 부위는 임의의 주어진 게놈에서 한 번만 발생할 수 있다.
"호밍 엔도뉴클레아제"는 메가뉴클레아제의 한 형태로서, 크고 비대칭적인 인식 부위 및 통상적으로 인트론 또는 인틴 중 어느 하나에 내장된 코딩 서열을 갖는 이중가닥 DNase이다. 호밍 엔도뉴클레아제 인식 부위는 유전체 내에서 극히 드물기 때문에 매우 소수의 위치, 때로는 유전체 내의 단일 위치에서 절단된다(WO2004067736, 미국 특허 제8,697,395 B2호 참조).
아연-핑거 뉴클레아제/-니카제 (ZFN)는 아연-핑거 DNA-결합 도메인을 DNA-절단 도메인에 융합함으로써 생성되는 인위적인 제한 효소이다. 아연-핑거 도메인은 특정 원하는 DNA 서열을 표적으로 하도록 조작될 수 있다.
RNA-유도 엔도뉴클레아제/-니카제, 특히 엔도뉴클레아제는, 예를 들어, Cas9 또는 Cpf1을 포함한다. 상기 CRISPR 시스템에 대해서는 상술한 바와 같다. 임의의 CRISPR 기반 시스템은 본 발명의 일 부분이다. 다른 RNA-유도 엔도뉴클레아제(들)가 사용/사용되는 경우, RNA-유도 엔도뉴클레아제와 상호작용하고 게놈 핵산의 게놈 표적 부위를 표적으로 하는 적절한 가이드-RNA, sgRNA 또는 crRNA 또는 다른 적절한 RNA 서열이 사용될 수 있다.
본원에서 사용되는 용어 "CRISPR 관련 단백질" 또는 "CRISPR/Cas" 단백질은 특정 박테리아, 예를 들어, 스트렙토코커스 피오게네스 및 기타 박테리아에서 발견되는 CRISPR(Clustered Regular Interspaced Short Palindromic Repeats) 유형 II 적응 면역 시스템과 관련된 핵산 유도 DNA 엔도뉴클레아제를 의미한다. Cas9과 같은 CRISPR/Cas 단백질은 박테리아에서 발견되는 야생형(wt) 단백질로 제한되지 않는다. 본 발명의 범위 내에서 야생형 CRISPR/Cas 서열로의 돌연변이 또는 유도체를 포함하는 CRISPR/Cas 단백질이 예상된다. 스트렙토코커스 피오게네스의 원래 타입 II CRISPR 시스템은 Cas9 단백질과 두 개의 RNA, 즉 성숙한 CRISPR RNA(crRNA) 및 부분적으로 상보적인 트랜스-액팅 RNA(tracrRNA)로 구성된 가이드 RNA로 구성된다. Cas9은 외부 DNA를 풀고 가이드 RNA의 20개 염기쌍 스페이서 영역에 상보적인 부위를 확인한다. Cas9 표적화가 단순화되었으며 대부분의 Cas 기반 시스템은 crRNA와 tracrRNA의 융합으로 인해 하나 또는 두 개의 키메라 가이드 RNA 또는 단일 가이드 RNA(chiRNA, 종종 가이드 RNA 또는 gRNA 또는 sgRNA라고도 함)만을 필요로 하도록 조작되었다. 스페이서 영역은 필요에 따라 조작될 수 있다.
본원에서 사용되는 용어 "Cas9 코딩 서열"은 숙주 세포/숙주 포유동물에서 기능하는 유전적 코드에 따라 전사 및/또는 번역되어 Cas9 단백질을 생성할 수 있는 폴리뉴클레오티드를 의미한다. 상기 Cas9 코딩 서열은 DNA(예를 들어, 플라스미드) 또는 RNA(예를 들어, mRNA)일 수 있다.
본원에서 사용되는 바와 같이, 용어 CRISPR/Cas 리보뉴클레오단백질은 CRISPR/Cas 단백질 및 관련 가이드 핵산으로 구성된 단백질/핵산 복합체를 의미한다. 예컨대, Cas9 리보뉴클레오단백질은 관련 가이드 RNA와 복합체를 이루는 Cas9를 의미한다.
일부 구현예에서, 상기 뉴클레아제는 RNA-유도 뉴클레아제이다. 본 발명에서 사용하기 위한 핵산-유도 뉴클레아제를 포함하는 RNA-유도 뉴클레아제의 비제한적인 예는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas12b, Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체(homolog), 동원체(ortholog), 또는 변형된 버전을 포함한다.
"메가TAL 뉴클레아제/-니카제"는 조작된 TAL DNA-결합 도메인과 조작된 메가뉴클레아제 또는 조작된 호밍 엔도뉴클레아제를 포함하는 조작된 뉴클레아제를 의미한다. TAL DNA-결합 도메인은 게놈 내 핵산서열의 거의 모든 유전자좌에서 DNA를 결합하도록 설계될 수 있으며, 이러한 DNA-결합 도메인이 조작된 메가뉴클레아제에 융합된 경우 표적서열을 절단한다. 메가TAL 뉴클레아제의 예시적인 예 및 TAL DNA-결합 도메인의 설계는 예를 들어 Boisel 등에 의해 본원에 개시되어 있다(MegaTALs: 치료용 게놈 공학을 위한 희귀-절단 뉴클레아제 아키텍처(2013), 핵산 연구 42(4):2591-2601) 및 여기에 인용된 문헌들, 이들 모두는 그 전체에 참조로 본 명세서에 통합된다. 메가TAL 뉴클레아제는 선택적으로 하나 이상의 링커 및/또는 추가적인 기능적 도메인, 예를 들어 C-말단 도메인(CTD) 폴리펩티드, N-말단 도메인(NTD) 폴리펩티드, 5-3' 엑소뉴클레아제 또는 3-5' 엑소뉴클레아제를 나타내는 말단 처리 효소 도메인, 또는 기타 비-뉴클레아제 도메인, 예를 들어 헬리케이스 도메인을 포함한다.
전사 활성화제-유사 이펙터(TALE) 뉴클레아제/-니카제는 DNA의 특정 서열을 절단하도록 조작될 수 있는 제한 효소이다. 전사 활성화제-유사 이펙터(TALE)는 실질적으로 원하는 DNA 서열에 결합하도록 조작될 수 있으므로, DNA-절단 도메인과 결합될 때, 특정 위치에서 DNA를 절단할 수 있다.
"TALE DNA 결합 도메인"은 식물 전사 활성화제를 모방하여 식물 전사체를 조작하는 전사 활성화제-유사 이펙터(TALE 또는 TAL-이펙터)의 DNA 결합 부분이다. 일부 구현예에서 고려되는 TALE DNA 결합 도메인은 신규 또는 자연 발생 TAL로부터 조작된 것으로, 잔토모나스 캄페스트리스 pv. 베시카토리아, 잔토모나스 가드니, 잔토모나스 트랜스루센스, 잔토모나스 아소노포디스, 잔토모나스 퍼포란스, 잔토모나스 알팔파, 잔토모나스 시트리, 잔토모나스 유베시카토리아, 랄스토니아 솔라나세움의 잔토모나스 오리자에 및 brg11 및 hpx17을 포함하지만, 이에 제한되지는 않는다. DNA 결합 도메인을 유도하고 설계하기 위한 TALE 단백질의 예시적인 예는 미국 특허 제9,017,967호 및 여기에 인용된 문헌에 개시되어 있으며, 이들 모두는 그 전체에 참조에 의해 본 명세서에 통합된다.
"BurrH-뉴클레아제"는 뉴클레아제 활성을 갖는 융합 단백질로서, 모듈화된 염기별 특이적 핵산 결합 도메인(MBBBD)을 포함한다. 이들 도메인은 박테리아 세포내 공생체 버크홀데리아 리족시니카(Burkholderia Rhizoxinica)로부터의 단백질 또는 해양 유기체로부터 동정된 다른 유사한 단백질로부터 유래된다. 이러한 결합 도메인의 상이한 모듈을 함께 조합함으로써, 모듈화된 염기별 결합 도메인은 DNA-결합 도메인과 같은 특정 핵산서열에 대한 결합 특성을 갖도록 조작될 수 있다. 이러한 조작된 MBBBD는 따라서 뉴클레아제 촉매 도메인에 융합되어, 게놈 내 핵산서열의 거의 모든 유전자좌에서 DNA를 절단할 수 있다. BurH-뉴클레아제의 예시적인 예 및 MBBBD의 설계는 WO 2014/018601 및 US2015225465 A1에 개시되어 있고, 여기에 인용된 참조문헌들은 모두 그 전체에 참조로 본원에 통합된다.
본 발명의 관련 양태는 세포 내에서 CRISPR/Cas-매개 이중-가닥 절단(DSB)을 생성하기에 적합한 벡터와 같은 핵산분자를 제공한다. 일부 구현예에서, 벡터는 CRISPR/Cas 단백질, 예를 들어, Cas9 및 가이드 핵산(Cas9 단일 가이드 RNA, 또는 sgRNA)을 코딩하는 서열을 포함하며, 이들의 세포 내 발현을 위해 적합한 프로모터뿐만 아니라 출처 또는 복제 및 선택가능한 표지자와 같은 다른 벡터 성분에 작동적으로 연결된다. 일부 구현예에서, 상기 세포는 본원에 기재된 바와 같은 배아 줄기세포 또는 배아 하이브리드 줄기세포이다.
본 발명에 따르면, 상동 재조합은 엔도뉴클레아제에 의해 생성된 이중가닥 절단(DSB)에 의해 촉진된다. 일부 구현예에서, 엔도뉴클레아제는 CRISPR/Cas9 및 하나 이상의 단일 가이드 RNA(들)("s" 또는 줄여서 sgRNA")를 포함한다. 당업자 또는 통상의 기술자는 상기 엔도뉴클레아제 부위에 대해 기술된 바와 같이, 주형서열 및 표적서열 측면에 있는 표적서열, 또는 표적 위치에 있는 표적서열을 갖는 가이드 RNA를 선택할 수 있을 것이다.
일부 구현예에서, 효소는 CRISPR/Cas 단백질을 코딩하는 벡터 또는 코딩 서열, 및 하나 이상의 sgRNA와 같은 핵산분자를 도입함으로써 도입될 수 있다. 일부 구현예에서, CRISPR/Cas 단백질을 코딩하는 벡터 또는 코딩 서열은 CRISPR/Cas mRNA이다. 일부 구현예에서, CRISPR/Cas 단백질을 코딩하는 벡터 또는 코딩 서열은 CRISPR/Cas 단백질 및 gRNA를 코딩하는 DNA 서열을 포함하는 플라스미드와 같은 벡터이다. 일부 구현예에서, CRISPR/Cas 단백질은 Cas9이다.
특정 구현예에서, 단리된 CRISPR/Cas 단백질은 마이크로인젝션 또는 전기천공을 통해 세포 내(예를 들어, 접합체 또는 ES 세포)로 직접 도입될 수 있다. 상기 CRISPR/Cas 단백질은 CRISPR/Cas 단백질/gNA(가이드 핵산) 복합체인 CRISPR/Cas 리보뉴클레오단백질의 형태일 수 있다. 또는 CRISPR/Cas 단백질 및 하나 이상의 gNA가 임의의 gNA 없이도 세포 내부의 제자리에서 CRISPR/Cas 단백질/gNA 복합체의 형성을 허용하도록 접합체 또는 ES 세포 내에 공동 도입될 수 있다. 일부 구체예에서, 상기 CRISPR/Cas 단백질 및 gNA는 형질감염, 전기천공 또는 형질도입에 의해 세포 내로 도입되는 벡터에 의해 암호화된다. 일부 구체예에서, CRISPR/Cas 단백질은 Cas9이다.
본 발명의 방법들에서 사용하기 위한 엔도뉴클레아제로서 기능하기 위해, CRISPR/Cas 단백질은 gRNA와 기능적 복합체를 형성하는 것이 요구된다.
일부 구현예에 따르면, 다수의 gNA가 사용되며, 각각은 특정 CRISPR/Cas 절단 부위를 표적으로 한다. 예를 들어, 4개의 gNA가 사용될 수 있는데, 2개는 주형서열의 양 측에 gNA 표적서열에 특이적인 표적서열을 갖는 것이고, 2개는 표적서열의 양 측에 gNA 표적서열에 특이적인 표적서열을 갖는 것이다. 대안적으로, 3개의 gNA가 사용될 수 있는데, 하나는 표적 위치에 gNA 표적서열에 특이적인 표적서열을 갖는 것이고, 2개는 주형서열의 양 측에 gNA 표적서열에 특이적인 표적서열을 갖는 것이다. 또 다른 예로서, 2개의 gNA가 사용될 수 있는데, 하나는 주형서열에 인접한 gNA 표적서열에 특이적인 표적서열을 갖는 것이고, 하나는 표적서열에 인접한 gNA 표적서열에 특이적인 표적서열을 갖는 것이다.
바람직하게, DSB를 생성하는데 사용되는 gNA의 수와 무관하게, 특정 실시예에서, 각각의 gNA는 주형 및 표적서열의 5' 및 3' 말단, 또는 표적 위치에 대한 이들의 근접성에 기초하여 독립적으로 선택된다.
gNA의 선택 및 설계는 표적 유전체 및 서열 유형과 같은 사용자 입력에 기초하여 잘 알려진 원리 또는 온라인 도구를 사용하여 수행될 수 있다. 일반적으로, Cas9의 경우, gRNA는 Cas9 결합에 필요한 "scaffold" 서열과 표적서열에 의해 결합 또는 변형될 유전체 표적을 정의하는 사용자 정의 ~20 뉴클레오티드 "spacer" 또는 "targeting" 서열로 구성된 짧은 합성 RNA이다. 단순화를 위해, "gRNA targeting a Cas9 cleavage site"는 gRNA의 스페이서 또는 표적서열이 유전체 표적서열에 결합하여 절단 부위에서 절단하도록 설계된 사실을 의미한다.
본 발명에 따른 gRNA 및 gDNA를 포함하는 가이드 핵산은 10-50 뉴클레오티드, 10-40, 10-30, 10-20, 15-25, 16-24, 17-23, 18-22, 19-21 및 20 뉴클레오티드를 포함하는 길이의 10 뉴클레오티드의 임의의 것일 수 있다.
바람직하게는, 표적서열은 이론적으로 독특한 (게놈의 나머지에 비해) 게놈 표적서열에 결합할 정도로 충분히 독특하다. 표적은 프로토스페이서 인접 모티프(또는 "PAM" 서열)의 바로 상류(또는 5')에 존재해야 한다. 상기 PAM 서열은 표적 결합에 절대적으로 필요하며, 정확한 서열은 Cas9의 종에 의존적이다. 가장 널리 사용되는 스트렙토코커스 피오게네스 Cas9에서, 상기 PAM 서열은 5'-NGG-3'이다("N"은 4개의 표준 뉴클레오티드 중 어느 하나를 나타낸다). 다른 종의 추가 Cas9에 대한 다른 PAM 서열은 당업계에 공지되어 있다. 하기 표 4에 기재된 예시적인 PAM 서열을 참조한다.
Cas9-gRNA 복합체는 임의의 표적 유전체 서열을 PAM과 결합시킬 것이지만, Cas9는 gRNA 스페이서와 표적 유전체 서열 사이에 충분한 상동성이 존재하는 경우에만 표적 유전체 서열을 절단한다. Cas9-매개 DNA 절단의 최종 결과는 PAM 서열의 약 3-4 뉴클레오티드 상류인 절단 부위에서 표적 유전체 서열 내의 이중가닥 절단(DSB)이다.
일부 구현예에서, 이중가닥 절단은 표적서열의 양 측에서 또는 양 측에서 생성된다. 예를 들어, 표적 염색체가 표적 위치, 예컨대 표적 염색체의 결손이 거의 또는 전혀 없이 주형서열이 삽입될 위치를 포함하는 그러한 구체예에서, 이중가닥 절단은 표적 위치에서 생성된다. 예시적인 표적 위치는 본원에 기재된 뉴클레아제 중 임의의 것에 대한 절단 부위를 포함한다. 추가적인 예로서, 표적 염색체가 표적서열, 예컨대 주형서열의 삽입에 의해 대체되거나 삭제될 서열을 포함하는 그러한 구체예에서, 표적서열의 어느 한 측(즉, 표적서열의 5' 및 3' 모두)에서 이중절단 가닥이 생성된다.
특정 실시형태에서, 임의의 선택된 엔도뉴클레아제, 예를 들면 gNA 표적서열의 절단 부위는 표적서열 또는 위치의 약 10 bp, 약 20 bp, 약 30 bp, 약 50 bp, 약 70 bp, 약 100 bp, 약 200 bp, 약 300 bp, 약 400 bp, 또는 약 500 내에 있다.
특정 실시형태에서, 임의의 선택된 엔도뉴클레아제, 예를 들면 gNA 표적서열의 절단 부위는 주형서열의 약 100 bp, 약 200 bp, 약 300 bp, 약 400 bp, 약 500 bp, 약 600 bp, 약 700 bp, 약 800 bp, 약 900 bp, 약 1,000 bp, 약 1,200 bp, 약 1,300 bp, 약 1,400 bp, 약 1,500 bp, 약 1,600 bp, 약 1,800 bp, 약 1,900 r, 약 2,000 이다.
일부 구현예에서, 이중가닥 절단은 절제, 불일치 복구(MMR), 뉴클레오티드 절제 복구(NER), 염기 절제 복구(BER), 표준 비동종 말단 접합부(캐노니컬 NHEJ), 대체 비동종 말단 접합부(ALT-NHEJ), 표준 비동종 말단 접합부(캐노니컬 HDR), 대체 상동성 지시 복구(ALT-HDR), 대체 상동성 지시 복구(ALT-HDR), 마이크로호몰로지 매개 말단 접합부(MmeJ), 블런트 엔드 접합부(Blunt End Jointing), 합성 의존성 마이크로호몰로지 매개 말단 접합부(Single Strand Annealing, SSA), 홀리데이 접합부 모델 또는 이중가닥 파손 복구(DSBR), 합성 의존성 스트랜드 어닐링(SDSA), 단일 가닥 파손 복구(SSBR), 트랜스레션 합성 복구(TLS) 및 스트랜드 간 가교 복구(ICL)로 구성된 군에서 선택된 적어도 하나의 DNA 복구 경로를 통해 복구된다.
조작된 염색체의 복구
본 명세서에 기재된 조작된 염색체를 회수하고, 상기 조작된 염색체를 다운스트림 애플리케이션에 적합한 세포 환경으로 전달하는 방법을 제공한다. 일부 실시형태에서, 본 명세서에 기재된 조작된 염색체를 회수하는 것은 마이크로-세포 매개 염색체 전달(MMCT)을 포함한다.
마이크로세포-매개 염색체 전달 (MMCT)은 공여 세포로부터 제조된 마이크로세포와 수용 세포를 융합하는 기술이다. 이 기술에 의해, 공여 세포 내의 특정 (외래) DNA (예를 들어, 염색체)가 수용 세포 내로 전달될 수 있다. 마이크로세포는 통상적으로, 다른 방법을 사용할 수도 있지만, 공여 세포를 콜세미드로 처리하여 제조되며, 본 발명의 범위 내에서 예상된다.
예시적인 MMCT 프로토콜은 조작된 염색체를 포함하는 세포를 소핵을 유도하기에 충분한 조건하에 세포 배양 배지에서 배양하여 소핵 세포를 생성하고, 소핵 세포를 수집하는 단계를 포함한다. 예시적인 소핵 유도제는 소소관 중합 억제제, 소소관 해중합 억제제 및 방추 체크포인트 억제제를 포함하나 이에 제한되지는 않는다. 당업계에 공지된 예시적인 소핵 유도제는 콜세미드, 콜히친, 빈크리스틴 또는 이들의 조합을 포함하나 이에 제한되지는 않는다. 예컨대, 세포를 0.05 μg/mL 내지 0.25 μg/mL로 처리하여 소핵을 유도할 수 있다.
소핵 세포는 원심분리 및 여과를 포함하여 당업계에 공지된 임의의 적합한 방법을 사용하여 회수될 수 있다.
따라서, 본 발명은 조작된 염색체를 회수하는 단계는 세포를 소핵화를 유도하기에 충분한 조건하에서 콜세미드에 노출시키는 단계, 및 원심분리를 이용하여 소핵화된 세포를 수집하는 단계를 포함하는 방법을 제공한다.
일부 실시형태에서, 조작된 염색체는 하나 이상의 마커, 예를 들어 주형서열로 염색체를 조작할 때 도입된 선택가능 또는 검출가능한 마커를 포함한다. 이들 마커는 조작된 염색체를 따르는데 사용될 수 있고, 상기 기재된 소핵 세포와의 융합 후 조작된 염색체를 포함하는 세포를 선택한다.
따라서, 본 발명은 (a) 본 발명의 방법에 의해 제조된 조작된 염색체를 포함하는 소핵 세포를 상기 ES 세포에 융합하는 단계, 여기서 (i) 상기 ES 세포는 조작된 염색체와 상동인 염색체를 포함하고, 상기 상동 염색체는 상기 ES 세포에서 상기 형광 단백질을 발현할 수 있는 프로모터와 작동 가능하게 연결된 제1 형광 단백질을 포함하며, (ii) 상기 소핵 세포의 적어도 서브세트는 조작된 염색체를 포함하고, 조작된 염색체는 상기 ES 세포에서 상기 형광 단백질을 발현할 수 있는 프로모터와 상이한 제2 형광 단백질을 포함하고, 제2 형광 단백질은 상기 ES 세포에서 상기 형광 단백질을 발현할 수 있는 프로모터와 작동 가능하게 연결됨; (b) 상기 제1 및 제2 형광 단백질을 모두 발현하는 ES 세포를 선별하는 단계; (c) 상기 단계 (c)에서 선택된 ES 세포를 상기 상동 염색체의 적어도 서브세트에 의해 소실될 때까지 배양하는 단계; 및 (d) 상기 제2 형광 단백질을 발현하고 상기 제1 형광 단백질을 발현하지 않는 ES 세포를 선택하는 단계를 포함하는 배아 줄기 세포 생성 방법을 제공한다. 일부 구현예에서, 상기 ES 세포는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 말, 낙타, 닭 또는 원숭이 ES 세포이다. 일부 구체예에서, 상기 ES 세포는 마우스 ES 세포이다. 일부 구체예에서, 상기 ES 세포는 마우스 ES 세포이다. 일부 구체예에서, 상기 ES 세포는 래트 ES 세포이다. 일부 구체예에서, 상기 ES 세포는 원숭이 ES 세포이다.
위에 기술된 배아줄기세포를 생성하는 방법은 두 개의 서로 다른 형광 단백질을 마커로 사용하는 반면, 조작된 염색체와 상동 염색체 상의 마커가 상이한 한, 통상의 기술자는 다른 마커가 적합할 수 있음을 인식할 것이다. 예를 들어, 본 명세서에 기재된 2개의 상이한 선택가능한 마커뿐만 아니라, 표지된 항체에 의해 인식될 수 있는 2개의 상이한 표면 분자, 또는 원심분리를 통해 선택을 허용하는 금 입자와 같은 선택적 마커에 접합된 2개의 상이한 표면 분자를 사용할 수 있다. 추가적인 예로서, 마커로서 형광 단백질 이외에, 이 단계에서 양성-음성 선택을 위해 퓨로마이신 및 하이그로마이신/티미딘 키나제(TK) 마커를 사용할 수 있다. 티미딘 키나제가 특정 티미딘 유사체의 존재 하에 발현되면, 이들 유사체는 독성 화합물로 전환되어 세포를 사멸시킨다. 예를 들어, 퓨로마이신 내성 마커와 하이그로마이신/TK 마커를 동일한 위치의 2개의 염색체에 녹인 후, 퓨로마이신 및 하이그로마이신에서 배양하여 이중 양성 단일 클론을 선택한다. 며칠 동안 배양한 후, 하이그로마이신/TK 마커를 보유하는 염색체인 염색체의 하나의 사본이 소실된 클론을 선택하기 위해 퓨로마이신 및 티미딘 키나제를 사용한다.
일부 구현예에서, 배아 줄기세포를 생성하는 방법은 (a) 본 발명에 개시된 방법에 의해 제조된 조작된 염색체를 포함하는 소핵 세포를 ES 세포에 융합하는 단계, 여기서 (i) ES 세포는 조작된 염색체와 상동인 염색체를 포함하고, 상동 염색체는 제1 마커를 포함하고, (ii) 조작된 염색체의 적어도 서브세트는 조작된 염색체를 포함하고, 조작된 염색체는 제1 마커와 상이한 제2 마커를 포함함; (b) 제1 마커 및 제2 마커를 모두 발현하는 ES 세포를 선별하는 단계; (c) 단계 (c) 상동 염색체가 ES 세포의 적어도 서브세트에 의해 손실될 때까지 배양하는 단계; 및 (d) 제2 마커를 발현하고 제1 마커를 발현하지 않는 ES 세포를 선별하는 단계를 포함한다.
소핵 세포는 임의의 적합한 방법을 사용하여 ES 세포에 융합될 수 있다. 융합 방법에는, 특히, 전기 융합, 바이러스 유도 융합, 및 예를 들어, 세포에 PEG1000을 첨가하는 것을 통한 화학적 유도 융합이 포함된다.
상기 조작된 염색체를 회수하는 방법에 의해 생성된 삼배체의 고유한 불안정성을 감안할 때, 상기 조작된 염색체에 상응하는 상동 염색체를 상실한 세포를 유도하기에 적어도 5일, 적어도 7일, 적어도 10일, 또는 적어도 14일의 기간 동안 소핵 세포에 융합되어 생성된 세포를 배양하면 충분할 수 있다. 대안적으로, 음성적으로 선택 가능한 마커, 예를 들어, 선택적 요법에 노출될 때 발현이 세포를 사멸시키는 상동 염색체 상에 위치한 마커를 사용한 선택 계획이 채용될 수 있다. 일부 구체예에서, 단계 (b) 및 (d)에서 세포를 선택하는 것은 형광 활성화 세포 분류(FACS)를 포함한다. 예를 들어, 세포는 조작된 염색체를 표지하는 데 사용되는 제2 형광 단백질을 발현하지만 상동 염색체를 표지하는 데 사용되는 제1 형광 단백질은 발현하지 않는 세포를 분류하는 FAC일 수 있다.
세포
본 발명은 본 발명의 방법에 사용하기 위한 세포를 제공한다. 일부 구체예에서, 상기 세포는 배아줄기(ES) 세포, 하이브리드 배아줄기(EHS) 세포, 또는 접합 세포를 포함한다. 본 발명은 또한 본 발명의 방법에 의해 제조된 조작된 염색체를 포함하는 세포를 제공한다. 본 발명은 본 명세서에 기재된 세포를 분리, 융합 및 배양하는 방법을 제공한다.
따라서, 본 발명은 본 명세서에 기재된 EHS 세포를 생성하기 위한 세포 융합 방법을 제공한다. 세포 융합은 화학적, 생물학적 및 물리적 수단을 통해 가능하게 되었다. 이러한 기술의 예는 각각 폴리에틸렌 글리콜(PEG) 융합, 푸사겐성 바이러스 융합 및 전기 융합을 포함한다.
본 발명의 방법에 사용하기 위한 ES 세포는 다양한 공급원으로부터 수득될 수 있으며, 1차 분리된 ES 세포 또는 인공적 또는 자연적으로 생성된 ES 세포주일 수 있다. 본 발명의 EHS 세포를 생성하기 위한 세포 융합 전 또는 후, 또는 본 명세서에 기재된 방법 전 또는 후에, 하나 이상의 표지자의 발현과 같은 유용한 형질을 도입하기 위해 먼저 유전자 변형될 수 있다
하나의 통상적으로 사용되는 기술은 예를 들어 PEG를 사용하는 화학적 융합이다. 이 기술은 하이브리도마를 발생시키는데 특히 성공적이었다. 융합 확률은 매우 짧은 기간 동안 강렬한 전기장에 세포를 노출시킴으로써 향상될 수 있다. 화학 작용제를 사용하여 전기장 노출 전에 현탁액에서 원하는 유형(즉, 2가지 유형의 EH 세포)의 세포 쌍의 연결 및 근접을 효과적으로 수행할 수 있다.
세포의 전기 융합은 세포들을 근접하게 모으고 이들을 교대 전기장에 노출시키는 것을 포함한다. 적절한 조건하에서, 세포들은 함께 밀리고, 세포막들의 융합 및 이어서 융합체 세포 또는 하이브리드 세포의 형성이 있다. 세포의 전기 융합 및 이를 수행하기 위한 장치는 예를 들어, 미국 특허 제4,441,972호, 4,578,168호 및 5,283,194호, 국제 특허 출원 제PCT/AU92/00473호에 기재되어 있다. 일반적으로, 본 방법은 세포를 선택하고, 세포 융합 챔버로서 사용하기 위해 채택된 유체-충전 챔버에 위치시키는 것을 포함한다. 세포들의 개별 쌍들이 융합 과정, 즉 단일 세포 융합에 관여할 수 있거나, 또는 벌크 융합이 각각 2개 이상의 세포들을 포함하는 2개의 집단으로 발생할 수 있다. 벌크 융합은 약 2 내지 약 1000개의 세포들이 관여하는 미니-벌크 융합 또는 약 1000개 초과의 세포들이 관여하는 매크로-벌크 융합일 수 있다. 융합은 PEG의 존재와 같은 화학적 수단, 예를 들어, 푸사겐성 바이러스의 존재 하에 또는 전기적 수단, 즉 전기적 수단에 의해 촉진될 수 있다. 융합은 또한 이러한 기술들의 조합을 포함할 수 있다. 상기 세포들은 융합을 촉진하기 위해 인터루킨 3 (IL-3)과 같은 사이토카인으로 처리될 수도 있다.
세포 융합 후, 융합된 세포(융합된 세포) 또는 하이브리드 세포로 공지된 융합된 세포는 융합에 관여하는 세포로부터 융합된 지질 이중층에 둘러싸인 적어도 2개의 세포의 핵을 포함한다. 세포의 핵은 4배체이거나 더 적은 수의 염색체를 포함할 수 있는 비정상적인 수의 염색체를 갖는 하이브리드 세포를 생성한다. 상기 하이브리드 세포는 적절한 배양 조건하에서 분열 및 증식하는 능력을 갖는다.
일부 구현예에서, EHS 세포는 전기 융합을 통해 생성된다. 예를 들어, 인간과 마우스, 인간과 래트, 또는 인간과 원숭이 ES 세포는 전기 융합을 통해 융합될 수 있다. 일부 구현예에서, 인간, 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 이루어진 군으로부터 선택된 2종으로부터 2개의 EHS 세포가 전기 융합을 통해 EHS 세포를 생성한다.
일반적으로, 일단 융합이 발생하면, 생성된 혼성 세포는 본 발명의 방법에 사용하기 위해 배양에서 확장되기 전에 적합한 풍부한 배지에서 회수된다. 회수 배지는 융합의 스트레스 후 세포 융합물의 회수를 허용하는 인자를 포함해야 한다. 그러한 보충제는 높은 비율의 태아 송아지 혈청, 예를 들어 20%를 포함할 수 있다.
세포 융합을 통해 생성된 하이브리드 세포는 이들 세포를 선택하고, 융합 이벤트를 모니터링하는 데 유용한 고유한 세포 표면 마커를 포함할 수 있다.
일부 구체예에서, 본 발명의 세포는 본 명세서에 기재된 마커의 도입과 같은 하나 이상의 유전적 변형을 포함한다. 유전적 변형은 당업계에 공지된 임의의 적합한 수단에 의해 수행될 수 있다. 예를 들어, 세포는 형질감염, 형질도입, 전기천공, 리포펙션 등에 의해 변형될 수 있다.
본원에서 사용되는 형질감염이란, 네이키드 또는 정제된 핵산 또는 특정 핵산을 운반하는 벡터를 포함하는 핵산을 세포, 특히 포유동물 세포를 포함한 진핵세포에 도입하는 것을 의미한다. 공지의 모든 형질감염 방법이 본 발명의 내용에서 채용될 수 있다. 이러한 방법 중 일부는 세포 내로 핵산을 가져오기 위한 생물학적 막의 투과성을 강화하는 것을 포함한다. 두드러진 예는 전기천공법, 미세천공법 및 리포펙션이다. 상기 방법은 숙주 세포 내로 핵산의 플럭스 레이트를 선택적으로 향상시키기 위해 단독으로 사용되거나 음파, 전자기 및 열 에너지, 화학적 투과 강화제, 압력 등에 의해 뒷받침될 수 있다. 다른 형질감염 방법, 예를 들면, 리포펙션 또는 바이러스(또한 형질도입이라고 함)를 포함하는 캐리어 기반 형질감염 및 화학적 기반 형질감염도 본 발명의 범위에 속한다. 한편, 핵산을 세포 내로 가져오는 어떠한 방법도 사용될 수 있다. 일시적으로 형질감염된 세포는 짧은 시간 동안 형질감염된 RNA/DNA를 운반/발현하고 이를 전달하지 않을 것이다. 안정적으로 형질감염된 세포는 지속적으로 형질감염된 DNA를 발현하고 이를 전달할 것이다: 외인성 핵산은 세포의 유전체 내로 통합되었다.
파포바이러스, 아데노바이러스, 백시니아 바이러스, 아데노 관련 바이러스, 렌티바이러스, 신드비스 및 셈리키 숲 바이러스 및 조류 및 인간 기원의 레트로바이러스를 포함한 많은 바이러스가 유전자 전달 벡터로서 또는 유전자 전달 벡터를 제조하기 위한 기초로 사용되었다.
인산칼슘 공침, 기계적 기술, 예를 들어, 마이크로인젝션, 리포솜을 통한 막 융합-매개 전달 및 직접 DNA 흡수 및 수용체-매개 DNA 전달을 포함하는 유전자 전달의 화학적 기술들이다. 바이러스-매개 유전자 전달은 리포솜 전달을 사용하는 직접적인 생체 내 유전자 전달과 결합될 수 있으며, 이는 특정 세포로 바이러스 벡터를 지시하도록 허용한다. 대안적으로, 레트로바이러스 벡터 생산자 세포주는 특정 조직에 주입될 수 있다. 그 후 생산자 세포의 주입은 벡터 입자의 연속적인 공급원을 제공할 것이다.
본 발명은 본 발명의 세포를 배양하는 방법을 제공한다. 많은 줄기세포 배지 배양 또는 성장 환경이 본 명세서에 기재된 구현예에서 구상되는데, 여기에는 정의 배지, 컨디셔닝 배지, 피더-프리 배지, 무혈청 배지 등이 포함된다. 본 명세서에 사용된 바와 같이, 이의 "성장 환경" 당량이란 미분화 또는 미분화 줄기세포(예를 들어, 배아 줄기세포)가 시험관 내에서 증식할 환경이다. 상기 환경의 특징은 세포가 배양되는 배지, 및 존재하는 경우 지지 구조체(예를 들어, 고체 표면 상의 기질)를 포함한다. 세포를 배양 또는 유지하기 위한 방법은 또한 PCT/US2007/062755; 미국 출원번호 11/993,399 및 미국 출원번호 11/875,057에 기재되어 있다.
기본 세포 배양 배지는 당업계에 공지되어 있고 상업적으로 이용가능하다. 예시적인 기본 세포 배양 배지는 DMEM, CMRL 또는 RPMI 기반 배지를 포함하지만, 이에 제한되지 않는다.
본 발명의 세포 배양 방법에 사용되는 세포 배양 배지는 혈청을 포함하거나, 무혈청일 수 있다. 세포 배양 배지는 또한 B27 보충제, 인슐린, 포도당, EGF 및 FGF와 같은 성장 인자, 사이토카인과 같은 당업계에 공지된 하나 이상의 보충제 또는 기타 배지 성분을 포함할 수 있다.
용어 "공급 세포(feeder cell)"는 시험관 내에서 성장하고 배양 배지 내로 적어도 하나의 인자를 분비하는 세포의 배양을 지칭하고, 이는 배양에서 관심 있는 다른 세포의 성장을 지원하기 위해 사용될 수 있다. 본 명세서에서 사용된 바와 같이, "공급 세포 층"은 "공급 세포" 용어와 상호교환적으로 사용될 수 있다. 공급 세포는 단분자층을 포함할 수 있고, 여기서 공급 세포는 서로 상부에서 성장하기 전에 완전한 층으로 배양 접시의 표면을 덮거나, 또는 세포의 클러스터를 포함할 수 있다. 바람직한 실시예에서, 공급 세포는 부착성 단분자층을 포함한다.
유사하게, ES 또는 EHS 세포 배양체 또는 응집체 현탁액 배양체가 피더 세포를 사용하지 않고 정의된 조건 또는 배양 시스템에서 성장되는 구현예는 "피더-프리(feeder-free)"이다. 피더-프리 방법은 또한 미국 특허 제6,800,480호에 기재되어 있다. 일부 구현예에서, ES 또는 ESH 세포는 2차원 또는 3차원 환경에서 배양될 수 있다. 미국 특허 제6,800,480호에서는 섬유아세포를 배양하고, 제자리에서 섬유아세포를 용해시킨 다음, 용해 후 남은 것을 세척하여 세포외 기질을 제조한다. 또는, 미국 특허 제6,800,480호에서는 세포외 기질을 콜라겐, 태반 기질, 섬유결합소, 라미닌, 메로신, 테나신, 헤파린 설페이트, 콘드로이틴 설페이트, 더마탄 설페이트, 아그레칸, 빅리칸, 트롬보손딘, 비트로넥틴 및 데코린으로부터 선택된 분리된 기질 성분 또는 이들의 조합으로부터 제조할 수 있다.
일부 실시형태에서, 배양 방법 또는 배양 시스템은 동물 유래 생성물이 없다. 다른 실시형태에서, 배양 방법은 이종(exeno)이 없다.
본 발명은 본 명세서에 기재된 조작된 염색체를 포함하는 ES 세포를 다양한 다운스트림 응용 분야에 사용하기 위해 상이한 세포 유형으로 분화하는 것을 고려한다. ES 세포는 일반적으로 내인성 발달 세포 신호 및 세포 특이적 분화를 직접 요약하는 외인성 생화학적 조성물로 세포 배양 배지를 보충하는 것을 포함하는 다양한 전략을 사용하여 시험관 내에서 다양한 세포 유형으로 분화하도록 유도될 수 있다. ES 세포를 분화하기 위한 전략은 Vazin 및 Freed, Restor Neurol Neurosci (2010) 28(4): 589-603에 개시되어 있으며, 이들의 내용은 본 명세서에 참고로 포함되어 있다.
예를 들어, ES 또는 EHS 세포의 개체군은 특정 보충 성장 인자의 존재 하에 추가로 배양되어 상이한 세포주로 발달하거나 또는 상이한 세포주로 발달할 수 있는 세포의 개체군을 수득할 수 있다. "보충 성장 인자"라는 용어는 가장 넓은 맥락에서 사용되며, ES 세포의 성장을 촉진하고, 세포의 생존을 유지하고, 세포의 분화를 자극하며, 및/또는 세포의 분화의 역전을 자극하는 데 효과적인 물질을 의미한다. 더욱이, 보충 성장 인자는 공급 세포에 의해 그 배지 내로 분비되는 물질일 수 있다. 이러한 물질은 사이토카인, 케모카인, 소분자, 중화 항체 및 단백질을 포함하나 이에 제한되지는 않는다. 성장 인자는 또한 세포의 형태 및 기능뿐만 아니라 세포의 발달 및 유지를 제어하는 세포간 신호 전달 폴리펩티드를 포함할 수 있다. 바람직한 구체예에서, 보충 성장 인자는 가용성 인터루킨-6 수용체(IL-6R), 섬유아세포 성장 인자(FGF), 뼈 형태유전 단백질(BMP), 종양 괴사 인자(TNF) 및 과립구 대식세포 집락 자극 인자(GM-CSF)와 조합하여 스틸 세포 인자(SCF), 온코스타틴 M(OSM), 섬모 신경영양 인자(CNTF), 인터루킨-6(IL-6)를 포함하는 군으로부터 선택된다.
다양한 다능성 및/또는 분화된 세포로의 줄기세포의 진행은 제2 또는 대조군 유전자, 예를 들어 하우스키핑 유전자의 발현과 비교하여 특정 세포 유형의 특징인 유전자, 또는 유전자 마커의 상대적인 발현을 결정함으로써 모니터링할 수 있다. 일부 공정에서, 특정 마커의 발현은 마커의 존재 여부를 검출함으로써 결정된다. 또는, 특정 마커의 발현은 세포 배양물 또는 세포 집단의 세포 내에서 마커가 존재하는 수준을 측정함으로써 결정될 수 있다. 이러한 공정에서, 마커 발현의 측정은 정성적일 수도 있고 정량적일 수도 있다. 마커 유전자에 의해 생성되는 마커의 발현을 정량하는 한 가지 방법은 정량적 PCR(Q-PCR)을 사용하는 것이다. Q-PCR을 수행하는 방법은 당업계에 잘 알려져 있다. 당업계에 공지된 다른 방법을 사용하여 마커 유전자 발현을 정량할 수도 있다. 예를 들어, 관심 마커 유전자 산물에 특이적인 항체를 사용하여 마커 유전자 산물의 발현을 검출할 수 있다.
형질전환 동물
본 발명은 본 발명의 조작된 염색체를 포함하는 형질전환 동물, 예를 들어 형질전환 마우스, 및 이의 제조방법을 제공한다.
본 명세서에 기재된 조작된 염색체를 포함하는 ES 세포 또는 접합 세포로부터 형질전환 동물을 제조하기 위한 적합한 방법의 선택은 동물에 의존할 것이고, 당업계의 숙련자에게 공지될 것이다.
예시적인 방법들에서, 조작된 염색체를 포함하는 ES 세포는 배반포 발달 단계에서 배아에 통합되고, 이는 임신한 또는 가임신한 여성에게 이식되어 임신 기간까지 운반된다. 그 결과 키메라 동물이 된다. 만약 ES 세포가 생식 세포를 생성한다면, 그 동물의 자손은 완전히 형질전환되어 조작된 염색체를 운반할 것이다.
일부 실시형태에서, 상기 형질전환 동물은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 또는 원숭이이다.
일부 구체예에서, 상기 형질전환 동물은 마우스이다. 일부 구체예에서, 상기 형질전환 마우스를 생산하는 것은 ES 세포를 이배체 배반포에 주입하는 단계, ES 세포로부터 제핵 마우스 배아로의 핵 전달, 또는 4배체 배아 보완을 포함한다.
일부 구현예에서, 상기 방법은 ES 세포 또는 접합체를 유사-임신 암컷으로 이식하는 단계를 추가로 포함한다. 마우스에서, 유사-임신 암컷은 자연 발정 상태의 6-8주령 암컷 마우스와 혈관절제된 수컷을 교배시킴으로써 준비된다. 유사-임신 암컷으로의 당일 이식을 위해 처리된 접합체는 배양체로부터 제거되고, 예열된 적합한 배지(예를 들어, M2 배지)에 넣고, 난관을 통해 유사-임신 암컷(예를 들어, 9-11주령) 후 0.5일로 이식될 수 있다.
일단 본 발명의 방법을 사용하여 조작된 염색체가 숙주 포유동물에 삽입되면, 조작된 염색체의 존재는 생성된 형질전환 동물(예를 들어, 마우스) 또는 그 자손에서 확인될 수 있다. 이러한 확인은 전형적으로 조작된 염색체를 잠재적으로 보유하는 유전자형 동물, 접합 서열의 중합효소 연쇄반응 증폭, 특정 DNA 스트레치(예를 들어, 주형서열)의 직접 시퀀싱 및 유전자 매핑 중 하나 이상을 포함한다. 이러한 기술은 당업계에 잘 알려져 있다.
본 발명은 본 발명의 조작된 염색체를 포함하는 형질전환 마우스를 제공한다. 일부 구체예에서, 형질전환 마우스는 인간화된 하나 이상의 유전자, 예를 들어 표 1 및 표 2에 기재된 유전자 중 어느 하나를 포함한다. 일부 구체예에서, 동물 모델은 하나 이상의 인간화된 유전자(예를 들어, 1, 2, 5, 10, 20, 50, 100 이상의 유전자)를 포함한다. 일부 구체예에서, 형질전환 마우스는 인간화된 면역글로불린 유전자의 전부 또는 일부를 포함한다. 일부 구체예에서, 형질전환 마우스는 인간화된 TCR 서브유닛 유전자의 전부 또는 일부를 포함한다.
본 발명의 형질전환 마우스의 일부 구현예에서, 마우스 염색체 12는 마우스 Igh 가변 영역을 대신하여 인간 IGH 가변 영역의 서열을 포함한다. 일부 구현예에서, 마우스 Igh 가변 영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열들을 포함한다. 일부 구현예에서, 인간 IGH 가변 영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열들을 포함한다. 일부 구현예에서, 조작된 염색체는 마우스 Igk 가변 영역을 대신하여 인간 IGK 가변 영역의 서열을 포함하는 마우스 염색체 6이다. 일부 구현예에서, 마우스 Igk 가변 영역 서열은 마우스 Vk 및 Jk1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열들을 포함한다. 일부 구현예에서, 주형서열은 인간 IGK 가변 영역 서열을 포함한다. 일부 구현예에서, 인간 IGK 가변 영역 서열은 인간 Vk 및 Jk1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열들을 포함한다.
응용
본 명세서에 기재된 조작된 염색체를 포함하는 세포 및 형질전환 동물의 다운스트림 응용이 본 명세서의 범위 내에서 고려된다.
예시적인 다운스트림 응용은 하나 이상의 인간 유전자에 대해 인간화된 동물 모델(예를 들어, 마우스, 래트 또는 원숭이)을 사용하여 인간 질병 및 장애의 동물 모델에 대한 기초 및 응용 연구를 포함한다. 예시적이지만 비제한적인, 모델 동물 상동체를 인간 상동체로 대체함으로써 인간화될 수 있는 유전자를 표 1 및 표 2에 기재한다. 염색체 수차(전좌, 역전 등)와 관련된 인간 질병에 대한 동물 모델도 본 명세서에 기재된 방법을 사용하여 제조될 수 있다. 예를 들어, DMD(Duchenne Music Disstrophy) 인간화 마우스 질병 모델과 같이 300kB보다 큰 단편에 대해 대규모 염색체 재배열이 필요한 모든 동물 모델 또는 최대 수백 개의 유전자 배열의 대규모 삽입 또는 교체가 필요한 모든 동물 모델이 본 발명의 범위 내에서 구상된다.
일부 구현예에서, 예를 들어, 동물의 Igh 가변 영역이 인간화된 구현예에서, 본 발명의 형질전환 동물은 인간화 항체를 생산하는데 사용될 수 있다. 예를 들어, 이러한 동물은 인간화된, 또는 인간화된, 항체로 특이적 B 세포를 생산할 수 있다. 일부 구체예에서, 예를 들어, 동물의 Igk 또는 Igl 가변 영역이 인간화된 구현예에서, 본 발명의 형질전환 동물은 인간화 항체를 생산하는데 사용될 수 있다.
일부 구현예에서, 예를 들어, 항체 또는 이의 항원 단편을 포함하는 주형서열이 표적 염색체 내에 삽입된 구현예에서, 본 발명의 형질전환 동물은 항체 또는 항원 결합 단편을 생성하기 위해 사용될 수 있다. 예를 들어, 형질전환 동물은 다른 것들 중에서도 단일 사슬 가변 단편(scFv), 나노바디, 이중-특이적 항체, 및 다중-특이적 항체를 생성하기 위해 사용될 수 있다. 이러한 항체는 연구 또는 치료 목적을 위해 사용될 수 있다.
예시적인 다운스트림 응용은 조작된 염색체가 형질전환 동물에 통합되지 않은 응용을 포함한다. 대신에, 일 예로서, 조작된 염색체를 포함하는 ES 세포는 연구 또는 치료 목적으로 사용될 수 있는 다른 세포 유형으로 분화된다.
키트
본 발명은 본 명세서에 기재된 핵산분자를 포함하는 키트를 제공한다. 일부 구체예에서, 핵산분자는 벡터, 예를 들어 플라스미드이다.
본 발명의 키트의 일부 구현예에서, 키트는 본원에 기술된 방법에 사용하기 위한 세포, 예를 들어, 동결보존된 EHS 세포를 포함한다. 일부 구현예에서, 키트는 핵산분자, 및 선택적으로 세포를 사용하기 위한 지침서를 포함한다.
실시예
실시예 1: 배아 하이브리드 줄기(EHS) 세포 구축
본 연구의 전체적인 목표는 Igh 및 Igk 유전자의 가변 도메인에 대해 인간화된 마우스를 얻는 것이었다. 인간과 마우스는 항체 유전자의 배열 및 발현에서 높은 유사성을 나타내고, 중쇄의 유전체 조직 또한 인간과 마우스에서 유사하다. 따라서, VH, DH 및 JH 유전자 세그먼트를 모두 포함하는 ~3MB 마우스 유전체 서열을 동등한 인간 유전자 단편을 포함하는 연속 인간 유전체 서열 약 1MB로 대체함으로써 마우스 Igh 또는 Igk 유전자 가변 도메인의 인간화된 버전을 얻을 수 있었다(도 1).
인간화된 마우스 Igh 유전자를 개발하기 위한 첫 단계는 마우스 배아줄기(ES) 세포를 인간 ES 세포에 융합하여 마우스 배아 하이브리드 줄기(EHS) 세포를 만들고, 마우스와 인간 Igh 유전자를 모두 가진 세포를 만드는 것이었다.
PGK 프로모터의 제어 하에 네오마이신 내성 유전자를 발현하는 조작된 마우스 세포와 CAG 프로모터의 제어 하에 mCherry 마커를 발현하는 조작된 인간 ES 세포를 전기융합에 의해 융합시켰다. 하이브리드 EHS 세포를 G418을 포함하는 마우스 ES 세포배지에서 7일 동안 배양하고, 생존 세포를 mCherry의 발현 수준에 따라 형광 활성화 세포 분류(FACS)로 분류하였다(도 2). 양성 세포를 G418을 포함하는 마우스 ES 세포배지에서 지속적으로 배양하고, 단일 세포 클론을 성장을 위해 별도의 웰로 분리하였다. 다음으로, 유전자형 분석을 위해 각각의 단일 세포 클론에 대해 유전체 DNA를 추출하였다. 구체적으로, 인간 면역글로불린 헤비(IGH) 사슬의 V, D, J 영역(도 3a)에 대한 프라이머 3쌍을 사용하여 EHS 클론 내 표적서열(도 3b)의 존재를 확인하였다. 상기 3개의 원하는 영역을 모두 갖는 클론만을 추가 실험을 위해 보유하였다.
실시예 2: 인간화된 염색체 조작
2.1. HDR 매개 염색체 재배열(HMCR)에 의한 EHC 확립
Igh 유전자의 가변 도메인에 대해 인간화된 마우스 배아 하이브리드 줄기(EHS) 세포를 얻기 위해, 마우스 염색체 12 상의 Igh 유전자의 ~3MB 가변 도메인을 HDR-매개 염색체 재배열(HMR; 도 4a)에 의해 인간 염색체 14 상의 인간 IGH 유전자의 ~1MB 가변 도메인으로 대체하였다.
2개의 플라스미드는 HMCR 과정을 매개하도록 설계되었으며, 도 4A에 도시되어 있다. 5' HMCR 플라스미드는 마우스 Igh 유전자의 5' 말단을 인간 대응물로 대체하도록 설계되었으며, 3' HMCR 플라스미드는 마우스 Igh 유전자의 3' 말단을 인간 대응물로 대체하도록 매개하였다. 5' HMCR 플라스미드는 마우스 Igh 유전자의 5' 말단에 상동성인 5' 암, 인간 IGH 유전자의 5'에 상동성인 3' 암 및 두 상동성 암 사이에 삽입된 CMV-EGFP-polyA-PGK-Puromycin-poly의 카세트를 포함하였다. 유사하게, 3' HMCR 플라스미드는 인간 IGH 가변 암의 3'에 상동성인 5' 암, 마우스 Ig 가변 암의 3'에 상동성인 3' 암 및 두 상동성 암 사이에 삽입된 PGK-Hygromycin-polyA 카세트를 포함하였다(도 4A 참조). 상동성 암들의 길이는 600bp 내지 1000bp 사이였다. 동시에, 마우스 및 인간의 Igh 가변 도메인의 5' 및 3' 말단을 표적으로 하는 Cas9 및 sgRNA를 포함하는 4개의 플라스미드도 설계하였다(도 4a의 지그재그 마크, 표 7에 제공된 sgRNA 표적화 서열 참조). 이들 6개의 플라스미드를 표준 방법을 사용하여 실시예 1에서 얻은 EHS 세포에 원형 플라스미드로서 공동 형질감염시키고, 생성된 세포를 Puromycin 및 Hygromycin을 포함하는 마우스 ES 세포 배지에서 7일 동안 배양하였다. 생존한 GFP-양성 단일 클론을 추가 배양을 위해 선별하였다.
유전자형 분석을 수행하여, 성공적인 HMCR로 원하는 단일 클론을 확인하였다. 유전자형 분석을 위해, 도 5a와 같이 4쌍의 PCR 프라이머를 설계하였다. 제1 쌍의 프라이머에 대해, 정방향 프라이머는 마우스 Igh 5' HMCR 플라스미드의 5' 상동성 암의 상류에 설계하였고, 역방향 프라이머는 CMV 프로모터 영역 내에 있었다(도 5a). 제2 쌍의 프라이머에 대해, 정방향 프라이머는 5' HMCR 플라스미드의 Puromycin 유전자 내에 있었고, 역방향 프라이머는 인간 IGH 서열 내에서 인간 IGH의 5' 상동성 암의 하류에 있었다(도 5a). 제3 쌍의 프라이머에 대해, 정방향 프라이머는 인간 IGH 가변 영역의 3' 상동성 암의 상류에 있었고, 역방향 프라이머는 3' HMCR 플라스미드의 PGK 프로모터 영역에 있었다(도 5a). 마지막 쌍의 프라이머에 대해, 정방향 프라이머는 3' HMCR 플라스미드의 Hygromycin 유전자에 있었고, 역방향 프라이머는 마우스 Igh 가변 도메인 내에서 3' HMCR 플라스미드의 3' 상동성의 3' 다운스트림에 있었다(도 5a). 각 클론에 대해 각 프라이머 쌍으로 PCR 증폭을 수행하였고, 4개의 유전자형 분석 모두에 대해 양성인 클론만을 추가 실험을 위해 보유하였다. 이 단계에서 분리된 196개의 클론 중, 6개는 4개의 PCR 앰플리콘 모두에 대해 양성인 것으로 확인되었다(도 5b).
성공적인 HMCR로 EHS 세포에서 인간 IGH 유전자의 발현을 용이하게 하기 위해, 3' 선택 마커는 상동성 지시 복구(HDR)에 의해 양성 클론의 게놈에서 삭제되었지만(도 4a), 비-상동성 말단 접합(NHEJ), 미세상동성 매개 말단 접합(MMEJ) 및 상동성 매개 말단 접합(HMEJ) 방법도 사용될 수 있었다. 상기 과정은 성공적으로 마우스 염색체 12 상의 마우스 Igh 유전자의 VH, DH 및 JH1-6 유전자 세그먼트를 포함하는 가변 도메인을 갖는 조작된 인간화 염색체(EHC)를 확립하였다.
HMCR 공정을 매개하기 위해 사용된 플라스미드의 서열은 하기 표 5 및 표 6에 제공된다.
표 7은 sgRNA 표적화 서열의 비표적 가닥 3'에 위치한 PAM 서열(NGG)을 갖는 sgRNA 서열을 제공한다. PAM이 없는 상응하는 sgRNA 표적화 서열은 서열번호 14-17과 같이 제공한다.
2.2. CRE-Loxp 매개 염색체 재배열(CMCR)에 의한 EHC 확립
Igh 유전자의 가변 도메인에 대해 인간화된 마우스 EHS 세포를 얻기 위해, 마우스 염색체 12번의 Igh 유전자의 ~3MB 가변 도메인은 CRE-Loxp 매개 염색체 재배열 (CMCR; 도 4B)에 의해 인간 염색체 14번의 ~1MB 가변 도메인으로 대체되었다. 4개의 플라스미드가 CMCR 과정을 매개하도록 설계되었다. 마우스 Igh 5' (pCMV-GFP-BGH PolyA-Loxp) 및 3' (BGH polyA-Loxp-511-Hygromycin-BGH PolyA-PGK-BSD-BGH PolyA) 플라스미드는 마우스 Igh 가변 유전자좌의 5' 및 3' 말단에 각각 삽입되도록 설계되었다. 동시에, 인간 IGH 5' (BGH polyA-Loxp-Puro-BGH PolyA-PGK-Neomycin-BGH PolyA) 및 3' (PCMV-BGP-BGH PolyA-PGK-Loxp-511) 플라스미드는 인간 IGH 가변 유전자좌의 5' 및 3' 말단에 각각 삽입되도록 설계되었다 (도 5). 형질감염 후의 EHS 세포를 BSD 및 Neomycin을 함유하는 마우스 ES 세포 배지에서 7일 동안 배양하였다. 생존된 GFP- 및 BFP- 이중 양성 세포를 추가 배양을 위해 선별하였다. 유전자형 분석은 상기 플라스미드들이 성공적으로 통합되어 원하는 단일 클론을 확인하기 위해 수행하였다. CMCR을 위해 성공적으로 통합된 EHS 세포에 Cre를 형질감염시켰고, 성공적으로 재배열된 세포는 Puromycin 및 Hygromycin을 함유하는 배지에서 생존할 수 있었다. 그 후 생존된 세포를 유전자형 분석을 위해 패킹하였다. 성공적인 CMCR을 갖는 EHS 세포에서 인간 IGH 유전자의 발현을 용이하게 하기 위해, 3' 선택 마커를 다음으로 게놈으로부터 삭제하였다(도 5). 상기 과정들에 따라, 조작된 인간화 염색체(EHC; 마우스 염색체 12의 Igh 유전자는 그들의 가변 도메인에 대해 인간화됨)를 EHS 세포에서 CMCR에 의해 성공적으로 확립하였다
실시예 3: 마이크로 세포 매개 염색체 전달을 통한 마우스 배아줄기세포의 염색체 대체
실시예 1 및 2에 기재된 바와 같이 조작된 인간화 염색체(EHC)로 EHS 세포를 수득한 후, EHC를 이어서 마이크로-세포 매개 염색체 전달(MMCT)에 의해 마우스 ES 세포로 전달하여 Igh 유전자의 가변 도메인에 대해 인간화된 마우스 ES 세포를 확립하였다.
EHC를 운반하는 EHS 세포에 0.2㎍/ml 콜세미드를 37℃에서 48시간 동안 처리하였다. 장기간의 유사분열 정지는 마이크로 세포의 형성을 유도하였고, 이를 원심분리에 의해 수집하였다(도 6). 동시에, 12번 염색체 상의 mCherry 형광 표지자 및 발현 마우스 ES 세포를 수득하였다(도 6). 이들 세포는 CMV-mCherry-polyA의 카세트를 마우스 12번 염색체의 하나의 카피에 삽입함으로써 수득하였다.
다음으로, 마이크로 세포를 전기 융합에 의해 마우스 ES 세포와 혼성화시키고, 생성된 세포를 FACS에 의해 GFP+ 및 mCherry+ 마커를 사용하여 분류하여 GFP+ 및 mCherry+인 마우스 ES 세포를 수득하였다. GFP+는 EHC가 마우스 ES 세포 내로 성공적으로 전달되었음을 나타낸 반면, mCherry+ 마커는 세포가 mCherry+ 염색체 12도 보유함을 나타내었다. 양성 세포는 마우스 ES 세포 배지에서 2주 동안 지속적으로 배양하였고, mCherry+ 및 GFP+ 마우스 ES 세포, 즉 mCherry+로 표시된 여분의 염색체 12를 상실한 세포를 FACS에 의해 분류하여 7일 동안 배양하였다. 단일 클론을 성장 및 핵형 분석을 위해 별도의 웰로 분리하고, 올바른 핵형을 갖는 클론을 유지하였다. 그 결과, 마우스 ES 세포는 Igh 유전자의 가변 영역에 대해 인간화되었다.
실시예 4:
Igh
인간화 마우스 제조
실시예 3에서 얻은 Igh 유전자의 가변영역에 대해 인간화된 마우스 ES 세포를 표준 절차에 따라 B6D2F1 (C57BL/6 X DBA2) 마우스 균주로부터 배반포에 주입하였다. 대안적으로, 핵 전달 또는 4배체 배아 보완을 사용하여 인간화된 마우스를 생성할 수도 있었다.
주입된 배반포를 coitus (dpc) 후 2.5일에 가성임신 ICR 여성의 자궁으로 옮겼다. Igh 인간화 마우스를 형광 입체현미경 하에서 GFP의 발현 수준에 의해 확인하고, GFP+ 마우스를 추가로 분석하였다.
다음으로, 일련의 PCR 실험을 Igh 인간화 마우스를 검증하기 위해 설계하였다. 제1 세트의 PCR 실험은 인간 IGH 가변 영역의 완전성을 검증하기 위해 설계하였다. 인간 IGH 가변 영역의 상이한 영역에 대한 5쌍의 프라이머를 설계하였다(도 7a, PCR 프라이머 1-10을 나타내는 화살표 참조). Igh 인간화 마우스는 5개의 PCR 프라이머 쌍 모두에 대해 양성 PCR 생성물을 나타냈다(도 7B). 우리는 또한 인간 IGH 가변 영역의 업스트림 및 다운스트림에 프라이머를 설계하였으며(도 7A), 우리의 Igh 인간화 마우스에 대한 PCR 실험 중 어느 것에서도 생성물이 관찰되지 않은 반면, HEK293T는 PCR 생성물의 오른쪽 밴드를 나타냈다(도 7B).
섬유아세포를 Igh 인간화 마우스의 꼬리로부터 분리하여 FIX(Fluorence In Situ Hybridization)를 수행하는 데 사용하였다. FIX 결과는 Igh 인간화 마우스의 염색체 12가 인간 염색체 14의 단편을 포함하는 것으로 나타났으며(도 8a), 이는 인간 IGH 유전자의 가변 도메인이 쥐의 염색체 12에 성공적으로 삽입되었음을 나타낸다.
이상 염색체를 배제하기 위해 G-banding karyotype 분석을 또한 수행하였다(도 8b).
Igh 인간화 마우스의 게놈 DNA도 추출하여, 전체 게놈 시퀀싱(WGS) 분석을 수행하였다. WGS 서열은 마우스 및 인간 염색체 14번의 염색체를 모두 포함하는 참조 게놈에 매핑되었다. 인간 IGH 유전자의 모든 가변 도메인(VH, DH 및 JH 유전자 세그먼트)은 전체 게놈 서열 판독에 의해 커버되었다. 또한, 다른 게놈 영역에서는 표적 외 편집이 발견되지 않았다(도 9a 내지 도 9b).
실시예 5: Igk 인간화 마우스 제조
MASIRT를 적용하여 Igk 유전자의 가변 도메인에 대해 인간화된 마우스를 수득하였다(도 10). 상기 기재된 Igh 유전자에 대한 접근법과 유사한 접근법을 사용하여, Igk 인간화 마우스도 수득하였다. Igk 인간화 마우스를 검증하기 위해, 우리는 먼저 인간 IGK 가변 영역의 완전성을 검증하기 위해 PCR 실험을 수행하였다. 인간 IGK 가변 영역의 상이한 유전자좌 상에서 5쌍의 프라이머를 설계하였고(도 11A), 수득한 Igk 인간화 마우스는 5개의 실험 모두에 대해 PCR 생성물이 양성이었다(도 11B). 인간 IGK 가변 영역의 업스트림 및 다운스트림 상의 프라이머도 설계하였고(도 11A), 수득한 Igk 인간화 마우스에 대한 PCR 실험 중 어느 것에서도 생성물이 관찰되지 않은 반면, HEK293T는 PCR 생성물의 오른쪽 밴드를 나타내었다(도 11B). 마지막으로, Igk 인간화 마우스의 게놈 DNA도 추출하여 전체 게놈 시퀀싱(WGS) 분석을 수행하였다.
표 10은 sgRNA 표적화 서인간의 2번 염색체를 포함하는 참조 게놈에 대한 전체 게놈 서열을 맵핑하였다. 이열의 비표적 가닥 3'에 위치한 PAM 서열(NGG)을 갖는 sgRNA 서열을 제공한다. PAM이 없는 상응하는 sgRNA 표적화 서열은 서열번호 28-31과 같이 제공한다.
마우스의 모든 염색체 및 는 인간 IGK 유전자의 모든 가변 도메인(VH 및 JH 유전자 세그먼트)이 전체 게놈 서열에 의해 커버되었음을 보여준다. 이외에도, 다른 게놈 영역에서 어떠한 목표 외 편집도 발견되지 않았다(도 12).
서열목록 전자파일 첨부
Claims (105)
- 하기 단계를 포함하는 조작된 염색체의 제조방법:
a. 표적서열을 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계;
b. 상기 세포를 하기 핵산분자와 접촉시키는 단계
i. 표적서열의 5' 말단의 상류(upstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암(homology arm), 적어도 하나의 제1 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 제1 핵산분자; 및
ii. 주형서열의 3' 말단의 하류(downstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암, 적어도 하나의 제2 마커, 및 표적서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5' 에서 3' 으로 포함하는 제2 핵산분자;
c. 주형서열 및 상기 제1 및 제2 마커가 표적 염색체 내로 삽입되어, 표적서열의 양 측면, 및 주형서열의 5' 말단 및 3' 말단에서 이중가닥 절단(double strand break)을 생성하는 단계; 및
d. 상기 제1 및 제2 마커를 발현하는 세포 또는 세포들을 선별하는 단계. - 제1항에 있어서, 주형서열의 삽입 후에, 제1 마커는 주형서열의 5' 말단에 위치하고 제2 마커는 주형서열의 3' 말단에 위치하는 것인 방법.
- 제1항 또는 제2항에 있어서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 20 내지 2,000 bp, 약 50 내지 1,500 bp, 약 100 내지 1,400 bp, 약 150 내지 1,300 bp, 약 200 내지 1,200 bp, 약 300 내지 1,100 bp, 약 400 내지 1,000 bp, 또는 약 500 내지 900 bp, 또는 약 600 bp 내지 약 800 bp인 방법.
- 제1항 또는 제2항에 있어서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 400 내지 1,500 bp, 길이가 약 500 내지 1,300 bp, 또는 길이가 약 600 내지 1,000 bp인 방법.
- 제1항 또는 제2항에 있어서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 600 내지 1,000 bp인 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 주형서열의 길이가 적어도 25 KB(kilobasepairs), 적어도 50 KB, 적어도 100 KB, 적어도 200 KB, 적어도 400 KB, 적어도 500 KB, 적어도 600 KB, 적어도 700 KB, 적어도 800 KB, 적어도 900 KB, 적어도 1 MB(megabasepair), 적어도 2 MB, 적어도 3 MB, 적어도 4 MB, 적어도 5 MB, 적어도 6 MB, 적어도 7 MB, 적어도 8 MB, 적어도 9 MB, 적어도 10 MB, 적어도 15 MB, 적어도 20 MB, 적어도 25 MB, 적어도 30 MB, 적어도 40 MB, 적어도 50 MB, 적어도 60 MB, 적어도 70 MB, 적어도 80 MB, 적어도 90 MB, 적어도 100 MB, 적어도 120 MB, 적어도 140 MB, 적어도 160 MB, 적어도 180 MB, 적어도 200 MB, 적어도 220 MB, 또는 적어도 250 MB인 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 주형서열의 길이가 50 KB 내지 250 MB, 50 KB 내지 100 MB, 50 KB 내지 50 MB, 50 KB 내지 20 MB, 50 KB 내지 10 MB, 50 KB 내지 5 MB, 50 KB 내지 3 MB, 50 KB 내지 2 MB, 50 KB 내지 1 MB, 100 KB 내지 200 MB, 100 KB 내지 100 MB, 100 KB 내지 50 MB, 100 KB 내지 20 MB, 100 KB 내지 10 MB, 100 KB 내지 5 MB, 100 KB 내지 3 MB, 100 KB 내지 2 MB, 100 KB 내지 1 MB, 100 KB 내지 500 KB, 200 KB 내지 100 MB, 200 KB 내지 50 MB, 200 KB 내지 20 MB, 200 KB 내지 10 MB, 200 KB 내지 5 MB, 200 KB 내지 3 MB, 200 KB 내지 2 MB, 200 KB 내지 1 MB, 200 KB 내지 500 KB, 500 KB 내지 100 MB, 500 KB 내지 50 MB, 500 KB 내지 20 MB, 500 KB 내지 10 MB, 500 KB 내지 5 MB, 500 KB 내지 3 MB, 500 KB 내지 2 MB, 500 KB 내지 1 MB, 1 MB 내지 100 MB, 1 MB 내지 50 MB, 1 MB 내지 20 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 1 MB 내지 2 MB, 3 MB 내지 100 MB, 3 MB 내지 50 MB, 3 MB 내지 20 MB, 3 MB 내지 10 MB, 3 MB 내지 5 MB, 5 MB 내지 100 MB, 5 MB 내지 50 MB, 5 MB 내지 20 MB, 5 MB 내지 10 MB, 10 MB 내지 100 MB, 10 MB 내지 50 MB, 또는 10 MB 내지 20 MB인 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 주형서열의 길이가 200 KB 내지 50 MB, 1 MB 내지 20 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 3 MB 내지 20 MB, 3 MB 내지 10 MB, 3 MB 내지 7 MB, 또는 3 MB 내지 5 MB인 방법.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 단계 (c)에서 이중가닥 절단을 생성하는 단계는 이중가닥 절단을 유도하기 위해 CRISPR/Cas 엔도뉴클레아제 및 하나 이상의 가이드 핵산(guide nucleic acids, gNAs), 하나 이상의 아연 핑거 뉴클레아제(zinc finger nucleases), 하나 이상의 전사 활성화제 유사 이펙터 뉴클레아제(Transcription Activator-Like Effector Nucleases, TALEN), 또는 하나 이상의 CRE 재조합효소(CRE recombinase)를 사용하는 단계를 포함하는 방법.
- 제9항에 있어서, CRISPR/Cas 엔도뉴클레아제는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas12b, Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체(homolog), 동원체(ortholog), 또는 변형된 버전을 포함하는 방법.
- 제9항에 있어서, CRISPR/Cas 엔도뉴클레아제는 Cas9, Cpf1, CasX, CasY, C2c1, C2c3, 또는 이의 동족체, 동원체 또는 변형된 버전을 포함하는 방법.
- 제9항에 있어서, CRISPR/Cas 엔도뉴클레아제는 Cas9을 포함하는 방법.
- 제10항 내지 제12항 중 어느 한 항에 있어서, gNA는 단일 가이드 RNA(single guide RNA, sgRNA)를 포함하는 방법.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 표적 염색체는 제1 핵산분자의 5' 상동성 암의 서열, 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5' 에서 3'으로 포함하는 방법.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 주형 염색체는 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 및 제2 핵산분자의 5' 상동성 암의 서열을, 5'에서 3'으로 포함하는 방법.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 표적서열은 적어도 1개의 유전자, 적어도 2개의 유전자, 적어도 3개의 유전자, 적어도 5개의 유전자, 적어도 10개의 유전자, 적어도 20개의 유전자, 적어도 30개의 유전자, 적어도 40개의 유전자, 적어도 50개의 유전자, 적어도 100개의 유전자, 또는 적어도 200개의 유전자를 포함하는 방법.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 표적서열은 주형서열의 하나 이상의 유전자와 상동성(homologous)인 하나 이상의 유전자를 포함하는 방법.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 주형서열은 자연적으로 발생하는 서열을 포함하는 방법.
- 제18항에 있어서, 주형서열은 자연적으로 발생하는 서열에 대한 하나 이상의 변형을 포함하는 방법.
- 제18항에 있어서, 주형서열은 적어도 1개의 유전자, 적어도 2개의 유전자, 적어도 3개의 유전자, 적어도 5개의 유전자, 적어도 10개의 유전자, 적어도 20개의 유전자, 적어도 30개의 유전자, 적어도 40개의 유전자, 적어도 50개의 유전자, 적어도 100개의 유전자, 또는 적어도 200개의 유전자를 포함하는 방법.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 주형서열은 인공 서열을 포함하는 방법.
- 제21항에 있어서, 인공 서열은 하나 이상의 항체 또는 이의 항원 결합 단편을 코딩하는 서열을 포함하는 방법.
- 제22항에 있어서, 하나 이상의 항체 또는 이의 항원 결합 단편은 scFv, 이중-특이적 항체, 또는 다중-특이적 항체를 포함하는 방법.
- 제1항 내지 제23항 중 어느 한 항에 있어서, 주형서열의 삽입에 의해 표적서열이 결실되는 방법.
- 제24항에 있어서,
a. 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 표적서열, 제2 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고;
b. 주형 염색체가 제3 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제4 sgRNA 표적서열을, 5'에서 3'으로 포함하는, 방법. - 제25항에 있어서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, 및 제1, 제2, 제3 및 제4 sgRNA와 접촉시키는 단계를 포함하는 방법.
- 제26항에 있어서, 제1, 제2, 제3 및 제4 sgRNA는 제1, 제2, 제3 및 제4 sgRNA 표적서열에 특이적인 표적서열을 포함하는 방법.
- 제26항에 있어서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함하는 방법.
- 제1항 내지 제23항 중 어느 한 항에 있어서, 주형서열의 삽입은 표적서열의 결실을 거의 또는 전혀 포함하지 않는 방법.
- 제29항에 있어서, 주형서열의 삽입은 표적서열의 하나 이상의 기능을 파괴하는 방법.
- 제29항 또는 제30항에 있어서, 주형서열의 삽입은 표적서열에서의 유전자를 파괴하는 방법.
- 제29항 내지 제31항 중 어느 한 항에 있어서,
a. 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고;
b. 주형 염색체가 제2 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제3 sgRNA 표적서열을, 5'에서 3'으로 포함하는, 방법. - 제32항에 있어서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, 및 제1, 제2, 및 제3 sgRNA와 접촉시키는 단계를 포함하는 방법.
- 제33항에 있어서, 제1, 제2, 및 제3 sgRNA는 제1, 제2, 및 제3 sgRNA 표적서열에 특이적인 표적서열을 포함하는 방법.
- 제34항 또는 제35항에 있어서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함하는 방법.
- 제1항 내지 제35항 중 어느 한 항에 있어서, 제1 또는 제2 마커는 세포 내에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 형광 단백질을 포함하는 방법.
- 제36항에 있어서, 형광 단백질은 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 적색 형광 단백질(RFP), 시안 형광 단백질(CFP), 청색 형광 단백질(BFP), dsRed, mCherry 또는 tdTomato를 포함하는 방법.
- 제36항에 있어서, 형광 단백질은 GFP를 포함하는 방법.
- 제1항 내지 제38항 중 어느 한 항에 있어서, 제1 마커는 선택가능한 마커를 추가로 포함하는 방법.
- 제1항 내지 제39항 중 어느 한 항에 있어서, 제2 마커는 선택가능한 마커를 추가로 포함하는 방법.
- 제39항 또는 제40항에 있어서, 선택가능한 마커는 다이하이드로폴레이트 환원효소(Dihydrofolate reductase, DHFR), 글루타민 합성효소(Glutamine synthase, GS), 푸로마이신 아세틸트랜스퍼라제(Puromycin acetyltransferase), 블라스티딘 탈아미노화효소(Blasticidin deaminase), 히스티디놀 탈수소효소(Histidinol dehydrogenase), 하이그로마이신 포스포트랜스퍼라제(Hygromycin phosphotransferase, hph), 블레오마이신 내성 유전자(Bleomycin resistance gene) 및 아미노글리코사이드 포스포트랜스퍼라제(Aminoglycoside phosphotransferase, 네오마이신 내성)으로 구성된 군에서 선택되는 것인 방법.
- 제39항 내지 제41항 중 어느 한 항에 있어서, 제1 및 제2 마커는 동일한 선택가능한 마커가 아닌 방법.
- 제1항 내지 제42항 중 어느 한 항에 있어서, 제1 마커는 세포 내에서 GFP를 발현할 수 있는 프로모터에 작동 가능하게 연결된 GFP 및 푸로마이신 아세틸트랜스퍼라제를 포함하고, 제2 마커는 하이그로마이신 포스포트랜스퍼라제를 포함하는 방법.
- 제1항 내지 제43항 중 어느 한 항에 있어서, 상기 (d) 단계 이후에 추가로, (e) 제1 또는 제2 마커의 전부 또는 일부를 삭제하는 단계를 포함하는 방법.
- 제44항에 있어서, 제1 또는 제2 마커를 삭제하는 단계는 CRISPR/Cas 엔도뉴클레아제 및 마커를 코딩하는 서열에 특이적인 표적서열을 포함하는 gNA로 결실을 유도하는 단계를 포함하는 방법.
- 제1항 내지 제45항 중 어느 한 항에 있어서, 세포는 하이브리드 세포(hybrid cells), 배아 하이브리드 줄기(embryonic hybrid stem, EHS) 세포 또는 접합체(zygotes)를 포함하는 방법.
- 제46항에 있어서, EHS 세포는 마우스(mouse), 래트(rat), 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 임의의 두 종의 ES 세포를 융합하여 제조되는 방법.
- 제46항에 있어서, EHS 세포는 인간 배아 줄기세포를 인간이 아닌 종의 배아 줄기세포에 융합하여 제조되는 방법.
- 제48항에 있어서, 인간이 아닌 종은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 또는 원숭이인 방법.
- 제46항에 있어서, EHS 세포는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 임의의 상이한 두 종의 ES 세포를 융합하여 제조되는 방법.
- 제46항에 있어서, 하이브리드 세포를 제조하는 단계는 하기 단계를 포함하는 방법:
a. 소핵(micronucleated) 인간 세포를 제조하는 단계; 및
b. 하이브리드 세포를 제조하기 위해, 상기 소핵 인간 세포와 인간이 아닌 종의 세포를 융합하는 단계. - 제51항에 있어서, 소핵 인간 세포는 소핵을 유도하기에 충분한 조건하에서 인간 세포 콜세미드(colcemid)를 노출시키는 단계 및 원심분리를 이용하여 소핵 세포를 수집하는 단계에 의해 제조되는 방법.
- 제51항 또는 제52항에 있어서, 인간이 아닌 종은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 또는 원숭이인 방법.
- 제51항 내지 제53항 중 어느 한 항에 있어서, 인간이 아닌 종의 세포는 ES 세포이고, 하이브리드 세포는 EHS 세포인 방법.
- 제47항 내지 제50항 중 어느 한 항에 있어서, 융합은 전기 융합(electrofusion), 바이러스 유도 융합(viral induced fusion), 또는 화학적 유도 융합(chemically induced fusion)을 포함하는 방법.
- 제1항 내지 제55항 중 어느 한 항에 있어서, 표적서열은 면역글로불린 또는 T 세포 수용체 서브유닛(subunit)을 코딩하는 유전자를 포함하는 방법.
- 제1항 내지 제56항 중 어느 한 항에 있어서, 표적 염색체는 마우스 염색체 12(mouse chromosome 12)를 포함하고 주형 염색체는 인간 염색체 14(human chromosome 14)를 포함하거나, 표적 염색체는 마우스 염색체 6(mouse chromosome 6)을 포함하고 주형 염색체는 인간 염색체 2(human chromosome 2)를 포함하는 방법.
- 제57항에 있어서, 표적서열은 마우스 Igh 가변영역 서열, 마우스 Igk 가변영역 서열, 및/또는 마우스 Igl 가변영역 서열을 포함하는 방법.
- 제58항에 있어서, 마우스 Igh 가변영역 서열은 마우스 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재(intervening) 비-코딩 서열을 포함하는 방법.
- 제57항 내지 제59항 중 어느 한 항에 있어서, 주형서열은 인간 IGH 가변영역 서열, 인간 IGK 가변영역 서열, 및/또는 인간 IGL 가변영역 서열을 포함하는 방법.
- 제60항에 있어서, 인간 IGH 가변영역 서열은 인간 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함하는 방법.
- 제1항 내지 제61항 중 어느 한 항에 있어서, 상기 단계 (d)에서 선별된 세포로부터 조작된 염색체를 회수하는 단계를 추가적으로 포함하는 방법.
- 제62항에 있어서, 조작된 염색체를 회수하는 단계는 소핵을 유도하기에 충분한 조건하에서 세포를 콜세미드에 노출시키는 단계 및 원심분리를 이용하여 소핵 세포를 수집하는 단계를 포함하는 방법.
- 제1항 내지 제63항 중 어느 한 항에 있어서, 제1 및 제2 핵산분자는 플라스미드인 방법.
- 제1항 내지 제64항 중 어느 한 항의 방법에 의해 제조된 조작된 염색체.
- 제65항에 있어서, 마우스 Igh 가변영역을 대신하여 인간 IGH 가변영역의 서열을 포함하는 마우스 염색체 12이거나, 마우스 Igk 가변영역을 대신하여 인간 IGK 가변영역의 서열을 포함하는 마우스 염색체 6인 조작된 염색체.
- 제66항에 있어서, 마우스 Igh 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함하는 조작된 염색체.
- 제66항 또는 제67항에 있어서, 인간 IGH 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함하는 조작된 염색체.
- 제64항 내지 제68항 중 어느 한 항의 조작된 염색체를 포함하는 세포.
- 제69항에 있어서, 마우스 ES 세포와 혼성화할 수 있는 세포.
- 제69항에 있어서, 배아줄기(ES) 세포, 배아 하이브리드 줄기(EHS) 세포, 또는 접합체(zygote)인 세포.
- 제68항에 있어서, 소핵 세포인 세포.
- 제72항에 있어서, EHS 세포는 인간 및 마우스 ES 세포의 하이브리드인 세포.
- 제72항에 있어서, ES 세포는 마우스 ES 세포인 세포.
- 하기 단계를 포함하는 마우스 배아줄기(ES) 세포의 제조방법:
a. 제1항 내지 제64항 중 어느 한 항의 방법에 의해 제조된 조작된 염색체를 포함하는 소핵 세포를 융합시키는 단계, 여기서:
i. 마우스 ES 세포는 조작된 염색체와 상동 염색체를 포함하고, 상동 염색체는 ES 세포에서 형광 단백질을 발현할 수 있는 프로모터와 작동 가능하게 연결된 제1 형광 단백질을 포함함; 및
ii. 소핵 세포의 적어도 하나의 서브세트는 조작된 염색체를 포함하고, 조작된 염색체는 제1 형광 단백질과 상이한 제2 형광 단백질을 포함하며, 제2 형광 단백질은 ES 세포에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 것임;
b. 제1 및 제2 형광 단백질을 모두 발현하는 ES 세포를 선별하는 단계;
c. 상동 염색체가 ES 세포의 적어도 하나의 서브세트에 의해 소실될 때까지 단계 (c)에서 선별된 ES 세포를 배양하는 단계; 및
d. 제2 형광 단백질을 발현하고 제1 형광 단백질을 발현하지 않는 ES 세포를 선별하는 단계. - 제75항에 있어서, 상기 단계 (c)에서 세포를 배양하는 단계는 적어도 5일, 적어도 7일, 적어도 10일, 또는 적어도 14일 동안 세포를 배양하는 단계를 포함하는 방법.
- 제75항 또는 제76항에 있어서, 상기 단계 (b) 및 (d)에서 세포를 선별하는 단계는 형광 활성화 세포 분류(fluorescence activated cell sorting, FACS)를 포함하는 방법.
- 제75항 내지 제77항 중 어느 한 항의 방법에 의해 제조된 마우스 ES 세포.
- 제75항 내지 제78항 중 어느 한 항의 방법에 의해 제조된 마우스 ES 세포로부터 제조된, 형질전환(transgenic) 마우스.
- 제79항에 있어서, 형질전환 마우스를 생산하는 단계는 ES 세포를 이배체 배반포(diploid blastocyst)에 주입하는 단계, ES 세포에서 핵이 제거된(enucleated) 마우스 배아로의 핵 이식, 또는 4배체 배아 보완을 포함하는 형질전환 마우스.
- 제79항 또는 제80항에 있어서, 마우스 염색체 12는 마우스 Igh 가변영역 대신 인간 IGH 가변영역의 서열을 포함하거나, 마우스 염색체 6은 마우스 Igk 가변영역 대신 인간 IGK 가변영역의 서열을 포함하는 형질전환 마우스.
- 제81항에 있어서, 마우스 Igh 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함하는 형질전환 마우스.
- 제81항 또는 제82항에 있어서, 인간 IGH 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함하는 형질전환 마우스.
- 하기 단계를 포함하는 항체의 제조방법:
a. 형질전환 마우스가 인간 IGH 가변영역으로부터 인간 V, D 및 J 세그먼트를 포함하는 복수의 항체를 제조하여, 제80항 내지 제83항 중 어느 한 항의 형질전환 마우스에 항원을 자극하는(challenging) 단계; 및
b. 항원에 특이적인 항체를 분리하는 단계. - 제84항의 방법에 의해 제조된 항체로부터 유도된 항체.
- 제85항에 있어서, 단일 사슬 가변 단편(scFv), 이중-특이적 항체 또는 다중-특이적 항체를 포함하는 항체.
- 하기 단계를 포함하는 염색체 재배열(rearrangement)의 제조방법:
a. 표적 위치를 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계;
b. 표적 위치의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 5' 상동성 암, 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 핵산분자와 상기 세포를 접촉시키는 단계;
c. 상기 마커가 5' 상동성 암의 서열의 표적 염색체 3' 내로 삽입되고 염색체 재배열이 제조되어, 표적 위치, 및 주형서열의 5' 말단에서 이중가닥 절단을 제조하는 단계; 및
d. 상기 마커를 발현하는 세포 또는 세포들을 선별하는 단계. - 제87항에 있어서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 20 내지 2,000 bp, 약 50 내지 1,500 bp, 약 100 내지 1,400 bp, 약 150 내지 1,300 bp, 약 200 내지 1,200 bp, 약 300 내지 1,100 bp, 약 400 내지 1,000 bp, 또는 약 500 내지 900 bp, 또는 약 600 bp 내지 약 800 bp인 방법.
- 제87항에 있어서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 400 내지 1,500 bp, 길이가 약 500 내지 1,300 bp, 또는 길이가 약 600 내지 1,000 bp인 방법.
- 제87항에 있어서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 600 내지 1,000 bp인 방법.
- 제87항 내지 제90항 중 어느 한 항에 있어서, 상기 단계 (c)에서 이중가닥 절단을 생성하는 단계는 이중가닥 절단을 유도하기 위해 CRISPR/Cas 엔도뉴클레아제 및 적어도 하나의 sgRNA, 하나 이상의 아연 핑거 뉴클레아제, 하나 이상의 전사 활성화제 유사 이펙터 뉴클레아제(TALEN), 또는 하나 이상의 CRE 재조합효소를 사용하는 단계를 포함하는 방법.
- 제91항에 있어서, CRISPR/Cas 엔도뉴클레아제는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas12b, Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체, 동원체, 또는 변형된 버전을 포함하는 방법.
- 제91항에 있어서, CRISPR/Cas 엔도뉴클레아제는 Cas9, Cpf1, CasX, CasY, C2c1, C2c3, 또는 이의 동족체, 동원체 또는 변형된 버전을 포함하는 방법.
- 제91항에 있어서, CRISPR/Cas 엔도뉴클레아제는 Cas9을 포함하는 방법.
- 제91항 내지 제93항 중 어느 한 항에 있어서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, CRISPR/Cas 엔도뉴클레아제가 표적 위치를 절단하도록 표적 위치에 특이적인 표적서열을 포함하는 적어도 하나의 제1 gNA, 및 주형서열의 5' 말단에 특이적인 표적서열을 포함하는 제2 gNA와 접촉시키는 단계를 포함하는 방법.
- 제95항에 있어서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함하는 방법.
- 제87항 내지 제96항 중 어느 한 항에 있어서, 마커는 세포 내에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 형광 단백질을 포함하는 방법.
- 제97항에 있어서, 형광 단백질은 GFP, YFP, RFP, CFP, BFP, dsRed, mCherry 또는 tdTomato를 포함하는 방법.
- 제87항 내지 제98항 중 어느 한 항에 있어서, 마커는 선택가능한 마커를 추가로 포함하는 방법.
- 제99항에 있어서, 선택가능한 마커는 다이하이드로폴레이트 환원효소(DHFR), 글루타민 합성효소(GS), 푸로마이신 아세틸트랜스퍼라제, 블라스티딘 탈아미노화효소, 히스티디놀 탈수소효소, 하이그로마이신 포스포트랜스퍼라제(hph), 블레오마이신 내성 유전자 및 아미노글리코사이드 포스포트랜스퍼라제(네오마이신 내성)으로 구성된 군에서 선택되는 것인 방법.
- 제87항 내지 제100항 중 어느 한 항에 있어서, 세포는 배아줄기(ES) 세포를 포함하는 방법.
- 제87항 내지 제101항 중 어느 한 항에 있어서, 핵산분자는 플라스미드인 방법.
- 제87항 내지 제101항 중 어느 한 항의 염색체 재배열을 포함하는 세포.
- 제103항에 있어서, 마우스 ES 세포인 세포.
- 제103항 또는 제104항의 세포로부터 제조된 마우스 ES 세포의 형질전환 마우스.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2021120126 | 2021-09-24 | ||
CNPCT/CN2021/120126 | 2021-09-24 | ||
PCT/CN2022/120692 WO2023046038A1 (en) | 2021-09-24 | 2022-09-23 | Methods for large-size chromosomal transfer and modified chromosomes and organisims using same |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240069672A true KR20240069672A (ko) | 2024-05-20 |
Family
ID=85720116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237045065A KR20240069672A (ko) | 2021-09-24 | 2022-09-23 | 대규모 염색체 전달 방법 및 이를 이용한 변형 염색체 및 유기체 |
Country Status (6)
Country | Link |
---|---|
KR (1) | KR20240069672A (ko) |
CN (1) | CN117795078A (ko) |
AU (1) | AU2022350732A1 (ko) |
CA (1) | CA3222922A1 (ko) |
TW (1) | TW202332770A (ko) |
WO (1) | WO2023046038A1 (ko) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101892221A (zh) * | 2010-06-30 | 2010-11-24 | 苏州神洲基因有限公司 | 染色体的无痕迹修饰方法 |
CN103215295B (zh) * | 2013-04-11 | 2015-04-22 | 西北农林科技大学 | 一种β-酪蛋白位点定点整合Lys基因的打靶载体及其构建的细胞 |
CN113215196A (zh) * | 2014-06-06 | 2021-08-06 | 瑞泽恩制药公司 | 用于修饰所靶向基因座的方法和组合物 |
WO2016025759A1 (en) * | 2014-08-14 | 2016-02-18 | Shen Yuelei | Dna knock-in system |
CN110214185A (zh) * | 2016-11-28 | 2019-09-06 | 国立大学法人大阪大学 | 基因组编辑方法 |
JP7466905B2 (ja) * | 2017-07-18 | 2024-04-15 | ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー | 二段階相同組換え修復によるスカーレスゲノム編集 |
US20190225989A1 (en) * | 2018-01-19 | 2019-07-25 | Institute of Hematology and Blood Disease Hospital, CAMS & PUMC | Gene knockin method and kit for gene knockin |
-
2022
- 2022-09-23 AU AU2022350732A patent/AU2022350732A1/en active Pending
- 2022-09-23 WO PCT/CN2022/120692 patent/WO2023046038A1/en active Application Filing
- 2022-09-23 CN CN202280053436.XA patent/CN117795078A/zh active Pending
- 2022-09-23 KR KR1020237045065A patent/KR20240069672A/ko unknown
- 2022-09-23 TW TW111136154A patent/TW202332770A/zh unknown
- 2022-09-23 CA CA3222922A patent/CA3222922A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
TW202332770A (zh) | 2023-08-16 |
CN117795078A (zh) | 2024-03-29 |
CA3222922A1 (en) | 2023-03-30 |
WO2023046038A9 (en) | 2023-04-27 |
WO2023046038A1 (en) | 2023-03-30 |
AU2022350732A1 (en) | 2024-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019202160B2 (en) | Methods and compositions for the targeted modification of a genome | |
JP6700306B2 (ja) | 受精前の卵細胞、受精卵、及び標的遺伝子の改変方法 | |
AU2020233694A1 (en) | Targeted modification of rat genome | |
CN109536526B (zh) | 核酸酶介导的使用大靶向载体的靶向 | |
JP5900942B2 (ja) | 核酸挿入用ベクター | |
WO2018225858A1 (ja) | Dnaが編集された真核細胞を製造する方法、および当該方法に用いられるキット | |
CN109414001A (zh) | 通过cas9蛋白的多循环电穿孔产生的遗传修饰的非人哺乳动物 | |
WO2014172470A2 (en) | Methods of mutating, modifying or modulating nucleic acid in a cell or nonhuman mammal | |
CA3182286A1 (en) | Selection by essential-gene knock-in | |
WO2019206236A1 (zh) | 通过Tild-CRISPR实现高效精确的靶向整合 | |
CA3144958A1 (en) | Transgenic mammals and methods of use thereof | |
AU778719B2 (en) | Trap vector and gene trapping method by using the same | |
JP2022526048A (ja) | 人工組換え染色体およびその使用 | |
KR20240069672A (ko) | 대규모 염색체 전달 방법 및 이를 이용한 변형 염색체 및 유기체 | |
WO1994021787A1 (en) | Method for defined deletions of dna | |
Brakebusch | Generation and analysis of genetically modified mice | |
WO2021200768A1 (ja) | ヒト染色体の分散方法、単離方法、およびその動物胚への移植方法 | |
KR102403995B1 (ko) | 파킨슨 병 유도 벡터 및 이를 이용한 개 모델의 제조 방법 | |
WO2023176982A1 (ja) | Mhc遺伝子群ヒト化動物 | |
TW201840849A (zh) | 編輯核酸序列之組成物及方法 | |
US20220282284A1 (en) | Crispr genome editing with cell surface display to produce homozygously edited eukaryotic cells | |
NZ721985B2 (en) | Methods and compositions for the targeted modification of a genome |