TW202400252A - 用於安全基因組整合之新位點及其使用方法 - Google Patents
用於安全基因組整合之新位點及其使用方法 Download PDFInfo
- Publication number
- TW202400252A TW202400252A TW112116119A TW112116119A TW202400252A TW 202400252 A TW202400252 A TW 202400252A TW 112116119 A TW112116119 A TW 112116119A TW 112116119 A TW112116119 A TW 112116119A TW 202400252 A TW202400252 A TW 202400252A
- Authority
- TW
- Taiwan
- Prior art keywords
- gene
- intergenic region
- seq
- cells
- nucleotide sequence
- Prior art date
Links
- 230000010354 integration Effects 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 37
- 108700019146 Transgenes Proteins 0.000 claims abstract description 47
- 239000013598 vector Substances 0.000 claims abstract description 29
- 230000002459 sustained effect Effects 0.000 claims abstract description 10
- 210000004027 cell Anatomy 0.000 claims description 255
- 108091029795 Intergenic region Proteins 0.000 claims description 240
- 108090000623 proteins and genes Proteins 0.000 claims description 210
- 239000002773 nucleotide Substances 0.000 claims description 130
- 125000003729 nucleotide group Chemical group 0.000 claims description 130
- 108020005004 Guide RNA Proteins 0.000 claims description 57
- 210000000130 stem cell Anatomy 0.000 claims description 48
- 102000004169 proteins and genes Human genes 0.000 claims description 39
- 239000002243 precursor Substances 0.000 claims description 35
- 210000001778 pluripotent stem cell Anatomy 0.000 claims description 32
- 108091033409 CRISPR Proteins 0.000 claims description 31
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 29
- 230000004069 differentiation Effects 0.000 claims description 26
- 101150061567 AKR1A1 gene Proteins 0.000 claims description 24
- 101150109238 NDUFS5 gene Proteins 0.000 claims description 24
- 101710163270 Nuclease Proteins 0.000 claims description 24
- 108020004414 DNA Proteins 0.000 claims description 22
- 101000928511 Homo sapiens Akirin-1 Proteins 0.000 claims description 22
- 101001021925 Homo sapiens Fascin Proteins 0.000 claims description 21
- 101150071562 RAB13 gene Proteins 0.000 claims description 21
- 230000009261 transgenic effect Effects 0.000 claims description 21
- 108010042407 Endonucleases Proteins 0.000 claims description 20
- 102000004533 Endonucleases Human genes 0.000 claims description 20
- 210000004962 mammalian cell Anatomy 0.000 claims description 19
- 101150074028 RPL34 gene Proteins 0.000 claims description 17
- 101150006181 OSTC gene Proteins 0.000 claims description 16
- 101150076311 Prdx1 gene Proteins 0.000 claims description 14
- 101150087690 ACTB gene Proteins 0.000 claims description 13
- 102100036457 Akirin-1 Human genes 0.000 claims description 12
- 230000001939 inductive effect Effects 0.000 claims description 12
- 210000002569 neuron Anatomy 0.000 claims description 12
- 101150108703 CBX3 gene Proteins 0.000 claims description 11
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 11
- 101150041150 HNRNPA2B1 gene Proteins 0.000 claims description 11
- 101100401746 Homo sapiens MLF2 gene Proteins 0.000 claims description 11
- 101000578920 Homo sapiens Microtubule-actin cross-linking factor 1, isoforms 1/2/3/5 Proteins 0.000 claims description 11
- 101000983170 Homo sapiens Proliferation-associated protein 2G4 Proteins 0.000 claims description 11
- 101000700734 Homo sapiens Serine/arginine-rich splicing factor 9 Proteins 0.000 claims description 11
- 101150011423 MLF2 gene Proteins 0.000 claims description 11
- 101150054880 NASP gene Proteins 0.000 claims description 11
- 101150061650 Ptges3 gene Proteins 0.000 claims description 11
- 101150111584 RHOA gene Proteins 0.000 claims description 11
- 101150117421 RPS27 gene Proteins 0.000 claims description 11
- 101150024198 rpl41 gene Proteins 0.000 claims description 11
- -1 Cpf1 Proteins 0.000 claims description 10
- 102000053602 DNA Human genes 0.000 claims description 10
- 101150033186 Dynll1 gene Proteins 0.000 claims description 10
- 101150115464 GPX1 gene Proteins 0.000 claims description 10
- 101100079046 Homo sapiens MYL6B gene Proteins 0.000 claims description 10
- 101000983294 Homo sapiens Oligosaccharyltransferase complex subunit OSTC Proteins 0.000 claims description 10
- 101150021709 Jtb gene Proteins 0.000 claims description 10
- 101150064183 MYL6 gene Proteins 0.000 claims description 10
- 101150118551 MYL6B gene Proteins 0.000 claims description 10
- 101150018687 NACA gene Proteins 0.000 claims description 10
- 102100026241 Oligosaccharyltransferase complex subunit OSTC Human genes 0.000 claims description 10
- 101150105595 PTMS gene Proteins 0.000 claims description 10
- 101150067024 RBM39 gene Proteins 0.000 claims description 10
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 10
- 230000001419 dependent effect Effects 0.000 claims description 10
- 101001098029 Homo sapiens 40S ribosomal protein S2 Proteins 0.000 claims description 9
- 101001111265 Homo sapiens NADH dehydrogenase [ubiquinone] 1 beta subcomplex subunit 10 Proteins 0.000 claims description 9
- 102100024021 NADH dehydrogenase [ubiquinone] 1 beta subcomplex subunit 10 Human genes 0.000 claims description 9
- 210000004413 cardiac myocyte Anatomy 0.000 claims description 9
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 8
- 230000000747 cardiac effect Effects 0.000 claims description 8
- 210000005260 human cell Anatomy 0.000 claims description 8
- 210000002540 macrophage Anatomy 0.000 claims description 8
- 210000000274 microglia Anatomy 0.000 claims description 8
- 230000001225 therapeutic effect Effects 0.000 claims description 8
- 210000002363 skeletal muscle cell Anatomy 0.000 claims description 7
- 210000000329 smooth muscle myocyte Anatomy 0.000 claims description 7
- 238000013518 transcription Methods 0.000 claims description 7
- 230000035897 transcription Effects 0.000 claims description 7
- 230000002503 metabolic effect Effects 0.000 claims description 6
- 239000013607 AAV vector Substances 0.000 claims description 5
- 210000002237 B-cell of pancreatic islet Anatomy 0.000 claims description 5
- 210000004443 dendritic cell Anatomy 0.000 claims description 5
- 210000003958 hematopoietic stem cell Anatomy 0.000 claims description 5
- 230000002861 ventricular Effects 0.000 claims description 5
- 239000013603 viral vector Substances 0.000 claims description 5
- 101000952182 Homo sapiens Max-like protein X Proteins 0.000 claims description 4
- 102100037423 Max-like protein X Human genes 0.000 claims description 4
- 210000001789 adipocyte Anatomy 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 101150046383 gene 5 gene Proteins 0.000 claims description 4
- 230000006801 homologous recombination Effects 0.000 claims description 4
- 238000002744 homologous recombination Methods 0.000 claims description 4
- 210000001616 monocyte Anatomy 0.000 claims description 4
- 210000002161 motor neuron Anatomy 0.000 claims description 4
- 210000000608 photoreceptor cell Anatomy 0.000 claims description 4
- 210000000844 retinal pigment epithelial cell Anatomy 0.000 claims description 4
- 230000001177 retroviral effect Effects 0.000 claims description 4
- 101150018129 CSF2 gene Proteins 0.000 claims description 3
- 101150069031 CSN2 gene Proteins 0.000 claims description 3
- 101150074775 Csf1 gene Proteins 0.000 claims description 3
- 101001082207 Homo sapiens Parathymosin Proteins 0.000 claims description 3
- 101000664703 Homo sapiens Transcription factor SOX-10 Proteins 0.000 claims description 3
- 208000026350 Inborn Genetic disease Diseases 0.000 claims description 3
- 102000015696 Interleukins Human genes 0.000 claims description 3
- 108010063738 Interleukins Proteins 0.000 claims description 3
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 claims description 3
- 101100053793 Mus musculus Zbtb7b gene Proteins 0.000 claims description 3
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 claims description 3
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 claims description 3
- 102100038808 Transcription factor SOX-10 Human genes 0.000 claims description 3
- 210000000748 cardiovascular system Anatomy 0.000 claims description 3
- 101150055766 cat gene Proteins 0.000 claims description 3
- 210000003169 central nervous system Anatomy 0.000 claims description 3
- 101150055601 cops2 gene Proteins 0.000 claims description 3
- 208000016361 genetic disease Diseases 0.000 claims description 3
- 210000000987 immune system Anatomy 0.000 claims description 3
- 210000000663 muscle cell Anatomy 0.000 claims description 3
- 210000000822 natural killer cell Anatomy 0.000 claims description 3
- 108091008695 photoreceptors Proteins 0.000 claims description 3
- 101150060482 rps2 gene Proteins 0.000 claims description 3
- 210000001044 sensory neuron Anatomy 0.000 claims description 3
- UJCHIZDEQZMODR-BYPYZUCNSA-N (2r)-2-acetamido-3-sulfanylpropanamide Chemical compound CC(=O)N[C@@H](CS)C(N)=O UJCHIZDEQZMODR-BYPYZUCNSA-N 0.000 claims description 2
- LTPSRQRIPCVMKQ-UHFFFAOYSA-N 2-amino-5-methylbenzenesulfonic acid Chemical compound CC1=CC=C(N)C(S(O)(=O)=O)=C1 LTPSRQRIPCVMKQ-UHFFFAOYSA-N 0.000 claims description 2
- 108010083359 Antigen Receptors Proteins 0.000 claims description 2
- 102000006306 Antigen Receptors Human genes 0.000 claims description 2
- 241001669680 Dormitator maculatus Species 0.000 claims description 2
- 101000588247 Homo sapiens Nascent polypeptide-associated complex subunit alpha Proteins 0.000 claims description 2
- 101000981973 Homo sapiens Nascent polypeptide-associated complex subunit alpha, muscle-specific form Proteins 0.000 claims description 2
- 101150019607 NDUFB10 gene Proteins 0.000 claims description 2
- 102100026779 Nascent polypeptide-associated complex subunit alpha, muscle-specific form Human genes 0.000 claims description 2
- 102100027370 Parathymosin Human genes 0.000 claims description 2
- 230000002950 deficient Effects 0.000 claims description 2
- 229940047122 interleukins Drugs 0.000 claims description 2
- 238000010459 TALEN Methods 0.000 claims 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims 1
- 210000005229 liver cell Anatomy 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000014509 gene expression Effects 0.000 abstract description 65
- 102000039446 nucleic acids Human genes 0.000 abstract description 8
- 108020004707 nucleic acids Proteins 0.000 abstract description 8
- 150000007523 nucleic acids Chemical class 0.000 abstract description 8
- 230000010473 stable expression Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 78
- 230000008685 targeting Effects 0.000 description 58
- 206010067482 No adverse event Diseases 0.000 description 34
- 230000002900 effect on cell Effects 0.000 description 33
- 101001124867 Homo sapiens Peroxiredoxin-1 Proteins 0.000 description 24
- 102100029139 Peroxiredoxin-1 Human genes 0.000 description 24
- 102100026448 Aldo-keto reductase family 1 member A1 Human genes 0.000 description 23
- 101000718007 Homo sapiens Aldo-keto reductase family 1 member A1 Proteins 0.000 description 23
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 20
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 20
- 230000033228 biological regulation Effects 0.000 description 19
- 230000001973 epigenetic effect Effects 0.000 description 19
- 230000006698 induction Effects 0.000 description 17
- 238000000684 flow cytometry Methods 0.000 description 16
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 14
- 102000004389 Ribonucleoproteins Human genes 0.000 description 13
- 108010081734 Ribonucleoproteins Proteins 0.000 description 13
- 210000005064 dopaminergic neuron Anatomy 0.000 description 12
- 210000003643 myeloid progenitor cell Anatomy 0.000 description 12
- 230000001105 regulatory effect Effects 0.000 description 12
- 102100040637 60S ribosomal protein L34 Human genes 0.000 description 11
- 101000672659 Homo sapiens 60S ribosomal protein L34 Proteins 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 206010020751 Hypersensitivity Diseases 0.000 description 10
- 210000001259 mesencephalon Anatomy 0.000 description 10
- 238000012174 single-cell RNA sequencing Methods 0.000 description 10
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 9
- 101000601517 Homo sapiens NADH dehydrogenase [ubiquinone] iron-sulfur protein 5 Proteins 0.000 description 9
- 102100037701 NADH dehydrogenase [ubiquinone] iron-sulfur protein 5 Human genes 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 238000010362 genome editing Methods 0.000 description 9
- 239000001963 growth medium Substances 0.000 description 9
- 210000002064 heart cell Anatomy 0.000 description 9
- 230000003252 repetitive effect Effects 0.000 description 9
- 108700005081 Overlapping Genes Proteins 0.000 description 8
- 108091023040 Transcription factor Proteins 0.000 description 8
- 102000040945 Transcription factor Human genes 0.000 description 8
- 210000001185 bone marrow Anatomy 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- 102100036089 Fascin Human genes 0.000 description 7
- 230000001464 adherent effect Effects 0.000 description 7
- 238000002659 cell therapy Methods 0.000 description 7
- 229960003638 dopamine Drugs 0.000 description 7
- 239000003623 enhancer Substances 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 108091029523 CpG island Proteins 0.000 description 6
- 210000001671 embryonic stem cell Anatomy 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 5
- 108700004991 Cas12a Proteins 0.000 description 5
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 5
- 108010077544 Chromatin Proteins 0.000 description 5
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 5
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 210000003483 chromatin Anatomy 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 4
- 108010053770 Deoxyribonucleases Proteins 0.000 description 4
- 102000016911 Deoxyribonucleases Human genes 0.000 description 4
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 4
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 4
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 4
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 4
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 4
- 239000004098 Tetracycline Substances 0.000 description 4
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 4
- 101150059443 cas12a gene Proteins 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 210000003981 ectoderm Anatomy 0.000 description 4
- 210000001900 endoderm Anatomy 0.000 description 4
- 238000002073 fluorescence micrograph Methods 0.000 description 4
- 230000003394 haemopoietic effect Effects 0.000 description 4
- 210000003494 hepatocyte Anatomy 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 210000004072 lung Anatomy 0.000 description 4
- 230000001537 neural effect Effects 0.000 description 4
- 210000003491 skin Anatomy 0.000 description 4
- 229960002180 tetracycline Drugs 0.000 description 4
- 235000019364 tetracycline Nutrition 0.000 description 4
- 229930101283 tetracycline Natural products 0.000 description 4
- 150000003522 tetracyclines Chemical class 0.000 description 4
- 108090000835 CX3C Chemokine Receptor 1 Proteins 0.000 description 3
- 102100039196 CX3C chemokine receptor 1 Human genes 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 108700039887 Essential Genes Proteins 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- 241001112693 Lachnospiraceae Species 0.000 description 3
- 108700020796 Oncogene Proteins 0.000 description 3
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 210000003743 erythrocyte Anatomy 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000000799 fluorescence microscopy Methods 0.000 description 3
- 210000002865 immune cell Anatomy 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000010859 live-cell imaging Methods 0.000 description 3
- 210000003716 mesoderm Anatomy 0.000 description 3
- 230000002025 microglial effect Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 210000004694 pigment cell Anatomy 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 210000003289 regulatory T cell Anatomy 0.000 description 3
- 230000008672 reprogramming Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 231100000935 short-term exposure limit Toxicity 0.000 description 3
- 210000001685 thyroid gland Anatomy 0.000 description 3
- 102100022289 60S ribosomal protein L13a Human genes 0.000 description 2
- 102100024406 60S ribosomal protein L15 Human genes 0.000 description 2
- 102100040540 60S ribosomal protein L3 Human genes 0.000 description 2
- 102100035841 60S ribosomal protein L7 Human genes 0.000 description 2
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 2
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 2
- 102100039236 Histone H3.3 Human genes 0.000 description 2
- 102000006947 Histones Human genes 0.000 description 2
- 101000681240 Homo sapiens 60S ribosomal protein L13a Proteins 0.000 description 2
- 101001117935 Homo sapiens 60S ribosomal protein L15 Proteins 0.000 description 2
- 101000673985 Homo sapiens 60S ribosomal protein L3 Proteins 0.000 description 2
- 101000853617 Homo sapiens 60S ribosomal protein L7 Proteins 0.000 description 2
- 101001013159 Homo sapiens Myeloid leukemia factor 2 Proteins 0.000 description 2
- 101001128460 Homo sapiens Myosin light polypeptide 6 Proteins 0.000 description 2
- 101000984042 Homo sapiens Protein lin-28 homolog A Proteins 0.000 description 2
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 2
- 101000716102 Homo sapiens T-cell surface glycoprotein CD4 Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 102100029687 Myeloid leukemia factor 2 Human genes 0.000 description 2
- 102100035423 POU domain, class 5, transcription factor 1 Human genes 0.000 description 2
- 102100025460 Protein lin-28 homolog A Human genes 0.000 description 2
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 102000002278 Ribosomal Proteins Human genes 0.000 description 2
- 108010000605 Ribosomal Proteins Proteins 0.000 description 2
- 101100495925 Schizosaccharomyces pombe (strain 972 / ATCC 24843) chr3 gene Proteins 0.000 description 2
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 description 2
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 2
- 238000004873 anchoring Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 210000001130 astrocyte Anatomy 0.000 description 2
- 230000001746 atrial effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000003915 cell function Effects 0.000 description 2
- 239000002771 cell marker Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 210000002889 endothelial cell Anatomy 0.000 description 2
- 210000001842 enterocyte Anatomy 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000001506 immunosuppresive effect Effects 0.000 description 2
- 210000004692 intercellular junction Anatomy 0.000 description 2
- 230000000968 intestinal effect Effects 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 210000000066 myeloid cell Anatomy 0.000 description 2
- 210000000107 myocyte Anatomy 0.000 description 2
- 210000001982 neural crest cell Anatomy 0.000 description 2
- 210000005157 neural retina Anatomy 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 210000003583 retinal pigment epithelium Anatomy 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000009258 tissue cross reactivity Effects 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 102100026726 40S ribosomal protein S11 Human genes 0.000 description 1
- 102100023912 40S ribosomal protein S12 Human genes 0.000 description 1
- 102100026357 40S ribosomal protein S13 Human genes 0.000 description 1
- 102100023216 40S ribosomal protein S15 Human genes 0.000 description 1
- 102100024113 40S ribosomal protein S15a Human genes 0.000 description 1
- 102100031571 40S ribosomal protein S16 Human genes 0.000 description 1
- 102100039980 40S ribosomal protein S18 Human genes 0.000 description 1
- 102100033051 40S ribosomal protein S19 Human genes 0.000 description 1
- 102100037563 40S ribosomal protein S2 Human genes 0.000 description 1
- 102100023415 40S ribosomal protein S20 Human genes 0.000 description 1
- 102100037513 40S ribosomal protein S23 Human genes 0.000 description 1
- 102100033449 40S ribosomal protein S24 Human genes 0.000 description 1
- 102100022721 40S ribosomal protein S25 Human genes 0.000 description 1
- 102100022681 40S ribosomal protein S27 Human genes 0.000 description 1
- 102100023679 40S ribosomal protein S28 Human genes 0.000 description 1
- 102100033409 40S ribosomal protein S3 Human genes 0.000 description 1
- 102100022600 40S ribosomal protein S3a Human genes 0.000 description 1
- 102100034088 40S ribosomal protein S4, X isoform Human genes 0.000 description 1
- 102100023779 40S ribosomal protein S5 Human genes 0.000 description 1
- 102100033714 40S ribosomal protein S6 Human genes 0.000 description 1
- 102100024088 40S ribosomal protein S7 Human genes 0.000 description 1
- 102100037663 40S ribosomal protein S8 Human genes 0.000 description 1
- 102100033731 40S ribosomal protein S9 Human genes 0.000 description 1
- 102100027271 40S ribosomal protein SA Human genes 0.000 description 1
- 102100033416 60S acidic ribosomal protein P1 Human genes 0.000 description 1
- 102100026112 60S acidic ribosomal protein P2 Human genes 0.000 description 1
- 102100035916 60S ribosomal protein L11 Human genes 0.000 description 1
- 102100025643 60S ribosomal protein L12 Human genes 0.000 description 1
- 102100024442 60S ribosomal protein L13 Human genes 0.000 description 1
- 102100031854 60S ribosomal protein L14 Human genes 0.000 description 1
- 102100032411 60S ribosomal protein L18 Human genes 0.000 description 1
- 102100021690 60S ribosomal protein L18a Human genes 0.000 description 1
- 102100021206 60S ribosomal protein L19 Human genes 0.000 description 1
- 102100037965 60S ribosomal protein L21 Human genes 0.000 description 1
- 102100037685 60S ribosomal protein L22 Human genes 0.000 description 1
- 102100021308 60S ribosomal protein L23 Human genes 0.000 description 1
- 102100023247 60S ribosomal protein L23a Human genes 0.000 description 1
- 102100035322 60S ribosomal protein L24 Human genes 0.000 description 1
- 102100028348 60S ribosomal protein L26 Human genes 0.000 description 1
- 102100021927 60S ribosomal protein L27a Human genes 0.000 description 1
- 102100021660 60S ribosomal protein L28 Human genes 0.000 description 1
- 102100021671 60S ribosomal protein L29 Human genes 0.000 description 1
- 102100038237 60S ribosomal protein L30 Human genes 0.000 description 1
- 102100040768 60S ribosomal protein L32 Human genes 0.000 description 1
- 102100022276 60S ribosomal protein L35a Human genes 0.000 description 1
- 102100022048 60S ribosomal protein L36 Human genes 0.000 description 1
- 102100040131 60S ribosomal protein L37 Human genes 0.000 description 1
- 102100036126 60S ribosomal protein L37a Human genes 0.000 description 1
- 102100035988 60S ribosomal protein L39 Human genes 0.000 description 1
- 102100026926 60S ribosomal protein L4 Human genes 0.000 description 1
- 102100040623 60S ribosomal protein L41 Human genes 0.000 description 1
- 102100026750 60S ribosomal protein L5 Human genes 0.000 description 1
- 102100040924 60S ribosomal protein L6 Human genes 0.000 description 1
- 102100036630 60S ribosomal protein L7a Human genes 0.000 description 1
- 102100035931 60S ribosomal protein L8 Human genes 0.000 description 1
- 102100041029 60S ribosomal protein L9 Human genes 0.000 description 1
- 241000093740 Acidaminococcus sp. Species 0.000 description 1
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 102100030374 Actin, cytoplasmic 2 Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 241001063273 Alicyclobacillus acidiphilus Species 0.000 description 1
- 241000825009 Bacillus hisashii Species 0.000 description 1
- 241000770536 Bacillus thermophilus Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 1
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 description 1
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102100030878 Cytochrome c oxidase subunit 1 Human genes 0.000 description 1
- 102100027456 Cytochrome c oxidase subunit 2 Human genes 0.000 description 1
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 1
- 102000043859 Dynamin Human genes 0.000 description 1
- 108700021058 Dynamin Proteins 0.000 description 1
- 101150115146 EEF2 gene Proteins 0.000 description 1
- 101150073167 Eif1 gene Proteins 0.000 description 1
- 102000016942 Elastin Human genes 0.000 description 1
- 108010014258 Elastin Proteins 0.000 description 1
- 102100030801 Elongation factor 1-alpha 1 Human genes 0.000 description 1
- 102100031334 Elongation factor 2 Human genes 0.000 description 1
- 102100029775 Eukaryotic translation initiation factor 1 Human genes 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 102100034003 FAU ubiquitin-like and ribosomal protein S30 Human genes 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102100020760 Ferritin heavy chain Human genes 0.000 description 1
- 102100021062 Ferritin light chain Human genes 0.000 description 1
- 102000009123 Fibrin Human genes 0.000 description 1
- 108010073385 Fibrin Proteins 0.000 description 1
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 1
- 102100027581 Forkhead box protein P3 Human genes 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 241000588088 Francisella tularensis subsp. novicida U112 Species 0.000 description 1
- 108010061711 Gliadin Proteins 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- 102100033039 Glutathione peroxidase 1 Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108091059596 H3F3A Proteins 0.000 description 1
- 102100032510 Heat shock protein HSP 90-beta Human genes 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 102100035616 Heterogeneous nuclear ribonucleoproteins A2/B1 Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000639726 Homo sapiens 28S ribosomal protein S12, mitochondrial Proteins 0.000 description 1
- 101000691550 Homo sapiens 39S ribosomal protein L13, mitochondrial Proteins 0.000 description 1
- 101001119215 Homo sapiens 40S ribosomal protein S11 Proteins 0.000 description 1
- 101000682687 Homo sapiens 40S ribosomal protein S12 Proteins 0.000 description 1
- 101000718313 Homo sapiens 40S ribosomal protein S13 Proteins 0.000 description 1
- 101000623543 Homo sapiens 40S ribosomal protein S15 Proteins 0.000 description 1
- 101001118566 Homo sapiens 40S ribosomal protein S15a Proteins 0.000 description 1
- 101000706746 Homo sapiens 40S ribosomal protein S16 Proteins 0.000 description 1
- 101000811259 Homo sapiens 40S ribosomal protein S18 Proteins 0.000 description 1
- 101000733040 Homo sapiens 40S ribosomal protein S19 Proteins 0.000 description 1
- 101001114932 Homo sapiens 40S ribosomal protein S20 Proteins 0.000 description 1
- 101001097953 Homo sapiens 40S ribosomal protein S23 Proteins 0.000 description 1
- 101000656669 Homo sapiens 40S ribosomal protein S24 Proteins 0.000 description 1
- 101000678929 Homo sapiens 40S ribosomal protein S25 Proteins 0.000 description 1
- 101000678466 Homo sapiens 40S ribosomal protein S27 Proteins 0.000 description 1
- 101000623076 Homo sapiens 40S ribosomal protein S28 Proteins 0.000 description 1
- 101000656561 Homo sapiens 40S ribosomal protein S3 Proteins 0.000 description 1
- 101000679249 Homo sapiens 40S ribosomal protein S3a Proteins 0.000 description 1
- 101000732165 Homo sapiens 40S ribosomal protein S4, X isoform Proteins 0.000 description 1
- 101000622644 Homo sapiens 40S ribosomal protein S5 Proteins 0.000 description 1
- 101000656896 Homo sapiens 40S ribosomal protein S6 Proteins 0.000 description 1
- 101000690200 Homo sapiens 40S ribosomal protein S7 Proteins 0.000 description 1
- 101001097439 Homo sapiens 40S ribosomal protein S8 Proteins 0.000 description 1
- 101000657066 Homo sapiens 40S ribosomal protein S9 Proteins 0.000 description 1
- 101000694288 Homo sapiens 40S ribosomal protein SA Proteins 0.000 description 1
- 101000712357 Homo sapiens 60S acidic ribosomal protein P1 Proteins 0.000 description 1
- 101000691878 Homo sapiens 60S acidic ribosomal protein P2 Proteins 0.000 description 1
- 101001108634 Homo sapiens 60S ribosomal protein L10 Proteins 0.000 description 1
- 101001073740 Homo sapiens 60S ribosomal protein L11 Proteins 0.000 description 1
- 101000575173 Homo sapiens 60S ribosomal protein L12 Proteins 0.000 description 1
- 101001118201 Homo sapiens 60S ribosomal protein L13 Proteins 0.000 description 1
- 101000704267 Homo sapiens 60S ribosomal protein L14 Proteins 0.000 description 1
- 101001087985 Homo sapiens 60S ribosomal protein L18 Proteins 0.000 description 1
- 101000752293 Homo sapiens 60S ribosomal protein L18a Proteins 0.000 description 1
- 101001105789 Homo sapiens 60S ribosomal protein L19 Proteins 0.000 description 1
- 101000661708 Homo sapiens 60S ribosomal protein L21 Proteins 0.000 description 1
- 101001097555 Homo sapiens 60S ribosomal protein L22 Proteins 0.000 description 1
- 101000675833 Homo sapiens 60S ribosomal protein L23 Proteins 0.000 description 1
- 101001115494 Homo sapiens 60S ribosomal protein L23a Proteins 0.000 description 1
- 101000660926 Homo sapiens 60S ribosomal protein L24 Proteins 0.000 description 1
- 101001080179 Homo sapiens 60S ribosomal protein L26 Proteins 0.000 description 1
- 101000753696 Homo sapiens 60S ribosomal protein L27a Proteins 0.000 description 1
- 101000676271 Homo sapiens 60S ribosomal protein L28 Proteins 0.000 description 1
- 101000676246 Homo sapiens 60S ribosomal protein L29 Proteins 0.000 description 1
- 101001101319 Homo sapiens 60S ribosomal protein L30 Proteins 0.000 description 1
- 101000672453 Homo sapiens 60S ribosomal protein L32 Proteins 0.000 description 1
- 101001110988 Homo sapiens 60S ribosomal protein L35a Proteins 0.000 description 1
- 101001110263 Homo sapiens 60S ribosomal protein L36 Proteins 0.000 description 1
- 101000671735 Homo sapiens 60S ribosomal protein L37 Proteins 0.000 description 1
- 101001092424 Homo sapiens 60S ribosomal protein L37a Proteins 0.000 description 1
- 101000716179 Homo sapiens 60S ribosomal protein L39 Proteins 0.000 description 1
- 101000691203 Homo sapiens 60S ribosomal protein L4 Proteins 0.000 description 1
- 101000674326 Homo sapiens 60S ribosomal protein L41 Proteins 0.000 description 1
- 101000691083 Homo sapiens 60S ribosomal protein L5 Proteins 0.000 description 1
- 101000673524 Homo sapiens 60S ribosomal protein L6 Proteins 0.000 description 1
- 101000853243 Homo sapiens 60S ribosomal protein L7a Proteins 0.000 description 1
- 101000853659 Homo sapiens 60S ribosomal protein L8 Proteins 0.000 description 1
- 101000672886 Homo sapiens 60S ribosomal protein L9 Proteins 0.000 description 1
- 101000773237 Homo sapiens Actin, cytoplasmic 2 Proteins 0.000 description 1
- 101000797578 Homo sapiens Chromobox protein homolog 3 Proteins 0.000 description 1
- 101000919849 Homo sapiens Cytochrome c oxidase subunit 1 Proteins 0.000 description 1
- 101000725401 Homo sapiens Cytochrome c oxidase subunit 2 Proteins 0.000 description 1
- 101000966403 Homo sapiens Dynein light chain 1, cytoplasmic Proteins 0.000 description 1
- 101000920078 Homo sapiens Elongation factor 1-alpha 1 Proteins 0.000 description 1
- 101000732045 Homo sapiens FAU ubiquitin-like and ribosomal protein S30 Proteins 0.000 description 1
- 101001002987 Homo sapiens Ferritin heavy chain Proteins 0.000 description 1
- 101000818390 Homo sapiens Ferritin light chain Proteins 0.000 description 1
- 101000861452 Homo sapiens Forkhead box protein P3 Proteins 0.000 description 1
- 101001014936 Homo sapiens Glutathione peroxidase 1 Proteins 0.000 description 1
- 101001016856 Homo sapiens Heat shock protein HSP 90-beta Proteins 0.000 description 1
- 101000854026 Homo sapiens Heterogeneous nuclear ribonucleoproteins A2/B1 Proteins 0.000 description 1
- 101001035966 Homo sapiens Histone H3.3 Proteins 0.000 description 1
- 101001046686 Homo sapiens Integrin alpha-M Proteins 0.000 description 1
- 101001057504 Homo sapiens Interferon-stimulated gene 20 kDa protein Proteins 0.000 description 1
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 description 1
- 101001139134 Homo sapiens Krueppel-like factor 4 Proteins 0.000 description 1
- 101000934338 Homo sapiens Myeloid cell surface antigen CD33 Proteins 0.000 description 1
- 101001128464 Homo sapiens Myosin light chain 6B Proteins 0.000 description 1
- 101000604411 Homo sapiens NADH-ubiquinone oxidoreductase chain 1 Proteins 0.000 description 1
- 101000632748 Homo sapiens NADH-ubiquinone oxidoreductase chain 2 Proteins 0.000 description 1
- 101001109052 Homo sapiens NADH-ubiquinone oxidoreductase chain 4 Proteins 0.000 description 1
- 101001109719 Homo sapiens Nucleophosmin Proteins 0.000 description 1
- 101001094700 Homo sapiens POU domain, class 5, transcription factor 1 Proteins 0.000 description 1
- 101000711369 Homo sapiens Probable ribosome biogenesis protein RLP24 Proteins 0.000 description 1
- 101001028689 Homo sapiens Protein JTB Proteins 0.000 description 1
- 101000738322 Homo sapiens Prothymosin alpha Proteins 0.000 description 1
- 101001076715 Homo sapiens RNA-binding protein 39 Proteins 0.000 description 1
- 101000620529 Homo sapiens Ras-related protein Rab-13 Proteins 0.000 description 1
- 101000650652 Homo sapiens Small EDRK-rich factor 2 Proteins 0.000 description 1
- 101000946843 Homo sapiens T-cell surface glycoprotein CD8 alpha chain Proteins 0.000 description 1
- 101000658138 Homo sapiens Thymosin beta-10 Proteins 0.000 description 1
- 101000687905 Homo sapiens Transcription factor SOX-2 Proteins 0.000 description 1
- 101000653679 Homo sapiens Translationally-controlled tumor protein Proteins 0.000 description 1
- 101000863873 Homo sapiens Tyrosine-protein phosphatase non-receptor type substrate 1 Proteins 0.000 description 1
- 101001115218 Homo sapiens Ubiquitin-40S ribosomal protein S27a Proteins 0.000 description 1
- 101000840051 Homo sapiens Ubiquitin-60S ribosomal protein L40 Proteins 0.000 description 1
- 102100022338 Integrin alpha-M Human genes 0.000 description 1
- 102100027268 Interferon-stimulated gene 20 kDa protein Human genes 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- 102100020677 Krueppel-like factor 4 Human genes 0.000 description 1
- 108091008143 L ribosomal proteins Proteins 0.000 description 1
- 241000689670 Lachnospiraceae bacterium ND2006 Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 102000006404 Mitochondrial Proteins Human genes 0.000 description 1
- 108010058682 Mitochondrial Proteins Proteins 0.000 description 1
- 241001193016 Moraxella bovoculi 237 Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 102100025243 Myeloid cell surface antigen CD33 Human genes 0.000 description 1
- 102100031828 Myosin light chain 6B Human genes 0.000 description 1
- 102100031829 Myosin light polypeptide 6 Human genes 0.000 description 1
- ZBZXYUYUUDZCNB-UHFFFAOYSA-N N-cyclohexa-1,3-dien-1-yl-N-phenyl-4-[4-(N-[4-[4-(N-[4-[4-(N-phenylanilino)phenyl]phenyl]anilino)phenyl]phenyl]anilino)phenyl]aniline Chemical compound C1=CCCC(N(C=2C=CC=CC=2)C=2C=CC(=CC=2)C=2C=CC(=CC=2)N(C=2C=CC=CC=2)C=2C=CC(=CC=2)C=2C=CC(=CC=2)N(C=2C=CC=CC=2)C=2C=CC(=CC=2)C=2C=CC(=CC=2)N(C=2C=CC=CC=2)C=2C=CC=CC=2)=C1 ZBZXYUYUUDZCNB-UHFFFAOYSA-N 0.000 description 1
- 108010086428 NADH Dehydrogenase Proteins 0.000 description 1
- 102000006746 NADH Dehydrogenase Human genes 0.000 description 1
- 102100038625 NADH-ubiquinone oxidoreductase chain 1 Human genes 0.000 description 1
- 102100028488 NADH-ubiquinone oxidoreductase chain 2 Human genes 0.000 description 1
- 102100021506 NADH-ubiquinone oxidoreductase chain 4 Human genes 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101710149564 Nuclear autoantigenic sperm protein Proteins 0.000 description 1
- 102100022678 Nucleophosmin Human genes 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 239000004100 Oxytetracycline Substances 0.000 description 1
- 101710126211 POU domain, class 5, transcription factor 1 Proteins 0.000 description 1
- 108010089430 Phosphoproteins Proteins 0.000 description 1
- 102000007982 Phosphoproteins Human genes 0.000 description 1
- 241001135219 Prevotella disiens Species 0.000 description 1
- 108010007568 Protamines Proteins 0.000 description 1
- 102000007327 Protamines Human genes 0.000 description 1
- 102100037171 Protein JTB Human genes 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102100037925 Prothymosin alpha Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102100025234 Receptor of activated protein C kinase 1 Human genes 0.000 description 1
- 108010044157 Receptors for Activated C Kinase Proteins 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 102100029288 Serine/arginine-rich splicing factor 9 Human genes 0.000 description 1
- 102100037082 Signal recognition particle 14 kDa protein Human genes 0.000 description 1
- 101710089523 Signal recognition particle 14 kDa protein Proteins 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 102100027692 Small EDRK-rich factor 2 Human genes 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 108091008874 T cell receptors Proteins 0.000 description 1
- 102100034922 T-cell surface glycoprotein CD8 alpha chain Human genes 0.000 description 1
- 102100034998 Thymosin beta-10 Human genes 0.000 description 1
- 102100024270 Transcription factor SOX-2 Human genes 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 102100029887 Translationally-controlled tumor protein Human genes 0.000 description 1
- OKKRPWIIYQTPQF-UHFFFAOYSA-N Trimethylolpropane trimethacrylate Chemical compound CC(=C)C(=O)OCC(CC)(COC(=O)C(C)=C)COC(=O)C(C)=C OKKRPWIIYQTPQF-UHFFFAOYSA-N 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108091000117 Tyrosine 3-Monooxygenase Proteins 0.000 description 1
- 102000048218 Tyrosine 3-monooxygenases Human genes 0.000 description 1
- 102100029948 Tyrosine-protein phosphatase non-receptor type substrate 1 Human genes 0.000 description 1
- 102100023341 Ubiquitin-40S ribosomal protein S27a Human genes 0.000 description 1
- 102100028462 Ubiquitin-60S ribosomal protein L40 Human genes 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 1
- 108091002437 YBX1 Proteins 0.000 description 1
- 102000033021 YBX1 Human genes 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000004703 blastocyst inner cell mass Anatomy 0.000 description 1
- 210000002798 bone marrow cell Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000011748 cell maturation Effects 0.000 description 1
- 210000003986 cell retinal photoreceptor Anatomy 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000032459 dedifferentiation Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 210000001787 dendrite Anatomy 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 229920002549 elastin Polymers 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000017188 evasion or tolerance of host immune response Effects 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 229950003499 fibrin Drugs 0.000 description 1
- 102000034240 fibrous proteins Human genes 0.000 description 1
- 108091005899 fibrous proteins Proteins 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000001654 germ layer Anatomy 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 210000005061 intracellular organelle Anatomy 0.000 description 1
- 230000004068 intracellular signaling Effects 0.000 description 1
- YWXYYJSYQOXTPL-SLPGGIOYSA-N isosorbide mononitrate Chemical compound [O-][N+](=O)O[C@@H]1CO[C@@H]2[C@@H](O)CO[C@@H]21 YWXYYJSYQOXTPL-SLPGGIOYSA-N 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 210000001069 large ribosome subunit Anatomy 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000003712 lysosome Anatomy 0.000 description 1
- 230000001868 lysosomic effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000004409 osteocyte Anatomy 0.000 description 1
- IWVCMVBTMGNXQD-PXOLEDIWSA-N oxytetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3[C@H](O)[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O IWVCMVBTMGNXQD-PXOLEDIWSA-N 0.000 description 1
- 229960000625 oxytetracycline Drugs 0.000 description 1
- 235000019366 oxytetracycline Nutrition 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 229940048914 protamine Drugs 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 210000001164 retinal progenitor cell Anatomy 0.000 description 1
- 108090000850 ribosomal protein S14 Proteins 0.000 description 1
- 102000004314 ribosomal protein S14 Human genes 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 210000001812 small ribosome subunit Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 238000010374 somatic cell nuclear transfer Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- IWVCMVBTMGNXQD-UHFFFAOYSA-N terramycin dehydrate Natural products C1=CC=C2C(O)(C)C3C(O)C4C(N(C)C)C(O)=C(C(N)=O)C(=O)C4(O)C(O)=C3C(=O)C2=C1O IWVCMVBTMGNXQD-UHFFFAOYSA-N 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 238000012250 transgenic expression Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0634—Cells from the blood or the immune system
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2506/00—Differentiation of animal cells from one lineage to another; Differentiation of pluripotent cells
- C12N2506/45—Differentiation of animal cells from one lineage to another; Differentiation of pluripotent cells from artificially induced pluripotent stem cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Hematology (AREA)
- Immunology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本發明係關於基因改造細胞,其自用於安全基因組整合及穩定表現之位點以持續表現量表現一或多個轉殖基因。本發明亦提供製造該等細胞之方法及可用於製造該等細胞之核酸載體。
Description
在所謂的「基因組安全港」位點處將轉殖基因安全性地整合至基因組中已經做了許多的努力。基因組中之安全港位點為其中可引入核酸(例如外源基因)而不妨礙相鄰基因之表現或調節且因此不妨礙細胞之正常功能的彼等位點。三個基因組位點-
AAVS1、
CCR5及
ROSA26-傳統上視為安全港位點且已用於大部分靶向轉殖基因整合中。
AAVS1為用於AAV基因組之罕見基因組整合的區域且已發現其允許穩固表現而不妨礙細胞功能。
CCR5係因為天然存在之CCR5-Δ32突變導致HIV抗性表現型而偶然鑑別出的;基因之可處置性使其成為理想整合位點。
ROSA26基因座最初經由慢病毒基因捕獲方法在小鼠胚胎幹細胞中鑑別出。
雖然此等基因組安全港位點允許在給定細胞環境下之穩固轉殖基因表現,但其可能不支援其他細胞譜系中或細胞狀態變化之後的如實轉殖基因表現。此係因為轉殖基因與宿主細胞基因組情形之間的互逆相互相用可影響轉殖基因之表現,導致轉殖基因表現之衰減或完全沉默(例如,經由DNA甲基化)。更嚴重地,基因組整合之此等位點亦可影響插入位點附近內源基因之表現,由此影響正常宿主細胞功能。
本發明至少部分地基於鑑別基因組中在不同細胞類型中及在不同細胞狀態(包括成熟期)下保持轉錄活性之基因間位點,使得整合於其中之相關外源核苷酸序列(例如編碼蛋白質或RNA之轉殖基因)隨著細胞經歷增殖及細胞狀態變化而保持表現及功能性。
因此,在一個態樣中,本發明提供基因改造細胞,例如哺乳動物(例如人類)細胞,其包含整合於細胞之基因組中之持續轉錄活性有效負載區(STAPLR)中的外源核苷酸序列,其中STAPLR選自由以下組成之群:
RPL34基因與
OSTC基因之間的基因間區域;
ACTB基因與
FSCN1基因之間的基因間區域;
AKIRIN1基因與
NDUFS5基因之間的基因間區域;
PRDX1基因與
AKR1A1基因之間的基因間區域;
PTGES3基因與
NACA基因之間的基因間區域;
MLF2基因與
PTMS基因之間的基因間區域;
RAB13基因與
RPS27基因之間的基因間區域;
JTB基因與
RAB13基因之間的基因間區域;
AKR1A1基因與
NASP基因之間的基因間區域;
NDUFS5基因與
MACF1基因之間的基因間區域;
SRSF9基因與
DYNLL1基因之間的基因間區域;
MYL6B基因與
MYL6基因之間的基因間區域;
GPX1基因與
RHOA基因之間的基因間區域;
HNRNPA2B1基因與
CBX3基因之間的基因間區域;
ROMO基因與
RBM39基因之間的基因間區域;
PA2G4基因與
RPL41基因之間的基因間區域;及
NDUFB10與
RPS2基因之間的基因間區域。
在一些實施例中,
RPL34基因與
OSTC基因之間的基因間區域包含與SEQ ID NO: 1至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 1充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
ACTB基因與
FSCN1基因之間的基因間區域包含與SEQ ID NO: 2至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 2充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
AKIRIN1基因與
NDUFS5基因之間的基因間區域包含與SEQ ID NO: 3至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 3充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
PRDX1基因與
AKR1A1基因之間的基因間區域包含與SEQ ID NO: 4至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 4充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
PTGES3基因與
NACA基因之間的基因間區域包含與SEQ ID NO: 5至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 5充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
MLF2基因與
PTMS基因之間的基因間區域包含與SEQ ID NO: 6至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 6充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
RAB13基因與
RPS27基因之間的基因間區域包含與SEQ ID NO: 7至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 7充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
JTB基因與
RAB13基因之間的基因間區域包含與SEQ ID NO: 8至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 8充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
AKR1A1基因與
NASP基因之間的基因間區域包含與SEQ ID NO: 9至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 9充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
NDUFS5基因與
MACF1基因之間的基因間區域包含與SEQ ID NO: 10至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 10充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
SRSF9基因與
DYNLL1基因之間的基因間區域包含與SEQ ID NO: 11至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 11充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
MYL6B基因與
MYL6基因之間的基因間區域包含與SEQ ID NO: 12至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 12充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
GPX1基因與
RHOA基因之間的基因間區域包含與SEQ ID NO: 13至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 13充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
HNRNPA2B1基因與
CBX3基因之間的基因間區域包含與SEQ ID NO: 14至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 14充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
ROMO基因與
RBM39基因之間的基因間區域包含與SEQ ID NO: 15至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 15充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
PA2G4基因與
RPL41基因之間的基因間區域包含與SEQ ID NO: 16至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 16充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
在一些實施例中,
NDUFB10基因與
RPS2基因之間的基因間區域包含與SEQ ID NO: 97至少95% (例如至少96%、至少97%、至少98%、至少99%或100%)一致之核苷酸序列或與SEQ ID NO: 97充分類似之核苷酸序列,如序列功能保持完整(例如對細胞無不良作用)所需要。
本文亦提供產生此等基因改造哺乳動物細胞之方法,以及用於將相關核苷酸序列引入本文中之新基因組整合位點中的DNA構築體。因此,在一個態樣中,本發明提供用於修飾哺乳動物細胞之方法,包含將相關核苷酸序列(亦即外源核苷酸序列)整合至本文中所描述之STAPLR中。在一些實施例中,整合步驟藉由使用以下進行:CRISPR/Cas系統;Cre/Lox系統;FLP-FRT系統;TALEN系統;ZFN系統;歸巢核酸內切酶(homing endonuclease);隨機整合;同源重組;轉位酶;或非核酸酶依賴性病毒載體,視情況選自反轉錄病毒載體、AAV載體及慢病毒載體。在其他實施例中,CRISPR/Cas系統包含導引RNA,且其中STAPLR為(i)
RPL34基因與
OSTC基因之間的基因間區域且gRNA選自SEQ ID NO: 25-32,(ii)
ACTB基因與
FSCN1基因之間的基因間區域且gRNA選自SEQ ID NO: 33-54,(iii)
AKIRIN1基因及
NDUFS5基因之間的基因間區域且gRNA選自SEQ ID NO: 55-70,或(iv)
PRDX1基因與
AKR1A1基因之間的基因間區域且gRNA選自SEQ ID NO: 71-92。
在一些實施例中,CRISPR/Cas系統包含第I型、第II型、第III型、第IV型、第V型之gRNA依賴性核酸酶或其變異體。在其他實施例中,CRISPR/Cas系統包含選自由以下組成之群之gRNA依賴性核酸酶:Cas9、Cpf1、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas12、Cas13、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、CasX、CasY、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、CasPhi、MAD7及Csf4。
在另一態樣中,本發明提供DNA分子,其包含由5'同源區(HR)及3' HR側接之相關核苷酸序列,其中5' HR及3' HR分別與本文中所描述之STAPLR中的第一基因組區(GR)及第二GR至少85% (例如至少90%、95%、96%、97%、98%或99%)同源。在一些實施例中,5' HR及3' HR中之各者獨立地為約至少50、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450、至少500、至少550、至少600、至少650、至少700、至少750、至少800、至少850、至少900、至少950、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、至少1800、至少1900或至少2000個鹼基對長。在一些實施例中,HR各自為200至2000 (例如300至2500、400至2000或500至1500)個鹼基對長。在其他實施例中,5'及3' HR分別與SEQ ID NO: 17及18、SEQ ID NO: 19及20、SEQ ID NO: 21及22、SEQ ID NO: 23及24、SEQ ID NO: 93及94或SEQ ID NO: 95及96至少90%同源。
在一些實施例中,外源核苷酸序列或相關核苷酸序列包含轉殖基因。在其他實施例中,轉殖基因包含編碼序列(例如用於蛋白質或RNA)及一或多個調節子元件(regulator element)。在一些實施例中,一或多個調節子元件包括引導編碼序列轉錄之持續型或可誘導型啟動子。在一些實施例中,轉殖基因編碼治療性蛋白質(例如,其缺乏或缺陷導致諸如遺傳性疾病之疾病的蛋白質、細胞介素或重組抗原受體);細胞標記物;或調節細胞之分化狀態或活性的蛋白質(例如,再程式化因子)。在一些實施例中,轉殖基因編碼SOX10、IL-10、IL-12、CD19t或ThPOK。
在本發明之一些實施例中,哺乳動物細胞為人類細胞。在一些實施例中,哺乳動物細胞(例如人類細胞)為多潛能幹細胞(PSC;例如誘導性PSC (iPSC)或ESC)。在一些實施例中,哺乳動物細胞(例如人類細胞)為a)免疫系統中之細胞(例如T細胞、自然殺手細胞、樹突細胞、巨噬細胞/單核球或其造血祖細胞或前驅細胞);b)心血管系統中之細胞(例如心室心肌細胞、結節細胞或其心肌祖細胞或前驅細胞);c)代謝系統中之細胞(例如肝細胞或胰臟β細胞或其祖細胞或前驅細胞);d)中樞神經系統中之細胞(例如感覺神經元、運動神經元、仲介神經元、微膠質細胞、寡樹突細胞或其祖細胞或前驅細胞);e)肌細胞(例如骨骼肌細胞或平滑肌細胞或其祖細胞或前驅細胞);f)脂肪細胞或其祖細胞或前驅細胞;或g)眼系統中之細胞(例如視網膜色素上皮細胞、感光受體細胞或其祖細胞或前驅細胞)。本發明之額外細胞類型描述於下文中。
本文亦提供包含本文中之基因工程化細胞及醫藥學上可接受之載劑的醫藥組合物,及包含如本文中所揭示之DNA分子的基因編輯系統及用於將DNA分子(例如核酸酶及gRNA)上之相關核苷酸序列併入至STAPLR中的必需基因編輯系統。
在另一態樣中,本發明提供用於鑑別哺乳動物細胞之基因組中之持續轉錄活性有效負載區(STAPLR)的方法,該方法包含:(i)對一組兩種或更多種哺乳動物細胞類型進行單細胞RNA定序分析,其中定序分析針對各細胞類型分配一個獨特轉錄組;(ii) 轉錄組中之組成基因(constituent gene)分配一個盛行率分數,其中盛行率分數代表含有至少一種基因轉錄本之哺乳動物細胞類型在哺乳動物細胞類型之組中的分率;(iii)鑑別哺乳動物細胞之基因組中組成基因之鄰近基因,其中鄰近基因不與組成基因重疊;(iv)確定非重疊基因對或包含步驟(iii)中所鑑別之三個或更多個基因之區域的鄰近分數,其中鄰近分數為基因對中或區域中之個別基因盛行率分數之結果;(v)對鄰近分數排序;及(vi)基於高排序選擇非重疊基因對或包含三個或更多個非重疊基因之區域,藉此鑑別所選基因對或區域之基因之間的基因間區域為STAPLR。在一些實施例中,該方法進一步包含(vii)選擇STAPLR中之可靶向基因間子區域;及(viii)在所選子區域處插入轉殖基因,其中持續轉殖基因或基因線路之轉錄。在一些實施例中,可靶向子區域包含:無已知啟動子或強化子區、最小數目之保守區、重複區、表觀遺傳標記及/或酶超敏區,及/或核酸酶為CRISPR核酸酶。在一些實施例中,其中基因間區域為至少30 (例如至少40、至少50、至少75或至少100)個鹼基對長,及/或不包含或包含最小數目之啟動子區、CpG島及H3K4Me1表觀遺傳標記、H3K4Me3表觀遺傳標記、H3K27Ac表觀遺傳標記、DNase I超敏區、保守區或重複區。
本發明之其他特徵、目標及優勢在以下具體實施方式中顯而易知。然而,應理解,具體實施方式雖然指示本發明之實施例及態樣,但仍僅藉助於說明而非限制的方式給出。對於熟習此項技術者而言,在本發明之範圍內的各種改變及修正將自具體實施方式變得顯而易知。
對相關申請案之交叉參考
本申請案主張2022年4月28日申請之美國臨時申請案第63/336,248號之優先權,其內容以全文引用之方式併入本文中。
序列表
本申請案含有以ASCII格式以電子方式提交且以全文引用之方式併入本文中之序列表。2023年4月27日創建之序列表的電子原稿命名為025450_TW017_SL.xml且大小為379,951位元組。
基因工程化細胞為細胞療法之重要工具。但因為細胞經歷增殖,或細胞狀態或活體內環境變化,工程化細胞中之人工基因線路通常隨時間推移而藉由轉殖基因沉默而被顛覆。因此,需要鑑別對於轉殖基因整合安全且亦提供在整個細胞類型、細胞狀態及活體內環境轉錄方面保持開放之染色質圖譜(chromatin landscape)的基因組區域。整合轉殖基因至此位點中將允許轉殖基因在細胞療法產品之壽命期間保持轉錄活性。
本文中提供適用於實現轉殖基因在各種細胞或分化狀態中之表現而不影響可能不利於細胞或細胞用作療法之目的之內源基因表現的組合物(例如核酸分子及細胞之組合物)及方法(例如用於基因組(基因)工程細胞)。所提供之組合物及方法至少部分地基於鑑別包含在不同分化細胞狀態下保持轉錄活性之多個持續轉錄活性有效負載區(STAPLR)的染色質圖譜。
I. STAPLR諸位發明人已發現,哺乳動物基因組中之某些基因間區域使得整合於其中之轉殖基因的表現量能夠一致,即使在細胞經歷其分化狀態之變化時及/或無關於細胞類型。此發現極大地擴展了轉殖基因可穩定整合且可在各種細胞狀態下維持其表現的基因組位點之基因譜。此發現因此解決例如在細胞療法之情形下轉殖基因表現中長期存在的一個問題。此等基因間區域在本文中稱為「持續轉錄活性有效負載區」(STAPLR),其中「有效負載(payload)」或「基因組有效負載(genomic payload)」係指引入該區域的一或多個外源或異源核苷酸序列。STAPLR包含用於著陸基因組有效負載之開放染色質圖譜。STAPLR中之染色體DNA呈可接近基因編輯機構之組分且允許遺傳物質整合之構形。在一些個例中,STAPLR處於轉錄活性基因附近。
此發現之一個應用為有效產生基因工程化/基因改造治療細胞,其首先經基因改造且隨後例如藉由分化或去分化使其改變細胞狀態。例如,本基因工程方法可應用於隨後分化成各種細胞類型之iPSC。在過去,當iPSC經工程化以將轉殖基因併入其基因組中且隨後分化成所需細胞類型時,轉殖基因可在iPSC分化時變得無活性。然而,整合至如本文所揭示之STALPR中的轉殖基因在iPSC分化時不會變得無活性。因此,STALPR為轉殖基因表現提供通用的「著陸墊」。
此轉殖基因表現穩定性在向有需要之個體(例如人類患者)投與細胞療法中之治療細胞之後亦為有利的,其中治療細胞可遇到將閉合整合於別處之轉殖基因的不同且變化的環境。
此外,將轉殖基因整合於基因間區域而非基因內將對相鄰基因之表現或調節引起最小破壞,且因此使得基因工程化細胞功能正常。STAPLR處之轉殖基因整合亦降低在細胞中引起非所要作用的風險(例如活化致癌基因或破壞諸如腫瘤抑制基因之必需基因)。此外,STAPLR與其持續轉錄活性狀態一起將允許測試及使用較寬範圍之調節元件(例如啟動子及強化子)。
如本文中所使用,「基因間區域(intergenic region)」為位於兩個鄰近基因之間的核苷酸序列之區段。基因間區域可具有各種尺寸。例如,基因間區域可為至少30、40、50、75或100個鹼基對長。在一些實施例中,基因間區域可為至少150、200、300、400、500、750或1000個鹼基對長。在一些實施例中,基因間區域可為至少1500、2000、2500、3000、3500、5000或10000個鹼基對長。在一些實施例中,基因間區域可為至少15000、20000、30000、40000、50000、75000或100000個鹼基對長。在一些實施例中,基因間區域為30個鹼基對至100000個鹼基對長。在一些實施例中,基因間區域為50個鹼基對至75000個鹼基對長。在一些實施例中,基因間區域為75個鹼基對至70000個長。
本發明之STAPLR包括(但不限於)(人類基因之NCBI基因ID在圓括號中示出):
RPL34基因(基因ID:6164)與
OSTC基因(基因ID:58505)之間的基因間區域;
ACTB基因(基因ID:60)與
FSCN1基因(基因ID:6624)之間的基因間區域;
AKIRIN1基因(基因ID:79647)與
NDUFS5基因(基因ID:4725)之間的基因間區域;
PRDX1基因(基因ID:5052)與
AKR1A1基因(基因ID:10327)之間的基因間區域;
PTGES3基因(基因ID:10728)與
NACA基因(基因ID:4666)之間的基因間區域;
MLF2基因(基因ID:8079)與
PTMS基因(基因ID:5763)之間的基因間區域;
RAB13基因(基因ID:5872)與
RPS27基因(基因ID:4840565)之間的基因間區域;
JTB基因(基因ID:10899)與
RAB13基因(基因ID:5872)之間的基因間區域;
AKR1A1基因(基因ID:10327)與
NASP基因(基因ID:4678)之間的基因間區域;
NDUFS5基因(基因ID:4725)與
MACF1基因(基因ID:23499)之間的基因間區域;
SRSF9基因(基因ID:8683)與
DYNLL1基因(基因ID:8655)之間的基因間區域;
MYL6B基因(基因ID:140465)與
MYL6基因(基因ID:4637)之間的基因間區域;
GPX1基因(基因ID:2876)與
RHOA基因(基因ID:387)之間的基因間區域;
HNRNPA2B1基因(基因ID:3181)與
CBX3基因(基因ID:11335)之間的基因間區域;
ROMO基因(基因ID:140823)與
RBM39基因(基因ID:9584)之間的基因間區域;
PA2G4基因(基因ID:5036)與
RPL41基因(基因ID:6171)之間的基因間區域;及
NDUFB10(基因ID:4716)與
RPS2基因(基因ID:6187)之間的基因間區域。在一些實施例中,本文中之基因係指人類基因且哺乳動物細胞為人類細胞。
人類基因組中之前述STAPLR基因間區域的起始配位及末端配位及尺寸列於下
表 1中。配位係如藉由NCBI之RefSeq資料庫處可用之資訊定義。
表 1. 精選基因之間的基因間區域
SEQ ID NO | STAPLR | 起始配位 | 末端配位 | 尺寸 | |
1 | RPL34基因與 OSTC基因之間的基因間區域 | chr4: 108,630,485 | chr4: 108,650,584 | 20100 | |
2 | ACTB基因與 FSCN1基因之間的基因間區域 | chr7: 5,530,602 | chr7: 5,592,815 | 62214 | |
3 | AKIRIN1基因與 NDUFS5基因之間的基因間區域 | chr1: 39,006,066 | chr1: 39,026,294 | 20229 | |
4 | PRDX1基因與 AKR1A1基因之間的基因間區域 | chr1: 45,522,891 | chr1: 45,550,778 | 27888 | |
5 | PTGES3基因與 NACA基因之間的基因間區域 | chr12: 56,688,285 | chr12: 56,712,426 | 24142 | |
6 | MLF2基因與 PTMS基因之間的基因間區域 | chr12: 6,753,142 | chr12: 6,766,362 | 13221 | |
7 | RAB13基因與 RPS27基因之間的基因間區域 | chr1: 153,986,340 | chr1: 153,990,761 | 4422 | |
8 | JTB與 RAB13基因之間的基因間區域 | chr1: 153,977,675 | chr1: 153,981,649 | 3975 | |
9 | AKR1A1與 NASP基因之間的基因間區域 | chr1: 45,570,050 | chr1: 45,584,040 | 13991 | |
10 | NDUFS5與 MACF1基因之間的基因間區域 | chr1: 39,034,616 | chr1: 39,084,166 | 49551 | |
11 | SRSF9與 DYNLL1基因之間的基因間區域 | chr12: 120,469,749 | chr12: 120,469,841 | 93 | |
12 | MYL6B與 MYL6基因之間的基因間區域 | chr12: 56,157,983 | chr12: 56,158,358 | 376 | |
13 | GPX1與 RHOA基因之間的基因間區域 | chr3: 49,358,354 | chr3: 49,359,144 | 791 | |
14 | HNRNPA2B1與 CBX3基因之間的基因間區域 | chr7: 26,200,747 | chr7: 26,201,442 | 696 | |
15 | ROMO與 RBM39基因之間的基因間區域 | chr20: 35,700,985 | chr20: 35,701,346 | 362 | |
16 | PA2G4基因與 RPL41基因之間的基因間區域 | chr12: 56,113,911 | chr12: 56,116,632 | 2722 | |
97 | NDUFB10與 RPS2基因之間的基因間區域 | chr16: 1,961,976 | chr16: 1,962,057 | 81 |
由於人類之間的變化及哺乳動物屬種之間的變化,前述基因對之間的基因間區域可在一定程度上不同於表1中所示之對應SEQ ID NO。
在一些實施例中,
RPL34基因與
OSTC基因之間的基因間區域包含與SEQ ID NO: 1至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 1充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 1之功能性,亦即
RPL34基因與
OSTC基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
ACTB基因與
FSCN1基因之間的基因間區域包含與SEQ ID NO: 2至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 2充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 2之功能性,亦即
ACTB基因與
FSCN1基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
AKIRIN1基因與
NDUFS5基因之間的基因間區域包含與SEQ ID NO: 3至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 3充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 3之功能性,亦即
AKIRIN1基因與
NDUFS5基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
PRDX1基因與
AKR1A1基因之間的基因間區域包含與SEQ ID NO: 4至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 4充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 4之功能性,亦即
PRDX1基因與
AKR1A1基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
PTGES3基因與
NACA基因之間的基因間區域包含與SEQ ID NO: 5至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 5充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 5之功能性,亦即
PTGES3基因與
NACA基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
MLF2基因與
PTMS基因之間的基因間區域包含與SEQ ID NO: 6至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 6充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 6之功能性,亦即
MLF2基因與
PTMS基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
RAB13基因與
RPS27基因之間的基因間區域包含與SEQ ID NO: 7至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 7充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 7之功能性,亦即
RAB13基因與
RPS27基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
JTB基因與
RAB13基因之間的基因間區域包含與SEQ ID NO: 8至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 8充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 8之功能性,亦即
JTB基因與
RAB13基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
AKR1A1基因與
NASP基因之間的基因間區域包含與SEQ ID NO: 9至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 9充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 9之功能性,亦即
AKR1A1基因與
NASP基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
NDUFS5基因與
MACF1基因之間的基因間區域包含與SEQ ID NO: 10至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 10充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 10之功能性,亦即
NDUFS5基因與
MACF1基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
SRSF9基因與
DYNLL1基因之間的基因間區域包含與SEQ ID NO: 11至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 11充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 11之功能性,亦即
SRSF9基因與
DYNLL1基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
MYL6B基因與
MYL6基因之間的基因間區域包含與SEQ ID NO: 12至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 12充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 12之功能性,亦即
MYL6B基因與
MYL6基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
GPX1基因與
RHOA基因之間的基因間區域包含與SEQ ID NO: 13至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 13充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 13之功能性,亦即
GPX1基因與
RHOA基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
HNRNPA2B1基因與
CBX3基因之間的基因間區域包含與SEQ ID NO: 14至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 14充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 14之功能性,亦即
HNRNPA2B1基因與
CBX3基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
ROMO基因與
RBM39基因之間的基因間區域包含與SEQ ID NO: 15至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 15充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 15之功能性,亦即
ROMO基因與
RBM39基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
PA2G4基因與
RPL41基因之間的基因間區域包含與SEQ ID NO: 16至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 16充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 16之功能性,亦即
PA2G4基因與
RPL41基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
在一些實施例中,
NDUFB10與
RPS2基因之間的基因間區域包含與SEQ ID NO: 97至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致或與SEQ ID NO: 97充分類似之核苷酸序列,以使基因間區域保持SEQ ID NO: 97之功能性,亦即
NDUFB10與
RPS2基因之間的基因間區域之功能(例如轉譯調節)保持完整(例如對細胞無不良作用)。
兩個核苷酸序列之一致性百分比可藉由例如BLAST®使用預設參數(可在美國國家醫學圖書館國家生物技術資訊中心(U.S. National Library of Medicine's National Center for Biotechnology Information)網站獲得)測定。在一些實施例中,出於比較目的比對之參考序列的長度為參考序列之至少30%,例如至少40%、50%、60%、70%、80%或90%。
II. 外源序列至 STAPLR 中之整合 A. 整合位點相關外源核苷酸序列可整合於STAPLR內之任何位點處。例如,整合位點或外源序列與相鄰內源序列之間的接合點可位於STAPLR之第一半或第二半中;STAPLR之5'、中間或3'三分之一中;或STALPR之第一、第二、第三或第四四分之一中。在一些實施例中,外源序列之整合位點或外源序列與相鄰內源序列之間的接合點位於STAPLR內且離最接近基因(亦即,來自STAPLR之5'或3'邊界,例如來自
表 1中所示之起始配位或末端配位)至少10、20、30、40、50、80、90、100、200、300、400、500、1000、1500、2000、2500、3000、3500、4000、5000、10000、15000或20000個鹼基對遠。
在單一基因組中,一或多個外源核苷酸序列可整合至一或多個STAPLR中。在一些實施例中,一或多個(例如兩個、三個或四個)外源核苷酸序列可整合至單一所載STALPR內之一或多個位點中。在一些實施例中,靶向單一基因組中超過一個STALPR用於整合外源核苷酸序列。
在一些實施例中,外源序列引入到至少一個STAPLR及至少一個如WO 2021/072329中所描述之持續轉殖基因表現基因座(STEL)中。STEL位點為在多潛能狀態中以及在分化期間穩固且一致地表現(例如,如藉由單細胞RNA定序(scRNAseq)分析所檢查)之內源基因的基因座。雖然STAPLR可與STEL位點相關聯,但其不需要與STEL位點相關聯。STEL位點可從單細胞RNA序列資料鑑別。理想STEL位點之界定特徵為表現之普遍存在性。STEL位點可藉由分析跨越不同細胞類型及細胞成熟期狀態之候選基因座的表現來鑑別,諸如PSC及PSC衍生之多巴胺神經元(及精選祖細胞狀態)、微膠質細胞(及精選祖細胞狀態)及心肌細胞(及精選心肌細胞祖細胞狀態)。添加成人組織之公開可獲得的單細胞RNA定序資料允許細化此類STEL分析。STEL包括(但不限於)在多種細胞類型中具有活性之某些管家基因,諸如參與基因表現(例如轉錄因子及組蛋白)、細胞代謝(例如GAPDH及NADH去氫酶)或細胞結構(例如肌動蛋白)之彼等者,或編碼核糖體蛋白之彼等者(例如大或小核糖體次單元,諸如RPL13A、RPLP0及RPL7)。STEL之實例為編碼核糖體蛋白之基因,諸如
RPL基因(例如
RPL13A 、 RPLP0 、 RPL10 、 RPL13 、 RPS18 、 RPL3 、 RPLP1 、 RPL15 、 RPL41 、 RPL11 、 RPL32 、 RPL18A 、 RPL19 、 RPL28 、 RPL29 、 RPL9 、 RPL8 、 RPL6 、 RPL18 、 RPL7 、 RPL7A 、 RPL21 、 RPL37A 、 RPL12 、 RPL5 、 RPL34 、 RPL35A 、 RPL30 、 RPL24 、 RPL39 、 RPL37 、 RPL14 、 RPL27A 、 RPLP2 、 RPL23A 、 RPL26 、 RPL36 、 RPL35 、 RPL23 、 RPL4及
RPL22)及
RPS基因(例如
RPS2 、 RPS19 、 RPS14 、 RPS3A 、 RPS12 、 RPS3 、 RPS6 、 RPS23 、 RPS27A 、 RPS8 、 RPS4X 、 RPS7 、 RPS24 、 RPS27 、 RPS15A 、 RPS9 、 RPS28 、 RPS13 、 RPSA 、 RPS5 、 RPS16 、 RPS25 、 RPS15 、 RPS20及
RPS11);編碼粒線體蛋白之基因(例如
MT-CO1 、 MT-CO2 、 MT-ND4 、 MT-ND1及
MT-ND2);編碼肌動蛋白之基因(
ACTG1及
ACTB);編碼真核細胞轉譯因子之基因(例如
EEF1A1 、 EEF2及
EIF1);及編碼組蛋白之基因(例如
H3F3A及
H3F3B)。額外STEL為編碼參與局部附著、細胞受質黏著接合點、細胞受質接合點、細胞錨定、細胞外胞外體、細胞外囊泡、細胞內胞器或錨定接合點之蛋白質的彼等者。STEL之額外實例為
FTL、
FTH1、
TPT1、
TMSB10、
GAPDH、
PTMA、
GNB2L1、
NACA、
YBX1、
NPM1、
FAU、
UBA52、
HSP90AB1、
MYL6、
SERF2及
SRP14。
在一些實施例中,在單一哺乳動物(例如人類)基因組中,外源序列引入至STAPLR (諸如
RPL34/
OSTC或
PRDX1/
AKR1A1STAPLR)及STEL (諸如
GAPDH基因座)中。在一些實施例中,外源序列引入單一基因組中之多個STAPLR,諸如
RPL34/
OSTC及
PRDX1/
AKR1A1STAPLR中。
B. 整合之方法任何基因組整合方法均可用以利用本文中所描述之STAPLR。在一些實施例中,外源核苷酸序列在STAPLR中之整合藉由使用選自由以下組成之群的基因組編輯系統實現:CRISPR/Cas系統、Cre/Lox系統、FLP-FRT系統、類轉錄活化子效應物核酸酶(TALEN)系統、鋅指核酸酶(ZFN)系統、歸巢核酸內切酶、序列特異性核酸內切酶、隨機整合(例如,通過轉位子)、大範圍核酸酶、同源重組、轉位酶及非核酸酶依賴性病毒載體(例如反轉錄病毒載體、AAV載體及慢病毒載體)。在一些實施例中,整合不引起區域中之內源序列缺失,及/或不添加除待整合之外源供體序列以外的核苷酸序列。在一些實施例中,整合在整合位點引起(非供體序列之)插入及/或缺失(插入缺失)。
在一些實施例中,外源序列可經由同源重組在諸如CRISPR相關核酸內切酶之合適核酸內切酶產生之DNA斷裂處併入至STAPLR位點中,核酸內切酶可為例如選自(但不限於)第I型(例如,次型I-A、I-B、I-C、I-C變異體、I-D、I-E、I-F、I-F變異體1或I-F變異體2)、第II型(例如,次型II-A、II-B、II-B變異體或II-C)、第III型(例如,次型III-A、III-B或III-B變異體)、第IV型或第V型Cas蛋白質或其變異體。在一些實施例中,核酸酶選自由以下組成之群:Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas12 (例如Cas12a或Cpf1或Cas12b)、Cas13、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、CasX、CasY、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、CasPhi、MAD7、Csf4及其同源物,或其經修改之版本(例如具有核酸酶活性之野生型Cas蛋白質的截短版本或變異體)。
在一些實施例中,Cas核酸內切酶為Cpf1 (Cas12a)核酸內切酶或其變異體、衍生物或片段,諸如(例如)衍生自以下之Cpf1:新兇手弗朗西斯氏菌(
Francisella novicida) U112 (FnCpf1)、胺基酸球菌屬(
Acidaminococcus sp.) BV3L6 (AsCpf1,包括經改良之變異體,諸如enAsCpf1)、毛螺菌科菌屬(Lachnospiraceae bacterium) ND2006 (LbCpf1)、毛螺菌科菌屬MA2020 (Lb2Cpfl)、毛螺菌科菌屬MC2017 (Lb3Cpfl)、牛眼莫拉氏菌(
Moraxella bovoculi) 237 (MbCpf1)或解糖腖普雷沃菌(
Prevotella disiens) (PdCpf1)。
在一些實施例中,Cas核酸內切酶為Cas9蛋白質或其變異體、衍生物或片段。在一些實施例中,Cas9蛋白質為SaCas9、SpCas9、SpCas9n、Cas9-HF、Cas9-H840A、FokI-dCas9或D10A切口酶。
在一些實施例中,Cas核酸內切酶為第五型RNA可程式化核酸酶,如WO 2022/258753中所揭示。
在一些實施例中,Cas核酸內切酶為MAD核酸酶,諸如MAD7核酸酶,如美國專利10,337,028中所揭示。
適合之核酸內切酶的非限制性實例闡述於下
表 A中。
表 A 例示性核酸內切酶
酶 | 序列 |
Cas12a | MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRN (SEQ ID NO: 98) |
Cas12a變異體1 | MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQRPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAARLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFLFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRNGRSSDDEATADSQHAAPPKKKRKV (SEQ ID NO: 99) |
第V型RNA可程式化核酸酶實例1 | MTIRSMKLKLKIYSGRSAPQLRQGLWRLHRLLNEGTAYYMDWLVHMRQEALPGKSKEEIRAELERRVRQQQEKNGVQNDQVPMDEVLSALRQLYELLVPSAVNNSGDAQTLSRKFLSPLVDPNSEGGKGTSNAGAKPGWRKKQEAGDPSWEKDYERWLKRKQADPTAEILGKLETAGLKPLFPLYTNEVKDIRWMPLTSKQYVRNWDRDMFQQAIEHLLSWETWNRKVNEERAKLKETVRRFEEQHLANGKDWLSPLQAYEANREQALRDMAISPSDRFRITRRQIKGWSELYERWNKLAPTASVEAYMQEVRHVQKKLGGTFGDADLYRFLAKPENVHIWRDHQERLHYYAAYNDLHKRLMSAKEQAAFTLPDPVAHPLWVRFDARDGNLFTYILQADSSKQRSRRYVNFSRFLWPVEDGYFEETENVKVELALSKQFYRQVIVHDNPTGKQKITFQDYSSKEILEGHLGGAKLQLDRNFLRKSGRDFETGDFGPAFLNVVLDLKPKQEVKNGRLQSPLGQALLVKSRPNDIPKVYGYKPDALAAWLEQASGEESLGSESLRQGFRVMSIDLGVRSAAAISVFSVKGEKTREGDKVCYPVGETGLFAVHDRSFLLRLPGESSEKRVNVERDKRKTERMQIRYHIRTLARVLRLANKATPMDRIKAVQDVLNDIESTRFMNDHDHHVYNHALETLRTYAPDHQGIWEEQVIAAHRQLEHHVGVIVGEWRKNWGKDRRGTVGLSMDNIEELDEMRRLLISWSRRARYPREAKPFQVNESNPVHLLRHLQNLKEDRLKQLANLIVMTALGYVYDSKEKKWKAAYPACQLILFEDLQRYRFHLDRSARENSQLMKWAHRSIPKYVWMQGEPYGLQIGDVWAGFTSRYHAKTGAPGIRCKALTEKDFQQGRLLESLVAEGMFTLQEVGTLKPGDIVPAEGGELFVTLADDSGDRIVITHADINAAQNVQKRFWLANSERFRVACRSVQIASQECFIPSSESVAKKMGKGVFVRDFSFHKDMEVYHWNNQVKLTAKNVPTDHSDDLQDLQDYQAILEEARESSSSYKTLFRDPSGFFFPDDVWVPQNIYWREVKKTITALLRKRIMST (SEQ ID NO: 100) |
第V型RNA可程式化核酸酶實例2 | MPIRSFKLKLVTHNGDSTYMDKLRRGLWKTHVIINRGIAYYMNTLALMRQEPYGSKSREEVRLDLLSTLREQQRRNNWSEQTGTDDELLSLSRRVYELLVPSAIGEKGDAQMLSRKFLSPLVDPNSEGGRGTAKSGRKPRWKKMMEEGHPDWEKEKEKDAAKKAEDPTASILADLEAVGLLPLFPLFSDEQKEIRWLPKKKRQFVRTWDRDMFQQALERMLSWESWNRRVAEEYLKLQAQRDEVYAKYLEDAGSWLNDLQTFEKQREEELAEVSFEPNSEYLITRRQIRGWKEVYEKWSKTSENASQEQLWRMVADVQTAMAGAFGDPKVYQFLSQPKHHHIWREHPNRLFYYSKYNEVREKLNRAKKQAAFTLPDPVEHPLWTRFDARGGNIHDYEISKVGKQYHVTFSSLILPEAQSWVEIENVTVGIGNSLQLKRQIRLDGYADKKQKVKYYDYSSRFELTGVLGGAKIQFDRKHLKKAAHRLAEGETGPIFLNVVVDVEPFLEVKNGRLRTPLGQVLQVNTRDWPKVVDYKAKELSVLMENTQIGNENGVSTIEAGMRIMSIDLGQRTAAAVSIFEVISKKPDEKETKLFYPIADTDLYAVHRRSLLLRLPGEEISSKKMIEKRKERARIRSLVRYQIRLLSEVLRLHTQGTAEQRRFKLDELLVSIQKKLELDQSEWISELEKLFDYIDESAEKWKEALVVAHRTLEPIVVEAVRNWKKSLSKENKDRRRIAGISIWSIEELEETRKLLIAWSKHSREPGIPKRLEKEETFAPEHLQHIQNVKDDRLKQMANLFVMTALGYKYDEGNKRWVEAYPACQVILFEDLSRYRFALDRPRRENNRLMKWAHRSIPRLTYMQAELFGIQVGDVYSAYTSRFHAKTGAPGIRCHALTEADLQSNSYVVNQLIKDKFIQDNQTEILKAGQIVPWQGGELFVTFADRSGASLAVIHADINAAQNLQKRFWQHNSEVFRVPCKVVKGGLVPVYEKMRKLFGKGLFVNIDDPESKEVYRWEHSTKMKSKTTPVDLESEDIDHEELSDEWEDMQEGYKTLLRDPSGFFWSSDSWIPQKDFWIRVKSRIGKSLREQIR (SEQ ID NO: 101) |
第V型RNA可程式化核酸酶實例3 | MPIRSFKLKLVTHNGDSTYMDKLRRGLWKTHVIINRGIAYYMNTLALMRQEPYGSKSREEVRLDLLSTLREQQRRNNWSEQTGTDDELLSLSRRVYELLVPSAIGEKGDAQMLSRKFLSPLVDPNSEGGRGTAKSGRKPRWKKMMEEGHPDWEKEKEKDAAKKAEDPTASILADLEAVGLLPLFPLFSDEQKEIRWLPKKKRQFVRTWDRDMFQQALERMLSWESWNRRVAEEYQKLQAQRDEVYAKYLEDAGSWLNDLQTFEKQREEELAEVSFEPNSEYLITRRQIRGWKEVYEKWSKTSENASQEQLWRMVADVQTAMAGAFGDPKVYQFLSQPKHHHIWREHPNRLFYYSKYNEVREKLNRAKKQAAFTLPDPVEHPLWTRFDARGGNIHDYEISKVGKQYHVTFSSLILPEAQSWVEIENVTVGIGNSLQLKRQIRLDGYADKKQKVKYYDYSSRFELTGVLGGAKIQFDRKHLKKAAHRLAEGETGPIFLNVVVDVEPFLEVKNGRLRTPLGQVLQVNTRDWPKVVDYKAKELSVLMENTQIGNENGVSTIEAGMRIMSIDLGQRTAAAVSIFEVISKKPDEKETKLFYPIADTDLYAVHRRSLLLRLPGEEISSKKMIEKRKERARIRSLVRYQIRLLSEVLRLHTQGTAEQRRFKLDELLVSIQRKLELDQSEWISELEKLFDYIDESAEKWKEALVVAHRTLEPIVVEAVRNWKKSLSKENKDRRRIAGISIWSIEELEETRKLLIAWSKHSREPGIPKRLEKEETFAPEHLQHIQNVKDDRLKQMANLFVMTALGYKYDEGNKRWVEAYPACQVILFEDLSRYRFALDRPRRENNRLMKWAHRSIPRLTYMQAELFGIQVGDVYSAYTSRFHAKTGAPGIRCHALTEADLQSNSYVVNQLIKDKFIQDNQTEILKAGQIVPWQGGELFVTFADRSGASLAVIHADINAAQNLQKRFWQHNSEVFRVPCKVVKGGLVPVYEKMRKLFGKGLFVNIDDPESKEVYRWEHSTKMKSKTTPVDLESEDIEHEELSDEWEDMQEGYKTLLRDPSGFFWSSDSWIPQKDFWIRVKSRIGKSLREQIR (SEQ ID NO: 102) |
在一些實施例中,CRISPR/Cas系統包含靶向所選基因間區域之gRNA依賴性核酸酶(或其編碼序列)、gRNA (或其編碼序列)及包含外源核苷酸序列之供體DNA。
在一些實施例中,STAPLR為
RPL34基因與
OSTC基因之間的基因間區域,且gRNA選自SEQ ID NO: 25-32。
在一些實施例中,STAPLR為
ACTB基因與
FSCN1基因之間的基因間區域,且gRNA選自SEQ ID NO: 33-54。
在一些實施例中,STAPLR為
AKIRIN1基因與
NDUFS5基因之間的基因間區域,且gRNA選自SEQ ID NO: 55-70。
在一些實施例中,STAPLR為
PRDX1基因與
AKR1A1基因之間的基因間區域,且gRNA選自SEQ ID NO: 71-92。
在一些實施例中,核酸內切酶在STAPLR內產生DNA斷裂。在其他實施例中,核酸內切酶在與STAPLR相鄰之基因中產生DNA斷裂,使得在整合之後,外源核苷酸序列仍整合於STAPLR內。在一些實施例中,不當整合事件之篩檢可根據WO 2021/226151中所描述之方法進行,其中在與STAPLR相鄰之基因的外顯子中引入DNA斷裂且為細胞存活所必需的,且整合未恰當達成之彼等細胞不存活。
C. 外源核苷酸序列在一些實施例中,用於整合之相關外源核苷酸序列可包含編碼蛋白質或RNA之轉殖基因。轉殖基因可包含基因產物之編碼序列及視情況一或多個轉錄調節元件。在一些實施例中,轉殖基因包含一或多個調節元件,其中一或多個調節元件可視情況與編碼序列可操作地鍵聯。
調節元件之非限制性實例為啟動子、強化子、沉默子、染色質絕緣子、內含子序列、Kozak序列、普遍存在之染色質開放元件(UCOE)、轉錄活化子結合元件、增強基因表現或RNA穩定性之序列(例如WPRE元件)、多腺苷酸化信號序列(例如SV40 polyA信號)及其類似物。
在一些實施例中,引導轉殖基因表現之啟動子為持續型啟動子,包括(但不限於) EF1a、EFS、UBC、PGK、CAGGS、CMV、SV40、B2M及ROSA26啟動子。在一些實施例中,外源核苷酸序列之表現處於細胞類型特異性啟動子、組織特異性啟動子或譜系特異性啟動子之控制下。例如,啟動子可為多巴胺能神經元之酪胺酸羥化酶啟動子;運動神經元之Hb9啟動子;心肌細胞之SIRPA啟動子;骨髓譜系之細胞的CD14、CD33、CD45或CD11b啟動子;或T淋巴細胞之CD3、FOXP3、CD25、CD8或CD4啟動子。在一些實施例中,外源核苷酸序列之表現處於可誘導型啟動子(例如乳糖操縱子,其可藉由異丙基β-D-1-硫代半乳糖苷(IPTG)觸發;TRE啟動子,其可藉由四環素及其衍生物觸發)之控制下。
在一些實施例中,外源序列包含一或多個對由另一位點(例如由內源基因或整合於STEL或STAPLR處之轉殖基因)表現之因子起反應的調節元件。此類調節元件之非限制性實例為轉錄因子結合位點。在一些實施例中,此類調節元件整合於其他一或多個調節元件及/或轉殖基因之編碼序列附近的STAPLR位點處。例如,細胞可經如本文中所揭示之包含外源核苷酸序列的DNA分子修飾,外源核苷酸序列包含轉殖基因及轉錄因子結合位點,其中可結合至轉錄因子結合位點之轉錄因子由內源基因或基因組任何部分中(例如在STAPLR、STEL或另一安全港位點中)之另一轉殖基因表現或異位表現。
在一些實施例中,轉殖基因編碼RNA (例如小干擾RNA或微型RNA)或相關蛋白質。相關蛋白質(如本文中所使用,包括肽)可為例如球狀蛋白質(例如白蛋白、球蛋白、榖蛋白、醇溶蛋白、組蛋白、血球蛋白或魚精蛋白)、纖維蛋白質(例如硬蛋白質,諸如膠原蛋白、彈性蛋白、角蛋白或絲蛋白)或中間蛋白質。在一些實施例中,相關蛋白質為複合蛋白質,諸如金蛋白質、色蛋白、醣蛋白、黏蛋白、磷蛋白、脂蛋白。在一些實施例中,相關蛋白質為治療性蛋白質(例如可改良或預防疾病或病況之症狀的蛋白質)。治療性蛋白質之非限制性實例包括在諸如血友病及溶酶體貯積病(lysosome storage disease)之遺傳性疾病中缺乏或有缺陷的蛋白質、酶、調節免疫力之細胞介素、重組抗原受體(例如嵌合抗原受體)、抗體、調節經修飾細胞之分化或活性的蛋白質(例如維持細胞在M1或M2極性中之轉錄因子或蛋白質)及其類似物。在一些實施例中,相關蛋白質為細胞標記物、用於免疫逃避之蛋白質或用於細胞療法之安全或殺滅開關。相關蛋白質之實例為(但不限於) SOX10、IL-10、IL-12、CD19t及ThPOK。
D. 靶向載體本發明提供用於將外源核苷酸序列整合至STAPLR中之靶向載體。如本文中所使用,「靶向載體(targeting vector)」為包含相關外源核苷酸序列及與側接基因組中所需整合位置之內源染色體核苷酸序列同源之序列的核酸。此等側接同源序列稱為「同源臂」。同源臂藉助於同源臂與對應內源核苷酸序列之間存在的同源性將靶向載體引導至基因組內之特異性染色體位置。在一些實施例中,靶向載體為包含相關核酸之核酸,該核酸側接有5'核苷酸序列(左同源臂或左同源區)及3'核苷酸序列(右同源臂或右同源區),其中5'核苷酸序列及3'核苷酸序列為側接細胞基因組中之整合位點的核苷酸序列且經由同源性調解相關核酸整合至整合位點中。整合位點可在STAPLR內或在與STAPLR相鄰之基因序列中(例如基因之外顯子、內含子或UTR中)。
在一些實施例中,5'核苷酸序列及3'核苷酸序列充分類似於側接細胞基因組中之整合位點的核苷酸序列,以允許經由同源性將相關核酸整合至STAPLR中。5'序列及3'序列充分類似於用於同源重組所靶向之內源核苷酸序列,使得同源臂在整合(完全或部分)時不會對整合之基因環境造成不利影響(例如不影響鄰近基因之功能)。在一些實施例中,同源臂與所靶向STAPLR中之核苷酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致。
在一些實施例中,如本文中所提供之靶向載體包含一或多個核酸內切酶靶向序列,例如用以在與核酸內切酶-導引組合一起使用時線性化載體。
在一些實施例中,靶向載體為環狀載體。在一些實施例中,靶向載體為線性載體。在一些實施例中,靶載體為病毒載體(例如AAV載體、腺病毒載體、慢病毒載體、單純疱疹病毒載體)或質體載體。靶載體亦可包含一或多個核酸內切酶識別位點。
例如,在一些實施例中,
RPL34基因與
OSTC基因之間的基因間區域包含與SEQ ID NO: 1至少80%一致之核苷酸序列,以便
RPL34基因與
OSTC基因之間的基因間區域之功能在整合後保持完整。在一些實施例中,
RPL34基因與
OSTC基因之間的基因間區域包含與SEQ ID NO: 1至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致之核苷酸序列,使得
RPL34基因與
OSTC基因之間的基因間區域之功能在整合後保持完整。同樣的道理可適用於
ACTB基因與
FSCN1基因之間的基因間區域及其與SEQ ID NO: 2之一致性;
AKIRIN1基因與
NDUFS5基因之間的基因間區域及其與SEQ ID NO: 3之一致性;
PRDX1基因與
AKR1A1基因之間的基因間區域及其與SEQ ID NO: 4之一致性;
PTGES3基因與
NACA基因之間的基因間區域及其與SEQ ID NO: 5之一致性;
MLF2基因與
PTMS基因之間的基因間區域及其與SEQ ID NO: 6之一致性;
RAB13基因與
RPS27基因之間的基因間區域及其與SEQ ID NO: 7之一致性;
JTB基因與
RAB13基因之間的基因間區域及其與SEQ ID NO: 8之一致性;
AKR1A1基因與
NASP基因之間的基因間區域及其與SEQ ID NO: 9之一致性;
NDUFS5基因與
MACF1基因之間的基因間區域及其與SEQ ID NO: 10之一致性;
SRSF9基因與
DYNLL1基因之間的基因間區域及其與SEQ ID NO: 11之一致性;
MYL6B基因與
MYL6基因之間的基因間區域及其與SEQ ID NO: 12之一致性;
GPX1基因與
RHOA基因之間的基因間區域及其與SEQ ID NO: 13之一致性;
HNRNPA2B1基因與
CBX3基因之間的基因間區域及其與SEQ ID NO: 14之一致性;
ROMO基因與
RBM39基因之間的基因間區域及其與SEQ ID NO: 15之一致性;
PA2G4基因與
RPL41基因之間的基因間區域及其與SEQ ID NO: 16之一致性;及
NDUFB10與
RPS2基因之間的基因間區域及其與SEQ ID NO: 97之一致性。
在本發明之方法中,同源臂之長度不同。在一些實施例中,同源臂中之各者獨立地約為至少50、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450、至少500、至少550、至少600、至少650、至少700、至少750、至少800、至少850、至少900、至少950、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、至少1800、至少1900或至少2000個鹼基對長。在一些實施例中,同源臂中之各者獨立地為50-2000、100-1900、150-1800、200-1700、250-1600、300-1500、350-1400、400-1300、450-1200、500-1100、550-1000、600-950、650-900、700-850或750-800個鹼基對長。
在本發明之方法中,同源臂(亦即5'核苷酸序列及3'核苷酸序列)可經設計以靶向所揭示之基因間區域內的任何位置。
在一些實施例中,5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 17的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 18的核苷酸序列。在一些實施例中,5'核苷酸序列包含與SEQ ID NO: 17至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 17之功能保持完整。在一些實施例中,3'核苷酸序列包含與SEQ ID NO: 18至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 18之功能保持完整。
在一些實施例中,5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 19的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 20的核苷酸序列。在一些實施例中,5'核苷酸序列包含與SEQ ID NO: 19至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 19之功能保持完整。類似地,在一些實施例中,3'核苷酸序列包含與SEQ ID NO: 20至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 20之功能保持完整。
在一些實施例中,5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 21的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 22的核苷酸序列。在一些實施例中,5'核苷酸序列包含與SEQ ID NO: 21至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 21之功能保持完整。類似地,在一些實施例中,3'核苷酸序列包含與SEQ ID NO: 22至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 22之功能保持完整。
在一些實施例中,5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 23的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 24的核苷酸序列。在一些實施例中,5'核苷酸序列包含與SEQ ID NO: 23至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 23之功能保持完整。類似地,在一些實施例中,3'核苷酸序列包含與SEQ ID NO: 24至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 24之功能保持完整。
在一些實施例中,5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 93的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 94的核苷酸序列。在一些實施例中,5'核苷酸序列包含與SEQ ID NO: 93至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 93之功能保持完整。類似地,在一些實施例中,3'核苷酸序列包含與SEQ ID NO: 94至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 94之功能保持完整。
在一些實施例中,5'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 95的核苷酸序列且3'核苷酸序列包含如序列功能保持完整所需要之充分類似於SEQ ID NO: 96的核苷酸序列。在一些實施例中,5'核苷酸序列包含與SEQ ID NO: 95至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 95之功能保持完整。類似地,在一些實施例中,3'核苷酸序列包含與SEQ ID NO: 96至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的核苷酸序列,用以使SEQ ID NO: 96之功能保持完整。
在一些實施例中,同源臂完全落於所靶向STAPLR內。在其他實施例中,同源臂可在整合之後與鄰近基因之一部分重疊而不妨礙其功能且外源序列仍整合於STAPLR內。
本發明提供STAPLR靶向系統,其包含本文中之靶向載體及用於將靶向載體上之相關核苷酸序列併入至STAPLR中的恰當基因編輯系統,諸如本文中所描述之彼等者。
III. 基因改造哺乳動物細胞本文中提供基因改造細胞,其包含本文中所揭示之STAPLR中之一或多者中的修飾。靶向STAPLR整合之哺乳動物細胞可為任何細胞類型或呈任何相關細胞狀態。例如,細胞可為幹細胞或分化細胞。細胞(諸如人類細胞)可藉由基因編輯方法(諸如本文中所描述之彼等方法)活體外、活體內或離體工程化。細胞亦可為非人類細胞,諸如來自實驗室動物(例如非人類靈長類動物、小鼠、大鼠及兔)、農畜(例如牛及馬)及寵物(例如狗及貓)之細胞。
A. 幹細胞在一些實施例中,靶向其STAPLR處之修飾的哺乳動物細胞為幹細胞,尤其多潛能幹細胞(PSC),諸如誘導性多潛能幹細胞(iPSC;例如,人類iPSC)或胚胎幹細胞(ESC;例如,人類ESC)。隨後可誘導工程化幹細胞以使其分化成在本文中稱為PSC衍生物、PSC衍生物細胞或PSC衍生細胞的所需細胞類型。幹細胞為可能產生大量特異性細胞類型之起點,該等細胞類型可用於再生醫學遞送至患有多種不同疾病之患者中。
如本文中所使用,術語「多潛能(pluripotent)」或「多能性(pluripotency)」係指細胞自我更新且分化成三個胚層:內胚層、中胚層或外胚層中之任一者之細胞的能力。「多潛能幹細胞」或「PSC」包括例如自囊胚之內細胞團衍生之或藉由體細胞核轉移衍生之ESC,及自非多潛能細胞衍生之iPSC。
如本文中所使用,術語「胚胎幹(embryonic stem)」、「ES」細胞及「ESC」係指獲自早期胚胎之多潛能幹細胞。在一些實施例中,該術語不包括涉及破壞人類胚胎之幹細胞;亦即,ESC獲自先前已建立ESC細胞株。
術語「誘導性多潛能幹細胞(induced pluripotent stem cell)」或「iPSC」係指藉由引入一或多個再程式化因子或使細胞與其接觸而從非多潛能細胞人工製備的多潛能幹細胞類型,諸如成人體細胞、部分分化細胞或末端分化細胞(諸如纖維母細胞)、造血譜系細胞、肌細胞、神經元、表皮細胞或其類似物。產生iPSC之方法包括例如誘導一或多個基因(例如,POU5F1/OCT4 (基因ID:5460)與(但不限於) SOX2 (基因ID:6657)、KLF4 (基因ID:9314)、c-MYC (基因ID:4609)、NANOG (基因ID:79923)及/或LIN28/LIN28A (基因ID:79727) 之組合)的表現。再程式化因子可藉由各種手段遞送(例如,病毒、非病毒、RNA、DNA或蛋白質遞送);或者,內源基因可藉由使用例如CRISPR工具將非多潛能細胞再程式化至PSC中來活化。
參見例如WO 2013/177133及WO 2022/204567。
用於誘導PSC分化成各種譜系之細胞的方法為此項技術中已知的。例如,用於誘導PSC分化成樹突細胞之方法描述於Slukvin等人,
J Imm. (2006) 176:2924-32;及Su等人,
Clin Cancer Res. (2008) 14(19):6207-17;及Tseng等人,
Regen Med. (2009) 4(4):513-26中。用於誘導PSC變成造血祖細胞、骨髓譜系細胞及T淋巴球之方法描述於例如Kennedy等人,
Cell Rep. (2012) 2:1722-35中。
重組PSC可分化成適合於療法之細胞,包括內胚層(例如,肺、甲狀腺或胰臟細胞或其祖細胞)、外胚層(例如,皮膚、神經元或色素細胞或其祖細胞)及中胚層(例如,心臟細胞、骨骼肌細胞、紅血球、平滑肌細胞或其祖細胞或前驅細胞)譜系中之細胞。
在一些實施例中,重組PSC分化成內胚層(例如,肺、甲狀腺或胰臟細胞或其祖細胞或前驅細胞)、外胚層(例如,皮膚、神經元或色素細胞或其祖細胞或前驅細胞)及中胚層(例如,心臟細胞、骨骼肌細胞、紅血球、平滑肌細胞或其祖細胞或前驅細胞)譜系中之細胞。
在一些實施例中,本發明之重組PSC分化成心臟細胞。在各種實施例中,心臟細胞為心臟祖細胞或成熟或不成熟(心房或心室)心肌細胞。在其他實施例中,心臟細胞為心臟內皮細胞或結節細胞。
在一些實施例中,本發明之重組PSC分化成人類免疫細胞,其視情況選自T細胞、表現嵌合抗原受體(CAR)或重組TCR之T細胞、調節T細胞、骨髓細胞、樹突細胞及/或巨噬細胞/單核球(例如免疫抑制巨噬細胞)或其祖細胞或前驅細胞。
在一些實施例中,本發明之重組PSC分化成寡樹突細胞祖細胞或前驅細胞或寡樹突細胞。在一些實施例中,本發明之重組PSC分化成微膠質細胞祖細胞或前驅細胞或微膠質細胞。
在一些實施例中,本發明之重組PSC分化成神經譜系細胞,例如神經脊細胞、星形膠質細胞、多巴胺能神經元祖細胞、多巴胺能神經元、中腦多巴胺能神經元祖細胞、中腦多巴胺能神經元、真實中腦多巴胺(DA)神經元、多巴胺能神經元前驅細胞、底板中腦祖細胞、底板中腦DA神經元或其祖細胞或前驅細胞。
在一些實施例中,本發明之重組PSC分化成眼系統之細胞,諸如感光受體細胞、感光受體祖細胞或前驅細胞、視網膜色素上皮(RPE)細胞或其祖細胞或前驅細胞、神經視網膜細胞或其祖細胞或前驅細胞。在其他實施例中,未經編輯之PSC分化成眼系統之細胞,其隨後經本發明之靶向構築體工程化。
在其他實施例中,本發明之重組PSC分化成微膠質細胞或微膠質細胞祖細胞或前驅細胞。
在其他實施例中,本發明之重組PSC分化成人類代謝系統中之細胞,其視情況選自肝細胞、膽管細胞及胰臟β細胞或其祖細胞或前驅細胞。
在其他實施例中,本發明之重組PSC分化成腸祖細胞或前驅細胞或腸細胞。
B. 分化細胞在另其他實施例中,待工程化之細胞為分化細胞(例如部分或末端分化細胞)。部分分化細胞可為例如組織特異性祖細胞或幹細胞,諸如造血祖細胞或幹細胞、骨胳肌肉祖細胞或幹細胞、心臟祖細胞或幹細胞、神經元祖細胞或幹細胞及間葉幹細胞。
可在其STAPLR中之一或多者處工程化之例示性分化細胞類型包括內胚層(例如肺、甲狀腺或胰臟細胞或其祖細胞)、外胚層(例如皮膚、神經元或色素細胞或其祖細胞或前驅細胞)及中胚層(例如心臟細胞、骨骼肌細胞、紅血球、平滑肌細胞或其祖細胞或前驅細胞)譜系中之細胞。或者,PSC可分化成此等譜系中之細胞且隨後經本發明之靶向構築體工程化。
在一些實施例中,心臟細胞經工程化。在一些實施例中,心臟細胞為心臟祖細胞或成熟或不成熟(心房或心室)心肌細胞。在其他實施例中,心臟細胞為心臟內皮細胞或結節細胞。
在一些實施例中,人類免疫細胞經工程化。人類免疫細胞視情況選自T細胞(例如,CD4+ T細胞、CD8+ T細胞或Treg細胞)、表現嵌合抗原受體(CAR)或重組TCR之T細胞、調節T細胞、骨髓細胞、樹突細胞及/或巨噬細胞(例如,免疫抑制巨噬細胞),或其祖細胞或前驅細胞,諸如造血幹細胞或祖細胞。
在一些實施例中,寡樹突細胞祖細胞或前驅細胞或寡樹突細胞經工程化。
在一些實施例中,神經譜系細胞經工程化。在各種實施例中,神經譜系細胞為神經脊細胞、星形膠質細胞、多巴胺能神經元祖細胞、多巴胺能神經元細胞、中腦多巴胺能神經元祖細胞、中腦多巴胺能神經元、真實中腦多巴胺(DA)神經元、多巴胺能神經元前驅細胞、底板中腦祖細胞、底板中腦DA神經元或其祖細胞或前驅細胞。
在一些實施例中,眼系統之細胞經工程化。在各種實施例中,眼系統之細胞為感光受體細胞、感光受體祖細胞或前驅細胞、視網膜色素上皮細胞或其祖細胞或前驅細胞、神經視網膜細胞或其祖細胞或前驅細胞。
在其他實施例中,微膠質細胞或微膠質細胞祖細胞或前驅細胞經工程化。
在其他實施例中,人類代謝系統中之細胞經工程化。在各種實施例中,人類代謝系統中之細胞視情況選自肝細胞、膽管細胞及胰臟β細胞或其祖細胞或前驅細胞。
在其他實施例中,腸祖細胞或前驅細胞或腸細胞經工程化。
本文中可經工程化以將外源序列整合至STAPLR中之額外細胞類型為(但不限於)纖維母細胞、脂肪細胞、肌細胞(例如,骨骼肌細胞或平滑肌細胞)、骨細胞、骨髓細胞、骨髓祖細胞(例如,原始骨髓祖細胞)。
該等細胞可能來自已建立細胞株,或其等可為初代細胞,其中「初代細胞(primary cells)」、「初代細胞株(primary cell lines)」及「初代培養物(primary cultures)」在本文中可互換地使用,以指代來源於個體(例如人類)且允許活體外或離體生長用於有限數目之培養物繼代的細胞及細胞培養物。例如,初代培養物包括可能已繼代0次、1次、2次、4次、5次、10次或15次,但繼代次數尚不足以經歷危機階段之培養物。初代細胞株可活體外或離體維持少於10代。在一些實施例中,細胞在細胞療法之情形中為自體的。在一些實施例中,細胞在細胞療法之情形下為同種異體的。
可藉由任何適合方法自個體收穫初代細胞。例如,白細胞可適當藉由血球分離術、白血球分離術、密度梯度分離等收穫,而來自組織(諸如皮膚、肌肉、骨髓、脾臟、肝、胰臟、肺、腸、胃等)之細胞藉由活體組織切片收穫最適當。
前述分化細胞類型中任一者可以在其工程化之前自PSC分化。
本發明包含一種醫藥組合物,其包含本文中之工程化細胞及醫藥學上可接受之載劑。
IV. 鑑別 STAPLR 之方法本發明亦提供鑑別STAPLR作為用於哺乳動物細胞(例如人類細胞)中安全基因組整合之位點的方法。在此等方法中,第一步驟為選擇一組細胞類型用於單細胞RNA定序(「scRNAseq」)。細胞類型之實例在不限制的情況下為本文中所提及之彼等細胞類型,包括但不限於PSC (例如iPSC)、免疫系統中之細胞(例如T細胞、NK細胞、樹突細胞、巨噬細胞/單核球或其造血祖細胞)、心血管系統中之細胞(例如心室心肌細胞、結節細胞或心臟祖細胞)、代謝系統中之細胞(例如肝細胞及胰臟β細胞)、中樞神經系統中之細胞(例如感覺神經元、運動神經元、仲介神經元、微膠質細胞、寡樹突細胞或其祖細胞)、肌細胞(例如骨骼肌細胞及平滑肌細胞)、脂肪細胞及眼系統中之細胞(例如視網膜色素上皮細胞及感光受體細胞)。
第二步為進行scRNAseq分析,其中定序分析包含分配給通過品質標準之各細胞經轉錄基因之獨特轉錄組。為了通過品質標準,篩選轉錄組以排除具有高稀疏性或缺失之彼等轉錄組及可能衍生自超過一個細胞之彼等轉錄組。
隨後,各基因經分配一個盛行率分數。盛行率分數滿分為「1」且表示基於所收集資料集之scRNAseq資料庫含有所載基因之至少一種轉錄本的細胞之分率。在一些實施例中,scRNAseq資料集獲自PSC、多巴胺能神經元及/或其祖細胞(例如處於各種精選分化狀態下之彼等細胞)、微膠質細胞及/或其祖細胞(例如處於各種精選分化狀態下之彼等細胞)、心肌細胞及/或其祖細胞(例如處於各種精選分化狀態下之彼等細胞)、寡樹突細胞及/或其祖細胞(例如處於各種精選分化狀態下之彼等細胞)或巨噬細胞及/或其祖細胞(例如處於各種精選分化狀態下之彼等細胞)。
分配盛行率分數之後,判定哺乳動物(例如人類)基因組中各基因之位置。
鑑別哺乳動物細胞基因組中之STAPLR的下一步為鑑別鄰近非重疊基因。「非重疊基因(non-overlapping genes)」意謂基因在兩股中之任一股上彼此分隔至少50個鹼基對、至少75個鹼基對、至少100個鹼基對、至少200個鹼基對、至少300個鹼基對、至少400個鹼基對、至少500個鹼基對、至少1000個鹼基對、至少1500個鹼基對、至少2000個鹼基對、至少2500個鹼基對、至少3000個鹼基對、至少3500個鹼基對、至少5000個鹼基對、至少10000個鹼基對、至少15000個鹼基對或至少20000個鹼基對。用於計算鑑別非重疊基因之基因距離的轉錄本可由任何基因組資料庫(諸如NCBI之RefSeq資料庫及GENCODE資料庫)指定。
在一些個例中,不同基因組資料庫含有非共識基因邊界標註,其可引起關於兩個基因是否重疊之不同所計算基因距離及相反結論。在此類情況下,若藉由使用至少一個基因組資料庫測定非重疊,則兩個基因視為非重疊的。例如,
MLF2下游側接有其鄰近基因
PTMS。如NCBI RefSeq資料庫中所標註,此等基因為非重疊的,其中基因間距離為約13 kb;然而,GENCODE V38資料庫記述一個
MLF2轉錄本之起始位點位於在相對股上編碼之
PTMS的第一內含子內。在此情況下,考慮RefSeq標註但不考慮GENCODE標註,並將此基因對歸類為非重疊。
一旦兩個或兩個以上基因視為非重疊,則確定非重疊基因對或包含三個或更多個非重疊基因之區域的鄰近分數。鄰近分數為個別盛行率分數之結果且反映兩個基因在集合scRNAseq資料集中轉錄活性之機率。鄰近分數實質上為轉錄活性基因附近之排序。
隨後分選鄰近分數以獲得非重疊基因對的排序或包含三個或更多個基因之區域的排序。一旦鄰近分數排序後,選擇具有最佳鄰近分數的基因對或包含三個或更多個基因之區域,且將所選基因對或區域之基因之間的基因間區域鑑別為潛在STAPLR。
可靶向STAPLR用於安全基因整合。然後標註具有排序最高鄰近分數之基因間區域以便設計用於位點特異性整合之同源臂。一般而言,對於整合位點需避免之序列包括啟動子區、強化子區、CpG島、表觀遺傳標記(例如H3K4Me1、H3K4Me3及H3K27Ac)、DNase I超敏峰、保守區及重複區。UCSC基因組瀏覽器可與(但不限於)以下基因標註渠道一起使用:GENCODE V32/RefSeq Genes/GTEx RNA-seq/EPDnew Promoters/ENCODE (轉譯、H3K4Me1、H3K4Me3, H3K27Ac及DNase Clusters)、GeneHancer、CpG Islands、Conservation 100脊椎動物及RepeatMasker。
在選擇可靶向基因間子區域時,必須避免已知啟動子區及強化子區。另外,保守區、重複區、表觀遺傳標記及DNase超敏區為選擇可靶向區域時應最小化的特徵。在一些實施例中,可靶向基因間子區域包含CRISPR核酸內切酶原始間隔基相鄰基序(PAM)位點之序列。PAM位點為緊隨藉由Cas (例如Cas9或Cpf1)核酸內切酶靶向之DNA序列的2-6鹼基對DNA序列。合成稱為導引RNA (gRNA)之短寡核苷酸以在CRISPR/Cas基因編輯系統中執行tracrRNA-crRNA複合物之功能。gRNA識別在5'或3'末端處具有PAM序列之基因序列。不同Cas蛋白質可識別不同PAM。例如,來自化膿性鏈球菌(
Streptococcus pyrogenes)之Cas9識別5'-NGG-3' (「N」:任意核鹼基);來自金黃色葡萄球菌(
Staphylococcus aureus)之Cas9識別5'-NNGRR(N)-3';來自腦膜炎雙球菌(
Neisseria meningitidis)之Cas9識別5'-NNNNGATT-3';來自空腸彎曲桿菌(
Campylobacter jejuni)之Cas9識別5'-NNNNRYAC-3' (「Y」:嘧啶);來自嗜熱鏈球菌(
Streptococcus thermophilus)之Cas9識別5'-NNGRR(N)-3' (「W」:A或T);來自毛螺菌科菌屬及胺基酸球菌屬之Cpf1 (Cas12a)識別5'-TTTV-3' (「V」:G、A或C);來自環脂酸芽孢桿菌屬(
Alicyclobacillus acidiphilus)之Cas12b識別5'-TTN-3';及來自嗜熱芽孢桿菌屬(
Bacillus hisashii)之Cas12b v4識別5'-ATTN-3'、5'-TTTN-3'及5'-GTTN-3'。
最後,確認所鑑別之基因間區域將安全地支撐外源基因有效負載可藉由使用基因編輯系統將轉殖基因插入基因間區域內之靶向位置來進行。基因編輯系統可為例如CRISPR系統(例如使用上文所揭示之CRISPR核酸內切酶的彼等系統)、Cre/Lox系統、FLP-FRT系統、TALEN系統、ZFN系統、利用歸巢核酸內切酶之系統、產生同源重組之系統,或利用非核酸酶依賴性病毒載體(例如反轉錄病毒載體、AAV載體或慢病毒載體)之系統。持續型、可誘導型、組織特異性或譜系特異性啟動子可用於引導所插入轉殖基因的表現。
在一些實施例中,所靶向基因間區域為至少30、40、50、75或100個鹼基對長。在一些實施例中,基因間區域不包含啟動子區或強化子區。雖然基因間區域不包含保守區、重複區、表觀遺傳標記及/或DNase超敏區可能較佳,但在一些實施例中基因間區域實際上可含有最小量之保守區、重複區、表觀遺傳標記及/或酶超敏區。例如,在一些實施例中,基因間區域將不包含CpG島、H3K4Me1表觀遺傳標記、H3K4Me3表觀遺傳標記、H3K27Ac表觀遺傳標記、DNase I超敏區、保守區或重複區。然而,在一些實施例中,基因間區域可包含CpG島、H3K4Me1表觀遺傳標記、H3K4Me3表觀遺傳標記、H3K27Ac表觀遺傳標記、DNase I超敏區、保守區或重複區。所允許保守區、重複區、表觀遺傳標記及/或DNase超敏區的量視各種因素而定。此等因素包括例如基因間區域之尺寸;保守區、重複區及/或超敏區或表觀遺傳標記之尺寸;gRNA結合位點之存在;或合成5'及3'同源臂以用於靶向之挑戰。
在基因組整合之後,量測經整合之轉殖基因的轉錄水平,且當經整合之轉殖基因呈現持續轉錄(或當誘導調節轉殖基因之可誘導型啟動子時呈現持續轉錄)時,所選基因對之間或所選區域內的基因間區域確認為STAPLR。
除非本文中另外定義,否則結合本發明使用之科學與技術術語應具有由一般技術者通常理解之含義。下文描述例示性方法及材料,但類似或等效於本文中所描述之方法及材料的方法及材料亦可用於實踐或測試本發明。在有衝突之情況下,將以本發明(包括定義)為準。此外,除非上下文另外需要,否則單數術語應包括複數且複數術語應包括單數。在整個本說明書及實施例中,詞語「具有(have)」及「包含(comprise)」或諸如「具有(has/having)」、「包含(comprises/comprising)」之變化形式應理解為暗示包括陳述的整數或整數群,但不排除任何其他整數或整數群。本文中所提及之所有公開案及其他參考文獻均以全文引用之方式併入本文中。儘管本文中引用多個文獻,但此引用不構成此等文獻中之任一者形成此項技術中公共常識之部分的許可。如本文中所使用,術語「大致(approximately)」或「約(about)」當應用於相關之一或多個值時係指類似於所陳述參考值的值。在一些實施例中,除非另行說明或以其他方式自上下文顯而易見,否則該術語係指值之範圍在所陳述參考值之任一方向(大於或小於)的10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更低內。
根據本發明,附屬請求項中之反向參考意謂用於由反向參考所指示申請專利範圍中之各個及每一組合之直接及明確揭示內容的簡寫。另外,創建本文中之標題係為了易於組織且不意欲以任何方式限制所主張發明之範圍。
為了能更好地理解本發明,闡述以下實例。此等實例僅為達成說明之目的且不應解釋為以任何方式限制本發明之範圍。
實例
實例 1 : 用於 STAPLR 靶向 之設計 gRNA 之選擇吾人使用CRISPOR鑑別靶向中點區域附近的基於Cas9之gRNA,其中STAPLR構築體同源臂側接轉殖基因整合之預期位點。吾人排除在基因組中具有完美脫靶之gRNA。吾人將具有最大3 bp脫靶錯誤配對之gRNA的使用減至最少。針對各STAPLR位點選擇三個gRNA,如
表 2中所見。
表 2.
用於靶向精選 STAPLR 位點之 gRNA
*較佳實施例。
STAPLR 位點 | gRNA 序列 (5' → 3') |
PRDX1- AKIR1A1 | CTTGCAGCACTGCCTAGGCT (SEQ ID NO: 71) |
TGGTTCTTGCAGCACTGCCT* (SEQ ID NO: 72) | |
TCTTGCAGCACTGCCTAGGC (SEQ ID NO: 73) | |
ACTB- FSCN1 | GCCCACCTTGAAGATCTGTA* (SEQ ID NO: 33) |
TGCCCACCTTGAAGATCTGT (SEQ ID NO: 34) | |
CACCTTGAAGATCTGTAGGG (SEQ ID NO: 35) | |
RPL34- OSTC | TTATCATGATACTATGTCCC* (SEQ ID NO: 25) |
AGTTACTGAGCACAGTGCCT (SEQ ID NO: 26) | |
GAGTTACTGAGCACAGTGCC (SEQ ID NO: 27) | |
AKIRIN1- NDUFS5 | ATTAATGCCTTTAAATAGGT (SEQ ID NO: 55) |
TCTTAAACCTACCTATTTAA* (SEQ ID NO: 56) | |
GCTAATTAATGCCTTTAAAT (SEQ ID NO: 57) |
用於STAPLR靶向之額外基於Cas9之及基於Cpf1之gRNA的清單列於
表 3中。
表 3. 額外 STAPLR 靶向之 gRNA
STAPLR 位點 | 核酸酶 | gRNA 序列 (5' → 3') |
PRDX1- AKIR1A1 位點 1 | Cas9 | CTTGCAGCACTGCCTAGGCT (SEQ ID NO: 74) |
TGGTTCTTGCAGCACTGCCT (SEQ ID NO: 75) | ||
TCTTGCAGCACTGCCTAGGC (SEQ ID NO: 76) | ||
TAGGCTGGGCTCAAACTCCA (SEQ ID NO: 77) | ||
CTAGGCTGGGCTCAAACTC (SEQ ID NO: 78) | ||
TGAGAGGATCACTTGAGCCC (SEQ ID NO: 79) | ||
CTGGAGTTTGAGCCCAGCCT (SEQ ID NO: 80) | ||
TTCTTTGTTTGTTTAGAGAC (SEQ ID NO: 81) | ||
Cpf1 | AGCCCAGCCTAGGCAGTGCTG (SEQ ID NO: 82) | |
GAGACTGGTTCTTGCAGCACT (SEQ ID NO: 83) | ||
TTTAGAGACTGGTTCTTGCAG (SEQ ID NO: 84) | ||
TTTGTTTAGAGACTGGTTCTT (SEQ ID NO: 85) | ||
TTTGTTTGTTTAGAGACTGGT (SEQ ID NO: 86) | ||
ACTB- FSCN1 | Cas9 | GCCCACCTTGAAGATCTGTA (SEQ ID NO: 38) |
TGCCCACCTTGAAGATCTGT (SEQ ID NO: 39) | ||
GGGCCAAGAGGCTCAGTCAC (SEQ ID NO: 40) | ||
GGATAAAGAGATCAGGTCCA (SEQ ID NO: 41) | ||
CACCTTGAAGATCTGTAGGG (SEQ ID NO: 42) | ||
TCCCTACAGATCTTCAAGGT (SEQ ID NO: 43) | ||
TTCAAGGTGGGCAAGGAACT (SEQ ID NO: 44) | ||
TCCCTCCCTACAGATCTTCA (SEQ ID NO: 45) | ||
CTCCCTACAGATCTTCAAGG (SEQ ID NO: 46) | ||
ACCTTGAAGATCTGTAGGGA (SEQ ID NO: 47) | ||
CTTCAAGGTGGGCAAGGAAC (SEQ ID NO: 48) | ||
ACAGATCTTCAAGGTGGGCA (SEQ ID NO: 49) | ||
AAGAGATCAGGTCCAAGGCC (SEQ ID NO: 50) | ||
GGGCAAGGAACTGGGCCAAG (SEQ ID NO: 51) | ||
TAGGGAGGGATAAAGAGATC (SEQ ID NO: 52) | ||
ATCAGGTCCAAGGCCAGGTG (SEQ ID NO: 53) | ||
AGGTCCAAGGCCAGGTGCGG (SEQ ID NO: 54) | ||
TGAACCACCGCACCTGGCCT (SEQ ID NO: 36) | ||
Cpf1 | TCCCTCCCTACAGATCTTCAA (SEQ ID NO: 37) | |
RPL34- OSTC | Cas9 | TTATCATGATACTATGTCCC (SEQ ID NO: 28) |
AGTTACTGAGCACAGTGCCT (SEQ ID NO: 29) | ||
GAGTTACTGAGCACAGTGCC (SEQ ID NO: 30) | ||
Cpf1 | CAAGCATTTATCATGATACTA (SEQ ID NO: 31) | |
TCATGATACTATGTCCCAGGC (SEQ ID NO: 32) | ||
AKIRIN1- NDUFS5 | Cas9 | ATTAATGCCTTTAAATAGGT (SEQ ID NO: 58) |
TCTTAAACCTACCTATTTAA (SEQ ID NO: 59) | ||
CCACTTCCCTCCTCCATTAA (SEQ ID NO: 60) | ||
GCTAATTAATGCCTTTAAAT (SEQ ID NO: 61) | ||
CTTTAATGGAGGAGGGAAGT (SEQ ID NO: 62) | ||
CCTTTAATGGAGGAGGGAAG (SEQ ID NO: 63) | ||
TTTAATGGAGGAGGGAAGTG (SEQ ID NO: 64) | ||
Cpf1 | ATGGAGGAGGGAAGTGGGGTG (SEQ ID NO: 65) | |
AGAGAATCTATGTCACCCCAC (SEQ ID NO: 66) | ||
AAGGCATTAATTAGCGTTTGC (SEQ ID NO: 67) | ||
AATAGGTAGGTTTAAGAGAAT (SEQ ID NO: 68) | ||
CATGCACTACTTTAAAATTTT (SEQ ID NO: 69) | ||
AAGTAGTGCATGCAAACGCTA (SEQ ID NO: 70) | ||
PRDX1- AKR1A1 位點 2 | Cas9 | AAGGGCCAAGGGAGTTAGTG (SEQ ID NO: 87) |
AGCTCCCTCACTAACTCCCT (SEQ ID NO: 88) | ||
AGGGCCAAGGGAGTTAGTGA (SEQ ID NO: 89) | ||
PRDX1- AKIR1A1 位點 3 | Cas9 | ATGAAAAATAAGCCCGGTAG (SEQ ID NO: 90) |
CAGGCTGAGTCACCACTACC (SEQ ID NO: 91) | ||
ACAGGCTGAGTCACCACTAC (SEQ ID NO: 92) |
對於各STAPLR位點,用與呈核糖核蛋白(RNP)形式之Cas9核酸酶複合的各個別gRNA對人類iPSC進行核轉染。三天後,收穫經核轉染細胞,萃取基因組DNA,且對側接預期切割位點之基因組區域進行PCR擴增。對經純化PCR產物進行定序,且經由Synthego之ICE Analysis Tool (可在Synthego之網站獲得)分析定序資料之總切割效率(
圖 1)。當顯示大於50%的插入缺失編輯時,認為gRNA為有效的。
資料顯示每個STAPLR位點存在至少一個有效gRNA (>50%的插入缺失編輯)。選擇具有最大總切割效率之gRNA用於未來實驗以在STAPLR位點整合轉殖基因。
STAPLR 同源臂之設計生成由均高度表現之基因組成的基因鄰之清單。對此清單進行篩選以移除含有至少一個基因為已知腫瘤抑制基因或致癌基因的基因對。起初,忽視其間具有小於5 kb基因間距離之基因對。然而,亦可標註且測試側接基因之間僅具有約100個鹼基基因間距離的基因對。設計中避免啟動子區、強化子區、CpG島及含有表觀遺傳標記物之區域。將避免調節元件且能夠在供體質體中合成之子區域歸類為潛在同源臂區且用作gRNA搜尋之基礎(
表 4)。
表 4. 用於選擇 STAPLR 之參數
STAPLR 位點參數 |
位點側接有高度表現之相鄰基因 |
側接基因不係已知腫瘤抑制基因或致癌基因 |
側接基因之間的基因間距離>50個鹼基 |
位點避免已標註之調節元件及重複區 |
位點允許同源臂合成且選殖至供體構築體中 |
位點具有可用的CRISPR gRNA,該等CRISPR gRNA具有預測之高效率及低數目之脫靶 |
在選擇具有預測高效率之gRNA之後,同源臂序列最終確定集中於在側接轉殖基因整合預期位點之800 bp左同源臂及800 bp右同源臂之內的所選gRNA。
表 5指示各例示性STAPLR位點之兩個基因鄰之間的鹼基對中的基因間距離以及基於hg38人類參考基因組之各組STAPLR左同源臂及右同源臂之配位。使用NCBI之RefSeq資料庫計算基因距離。
表 5. STAPLR 基因鄰之間的基因間距離及 STAPLR 同源臂配位
基因鄰 | 同源臂染色體配位 (Hg38) | 基因間距離 (bp) | 插入點至上游基因鄰之距離 (bp) | 插入點至下游 基因鄰之距離 (bp) |
RPL34- OSTC | chr4:108,638,253-108,639,852 | 20,100 | 8,568 | 11,532 |
ACTB- FSCN1 | chr7:5,545,025-5,546,624 | 62,214 | 15,223 | 46,991 |
AKIRIN1- NDUFS5 | chr1:39,012,798-39,014,397 | 20,229 | 7,533 | 12,696 |
PRDX1-AKR1A1 位點 1 | chr1:45,525,540-45,527,139 | 27,888 | 3,449 | 24,439 |
PRDX1-AKR1A1 位點 2 | chr1: 45,524,377- 45,525,976 | 27,888 | 2,286 | 25,649 |
PRDX1-AKR1A1 位點 3 | chr1: 45,528,804- 45,530,403 | 27,888 | 6,713 | 21,222 |
基於hg38人類參考基因組之靶向構築體之左同源臂及右同源臂的序列顯示於下表中。
表 6. STAPLR 左同源臂及右同源臂
STAPLR 位點 | 左同源臂 | 右同源臂 |
AKIRIN1- NDUFS5 | TTCTCATTTAGCAAGAGTGGAAAACTGTTGTGGATCCCAGGAGAAGTCTGGAGCTAGGTAGTAGGGGCTAGATAATAGAGGGCTTTGACTAATAGGAGTTTGGGCCTTATCCTGTGGAAATCTGAAGGGTTTTGGGAAAATGAATTCAGGGCTAGGTGCAAGACAGAAGGGCAAATACCAGACTAAGACACACAGCCACTAAGAGCCTCTTTTTTTTTTTTTGTCCAGTCAGAGGTAATGAGGCCTATATATTTATTAGGAAGGATGATTAACCATGGCTGTAGCTTCACCTAAGAGGAACGTGGCTCTTGGGCCGGGTGCGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGTAGAGGTGGGCGGATCACCTGAGGTCAGGAGTTCAAGACCAGCCTGACCAACATGGAGAAACCTCTTCTCTACTAAAAATACAAAATTAGCCGGGCGTGGTGGTGCATGCCTGTAATCCCTGTTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACCTGGGAGGTGGAGGTTGCGGTGAGCTGAGATCACACCATTGCACTCCAGCCTGGACAACAAGAGCAAAACTCTATCTCAAAAAAAAAGAGAGGAATGTGGCTCTTGAAGAATCTTTCTAGTCTCATCTTCCCTGTCCCCTTAGACACACCTTCAAAGATCCTTTTTCTTTTGGTTTGGCTTGTCTTTCCCCCTCACTTTACCTAATCCAGCCCAATTCCATAGCCACTGCTGGTTCCTTTAATGGAGGAGGGAAGTGGGGTGACATAGATTCTCTTAAACCTACC (SEQ ID NO: 17) | TATTTAAAGGCATTAATTAGCGTTTGCATGCACTACTTTAAAATTTTCCTCTCAATTGCTTGAGTCCAGGAGTTCGAGGTTACGGTGAACTATGATTTCACCATTGCAGTCCAGCTGAGGCAACAGAGAGAGACCCTCTTAAAGAAAAAAAAAACTTTTTCCTCTCAGACTCTGTCCCTAGCATTGACTCACCCCATCATTTTTTTTTTTTTTCTTGAGATGGAGTTTCAAGAAAAAACTCCAGGCTGGAGGCAGTGGTATGGTCTCGGCTCACTGCAACCTCCGCCTCCCGGGTTCAAGCGATTCTCCCTGCCTCAGCCTCCCAAATAGCTGGGATTACAGGCACCCGCCACCACACCCAGCTAATTTTTTGTATTTTTAGCAGAGACGGGGCTTCTCCATATTAGCCAAGCTGGTCTGGAACTCCTGACTTCAAGTGATCCACCCACCTTGGCCTCCCAAAGTACTGGGATTACAGGCACGAGCCACCGCGCCCGGCCTTCACCTATTATATCTATTCTTGTCTTTTAAATAGTGAGTGACTTCACAGCTCAGTCTCTTTGTTCTGAACTTCCATTCTGAGTCGCAACCCAGGTACACCTTAGGAAGGGCGGGATCCCGTTATCCTGTCCCTGAACATCAACTACTGAGACAGCTGATGAAGCTGGCTCGGTGTGTGACGGAGGCCCCCTCAGAGTCAGCAGAGCCGAGCGTACAGCGCACATCAGGCAGAGCAGACCAGAGGCAGGGAAGACACACTGGGGCAGGGCCAGTGGGCACATCTGGACCACCTGCGAGGG (SEQ ID NO: 18) |
RPL34- OSTC | TTATTCTTCACAGAGGACAGCTCCCAACTCTTTACCTCTCTTCCTAATGCAACACTCACTCTCACTCTCAGCAGCCTTATAATATCTGTAAATGTAGAAACTATCAGTTATGAACTTCTGTAACTCCCTTTTCATCTTTGGCACCTCAAAACTTTAATGTATGTAAAAGCATGGGCTTTGAAATTGGTAAACTGGAGCTCTATCAATCTCTGGCTGTGTCAACTTGAGCATGTTGCCCAATTTCTATGAGCCTCAGTTTTCTTATCTAAAAAATGAAACTAATAATGCCTACTCCAAAGAATTGTTGGATGGATTAAGTAAGACAACCTAATATAATTGCTGTGCATAGTAAATCCTAACTGTTGGTTGCCTTATACCTCTAATCTTCTTTCTGCTCTCTTTTCTTTAGAAGATGGCATGCATCTTTTCCAAGGTAAATTTTACCTCTGTTGAACTCTATCCCATACTCTCTTGCCATGGCCCTAATTTTGTTCAGTTACTTAACTCCTTCCCTTCCCTCTGACATCCTTGGTCCCTTCCTCTCCACAGTTTTATTCTCTCGTCTTACACAAACATGCCCAAGTCTCATCATCCATAAAAACCTCTGTCATTACCACTTCAGCTCTCTTCTTCTGTTCATACCCAGCTGTGTTGGGTGCCATGAATCATTCACTACTATTATTTTTAAAATTCCTATCACTACTTCTCCCCTCTGCAATCTGGCTTCTCCTGCCAACATGCTACTGAAATTAATGAATTAATTCATCAAATATTTACAAGCATTTATCATGATACTATGT (SEQ ID NO: 19) | CACAGGCACTGTGCTCAGTAACTCAAGTCATTATAATACTGTGTGCTTGACAATATGTTGTACTTACTGGCCAAAAATCACCAATGTCTAATTGTCAAGCTAAATGTCTTCTTTCAATTTCAATCTATCTGACATGCTGGAAACTTCCCTTTCCAAGGCTTCTTTGCTATCGCTCCCTTGGCTCTTCTGTTCCTTTGATCTTGCTGTATTTACTTTGTAGTATCCTCCTAATTATGGGGGTGATTCCCTAGGCATCCATCTTCAGCTTTCTTCTCTCTCACTCTTTTAACTTTACTCTGTGAATTTCCTGTAATTATACACTACATTTGGTGTGTGTGTGTGTGTGTCTGTGTGCACGTGCATTTTTCTAGGAAGGAGTTCATAGCTTTTATCAGCTCTGCAAGGAGGTCTATGACCCTCCCAATAACAACCCTGACCAGTTCCACCTCACGTGTAGACACATTCTTCCACTGTGATGACTTCCATTATCCTCCACATGCTGCTGATTCCTGGATCTCCAACCCTAAACCTCTTTCCCATGCTCCAGCGACCATCTTCCCAACTCTGCCTAGGTCCCTCCTGGAGGGTCCTTCTAGAATAATAGTTCTCATCAGGCAGGTGGCAGAACCTCTGTCTCCCACTCCTTGCATGCCCCTCTGTGAGGCTTGGGTGGGTTGGGGGTGATGGGAGGGGTGCGTGTATAATCAGAGTCCCTGGGGTGCAGAAGCTCTGTTCTGACCTTGCCTCTTGCTATCCATGGAATTACTGCTCTATCCTGGCCATTTTCCCATTCTCTTTCT (SEQ ID NO: 20) |
ACTB- FSCN1 | GAAGCCGGGTGTGGTGGTGCATGCCTGTGGTCCCAGCCACTTGGGAAACTGAGGTGGGAGGATTGCTCAAGCCCAGGAGGTCAAGGCTGCTGTGAGCTATGATTGTGACACTGCACTCCAGCCTGGGCAACAAAGGGAGACCCCTTAACTAACTAAATGAATGAATGAATGAATGAATGAAGGCAACCTGAGCTGCATTCCTTGGCCTGCCAACCTGCCCAGCCCCATCCCTCAGCCCTCCCTGAGTCTGAGGGCCCTGCAGGTCCCACACAGGGCCAGGCTCCATCTTGTTTCTGCAAATTTGCACCTTCCGTTCCATTCCCTGCCACACTGCTCACGGGTCACCATGGATGCTGGATAACTGCCACCGTCTCCTTGGAGAAGCCCTCCGTCATCTCAGCCCCTGATGTCAGGTATTCAACCTGCAAATCCTCCCTGTAGGTGCTGGGCTCTCCAGAGCCCTGGGCTGTGTGCAGGGGACTCAGGGGAGAACGGGCCCCACCCAGCTCCTTCCTCACAGAGCTTTCAGAGGCTGGGGGCCTCCCTGATCCCCTCCCAGATCCCAAGGCCCCTGCTGCCCCCACCCTGCAGACTGGGACTCCGTGAGGCTGGGCTCTGACTTGGATATTGTGGTTCCAGCACACAGCAGGCACCGTGGCTGTAGTAGGCGTGCATGGGAAGTCAGGAGGAGCAGACCTGTCATCTCCCCTGCTGAGGACACAGCCCGGTCAGCGTGTCTTGGCGGCCTGGGGCCAGTGACTGAGCCTCTTGGCCCAGTTCCTTGCCCACCTTGAAGATCT (SEQ ID NO: 21) | GTAGGGAGGGATAAAGAGATCAGGTCCAAGGCCAGGTGCGGTGGTTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCAGGCAGATCGCGAGGTCAGGAGTTCGAGACGAGCCTGGCCATCATGGTGAAACCCCGTCTCTACTAAAAATACAAAAATTGGCCAGGCATGGTGGCAGGCGCCTGTAATCCCAGCTGAGGCAGGAGAATCGCTTGAACCCGGGAGGTGGAGGTTGCAGTGAGCCGAGAGCGAGCCACTGCACTCCTGCCTGGGTAACAAAGCAAGACTCCATCTCAAAAAAAAAAAAAAAAAAAAAAATCAAGTCTGGCGCAGCCCCAGGAAGCAATCTTGGGCTGGGCACACCGCATTTCTGTGACATGAAGGCAGCGACACCTCGTCGCTGTCACAGGGTTGCTGGGGTTGGGGGCTAGAGGAGAGGAGGAGCCTCTGTTGAGGGCTCCAAGAAGGGACAGAGAGGTGGTGCTCATGGGTCCTGGAGACACCTTTTGGGTGGTTCGTGCCCTCCATCCTGGGCCACTTTGGGGAGGTGAAGGAGGGAAGCATTAAGGGACAAGACCCCCCGTTCCCAATTTCTCTCCGGAGCCAGGGTTTCTCTGATTCGAAGAAACAGGTGTCACAACCCAGGAAGTCCACTGATGGCATCTGCCCTGGGGCATCAGCATTTAGGGCTGATCACTGAGGTCTGCACCTCCCAAGGCTGCTGTGCCCATTCCTGGGCGCCCCAAAGGGGAAGAAAAACTCCTGAATGTGCACCGGGACAGGACCCATCCCATGCGG (SEQ ID NO: 22) |
PRDX1- AKR1A1位點1 | AGAAAATTGCCACCTATTGTATTCACCATATGCCAGGCATTGGGCTGGGCACTTGAGTTTATTTTTCTAATTCAAGAACAAGGCCAGGCACGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTAAGGCGGGCAGATCACAAGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGAGAAATCCCATCTCTACTAAAAATACAAAAATTAGCTGGGTTTCGTGGTGTGCACCTGTAGTCCCAGCTACTCAGGGGGCTGAGGCAGGAGAATCTCTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCCGAGATCGCGCCACTGCACTCCAGCCTGAGTGACAGAGTGAGACTCCGTCTAAAAAAAAAGAACAAAAGCCGGGCATGGTGGCTCAAGCCTGTAATCCCAGCACTTTGGGAGGCCAAGGTGGGCAGATCATGAGGTCAGTAGTTCCAGACCAGCCTGACCAACATGGTGAAAACCTGTTTCTACTAAAAATACAAAAATTAGCTGGGCGTGGTGGCAGGCACTTGCAATCCCAGCTACTCAGGAGGCTGCAGCAGGAGAATCACTTGAACCCGGGAGGCAGAGGTTTTAGTGAGCTGAGATCCCGCCACTGCACTCCAACCTGGGCAACAGAGCAAGACTCTGTCTCAAAAAAAAAAAAAAAGAAAAAAGAAAAAAAGAAAAGAAAAAAGAACTAAAAGAGAGTGGAGCACATTTGGCATGTGACTATAGTCCCAGCTACTTGGTAGGCTGAGGTGAGAGGATCACTTGAGCCCTGGAGTTTGAGCCCAGC (SEQ ID NO: 23) | CTAGGCAGTGCTGCAAGAACCAGTCTCTAAACAAACAAAGAAAAAAAAACAGGAAAAAAAAAGAGTTATCCTAGCCTAGAGAAATGTTAACAGTCTATCCCCTTAAGATCATAAAAGTGAAATAACTGGACAGAGTACTGAAAAAAGAAGAAATCTGTTGAACAAGTCTAAGTGATTTGTAGAGTCTCTCCAAAGGACAGTAAAGATTTCAGAACCATGGGGAGGAGGCTTTCTTGCAGGGTCTGATGTATACCTCTAGTTCTATTTTTAGATATATTCCATTGTGCTCTCTTCATTTGCTCACCATTAGCATGGGAATTATTCCCCTTGTTTTATTTATATTTGTAGTAACAAGTCTAGCACAGTAACTGGCATAGAAGTACTTAATAAATGTTACAATGTGTTGAAGACTTTTGAGATGTAGAATTAAATTATTTGAACTACGTTTCAGGAAGTTGACTCTGGAAGCTGTGTGATGAATGAATTTAGTGACTAGGAGATTAGGCAAAGAGAGCAATTGGGAGGCCACGGCAATGATCCAGACAAGAGAAGTCTCAGAACTGTAATATGACATTAGCAGCAGGGTAGAAAGAAGGAAATACAAGGTATATTTCTTCAGGCTTTAGGATTAATTGGATTTAGGATGAAAGGAAAGAGTAAATTAAATCCAGTTTCTTGGTGACATGAGTGATGTCATTAACCTGTGACATAGGAAACACTGGAAGAAAAGCAGGTTTGAGGTTTAAAATAATGTTAAACAGGCCGGGAGCGGTGGCTCACGCCTGTAATCCCAACATTTT (SEQ ID NO: 24) |
PRDX1- AKR1A1位點2 | AATAATATTAATACTTTATTGTGATTATCTATGTAGTTCAGTACAGTACTTAGTTCTTATTATAAATTAGAAATGTTAGCTGCTATTAGTATAACTCTTCCATCCTTCACACTTATAACACCCAGAACACAGTGTAGTTGTTTCAAGCCTTCAGACTTTTTTTTTTAAGATGGAATTTCGCTTTTCTTGCCCAGGCAGGAGTGCAATGGCACGACTTCTGCTCACTGCACCCTCCACCTCCAGCGTTCAAGCAATTCTCCTGCCTCAGCCTCCCAAGTAGCTGGGATTACAGGCGCCCACCACCACGCCCGGCTAATTTTTTGTATTTTTAGTAGAGACGGGGTTTCAGTATGTCAGCCAGGCTGGTCTCAAACTCCTGACCTCAGTTGATCTACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGGAGTGAGCCACTGAGCCCGGCCGCCTTCAGACTTTTGTTTGAACCTGGAAAACTCTTTCCCTGGAGAAAACATGTCTTTCAGCATTACTTTCTCTCCGGCTGTTTCTTACCTTTACTCATTCCCAGGATTTACAATTCCCCTCCTTTGTGTCCAAACAATAGCTTGTATAGCCAAAAAAATCTTTTAAGCAATTTTAGTTTTACATTTCTTCCTCTGCCTGCTAGAGTGACTTTCTGGAGAGTAGGATGTGGGTGACATCTGTCTCTGTGTCCCCAAAGTCACAACAAAGCATCTGATATAAAATAGGAGCTCAGTCAGTGAGCATTCAATCAATAGTATCATGTTTCTGTCTCTGTCCCCAGCTCCCTCAC (SEQ ID NO: 93) | TAACTCCCTTGGCCCTTATAGTGGGATAATGAATGAGGAAGTGCTGTCTCATGCTCATTGAGCATCTCAATTTTTGTTATTTATCATACTACTTTGCATAGACGTGATTTATTTGCTTTTTCCTTCTTTGCCTGAGGCTGAATAGTTAGTTGGCATTATTCCTTTTTTTAATTTTTATGTAACTTTTATTCTTTTTTATCAGGCAGCCACCCGAGCCAGCAGCCAGCGTAGGCTCAGAGAGACTCCCCTTTCTTTCTTGCAGGAGCAAGGGCAGCATGAAAGTTCAGAGCTTAATAATGGATGGTTATTGGCTATGGGCAGGCTAAACCAATACACAGTACATACAGTCATACTTCAGCCCAAAGAAAATTGCCACCTATTGTATTCACCATATGCCAGGCATTGGGCTGGGCACTTGAGTTTATTTTTCTAATTCAAGAACAAGGCCAGGCACGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTAAGGCGGGCAGATCACAAGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGAGAAATCCCATCTCTACTAAAAATACAAAAATTAGCTGGGTTTCGTGGTGTGCACCTGTAGTCCCAGCTACTCAGGGGGCTGAGGCAGGAGAATCTCTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCCGAGATCGCGCCACTGCACTCCAGCCTGAGTGACAGAGTGAGACTCCGTCTAAAAAAAAAGAACAAAAGCCGGGCATGGTGGCTCAAGCCTGTAATCCCAGCACTTTGGGAGGCCAAGGTGGGCAGAT (SEQ ID NO: 94) |
PRDX1- AKR1A1位點3 | TGTTCACGTGTTTGTCTGCTGACCCTCTCCCCACAATTGTCTTGTGACCCTGACACATCCCCCTCTCCGAGAAACACCCACAAATGATCAATAAATACTAAGGGAACTCAGAGGCTGGCGGGATCCTCCATATGCTGAACGCTGGTCCCCTGGGTCCCCTTATTTCTTTCTCTATACTTTGTCTCTGTGTCTTTTTCTTTTCCAAGTCTCTCGTTCCACCTAACAAGAAACACCCACAGGTGTGGAGGGGCAACCCACCCCTTCACCATCTCCACAAAAAATAAAAAATTAGCCCAGTGTGGTGGTGTGTGCCTGTGGTCCTAACTAGTCCAGAGGCTGAGGTGGGAGGATTGCTTGAGTCCCAGAGCTCGAGGCTGCAGTGAGCCGAGATGGCACCACTGTACTCCAGCCTGGGTGACAGAGTGAGCAGAGTGAGACCCTGTCTCAAAAAATAATAAAATAAAATAATGGGAACCCAAATCACAAGACAGCACTCATTTTTCTTTTATTTATTTTATTTTTTTTGAGACAGAGTCTTGCTCTGCTGCCCAGACTGGAGTGCAGCAGCATGGTTTCGGCTCACTGCAACCTCCACCTCCTGGGTTCAAGTGATTCTTGTGCCTCAGCCTCCCAAGTAGCTGGAATTACAGGTATGTGCCACCATGCCTGACTGATTTTTGTATTTTTAATAGAGACAGGGTTACGCCATGTTGTCCAGTCTGGTTTCGAACTCCTGGTCTCAAGGGATTCACCCATCTCGGCCTCTCAAAGTACTGGGATTACAGGCTGAGTCACCACTA (SEQ ID NO: 95) | CCGGGCTTATTTTTCATACAGATGATTTAGAATATGTTTATGTTAAATTTTTTTAGATTATCACTAAAAGAAAACAGTTGAATTCTTCAATTTACAAGGATTCAATTTTTAAAATTATATTTGAATGTACAGAGGCCTACAAATACCAATTTCAGAAACACTGTTATCAAGGATATCTATTTGTTAAAATTGAATGCAACTGAAAGTAACAGATTAACTGCAAATAACAAGCTTAACCAAATAGGGGATTAATTTTTCCCATTTAACAAGGAGACAGGGCCGGGCACAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGTCGAGGCGGGTGGATCACTTGAGGTTGGGAGCTCAAGACCAGCCTGACCAACATGGAGAAACCCCGTGTCTACGAAAAATACAAAATTAGCCGGACGTGATGGTACATGCCTGTAATCTCAACTACTCGGGAGGCTGAGGCAGGAGAATGGCTTGAACCTGGGAGGTGGAGGTTGCAGTGAGCCAAGATCGCGCCATTTGCATTCCAGCCTGGGCAACAAGACGAGCTCCGTCTCAAAAAAAAAAAAAAAAAAAAAAAAGCAAGTAGACAGGGCCAGGTGGAGTGGCTCATGGTTGTAATCCCAGCATTTTGGGAGGCCGAGATGAGAGGATCATTTGAGCTCAGGAGTTGGAGACCAGCCTGGGCGACATAGGGGTACCCATCTCTACAAAAAATTAAACAAACAAACAAAAAATAGCCAAACATGATGACGCATGCCTGTAGTCCCAGCTACCCAGGAGGCTGAGATGAGAGAAT (SEQ ID NO: 96) |
實例 2 : 在所 靶向 iPSC 合倂群體中之 STAPLR 處之可誘導性及轉殖基因表現的試驗為了測試四個已標註STAPLR位點(
PRDX1-AKR1A1(位點1)
, ACTB-FSCN1, RPL34-OSTC, AKIRIN1-NDUFS5)中之各者處的可誘導性及轉殖基因表現之穩固性,使用來自Clontech/TakaRa之雙組分去氧羥四環素可誘導型rtTA/TRE系統Tet-On 3G (如美國專利9,127,283中所描述,其以全文引用之方式併入本文中)。對於持續型組分,經由本發明諸人之「持續轉殖基因表現基因座」(STEL)方法,Tet-On 3G rtTA (反向四環素反式活化因子(reverse tetracycline transactivator))自GAPDH基因座以二對偶基因形式表現(
圖 2),如WO 2021/072329中所描述,其以全文引用的方式併入本文中。
為了測試來自STAPLR位點之轉殖基因的可誘導性,使用TRE3G啟動子測試eGFP運載物之表現。將Kozak序列包括在內以實現轉譯起始且添加SV40 PolyA序列以實現轉錄終止。在去氧羥四環素存在下,rtTA蛋白質結合至且活化四環素反應元件(TRE)最小啟動子(
圖 3)。對於各STAPLR位點,用所選高效RNP及對應STAPLR靶向構築體(STAPLR左同源臂-TRE3G啟動子-eGFP-SV40-STAPLR右同源臂)對在
GAPDH下具有二對偶基因rtTA整合之親本iPSC細胞株(GAPDH::rtTA iPSC)進行核轉染。從核轉染後第一天(
圖 4)開始且持續至核轉染後第七天(
圖 5),向接受STAPLR RNP及STAPLR靶向構築體之細胞的池進給含有2 μg/ml去氧羥四環素之培養基以便誘導GFP表現。亦給與親本rtTA iPSC細胞株2 μg/ml去氧羥四環素培養基作為對照物。藉由螢光顯微鏡檢查術在一週過程內監測GFP表現。隨著細胞經去氧羥四環素治療更長持續時間,觀測到GFP強度之增加。此基於rtTA/TREG之轉殖基因表現系統在STAPLR處之初步試驗指示靶向STAPLR位點之iPSC的合併群體中值穩固的GFP可誘導性及表現。
實例 3 :在所 靶向 iPSC 純系 群體中之 STAPLR 處之可誘導性及轉殖基因表現的試驗用RNP及STAPLR靶向構築體在四個STAPLR位點中之各者處對親本GAPDH::rtTA iPSC進行核轉染,隨後以純系密度接種靶向STAPLR之iPSC的各合併群體。藉由PCR跨越左同源臂與右同源臂之接合點挑選及篩選個別殖株,以確認TRE3G-eGFP-SV40在四個STAPLR位點中之各者處的精確整合。擴增所靶向iPSC殖株且用含有在0.1 μg/ml至5 μg/ml之範圍之去氧羥四環素的培養基治療0至68小時。在此GFP誘導時程內之0、3、8、24、48及68小時的時程收集細胞且進行流動式細胞量測分析(
圖 6)。結果表明來自所有四個STAPLR位點之最大GFP誘導可見於投與0.1 μg/ml去氧羥四環素及投與去氧羥四環素48小時之後。STAPLR位點之最大GFP表現量不同,其中
PRDX1-
AKR1A1位點展現去氧羥四環素誘導之iPSC中的最高GFP表現。隨後用含有2 μg/ml去氧羥四環素之培養基治療來自各靶向STAPLR位點之一個純系衍生細胞株及野生型未經編輯之iPSC對照細胞株持續72小時(
圖 7)。
AKIRIN1-
NDUFS5STAPLR細胞株展示稍微延遲之GFP誘導,因此用含有2 μg/ml去氧羥四環素之培養基治療增加至6天(
圖 7)。結果表明所有四種經治療的靶向STAPLR之iPSC細胞株可誘導高GFP表現量,其中
PRDX1-
AKR1A1位點再次展現去氧羥四環素誘導之iPSC中的最高GFP表現,而野生型未經編輯之經去氧羥四環素治療的iPSC對照細胞株不表現GFP。在所有情況下,未接受去氧羥四環素治療之細胞不表現GFP。
實例 4 :在 iPSC 衍生之骨髓祖細胞中之 STAPLR 處之可誘導性及轉殖基因表現的試驗將純系衍生之STAPLR iPSC細胞株分化成骨髓祖細胞,以證明STAPLR處之轉殖基因整合在分化iPSC中維持持續轉殖基因表現(Douvaras等人,
Stem Cell Reports(2017) 8(6):1516-24)。在分化第12天添加2 μg/ml去氧羥四環素至各靶向STAPLR之純系細胞株,且每日補充去氧羥四環素持續三天。在分化第15天,收穫附著型骨髓祖細胞用於GFP誘導之流動式細胞量測分析。與未接受去氧羥四環素之分化細胞相比,四個TRE-eGFP-SV40 STAPLR細胞株中之三者(
PRDX1-
AKR1A1、
ACTB-
FSCN1、
RPL34-
OSTC)展現異質附著型骨髓祖細胞中之有效GFP誘導(
圖 8)。使用相同方案分化且經去氧羥四環素類似治療之野生型未經編輯之iPSC對照株不顯示GFP之誘導。在螢光顯微鏡檢查術下,TRE-eGFP-SV40 STAPLR細胞株中之一者(
AKIRIN1-
NDUFS5)展現延遲之GFP誘導。向此細胞株再補充去氧羥四環素持續額外三天且在分化第18天收穫附著型骨髓祖細胞用於流動式細胞量測分析。
圖 8顯示可見於在分化第18天收穫之骨髓祖細胞的雙峰GFP誘導。在所有情況下,未接受去氧羥四環素治療之細胞不表現GFP。
超過30天後STAPLR靶向細胞株進一步分化直至在懸浮培養物中可收集非附著型骨髓祖細胞之時間點。添加2 μg/ml去氧羥四環素持續六天且採集非附著型骨髓祖細胞用於GFP誘導之流動式細胞量測分析。超過30天培養之所有四個TRE-eGFP-SV40 STAPLR細胞株展現向三陽性骨髓祖細胞之有效分化,如藉由細胞表面標記物CD45、CD14及CX3CR1共表現>80%所定義(
圖 9)。與經去氧羥四環素治療之野生型未經編輯之對照細胞株相比,經去氧羥四環素治療之STAPLR細胞株亦展現異質非附著型骨髓祖細胞中之有效GFP誘導,其中最大GFP表現量有一些變化(
圖 10)。此資料表明,在所有四個STAPLR位點處之轉殖基因整合准許在外部啟動子控制下在分化成骨髓祖細胞期間及之後保持轉殖基因表現。
實例 5:
人類誘導性多潛能幹細胞株之衍生與來自 PRDX1-AKR1A1 STAPLR 位點之 CD19t-IL12 的可誘導型表現使用用於
PRDX1-
AKR1A1STAPLR位點(位點1)之所選高效RNP及包含側接PRDX1-AKR1A1左同源臂及右同源臂之由去氧羥四環素可誘導型啟動子(TRE3G)驅動之CD19t-IL12序列盒的靶向構築體,對在
GAPDH下具有二對偶基因rtTA整合之親本iPSC細胞株(GAPDH::rtTA iPSC)進行轉染。CD19t在本文中作為非生物功能性運載物包括在內;其充當用於藉由流動式細胞量測術替代偵測IL-12轉殖基因整合之抗原決定基標記物。使用兩個不同gRNA及其相應核酸酶靶向
PRDX1-
AKR1A1STAPLR位點。選擇具有序列5'-GAGACTGGTTCTTGCAGCACT-3' (SEQ ID NO: 83)之基於Cpf1之導引RNA或具有序列5'-CTTGCAGCACTGCCTAGGCT-3' (SEQ ID NO: 71)之基於Cas9之導引RNA以產生純系細胞株。GAPDH::rtTA持續表現來自GAPDH基因座之反向四環素反式活化因子(rtTA)。在去氧羥四環素存在下,rtTA結合至TRE3G啟動子且誘導由TRE3G啟動子驅動之CD19t及IL-12的表現(
圖 11)。
製備GAPDH::rtTA iPSC之單細胞懸浮液用於用Cpf1或Cas9 gRNA RNP複合物及
PRDX1-
AKR1A1靶向pTRE3G-CD19t-IL-12 DNA供體模板轉染。轉染後兩天,用去氧羥四環素(2 μg/mL)治療細胞48小時以誘導CD19t-IL12表現,使用AF488結合抗CD19t抗體染色的活細胞成像對其分析(
圖 12,圖A及圖B)。隨後解離細胞且以單細胞純系密度接種。純系密度接種之後四天,用2 μg/mL去氧羥四環素治療生長菌落持續48小時以誘導CD19t-IL-12表現。在48小時去氧羥四環素治療之後,使用AF488結合抗CD19t抗體用活細胞成像分析菌落。鑑別CD19t陽性菌落(
圖 12,圖A及B圖,標記在「純系密度」下)。
資料表明,
PRDX1-AKR1A1STAPLR位點處之CD19t-IL-12表現序列盒整合准許在外部啟動子控制下在用去氧羥四環素治療之後靶向STAPLR之iPSC合併群體及純系群體中轉殖基因之持續表現。
實例 6 :所 靶向 iPSC 中 STAPLR 基因間區域內各種位點處之報導子轉殖基因表現的誘導為了測試
PRDX1-AKR1A1基因間區域內之兩個替代位點處(
PRDX1-AKR1A1位點2及位點3)之可誘導性及轉殖基因表現的穩固性,吾人同樣利用雙組分去氧羥四環素可誘導型rtTA/TRE系統。TRE3G啟動子用於測試EGFP運載物之表現。根據原始
PRDX1-AKR1A1靶向構築體之設計,將Kozak序列包括在內以實現轉譯起始且添加SV40 PolyA序列以實現轉錄終止。在去氧羥四環素存在下,rtTA蛋白質結合至且活化TRE最小啟動子。用所選高效RNP及對應
PRDX1-
AKR1A1靶向構築體對在
GAPDH下具有二對偶基因rtTA整合之親本iPSC細胞株(GAPDH::rtTA iPSC)進行核轉染(對於位點2或位點3)。針對
PRDX1-AKR1A1位點2測試三個不同gRNA (SEQ ID NO: 87-89)且針對
PRDX1-AKR1A1位點3測試三個不同gRNA (SEQ ID NO: 90-92)。從核轉染後第二天(位點2;
圖 13)或第一天(位點3,
圖 14)開始且至多持續至核轉染後第7天(
圖 15及
圖 16),向接受
PRDX1-AKR1A1位點2或位點3 RNP及靶向構築體之細胞的池進給含有2 μg/ml去氧羥四環素之培養基以便誘導GFP表現。藉由螢光顯微鏡檢查術或流動式細胞量測術,在7天過程內監測GFP表現。自
PRDX1-AKR1A1位點2及
PRDX1-AKR1A1位點3均誘導GFP表現。針對各位點測試之所有三個gRNA展示構築體靶向效率之差異(流動式細胞量測直方圖中所見之不同尺寸峰),但全部能夠在去氧羥四環素添加之後誘導GFP表現達到類似高強度(類似對數級表現量)。在約10
6觀測到的峰表示表現高GFP量之經編輯細胞,而在約10
4觀測到的峰表示自非整合靶向構築體表現之暫態GFP。資料表明
PRDX1-AKR1A1基因間區域內之多個位點准許靶向STAPLR位點之iPSC的合併群體中穩固的GFP可誘導性及表現。
圖 1點陣圖顯示使用Synthego之ICE Analysis Tool進行桑格定序(Sanger sequencing)檢查之後獲得的插入缺失編輯百分比。對於各不同STAPLR位點,測試三個不同gRNA且圈出具有最高插入缺失編輯百分比之gRNA。實心水平線指示每個STAPLR位點之三個不同gRNA的平均插入缺失編輯百分比。
圖 2圖表繪示在
GAPDH基因座處編碼2A肽之序列及編碼rtTA之Tet-On 3G版本之序列的整合。左同源臂及右同源臂經設計以使得能夠將緊鄰5'之轉殖基因同框整合至
GAPDH之終止密碼子。此允許在內源
GAPDH啟動子控制下表現rtTA。已經用靶向構築體編輯之iPSC持續表現rtTA蛋白質。
圖 3圖表繪示四種STAPLR靶向構築體中之各者在持續表現rtTA蛋白質之iPSC中之各STAPLR位點處的整合,該等STAPLR靶向構築體包含側接有左同源臂及右同源臂之pTRE3G-eGFP-Sv40轉殖基因。去氧羥四環素之添加允許結合rtTA蛋白質及活化來自TRE3G啟動子之GFP表現。
圖 4為一組螢光顯微鏡影像,其描繪已接受去氧羥四環素24小時之細胞合併群體中之GFP的表現。在用STAPLR靶向構築體及對應RNP進行iPSC核轉染之後24小時,添加去氧羥四環素至培養基中。在未接受去氧羥四環素之細胞中未觀測到GFP。經去氧羥四環素治療但未用STAPLR靶向構築體及RNP進行核轉染之持續表現rtTA的對照iPSC亦不表現GFP。
圖 5為一組螢光顯微鏡影像,其描繪已接受去氧羥四環素6天之細胞合併群體中之GFP的表現。在用STAPLR靶向構築體及對應RNP進行iPSC核轉染之後24小時,添加去氧羥四環素至培養基中。在未接受去氧羥四環素之細胞中未觀測到GFP。經去氧羥四環素治療但未用STAPLR靶向構築體及RNP進行核轉染之持續表現rtTA的對照iPSC亦不表現GFP。
圖 6為一組流動式細胞量測直方圖,其描繪在不同濃度之去氧羥四環素下隨時間推移四種不同純系衍生之STAPLR iPSC細胞株中GFP表現之誘導。在去氧羥四環素投與之0、3、8、24、48及68小時之後收集細胞用於分析。
圖 7為一組流動式細胞量測直方圖,其描繪用2 μg/ml去氧羥四環素治療後隨時間推移四種不同純系衍生之STAPLR iPSC細胞株中GFP表現之誘導。左圖顯示在無去氧羥四環素治療或有去氧羥四環素治療72小時情況下之
PRDX1-
AKR1A1、
ACTB-
FSCN1及
RPL34-
OSTCSTAPLR細胞株及野生型未經編輯之iPSC對照細胞株。右圖顯示無去氧羥四環素治療或用去氧羥四環素治療6天情況下之
AKIRIN1-
NDUFS5STAPLR細胞株。
圖 8為一組流動式細胞量測直方圖,其描繪在用2 μg/ml去氧羥四環素治療後分化成骨髓祖細胞之四種不同純系衍生之STAPLR iPSC細胞株中GFP表現之誘導。在分化第12天添加去氧羥四環素至培養基中。左圖顯示在無去氧羥四環素治療或有去氧羥四環素治療72小時情況下之骨髓分化第15天之後的
PRDX1-
AKR1A1、
ACTB-
FSCN1及
RPL34-
OSTCSTAPLR細胞株及野生型未經編輯之iPSC對照細胞株。右圖顯示在無去氧羥四環素治療或用無去氧羥四環素治療6天情況下之骨髓分化第18天之後的
AKIRIN1-
NDUFS5STAPLR細胞株。
圖 9為一組流動式細胞量測點陣圖,其顯示已分化超過30天之非附著型骨髓STAPLR靶向iPSC細胞株群體中骨髓祖細胞標記物CD45、CD14及CX3CR1之表現。CD14與CX3CR1細胞組閘控於CD45陽性細胞上。
圖 10為一組流動式細胞量測直方圖,其描繪在四種分化同源細胞衍生之STAPLR iPSC細胞株及野生型未經編輯之iPSC對照細胞株中用2 μg/ml去氧羥四環素治療之後非附著型骨髓祖細胞中之GFP表現的誘導。在分化第30天之後添加去氧羥四環素至培養基中持續六天。
圖 11圖表繪示靶向構築體之整合的圖,該靶向構築體包含側接有左同源臂及右同源臂以允許在
PRDX1-
AKR1A1STAPLR位點整合的pTRE3G-CD19t-IL12轉殖基因。此構築體在持續表現來自
GAPDH內源啟動子之rtTA蛋白質的iPSC中經轉染。
圖 12為一組相片,其顯示在用
PRDX1-
AKR1A1pTRE3G-CD19t-IL12供體模板靶向後之細胞合併樣品中或在相比於未經治療細胞之單細胞純系密度接種之後的細胞純系群體中用2 μg/mL去氧羥四環素治療48小時後CD19t (截短以防止細胞內信號轉導)染色之活細胞成像。圖A展示用基於Cpf1之RNP靶向之後的細胞。圖B顯示在用基於Cas9之RNP靶向之後的細胞。
圖 13為一組螢光顯微鏡影像,其描繪已接受去氧羥四環素24小時之細胞合併群體中GFP之表現。在用
PRDX1-
AKR1A1位點2靶向構築體及包含三個靶向位點2之不同gRNA的三個不同RNP進行iPSC核轉染之後48小時,添加去氧羥四環素至培養基中。在未接受去氧羥四環素之細胞中未觀測到GFP。
圖 14為一組螢光顯微鏡影像,其描繪已接受去氧羥四環素24小時之細胞合併群體中GFP之表現。在用
PRDX1-
AKR1A1位點3靶向構築體及包含三個靶向位點3之不同gRNA的三個不同RNP進行iPSC核轉染之後24小時,添加去氧羥四環素至培養基中。在未接受去氧羥四環素之細胞中未觀測到GFP。
圖 15為一組流動式細胞量測直方圖,其描繪在用2 μg/ml去氧羥四環素治療之後細胞合群體中之GFP表現的誘導。在用
PRDX1-
AKR1A1位點2靶向構築體及包含三個靶向位點2之不同gRNA的三個不同RNP進行iPSC核轉染之後48小時,添加去氧羥四環素至培養基中。在用去氧羥四環素治療後5天進行流動式細胞量測分析。在未接受去氧羥四環素之細胞中及在未接受靶向構築體及RNP之親本GAPDH::rtTA iPSC中未觀測到GFP。
圖 16為一組流動式細胞量測直方圖,其描繪在用2 μg/ml去氧羥四環素治療之後細胞合併群體中之GFP表現的誘導。在用
PRDX1-
AKR1A1位點3靶向構築體及包含三個靶向位點3之不同gRNA的三個不同RNP進行iPSC核轉染之後24小時,添加去氧羥四環素至培養基中。在用去氧羥四環素治療後6天進行流動式細胞量測分析。在未接受去氧羥四環素之細胞中及在未接受靶向構築體及RNP之親本GAPDH::rtTA iPSC中未觀測到GFP。
TW202400252A_112116119_SEQL.xml
Claims (15)
- 一種基因改造哺乳動物細胞,該細胞包含整合於細胞基因組中之持續轉錄活性有效負載區(STAPLR)中的外源核苷酸序列,其中該STAPLR選自由以下組成之群: RPL34基因與 OSTC基因之間的基因間區域; ACTB基因與 FSCN1基因之間的基因間區域; AKIRIN1基因與 NDUFS5基因之間的基因間區域; PRDX1基因與 AKR1A1基因之間的基因間區域; PTGES3基因與 NACA基因之間的基因間區域; MLF2基因與 PTMS基因之間的基因間區域; RAB13基因與 RPS27基因之間的基因間區域; JTB基因與 RAB13基因之間的基因間區域; AKR1A1基因與 NASP基因之間的基因間區域; NDUFS5基因與 MACF1基因之間的基因間區域; SRSF9基因與 DYNLL1基因之間的基因間區域; MYL6B基因與 MYL6基因之間的基因間區域; GPX1基因與 RHOA基因之間的基因間區域; HNRNPA2B1基因與 CBX3基因之間的基因間區域; ROMO基因與 RBM39基因之間的基因間區域; PA2G4基因與 RPL41基因之間的基因間區域;及 NDUFB10與 RPS2基因之間的基因間區域。
- 一種用於改造哺乳動物細胞之方法,該方法包含將外源核苷酸序列整合在細胞基因組之持續轉錄活性有效負載區(STAPLR)中,其中該STAPLR選自由以下組成之群: RPL34基因與 OSTC基因之間的基因間區域; ACTB基因與 FSCN1基因之間的基因間區域; AKIRIN1基因與 NDUFS5基因之間的基因間區域; PRDX1基因與 AKR1A1基因之間的基因間區域; PTGES3基因與 NACA基因之間的基因間區域; MLF2基因與 PTMS基因之間的基因間區域; RAB13基因與 RPS27基因之間的基因間區域; JTB基因與 RAB13基因之間的基因間區域; AKR1A1基因與 NASP基因之間的基因間區域; NDUFS5基因與 MACF1基因之間的基因間區域; SRSF9基因與 DYNLL1基因之間的基因間區域; MYL6B基因與 MYL6基因之間的基因間區域; GPX1基因與 RHOA基因之間的基因間區域; HNRNPA2B1基因與 CBX3基因之間的基因間區域; ROMO基因與 RBM39基因之間的基因間區域; PA2G4基因與 RPL41基因之間的基因間區域;及 NDUFB10與 RPS2基因之間的基因間區域。
- 如請求項2之方法,其中整合步驟藉由使用以下進行:CRISPR/Cas系統;Cre/Lox系統;FLP-FRT系統;TALEN系統;ZFN系統;歸巢核酸內切酶(homing endonuclease);隨機整合;同源重組;轉位酶;或非核酸酶依賴性病毒載體,視情況選自反轉錄病毒載體、AAV載體及慢病毒載體。
- 如請求項2之方法,其中整合步驟藉由使用包含導引RNA之CRISPR/Cas系統進行,且其中 該STAPLR為該 RPL34基因與該 OSTC基因之間的該基因間區域且gRNA選自SEQ ID NO: 25-32, 該STAPLR為該 ACTB基因與該 FSCN1基因之間的該基因間區域且該gRNA選自SEQ ID NO: 33-54, 該STAPLR為該 AKIRIN1基因與該 NDUFS5基因之間的該基因間區域且該gRNA選自SEQ ID NO: 55-70,或 該STAPLR為該 PRDX1基因與該 AKR1A1基因之間的該基因間區域且該gRNA選自SEQ ID NO: 71-92。
- 如請求項3或4之方法,其中該CRISPR/Cas系統包含第I型、第II型、第III型、第IV型、第V型之gRNA依賴性核酸酶或其變異體。
- 如請求項3或4之方法,其中該CRISPR/Cas系統包含選自由以下組成之群之gRNA依賴性核酸酶:Cas9、Cpf1、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas12、Cas13、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、CasX、CasY、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、CasPhi、MAD7及Csf4。
- 一種DNA分子,該分子包含經以5'同源區(HR)及3' HR側接之相關核苷酸序列,其中該5' HR及該3' HR各自地與哺乳動物細胞基因組之持續轉錄活性有效負載區(STAPLR)中的第一基因組區(GR)及第二GR至少95%同源,其中該STAPLR選自由以下組成之群: RPL34基因與 OSTC基因之間的基因間區域; ACTB基因與 FSCN1基因之間的基因間區域; AKIRIN1基因與 NDUFS5基因之間的基因間區域; PRDX1基因與 AKR1A1基因之間的基因間區域; PTGES3基因與 NACA基因之間的基因間區域; MLF2基因與 PTMS基因之間的基因間區域; RAB13基因與 RPS27基因之間的基因間區域; JTB基因與 RAB13基因之間的基因間區域; AKR1A1基因與 NASP基因之間的基因間區域; NDUFS5基因與 MACF1基因之間的基因間區域; SRSF9基因與 DYNLL1基因之間的基因間區域; MYL6B基因與 MYL6基因之間的基因間區域; GPX1基因與 RHOA基因之間的基因間區域; HNRNPA2B1基因與 CBX3基因之間的基因間區域; ROMO基因與 RBM39基因之間的基因間區域; PA2G4基因與 RPL41基因之間的基因間區域; NDUFB10與 RPS2基因之間的基因間區域。
- 如請求項7之DNA分子,其中該5' HR及該3' HR中之各者獨立地為約至少50、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450、至少500、至少550、至少600、至少650、至少700、至少750、至少800、至少850、至少900、至少950、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、至少1800、至少1900或至少2000個鹼基對長。
- 如請求項7或8之DNA分子,其中該5' HR及該3' HR分別與 SEQ ID NO: 17及18, SEQ ID NO: 19及20, SEQ ID NO: 21及22, SEQ ID NO: 23及24, SEQ ID NO: 93及94,或 SEQ ID NO: 95及96, 至少90%同源。
- 如請求項1至9中任一項之細胞、方法或DNA分子,其中: 該 RPL34基因與該 OSTC基因之間的該基因間區域包含與SEQ ID NO: 1至少95%一致之核苷酸序列; 該 ACTB基因與該 FSCN1基因之間的該基因間區域包含與SEQ ID NO: 2至少95%一致之核苷酸序列; 該 AKIRIN1基因與該 NDUFS5基因之間的該基因間區域包含與SEQ ID NO: 3至少95%一致之核苷酸序列; 該 PRDX1基因與該 AKR1A1基因之間的該基因間區域包含與SEQ ID NO: 4至少95%一致之核苷酸序列; 該 PTGES3基因與該 NACA基因之間的該基因間區域包含與SEQ ID NO: 5至少95%一致之核苷酸序列; 該 MLF2基因與該 PTMS基因之間的該基因間區域包含與SEQ ID NO: 6至少95%一致之核苷酸序列; 該 RAB13基因與該 RPS27基因之間的該基因間區域包含與SEQ ID NO: 7至少95%一致之核苷酸序列; 該 JTB基因與該 RAB13基因之間的該基因間區域包含與SEQ ID NO: 8至少95%一致之核苷酸序列; 該 AKR1A1基因與該 NASP基因之間的該基因間區域包含與SEQ ID NO: 9至少95%一致之核苷酸序列; 該 NDUFS5基因與該 MACF1基因之間的該基因間區域包含與SEQ ID NO: 10至少95%一致之核苷酸序列; 該 SRSF9基因與該 DYNLL1基因之間的該基因間區域包含與SEQ ID NO: 11至少95%一致之核苷酸序列; 該 MYL6B基因與該 MYL6基因之間的該基因間區域包含與SEQ ID NO: 12至少95%一致之核苷酸序列; 該 GPX1基因與該 RHOA基因之間的該基因間區域包含與SEQ ID NO: 13至少95%一致之核苷酸序列; 該 HNRNPA2B1基因與該 CBX3基因之間的該基因間區域包含與SEQ ID NO: 14至少95%一致之核苷酸序列; 該 ROMO基因與該 RBM39基因之間的該基因間區域包含與SEQ ID NO: 15至少95%一致之核苷酸序列; 該 PA2G4基因與該 RPL41基因之間的該基因間區域包含與SEQ ID NO: 16至少95%一致之核苷酸序列;及/或 該 NDUFB10基因與該 RPS2基因之間的該基因間區域包含與SEQ ID NO: 97至少95%一致之核苷酸序列。
- 如請求項1至10中任一項之細胞、方法或DNA分子,其中該外源核苷酸序列或該相關核苷酸序列包含轉殖基因,視情況其中該轉殖基因包含持續型啟動子或可誘導型啟動子。
- 如請求項11之細胞、方法或DNA分子,其中該轉殖基因編碼 治療性蛋白質,視情況遺傳性疾病中缺乏或有缺陷之蛋白質、細胞介素、重組抗原受體; 細胞標記物;或 調節該細胞之分化狀態或活性的蛋白質; 視情況其中該轉殖基因編碼SOX10、IL-10、IL-12、CD19t或ThPOK。
- 如請求項1至12中任一項之細胞、方法或DNA分子,其中該細胞為人類細胞。
- 如請求項1至13中任一項之細胞、方法或DNA分子,其中該細胞為多潛能幹細胞(PSC),視情況誘導性PSC (iPSC)。
- 如請求項1至13中任一項之細胞、方法或DNA分子,其中該細胞為以下細胞: a)免疫系統中之細胞,視情況T細胞、自然殺手細胞、樹突細胞、巨噬細胞/單核球或其造血祖細胞; b)心血管系統中之細胞,視情況心室心肌細胞、結節細胞或心臟祖細胞; c)代謝系統中之細胞,視情況肝細胞或胰臟β細胞; d)中樞神經系統中之細胞,視情況感覺神經元、運動神經元、仲介神經元、微膠質細胞、寡樹突細胞或其祖細胞; e)肌細胞,視情況骨骼肌細胞或平滑肌細胞; f)脂肪細胞;或 g)眼系統中之細胞,視情況視網膜色素上皮細胞、感光受體細胞或感光受體前驅細胞。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202263336248P | 2022-04-28 | 2022-04-28 | |
US63/336,248 | 2022-04-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202400252A true TW202400252A (zh) | 2024-01-01 |
Family
ID=86604206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112116119A TW202400252A (zh) | 2022-04-28 | 2023-04-28 | 用於安全基因組整合之新位點及其使用方法 |
Country Status (2)
Country | Link |
---|---|
TW (1) | TW202400252A (zh) |
WO (1) | WO2023212722A1 (zh) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012071549A2 (en) | 2010-11-24 | 2012-05-31 | Clontech Laboratories, Inc. | Inducible expression system transcription modulators comprising a distributed protein transduction domain and methods for using the same |
WO2013177133A2 (en) | 2012-05-21 | 2013-11-28 | The Regents Of The Univerisity Of California | Generation of human ips cells by a synthetic self- replicative rna |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
AU2020364157A1 (en) | 2019-10-09 | 2022-04-14 | Bluerock Therapeutics Lp | Cells with sustained transgene expression |
EP3858999A1 (en) * | 2020-01-30 | 2021-08-04 | Aelian Biotechnology GmbH | Safe harbor loci |
CN115916968A (zh) | 2020-05-04 | 2023-04-04 | 爱迪塔斯医药公司 | 通过必需基因敲入进行选择 |
TW202300642A (zh) | 2021-03-25 | 2023-01-01 | 美商藍岩醫療公司 | 獲得誘導型多能幹細胞之方法 |
AU2022290382A1 (en) | 2021-06-11 | 2023-11-23 | Bayer Aktiengesellschaft | Type v rna programmable endonuclease systems |
-
2023
- 2023-04-28 WO PCT/US2023/066396 patent/WO2023212722A1/en unknown
- 2023-04-28 TW TW112116119A patent/TW202400252A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023212722A1 (en) | 2023-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017054647A1 (zh) | 一种高效安全的转座子整合系统及其用途 | |
CN111712569A (zh) | 用于基因编辑的Cpf1-相关方法和组合物 | |
US20200407693A1 (en) | Method for producing low-antigenic cell | |
EP4036228A1 (en) | Methods for the treatment of corneal dystrophies | |
US20210130817A1 (en) | Gene Editing System and Gene Editing Method | |
WO2021083183A9 (zh) | 一种造血干细胞hbb基因修复的方法及产品 | |
CN110144353A (zh) | 一种橡胶树U6基因启动子proHbU6.6及其克隆与应用 | |
US20210032612A1 (en) | CRISPR/Cas9 Systems, and Methods of Use Thereof | |
KR102428606B1 (ko) | 향상된 유전자 전달 방법 | |
US20240060047A1 (en) | Cells with sustained transgene expression | |
TW202400252A (zh) | 用於安全基因組整合之新位點及其使用方法 | |
US20210254068A1 (en) | Genome engineering primary monocytes | |
CN110678553B (zh) | 在哺乳动物干细胞中进行基因组编辑的方法 | |
EP4079765A1 (en) | Fusion protein that improves gene editing efficiency and application thereof | |
WO2024145653A2 (en) | Engineered cells for the production of cd4+ t cells and cd4+ tregs | |
WO2021172583A1 (ja) | 遺伝子改変巨核球、改変血小板及びそれらの製造方法 | |
WO2023085433A1 (ja) | ヒト細胞内でヒト人工染色体ベクターを作製する方法 | |
US20220177922A1 (en) | High-throughput gene-editing technique | |
TW202417626A (zh) | 具有共表現的tgfbr shrna之免疫細胞 | |
CN116478989A (zh) | 靶向ZFY基因的sgRNA和利用其整合外源基因的绵羊成纤维细胞系的建立 | |
KR101590247B1 (ko) | 돼지 Sal-like 1 유전자 타겟팅 벡터 및 Sal-like 1 유전자 타겟팅 TALEN을 이용한, Sal-like 1 유전자 넉-아웃 세포의 제조 방법 | |
CN116478990A (zh) | 靶向ZFX基因的sgRNA和利用其整合外源基因的绵羊成纤维细胞系的建立与应用 | |
CN116546993A (zh) | 安全港基因座 |