CN116507732A - 哺乳动物细胞及其工程化的方法 - Google Patents
哺乳动物细胞及其工程化的方法 Download PDFInfo
- Publication number
- CN116507732A CN116507732A CN202180074337.5A CN202180074337A CN116507732A CN 116507732 A CN116507732 A CN 116507732A CN 202180074337 A CN202180074337 A CN 202180074337A CN 116507732 A CN116507732 A CN 116507732A
- Authority
- CN
- China
- Prior art keywords
- library
- aav
- viral
- sequence
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 210000004962 mammalian cell Anatomy 0.000 title claims abstract description 1009
- 238000000034 method Methods 0.000 title claims abstract description 216
- 239000013603 viral vector Substances 0.000 claims abstract description 823
- 239000013607 AAV vector Substances 0.000 claims abstract description 150
- 210000004027 cell Anatomy 0.000 claims description 377
- 150000007523 nucleic acids Chemical group 0.000 claims description 350
- 230000003612 virological effect Effects 0.000 claims description 296
- 239000013598 vector Substances 0.000 claims description 274
- 238000004519 manufacturing process Methods 0.000 claims description 250
- 108090000623 proteins and genes Proteins 0.000 claims description 214
- 230000010354 integration Effects 0.000 claims description 213
- 102000039446 nucleic acids Human genes 0.000 claims description 176
- 108020004707 nucleic acids Proteins 0.000 claims description 176
- 101710163270 Nuclease Proteins 0.000 claims description 89
- 108020005004 Guide RNA Proteins 0.000 claims description 87
- 238000012163 sequencing technique Methods 0.000 claims description 82
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 74
- 241000282414 Homo sapiens Species 0.000 claims description 73
- 108090000565 Capsid Proteins Proteins 0.000 claims description 46
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 46
- 230000001965 increasing effect Effects 0.000 claims description 46
- 102000018120 Recombinases Human genes 0.000 claims description 37
- 108010091086 Recombinases Proteins 0.000 claims description 37
- 238000003780 insertion Methods 0.000 claims description 30
- 230000037431 insertion Effects 0.000 claims description 30
- 238000012217 deletion Methods 0.000 claims description 25
- 230000037430 deletion Effects 0.000 claims description 25
- 230000000875 corresponding effect Effects 0.000 claims description 24
- 239000003550 marker Substances 0.000 claims description 24
- 241000713666 Lentivirus Species 0.000 claims description 21
- 238000006467 substitution reaction Methods 0.000 claims description 19
- 230000001225 therapeutic effect Effects 0.000 claims description 13
- 230000001976 improved effect Effects 0.000 claims description 12
- 230000028327 secretion Effects 0.000 claims description 12
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 11
- 241000702421 Dependoparvovirus Species 0.000 claims description 11
- 230000008707 rearrangement Effects 0.000 claims description 11
- 230000000694 effects Effects 0.000 claims description 10
- 230000002829 reductive effect Effects 0.000 claims description 10
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 9
- 101150044789 Cap gene Proteins 0.000 claims description 9
- 230000004049 epigenetic modification Effects 0.000 claims description 9
- 238000012546 transfer Methods 0.000 claims description 9
- 210000003734 kidney Anatomy 0.000 claims description 7
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 6
- 230000002596 correlated effect Effects 0.000 claims description 6
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 5
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 5
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 5
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 5
- 241000649045 Adeno-associated virus 10 Species 0.000 claims description 5
- 241000649046 Adeno-associated virus 11 Species 0.000 claims description 5
- 241000649047 Adeno-associated virus 12 Species 0.000 claims description 5
- 241000300529 Adeno-associated virus 13 Species 0.000 claims description 5
- 241000283690 Bos taurus Species 0.000 claims description 5
- 101150066583 rep gene Proteins 0.000 claims description 5
- 241000271566 Aves Species 0.000 claims description 4
- 241000282465 Canis Species 0.000 claims description 4
- 241000283707 Capra Species 0.000 claims description 4
- 241000699802 Cricetulus griseus Species 0.000 claims description 4
- 210000001672 ovary Anatomy 0.000 claims description 4
- 210000003501 vero cell Anatomy 0.000 claims description 4
- 241000282552 Chlorocebus aethiops Species 0.000 claims description 3
- 241000699800 Cricetinae Species 0.000 claims description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 claims description 3
- 210000000692 cap cell Anatomy 0.000 claims description 3
- 230000001605 fetal effect Effects 0.000 claims description 3
- 210000002950 fibroblast Anatomy 0.000 claims description 3
- 210000003292 kidney cell Anatomy 0.000 claims description 3
- 210000005265 lung cell Anatomy 0.000 claims description 3
- 201000000050 myeloid neoplasm Diseases 0.000 claims description 3
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 claims 26
- 230000009286 beneficial effect Effects 0.000 abstract description 7
- 102000040430 polynucleotide Human genes 0.000 description 131
- 108091033319 polynucleotide Proteins 0.000 description 131
- 239000002157 polynucleotide Substances 0.000 description 131
- 125000003729 nucleotide group Chemical group 0.000 description 103
- 239000002773 nucleotide Substances 0.000 description 102
- 230000014509 gene expression Effects 0.000 description 92
- 102000004169 proteins and genes Human genes 0.000 description 87
- 241000701161 unidentified adenovirus Species 0.000 description 78
- 108090000765 processed proteins & peptides Proteins 0.000 description 76
- 102000004196 processed proteins & peptides Human genes 0.000 description 75
- 229920001184 polypeptide Polymers 0.000 description 74
- 238000004806 packaging method and process Methods 0.000 description 64
- 230000001404 mediated effect Effects 0.000 description 58
- 210000000234 capsid Anatomy 0.000 description 56
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 55
- 108020004414 DNA Proteins 0.000 description 49
- 230000001939 inductive effect Effects 0.000 description 48
- 239000000306 component Substances 0.000 description 46
- 230000010076 replication Effects 0.000 description 42
- 108091026890 Coding region Proteins 0.000 description 39
- 108010020764 Transposases Proteins 0.000 description 39
- 102000008579 Transposases Human genes 0.000 description 39
- 241000700605 Viruses Species 0.000 description 35
- 150000001413 amino acids Chemical class 0.000 description 35
- 230000001105 regulatory effect Effects 0.000 description 35
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 34
- 239000000047 product Substances 0.000 description 33
- 238000007481 next generation sequencing Methods 0.000 description 32
- 239000003623 enhancer Substances 0.000 description 31
- 108091033409 CRISPR Proteins 0.000 description 30
- 241000725303 Human immunodeficiency virus Species 0.000 description 30
- 239000003124 biologic agent Substances 0.000 description 27
- 238000010362 genome editing Methods 0.000 description 27
- 238000013518 transcription Methods 0.000 description 26
- 230000035897 transcription Effects 0.000 description 26
- 230000004927 fusion Effects 0.000 description 25
- 238000010801 machine learning Methods 0.000 description 24
- 238000001415 gene therapy Methods 0.000 description 23
- 239000013612 plasmid Substances 0.000 description 22
- 108700008625 Reporter Genes Proteins 0.000 description 21
- 230000006870 function Effects 0.000 description 19
- 230000002068 genetic effect Effects 0.000 description 19
- 238000001890 transfection Methods 0.000 description 19
- 241000713311 Simian immunodeficiency virus Species 0.000 description 18
- 238000012216 screening Methods 0.000 description 18
- 210000001519 tissue Anatomy 0.000 description 18
- 241000701022 Cytomegalovirus Species 0.000 description 16
- 102000053602 DNA Human genes 0.000 description 15
- 230000002950 deficient Effects 0.000 description 15
- 230000004048 modification Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 229960005486 vaccine Drugs 0.000 description 15
- -1 casZ Proteins 0.000 description 14
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 13
- 239000003795 chemical substances by application Substances 0.000 description 13
- 230000000295 complement effect Effects 0.000 description 13
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- 238000011194 good manufacturing practice Methods 0.000 description 12
- 230000000174 oncolytic effect Effects 0.000 description 12
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 12
- 241000713800 Feline immunodeficiency virus Species 0.000 description 11
- 108091034117 Oligonucleotide Proteins 0.000 description 11
- 108700026244 Open Reading Frames Proteins 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 11
- 238000002659 cell therapy Methods 0.000 description 11
- 238000012239 gene modification Methods 0.000 description 11
- 230000005017 genetic modification Effects 0.000 description 11
- 235000013617 genetically modified food Nutrition 0.000 description 11
- 102100034349 Integrase Human genes 0.000 description 10
- 108020004999 messenger RNA Proteins 0.000 description 10
- 230000001177 retroviral effect Effects 0.000 description 10
- 239000000523 sample Substances 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 238000010361 transduction Methods 0.000 description 10
- 230000026683 transduction Effects 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 9
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 9
- 230000004913 activation Effects 0.000 description 9
- 238000012258 culturing Methods 0.000 description 9
- 238000011018 current good manufacturing practice Methods 0.000 description 9
- 239000000725 suspension Substances 0.000 description 9
- 238000002560 therapeutic procedure Methods 0.000 description 9
- 241001430294 unidentified retrovirus Species 0.000 description 9
- 108091029865 Exogenous DNA Proteins 0.000 description 8
- 101710177291 Gag polyprotein Proteins 0.000 description 8
- 101710125418 Major capsid protein Proteins 0.000 description 8
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 8
- 241000714474 Rous sarcoma virus Species 0.000 description 8
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 8
- 210000000349 chromosome Anatomy 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 229940088598 enzyme Drugs 0.000 description 8
- 239000000203 mixture Substances 0.000 description 8
- 238000011275 oncology therapy Methods 0.000 description 8
- 102000005962 receptors Human genes 0.000 description 8
- 108020003175 receptors Proteins 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 7
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 7
- 108010076504 Protein Sorting Signals Proteins 0.000 description 7
- 108091023045 Untranslated Region Proteins 0.000 description 7
- 230000027455 binding Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 201000011510 cancer Diseases 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 208000015181 infectious disease Diseases 0.000 description 7
- 230000008488 polyadenylation Effects 0.000 description 7
- 230000003362 replicative effect Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 241000991587 Enterovirus C Species 0.000 description 6
- 241000713730 Equine infectious anemia virus Species 0.000 description 6
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 6
- 102000003792 Metallothionein Human genes 0.000 description 6
- 108090000157 Metallothionein Proteins 0.000 description 6
- 241001529936 Murinae Species 0.000 description 6
- 108091034057 RNA (poly(A)) Proteins 0.000 description 6
- 108091027981 Response element Proteins 0.000 description 6
- 241000713880 Spleen focus-forming virus Species 0.000 description 6
- 238000010459 TALEN Methods 0.000 description 6
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 6
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000012512 characterization method Methods 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 230000002035 prolonged effect Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 5
- 102100031780 Endonuclease Human genes 0.000 description 5
- 108010042407 Endonucleases Proteins 0.000 description 5
- 208000031448 Genomic Instability Diseases 0.000 description 5
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 5
- 108090000288 Glycoproteins Proteins 0.000 description 5
- 102000003886 Glycoproteins Human genes 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 5
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 5
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 5
- 240000007019 Oxalis corniculata Species 0.000 description 5
- 241000713325 Visna/maedi virus Species 0.000 description 5
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 5
- 101150059443 cas12a gene Proteins 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 239000012636 effector Substances 0.000 description 5
- 238000004520 electroporation Methods 0.000 description 5
- 108700004025 env Genes Proteins 0.000 description 5
- 101150030339 env gene Proteins 0.000 description 5
- 108700004026 gag Genes Proteins 0.000 description 5
- 101150098622 gag gene Proteins 0.000 description 5
- 239000005090 green fluorescent protein Substances 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 108700004029 pol Genes Proteins 0.000 description 5
- 101150088264 pol gene Proteins 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 230000001629 suppression Effects 0.000 description 5
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 4
- 108020005345 3' Untranslated Regions Proteins 0.000 description 4
- 108020003589 5' Untranslated Regions Proteins 0.000 description 4
- 102000007469 Actins Human genes 0.000 description 4
- 108010085238 Actins Proteins 0.000 description 4
- 241000701822 Bovine papillomavirus Species 0.000 description 4
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 4
- 238000002965 ELISA Methods 0.000 description 4
- 241000710188 Encephalomyocarditis virus Species 0.000 description 4
- 101710091045 Envelope protein Proteins 0.000 description 4
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- 241000711549 Hepacivirus C Species 0.000 description 4
- 241000709721 Hepatovirus A Species 0.000 description 4
- 241001135569 Human adenovirus 5 Species 0.000 description 4
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 4
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 4
- 241001502974 Human gammaherpesvirus 8 Species 0.000 description 4
- 241000430519 Human rhinovirus sp. Species 0.000 description 4
- 241000713333 Mouse mammary tumor virus Species 0.000 description 4
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 4
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 4
- 108091036407 Polyadenylation Proteins 0.000 description 4
- 101710188315 Protein X Proteins 0.000 description 4
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 4
- 241000710961 Semliki Forest virus Species 0.000 description 4
- 241000700584 Simplexvirus Species 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- 239000004098 Tetracycline Substances 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- 108090000848 Ubiquitin Proteins 0.000 description 4
- 102000044159 Ubiquitin Human genes 0.000 description 4
- 108700005077 Viral Genes Proteins 0.000 description 4
- 101710185494 Zinc finger protein Proteins 0.000 description 4
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 4
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 4
- 210000004507 artificial chromosome Anatomy 0.000 description 4
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 210000000688 human artificial chromosome Anatomy 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000003127 radioimmunoassay Methods 0.000 description 4
- 108010054624 red fluorescent protein Proteins 0.000 description 4
- 238000010839 reverse transcription Methods 0.000 description 4
- 238000007480 sanger sequencing Methods 0.000 description 4
- 210000000130 stem cell Anatomy 0.000 description 4
- 229960002180 tetracycline Drugs 0.000 description 4
- 229930101283 tetracycline Natural products 0.000 description 4
- 235000019364 tetracycline Nutrition 0.000 description 4
- 150000003522 tetracyclines Chemical class 0.000 description 4
- 230000035899 viability Effects 0.000 description 4
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 3
- 241000711404 Avian avulavirus 1 Species 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 150000008575 L-amino acids Chemical class 0.000 description 3
- 241000711408 Murine respirovirus Species 0.000 description 3
- 102000001068 Neural Cell Adhesion Molecules Human genes 0.000 description 3
- 108010069196 Neural Cell Adhesion Molecules Proteins 0.000 description 3
- 241001494479 Pecora Species 0.000 description 3
- 108020004459 Small interfering RNA Proteins 0.000 description 3
- 108091027544 Subgenomic mRNA Proteins 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 102000013394 Troponin I Human genes 0.000 description 3
- 108010065729 Troponin I Proteins 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000004115 adherent culture Methods 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 239000006143 cell culture medium Substances 0.000 description 3
- 230000032823 cell division Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 150000004713 phosphodiesters Chemical class 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 230000010474 transient expression Effects 0.000 description 3
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 3
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 2
- 101150112497 26 gene Proteins 0.000 description 2
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 239000004382 Amylase Substances 0.000 description 2
- 102000013142 Amylases Human genes 0.000 description 2
- 108010065511 Amylases Proteins 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 101710163595 Chaperone protein DnaK Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 102000029816 Collagenase Human genes 0.000 description 2
- 108060005980 Collagenase Proteins 0.000 description 2
- 241000711573 Coronaviridae Species 0.000 description 2
- 241000710127 Cricket paralysis virus Species 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 2
- 150000008574 D-amino acids Chemical class 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 230000008265 DNA repair mechanism Effects 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 101710088194 Dehydrogenase Proteins 0.000 description 2
- 108090000204 Dipeptidase 1 Proteins 0.000 description 2
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 2
- 241001466953 Echovirus Species 0.000 description 2
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 2
- 241000710831 Flavivirus Species 0.000 description 2
- 101710107035 Gamma-glutamyltranspeptidase Proteins 0.000 description 2
- 241001663880 Gammaretrovirus Species 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 101710173228 Glutathione hydrolase proenzyme Proteins 0.000 description 2
- 241000941423 Grom virus Species 0.000 description 2
- 108010086786 HLA-DQA1 antigen Proteins 0.000 description 2
- 108010067802 HLA-DR alpha-Chains Proteins 0.000 description 2
- 101710178376 Heat shock 70 kDa protein Proteins 0.000 description 2
- 101710152018 Heat shock cognate 70 kDa protein Proteins 0.000 description 2
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 2
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 2
- 208000009889 Herpes Simplex Diseases 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 2
- 102000002265 Human Growth Hormone Human genes 0.000 description 2
- 241000598436 Human T-cell lymphotropic virus Species 0.000 description 2
- 241000598171 Human adenovirus sp. Species 0.000 description 2
- 241000701041 Human betaherpesvirus 7 Species 0.000 description 2
- 241000701027 Human herpesvirus 6 Species 0.000 description 2
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 2
- 102000013463 Immunoglobulin Light Chains Human genes 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 102100034353 Integrase Human genes 0.000 description 2
- 102000003996 Interferon-beta Human genes 0.000 description 2
- 108090000467 Interferon-beta Proteins 0.000 description 2
- 102000000588 Interleukin-2 Human genes 0.000 description 2
- 108010002350 Interleukin-2 Proteins 0.000 description 2
- 102000010789 Interleukin-2 Receptors Human genes 0.000 description 2
- 108010038453 Interleukin-2 Receptors Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 239000005089 Luciferase Substances 0.000 description 2
- 102000043131 MHC class II family Human genes 0.000 description 2
- 108091054438 MHC class II family Proteins 0.000 description 2
- 108010059343 MM Form Creatine Kinase Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 101710201349 Metallothionein B Proteins 0.000 description 2
- 102100031347 Metallothionein-2 Human genes 0.000 description 2
- 101710094505 Metallothionein-2 Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 101000579126 Mus musculus Phosphoglycerate kinase 1 Proteins 0.000 description 2
- 102000016387 Pancreatic elastase Human genes 0.000 description 2
- 108010067372 Pancreatic elastase Proteins 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 102100037935 Polyubiquitin-C Human genes 0.000 description 2
- 102000007584 Prealbumin Human genes 0.000 description 2
- 108010071690 Prealbumin Proteins 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 108010071563 Proto-Oncogene Proteins c-fos Proteins 0.000 description 2
- 102000007568 Proto-Oncogene Proteins c-fos Human genes 0.000 description 2
- 101000868151 Rattus norvegicus Somatotropin Proteins 0.000 description 2
- 108091008874 T cell receptors Proteins 0.000 description 2
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 2
- 208000000389 T-cell leukemia Diseases 0.000 description 2
- 208000028530 T-cell lymphoblastic leukemia/lymphoma Diseases 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 102000006601 Thymidine Kinase Human genes 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- 102000011923 Thyrotropin Human genes 0.000 description 2
- 108010061174 Thyrotropin Proteins 0.000 description 2
- 108010012306 Tn5 transposase Proteins 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 108010056354 Ubiquitin C Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000700618 Vaccinia virus Species 0.000 description 2
- 108010065472 Vimentin Proteins 0.000 description 2
- 102100035071 Vimentin Human genes 0.000 description 2
- 108010067390 Viral Proteins Proteins 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 2
- 235000019418 amylase Nutrition 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 102000006635 beta-lactamase Human genes 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 229960003957 dexamethasone Drugs 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 2
- 108010078428 env Gene Products Proteins 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 208000009724 equine infectious anemia Diseases 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 102000006640 gamma-Glutamyltransferase Human genes 0.000 description 2
- 102000054767 gene variant Human genes 0.000 description 2
- 102000034356 gene-regulatory proteins Human genes 0.000 description 2
- 108091006104 gene-regulatory proteins Proteins 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 238000003364 immunohistochemistry Methods 0.000 description 2
- 238000010324 immunological assay Methods 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 230000035790 physiological processes and functions Effects 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000014493 regulation of gene expression Effects 0.000 description 2
- 229960002930 sirolimus Drugs 0.000 description 2
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 2
- 238000007811 spectroscopic assay Methods 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 102000003390 tumor necrosis factor Human genes 0.000 description 2
- 210000005048 vimentin Anatomy 0.000 description 2
- 230000017613 viral reproduction Effects 0.000 description 2
- RIFDKYBNWNPCQK-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(6-imino-3-methylpurin-9-yl)oxolane-3,4-diol Chemical compound C1=2N(C)C=NC(=N)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RIFDKYBNWNPCQK-IOSLPCCCSA-N 0.000 description 1
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- PISWNSOQFZRVJK-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 PISWNSOQFZRVJK-XLPZGREQSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 1
- LMMLLWZHCKCFQA-UGKPPGOTSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-prop-1-ynyloxolan-2-yl]pyrimidin-2-one Chemical compound C1=CC(N)=NC(=O)N1[C@]1(C#CC)O[C@H](CO)[C@@H](O)[C@H]1O LMMLLWZHCKCFQA-UGKPPGOTSA-N 0.000 description 1
- XXSIICQLPUAUDF-TURQNECASA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidin-2-one Chemical compound O=C1N=C(N)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XXSIICQLPUAUDF-TURQNECASA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 1
- UEHOMUNTZPIBIL-UUOKFMHZSA-N 6-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7h-purin-8-one Chemical compound O=C1NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UEHOMUNTZPIBIL-UUOKFMHZSA-N 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- HDZZVAMISRMYHH-UHFFFAOYSA-N 9beta-Ribofuranosyl-7-deazaadenin Natural products C1=CC=2C(N)=NC=NC=2N1C1OC(CO)C(O)C1O HDZZVAMISRMYHH-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 102100033312 Alpha-2-macroglobulin Human genes 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 102000009091 Amyloidogenic Proteins Human genes 0.000 description 1
- 108010048112 Amyloidogenic Proteins Proteins 0.000 description 1
- 241001446316 Bohle iridovirus Species 0.000 description 1
- 102000005600 Cathepsins Human genes 0.000 description 1
- 108010084457 Cathepsins Proteins 0.000 description 1
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 1
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 1
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 1
- 241000195634 Dunaliella Species 0.000 description 1
- 101710121417 Envelope glycoprotein Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108050001049 Extracellular proteins Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 1
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 1
- 108091005886 Hemoglobin subunit gamma Proteins 0.000 description 1
- 102100038617 Hemoglobin subunit gamma-2 Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- 101001042049 Human herpesvirus 1 (strain 17) Transcriptional regulator ICP22 Proteins 0.000 description 1
- 101000999690 Human herpesvirus 2 (strain HG52) E3 ubiquitin ligase ICP22 Proteins 0.000 description 1
- 241000713340 Human immunodeficiency virus 2 Species 0.000 description 1
- 101150090364 ICP0 gene Proteins 0.000 description 1
- 101150027427 ICP4 gene Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 108700005089 MHC Class I Genes Proteins 0.000 description 1
- 108091054437 MHC class I family Proteins 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 241000712079 Measles morbillivirus Species 0.000 description 1
- 102000014415 Muscarinic acetylcholine receptor Human genes 0.000 description 1
- 108050003473 Muscarinic acetylcholine receptor Proteins 0.000 description 1
- 102000011830 Neural cell adhesion Human genes 0.000 description 1
- 108050002172 Neural cell adhesion Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- 241001144416 Picornavirales Species 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 1
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 1
- 241001505332 Polyomavirus sp. Species 0.000 description 1
- 108010015078 Pregnancy-Associated alpha 2-Macroglobulins Proteins 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102000016611 Proteoglycans Human genes 0.000 description 1
- 108010067787 Proteoglycans Proteins 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 206010037742 Rabies Diseases 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 241000702263 Reovirus sp. Species 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 206010041660 Splenomegaly Diseases 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- 241000711975 Vesicular stomatitis virus Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- ZVQOOHYFBIDMTQ-UHFFFAOYSA-N [methyl(oxido){1-[6-(trifluoromethyl)pyridin-3-yl]ethyl}-lambda(6)-sulfanylidene]cyanamide Chemical compound N#CN=S(C)(=O)C(C)C1=CC=C(C(F)(F)F)N=C1 ZVQOOHYFBIDMTQ-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 229940074608 allergen extract Drugs 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 102000013529 alpha-Fetoproteins Human genes 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000001147 anti-toxic effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 239000002981 blocking agent Substances 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- 239000012503 blood component Substances 0.000 description 1
- 239000003914 blood derivative Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000002327 eosinophilic effect Effects 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 230000008826 genomic mutation Effects 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002706 hydrostatic effect Effects 0.000 description 1
- 230000009851 immunogenic response Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 101710130522 mRNA export factor Proteins 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 101150008049 mx gene Proteins 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 244000309711 non-enveloped viruses Species 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 230000002023 papillomaviral effect Effects 0.000 description 1
- GJVFBWCTGUSGDD-UHFFFAOYSA-L pentamethonium bromide Chemical compound [Br-].[Br-].C[N+](C)(C)CCCCC[N+](C)(C)C GJVFBWCTGUSGDD-UHFFFAOYSA-L 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000003393 splenic effect Effects 0.000 description 1
- 208000003265 stomatitis Diseases 0.000 description 1
- 108091007196 stromelysin Proteins 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- HDZZVAMISRMYHH-KCGFPETGSA-N tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HDZZVAMISRMYHH-KCGFPETGSA-N 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229940124856 vaccine component Drugs 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 208000005925 vesicular stomatitis Diseases 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 210000000605 viral structure Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本公开提供了用于表达病毒载体的哺乳动物细胞系,及其制备和使用方法。所提供的方法采用:使用能够被包装到病毒载体中的标识符来选择和/或鉴定具有与病毒载体产生的有益特征相关的工程化序列的哺乳动物细胞系。示例性病毒载体包括AAV载体。
Description
相关申请的交叉引用
本申请要求于2020年9月1日提交的美国临时专利申请号63/073,365和于2020年11月9日提交的美国临时专利申请号63/111,238的权益,两个申请的内容以引用的方式整体并入本文。
背景技术
生物制剂市场诸如像基因和细胞疗法正在扩大,但目前承受着高制造成本和与扩大生产相关的困难的负担。持续需要改善的细胞系和分离它们的方法,用于包括但不限于生物制剂生产和病毒载体生产的应用。
发明内容
本公开尤其提供了用于在哺乳动物细胞中产生和/或表达病毒载体的方法、系统和组合物。本公开认识到,用于在哺乳动物细胞中表达病毒载体的现有技术承受着低效的病毒生产和低效的分离优化的哺乳动物细胞系的筛选的负担。本公开提供了用于工程化哺乳动物细胞和/或病毒载体以获得改变的与病毒载体生产相关的特征和其他特征的平台技术。在一些实施方案中,提供的方法使产生和/或选择具有改善的病毒载体表达和/或生产特征(例如,增加的病毒载体表达、增加的表达持续时间、增加的稳定性等)的哺乳动物细胞系成为可能。在一些实施方案中,方法包括筛选由具有标识符的哺乳动物细胞的文库产生的病毒载体。提供的技术包括令人惊讶的见解,即使病毒载体获取表达其的哺乳动物细胞的标识符(例如,包括条形码序列和/或文库变体),从而使文库中细胞的病毒载体产生能力的有效评估、表征和/或鉴定成为可能。例如,在一些实施方案中,哺乳动物细胞群各自用文库构建体转化,所述文库构建体包含标识符,具有适合于将标识符包装到病毒载体中的结构(例如,对于AAV载体,标识符可以位于AAV ITR之间)。在一些实施方案中,可以通过丰富的独特标识符来筛选、选择和/或表征由此类哺乳动物细胞群产生的病毒载体池。
在一些实施方案中,提供了包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(i)至少一个位于能够包装到病毒载体中的两个病毒重复序列之间的标识符,和(ii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
在一些实施方案中,由哺乳动物细胞产生的病毒载体包含与产生病毒载体的哺乳动物细胞的标识符相同的标识符。在一些实施方案中,病毒载体的标识符源自产生病毒载体的哺乳动物细胞的标识符。在一些实施方案中,病毒载体的标识符对应于产生病毒载体的哺乳动物细胞的标识符。在一些实施方案中,病毒载体的标识符与产生病毒载体的哺乳动物细胞的标识符至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同。
在一些实施方案中,提供了包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(i)至少一个位于能够包装到病毒载体中的两个病毒重复序列之间的标识符,(ii)至少一个扰动,和(iii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中哺乳动物细胞产生包含至少一个标识符的病毒载体。在一些实施方案中,哺乳动物细胞还包含有效载荷和/或至少一个文库变体。在一些实施方案中,哺乳动物细胞还包含至少一个扰动附加序列。
在一些实施方案中,提供了包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(i)至少一个位于能够包装到病毒载体中的两个病毒重复序列之间的标识符,(ii)至少一个文库变体,和(iii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中哺乳动物细胞产生包含至少一个标识符的病毒载体。在一些实施方案中,哺乳动物细胞还包含有效载荷和/或至少一个扰动。在一些实施方案中,哺乳动物细胞还包含至少一个扰动附加序列。
在一些实施方案中,提供了包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(i)至少一个位于能够包装到病毒载体中的两个病毒重复序列之间的标识符,(ii)至少一个有效载荷,和(iii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中哺乳动物细胞产生包含至少一个标识符的病毒载体。在一些实施方案中,哺乳动物细胞还包含至少一个文库变体和/或至少一个扰动。在一些实施方案中,哺乳动物细胞还包含至少一个扰动附加序列。
在一些实施方案中,哺乳动物细胞还包含至少一个反式作用整合序列和/或至少一个顺式作用整合序列。
在一些实施方案中,提供了包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(i)至少一个位于能够包装到病毒载体中的两个病毒重复序列之间的标识符;(ii)至少一个文库变体和/或扰动;(iii)至少一个有效载荷;(iv)至少一个扰动附加序列;(v)至少一个反式作用整合序列和/或至少一个顺式作用整合序列;和(vi)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
在一些实施方案中,提供了包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(i)至少一个位于能够包装到病毒载体中的两个病毒重复序列之间的标识符;(ii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸;以及任选的(iii)一个或多个包含至少一个扰动、至少一个文库变体、至少一个有效载荷、至少一个扰动附加序列、至少一个反式作用整合序列,和/或至少一个顺式作用整合序列的工程化序列,并且其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
在一些实施方案中,提供了包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(i)文库构建体,和(ii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中所述文库构建体包含标识符,其中所述标识符位于能够包装到病毒载体中的两个病毒重复序列之间,并且其中哺乳动物细胞产生包含所述标识符的病毒载体。在一些实施方案中,哺乳动物细胞任选地还包含一个或多个工程化序列,所述一个或多个工程化序列包含:至少一个扰动、至少一个文库变体、至少一个有效载荷、至少一个扰动附加序列、至少一个反式作用整合序列,和/或至少一个顺式作用整合序列,并且其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
在一些实施方案中,由哺乳动物细胞产生的病毒载体包含与文库构建体相同的标识符。在一些实施方案中,病毒载体的标识符源自相关文库构建体的标识符。在一些实施方案中,病毒载体的标识符对应于文库构建体的标识符。在一些实施方案中,病毒载体的标识符与文库构建体的标识符至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同。
在一些实施方案中,提供了包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(i)文库构建体,和(ii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中所述文库构建体包含标识符,其中所述标识符位于能够包装到病毒载体中的两个病毒重复序列之间,并且其中哺乳动物细胞产生包含所述标识符的病毒载体。在一些实施方案中,文库构建体任选地还包含一个或多个工程化序列,所述一个或多个工程化序列包含至少一个文库变体和/或至少一个有效载荷。在一些实施方案中,哺乳动物细胞任选地还包含一个或多个工程化序列,所述一个或多个工程化序列包含:至少一个扰动、至少一个扰动附加序列、至少一个反式作用整合序列,和/或至少一个顺式作用整合序列,并且其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
在一些实施方案中,提供了包含多个哺乳动物细胞的哺乳动物细胞群,所述多个哺乳动物细胞各自单独地包含一个或多个工程化序列,其中所述一个或多个工程化序列共同包含:(i)至少一个位于能够包装到病毒载体中的两个病毒重复序列之间的标识符,(ii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且其中哺乳动物细胞群产生单独地包含至少一个标识符的病毒载体。在一些实施方案中,哺乳动物细胞群任选地还包含一个或多个工程化序列,所述一个或多个工程化序列包含:至少一个扰动、至少一个文库变体、至少一个有效载荷、至少一个扰动附加序列、至少一个反式作用整合序列,和/或至少一个顺式作用整合序列。
在一些实施方案中,提供了包含多个哺乳动物细胞的哺乳动物细胞群,所述多个哺乳动物细胞各自单独地包含一个或多个工程化序列,其中所述一个或多个工程化序列共同包含:(i)至少一个位于能够包装到病毒载体中的两个病毒重复序列之间的标识符,(ii)至少一个文库变体和/或扰动,(iii)至少一个有效载荷,和(iv)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中哺乳动物细胞群产生单独地包含至少一个标识符的病毒载体。在一些实施方案中,哺乳动物细胞任选地还包含一个或多个工程化序列,所述一个或多个工程化序列包含:至少一个扰动附加序列、至少一个反式作用整合序列,和/或至少一个顺式作用整合序列。
在一些实施方案中,提供了包含多个哺乳动物细胞的哺乳动物细胞群,所述多个哺乳动物细胞各自单独地包含一个或多个工程化序列,其中所述一个或多个工程化序列共同包含:(i)文库构建体和(ii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中文库构建体包含位于能够包装到病毒载体中的两个病毒重复序列之间的标识符,并且其中哺乳动物细胞群产生单独地包含标识符的病毒载体。在一些实施方案中,哺乳动物细胞群任选地还包含一个或多个工程化序列,所述一个或多个工程化序列包含:至少一个扰动、至少一个文库变体、至少一个有效载荷、至少一个扰动附加序列、至少一个反式作用整合序列,和/或至少一个顺式作用整合序列。
在一些实施方案中,提供了包含多个哺乳动物细胞的哺乳动物细胞群,所述多个哺乳动物细胞各自单独地包含一个或多个工程化序列,其中所述一个或多个工程化序列共同包含:(i)文库构建体和(ii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中文库构建体包含位于能够包装到病毒载体中的两个病毒重复序列之间的标识符,并且其中哺乳动物细胞群产生单独地包含标识符的病毒载体。在一些实施方案中,文库构建体任选地还包含一个或多个工程化序列,所述一个或多个工程化序列包含至少一个文库变体和/或至少一个有效载荷。在一些实施方案中,哺乳动物细胞群任选地还包含一个或多个工程化序列,所述一个或多个工程化序列包含:至少一个扰动、至少一个扰动附加序列、至少一个反式作用整合序列,和/或至少一个顺式作用整合序列。
在一些实施方案中,提供的哺乳动物细胞包含扰动(例如,一个或多个扰动)。在一些实施方案中,提供的哺乳动物细胞产生包含扰动(例如,一个或多个扰动)的病毒载体。在一些实施方案中,提供的哺乳动物细胞包含扰动(例如,一个或多个扰动),所述哺乳动物细胞也产生包含扰动(例如,一个或多个扰动)的病毒载体。在一些实施方案中,至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸包含扰动(例如,一个或多个扰动)。在一些实施方案中,提供的哺乳动物细胞包含扰动(例如,一个或多个扰动),并且至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸包含扰动(例如,一个或多个扰动)。在一些实施方案中,提供的哺乳动物细胞产生包含扰动(例如,一个或多个扰动)的病毒载体,并且至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸包含扰动(例如,一个或多个扰动)。在一些实施方案中,提供的哺乳动物细胞包含扰动(例如,一个或多个扰动),所述哺乳动物细胞也产生包含扰动(例如,一个或多个扰动)的病毒载体,并且至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸包含扰动(例如,一个或多个扰动)。
哺乳动物细胞和/或哺乳动物细胞群可包括本领域适合于表达病毒载体的任何哺乳动物细胞。在一些实施方案中,哺乳动物细胞包括啮齿动物(小鼠、大鼠)、兔、猴、狗、猫、绵羊、牛、灵长类动物(例如,人)和/或猪的细胞。在一些实施方案中,哺乳动物细胞包括人胚肾(HEK)细胞、HEK 293细胞、HEK 293T细胞、Expi293细胞、中国仓鼠卵巢(CHO)细胞、HeLa细胞、HeLa S3细胞、PER.C6细胞、HKB11细胞、CAP细胞、幼仓鼠肾成纤维细胞(BHK细胞)(例如,BHK-21细胞)、小鼠骨髓瘤细胞(例如,Sp2/0细胞、NS0细胞)、非洲绿猴肾细胞(例如,COS细胞、Vero细胞)、A549细胞、恒河猴胎肺细胞(例如,FRhL-2细胞)或其任何衍生物。在一些实施方案中,哺乳动物细胞包括HEK 293细胞、HEK 293T细胞、CHO细胞或其衍生物。在一些实施方案中,哺乳动物细胞包括HEK 293细胞、HEK 293T细胞或其衍生物。在一些实施方案中,哺乳动物细胞包括HeLa细胞或其衍生物。
在一些实施方案中,哺乳动物细胞适用于悬浮细胞培养。在一些实施方案中,哺乳动物细胞适用于贴壁细胞培养。在一些实施方案中,哺乳动物细胞群可以包含悬浮细胞和/或贴壁细胞。
本公开的哺乳动物细胞和/或方法可以用于产生任何病毒载体。在一些实施方案中,由本公开的哺乳动物细胞和/或方法产生的病毒载体包含扰动(例如,一个或多个扰动)。在一些实施方案中,扰动改变一个或多个与产生病毒载体相关的特征(例如,病毒载体稳定性等)或其他特征(例如,改变的治疗活性等)。
在一些实施方案中,哺乳动物细胞文库的哺乳动物细胞已经被修饰以破坏或去除产生的病毒载体的受体。在一些实施方案中,哺乳动物细胞已经用阻断病毒载体感染的剂处理。
在一些实施方案中,病毒载体是腺相关病毒(AAV)载体、慢病毒载体、腺病毒载体、α病毒载体、辛德毕斯病毒载体、逆转录病毒载体(例如,γ逆转录病毒载体)、多瘤病毒载体(例如,猴病毒40(SV40)载体)、乳头瘤病毒载体(例如,牛乳头瘤病毒(BPV)载体)、痘苗病毒载体、单纯疱疹病毒(HSV)载体、麻疹病毒载体、棒状病毒载体、狂犬病病毒载体、水疱性口炎病毒(VSV)载体、小核糖核酸病毒载体(例如,脊髓灰质炎病毒载体)、呼肠孤病毒载体、塞内卡病毒载体、艾柯病毒(echovirus)载体(例如,RIGVIR)、塞姆利基森林病毒(SFV)载体、黄病毒载体、指环病毒载体、新城疫病毒(NDV)载体、副粘病毒载体、仙台病毒载体、正粘病毒载体、流感病毒载体、冠状病毒载体和/或杂交病毒载体,和/或其衍生物、杂交体和/或工程化衍生物。
在一些实施方案中,本文提供的哺乳动物细胞、哺乳动物细胞群和/或方法可用于表达腺相关病毒(AAV)载体。在一些实施方案中,哺乳动物细胞包含(i)至少一个位于能够包装到AAV载体中的两个病毒重复序列之间的标识符和(ii)至少一个包含一个或多个产生AAV载体所必需的核酸序列的多核苷酸。在一些实施方案中,两个病毒重复序列各自是能够包装到AAV载体中的AAV ITR序列。在一些实施方案中,两个病毒重复序列各自是哺乳动物AAV ITR序列。在一些实施方案中,两个病毒重复序列各自是人AAV ITR序列。
在一些实施方案中,提供了包含多个哺乳动物细胞的哺乳动物细胞群,其中多个中的每个哺乳动物细胞包含:(i)核酸序列,其包含位于两个功能性AAV ITR序列之间的条形码,其中所述核酸序列被整合至位于一对顺式作用整合序列之间的哺乳动物基因组中,(ii)一个或多个文库变体,其导致一个或多个扰动,和(iii)一个或多个产生AAV载体所必需的核酸序列,其中哺乳动物细胞群产生多个AAV载体,其中每个AAV载体包含对应于产生它的哺乳动物细胞的条形码的条形码。在一些实施方案中,至少一个文库变体包含gRNA,并且所述哺乳动物细胞还包含RNA引导的核酸酶。在一些实施方案中,由哺乳动物细胞产生的AAV载体还包含有效载荷。
在一些实施方案中,哺乳动物细胞的顺式作用整合序列是源自慢病毒的病毒重复序列。在一些实施方案中,哺乳动物细胞的顺式作用整合序列是重组酶识别位点。
在一些实施方案中,相对于缺乏一个或多个扰动的参考哺乳动物细胞群,哺乳动物细胞的一个或多个扰动与AAV产生和/或AAV分泌的增加相关。在一些实施方案中,相对于缺乏一个或多个扰动的参考哺乳动物细胞,包含一个或多个扰动的哺乳动物细胞具有至少10%的AAV产生和/或AAV分泌增加。
在一些实施方案中,本文所述的哺乳动物细胞和/或文库构建体的两个病毒重复序列包含一对反向末端重复序列(ITR),其是或包括人AAV1 ITR;人AAV2 ITR;人AAV3bITR;人AAV4 ITR;人AAV5 ITR;人AAV6 ITR;人AAV7 ITR;人AAV8 ITR;人AAV9 ITR;人AAV10ITR;人AAV11 ITR;人AAV12 ITR;人AAV13 ITR,或其任何组合。
在一些实施方案中,本文所述的哺乳动物细胞和/或文库构建体的两个病毒重复序列包含一对反向末端重复序列(ITR),其是或包括牛AAV(b-AAV)ITR;犬AAV(CAAV)ITR;小鼠AAV1 ITR;山羊AAV ITR;大鼠AAV ITR;或禽AAV(AAAV)ITR。
在一些实施方案中,哺乳动物细胞包含一个或多个多核苷酸,其编码一个或多个产生AAV载体所必需的蛋白质,诸如AAV衣壳蛋白。在一些实施方案中,AAV载体包含人AAV1衣壳蛋白;人AAV2衣壳蛋白;人AAV3b衣壳蛋白;人AAV4衣壳蛋白;人AAV5衣壳蛋白;人AAV6衣壳蛋白;人AAV7衣壳蛋白;人AAV8衣壳蛋白;人AAV9衣壳蛋白;人AAV10衣壳蛋白;人AAV11衣壳蛋白;人AAV12衣壳蛋白;或人AAV13衣壳蛋白。在一些实施方案中,AAV载体包含人祖先AAV衣壳蛋白。在一些实施方案中,AAV载体包含牛AAV(b-AAV)衣壳蛋白;犬AAV(CAAV)衣壳蛋白;小鼠AAV1衣壳蛋白;山羊AAV衣壳蛋白;大鼠AAV衣壳蛋白;或禽AAV(AAAV)衣壳蛋白。
在一些实施方案中,本文提供的哺乳动物细胞、哺乳动物细胞群和/或方法可用于表达AAV载体,其中哺乳动物细胞包含(i)包含至少一个位于能够包装到AAV载体中的两个AAV ITR序列之间的标识符的文库构建体,和(ii)至少一个包含一个或多个产生AAV载体所必需的选自Rep基因、Cap基因、辅助基因或其组合的核酸序列的多核苷酸。在一些实施方案中,至少一个包含一个或多个形成AAV载体所必需的核酸序列的多核苷酸包含:AAV Rep基因、AAV Cap基因、一个或多个AAV辅助基因或其组合。在一些实施方案中,AAV载体具有复制能力。在一些实施方案中,AAV载体是条件复制的、复制缺乏的、无复制能力的和/或复制缺陷的。
在一些实施方案中,哺乳动物细胞已经先前或同时被遗传修饰以破坏或去除AAV的受体。在一些实施方案中,哺乳动物细胞已经用阻断AAV载体感染的剂处理。
在一些实施方案中,本文提供的哺乳动物细胞、哺乳动物细胞群和/或方法可用于表达慢病毒载体。在一些实施方案中,哺乳动物细胞包含(i)至少一个位于能够包装到慢病毒载体中的两个病毒重复序列之间的标识符和(ii)至少一个包含一个或多个产生慢病毒载体所必需的核酸序列的多核苷酸。在一些实施方案中,两个病毒重复序列各自是能够包装到慢病毒载体中的慢病毒LTR序列。
在一些实施方案中,本文所述的哺乳动物细胞和/或文库构建体的两个病毒重复序列包含一对LTR,其包括HIV LTR、SIV LTR、马传染性贫血病毒LTR、FIV LTR、维斯纳病毒LTR,或其衍生物或组合。在一些特定的实施方案中,慢病毒载体是HIV载体并且LTR是HIVLTR或其衍生物。在一些实施方案中,慢病毒载体包含慢病毒Psi序列。
在一些实施方案中,提供了包含多个哺乳动物细胞的哺乳动物细胞群,其中多个中的每个哺乳动物细胞包含:(i)核酸序列,包含位于两个功能性慢病毒LTR序列之间的条形码,其中所述核酸序列被整合至位于一对顺式作用整合序列之间的哺乳动物基因组中,(ii)一个或多个文库变体,其导致一个或多个扰动,和(iii)一个或多个产生慢病毒载体所必需的核酸序列,其中哺乳动物细胞群产生多个慢病毒载体,其中每个慢病毒载体包含对应于产生它的哺乳动物细胞的条形码的条形码。在一些实施方案中,至少一个文库变体包含gRNA,并且所述哺乳动物细胞还包含RNA引导的核酸酶。在一些实施方案中,由哺乳动物细胞产生的慢病毒载体还包含有效载荷。
在一些实施方案中,哺乳动物细胞的顺式作用整合序列是源自慢病毒的病毒重复序列。在一些实施方案中,哺乳动物细胞的顺式作用整合序列是重组酶识别位点。
在一些实施方案中,慢病毒LTR包括HIV LTR、SIV LTR、马传染性贫血病毒LTR、FIVLTR、维斯纳病毒LTR或其衍生物或组合。在一些特定的实施方案中,慢病毒载体是HIV载体并且LTR是HIV LTR或其衍生物。在一些实施方案中,慢病毒载体包含慢病毒Psi序列。
在一些实施方案中,相对于缺乏一个或多个扰动的参考哺乳动物细胞群,哺乳动物细胞的一个或多个扰动与慢病毒载体产生和/或慢病毒载体分泌的增加相关。在一些实施方案中,相对于缺乏一个或多个扰动的参考哺乳动物细胞,包含一个或多个扰动的哺乳动物细胞具有至少10%的慢病毒载体产生和/或慢病毒载体分泌增加。
在一些实施方案中,由本公开的哺乳动物细胞和方法表达的慢病毒载体是人免疫缺陷病毒(HIV)载体、猴免疫缺陷病毒(SIV)载体、马传染性贫血病毒载体、猫免疫缺陷病毒(FIV)载体、维斯纳病毒载体或其衍生物。
在一些实施方案中,哺乳动物细胞包含一个或多个多核苷酸,其编码一个或多个产生慢病毒载体所必需的蛋白质,诸如慢病毒gag蛋白或其片段。在一些实施方案中,gag蛋白包含一个或多个选自基质(MA)、衣壳(CA)和核衣壳(NC)结构域的结构域。在一些实施方案中,哺乳动物细胞包含一个或多个多核苷酸,其编码一个或多个产生慢病毒载体所必需的蛋白质,诸如慢病毒包膜蛋白或其片段。
在一些实施方案中,慢病毒载体是包含源自不同病毒的gag蛋白和包膜蛋白的假型慢病毒载体。在一些实施方案中,哺乳动物细胞包含一个或多个编码一个或多个产生假型慢病毒载体所必需的蛋白质的多核苷酸,所述假型慢病毒载体包含源自人免疫缺陷病毒(HIV)载体、猴免疫缺陷病毒(SIV)载体、马传染性贫血病毒载体、猫免疫缺陷病毒载体、维斯纳病毒载体或其衍生物的gag蛋白和/或env蛋白。
在一些实施方案中,本文提供的哺乳动物细胞、哺乳动物细胞群和/或方法可用于表达慢病毒载体,其中哺乳动物细胞包含(i)包含至少一个位于两个慢病毒LTR和/或Psi序列之间的标识符的文库构建体,所述序列能够包装到慢病毒载体中,和(ii)至少一个包含一个或多个产生慢病毒载体所必需的选自gag基因、env基因、pol基因或其组合的核酸序列的多核苷酸。在一些实施方案中,至少一个包含一个或多个形成慢病毒载体所必需的核酸序列的多核苷酸包含:慢病毒gag基因、慢病毒env基因、慢病毒pol基因或其组合。在一些实施方案中,慢病毒载体具有复制能力。在一些实施方案中,慢病毒载体是条件复制的、复制缺乏的、无复制能力的和/或复制缺陷的。
在一些实施方案中,至少一个包含一个或多个形成慢病毒载体所必需的核酸序列的多核苷酸包含:HIV gag基因、HIV env基因、HIV pol基因或其组合。在一些实施方案中,慢病毒载体是具有复制能力的HIV载体。在一些实施方案中,慢病毒载体是条件复制的、复制缺乏的、无复制能力的和/或复制缺陷的HIV载体。
在一些实施方案中,哺乳动物细胞已经先前或同时被遗传修饰以破坏或去除慢病毒的受体。在一些实施方案中,哺乳动物细胞已经用阻断慢病毒载体感染的剂处理。在此类实施方案中,整合载体和/或顺式作用整合序列不是源自慢病毒。
在一些实施方案中,本文提供的哺乳动物细胞、哺乳动物细胞群和/或方法可用于表达单纯疱疹病毒(HSV)载体。在一些实施方案中,提供的哺乳动物细胞包含(i)至少一个位于能够包装到HSV载体中的两个病毒重复序列之间的标识符和(ii)至少一个包含一个或多个产生HSV载体所必需的核酸序列的多核苷酸。在一些实施方案中,HSV载体是或源自单纯疱疹病毒-1(HSV-1)、单纯疱疹病毒-2(HSV-2)、人巨细胞病毒(HCMV)、水痘-带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(EBV)、卡波西肉瘤相关疱疹病毒(KSHV)、人疱疹病毒6和/或人疱疹病毒7和/或其衍生物。
在一些实施方案中,本文所述的哺乳动物细胞和/或文库构建体的两个病毒重复序列包含末端a序列。
在一些实施方案中,哺乳动物细胞包含一个或多个多核苷酸,其编码一个或多个产生HSV载体所必需的蛋白质,诸如HSV衣壳蛋白或其片段。在一些实施方案中,HSV衣壳包含VP5、VP19C、VP23、pre-VP22a和/或成熟的蛋白酶(UL26基因产物)。
在一些实施方案中,本文提供的哺乳动物细胞、哺乳动物细胞群和/或方法可用于表达HSV载体,其中哺乳动物细胞包含(i)包含至少一个位于HSV末端a序列之间的标识符的文库构建体,所述序列能够包装到HSV载体中,和(ii)至少一个包含一个或多个产生包含HSV衣壳蛋白的HSV载体所必需的核酸序列的多核苷酸。
在一些实施方案中,本文提供的哺乳动物细胞、哺乳动物细胞群和/或方法可用于表达HSV-AAV杂交载体。在一些实施方案中,HSV-AAV杂交载体具有复制能力。在一些实施方案中,HSV-AAV杂交载体是条件复制的、复制缺乏的、无复制能力的和/或复制缺陷的。
在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含一个或多个多核苷酸,所述一个或多个多核苷酸包含一个或多个产生病毒载体所必需的核酸序列。在一些实施方案中,包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸游离存在于哺乳动物细胞中。在一些实施方案中,包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸存在于哺乳动物细胞基因组中。在一些实施方案中,一个或多个产生病毒载体所必需的核酸序列包含异源性调控元件(例如,异源性启动子和/或异源性增强子)。在一些实施方案中,一个或多个产生病毒载体所必需的核酸序列包含异源性启动子序列,所述异源性启动子序列是或包括SV40启动子、延伸因子(EF)-1启动子、巨细胞病毒(CMV)启动子、磷酸甘油酸激酶(PGK)1启动子、泛素(Ubc)启动子、人β肌动蛋白启动子、四环素反应元件(TRE)启动子、脾灶形成病毒(SFFV)启动子、鼠干细胞病毒(MSCV)启动子、超级核心启动子(SCP)、CAG启动子或其衍生物。在一些实施方案中,一个或多个产生病毒载体所必需的核酸序列包含异源性增强子序列,其是或包括CMV早期增强子、cAMP反应元件(CRE)增强子或其衍生物。在一些实施方案中,一个或多个产生病毒载体所必需的核酸序列处于诱导型转录控制元件的控制之下。在一些实施方案中,一个或多个产生病毒载体所必需的核酸序列可以整合到哺乳动物细胞基因组中并处于诱导型转录控制元件(例如,诱导型启动子和/或诱导型增强子)的控制之下。在一些实施方案中,一个或多个产生病毒载体所必需的核酸序列可以游离存在于哺乳动物细胞中并处于诱导型转录控制元件(例如,诱导型启动子和/或诱导型增强子)的控制之下。
本公开的哺乳动物细胞和/或哺乳动物细胞群的任何工程化序列可以游离存在和/或整合到哺乳动物细胞基因组中。在一些实施方案中,一个或多个工程化序列可以游离存在于哺乳动物细胞中,包括但不限于:标识符、扰动、文库变体、有效载荷、扰动附加序列、反式作用整合序列,和/或顺式作用整合序列。在一些实施方案中,一个或多个工程化序列可以整合到哺乳动物细胞基因组中,包括但不限于:标识符、扰动、文库变体、有效载荷、扰动附加序列、反式作用整合序列,和/或顺式作用整合序列。
在一些实施方案中,一个或多个工程化序列存在于病毒载体中(例如,标识符、扰动、有效载荷等)。在一些实施方案中,哺乳动物细胞和/或哺乳动物细胞群表达各自包含标识符和扰动的病毒载体。在一些实施方案中,病毒载体包含改变与病毒载体产生相关的一个或多个特征和/或其他特征(例如,稳定性等)的扰动。在一些实施方案中,病毒载体还包含有效载荷。在一些实施方案中,病毒载体还包含报告基因和/或选择标记。
在一些实施方案中,哺乳动物细胞包含文库构建体,其中构成文库构建体的一个或多个多核苷酸可以游离存在于哺乳动物细胞中,包括但不限于:标识符、文库变体、有效载荷、扰动附加序列、反式作用整合序列,和/或顺式作用整合序列。在一些实施方案中,哺乳动物细胞包含文库构建体,其中构成文库构建体的一个或多个多核苷酸可以整合到哺乳动物细胞中,包括但不限于:标识符、文库变体、有效载荷、扰动附加序列、反式作用整合序列,和/或顺式作用整合序列。在一些实施方案中,构成文库构建体的一个或多个多核苷酸可以以低拷贝数整合到哺乳动物细胞中,例如四个拷贝或更少、三个拷贝或更少、两个拷贝或更少,或单个拷贝。
在一些实施方案中,一个或多个工程化序列包含异源性编码序列。在一些实施方案中,一个或多个工程化序列包含异源性基因和/或异源性基因区段。在一些实施方案中,一个或多个工程化序列包含异源性调控元件(例如,异源性启动子和/或异源性增强子)。在一些实施方案中,一个或多个工程化序列包含异源性启动子序列,所述异源性启动子序列是或包括SV40启动子、延伸因子(EF)-1启动子、巨细胞病毒(CMV)启动子、磷酸甘油酸激酶(PGK)1启动子、泛素(Ubc)启动子、人β肌动蛋白启动子、四环素反应元件(TRE)启动子、脾灶形成病毒(SFFV)启动子、鼠干细胞病毒(MSCV)启动子、超级核心启动子(SCP)、CAG启动子或其衍生物。在一些实施方案中,一个或多个工程化序列包含异源性增强子序列,所述异源性增强子序列是或包括CMV早期增强子、cAMP反应元件(CRE)增强子或其衍生物。在一些实施方案中,一个或多个工程化序列包含诱导型转录控制元件。
在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含多于一个工程化序列(例如,标识符、扰动、文库变体、有效载荷、扰动附加序列、反式作用整合序列,和/或顺式作用整合序列)。在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个,或十个或更多个工程化序列。在一些实施方案中,哺乳动物细胞包含多至100个工程化序列。
在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含有包含一个或多个工程化序列的文库构建体,所述一个或多个工程化序列可以包括例如:标识符、文库变体、有效载荷、扰动附加序列、反式作用整合序列,和/或顺式作用整合序列。在一些实施方案中,本公开的哺乳动物细胞包含至少一个文库构建体,其中所述至少一个文库构建体包含至少一个工程化序列。在一些实施方案中,文库构建体包含两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个,或十个或更多个工程化序列。在一些实施方案中,文库构建体包含多至100个工程化序列。
在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群产生包含一个或多个工程化序列的病毒载体,所述一个或多个工程化序列可以包括例如:标识符、扰动、有效载荷,和/或顺式作用整合序列。
在一些实施方案中,本公开的哺乳动物细胞包含至少一个文库构建体,所述文库构建体包含至少一个选自以下的工程化序列:至少一个条形码、至少一个标识符、至少一个文库变体、至少一个有效载荷、至少一个顺式作用整合序列,或其组合和/或其多个。
在一些实施方案中,哺乳动物细胞包含至少一个包含条形码的工程化序列。在一些实施方案中,条形码包含约5至约25个核苷酸的序列。在一些实施方案中,提供的哺乳动物细胞包含多个独特的条形码,并且其中所述多个独特的条形码包含约5至约25个核苷酸的独特序列。
在一些实施方案中,文库构建体包含至少一个条形码。在一些实施方案中,文库构建体包含标识符,所述标识符包含至少一个条形码。在一些实施方案中,文库构建体包含标识符,所述标识符包含至少一个条形码,其中条形码位于两个病毒重复序列之间。在一些实施方案中,条形码位于两个病毒重复序列之间并且不是标识符。在一些实施方案中,条形码不位于两个病毒重复序列之间。
在一些实施方案中,哺乳动物细胞包含至少一个包含文库变体的工程化序列。文库变体可以包括但不限于包含基因、ORF、gRNA序列、非编码核酸或其组合的工程化序列。在一些实施方案中,哺乳动物细胞包含一个、两个、三个、四个、五个、六个、七个、八个、九个或十个文库变体。在一些实施方案中,哺乳动物细胞包含多至100个文库变体。
在一些实施方案中,哺乳动物细胞包含多个文库变体,其中所述多个文库变体包含至少一个工程化序列,所述至少一个工程化序列包含:至少一个独特基因、至少一个独特ORF、至少一个独特gRNA序列,和/或至少一个独特非编码核酸或其组合和/或多个。在一些实施方案中,哺乳动物细胞包含多个文库构建体,其中所述多个文库构建体包含:至少一个独特基因、至少一个独特ORF、至少一个独特gRNA序列、至少一个独特非编码核酸序列或其组合和/或多个。在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中所述多个文库构建体包含多个独特基因、多个独特ORF、多个独特gRNA序列、多个独特非编码核酸序列或其组合。
在一些实施方案中,文库构建体包含gRNA序列。在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中所述多个文库构建体包含至少一个独特gRNA序列。在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中所述多个文库构建体包含至少100个独特gRNA序列。
在一些实施方案中,文库构建体包含ORF。在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中所述多个文库构建体包含至少一个独特ORF。在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中所述多个文库构建体包含至少100个独特ORF。
在一些实施方案中,文库构建体包含基因。在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中所述多个文库构建体包含至少一个独特基因。在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中所述多个文库构建体包含至少100个独特基因。
在一些实施方案中,文库构建体包含非编码核酸序列。在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中所述多个文库构建体各自包含至少一个独特非编码核酸序列。在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中所述多个文库构建体包含至少100个独特非编码核酸序列。
在一些实施方案中,文库构建体包含至少一个报告基因和/或选择标记。在一些实施方案中,一个或多个包含文库构建体的多核苷酸包含报告基因和/或选择标记。
在一些实施方案中,文库构建体包含标识符。在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中所述多个文库构建体包含多个标识符。在一些实施方案中,标识符包含至少一个条形码和/或至少一个文库变体。在一些实施方案中,哺乳动物细胞包含有包含标识符的文库构建体,所述标识符包含至少一个条形码和/或至少一个文库变体。在一些实施方案中,哺乳动物细胞群包含多个包含多个标识符的文库构建体,其中所述标识符包含多个条形码和/或多个文库变体。
在一些实施方案中,文库构建体包含多个工程化序列,其中:多个工程化序列的第一子集位于两个病毒重复序列之间,并且多个工程化序列的第二子集位于两个病毒重复序列之外。
在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含多个包含至少一个文库变体和至少一个标识符的工程化序列,其中至少一个文库变体和至少一个标识符都位于两个病毒重复序列之间。在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含多个包含以下的工程化序列:至少一个文库变体、至少一个标识符和至少一个有效载荷,其中所述至少一个文库变体、至少一个标识符和至少一个有效载荷位于两个病毒重复序列之间。
在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含多个包含至少一个文库变体和至少一个标识符的工程化序列,并且其中至少一个标识符位于两个病毒重复序列之间,并且其中至少一个文库变体位于两个病毒重复序列之外。在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含多个包含至少一个文库变体、至少一个标识符和至少一个有效载荷的工程化序列,其中所述至少一个标识符和至少一个有效载荷位于两个病毒重复序列之间,并且其中所述至少一个文库变体位于两个病毒重复序列之外。
在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含多个包含至少两个文库变体和至少一个标识符的工程化序列,其中所述至少一个标识符和至少两个文库变体中的至少一个文库变体位于两个病毒重复序列之间,并且其中所述至少两个文库变体中的至少一个文库变体位于两个病毒重复序列之外。在一些实施方案中,提供的哺乳动物细胞还包含位于两个病毒重复序列之间的有效载荷。
在一些实施方案中,提供的文库构建体包含至少一个文库变体和至少一个标识符,其中所述至少一个文库变体和至少一个标识符都位于两个病毒重复序列之间。在一些实施方案中,提供的文库构建体包含:至少一个文库变体、至少一个标识符和至少一个有效载荷,其中所述至少一个文库变体、至少一个标识符和至少一个有效载荷位于两个病毒重复序列之间。
在一些实施方案中,提供的文库构建体包含至少一个文库变体和至少一个标识符,并且其中至少一个标识符位于两个病毒重复序列之间,并且其中至少一个文库变体位于两个病毒重复序列之外。在一些实施方案中,提供的文库构建体包含至少一个文库变体、至少一个标识符和至少一个有效载荷,其中所述至少一个标识符和至少一个有效载荷位于两个病毒重复序列之间,并且其中所述至少一个文库变体位于两个病毒重复序列之外。
在一些实施方案中,提供的文库构建体包含至少两个文库变体和至少一个标识符,其中所述至少一个标识符和至少两个文库变体中的至少一个文库变体位于两个病毒重复序列之间,并且其中所述至少两个文库变体中的至少一个文库变体位于两个病毒重复序列之外。在一些实施方案中,提供的文库构建体还包含位于两个病毒重复序列之间的有效载荷。
在一些实施方案中,至少一个标识符包含条形码。在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含至少一个包含至少一个条形码的工程化序列,并且其中所述至少一个条形码位于两个病毒重复序列之间。在一些实施方案中,位于两个病毒重复序列之间的条形码是标识符。在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含至少一个包含至少一个条形码的工程化序列,并且其中所述至少一个条形码位于两个病毒重复序列之外。
在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含多个条形码。在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含多个条形码,其中至少一个条形码位于两个病毒重复序列之间。在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含多个条形码,其中多个条形码位于两个病毒重复序列之间。在一些实施方案中,位于两个病毒重复序列之间的至少一个条形码是标识符。在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含多个条形码,其中多个条形码的第一子集位于两个病毒重复序列之间,并且多个条形码的第二子集位于两个病毒重复序列之外。
在一些实施方案中,提供的哺乳动物细胞包含文库构建体或其一部分的多于一个拷贝。在一些实施方案中,提供的哺乳动物细胞包含文库构建体或其一部分的1、2、3、4、5、6、7、8、9、10个或更多个拷贝。在一些实施方案中,提供的哺乳动物细胞包含文库构建体或其一部分的多个拷贝。在一些实施方案中,提供的哺乳动物细胞包含文库构建体或其一部分的一个至四个拷贝。在一些实施方案中,提供的哺乳动物细胞确切包含文库构建体或其一部分的两个拷贝。在一些实施方案中,提供的哺乳动物细胞确切包含文库构建体或其一部分的一个拷贝。
在一些实施方案中,提供的哺乳动物细胞包含至少一个由单个连续核酸序列组成的文库构建体。在一些实施方案中,提供的哺乳动物细胞群包含多个文库构建体,其中每个单独的文库构建体由单个连续核酸序列组成,并且其中多个文库构建体包含多个独特核酸序列。在一些实施方案中,文库构建体包含多于一个不连续核酸序列。在一些实施方案中,文库构建体包含至少两个、三个、四个、五个、六个、七个、八个、九个或十个不连续核酸序列。在一些实施方案中,文库构建体包含多至100个不连续核酸序列。
在一些实施方案中,提供的哺乳动物细胞群包含多个文库构建体,其中每个单独的文库构建体由不连续核酸序列组成,并且其中文库构建体包含多个独特核酸序列。在一些实施方案中,源自每个单独的哺乳动物细胞的核酸或其衍生物在单细胞测序方法过程中包含至少一个独特的细胞身份序列。在一些实施方案中,源自每个单独的哺乳动物细胞的多于一个核酸序列或其衍生物在单细胞测序方法过程中包含细胞身份序列。在一些实施方案中,源自每个单独的文库构建体的核酸或其衍生物在单细胞测序方法过程中包含至少一个独特的细胞身份序列。在一些实施方案中,源自每个单独的文库构建体的多于一个核酸序列或其衍生物在单细胞测序方法过程中包含细胞身份序列。
在一些实施方案中,提供的哺乳动物细胞群包含多个文库构建体,其中每个哺乳动物细胞包含单个文库构建体,所述单个文库构建体由多个不连续核酸序列组成,并且其中文库构建体包含多个独特核酸序列,并且其中来自文库构建体的多于一个核酸序列(或其衍生物)在单细胞测序方法过程中包含细胞身份序列。在一些实施方案中,来自文库构建体的所有核酸序列(或其衍生物)在单细胞测序方法过程中包含细胞身份序列。
在一些实施方案中,提供的哺乳动物细胞和/或病毒载体包含至少一个包含至少一个扰动的工程化序列。在一些实施方案中,提供的哺乳动物细胞包含至少一个游离存在于哺乳动物细胞中的扰动。在一些实施方案中,提供的哺乳动物细胞包含至少一个存在于哺乳动物细胞的基因组中的扰动。在一些实施方案中,提供的哺乳动物细胞包含至少两个扰动,其中至少一个扰动游离存在并且至少一个扰动存在于哺乳动物细胞的基因组中。
在一些实施方案中,由本文提供的哺乳动物细胞表达的病毒载体包含扰动(例如,一个或多个扰动)。在一些实施方案中,病毒载体包含工程化序列,所述工程化序列包含存在于病毒核酸中的扰动。在一些实施方案中,病毒载体包含工程化序列,所述工程化序列包含存在于ITR中的扰动。在一些实施方案中,病毒载体包含工程化序列,所述工程化序列包含存在于ITR之间的扰动。
在一些实施方案中,形成病毒载体所必需的一个或多个多核苷酸包含有包含扰动(例如,一个或多个扰动)的工程化序列。在一些实施方案中,形成病毒载体所必需的一个或多个多核苷酸游离存在并包含有包含扰动(例如,一个或多个扰动)的工程化序列。在一些实施方案中,形成病毒载体所必需的一个或多个多核苷酸存在于哺乳动物细胞的基因组中并包含有包含扰动(例如,一个或多个扰动)的工程化序列。
在一些实施方案中,提供的哺乳动物细胞和/或病毒载体包含多个独特的扰动。在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含至少两个、三个、四个、五个、六个、七个、八个或九个独特的扰动。
在一些实施方案中,提供的哺乳动物细胞和/或病毒载体包含至少一个扰动,所述扰动包括内源性基因组编码序列的插入、缺失、取代、替换、表观遗传修饰和/或重排。在一些实施方案中,内源性编码序列是或包含内源性基因或基因区段。
在一些实施方案中,提供的哺乳动物细胞和/或病毒载体包含至少一个扰动,所述扰动包括内源性基因组调控元件的插入、缺失、取代、替换、表观遗传修饰和/或重排。在一些实施方案中,内源性调控元件是或包含内源性启动子序列和/或内源性增强子序列。
在一些实施方案中,提供的哺乳动物细胞包含至少一个扰动附加序列。在一些实施方案中,扰动附加序列包含RNA引导的核酸酶或其衍生物。在一些实施方案中,RNA引导的核酸酶包含Cas9、Cpf1和/或CasZ或其衍生物,包括包含转录调控因子的融合蛋白(例如,Cas9-VPR或Cas9-KRAB-MeCP2融合物)、CRISPR蛋白与核酸酶结构域(例如,Fok1)的融合物、酶碱基编辑器(例如,BE和ABE融合物版本)、逆转录酶融合物(例如,引导编辑器)、CRISPR重组酶(例如,RecCas9)和CRISPR转座酶(例如,Tn7样转座酶系统Cas12k和与TniQ的级联复合物)。在一些实施方案中,RNA引导的核酸酶包含Cas9或其衍生物。
可以使用本领域已知的任何适当方法将提供的文库构建体引入哺乳动物细胞中。在一些实施方案中,通过转染和/或转导将文库构建体引入哺乳动物细胞中。在一些实施方案中,通过慢病毒介导的转导将文库构建体引入哺乳动物细胞中。
在一些实施方案中,提供的哺乳动物细胞包含文库构建体,其中文库构建体的至少一个工程化序列游离存在。在一些实施方案中,提供的哺乳动物细胞包含文库构建体,其中文库构建体包含至少一个包含至少一个文库变体的工程化序列,并且其中每个单独的细胞包含至少一个扰动附加序列,并且其中至少一个工程化序列游离存在。
在一些实施方案中,提供的哺乳动物细胞包含文库构建体,其中文库构建体的至少一个工程化序列包含至少一个文库变体,并且其中至少一个文库变体游离存在。在一些实施方案中,至少一个文库变体是效应物。在一些实施方案中,至少一个文库变体成为至少一个扰动。在一些实施方案中,至少一个文库变体包含至少一个ORF、至少一个基因、至少一个非编码核酸序列和/或至少一个gRNA,或其多个。
在一些实施方案中,提供的哺乳动物细胞包含文库构建体,其中文库构建体包含至少一个包含至少一个文库变体的工程化序列,所述至少一个文库变体包含至少一个gRNA,并且其中每个单独的细胞包含至少一个扰动附加序列,所述扰动附加序列包含RNA引导的核酸酶或非RNA引导的核酸酶或其衍生物,并且其中至少一个工程化序列游离存在。
在一些实施方案中,提供的哺乳动物细胞包含文库构建体,其中文库构建体包含至少一个包含至少一个文库变体的工程化序列,所述至少一个文库变体包含至少一个gRNA,其中每个单独的细胞包含至少一个扰动附加序列,所述扰动附加序列包含RNA引导的核酸酶或非RNA引导的核酸酶或其衍生物,并且其中至少一个工程化序列游离存在。
在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包括至少一个扰动。在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个扰动,所述至少一个扰动包括基因组序列变化、游离型序列变化和/或表观遗传修饰。在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个扰动,所述至少一个扰动包括内源性基因组编码序列的插入、缺失、取代和/或重排。
在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群产生单独地包含至少一个扰动的病毒载体。
在一些实施方案中,提供的哺乳动物细胞包含文库构建体,其中文库构建体的至少一个工程化序列存在于哺乳动物细胞的基因组中。在一些实施方案中,提供的哺乳动物细胞包含文库构建体,其中文库构建体包含至少一个包含至少一个文库变体的工程化序列,并且其中每个单独的细胞包含至少一个扰动附加序列,并且其中至少一个工程化序列存在于哺乳动物细胞的基因组中。
在一些实施方案中,将文库构建体或其一部分在随机插入位点插入哺乳动物细胞的基因组中。在一些实施方案中,随机插入位点在预定的基因组位置子集中是随机的。在一些实施方案中,将文库构建体或其一部分在预定插入位点插入哺乳动物细胞的基因组中。
在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含至少一个反式作用整合序列,其中所述至少一个反式作用整合序列包含(i)至少一个整合构建体和/或整合病毒载体,(ii)至少一个重组酶,和/或其多肽、蛋白质、核酸或多核苷酸产物,(iii)至少一个核酸酶,和/或其多肽、蛋白质、核酸或多核苷酸产物,(iv)至少一个转座酶,和/或其多肽、蛋白质、核酸或多核苷酸产物,和/或(v)至少一个工程化序列。
在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含至少一个反式作用整合序列,所述反式作用整合序列包含整合构建体和/或整合病毒载体。在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含至少一对位于第一组病毒重复序列侧翼的顺式作用整合序列,其中顺式作用整合序列包含第二组病毒重复序列。在一些实施方案中,整合构建体和/或整合病毒载体是慢病毒载体、γ逆转录病毒载体、泡沫逆转录病毒载体、腺相关病毒载体或其衍生物。在一些实施方案中,整合构建体或整合病毒载体是慢病毒载体。
在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含第一组病毒重复序列(例如,用于将序列包装到病毒载体靶标中)和包含第二组病毒重复序列的顺式作用整合序列。在一些实施方案中,包含第二组病毒重复序列的顺式作用整合序列是或包含LTR。
在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含至少一个反式作用整合序列,所述至少一个反式作用整合序列包含核酸酶和/或其多肽、蛋白质、核酸或多核苷酸产物。
在一些实施方案中,至少一个反式作用整合序列包含至少一个核酸酶,并且其中所述至少一个核酸酶包括RNA引导的核酸酶或其融合物或衍生物。在一些实施方案中,至少一个反式作用整合序列包含至少一个核酸酶,并且其中所述至少一个核酸酶包括非RNA引导的核酸酶或其融合物或衍生物。在一些实施方案中,至少一个核酸酶包括Cas9、CasZ、Cpf1、与可编程DNA结合结构域(诸如TALE蛋白(TALEN)或锌指蛋白(ZFN))融合的工程化Fok1核酸酶结构域,和/或大范围核酸酶或其衍生物。在一些实施方案中,至少一个核酸酶包括Cas9。
在一些实施方案中,至少一个反式作用整合序列还包含至少一个工程化序列。在一些实施方案中,至少一个反式作用整合序列包含RNA引导的核酸酶或其融合物或衍生物,并且还包含至少一个gRNA。
在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含至少一对位于第一组病毒重复序列侧翼的顺式作用整合序列,并且其中顺式作用整合序列包含同源臂序列。
在一些实施方案中,至少一个反式作用整合序列包含重组酶和/或其多肽、蛋白质、核酸或多核苷酸产物。在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含至少一对位于第一组病毒重复序列侧翼的顺式作用整合序列,并且其中顺式作用整合序列包含重组酶识别位点。在一些实施方案中,重组酶包括Cre、Flp、Dre、PhiC31和/或Bxb1,或其衍生物。
在一些实施方案中,重组酶包括包含Cre的重组酶。在一些实施方案中,重组酶识别位点包括LoxP位点。
在一些实施方案中,重组酶包括包含Bxb1的重组酶。在一些实施方案中,重组酶识别位点包括Att位点。
在一些实施方案中,重组酶包括包含Flp的重组酶。在一些实施方案中,重组酶识别位点包括Frt位点。
在一些实施方案中,至少一个反式作用整合序列包含转座酶和/或其多肽、蛋白质、核酸或多核苷酸产物。在一些实施方案中,提供的哺乳动物细胞和/或文库构建体包含至少一对位于第一组病毒重复序列侧翼的顺式作用整合序列,并且其中顺式作用整合序列包含转座酶识别位点。在一些实施方案中,转座酶包含Piggybac转座酶、睡美人转座酶和/或Tn5转座酶或其衍生物。在一些特定实施方案中,转座酶包含Piggybac转座酶或其衍生物。在一些特定实施方案中,转座酶包含睡美人转座酶或其衍生物。在一些特定实施方案中,转座酶包含Tn5转座酶或其衍生物。
在一些实施方案中,相对于参考群,哺乳动物细胞群产生发生改变的病毒载体。在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在将核酸转移至细胞的方式上发生改变的病毒载体。在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在治疗上发生改变的病毒载体。在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在预期应用上发生改变的病毒载体。
在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在应用中功能性较低的病毒载体。在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在应用中无功能性的病毒载体。在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在将核酸转移至细胞方面功能性较低和/或无功能性的病毒载体。在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在治疗上功能性较低和/或无功能性的病毒载体。在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在预期应用中功能性较低和/或无功能性的病毒载体。
在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在应用中功能性较高和/或增强的病毒载体。在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在将核酸转移至细胞方面功能性较高和/或增强的病毒载体。在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在治疗上功能性较高和/或增强的病毒载体。在一些实施方案中,相对于参考群,提供的哺乳动物细胞和/或哺乳动物细胞群产生在预期应用中功能性较高和/或增强的病毒载体。
在一些实施方案中,相对于参考细胞群,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个在生产规范下改变病毒载体产生的工程化序列(例如,扰动)。在一些实施方案中,相对于参考细胞群,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个在生产规范下提供增加的病毒载体产生的工程化序列(例如,扰动)。在一些实施方案中,相对于参考细胞群,具有改变的病毒载体产生的哺乳动物细胞包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个或更多个扰动。
在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个在当时现行的良好生产规范(cGMP)下提供增加的病毒载体产生的工程化序列(例如,扰动)。在一些实施方案中,至少一个工程化序列(例如,扰动)在良好生产规范(GMP)下提供增加的病毒载体产生。在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个在非良好生产规范(non-GMP)下提供增加的病毒载体产生的工程化序列(例如,扰动)。
在一些实施方案中,相对于参考细胞群,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个提供增加的哺乳动物细胞群活力的工程化序列(例如,扰动)。在一些实施方案中,相对于参考细胞群,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个提供增加的哺乳动物细胞群产生病毒载体的持续时间的扰动。在一些实施方案中,相对于参考细胞群,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个提供增加的哺乳动物细胞群基因组稳定性的工程化序列(例如,扰动)。
在一些实施方案中,相对于参考细胞群,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个在生产规范下提供减少的产生的病毒载体百分比的工程化序列(例如,扰动),所述病毒载体在应用中功能性较低。在一些实施方案中,相比于参考细胞群,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个在生产规范下提供减少的产生的病毒载体百分比的扰动,所述病毒载体在应用中无功能性。在一些实施方案中,相对于参考细胞群,百分比减少的病毒载体在将核酸转移至细胞方面功能性较低和/或无功能性。在一些实施方案中,相对于参考细胞群,百分比减少的病毒载体在治疗上功能性较低和/或无功能性。在一些实施方案中,相对于参考细胞群,百分比减少的病毒载体在预期应用中功能性较低和/或无功能性。
在一些实施方案中,相对于参考细胞群,提供的哺乳动物细胞和/或哺乳动物细胞群包含至少一个在生产规范下提供增加的产生的病毒载体百分比的工程化序列(例如,扰动),所述病毒载体在应用中功能性较高或增强。在一些实施方案中,相对于参考细胞群,百分比增加的病毒载体在将核酸转移至细胞方面功能性较高和/或增强。在一些实施方案中,相对于参考细胞群,百分比增加的病毒载体在治疗上功能性较高和/或增强。在一些实施方案中,相对于参考细胞群,百分比增加的病毒载体在预期应用中功能性较高和/或增强。
在一些实施方案中,相对于参考细胞群,至少一个工程化序列(例如,扰动)在生产规范下提供增加的病毒载体百分比,所述病毒载体含有用于它们的预期应用的所有和/或必需的核酸序列和/或其他元件。
在一些实施方案中,相对于参考细胞群,至少一个工程化序列(例如,扰动)在生产规范下提供减少的病毒载体百分比,所述病毒载体已失去用于它们的预期应用的所有和/或必需的核酸序列和/或其他元件,和/或使其发生突变。
在一些实施方案中,提供的哺乳动物细胞和/或哺乳动物细胞群和/或病毒载体包含多个工程化序列,其中所述多个工程化序列包含多个扰动。
在一些实施方案中,参考细胞群是:(a)不包含所述至少一个工程化序列的可比较的哺乳动物细胞群;和/或(b)能够产生病毒载体的标准细胞群。
在一些实施方案中,相对于参考细胞群,由本文所述的哺乳动物细胞产生的病毒载体包含在生产规范下改变病毒载体产生的工程化序列(例如,扰动)。在一些实施方案中,病毒载体包含改变功能(例如,治疗功能、将核酸转移至细胞的能力)、基因组稳定性、哺乳动物细胞的产生产量、哺乳动物细胞产生持续时间、产生的含有所有必需核酸序列的病毒载体百分比,和/或与病毒载体产生、病毒载体活性和/或病毒载体应用相关的另一个特征的扰动。
在一些实施方案中,哺乳动物细胞群通过以下方式产生:(a)将多个包含多个工程化序列的文库构建体引入到多个哺乳动物细胞中,其中单独的文库构建体包含至少一个位于第一组两个病毒重复序列之间的标识符,和(b)将至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸引入多个哺乳动物细胞中。
在一些实施方案中,哺乳动物细胞群通过将多个包含多个工程化序列的文库构建体引入到多个哺乳动物细胞中产生,其中单独的文库构建体包含至少一个位于第一组两个病毒重复序列之间的标识符,其中多个哺乳动物细胞包含一个或多个产生病毒载体所必需的核酸序列。
在一些实施方案中,提供了产生病毒载体的方法,所述方法包括:在使得哺乳动物细胞产生病毒载体的条件下培养本公开的哺乳动物细胞群,并且其中每个产生的病毒载体包含至少一个源自产生病毒载体的哺乳动物细胞的至少一个标识符的标识符。在一些实施方案中,每个产生的病毒载体包含至少一个与产生病毒载体的哺乳动物细胞的至少一个标识符相同的标识符。
在一些实施方案中,提供的方法包括:(a)从哺乳动物细胞文库产生病毒载体,其中哺乳动物细胞文库包含多个哺乳动物细胞,其中多个中的每个哺乳动物细胞单独地包含:(i)至少一个工程化序列,(ii)标识符,和(iii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且其中每个病毒载体包含源自产生病毒载体的哺乳动物细胞的标识符的标识符;和(b)检测病毒载体中的标识符。在一些实施方案中,每个病毒载体包含与产生病毒载体的哺乳动物细胞的标识符相同的标识符。
在一些实施方案中,提供的方法包括:(a)从哺乳动物细胞文库产生病毒载体,其中哺乳动物细胞文库包含多个哺乳动物细胞,其中多个中的每个哺乳动物细胞单独地包含:(i)至少一个工程化序列,(ii)至少一个标识符,和(iii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且其中每个病毒载体包含至少一个源自产生病毒载体的哺乳动物细胞的至少一个标识符的标识符;和(b)通过下一代测序检测病毒载体中的一个或多个标识符。在一些实施方案中,每个病毒载体包含至少一个与产生病毒载体的哺乳动物细胞的至少一个标识符相同的标识符。
在一些实施方案中,提供的方法包括:(a)产生AAV文库,其中AAV文库包含来自哺乳动物细胞文库的多个AAV载体,其中哺乳动物细胞文库包含多个哺乳动物细胞,其中多个中的每个哺乳动物细胞单独地包含:(i)至少一个工程化序列,(ii)至少一个条形码序列,和(iii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中每个AAV病毒载体包含至少一个构建体,并且其中至少一个构建体包含源自产生AAV病毒载体的哺乳动物细胞的至少一个条形码序列的条形码序列;和(b)检测AAV文库中的一个或多个条形码序列。在一些实施方案中,每个AAV病毒载体包含至少一个构建体,并且其中至少一个构建体包含与产生AAV病毒载体的哺乳动物细胞的至少一个条形码序列相同的条形码序列。
在一些实施方案中,提供的方法包括:(a)产生AAV文库,其中AAV文库包含来自哺乳动物细胞文库的多个构建体,其中哺乳动物细胞文库包含多个哺乳动物细胞,其中多个中的每个哺乳动物细胞单独地包含:(i)至少一个工程化序列,(ii)至少一个条形码序列,和(iii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中每个AAV病毒载体包含至少一个构建体,并且其中所述至少一个构建体包含源自产生AAV病毒载体的哺乳动物细胞的至少一个条形码序列的条形码序列;和(b)通过下一代测序检测AAV文库中的一个或多个条形码序列。在一些实施方案中,每个AAV病毒载体包含至少一个构建体,并且其中至少一个构建体包含与产生AAV病毒载体的哺乳动物细胞的至少一个条形码序列相同的条形码序列。在一些实施方案中,所提供的方法还包括对哺乳动物细胞文库的每个单独细胞内的至少一个或所有核酸序列或其衍生物进行单细胞测序的步骤,其中至少一个或所有核酸序列或其衍生物在单细胞测序方法过程中包含单细胞身份序列,并且其中至少一个或所有核酸序列或其衍生物包含至少一个文库构建体。
在一些实施方案中,本公开提供的方法还包括对哺乳动物细胞文库的每个单独细胞内的至少一个或所有核酸序列或其衍生物进行单细胞测序,其中至少一个或所有核酸序列或其衍生物在单细胞测序方法过程中包含单细胞身份序列,并且其中至少一个或所有核酸序列或其衍生物包含至少一个包含至少一个标识符的文库变体。
在一些实施方案中,本公开提供的方法还包括将第二文库构建体引入哺乳动物细胞中,其中哺乳动物细胞包含至少一个源自第一文库构建体的扰动,并且其中第二文库构建体包含至少一个包含位于第一组两个病毒重复序列之间的至少一个标识符的工程化序列。在一些实施方案中,将第二多个文库构建体引入多个哺乳动物细胞中,其中多个哺乳动物细胞包含至少一个源自第一多个文库构建体的扰动,并且其中第二多个文库构建体包含多个工程化序列,其中第二多个文库构建体中的每个单独的文库构建体包含至少一个位于第一组两个病毒重复序列之间的标识符。在一些实施方案中,提供的方法还包括通过单细胞测序和/或下一代测序检测一个或多个标识符和/或一个或多个工程化序列。在一些实施方案中,提供的方法包括多于两轮的文库构建体引入和一个或多个标识符和/或一个或多个工程化序列的检测。在一些实施方案中,提供的方法还包括使用机器学习方法来开发机器学习模型以鉴定靶扰动的期望组合。
在一些实施方案中,本公开提供的方法还包括去除哺乳动物细胞的至少一个标识符的步骤。在一些实施方案中,在提供的哺乳动物细胞和/或文库构建体包含报告基因和/或选择标记的情况下,提供的方法可以包括去除报告基因和/或选择标记的步骤。
在整个说明书中,在系统或组合物被描述为具有、包括或包含特定组件的情况下,或者在方法被描述为具有、包括或包含特定步骤的情况下,预期另外存在基本上由所述的组件组成或由所述的组件组成的本发明的系统或组合物,并且存在基本上由所述的步骤组成或由所述的步骤组成的根据本发明的方法。
应当理解,步骤的次序或执行某些动作的次序并不重要,只要本发明保持可操作即可。另外,两个或更多个步骤或动作可以同时进行。
以下描述仅用于说明和举例说明本公开,并不旨在将本发明限制于所描述的具体实施方案。
附图说明
本文包括的附图由下图组成,仅用于说明目的,并不用于限制。
图1描绘了用于鉴定或表征文库中哺乳动物细胞的病毒载体产生的技术平台的示意图,其中病毒载体获取与表达它们的哺乳动物细胞相关的标识符。
图2描绘了用于生成表达包含标识符的AAV病毒载体的哺乳动物细胞文库的示例性方案,其中慢病毒用于将文库构建体单拷贝或低拷贝整合到哺乳动物细胞基因组中。
图3描绘了通过确定病毒载体池中标识符的相对富集和使用单细胞测序方法鉴定哺乳动物细胞中的工程化序列来鉴定和/或表征文库中哺乳动物细胞的病毒载体产生的示例性方案。
图4描绘了使用包含标识符的AAV-in-Lenti构建体文库来生成表达AAV病毒载体的哺乳动物细胞文库的示例性方案。
图5描绘了用于生成表达AAV病毒载体的哺乳动物细胞文库的方法的示例性文库构建体的示意图。pSFX-LV-AAV是示例性AAV-in-Lenti文库构建体;pSFX-PB-AAV是示例性AAV-in-Transposase文库构建体;并且pSFX-AAV是用于游离表达的示例性AAV构建体。
图6描绘了对病毒载体核酸(例如,来自病毒载体(例如,AAV病毒载体)或细胞基因组DNA的标识符(例如,条形码)序列)进行测序的示例性示意图概览。
图7描绘了病毒载体池中条形码标识符的相对丰度图,所述病毒载体池由使用23个gRNA文库变体的AAV-in-Lenti构建体生成的示例性有限哺乳动物细胞文库产生。条形码丰度与野生型细胞(缺乏文库变体)的条形码丰度相关。图中的每个点代表文库中单个gRNA文库变体的分数;结果是三个生物学重复的平均值。
图8描绘了病毒载体池中条形码标识符的相对丰度的两张图,所述病毒载体池由使用大约12,000个gRNA文库变体的AAV-in-Lenti构建体生成的示例性哺乳动物细胞文库产生。(A)提供了由组成型表达Cas9的哺乳动物细胞文库产生的病毒载体池中条形码标识符的相对丰度图;(B)提供了由诱导型表达Cas9的哺乳动物细胞文库产生的病毒载体池中条形码标识符的相对丰度图。条形码丰度与野生型细胞(缺乏文库变体)的条形码丰度相关。每个点代表文库中单个基因的分数(根据4个对应的sgRNA分数计算);结果是三个生物学重复的平均值。
图9描绘了使用包含标识符的AAV-in-Transposase构建体文库来生成表达AAV病毒载体的哺乳动物细胞文库的示例性方案。
图10描绘了病毒载体池中条形码标识符的相对丰度的两张图,所述病毒载体池由使用23个gRNA文库变体的AAV-in-Transposase构建体生成的示例性哺乳动物细胞文库产生。(A)提供了由组成型表达Cas9的哺乳动物细胞文库产生的病毒载体池中条形码标识符的相对丰度图;(B)提供了由诱导型表达Cas9的哺乳动物细胞文库产生的病毒载体池中条形码标识符的相对丰度图。条形码丰度与野生型细胞(缺乏文库变体)的条形码丰度相关。图中的每个点代表文库中单个gRNA文库变体的分数;结果是三个生物学重复的平均值。
图11描绘了病毒载体池中条形码标识符的相对丰度的两张图,所述病毒载体池由使用大约12,000个gRNA文库变体的AAV-in-Transposase构建体生成的示例性哺乳动物细胞文库产生。(A)提供了由组成型表达Cas9的哺乳动物细胞文库产生的病毒载体池中条形码标识符的相对丰度图;(B)提供了由诱导型表达Cas9的哺乳动物细胞文库产生的病毒载体池中条形码标识符的相对丰度图。条形码丰度与野生型细胞(缺乏文库变体)的条形码丰度相关。每个点代表文库中单个基因的分数(根据4个对应的sgRNA分数计算);结果是三个生物学重复的平均值。
图12描绘了使用包含标识符的游离构建体文库来生成表达AAV病毒载体的哺乳动物细胞文库的示例性方案。
图13描绘了病毒载体池中条形码标识符的相对丰度图,所述病毒载体池由使用23个gRNA文库变体的游离AAV文库构建体生成的示例性有限哺乳动物细胞文库产生。条形码丰度与野生型细胞(缺乏文库变体)的条形码丰度相关。图中的每个点代表文库中单个gRNA文库变体的分数;结果是三个生物学重复的平均值。
图14描绘了病毒载体池中条形码标识符的相对丰度图,所述病毒载体池由使用大约12,000个gRNA文库变体的游离AAV文库构建体生成的示例性哺乳动物细胞文库产生。条形码丰度与野生型细胞(缺乏文库变体)的条形码丰度相关。每个点代表文库中单个基因的分数(根据4个对应的sgRNA分数计算);结果是三个生物学重复的平均值。
图15描绘了哺乳动物细胞(HEK293T)的病毒载体(特别是AAV)产生能力的图,所述哺乳动物细胞(HEK293T)已经被工程化以包含通过本文所述的示例性方法鉴定的文库变体。Y轴提供以每μL拷贝数为单位的AAV滴度,并且x轴提供不同的工程化细胞。沿着x轴从左至右,首先是缺乏Rep/Cap的野生型哺乳动物细胞的样品(阴性对照),然后是野生型哺乳动物细胞,然后是14种不同的哺乳动物细胞,其各自都已被工程化,包含从本文所述的筛选鉴定的单个基因(基因1至基因14)。与野生型细胞相比,几个基因的AAV滴度得到改善,观察到基因13和基因14的AAV滴度增加了大约10倍。
某些定义
为了更容易理解本发明,下文首先定义了某些术语。在整个说明书中阐述了以下术语和其他术语的附加定义。本文中为了描述本发明的背景并提供关于其实践的额外细节所引用的出版物和其他参考材料特此以引用的方式并入。
在本申请中,除非上下文另有明确说明,否则(i)术语“一(a/an)”在本文中用于指代一个或多于一个(即,指至少一个)文章的语法对象;(ii)术语“或”可以理解为意指“和/或”;(iii)术语“包含”和“包括”可理解为涵盖逐项列出的组分或步骤,无论是自身呈现还是与一个或多个额外组分或步骤一起呈现;并且(iv)在提供范围的情况下,端点包括在内。
在整个说明书中,每当多核苷酸或多肽由字母序列表示时(例如,A、C、G和T,在多核苷酸的情况下分别代表腺苷、胞苷、鸟苷和胸苷),此类多核苷酸或多肽以从左到右的5'到3'或N-末端到C-末端的顺序呈现。
约或大约:如本文所用,术语“约”或“大约”可以应用于一个或多个关注的值,包括与所陈述的参考值类似的值。一般来讲,熟悉上下文的本领域技术人员将理解所述上下文中“约”或“大约”所涵盖的相关差异程度。在一些实施方案中,术语“约”或“大约”是指落在规定参考值的±20%(大于或小于)内的值范围,除非另有说明或从上下文中另外明显看出。例如,在一些实施方案中,术语“约”或“大约”可以涵盖在参考值的20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小之内的值范围。
氨基酸:如本文所用,术语“氨基酸”是指可以并入多肽链中的任何化合物和/或物质,例如,通过形成一个或多个肽键。在一些实施方案中,氨基酸具有通用结构,例如,H2N–C(H)(R)–COOH。在一些实施方案中,氨基酸是天然存在的氨基酸。在一些实施方案中,氨基酸是非天然氨基酸;在一些实施方案中,氨基酸是D-氨基酸;在一些实施方案中,氨基酸是L-氨基酸。“标准氨基酸”是指天然存在的肽中常见的二十种标准L-氨基酸中的任一种。“非标准氨基酸”是指除标准氨基酸之外的任何氨基酸,无论其是合成制备的还是获得自天然来源的。从上下文可以清楚地看出,在一些实施方案中,术语“氨基酸”可以用于指代游离氨基酸;在一些实施方案中,它可以用于指代多肽的氨基酸残基。
与...相关:如本文所用,如果一个事件或实体的存在、水平和/或形式与另一个事件或实体的存在、水平和/或形式有关、关联或相关联,则短语“与...相关”描述所述两个事件或实体。例如,如果第一实体(例如,标识符)的存在和/或水平与第二实体(例如,工程化序列)的存在和/或水平相关联(例如,在哺乳动物细胞中,例如,通过细胞分裂和/或遗传操作),则认为第一实体与第二实体相关。在一些实施方案中,如果两个或更多个实体存在于同一细胞、基因组、染色体或遗传区域中(例如,使得它们通过多代的哺乳动物细胞分裂一起遗传),则它们在物理上与彼此“相关”。在一些实施方案中,如果特定实体(例如,标识符和/或工程化序列)的存在、水平和/或形式例如与特定表型(例如,病毒载体的细胞产生)改变的水平或外显率相关联(例如,所述实体表现出增加的病毒载体产生的细胞),则认为所述实体与所述表型相关。在一些实施方案中,两个或更多个实体在物理上彼此相关,直接或间接地相互作用,使得它们在物理上彼此接近和/或保持在物理上彼此接近。在一些实施方案中,物理上彼此相关的两个或更多个实体彼此共价连接;在一些实施方案中,物理上彼此相关的两个或更多个实体不彼此共价连接,而是非共价相关,例如通过氢键、范德华相互作用、疏水相互作用、磁性及其组合。
条形码:如本文所用,术语“条形码”是指能够在更大的异质性实体群中基本上区分实体(例如,分子、核酸、病毒、细胞等)或实体的组合的任何分子特征(例如,核酸序列)。在一些实施方案中,条形码是一种工程化序列。在一些实施方案中,条形码是一种工程化核酸序列。在一些实施方案中,条形码是文库构建体的一部分。在一些实施方案中,文库构建体可包含多于一个条形码。在文库构建体包含一个或多个条形码的情况下,一个或多个条形码可包含在(i)标识符内,(ii)标识符外,或(iii)标识符内外。在一些实施方案中,一个或多个条形码在检测(例如,通过下一代测序方法)时指示未被直接检测(例如,通过下一代测序方法)的一个或多个文库变体的身份。在一些实施方案中,条形码可以包含来自已知核酸序列池内的核酸序列。在一些实施方案中,条形码是外源性核酸序列。在一些实施方案中,条形码是内源性核酸序列。在一些实施方案中,条形码可以包含外源性序列和内源性序列。通常,条形码包含长度在3个核苷酸至50个核苷酸范围内的序列。例如,在一些实施方案中,条形码包含长度在由下限和上限(上限大于下限)界定的范围内的序列。在一些实施方案中,下限可以是约5个核苷酸、约6个核苷酸、约7个核苷酸、约8个核苷酸、约9个核苷酸、约10个核苷酸、约11个核苷酸、约12个核苷酸、约13个核苷酸、约14个核苷酸,或约15个核苷酸。在一些实施方案中,上限可以是约10个核苷酸、约15个核苷酸、约20个核苷酸、约25个核苷酸、约30个核苷酸、约35个核苷酸、约40个核苷酸、约45个核苷酸,或约50个核苷酸。在一些特定实施方案中,条形码包含长度在5个核苷酸至25个核苷酸范围内的序列。在一些特定实施方案中,条形码包含长度为约5个核苷酸、约10个核苷酸、约15个核苷酸、约20个核苷酸或约25个核苷酸的序列。
生物制剂:如本文所用,术语“生物制剂”在其最广泛的意义上是指由活生物体制成或源自活生物体(例如,在活系统中制造)的制品。根据本公开,生物制剂包括但不限于蛋白质、多肽、核酸、多核苷酸、病毒、病毒载体、治疗血清、毒素、抗毒素、疫苗、过敏原提取物、血液组分或衍生物、基因治疗产品、人体组织或细胞产品。在一些实施方案中,生物制剂是或包含可以用于治疗、治愈、减轻、预防或诊断严重或危及生命的疾病或医学病状的基于多肽的分子。在一些实施方案中,生物制剂是治疗性生物制剂。治疗性生物制剂是可以用于预防、治疗或治愈疾病或病状(例如,在哺乳动物中,例如,在人中)的那些。在一些实施方案中,生物制剂是诊断性生物制剂。在一些实施方案中,生物制剂用于制造(例如,制造基因治疗产品或细胞治疗产品)。在一些特定实施方案中,生物制剂是病毒载体。
细胞身份序列:如本文所用,是指用于标记所有来自特定哺乳动物细胞的待测序的核酸以作为单细胞测序方法的一部分的核酸序列。本公开涵盖以下认识:使用细胞身份序列的单细胞测序可用于文库构建体包含多个不连续核酸序列的方法。在此类方法中,给定的细胞身份序列可以提供存在于相同细胞中的所有标识符和/或文库变体的关联。使用不连续文库构建体和单细胞测序的方法的示例性示意图描绘于图3。然而,本公开还涵盖以下认识:使用细胞身份序列的单细胞测序也可以在一些实施方案中用于文库构建体包含单个连续核酸序列的方法。本公开还涵盖以下认识:在单细胞测序方法过程中,表达的RNA的逆转录过程中特异性附加单细胞身份序列。应当理解,旨在用于单细胞测序的构建体或核酸应包含在表达的RNA中,使得在逆转录步骤过程中可以使用适当的引物用细胞身份序列对所有转录物进行单细胞标记。
顺式作用整合序列:如本文所用,关于文库构建体的短语“顺式作用整合序列”是指通过一个或多个反式作用整合序列和/或其多肽、蛋白质、核酸或多核苷酸产物促进整合到细胞基因组(例如哺乳动物的细胞基因组)中的文库构建体本身上的核酸序列。在一些实施方案中,顺式作用整合序列包含在文库构建体中,并且在待整合到细胞基因组中的文库构建体的一部分的侧翼。在一些实施方案中,顺式作用整合序列包含同源臂、识别位点和/或病毒重复序列。
可比较的:如本文所用,术语“可比较的”是指两种或更多种剂、实体、情况、条件集合、受试者、群体等,它们可能彼此不相同,但足够类似以允许它们之间的比较,使得本领域技术人员将理解,可以基于观察到的差异或类似性合理地得出结论。在一些实施方案中,可比较的剂的集合、实体、情况、条件集合、受试者、群体等的特征在于多个基本相同的特征和一个或少量不同的特征。本领域的普通技术人员将理解,在上下文中,在任何给定情况下,对于两种或更多种此类剂、实体、情况、条件集合、受试者、群体等需要怎样的同一性程度才被认为是可比较的。例如,本领域的普通技术人员将理解,当剂的集合、实体、情况、条件集合、受试者、群体等在特征为以下时彼此是可比较的:足够数目和类型的基本上相同的特征,以保证得出以下合理结论:在不同的环境集合、刺激、剂、实体、情况、条件集合、受试者、群体等下获得的结果或观察到的现象的差异是由那些不同特征的变化引起的或指示那些不同特征的变化。
互补:如本文所用,术语“互补”是指根据标准沃森-克里克互补规则(Watson-Crick complementary rule)(腺嘌呤“A”碱基与胸腺嘧啶“T”配对,并且鸟嘌呤“G”碱基与胞嘧啶“C”配对)进行碱基配对的核苷酸或核苷酸序列。“100%互补”的核苷酸序列或表现出“100%互补性”的核苷酸序列是在两个核苷酸序列的至少一个的整体上彼此碱基配对的核苷酸序列。寡核苷酸可以与比寡核苷酸长的模板多核苷酸“100%互补”(即,如果寡核苷酸的整个序列与模板多核苷酸的一部分碱基配对,则寡核苷酸与模板多核苷酸“100%互补”)。然而,“互补”的核酸序列不必是100%互补。通常,关于两个或更多个核酸序列的术语“互补”是指两个核酸序列之间存在足够的互补性,使得它们在严格条件下和/或在扩增方法(例如,PCR或LCR)的退火阶段期间使用的温度下杂交。
构建体:如本文所用,术语“构建体”是指能够携带至少一个多核苷酸的实体。在一些实施方案中,构建体可以是质粒、转座子、粘粒或人工染色体(例如,人人工染色体(HAC)、酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1衍生的人工染色体(PAC))。在一些实施方案中,构建体有助于将多核苷酸转移至细胞。某些构建体能够在其所引入的宿主细胞中自主复制(例如,具有复制起点的质粒)。其他构建体可以整合到宿主细胞的基因组中,从而与宿主基因组一起复制。在一些实施方案中,提供了编码病毒载体的一个或多个元件的构建体。例如,在一些实施方案中,提供了编码用于在哺乳动物细胞中表达的病毒载体的一个或多个元件的质粒。在一些实施方案中,提供了编码病毒载体的一个或多个元件的构建体。在一些实施方案中,构建体是病毒载体。
对照:如本文所用,术语“对照”是指“对照”的本领域理解的含义,是与结果进行比较的标准。通常,对照用于通过分离变量以便对此类变量做出结论来增强实验的完整性。在一些实施方案中,对照是与测试反应或测定同时进行以提供比较物的反应或测定。例如,在一个实验中,应用了“测试”(即,被测试的变量)。在第二个实验中,应用了“对照”,不应用被测试的变量。在一些实施方案中,对照是历史对照(例如,先前进行的测试或测定的历史对照,或先前已知的量或结果)。在一些实施方案中,对照是或包括打印的或以其他方式保存的记录。在一些实施方案中,对照是阳性对照。在一些实施方案中,对照是阴性对照。
对应于:如本文所用,在多肽和核酸的上下文中,术语“对应于”通过与适当的参考多肽或核酸序列比较分别指定氨基酸残基或核苷酸残基的位置/身份。例如,在一些实施方案中,聚合物中的单体残基(例如,多肽中的氨基酸残基或多核苷酸中的核酸残基)可以被鉴定为“对应于”适当的参考聚合物中的残基。例如,本领域普通技术人员将理解,出于简单的目的,通常使用基于参考相关多肽的规范编号系统来指定多肽中的残基,使得“对应于”位置190处残基的氨基酸,例如,实际上不必是特定氨基酸链中的第190个氨基酸,而是对应于参考多肽中位置190处发现的残基;本领域普通技术人员容易理解如何鉴定“对应的”氨基酸(参见例如,Benson等人Nucl.Acids Res.(2013年1月1日)41(D1):D36-D42;Pearson等人PNAS第85卷,第2444-2448页,1988年4月)。本领域的技术人员将了解多种序列比对策略,包括可以用于例如根据本公开鉴定多肽和/或核酸中“对应的”残基的软件程序(例如,BLAST、FASTA等)。
内源性:如本文所用,术语“内源性”是指存在于其自然环境中的任何事物。关于核酸,“内源性的”可以例如是指源自细胞内部的核酸或其序列。例如,内源性核酸序列是天然存在于哺乳动物细胞基因组中而无需人为操作(例如,在其天然位置并在天然表达元件的控制下)的核酸序列。
工程化的:如本文所用,术语“工程化的”是指已由人为操作的方面。在核酸的上下文中,工程化可以包括可以对核酸进行的任何类型的修饰。在一些实施方案中,当序列已经被人为操作以产生在自然环境中不存在的序列,例如,包括缺失、插入、取代、替换、重排和/或融合至第二序列时,多核苷酸可以被认为是“工程化的”。例如,工程化多核苷酸可以包含两个或更多个序列,所述两个或更多个序列在自然界中并未按此顺序连接在一起,而是因为它们被人为操作以在工程化多核苷酸中彼此直接连接。类似地,如果细胞或生物体已经被操作使得其遗传信息改变(例如,先前不存在的新遗传物质已经例如通过转化、配对、体细胞杂交、转染、转导或其他机制引入,或先前存在的遗传物质例如通过取代或缺失突变或通过配对方案改变或去除),则认为细胞或生物体是“工程化的”。在一些实施方案中,工程化细胞(例如,工程化哺乳动物细胞)是指已经经过操作,使得其遗传、表观遗传和/或表型特性相对于适当的参考细胞(诸如其他没有被如此操作的相同细胞)发生改变的细胞。在一些实施方案中,操作是或包括遗传操作。在一些实施方案中,工程化细胞是已经被操作,使得其含有和/或表达改变的量和/或根据相对于此类适当参考细胞改变的时序的关注的特定剂(例如,蛋白质、核酸和/或其特定形式)的细胞。按照惯例并且被本领域技术人员理解,工程化多核苷酸或细胞的后代典型地仍被称为“工程化的”,即使实际操作是在先前实体上进行的。
工程化序列:如本文所用,短语“工程化序列”是指已经经过人为操作的序列(例如,核苷酸的序列)。在一些实施方案中,工程化序列是工程化核酸序列。在一些实施方案中,工程化核酸序列可以包括在5'至3'方向和/或3'至5'方向上阅读的序列。工程化核酸序列可以包括可以对核酸进行的任何类型的修饰(例如,引入、取代、缺失、替换、重排、表观遗传修饰等)。在一些实施方案中,工程化序列是或包括哺乳动物细胞基因组序列的遗传修饰。在一些实施方案中,工程化序列是或包括哺乳动物细胞基因组DNA的表观遗传修饰。在一些实施方案中,工程化序列是或包括游离序列(例如,引入或修饰游离存在于细胞内的序列)。在一些实施方案中,工程化序列是或包括具有一种或多种表观遗传特征的游离序列。在一些实施方案中,工程化序列是或包括标识符。在一些实施方案中,工程化序列是或包括多核苷酸,所述多核苷酸包含一个或多个产生病毒载体所必需的核酸序列。在一些实施方案中,工程化序列是或包括扰动。在一些实施方案中,工程化序列是或包括文库变体。在一些实施方案中,工程化序列是或包括有效载荷。在一些实施方案中,工程化序列是或包括扰动附加序列。在一些实施方案中,工程化序列是或包括反式作用整合序列。在一些实施方案中,工程化序列是或包括顺式作用整合序列。在一些实施方案中,工程化序列是或包括文库构建体。在一些实施方案中,工程化序列是或包括条形码。
游离基因:如本文所用,术语“游离基因”是指可以自主复制的染色体外遗传物质。在一些实施方案中,游离的遗传物质(例如,DNA)可以在质粒、粘粒、福斯质粒、人工染色体(例如,人人工染色体(HAC)、酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1衍生人工染色体(PAC))或病毒载体的环境中。
外源性:如本文所用,术语“外源性”是指被引入或已经被引入生物体或细胞中的任何实体。例如,“外源性核酸”是源自生物体或细胞外部的核酸。在一些实施方案中,哺乳动物细胞中的外源性核酸已经透过细胞膜被引入(例如,通过人为)。在一些实施方案中,外源性核酸可以是或包括存在于非天然环境中(例如,在不同位置和/或在非天然表达元件的控制下)的天然基因组中的核苷酸序列。在一些实施方案中,外源性核酸可以是或包括先前不存在于生物体或细胞(例如,来自不同生物体)的基因组中的核苷酸序列。外源性核酸包括外源性基因。“外源性基因”是已经引入生物体或细胞(例如,通过转化/转染)的核酸或其序列,其编码RNA和/或蛋白质的表达,并且在本文中也被称为“转基因”。
染色体外:如本文所用,术语“染色体外”是指不包含在染色体中的遗传物质。在哺乳动物细胞的情况下,染色体包括核染色体和线粒体染色体。染色体外遗传物质包括游离遗传物质。
基因:如本文所用,术语“基因”是指在染色体中编码基因产物(例如,RNA产物,例如,多肽产物)的DNA序列。在一些实施方案中,基因包括编码序列(即,编码特定产物的序列)。在一些实施方案中,基因包括非编码序列。在一些特定实施方案中,基因可以包括编码(例如,外显子)序列和非编码(例如,内含子)序列两者。在一些实施方案中,基因可以包括一种或多种调控序列(例如启动子、增强子等)和/或内含子序列,所述序列例如可以控制或影响基因表达(例如,细胞类型特异性表达、诱导型表达等)的一个或多个方面。如本文所用,术语“基因”通常是指编码多肽或其片段的核酸的一部分;所述术语可以任选地涵盖调控序列,如本领域普通技术人员根据上下文将清楚的。此定义并不旨在排除术语“基因”对非蛋白质编码表达单元的应用,而是要澄清,在大多数情况下,如本文件中使用的术语是指多肽编码核酸。在一些实施方案中,基因可以编码多肽,但所述多肽可能无功能,例如,基因变体可以编码相对于野生型基因不以相同方式发挥功能或根本不发挥功能的多肽。
基因组:如本文所用,术语“基因组”是指个体生物体或细胞携带的总遗传信息,由其染色体的完整核酸序列表示。
引导序列:如本文所用,术语“引导序列”是指对应于用于核酸酶介导的编辑(例如,用RNA引导的核酸酶)的引导RNA的核酸序列的核酸序列。术语“引导RNA”和“gRNA”是指促进RNA引导的核酸酶(诸如Cas9或Cpf1)与靶序列(诸如细胞中的基因组或游离序列)特异性缔合(或“靶向”)的任何核酸。gRNA可以是单分子的(包含单个RNA分子,并且也称为嵌合体)或模块化的(包含多于一个,并且通常是两个单独的RNA分子,诸如crRNA和tracrRNA,它们通常彼此缔合,例如通过复用(duplexing))。引导RNA,无论是单分子的还是模块化的,都包含“引导序列”,其与靶标内的序列(诸如需要编辑的细胞基因组中的DNA序列)完全或部分互补。引导序列在文献中被称为各种名称,包括但不限于“靶向结构域”、“互补区”(例如,Cotta-Ramusino等人的WO 2016/073990)、“间隔区”(例如,Briner等人,Molecular Cell56(2),333-339,2014年10月23日)和一般地“crRNA”(例如,Jiang等人NatBiotechnol.2013Mar;31(3):233–239)。不管它们的名称如何,引导序列的长度通常为约10至30个核苷酸。在一些实施方案中,引导序列的长度为15至25个核苷酸。在某些实施方案中,引导序列的长度为16至24个核苷酸(例如,长度为16、17、18、19、20、21、22、23或24个核苷酸)。在一些实施方案中,引导序列位于或接近gRNA的5'末端(例如,对于Cas9或从其衍生或获得的核酸酶)。在一些实施方案中,引导序列位于或接近gRNA的3'末端(例如,对于Cpf1或从其衍生或获得的核酸酶)。
异源性:如本文所用,术语“异源性”是指在存在的特定环境(例如,细胞或生物体)中不天然存在的任何实体。在核酸的环境中,异源性是指不天然一起(例如,在相同多核苷酸或相同细胞中)出现的序列。在一些实施方案中,异源性序列可以是将序列重排、替换、插入、取代至非内源性环境(例如,来自不同的基因组位置或来自不同的生物体)中。例如,异源性启动子序列或异源性增强子序列可以是与不同基因天然相关或来自不同生物体的序列。在一些实施方案中,异源性序列存在于哺乳动物细胞的基因组中。在一些实施方案中,异源性序列游离存在于哺乳动物细胞中。
同源性:如本文所用,术语“同源性”或“同源物”是指寡核苷酸分子(例如,DNA分子和/或RNA分子)之间和/或多肽分子之间的总体关联性。在一些实施方案中,如果寡核苷酸分子(例如,DNA分子和/或RNA分子)和/或多肽分子的序列至少15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%相同,则认为它们彼此“同源”。在一些实施方案中,如果寡核苷酸分子(例如,DNA分子和/或RNA分子)和/或多肽分子的序列至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%类似(例如,在对应位置处含有具有相关化学特性的残基),则认为它们彼此“同源”。例如,如本领域普通技术人员所熟知的,某些氨基酸通常彼此类似地被归类为“疏水”或“亲水”氨基酸,和/或具有“极性”或“非极性”的侧链。一种氨基酸取代为另一种相同类型的氨基酸通常可以被认为是“同源”取代。
标识符:如本文所用,是指(i)可以被检测(例如,通过下一代测序)和(ii)使鉴定产生或衍生病毒载体的哺乳动物细胞或克隆细胞系成为可能的元件。本公开提供了在哺乳动物细胞和病毒载体之间共享和/或转移的标识符。在一些实施方案中,标识符包含核酸序列。在一些实施方案中,标识符包含一个或多个条形码、一个或多个文库变体或其组合。在一些实施方案中,标识符包含可以例如通过PCR(例如,定量PCR)、杂交(例如,使用探针)和/或测序(例如,下一代测序和/或Sanger测序)检测的序列。在一些实施方案中,标识符是或包含在哺乳动物细胞和病毒载体之间共享和/或转移的核酸序列。一些实施方案中,标识符包含在文库构建体中(例如用于引入到哺乳动物细胞中)。在一些实施方案中,标识符在适合于将标识符包装到病毒载体中的遗传结构(例如,病毒重复序列,例如,AAV ITR序列)之间包含在文库构建体中。在一些实施方案中,标识符存在于病毒载体的基因组中(例如,在病毒重复序列之间)。在一些实施方案中,病毒载体基因组中(例如,病毒重复序列之间)的标识符的检测与产生或衍生病毒载体的哺乳动物细胞或克隆细胞系相关。在一些实施方案中,病毒载体基因组中(例如,病毒重复序列之间)的标识符的检测与同产生或衍生病毒载体的哺乳动物细胞或克隆细胞系相关的一个或多个文库构建体和/或一个或多个文库变体的存在相关。在一些实施方案中,提供的方法可以包括对标识符进行测序(例如,使用下一代测序方法)以确定特定病毒载体在病毒载体池或样品中的相对丰度的步骤。
同一性:如本文所用,术语“同一性”是指聚合物分子之间,例如核酸分子(例如,DNA分子和/或RNA分子)之间和/或多肽分子之间的总体关联性。例如,两个核酸或多肽序列的百分比同一性的计算可以通过出于最佳比较目的而比对两个序列来进行(例如,可以在第一序列和第二序列中的一者或二者中引入空位以进行最佳比对,并且可以出于比较目的忽略非同一性序列)。在一些实施方案中,出于比较目的比对的序列长度是参考序列长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或基本上100%;然后比较对应位置处的核苷酸。当第一序列中的位置被与第二序列中的对应位置相同的残基(例如,核苷酸或氨基酸)占据时,两个分子(即,第一和第二)在所述位置处是相同的。两个序列之间的百分比同一性是将为了两个序列的最佳比对而需要引入的空位的数量和每个空位的长度考虑在内,由被比较的两个序列共享的相同位置的数量的函数。两个序列之间的序列比较和百分比同一性的确定可以使用数学算法来完成。例如,可以使用Meyers和Miller的算法(CABIOS,1989,4:11-17,其以引用的方式整体并入本文)确定两个核苷酸序列之间的百分比同一性,所述算法已经并入ALIGN程序(2.0版)中。
整合构建体或整合病毒载体:如本文所用,是指促进构建体诸如文库构建体的基因组整合的构建体。在一些实施方案中,整合构建体是包含包膜病毒载体(例如,慢病毒载体)的整合病毒载体。例如,在一些实施方案中,在整合病毒载体(例如,慢病毒载体)的上下文中将文库构建体引入哺乳动物细胞中以产生具有整合到哺乳动物细胞基因组中的文库构建体的哺乳动物细胞;此类哺乳动物细胞将产生包含标识符的病毒载体。
分离的:如本文所用,是指物质和/或实体已经(1)与最初产生时(无论是在自然界和/或在实验环境中)与其相关的组分中的至少一些分离,且/或(2)由人为设计、产生、制备和/或制造。分离的物质和/或实体可以与最初与其相关的其他组分的约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或多于约99%分离。在一些实施方案中,分离的剂的纯度为约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或多于约99%。如本文所用,如果物质基本上不含其他组分,则所述物质是“纯的”。在一些实施方案中,如本领域技术人员将理解的,在已经与某些其他组分诸如像一种或多种载剂或赋形剂(例如,缓冲液、溶剂、水等)组合之后,物质仍可以被认为是“分离的”或甚至是“纯的”;在此类实施方案中,计算物质的百分比分离或纯度而不包括此类载剂或赋形剂。仅举一个实例,在一些实施方案中,自然界中存在的生物聚合物诸如多肽或多核苷酸在以下情况下被认为是“分离的”:a)凭借其来源或衍生源不与在自然界中以天然状态伴随它的一些或全部组分缔合;b)其基本上不含来自自然界中产生它的物种的相同物种的其他多肽或核酸;c)其由来自非自然界产生它的物种的细胞或其他表达系统的组分表达或以其他方式与所述组分相关。因此,例如,在一些实施方案中,化学合成的或在不同于自然产生它的细胞系统中合成的多肽被认为是“分离的”多肽。或者或另外,在一些实施方案中,已经经过一种或多种纯化技术的多肽可以被认为是“分离的”多肽,程度是其已经从其他组分分离,所述其他组分a)在自然界中与其相关;且/或b)在最初产生时与其相关。
文库构建体:如本文所用,是指一个或多个用于产生哺乳动物细胞文库的核酸构建体。如本文所用,文库构建体包含(i)至少一个标识符,(ii)适合于将标识符包装到病毒载体中的遗传结构(例如,病毒重复序列,例如,AAV ITR序列),和(iii)任何文库变体(如果尚未包含在标识符中)。文库构建体还可以包含其他工程化序列,诸如但不限于任何顺式作用整合序列(如果文库构建体的基因组整合是相关联的),和/或任何条形码。在一些实施方案中,文库构建体的所有元件都包含在单个(即,一个)连续核酸(例如,DNA)片段上。在一些实施方案中,文库构建体是指多个、单独的且不连续核酸(例如,DNA)片段。当文库构建体包含多个核酸时(即,不连续文库构建体),它将包括至少一个包含位于用于将标识符包装到病毒载体中的序列(例如,病毒重复序列,例如,AAV ITR序列)之间的标识符的构建体。在文库构建体不连续的一些实施方案中,文库构建体还包含一个或多个构建体,其中每个单独的构建体包含一个或多个文库变体。所提供的采用不连续文库构建体的方法还将包括鉴定文库构建体的一个或多个文库变体的步骤(例如,哺乳动物细胞的单细胞测序)。例如,图3描绘了一种方法,其中文库构建体包含单独的DNA片段,其显示包含有包含标识符的构建体(例如,侧翼为ITR的条形码)和包含文库变体的三个其他构建体(例如,三个独立且独特的gRNA)的细胞,其中标识符(例如,条形码)被包装到病毒载体中,并通过单细胞测序确定与文库变体的关联。可以设想,对于采用单个连续文库构建体的许多方法,单细胞测序并不总是需要的,但在一些情况下可能仍然有用。
文库变体:如本文所用,是指文库构建体的元件,其会产生在细胞之间变化的扰动。例如,在细胞群中,每个细胞都会得到不同的文库构建体,所述文库构建体包含独特的文库变体或文库变体的组合。例如,文库变体可以包含基因、ORF、gRNA序列、非编码核酸或其多个和/或组合。在本公开的上下文中,文库变体不同于条形码,但是一个或多个文库变体可以与一个或多个条形码相关。在一些实施方案中,一个或多个文库变体和/或条形码可以包含在文库构建体内的标识符之内或在其之外。在一些实施方案中,可以(例如,在下一代测序方法中)直接检测一个或多个条形码本身而不是文库变体本身。在一些实施方案中,文库变体在本文中可以称为效应物,由此文库变体影响或引起在细胞间变化的扰动。在一些实施方案中,文库变体本身可以成为在细胞间变化的扰动。例如,在一些实施方案中,是gRNA的文库变体是效应物,其连同RNA引导的核酸酶(例如,扰动附加序列)导致细胞基因组DNA内的缺失。在其他实施方案中,是ORF或基因序列的文库变体在其转染到细胞中以及在一些情况下整合到基因组DNA中(例如,如通过反式作用和顺式作用整合序列进行)时,本身成为细胞的遗传物质的扰动或修饰。
核酸:如本文所用,在其最广泛的意义上,是指被并入或可以被并入寡核苷酸链中的任何化合物和/或物质。在一些实施方案中,核酸是或是可以经由磷酸二酯键联并入寡核苷酸链中的化合物和/或物质。从上下文将清楚地看出,在一些实施方案中,“核酸”是指单独的核酸残基(例如,核苷酸和/或核苷);在一些实施方案中,“核酸”是指包含单独的核酸残基的寡核苷酸链。在一些实施方案中,“核酸”是或包括RNA;在一些实施方案中,“核酸”是或包括DNA。在一些实施方案中,核酸是、包含一个或多个天然核酸残基,或由其组成。在一些实施方案中,核酸是、包含一个或多个核酸类似物,或由其组成。
有效载荷:如本文所用,术语“有效载荷”是指通过本公开的方法产生的病毒载体递送的任何关注的实体。例如,可以期望将此种有效载荷被引入细胞、器官、生物体和/或生物系统(例如,包括细胞)。在一些实施方案中,有效载荷序列是或包含通过本公开的病毒载体递送的异源性核酸序列。在一些实施方案中,有效载荷序列包含以下中的一项或多项:编码区、基因调控元件和转录终止子。基因调控元件的非限制性实例包括启动子、转录激活子、增强子和聚腺苷酸化信号。在一些实施方案中,有效载荷序列包含编码区、基因调控元件和转录终止子,它们相对于彼此定位,使得编码区位于基因调控元件和转录终止子之间。在一些实施方案中,编码区编码基因产物。在一些实施方案中,基因产物是RNA。在一些实施方案中,编码区编码多肽(诸如蛋白质,诸如糖蛋白)。在一些实施方案中,编码区编码融合多肽和/或嵌合多肽。在一些实施方案中,编码区编码一种基因产物。在一些实施方案中,编码区编码多于一种基因产物(例如,2、3、4、5、6、7或更多种基因产物)。在一些实施方案中,编码区编码调控RNA(例如,siRNA、微小RNA等)。在一些特定实施方案中,有效载荷编码一个或多个用于基因编辑的实体(例如,gRNA介导的编辑系统)。在一些实施方案中,有效载荷编码蛋白质产物。
扰动:如本文所用,是指哺乳动物细胞、产生的病毒载体、产生病毒载体所必需的多核苷酸和/或其他构建体中的遗传修饰,所述遗传修饰由如本文所述的方法产生和/或鉴定。在一些实施方案中,哺乳动物细胞、产生的病毒载体、产生病毒载体所必需的多核苷酸和/或其他构建体包含一个或多个扰动。这些是从本公开的用于表达和/或产生病毒载体的哺乳动物细胞文库中生成、产生、鉴定和/或选择的。在一些实施方案中,扰动是一个或多个文库变体的结果。在一些实施方案中,扰动是遗传修饰,其不是文库变体的结果,而是由如本文所述的方法产生和/或鉴定的遗传修饰。在一些实施方案中,扰动包含在至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸中的遗传修饰。在一些实施方案中,扰动与哺乳动物细胞(例如,用于表达病毒载体(例如,独立地和/或合成地))或病毒载体的一种或多种期望特征相关。在一些实施方案中,扰动包括基因组序列变化(例如,基因组插入、缺失、取代、重排等)、游离序列变化和/或表观遗传修饰。
扰动附加序列:如本文所用,其包括有助于与文库构建体组合产生扰动的任何序列。例如,在一些实施方案中,文库构建体包含有包含gRNA的文库变体,并且扰动附加序列包含编码RNA引导的核酸酶或用于核酸酶介导的扰动的其他元件的序列。
多肽:如本文所用,术语“多肽”是指通常通过肽键连接的残基(例如,氨基酸)的任何聚合链。在一些实施方案中,多肽具有天然存在的氨基酸序列。在一些实施方案中,多肽具有非天然存在的氨基酸序列。在一些实施方案中,多肽具有被工程化的氨基酸序列,因为它是通过人为的作用设计和/或产生的。在一些实施方案中,多肽可以包含天然氨基酸、非天然氨基酸或两者,或由其组成。在一些实施方案中,多肽可以包含一个或多个侧基或其他修饰,例如,在多肽的N-末端、在多肽的C-末端或其任何组合处修饰或附接到一个或多个氨基酸侧链。在一些实施方案中,此类侧基或修饰可以是乙酰化、酰胺化、脂化、甲基化、聚乙二醇化等,包括其组合。在一些实施方案中,多肽可以含有L-氨基酸、D-氨基酸或两者,并且可以含有本领域已知的多种氨基酸修饰或类似物中的任一种。在一些实施方案中,有用的修饰可以是或包括例如末端乙酰化、酰胺化、甲基化等。在一些实施方案中,蛋白质可以包含天然氨基酸、非天然氨基酸、合成氨基酸及其组合。术语“肽”通常用于指代长度小于约100个氨基酸、小于约50个氨基酸、小于20个氨基酸或小于10个氨基酸的多肽。在一些实施方案中,蛋白质是抗体、抗体片段、其生物学活性部分和/或其特征部分。
多核苷酸:如本文所用,术语“多核苷酸”是指任何核酸的聚合链。在一些实施方案中,多核苷酸是或包含RNA;在一些实施方案中,多核苷酸是或包含DNA。在一些实施方案中,多核苷酸是、包含一个或多个天然核酸残基,或由其组成。在一些实施方案中,多核苷酸是、包含一个或多个核酸类似物,或由其组成。在一些实施方案中,多核苷酸类似物与核酸的不同之处在于多核苷酸类似物不利用磷酸二酯主链。或者或另外,在一些实施方案中,多核苷酸具有一个或多个硫代磷酸和/或5'-N-亚磷酰胺键联,而不是磷酸二酯键。在一些实施方案中,多核苷酸是、包含一个或多个天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷),或由其组成。在一些实施方案中,多核苷酸是、包含一个或多个核苷类似物(例如,2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮杂腺苷、7-脱氮杂鸟苷、8-氧代腺苷、8-氧代鸟苷、0(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、插入的碱基及其组合),或由其组成。在一些实施方案中,多核苷酸包含一个或多个与天然核酸中的糖相比修饰的糖(例如,2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖)。在一些实施方案中,多核苷酸具有编码功能性基因产物诸如RNA或蛋白质的核苷酸序列。在一些实施方案中,多核苷酸包含一个或多个内含子。在一些实施方案中,通过以下中的一种或多种方法制备多核苷酸:从天然来源分离、通过基于互补模板的聚合进行酶促合成(体内或体外)、在重组细胞或系统中复制和化学合成。在一些实施方案中,多核苷酸的长度为至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000或更多个残基。在一些实施方案中,多核苷酸部分或全部是单链;在一些实施方案中,多核苷酸部分或全部是双链。在一些实施方案中,多核苷酸具有包含至少一个编码多肽或是编码多肽的序列的补体的元件的核苷酸序列。在一些实施方案中,多核苷酸具有酶活性。
预定的:如本文所用,术语“预定的”是指在实验和/或分析开始之前。例如,在一些实施方案中,当一组可能的结果(例如,插入位点)在引入工程化序列(例如,工程化序列可以被插入几个不同的基因组位置之一)的物理行为之前已知时,工程化序列的位置或特征可以被认为是预定的。
蛋白质:如本文所用,术语“蛋白质”是指多肽(即,通过肽键彼此连接的至少两个氨基酸的串)。蛋白质可以包含除氨基酸之外的部分(例如,可以是糖蛋白、蛋白聚糖等)且/或可以以其他方式加工或修饰。本领域普通技术人员将理解,“蛋白质”可以是如由细胞产生的完整多肽链(具有或不具有信号序列),或可以是其特征部分。普通技术人员将理解,蛋白质有时可以包含多于一条例如通过一个或多个二硫键连接或者通过其他手段缔合的多肽链。
参考:如本文所用,术语“参考”描述了标准或对照,比较是相对于所述标准或对照进行的。例如,在一些实施方案中,将关注的剂、动物、个体、群体、样品、序列或值与参考或对照剂、动物、个体、群体、样品、序列或值分别进行比较。在一些实施方案中,参考或对照与关注的测试或测定基本上同时进行测试和/或测定。在一些实施方案中,参考或对照是历史参考或对照,任选地体现在有形介质中。通常,如本领域技术人员将理解的,将参考或对照在与评估下的条件或环境可比较的条件或环境下测定或表征。本领域技术人员将理解,何时存在足够类似性以证明依赖于特定可能的参考或对照和/或与特定可能的参考或对照比较是合理的。在一些实施方案中,参考是阴性对照参考;在一些实施方案中,参考是阳性对照参考。在一些实施方案中,与参考细胞或参考细胞群进行比较,所述参考细胞或参考细胞群具有可比较的遗传特征并且已经在可比较的条件下培养(除了关于正在分析的变量之外)。在一些特定实施方案中,参考细胞在至少一个工程化序列和/或至少一个条形码序列的存在方面不同,但在其他方面是可比较的。
RNA引导的核酸酶:如本文所用,术语“RNA引导的核酸酶”是指以序列特异性方式结合特定靶核苷酸序列的多肽,并且所述多肽由与多肽复合并与靶序列杂交的引导RNA分子导向靶核苷酸序列。尽管RNA引导的核酸酶能够在结合后切割靶序列,但术语RNA引导的核酸酶还涵盖能够结合但不切割靶序列的无核酸酶活性的RNA引导的核酸酶。RNA引导的核酸酶对靶序列的切割可以导致单链或双链断裂。仅能够切割双链核酸分子的单链的RNA引导的核酸酶在本文中被称为切口酶。在一些实施方案中,RNA引导的核酸酶是或源自Cas9、Cas Z、CpfI和/或Fok1。
反式作用整合序列:如本文所用,关于文库构建体的短语“反式作用整合序列”是指不一定作为文库构建体本身的一部分包含的核酸序列,其是将文库构建体整合到哺乳动物细胞基因组中所必需的。反式作用整合序列和/或其多肽、蛋白质、核酸或多核苷酸产物(例如,重组酶)实现与顺式作用整合序列(例如,重组酶位点)协同将文库构建体或其一部分整合到细胞基因组(例如,哺乳动物细胞)中。在一些实施方案中,多于一个反式作用整合序列对于文库构建体的整合是必需的。
转化或转染:如本文所用,术语“转化”或“转染”是指将外源性DNA引入到宿主细胞(例如,哺乳动物宿主细胞)中的任何过程。可以使用本领域熟知的各种方法在自然或人工条件下进行转化。转化可以依赖于将外源核酸序列插入到原核或真核宿主细胞中的任何已知方法。在一些实施方案中,特定转化方法是基于被转化的宿主细胞来选择的,并且可以包括但不限于病毒感染或转导、电穿孔、脂质体转染。在一些实施方案中,“转化的”细胞被稳定转化,因为插入的DNA能够作为自主复制质粒或作为宿主染色体的一部分进行复制。在一些实施方案中,转化的细胞在有限时间段内瞬时表达引入的核酸。
病毒载体:如本文所用,术语“病毒载体”是指(i)能够携带至少一个多核苷酸,并且(ii)包含病毒蛋白(例如,衣壳蛋白,例如,病毒衣壳蛋白和/或其变体或衍生物)的实体。在一些实施方案中,病毒载体包含一个或多个核酸分子。在一些实施方案中,病毒载体可以有助于核酸转移至细胞。在一些实施方案中,病毒载体包含一个或多个核酸序列和一个或多个病毒衣壳蛋白。在一些实施方案中,病毒载体包含源自腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体和/或逆转录病毒载体的衣壳蛋白和/或核酸序列。在一些实施方案中,病毒载体包含包膜。
本申请中引用的所有文献和类似材料,包括但不限于专利、专利申请、文章、书籍、论文和网页,无论此类文献和类似材料的格式如何,均以引用的方式明确地整体并入。如果一个或多个并入的文献和类似材料与本申请不同或矛盾,包括但不限于定义的术语、术语使用、描述的技术等,以本申请为准。本文所使用的小节标题仅出于组织性目的并且不解释为以任何方式限制所述的主题。
具体实施方式
生物制剂包括细胞和基因疗法、疫苗和生物试剂,是一个快速增长的市场。生物制剂可以在细胞内制造或其本身就是细胞(例如,细胞疗法,例如,CAR-T)。例如,哺乳动物细胞可以用于合成病毒,然后可以将病毒用作治疗剂(例如,疫苗、基因疗法),或者哺乳动物细胞可以用作治疗剂。然而,用于产生生物制剂的供应链,尤其是那些采用病毒载体的供应链,效率非常低。即使是病毒载体或哺乳动物宿主细胞的细微变化也可以影响生产收率。例如,病毒载体有效载荷和血清型可以影响哺乳动物细胞代谢、活力、病毒载体组装、病毒载体产生和/或病毒载体表达。为了降低成本和遵守良好生产规范,病毒载体的生物生产(诸如在哺乳动物细胞培养中)非常重要。本公开认识到病毒载体生产的问题在于哺乳动物细胞系通常未优化且/或分离优化细胞系的筛选平台也是低效的。由于生物生产的高成本和长生产时间两者以及对更大量的病毒载体的市场需求不断增加,目前病毒载体的制造是不充足的。
本公开尤其提供了用于在哺乳动物细胞中表达病毒载体的平台技术。本公开提供了使用基于文库的方法基于哺乳动物细胞或细胞系表达病毒载体的能力来筛选、评估和/或表征它们的方法。所提供的技术涵盖以下见解:使病毒载体获取表达其的哺乳动物细胞的标识符(例如,包括条形码序列和/或文库变体),从而使对病毒载体基因组(例如,病毒重复序列之间)进行测序以提供用于鉴定具有更高病毒载体表达和/或病毒载体产生的其他特征的哺乳动物细胞的有效且稳健的方法成为可能。所提供的方法、系统和组合物为工程化具有有益病毒载体特征(例如,增加的病毒载体表达、增加的表达持续时间、增加的稳定性等)的哺乳动物细胞提供快速、稳健的平台。
用于病毒载体表达的哺乳动物细胞平台
本公开提供了用于产生、筛选、选择、工程化和/或鉴定用于表达病毒载体的哺乳动物细胞或细胞系的平台技术。本公开提供了使用基于文库的方法用标识符指示文库中的哺乳动物细胞来源的方法。本公开提供了新的平台技术,其中由哺乳动物细胞表达的病毒载体获取标识符(例如,包括条形码和/或文库变体)。可以将哺乳动物细胞文库产生的病毒载体合并并分析(例如,通过测序,例如,通过下一代测序)所需特征。病毒载体获取标识符使快速鉴定产生病毒载体的哺乳动物细胞成为可能,所述哺乳动物细胞具有所需特征,诸如但不限于增强或改善的病毒载体产生。本公开涵盖以下认识:可以通过对病毒载体的标识符(例如,包含条形码和/或文库变体)进行测序来筛选哺乳动物细胞文库以得到具有所需的病毒载体产生特征(例如,改善的病毒载体产生)的细胞系。例如,来自哺乳动物细胞文库表达的病毒载体的标识符池中特定标识符的相对丰度可以与文库中特定哺乳动物细胞系的相对病毒载体生产率相关(例如,高丰度的特定标识符可以与具有较高病毒载体生产率的哺乳动物细胞系相关)。
图1提供了用于筛选哺乳动物细胞的病毒载体表达或其他病毒载体特征的示例性技术的示意图。所提供的技术采用哺乳动物细胞文库,所述哺乳动物细胞文库被工程化为包含标识符(例如,包含条形码和/或文库变体)和适当的用于将标识符包装到病毒载体中的遗传元件(例如,病毒重复序列,例如,用于表达AAV载体的AAV ITR)(描绘于图1,步骤A)。在一些实施方案中,标识符在文库构建体的环境中,其可以是单个连续多核苷酸或两个或更多个不连续多核苷酸。在一些实施方案中,文库构建体还包含例如至少一个文库变体。在一些实施方案中,文库变体可以影响病毒载体产生或其他特征。在一些实施方案中,文库变体可以引起扰动,例如可以影响病毒载体产生或其他特征的一个或多个遗传修饰。在一些实施方案中,哺乳动物细胞被遗传工程化以包含一个或多个工程化序列,所述一个或多个工程化序列包括位于病毒包装序列之间的标志符和任选的以下中的任一者:扰动、文库变体、有效载荷、扰动附加序列、反式作用整合序列和/或顺式作用整合序列。
哺乳动物细胞文库的哺乳动物细胞还可以包含(例如,已经游离存在和/或整合到哺乳动物细胞基因组内)或被工程化(例如,转染)以包含足以表达病毒载体的遗传物质(描绘于图1,步骤B)。用遗传物质(例如,一个或多个工程化序列)转染或转导哺乳动物细胞文库可以用于生成产生病毒载体的哺乳动物细胞文库。
遗传物质可以包含例如用于复制的病毒基因和编码必需病毒蛋白例如衣壳蛋白的病毒基因。对于AAV载体,足以表达病毒载体的遗传物质可以包含(i)编码AAV Rep蛋白和AAV Cap蛋白的基因;和(ii)支持AAV复制所需的腺病毒基因(例如,E2、E4和VARNA)。在一些实施方案中,病毒载体还包含有效载荷(例如,编码有效载荷的核酸)。在一些实施方案中,有效载荷包含具有启动子、ORF和polyA信号的表达盒。在一些实施方案中,用足以表达包含有效载荷和标识符的病毒载体的遗传物质转染哺乳动物细胞文库的哺乳动物细胞。
在一些实施方案中,所提供的技术包括一种独特的方法,借此病毒载体获取标识符(例如,在病毒载体基因组中,例如,在病毒重复序列之间)。因此,文库中哺乳动物细胞的每个克隆群都将表达具有独特标识符的病毒载体。这使得能够直接表征病毒载体并鉴定产生它的哺乳动物细胞。通常,本公开的产生病毒载体的哺乳动物细胞文库将包含至少一个工程化序列,所述至少一个工程化序列包含位于用于将标识符包装到病毒载体中的序列(例如,病毒重复序列,例如,用于表达AAV载体的AAV ITR)之间的标识符和足以表达关注的病毒载体的遗传物质。产生病毒载体的哺乳动物细胞文库的哺乳动物细胞还可以包含一个或多个(例如,多至100个独特的)文库变体和/或扰动。一个或多个扰动可以存在于哺乳动物细胞和/或由哺乳动物细胞表达的病毒载体中。
任何工程化序列(例如,编码病毒载体、标识符和/或其他工程化序列)可以游离存在(例如,在一个或多个质粒上)和/或被整合到哺乳动物细胞的基因组中。例如,在一些实施方案中,可以将一个或多个产生病毒载体所必需的核酸序列整合到哺乳动物细胞中。在一些实施方案中,一个或多个产生病毒载体所必需的核酸序列可以游离存在于哺乳动物细胞中。在一些实施方案中,一个或多个产生病毒载体所必需的核酸序列可以诱导表达(例如,在诱导型启动子的控制下)。
在一些实施方案中,培养产生病毒载体的哺乳动物细胞文库,并使用本领域已知的任何适当的方法收获病毒载体(描绘于图1,步骤C)。在一些实施方案中,收获由文库的哺乳动物细胞产生的总病毒载体。在一些实施方案中,对应于时间间隔收获文库的哺乳动物细胞产生的病毒载体。例如,可以每天、每两天、每3天或以更长的间隔收获病毒载体,以评估一段时间内的病毒载体产生。在一些实施方案中,可以在长时间后洗涤哺乳动物细胞并收获病毒载体(例如,以评估病毒载体的持续产生)。在一些实施方案中,分离病毒载体(例如,包括标识符)的遗传物质。
可以合并病毒载体并对遗传物质进行测序(例如,使用下一代测序)(描绘于图1,步骤D)。病毒载体池中标识符的存在表明哺乳动物细胞文库中的哺乳动物细胞或哺乳动物克隆细胞系(也具有标识符)可以产生病毒载体。在一些实施方案中,确定一个或多个标识符的相对丰度。在一些实施方案中,从病毒载体池确定的标识符的相对丰度与对应细胞系产生的相对病毒载体相关联。在一些实施方案中,标识符的相对丰度可以用于确定文库中不同哺乳动物细胞产生的特定病毒载体的数量(例如,相对数量)。在一些实施方案中,病毒载体池中标识符的丰度可以用于确定各种工程化序列(例如,文库变体和/或扰动)对文库中哺乳动物细胞的病毒载体产生能力的影响。
本公开认识到病毒载体的量或丰度可以反映偏差(例如,特定哺乳动物细胞或哺乳动物克隆细胞系增加的细胞分裂或细胞数量),并且不一定是与哺乳动物细胞或克隆细胞系相关的病毒载体产生水平。因此,在一些实施方案中,病毒载体的量或丰度可以被归一化。在一些实施方案中,检测到的病毒载体的量或丰度可以例如针对细胞量和/或细胞DNA的数量进行归一化。在一些实施方案中,细胞文库在文库中的每个细胞样品中包含大约相同数量的细胞。
可以鉴定与所需病毒载体特征(例如,高表达)相关的哺乳动物细胞,并确定它们的工程化序列(例如,通过基因组测序)。例如,可以选择与参考细胞相比在生产规范下(例如,在现行良好生产规范(cGMP)下)表现出增加的病毒载体产生的哺乳动物细胞。与参考细胞相比,增加的病毒载体产生可以是固定时间段内病毒载体数量的增加或延长的时间量的产生。在一些实施方案中,可以选择相对于参考细胞产生病毒载体时间更长(例如,由于增加的活力、增加的基因组稳定性和/或增加的病毒载体产生的持续时间)的哺乳动物细胞。参考细胞可以包括不包含工程化序列的可比较的哺乳动物细胞和/或标准细胞(例如,能够产生病毒载体)。
选定的哺乳动物细胞候选者通常可以用于产生病毒载体且/或对应的文库变体且/或所鉴定的扰动可以用于为新哺乳动物细胞文库的构建提供信息(描绘于图1,图F)。可以重复基于文库的平台方法,直到鉴定出表达具有所需特征和/或所需数量的病毒载体的工程化哺乳动物细胞。可以分析与所需特征相关的工程化序列,例如,使用机器学习(ML)方法来开发机器学习模型。经过训练的机器学习模型可以用于为未来的设计提供信息,并减少要筛选的哺乳动物细胞文库的数量和/或每个哺乳动物细胞文库的大小,从而减少时间和成本。在一些实施方案中,可以设计哺乳动物细胞文库且/或可以执行所述方法以鉴定在哺乳动物细胞中协同相互作用(例如,两个或更多个工程化序列组合)以具有所需特征(例如,一定水平的病毒载体产生)的工程化序列。在一些实施方案中,从本文所述的平台技术获得的所得哺乳动物细胞将具有一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个工程化序列(例如,一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个扰动)。在一些实施方案中,所提供的方法可以用于产生、筛选、选择、工程化和/或鉴定具有所需病毒载体产生特性(例如,一定水平的产生、所需持续时间的产生等)的哺乳动物细胞。在一些实施方案中,所提供的方法可以用于产生、筛选、选择、工程化和/或鉴定影响病毒载体产生的一个或多个扰动或扰动的组合。在一些实施方案中,选定的哺乳动物细胞候选者可以用于在额外修饰(例如,去除标识符)后产生病毒载体。在一些实施方案中,所鉴定的对应文库变体和/或扰动可以用于为类似哺乳动物细胞系或细胞系的构建提供信息(例如,扰动可以被引入相同的祖先细胞系、相似的祖先细胞系(其中一个或多个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸被整合到哺乳动物细胞基因组中)和/或非常不同的祖先细胞系中)。
在一些实施方案中,哺乳动物细胞被工程化以包含病毒载体的一种或多种组分,所述一种或多种组分处于诱导型转录控制元件(例如,启动子)的控制之下。在一些实施方案中,对包含病毒载体的遗传元件的哺乳动物细胞进行操作以进一步包含文库构建体。在一些实施方案中,哺乳动物细胞包含多核苷酸,所述多核苷酸具有一个或多个在诱导型转录控制元件的控制下产生病毒载体所必需的元件(例如,游离和/或整合到哺乳动物基因组中),并且被进一步工程化以包含文库构建体。
本领域技术人员将认识到,虽然图1的示意图描绘了工程化哺乳动物细胞文库以包含一个或多个工程化序列和一个或多个标识符,然后引入病毒载体的遗传元件,但这些用于工程化表达病毒载体的哺乳动物细胞文库的步骤可以以任何顺序和使用本领域已知的任何方法进行。例如,可以以任何顺序和使用本领域已知的任何方法来工程化表达病毒载体的哺乳动物细胞文库。例如,在一些实施方案中,同时或基本上同时引入工程化序列、标识符和病毒载体的元件。在一些实施方案中,生成哺乳动物细胞文库,其包含独特的工程化序列和形成病毒载体所必需的多核苷酸,并且随后引入标识符。在一些实施方案中,生成哺乳动物细胞文库,其包含独特的包含标识符的工程化序列,并且随后引入形成病毒载体所必需的多核苷酸。
所提供的方法可以用于生成、鉴定和/或选择具有产生任何所需病毒载体的所需特征的哺乳动物细胞。通常,此种病毒载体对于其所需目的将是具有功能性的。例如,在一些实施方案中,用于基因治疗的病毒载体将具有递送有效载荷(例如,核酸,例如,到靶细胞)的功能。在一些实施方案中,病毒载体是能够杀伤癌细胞的溶瘤病毒载体。在一些实施方案中,病毒载体有治疗活性。然而,在一些实施方案中,所提供的方法可以产生缺乏一种或多种功能性特征但保留其他关注的特征的非功能性病毒载体。在一些实施方案中,病毒载体是非功能性的或对于特定特征具有降低的功能性。例如,在一些实施方案中,病毒载体可能具有降低的转移有效载荷的能力或可能不能转移有效载荷。在一些实施方案中,病毒载体可能具有降低的杀伤癌细胞的能力。在一些实施方案中,病毒载体可能没有治疗活性。
病毒载体
在一些实施方案中,本公开的哺乳动物细胞系可以用于产生病毒载体。在一些实施方案中,所产生的病毒载体本身用作生物制剂和/或治疗。在一些实施方案中,所产生的病毒载体用于生成许多生物制剂和/或治疗的研究、生产和/或制造过程。例如,病毒载体可以以多种方式使用,包括但不限于疫苗、癌症治疗(例如,溶瘤治疗)和/或基因治疗(例如,体内基因和/或基因组编辑)。作为另一个实例,病毒载体可以以多种方式使用,包括但不限于研究、生产和/或制造:疫苗、癌症治疗(例如,溶瘤治疗)、基因治疗(例如,离体基因和/或基因组编辑)和/或细胞治疗(例如,离体基因和/或基因组编辑)。因此,有大量病毒载体可用于这些不同的应用。
本公开的方法可以用于选择和/或鉴定具有表达病毒载体的有益特征的哺乳动物细胞,例如,本领域已知或本文描述的任何病毒载体;本公开不限于任何特定的病毒载体。
病毒载体可以具有不同的大小、承载能力、具有不同的基因组结构(例如,DNA和/或RNA,以及单链和/或双链)。在一些实施方案中,病毒载体可以用于将核酸递送至细胞用于瞬时表达或长期表达。在一些实施方案中,病毒载体具有范围广泛的宿主细胞。在一些实施方案中,病毒载体可以具有有限和/或特定类型的宿主细胞。
所提供的哺乳动物细胞和/或哺乳动物细胞群包含一个或多个多核苷酸,所述一个或多个多核苷酸包含一个或多个产生病毒载体所必需的核酸序列。在一些实施方案中,包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸游离存在于哺乳动物细胞中。在一些实施方案中,包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸存在于哺乳动物细胞基因组中。在一些实施方案中,一个或多个产生病毒载体所必需的核酸序列处于诱导型转录控制元件的控制之下。例如,在一些特定实施方案中,一个或多个产生病毒载体所必需的核酸序列可以整合到哺乳动物细胞基因组中并处于诱导型转录控制元件(例如,诱导型启动子和/或诱导型增强子)的控制之下。可以衍生出病毒载体的病毒包括但不限于腺相关病毒(AAV)、腺病毒、慢病毒、α病毒(例如,辛德毕斯病毒)、逆转录病毒(例如,γ逆转录病毒)、多瘤病毒(例如,猴病毒40(SV40))、乳头瘤病毒(例如,牛乳头瘤病毒(BPV))、痘病毒(例如,痘苗病毒)、单纯疱疹病毒(HSV)、麻疹病毒、棒状病毒(例如,狂犬病病毒)、水疱性口炎病毒(VSV)、小核糖核酸病毒(例如,脊髓灰质炎病毒)、呼肠孤病毒、塞内卡病毒、艾柯病毒(例如,RIGVIR)、塞姆利基森林病毒(SFV)、黄病毒、指环病毒(https://www.ringtx.com)、新城疫病毒(NDV)、副粘病毒(例如,仙台病毒)、仙台病毒载体、正粘病毒(例如,流感病毒)、冠状病毒和杂交体和/或工程化病毒和/或病毒载体。
在一些特定实施方案中,本公开上下文中的病毒载体源自腺相关病毒、腺病毒、慢病毒、逆转录病毒和/或单纯疱疹病毒。
在一些实施方案中,本公开的哺乳动物细胞系可以用于产生病毒载体,诸如腺相关病毒载体、腺病毒载体、慢病毒载体、逆转录病毒载体和/或单纯疱疹病毒载体。
在一些实施方案中,本公开的产生的病毒载体适用于使用现行良好生产规范(cGMP)生成许多生物制剂和/或治疗的生产和/或制造过程。在一些实施方案中,病毒载体适用于生物制剂产品的工业规模制造。在一些实施方案中,病毒载体适用于符合当地监管标准(例如,FDA和/或EMA监管标准)的制造方法。
病毒载体可以是活的和减毒的。在一些实施方案中,病毒载体可以是条件复制的。在一些实施方案中,病毒载体可以是复制缺乏的。在一些实施方案中,病毒载体可以是无复制能力的。在一些实施方案中,病毒载体是复制缺陷的。在一些实施方案中,病毒载体具有复制能力。在一些实施方案中,病毒载体是非致病性的。
在一些实施方案中,本公开提供了一种独特的方法,病毒载体借此从表达它的哺乳动物细胞中获取标识符并将其并入其病毒核酸(例如,病毒基因组或构建体,例如病毒重复序列之间)。因此,由本公开的哺乳动物细胞和/或技术产生的病毒载体将在它们的病毒核酸(例如,病毒基因组或构建体,例如,在病毒重复序列之间)中具有标识符。在一些实施方案中,由本公开的哺乳动物细胞和/或方法产生的病毒载体将包含衣壳和工程化序列诸如核酸,其中核酸包含(i)有效载荷,(ii)标识符,和(iii)病毒基因组的一个或多个序列(例如,对于AAV可以在AAV ITR序列之间)。在一些实施方案中,随后将标识符和/或有效载荷或其一部分从病毒载体中去除。在一些实施方案中,随后将标识符和/或有效载荷或其一部分从病毒载体中去除,其中有效载荷或其一部分被另一有效载荷或其一部分替换。
腺相关病毒(AAV)载体
在一些实施方案中,由本公开的方法和哺乳动物细胞产生的病毒载体是腺相关病毒(AAV)载体。AAV是用于基因递送的常用病毒载体。在一些实施方案中,AAV载体具有低免疫原性(例如,在人中)。在一些实施方案中,AAV载体与范围广泛的宿主细胞相容。在一些实施方案中,AAV载体可以转导分裂细胞和静止细胞。在一些实施方案中,本公开的哺乳动物细胞产生如本文所述的AAV载体。
在一些实施方案中,本公开提供了编码一个或多个产生AAV载体所必需的元件的核酸序列。AAV载体的基本元件可以包括Rep蛋白和/或衣壳(Cap)蛋白(例如,形成AAV衣壳的VP1、VP2和VP3)。在一些实施方案中,AAV载体的基本元件可以编码在一个或多个构建体上(例如,其可以被整合到或游离存在于哺乳动物细胞内)。在一些实施方案中,编码一个或多个产生AAV载体所必需的元件的核酸被整合到哺乳动物细胞的基因组中。在一些实施方案中,编码一个或多个产生AAV载体所必需的元件的核酸游离存在于哺乳动物细胞中。
在一些实施方案中,本公开提供了包含衣壳和包含有效载荷的核酸的AAV载体。在一些实施方案中,AAV载体具有包含线性单链DNA核酸的二十面体蛋白衣壳。
在一些实施方案中,由本公开的哺乳动物细胞和/或方法产生的病毒载体将包含AAV衣壳和核酸,其中核酸包含(i)有效载荷,(ii)标识符(例如,包含条形码和/或文库变体),和(iii)两个ITR序列(例如,源自AAV)。
在一些实施方案中,AAV载体源自人AAV1;AAV2;AAV3b;AAV4;AAV5;AAV6;AAV7;AAV8;AAV9;AAV10;AAV11;AAV12;AAV13,或其任何衍生物。在一些实施方案中,AAV载体是合成的和/或杂交的人AAV载体。在一些实施方案中,AAV载体源自牛AAV(b-AAV);犬AAV(CAAV);小鼠AAV1;山羊AAV;大鼠AAV;或禽AAV(AAAV)。
在一些实施方案中,AAV载体可以被描述为具有血清型,其是对衣壳株和某些核酸序列(例如,ITR)的株的描述。例如,在一些实施方案中,AAV载体可以被描述为AAV2,其中载体具有AAV2衣壳和包含特征性AAV2反向末端重复序列(ITR)的核酸。在一些实施方案中,AAV载体可以被描述为假型,其中衣壳和ITR源自不同的AAV株,例如,AAV2/9将指代包含利用AAV2 ITR和AAV9衣壳的构建体的AAV载体。
在一些实施方案中,AAV载体没有血清型和/或假型。在一些实施方案中,AAV载体包含工程化AAV衣壳和/或ITR(例如,与已知AAV血清型的衣壳和/或ITR没有显著同源性)。
在一些实施方案中,本公开的AAV载体包含AAV衣壳。在一些实施方案中,AAV衣壳来自或源自AAV2、3、4、5、6、7、8、9、10、rh8、rh10、rh39、rh43或Anc80血清型的AAV衣壳,或其一种或多种杂交体。在一些实施方案中,AAV衣壳来自AAV祖先血清型。在一些实施方案中,AAV衣壳是祖先(Anc)AAV衣壳。Anc衣壳是从构建体序列创建的,所述构建体序列使用进化概率和进化模型构建以确定可能的祖先序列。因此,不知道自然界中是否存在Anc衣壳/构建体序列。在一些实施方案中,AAV衣壳是人工工程化序列(例如,与已知的AAV血清型衣壳没有显著同源性)。
如本文所提供的,本公开的AAV载体可以包含AAV衣壳和AAV核酸的任何组合(例如,包含有效载荷和/或AAV ITR)。例如,野生型或变体AAV衣壳包裹AAV核酸,所述AAV核酸包含标识符和/或侧翼为AAV衍生的ITR的有效载荷。
通常,AAV核酸由单链脱氧核糖核酸(ssDNA)组成。在一些实施方案中,AAV核酸包含一种或多种源自或修饰自天然存在的AAV基因组的组分。在一些实施方案中,AAV核酸包含源自或修饰自AAV的反向末端重复序列(ITR)。在一些实施方案中,AAV核酸包含有效载荷序列和两个ITR。在一些实施方案中,AAV载体包含衣壳和ssDNA,所述ssDNA包含有效载荷序列和两个病毒重复序列,例如ITR序列,在DNA链的每一端(5'和3')各一个。
在一些实施方案中,所提供的AAV核酸包含有效载荷,所述有效载荷包括编码序列和一个或多个调控和/或控制序列,以及任选的5'和3'AAV衍生的反向末端重复序列(ITR)。在一些实施方案中,所提供的AAV核酸被包装到AAV衣壳中以形成AAV载体。
在某些实施方案中,病毒载体包含有包含标识符和/或有效载荷序列的核酸以及侧翼为5'或“左”AAV ITR序列和3'或“右”AAV ITR序列的相关调控元件。5'和左的名称是指ITR序列相对于整个构建体的位置,在有义方向上从左到右读取。本领域普通技术人员将理解如何修饰给定的ITR序列以用作5'/左ITR或3'/右ITR,或其反义版本。
在一些实施方案中,本文所述的AAV载体的AAV核酸通常包含顺式作用5'ITR序列和3'ITR序列(参见,例如,B.J.Carter,在“Handbook of Parvoviruses,”中,P.Tijsser编,CRC Press,第155-168页,1990,其以引用的方式整体并入本文)。在一些实施方案中,至少80%的典型ITR序列(例如,至少85%、至少90%或至少95%)并入本文提供的构建体中。修饰这些ITR序列的能力在本领域的技能内。(参见,例如,文本诸如Sambrook等人,“Molecular Cloning.A Laboratory Manual”,第2版,Cold Spring Harbor Laboratory,New York,1989;和K.Fisher等人,J Virol.70:520-532,1996,每一篇都以引用的方式整体并入)。在一些实施方案中,标识符和/或有效载荷序列的侧翼为5'和3'AAV ITR序列。在一些实施方案中,AAV核酸包含标识符和侧翼为5'和3'AAV ITR序列的有效载荷。AAV ITR序列可以获得自任何已知的AAV,包括目前鉴定的AAV类型。
在一些实施方案中,AAV载体核酸包含有效载荷、标识符和两个AAV ITR。在一些实施方案中,AAV载体包含衣壳和dsDNA,所述dsDNA包含(i)有效载荷和/或标识符,和(ii)两个AAV ITR序列,在DNA链的每一端(5'和3')各一个。
通常,ITR能够形成发夹。形成发夹的能力可以有助于ITR的自启动(self-prime)能力,允许不依赖引物酶的第二DNA链的合成。ITR还可以帮助将AAV构建体有效封装在AAV载体中。AAV ITR序列可以获得自任何已知的AAV,包括哺乳动物AAV类型。
在一些实施方案中,ITR包括天然存在的ITR序列的一种或多种修饰,例如截短、缺失、取代或插入。修饰这些ITR序列的能力在本领域的技能内。(参见,例如,文本诸如Sambrook等人“Molecular Cloning.A Laboratory Manual”,第2版,Cold Spring HarborLaboratory,New York(1989);和K.Fisher等人,J Virol.,70:520-532(1996),每一篇都以引用的方式整体并入本文)。例如,AAV2衍生的ITR序列的长度为约145个核苷酸。在一些实施方案中,ITR包含少于145个核苷酸,例如127、130、134或141个核苷酸。例如,在一些实施方案中,ITR包含110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144或145个核苷酸。
在一些实施方案中,AAV载体有效载荷还包含常规控制元件,所述元件以允许其在转染有构建体或感染有由本公开产生的病毒载体的细胞中转录、翻译和/或表达的方式可操作地连接至编码序列。在一些实施方案中,AAV载体有效载荷任选地包含启动子、增强子、非翻译区(例如,5'UTR、3'UTR)、Kozak序列、内部核糖体进入位点(IRES)、剪接位点(例如,受体位点、供体位点)、聚腺苷酸化位点和/或其任何组合。
在一些实施方案中,AAV载体有效载荷小于4kb。在一些实施方案中,AAV载体有效载荷可以包含至少500bp、至少1kb、至少1.5kb、至少2kb、至少2.5kb、至少3kb、至少3.5kb、至少4kb,或至少4.5kb的序列。在一些实施方案中,AAV载体有效载荷可以包含至多7.5kb、至多7kb、至多6.5kb、至多6kb、至多5.5kb、至多5kb、至多4.5kb、至多4kb、至多3.5kb、至多3kb,或至多2.5kb的序列。在一些实施方案中,AAV载体有效载荷可以包含约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约3kb至约4kb、约3kb至约5kb,或约4kb至约5kb的序列。
在一些实施方案中,AAV载体可以指导有效载荷的长期表达。在一些实施方案中,AAV载体可以指导有效载荷的瞬时表达。
在一些实施方案中,由本公开的哺乳动物细胞和/或方法产生的AAV载体将包含AAV衣壳和核酸,其中核酸包含(i)有效载荷,(ii)标识符(例如,条形码和/或文库变体),和(iii)两个病毒重复序列(例如,源自AAV的ITR)。
在一些实施方案中,哺乳动物细胞文库的哺乳动物细胞被遗传修饰以包含一个或多个产生AAV载体所必需的核酸序列。在一些实施方案中,哺乳动物细胞文库的哺乳动物细胞可以具有所提供的一种或多种AAV载体组分,诸如像rep序列、cap序列和产生AAV载体所需的辅助功能。在一些实施方案中,AAV载体的一种或多种组分(例如,AAV Rep基因、AAVCap基因、一种或多种辅助基因或其组合)在诱导型转录控制元件(例如,启动子和/或增强子)的控制之下。在一些实施方案中,哺乳动物细胞(例如,哺乳动物细胞群的哺乳动物细胞)包含:(i)位于两个病毒重复序列之间的标识符,和(ii)一个或多个包含AAV Rep基因、AAV Cap基因、一种或多种辅助基因和/或其组合的多核苷酸,其中哺乳动物细胞产生包含标识符的AAV载体。在一些实施方案中,AAV载体包含有效载荷。在一些实施方案中,随后将标识符和/或有效载荷或其一部分从AAV载体中去除。在将标识符和/或有效载荷或其一部分从AAV载体中去除的一些实施方案中,有效载荷或其一部分被不同的有效载荷或其一部分替换。
腺病毒载体
在一些实施方案中,由本公开的方法和哺乳动物细胞产生的病毒载体是腺病毒载体。腺病毒是无包膜病毒,由于它们诱导的强烈免疫原性反应,它们通常用作疫苗。一些腺病毒因其优先感染和杀伤癌细胞的能力而被用于癌症治疗。
在一些实施方案中,腺病毒载体源自人腺病毒。人腺病毒涵盖至少51种血清型的家族,所述血清型分类为几个亚组。例如,A亚组包括腺病毒血清型12、18和31。B亚组包括腺病毒血清型3、7、11a、11p、14、16、21、34、35和50。C亚组包括腺病毒血清型1、2、5和6。D亚组包括腺病毒血清型8、9、10、13、15、17、19、19p、20、22-30、32、33、36-39、42-49和51。E亚组包括腺病毒血清型4。F亚组包括腺病毒血清型40和41。本公开的腺病毒载体可以属于任何腺病毒组、亚组和/或血清型。
在一些实施方案中,腺病毒载体源自任何血清型,诸如血清型1至血清型51(例如1、2、4、5...51)。例如,在一些实施方案中,腺病毒是2型腺病毒或5型腺病毒。在一些特定实施方案中,腺病毒载体至少部分源自5型腺病毒。
在一些实施方案中,腺病毒载体是复制缺陷的(例如,某些必需的病毒基因被删除和/或被有效载荷序列替换)。本文所述方法中使用的任何腺病毒载体可以包括在E1、E2a、E2b、E3或E4编码区中的任何一个或多个中的缺失。在一些实施方案中,腺病毒载体是复制缺陷的并且缺少E4基因座(例如,E4编码区被删除)。在一些实施方案中,复制缺陷腺病毒载体可用作疫苗,用于癌症治疗和/或基因治疗。
通常,腺病毒的特征在于高转导效率和直接高转基因表达。在一些实施方案中,腺病毒载体可以指导有效载荷的瞬时表达。在一些实施方案中,腺病毒载体指导靶细胞中有效载荷的瞬时表达。
在一些实施方案中,腺病毒载体具有复制能力。例如,具有复制能力的腺病毒载体(例如,溶瘤载体)可以被工程化为优先在癌细胞中复制并通过裂解病毒复制的自然过程破坏癌细胞。
在一些实施方案中,本公开提供了包含衣壳和包含有效载荷的核酸的腺病毒载体。在一些实施方案中,腺病毒载体具有包含线性双链体核酸的二十面体蛋白衣壳。在一些实施方案中,腺病毒载体的直径为约90-100nm。在一些实施方案中,腺病毒载体具有包含线性双链DNA的二十面体蛋白衣壳。
通常,腺病毒载体核酸由双链DNA(dsDNA)组成,并具有一种或多种源自或修饰自天然存在的腺病毒基因组的组分。在一些实施方案中,腺病毒载体核酸包含源自或修饰自任何血清型的腺病毒(例如,5型腺病毒)的反向末端重复(ITR)序列。在一些实施方案中,腺病毒载体核酸包含有效载荷和两个病毒重复序列,诸如ITR。在一些实施方案中,腺病毒载体核酸包含标识符和两个病毒重复序列,诸如ITR。在一些实施方案中,腺病毒载体核酸包含有效载荷、标识符和两个病毒重复序列,诸如ITR。在一些实施方案中,腺病毒载体包含衣壳和dsDNA,所述dsDNA包含(i)有效载荷和/或标识符,和(ii)两个ITR序列,在DNA链的每一端(5'和3')各一个。
在一些实施方案中,腺病毒ITR具有长度为约40bp至约200bp的序列。例如,人5型腺病毒的ITR为103bp。在一些实施方案中,腺病毒ITR具有约30bp、约40bp、约50bp、约60bp、约70bp、约80bp、约90bp、约100bp、约110bp、约120bp、约130bp、约140bp、约150bp、约160bp、约170bp、约180bp、约190bp、约200bp、约220bp、约240bp、约260bp、约280bp、约300bp、约325bp、约350bp、约375bp,或约400bp的长度。在一些特定实施方案中,腺病毒ITR序列为约50至约250bp。
在一些实施方案中,所提供的腺病毒载体包含腺病毒衍生的衣壳和核酸,所述核酸包含有效载荷和一个或多个腺病毒衍生的序列(诸如像ITR)。在一些实施方案中,所提供的腺病毒载体包含腺病毒衍生的衣壳和核酸,所述核酸包含标识符、有效载荷和至少两个病毒重复序列。在一些实施方案中,腺病毒载体包含有包含条形码和/或文库变体的标识符。在一些实施方案中,腺病毒载体有效载荷包括编码序列和一个或多个调控和/或控制序列。在一些实施方案中,腺病毒载体包含5'和3'腺病毒衍生的反向末端重复序列(ITR)。在一些特定的实施方案中,腺病毒载体包含衣壳和工程化腺病毒基因组,其中工程化基因组包含某些序列的缺失(例如,E1缺失和/或E3缺失)和有效载荷和/或标识符的插入。
在一些实施方案中,腺病毒载体有效载荷小于7.5kb。在一些实施方案中,腺病毒载体有效载荷可以包含至少500bp、至少1kb、至少1.5kb、至少2kb、至少2.5kb、至少3kb、至少3.5kb、至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb的序列。在一些实施方案中,腺病毒载体有效载荷可以包含至多10kb、至多9.5kb、至多9kb、至多8.5kb、至多8kb、至多7.5kb、至多7kb、至多6.5kb、至多6kb、至多5.5kb、至多5kb、至多4.5kb,或至多4kb的序列。在一些实施方案中,腺病毒载体有效载荷可以包含约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约1kb至约9kb、约1kb至约10kb、约2kb至约4kb、约2kb至约6kb、约2kb至约8kb、约2kb至约10kb、约4kb至约6kb、约4kb至约8kb,或约5kb至约8kb的序列。
在一些实施方案中,由本公开的哺乳动物细胞和/或方法产生的腺病毒载体将包含腺病毒衣壳和核酸,其中核酸包含(i)有效载荷,(ii)标识符(例如,条形码和/或文库变体),和(iii)两个病毒重复序列(例如,源自腺病毒的ITR)。
在一些实施方案中,哺乳动物细胞文库的哺乳动物细胞被遗传修饰以包含一个或多个产生腺病毒载体所必需的核酸序列。在一些实施方案中,哺乳动物细胞文库的哺乳动物细胞可以具有所提供的一种或多种腺病毒载体组分,诸如像rep序列、cap序列和产生腺病毒载体所需的辅助功能。在一些实施方案中,腺病毒载体的一种或多种组分(例如,腺病毒Rep基因、腺病毒Cap基因、一种或多种辅助基因或其组合)在诱导型转录控制元件(例如,启动子和/或增强子)的控制之下。在一些实施方案中,哺乳动物细胞(例如,哺乳动物细胞群的哺乳动物细胞)包含:(i)位于两个病毒重复序列之间的标识符,和(ii)一个或多个包含腺病毒Rep基因、腺病毒Cap基因、一种或多种辅助基因和/或其组合的多核苷酸,其中哺乳动物细胞产生包含标识符的腺病毒载体。在一些实施方案中,腺病毒载体包含有效载荷。在一些实施方案中,随后将标识符和/或有效载荷或其一部分从腺病毒载体中去除。在将标识符和/或有效载荷或其一部分从腺病毒载体中去除的一些实施方案中,有效载荷或其一部分被不同的有效载荷或其一部分替换。
逆转录病毒和慢病毒载体
在一些实施方案中,由本公开的方法和哺乳动物细胞产生的病毒载体是逆转录病毒载体。逆转录病毒是包膜病毒,其在宿主细胞中通过使用病毒逆转录酶将其RNA转录为DNA来复制。逆转录病毒DNA作为宿主基因组的一部分进行复制并且被称为前病毒。逆转录病毒载体可以包括但不限于基于或源自鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、亲嗜性逆转录病毒、猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的那些。
在一些实施方案中,由本公开的方法和哺乳动物细胞产生的病毒载体是慢病毒载体。慢病毒载体是多功能工具,因为它们具有转导非分裂细胞的能力。在一些实施方案中,慢病毒载体能够感染分裂细胞和非分裂细胞。通常,慢病毒载体使长期和/或稳定的基因表达成为可能,并被整合到宿主细胞基因组中。
慢病毒是直径约80至约120nm的包膜颗粒。在一些实施方案中,本公开提供了具有在约50nm至约200nm范围内的直径的慢病毒载体。在一些实施方案中,本公开提供了具有在约80nm至约120nm范围内的直径的慢病毒载体。
慢病毒可以含有几种结构蛋白,包括基质、衣壳、核衣壳、包膜和逆转录酶蛋白。在一些实施方案中,本公开提供了包含衣壳、包膜的慢病毒载体。在一些实施方案中,本公开提供了包含衣壳、包膜和核酸的慢病毒载体。在一些实施方案中,本公开提供了包含衣壳、包膜和包含有效载荷和/或标识符的核酸的慢病毒载体。
在一些实施方案中,由本公开的哺乳动物细胞和/或方法产生的慢病毒载体将包含慢病毒衣壳(或其衍生物)、包膜和核酸,其中核酸包含(i)有效载荷,(ii)标识符,和(iii)两个长末端重复(LTR)序列(例如,源自慢病毒)。在一些实施方案中,两个LTR序列能够将核酸包装到慢病毒载体中。在一些实施方案中,慢病毒载体包含慢病毒Psi序列(或其衍生物或工程化变体)。
在一些实施方案中,慢病毒载体包括基于人免疫缺陷病毒(HIV-1、HIV-2)、猫免疫缺陷病毒(FIV)、马传染性贫血病毒、猴免疫缺陷病毒(SIV)和梅迪-维斯纳病毒(MVV)的那些。在一些实施方案中,慢病毒核酸(即,工程化基因组)和包膜糖蛋白将基于不同的病毒,使得所得病毒载体是假型的。
在一些实施方案中,慢病毒载体源自HIV-1。在一些实施方案中,慢病毒载体源自HIV-1并包含衣壳蛋白和核酸,所述核酸包含(i)有效载荷,(ii)标识符,和(iii)两个长末端重复(LTR)序列(例如,源自慢病毒)。在一些实施方案中,慢病毒载体是HIV载体并且其中哺乳动物细胞包含两个包含HIV LTR序列的病毒重复序列。在一些实施方案中,慢病毒载体是SIV载体并且其中哺乳动物细胞包含两个包含SIV LTR序列的病毒重复序列。在一些实施方案中,慢病毒载体是马传染性贫血病毒载体,并且其中哺乳动物细胞包含两个包含马传染性贫血病毒LTR序列的病毒重复序列。在一些实施方案中,慢病毒载体是FIV载体并且其中哺乳动物细胞包含两个包含FIV LTR序列的病毒重复序列。在一些实施方案中,慢病毒载体是维斯纳病毒载体并且其中哺乳动物细胞包含两个包含维斯纳病毒LTR序列的病毒重复序列。
在一些实施方案中,慢病毒载体包含gag蛋白或其片段。在一些实施方案中,慢病毒载体包含有包含一个或多个选自基质(MA)、衣壳(CA)和核衣壳(NC)结构域的结构域的gag蛋白。在一些实施方案中,慢病毒载体包含包膜蛋白或其片段。在一些实施方案中,慢病毒载体是假型慢病毒载体,其中gag蛋白和包膜蛋白源自不同的病毒。在一些实施方案中,慢病毒载体包含源自人免疫缺陷病毒(HIV)载体、猴免疫缺陷病毒(SIV)载体、马传染性贫血病毒载体、猫免疫缺陷病毒载体、维斯纳病毒载体或其衍生物的gag蛋白和/或env蛋白。
在一些实施方案中,慢病毒载体包含(i)慢病毒gag基因,(ii)慢病毒env基因,(iii)慢病毒pol基因,或(iv)其组合。在一些实施方案中,表达慢病毒载体的哺乳动物细胞包含以下中的一种或多种:(i)慢病毒gag基因,(ii)慢病毒env基因,和(iii)慢病毒pol基因。
在一些实施方案中,安全特征被并入慢病毒载体中,其可以包括例如自失活长末端重复序列(LTR)和整合缺陷。在某些实施方案中,整合缺陷可能由载体基因组的元件赋予,但也可能源自包装系统的元件(例如,可能不是载体基因组的一部分但以反式提供的非功能性整合酶蛋白)。
慢病毒具有单链RNA(ssRNA)基因组。在一些实施方案中,慢病毒载体包含为ssRNA的核酸,并且包含源自慢病毒诸如HIV-1和/或SIV的有效载荷和序列。在一些实施方案中,有效载荷的侧翼为长末端重复(LTR)序列,这有助于将转移质粒序列整合到宿主基因组中。在一些实施方案中,慢病毒载体包含为ssRNA的核酸,并且包含标识符和病毒重复序列(例如HIV-1和/或SIV LTR)。在一些实施方案中,慢病毒载体包含为ssRNA的核酸,并且包含有效载荷、标识符和病毒重复序列(例如HIV-1和/或SIV LTR)。
在一些实施方案中,慢病毒载体核酸可以包含来自慢病毒的5'LTR和3'LTR的序列,并且特别地可以包含来自慢病毒的5'LTR的R序列和U5序列和来自慢病毒的失活或自失活的3'LTR。LTR序列可以是来自任何物种的任何慢病毒的LTR序列。例如,它们可以是来自HIV、SIV、FIV或BIV的LTR序列。在一些实施方案中,LTR序列是HIV LTR序列。
在一些实施方案中,慢病毒载体有效载荷小于8kb。在一些实施方案中,慢病毒载体有效载荷可以包含至少500bp、至少1kb、至少1.5kb、至少2kb、至少2.5kb、至少3kb、至少3.5kb、至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb,或至少8kb的序列。在一些实施方案中,慢病毒载体有效载荷可以包含至多10kb、至多9.5kb、至多9kb、至多8.5kb、至多8kb、至多7.5kb、至多7kb、至多6.5kb、至多6kb、至多5.5kb、至多5kb、至多4.5kb,或至多4kb的序列。在一些实施方案中,慢病毒载体有效载荷可以包含约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约1kb至约9kb、约1kb至约10kb、约2kb至约4kb、约2kb至约6kb、约2kb至约8kb、约2kb至约10kb、约4kb至约6kb、约4kb至约8kb,或约5kb至约8kb的序列。
在一些实施方案中,哺乳动物细胞文库的哺乳动物细胞被遗传修饰以包含一个或多个产生慢病毒载体所必需的核酸序列。在一些实施方案中,哺乳动物细胞文库的哺乳动物细胞可以具有提供的一种或多种慢病毒载体组分。在一些实施方案中,慢病毒载体的一种或多种组分处于诱导型转录控制元件(例如,启动子和/或增强剂)的控制之下。在一些实施方案中,哺乳动物细胞(例如,哺乳动物细胞群的哺乳动物细胞)包含:(i)位于两个病毒重复序列之间的标识符,和(ii)一个或多个产生慢病毒载体所必需的多核苷酸,其中哺乳动物细胞产生包含标识符的慢病毒载体。在一些实施方案中,慢病毒载体包含有效载荷。在一些实施方案中,随后将标识符和/或有效载荷或其一部分从慢病毒载体中去除。在将标识符和/或有效载荷或其一部分从慢病毒载体中去除的一些特定实施方案中,有效载荷或其一部分被不同的有效载荷或其一部分替换。
HSV载体
在一些实施方案中,由本公开的方法和哺乳动物细胞产生的病毒载体是单纯疱疹病毒(HSV)载体。HSV是大的包膜病毒,其具有含有环形dsDNA基因组的二十面体衣壳。HSV体内特征在于神经元的终生潜在感染。这一特征使HSV载体可用于长期转基因表达。在一些实施方案中,HSV载体是有复制能力的减毒载体、无复制能力的重组载体或复制缺陷的辅助依赖型载体。
在一些实施方案中,HSV载体具有在约120nm至约200nm之间的范围内的直径。在一些实施方案中,HSV载体是直径为约120至约200nm的包膜颗粒。在一些实施方案中,HSV载体具有在约100nm至约200nm之间的范围内的直径。
在一些实施方案中,HSV载体来自或源自单纯疱疹病毒-1(HSV-1)、单纯疱疹病毒-2(HSV-2)、人巨细胞病毒(HCMV)、水痘-带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(EBV)、卡波西肉瘤相关疱疹病毒(KSHV)、人疱疹病毒6和/或人疱疹病毒7和/或其衍生物。在一些实施方案中,HSV载体来自或源自HSV-1、HSV-2或其组合(例如,包含来自HSV-1的衣壳并包含源自HSV-2的核酸序列)。
在一些实施方案中,病毒载体是HSV-AAV杂交载体。
天然HSV-1基因组由两段基因组编码区组成,称为长独特区段和短独特区段(UL和US),每个片段的侧翼均为反向重复序列(分别为TRL/IRL和IRS/TRS)。在一些实施方案中,HSV载体被工程化以缺少或缺失ICP0、ICP4、ICP22、ICP27和/或ICP47以降低毒性。设计HSV载体的方法和注意事项是本领域已知的,例如Manservigi等人,Open Virol J.2010;4:123–156。
在一些实施方案中,本公开提供了包含衣壳蛋白和包含有效载荷的核酸的HSV载体。在一些实施方案中,HSV载体包含有包含VP5、VP19C、VP23、pre-VP22a和/或成熟的蛋白酶(UL26基因产物)的衣壳。
在一些实施方案中,HSV核酸还包含获得自或源自HSV病毒的序列(例如,TRL/IRL和/或IRS/TRS序列)。在一些实施方案中,本公开提供了HSV载体,其包含衣壳蛋白和包含HSV病毒重复序列(例如,TRL/IRL和/或IRS/TRS序列)的核酸。在一些实施方案中,本公开提供了包含衣壳、包膜和包含有效载荷的核酸的HSV载体。在一些实施方案中,本公开提供了HSV载体,其包含衣壳、包膜和包含有效载荷和HSV病毒重复序列(例如,TRL/IRL和/或IRS/TRS序列)的核酸。
在一些实施方案中,HSV载体有效载荷小于100kb。在一些实施方案中,HSV载体有效载荷可以包含至少1kb、至少2kb、至少3kb、至少4kb、至少5kb、至少6kb、至少7kb、至少8kb、至少9kb、至少10kb、至少15kb、至少20kb、至少25kb、至少30kb、至少40kb,或至少50kb的序列。在一些实施方案中,HSV载体有效载荷可以包含至多150kb、至多140kb、至多130kb、至多120kb、至多110kb、至多100kb、至多90kb、至多80kb、至多70kb、至多60kb、至多50kb、至多40kb、至多30kb、至多25kb、至多20kb、至多15kb,或至多10kb的序列。在一些实施方案中,慢病毒载体有效载荷可以包含约1kb至约150kb、约1kb至约100kb、约1kb至约50kb、约1kb至约25kb、约5kb至约100kb、约5kb至约90kb、约5kb至约80kb、约5kb至约70kb、约5kb至约60kb、约5kb至约50kb、约5kb至约40kb、约5kb至约30kb、约5kb至约25kb、约5kb至约20kb、约5kb至约15kb、约5kb至约10kb、约10kb至约100kb、约10kb至约50kb,或约10kb至约25kb的序列。
在一些实施方案中,本公开提供了包含衣壳蛋白和包含标识符的核酸的HSV载体。在一些实施方案中,本公开提供了HSV载体,其包含衣壳蛋白和包含标识符和HSV病毒重复序列(例如,TRL/IRL和/或IRS/TRS序列)的核酸。在一些实施方案中,本公开提供了包含衣壳、包膜和包含标识符的核酸的HSV载体。在一些实施方案中,本公开提供了HSV载体,其包含衣壳、包膜和包含标识符和HSV病毒重复序列(例如,TRL/IRL和/或IRS/TRS序列)的核酸。在一些实施方案中,HSV载体包含两个病毒重复序列,所述两个病毒重复序列包含末端a序列。
在一些实施方案中,HSV核酸包含有效载荷、标识符和获得自或源自HSV病毒的一个或多个序列。在一些实施方案中,通过本公开的方法和/或哺乳动物细胞产生的HSV载体包含HSV衣壳、包膜和包含有效载荷、标识符和获得自或源自HSV病毒的一个或多个序列(例如,TRL/IRL和/或IRS/TRS序列)的核酸。在一些实施方案中,HSV载体包含HSV衣壳、包膜和包含有效载荷和/或标识符、侧翼为HSV病毒重复序列(例如,TRL/IRL和/或IRS/TRS序列)的核酸。
在一些实施方案中,哺乳动物细胞文库的哺乳动物细胞被遗传修饰以包含一个或多个产生HSV载体所必需的核酸序列。在一些实施方案中,哺乳动物细胞文库的哺乳动物细胞可以具有提供的一种或多种HSV载体组分。在一些实施方案中,HSV载体的一种或多种组分处于诱导型转录控制元件(例如,启动子和/或增强剂)的控制之下。在一些实施方案中,哺乳动物细胞(例如,哺乳动物细胞群的哺乳动物细胞)包含:(i)位于两个病毒重复序列之间的标识符,和(ii)一个或多个产生HSV载体所必需的多核苷酸,其中哺乳动物细胞产生包含标识符的HSV载体。在一些实施方案中,HSV载体包含有效载荷。在一些实施方案中,随后将标识符和/或有效载荷或其一部分从HSV载体中去除。在将标识符和/或有效载荷或其一部分从HSV载体中去除的一些特定实施方案中,有效载荷或其一部分被不同的有效载荷或其一部分替换。
文库构建体
在本公开的上下文中,本公开提供了用于工程化哺乳动物细胞的文库构建体。在一些实施方案中,文库构建体可以包含两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个,或十个或更多个工程化序列。在一些实施方案中,文库构建体可以包含多至100个工程化序列。
文库构建体至少包含标识符和适合于将标识符包装到病毒载体中的遗传结构。如本文所用的文库构建体还将包含任何文库变体。在一些实施方案中,文库构建体还包含用于包装到病毒载体中的有效载荷(例如,在病毒重复序列之间)。例如,在一些实施方案中,文库构建体包含(i)标识符和有效载荷,其位于病毒重复序列之间,和(ii)至少一个包含至少一个文库变体的工程化序列。
在一些实施方案中,文库构建体还包含一个或多个构建体,其包含顺式作用整合序列(例如,同源臂、识别位点和/或病毒重复序列)。例如,在一些实施方案中,文库构建体包含(i)标识符和有效载荷,其位于病毒重复序列之间,(ii)至少一个包含至少一个文库变体的工程化序列,和(iii)用于将文库构建体或其一部分整合到哺乳动物细胞基因组中的顺式作用整合序列。
在一些实施方案中,文库构建体还包含至少一个条形码。例如,在一些实施方案中,文库构建体包含(i)标识符和有效载荷,其位于病毒重复序列之间,(ii)至少一个包含至少一个文库变体的工程化序列,和(iii)至少一个条形码。作为另一个实例,在一些实施方案中,文库构建体包含(i)标识符和有效载荷,其位于病毒重复序列之间,(ii)至少一个包含至少一个文库变体的工程化序列,(iii)至少一个条形码,和(iv)用于将文库构建体或其一部分整合到哺乳动物基因组中的顺式作用整合序列。
在一些实施方案中,文库构建体还包含至少一个工程化序列,所述至少一个工程化序列包含至少一个报告基因和/或选择标记。在一些实施方案中,一个或多个包含文库构建体的多核苷酸包含报告基因和/或选择标记。任何合适的报告基因(例如,GFP、RFP、YFP、lacZ等)或选择标记(例如,其赋予可以人工选择的性状,例如,抗性盒等)都可以用在本公开的上下文中。
文库构建体邻接
文库构建体可以是单个连续构建体或多个不连续构建体。在一些实施方案中,文库构建体是单个(即一个)连续构建体。在具有单个连续文库构建体的此类实施方案中,所得病毒载体的表征将直接提供关于任何文库变体的信息(例如,病毒载体标识符的确定可以直接与任何文库变体相关联)。在一些实施方案中,文库构建体包含多个不连续构建体。在文库构建体是不连续文库构建体的此类实施方案中,所提供的方法还将包括鉴定哺乳动物细胞中的文库变体的步骤(例如,通过单细胞测序)。
在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中每个单独的文库构建体由单个连续核酸序列组成,并且其中多个文库构建体包含多个独特核酸序列。在一些实施方案中,哺乳动物细胞群包含多个文库构建体,其中每个单独的文库构建体由不连续核酸序列组成,并且其中多个文库构建体包含多个独特核酸序列。
在一些实施方案中,所提供的哺乳动物细胞包含有包含多个多核苷酸的文库构建体,其中每个单独的哺乳动物细胞确切包含构成文库构建体的多个多核苷酸的第一子集中的一个独特的多核苷酸和构成文库构建体的多个多核苷酸的第二子集中的两个或更多个独特的多核苷酸。例如,在一些实施方案中,每个单独的哺乳动物细胞确切包含一个独特的标识符和两个或更多个独特的文库变体。在一些实施方案中,所提供的哺乳动物细胞包含有包含多个多核苷酸的文库构建体,其中每个单独的哺乳动物细胞确切包含构成文库构建体的多个多核苷酸的第一子集中的两个独特的多核苷酸和构成文库构建体的多个多核苷酸的第二子集中的多个独特的多核苷酸。例如,在一些实施方案中,每个单独的哺乳动物细胞确切包含两个独特的标识符和多个独特的文库变体。
连续文库构建体
在一些实施方案中,文库构建体是单个连续构建体,其包含至少一个标识符,其侧翼为适合于将标识符包装到病毒载体中的遗传结构(例如,病毒重复序列,例如,AAV ITR序列),以及任何文库变体。在一些实施方案中,单个连续文库构建体包含标识符和一个或多个文库变体,其中标识符和文库变体都位于病毒重复序列之间。在一些实施方案中,单个连续文库构建体包含位于病毒重复序列之间的标识符和位于病毒重复序列之外的一个或多个文库变体。在一些实施方案中,单个连续文库构建体包含位于病毒重复序列之间的标识符和一个或多个文库变体,以及位于病毒重复序列之外的一个或多个其他文库变体。在一些实施方案中,文库构建体是连续文库构建体,并且包含报告基因和/或选择标记。下表1中提供了单个连续文库构建体的一些示例性配置。
表1–作为单个连续构建体的示例性文库构建体
在细胞中的位置和拷贝数
在一些实施方案中,文库构建体是游离的和/或被整合到哺乳动物细胞基因组中。在一些实施方案中,文库构建体是游离的单个连续构建体。在一些实施方案中,文库构建体是整合到哺乳动物细胞基因组中的单个连续构建体。
在一些实施方案中,文库构建体还包含用于整合到哺乳动物细胞基因组中的顺式作用整合序列。例如,表1的示例性实施方案中的任一个还可以包含顺式作用整合序列(例如,同源臂、识别位点和/或病毒重复序列)。
在一些实施方案中,单个连续文库构建体被整合到哺乳动物细胞基因组中。在一些实施方案中,单个连续文库构建体包含顺式作用整合序列。在一些实施方案中,单个连续文库构建体包含位于文库构建体的3'和5'端的顺式作用整合序列。在一些实施方案中,单个连续文库构建体以低拷贝数(例如,10个或更少拷贝的文库构建体)被整合到哺乳动物细胞基因组中。在一些实施方案中,四个或更少拷贝的单个连续文库构建体被整合到哺乳动物细胞基因组中。在一些实施方案中,三个或更少拷贝的单个连续文库构建体被整合到哺乳动物细胞基因组中。在一些实施方案中,两个或更少拷贝的单个连续文库构建体被整合到哺乳动物细胞基因组中。在一些实施方案中,单个拷贝的单个连续文库构建体被整合到哺乳动物细胞基因组中。
在一些实施方案中,单个连续文库构建体游离存在于哺乳动物细胞中。在一些实施方案中,单个连续文库构建体以低拷贝数(例如,10个或更少拷贝的文库构建体,例如,4个或更少拷贝的文库构建体,例如,3个或更少拷贝的文库构建体、2个或更少拷贝的文库构建体,例如,单个(一个)拷贝的文库构建体)游离存在于哺乳动物细胞中。
不连续文库构建体
在一些实施方案中,提供的方法和细胞包括不连续文库构建体,其使例如同时筛选多个文库变体成为可能。在一些实施方案中,文库构建体包含多个不连续构建体,其中至少一个构建体包含标识符和适合于将标识符包装到病毒载体中的遗传结构。在一些实施方案中,不连续文库构建体包含第一构建体,所述第一构建体包含位于病毒重复序列之间的标识符和一个或多个其他构建体。在一些实施方案中,不连续文库构建体包含第一构建体,所述第一构建体包含位于病毒重复序列之间的标识符和有效载荷和一个或多个包含一个或多个文库变体的其他构建体。在一些实施方案中,不连续文库构建体包含第一构建体,所述第一构建体包含例如表1中描述的任何单个连续文库构建体和一个或多个其他构建体(例如,包含其他文库变体)。
在一些实施方案中,其他不连续文库构建体包含病毒载体的组分,例如病毒Cap基因和条形码。在一些实施方案中,文库包括具有工程化或不同血清型的病毒载体组分(例如,Cap基因)的文库构建体。例如,可以同时筛选具有不同血清型的Cap基因的病毒Cap基因文库(例如,以选择具有针对多种不同血清型的病毒载体的改进特征的哺乳动物细胞)。
在一些特定的实施方案中,一个或多个其他构建体包含文库变体,所述文库变体是变体病毒载体组分(例如,工程化的或不同血清型的)。在一些实施方案中,文库构建体包含表1中描述的文库构建体和一个或多个其他构建体,其中至少一个其他构建体包含病毒Cap基因和条形码。
在一些实施方案中,筛选了多个不同的文库变体文库,每个文库与不同的标识符相关。例如,可以同时筛选gRNA文库变体文库和Cap基因变体文库;这将使选择富含不同Cap基因文库变体的gRNA变体成为可能(例如,以选择那些对不同病毒载体血清型具有有益影响的gRNA介导的扰动)。
在一些实施方案中,文库构建体还包含一个、两个、三个、四个、五个或更多个构建体,每个构建体包含一个或多个文库变体。在一些实施方案中,一个或多个包含一个或多个文库变体的其他构建体和/或包含标识符的构建体还包含一个或多个条形码。
在一些实施方案中,文库构建体是不连续文库构建体,其包含两个、三个、四个、五个、六个、七个、八个、九个或十个不连续核酸序列(例如,单独的构建体)。在一些实施方案中,文库构建体是不连续文库构建体,其包含多至20个不连续核酸序列、多至30个不连续核酸序列、多至40个不连续核酸序列、多至50个不连续核酸序列、多至60个不连续核酸序列、多至70个不连续核酸序列、多至80个不连续核酸序列、多至90个不连续核酸序列或多至100个不连续核酸序列。
在一些实施方案中,文库构建体是不连续的并且文库构建体的一个或多个单独的多核苷酸包含报告基因和/或选择标记。在一些实施方案中,文库构建体是不连续的并且文库构建体的多个单独的多核苷酸包含报告基因和/或选择标记。在一些实施方案中,文库构建体是不连续的并且文库构建体的每一个单独的多核苷酸包含报告基因和/或选择标记。
表2–示例性不连续文库构建体
在细胞中的位置和拷贝数
在一些实施方案中,文库构建体是不连续的并且一个或多个单独的构建体是游离的。在一些实施方案中,文库构建体是不连续的并且一个或多个单独的构建体被整合到哺乳动物细胞基因组中。在一些实施方案中,文库构建体是不连续的并且至少一个构建体是游离的并且至少一个构建体被整合到哺乳动物细胞基因组中。
在一些实施方案中,不连续文库构建体的一个或多个单独的构建体被整合到哺乳动物细胞基因组中。在一些实施方案中,不连续文库构建体的一个或多个单独的构建体包含顺式作用整合序列。在一些实施方案中,不连续文库构建体的一个或多个单独的构建体包含位于每个构建体的3'和5'端的顺式作用整合序列。在一些实施方案中,顺式作用整合序列包含病毒重复序列(例如,位于用于包装到病毒载体中的任何病毒重复序列之外)。
在文库构建体包含多个不连续构建体的一些实施方案中,一个或多个单独的构建体游离存在于哺乳动物细胞中。在一些实施方案中,一个或多个单独的构建体以低拷贝数(例如,10个或更少拷贝的文库构建体,例如,4个或更少拷贝的文库构建体,例如,3个或更少拷贝的文库构建体、2个或更少拷贝的文库构建体,例如,单个(一个)拷贝的文库构建体)游离存在于哺乳动物细胞中。
标识符
本公开提供了可以被检测并使鉴定产生和/或衍生病毒载体的哺乳动物细胞或克隆细胞系成为可能的标识符。在一些实施方案中,特定标识符的相对丰度可以在病毒载体(例如,每个包含标识符)的合并样品中被表征、检测和/或量化。在一些实施方案中,检测标识符的至少一部分。在一些实施方案中,标识符通过测序(例如,通过下一代测序)检测。例如,在一些实施方案中,标识符的至少一部分通过下一代测序和/或单细胞测序和/或Sanger测序检测。
在一些实施方案中,标识符存在于哺乳动物细胞中并且还存在于哺乳动物细胞表达的病毒载体中。在一些实施方案中,本公开提供了存在于文库构建体的上下文中的标识符。在一些实施方案中,标识符位于用于包装到病毒载体中的序列(例如,病毒重复序列,例如用于表达AAV载体的AAV ITR)之间。在一些实施方案中,如本文所述的哺乳动物细胞表达的病毒载体包含标识符,例如,在病毒载体的核酸中。在一些实施方案中,如本文所述的哺乳动物细胞表达的病毒载体包含核酸,所述核酸包含位于两个病毒重复序列(例如,AAV载体的ITR)之间的标识符。在一些实施方案中,病毒载体核酸内的标识符的至少一部分通过下一代测序和/或单细胞测序和/或Sanger测序检测。
在一些实施方案中,表达病毒载体的哺乳动物细胞和表达的病毒载体均包含相同的标识符。在一些实施方案中,病毒载体的标识符对应于产生病毒载体的哺乳动物细胞的标识符。在一些实施方案中,病毒载体的标识符源自产生病毒载体的哺乳动物细胞的标识符。在一些实施方案中,病毒载体的标识符与产生病毒载体的哺乳动物细胞的标识符至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同。
在一些实施方案中,标识符包含条形码。在一些实施方案中,标识符是或包含条形码,并且存在于位于用于包装到病毒载体中的序列(例如,病毒重复序列,例如用于表达AAV载体的AAV ITR)之间的文库构建体中。在一些实施方案中,标识符是或包含存在于病毒载体核酸中的条形码。在一些实施方案中,所提供的方法包括检测包含来自病毒载体样品的条形码的标识符。
在一些实施方案中,标识符包含文库变体。在一些实施方案中,标识符包含文库变体,并且存在于位于用于包装到病毒载体中的序列(例如,病毒重复序列,例如用于表达AAV载体的AAV ITR)之间的文库构建体中。在一些实施方案中,标识符包含存在于病毒载体核酸中的文库变体。在一些实施方案中,所提供的方法包括检测包含来自病毒载体样品的文库变体的标识符。
在一些实施方案中,标识符包含条形码和文库变体。在一些实施方案中,标识符包含条形码和文库变体,并且存在于位于用于包装到病毒载体中的序列(例如,病毒重复序列,例如用于表达AAV载体的AAV ITR)之间的文库构建体中。在一些实施方案中,标识符包含存在于病毒载体核酸中的条形码和文库变体。在一些实施方案中,所提供的方法包括检测包含来自病毒载体样品的条形码和文库变体的标识符的至少一部分。
条形码
本公开涵盖以下认识:条形码可以用于跟踪不同组分之间的关联。在一些实施方案中,条形码是一种工程化序列。在一些实施方案中,条形码是一种工程化核酸序列。在一些实施方案中,条形码是文库构建体的一部分。
在一些实施方案中,文库构建体包含一个或多个条形码,所述条形码在检测时(例如,通过下一代测序方法)指示一个或多个文库变体和/或未直接检测的其他工程化序列的身份。在一些实施方案中,一个条形码与一个或多个工程化序列相关。例如,在一些实施方案中,一个条形码与一个或多个文库变体相关。在一些实施方案中,一个条形码与一个工程化序列相关。例如,在一些实施方案中,一个条形码与一个文库变体相关。
在一些实施方案中,条形码不组成标识符。在一些实施方案中,条形码组成标识符。在一些实施方案中,条形码组成包含核酸序列的标识符。在一些实施方案中,条形码组成包含工程化序列的标识符。在一些实施方案中,标识符不包含条形码。在一些实施方案中,标识符包含条形码。在一些实施方案中,标识符包含有包含核酸序列的条形码。在一些实施方案中,标识符包含有包含工程化序列的条形码。在一些实施方案中,哺乳动物细胞包含多个条形码,其中至少一个条形码是标识符并且至少一个条形码不是标识符。
在一些实施方案中,文库构建体包含条形码。在一些实施方案中,条形码用作标识符。在一些实施方案中,条形码用作标识符,并且位于两个病毒重复序列之间。在一些实施方案中,条形码不用作标识符。在一些实施方案中,条形码不用作标识符,并且位于两个病毒重复序列之间,但未被检测到(例如,通过下一代测序)。在一些实施方案中,文库构建体包含位于两个病毒重复序列之外的条形码序列,因此不被包装到病毒载体中。
在一些实施方案中,条形码用作标识符,其中条形码存在于位于用于包装到病毒载体中的序列(例如,病毒重复序列,例如,用于表达AAV载体的AAV ITR)之间的文库构建体中。在一些实施方案中,条形码用作使鉴定产生和/或衍生病毒载体的哺乳动物细胞或克隆细胞系成为可能的标识符。在一些实施方案中,条形码的相对丰度指示它所源自的哺乳动物细胞的相对生产率。在一些实施方案中,条形码用作标识符,并且在检测(例如,通过下一代测序方法)时也指示一个或多个文库变体和/或未直接检测的工程化序列的身份。
在一些实施方案中,条形码不用作标识符,但在检测(例如,通过下一代测序方法和/或单细胞测序方法)时指示一个或多个文库变体和/或未直接检测的工程化序列的身份。例如,在文库构建体不连续的一些实施方案中,条形码可以用于追踪一个或多个文库变体。在一些实施方案中,不连续文库构建体包含第一构建体和一个或多个各自包含条形码的其他构建体,所述第一构建体包含位于病毒重复序列之间的标识符。在一些实施方案中,文库构建体还包含一个、两个、三个、四个、五个或更多个构建体,每个构建体包含一个或多个文库变体,其中每个单独的构建体还包含条形码。在一些实施方案中,每个文库变体均与独特的条形码相关。作为另一个实例,在文库构建体连续的一些实施方案中,条形码也可以用于追踪一个或多个文库变体。在一些实施方案中,连续文库构建体包含位于病毒重复序列之间的标识符。在一些实施方案中,文库构建体还包含一个或多个文库变体和一个或多个条形码。在一些实施方案中,每个文库变体均与独特的条形码相关。
在一些实施方案中,条形码包含长度在3个核苷酸至50个核苷酸范围内的核酸序列。在一些实施方案中,条形码包含长度在由下限和上限(上限大于下限)界定的范围内的核酸序列。在一些实施方案中,下限可以是约5个核苷酸、约6个核苷酸、约7个核苷酸、约8个核苷酸、约9个核苷酸、约10个核苷酸、约11个核苷酸、约12个核苷酸、约13个核苷酸、约14个核苷酸,或约15个核苷酸。在一些实施方案中,上限可以是约10个核苷酸、约15个核苷酸、约20个核苷酸、约25个核苷酸、约30个核苷酸、约35个核苷酸、约40个核苷酸、约45个核苷酸,或约50个核苷酸。在一些特定实施方案中,条形码包含长度在5个核苷酸至25个核苷酸范围内的序列。在一些特定实施方案中,条形码包含约5个核苷酸、约10个核苷酸、约15个核苷酸、约20个核苷酸或约25个核苷酸。在一些实施方案中,条形码包含DNA和/或RNA。在一些实施方案中,条形码包含长度在3个核苷酸至50个核苷酸或约5个核苷酸至约25个核苷酸范围内的DNA序列。在一些实施方案中,条形码包含长度在3个核苷酸至50个核苷酸或约5个核苷酸至约25个核苷酸范围内的RNA序列。
在一些实施方案中,所提供的方法包括检测条形码(例如,通过测序,例如通过下一代测序和/或单细胞测序和/或Sanger测序)。
文库变体
本公开提供了包含一个或多个文库变体的哺乳动物细胞,所述一个或多个文库变体引起在文库的哺乳动物细胞之间变化的扰动。在一些实施方案中,文库变体引起可能影响病毒载体产生的某些特征的扰动。在一些实施方案中,文库变体包含引起扰动的工程化序列。在一些实施方案中,文库变体是序列变化。在一些实施方案中,文库变体是表观遗传变化。在一些实施方案中,文库变体在效应物中,由此文库变体影响或引起在细胞之间变化的扰动。在一些实施方案中,文库变体本身可以成为在细胞间变化的扰动。例如,在一些实施方案中,是gRNA的文库变体是效应物,其连同RNA引导的核酸酶(例如,扰动附加序列)导致细胞基因组DNA内的缺失。在其他实施方案中,文库变体是ORF或基因序列,在其转染到细胞中以及在一些情况下整合到基因组DNA中(例如,如通过反式作用和顺式作用整合序列进行)时,本身成为细胞的遗传物质的扰动或修饰。
在一些实施方案中,文库变体包含引导RNA序列。在一些实施方案中,包含引导RNA序列的文库变体也可以是标识符(例如,使病毒载体与产生它的哺乳动物细胞相关的独特gRNA序列)。在一些实施方案中,哺乳动物细胞包含有包含引导序列的文库变体,其可以被病毒载体获取。在一些实施方案中,引导序列的长度为约10至30个核苷酸。在一些实施方案中,引导序列的长度为15至25个核苷酸。在某些实施方案中,引导序列的长度为16至24个核苷酸(例如,长度为16、17、18、19、20、21、22、23或24个核苷酸)。在一些实施方案中,引导序列位于或接近gRNA的5'末端(例如,对于Cas9或从其衍生或获得的核酸酶)。在一些实施方案中,引导序列位于或接近gRNA的3'末端(例如,对于Cpf1或从其衍生或获得的核酸酶)。
在一些实施方案中,文库变体编码与引入基因组缺失相关的引导RNA序列。在一些实施方案中,文库变体编码与引入基因组突变(例如,SNP)相关的引导RNA序列。在一些实施方案中,文库变体编码与引入基因组重排相关的引导RNA序列。在一些实施方案中,文库变体编码与改变基因的表达(例如,激活和/或抑制)相关的引导RNA序列。
在一些实施方案中,文库变体包含一个或多个ORF。在一些实施方案中,文库变体包含ORF。在一些实施方案中,文库变体包含编码RNA序列的ORF。在一些实施方案中,ORF编码多肽(诸如蛋白质,诸如糖蛋白)。在一些实施方案中,ORF编码融合多肽和/或嵌合多肽。
在一些实施方案中,文库变体包含一个或多个基因。在一些实施方案中,文库变体包含基因。在一些实施方案中,文库变体包含编码RNA序列的基因。在一些实施方案中,基因编码多肽(诸如蛋白质,诸如糖蛋白)。在一些实施方案中,基因编码融合多肽和/或嵌合多肽。在一些实施方案中,文库变体包含哺乳动物基因。在一些实施方案中,文库变体包含病毒基因(例如,Cap基因)。
在一些实施方案中,文库变体编码非编码核酸序列。在一些实施方案中,文库变体编码调控RNA序列(例如,siRNA、微小RNA等)。
在一些实施方案中,文库变体或其一部分也是标识符,但文库构建体可以包含一个或多个不是标识符的其他文库变体。在一些实施方案中,文库变体或其一部分是标识符,其中文库变体位于用于包装到病毒载体中的序列(例如,病毒重复序列,例如,用于表达AAV载体的AAV ITR)之间。在一些实施方案中,文库变体不是标识符(例如,未被包装到病毒载体中)。在文库变体或其一部分是标识符的一些实施方案中,文库变体或其一部分对于此特定哺乳动物细胞或细胞系(以及由其表达的病毒载体)将是独特的。
在一些实施方案中,文库变体包含病毒载体的组分。例如病毒载体的工程化组分和/或不同血清型的成分。以这种方式可以筛选不同工程化或血清型的病毒载体。在一些实施方案中,文库变体包含Cap基因(例如,不同血清型的Cap基因)。
在一些实施方案中,所提供的哺乳动物细胞单独的包含至少一个文库变体,其中所述至少一个文库变体包含至少一个工程化序列,所述至少一个工程化序列包含至少一个基因、至少一个ORF、至少一个gRNA序列、至少一个独特非编码核酸,或其组合和/或多个。在一些实施方案中,哺乳动物细胞或哺乳动物细胞群包含多个文库变体,其中所述多个文库变体包含至少一个工程化序列,所述至少一个工程化序列包含:至少一个独特基因、至少一个独特ORF、至少一个独特gRNA序列,和/或至少一个独特非编码核酸或其组合和/或多个。
在一些实施方案中,所提供的哺乳动物细胞包含一个或多个文库变体。在一些实施方案中,所提供的哺乳动物细胞包含两个、三个、四个、五个、六个、七个、八个、九个或十个文库变体。在一些实施方案中,所提供的哺乳动物细胞包含至少100个文库变体。在一些实施方案中,所提供的哺乳动物细胞包含约2至约100个文库变体、约2至约20个文库变体、约3至约30个文库变体、约4至约40个文库变体、约5至约50个文库变体。在一些实施方案中,所提供的哺乳动物细胞包含不超过10个文库变体、不超过20个文库变体、不超过30个文库变体、不超过40个文库变体、不超过50个文库变体、不超过60个文库变体、不超过70个文库变体、不超过80个文库变体、不超过90个文库变体,或不超过100个文库变体。
在一些实施方案中,文库构建体包含至少一个文库变体和至少一个标识符,其中所述至少一个文库变体和至少一个标识符都位于两个病毒重复序列之间。在一些实施方案中,文库构建体包含至少一个文库变体和至少一个标识符,其中所述至少一个标识符位于两个病毒重复序列之间,并且所述至少一个文库变体位于两个病毒重复序列之外。在一些实施方案中,文库构建体包含至少两个文库变体和一个标识符,其中标识符和至少一个文库变体位于两个病毒重复序列之间,并且至少一个文库变体位于两个病毒重复序列之外。在一些实施方案中,文库构建体还包含位于两个病毒重复序列之间和/或之外的一个或多个其他工程化序列。例如,在一些实施方案中,文库构建体还包含位于两个病毒重复序列之间的有效载荷。作为另一个实例,在一些实施方案中,文库构建体还包含位于两个病毒重复序列之间和/或之外的一个或多个其他条形码。
在一些实施方案中,文库构建体包含为文库变体的标识符和一个或多个其他文库变体。在一些实施方案中,文库构建体是单个连续文库构建体,其包含标识符,所述标识符是位于用于包装到病毒载体中的序列(例如,病毒重复序列,例如,用于表达AAV载体的AAVITR)之间的文库变体,和位于用于包装到病毒载体中的序列之外的一个或多个其他文库变体。在一些实施方案中,文库构建体是不连续文库构建体,其包含标识符,所述标识符是位于用于包装到病毒载体中的序列(例如,病毒重复序列,例如,用于表达AAV载体的AAV ITR)之间的文库变体,并且文库构建体是一个或多个包含一个或多个其他文库变体的其他构建体。在一些特定实施方案中,一个或多个其他文库变体包含病毒载体的组分(例如,Cap基因)。
在一些实施方案中,文库构建体包含为条形码的标识符和一个或多个文库变体。在一些实施方案中,文库构建体是单个连续文库构建体,其包含标识符,所述标识符是位于用于包装到病毒载体中的序列(例如,病毒重复序列,例如,用于表达AAV载体的AAV ITR)之间的条形码,并且单个连续文库构建体包含位于用于包装到病毒载体中的序列之外的一个或多个文库变体。在一些实施方案中,文库构建体是不连续文库构建体,其包含标识符,所述标识符是位于用于包装到病毒载体中的序列(例如,病毒重复序列,例如,用于表达AAV载体的AAV ITR)之间的条形码,并且文库构建体是一个或多个包含一个或多个文库变体的其他构建体。
下表3中提供了文库构建体中的文库变体的一些示例性配置。
表3–文库构建体中的示例性文库变体
在一些实施方案中,所提供的方法包括检测一个或多个文库变体(例如,通过测序,例如,通过下一代测序)。
病毒重复序列
本公开提供了适合于将标识符包装到病毒载体中的结构,诸如像病毒重复序列。在一些实施方案中,病毒重复序列是DNA和/或RNA序列。在一些实施方案中,病毒重复序列是DNA序列。在一些实施方案中,病毒重复序列是RNA序列。在一些实施方案中,位于两个病毒重复序列之间的任何核酸序列将被包装到病毒载体中。
在一些实施方案中,病毒重复序列源自与靶病毒载体相同类型的病毒。例如,在一些实施方案中,靶病毒载体是AAV载体并且病毒重复序列源自AAV。在一些实施方案中,病毒重复序列源自与靶病毒载体相同的病毒株。例如,在一些实施方案中,靶病毒载体是AAV5载体并且病毒重复序列是源自AAV5的ITR。在一些实施方案中,病毒重复序列源自与靶病毒载体不同的病毒株,但仍能够包装到靶病毒载体中。在一些实施方案中,病毒重复序列是工程化病毒重复序列(例如,包括源自两种或更多种病毒的序列)。在一些实施方案中,病毒重复序列是合成病毒重复序列(例如,基于共有病毒重复序列设计)。
在一些实施方案中,靶病毒载体是AAV载体并且病毒重复序列包含AAV ITR序列或其衍生物。在一些实施方案中,病毒重复序列源自与AAV载体不同的AAV株,但仍能够被靶病毒载体获取。在一些实施方案中,病毒重复序列是工程化AAV ITR序列。在一些实施方案中,病毒重复序列是合成AAV ITR序列。
在一些实施方案中,靶病毒载体是腺病毒载体并且病毒重复序列包含腺病毒ITR序列或其衍生物。在一些实施方案中,病毒重复序列源自与腺病毒载体不同的腺病毒株,但仍能够被靶病毒载体获取。在一些实施方案中,病毒重复序列是工程化腺病毒ITR序列。在一些实施方案中,病毒重复序列是合成腺病毒ITR序列。
在一些实施方案中,靶病毒载体是慢病毒载体并且病毒重复序列包含慢病毒ITR序列或其衍生物。在一些实施方案中,靶病毒载体是HIV-1载体并且病毒重复序列包含HIV-1ITR序列或其衍生物。在一些实施方案中,病毒重复序列源自与靶慢病毒载体不同的慢病毒株,但仍能够被靶慢病毒载体获取。在一些实施方案中,病毒重复序列是工程化腺病毒ITR序列。在一些实施方案中,病毒重复序列是合成腺病毒ITR序列。
在一些实施方案中,靶病毒载体是HSV载体并且病毒重复序列包含HSV TRL/IRL和/或HSV IRS/TRS序列和/或其衍生物。在一些实施方案中,靶病毒载体是HSV-1载体和/或HSV-2载体,并且病毒重复序列包含HSV TRL/IRL和/或HSV IRS/TRS序列和/或其衍生物。在一些实施方案中,病毒重复序列源自与靶HSV载体不同的HSV株,但仍能够被靶HSV载体获取。在一些实施方案中,病毒重复序列是工程化HSV TRL/IRL和/或HSV IRS/TRS序列。在一些实施方案中,病毒重复序列是合成HSV TRL/IRL和/或HSV IRS/TRS序列。
有效载荷
本公开尤其提供了包含有效载荷的病毒载体。有效载荷通常是期望引入细胞、器官、生物体和/或生物系统(例如,包含细胞)中的任何关注的序列。例如,在一些实施方案中,病毒载体可以包含可以用于编辑细胞(例如,编码基因组编辑工具,例如,用于基因治疗和/或细胞治疗)的有效载荷。在一些实施方案中,有效载荷包含在文库构建体中。在一些实施方案中,有效载荷包含在文库构建体中并且位于用于包装到病毒载体中的序列(例如,病毒重复序列,例如,用于表达AAV载体的AAV ITR)之间。
在一些实施方案中,有效载荷序列包含以下中的一项或多项:编码区、基因调控元件和转录终止子。基因调控元件的非限制性实例包括启动子、转录激活子、增强子和聚腺苷酸化信号。在一些实施方案中,有效载荷序列包含编码区、基因调控元件和转录终止子,它们相对于彼此定位,使得编码区位于基因调控元件和转录终止子之间。
在一些实施方案中,编码区编码基因产物。在一些实施方案中,基因产物是RNA。在一些实施方案中,编码区编码多肽(诸如蛋白质,诸如糖蛋白)。在一些实施方案中,编码区编码融合多肽和/或嵌合多肽。在一些实施方案中,编码区编码一种基因产物。在一些实施方案中,编码区编码多于一种基因产物(例如,2、3、4、5、6、7或更多种基因产物)。在一些实施方案中,编码区编码调控RNA(例如,siRNA、微小RNA等)。
在一些实施方案中,本文所述的病毒载体的有效载荷可以是基因治疗有效载荷并且可以编码对受试者(诸如患有疾病或病症的受试者)有益的任何蛋白质或其一部分。蛋白质可以是细胞外蛋白、细胞内蛋白或膜结合蛋白。蛋白质可以是治疗性蛋白质。在一些实施方案中,被施用基因治疗的受试者患有疾病或病症,由此受试者的内源性版本的蛋白质有缺陷或产生的量有限或根本不产生。在一些此类实施方案中,有效载荷编码无缺陷版本的蛋白质。在一些实施方案中,被施用基因治疗的受试者患有由靶基因(例如,由靶基因的表达水平和/或靶多肽的活性水平)介导的疾病或病症,并且有效载荷编码靶基因或靶多肽的抑制剂。治疗性蛋白质的实例包括但不限于可输注或可注射的治疗性蛋白质、酶、酶辅因子、激素、血液或血液凝固因子、细胞因子和干扰素、生长因子、脂肪素等。
在一些实施方案中,有效载荷可以包含基因编辑组分。在一些实施方案中,有效载荷可以包含切除核酸(例如,其中病毒载体将RNA引导的核酸酶递送至靶细胞)。在一些实施方案中,包含基因编辑组分的有效载荷可以编码本领域已知的任何合适的核酸内切酶。例如,有效载荷可以编码或包含CRISPR(成簇规律间隔短回文重复序列)/Cas系统的一个或多个组分。
有效载荷序列可以是与相关病毒载体相容的任何长度。在一些实施方案中,有效载荷序列的侧翼为一个或多个获得自或源自病毒的序列(例如,AAV的ITR序列)。在一些实施方案中,有效载荷序列位于用于包装到病毒载体中的序列之间。在一些实施方案中,有效载荷序列位于病毒重复序列(例如,AAV的ITR序列)之间。
启动子
在一些实施方案中,有效载荷包含启动子。术语“启动子”是指被酶/蛋白质识别的DNA序列,其可以启动和/或发起可操作连接的编码序列(例如,基因)的转录。例如,启动子通常是指例如RNA聚合酶和/或任何相关因子结合的并且启动子可以自其发起转录的核苷酸序列。因此,在一些实施方案中,有效载荷包含可操作地连接至本文所述的非限制性实例启动子中的一个的编码序列。
在一些实施方案中,启动子是诱导型启动子、组成型启动子、哺乳动物细胞启动子、病毒启动子、嵌合启动子、工程化启动子、组织特异性启动子或本领域已知的任何其他类型的启动子。
多种启动子是本领域已知的,其可以用于本文。本文中可以使用的启动子的非限制性实例包括:人EF1α、人巨细胞病毒(CMV)(美国专利号5,168,062,其以引用的方式整体并入本文)、人泛素C(UBC)、小鼠磷酸甘油酸激酶1、多瘤腺病毒、猴病毒40(SV40)、β-珠蛋白、β-肌动蛋白、甲胎蛋白、γ-珠蛋白、β-干扰素、γ-谷氨酰转肽酶、小鼠乳腺肿瘤病毒(MMTV)、Rous肉瘤病毒、大鼠胰岛素、甘油醛-3-磷酸甘油醛脱氢酶、金属硫蛋白II(MT II)、淀粉酶、组织蛋白酶、MI毒蕈碱受体、逆转录病毒LTR(例如,人T细胞白血病病毒HTLV)、AAVITR、白细胞介素-2、胶原酶、血小板衍生生长因子、腺病毒5E2、溶基质素、鼠MX基因、葡萄糖调控蛋白(GRP78和GRP94)、α-2-巨球蛋白、波形蛋白、MHC I类基因H-2K b、HSP70、增殖蛋白、肿瘤坏死因子、促甲状腺激素a基因、免疫球蛋白轻链、T细胞受体、HLA DQa和DQ、白细胞介素-2受体、II类MHC、II类MHC HLA-DRa、肌肉肌酸激酶、前白蛋白(转甲状腺素蛋白)、弹性蛋白酶I、白蛋白基因、c-fos、c-HA-ras、神经细胞粘附分子(NCAM)、H2B(TH2B)组蛋白、大鼠生长激素、人血清淀粉样蛋白(SAA)、肌钙蛋白I(TN I)、杜氏肌营养不良症、人免疫缺陷病毒、脾灶形成病毒(SFFV)启动子、鼠干细胞病毒(MSCV)启动子、超核心启动子(SCP)、和长臂猿白血病病毒(GALV)启动子。启动子的其他实例是本领域已知的。参见,例如,Lodish,Molecular Cell Biology,Freeman and Company,New York 2007,其每一篇均以引用的方式整体并入本文。在一些实施方案中,启动子是CMV立即早期启动子。在一些实施方案中,启动子是CAG启动子或CAG/CBA启动子。
术语“组成型”启动子是指当与编码序列(例如,蛋白质编码序列)可操作地连接时,导致在大多数或所有生理条件下从细胞中的核酸转录RNA的核苷酸序列。
组成型启动子的实例包括但不限于逆转录病毒Rous肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子(参见,例如,Boshart等人,Cell 41:521-530,1985,其以引用的方式整体并入本文)、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EFl-α启动子(Invitrogen)。
诱导型启动子允许调控基因表达并且可以通过外源提供的化合物、环境因素诸如温度或特定生理状态例如急性期、细胞的特定分化状态或仅在复制细胞中的存在来调控。诱导型启动子和诱导型系统可以从各种商业来源获得,包括但不限于Invitrogen、Clontech和Ariad。诱导型启动子的其他实例是本领域已知的。
受外源提供的化合物调控的诱导型启动子的实例包括锌诱导型绵羊金属硫蛋白(MT)启动子、地塞米松(Dex)诱导型小鼠乳腺肿瘤病毒(MMTV)启动子、T7聚合酶启动子系统、蜕皮激素昆虫启动子、四环素-抑制型系统、四环素诱导型系统、RU486诱导型系统和雷帕霉素诱导型系统。
术语“组织特异性”启动子是指仅在某些特定细胞类型和/或组织中有活性的启动子(例如,特定基因的转录仅发生在表达与组织特异性启动子结合的转录调控和/或控制蛋白的细胞内)。
在一些实施方案中,调控和/或控制序列赋予组织特异性基因表达能力。在一些情况下,组织特异性调控和/或控制序列结合以组织特异性方式诱导转录的组织特异性转录因子。
增强子
在一些情况下,有效载荷可以包含增强子序列。术语“增强子”是指可以增加核酸编码序列(例如,蛋白质)的转录水平的核苷酸序列。增强子序列(长度通常为50-1500bp)通常通过为转录相关蛋白(例如转录因子)提供其他结合位点来提高转录水平。在一些实施方案中,在内含子序列中存在增强子序列。与启动子序列不同,增强子序列可以在距离转录起始位点远得多的位置(例如,与启动子相比)起作用。增强子的非限制性实例包括RSV增强子、CMV增强子、CMV早期增强子、cAMP反应元件(CRE)增强子和/或SV40增强子。
其他序列
在一些实施方案中,本文所述的任何有效载荷可以包含非翻译区(UTR),诸如5'UTR或3'UTR。基因的UTR被转录但不被翻译。5'UTR从转录起始位点开始,并持续到起始密码子,但不包含起始密码子。3'UTR紧随终止密码子开始,并持续直至转录终止信号。
在一些实施方案中,编码本文提供的蛋白质的有效载荷可以包含聚腺苷酸化(poly(A))信号序列。大多数新生真核mRNA在其3'端具有poly(A)尾,这是在一个复杂的过程中添加的,所述过程包括初级转录物的切割和由poly(A)信号序列驱动的偶联聚腺苷酸化反应(参见,例如,Proudfoot等人,Cell 108:501-512,2002,其以引用的方式整体并入本文)。poly(A)尾赋予mRNA稳定性和可转移性(B.Alberts等人的Molecular Biology of theCell,第三版,Garland Publishing,1994,其以引用的方式整体并入本文)。在一些实施方案中,poly(A)信号序列位于编码序列的3'。
在一些实施方案中,编码蛋白质的有效载荷可以包含内部核糖体进入位点(IRES)。IRES形成复杂的二级结构,允许从任何位置发生翻译起始,mRNA紧接在IRES所在位置的下游(参见,例如,Pelletier和Sonenberg,Mal.Cell.Biol.8(3):1103-1112,1988)。本领域技术人员已知有几种IRES序列,包括来自例如口蹄疫病毒(FMDV)、脑心肌炎病毒(EMCV)、人鼻病毒(HRV)、蟋蟀麻痹病毒、人免疫缺陷病毒(HIV)、甲型肝炎病毒(HAV)、丙型肝炎病毒(HCV)和脊髓灰质炎病毒(PV)的那些。
在一些实施方案中,本文提供的任何构建体可以包含剪接供体和/或剪接受体序列,其在转录过程发生的RNA加工过程中是有功能性的。在一些实施方案中,剪接位点参与反式剪接。
在一些实施方案中,本文提供的有效载荷可以任选地包含编码报告多肽和/或蛋白质的序列(“报告序列”)和/或编码选择标记的序列(例如,其赋予可以人工选择的性状,例如,抗性盒等)。报告序列的非限制性实例包括编码以下的DNA序列:β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、红色荧光蛋白、mCherry荧光蛋白、黄色荧光蛋白、氯霉素乙酰转移酶(CAT)和荧光素酶。报告序列的其他实例是本领域已知的。当与驱动其表达的控制元件相关时,报告序列可以提供通过常规方式可检测的信号,所述常规方式包括酶促、射线照相、比色、荧光或其他光谱测定;荧光激活细胞分选(FACS)测定;免疫学测定(例如,酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组织化学)。类似地,当与驱动其表达的控制元件相关时,选择标记序列可以赋予也可以通过常规方式人工选择的性状。
文库构建体元件相对于病毒重复序列的位置
文库构建体可以包含一个或多个工程化序列。在一些实施方案中,文库构建体包含多个工程化序列。在一些实施方案中,文库构建体包含用于包装病毒载体的病毒重复序列。
文库构建体上的一个或多个和/或多个工程化序列可以位于相对于彼此和相对于文库构建体上的病毒重复序列的许多位置和/或位置组合。例如,在一些实施方案中,哺乳动物细胞或哺乳动物细胞群包含至少一个包含多个工程化序列的文库构建体,其中多个工程化序列的第一子集位于病毒重复序列之间,并且多个工程化序列的第二子集位于病毒重复序列之外。
在一些实施方案中,文库构建体上的多个工程化序列包含至少一个文库变体和至少一个标识符。在一些实施方案中,所有文库变体和标识符都位于病毒重复序列之间。在一些实施方案中,标识符位于病毒重复序列之间并且所有文库变体都位于病毒重复序列之外。在一些实施方案中,多个工程化序列包含至少两个文库变体和至少一个标识符。在一些实施方案中,标识符和至少一个文库变体位于病毒重复序列之间,并且至少一个文库变体位于病毒重复序列之外。
在一些实施方案中,多个工程化序列包含至少一个文库变体、至少一个标识符和至少一个有效载荷。在一些实施方案中,所有文库变体、标识符和有效载荷都位于病毒重复序列之间。在一些实施方案中,所有标识符和有效载荷都位于病毒重复序列之间,并且所有文库变体都位于病毒重复序列之外。在一些实施方案中,多个工程化序列包含至少两个文库变体、至少一个有效载荷和至少一个标识符。在一些实施方案中,所有标识符、有效载荷和至少一个文库变体位于病毒重复序列之间,并且至少一个文库变体位于病毒重复序列之外。
在一些实施方案中,文库构建体还包含至少一个工程化序列,所述至少一个工程化序列包含至少一个报告基因和/或选择标记。在一些实施方案中,所有报告基因和/或选择标记都位于病毒重复序列之间。在一些实施方案中,所有报告基因和/或选择标记都位于病毒重复序列之外。在一些实施方案中,文库构建体包含至少一个报告基因和至少一个选择标记。在一些实施方案中,至少一个报告基因和至少一个选择标记都位于病毒重复序列之间。在一些实施方案中,至少一个报告基因和至少一个选择标记都位于病毒重复序列之外。在一些实施方案中,至少一个报告基因位于病毒重复序列之间并且至少一个选择标记位于病毒重复序列之外。在一些实施方案中,至少一个选择标记位于病毒重复序列之间,并且至少一个报告基因位于病毒重复序列之外。
在一些实施方案中,文库构建体还包含至少一个包含至少一个条形码的工程化序列。在一些实施方案中,所有条形码都位于病毒重复序列之间。在一些实施方案中,所有条形码都位于病毒重复序列之外。在一些实施方案中,文库构建体包含多个条形码,其中第一子集位于病毒重复序列之间,并且第二子集位于病毒重复序列之外。
在一些实施方案中,文库构建体包含至少一个标识符和至少一个条形码。在一些实施方案中,至少一个条形码用作标识符,并且在一些实施方案中,至少一个条形码不用作标识符。在一些实施方案中,至少一个条形码位于病毒重复序列之间,并且至少一个条形码或其一部分用作标识符。在一些实施方案中,至少一个条形码位于病毒重复序列之间,并且至少一个条形码不用作标识符。在一些实施方案中,文库构建体包含至少一个标识符和至少两个条形码。在一些实施方案中,所有标识符和至少一个条形码位于病毒重复序列之间,并且至少一个条形码位于病毒重复序列之外,其中位于病毒重复序列之间的至少一个条形码(或其一部分)用作标识符。在一些实施方案中,所有标识符和至少一个条形码位于病毒重复序列之间,并且至少一个条形码位于病毒重复序列之外,其中至少两个条形码均不用作标识符。
在一些实施方案中,文库构建体包含至少两个条形码并且还包含至少一个其他工程化序列,其中没有条形码用作标识符并且所有条形码都用于追踪其他工程化序列。例如,在一些实施方案中,文库构建体包含至少两个条形码并且还包含至少一个文库变体,其中没有条形码用作标识符并且所有条形码都用于追踪文库变体。在一些实施方案中,一个条形码用作标识符并且其他条形码用于追踪文库变体。
在一些实施方案中,一个条形码指示单个工程化序列(例如,单个文库变体)。在一些实施方案中,一个条形码指示多于一个工程化序列(例如,多于一个文库变体)。在一些实施方案中,多于一个条形码指示一个工程化序列(例如,一个文库变体)。在一些实施方案中,多于一个条形码指示多于一个工程化序列(例如,多于一个文库变体)。在一些实施方案中,没有条形码用作标识符并且所有条形码都用于追踪包含条形码的其他工程化序列。在一些实施方案中,一个条形码用作标识符并且其他条形码用于追踪包含条形码的其他工程化序列。
哺乳动物细胞中构建体的使用
构建体和工程化序列的其他特征
启动子
在一些实施方案中,构建体包含启动子。术语“启动子”是指被酶/蛋白质识别的DNA序列,其可以启动和/或发起可操作连接的编码序列(例如,基因)的转录。例如,启动子通常是指例如RNA聚合酶和/或任何相关因子结合的并且启动子可以自其发起转录的核苷酸序列。因此,在一些实施方案中,工程化序列包含可操作地连接至本文所述的非限制性实例启动子中的一个的编码序列。
在一些实施方案中,启动子是诱导型启动子、组成型启动子、哺乳动物细胞启动子、病毒启动子、嵌合启动子、工程化启动子、组织特异性启动子或本领域已知的任何其他类型的启动子。
多种启动子是本领域已知的,其可以用于本文。本文中可以使用的启动子的非限制性实例包括:人EF1α、人巨细胞病毒(CMV)(美国专利号5,168,062,其以引用的方式整体并入本文)、人泛素C(UBC)、小鼠磷酸甘油酸激酶1、多瘤腺病毒、猴病毒40(SV40)、β-珠蛋白、β-肌动蛋白、甲胎蛋白、γ-珠蛋白、β-干扰素、γ-谷氨酰转肽酶、小鼠乳腺肿瘤病毒(MMTV)、Rous肉瘤病毒、大鼠胰岛素、甘油醛-3-磷酸甘油醛脱氢酶、金属硫蛋白II(MT II)、淀粉酶、组织蛋白酶、MI毒蕈碱受体、逆转录病毒LTR(例如,人T细胞白血病病毒HTLV)、AAVITR、白细胞介素-2、胶原酶、血小板衍生生长因子、腺病毒5E2、溶基质素、鼠MX基因、葡萄糖调控蛋白(GRP78和GRP94)、α-2-巨球蛋白、波形蛋白、MHC I类基因H-2K b、HSP70、增殖蛋白、肿瘤坏死因子、促甲状腺激素a基因、免疫球蛋白轻链、T细胞受体、HLA DQa和DQ、白细胞介素-2受体、II类MHC、II类MHC HLA-DRa、肌肉肌酸激酶、前白蛋白(转甲状腺素蛋白)、弹性蛋白酶I、白蛋白基因、c-fos、c-HA-ras、神经细胞粘附分子(NCAM)、H2B(TH2B)组蛋白、大鼠生长激素、人血清淀粉样蛋白(SAA)、肌钙蛋白I(TN I)、杜氏肌营养不良症、人免疫缺陷病毒、脾灶形成病毒(SFFV)启动子、鼠干细胞病毒(MSCV)启动子、超核心启动子(SCP)、和长臂猿白血病病毒(GALV)启动子。启动子的其他实例是本领域已知的。参见,例如,Lodish,Molecular Cell Biology,Freeman and Company,New York 2007,其每一篇均以引用的方式整体并入本文。在一些实施方案中,启动子是CMV立即早期启动子。在一些实施方案中,启动子是CAG启动子或CAG/CBA启动子。
术语“组成型”启动子是指当与编码序列(例如,蛋白质编码序列)可操作地连接时,导致在大多数或所有生理条件下从细胞中的核酸转录RNA的核苷酸序列。
组成型启动子的实例包括但不限于逆转录病毒Rous肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子(参见,例如,Boshart等人,Cell 41:521-530,1985,其以引用的方式整体并入本文)、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EFl-α启动子(Invitrogen)。
诱导型启动子允许调控基因表达并且可以通过外源提供的化合物、环境因素诸如温度或特定生理状态例如急性期、细胞的特定分化状态或仅在复制细胞中的存在来调控。诱导型启动子和诱导型系统可以从各种商业来源获得,包括但不限于Invitrogen、Clontech和Ariad。诱导型启动子的其他实例是本领域已知的。
受外源提供的化合物调控的诱导型启动子的实例包括锌诱导型绵羊金属硫蛋白(MT)启动子、地塞米松(Dex)诱导型小鼠乳腺肿瘤病毒(MMTV)启动子、T7聚合酶启动子系统、蜕皮激素昆虫启动子、四环素-抑制型系统、四环素诱导型系统、RU486诱导型系统和雷帕霉素诱导型系统。
术语“组织特异性”启动子是指仅在某些特定细胞类型和/或组织中有活性的启动子(例如,特定基因的转录仅发生在表达与组织特异性启动子结合的转录调控和/或控制蛋白的细胞内)。
在一些实施方案中,调控和/或控制序列赋予组织特异性基因表达能力。在一些情况下,组织特异性调控和/或控制序列结合以组织特异性方式诱导转录的组织特异性转录因子。
增强子
在一些情况下,构建体可以包含增强子序列。术语“增强子”是指可以增加核酸编码序列(例如,蛋白质)的转录水平的核苷酸序列。增强子序列(长度通常为50-1500bp)通常通过为转录相关蛋白(例如转录因子)提供其他结合位点来提高转录水平。在一些实施方案中,在内含子序列中存在增强子序列。与启动子序列不同,增强子序列可以在距离转录起始位点远得多的位置(例如,与启动子相比)起作用。增强子的非限制性实例包括RSV增强子、CMV增强子、CMV早期增强子、cAMP反应元件(CRE)增强子和/或SV40增强子。
其他序列
在一些实施方案中,本文所述的任何构建体可以包含非翻译区(UTR),诸如5'UTR或3'UTR。基因的UTR被转录但不被翻译。5'UTR从转录起始位点开始,并持续到起始密码子,但不包含起始密码子。3'UTR紧随终止密码子开始,并持续直至转录终止信号。
在一些实施方案中,包含编码本文提供的蛋白质的工程化序列的构建体可以包含聚腺苷酸化(poly(A))信号序列。大多数新生真核mRNA在其3'端具有poly(A)尾,这是在一个复杂的过程中添加的,所述过程包括初级转录物的切割和由poly(A)信号序列驱动的偶联聚腺苷酸化反应(参见,例如,Proudfoot等人,Cell 108:501-512,2002,其以引用的方式整体并入本文)。poly(A)尾赋予mRNA稳定性和可转移性(B.Alberts等人的MolecularBiology of the Cell,第三版,Garland Publishing,1994,其以引用的方式整体并入本文)。在一些实施方案中,poly(A)信号序列位于编码序列的3'。
在一些实施方案中,包含编码蛋白质的工程化序列的构建体可以包含内部核糖体进入位点(IRES)。IRES形成复杂的二级结构,允许从任何位置发生翻译起始,mRNA紧接在IRES所在位置的下游(参见,例如,Pelletier和Sonenberg,Mal.Cell.Biol.8(3):1103-1112,1988)。本领域技术人员已知有几种IRES序列,包括来自例如口蹄疫病毒(FMDV)、脑心肌炎病毒(EMCV)、人鼻病毒(HRV)、蟋蟀麻痹病毒、人免疫缺陷病毒(HIV)、甲型肝炎病毒(HAV)、丙型肝炎病毒(HCV)和脊髓灰质炎病毒(PV)的那些。
在一些实施方案中,本文提供的任何构建体可以包含剪接供体和/或剪接受体序列,其在转录过程发生的RNA加工过程中是有功能性的。在一些实施方案中,剪接位点参与反式剪接。
在一些实施方案中,本文提供的任何构建体可以任选地包含编码报告多肽和/或蛋白质的序列(“报告序列”)和/或编码选择标记的序列(例如,其赋予可以人工选择的性状,例如,抗性盒等)。报告序列的非限制性实例包括编码以下的DNA序列:β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、红色荧光蛋白、mCherry荧光蛋白、黄色荧光蛋白、氯霉素乙酰转移酶(CAT)和荧光素酶。报告序列的其他实例是本领域已知的。当与驱动其表达的控制元件相关时,报告序列可以提供通过常规方式可检测的信号,所述常规方式包括酶促、射线照相、比色、荧光或其他光谱测定;荧光激活细胞分选(FACS)测定;免疫学测定(例如,酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组织化学)。类似地,当与驱动其表达的控制元件相关时,选择标记序列可以赋予也可以通过常规方式人工选择的性状。
哺乳动物细胞工程化和细胞构建体进入
在一些实施方案中,本公开提供了包括制备或获得哺乳动物细胞文库的方法。适用于遗传修饰的任何方法都可以用于在本公开的上下文中操作哺乳动物细胞,例如以引入文库构建体、引入另一构建体和/或引入扰动。例如,本领域已知许多用于将外源性核酸(例如,DNA)引入真核细胞的方法,包括转染、感染(例如,病毒转导)或电穿孔。
用于将构建体递送至哺乳动物细胞的方法可以根据需要而变化。在某些实施方案中,某些构建体可以作为一个或多个质粒中的核酸(例如,DNA)构建体递送。递送方法包括但不限于电穿孔、显微注射、基因枪、穿刺转染、静水压、连续输注、超声处理、磁转染、化学媒介物(例如,寡核苷酸、脂质复合物、聚合物囊泡、复合物、树枝状聚合物、无机纳米颗粒和细胞穿膜肽)、病毒载体(例如,整合构建体和/或整合病毒载体,例如,有复制能力的病毒载体、无复制能力的病毒载体、复制缺乏的病毒载体、复制缺陷的病毒载体、有复制能力的病毒载体,和/或条件复制病毒载体)。
在一些实施方案中,哺乳动物细胞文库被遗传修饰以包含文库构建体和/或其他构建体。文库构建体和/或其他构建体可以通过例如对于核酸操作技术人员而言本领域已知的任何合适的方法来递送并且包括遗传工程化、重组工程化和合成技术(参见,例如,Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,N.Y,其以引用的方式整体并入本文)。在一些实施方案中,所提供的方法包括将组成文库构建体的一个或多个核酸转染到文库的哺乳动物细胞中。
在一些实施方案中,哺乳动物细胞文库被遗传修饰以包含一个或多个产生病毒载体所必需的核酸序列。在一些实施方案中,表达和/或产生病毒载体的哺乳动物细胞文库可以具有一种或多种以反式形式提供给哺乳动物细胞的病毒载体组分。例如,可以使用任何适当的构建体将重组AAV构建体和/或工程化序列、rep序列、cap序列和产生本公开的AAV载体所需的辅助功能递送至包装宿主细胞。
编码病毒元件的构建体可以通过例如对于核酸操作技术人员而言本领域已知的任何合适的方法来递送并且包括遗传工程化、重组工程化和合成技术(参见,例如,Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,N.Y,其以引用的方式整体并入本文)。在一些实施方案中,所提供的方法包括将一个或多个组成病毒构建体或编码病毒载体组分的核酸转染到文库的哺乳动物细胞中。在一些实施方案中,所提供的方法包括转染一个或多个含有编码病毒载体的核酸分子或基本上由其组成的质粒。在一些实施方案中,病毒载体组分包含在一个或多个转染到细胞中的质粒上。在一些实施方案中,病毒载体组分包含在一个、两个、三个或更多个各自转染到细胞中的质粒上。
在一些实施方案中,病毒载体是腺相关病毒(AAV),并且病毒转染包括将含有编码AAV载体的核酸分子或基本上由其组成的质粒转染到哺乳动物细胞中,并提供AAV载体复制和包装必要的AAV载体rep和/或cap。在一些实施方案中,将各自包含AAV载体组分的一个、两个、三个或更多个质粒转染到细胞中。在一些特定实施方案中,组合提供各种AAV组分(包括辅助病毒、有效载荷(例如,治疗基因)、rep和/或cap)的质粒(例如,1至5个质粒,例如,3个质粒)被转染到细胞中。
在一些特定实施方案中,AAV构建体的病毒转染可以使用三重转染方法完成(例如,如美国专利号6,001,650中所述,其以引用的方式整体并入本文)。在一些实施方案中,AAV载体通过用一个或多个构建体转染宿主细胞而产生,所述一个或多个构建体包含一个或多个产生AAV载体所必需的核酸序列,包括但不限于rep序列和/或cap序列,和/或包含辅助功能的构建体。在一些实施方案中,rep和cap序列以反式形式发挥作用,用于生产性AAV载体复制和衣壳化。在一些实施方案中,包含rep和/或cap序列的构建体支持高效AAV构建体产生而不生成任何可检测的野生型AAV载体(即,含有功能性rep和cap基因的AAV载体)。辅助功能构建体编码AAV载体复制所依赖的非AAV衍生病毒和/或细胞功能的核苷酸序列,所述序列可以具有AAV构建体复制所需的那些功能,包括但不限于参与AAV载体基因转录的激活、阶段特异性AAV载体mRNA剪接、AAV DNA复制、cap表达产物的合成和/或AAV载体衣壳组装的那些部分。这些基于病毒的功能可以源自任何已知的辅助病毒,诸如像腺病毒、疱疹病毒(除了1型单纯疱疹病毒之外)和痘苗病毒。
在一些实施方案中,防止产生病毒载体再感染哺乳动物细胞文库的哺乳动物细胞可能是有益的。在一些实施方案中,哺乳动物细胞文库的哺乳动物细胞已经被修饰以破坏或去除产生的病毒载体的受体。在一些实施方案中,哺乳动物细胞已经用感染/阻断剂处理。
例如,在一些实施方案中,产生的病毒载体是或包括AAV载体,并且哺乳动物细胞文库已经先前或同时被遗传修饰以破坏或去除AAV的受体。在一些实施方案中,产生的病毒载体是或包括慢病毒载体,并且哺乳动物细胞文库已经先前或同时被遗传修饰以破坏或去除慢病毒的受体。在一些实施方案中,哺乳动物细胞已经用阻断慢病毒载体感染的剂处理。在此类实施方案中,整合载体和/或顺式作用整合序列不是源自慢病毒。
构建体和工程化序列在哺乳动物细胞中的位置
本文所述的任何构建体可以以在染色体外的形式存在于哺乳动物细胞中和/或被整合到哺乳动物细胞基因组中。
在一些实施方案中,文库构建体是游离的和/或被整合到哺乳动物细胞基因组中。在一些实施方案中,文库构建体是游离的单个连续构建体。在一些实施方案中,文库构建体是整合到哺乳动物细胞基因组中的单个连续构建体。在一些实施方案中,文库构建体是不连续的并且一个或多个单独的构建体是游离的。在一些实施方案中,文库构建体是不连续的并且一个或多个单独的构建体被整合到哺乳动物细胞基因组中。在一些实施方案中,文库构建体是不连续的并且至少一个构建体是游离的并且至少一个构建体被整合到哺乳动物细胞基因组中。
在一些实施方案中,一个或多个产生病毒载体所必需的序列以在染色体外的形式(例如,游离)存在于哺乳动物细胞内。在一些实施方案中,一个或多个产生病毒载体所必需的序列被整合到哺乳动物细胞的基因组中。
在一些实施方案中,一个或多个产生病毒载体所必需的序列被整合到哺乳动物细胞的基因组中,其中一个或多个序列是诱导表达的。在一些实施方案中,所有产生病毒载体所必需的序列被整合到哺乳动物细胞的基因组中,其中一个或多个序列是诱导表达的。在一些实施方案中,所有产生病毒载体所必需的序列被整合到哺乳动物细胞的基因组中,其中两个或更多个序列是诱导表达的。在一些实施方案中,所有产生病毒载体所必需的序列被整合到哺乳动物细胞的基因组中,其中所有序列是诱导表达的。
可以使用本领域已知的用于整合序列的任何方法。在一些实施方案中,整合是靶向整合(例如,在预定位点)。在一些实施方案中,整合是随机整合(例如,在随机位点)。在一些实施方案中,整合在预定的基因组位置子集中是随机的。
在一些实施方案中,使用本领域已知的方法将一个或多个工程化序列(例如,文库构建体和/或其他构建体)预整合到哺乳动物文库的细胞中。在一些实施方案中,将具有一个或多个整合序列的哺乳动物细胞用编码病毒载体的序列转染。在一些实施方案中,一个或多个病毒载体序列也被整合到基因组中。
在一些实施方案中,可以使用本领域技术人员已知的方法将用于培养病毒载体的哺乳动物细胞文库稳定地工程化为含有一种或多种此类病毒组分(例如,重组AAV构建体、rep序列、cap序列和/或辅助功能)。在一些实施方案中,此类稳定的哺乳动物细胞含有在诱导型启动子控制下的此类病毒载体组分。在一些实施方案中,此类病毒载体组分可以处于组成型启动子的控制之下。在一些实施方案中,选定的稳定哺乳动物细胞可以含有处于组成型启动子控制之下的选定组分和处于一个或多个诱导型启动子控制之下的其他选定组分。例如,例如含有处于组成型启动子控制之下的E1辅助功能,以及处于诱导型启动子控制之下的rep和/或cap基因的稳定哺乳动物细胞。其他稳定的哺乳动物细胞可以由本领域技术人员使用常规方法作为产生哺乳动物细胞文库的基础来生成。然后可以操作此类稳定表达哺乳动物细胞系以包含多种不同的工程化序列,包括标识符序列,从而生成产生病毒载体的哺乳动物细胞文库。
在一些实施方案中,外源性DNA(例如文库构建体)被整合到基因组DNA中,使得外源性DNA与哺乳动物细胞的基因组DNA邻接。在一些实施方案中,整合由细胞内源性的天然DNA修复机制介导。例如,通过将外源性DNA引入细胞,使位点特异性核酸酶产生整合位点,并使供体DNA被整合,整合即可发生。细胞可以在培养物中保持足够的时间以使DNA被整合。这通常将产生混合细胞群,包括(i)外源性DNA在由位点特异性核酸酶产生的整合位点整合到其中的重组细胞,以及任选的(ii)外源性DNA在除了所需的整合位点之外的位点整合到其中的细胞和/或任选的(iii)外源性DNA未整合到其中的细胞。本领域已知的选择方法可以用于富集文库中具有遗传组合物的细胞。
游离文库构建体
在一些实施方案中,本公开提供了哺乳动物细胞,其中一个或多个构建体(例如,文库构建体和/或编码产生病毒载体所必需的序列的构建体)没有被整合到哺乳动物细胞基因组中而是游离存在。可以使用本领域已知的用于将游离构建体引入哺乳动物细胞的任何方法。
在一些实施方案中,单个连续文库构建体游离存在于哺乳动物细胞中。在一些实施方案中,不连续文库构建体的一个或多个单独的构建体游离存在于哺乳动物细胞中(例如,包含标识符和病毒包装序列的构建体)。在一些实施方案中,不连续文库构建体的所有单独的构建体游离存在于哺乳动物细胞中。
在一些实施方案中,可以通过标准转染或电穿孔方法将外源性核酸(例如,DNA)引入哺乳动物细胞中。在一些实施方案中,引入哺乳动物细胞中的外源性核酸可以以单拷贝数、低拷贝数或高拷贝数游离存在于细胞中。在一些实施方案中,引入哺乳动物细胞的外源性核酸可以以可变的拷贝数以基因组形式存在和/或游离存在。本领域已知的选择和/或筛选方法可以用于富集具有游离构建体(例如,文库构建体)的细胞。
在一些实施方案中,由第一哺乳动物细胞文库生成的病毒载体池用于转染哺乳动物细胞以生成第二哺乳动物细胞文库。在一些实施方案中,第二哺乳动物细胞文库以游离形式表达文库变体。在一些实施方案中,由第一哺乳动物细胞文库生成的病毒载体池是AAV载体池。在一些实施方案中,由第一哺乳动物细胞文库生成的AAV载体池用于转导哺乳动物细胞以生成以游离形式包含标识符的第二哺乳动物细胞文库。
整合的文库构建体
在一些实施方案中,本公开提供了哺乳动物细胞,其中一个或多个构建体(例如,文库构建体和/或编码产生病毒载体所必需的序列的构建体)被整合到哺乳动物细胞基因组中。可以使用本领域已知的用于整合序列的任何方法。
在一些实施方案中,将构建体(例如,文库构建体)整合到哺乳动物细胞基因组内是由至少一个反式作用整合序列介导的。在一些实施方案中,至少一个反式作用整合序列包含(i)整合构建体和/或整合病毒载体,(ii)重组酶,(iii)核酸酶,(iv)转座酶,和/或其衍生物和/或融合物。在一些实施方案中,将构建体(例如,文库构建体)整合到哺乳动物细胞基因组内是由至少一个与顺式作用整合序列相协调的反式作用整合序列介导的。在一些实施方案中,顺式作用整合序列包含(i)病毒重复序列,(ii)重组酶识别位点,(iii)同源臂,和/或(iv)转座酶识别位点和/或其衍生物。
在一些实施方案中,待整合到哺乳动物基因组中的构建体(例如,文库构建体)包含至少一对位于待整合序列侧翼的顺式作用整合序列。例如,提供了一种文库构建体,其包含位于标识符和/或有效载荷的侧翼的第一组病毒重复序列,其中第一组病毒重复序列侧翼为顺式作用整合序列。
在一些实施方案中,将构建体整合到哺乳动物细胞基因组中是靶向整合。在一些实施方案中,将构建体整合到哺乳动物细胞基因组中是随机整合。在一些实施方案中,构建体在随机插入位点处被整合到哺乳动物细胞基因组中。在一些实施方案中,随机插入位点在预定的基因组位置子集中是随机的。在一些实施方案中,文库构建体在哺乳动物细胞基因组中的插入包括预定的插入位点。
在一些实施方案中,文库构建体(例如,一个或多个与文库构建体相关的单独核酸)被整合到哺乳动物基因组中。在一些实施方案中,单个连续文库构建体被整合到哺乳动物基因组中。在一些实施方案中,不连续文库构建体的一个或多个单独的构建体(例如,包含标识符和病毒包装序列的构建体)游被整合到哺乳动物基因组中。在一些实施方案中,不连续文库构建体的所有单独的构建体被整合到哺乳动物基因组中。
在一些实施方案中,可以通过标准转染或电穿孔方法将外源性核酸(例如,DNA)引入哺乳动物细胞中。在一些实施方案中,引入哺乳动物细胞中的外源性核酸可以以单拷贝数、低拷贝数或高拷贝数整合到基因组中或以单拷贝数、低拷贝数或高拷贝数游离存在于细胞中。在一些实施方案中,引入哺乳动物细胞的外源性核酸可以以可变的拷贝数以基因组形式存在和/或游离存在。本领域已知的选择和/或筛选方法可以用于富集具有整合的构建体(例如,文库构建体)的细胞。
病毒转导介导的整合
在一些实施方案中,文库构建体通过病毒转导介导的整合被整合到哺乳动物基因组中。在一些实施方案中,例如,提供了一种文库构建体,其包含位于标识符和/或有效载荷的侧翼的第一组病毒重复序列,其中第一组病毒重复序列侧翼为包含第二组病毒重复序列的顺式作用整合序列。在一些实施方案中,至少一个反式作用整合序列包含整合病毒载体和/或整合构建体,其中整合病毒载体是慢病毒载体、γ逆转录病毒载体、泡沫逆转录病毒载体、腺相关病毒载体,或其衍生物。
在一些实施方案中,整合病毒载体是慢病毒载体。在一些实施方案中,慢病毒整合载体介导文库构建体或其一部分整合到哺乳动物细胞基因组中。在一些实施方案中,文库构建体包含位于标识符和/或有效载荷侧翼的第一组病毒重复序列(例如,用于包装AAV载体的AAV ITR),其中第一组病毒重复序列侧翼为包含第二组病毒重复序列(例如,用于将文库构建体或其一部分整合到哺乳动物基因组中的慢病毒LTR)的顺式作用整合序列。
下表4中提供了慢病毒转导介导的文库构建体整合的一些示例性设想。表4的每个实施方案都可以在单个连续文库构建体或不连续文库构建体的上下文中。在一些实施方案中,文库构建体是不连续文库构建体并且包含标识符的单独的构建体被整合到基因组中。在一些实施方案中,文库构建体是不连续文库构建体,并且文库构建体的两个或更多个单独的构建体通过慢病毒转导介导的整合被整合到哺乳动物基因组中。在一些实施方案中,不连续文库构建体的所有单独的构建体通过慢病毒转导介导的整合被整合到哺乳动物基因组中。
表4–慢病毒转导介导的整合的示例性设想
核酸酶介导的整合
在一些实施方案中,文库构建体通过核酸酶介导的整合被整合到哺乳动物基因组中。在一些实施方案中,例如,提供了一种文库构建体,其包含位于标识符和/或有效载荷的侧翼的第一组病毒重复序列,其中第一组病毒重复序列侧翼为包含同源臂的顺式作用整合序列。
在一些实施方案中,至少一个反式作用整合序列包含核酸酶和/或其融合物和/或衍生物,其包含Cas9、CasZ、Cpf1、与可编程DNA结合结构域(诸如TALE蛋白(TALEN)或锌指蛋白(ZFN))融合的工程化Fok1核酸酶结构域,和/或大范围核酸酶和/或其衍生物。在一些实施方案中,核酸酶是或包含Cas9。
在一些实施方案中,至少一个反式作用整合序列包含锌指核酸酶。锌指核酸酶(ZFN)是人工限制性酶,其是通过将锌指DNA结合结构域与DNA切割结构域组合生成的。ZFN中最常见的切割结构域是来自IIs型限制性核酸内切酶FokI的非特异性切割结构域,可以使用引导序列靶向所述结构域。使用ZFN的方法描述于例如WO 2009146179 A1、WO2008060510A2和CN 102174576A中,其以引用的方式整体并入。
在一些实施方案中,至少一个反式作用整合序列包含转录激活因子样效应物核酸酶(TALEN)。TALEN是限制性酶,其可以被工程化以切割特定的DNA序列。使用TALEN的方法描述于例如WO 2014134412 A1、WO 2013163628 A2和WO 2014040370 A1中,其以引用的方式整体并入。
在一些实施方案中,至少一个反式作用整合序列包含非RNA引导的核酸酶和/或其融合物和/或衍生物。在一些实施方案中,文库构建体在哺乳动物细胞基因组内的插入是由至少两个反式作用整合序列介导的,其中至少一个反式作用整合序列包含RNA引导的核酸酶和/或其融合物和/或衍生物,并且至少一个反式作用整合序列包含gRNA序列。
在一些实施方案中,文库构建体在哺乳动物细胞基因组中的插入是由至少一个反式作用整合序列介导的,并且其中至少一个反式作用整合序列包含核酸酶(例如,RNA引导的核酸酶或非RNA引导的核酸酶)和/或其融合物和/或衍生物,并且其中文库构建体包含至少一对为同源臂的顺式作用整合序列。在一些实施方案中,文库构建体包含两个病毒包装序列(例如,病毒重复序列)之间的标识符和/或有效载荷,所有这些都位于包含同源臂序列的顺式作用整合序列之间。
在一些实施方案中,文库构建体在哺乳动物细胞基因组中的插入是由至少两个反式作用整合序列介导的,其中至少一个反式作用整合序列包含核酸酶(例如,RNA引导的核酸酶)和/或其融合物和/或衍生物,并且至少一个反式作用整合序列包含gRNA序列。在一些实施方案中,文库构建体包含两个病毒包装序列(例如,病毒重复序列)之间的标识符和/或有效载荷,所有这些都位于包含同源臂序列的顺式作用整合序列之间。
在一些实施方案中,文库构建体通过核酸酶介导的整合(例如,使用CRISPR/Cas9)被整合到哺乳动物细胞的基因组中。在一些实施方案中,文库构建体的整合由细胞内源性的天然DNA修复机制介导。例如,通过将外源性DNA引入细胞,使位点特异性核酸酶产生整合位点,并使供体DNA被整合,整合即可发生。
在一些实施方案中,文库构建体在哺乳动物细胞基因组内的插入是由Cas9介导的。在一些实施方案中,文库构建体包含AAV ITR序列之间的标识符和/或有效载荷,所有这些都位于包含同源臂序列的顺式作用整合序列之间。
下表5中提供了核酸酶介导的文库构建体整合的一些示例性设想。表5的每个实施方案都可以在单个连续文库构建体或不连续文库构建体的上下文中。在一些实施方案中,文库构建体是不连续文库构建体并且包含标识符的单独的构建体被整合到基因组中。在一些实施方案中,文库构建体是不连续文库构建体,并且文库构建体的两个或更多个单独的构建体通过核酸酶介导的整合被整合到哺乳动物基因组中。在一些实施方案中,不连续文库构建体的所有单独的构建体通过核酸酶介导的整合被整合到哺乳动物基因组中。
表5–核酸酶介导的整合的示例性设想
重组酶介导的整合
在一些实施方案中,文库构建体通过重组酶介导的整合被整合到哺乳动物基因组中。在一些实施方案中,例如,提供了一种文库构建体,其包含位于标识符和/或有效载荷的侧翼的第一组病毒重复序列,其中第一组病毒重复序列侧翼为包含重组酶识别位点的顺式作用整合序列。
在一些实施方案中,至少一个反式作用整合序列包含重组酶。在一些实施方案中,重组酶包含Cre、Flp、Dre、PhiC31和/或Bxb1,和/或其衍生物和/或融合物。
在一些实施方案中,反式作用整合序列包含有包含Cre的重组酶。在一些实施方案中,Cre介导文库构建体或其一部分整合到哺乳动物细胞基因组中。在一些实施方案中,文库构建体包含位于标识符和/或有效载荷侧翼的第一组病毒重复序列(例如,用于包装AAV载体的AAV ITR),其中第一组病毒重复序列侧翼为包含LoxP位点的顺式作用整合序列。
在一些实施方案中,反式作用整合序列包含有包含Bxb1的重组酶。在一些实施方案中,Bxb1介导文库构建体或其一部分整合到哺乳动物细胞基因组中。在一些实施方案中,文库构建体包含位于标识符和/或有效载荷侧翼的第一组病毒重复序列(例如,用于包装AAV载体的AAV ITR),其中第一组病毒重复序列侧翼为包含Att位点的顺式作用整合序列。
在一些实施方案中,反式作用整合序列包含有包含Flp的重组酶。在一些实施方案中,Flp介导文库构建体或其一部分整合到哺乳动物细胞基因组中。在一些实施方案中,文库构建体包含位于标识符和/或有效载荷侧翼的第一组病毒重复序列(例如,用于包装AAV载体的AAV ITR),其中第一组病毒重复序列侧翼为包含Frt位点的顺式作用整合序列。
下表6中提供了重组酶介导的文库构建体整合的一些示例性设想。表6的每个实施方案都可以在单个连续文库构建体或不连续文库构建体的上下文中。在一些实施方案中,文库构建体是不连续文库构建体并且包含标识符的单独的构建体被整合到基因组中。在一些实施方案中,文库构建体是不连续文库构建体,并且文库构建体的两个或更多个单独的构建体通过重组酶介导的整合被整合到哺乳动物基因组中。在一些实施方案中,不连续文库构建体的所有单独的构建体通过重组酶介导的整合被整合到哺乳动物基因组中。
表6–重组酶介导的整合的示例性设想
转座酶介导的整合
在一些实施方案中,文库构建体通过转座酶介导的整合被整合到哺乳动物基因组中。在一些实施方案中,例如,提供了一种文库构建体,其包含位于标识符和/或有效载荷的侧翼的第一组病毒重复序列,其中第一组病毒重复序列侧翼为包含转座酶识别位点的顺式作用整合序列。
在一些实施方案中,至少一个反式作用整合序列包含转座酶。在一些实施方案中,转座酶包含睡美人转座酶和/或Piggybac转座酶和/或其衍生物和/或融合物。
在一些实施方案中,反式作用整合序列包含有包含睡美人转座酶的转座酶。在一些实施方案中,睡美人转座酶介导文库构建体或其一部分整合到哺乳动物细胞基因组中。在一些实施方案中,文库构建体包含位于标识符和/或有效载荷的侧翼的第一组病毒重复序列(例如,用于包装AAV载体的AAV ITR),其中第一组病毒重复序列侧翼为包含转座酶识别位点的顺式作用整合序列。
在一些实施方案中,反式作用整合序列包含有包含Piggybac转座酶的转座酶。在一些实施方案中,Piggybac转座酶介导文库构建体或其一部分整合到哺乳动物细胞基因组中。在一些实施方案中,文库构建体包含位于标识符和/或有效载荷的侧翼的第一组病毒重复序列(例如,用于包装AAV载体的AAV ITR),其中第一组病毒重复序列侧翼为包含转座酶识别位点的顺式作用整合序列。
下表7中提供了转座酶介导的文库构建体整合的一些示例性设想。表7的每个实施方案都可以在单个连续文库构建体或不连续文库构建体的上下文中。在一些实施方案中,文库构建体是不连续文库构建体并且包含标识符的单独的构建体被整合到基因组中。在一些实施方案中,文库构建体是不连续文库构建体,并且文库构建体的两个或更多个单独的构建体通过转座酶介导的整合被整合到哺乳动物基因组中。在一些实施方案中,不连续文库构建体的所有单独的构建体通过转座酶介导的整合被整合到哺乳动物基因组中。
表7–转座酶介导的整合的示例性设想
哺乳动物细胞
本公开提供了使用本文所述的方法鉴定和/或产生的哺乳动物细胞。在一些实施方案中,所提供的哺乳动物细胞表达病毒载体。在一些实施方案中,所提供的哺乳动物细胞含有一个或多个产生病毒载体所必需的多核苷酸。
本公开还提供了包含本文所述的任何病毒载体、构建体和/或组合物的哺乳动物细胞。在一些实施方案中,本公开提供了哺乳动物细胞,其包含:(i)标识符,(ii)工程化序列,和(iii)一个或多个产生病毒载体所必需的元件。
在一些实施方案中,所提供的哺乳动物细胞包含:(i)位于病毒包装序列(例如,病毒重复序列,例如,AAV ITR)之间的标识符,(ii)包含扰动和/或扰动附加序列的工程化序列,和(iii)一个或多个产生病毒载体所必需的元件。在一些实施方案中,所提供的哺乳动物细胞包含:(i)文库构建体,和(ii)一个或多个产生病毒载体所必需的元件,其中文库构建体包含位于病毒包装序列(例如,病毒重复序列,例如,AAV ITR)之间的标识符,以及任选的文库变体和/或顺式作用整合序列。
在一些实施方案中,所提供的技术包括一种独特的方法,借此病毒载体获取标识符(例如,在病毒载体基因组中,例如,在病毒重复序列之间)。因此,由文库的哺乳动物细胞表达的病毒载体将各自包含标识符。这使得能够直接表征病毒载体并鉴定产生它的哺乳动物细胞。
在一些实施方案中,哺乳动物细胞产生包含有效载荷和标识符的病毒载体(例如,在病毒载体核酸中)。在一些实施方案中,病毒载体核酸的测序可以鉴定病毒载体池中标识符(例如,条形码和/或文库变体)的丰度。不希望受理论的束缚,标识符的丰度可以将工程化序列与表型变化诸如病毒载体表达的变化联系起来。例如,病毒载体池中的丰富标识符可以鉴定包含可以具有改进的病毒载体产生的文库变体(和所得扰动)(例如,对应于所述标识符)的细胞。
在一些实施方案中,哺乳动物细胞包含:(i)位于两个能够包装到病毒载体中的病毒重复序列之间的标识符,(ii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中哺乳动物细胞产生包含至少一个标识符的病毒载体。在一些实施方案中,标识符包括独特的文库变体(例如,引导序列、ORF等)。在一些实施方案中,标识符包括条形码并且哺乳动物细胞还包含一个或多个文库变体。在一些实施方案中,哺乳动物细胞包含文库构建体和一个或多个产生病毒载体所必需的核酸序列。
在一些实施方案中,所提供的哺乳动物细胞是通过向哺乳动物细胞中引入(i)文库构建体和(ii)一个或多个产生病毒载体所必需的核酸序列而产生的。
在一些实施方案中,本公开提供了哺乳动物细胞,其已被工程化以包含使用本文描述的方法鉴定的扰动。在一些实施方案中,哺乳动物细胞包含使用本公开的方法鉴定的一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个扰动。在一些实施方案中,哺乳动物细胞包含一个或多个扰动(例如,其影响病毒载体产生)和产生病毒载体所必需的核酸序列。在一些实施方案中,哺乳动物细胞(i)包含一个或多个扰动并且(ii)产生递送有效载荷的病毒载体。在一些实施方案中,哺乳动物细胞不包含标识符(例如,标识符已被去除且/或具有鉴定的扰动的哺乳动物细胞已被工程化)。
在一些实施方案中,提供了包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(i)包含位于能够包装到病毒载体中的第一组两个病毒重复序列之间的标识符的文库构建体,和(ii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中文库构建体包含标识符。在一些实施方案中,文库构建体还包含至少一个扰动和/或至少一个文库变体。在一些实施方案中,文库构建体还包含至少一个有效载荷。在一些实施方案中,文库构建体还包含至少一个扰动附加序列。在一些实施方案中,文库构建体还包含至少一个反式作用整合序列和/或至少一个顺式作用整合序列。
可以在本公开的上下文中工程化或筛选本领域已知的任何合适的哺乳动物细胞系。用于表达病毒载体的哺乳动物细胞可以包括本领域已知的任何哺乳动物细胞类型。代表性哺乳动物细胞包括但不限于人胚肾(HEK)细胞(例如,HEK 293细胞、HEK 293T细胞、Expi293细胞)、中国仓鼠卵巢(CHO)细胞、HeLa细胞(例如,HeLa S3细胞)、PER.C6细胞、HKB11细胞、CAP细胞、幼仓鼠肾成纤维细胞(BHK细胞)(例如,BHK-21细胞)、小鼠骨髓瘤细胞(例如,Sp2/0细胞和NS0细胞)、非洲绿猴肾细胞(例如,COS细胞和Vero细胞)、A549细胞、恒河猴胎肺细胞(例如,FRhL-2细胞)及其任何衍生物。在一些实施方案中,哺乳动物细胞可以支持病毒生命周期。在一些实施方案中,本公开的哺乳动物细胞是高度可转染的。
用于病毒生产的哺乳动物细胞是本领域已知的。此类细胞的代表性实例包括但不限于人胚肾(HEK)293细胞及其衍生物(例如,293T株、293SF-3F6株)、HeLa细胞、A549细胞、KB细胞、CKT1细胞、NIH/sT3细胞、Vero细胞、中国仓鼠卵巢(CHO)细胞或支持病毒生命周期的任何真核细胞。
在一些特定实施方案中,用于表达病毒载体的哺乳动物细胞是CHO细胞。CHO细胞具有不同的谱系,包括CHO-K1、CHO-S、CHO-DG44和CHO-DXB11。在一些特定实施方案中,用于表达病毒载体的哺乳动物细胞是HEK 293细胞。在一些特定实施方案中,用于表达病毒载体的哺乳动物细胞是HEK 293T细胞。在一些特定实施方案中,用于表达病毒载体的哺乳动物细胞是HeLa细胞。
在一些实施方案中,本公开的哺乳动物细胞适合于贴壁细胞培养。在一些实施方案中,哺乳动物细胞在贴壁细胞培养基中培养。在一些实施方案中,哺乳动物细胞可以在无血清条件下生长。
在一些实施方案中,本公开的哺乳动物细胞适合于悬浮细胞培养。在一些实施方案中,适合于悬浮细胞培养的哺乳动物细胞是CHO细胞(例如,CHO-K1、CHO-S、CHO-DG44和/或CHO-DXB11细胞)、HEK 293细胞(例如,293SF、3F6、293T)、HeLa细胞及其衍生物。在一些特定实施方案中,哺乳动物细胞可以在无血清条件下悬浮培养。在一些实施方案中,HEK293细胞具有在无血清条件下悬浮生长的能力。
在一些实施方案中,哺乳动物细胞在悬浮细胞培养基中培养。在一些实施方案中,悬浮细胞培养的哺乳动物细胞适合于大量培养(例如,≥1L容量、≥2L容量、≥3L容量、≥4L容量、≥5L容量、≥10L容量、≥20L容量、≥30L容量、≥40L容量、≥50L容量、≥60L容量、≥70L容量、≥80L容量、≥90L容量、≥100L容量、≥200L容量、≥300L容量、≥400L容量,或≥500L容量)。
在一些实施方案中,本公开的哺乳动物细胞系适用于制造生物制剂(例如,病毒载体)。在一些实施方案中,哺乳动物细胞系适用于生物产品的工业规模制造。在一些实施方案中,哺乳动物细胞系适用于符合当地监管标准(例如,FDA和/或EMA监管标准)的制造方法。在一些实施方案中,哺乳动物细胞系适用于使用现行良好生产规范(cGMP)制造生物制剂(例如,病毒载体)。在一些实施方案中,哺乳动物细胞系适用于使用良好生产规范(GMP)制造生物制剂(例如,病毒载体)。在一些实施方案中,哺乳动物细胞系适用于使用非良好生产规范(non-GMP)制造生物制剂(例如,病毒载体)。
扰动
本公开提供了包含一个或多个扰动的哺乳动物细胞、产生的病毒载体、产生病毒载体所必需的多核苷酸和/或其他构建体。这些是从本公开的用于表达和/或产生病毒载体的哺乳动物细胞文库中生成、产生、鉴定和/或选择的。如本文所用,扰动包括哺乳动物细胞、产生的病毒载体、产生病毒载体所必需的多核苷酸和/或其他构建体中的遗传修饰,所述遗传修饰由如本文所述的方法产生和/或鉴定。
在一些实施方案中,扰动是一个或多个文库变体的结果。在一些实施方案中,扰动是遗传修饰,其不是文库变体的结果,而是从如本文所述的方法产生和/或鉴定的遗传修饰。在一些实施方案中,扰动包含在至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸中的遗传修饰。
在一些实施方案中,在哺乳动物细胞和/或病毒载体群中,哺乳动物细胞和/或病毒载体各自单独地包含至少一个包含多个独特扰动的工程化序列。在一些实施方案中,在哺乳动物细胞和/或病毒载体群中,哺乳动物细胞和/或病毒载体各自单独地包含至少一个包含至少两个、三个、四个、五个、六个、七个、八个或九个独特扰动的工程化序列。
在一些实施方案中,扰动包括哺乳动物细胞、产生的病毒载体、产生病毒载体所必需的多核苷酸和/或其他构建体中的工程化序列,所述工程化序列可以包含基因组序列变化(例如,基因组插入、缺失或敲除、取代(例如,SNP)、替换、重排等)、游离序列变化(例如,插入、缺失或敲除、SNP(取代)、替换、重排等)和/或表观遗传修饰(例如,激活、抑制等)。在一些实施方案中,扰动包括病毒载体中的工程化序列。在一些实施方案中,扰动包括在至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸中的工程化序列。在一些实施方案中,由本文所述的哺乳动物细胞和/或方法产生的病毒载体包含扰动。
在一些实施方案中,扰动包括对内源性编码序列的修饰。在一些实施方案中,内源性编码序列包含内源性基因或基因区段。在一些实施方案中,扰动包括对内源性调控元件的修饰,其中调控元件包含至少一个启动子序列和/或至少一个增强子序列。
扰动的类型
在一些实施方案中,扰动包括一个或多个基因组和/或游离修饰。在一些实施方案中,扰动包括一个或多个缺失或敲除、SNP(取代)、替换、插入、重排和/或表观遗传修饰(例如,激活(例如,一个或多个基因的激活)和/或抑制(例如,一个或多个基因的抑制))。
在一些实施方案中,扰动包括基因组或游离缺失或敲除。在一些实施方案中,包括基因组或游离缺失或敲除的扰动由为gRNA缺失或敲除文库的一部分的一个或多个文库变体的表达引起。在一些实施方案中,包括基因组或游离缺失或敲除的扰动不由一个或多个文库变体的表达引起。在一些实施方案中,通过任何合适的方式将文库变体引入哺乳动物细胞。在一些实施方案中,文库变体包含在文库构建体中,所述文库构建体是gRNA缺失或KO文库的一部分。
在一些实施方案中,扰动包括基因组或游离SNP。在一些实施方案中,包括基因组或游离SNP的扰动由为gRNA SNP文库的一部分的一个或多个文库变体的表达引起。在一些实施方案中,包括基因组或游离SNP的扰动不由一个或多个文库变体的表达引起。在一些实施方案中,通过任何合适的方式将文库变体引入哺乳动物细胞。在一些实施方案中,文库变体包含在文库构建体中,所述文库构建体是gRNA SNP文库的一部分。
在一些实施方案中,扰动包括基因组或游离激活(例如,一个或多个基因的激活)。在一些实施方案中,包括基因组或游离激活的扰动由为gRNA激活文库的一部分的一个或多个文库变体的表达引起。在一些实施方案中,包括基因组或游离激活的扰动不由一个或多个文库变体的表达引起。在一些实施方案中,通过任何合适的方式将文库变体引入哺乳动物细胞。在一些实施方案中,文库变体包含在文库构建体中,所述文库构建体是gRNA激活文库的一部分。
在一些实施方案中,扰动包括基因组或游离抑制(例如,一个或多个基因的抑制)。在一些实施方案中,包括基因组或游离抑制的扰动由为gRNA抑制文库的一部分的一个或多个文库变体的表达引起。在一些实施方案中,包括基因组或游离抑制的扰动不由一个或多个文库变体的表达引起。在一些实施方案中,通过任何合适的方式将文库变体引入哺乳动物细胞。在一些实施方案中,文库变体包含在文库构建体中,所述文库构建体是gRNA抑制文库的一部分。
在一些实施方案中,扰动包括基因组或游离插入(例如,一个或多个基因的插入)。在一些实施方案中,包括基因组或游离插入的扰动由为gRNA插入文库的一部分的一个或多个文库变体的表达引起。在一些实施方案中,包括基因组或游离插入的扰动不由一个或多个文库变体的表达引起。在一些实施方案中,通过任何合适的方式将文库变体引入哺乳动物细胞。在一些实施方案中,文库变体包含在文库构建体中,所述文库构建体是插入文库的一部分。
在一些实施方案中,可以使用基因组编辑将包含一个或多个工程化序列的一个或多个扰动引入哺乳动物细胞文库的哺乳动物细胞中。下表8中提供了一些示例性类别的扰动和相关文库设想以及扰动附加序列。
表8–哺乳动物细胞中的示例性扰动
扰动附加序列
在一些实施方案中,所提供的哺乳动物细胞包含扰动附加序列,其有助于与文库构建体组合而产生扰动。例如,在一些实施方案中,哺乳动物细胞包含(i)文库构建体,其包含一个或多个包含gRNA的文库变体,(ii)扰动附加序列,其包含编码RNA引导的核酸酶和/或其衍生物和/或融合物的序列,和/或(iii)核酸酶介导的扰动的其他元件。在一些实施方案中,扰动附加序列包含源自Cas9、CasZ、CpfI和/或Fok1的RNA引导的核酸酶。
在一些实施方案中,扰动附加序列包含RNA引导的核酸酶,其包含Cas9、Cpf1和/或CasZ或其衍生物,包括包含转录调控因子的融合蛋白(例如,Cas9-VPR或Cas9-KRAB-MeCP2融合物)、CRISPR蛋白与核酸酶结构域(例如,Fok1)的融合物、酶碱基编辑器(例如,BE和ABE融合物版本)、逆转录酶融合物(例如,引导编辑器)、CRISPR重组酶(例如,RecCas9)和CRISPR转座酶(例如,Tn7样转座酶系统Cas12k和与TniQ的级联复合物)。
在一些实施方案中,扰动附加元件包括Cpf1核酸内切酶。在一些实施方案中,Cpf1包括公开于Zetsche等人(2015)Cell 163:759-771中的Cpf1多肽的Cpf1同源物和直系同源物以及公开于US 2016/0208243中的Cpf1多肽。其他工程化Cpf1变体是本领域普通技术人员已知的并且包括在当前公开的范围内(参见,例如,WO/2017/184768)。
在一些实施方案中,所提供的哺乳动物细胞是通过向哺乳动物细胞中引入(i)文库构建体和(ii)扰动附加序列,和(iii)一个或多个产生病毒载体所必需的核酸序列而产生的。在一些实施方案中,本公开的表达病毒载体的细胞文库是通过向每个细胞(例如,哺乳动物细胞)中引入:(i)文库构建体,(ii)扰动附加序列,和(iii)一个或多个产生病毒载体所必需的核酸序列而生成的。
在一些实施方案中,所提供的方法包括在哺乳动物细胞中表达扰动附加序列。在一些实施方案中,所提供的方法包括筛选由哺乳动物细胞文库产生的病毒载体,其中文库的每个细胞包含:(i)文库构建体,(ii)扰动附加序列,和(iii)一个或多个产生病毒载体所必需的核酸序列。
例如,哺乳动物细胞可以使用基因组编辑以引入一个或多个工程化序列(例如,文库变体)。
在一些实施方案中,文库变体和扰动附加序列对应于由天然存在的CRISPR系统调整的组分:引导RNA(作为文库变体)和RNA引导的核酸酶(作为扰动附加元件)。在CRISPR/Cas系统中,引导RNA(gRNA)与核酸内切酶(诸如Cas9核酸内切酶)形成复合物。然后,所述复合物被gRNA引导至DNA靶序列,所述DNA靶序列通常位于靶细胞的基因组中。Cas9或Cas9核酸内切酶是指包含Cas9蛋白或其片段的RNA引导的核酸内切酶(例如,包含Cas9的活性或非活性DNA切割结构域或部分非活性DNA切割结构域的蛋白质(例如,Cas9切口酶),和/或Cas9的gRNA结合结构域)。Cas9识别CRISPR重复序列中的短基序(PAM或原型间隔区相邻基序),以帮助区分自身和非自身。Cas9核酸内切酶和引导RNA(例如,单个引导RNA)序列和结构是本领域技术人员熟知的(参见,例如,Ferretti等人,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);Deltcheva等人,Nature 471:602-607(2011);以及Jinek等人,Science 337:816-821(2012))。
筛选的哺乳动物细胞和病毒载体的潜在特征
在一些实施方案中,扰动与病毒载体和/或用于病毒载体的表达和/或产生(例如,独立地和/或合成地)的一种或多种特征(例如,所需特征)相关。在一些实施方案中,单个(一个)扰动与病毒载体和/或用于病毒载体的表达和/或产生的一种或多种特征(例如,所需特征)相关。在一些实施方案中,两个或更多个扰动一起与病毒载体和/或用于病毒载体的表达和/或产生的一种或多种特征(例如,所需特征)相关。
在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如在应用和/或预期应用中以某种方式改变的病毒载体的产生相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如以它们将核酸转移至细胞的方式改变的病毒载体的产生相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如在治疗上改变的病毒载体的产生相关。
在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如以某种方式没有功能性和/或功能性较低的病毒载体的产生相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如以某种方式功能性较高和/或增强的病毒载体的产生相关。
在一些实施方案中,至少一个扰动与改变的(例如,增加的)病毒载体效力或感染细胞的能力相关。在一些实施方案中,至少一个扰动与改变的(例如,增加的)转导宿主细胞的能力相关。
在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如在将核酸转移至细胞方面没有功能性和/或功能性较低的病毒载体的产生相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如在将核酸转移至细胞方面功能性较高和/或增强的病毒载体的产生相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如在治疗上没有功能性和/或功能性较低的病毒载体的产生相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如在治疗上功能性较高和/或增强的病毒载体的产生相关。
在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如改变的病毒载体的表达和/或产生相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与增加的病毒载体的表达和/或产生相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与增加的病毒载体的分泌相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如在当时现行的良好生产规范(cGMP)下改变的(例如,增加的)病毒载体的表达和/或产生相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如在良好生产规范(GMP)下改变的(例如,增加的)病毒载体的表达、产生和/或分泌相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如在非良好生产规范(non-GMP)下改变的(例如,增加的)病毒载体的表达、产生和/或分泌相关。
在一些实施方案中,哺乳动物细胞或哺乳动物细胞群包含至少一个与病毒载体产生增加相关的扰动。在一些实施方案中,与缺乏至少一个扰动的可比较的哺乳动物细胞相比,包含至少一个扰动的哺乳动物细胞在病毒载体产生方面具有至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少12倍、至少15倍、至少20倍、至少25倍或至少50倍的增加。
在一些实施方案中,与缺乏至少一个扰动的可比较的哺乳动物细胞相比,包含至少一个扰动的哺乳动物细胞在病毒载体表达方面具有至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少12倍、至少15倍、至少20倍、至少25倍或至少50倍的增加。
在一些实施方案中,病毒载体包含至少一个与增加的病毒载体的产生和/或表达相关的扰动。在一些实施方案中,哺乳动物细胞以比表达缺乏扰动的病毒载体的可比较的哺乳动物细胞更高的水平表达包含至少一个扰动的病毒载体。在一些实施方案中,包含至少一个扰动的病毒载体以比缺乏扰动的可比较的病毒载体的表达高至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少12倍、至少15倍、至少20倍、至少25倍或至少50倍的水平产生和/或表达。
在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如改变的(例如,增加的)病毒载体的表达和/或产生的持续时间相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如改变的(例如,增加的)哺乳动物细胞的活力相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如改变的(例如,增加的)哺乳动物细胞的稳定性(例如,基因组稳定性)相关。
在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如改变的(例如,增加的)病毒载体的稳定性(例如,基因组稳定性)相关。在一些实施方案中,哺乳动物细胞和/或病毒载体包含至少一个扰动,并且与例如改变的(例如,降低的)产生的空病毒载体的百分比相关。
在一些实施方案中,哺乳动物细胞和/或病毒载体需要一个或多个或两个或更多个扰动来产生任何上述关联、效应或表型。例如,在一些实施方案中,具有一个或多个或两个或更多个扰动的哺乳动物细胞和/或病毒载体具有改变的病毒载体产生水平(例如,增加的或减少的)。在一些实施方案中,哺乳动物细胞和/或病毒载体需要两个或更多个扰动,所述扰动在哺乳动物细胞和/或病毒载体中以合成方式相互作用以产生任何上述关联、效应或表型。例如,在一些实施方案中,两个或更多个扰动在哺乳动物细胞和/或病毒载体中以合成方式相互作用以导致病毒载体产生水平改变(例如,增加或减少)。
在一些实施方案中,任何上述关联、效应或表型相对于参考群进行比较,其中参考群是不包含至少一个扰动的可比较的或标准的哺乳动物细胞群和/或病毒载体群。
细胞工程化平台方法
本公开提供了针对病毒载体表达和/或产生的特征和/或其他特征工程化和/或筛选哺乳动物细胞文库的方法。
在一些实施方案中,本公开提供了从哺乳动物细胞文库产生和/或制造病毒载体的方法,其中文库的每个哺乳动物细胞单独地包含一个或多个工程化序列,所述一个或多个工程化序列包含(i)标识符和(ii)至少一个表达形成病毒载体所必需的一个或多个元件的核酸序列,并且其中表达的每个病毒载体都包含标识符。
在一些实施方案中,本公开提供了筛选哺乳动物细胞文库的方法,其中文库的每个哺乳动物细胞单独地包含一个或多个工程化序列,所述一个或多个工程化序列包含(i)标识符和(ii)至少一个表达形成病毒载体所必需的一个或多个元件的核酸序列,并且其中表达的每个病毒载体都包含标识符。在一些实施方案中,所述方法包括检测病毒载体中的标识符的步骤(例如,通过下一代测序和/或单细胞测序)。
在一些实施方案中,本公开提供了从哺乳动物细胞文库产生AAV载体的方法,其中文库的每个哺乳动物细胞单独地包含一个或多个工程化序列,所述一个或多个工程化序列包含(i)标识符和(ii)至少一个表达形成AAV载体所必需的一个或多个元件的核酸序列,并且其中表达的每个AAV载体都包含标识符。在一些实施方案中,至少一个工程化序列包含文库变体。在一些实施方案中,至少一个工程化序列包含文库变体和条形码。在一些实施方案中,标识符包含条形码。在一些实施方案中,文库变体在哺乳动物细胞和/或病毒载体中产生至少一个扰动(例如,改变AAV载体产生的一个方面的扰动)。
在一些实施方案中,本公开提供了筛选哺乳动物细胞文库与AAV载体产生相关的特征的方法,其中文库的每个哺乳动物细胞单独地包含一个或多个工程化序列,所述一个或多个工程化序列包含(i)标识符和(ii)至少一个表达形成AAV载体所必需的一个或多个元件的核酸序列,并且其中表达的每个AAV载体都包含标识符。在一些实施方案中,所述方法包括检测AAV载体中的标识符的步骤(例如,通过下一代测序)。在一些实施方案中,特定标识符的相对丰度是相对于AAV载体池中的所有标识符确定的。
在一些实施方案中,至少一个工程化序列还包含有效载荷、报告基因、选择标记、扰动附加序列、反式作用整合序列和/或顺式作用整合序列。
在一些实施方案中,本公开提供了包括以下的方法:(i)表达和/或产生病毒载体的哺乳动物细胞文库,其中文库的每个哺乳动物细胞包含(a)文库构建体,其包含位于病毒包装序列之间的标识符,和(b)一个或多个产生病毒载体所必需的多核苷酸;(ii)培养文库的哺乳动物细胞以产生包含标识符的病毒载体,以及(iii)检测病毒载体池中的标识符。
在一些实施方案中,本公开提供了包括以下的方法:(i)表达和/或产生AAV载体的哺乳动物细胞文库,其中文库的每个哺乳动物细胞包含(a)文库构建体,其包含位于AAVITR序列之间的标识符,和(b)一个或多个产生AAV载体所必需的多核苷酸;(ii)培养文库的哺乳动物细胞以产生包含标识符的AAV载体,以及(iii)检测AAV载体池中的标识符。
图2提供了使用用于表达具有标识符的AAV病毒载体的示例性单个连续文库构建体来工程化表达和/或产生病毒载体的哺乳动物细胞文库的示例性平台方法的示意图。哺乳动物细胞被工程化以包含(i)单个连续文库构建体和(ii)具有AAV表达所必需的序列(例如,辅助基因和rep/cap)的AAV构建体,描绘为图2,步骤C。示例性示意图利用整合病毒载体(例如,AAV-in-lenti整合慢病毒载体)以将单个文库构建体整合到文库的哺乳动物细胞中。
在一些实施方案中,生成包含文库构建体的慢病毒载体。为了生成包含文库构建体的慢病毒载体,哺乳动物细胞的第一子集被工程化以包含慢病毒表达所必需的序列(例如,包膜和gag)和包含侧翼为病毒包装序列(例如,AAV ITR)的标识符(例如,独特的文库变体(例如,gRNA)和/或条形码)的文库构建体,所有病毒包装序列的侧翼为顺式作用整合序列(例如,慢病毒LTR)。在一些实施方案中,文库构建体还可以包含有效载荷。
在一些实施方案中,AAV-in-lenti整合慢病毒载体文库可以用于生成哺乳动物细胞文库,其中使用哺乳动物细胞的第二子集,文库构建体以低拷贝数(例如,以大约单个拷贝,例如一个拷贝,或不超过两个拷贝,或不超过三个拷贝,或不超过四个拷贝)被整合到哺乳动物细胞基因组中。在一些实施方案中,文库构建体(例如,用于产生AAV的哺乳动物细胞文库)可以通过其他方式(例如,核酸酶介导的整合、重组酶介导的整合、转座酶介导的整合等)被整合到哺乳动物细胞中或在哺乳动物细胞中游离表达。在各种实施方案中,哺乳动物细胞文库的哺乳动物细胞应包含一致且低拷贝数的文库构建体(例如,单个拷贝)。图2,步骤D描绘了来自所得哺乳动物细胞文库的AAV载体的表达,其可以根据本文提供的方法进行筛选。
图3提供了使用用于表达和/或产生具有标识符的AAV病毒载体的示例性不连续文库构建体来工程化表达和/或产生病毒载体的哺乳动物细胞文库的示例性平台方法的示意图。在一些实施方案中,不连续文库构建体被提供为一起构成文库构建体的一系列构建体。在一些实施方案中,不连续文库构建体包括包含标识符(例如,条形码)的AAV-in-lenti构建体和一个或多个其他构建体,所述一个或多个其他构建体包含一个或多个文库变体,如图3,步骤A所描绘。在一些实施方案中,这些其他构建体中的每一个也含有一个或多个条形码。在一些实施方案中,文库构建体包含用于通过其他方式(例如,核酸酶介导的整合的同源臂、重组酶介导的整合的重组位点、转座酶介导的整合的转座酶位点等)进行基因组整合的顺式作用整合序列或者可以用于哺乳动物细胞中的游离表达。
用构成文库构建体的各种AAV-in-lenti整合慢病毒载体文库转导哺乳动物细胞的第一子集,如图3,步骤B所描绘。例如,可以用包含标识符(例如,条形码)的AAV-in-lenti构建体转导细胞,其中标识符的侧翼为ITR序列,ITR序列的侧翼为LTR序列。在一些实施方案中,包含标识符(例如,条形码)的AAV-in-lenti整合慢病毒载体在一定条件下被转导到哺乳动物细胞的第二子集中以获得每个细胞具有大约单个拷贝(一个)的文库构建体的哺乳动物细胞。在一些实施方案中,包含文库变体的单独的文库构建体以高拷贝剂量或多轮单拷贝剂量(例如,使用整合慢病毒载体)被引入和/或整合到哺乳动物细胞中,以生成多文库变体(例如,gRNA)扰动的哺乳动物细胞文库群。在一些实施方案中,哺乳动物细胞文库的每个细胞包含每个细胞单个侧翼为ITR的条形码,以及每个细胞多于一个的文库变体(例如,gRNA)。
哺乳动物细胞被工程化以包含AAV表达所必需的序列(例如,辅助基因和rep/cap),描绘为图3,步骤C。在采用不连续文库构建体的方法中,对文库的哺乳动物细胞的至少一部分和/或AAV载体的至少一部分进行测序。图3,步骤D描绘了哺乳动物细胞的单细胞测序,并且图3,步骤E描绘了AAV载体中标识符的测序。值得注意的是,这些测序步骤可以以任何顺序进行。例如,在一些实施方案中,可以首先对AAV载体进行测序以确定与哺乳动物细胞和/或病毒载体的所需特征相关的标识符(例如,用于病毒载体产生),然后可以通过单细胞测序对细胞进行测序以将特定标识符(例如,先前鉴定的标识符)与其潜在的致病(causative)文库变体相关联。在一些实施方案中,只有那些与选定的标识符相关的哺乳动物细胞可以通过单细胞测序进行测序。在一些实施方案中,AAV载体的测序和哺乳动物细胞的单细胞测序基本上同时进行。
本领域技术人员将认识到,虽然图2和图3中的示意图描绘了筛选哺乳动物细胞文库的病毒载体表达和/或产生的特征,但步骤的顺序可以适当调整。
在一些实施方案中,由第一哺乳动物细胞文库生成的病毒载体池用于转导哺乳动物细胞以生成包含文库变体的第二哺乳动物细胞文库。在一些实施方案中,第一哺乳动物细胞文库包含整合的文库构建体。在一些实施方案中,第一哺乳动物细胞文库包含游离文库构建体。在一些实施方案中,第二哺乳动物细胞文库包含整合的文库构建体。在一些实施方案中,第二哺乳动物细胞文库包含游离文库构建体。
在一些实施方案中,病毒载体是从第一哺乳动物细胞文库中收获和/或合并的。在一些实施方案中,病毒载体是AAV病毒载体并且第一哺乳动物细胞文库是使用AAV-in-Lenti文库、AAV-in-Transposase文库或游离AAV文库生成的。在一些实施方案中,从第一哺乳动物细胞文库收获和/或合并的病毒载体用于转染哺乳动物细胞并生成第二哺乳动物细胞文库。在一些实施方案中,第二哺乳动物细胞文库以游离形式表达文库变体。在一些实施方案中,由第一哺乳动物细胞文库生成的AAV载体池用于转导哺乳动物细胞以生成以游离形式包含标识符的第二哺乳动物细胞文库。
病毒载体的收获和合并
使用本领域已知的任何适当的方法培养表达病毒载体的哺乳动物细胞文库,并收获产生的病毒载体。
可以通过分批培养、分批补料培养或连续培养来培养表达病毒载体的哺乳动物细胞。表达病毒载体的哺乳动物细胞可以悬浮培养或附着于摇瓶、发酵罐或生物反应器中的固体载剂。培养后,可以收获哺乳动物细胞和/或上清液,并且可以使用本领域已知的方法从适当的级分中分离并纯化核酸。
在一些实施方案中,病毒载体是从哺乳动物细胞文库中收获的。在一些实施方案中,在哺乳动物细胞表达足够的时间后收获病毒载体,这可以根据哺乳动物细胞类型和培养条件而变化。
在一些实施方案中,收获由表达病毒载体的哺乳动物细胞文库的哺乳动物细胞产生的总病毒载体。在一些实施方案中,对应于时间间隔收获表达病毒载体的细胞文库的哺乳动物细胞产生的病毒载体。例如,可以每天、每两天、每3天或间隔更长的时间收获病毒载体,以评估随时间变化的病毒载体产生。
在一些实施方案中,当哺乳动物细胞达到特定范围内的细胞密度时收获病毒载体。在一些实施方案中,病毒载体在特定时间后收获。在一些实施方案中,病毒载体在病毒转染后的12小时和2周之间收获。在一些实施方案中,病毒载体在病毒转染后的24和144小时之间收获。在一些实施方案中,病毒载体是从细胞培养基中收获的。在一些实施方案中,哺乳动物细胞在收获病毒载体的过程中被裂解。在一些实施方案中,当哺乳动物细胞产生至少阈值水平的病毒载体(例如,在纯化之前每个哺乳动物细胞平均至少约1x 103个病毒载体)时收获病毒载体。
在一些实施方案中,可以在长时间后洗涤哺乳动物细胞并收获病毒载体(例如,以评估病毒载体的持续产生)。在一些实施方案中,分离来自病毒载体(例如,其包含标识符)的病毒载体核酸。
在一些实施方案中,哺乳动物细胞在收获前被合并。在一些实施方案中,病毒载体在病毒载体核酸(例如,DNA和/或RNA)测序之前合并。
病毒载体测序
在一些实施方案中,所提供的方法和技术包括病毒载体核酸的测序。在一些实施方案中,病毒载体核酸在测序前量化。在一些实施方案中,病毒载体核酸在测序前不量化。可以使用本领域的任何合适的测序方法。
在一些实施方案中,确定纯化后的病毒载体滴度。在一些实施方案中,使用定量PCR确定滴度。在某些实施方案中,使用对构建体具有特异性的TaqMan探针来确定构建体水平。在各种实施方案中,所提供的方法和技术包括扩增步骤,其中病毒载体核酸物质(或其一部分,例如,标识符)被扩增。虽然任何适用于应用的扩增反应都被认为与一些实施方案相容,但作为具体实例,在一些实施方案中,扩增步骤可以是或包括聚合酶链式反应(PCR)、滚环扩增(RCA)、多重置换扩增(MDA)、等温扩增及其任何组合。
在一些实施方案中,待在本方法的上下文中使用的测序包括下一代测序。有许多使用不同的测序技术的不同的NGS平台。通常,NGS平台对数百万个DNA小片段进行并行测序。在一些实施方案中,NGS是或包括Solexa测序,其同时鉴定DNA碱基,因为每个碱基发射独特的荧光信号,并将它们添加到核酸链中。在一些实施方案中,NGS是或包括454测序,其在核苷酸通过聚合酶并入新的DNA链后再次使用荧光检测焦磷酸盐释放。在一些实施方案中,NGS是或包括离子流(ion torrent):质子/PGM测序,其测量来自单独的碱基通过DNA聚合酶并入的H+(质子)的直接释放。
可以分析病毒载体核酸池中标识符的丰度。标识符序列可以用于选择促进所需病毒载体特征(例如,高产量)的哺乳动物细胞。例如,与参考细胞相比,增加的病毒载体产生可以是固定时间段内病毒载体数量的增加或延长的时间量的产生。在一些实施方案中,可以分析在不同连接点处的病毒载体池样品(例如,以评估在之后时间点产生病毒载体的哺乳动物细胞系)。使用病毒载体中的标识符,可以鉴定对应的哺乳动物细胞并确定所述细胞中的工程化序列(例如,文库变体)。例如,这可以通过文库变体与标识符的直接和预先确定的关联来完成(例如,在具有连续文库构建体的情况下),或者通过单细胞测序的其他步骤,然后将标识符与潜在的致病文库变体相关联来完成(例如,在具有不连续文库构建体的情况下)。
单细胞测序
在一些实施方案中,本公开的方法包括单细胞测序的步骤。在一些实施方案中,其中哺乳动物细胞包含文库构建体(例如,不连续文库构建体),所提供的方法包括单细胞测序步骤(例如,以鉴定哺乳动物细胞中未包装到病毒载体中的一个或多个工程化序列)。在一些实施方案中,应当理解单细胞测序步骤也可以用于使用连续文库构建体的情况。
在一些实施方案中,其中文库构建体包含多个不连续构建体,所提供的方法包括单细胞测序步骤。在一些实施方案中,待通过单细胞测序进行测序的核酸(例如,构建体的)在哺乳动物细胞中表达为RNA。在一些实施方案中,所提供的包括单细胞测序的方法包括用细胞身份序列标记一个或多个表达的序列(例如,RNA,例如,mRNA)的步骤。在一些实施方案中,所有表达的序列(例如,RNA,例如,mRNA)都用细胞身份序列标记。在一些实施方案中,文库的哺乳动物细胞将表达包含存在于细胞中的任何标识符和/或文库变体的poly-A尾mRNA。
在一些实施方案中,用细胞身份序列标记一个或多个文库变体。在一些实施方案中,用细胞身份序列标记所有文库变体。在一些实施方案中,用细胞身份序列标记所有文库变体和所有标识符。在一些实施方案中,哺乳动物细胞文库的每个哺乳动物细胞或细胞系包含独特的细胞身份序列。因此,细胞身份序列使来自包含在连续或不连续文库构建体(将包含已测序的核酸)上的构建体的核酸与其来源的单独的哺乳动物细胞或细胞系相关联。
本公开还涵盖以下认识:在单细胞测序方法过程中,在表达的RNA转化为cDNA的逆转录过程中,特异性附加单细胞身份序列。应当理解,旨在用于单细胞测序的构建体或核酸应包含在表达的RNA中,使得在逆转录步骤过程中可以使用适当的引物用细胞身份序列对所有转录物进行单细胞标记。
在一些实施方案中,所提供的方法包括哺乳动物细胞文库的哺乳动物细胞的单细胞测序步骤和病毒载体测序步骤(例如,使用下一代测序)。本公开涵盖以下认识:通过对病毒载体和哺乳动物细胞进行测序,可以确定哺乳动物细胞中病毒载体丰度和任何文库变体之间的关联。
在一些实施方案中,所提供的方法包括病毒载体测序步骤(例如,使用下一代测序),然后是单细胞测序步骤。在一些实施方案中,对基于病毒载体测序选择的那些哺乳动物细胞系进行哺乳动物细胞文库的哺乳动物细胞的单细胞测序。
在一些实施方案中,哺乳动物细胞文库的哺乳动物细胞的单细胞测序与病毒载体测序(例如,使用下一代测序)同时进行。在一些实施方案中,在病毒载体测序之前进行哺乳动物细胞文库的哺乳动物细胞的单细胞测序。
分析
在一些实施方案中,本公开涵盖以下认识:病毒池中特定标识符的丰度可以用于鉴定具有改进的特征(例如,病毒载体特征或病毒载体产生特征(例如,高表达和/或产生))的哺乳动物细胞(在文库中的细胞中)。可以确定哺乳动物细胞中对应的工程化序列(例如,文库变体)。例如,这可以通过文库变体与经测序的标识符的直接和预先确定的关联来完成(例如,在具有连续文库构建体的情况下),或者通过单细胞测序的其他步骤,然后将标识符与潜在的致病文库变体相关联来完成(例如,在具有不连续文库构建体的情况下)。
在一些实施方案中,所提供的方法和技术包括在病毒载体测序之前进行选择或筛选的步骤。例如,可以针对病毒载体的功能性特征选择或筛选由哺乳动物细胞文库产生的病毒载体,所述特征诸如像病毒载体稳定性、病毒载体效力、病毒载体感染细胞的能力、病毒载体结合(例如,与受体结合)、病毒载体转移核酸的能力等。在一些实施方案中,将此类选定的病毒载体合并并对其进行测序。使用此类方法,可以鉴定具有多种有益特征的哺乳动物细胞和/或扰动。例如,产生高水平的病毒载体且稳定的细胞系。
在一些实施方案中,所提供的方法和技术包括在病毒载体测序后进行选择或筛选步骤。例如,选择或筛选的候选病毒载体或鉴定的扰动(例如,遗传变化)可以用于提供病毒载体文库构建的信息,所述病毒载体文库可以针对各种特征进行分析。例如,可以针对它们转导哺乳动物细胞的能力来选择或筛选此类病毒载体文库。
选择的哺乳动物细胞候选者可以用于产生病毒载体,或鉴定的扰动(例如,遗传变化)可以用于提供新哺乳动物细胞文库构建的信息。基于文库的平台方法(描绘于图1,图A至F)可以被重复直到鉴定出表达具有所需特征和/或所需数量的病毒载体的工程化哺乳动物细胞。可以分析与所需特征相关的工程化序列,例如,使用机器学习(ML)方法来开发机器学习模型。经过训练的机器学习模型可以用于为未来的设计提供信息,并减少要筛选的哺乳动物细胞文库的数量,从而减少时间和成本。在一些实施方案中,可以设计哺乳动物细胞文库且/或可以执行所述方法以鉴定在哺乳动物细胞中协同相互作用(例如,两个或更多个工程化序列组合)以具有所需特征(例如,一定水平的病毒载体产生)的工程化序列。在一些实施方案中,获得自本文所述的平台技术的所得哺乳动物细胞将具有一个、两个、三个、四个、五个或更多个工程化序列(例如,文库变体和/或扰动),使得生成具有所需病毒载体产生特性(例如,一定水平的产生、所需持续时间的产生等)的哺乳动物细胞。
在一些实施方案中,机器学习模型被训练以生成预测,所述预测指示在哺乳动物细胞和/或病毒载体中具有一个或多个其他扰动的工程化序列(例如,扰动)是否可能具有协同作用和/或进一步改进的病毒载体特征。
在各种实施方案中,机器学习模型是回归模型(例如,线性回归、逻辑回归或多项式回归)、决策树、随机森林、支持向量机、朴素贝叶斯模型、k-均值聚类或神经网络(例如,前馈网络、卷积神经网络(CNN)或深度神经网络(DNN))中的任何一种。可以使用机器学习实现方法来训练机器学习模型,所述方法诸如线性回归算法、逻辑回归算法、决策树算法、支持向量机分类、朴素贝叶斯分类、K-最近邻分类、随机森林算法、深度学习算法、梯度提升算法和降维技术中的任何一种。在各种实施方案中,使用监督学习算法、非监督学习算法、半监督学习算法(例如,部分监督)、弱监督、转移、多任务学习或其任何组合来训练机器学习模型。在各种实施方案中,机器学习模型包括在机器学习模型的训练过程中调整的参数。例如,调整参数以最小化损失函数,从而提高机器学习模型的预测能力。
通常,训练机器学习模型以区分导致病毒载体表达变化的一个或多个编辑。例如,训练机器学习模型以识别训练实例中有助于增加或减少病毒载体表达的模式。作为一个具体实例,训练机器学习模型以鉴定特定基因组位置,如果编辑所述位置,可能会导致哺乳动物细胞增加和/或延长病毒载体产生。作为另一个具体实例,可以训练机器学习模型以鉴定特定基因组位置,如果编辑所述位置,会产生具有增加和/或延长的病毒载体产生的哺乳动物细胞。
在各种实施方案中,使用机器学习模型输出的预测分数对鉴定的编辑进行归类。作为一个实例,被分配了高于阈值的分数的鉴定的编辑被归类为用于进一步测试的候选编辑。在各种实施方案中,阈值分数是0.5、0.6、0.7、0.75、0.8、0.85、0.90、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98或0.99。不满足阈值分数标准的鉴定的编辑被归类为非候选编辑。
总而言之,机器学习模型的应用使可以快速筛选出的编辑的进行于电脑中的预测和归类成为可能。因此,在基因组设计中仅使用候选编辑进行进一步测试,而将非候选编辑从进一步考虑中去除。这消除了非常耗时且成本高昂的体外测试所有编辑组合的需要。
应用
本公开尤其提供了用于表达病毒载体的哺乳动物细胞、用于生成哺乳动物细胞的构建体和使用本文所述的方法生成的病毒载体。病毒载体和相关的哺乳动物细胞可以用于许多应用,包括但不限于疫苗、癌症治疗(例如,溶瘤治疗)、基因治疗和/或细胞治疗(例如,CAR-T)。病毒载体和哺乳动物细胞可以用于生成生物制剂和/或治疗的研究和制造过程,或用作生物制剂本身。
例如,在一些实施方案中,病毒载体可以以多种方式使用,包括但不限于疫苗、癌症治疗(例如,溶瘤治疗)和/或基因治疗(例如,体内基因和/或基因组编辑)。作为另一个实例,在一些实施方案中,病毒载体可以以多种方式使用,包括但不限于研究、生产和/或制造:疫苗、癌症治疗(例如,溶瘤治疗)、基因治疗(例如,离体基因和/或基因组编辑)和/或细胞治疗(例如,离体基因和/或基因组编辑)。因此,有大量病毒载体可用于这些不同的应用。
在一些实施方案中,提供了包含如本文所述的文库构建体、病毒载体和/或哺乳动物细胞的组合物。在一些实施方案中,提供了本文所述的方法产生哺乳动物细胞的用途。在一些实施方案中,提供了本文所述的方法产生病毒载体(例如,AAV载体)的用途。在一些实施方案中,提供了本文所述的方法产生文库构建体的用途。
在一些实施方案中,提供了本文所述的文库构建体、病毒载体和/或方法产生工程化哺乳动物细胞的用途。在一些实施方案中,提供了一种制造表达病毒载体的哺乳动物细胞的方法,所述方法包括引入一个或多个使用本文所述的筛选方法鉴定的扰动。
本公开还提供了用使用本文所述的病毒载体和/或哺乳动物细胞的组合物(例如,药物组合物)治疗受试者的方法。
哺乳动物细胞和病毒载体的示例性应用
本公开的哺乳动物细胞可以用于许多应用,包括但不限于疫苗、癌症治疗(例如,溶瘤治疗)、基因治疗和/或细胞治疗(例如,CAR-T)。哺乳动物细胞可以用于生成生物制剂和/或治疗的研究和制造过程,或用作生物制剂。例如,在一些实施方案中,哺乳动物细胞可以用于产生病毒载体,所述病毒载体可以直接用作生物制剂和/或治疗,包括但不限于:疫苗、癌症治疗(例如,溶瘤治疗)和/或基因治疗(例如,体内基因和/或基因组编辑)。作为另一个实例,在一些实施方案中,哺乳动物细胞可以用于产生病毒载体,所述病毒载体可以用于研究、生产和/或制造生物制剂和/或治疗,包括但不限于:疫苗、癌症治疗(例如,溶瘤治疗)、基因治疗(例如,离体基因和/或基因组编辑)和/或细胞治疗(例如,离体基因和/或基因组编辑)。
在一些实施方案中,本公开的哺乳动物细胞产生所需水平的病毒载体。在一些实施方案中,本公开的哺乳动物细胞包含一个或多个影响病毒载体产生的扰动。
在一些实施方案中,提供了一种制造病毒载体的方法,其包括培养本文所述的哺乳动物细胞。在一些实施方案中,提供了一种制造靶水平的病毒载体的方法,其包括培养本文所述的哺乳动物细胞。在一些实施方案中,提供了哺乳动物细胞产生高于阈值水平的水平的病毒载体(例如,AAV载体)的用途。在一些实施方案中,用于产生病毒载体的哺乳动物细胞包含一个多个扰动并且以比缺乏一个或多个扰动的对应哺乳动物细胞更高的水平产生病毒载体。
在一些实施方案中,提供了用于在哺乳动物细胞中产生病毒载体的方法,然后所述病毒载体可以用于生成细胞治疗。在一些实施方案中,产生的病毒载体具有编码用于生成CAR-T细胞的嵌合抗原受体的有效载荷,其中生成的CAR-T细胞可以施用于受试者。
在一些实施方案中,本公开提供了一种制造和/或生产疫苗的方法,所述方法包括培养本公开的哺乳动物细胞,其中病毒载体包含有包含疫苗组分的有效载荷。在一些实施方案中,提供了一种制造和/或生产基于AAV的疫苗的方法。
在一些实施方案中,本公开提供了一种制造和/或生产溶瘤病毒载体的方法,所述方法包括培养本公开的哺乳动物细胞,其中病毒载体是溶瘤病毒载体。
在一些实施方案中,提供了用于在哺乳动物细胞中产生病毒载体的方法,所述病毒载体可以作为基因治疗。在一些实施方案中,产生的病毒载体具有允许体内基因治疗的有效载荷,其中生成的病毒载体可以施用于受试者。
在一些实施方案中,提供了用于在哺乳动物细胞中产生病毒载体的方法,然后所述病毒载体可以用于离体基因治疗。在一些实施方案中,产生的病毒载体具有允许离体基因治疗的有效载荷,其中生成的病毒载体可以用于生成治疗细胞,其然后可以施用于受试者。
某些示例性实施方案
基于引导RNA的病毒载体产生筛选的示例性方法
在一些实施方案中,所提供的技术采用哺乳动物细胞文库,所述哺乳动物细胞文库已使用引导RNA导向核酸酶介导的编辑进行遗传工程化(例如,以诱导扰动)。在一些实施方案中,每个哺乳动物细胞通过表达RNA引导的核酸内切酶和对靶序列具有特异性的引导RNA分子而具有至少一个靶向基因组修饰(即,为文库变体的工程化序列)。在一些实施方案中,靶向基因组修饰是或包括基因的失活、基因的缺失、基因的修饰、基因的插入和/或全部或部分基因的取代。在一些实施方案中,标识符是引导序列(例如,引导RNA序列或编码引导序列的引导DNA序列)。因此,引导RNA指导核酸酶介导的编辑可以用于哺乳动物细胞以同时工程化核酸序列和提供标识符(例如,引导序列)。在一些实施方案中,用包含至少一个构建体的文库构建体转化哺乳动物细胞,所述至少一个构建体包含为引导序列的标识符,其中标识符位于用于将标识符包装到病毒载体中的序列(例如,病毒重复序列,例如,用于表达AAV载体的AAV ITR)之间。
在一些实施方案中,哺乳动物细胞包含至少一个已经通过引导RNA指导核酸酶介导的编辑(例如,扰动)编辑的序列。在一些实施方案中,哺乳动物细胞包含至少一个已经通过引导RNA指导核酸酶介导的编辑编辑的序列和一个或多个其他工程化序列(例如,通过核酸酶介导的编辑和/或其他方法)。在一些实施方案中,文库中的哺乳动物细胞包含至少两个或更多个工程化序列(例如,两个或更多个扰动)。
在一些实施方案中,一种方法,其包括用包含病毒载体(例如,AAV载体,描述为包含辅助基因、Tx基因、Rep Cap的遗传元件)表达序列的构建体转染文库的哺乳动物细胞,从而生成产生病毒载体的哺乳动物细胞文库。在一些实施方案中,引导RNA指导核酸酶介导的编辑在构建体转染之前进行。在一些实施方案中,引导RNA指导核酸酶介导的编辑与构建体转染大约同时进行,意味着引导RNA介导的编辑组分和病毒载体组分同时转染到哺乳动物文库中。
在一些实施方案中,引导RNA指导核酸酶介导的编辑与构建体转染基本上同时进行。在一些实施方案中,引导RNA指导核酸酶介导的编辑在已经具有用于表达病毒载体的遗传元件的哺乳动物细胞上进行(例如,在用表达病毒载体的序列转染哺乳动物细胞之后)。在一些实施方案中,引导RNA指导核酸酶介导的编辑在已经被工程化以表达病毒载体(例如,AAV载体)的哺乳动物细胞上进行。在一些实施方案中,一种或多种用于表达病毒载体的元件被整合到哺乳动物细胞基因组中。在一些实施方案中,一种或多种用于表达病毒载体的元件存在于哺乳动物细胞的染色体外。
无论步骤顺序如何,本领域技术人员都可以生成哺乳动物细胞文库,其中每个细胞或细胞系包含一个或多个工程化序列和至少一个标识符(例如,包含引导序列的文库变体),以及足以表达病毒载体的遗传元件。因此,提供了产生病毒载体的哺乳动物细胞文库,其中每个细胞包含(i)至少一个文库变体(例如,工程化序列),(i)至少一个标识符(例如,包含引导序列),和(iii)足以表达关注的病毒载体的病毒元件。
在一些实施方案中,所提供的技术包括一种独特的方法,借此病毒载体将引导序列获取入病毒载体基因组中(例如,在病毒重复序列之间)。这使直接表征病毒载体并鉴定相关工程化序列(例如,文库变体)成为可能。在一些实施方案中,文库变体可以用作哺乳动物细胞的标识符(其可以含有其他突变,所述突变可以例如通过测序鉴定)。
在一些特定的实施方案中,所提供的哺乳动物细胞用一个或多个编码病毒载体的构建体转染,例如一个、两个、三个或更多个质粒(例如,rep/cap、辅助质粒、tx质粒)被转染到细胞中。在一些实施方案中,1个或多个病毒载体序列被整合到基因组中。在一些实施方案中,1个或多个病毒载体序列是游离的。在一些实施方案中,病毒载体包含有效载荷(例如,其包含引导序列和核酸酶序列)(在这种情况下,基因组工程化(例如,引入工程化序列)、引入鉴定序列和构建体转染步骤都可以同时发生)。
在一些实施方案中,将文库中的哺乳动物细胞用包含有效载荷序列的tx质粒转染。在一些实施方案中,表达病毒的哺乳动物细胞产生至少携带有效载荷和引导RNA的AAV。
在一些实施方案中,文库中的哺乳动物细胞用包含至少两个引导RNA和编码的Cas9的tx质粒转染,其中第一gRNA结合患者的基因组,并且第二引导RNA结合哺乳动物细胞群(并充当标识符)。在一些实施方案中,表达病毒的哺乳动物细胞产生至少携带核酸酶、第一引导RNA、第二引导RNA的AAV。
使用本领域已知的任何适当的方法培养表达病毒载体的细胞文库并收获病毒载体。在一些实施方案中,分离病毒基因组DNA(例如,其包含引导序列)并且对病毒核酸(例如,DNA)进行测序(例如,使用下一代测序)。可以确定标识符(例如,引导序列)的相对丰度(例如,相对于其他引导序列),并且这与那些特定病毒载体的丰度相关联。在一些特定的实施方案中,本文描述了文库中的哺乳动物细胞。
基于条形码的病毒产生筛选的示例性方法
在一些实施方案中,所提供的技术采用哺乳动物细胞文库,所述哺乳动物细胞文库已被遗传工程化以包含条形码序列和一个或多个工程化序列(包括突变、插入、缺失、替换、取代、重排等)。在一些实施方案中,所提供的方法包括生成和/或获得哺乳动物细胞文库,其中每个细胞具有条形码序列和一个或多个工程化序列(例如,包括一个或多个关注的突变)。
在一些实施方案中,条形码序列在引入工程化序列之前被引入哺乳动物细胞(例如,通过靶向或通过随机诱变和/或编辑)。在一些实施方案中,条形码序列与工程化序列基本上同时被引入哺乳动物细胞。在一些实施方案中,条形码序列在引入工程化序列后被引入哺乳动物细胞。
然后转染哺乳动物细胞文库的哺乳动物细胞以表达病毒载体(例如,AAV载体,描述为包含遗传元件辅助基因、Tx基因、Rep Cap),从而生成病毒感染的哺乳动物细胞文库(描绘于图1的右上部分)。通常,本公开的病毒感染的哺乳动物细胞文库将包含工程化序列、条形码序列和足以表达关注的病毒载体的病毒元件。
在一些特定的实施方案中,所提供的哺乳动物细胞用病毒载体转染,例如一个、两个、三个或更多个质粒(例如,rep/cap、辅助质粒、tx质粒)被转染到细胞中。在一些实施方案中,1个或多个病毒载体序列被整合到基因组中。在一些实施方案中,1个或多个病毒载体序列是游离的。
在一些实施方案中,(i)条形码序列、(ii)工程化序列和(iii)用于表达病毒载体的遗传元件中的两个或更多个基本上同时被引入哺乳动物细胞中。在一些实施方案中,所有三者基本上同时被引入。在一些实施方案中,条形码序列和/或工程化序列的引入是在用表达病毒载体的序列转染哺乳动物细胞后在哺乳动物细胞上进行的。在一些实施方案中,条形码序列和/或工程化序列的引入是在已经被工程化以表达病毒载体(例如,AAV载体)的哺乳动物细胞上进行的。在一些实施方案中,一种或多种用于表达病毒载体的元件被整合到哺乳动物细胞基因组中。在一些实施方案中,一种或多种用于表达病毒载体的元件存在于哺乳动物细胞的染色体外。
在一些实施方案中,所提供的技术包括一种独特的方法,借此病毒载体将条形码序列获取入病毒载体基因组中(例如,在病毒重复序列之间)。这使直接表征病毒载体并鉴定产生病毒载体的哺乳动物细胞成为可能。
在一些实施方案中,由哺乳动物细胞表达的病毒载体包含有效载荷和条形码。在一些特定实施方案中,病毒载体包含条形码和有效载荷(例如,有效载荷可以包括gRNA和核酸酶(例如,Cas9))。在一些特定实施方案中,使用此类方法由哺乳动物细胞文库产生的病毒载体(例如,AAV)可以包含有效载荷(例如,Cas9/gRNA)和条形码。条形码序列可以用于确定文库中哪些哺乳动物细胞是高病毒载体产生者,以及鉴定关注的工程化序列。
使用本领域已知的任何适当的方法培养表达病毒载体的细胞文库并收获病毒载体。在一些实施方案中,分离病毒核酸(例如,基因组DNA,例如,其包含条形码序列),并且对病毒核酸(例如,基因组DNA)进行测序(例如,使用下一代测序)。可以确定条形码的相对丰度(例如,相对于其他病毒载体条形码),并且这与特定病毒载体的丰度相关联。在一些特定的实施方案中,本文描述了文库中的哺乳动物细胞。
某些编号的示例性实施方案
实施方案1.一种包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(a)至少一个位于能够包装到病毒载体中的第一组两个病毒重复序列之间的标识符,和(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
实施方案2.一种包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(a)至少一个位于能够包装到病毒载体中的第一组两个病毒重复序列之间的标识符,(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,和(c)至少一个扰动,并且其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
实施方案3.一种包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(a)至少一个位于能够包装到病毒载体中的第一组两个病毒重复序列之间的标识符,(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,(c)至少一个扰动,和(d)至少一个文库变体,并且其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
实施方案4.一种包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(a)至少一个位于能够包装到病毒载体中的第一组两个病毒重复序列之间的标识符,(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,(c)至少一个扰动,(d)至少一个文库变体,和(e)至少一个有效载荷,并且其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
实施方案5.一种包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(a)至少一个位于能够包装到病毒载体中的第一组两个病毒重复序列之间的标识符,(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,(c)至少一个扰动,(d)至少一个文库变体,(e)至少一个有效载荷,和(f)至少一个扰动附加序列,并且其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
实施方案6.一种包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(a)至少一个位于能够包装到病毒载体中的第一组两个病毒重复序列之间的标识符,(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,(c)至少一个扰动,(d)至少一个文库变体,(e)至少一个有效载荷,(f)至少一个扰动附加序列,和(g)至少一个反式作用整合序列,并且其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
实施方案7.一种包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:a)至少一个位于能够包装到病毒载体中的第一组两个病毒重复序列之间的标识符,(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,(c)至少一个扰动,(d)至少一个文库变体,(e)至少一个有效载荷,(f)至少一个扰动附加序列,(g)至少一个反式作用整合序列,和(h)至少一个顺式作用整合序列,并且其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
实施方案8.一种包含多个哺乳动物细胞的哺乳动物细胞群,所述多个哺乳动物细胞各自单独地包含一个或多个工程化序列,其中所述一个或多个工程化序列共同包含:(a)至少一个位于能够包装到病毒载体中的第一组两个病毒重复序列之间的标识符,和(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且其中哺乳动物细胞群产生单独地包含至少一个标识符的病毒载体。
实施方案9.一种包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(a)至少一个位于能够包装到病毒载体中的第一组两个病毒重复序列之间的标识符,和(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且任选地其中一个或多个工程化序列包含至少一个扰动、至少一个文库变体、至少一个有效载荷、至少一个扰动附加序列、至少一个反式作用整合序列,和/或至少一个顺式作用整合序列,并且其中哺乳动物细胞产生单独地包含至少一个标识符的病毒载体。
实施方案10.一种包含多个哺乳动物细胞的哺乳动物细胞群,所述多个哺乳动物细胞各自单独地包含一个或多个工程化序列,其中所述一个或多个工程化序列共同包含:(a)至少一个位于能够包装到病毒载体中的第一组两个病毒重复序列之间的标识符,和(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且任选地其中一个或多个工程化序列包含至少一个扰动、至少一个文库变体、至少一个有效载荷、至少一个扰动附加序列、至少一个反式作用整合序列,和/或至少一个顺式作用整合序列,并且其中哺乳动物细胞群产生单独地包含至少一个标识符的病毒载体。
实施方案11.一种包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(a)至少一个文库构建体,和(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且其中至少一个文库构建体包含至少一个标识符,其中标识符位于能够包装到病毒载体中的第一组两个病毒重复序列之间,并且其中哺乳动物细胞产生包含至少一个标识符的病毒载体。
实施方案12.一种包含多个哺乳动物细胞的哺乳动物细胞群,所述多个哺乳动物细胞各自单独地包含一个或多个工程化序列,其中所述一个或多个工程化序列共同包含:(a)至少一个文库构建体,和(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且其中至少一个文库构建体包含至少一个标识符,其中标识符位于能够包装到病毒载体中的第一组两个病毒重复序列之间,并且其中哺乳动物细胞群产生单独地包含至少一个标识符的病毒载体。
实施方案13.一种包含一个或多个工程化序列的哺乳动物细胞,所述一个或多个工程化序列共同包含:(a)至少一个文库构建体,其中至少一个文库构建体包含至少一个标识符,其中标识符位于能够包装到病毒载体中的第一组两个病毒重复序列之间,和(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且任选地其中一个或多个工程化序列包含至少一个扰动、至少一个文库变体、至少一个有效载荷、至少一个扰动附加序列、至少一个反式作用整合序列,和/或至少一个顺式作用整合序列,并且其中哺乳动物细胞群产生单独地包含至少一个标识符的病毒载体。
实施方案14.一种包含多个哺乳动物细胞的哺乳动物细胞群,所述多个哺乳动物细胞各自单独地包含一个或多个工程化序列,其中所述一个或多个工程化序列共同包含:(a)至少一个文库构建体,其中至少一个文库构建体包含至少一个标识符,其中标识符位于能够包装到病毒载体中的第一组两个病毒重复序列之间,和(b)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且任选地其中一个或多个工程化序列包含至少一个扰动、至少一个文库变体、至少一个有效载荷、至少一个扰动附加序列、至少一个反式作用整合序列,和/或至少一个顺式作用整合序列,并且其中哺乳动物细胞群产生单独地包含至少一个标识符的病毒载体。
实施方案15.如实施方案1至14中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包括人胚肾(HEK)细胞、HEK 293细胞、HEK 293T细胞、Expi293细胞、中国仓鼠卵巢(CHO)细胞、HeLa细胞、HeLa S3细胞、PER.C6细胞、HKB11细胞、CAP细胞、幼仓鼠肾成纤维细胞(BHK细胞)(例如,BHK-21细胞)、小鼠骨髓瘤细胞(例如,Sp2/0细胞、NS0细胞)、非洲绿猴肾细胞(例如,COS细胞和Vero细胞)、A549细胞、恒河猴胎肺细胞(例如,FRhL-2细胞)或其任何衍生物。
实施方案16.如实施方案15所述的哺乳动物细胞或哺乳动物细胞群,或其衍生物,其中哺乳动物细胞各自单独地包括悬浮细胞和/或贴壁细胞。
实施方案17.如实施方案1至16中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包括HEK 293细胞、HEK 293T细胞、CHO细胞或其衍生物。
实施方案18.如实施方案1至17中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包括HEK 293细胞、HEK 293T细胞或其衍生物。
实施方案19.如实施方案1至16中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包括HeLa细胞。
实施方案20.如实施方案1至19中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中病毒载体是腺相关病毒(AAV)载体、慢病毒载体、腺病毒载体、α病毒载体、辛德毕斯病毒载体、逆转录病毒载体(例如,γ逆转录病毒载体)、多瘤病毒载体(例如,猴病毒40(SV40)载体)、乳头瘤病毒载体(例如,牛乳头瘤病毒(BPV)载体)、痘苗病毒载体、单纯疱疹病毒(HSV)载体、麻疹病毒载体、棒状病毒载体、狂犬病病毒载体、水疱性口炎病毒(VSV)载体、小核糖核酸病毒载体(例如,脊髓灰质炎病毒载体)、呼肠孤病毒载体、塞内卡病毒载体、艾柯病毒载体(例如,RIGVIR)、塞姆利基森林病毒(SFV)载体、黄病毒载体、指环病毒载体(https://www.ringtx.com)、新城疫病毒(NDV)载体、副粘病毒载体、仙台病毒载体、正粘病毒载体、流感病毒载体、冠状病毒载体和/或杂交病毒载体,和/或其衍生物、杂交体和/或工程化衍生物。
实施方案21.如实施方案1至20中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中病毒载体是腺相关病毒(AAV)载体。
实施方案22.如实施方案1至21中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中第一组两个病毒重复序列各自是能够包装到AAV载体中的AAV ITR序列。
实施方案23.如实施方案1至22中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中AAV载体包含人AAV1衣壳蛋白;人AAV2衣壳蛋白;人AAV3b衣壳蛋白;人AAV4衣壳蛋白;人AAV5衣壳蛋白;人AAV6衣壳蛋白;人AAV7衣壳蛋白;人AAV8衣壳蛋白;人AAV9衣壳蛋白;人AAV10衣壳蛋白;人AAV11衣壳蛋白;人AAV12衣壳蛋白;或人AAV13衣壳蛋白。
实施方案24.如实施方案1至23中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中AAV载体包含人祖先AAV衣壳蛋白。
实施方案25.如实施方案1至24中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中病毒载体包括AAV载体,其中AAV载体包含第一组两个病毒重复序列,所述第一组两个病毒重复序列包含一对反向末端重复序列(ITR),其是或包括人AAV1 ITR;人AAV2 ITR;人AAV3b ITR;人AAV4 ITR;人AAV5 ITR;人AAV6 ITR;人AAV7 ITR;人AAV8 ITR;人AAV9 ITR;人AAV10 ITR;人AAV11 ITR;人AAV12 ITR;或人AAV13 ITR。
实施方案26.如实施方案1至25中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中AAV载体包含牛AAV(b-AAV)衣壳蛋白;犬AAV(CAAV)衣壳蛋白;小鼠AAV1衣壳蛋白;山羊AAV衣壳蛋白;大鼠AAV衣壳蛋白;或禽AAV(AAAV)衣壳蛋白。
实施方案27.如实施方案1至26中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中病毒载体包括AAV载体,其中AAV载体包含一对ITR,其是或包括牛AAV(b-AAV)ITR;犬AAV(CAAV)ITR;小鼠AAV1 ITR;山羊AAV ITR;大鼠AAV ITR;或禽AAV(AAAV)ITR。
实施方案28.如实施方案1至27中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个包含一个或多个形成病毒载体所必需的核酸序列的多核苷酸包含:(a)AAVRep基因;(b)AAV Cap基因;(c)一个或多个AAV辅助基因,或(d)其组合。
实施方案29.如实施方案1至20中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中病毒载体是慢病毒载体。
实施方案30.如实施方案29所述的哺乳动物细胞或哺乳动物细胞群,其中慢病毒载体是人免疫缺陷病毒(HIV)载体、猴免疫缺陷病毒(SIV)载体、马传染性贫血病毒载体、猫免疫缺陷病毒载体、维斯纳病毒载体或其衍生物。
实施方案31.如实施方案29或30所述的哺乳动物细胞或哺乳动物细胞群,其中第一组两个病毒重复序列各自是能够包装到慢病毒载体中的慢病毒LTR序列。
实施方案32.如实施方案29至31中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中慢病毒载体包含慢病毒Psi序列。
实施方案33.如实施方案29至32中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中慢病毒载体包含gag蛋白或其片段。
实施方案34.如实施方案29至33中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中gag蛋白包含一个或多个选自基质(MA)、衣壳(CA)和核衣壳(NC)结构域的结构域。
实施方案35.如实施方案29至34中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中慢病毒载体包含包膜蛋白或其片段。
实施方案36.如实施方案29至35中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中慢病毒载体是包含源自不同病毒的gag蛋白和包膜蛋白的假型慢病毒载体。
实施方案37.如实施方案29至36中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中慢病毒载体包含源自人免疫缺陷病毒(HIV)载体、猴免疫缺陷病毒(SIV)载体、马传染性贫血病毒载体、猫免疫缺陷病毒载体、维斯纳病毒载体或其衍生物的gag蛋白和/或env蛋白。
实施方案38.如实施方案29至37中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中病毒载体包括慢病毒载体,其中第一组两个病毒重复序列包含源自人免疫缺陷病毒(HIV)载体、猴免疫缺陷病毒(SIV)载体、马传染性贫血病毒载体、猫免疫缺陷病毒载体、维斯纳病毒载体或其衍生物的慢病毒LTR和/或Psi序列。
实施方案39.如实施方案29至38中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个包含一个或多个形成病毒载体所必需的核酸序列的多核苷酸包含:(a)慢病毒gag基因;(b)慢病毒env基因;(c)慢病毒pol基因;或(d)其组合。
实施方案40.如实施方案1至20中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中病毒载体是单纯疱疹病毒(HSV)载体。
实施方案41.如实施方案40所述的哺乳动物细胞或哺乳动物细胞群,其中HSV载体源自单纯疱疹病毒-1(HSV-1)、单纯疱疹病毒-2(HSV-2)、人巨细胞病毒(HCMV)、水痘-带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(EBV)、卡波西肉瘤相关疱疹病毒(KSHV)、人疱疹病毒6和/或人疱疹病毒7和/或其衍生物。
实施方案42.如实施方案40或41所述的哺乳动物细胞或哺乳动物细胞群,其中病毒载体是HSV载体并且第一组两个病毒重复序列包含末端a序列。
实施方案43.如实施方案40至42中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中衣壳包含VP5、VP19C、VP23、pre-VP22a和/或成熟的蛋白酶(UL26基因产物)。
实施方案44.如实施方案1至28或40至43中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中病毒载体是HSV-AAV杂交载体。
实施方案45.如实施方案1至44中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中病毒载体是有复制能力的病毒载体。
实施方案46.如实施方案1至45中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中病毒载体是条件复制的、复制缺乏的、无复制能力的和/或复制缺陷的病毒载体。
实施方案47.如实施方案1至46中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个工程化序列游离存在于每个单独的哺乳动物细胞中。
实施方案48.如实施方案1至47中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个工程化序列存在于每个单独的哺乳动物细胞的基因组中。
实施方案49.如实施方案1至48中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个工程化序列存在于每个单独的哺乳动物细胞的基因组中,并且其中至少一个工程化序列是诱导表达的。
实施方案50.如实施方案1至49中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个工程化序列包含异源性编码序列。
实施方案51.如实施方案50所述的哺乳动物细胞或哺乳动物细胞群,其中异源性编码序列包含异源性基因和/或异源性基因区段。
实施方案52.如实施方案1至51中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个工程化序列包含异源性调控元件。
实施方案53.如实施方案52所述的哺乳动物细胞或哺乳动物细胞群,其中异源性调控元件是或包括异源性启动子序列和/或异源性增强子序列。
实施方案54.如实施方案53所述的哺乳动物细胞或哺乳动物细胞群,其中异源性启动子序列是或包括SV40启动子、延伸因子(EF)-1启动子、巨细胞病毒(CMV)启动子、磷酸甘油酸激酶(PGK)1启动子、泛素(Ubc)启动子、人β肌动蛋白启动子、四环素反应元件(TRE)启动子、脾灶形成病毒(SFFV)启动子、鼠干细胞病毒(MSCV)启动子、超级核心启动子(SCP)、CAG启动子或其衍生物。
实施方案55.如实施方案53或54所述的哺乳动物细胞或哺乳动物细胞群,其中异源性增强子序列是或包括CMV早期增强子、cAMP反应元件(CRE)增强子或其衍生物。
实施方案56.如实施方案1至55中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中所述哺乳动物细胞各自单独地包含两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个,或十个或更多个工程化序列。
实施方案57.如实施方案1至56中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含多至100个工程化序列。
实施方案58.如实施方案1至57中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中每个单独的哺乳动物细胞包含至少一个文库构建体,并且其中至少一个文库构建体包含至少一个工程化序列。
实施方案59.如实施方案1至58中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中每个单独的哺乳动物细胞包含至少一个文库构建体,其中至少一个文库构建体包含至少一个工程化序列,所述至少一个工程化序列包含至少一个条形码、至少一个标识符、至少一个文库变体、至少一个有效载荷、至少一个顺式作用整合序列或其组合和/或多个。
实施方案60.如实施方案59所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个条形码包含约5至约25个核苷酸的序列。
实施方案61.如实施方案59或60所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞群包含多个独特的条形码,并且其中多个独特的条形码包含约5至约25个核苷酸的独特序列。
实施方案62.如实施方案59至61中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含一个、两个、三个、四个、五个、六个、七个、八个、九个或十个文库变体。
实施方案63.如实施方案59至61中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含多至100个文库变体。
实施方案64.如实施方案59至61中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库变体包含至少一个工程化序列,所述至少一个工程化序列包含至少一个基因、至少一个ORF、至少一个gRNA序列、至少一个非编码核酸,或其组合和/或多个。
实施方案65.如实施方案1至64中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库变体,并且其中多个文库变体包含至少一个工程化序列,所述至少一个工程化序列包含:至少一个独特基因、至少一个独特ORF、至少一个独特gRNA序列,和/或至少一个独特非编码核酸或其组合和/或多个。
实施方案66.如实施方案1至65中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,并且其中多个文库构建体包含:至少一个独特基因、至少一个独特ORF、至少一个独特gRNA序列、至少一个独特非编码核酸或其组合和/或多个。
实施方案67.如实施方案64至66中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少一个gRNA序列。
实施方案68.如实施方案64至66中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中多个文库构建体包含至少一个独特gRNA序列。
实施方案69.如实施方案64至66中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中多个文库构建体包含至少100个独特gRNA序列。
实施方案70.如实施方案64至66中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少一个ORF。
实施方案71.如实施方案64至66中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中多个文库构建体包含至少一个独特ORF。
实施方案72.如实施方案64至66中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中多个文库构建体包含至少100个独特ORF。
实施方案73.如实施方案64至66中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少一个基因。
实施方案74.如实施方案64至66中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中多个文库构建体包含至少一个独特基因。
实施方案75.如实施方案64至66中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中多个文库构建体包含至少100个独特基因。
实施方案76.如实施方案64至66中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少一个非编码核酸序列。
实施方案77.如实施方案64至66中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中多个文库构建体包含至少一个独特非编码核酸序列。
实施方案78.如实施方案64至66中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中多个文库构建体包含至少100个独特非编码核酸序列。
实施方案79.如实施方案58至78中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少一个报告基因和/或选择标记,或其组合和/或多个。
实施方案80.如实施方案58至79中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少一个标识符。
实施方案81.如实施方案58至79中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,所述多个文库构建体包含多个标识符。
实施方案82.如实施方案80至81中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中每个单独的哺乳动物细胞包含有包含单个条形码的标识符。
实施方案83.如实施方案80至81中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个标识符包含(a)至少一个条形码和/或(b)至少一个文库变体。
实施方案84.如实施方案80至81中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个标识符,所述多个标识符包含(a)多个条形码和/或(b)多个文库变体。
实施方案85.如实施方案58至84中任一项所述的哺乳动物细胞或哺乳动物细胞群,(i)其中至少一个文库构建体包含多个工程化序列,其中(a)多个工程化序列的第一子集位于第一组两个病毒重复序列之间,并且(b)多个工程化序列的第二子集位于第一组两个病毒重复序列之外。
实施方案86.如实施方案85所述的哺乳动物细胞或哺乳动物细胞群,其中多个工程化序列包含(i)至少一个文库变体和(ii)至少一个标识符,(ii)其中至少一个文库变体和至少一个标识符都位于第一组两个病毒重复序列之间。
实施方案87.如实施方案85所述的哺乳动物细胞或哺乳动物细胞群,其中多个工程化序列包含(i)至少一个文库变体、至少一个标识符和至少一个有效载荷,(ii)其中至少一个文库变体、至少一个标识符和至少一个有效载荷位于第一组两个病毒重复序列之间。
实施方案88.如实施方案85所述的哺乳动物细胞或哺乳动物细胞群,其中多个工程化序列包含至少一个文库变体和至少一个标识符,并且其中(a)至少一个标识符位于第一组两个病毒重复序列之间,并且(b)至少一个文库变体位于第一组两个病毒重复序列之外。
实施方案89.如实施方案85所述的哺乳动物细胞或哺乳动物细胞群,其中多个工程化序列包含至少一个文库变体、至少一个标识符和至少一个有效载荷,其中(a)至少一个标识符和至少一个有效载荷位于第一组两个病毒重复序列之间,并且(b)至少一个文库变体位于第一组两个病毒重复序列之外。
实施方案90.如实施方案85所述的哺乳动物细胞或哺乳动物细胞群,其中多个工程化序列包含至少两个文库变体和至少一个标识符,其中(a)至少一个标识符和至少两个文库变体中的至少一个文库变体位于第一组两个病毒重复序列之间,并且(b)至少两个文库变体中的至少一个文库变体位于第一组两个病毒重复序列之外。
实施方案91.如实施方案85所述的哺乳动物细胞或哺乳动物细胞群,其中多个工程化序列包含至少两个文库变体、至少一个有效载荷和至少一个标识符,其中(a)至少一个标识符、至少一个有效载荷和至少两个文库变体中的至少一个文库变体位于第一组两个病毒重复序列之间,并且(b)至少两个文库变体中的至少一个文库变体位于第一组两个病毒重复序列之外。
实施方案92.如实施方案85至91中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个标识符包含至少一个条形码。
实施方案93.如实施方案85至91中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少一个包含至少一个条形码的工程化序列,并且其中至少一个条形码位于第一组两个病毒重复序列之间。
实施方案94.如实施方案85至91中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少一个包含至少一个条形码的工程化序列,并且其中至少一个条形码位于第一组两个病毒重复序列之外。
实施方案95.如实施方案85至91中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少一个包含多个条形码的工程化序列,并且其中(a)多个条形码的第一子集位于第一组两个病毒重复序列之间,并且(b)多个条形码的第二子集位于第一组两个病毒重复序列之外。
实施方案96.如实施方案58至95中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含文库构建体或其一部分的多于一个拷贝。
实施方案97.如实施方案58至95中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含文库构建体或其一部分的多个拷贝。
实施方案98.如实施方案58至95中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含文库构建体或其一部分的在一个和四个之间的拷贝。
实施方案99.如实施方案58至95中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含文库构建体或其一部分的两个拷贝。
实施方案100.如实施方案58至95中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地确切包含文库构建体的一个拷贝。
实施方案101.如实施方案58至100中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含单个连续核酸序列。
实施方案102.如实施方案58至101中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中每个单独的文库构建体由单个连续核酸序列组成,并且其中多个文库构建体包含多个独特核酸序列。
实施方案103.如实施方案58至102中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含多于一个不连续核酸序列。
实施方案104.如实施方案58至103中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少两个、三个、四个、五个、六个、七个、八个、九个或十个不连续核酸序列。
实施方案105.如实施方案58至104中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含多至100个不连续核酸序列。
实施方案106.如实施方案58至105中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中每个单独的文库构建体由不连续核酸序列组成,并且其中文库构建体包含多个独特核酸序列。
实施方案107.如实施方案58至106中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中源自每个单独的哺乳动物细胞的核酸或其衍生物在单细胞测序方法过程中包含至少一个独特细胞身份序列。
实施方案108.如实施方案58至107中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中多于一个核酸序列或其衍生物在单细胞测序方法过程中包含细胞身份序列。
实施方案109.如实施方案58至108中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中每个单独的文库构建体由不连续核酸序列组成,其中文库构建体包含多个独特核酸序列,并且其中多于一个来自文库构建体的核酸序列(或其衍生物)在单细胞测序方法过程中包含细胞身份序列。
实施方案110.如实施方案58至109中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个文库构建体,其中每个单独的文库构建体由不连续核酸序列组成,其中文库构建体包含多个独特核酸序列,并且其中所有来自文库构建体的核酸序列(或其衍生物)在单细胞测序方法过程中包含细胞身份序列。
实施方案111.如实施方案1至110中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含至少一个包含至少一个扰动的工程化序列,并且其中至少一个扰动游离存在于哺乳动物细胞中。
实施方案112.如实施方案1至111中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含至少一个包含至少一个扰动的工程化序列,并且其中至少一个扰动存在于哺乳动物细胞的基因组中。
实施方案113.如实施方案1至112中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含至少两个包含至少两个扰动的工程化序列,并且其中至少一个扰动游离存在,且至少一个扰动存在于哺乳动物细胞的基因组中。
实施方案114.如实施方案1至113中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含至少一个包含多个独特扰动的工程化序列。
实施方案115.如实施方案1至114中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含至少一个工程化序列,所述至少一个工程化序列包含至少两个、三个、四个、五个、六个、七个、八个或九个独特扰动。
实施方案116.如实施方案111至115中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个扰动包括内源性基因组编码序列的插入、缺失、取代、替换、表观遗传修饰和/或重排。
实施方案117.如实施方案116所述的哺乳动物细胞或哺乳动物细胞群,其中内源性编码序列是或包含内源性基因或基因区段。
实施方案118.如实施方案111至115中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个扰动包括内源性基因组调控元件的插入、缺失、取代、替换、表观遗传修饰和/或重排。
实施方案119.如实施方案118所述的哺乳动物细胞或哺乳动物细胞群,其中内源性调控元件是或包含内源性启动子序列和/或内源性增强子序列。
实施方案120.如实施方案111至115中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞各自单独地包含至少一个包含至少一个扰动附加序列的工程化序列,并且其中至少一个扰动附加序列包含至少一个RNA引导的核酸酶或其衍生物。
实施方案121.如实施方案120所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个RNA引导的核酸酶包含Cas9、Cpf1和/或CasZ或其衍生物,包括包含转录调控因子的融合蛋白(例如,Cas9-VPR或Cas9-KRAB-MeCP2融合物)、CRISPR蛋白与核酸酶结构域(例如,Fok1)的融合物、酶碱基编辑器(例如,BE和ABE融合物的版本)、逆转录酶融合物(例如,引导编辑器)、CRISPR重组酶(例如,RecCas9)和CRISPR转座酶(例如,Tn7样转座酶系统Cas12k和与TniQ的级联复合物)。
实施方案122.如实施方案120所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个RNA引导的核酸酶包含Cas9或其衍生物。
实施方案123.如实施方案1至122中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中经由转染将文库构建体引入每个单独的细胞中。
实施方案124.如实施方案123所述的哺乳动物细胞或哺乳动物细胞群,其中工程化序列包含至少一个文库构建体,所述至少一个文库构建体经由病毒转导被引入每个单独的细胞中。
实施方案125.如实施方案124所述的哺乳动物细胞或哺乳动物细胞群,其中经由慢病毒介导的转导将文库构建体引入每个单独的细胞中。
实施方案126.如实施方案123至125中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体或其一部分游离存在于哺乳动物细胞中。
实施方案127.如实施方案126所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少一个包含至少一个文库变体的工程化序列,并且其中每个单独的细胞包含至少一个扰动附加序列。
实施方案128.如实施方案126所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体包含至少一个包含至少一个文库变体的工程化序列。
实施方案129.如实施方案127至128中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库变体包含至少一个效应物。
实施方案130.如实施方案127至128中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库变体成为至少一个扰动。
实施方案131.如实施方案129至130中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库变体包含至少一个ORF、至少一个基因、至少一个非编码核酸序列和/或至少一个gRNA或其多个。
实施方案132.如实施方案131所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库变体是gRNA并且至少一个扰动附加序列是RNA引导的核酸酶或其衍生物。
实施方案133.如实施方案131所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个扰动附加序列是非RNA指导的核酸酶或其衍生物。
实施方案134.如实施方案126至133中任一项所述的哺乳动物细胞或哺乳动物细胞群,其包含至少一个扰动。
实施方案135.如实施方案126至134中任一项所述的哺乳动物细胞或哺乳动物细胞群,其包含至少一个扰动,所述至少一个扰动包括基因组序列变化、游离序列变化和/或表观遗传修饰。
实施方案136.如实施方案126至135中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中扰动包括内源性基因组编码序列的插入、缺失、取代和/或重排。
实施方案137.如实施方案123至125中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个文库构建体或其一部分存在于哺乳动物细胞的基因组中。
实施方案138.如实施方案137所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞基因组内至少一个文库构建体的插入是在随机插入位点。
实施方案139.如实施方案138所述的哺乳动物细胞或哺乳动物细胞群,其中随机插入位点在基因组位置的预定子集中是随机的。
实施方案140.如实施方案137所述的哺乳动物细胞或哺乳动物细胞群,其中哺乳动物细胞基因组内至少一个文库构建体的插入是在预定插入位点。
实施方案141.如实施方案137至140中任一项所述的哺乳动物细胞或哺乳动物细胞群,其包含至少一个反式作用整合序列,其中至少一个反式作用整合序列包含(a)至少一个整合构建体和/或整合病毒载体,(b)至少一个重组酶,和/或其多肽、蛋白质、核酸或多核苷酸产物,(c)至少一个核酸酶,和/或其多肽、蛋白质、核酸或多核苷酸产物,(d)至少一个转座酶,和/或其多肽、蛋白质、核酸或多核苷酸产物,和/或(e)至少一个工程化序列。
实施方案142.如实施方案141所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个反式作用整合序列包含至少一个整合构建体和/或整合病毒载体。
实施方案143.如实施方案141所述的哺乳动物细胞或哺乳动物细胞群,(a)其中每个单独的哺乳动物细胞包含至少一个工程化序列,所述至少一个工程化序列包含至少一对位于第一组病毒重复序列侧翼的顺式作用整合序列,并且(b)其中顺式作用整合序列包含第二组病毒重复序列。
实施方案144.在如实施方案143所述的哺乳动物细胞或哺乳动物细胞群,其中整合构建体和/或整合病毒载体是慢病毒载体、γ逆转录病毒载体、泡沫逆转录病毒载体、腺相关病毒载体或其衍生物。
实施方案145.如实施方案144所述的哺乳动物细胞或哺乳动物细胞群,其中整合构建体或整合病毒载体是慢病毒载体。
实施方案146.如实施方案145所述的哺乳动物细胞或哺乳动物细胞群,其中第一组病毒重复序列是或包含ITR,并且第二组病毒重复序列是或包含LTR。
实施方案147.如实施方案141所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个反式作用整合序列包含核酸酶和/或其多肽、蛋白质、核酸或多核苷酸产物。
实施方案148.如实施方案147所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个反式作用整合序列包含至少一个核酸酶,并且其中至少一个核酸酶包括RNA引导的核酸酶或其融合物或衍生物。
实施方案149.如实施方案147所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个反式作用整合序列包含至少一个核酸酶,并且其中至少一个核酸酶包括非RNA引导的核酸酶或其融合物或衍生物。
实施方案150.如实施方案148所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个反式作用整合序列还包含至少一个工程化序列。
实施方案151.如实施方案148所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个反式作用整合序列还包含至少一个gRNA。
实施方案152.如实施方案147至151中任一项所述的哺乳动物细胞或哺乳动物细胞群,(a)其中每个单独的哺乳动物细胞包含至少一个工程化序列,所述至少一个工程化序列包含至少一对位于第一组病毒重复序列侧翼的顺式作用整合序列,并且(b)其中顺式作用整合序列包含同源臂序列。
实施方案153.如实施方案152所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个核酸酶包含Cas9、CasZ、Cpf1、与可编程DNA结合结构域(诸如TALE蛋白(TALEN)或锌指蛋白(ZFN))融合的工程化Fok1核酸酶结构域,和/或大范围核酸酶或其衍生物。
实施方案155.如实施方案153所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个核酸酶包含Cas9。
实施方案156.如实施方案141所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个反式作用整合序列包含重组酶和/或其多肽、蛋白质、核酸或多核苷酸产物。
实施方案157.如实施方案156所述的哺乳动物细胞或哺乳动物细胞群,(a)其中每个单独的哺乳动物细胞包含至少一个工程化序列,所述至少一个工程化序列包含至少一对位于第一组病毒重复序列侧翼的顺式作用整合序列,并且(b)其中顺式作用整合序列包含重组酶识别位点。
实施方案158.如实施方案157所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个重组酶包含Cre、Flp、Dre、PhiC31和/或Bxb1,或其衍生物。
实施方案159.如实施方案158所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个重组酶包含Cre。
实施方案160.如实施方案159所述的哺乳动物细胞或哺乳动物细胞群,其中重组酶识别位点包括LoxP位点。
实施方案161.如实施方案158所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个重组酶包含Bxb1。
实施方案162.如实施方案161所述的哺乳动物细胞或哺乳动物细胞群,其中重组酶识别位点包括Att位点。
实施方案163.如实施方案158所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个重组酶包含Flp。
实施方案164.如实施方案163所述的哺乳动物细胞或哺乳动物细胞群,其中重组酶识别位点包括Frt位点。
实施方案165.如实施方案141所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个反式作用整合序列包含转座酶和/或其多肽、蛋白质、核酸或多核苷酸产物。
实施方案166.如实施方案165所述的哺乳动物细胞或哺乳动物细胞群,(a)其中每个单独的哺乳动物细胞包含至少一个工程化序列,所述至少一个工程化序列包含至少一对位于第一组病毒重复序列侧翼的顺式作用整合序列,并且(b)其中顺式作用整合序列包含转座酶识别位点。
实施方案167.如实施方案166所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个转座酶包含Piggybac转座酶、睡美人转座酶和/或Tn5转座酶,或其衍生物。
实施方案168.如实施方案167所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个转座酶包含Piggybac转座酶。
实施方案169.如实施方案167所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个转座酶包含睡美人转座酶。
实施方案170.如实施方案1至169中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了改变的病毒载体。
实施方案171.如实施方案170所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在它们将核酸转移至细胞的方式上发生改变的病毒载体。
实施方案172.如实施方案170所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在治疗上发生改变的病毒载体。
实施方案173.如实施方案1至172中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在它们的预期应用中发生改变的病毒载体。
实施方案174.如实施方案1至173中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在应用中功能性较低的病毒载体。
实施方案175.如实施方案1至174中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在应用中无功能性的病毒载体。
实施方案176.如实施方案174或175中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在将核酸转移至细胞方面功能性较低和/或无功能性的病毒载体。
实施方案177.如实施方案174至175中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在治疗上功能性较低和/或无功能性的病毒载体。
实施方案178.如实施方案174至175中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在它们的预期应用中功能性较低和/或无功能性的病毒载体。
实施方案179.如实施方案1至178中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在应用中功能性较高和/或增强的病毒载体。
实施方案180.如实施方案179所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在将核酸转移至细胞方面功能性较高和/或增强的病毒载体。
实施方案181.如实施方案179所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在治疗上功能性较高和/或增强的病毒载体。
实施方案182.如实施方案179所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考群,细胞群产生了在它们的预期应用中功能性较高和/或增强的病毒载体。
实施方案183.如实施方案1至182中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化序列在生产规范下改变了病毒载体产生。
实施方案184.如实施方案1至183中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化序列在生产规范下提供了增加的病毒载体产生。
实施方案185.如实施方案183或184所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个改变病毒载体产生的工程化序列包含至少一个扰动。
实施方案186.如实施方案185所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个扰动在当时现行的良好生产规范(cGMP)下提供了增加的病毒载体产生。
实施方案187.如实施方案185所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个扰动在良好生产规范(GMP)下提供了增加的病毒载体产生。
实施方案188.如实施方案185所述的哺乳动物细胞或哺乳动物细胞群,其中至少一个扰动在非良好生产规范(non-GMP)下提供了增加的病毒载体产生。
实施方案189.如实施方案1至188中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化序列提供了增加的哺乳动物细胞群的活力。
实施方案190.如实施方案1至189中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化序列提供了增加的哺乳动物细胞群的病毒载体产生的持续时间。
实施方案191.如实施方案1至190中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化序列提供了增加的哺乳动物细胞群的基因组稳定性。
实施方案192.如实施方案1至185中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化序列在生产规范下提供了减少的产生的病毒载体百分比,所述病毒载体在应用中功能性较低。
实施方案193.如实施方案1至185中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相比于参考细胞群,至少一个工程化序列在生产规范下提供了减少的产生的病毒载体百分比,所述病毒载体在应用中无功能性。
实施方案194.如实施方案192或193所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,百分比减少的病毒载体在将核酸转移至细胞方面功能性较低和/或无功能性。
实施方案195.如实施方案192或193所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,百分比减少的病毒载体在治疗上功能性较低和/或无功能性。
实施方案196.如实施方案192或193所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,百分比减少的病毒载体在它们的预期应用中功能性较低和/或无功能性。
实施方案197.如实施方案1至191中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化序列在生产规范下提供了增加的产生的病毒载体百分比,所述病毒载体在应用中功能性较高和/或增强。
实施方案198.如实施方案197所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,百分比增加的病毒载体在将核酸转移至细胞方面功能性较高和/或增强。
实施方案199.如实施方案197所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,百分比增加的病毒载体在治疗上功能性较高和/或增强。
实施方案200.如实施方案197所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,百分比增加的病毒载体在它们的预期应用中功能性较高和/或增强。
实施方案201.如实施方案1至191中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化序列在生产规范下提供了增加的病毒载体百分比,所述病毒载体含有用于它们的预期应用的所有和/或必需的核酸序列和/或其他元件。
实施方案202.如实施方案1至191中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化序列在生产规范下提供了减少的病毒载体百分比,所述病毒载体已失去用于它们的预期应用的所有和/或必需的核酸序列和/或其他元件和/或已使其突变。
实施方案203.如实施方案1至202中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中每个单独的哺乳动物细胞包含至少一个包含一个扰动的工程化序列。
实施方案204.如实施方案1至203中任一项所述的哺乳动物细胞群,其中哺乳动物细胞群包含多个工程化序列,其中多个工程化序列包含多个扰动。
实施方案205.如实施方案1至204中任一项所述的哺乳动物细胞群,其中每个单独的哺乳动物细胞包含多个包含多个扰动的工程化序列。
实施方案206.如实施方案1至205中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中参考细胞群是:(a)不包含至少一个工程化序列的可比较的哺乳动物细胞群;和/或(b)能够产生病毒载体的标准细胞群。
实施方案207.如实施方案1至206中任一项所述的哺乳动物细胞群,其通过以下步骤产生:(a)将多个包含多个文库构建体的工程化序列引入到多个哺乳动物细胞中,其中单独的文库构建体包含至少一个位于第一组两个病毒重复序列之间的标识符,和(b)将至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸引入多个哺乳动物细胞中。
实施方案208.如实施方案1至206中任一项所述的哺乳动物细胞群,其通过将多个包含多个文库构建体的工程化序列引入到多个哺乳动物细胞中的步骤产生,其中单独的文库构建体包含至少一个位于第一组两个病毒重复序列之间的标识符,其中多个哺乳动物细胞包含一个或多个产生病毒载体所必需的核酸序列。
实施方案209.一种产生病毒载体的方法,所述方法包括:在使得哺乳动物细胞产生病毒载体的条件下培养如实施方案1至206中任一项所述的哺乳动物细胞群,并且其中每个产生的病毒载体包含至少一个源自产生病毒载体的哺乳动物细胞的至少一个标识符的标识符。
实施方案210.如实施方案209所述的方法,其中每个产生的病毒载体包含至少一个与产生病毒载体的哺乳动物细胞的至少一个标识符相同的标识符。
实施方案211.一种方法,所述方法包括:(a)从哺乳动物细胞文库产生病毒载体,其中哺乳动物细胞文库包含多个哺乳动物细胞,其中多个中的每个哺乳动物细胞单独地包含:(i)至少一个工程化序列,(ii)至少一个标识符,和(iii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且其中每个病毒载体包含至少一个源自产生病毒载体的哺乳动物细胞的至少一个标识符的标识符;和(b)检测病毒载体中的一个或多个标识符。
实施方案212.如实施方案211所述的方法,其中每个病毒载体包含至少一个与产生病毒载体的哺乳动物细胞的至少一个标识符相同的标识符。
实施方案213.一种方法,所述方法包括:(a)从哺乳动物细胞文库产生病毒载体,其中哺乳动物细胞文库包含多个哺乳动物细胞,其中多个中的每个哺乳动物细胞单独地包含:(i)至少一个工程化序列,(ii)至少一个标识符,和(iii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,并且其中每个病毒载体包含至少一个源自产生病毒载体的哺乳动物细胞的至少一个标识符的标识符;和(b)通过下一代测序检测病毒载体中的一个或多个标识符。
实施方案214.如实施方案213所述的方法,其中每个病毒载体包含至少一个与产生病毒载体的哺乳动物细胞的至少一个标识符相同的标识符。
实施方案215.一种方法,所述方法包括以下步骤:(a)产生AAV文库,其中AAV文库包含来自哺乳动物细胞文库的多个AAV载体,其中哺乳动物细胞文库包含多个哺乳动物细胞,其中多个中的每个哺乳动物细胞单独地包含:(i)至少一个工程化序列,(ii)至少一个条形码序列,和(iii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中每个AAV病毒载体包含至少一个构建体,并且其中至少一个构建体包含源自产生AAV病毒载体的哺乳动物细胞的至少一个条形码序列的条形码序列;和(b)检测AAV文库中的一个或多个条形码序列。
实施方案216.如实施方案215所述的方法,其中每个AAV病毒载体包含至少一个构建体,并且其中至少一个构建体包含与产生AAV病毒载体的哺乳动物细胞的至少一个条形码序列相同的条形码序列。
实施方案217.一种方法,所述方法包括以下步骤:(a)产生AAV文库,其中AAV文库包含来自哺乳动物细胞文库的多个构建体,其中哺乳动物细胞文库包含多个哺乳动物细胞,其中多个中的每个哺乳动物细胞单独地包含:(i)至少一个工程化序列,(ii)至少一个条形码序列,和(iii)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中每个AAV病毒载体包含至少一个构建体,并且其中至少一个构建体包含源自产生AAV病毒载体的哺乳动物细胞的至少一个条形码序列的条形码序列;和(b)通过下一代测序检测AAV文库中的一个或多个条形码序列。
实施方案218.如实施方案217所述的方法,其中每个AAV病毒载体包含至少一个构建体,并且其中至少一个构建体包含与产生AAV病毒载体的哺乳动物细胞的至少一个条形码序列相同的条形码序列。
实施方案219.如实施方案209至218中任一项所述的方法,其还包括对哺乳动物细胞文库的每个单独的细胞内的至少一个或所有核酸序列或其衍生物进行单细胞测序,其中至少一个或所有核酸序列或其衍生物在单细胞测序方法过程中包含单细胞身份序列,并且其中至少一个或所有核酸序列或其衍生物包含至少一个文库构建体。
实施方案220.如实施方案209至218中任一项所述的方法,其还包括对哺乳动物细胞文库的每个单独的细胞内的至少一个或所有核酸序列或其衍生物进行单细胞测序,其中至少一个或所有核酸序列或其衍生物在单细胞测序方法的上下文中包含单细胞身份序列,并且其中至少一个或所有核酸序列或其衍生物包含至少一个包含至少一个标志符的文库变体。
实施方案221.如实施方案209至220中任一项所述的方法,其中第二文库构建体被引入哺乳动物细胞中,其中哺乳动物细胞包含至少一个源自第一文库构建体的扰动,并且其中第二文库构建体包含至少一个包含位于第一组两个病毒重复序列之间的至少一个标识符的工程化序列。
实施方案222.如实施方案209至221中任一项所述的方法,其中将第二多个文库构建体引入多个哺乳动物细胞中,其中多个哺乳动物细胞包含至少一个源自第一多个文库构建体的扰动,并且其中第二多个文库构建体包含多个工程化序列,其中第二多个文库构建体中的每个单独的文库构建体包含至少一个位于第一组两个病毒重复序列之间的标识符。
实施方案223.如实施方案221至222中任一项所述的方法,其还包括通过单细胞测序和/或下一代测序检测一个或多个标识符和/或一个或多个工程化序列。
实施方案224.如实施方案221至223中任一项所述的方法,其涉及多于两轮的文库构建体引入和一个或多个标识符和/或一个或多个工程化序列的检测。
实施方案225.如实施方案221至224中任一项所述的方法,其还包括使用机器学习方法来开发机器学习模型以鉴定靶扰动的期望组合。
实施方案226.如实施方案207至225中任一项所述的方法,其中从细胞去除至少一个标识符。
实施方案227.如实施方案209至226中任一项所述的方法,其中每个产生的病毒载体包含报告基因和/或选择标记。
实施方案228.如实施方案227所述的方法,其中所述方法还包括去除报告基因和/或选择标记的步骤。
实施方案229.一种包含多个哺乳动物细胞的哺乳动物细胞群,每个哺乳动物细胞单独地包含:(a)至少一个工程化核酸序列,(b)至少一个条形码序列,和(c)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中多个哺乳动物细胞产生多个病毒载体。
实施方案230.如实施方案229所述的哺乳动物细胞群,其中与参考细胞群相比,至少一个工程化核酸序列在生产规范下提供了增加的病毒载体产生。
实施方案231.如实施方案229或230所述的哺乳动物细胞群,其中至少一个工程化核酸序列在当时现行的良好生产规范(cGMP)下提供了增加的产生的病毒载体。
实施方案232.如实施方案229至231中任一项所述的哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化核酸序列提供了增加的哺乳动物细胞群的活力。
实施方案233.如实施方案229至232中任一项所述的哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化核酸序列提供了增加的哺乳动物细胞群的病毒载体产生的持续时间。
实施方案234.如实施方案229至233中任一项所述的哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化核酸序列提供了增加的哺乳动物细胞群的基因组稳定性。
实施方案235.如实施方案230至234中任一项所述的哺乳动物细胞群,其中参考细胞群是:(i)不包含至少一个工程化核酸序列的可比较的哺乳动物细胞群;或(ii)能够产生病毒载体的标准细胞群。
实施方案236.如实施方案229至235中任一项所述的哺乳动物细胞群,其中(a)至(c)中的至少一个游离存在于哺乳动物细胞中。
实施方案237.如实施方案229至236中任一项所述的哺乳动物细胞群,其中(a)至(c)中的至少一个存在于哺乳动物细胞的基因组中。
实施方案238.如实施方案229至237中任一项所述的哺乳动物细胞群,其中至少一个条形码序列由单个条形码序列组成并且至少一个工程化核酸序列由单个工程化核酸序列组成。
实施方案239.如实施方案238所述的哺乳动物细胞群,其中至少一个条形码序列与至少一个工程化核酸序列相关。
实施方案240.如实施方案229至237中任一项所述的哺乳动物细胞群,其中至少一个条形码序列由第一条形码序列和第二条形码序列组成,并且其中至少一个工程化核酸序列由第一工程化核酸序列和第二工程化核酸序列组成。
实施方案241.如实施方案240所述的哺乳动物细胞群,其中第一条形码序列与第一工程化核酸序列相关,并且第二条形码序列与第二工程化核酸序列相关。
实施方案242.如实施方案240或241所述的哺乳动物细胞群,其中第二工程化核酸序列在第一工程化核酸序列之后被选择和/或引入到哺乳动物细胞群中。
实施方案243.如实施方案240至242中任一项所述的哺乳动物细胞群,其还包含与第三条形码序列相关的第三工程化序列。
实施方案244.如实施方案229至237中任一项所述的哺乳动物细胞群,其中至少一个条形码序列由单个条形码序列组成并且至少一个工程化核酸序列由至少两个工程化核酸序列组成。
实施方案245.如实施方案229至237中任一项所述的哺乳动物细胞群,其中至少一个条形码序列由单个条形码序列组成并且至少一个工程化核酸序列由两个、三个、四个或五个工程化核酸序列组成。
实施方案246.如实施方案229至245中任一项所述的哺乳动物细胞群,其中至少一个工程化序列包含异源性编码序列。
实施方案247.如实施方案246所述的哺乳动物细胞群,其中异源性编码序列是或包含异源性基因和/或异源性基因区段。
实施方案248.如实施方案229至247中任一项所述的哺乳动物细胞群,其中至少一个工程化核酸序列包含异源性调控元件。
实施方案249.如实施方案248所述的哺乳动物细胞群,其中异源性调控元件是或包含异源性启动子序列和/或异源性增强子序列。
实施方案250.如实施方案248所述的哺乳动物细胞群,其中异源性启动子序列是或包括SV40启动子、延伸因子(EF)-1启动子、巨细胞病毒(CMV)启动子、磷酸甘油酸激酶(PGK)1启动子、泛素(Ubc)启动子、人β肌动蛋白启动子、四环素反应元件(TRE)启动子或其衍生物。
实施方案251.如实施方案229至250中任一项所述的哺乳动物细胞群,其中至少一个工程化核酸序列是或包含哺乳动物细胞基因组内内源性编码序列的插入、缺失、取代、替换或重排。
实施方案252.如实施方案251所述的哺乳动物细胞群,其中内源性编码序列是或包含内源性基因或基因区段。
实施方案253.如实施方案229至252中任一项所述的哺乳动物细胞群,其中至少一个工程化核酸序列包含哺乳动物细胞基因组内内源性调控元件的插入、缺失、取代、替换或重排。
实施方案254.如实施方案253所述的哺乳动物细胞群,其中内源性调控元件是或包含内源性启动子序列和/或内源性增强子序列。
实施方案255.如实施方案229至254中任一项所述的哺乳动物细胞群,其中至少一个工程化核酸序列包含哺乳动物细胞基因组内的插入。
实施方案256.如实施方案229至255中任一项所述的哺乳动物细胞群,其中至少一个工程化核酸序列包含病毒或非病毒核酸序列向哺乳动物细胞基因组中的插入。
实施方案257.如实施方案255或256所述的哺乳动物细胞群,其中哺乳动物细胞基因组内的插入包括随机插入位点。
实施方案258.如实施方案257所述的哺乳动物细胞群,其中随机插入位点在基因组位置的预定子集中是随机的。
实施方案259.如实施方案255或256所述的哺乳动物细胞群,其中哺乳动物细胞基因组内的插入包括预定插入位点。
实施方案260.如实施方案240至242中任一项所述的哺乳动物细胞群,其中第二工程化核酸序列是或包含在预定插入位点的插入。
实施方案261.如实施方案260所述的哺乳动物细胞群,其中预定插入位点是合理选择的。
实施方案262.如实施方案261所述的哺乳动物细胞群,其中预定插入位点是使用机器学习合理选择的。
实施方案263.如实施方案262所述的哺乳动物细胞群,其中预定插入位点是使用第一工程化序列的序列或第一工程化序列在哺乳动物细胞基因组中的位置合理选择的。
实施方案263.如实施方案240至242中任一项所述的哺乳动物细胞群,其通过以下步骤产生:将第一工程化核酸序列和第一条形码序列引入多个哺乳动物细胞中,以及将第二工程化核酸序列和第二条形码序列引入多个哺乳动物细胞中,其中将第二工程化核酸序列插入在哺乳动物细胞基因组中的预定位点。
实施方案264.如实施方案229至263中任一项所述的哺乳动物细胞群,其中至少一个条形码序列包含约5至约25个核苷酸的核酸序列。
实施方案265.如实施方案229至264中任一项所述的哺乳动物细胞群,其中多个哺乳动物细胞是或包括人胚肾(HEK)细胞、中国仓鼠卵巢(CHO)细胞、HeLa细胞、PER.C6细胞、HKB11细胞、CAP细胞、幼仓鼠肾成纤维细胞(BHK细胞)、Sp2/0细胞、NS0细胞、COS细胞、Vero细胞或其任何衍生物。
实施方案266.如实施方案229至264中任一项所述的哺乳动物细胞群,其中多个哺乳动物细胞是或包括HEK 293细胞、CHO细胞,或其衍生物。
实施方案267.如实施方案229至266中任一项所述的哺乳动物细胞群,其中病毒载体是腺相关病毒(AAV)载体。
实施方案268.如实施方案267所述的哺乳动物细胞群,其中AAV载体包含人AAV1衣壳蛋白;人AAV2衣壳蛋白;人AAV3b衣壳蛋白;人AAV4衣壳蛋白;人AAV5衣壳蛋白;人AAV6衣壳蛋白;人AAV7衣壳蛋白;人AAV8衣壳蛋白;人AAV9衣壳蛋白;人AAV10衣壳蛋白;人AAV11衣壳蛋白;人AAV12衣壳蛋白;或人AAV13衣壳蛋白。
实施方案269.如实施方案267所述的哺乳动物细胞群,其中AAV载体包含人祖先AAV衣壳蛋白。
实施方案270.如实施方案240至242中任一项所述的哺乳动物细胞群,其中AAV载体包括AAV载体,其中AAV载体包含一对反向末端重复序列(ITR),其是或包括人AAV1 ITR;人AAV2 ITR;人AAV3b ITR;人AAV4 ITR;人AAV5 ITR;人AAV6 ITR;人AAV7 ITR;人AAV8ITR;人AAV9 ITR;人AAV10 ITR;人AAV11 ITR;人AAV12ITR;或人AAV13 ITR。
实施方案271.如实施方案267中所述的哺乳动物细胞群,其中AAV载体包含牛AAV(b-AAV)衣壳蛋白;犬AAV(CAAV)衣壳蛋白;小鼠AAV1衣壳蛋白;山羊AAV衣壳蛋白;大鼠AAV衣壳蛋白;或禽AAV(AAAV)衣壳蛋白。
实施方案272.如实施方案267或271中所述的哺乳动物细胞群,其中AAV载体包括AAV载体,其中AAV载体包含一对ITR,其是或包括牛AAV(b-AAV)ITR;犬AAV(CAAV)ITR;小鼠AAV1 ITR;山羊AAV ITR;大鼠AAV ITR;或禽AAV(AAAV)ITR。
实施方案273.如实施方案267至272中任一项所述的哺乳动物细胞群,其中至少一个包含一个或多个形成病毒载体所必需的核酸序列的多核苷酸包含:AAV Rep基因;AAVCap基因;一种或多种腺病毒辅助基因;或其组合。
实施方案274.如实施方案229至273中任一项所述的哺乳动物细胞群,其中多个哺乳动物细胞中的每个还包含转基因,所述转基因是或包括报告基因、治疗基因、免疫原性基因、诊断基因或其组合。
实施方案275.如实施方案274所述的哺乳动物细胞群,其中多个哺乳动物细胞产生多个包含转基因的病毒载体。
实施方案276.一种包含多个哺乳动物细胞的哺乳动物细胞群,其中多个哺乳动物细胞中的每个单独地包含:(a)至少一个工程化核酸序列,(b)至少一个条形码序列,和(c)至少一个包含一个或多个形成AAV载体所必需的元件的核酸序列,所述至少一个核酸序列选自:AAV Rep基因、AAV Cap基因、一种或多种腺病毒辅助基因或其组合,其中多个哺乳动物细胞产生多个AAV载体。
实施方案277.一种哺乳动物细胞群,所述哺乳动物细胞群包含多个适合于产生腺相关病毒(AAV)载体的哺乳动物细胞,其中多个哺乳动物细胞中的每个单独地包含:(a)至少一个工程化核酸序列,(b)至少一个条形码序列,和(c)至少一个核酸序列,其包含一个或多个形成AAV载体所必需的元件,其中多个哺乳动物细胞产生AAV载体。
实施方案278.一种方法,所述方法包括以下步骤:(a)从包含多个哺乳动物细胞的哺乳动物细胞文库产生包含多个AAV载体的AAV文库,其中多个中的每个哺乳动物细胞单独地包含:至少一个工程化核酸序列、至少一个条形码序列,和至少一个核酸序列,所述至少一个核酸序列表达一个或多个形成AAV载体所必需的元件,其中每个AAV载体包含有包含条形码序列的AAV载体,所述条形码序列与产生AAV载体的哺乳动物细胞的至少一个条形码序列相同;(b)检测AAV文库中的一个或多个条形码序列。
实施方案279.如实施方案278所述的方法,其中检测条形码的步骤包括对条形码进行测序的步骤。
实施方案280.如实施方案279所述的方法,其中测序步骤包括下一代测序(NGS)步骤。
实施方案281.如实施方案278至280中任一项所述的方法,其还包括基于AAV文库中条形码的存在来鉴定产生AAV载体的哺乳动物细胞。
实施方案282.一种在哺乳动物细胞中产生AAV载体的方法,所述方法包括培养实施方案281中鉴定的哺乳动物细胞,从而产生AAV载体。
实施方案283.一种产生AAV载体的方法,所述方法包括:在使得哺乳动物细胞产生AAV载体的条件下培养如实施方案229至279中任一项所述的哺乳动物细胞群,其中产生的每个AAV载体包含有包含至少一个条形码序列的AAV载体,所述至少一个条形码序列与产生AAV载体的哺乳动物细胞的至少一个条形码序列相同。
实施方案284.如实施方案282至283所述的方法,其还包括分离AAV载体。
实施方案285.如实施方案280至284中任一项所述的方法,其中产生AAV载体的哺乳动物细胞是HEK细胞或CHO细胞。
实施方案286.如实施方案280至285中任一项所述的方法,其中所述方法提供了每个哺乳动物细胞至少约1x 103个AAV载体。
实施方案287.如实施方案280至286中任一项所述的方法,其中所述方法提供了每升培养物至少约1x 103个AAV载体。
实施方案288.一种通过如实施方案282至287中任一项所述的方法产生的AAV载体。
实施方案289.一种在哺乳动物细胞中产生AAV载体的方法,所述方法包括在一定条件下培养实施方案281中鉴定的哺乳动物细胞,从而产生AAV载体。
实施方案290.一种产生AAV载体的方法,所述方法包括:在使得哺乳动物细胞产生AAV载体的条件下培养哺乳动物细胞,其中哺乳动物细胞各自单独地包含:至少一个工程化核酸序列、至少一个条形码序列,和至少一个包含一个或多个形成AAV载体所必需的核酸序列的多核苷酸,并且其中每个AAV载体包含至少一个条形码序列,所述至少一个条形码序列与产生AAV载体的哺乳动物细胞的至少一个条形码序列相同。
实施方案291.如实施方案290所述的方法,其还包括分离AAV载体。
实施方案292.如实施方案290至291中任一项所述的方法,其中鉴定的哺乳动物细胞是HEK细胞或CHO细胞。
实施方案293.一种通过如实施方案289或290中任一项所述的方法产生的AAV载体。
实施方案294.一种腺相关病毒(AAV)载体文库,其包含至少1x103个AAV载体,其中每个AAV载体包含适合于鉴定AAV载体的条形码序列。
实施方案295.一种腺相关病毒(AAV)载体文库,其包含至少1x103个AAV载体,其中每个AAV载体包含适合于鉴定产生AAV载体的哺乳动物细胞或哺乳动物克隆细胞系的条形码序列。
实施方案296.如实施方案294或295所述的文库,其中AAV载体各自包含有包含编码转基因的核酸序列的AAV载体。
实施方案297.如实施方案294-296中任一项所述的文库,其中AAV载体由哺乳动物细胞或哺乳动物克隆细胞系产生。
实施方案298.一种包含多个哺乳动物细胞的哺乳动物细胞群,其中每个哺乳动物细胞包含:(a)至少一个工程化核酸序列,(b)至少一个条形码序列,和(c)至少一个包含一个或多个形成病毒载体所必需的核酸序列的多核苷酸,其中多个哺乳动物细胞产生多个病毒载体,其中多个哺乳动物细胞包含两个或更多个哺乳动物细胞子集,并且其中每个哺乳动物细胞子集包含子集独有的至少一个工程化核酸序列和至少一个条形码序列。
实施方案299.一种方法,所述方法包括以下步骤:(a)从包含多个哺乳动物细胞的哺乳动物细胞文库产生包含多个AAV载体的AAV文库,其中多个中的每个哺乳动物细胞单独地包含:至少一个工程化核酸序列、至少一个条形码序列,和至少一个核酸序列,所述至少一个核酸序列表达一个或多个形成AAV载体所必需的元件,其中多个哺乳动物细胞包含两个或更多个哺乳动物细胞子集,并且其中每个哺乳动物细胞子集包含子集独有的至少一个工程化核酸序列和至少一个条形码序列,并且其中多个中的每个AAV载体包含有包含条形码序列的AAV载体,所述条形码序列与产生AAV载体的哺乳动物细胞的至少一个条形码序列相同;(b)检测AAV文库中的一个或多个条形码序列。
实施方案300.如实施方案299所述的方法,其还包括确定AAV文库中一个或多个条形码序列中的每个的量。
实施方案301.如实施方案300所述的方法,其还包括将AAV文库中的一个或多个条形码序列的量与参考值进行比较。
实施方案302.如实施方案299或300所述的方法,其还包括确定AAV文库中一个或多个条形码序列中的至少两个的量。
实施方案303.如实施方案302所述的方法,其还包括将AAV文库中的一个或多个条形码序列中的至少两个的量相互比较。
实施方案304.如实施方案299至303中任一项所述的方法,其还包括基于AAV文库中条形码的存在来鉴定产生AAV载体的哺乳动物细胞或哺乳动物克隆细胞系。
实施方案305.一种包含多个哺乳动物细胞的哺乳动物细胞群,所述多个哺乳动物细胞各自单独地包含:(a)至少一个工程化核酸序列,(b)引导序列,其中引导序列与工程化核酸序列至少部分互补,(c)至少一个切除核酸,和(d)至少一个包含一个或多个产生病毒载体所必需的核酸序列的多核苷酸,其中多个哺乳动物细胞产生多个病毒载体。
实施方案306.如实施方案305所述的哺乳动物细胞群,其中至少一个切除核酸编码与核定位信号(NLS)融合的RNA引导的核酸内切酶,并且其中引导序列包含指导核酸内切酶至存在于哺乳动物细胞中的至少一个靶基因座的引导RNA。
实施方案307.如实施方案305或306所述的哺乳动物细胞群,其中与参考细胞群相比,至少一个工程化核酸序列在生产规范下提供了增加的病毒载体产生。
实施方案308.如实施方案305至307中任一项所述的哺乳动物细胞群,其中至少一个工程化核酸序列在当时现行的良好生产规范(cGMP)下提供了增加的产生的病毒载体。
实施方案309.如实施方案305至308中任一项所述的哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化核酸序列提供了增加的哺乳动物细胞群的活力。
实施方案310.如实施方案305至309中任一项所述的哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化核酸序列提供了增加的哺乳动物细胞群的病毒载体产生的持续时间。
实施方案311如实施方案305至310中任一项所述的哺乳动物细胞群,其中相对于参考细胞群,至少一个工程化核酸序列提供了增加的哺乳动物细胞群的基因组稳定性。
实施方案312.如实施方案306至311中任一项所述的哺乳动物细胞群,其中参考细胞群是:(i)不包含至少一个工程化核酸序列的可比较的哺乳动物细胞群;或(ii)能够产生病毒载体的标准细胞群。
实施方案313.如实施方案305至312中任一项所述的哺乳动物细胞群,其中多个哺乳动物细胞是或包括人胚肾(HEK)细胞、中国仓鼠卵巢(CHO)细胞、HeLa细胞、PER.C6细胞、HKB11细胞、CAP细胞、幼仓鼠肾成纤维细胞(BHK细胞)、Sp2/0细胞、NS0细胞、COS细胞、Vero细胞或其任何衍生物。
实施方案314.如实施方案305至313中任一项所述的哺乳动物细胞群,其中多个哺乳动物细胞是或包括HEK 293细胞、CHO细胞,或其衍生物。
实施方案315.如实施方案305至314中任一项所述的哺乳动物细胞群,其中至少一个工程化核酸序列是或包含哺乳动物细胞基因组内内源性编码序列的插入、缺失、取代、替换或重排。
实施方案316.如实施方案315所述的哺乳动物细胞群,其中内源性编码序列是或包含内源性基因或基因区段。
实施方案317.如实施方案305至316中任一项所述的哺乳动物细胞群,其中至少一个工程化核酸序列包含哺乳动物细胞基因组内内源性调控元件的插入、缺失、取代、替换或重排。
实施方案318.如实施方案317所述的哺乳动物细胞群,其中内源性调控元件是或包含内源性启动子序列和/或内源性增强子序列。
实施方案319.如实施方案305至318中任一项所述的哺乳动物细胞群,其中至少一个工程化核酸序列由单个工程化核酸序列组成。
实施方案320.如实施方案305至319中任一项所述的哺乳动物细胞群,其中至少一个工程化核酸序列包含异源性编码序列。
实施方案321.如实施方案320所述的哺乳动物细胞群,其中异源性编码序列是或包含异源性基因和/或异源性基因区段。
实施方案322.如实施方案305至319中任一项所述的哺乳动物细胞群,其中至少一个工程化核酸序列包含异源性调控元件。
实施方案323.如实施方案322所述的哺乳动物细胞群,其中异源性调控元件是或包含异源性启动子序列和/或异源性增强子序列。
实施方案324.如实施方案305至323中任一项所述的哺乳动物细胞群,其中病毒载体是腺相关病毒(AAV)载体。
实施方案325.如实施方案324所述的哺乳动物细胞群,其中AAV载体包含人AAV1衣壳蛋白;人AAV2衣壳蛋白;人AAV3b衣壳蛋白;人AAV4衣壳蛋白;人AAV5衣壳蛋白;人AAV6衣壳蛋白;人AAV7衣壳蛋白;人AAV8衣壳蛋白;人AAV9衣壳蛋白;人AAV10衣壳蛋白;人AAV11衣壳蛋白;人AAV12衣壳蛋白;或人AAV13衣壳蛋白。
实施方案326.如实施方案324所述的哺乳动物细胞群,其中AAV载体包含人祖先AAV衣壳蛋白。
实施方案327.如实施方案324至326中任一项所述的哺乳动物细胞群,其中AAV载体包括AAV载体,其中AAV载体包含一对反向末端重复序列(ITR),其是或包括人AAV1 ITR;人AAV2 ITR;人AAV3b ITR;人AAV4 ITR;人AAV5 ITR;人AAV6 ITR;人AAV7 ITR;人AAV8ITR;人AAV9 ITR;人AAV10 ITR;人AAV11 ITR;人AAV12ITR;或人AAV13 ITR。
实施方案328.如实施方案324中所述的哺乳动物细胞群,其中AAV载体包含牛AAV(b-AAV)衣壳蛋白;犬AAV(CAAV)衣壳蛋白;小鼠AAV1衣壳蛋白;山羊AAV衣壳蛋白;大鼠AAV衣壳蛋白;或禽AAV(AAAV)衣壳蛋白。
实施方案329.如实施方案325或328中所述的哺乳动物细胞群,其中AAV载体包括AAV载体,其中AAV载体包含一对ITR,其是或包括牛AAV(b-AAV)ITR;犬AAV(CAAV)ITR;小鼠AAV1 ITR;山羊AAV ITR;大鼠AAV ITR;或禽AAV(AAAV)ITR。
实施方案330.如实施方案324至329中任一项所述的哺乳动物细胞群,其中至少一个包含一个或多个形成病毒载体所必需的核酸序列的多核苷酸包含:AAV Rep基因、AAVCap基因、一种或多种腺病毒辅助基因,或其组合。
实施方案331.如实施方案305至330中任一项所述的哺乳动物细胞群,其中多个哺乳动物细胞中的每个还包含转基因,所述转基因是或包括报告基因、治疗基因、免疫原性基因、诊断基因或其组合。
实施方案332.如实施方案331所述的哺乳动物细胞群,其中多个哺乳动物细胞产生多个包含转基因的病毒载体。
提供以下实施例以便向熟练技术人员描述如何制备并使用本文所述的方法和组合物,并且不旨在限制本公开的范围。
实施例
实施例1:用于筛选AAV产生的基于CRISPR gRNA的文库技术,使用慢病毒载体进行基因组整合
本实施例描述了一种产生和筛选哺乳动物细胞文库的方法,以确定通过文库内的特定细胞扰动(例如,在含有特定文库变体的细胞中)产生的示例性病毒载体(例如,在此实施例中,AAV载体)的水平。具体而言,此实施例描述了一种将从哺乳动物细胞文库产生的单独病毒载体与它们所源自的特定细胞变体相关联的方法,其中用于创建哺乳动物细胞文库的gRNA是标识符。
实施例1.1:转染和构建哺乳动物细胞文库
本实施例描述了一种生成产生AAV载体的哺乳动物细胞文库的方法。示例性AAV载体宿主产生细胞系,例如293T,可以通过CRISPR核酸酶表达构建体的稳定或瞬时表达进行修饰。例如,CRISPR核酸酶表达构建体可以通过慢病毒整合SpCas9核酸酶(293T-Cas9)来稳定表达。针对基因组序列的gRNA序列文库(文库变体)将被合成并在两个AAV ITR序列之间克隆到载体(例如,质粒)中。ITR定界序列本身将在慢病毒5'LTR和相关慢病毒包装序列(包括Psi)的下游,以及慢病毒3'LTR的上游位于核酸上,适用于由LTR定界的转录RNA的第3代慢病毒包装并含有AAV ITR序列和转录RNA形式的gRNA表达盒。此类具有位于慢病毒LTR和Psi序列之间的AAV ITR的构建体将在本文中被称为AAV-in-Lenti。示例性AAV-in-Lenti构建体的示意图描绘于图2。AAV-in-Lenti质粒还可以含有选择标记基因,诸如抗生素抗性(例如,嘌呤霉素抗性)或荧光蛋白(例如,GFP),使含有最终整合文库构建体的哺乳动物细胞的未来选择或鉴定成为可能。如克隆到AAV-in-Lenti质粒中的gRNA文库可制备为纯化质粒池,用于转染到293T-Cas9细胞中。此质粒文库可以与编码病毒糖蛋白(例如VSV-G蛋白)的质粒以及第2代或第3代慢病毒包装质粒一起转染到293T细胞中,以提供最低限度的慢病毒Gag Pol、Rev基因功能。AAV-in-Lenti文库病毒载体将从培养物上清液中收集、过滤,并且浓缩或直接应用于293T-Cas9细胞系。用AAV-in-Lenti文库转导的细胞将经由它们的选择标记分离。转导后,将假定每个细胞的gRNA文库表达已通过稳定表达的SpCas9基因的作用导致gRNA靶向切割和插入缺失形成。然后可以用产生和包装重组AAV病毒载体所必要的质粒构建体(例如,形成病毒载体所必需的多核苷酸)(例如,pHelper和pAAV Rep-Cap)转染AAV-in-Lenti文库的纯化细胞群。这些质粒上存在的功能可以指导ITR限定的AAV载体基因组从慢病毒整合的ITR-in-Lenti序列的复制,并且这些ITR病毒载体构建体将被包装并释放到AAV载体中。使用这种AAV-in-Lenti方法,并滴定293T-Cas9细胞上的慢病毒包装的构建体,使控制MOI使得每个细胞接受大约一个侧翼为ITR的gRNA文库成员序列成为可能。
实施例1.2:产生和收获病毒载体
本实施例描述了一种产生和纯化从哺乳动物细胞文库产生的病毒载体的方法。使用本领域已知的方法产生病毒载体,例如,如Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所述。例如,转染后,24小时后更换培养基(DMEM w/Glutamax,Pen/Strep抗生素,5% FBS),并在72小时后添加50%培养基体积(500mL)。5天后,通过添加NaCl至150mM并在37℃下孵育2小时来裂解细胞。收集培养基-细胞混合物并在4℃下放置过夜。分离上清液并通过0.22μM过滤器(Corning 431098)过滤。将dH2O中的40%PEG-8000添加到病毒载体材料中至终浓度为8%,并在4℃下孵育过夜。将此材料以4800g离心20分钟,收集沉淀并溶解在7mL PBS中。然后如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所描述的对材料进行碘克沙醇梯度纯化,使用离心浓缩器(Millipore UFC910024)浓缩,并冷冻在-80℃下。
实施例1.3:病毒载体的NGS
本实施例描述了一种对纯化的AAV载体中包含的作为标识符的DNA,特别是gRNA编码序列进行测序的方法。从纯化的AAV载体池(例如,整个AAV载体池、来自选定细胞子集的AAV载体池或选定的AAV载体)中分离DNA。可以使用本领域已知的方法,诸如碱裂解,来纯化DNA。使用PCR自侧翼引物序列扩增DNA。纯化扩增产物,与具有同源悬突的测序衔接子(例如,Illumina衔接子)以50:1的扩增子:衔接子摩尔比混合,放入GGA反应(BsmBI和T4连接酶,NEB),并使循环100x过夜(16℃5分钟,然后37℃5分钟),概念上类似于Velculescu,等人,1995(Science第270卷,Issue 5235,第484-487页)。然后将此材料扩增以添加Illumina衔接子和索引,并使用NextSeq平台进行测序。宿主细胞产生株文库中含有的gRNA序列也将被扩增并以同样的方式制备用于测序。测量每个gRNA的序列读取频率,并确定它们在所有gRNA池内的相对丰度。从AAV载体相关DNA扩增的gRNA序列的相对丰度将与原始宿主细胞群中的gRNA序列丰度进行比较。通过这种方式,可以鉴定导致扰动的gRNA文库变体,所述扰动直接改变宿主细胞生物学并导致差异AAV载体产生,因为与参考宿主细胞群相比,所述gRNA文库变体在AAV载体DNA群中富集或去富集。
本文描述的方法还允许迭代轮次的文库筛选,其中在AAV载体群中发现显著富集,并确认在细胞中引入扰动以得到更高滴度的AAV载体产生的gRNA序列可以与AAV-in-LentigRNA文库独立引入宿主细胞,使突变的组合能够在连续几轮筛选和命中确认中“堆叠”。
实施例2:用于筛选AAV产生的基于条形码CRISPR gRNA的文库技术,使用慢病毒载体进行基因组整合
本实施例描述了一种产生和筛选哺乳动物细胞文库的方法,以确定通过文库内的特定细胞扰动(例如,在含有特定文库变体的细胞中)产生的示例性病毒载体(例如,AAV载体)的水平。具体而言,此实施例描述了一种将从哺乳动物细胞文库产生的单独病毒载体与它们所源自的特定细胞变体相关联的方法,其中将条形码用作标识符。此方法的示意图概览提供为图4。
实施例2.1:转染和构建哺乳动物细胞文库
本实施例描述了一种生成示例性的产生AAV载体的哺乳动物细胞文库的方法。示例性AAV载体宿主产生细胞系例如HEK 293T被修饰以表达CRISPR核酸酶表达构建体,例如Cas9。Cas9通过稳定的慢病毒整合在HEK 293T细胞中稳定表达。生成了在组成型启动子控制下稳定表达Cas9的HEK293T细胞,以及在诱导型启动子(例如,四环素诱导型启动子(TetON))控制下表达Cas9的细胞。使用组成型和诱导型表达Cas9的哺乳动物细胞中的模型gRNA证明了成功的基因编辑(数据未显示)。此外,在TetON启动子下表达Cas9的哺乳动物细胞中,基因编辑随着多西环素浓度的增加是剂量依赖性编辑,并且在不存在多西环素的情况下没有观察到编辑(数据未显示)。
针对各种基因组序列的示例性gRNA序列文库(文库变体)被合成并克隆到质粒中:构建了23个gRNA的试验文库和12,000个gRNA的更大筛选文库。
每个文库构建体包含位于两个AAV ITR序列之外的gRNA文库变体和位于两个AAVITR序列之间的对应条形码标识符序列。文库变体(gRNA)与条形码序列配对的相关配对可以在构建体设计和合成时预先确定,或者可以随机关联,取决于所使用的特定克隆方法,其中gRNA:条形码配对由克隆文库质粒DNA的NGS确定。ITR定界序列本身将在顺式作用整合序列诸如慢病毒5'LTR和相关慢病毒包装序列(包括Psi)的下游,以及慢病毒3'LTR的上游位于质粒上,适用于由LTR定界的转录RNA的第三代慢病毒包装并含有AAV ITR序列和转录RNA形式的gRNA表达盒。此种具有位于慢病毒LTR和Psi序列之间的AAV ITR的文库构建体将在本文中被称为AAV-in-Lenti,并且此种AAV-in-Lenti构建体的示例性示意图提供于图5,标记为pSFX-LV-AAV。生成了AAV-in-Lenti质粒,其还含有示例性选择标记基因、抗生素抗性基因(例如,嘌呤霉素抗性)和示例性荧光蛋白基因(例如,绿色荧光蛋白)的AAV有效载荷,使含有整合文库构建体并产生AAV载体的哺乳动物细胞的未来选择或鉴定成为可能。
如克隆到AAV-in-Lenti型式中的示例性gRNA文库可制备为纯化质粒池,用于转染到293T-Cas9细胞中。23个gRNA(试验测定)和12,000个gRNA(筛选测定)的AAV-in-Lenti质粒文库与编码病毒糖蛋白(例如VSV-G蛋白)的质粒和第二代或第三代慢病毒包装质粒一起转染到293T细胞中以提供最低限度的慢病毒Gag Pol、Rev基因功能。AAV-in-Lenti文库病毒载体将从培养物上清液中收集、过滤,并且浓缩或直接应用于293T-Cas9细胞系。用慢病毒包装的AAV-in-Lenti文库转导的细胞将经由它们的选择标记分离。转导后,将假定每个细胞的gRNA文库表达已通过稳定表达的SpCas9基因的作用导致gRNA靶向切割和插入缺失形成。然后将用产生和包装重组AAV病毒载体所必要的质粒构建体(例如,形成病毒载体所必需的多核苷酸)(例如,pHelper和pAAV Rep-Cap)转染纯化的文库群。这些质粒上存在的功能将指导ITR限定的AAV载体基因组从慢病毒整合的ITR-in-Lenti序列的复制,并且这些ITR病毒载体构建体将被包装并释放到AAV载体中。使用这种AAV-in-Lenti方法,并滴定293T-Cas9细胞上的慢病毒包装的构建体,使控制MOI使得每个细胞接受大约一个侧翼为ITR的gRNA文库成员序列成为可能。
实施例2.2:产生和收获病毒载体
使用本领域已知的方法产生病毒载体,例如,如上在实施例1.2和Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中描述的。
评估了从慢病毒整合、侧翼为ITR的模板DNA纯化的AAV的功能性。将纯化的AAV转导到HEK293T中,并用荧光显微镜观察绿色细胞。发现从AAV-in-Lenti文库产生的AAV可成功转导HEK293T细胞(数据未显示)。
实施例2.3:病毒载体的NGS
本实施例描述了一种扩增纯化的AAV载体中含有的DNA,特别是条形码序列和文库变体(例如,gRNA)和对其进行测序的方法。本公开涵盖以下认识:条形码序列可以鉴定产生AAV载体的哺乳动物细胞,以及哺乳动物细胞的对应的文库变体。此纯化、扩增和测序的示意图概览提供为图6。如实施例1.3中所述,使用本领域已知的方法分离DNA。纯化扩增产物,与具有同源悬突的测序衔接子(例如,Illumina衔接子)以50:1的扩增子:衔接子摩尔比混合,放入GGA反应(BsmBI和T4连接酶,NEB),并循环100x过夜(16℃5分钟,然后37℃5分钟),如上描述于实施例1.3中。然后将此材料扩增以添加Illumina衔接子和索引,并使用NextSeq平台进行测序。宿主细胞产生株文库中含有的gRNA序列也被扩增并使用基本上类似的方法进行测序。测量每个gRNA的序列读取频率,并确定它们在所有gRNA池内的相对丰度。将从AAV载体相关DNA扩增的gRNA序列的相对丰度与原始宿主细胞群中的gRNA序列丰度进行比较。通过这种方式,鉴定了导致扰动的gRNA文库变体,所述扰动直接改变宿主细胞生物学并导致差异AAV载体产生,因为与宿主细胞群相比,所述gRNA文库变体在AAV载体DNA群中富集或去富集。
23个gRNA的试验文库的筛选结果提供于图7中。将在表达Cas9的细胞中产生的AAV的三个生物学重复与在野生型(“WT”)细胞中产生的AAV的三个生物学重复进行比较。使用bowtie2软件将NGS数据与23池中的条形码集进行比对。Langmead B,Salzberg S.“Fastgapped-read alignment with Bowtie 2.”Nature Methods.2012,9:357-359。用DESeq2包评估相对条形码丰度以进行差异表达分析。Love MI,Huber W,Anders S(2014).“Moderated estimation of fold change and dispersion for RNA-seq data withDESeq2.”Genome Biology,15,550。图7中的结果证明筛选方案、NGS样品制备、测序和数据分析流程是有效的。此外,试验筛选的结果表明几个基因可能与增加或减少的AAV产生相关,具有高统计置信度(经调整的p值约0.1)。
12,000个gRNA的文库的筛选结果提供于图8中。将在表达Cas9的细胞中产生的AAV的三个生物学重复与在WT细胞中产生的AAV的三个生物学重复进行比较。使用bowtie2软件将NGS数据与12池中的条形码集进行比对,Langmead和Salzberg,同上。用MAGeCK包评估相对条形码丰度,并计算基因水平的富集和显著性(FDR)分数。Li,等人“MAGeCK enablesrobust identification of essential genes from genome-scale CRISPR/Cas9knockout screens.”(2014)Genome Biology 15:554。图8中的每个点表示对文库中单个基因的评分(根据4个对应的sgRNA分数计算)。图8中的结果证明筛选方案、NGS样品制备、测序和数据分析流程对于大规模筛选是有效的。此外,数据证明条形码可以用作鉴定与AAV产生的变化相关的文库变体的读数,因为许多细胞系(以及相关gRNA)与增加或减少的AAV产生相关。
在此实施例中描述的方法还允许迭代轮次的文库筛选,其中在AAV载体群中发现显著富集,并确认在细胞中引入扰动以得到更高滴度的AAV载体产生的gRNA序列可以与AAV-in-Lenti gRNA文库独立引入宿主细胞,使突变的组合能够在连续几轮筛选和命中确认中“堆叠”。
实施例3:用于筛选慢病毒产生的基于ORF的文库技术,使用DNA转座进行基因组整合
本实施例描述了一种产生和筛选哺乳动物细胞文库的方法,以确定通过文库内的特定细胞变体(例如,含有特定文库变体)产生的示例性病毒载体(例如,在此实施例中,慢病毒载体)的水平。具体而言,此实施例描述了一种将从哺乳动物细胞文库产生的单独病毒载体与它们所源自的特定细胞变体相关联的方法,其中用于创建哺乳动物细胞文库的转基因ORF是标识符。
实施例3.1:生成哺乳动物细胞文库
本实施例描述了一种在宿主产生细胞系(例如293T)内生成产生重组慢病毒载体的哺乳动物细胞文库的方法。在宿主细胞系中编码具有预期生物学功能的蛋白质基因产物(其序列设计成排除被下游测序制备步骤中的酶诸如BsmBI限制性酶切割)的ORF序列文库将被合成并在慢病毒5'LTR和相关慢病毒包装序列(包括Psi)的下游,以及慢病毒3'LTR的上游克隆到慢病毒转移质粒中,适用于由LTR定界的转录RNA的第3代慢病毒包装。此LTR限定的区段本身将位于DNA序列之间,使DNA能够酶促整合到宿主细胞基因组中,例如通过使用piggyBac转座酶经由从piggyBac DNA转座子系统中提取的侧翼同源反向末端重复序列(ITR)。此类具有位于转座子ITR之间的慢病毒LTR的构建体将在本文中被称为Lenti-in-Transposon。Lenti-in-Transposon质粒还将含有选择标记基因,诸如嘌呤霉素抗性或绿色荧光蛋白,使含有最终整合文库构建体的哺乳动物细胞的未来选择或鉴定成为可能。如克隆到Lenti-in-Transposon质粒中的ORF文库将被制备为纯化的质粒池,用于转染到293T细胞中。此质粒文库将与转座酶表达质粒(表达反式作用整合序列)一起转染到293T细胞中,以驱动酶促整合到宿主基因组内的随机位置。在此种转染后产生的基因组修饰的文库细胞将经由连续暴露于选择性剂(诸如嘌呤霉素)或通过基于荧光标记基因(诸如GFP)的荧光细胞分选来分离。然后以此方式分离的稳定克隆的文库群将用产生和包装重组慢病毒载体所必需的质粒构建体(例如,形成病毒载体所必需的多核苷酸)转染,诸如编码病毒糖蛋白(例如VSV-G蛋白)的质粒,以及第二代或第三代慢病毒包装质粒,以提供最低限度的慢病毒GagPol、Rev基因功能。这些质粒上存在的功能将指导ITR限定的慢病毒载体基因组从转座子整合的Lenti-in-Transposon序列的产生,并且这些慢病毒载体RNA将被包装并释放到慢病毒载体中。使用此Lenti-in-Transposon方法将使每个细胞的文库成员实现低拷贝数整合,使得在选择稳定文库群的过程中耗尽大量过量的非整合转染质粒DNA。
实施例3.2:产生和收获病毒载体
本实施例描述了一种产生和纯化从哺乳动物细胞文库产生的病毒载体的方法。使用本领域已知的方法产生病毒,例如,如Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所述。例如,转染后,24小时后更换培养基(DMEM w/Glutamax,Pen/Strep抗生素,5% FBS),并在48小时后添加50%培养基体积(500mL)。3天后,收集培养物上清液,并通过0.45um过滤器(Corning 431098)过滤。将dH2O中的40% PEG-8000添加到病毒载体材料中至终浓度为8%,并在4℃下孵育过夜。将此材料以1500g离心45分钟,收集沉淀并溶解。
实施例3.3:病毒载体的NGS。
本实施例描述了一种对纯化的慢病毒载体RNA,特别是ORF编码序列进行测序的方法。从整个纯化的慢病毒载体池中分离全体RNA。使用碱裂解纯化RNA。使用具有ORF下游结合位点的通用引物反向序列将RNA逆转录成cDNA。然后使用ORF序列侧翼的通用正向和反向引物对此cDNA进行PCR。纯化PCR的扩增产物,与具有同源悬突的Illumina衔接子以50:1的扩增子:衔接子摩尔比混合,放入GGA反应(BsmBI和T4连接酶,NEB),并使循环100x过夜(16℃5分钟,然后37℃5分钟),概念上类似于Velculescu,等人,1995(Science第270卷,Issue5235,第484-487页)。然后将此材料扩增以添加Illumina衔接子和索引,并使用NextSeq平台进行测序。宿主细胞产生株文库中含有的为整合DNA的ORF序列也将通过PCR被扩增并以同样的方式制备用于测序。将通过获得自每次Illumina读取的部分末端ORF序列对它们已知的全长序列的参考来鉴定每次读取ORF。因此测量每个ORF的频率,并确定它们在所有ORF池内的相对丰度。从慢病毒载体相关RNA扩增的ORF的相对丰度将与原始宿主细胞群中的ORF序列丰度进行比较。通过这种方式,可以鉴定导致扰动的ORF文库变体,所述扰动直接改变宿主细胞生物学并导致差异慢病毒载体产生,因为与宿主细胞群相比,所述ORF文库变体在慢病毒群中富集或去富集。
在此实施例中描述的方法还允许迭代轮次的文库筛选,其中在慢病毒群中发现显著富集,并确认在细胞中引入扰动以得到更高滴度的慢病毒载体产生的ORF序列可以与Lenti-in-Transposon ORF文库独立引入宿主细胞,使突变的组合能够在连续几轮筛选和命中确认中“堆叠”。
实施例4:用于筛选AAV产生的基于条形码CRISPR gRNA的文库技术,使用DNA转座进行基因组整合
本实施例描述了一种产生和筛选哺乳动物细胞文库的方法,以确定通过文库内的特定文库变体产生的示例性病毒载体(例如,AAV载体)的水平。具体而言,此实施例描述了哺乳动物细胞示例性文库的构建,所述哺乳动物细胞使用条形码标识符与基于CRISPRgRNA的文库,所述文库通过DNA转座被整合到哺乳动物细胞基因组中。此实施例还提供了一种将从所述哺乳动物细胞文库产生的单独病毒载体与它们所源自的特定细胞变体相关联的方法。此方法的示意图概览提供为图9。
实施例4.1:生成哺乳动物细胞文库
本实施例描述了一种在宿主产生细胞系(例如293T)内生成产生重组AAV载体的哺乳动物细胞文库的方法。AAV载体宿主产生细胞系,例如293T,通过CRISPR核酸酶表达构建体(例如,Cas9)的稳定慢病毒整合进行修饰,如上文实施例2.1中所述。针对基因组序列的gRNA序列文库(文库变体)被合成并在两个AAV ITR序列之外的位置克隆到质粒中,其中对应的条形码标识符序列位于两个AAV ITR序列之间。此ITR限定的区段位于DNA序列之间,使DNA能够酶促整合到宿主细胞基因组中,例如通过使用piggyBac转座酶经由从piggyBacDNA转座子系统中提取的侧翼同源反向末端重复序列(ITR)。此种具有位于转座子ITR之间的AAV ITR的构建体将在本文中被称为AAV-in-Transposon;此种AAV-in-Transposon构建体的示例性示意图提供于图5,标记为pSFX-PB-AAV。AAV-in-Transposon质粒还含有示例性选择标记基因、抗生素抗性基因(例如,嘌呤霉素抗性)和示例性荧光蛋白基因(例如,绿色荧光蛋白)的AAV有效载荷,使含有整合文库构建体并产生AAV载体的哺乳动物细胞的未来选择或鉴定成为可能。如克隆到AAV-in-Transposon质粒中的示例性条形码gRNA文库被制备为纯化质粒池,用于转染到293T细胞中。生成了23个gRNA(试验测定)和12,000个gRNA(筛选测定)的AAV-in-Transposon质粒文库。这些质粒文库与转座酶表达质粒(表达反式作用整合序列)一起转染到293T细胞中,以驱动酶促整合到宿主基因组内的随机位置。
在此种转染后产生的基因组修饰的文库细胞经由连续暴露于选择性剂(诸如嘌呤霉素)或通过基于荧光标记基因(诸如GFP)的荧光细胞分选来分离。用AAV-in-Transposon质粒转导组成型表达Cas9的HEK293T细胞和表达诱导型TetON-Cas9的HEK293T细胞。用荧光显微镜观察荧光细胞,并在所有转座酶:转座子比率下观察到荧光细胞,表明整合成功。
然后用产生和包装重组AAV病毒载体所必要的质粒构建体(例如,形成病毒载体所必需的多核苷酸)(例如,pHelper和pAAV Rep-Cap)转染纯化的细胞文库群。这些质粒上存在的功能指导ITR限定的AAV载体基因组从基因组整合的AAV-in-Transposon序列的复制,并且这些ITR病毒载体构建体被包装并释放到AAV载体中。
相对于质粒标准,通过qPCR测量转座子拷贝数;基因组拷贝数最初范围为3-8,取决于转座子与转座酶的比率(数据未显示)。获得自分选群的AAV滴度与分选群的GFP表达水平成正比。
转染的转座酶:转座子质粒的比率得到优化,使得转座子整合细胞的拷贝数低于以前观察到的,使大多数细胞仅接受大约1个遗传扰动(1个gRNA文库变体/来自文库的条形码对)。将具有顺式作用转座子的质粒与含有编码piggyBac转座酶的反式作用序列的质粒以各种转座酶:转座子比率共转染,以获得较低的拷贝数。拷贝数随着转座子质粒相对量的增加而增加,成功鉴定了优化的转座酶:转座子比率,以实现每个细胞大约1个拷贝(数据未显示)。
此实施例证明了转染的转座酶:转座子质粒比率的成功优化,使得大多数细胞仅接受1个遗传扰动(1个sgRNA:来自库的条形码对)。因此,此实施例证明了示例性AAV-in-Transposon方法实现每个细胞的文库变体的低拷贝数整合,使得在选择稳定文库群的过程中耗尽大量过量的非整合转染质粒DNA。
实施例4.2:产生和收获病毒载体
本实施例描述了一种产生和纯化从哺乳动物细胞文库产生的病毒载体的方法。使用本领域已知的方法产生病毒载体,例如,如Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所述。例如,转染后,24小时后更换培养基(DMEM w/Glutamax,Pen/Strep抗生素,5% FBS),并在72小时后添加50%培养基体积(500mL)。5天后,通过添加NaCl至150mM并在37℃下孵育2小时来裂解细胞。收集培养基-细胞混合物并在4℃下放置过夜。分离上清液并通过0.22μM过滤器(Corning 431098)过滤。将dH2O中的40%PEG-8000添加到病毒载体材料中至终浓度为8%,并在4℃下孵育过夜。将此材料以4800g离心20分钟,收集沉淀并溶解在7mL PBS中。然后如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所描述的对材料进行碘克沙醇梯度纯化,使用离心浓缩器(Millipore UFC910024)浓缩,并冷冻在-80℃下。
评估了从转座酶整合、ITR侧翼模板DNA纯化的AAV的功能性。将纯化的AAV转导到HEK293T中,并用荧光显微镜观察绿色细胞。发现从AAV-in-Transposon文库产生的AAV可成功转导HEK293T细胞(数据未显示)。
实施例4.3:病毒载体的NGS。
本实施例描述了一种对纯化的AAV载体中包含的DNA,特别是对应于文库gRNA的条形码序列进行测序的方法。此纯化、扩增和测序的示意图概览提供为图6。如实施例1.3中所述使用本领域已知的方法分离DNA。使用PCR自侧翼引物序列扩增DNA。纯化扩增产物,与具有同源悬突的Illumina衔接子以50:1的扩增子:衔接子摩尔比混合,放入GGA反应(BsmBI和T4连接酶,NEB),并使循环100x过夜(16℃5分钟,然后37℃5分钟),概念上类似于Velculescu,等人,1995(Science第270卷,Issue 5235,第484-487页)。然后将此材料扩增以添加Illumina衔接子和索引,并使用NextSeq平台进行测序。宿主细胞产生株文库中含有的gRNA序列也将被扩增并以同样的方式制备用于测序。测量每个gRNA的序列读取频率,并确定它们在所有gRNA池内的相对丰度。从AAV载体相关DNA扩增的gRNA序列的相对丰度将与原始宿主细胞群中的gRNA序列丰度进行比较。通过这种方式,可以鉴定导致扰动的gRNA文库变体,所述扰动直接改变宿主细胞生物学并导致差异AAV载体产生,因为与宿主细胞群相比,所述gRNA文库变体在AAV载体DNA群中富集或去富集。
23个gRNA的试验文库的筛选结果提供于图10中。将在表达Cas9的细胞中产生的AAV的三个生物学重复与在野生型(“WT”)细胞中产生的AAV的三个生物学重复进行比较。独立地,将在四环素诱导型启动子(“TetON”)控制下表达Cas9的细胞中产生的AAV的三个生物学重复与在野生型(“WT”)细胞中产生的AAV的三个生物学重复进行了比较。使用bowtie2软件将NGS数据与23池中的条形码集进行比对。Langmead B,Salzberg S.“Fast gapped-readalignment with Bowtie 2.”Nature Methods.2012,9:357-359。用DESeq2包评估相对条形码丰度以进行差异表达分析。Love MI,Huber W,Anders S(2014).“Moderated estimationof fold change and dispersion for RNA-seq data with DESeq2.”Genome Biology,15,550。图10中的结果证明筛选方案、NGS样品制备、测序和数据分析流程是有效的。此外,试验筛选的结果表明几个基因可能与增加或减少的AAV产生相关,具有高统计置信度(经调整的p值约0.1)。
12,000个gRNA的文库的筛选结果提供于图11中。将在表达Cas9的细胞中产生的AAV的三个生物学重复与在WT细胞中产生的AAV的三个生物学重复进行比较。使用bowtie2软件将NGS数据与12,000池中的条形码集进行比对,Langmead和Salzberg,同上。用MAGeCK包评估相对条形码丰度,并计算基因水平的富集和显著性(FDR)分数。Li,等人“MAGeCKenables robust identification of essential genes from genome-scale CRISPR/Cas9 knockout screens.”(2014)Genome Biology 15:554。图11中的每个点表示文库中单个基因的评分(根据4个对应的sgRNA分数计算)。图11中的结果证明筛选方案、NGS样品制备、测序和数据分析流程对于大规模筛选是有效的。此外,数据证明条形码可以用作鉴定与AAV产生的变化相关的文库变体的读数,因为许多细胞系(以及相关gRNA)与增加或减少的AAV产生相关。
因此,此实施例证实了使用各种整合方法(例如,慢病毒整合和转座子介导整合)的文库构建都是有效的。
在此实施例中描述的方法还允许迭代轮次的文库筛选,其中在AAV载体群中发现显著富集,并确认在细胞中引入扰动以得到更高滴度的AAV载体产生的gRNA序列可以与AAV-in-Lenti gRNA文库独立引入宿主细胞,使突变的组合能够在连续几轮筛选和命中确认中“堆叠”。
实施例5:用于筛选AAV产生的基于条形码ORF的文库技术,经由靶向核酸酶切割进行基因组整合
本实施例描述了一种产生和筛选哺乳动物细胞文库的方法,以确定通过文库内的特定细胞变体(例如,含有特定文库变体)产生的示例性病毒载体(例如,在此实施例中,AAV载体)的水平。具体而言,此实施例描述了一种将从哺乳动物细胞文库产生的单独病毒载体与它们所源自的特定细胞变体相关联的方法,其中用于创建哺乳动物细胞文库的每个转基因ORF文库变体与DNA条形码配对,所述DNA条形码是标识符。
实施例5.1:生成哺乳动物细胞文库
本实施例描述了一种在宿主产生细胞系(例如293T)内生成产生重组AAV载体的哺乳动物细胞文库的方法。在宿主细胞系中编码具有预期生物学功能的蛋白质基因产物的ORF序列文库(文库变体)将被合成并与DNA条形码序列一起克隆到质粒中。此ORF:DNA条形码序列配对可以在构建体设计和合成时预先确定,或者可以随机关联,取决于所使用的特定克隆方法,其中ORF:条形码配对由克隆文库质粒DNA的NGS确定。此文库将构建成条形码序列位于两个AAV ITR序列之间,对应的ORF和ORF表达调控序列(诸如启动子和poly-A信号)位于ITR限定区域之外。ITR定界区域和ORF表达单元的整个连续序列的侧翼上游和下游将是足以作为同源臂(顺式作用整合序列)起作用的序列,用于核酸酶刺激的基于同源重组的靶向整合到宿主细胞基因组基因座,诸如AAVS1基因座中。此种具有位于AAVS1同源臂之间的AAV ITR的构建体将在本文中被称为AAV-in-Locus。AAV-in-Locus质粒还将含有选择标记基因,诸如嘌呤霉素抗性或绿色荧光蛋白,使含有最终整合文库构建体的哺乳动物细胞的未来选择或鉴定成为可能。如克隆到AAV-in-Locus质粒中的条形码ORF文库将被制备为纯化的质粒池,用于转染到293T细胞中。此质粒文库将与编码SpCas9核酸酶的质粒和靶向AAVS1基因座的gRNA一起转染到293T细胞中。在此种转染后产生的基因组修饰的文库细胞将经由连续暴露于选择性剂(诸如嘌呤霉素)或通过基于荧光标记基因(诸如GFP)的荧光细胞分选来分离。然后将用产生和包装重组AAV载体所必需的质粒构建体(例如,形成病毒载体所必需的多核苷酸)(例如,pHelper和pAAV Rep-Cap)转染以此方式分离的文库群的稳定克隆。这些质粒上存在的功能将指导ITR限定的AAV载体基因组从AAVS1整合的ITR-in-Locus序列的复制,并且这些ITR载体DNA将被包装并释放到AAV载体中。使用此AAV-in-Locus方法,通过将可能的在靶整合事件仅限制在宿主细胞姐妹染色单体内存在的AAVS1基因座的拷贝,将实现对每个细胞文库成员的拷贝数的控制。
实施例5.2:产生和收获病毒载体
本实施例描述了一种产生和纯化从哺乳动物细胞文库产生的病毒载体的方法。如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所述产生病毒载体。简单来说,转染后,24小时后更换培养基(DMEM w/Glutamax,Pen/Strep抗生素,5% FBS),并在72小时后添加50%培养基体积(500mL)。5天后,通过添加NaCl至150mM并在37℃下孵育2小时来裂解细胞。收集培养基-细胞混合物并在4℃下放置过夜。分离上清液并通过0.22μM过滤器(Corning 431098)过滤。将dH2O中的40% PEG-8000添加到病毒载体材料中至终浓度为8%,并在4℃下孵育过夜。将此材料以4800g离心20分钟,收集沉淀并溶解在7mL PBS中。然后如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所描述的对材料进行碘克沙醇梯度纯化,使用离心浓缩器(Millipore UFC910024)浓缩,并冷冻在-80℃下。
实施例5.3:病毒载体的NGS
本实施例描述了一种对纯化的AAV载体中包含的DNA,特别是条形码序列进行测序的方法。从整个纯化的AAV病毒载体池中分离全体DNA。使用碱裂解纯化DNA。使用PCR自侧翼引物序列扩增DNA。纯化扩增产物,与具有同源悬突的Illumina衔接子以50:1的扩增子:衔接子摩尔比混合,放入GGA反应(BsmBI和T4连接酶,NEB),并使循环100x过夜(16℃5分钟,然后37℃5分钟),概念上类似于Velculescu,等人,1995(Science第270卷,Issue 5235,第484-487页)。然后将此材料扩增以添加Illumina衔接子和索引,并使用NextSeq平台进行测序。宿主细胞产生株文库中含有的条形码序列也将被扩增并以同样的方式制备用于测序。测量每个条形码的序列读取频率,并确定它们在所有条形码池内的相对丰度。从AAV载体相关DNA扩增的条形码序列的相对丰度将与原始宿主细胞群中的条形码序列丰度进行比较。因为每个条形码都与特定的ORF文库成员具有已知的关联,可以鉴定导致扰动的ORF文库变体,所述扰动直接改变宿主细胞生物学并导致差异AAV载体产生,因为与宿主细胞群相比,ORF文库成员的相关条形码在AAV载体DNA群中富集或去富集。
在此实施例中描述的方法还允许迭代轮次的文库筛选,其中在AAV群中发现显著富集,并确认在细胞中引入扰动以得到更高滴度的AAV载体产生的具有条形码的ORF序列可以与AAV-in-Locus条形码ORF文库独立引入宿主细胞,使突变的组合能够在连续几轮筛选和命中确认中“堆叠”。
实施例6:用于筛选游离质粒DNA上AAV产生的基于条形码ORF的文库技术
本实施例描述了一种产生和筛选哺乳动物细胞文库的方法,以确定通过文库内的特定细胞变体(例如,含有特定文库变体)产生的示例性病毒载体(例如,在此实施例中,AAV载体)的水平。具体而言,此实施例描述了一种将从哺乳动物细胞文库产生的单独病毒载体与它们所源自的特定细胞变体相关联的方法,其中用于创建哺乳动物细胞文库的每个转基因ORF文库变体与DNA条形码配对,所述DNA条形码是标识符。
实施例6.1:生成哺乳动物细胞文库
本实施例描述了一种在宿主产生细胞系(例如,293T)内生成产生重组AAV载体的哺乳动物细胞文库的方法。在宿主细胞系中编码具有预期生物学功能的蛋白质基因产物的ORF序列文库(文库变体)将被合成并与DNA条形码序列一起克隆到质粒中。此ORF:DNA条形码序列配对可以在构建体设计和合成时预先确定,或者可以随机关联,取决于所使用的特定克隆方法,其中ORF:条形码配对由克隆文库质粒DNA的NGS确定。此文库将构建成条形码序列位于两个AAV ITR序列之间,并且将被转录到poly-A尾mRNA转录物中,其中此转录物是侧翼为ITR的转录单位或跨越居间ITR序列的转录单位。对应的ORF和ORF表达调控序列诸如启动子和poly-A信号将位于ITR限定区域之外。ITR定界区域和ORF表达单元的整个连续序列将包含在环状质粒DNA骨架中。此种具有AAV-on-plasmid的构建体还将含有选择标记基因,诸如嘌呤霉素抗性或绿色荧光蛋白,使含有质粒构建体以及SV40复制起点的哺乳动物细胞的未来选择或鉴定成为可能,促进在后续的培养传代过程中保留转染细胞内的质粒。如克隆到AAV-on-plasmid中的条形码ORF文库将被制备为纯化的质粒池,用于转染到293T细胞中。然后将用产生和包装重组AAV载体所必需的质粒构建体(例如,形成病毒载体所必需的多核苷酸)(例如,pHelper和pAAV Rep-Cap)转染以此方式转染的细胞文库群。这些质粒上存在的功能将指导ITR限定的AAV载体基因组从ITR-on-Plasmid序列的复制,并且这些ITR载体DNA将被包装并释放到AAV载体中。以低效率转染细胞将限制每个细胞的独特质粒数量,与293T细胞内的SV40起点依赖性复制一起,使得能够经由质粒携带的选择标记在文库细胞纯化步骤过程中保留低拷贝转染。此外,在表达mRNA转录物中包含条形码将促进每个细胞、多拷贝质粒文库成员身份的解卷积,这首先通过将可检测文库成员限制为在宿主细胞核内实际发挥作用且未保留在细胞其他地方(诸如胞内体或细胞质)的那些质粒,其次通过使用建立的单细胞条形码化和RNA测序方法(诸如10x Genomics)捕获条形码序列来促进每个细胞多重质粒文库成员的鉴定。使用此AAV-on-Plasmid方法将限制每个宿主细胞的多重文库成员数量的问题,同时促进每个细胞多拷贝身份的解卷积。然后可以将这些每个细胞的组合文库身份与AAV载体富集条形码相关联,以自信地鉴定多重文库群中的命中。
实施例6.2:产生和收获病毒载体
本实施例描述了一种产生和纯化从哺乳动物细胞文库产生的病毒载体的方法。如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所述产生病毒载体。简单来说,转染后,24小时后更换培养基(DMEM w/Glutamax,Pen/Strep抗生素,5% FBS),并在72小时后添加50%培养基体积(500mL)。5天后,通过添加NaCl至150mM并在37℃下孵育2小时来裂解细胞。收集培养基-细胞混合物并在4℃下放置过夜。分离上清液并通过0.22μM过滤器(Corning 431098)过滤。将dH2O中的40% PEG-8000添加到病毒载体材料中至终浓度为8%,并在4℃下孵育过夜。将此材料以4800g离心20分钟,收集沉淀并溶解在7mL PBS中。然后如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所描述的对材料进行碘克沙醇梯度纯化,使用离心浓缩器(Millipore UFC910024)浓缩,并冷冻在-80℃下。
实施例6.3:病毒载体和每个细胞文库成员代表(Representation)的NGS
本实施例描述了一种对纯化的AAV载体中包含的DNA,特别是条形码序列进行测序的方法。从整个纯化的AAV病毒载体池中分离全体DNA。使用碱裂解纯化DNA。使用PCR自侧翼引物序列扩增DNA。纯化扩增产物,与具有同源悬突的Illumina衔接子以50:1的扩增子:衔接子摩尔比混合,放入GGA反应(BsmBI和T4连接酶,NEB),并使循环100x过夜(16℃5分钟,然后37℃5分钟),概念上类似于Velculescu,等人,1995(Science第270卷,Issue 5235,第484-487页)。然后将此材料扩增以添加Illumina衔接子和索引,并使用NextSeq平台进行测序。宿主细胞产生株文库中含有的条形码序列也将被扩增并以同样的方式制备用于测序。测量每个条形码的序列读取频率,并确定它们在所有条形码池内的相对丰度。从AAV载体相关DNA扩增的条形码序列的相对丰度将与原始宿主细胞群中的条形码序列丰度进行比较。因为每个条形码都与特定的ORF文库变体具有已知的关联,可以鉴定导致扰动的ORF文库变体,所述扰动直接改变宿主细胞生物学并导致差异AAV载体产生,因为与宿主细胞群相比,ORF文库变体的相关条形码在AAV载体DNA群中富集或去富集。有了足够高倍的细胞文库覆盖率和测序深度,真正富集的命中将在固有多重转染质粒文库中被鉴定。此外,为了简化多重转染文库中的命中鉴定问题,可以对产生者群进行单细胞测序。产生者细胞将在细胞mRNA的逆转录过程中被单独标记(10X Genomics),将细胞身份序列附加到细胞mRNA,从而标记细胞文库群中含有的所有条形码。然后可以通过PCR特异性扩增细胞身份序列标记的条形码cDNA,并且这些扩增子可以如上所述制备以用于由Illumina进行NGS。这些扩增子的测序将揭示细胞文库群中存在的每个细胞文库成员组合,允许辨别单个或组合的命中与错误富集的‘搭便车者(hitchhiker)’。
在此实施例中描述的方法还允许迭代轮次的文库筛选,其中在AAV载体群中发现显著富集,并确认在细胞中引入扰动以得到更高滴度的AAV载体产生的具有条形码的ORF序列可以与AAV-on-Plasmid条形码ORF文库独立引入宿主细胞,使突变的组合能够在连续几轮筛选和命中确认中“堆叠”。
实施例7:用于筛选游离质粒DNA上AAV产生的基于条形码CRISPR gRNA的文库技术
本实施例描述了一种产生和筛选哺乳动物细胞文库的方法,以确定通过文库内的特定细胞变体(例如,含有特定文库变体)产生的示例性病毒载体(例如,在此实施例中,AAV载体)的水平。具体而言,此实施例描述了一种将从哺乳动物细胞文库产生的单独病毒载体与它们所源自的特定细胞变体相关联的方法,其中用于创建哺乳动物细胞文库的每个转基因gRNA文库变体与DNA条形码配对,所述DNA条形码是标识符。此方法的示意图概览提供为图12。
实施例7.1:生成哺乳动物细胞文库
本实施例描述了一种在宿主产生细胞系(例如293T)内生成产生重组AAV载体的哺乳动物细胞文库的方法。在宿主细胞系中编码具有预期生物学功能的蛋白质基因产物的条形码CRISPR gRNA序列文库(文库变体)被合成并与DNA条形码序列一起克隆到质粒中。此gRNA:DNA条形码序列配对可以在构建体设计和合成时预先确定,或者可以随机关联,取决于所使用的特定克隆方法,其中gRNA:条形码配对由克隆文库质粒DNA的NGS确定。此文库被构建成条形码序列位于两个AAV ITR序列之间。对应的gRNA和gRNA表达调控序列诸如启动子将位于ITR限定区域之外。ITR定界区域和gRNA表达单元的整个连续序列将包含在环状质粒DNA骨架中,此种游离构建体的示例性示意图提供于图5中,标记为pSFX-AAV。此类AAV-on-plasmid构建体还含有示例性选择标记基因、抗生素抗性基因(例如,嘌呤霉素抗性)和示例性荧光蛋白基因(例如,绿色荧光蛋白)的AAV有效载荷,使含有整合文库构建体并产生AAV载体以及含有SV40复制起点的哺乳动物细胞的未来选择或鉴定成为可能,促进在后续的培养传代过程中保留转染细胞内的质粒。如克隆到AAV-on-plasmid中的条形码gRNA文库被制备为纯化的质粒池,用于转染到293T细胞中。然后用产生和包装重组AAV载体所必需的质粒构建体(例如,形成病毒载体所必需的多核苷酸)(例如,pHelper和pAAV Rep-Cap)转染以此方式转染的细胞文库群。这些质粒上存在的功能指导ITR限定的AAV载体基因组从ITR-on-Plasmid序列的复制,并且这些ITR载体DNA被包装并释放到AAV载体中。以低效率转染细胞可以限制每个细胞的独特质粒数量,与293T细胞内的SV40起点依赖性复制一起,使得能够经由质粒携带的选择标记在文库细胞纯化步骤过程中保留低拷贝转染。此外,在表达mRNA转录物中包含条形码促进每个细胞、多拷贝质粒文库成员身份的解卷积,这首先通过将可检测文库成员限制为在宿主细胞核内实际发挥作用且未保留在细胞其他地方(诸如胞内体或细胞质)的那些质粒,其次通过使用建立的单细胞条形码化和RNA测序方法(诸如10xGenomics)捕获条形码序列来促进每个细胞多重质粒文库成员的鉴定。使用此AAV-on-Plasmid方法限制每个宿主细胞的多重文库成员数量,同时另外促进每个细胞多拷贝身份的解卷积。然后将这些每个细胞的组合文库身份与AAV载体富集条形码相关联,以自信地鉴定多重文库群中的命中。
实施例7.2:产生和收获病毒载体
本实施例描述了一种产生和纯化从哺乳动物细胞文库产生的病毒载体的方法。如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所述产生病毒载体。简单来说,转染后,24小时后更换培养基(DMEM w/Glutamax,Pen/Strep抗生素,5% FBS),并在72小时后添加50%培养基体积(500mL)。5天后,通过添加NaCl至150mM并在37℃下孵育2小时来裂解细胞。收集培养基-细胞混合物并在4℃下放置过夜。分离上清液并通过0.22μM过滤器(Corning 431098)过滤。将dH2O中的40% PEG-8000添加到病毒载体材料中至终浓度为8%,并在4℃下孵育过夜。将此材料以4800g离心20分钟,收集沉淀并溶解在7mL PBS中。然后如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所描述的对材料进行碘克沙醇梯度纯化,使用离心浓缩器(Millipore UFC910024)浓缩,并冷冻在-80℃下。
实施例7.3:病毒载体和每个细胞文库成员代表的NGS
本实施例描述了一种对纯化的AAV载体中包含的DNA,特别是条形码序列进行测序的方法。从整个纯化的AAV病毒载体池中分离全体DNA。使用碱裂解纯化DNA。使用PCR自侧翼引物序列扩增DNA。纯化扩增产物,与具有同源悬突的Illumina衔接子以50:1的扩增子:衔接子摩尔比混合,放入GGA反应(BsmBI和T4连接酶,NEB),并使循环100x过夜(16℃5分钟,然后37℃5分钟),概念上类似于Velculescu,等人,1995(Science第270卷,Issue 5235,第484-487页)。然后将此材料扩增以添加Illumina衔接子和索引,并使用NextSeq平台进行测序。宿主细胞产生株文库中含有的条形码序列也被扩增并以同样的方式制备用于测序。测量每个条形码的序列读取频率,并确定它们在所有条形码池内的相对丰度。将从AAV载体相关DNA扩增的条形码序列的相对丰度与原始宿主细胞群中的条形码序列丰度以及不表达Cas9且因此未进行基因组修饰的转染细胞进行比较。因为每个条形码都与特定的gRNA文库变体具有已知的关联,可以鉴定导致扰动的gRNA文库变体,所述扰动直接改变宿主细胞生物学并导致差异AAV载体产生,因为与宿主细胞群和/或从不表达Cas9的细胞(WT细胞)分离的AAV相比,gRNA文库变体的相关条形码在AAV载体DNA群中富集或去富集。有了足够高倍的细胞文库覆盖率和测序深度,真正富集的命中可以在固有多重转染质粒文库中被鉴定。此外,为了简化多重转染文库中的命中鉴定问题,可以对产生者群进行单细胞测序。产生者细胞将在细胞mRNA的逆转录过程中被单独标记(10X Genomics),将细胞身份序列附加到细胞mRNA,从而标记细胞文库群中含有的所有条形码。然后可以通过PCR特异性扩增细胞身份序列标记的条形码cDNA,并且这些扩增子可以如上所述制备以用于由Illumina进行NGS。这些扩增子的测序将揭示细胞文库群中存在的每个细胞文库成员组合,允许辨别单个或组合的命中与错误富集的‘搭便车者(hitchhiker)’。
23个gRNA的试验文库的筛选结果提供于图13中。将在表达Cas9的细胞中产生的AAV的三个生物学重复与在野生型(“WT”)细胞中产生的AAV的三个生物学重复进行比较。使用bowtie2软件将NGS数据与23池中的条形码集进行比对。Langmead B,Salzberg S.“Fastgapped-read alignment with Bowtie 2.”Nature Methods.2012,9:357-359。用DESeq2包评估相对条形码丰度以进行差异表达分析。Love MI,Huber W,Anders S(2014).“Moderated estimation of fold change and dispersion for RNA-seq data withDESeq2.”Genome Biology,15,550。图13中的结果证明筛选方案、NGS样品制备、测序和数据分析流程是有效的。此外,试验筛选的结果表明几个基因可能与增加或减少的AAV产生相关,具有高统计置信度(经调整的p值约0.1)。
12,000个gRNA的文库的筛选结果提供于图14中。将在表达Cas9的细胞中产生的AAV的三个生物学重复与在WT细胞中产生的AAV的三个生物学重复进行比较。使用bowtie2软件将NGS数据与12,000个条形码池中的条形码集进行比对,Langmead和Salzberg,同上。用MAGeCK包评估相对条形码丰度,并计算基因水平的富集和显著性(FDR)分数。Li,等人“MAGeCK enables robust identification of essential genes from genome-scaleCRISPR/Cas9 knockout screens.”(2014)Genome Biology 15:554。图14中的每个点表示文库中单个基因的评分(根据4个对应的sgRNA分数计算)。图14中的结果证明筛选方案、NGS样品制备、测序和数据分析流程对于大规模筛选是有效的。此外,数据证明条形码可以用作鉴定与AAV产生的变化相关的文库变体的读数,因为许多细胞系(以及相关gRNA)与增加或减少的AAV产生相关。
合并的VectorSelect筛选鉴定了数百个与增加的AAV产生相关的基因,并且我们选择了14个进行独立验证。因此,此实施例证实了使用各种整合方法(例如,慢病毒整合和转座子介导整合)的文库构建都是有效的。基于筛选数据,我们经由用CRISPRMax试剂反向转染将14个基因中每个基因的表现最佳的sgRNA作为与Cas9的核糖核蛋白(RNP)复合物递送至HEK293T细胞。每个sgRNA都是独立递送的,生成了单独的修饰细胞组和作为参考样品(WT)的未修饰组。我们允许基因编辑的细胞在RNP递送后恢复8天,然后从每个细胞组中接种相同数量的细胞,并通过三重转染AAV转移质粒(pTransfer)、辅助质粒(pHelper)和具有AAV2 rep和cap基因的质粒(pRepCap)来产生AAV。还包括阴性对照组,其是通过仅将pTransfer转染到未修饰的细胞(WT–RepCap)中制成的。
对所有编辑细胞组的AAV产生在生物学上进行一式三份。使用市售AAV2Pro纯化试剂盒(例如,来自Takara)收获AAV,然后用DNase I处理以去除未封装的DNA。使用ddPCR和基于EvaGreen的方案测量纯化产物中AAV载体基因组的数量,所述方案使用针对AAV ITR区域的引物。
通过ddPCR对每个细胞组进行的载体基因组定量示于图15。结果表明,AAV在所有组中均成功产生,这是通过相对于RepCap组(阴性对照)的较大信号差异来测量的,RepCap组不应产生AAV并提供测定中的背景信号量度。从此数据中得出的一个关键结论是,相对于未修饰的HEK293T细胞组,所有14个基因敲除组都具有增加的AAV产生,在一些情况下增加了近10倍(基因13和基因14)。这证实了VectorSelect高通量合并筛选的结果,并验证了平台快速鉴定候选细胞扰动的能力,所述扰动在更传统的低通量平行筛选测定中独立测试时具有高验证可能。
在此实施例中描述的方法还允许迭代轮次的文库筛选,其中在AAV载体群中发现显著富集,并确认在细胞中引入扰动以得到更高滴度的AAV载体产生的具有条形码的gRNA序列可以与AAV-on-Plasmid条形码gRNA文库独立引入宿主细胞,使突变的组合能够在连续几轮筛选和命中确认中“堆叠”。
实施例8:用于筛选AAV产生的多重gRNA文库技术,经由慢病毒载体进行基因组整合。
本实施例描述了一种产生和筛选哺乳动物细胞文库的方法,以确定通过文库内的特定细胞变体(例如,含有特定文库变体)产生的示例性病毒载体(例如,在此实施例中,AAV载体)的水平。具体而言,此实施例描述了一种将从多重gRNA基因组编辑的哺乳动物细胞文库产生的单独病毒载体与它们所源自的特定细胞变体相关联的方法,其中DNA和RNA编码的条形码是标识符。
实施例8.1:生成哺乳动物细胞文库
本实施例描述了一种生成产生AAV的哺乳动物细胞文库的方法。AAV宿主产生细胞系,例如293T,将通过CRISPR核酸酶表达构建体(例如,SpCas9核酸酶(293T-Cas9))的稳定慢病毒整合进行修饰。针对基因组序列的gRNA序列文库(文库变体)将被合成并克隆到慢病毒载体质粒中,使得gRNA编码序列也包含在源自慢病毒载体的poly-A尾mRNA转录物中。单独地,作为标识符起作用的条形码序列将在两个AAV ITR序列之间被克隆并放置在载体内,使得标识符被包含在poly-A尾mRNA转录物中。此侧翼为ITR的标识符本身将在慢病毒5'LTR和相关慢病毒包装序列(包括Psi)的下游,以及慢病毒3'LTR的上游位于质粒上,适用于由LTR定界的转录RNA的第3代慢病毒包装并含有转录RNA形式的AAV ITR序列。此类具有位于慢病毒LTR和Psi序列之间的AAV ITR的构建体将在本文中被称为AAV-in-Lenti。AAV-in-Lenti质粒还将含有选择标记基因,诸如嘌呤霉素抗性或绿色荧光蛋白,使含有最终整合文库构建体的哺乳动物细胞的未来选择或鉴定成为可能。慢病毒gRNA文库和条形码AAV-in-Lenti质粒文库将与编码病毒糖蛋白(例如VSV-G蛋白)的质粒以及第2代或第3代慢病毒包装质粒一起独立转染到293T细胞中,以提供最低限度的慢病毒Gag Pol、Rev基因功能(例如,形成病毒载体所必需的多核苷酸)。此转染后产生的慢病毒载体将从培养物上清液中收集、过滤,并且浓缩或直接应用于293T-Cas9细胞系。细胞将首先被高效转导,以驱动独立gRNA文库变体的多拷贝整合。细胞文库中所需平均每个细胞的文库变体数的实现将由细胞文库gDNA的qPCR确定。随后,此多拷贝gRNA文库群将用含有标识符的AAV-in-Lenti条形码文库以单拷贝效率进行转导,并经选择以建立每个细胞的条形码多重gRNA细胞文库。
将假定每个细胞的gRNA表达已通过稳定表达的SpCas9基因的作用导致gRNA靶向切割和插入缺失形成。然后将用产生和包装重组AAV载体所必要的质粒构建体(例如,pHelper和pAAV Rep-Cap)转染纯化的文库群。这些质粒上存在的功能将指导ITR限定的AAV载体基因组从慢病毒整合的ITR-in-Lenti序列的复制,并且这些ITR载体DNA将被包装并释放到AAV载体中。
实施例8.2:产生和收获病毒载体
本实施例描述了一种产生和纯化从哺乳动物细胞文库产生的病毒载体的方法。如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所述产生病毒载体。简单来说,转染后,24小时后更换培养基(DMEM w/Glutamax,Pen/Strep抗生素,5% FBS),并在72小时后添加50%培养基体积(500mL)。5天后,通过添加NaCl至150mM并在37℃下孵育2小时来裂解细胞。收集培养基-细胞混合物并在4℃下放置过夜。分离上清液并通过0.22μM过滤器(Corning 431098)过滤。将dH2O中的40% PEG-8000添加到病毒载体材料中至终浓度为8%,并在4℃下孵育过夜。将此材料以4800g离心20分钟,收集沉淀并溶解在7mL PBS中。然后如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所描述的对材料进行碘克沙醇梯度纯化,使用离心浓缩器(Millipore UFC910024)浓缩,并冷冻在-80℃下。
实施例8.3:病毒载体和每个细胞文库成员代表的NGS。
本实施例描述了一种对纯化的AAV载体中包含的DNA,特别是条形码序列进行测序的方法。从整个纯化的AAV病毒载体池中分离全体DNA。使用碱裂解纯化DNA。使用PCR自侧翼引物序列扩增DNA。纯化扩增产物,与具有同源悬突的Illumina衔接子以50:1的扩增子:衔接子摩尔比混合,放入GGA反应(BsmBI和T4连接酶,NEB),并使循环100x过夜(16℃5分钟,然后37℃5分钟),概念上类似于Velculescu,等人,1995(Science第270卷,Issue 5235,第484-487页)。然后将此材料扩增以添加Illumina衔接子和索引,并使用NextSeq平台进行测序。宿主细胞产生株文库中含有的条形码序列也将被扩增并以同样的方式制备用于测序。测量每个条形码的序列读取频率,并确定它们在所有条形码池内的相对丰度。从AAV载体相关DNA扩增的条形码序列的相对丰度将与原始宿主细胞群中的条形码序列丰度进行比较。为了将载体标识符与产生者细胞基因型(即,组合gRNA身份)联系起来,产生者群将在细胞mRNA的逆转录(10X genomics)过程中进行单细胞RNA标记,在mRNA上附加细胞身份序列,从而标记以每个细胞为基础包含在整个细胞文库群中的所有侧翼为ITR的条形码和gRNA(因为各自被设计为包含在poly-A尾mRNA转录物中,无论是在有义方向还是反义方向)。然后可以通过PCR特异性扩增细胞身份序列标记的条形码cDNA,并且这些扩增子可以如上所述制备以用于由Illumina进行NGS。对这些扩增子进行测序将揭示细胞文库群中存在的每个细胞文库成员组合,允许辨别无论是由于单个还是组合的gRNA驱动的插入缺失的真正命中与错误富集的“搭便车者”。
此实施例中描述的方法有助于组合文库生成和迭代轮次的文库筛选,因为文库成员和侧翼为ITR的标识符是不连续的,文库组成和每个细胞的拷贝数可以在连续轮次中进行调整,而无需再克隆复杂的多gRNA编码DNA构建体。通过使用单细胞RNA测序方法将克隆基因型与病毒载体产生表型相联系,为DNA文库构建提供最大的灵活性。
实施例9:用于用病毒感染和再扩增筛选游离质粒DNA上AAV产生的基于CRISPRgRNA的文库技术
本实施例描述了一种产生和筛选哺乳动物细胞文库的方法,以确定通过文库内的特定细胞扰动(例如,在含有特定文库变体的细胞中)产生的示例性病毒载体(例如,在此实施例中,AAV载体)的水平。具体而言,此实施例描述了一种将从哺乳动物细胞文库产生的单独病毒载体与它们所源自的特定细胞变体相关联的方法,其中用于创建哺乳动物细胞文库的gRNA是标识符。在此实施例中,病毒载体是在两个连续哺乳动物细胞文库中生成的。这提供了一种方法,其用于通过哺乳动物细胞文库2中的其他低拷贝数选择步骤准确鉴定哺乳动物细胞文库1中以高拷贝数递送的工程化序列的影响。
实施例9.1:生成哺乳动物细胞文库1
本实施例描述了一种在宿主产生细胞系(例如293T)内生成产生第一重组AAV载体的哺乳动物细胞文库的方法。在宿主细胞系中编码具有预期生物学功能的蛋白质基因产物的条形码CRISPR gRNA序列文库(文库变体)将被合成并与DNA条形码序列一起克隆到质粒中。此gRNA:DNA条形码序列配对可以在构建体设计和合成时预先确定,或者可以随机关联,取决于所使用的特定克隆方法,其中gRNA:条形码配对由克隆文库质粒DNA的NGS确定。此文库将构建成条形码序列位于两个AAV ITR序列之间。对应的gRNA和gRNA表达调控序列(诸如像启动子)将位于ITR限定区域之外。ITR定界区域和gRNA表达单元的整个连续序列将包含在环状质粒DNA骨架中,此种游离构建体的示例性示意图提供于图5中,标记为pSFX-AAV。此类AAV-on-plasmid构建体还含有示例性选择标记基因、抗生素抗性基因(例如,嘌呤霉素抗性)和示例性荧光蛋白基因(例如,绿色荧光蛋白)的AAV有效载荷,使含有整合文库构建体并产生AAV载体以及含有SV40复制起点的哺乳动物细胞的未来选择或鉴定成为可能,促进在后续的培养传代过程中保留转染细胞内的质粒。如克隆到AAV-on-plasmid中的条形码gRNA文库被制备为纯化的质粒池,用于转染到293T细胞中。然后将用产生和包装重组AAV载体所必需的质粒构建体(例如,形成病毒载体所必需的多核苷酸)(例如,pHelper和pAAVRep-Cap)转染以此方式转染的细胞文库群。这些质粒上存在的功能指导ITR限定的AAV载体基因组从ITR-on-Plasmid序列的复制,并且这些ITR载体DNA被包装并释放到AAV载体中。
实施例9.2:产生和收获病毒载体
本实施例描述了一种产生和纯化从哺乳动物细胞文库1产生的病毒载体的方法。病毒载体如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所述产生。简单来说,转染后,24小时后更换培养基(DMEM w/Glutamax,Pen/Strep抗生素,5% FBS),并在72小时后添加50%培养基体积(500mL)。5天后,通过添加NaCl至150mM并在37℃下孵育2小时来裂解细胞。收集培养基-细胞混合物并在4℃下放置过夜。分离上清液并通过0.22μM过滤器(Corning 431098)过滤。将dH2O中的40% PEG-8000添加到病毒载体材料中至终浓度为8%,并在4℃下孵育过夜。将此材料以4800g离心20分钟,收集沉淀并溶解在7mL PBS中。然后如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所描述的对材料进行碘克沙醇梯度纯化,使用离心浓缩器(Millipore UFC910024)浓缩,并冷冻在-80℃下。
实施例9.3:通过病毒感染生成哺乳动物细胞文库2,以及再扩增和收获病毒载体
从哺乳动物细胞文库1中纯化的病毒载体将用于感染宿主产生系,诸如HEK293T,或表达Cas9核酸酶或衍生物的此细胞系的变体。这些细胞先前未用任何工程化序列进行修饰。将含有gRNA文库变体的病毒载体有效载荷转导到此细胞群中将生成第二哺乳动物细胞文库,即哺乳动物细胞文库2。表达Cas9的哺乳动物细胞文库2的细胞将被源自哺乳动物细胞文库1的细胞的转导gRNA文库变体组修饰,所述哺乳动物细胞文库1产生高水平病毒,从而扩增哺乳动物细胞文库1中的gRNA,其作用与提高的病毒滴度真正相关。
然后将用产生和包装重组AAV载体所必需的质粒构建体(例如,形成病毒载体所必需的多核苷酸)(例如,pHelper和pAAV Rep-Cap)转染以此方式生成的细胞文库群。这些质粒上存在的功能指导ITR限定的AAV载体基因组从ITR-on-Plasmid序列的复制,并且这些ITR载体DNA被包装并释放到AAV载体中。
使用此连续哺乳动物细胞文库方法提供了一种方式来解卷积由游离递送产生的工程化序列的多拷贝递送的影响。用由哺乳动物细胞文库1产生的病毒感染第二细胞群可以在受控条件下进行,使得大多数细胞成员每个细胞仅接受gRNA文库的一个拷贝。与哺乳动物细胞文库1相比,此第二哺乳动物细胞文库中拷贝数的控制将导致对影响AAV产生的gRNA更稳健的鉴定,因为哺乳动物细胞文库1是通过游离转染构建的,并且可能含有许多接受多个工程化序列的细胞。
然后将每个细胞的文库身份与AAV载体富集条形码相关联,以自信地鉴定多重文库群中的命中。
实施例9.4:产生和收获病毒载体
本实施例描述了一种产生和纯化从哺乳动物细胞文库2产生的病毒载体的方法。如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所述产生病毒载体。简单来说,转染后,24小时后更换培养基(DMEM w/Glutamax,Pen/Strep抗生素,5% FBS),并在72小时后添加50%培养基体积(500mL)。5天后,通过添加NaCl至150mM并在37℃下孵育2小时来裂解细胞。收集培养基-细胞混合物并在4℃下放置过夜。分离上清液并通过0.22μM过滤器(Corning 431098)过滤。将dH2O中的40% PEG-8000添加到病毒载体材料中至终浓度为8%,并在4℃下孵育过夜。将此材料以4800g离心20分钟,收集沉淀并溶解在7mL PBS中。然后如先前在Zolotukhin,等人,1999(Gene Therapy 6,第973-985页)中所描述的对材料进行碘克沙醇梯度纯化,使用离心浓缩器(Millipore UFC910024)浓缩,并冷冻在-80℃下。
实施例9.5:病毒载体和每个细胞文库成员代表的NGS
本实施例描述了一种对纯化的AAV载体中包含的DNA,特别是条形码序列进行测序的方法。从整个纯化的AAV病毒载体池中分离全体DNA。使用碱裂解纯化DNA。使用PCR自侧翼引物序列扩增DNA。纯化扩增产物,与具有同源悬突的Illumina衔接子以50:1的扩增子:衔接子摩尔比混合,放入GGA反应(BsmBI和T4连接酶,NEB),并使循环100x过夜(16℃5分钟,然后37℃5分钟),概念上类似于Velculescu,等人,1995(Science第270卷,Issue 5235,第484-487页)。然后将此材料扩增以添加Illumina衔接子和索引,并使用NextSeq平台进行测序。宿主细胞产生株文库中含有的条形码序列也将被扩增并以同样的方式制备用于测序。测量每个条形码的序列读取频率,并确定它们在所有条形码池内的相对丰度。从AAV载体相关DNA扩增的条形码序列的相对丰度将与原始宿主细胞群中的条形码序列丰度以及不表达Cas9且因此未进行基因组修饰的转染细胞进行比较。因为每个条形码都与特定的gRNA文库变体具有已知的关联,可以鉴定导致扰动的gRNA文库变体,所述扰动直接改变宿主细胞生物学并导致差异AAV载体产生,因为与宿主细胞群和/或从不表达Cas9的细胞(WT细胞)分离的AAV相比,gRNA文库变体的相关条形码在AAV载体DNA群中富集或去富集。有了足够高倍的细胞文库覆盖率和测序深度,真正富集的命中将在固有多重转染质粒文库中被鉴定。此外,为了简化多重转染文库中的命中鉴定问题,可以对产生者群进行单细胞测序。产生者细胞将在细胞mRNA的逆转录过程中被单独标记(10X Genomics),将细胞身份序列附加到细胞mRNA,从而标记细胞文库群中含有的所有条形码。然后可以通过PCR特异性扩增细胞身份序列标记的条形码cDNA,并且这些扩增子可以如上所述制备以用于由Illumina进行NGS。这些扩增子的测序将揭示细胞文库群中存在的每个细胞文库成员组合,允许辨别单个或组合的命中与错误富集的‘搭便车者(hitchhiker)’。
等效方案
本领域技术人员应理解,本领域技术人员将容易想到对本公开的各种改变、修改和改进。此类改变、修改和改进旨在成为本公开的一部分,并且旨在落入本发明的精神和范围内。因此,前述描述和附图仅是作为例子的,并且本公开中描述的任何发明均由所附权利要求书进一步详细描述。
本领域技术人员应理解可归因于如本文所述的测定或其他方法中获得的值的典型的标准偏差或误差。本文中为了描述本发明的背景并提供关于其实践的额外细节所引用的出版物、网址和其他参考材料由此以引用的方式整体并入。
Claims (30)
1.一种方法,所述方法包括:
a.从哺乳动物细胞文库产生多个腺相关病毒(AAV)载体,其中所述哺乳动物细胞文库包含多个哺乳动物细胞,其中每个哺乳动物细胞单独包含:
(i)核酸序列,其包含位于两个功能性AAV ITR序列之间的条形码,其中所述核酸序列被整合到位于一对顺式作用整合序列之间的哺乳动物基因组中,
(ii)一个或多个文库变体,其导致一个或多个扰动,其中至少一个文库变体包含gRNA,
(iii)RNA引导的核酸酶,以及
(iv)一个或多个产生AAV载体所必需的核酸序列,
其中所述多个哺乳动物细胞产生多个AAV载体,其中每个AAV载体包含对应于产生它的所述哺乳动物细胞的条形码的条形码;和
b.检测所述多个AAV载体的条形码。
2.一种选择用于产生腺相关病毒(AAV)载体的哺乳动物细胞的方法,所述方法包括:
a.用一个或多个产生AAV载体所必需的序列转染哺乳动物细胞文库,其中所述哺乳动物细胞文库包含多个哺乳动物细胞,其中所述多个中的每个哺乳动物细胞单独包含:
(i)核酸序列,其包含位于两个功能性AAV ITR序列之间的条形码,其中所述核酸序列被整合到位于一对顺式作用整合序列之间的哺乳动物基因组中,
(ii)一个或多个文库变体,其导致一个或多个扰动,其中至少一个文库变体包含gRNA,以及
(iii)RNA引导的核酸酶,
b.从所述哺乳动物细胞文库产生多个AAV载体,其中所述AAV载体各自包含对应于产生它的所述单独哺乳动物细胞的条形码;和
c.检测所述多个AAV载体的条形码,其中所述条形码的丰度与所述哺乳动物细胞产生和/或分泌AAV载体相关。
3.如权利要求1或2所述的方法,其中所述顺式作用整合序列是源自慢病毒的病毒重复序列。
4.如权利要求1或2所述的方法,其中所述顺式作用整合序列是重组酶识别位点。
5.如权利要求1至4中任一项所述的方法,其还包括确定特定条形码相对于存在于从所述哺乳动物细胞文库产生的所述多个AAV载体中的所有条形码的相对丰度的步骤。
6.如权利要求1至5中任一项所述的方法,其中相对于缺乏所述一个或多个扰动的参考哺乳动物细胞,所述一个或多个扰动与AAV产生和/或AAV分泌的增加相关。
7.如权利要求6所述的方法,其中相对于缺乏所述一个或多个扰动的参考哺乳动物细胞,包含所述一个或多个扰动的所述哺乳动物细胞具有至少10%的AAV产生和/或AAV分泌增加。
8.如权利要求1至7中任一项所述的方法,其中所述RNA引导的核酸酶是无核酸酶活性的RNA引导的核酸酶。
9.如权利要求1至8中任一项所述的方法,其中至少一个文库变体被整合到位于所述一对顺式作用整合序列之间的哺乳动物基因组中。
10.如权利要求1至9中任一项所述的方法,其中所述核酸序列的一个或两个拷贝被整合到哺乳动物基因组中。
11.如权利要求1至10中任一项所述的方法,其中所述两个功能性AAV ITR序列包括人AAV1 ITR、人AAV2 ITR、人AAV3b ITR、人AAV4 ITR、人AAV5 ITR、人AAV6 ITR、人AAV7 ITR、人AAV8 ITR、人AAV9 ITR、人AAV10 ITR、人AAV11 ITR、人AAV12 ITR或人AAV13 ITR。
12.如权利要求1至10中任一项所述的方法,其中所述两个功能性AAV ITR序列包括牛AAV(b-AAV)ITR、犬AAV(CAAV)ITR、小鼠AAV1 ITR、山羊AAV ITR、大鼠AAV ITR或禽AAV(AAAV)ITR。
13.如权利要求1至12中任一项所述的方法,其中所述一个或多个产生AAV载体所必需的序列包含(a)AAV Rep基因,(b)AAV Cap基因,(c)一个或多个AAV辅助基因;或(d)其组合。
14.如权利要求13所述的方法,其中所述一个或多个产生AAV载体所必需的序列包含编码人AAV1衣壳蛋白、人AAV2衣壳蛋白、人AAV3b衣壳蛋白、人AAV4衣壳蛋白、人AAV5衣壳蛋白、人AAV6衣壳蛋白、人AAV7衣壳蛋白、人AAV8衣壳蛋白、人AAV9衣壳蛋白、人AAV10衣壳蛋白、人AAV11衣壳蛋白、人AAV12衣壳蛋白,或人AAV13衣壳蛋白的AAV Cap基因。
15.如权利要求1至14中任一项所述的方法,其中所述一个或多个扰动包括内源性基因组编码序列的插入、缺失、取代、替换、表观遗传修饰和/或重排。
16.如权利要求1至15中任一项所述的方法,其中所述一个或多个文库变体包含至少两个文库变体,其中所述至少两个文库变体包含至少一个独特基因、至少一个独特ORF、至少一个独特gRNA序列,和/或至少一个独特非编码核酸,或其组合和/或多个。
17.如权利要求1至16中任一项所述的方法,其中所述方法还包括单细胞测序。
18.一种通过如权利要求2所述的方法选择的哺乳动物细胞。
19.一种包含多个哺乳动物细胞的哺乳动物细胞群,其中所述多个中的每个哺乳动物细胞包含:
(i)核酸序列,其包含位于两个功能性AAV ITR序列之间的条形码,其中所述核酸序列被整合到位于一对顺式作用整合序列之间的哺乳动物基因组中,
(ii)一个或多个文库变体,其导致一个或多个扰动,其中至少一个文库变体包含gRNA,
(iii)RNA引导的核酸酶,以及
(iv)一个或多个产生AAV载体所必需的核酸序列,
其中所述哺乳动物细胞群产生多个AAV载体,其中每个AAV载体包含对应于产生它的所述哺乳动物细胞的条形码的条形码。
20.如权利要求19所述的哺乳动物细胞群,其中所述顺式作用整合序列是源自慢病毒的病毒重复序列。
21.如权利要求19所述的哺乳动物细胞群,其中所述顺式作用整合序列是重组酶识别位点。
22.如权利要求19至21中任一项所述的哺乳动物细胞群,其中相对于缺乏所述一个或多个扰动的参考哺乳动物细胞群,所述一个或多个扰动与AAV产生和/或AAV分泌的增加相关。
23.如权利要求22所述的哺乳动物细胞群,其中相对于缺乏所述一个或多个扰动的参考哺乳动物细胞,包含所述一个或多个扰动的哺乳动物细胞具有至少10%的AAV产生和/或AAV分泌增加。
24.如权利要求18至23中任一项所述的哺乳动物细胞或哺乳动物细胞群,其中所述哺乳动物细胞各自单独地包括人胚肾(HEK)细胞、HEK 293细胞、HEK 293T细胞、Expi293细胞、中国仓鼠卵巢(CHO)细胞、HeLa细胞、HeLa S3细胞、PER.C6细胞、HKB11细胞、CAP细胞、幼仓鼠肾成纤维细胞(BHK细胞)(例如,BHK-21细胞)、小鼠骨髓瘤细胞(例如,Sp2/0细胞、NS0细胞)、非洲绿猴肾细胞(例如,COS细胞和Vero细胞)、A549细胞、恒河猴胎肺细胞(例如,FRhL-2细胞)或其任何衍生物。
25.如权利要求18至24中任一项所述的哺乳动物细胞或哺乳动物细胞群,其与缺乏所述一个或多个扰动的哺乳动物细胞产生的AAV群相比产生了包含至少一个改进的特征的AAV载体群。
26.一种由如权利要求18至25中任一项所述的哺乳动物细胞或哺乳动物细胞群产生的AAV载体群,其中所述AAV载体群包括至少一个改进的特征,其中至少一个改进的特征包括转移病毒核酸的能力改变、AAV治疗活性改变,和/或无功能AAV群百分比减少,和/或在生产规范下病毒载体的百分比增加,所述病毒载体含有所有和/或必需的核酸序列和/或用于它们的预期应用的其他元件。
27.一种分离的核酸,所述分离的核酸包含源自慢病毒的5'和3'病毒重复序列,其中所述5'和3'病毒重复序列之间的序列包含:
(i)位于两个功能性腺相关病毒(AAV)ITR序列之间的条形码,
(ii)选择标记,和
(iii)一个或多个文库变体。
28.如权利要求27所述的分离的核酸,其中所述至少一个文库变体包含至少一个工程化序列,所述工程化序列包含至少一个基因、至少一个ORF、至少一个gRNA序列、至少一个非编码核酸,或其组合和/或多个。
29.一种包含变体文库的核酸群,其中所述群中的每个核酸都包含用于引入靶哺乳动物细胞的顺式作用整合序列并且位于这些顺式作用整合序列之间的是:(i)至少一个文库变体,和(ii)位于两个功能性腺相关病毒(AAV)ITR序列之间的条形码。
30.如权利要求29所述的核酸群,其中所述顺式作用整合序列是源自慢病毒的病毒重复序列。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/073,365 | 2020-09-01 | ||
US202063111238P | 2020-11-09 | 2020-11-09 | |
US63/111,238 | 2020-11-09 | ||
PCT/US2021/048741 WO2022051418A1 (en) | 2020-09-01 | 2021-09-01 | Mammalian cells and methods for engineering the same |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116507732A true CN116507732A (zh) | 2023-07-28 |
Family
ID=87317074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180074337.5A Pending CN116507732A (zh) | 2020-09-01 | 2021-09-01 | 哺乳动物细胞及其工程化的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116507732A (zh) |
-
2021
- 2021-09-01 CN CN202180074337.5A patent/CN116507732A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10294492B2 (en) | Stable episomes based on non-integrative lentiviral vectors | |
JP5749014B2 (ja) | ポリプリントラクト改変レトロウイルスベクター | |
CN107109434A (zh) | 新颖cho整合位点和其用途 | |
US20210054407A1 (en) | Dry Transfection Compositions and Methods for Making and Using the Same | |
US20210340508A1 (en) | Genome Editing by Directed Non-Homologous DNA Insertion Using a Retroviral Integrase-Cas9 Fusion Protein | |
CN113874515A (zh) | 多任务处理调控组件以识别细胞类型特异性调控组件 | |
US20240076655A1 (en) | Mammalian cells and methods for engineering the same | |
CN116507732A (zh) | 哺乳动物细胞及其工程化的方法 | |
WO2023167860A1 (en) | Insect cells and methods for engineering the same | |
WO2020117992A9 (en) | Improved vector systems for cas protein and sgrna delivery, and uses therefor | |
Weber et al. | Precise and Scarless Insertion of Transposable Elements by Cas9-Mediated Genome Engineering | |
US20240043820A1 (en) | Enzyme variants | |
WO2024148206A1 (en) | Methods and systems for engineering cells and for target validation | |
Murphy et al. | Polymerase Chain Reaction: Applications in Gene and Cell Therapy Studies | |
Wang | A CRISPR way to treat Usher syndrome | |
WO2022258967A9 (en) | Lentiviral vector | |
WO2024077089A2 (en) | Modified cpg dinucleotides for recombinant viral vector production | |
JP2012044910A (ja) | ネコカリシウイルス遺伝子の発現用ベクター及びこれを用いたウイルスの製造方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |