KR20200015700A - Dna가 편집된 진핵 세포를 제조하는 방법 및 당해 방법에 사용되는 키트 - Google Patents
Dna가 편집된 진핵 세포를 제조하는 방법 및 당해 방법에 사용되는 키트 Download PDFInfo
- Publication number
- KR20200015700A KR20200015700A KR1020207000115A KR20207000115A KR20200015700A KR 20200015700 A KR20200015700 A KR 20200015700A KR 1020207000115 A KR1020207000115 A KR 1020207000115A KR 20207000115 A KR20207000115 A KR 20207000115A KR 20200015700 A KR20200015700 A KR 20200015700A
- Authority
- KR
- South Korea
- Prior art keywords
- dna
- sequence
- cas3
- crispr
- crrna
- Prior art date
Links
- 210000003527 eukaryotic cell Anatomy 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims description 68
- 238000010440 CRISPR–Cas3 gene editing Methods 0.000 claims abstract description 111
- 108090000623 proteins and genes Proteins 0.000 claims description 165
- 102000004169 proteins and genes Human genes 0.000 claims description 149
- 108091033319 polynucleotide Proteins 0.000 claims description 131
- 102000040430 polynucleotide Human genes 0.000 claims description 131
- 239000002157 polynucleotide Substances 0.000 claims description 131
- 239000013604 expression vector Substances 0.000 claims description 56
- 238000012546 transfer Methods 0.000 claims description 27
- 238000003776 cleavage reaction Methods 0.000 claims description 20
- 230000007017 scission Effects 0.000 claims description 20
- 241000282414 Homo sapiens Species 0.000 claims description 19
- 241001465754 Metazoa Species 0.000 claims description 17
- 238000004519 manufacturing process Methods 0.000 claims description 12
- 230000007704 transition Effects 0.000 claims description 10
- 108020004414 DNA Proteins 0.000 description 154
- 230000000694 effects Effects 0.000 description 79
- 239000013612 plasmid Substances 0.000 description 77
- 239000013598 vector Substances 0.000 description 77
- 210000004027 cell Anatomy 0.000 description 76
- 125000003729 nucleotide group Chemical group 0.000 description 42
- 239000002773 nucleotide Substances 0.000 description 41
- 241000588724 Escherichia coli Species 0.000 description 36
- 108091033409 CRISPR Proteins 0.000 description 33
- 230000007018 DNA scission Effects 0.000 description 31
- 241000196324 Embryophyta Species 0.000 description 24
- 125000006850 spacer group Chemical group 0.000 description 24
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 22
- 238000010354 CRISPR gene editing Methods 0.000 description 21
- 230000000295 complement effect Effects 0.000 description 20
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 19
- 238000010362 genome editing Methods 0.000 description 19
- 238000012217 deletion Methods 0.000 description 18
- 230000037430 deletion Effects 0.000 description 18
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 15
- 238000010586 diagram Methods 0.000 description 15
- 210000001161 mammalian embryo Anatomy 0.000 description 14
- 239000000203 mixture Substances 0.000 description 14
- 101150017501 CCR5 gene Proteins 0.000 description 13
- 101710163270 Nuclease Proteins 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 210000005260 human cell Anatomy 0.000 description 12
- 238000012163 sequencing technique Methods 0.000 description 12
- 108060004795 Methyltransferase Proteins 0.000 description 11
- 239000012124 Opti-MEM Substances 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 11
- 239000013600 plasmid vector Substances 0.000 description 11
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 10
- 239000003814 drug Substances 0.000 description 10
- 239000002609 medium Substances 0.000 description 10
- 108090000765 processed proteins & peptides Proteins 0.000 description 10
- 239000000499 gel Substances 0.000 description 9
- 210000000287 oocyte Anatomy 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- 238000013461 design Methods 0.000 description 8
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 8
- 108091008146 restriction endonucleases Proteins 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 210000001519 tissue Anatomy 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 238000010442 DNA editing Methods 0.000 description 7
- 150000001413 amino acids Chemical class 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 210000004962 mammalian cell Anatomy 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 239000000546 pharmaceutical excipient Substances 0.000 description 7
- 230000008685 targeting Effects 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 101100438883 Homo sapiens CCR5 gene Proteins 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 230000004075 alteration Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 210000004102 animal cell Anatomy 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 239000013613 expression plasmid Substances 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- 102000037865 fusion proteins Human genes 0.000 description 5
- 239000013642 negative control Substances 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 239000012097 Lipofectamine 2000 Substances 0.000 description 4
- 108010052090 Renilla Luciferases Proteins 0.000 description 4
- 239000007984 Tris EDTA buffer Substances 0.000 description 4
- 239000004480 active ingredient Substances 0.000 description 4
- 239000012298 atmosphere Substances 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 150000007523 nucleic acids Chemical class 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- WURBVZBTWMNKQT-UHFFFAOYSA-N 1-(4-chlorophenoxy)-3,3-dimethyl-1-(1,2,4-triazol-1-yl)butan-2-one Chemical compound C1=NC=NN1C(C(=O)C(C)(C)C)OC1=CC=C(Cl)C=C1 WURBVZBTWMNKQT-UHFFFAOYSA-N 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 108091029865 Exogenous DNA Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 239000011543 agarose gel Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- -1 cationic lipid Chemical class 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000012636 effector Substances 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 230000004720 fertilization Effects 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 101000583086 Bunodosoma granuliferum Delta-actitoxin-Bgr2b Proteins 0.000 description 2
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 108020005004 Guide RNA Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 239000005089 Luciferase Substances 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 210000003855 cell nucleus Anatomy 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 235000013601 eggs Nutrition 0.000 description 2
- 108010025678 empty spiracles homeobox proteins Proteins 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 244000144972 livestock Species 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 239000007758 minimum essential medium Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102100036664 Adenosine deaminase Human genes 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 102100026846 Cytidine deaminase Human genes 0.000 description 1
- 108010031325 Cytidine deaminase Proteins 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 240000006497 Dianthus caryophyllus Species 0.000 description 1
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 101100005249 Escherichia coli (strain K12) ygcB gene Proteins 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 102000018997 Growth Hormone Human genes 0.000 description 1
- 102000010437 HD domains Human genes 0.000 description 1
- 108050001906 HD domains Proteins 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 108010034791 Heterochromatin Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 208000035752 Live birth Diseases 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108091027974 Mature messenger RNA Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 241000711408 Murine respirovirus Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 240000008790 Musa x paradisiaca Species 0.000 description 1
- 241000282339 Mustela Species 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000010718 Oxidation Activity Effects 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108091093078 Pyrimidine dimer Proteins 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000555745 Sciuridae Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 241000701093 Suid alphaherpesvirus 1 Species 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 239000002535 acidifier Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 230000003113 alkalizing effect Effects 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 230000008970 bacterial immunity Effects 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 210000002449 bone cell Anatomy 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 101150055191 cas3 gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000027326 copulation Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 101150037603 cst-1 gene Proteins 0.000 description 1
- 230000000254 damaging effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 235000021186 dishes Nutrition 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 210000002308 embryonic cell Anatomy 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 101150046383 gene 5 gene Proteins 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 102000040620 helicase family Human genes 0.000 description 1
- 108091070619 helicase family Proteins 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 210000004458 heterochromatin Anatomy 0.000 description 1
- 230000008076 immune mechanism Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 230000012223 nuclear import Effects 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 239000003883 ointment base Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 229940127557 pharmaceutical product Drugs 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 239000004014 plasticizer Substances 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000003380 propellant Substances 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 239000013635 pyrimidine dimer Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 108010015840 seryl-prolyl-lysyl-lysine Proteins 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 239000002511 suppository base Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 108700029760 synthetic LTSP Proteins 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
- C12N5/12—Fused cells, e.g. hybridomas
- C12N5/14—Plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
- C12N5/12—Fused cells, e.g. hybridomas
- C12N5/16—Animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Environmental Sciences (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Botany (AREA)
- Animal Husbandry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Coloring Foods And Improving Nutritive Qualities (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
진핵 세포에 있어서 CRISPR-Cas3 시스템을 확립하는 것에 성공했다.
Description
본 발명은 DNA가 편집된 진핵 세포, 동물 및 식물을 제조하는 방법, 그리고 당해 방법에 사용되는 키트에 관한 것이다.
세균, 고세균은, 외래로부터 침입하려고 하는 파지 등의 생물을 특이적으로 인식하고, 배제하는 적응 면역 기구를 갖고 있다. CRISPR-Cas 시스템이라고 불리는 이 시스템은, 먼저, 외래 생물의 게놈 정보를 자기 게놈에 받아들인다(어댑테이션). 그리고, 다시 동일한 외래 생물이 침입하려고 할 때, 자기 게놈에 받아들인 정보와 게놈 서열의 상보성을 이용해서 외래 게놈을 절단하고, 배제한다(인터피어런스).
최근에 되서야, 상기의 CRISPR-Cas 시스템을, 「DNA 편집용 도구」로서 사용한, 게놈 편집(DNA 편집) 기술이 개발되게 되었다(비특허문헌 1).
CRISPR-Cas 시스템은, DNA를 절단하는 과정에서 작용하는 이펙터가, 복수의Cas로 이루어지는 「클래스 1」과, 단일의 Cas로 이루어지는 「클래스 2」로 크게 구별된다. 특히, 클래스 1의 CRISPR-Cas 시스템으로서는, Cas3 및 캐스케이드 복합체(캐스케이드와 crRNA와의 복합체를 의미한다. 이하 마찬가지.)가 관여하는 「타입 I」이 널리 알려져 있고, 클래스 2의 CRISPR-Cas 시스템으로서는, Cas9가 관여하는 「타입 II」가 널리 알려져 있다(이하, CRISPR-Cas 시스템에 관해서, 「클래스 1 타입 I」 및 「클래스 2 타입 II」를 각각 단순히 「타입 I」 및 「타입 II」라고 칭하기도 한다.). 그리고, 지금까지의 DNA 편집 기술에 있어서 광범위하게 사용되었던 것은, Cas9가 관여하는 클래스 2의 CRISPR-Cas 시스템이다(이하, 「CRISPR-Cas9 시스템」이라고 칭하는 경우도 있다.). 예를 들어, 비특허문헌 1은, Cas9를 사용해서 DNA를 절단하는, 클래스 2의 CRISPR-Cas 시스템을 보고하고 있다.
한편, Cas3 및 캐스케이드 복합체를 사용해서 DNA를 절단하는, 클래스 1의 CRISPR-Cas 시스템(이하, 「CRISPR-Cas3 시스템」이라고 칭하는 경우도 있다.)에 대해서는, 많은 노력에도 불구하고, 진핵 세포에 있어서 게놈 편집의 성공예의 보고는 이루어져 있지 않다. 예를 들어, 비특허문헌 2 및 3에서는, 단순히, CRISPR-Cas3 시스템을 사용함으로써, 무세포계에서 표적 DNA가 완전히 분해된 것이나, 특정한 대장균주를 선택적으로 제거할 수 있던 것을 보고하고 있지만, 이들은 게놈 편집의 성공을 의미하는 것은 아니고, 또한 진핵 세포에서는 전혀 실증되지 않았다. 또한, 특허문헌 1에 있어서는, CRISPR-Cas3 시스템이, Cas3의 헬리카제 활성과 엑소뉴클레아제 활성에 의해, 대장균에 있어서 표적 DNA를 분해해버리는 점에서(실시예 5, 도 6), 진핵 세포에 있어서는, Cas3 대신에, FokI 뉴클레아제를 사용해서 게놈 편집을 행할 것을 제안하고 있다(실시예 7, 도 7, 도 11). 또한, 특허문헌 2에서는, CRISPR-Cas3 시스템은, 대장균에 있어서 표적 DNA를 분해해버리는 점에서(도 4), cas3을 결실시키거나, 불활성화된 Cas3(Cas3'와 Cas3")을 사용함으로써, 프로그램화 가능한 유전자 억제에 재목적화할 것을 제안하고 있다(예를 들어, 실시예 15, 청구항 4(e)).
Jinek M et al. (2012) A Programmable Dual-RNA Guided DNA Endonuclease in Adaptive Bacterial Immunity, Science, Vol.337(Issue 6096), pp.816-821
Mulepati S & Bailey S (2013) In Vitro Reconstitution of an Escherichia coli RNA-guided Immune System Reveals Unidirectional, ATP-dependent Degradation of DNA Target, Journal of Biological Chemistry, Vol.288(No.31), pp.22184-22192
Ahmed A. Gomaa et al. (2014) Programmable Reomoval of Bacterial Strains by Use of Genome Targeting CRISPR-Cas Systems, mbio. asm. org, Volume 5, Issue 1, e00928-13
본 발명은, 이러한 상황을 감안하여 이루어진 것으로, 그 목적은, 진핵 세포에 있어서 CRISPR-Cas3 시스템을 확립하는 것에 있다.
본 발명자들은, 상기 목적을 달성하기 위해서 예의 검토를 거듭한 결과, 마침내, 진핵 세포에 있어서 CRISPR-Cas3 시스템을 확립하는 것에 성공했다. 가장 널리 이용되고 있는 CRISPR-Cas9 시스템은, 여러 진핵 세포에 있어서 게놈 편집에 성공하고 있지만, 이 시스템에서는, 통상, crRNA로서 성숙 crRNA가 사용되고 있다. 그러나, 놀랍게도, CRISPR-Cas3 시스템에서는, 성숙 crRNA를 사용한 경우에는 진핵 세포에 있어서 게놈 편집이 곤란하여, 통상, 시스템의 구성 요소로서는 사용되지 않는 프리 crRNA를 사용함으로써 비로소, 효율적인 게놈 편집이 가능했다. 즉, CRISPR-Cas3 시스템을 진핵 세포에서 기능시키기 위해서는, 캐스케이드를 구성하는 단백질에 의한 crRNA의 절단이 중요한 것이 판명되었다. 이 프리 crRNA를 사용한 CRISPR-Cas3 시스템은, 타입 I-E의 시스템뿐만 아니라, 타입 I-F 및 타입 I-G의 시스템에도 널리 적용하는 것이 가능했다. 또한, Cas3에 핵 이행 시그널, 특히 바이파타이트(bipartite) 핵 이행 시그널을 부가함으로써, 진핵 세포에 있어서의 CRISPR-Cas3 시스템의 게놈 편집 효율을 더욱 향상시킬 수 있었다. 또한, 본 발명자는, CRISPR-Cas3 시스템에 의하면, CRISPR-Cas9 시스템과 달리, PAM 서열을 포함하거나, 그의 상류역에 있어서, 큰 결실을 초래하는 것이 가능한 것을 알아내고, 본 발명을 완성하기에 이르렀다.
즉, 본 발명은, 진핵 세포에 있어서의 CRISPR-Cas3 시스템에 관한 것으로, 보다 상세히는, 이하의 발명을 제공하는 것이다.
[1] DNA가 편집된 진핵 세포를 제조하는 방법으로서, 진핵 세포에 CRISPR-Cas3 시스템을 도입하는 것을 포함하고, CRISPR-Cas3 시스템이 이하의 (A) 내지 (C)를 포함하는 방법.
(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터,
(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및
(C) crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터
[2] DNA가 편집된 동물(단 인간을 제외함) 또는 식물을 제조하는 방법으로서, 동물(단 인간을 제외함) 또는 식물에 CRISPR-Cas3 시스템을 도입하는 것을 포함하고, CRISPR-Cas3 시스템이 이하의 (A) 내지 (C)를 포함하는 방법.
(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터,
(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및
(C) crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터
[3] 진핵 세포에 CRISPR-Cas3 시스템을 도입한 후에, 캐스케이드 단백질을 구성하는 단백질에 의해 crRNA가 절단되는 공정을 포함하는, [1] 또는 [2]에 기재된 방법.
[4] crRNA가 프리 crRNA인, [1] 또는 [2]에 기재된 방법.
[5] Cas3 단백질 및/또는 캐스케이드 단백질에 핵 이행 시그널이 부가되어 있는, [1] 내지 [4] 중 어느 하나에 기재된 방법.
[6] 핵 이행 시그널이 바이파타이트 핵 이행 시그널인, [5]에 기재된 방법.
[7] 이하의 (A) 및 (B)를 포함하는, [1] 내지 [6] 중 어느 하나에 기재된 방법에 사용하기 위한 키트.
(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및
(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터
[8] crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터를 더 포함하는, [7]에 기재된 키트.
[9] crRNA가 프리 crRNA인, [8]에 기재된 키트.
[10] Cas3 단백질 및/또는 캐스케이드 단백질에 핵 이행 시그널이 부가되어 있는, [7] 내지 [9] 중 어느 하나에 기재된 키트.
[11] 핵 이행 시그널이 바이파타이트 핵 이행 시그널인, [10]에 기재된 키트.
또한, 본 명세서에 있어서, 용어 「폴리뉴클레오티드」란 뉴클레오티드의 중합체를 의도하고, 용어 「유전자」, 「핵산」 또는 「핵산 분자」와 동일한 의미로 사용된다. 폴리뉴클레오티드는, DNA의 형태(예를 들어, cDNA 혹은 게놈 DNA)로도 존재할 수 있고, RNA(예를 들어, mRNA)의 형태로도 존재할 수 있다. 또한, 용어 「단백질」은, 「펩티드」 또는 「폴리펩티드」와 동일한 의미로 사용된다.
본 발명의 CRISPR-Cas3 시스템을 사용함으로써, 진핵 세포에 있어서 DNA를 편집하는 것이 가능하게 되었다.
도 1은 외인성 DNA에 대한 절단 활성을 측정한 SSA 검정의 결과이다.
도 2는 CCR5 유전자 중에 있어서의 표적 서열의 위치를 나타내는 개략도이다.
도 3a는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 1)를 나타내는 도면이다.
도 3b는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 2)를 나타내는 도면이다.
도 3c는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 3)를 나타내는 도면이다.
도 3d는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 4)를 나타내는 도면이다.
도 4의 (a)는 캐스케이드 플라스미드의 구조를 나타내는 모식도이다. (b)는 Cas3 플라스미드의 구조를 나타내는 모식도이다. (c)는 프리 crRNA 플라스미드의 구조를 나타내는 모식도이다. (d)는 리포터 벡터(표적 서열을 포함한다)의 구조를 나타내는 모식도이다.
도 5는 EMX1 유전자 중에 있어서의 표적 서열의 위치를 나타내는 개략도이다.
도 6a는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 EMX1 유전자(클론 1)를 나타내는 도면이다.
도 6b는 CRISPR-Cas3 시스템에 의해, 염기 서열의 다른 일부를 결실한 EMX1 유전자(클론 2)를 나타내는 도면이다.
도 7은 bpNLS를 부가한 Cas3/캐스케이드 플라스미드의 구조를 나타내는 모식도이다.
도 8은 캐스케이드(2A) 플라스미드의 구조를 나타내는 모식도이다.
도 9는 외인성 DNA에 대한 절단 활성을 측정한 SSA 검정의 결과이다.
도 10a는 본 실시예에 사용한 프리 crRNA(LRSR 및 RSR)와 성숙 crRNA의 구조를 나타내는 도면이다. 도면 중의 언더라인은, 5' 핸들(Cas5 핸들)을, 이중 언더라인은 3' 핸들(Cas6 핸들)을 나타낸다.
도 10b는 프리 crRNA(LRSR 및 RSR)와 성숙 crRNA를 사용해서 SSA 검정을 행한 결과를 나타내는 도면이다.
도 11은 1개의 NLS 또는 2개의 NLS(bpNLS)를 Cas3/캐스케이드 유전자의 발현 위해서 플라스미드에 사용해서 SSA 검정을 행한 결과를 나타내는 도면이다.
도 12는 CRISPR-Cas3 시스템의 DNA 절단 활성에 대한 PAM 서열의 효과를 나타내는 도면이다.
도 13은 CRISPR-Cas3 시스템의 DNA 절단 활성에 대한 스페이서의 단일 미스매치의 효과를 나타내는 도면이다.
도 14는 HD 뉴클레아제 도메인(H74A), SF2 헬리카제 도메인 모티브1(K320A), 모티프 3(S483/T485A)에서의 Cas3의 변이의 효과를 나타내는 도면이다.
도 15는 타입 I-E, 타입 I-F 및 타입 I-G의 CRISPR-Cas3 시스템의 DNA 절단 활성의 비교를 나타내는 도면이다.
도 16은 PCR 산물의 TA 클로닝 샘플의 시퀀싱에 의해 검출한 CRISPR-Cas3 시스템에 의한 결실의 크기를 나타내는 도면이다.
도 17은 TA 클론(n=49)의 대량 처리 시퀀싱에 의해 검출한 CRISPR-Cas3 시스템에 의한 결실의 위치를 나타내는 도면이다.
도 18a는 표적으로 한 EMX1 유전자좌의 주위 1000kb 이상의 마이크로어레이-기반의 캡처 시퀀싱을 이용하여, CRISPR-Cas3 시스템에 의한 결실 사이즈마다 검출한 수를 나타내는 도면이다.
도 18b는 표적으로 한 CCR5 유전자좌의 주위 1000kb 이상의 마이크로어레이-기반의 캡처 시퀀싱을 이용하여, CRISPR-Cas3 시스템에 의한 결실 사이즈마다 검출한 수를 나타내는 도면이다.
도 2는 CCR5 유전자 중에 있어서의 표적 서열의 위치를 나타내는 개략도이다.
도 3a는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 1)를 나타내는 도면이다.
도 3b는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 2)를 나타내는 도면이다.
도 3c는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 3)를 나타내는 도면이다.
도 3d는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 4)를 나타내는 도면이다.
도 4의 (a)는 캐스케이드 플라스미드의 구조를 나타내는 모식도이다. (b)는 Cas3 플라스미드의 구조를 나타내는 모식도이다. (c)는 프리 crRNA 플라스미드의 구조를 나타내는 모식도이다. (d)는 리포터 벡터(표적 서열을 포함한다)의 구조를 나타내는 모식도이다.
도 5는 EMX1 유전자 중에 있어서의 표적 서열의 위치를 나타내는 개략도이다.
도 6a는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 EMX1 유전자(클론 1)를 나타내는 도면이다.
도 6b는 CRISPR-Cas3 시스템에 의해, 염기 서열의 다른 일부를 결실한 EMX1 유전자(클론 2)를 나타내는 도면이다.
도 7은 bpNLS를 부가한 Cas3/캐스케이드 플라스미드의 구조를 나타내는 모식도이다.
도 8은 캐스케이드(2A) 플라스미드의 구조를 나타내는 모식도이다.
도 9는 외인성 DNA에 대한 절단 활성을 측정한 SSA 검정의 결과이다.
도 10a는 본 실시예에 사용한 프리 crRNA(LRSR 및 RSR)와 성숙 crRNA의 구조를 나타내는 도면이다. 도면 중의 언더라인은, 5' 핸들(Cas5 핸들)을, 이중 언더라인은 3' 핸들(Cas6 핸들)을 나타낸다.
도 10b는 프리 crRNA(LRSR 및 RSR)와 성숙 crRNA를 사용해서 SSA 검정을 행한 결과를 나타내는 도면이다.
도 11은 1개의 NLS 또는 2개의 NLS(bpNLS)를 Cas3/캐스케이드 유전자의 발현 위해서 플라스미드에 사용해서 SSA 검정을 행한 결과를 나타내는 도면이다.
도 12는 CRISPR-Cas3 시스템의 DNA 절단 활성에 대한 PAM 서열의 효과를 나타내는 도면이다.
도 13은 CRISPR-Cas3 시스템의 DNA 절단 활성에 대한 스페이서의 단일 미스매치의 효과를 나타내는 도면이다.
도 14는 HD 뉴클레아제 도메인(H74A), SF2 헬리카제 도메인 모티브1(K320A), 모티프 3(S483/T485A)에서의 Cas3의 변이의 효과를 나타내는 도면이다.
도 15는 타입 I-E, 타입 I-F 및 타입 I-G의 CRISPR-Cas3 시스템의 DNA 절단 활성의 비교를 나타내는 도면이다.
도 16은 PCR 산물의 TA 클로닝 샘플의 시퀀싱에 의해 검출한 CRISPR-Cas3 시스템에 의한 결실의 크기를 나타내는 도면이다.
도 17은 TA 클론(n=49)의 대량 처리 시퀀싱에 의해 검출한 CRISPR-Cas3 시스템에 의한 결실의 위치를 나타내는 도면이다.
도 18a는 표적으로 한 EMX1 유전자좌의 주위 1000kb 이상의 마이크로어레이-기반의 캡처 시퀀싱을 이용하여, CRISPR-Cas3 시스템에 의한 결실 사이즈마다 검출한 수를 나타내는 도면이다.
도 18b는 표적으로 한 CCR5 유전자좌의 주위 1000kb 이상의 마이크로어레이-기반의 캡처 시퀀싱을 이용하여, CRISPR-Cas3 시스템에 의한 결실 사이즈마다 검출한 수를 나타내는 도면이다.
[1] DNA가 편집된 진핵 세포, 동물, 식물을 제조하는 방법
본 발명의 방법은, 진핵 세포에 CRISPR-Cas3 시스템을 도입하는 것을 포함하고, CRISPR-Cas3 시스템이 이하의 (A) 내지 (C)를 포함하는 방법이다.
(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터,
(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및
(C) crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터
클래스 1의 CRISPR-Cas 시스템은, 타입 I 및 타입 III으로 분류되며, 또한 타입 I은, 캐스케이드를 구성하는 단백질(이하, 단순히 「캐스케이드」 또는 「캐스케이드 단백질」이라고 칭한다.)의 종류에 따라, 타입 I-A, 타입 I-B, 타입 I-C, 타입 I-D, 타입 I-E 및 타입 I-F의 6종류, 그리고 타입 I-B의 서브타입인 타입 I-G로 분류된다(예를 들어, [van der Oost J et al. (2014) Unravelling the structural and mechanistic basis of CRISPR-Cas systems, Nature Reviews Microbiologym, Vol.12 (No.7), pp.479-492], [Jackson RN et al. (2014) Fitting CRISPR-associated Cas3 into the Helicase Family Tree, Current Opinion in Structural Biology, Vol.24, pp.106-114]를 참조).
타입 I의 CRISPR-Cas 시스템은, Cas3(뉴클레아제 활성 및 헬리카제 활성을 갖는 단백질), 캐스케이드 및 crRNA가 협동함으로써, DNA를 절단하는 기능을 갖는다. 뉴클레아제로서 Cas3을 사용하는 점에서, 본 발명에 있어서 「CRISPR-Cas3 시스템」이라고 칭한다.
본 발명의 CRISPR-Cas3 시스템을 사용함으로써, 예를 들어 하기의 이점이 얻어진다.
먼저, CRISPR-Cas3 시스템에서 사용되는 crRNA는, 일반적으로는, 32 내지 37염기의 표적 서열을 인식한다(Ming Li et al., Nucleic Acids Res. 2017 May 5;45(8):4642-4654). 이에 반해, CRISPR-Cas9 시스템에서 사용되는 crRNA는, 일반적으로 18 내지 24염기의 표적 서열을 인식한다. 이 때문에, CRISPR-Cas3 시스템은, CRISPR-Cas9 시스템보다, 보다 정확하게 표적 서열을 인식할 수 있다고 생각된다.
또한, 클래스 2의 타입 II의 시스템인 CRISPR-Cas9 시스템의 PAM 서열은, 표적 서열의 3'측에 인접하는 「NGG(N은 임의의 염기)」이다. 또한, 클래스 2의 타입 V의 시스템인 CRISPR-Cpf1 시스템의 PAM 서열은, 표적 서열의 5'측에 인접하는 「AA」이다. 이에 반해, 본 발명의 CRISPR-Cas3 시스템의 PAM 서열은, 표적 서열의 5'측에 인접하는 「AAG」 또는 그것에 유사한 염기 서열(예를 들어, 「AGG」, 「GAG」, 「TAC」, 「ATG」, 「TAG」 등)이다(도 12). 따라서, 본 발명의 CRISPR-Cas3 시스템을 사용하면, 종래법에서는 인식할 수 없었던 영역을, DNA 편집의 대상으로 할 수 있다고 생각된다.
또한, CRISPR-Cas3 시스템은, 상기 클래스 2의 CRISPR-Cas 시스템과 달리, 복수 개소에 DNA 절단을 발생시킨다. 이 때문에, 본 발명의 CRISPR-Cas3 시스템을 사용하면, 100 내지 수천염기, 경우에 따라 그 이상의 광범위한 결실 변이를 발생시킬 수 있다(도 3, 6, 16 내지 18). 이 기능에 의해, 긴 게놈 영역을 녹-아웃하거나, 긴 DNA를 녹-인하거나 하는 것에 이용할 수 있다고 생각된다. 녹-인을 행하는 경우에는, 통상, 도너 DNA가 사용되고, 당해 도너 DNA도 본 발명의 CRISPR-Cas3 시스템을 구성하는 분자가 된다.
또한, 본 명세서에 있어서, 단순히 「Cas3」이라고 기재한 경우에는, 「Cas3 단백질」을 의미하는 것으로 한다. 캐스케이드 단백질에 대해서도 마찬가지이다.
본 발명의 CRISPR-Cas3 시스템은, 타입 I의 6종류의 서브타입 모두를 포함한다. 즉, CRISPR-Cas3 시스템을 구성하는 단백질은, 서브타입에 따라, 약간 그 구성 등이 상이한 경우가 있지만(예를 들어, 캐스케이드를 구성하는 단백질이 상이하지만), 본 발명은 이들 단백질 모두를 포함한다. 실제로, 본 실시예에 있어서, 타입 I-E 뿐만 아니라, 타입 1-G나 타입 I-F의 시스템에 있어서도, 게놈 편집이 가능한 것이 판명되었다(도 15).
타입 I의 CRISPR-Cas3 시스템 중에서도 일반적인 타입 I-E의 CRISPR-Cas3 시스템은, crRNA가 Cas3 및 캐스케이드(Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7)와 협동함으로써, DNA를 절단한다.
타입 I-A의 시스템에서는, 캐스케이드로서 Cas8a1, Csa5(Cas11), Cas5, Cas6 및 Cas7을 구성 요소로 하고, 타입 I-B에서는, 캐스케이드로서 Cas8b1, Cas5, Cas6 및 Cas7을 구성 요소로 하고, 타입 I-C에서는, 캐스케이드로서 Cas8c, Cas5 및 Cas7을 구성 요소로 하고, 타입 I-D에서는, 캐스케이드로서 Cas10d, Csc1(Cas5), Cas6 및 Csc2(Cas7)을 구성 요소로 하고, 타입 I-F에서는, 캐스케이드로서 Csy1(Cas8f), Csy2(Cas5), Cas6 및 Csy3(Cas7)을 구성 요소로 하고, 타입 I-G의 시스템에서는, 캐스케이드로서 Cst1(Cas8a1), Cas5, Cas6 및 Cst2(Cas7)을 구성 요소로 한다. 본 발명에 있어서는, Cas3 및 캐스케이드를 총칭해서 「Cas 단백질군」이라고 칭한다.
이하, 타입 I-E의 CRISPR-Cas3 시스템을 대표예로서 설명하지만, 그 외의 타입의 CRISPR-Cas3 시스템에 대해서는, 시스템을 구성하는 캐스케이드를, 적절히, 바꿔 읽으면 된다.
-Cas 단백질군-
본 발명의 CRISPR-Cas3 시스템에 있어서, Cas 단백질군은, 단백질의 형태로, 당해 단백질을 코딩하는 폴리뉴클레오티드의 형태로, 혹은 당해 폴리뉴클레오티드를 포함하는 발현 벡터의 형태로, 진핵 세포에 도입할 수 있다. Cas 단백질군을 단백질의 형태로 진핵 세포에 도입하는 경우에는, 각 단백질의 양 등을 적절히 제조하는 것이 가능하고, 핸들링의 관점에서 우수하다. 또한, 세포 내에서의 절단 효율 등을 고려하여, Cas 단백질군의 복합체를 먼저 형성시킨 후에, 진핵 세포에 도입할 수도 있다.
본 발명에 있어서는, Cas 단백질군에, 핵 이행 시그널을 부가하는 것이 바람직하다. 핵 이행 시그널은, Cas 단백질군의 N 말단측 및/또는 C 말단측(각 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 5' 말단측 및/또는 3' 말단측)에 부가될 수 있다. 이와 같이, Cas 단백질군에 핵 이행 시그널을 부가함으로써, 세포 내에서 핵으로의 국재가 촉진되고, 그 결과, DNA의 편집이 효율적으로 행해진다고 하는 이점을 갖는다.
상기의 핵 이행 시그널은, 수개 내지 수십개의 염기성 아미노산을 포함하는 펩티드 서열이며, 단백질을 핵 안으로 이행시키는 것이면, 그의 서열은 특별히 한정되지 않는다. 이러한 핵 이행 시그널의 구체예는, 예를 들어 [Wu J et al. (2009) The Intracellular Mobility of Nuclear Import Receptors and NLS Cargoes, Biophysical journal, Vol.96(Issue 9), pp.3840-3849]에 기재되어 있어, 당해 기술 분야에서 통상 사용되는 임의의 핵 이행 시그널이, 본 발명에 있어서 사용될 수 있다.
핵 이행 시그널은, 예를 들어 PKKKRKV(서열 번호 52)(염기 서열 CCCAAGAAGAAGCGGAAGGTG(서열 번호 53)에 의해 코딩)일 수 있다. 상기 핵 이행 시그널을 사용하는 경우, 예를 들어 Cas 단백질군을 코딩하는 각 폴리뉴클레오티드의 5' 말단측에, 서열 번호 53의 염기 서열을 포함하는 폴리뉴클레오티드를 배치하는 것이 바람직하다. 또한, 핵 이행 시그널은, 예를 들어 KRTADGSEFESPKKKRKVE(서열 번호 54)(염기 서열 AAGCGGACTGCTGATGGCAGTGAATTTGAGTCCCCAAAGAAGAAGAGAAAGGTGGAA(서열 번호 55)에 의해 코딩)일 수 있다. 상기 핵 이행 시그널을 사용하는 경우, 예를 들어 Cas 단백질군을 코딩하는 각 폴리뉴클레오티드의 양 끝에, 서열 번호 55의 염기 서열을 포함하는 폴리뉴클레오티드를 배치하는 것(즉, 「바이파타이트 핵 이행 시그널(bpNLS)」을 사용하는 것)이 바람직하다.
이러한 개변은, 후술하는 프리 crRNA의 이용과 아울러, 본 발명의 CRISPR-Cas3 시스템을 진핵 세포 내에서 효율적으로 발현 및 기능시키는 데 있어서 중요다.
본 발명에 사용되는 Cas 단백질군의 하나의 바람직한 형태는, 이하이다.
Cas3; 서열 번호 1 또는 서열 번호 7로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질
Cse1(Cas8); 서열 번호 2 또는 서열 번호 8로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질
Cse2(Cas11); 서열 번호 3 또는 서열 번호 9로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질
Cas5; 서열 번호 4 또는 서열 번호 10으로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질
Cas6; 서열 번호 5 또는 서열 번호 11로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질
Cas7; 서열 번호 6 또는 서열 번호 12로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질
상기 Cas 단백질군은, (1) 야생형 대장균의 Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6, Cas7의 N 말단에, 핵 이행 시그널로서 PKKKRKV(서열 번호 52)를 부가한 단백질 또는 (2) 야생형 대장균의 Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6, Cas7의 N 말단 및 C 말단에, 핵 이행 시그널로서 KRTADGSEFESPKKKRKVE(서열 번호 54)를 부가한 단백질이다. 이러한 아미노산 서열의 단백질로 함으로써, 상기 Cas 단백질군을 진핵 세포의 핵 안으로 이행시킬 수 있다. 이와 같이 해서 핵 안으로 이행한 상기 Cas 단백질군은, 표적의 DNA를 절단한다. 또한, CRISPAR-Cas9 시스템에서는 곤란하다고 생각되는, 견고한 구조를 갖는 DNA 영역(이질염색질 등)에 있어서도, 표적 DNA의 편집이 가능해진다.
본 발명에 사용되는 Cas 단백질군의 각 단백질의 다른 하나의 양태는, 상기 Cas 단백질군의 염기 서열과 90% 이상의 서열 동일성을 갖는 염기 서열에 의해 코딩되는 단백질이다. 본 발명에 사용되는 Cas 단백질군의 각 단백질의 다른 하나의 양태는, 상기 Cas 단백질군의 염기 서열과 상보적인 염기 서열을 포함하는 폴리뉴클레오티드와 엄격한 조건에서 하이브리다이즈하는 폴리뉴클레오티드에 의해 코딩되는 단백질이다. 상기의 각 단백질은, Cas 단백질군을 구성하는 다른 단백질과 복합체를 형성했을 때 DNA 절단 활성을 갖는 것이다. 또한, 「서열 동일성」, 「엄격한 조건」 등의 용어의 의미는 후술한다.
-Cas 단백질군을 코딩하는 폴리뉴클레오티드-
타입 I-E의 CRISPR-Cas 시스템을 구성하는 야생형의 단백질을 코딩하는 폴리뉴클레오티드는, 진핵 세포 내에서 효율적으로 발현하도록 개변을 실시한 폴리뉴클레오티드를 포함한다. 즉, Cas 단백질군을 코딩하고, 개변이 실시된 폴리뉴클레오티드를 사용할 수 있다. 폴리뉴클레오티드의 개변의 하나의 바람직한 형태는, 진핵 세포 내에서의 발현에 적합한 염기 서열로의 개변이며, 예를 들어 진핵 세포 내에서 발현하도록 코돈을 최적화하는 것이다.
본 발명에 사용되는 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 하나의 바람직한 형태는, 이하이다.
Cas3; 서열 번호 1 또는 서열 번호 7로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드
Cse1(Cas8); 서열 번호 2 또는 서열 번호 8로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드
Cse2(Cas11); 서열 번호 3 또는 서열 번호 9로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드
Cas5; 서열 번호 4 또는 서열 번호 10으로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드
Cas6; 서열 번호 5 또는 서열 번호 11로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드
Cas7; 서열 번호 6 또는 서열 번호 12로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드
이들은, 대장균의 야생형 Cas 단백질군을 코딩하는 염기 서열(Cas3; 서열 번호 13, Cse1(Cas8); 서열 번호 14, Cse2(Cas11); 서열 번호 15, Cas5; 서열 번호 16, Cas6; 서열 번호 17, Cas7; 서열 번호 18)을, 인공적으로 개변함으로써, 포유 동물 세포에 있어서 발현 및 기능할 수 있도록 한 폴리뉴클레오티드이다.
상기의 폴리뉴클레오티드의 인공적인 개변은, 진핵 세포 내에서의 발현에 적합한 염기 서열로 개변하고, 또한 핵 이행 시그널을 부가하는 것이다. 염기 서열의 개변 및 핵 이행 시그널의 부가에 대해서는, 상기한 바와 같다. 이에 의해, 보다 충분한 Cas 단백질군의 발현량의 상승, 그리고 기능의 증대를 기대할 수 있다.
본 발명에 사용되는 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 다른 하나의 양태는, 상기 Cas 단백질군의 염기 서열과 90% 이상의 서열 동일성을 갖는 염기 서열을 포함하는, 야생형의 Cas 단백질군을 코딩하는 염기 서열을 개변한 폴리뉴클레오티드이다. 이들 각 폴리뉴클레오티드로부터 발현한 단백질은, Cas 단백질군을 구성하는 다른 폴리뉴클레오티드로부터 발현한 단백질과 복합체를 형성했을 때 DNA 절단 활성을 갖는 것이다.
염기 서열의 서열 동일성은, 염기 서열 전체(또는 Cse3의 기능에 필요한 부분을 코딩하고 있는 영역)에 있어서, 적어도 90% 이상, 보다 바람직하게는 95% 이상(예를 들어, 95%, 96%, 97%, 98%, 99% 이상)일 수 있다. 염기 서열의 동일성은, BLASTN 등의 프로그램을 이용하여, 결정할 수 있다([Altschul SF (1990) Basic local alig㎚ent search tool, Journal of Molecular Biology, Vol.215(Issue 3), pp.403-410]을 참조). BLASTN에 의해 염기 서열을 해석하는 경우의 파라미터의 일례로서는, 스코어(score)=100, 단어길이(wordlength)=12의 설정을 들 수 있다. BLASTN에 의한 해석을 행하기 위한 구체적인 방법은, 당업자에게 알려져 있다. 비교 대상의 염기 서열을 최적의 상태로 얼라인먼트하기 위해서, 부가 또는 결실(갭 등)을 허용해도 된다.
또한, 「DNA 절단 활성을 갖는다」란, 폴리뉴클레오티드쇄를 적어도 1군데에 있어서 절단할 수 있는 것을 의도한다.
본 발명의 CRISPR-Cas3 시스템은, 표적 서열을 특이적으로 인식해서 DNA를 절단하는 것이 바람직하다. CRISPR-Cas3 시스템이 표적 서열을 특이적으로 인식 하고 있는지의 여부는, 예를 들어 실시예 A-1에 설명되고 있는 듀얼-루시페라아제(dual-Luciferase) 검정에 의해 알 수 있다.
본 발명에 사용되는 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 다른 하나의 양태는, 상기 Cas 단백질군의 염기 서열과 상보적인 염기 서열을 포함하는 폴리뉴클레오티드와 엄격한 조건에서 하이브리다이즈하는 폴리뉴클레오티드이다. 이들 각 폴리뉴클레오티드로부터 발현한 단백질은, Cas 단백질군을 구성하는 다른 폴리뉴클레오티드로부터 발현한 단백질과 복합체를 형성했을 때 DNA 절단 활성을 갖는 것이다.
여기에서 「엄격한 조건」이란, 2개의 폴리뉴클레오티드쇄가, 염기 서열에 특이적인 2중쇄의 폴리뉴클레오티드를 형성하지만, 비특이적인 2중쇄의 폴리뉴클레오티드는 형성하지 않는 조건을 말한다. 「엄격한 조건에서 하이브리다이즈한다」란, 환언하면, 서열 동일성이 높은 핵산끼리(예를 들어 완전히 매칭된 하이브리드)의 융해 온도(Tm값)로부터 15℃ 낮은 온도, 바람직하게는 10℃ 낮은 온도, 보다 바람직하게는 5℃ 낮은 온도까지의 온도 범위에 있어서, 하이브리다이즈할 수 있는 조건이라고도 할 수 있다.
엄격한 조건의 일례를 나타내면, 이하와 같다. 먼저, 0.25M Na2HPO4, 7% SDS, 1mM EDTA, 1×덴하르트 용액을 포함하는 완충액(pH7.2) 중, 60 내지 68℃(바람직하게는 65℃, 보다 바람직하게는 68℃)에서, 16 내지 24시간, 2종류의 폴리뉴클레오티드를 하이브리다이즈시킨다. 그 후, 20mM Na2HPO4, 1% SDS, 1mM EDTA를 포함하는 완충액(pH7.2) 중, 60 내지 68℃(바람직하게는 65℃, 보다 바람직하게는 68℃)에서, 15분간의 세정을 2회 행한다.
다른 예로서는, 이하의 방법을 들 수 있다. 먼저, 25% 포름아미드(보다 엄격한 조건에서는 50% 포름아미드), 4×SSC(염화나트륨/시트르산나트륨), 50mM Hepes(pH7.0), 10×덴하르트 용액, 20㎍/mL 변성 연어 정자 DNA를 포함하는 하이브리다이제이션 용액 중, 42℃에서, 밤새 프리하이브리다이제이션을 행한 후, 표지한 프로브를 첨가하고, 42℃에서 밤새 보온함으로써, 2종류의 폴리뉴클레오티드의 하이브리다이제이션을 행한다.
이어서, 하기의 조건 중 어느 하나로 세정을 행한다. 통상의 조건; 1×SSC 및 0.1% SDS를 세정액으로 하여, 37℃ 정도에서 세정. 엄격한 조건; .5×SSC 및 0.1% SDS 세정액으로 하여, 42℃ 정도에서 세정. 더욱 엄격한 조건; 0.2×SSC 및 0.1% SDS를 세정액으로 하여, 65℃ 정도에서 세정.
이와 같이 하이브리다이제이션의 세정 조건이 엄격해질수록, 특이성이 높은 하이브리다이즈가 된다. 또한, 상기 SSC, SDS 및 온도의 조건 조합은, 단순한 예시에 지나지 않는다. 하이브리다이제이션의 엄격함을 결정하는 상술한 요소 또는 다른 요소(예를 들어, 프로브 농도, 프로브의 길이, 하이브리다이제이션 반응 시간 등)를 적절히 조합함으로써, 상기와 마찬가지의 엄격함을 실현할 수 있다. 이것은, 예를 들어 [Joseph Sambrook & David W. Russell, Molecular cloning: a laboratory manual 3rd Ed., New York: Cold Spring Harbor Laboratory Press, 2001] 등에 기재되어 있다.
-Cas 단백질군을 코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터-
본 발명에 있어서는, Cas 단백질군을 발현시키기 위한 발현 벡터를 이용할 수 있다. 발현 벡터는, 기재 벡터로서, 일반적으로 사용되는 여러 벡터를 사용할 수 있고, 도입되는 세포 또는 도입 방법에 따라서 적절히 선택될 수 있다. 구체적으로는, 플라스미드, 파지, 코스미드 등을 사용할 수 있다. 벡터의 구체적인 종류는 특별히 한정되는 것이 아니고, 숙주 세포 중에서 발현 가능한 벡터를 적절히 선택하면 된다.
상술한 발현 벡터의 예로서는, 파지 벡터, 플라스미드 벡터, 바이러스 벡터, 레트로바이러스 벡터, 염색체 벡터, 에피솜 벡터 및 바이러스 유래 벡터(세균 플라스미드, 박테리오 파지, 효모 에피솜 등), 효모 염색체 엘리먼트 및 바이러스(바큘로 바이러스, 파포바 바이러스, 백시니아 바이러스, 아데노 바이러스, 조류 폭스 바이러스, 가성 광견병 바이러스, 헤르페스 바이러스, 렌티 바이러스, 레트로 바이러스 등), 및 그들의 조합에서 유래하는 벡터(코스미드, 파지미드 등)를 들 수 있다.
발현 벡터는, 전사 개시 및 전사 종결을 위한 부위를 더 포함하고 있고, 또한 전사 영역 중에 리보솜 결합 부위를 포함하고 있는 것이 바람직하다. 벡터 중의 성숙 전사물의 코딩 부분은, 번역되어야 할 폴리펩티드의 처음에 전사 개시 코돈 AUG를 포함하고, 그리고 종료에 적절하게 위치되는 종지 코돈을 포함하게 된다.
본 발명에 있어서, Cas 단백질군을 발현시키기 위한 발현 벡터는, 프로모터 서열을 포함하고 있어도 된다. 상기 프로모터 서열은, 숙주가 되는 진핵 세포의 종류에 따라 적절히 선택하면 된다. 또한, 발현 벡터는, DNA로부터의 전사를 항진시키기 위한 서열, 예를 들어 인핸서 서열을 포함하고 있어도 된다. 인핸서로서는, 예를 들어 SV40 인핸서(이것은, 복제 기점의 하류의 100 내지 270bp에 배치된다), 사이토메갈로 바이러스의 초기 프로모터 인핸서, 복제 기점의 하류에 배치되는 폴리오머 인핸서 및 아데노 바이러스 인핸서를 들 수 있다. 또한, 발현 벡터는, 전사된 RNA를 안정화시키기 위한 서열, 예를 들어 폴리 A 부가 서열(폴리아데닐화 서열, polyA)을 포함하고 있어도 된다. 폴리 A 부가 서열의 예로서는, 성장 호르몬 유전자 유래의 폴리 A 부가 서열, 소 성장 호르몬 유전자 유래의 폴리 A 부가 서열, 인간 성장 호르몬 유전자 유래 폴리 A 부가 서열, SV40 바이러스 유래 폴리 A 부가 서열, 인간 또는 토끼의 β 글로빈 유전자 유래의 폴리 A 부가 서열을 들 수 있다.
동일한 벡터 내에 혼입되는 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 수는, 발현 벡터를 도입한 숙주 세포 내에서 CRISPR-Cas 시스템의 기능을 발휘할 수 있는 한에 있어서, 특별히 한정되지 않는다. 예를 들어, Cas 단백질군을 코딩하는 폴리뉴클레오티드를 1종류의(동일한) 벡터에 탑재한다고 하는 설계가 가능하고, 또한 추가로, 각 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 모두 또는 일부를 따로따로 벡터에 탑재한다고 하는 설계도 가능하다. 예를 들어, 캐스케이드 단백질을 코딩하는 폴리뉴클레오티드를 1종류의(동일한) 벡터에 탑재하고, Cas3을 코딩하는 폴리뉴클레오티드를 다른 벡터에 탑재한다고 하는 설계가 가능하다. 바람직하게는, 발현 효율 등의 관점에서, 각 Cas 단백질군을 코딩하는 폴리뉴클레오티드를 따로따로 6종류의 벡터에 탑재하는 방법이 사용된다.
그 외, 발현량을 조절하는 등의 목적을 위해, 동일한 벡터 중에, 동일한 단백질을 코딩하는 폴리뉴클레오티드를 복수 탑재해도 된다. 예를 들어, Cas3을 코딩하는 폴리뉴클레오티드를 1종류의(동일한) 벡터 내의 2군데에 배치한다고 하는 설계가 가능하다.
또한, Cas 단백질군을 코딩하는 복수의 염기 서열을 포함하고 있고, 당해 복수의 염기 서열 사이에는, 세포 내의 프로테아제에 의해 절단되는 아미노산 서열(2A 펩티드 등)을 코딩하는 염기 서열이 삽입되어 있는 발현 벡터를 사용해도 된다(예를 들어, 도 8의 벡터 구조를 참조). 이러한 염기 서열을 갖는 폴리뉴클레오티드가 전사·번역되면, 세포 내에서 하나로 연결된 폴리펩티드쇄가 발현한다. 그 후, 세포 내 프로테아제의 작용에 의해, Cas 단백질군이 분리되어, 개별의 단백질이 된 후에 복합체를 형성하고, 기능한다. 이에 의해, 세포 내에서 발현하는 Cas 단백질군의 양비를 조정할 수 있다. 예를 들어, 「Cas3을 코딩하는 염기 서열과 Cse1(Cas8)을 코딩하는 염기 서열을 1개씩 포함하는 발현 벡터」로부터는, Cas3과 Cse1(Cas8)이, 등량 발현하는 것이 예측된다. 또한, 1종류의 발현 벡터로 복수의 Cas 단백질군을 발현시키는 것이 가능하기 때문에, 핸들링성이 우수한 점에서 유리하다. 한편, DNA 절단 활성의 높이의 관점에서는, 통상, Cas 단백질군을 각각 다른 발현 벡터에 의해 발현시키는 양태 쪽이 우수하다.
본 발명에 사용되는 발현 벡터는, 공지된 방법에 의해 제작할 수 있다. 이러한 방법으로서는, 벡터를 제작용 키트에 부속하는 실시 매뉴얼에 기재된 방법에 더하여, 다양한 안내서에 기재된 방법을 들 수 있다. 예를 들어, [Joseph Sambrook & David W. Russell, Molecular cloning: a laboratory manual 3rd Ed., New York: Cold Spring Harbor Laboratory Press, 2001]은, 포괄적인 안내서이다.
-crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터-
본 발명의 CRISPR-Cas3 시스템은, 게놈 편집을 행하는 DNA에 대한 표적화를 위해서, crRNA, crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터를 포함한다.
crRNA는 CRISPR-Cas 시스템의 일부를 형성하는 RNA이며, 표적 서열과 상보적인 염기 서열을 갖는다. 본 발명의 CRISPR-Cas3 시스템은, crRNA에 의해, 표적 서열을 특이적으로 인식해서 그 서열을 절단하는 것을 가능하게 한다. CRISPR-Cas9 시스템을 대표로 하는 CRISPR-Cas 시스템에 있어서는, 지금까지 cRNA로서, 통상, 성숙 crRNA가 사용되어 왔다. 그러나, CRISPR-Cas3 시스템을 진핵 세포로 기능시키는 경우에 있어서는, 그 이유는 명백하지 않지만, 성숙 crRNA의 이용은 적합하지 않은 것이 명확해졌다. 그리고, 놀랍게도, 성숙 crRNA 대신에, 프리 crRNA를 이용함으로써, 진핵 세포에 있어서 고효율로 게놈 편집을 행하는 것이 가능한 것이 판명되었다. 이 사실은, 성숙 crRNA와 프리 crRNA와의 대비 실험으로부터 명백하다(도 10). 따라서, 본 발명의 crRNA로서는, 프리 crRNA를 사용하는 것이 특히 바람직하다.
본 발명에 사용하는 프리 crRNA는, 전형적으로는, 「리더 서열-반복 서열-스페이서 서열-반복 서열(LRSR 구조)」 또는 「반복 서열-스페이서 서열-반복 서열(RSR 구조)」의 구조를 갖는다. 리더 서열은, AT 풍부한 서열로, 프리 crRNA를 발현시키는 프로모터로서 기능한다. 반복 서열은, 스페이서 서열을 개재해서 반복하고 있는 서열이며, 스페이서 서열은, 표적 DNA에 상보적인 서열로서 본 발명에 있어서 설계하는 서열이다(본래는, 어댑테이션의 과정에 있어서 받아들인, 외래 DNA 유래의 서열이다). 프리 crRNA는, 캐스케이드를 구성하는 단백질(예를 들어, 타입 I-A, B, D 내지 E에서는 Cas6, 타입 I-C에서는 Cas5)에 의해 절단되면 성숙 crRNA가 된다.
전형적으로는, 리더 서열의 쇄길이는 86염기, 반복 서열의 쇄길이는 29염기이다. 스페이서 서열의 쇄길이는, 예를 들어 10 내지 60염기, 바람직하게는 20 내지 50염기, 보다 바람직하게는 25 내지 40염기, 전형적으로는 32 내지 37염기이다. 따라서, 본 발명에 있어서 사용되는 프리 crRNA의 쇄길이는, LRSR 구조의 경우, 예를 들어 154 내지 204염기, 바람직하게는 164 내지 194염기, 보다 바람직하게는 169 내지 184염기, 전형적으로는 176 내지 181염기이다. 또한, RSR 구조의 경우, 예를 들어 68 내지 118염기, 바람직하게는 78 내지 108염기, 보다 바람직하게는 83 내지 98염기, 전형적으로는 90 내지 95염기이다.
본 발명의 CRISPR-Cas3 시스템을 진핵 세포에 있어서 기능시키기 위해서는, 프리 crRNA의 반복 서열이, 캐스케이드를 구성하는 단백질에 의해 절단되는 과정이 중요하다고 생각된다. 따라서, 상기 반복 서열은, 이러한 절단이 발생하는 한, 상기 쇄길이보다 짧아도 되고 길어도 되는 것은, 이해하기 바란다. 즉, 프리 crRNA는, 후술하는 성숙 crRNA의 양 끝에, 캐스케이드를 구성하는 단백질에 의한 절단에 충분한 서열이 부가된 crRNA라 할 수 있다. 본 발명의 방법의 바람직한 형태는, 이와 같이, CRISPR-Cas3 시스템을 진핵 세포에 도입한 후에, 캐스케이드를 구성하는 단백질에 의해 crRNA가 절단되는 공정을 포함한다.
한편, 프리 crRNA가 절단되어 생성하는 성숙 crRNA는, 「5' 핸들 서열-스페이서 서열-3' 핸들 서열」의 구조를 갖는다. 전형적으로는, 5' 핸들 서열은, 반복 서열의 22 내지 29번째의 8염기로 이루어지고 Cas5에 홀딩된다. 또한, 전형적으로는, 3' 핸들 서열은, 반복 서열의 1 내지 21번째의 21염기로 이루어지고, 6 내지 21번째의 염기로 스템-루프 구조를 형성하여, Cas6에 홀딩된다. 따라서, 성숙 crRNA의 쇄길이는 통상 61 내지 66염기이다. 단, CRISPR-Cas3 시스템의 타입에 따라서는, 3' 핸들 서열을 가지지 않는 성숙 crRNA도 있는 점에서, 이 경우에는 쇄길이는 21염기 짧아진다.
또한, RNA의 서열은, DNA의 편집을 원하는 표적 서열에 따라서 적절히 설계하면 된다. 또한, RNA의 합성은, 당해 분야에서 기지인 임의의 방법을 사용해서 행할 수 있다.
-진핵 세포-
본 발명에 있어서의 「진핵 세포」로서는, 예를 들어 동물 세포, 식물 세포, 조세포, 진균 세포를 들 수 있다. 또한 동물 세포로서는, 예를 들어 포유 동물 세포 외에, 어류, 조류, 파충류, 양서류, 곤충류의 세포를 들 수 있다.
「동물 세포」에는, 예를 들어 동물의 개체를 구성하고 있는 세포, 동물로부터 적출된 기관·조직을 구성하는 세포, 동물의 조직에서 유래하는 배양 세포 등이 포함된다. 구체적으로는, 예를 들어 난모 세포나 정자 등의 생식 세포; 각 단계의 배의 배세포(예를 들어, 1세포기 배, 2세포기 배, 4세포기 배, 8세포기 배, 16세포기 배, 상실기 배 등); 유도 다능성 줄기(iPS) 세포나 배성 줄기(ES) 세포 등의 줄기 세포; 섬유아 세포, 조혈 세포, 뉴런, 근세포, 골세포, 간세포, 췌장 세포, 뇌세포, 신장 세포 등의 체세포 등을 들 수 있다. 게놈 편집 동물의 작성에 사용되는 난모 세포로서는, 수정 전 및 수정 후의 난모 세포를 이용할 수 있지만, 바람직하게는 수정 후의 난모 세포, 즉 수정란이다. 특히 바람직하게는, 수정란은 전핵기 배의 것이다. 난모 세포는, 동결 보존된 것을 해동해서 사용할 수 있다.
본 발명에 있어서 「포유 동물」이란, 인간 및 비인간 포유 동물을 포함하는 개념이다. 비인간 포유 동물의 예로서는, 소, 멧돼지, 돼지, 양, 염소 등의 우제류, 말 등의 기제류, 마우스, 래트, 모르모트, 햄스터, 다람쥐 등의 설치류, 토끼 등의 토끼목, 개, 고양이, 페렛 등의 식육류 등을 들 수 있다. 상술한 비인간 포유 동물은, 가축 또는 컴패니언 애니멀(애완 동물)이어도 되고, 야생 동물이어도 된다.
「식물 세포」로서는, 예를 들어 곡물류, 유료 작물, 사료 작물, 과일, 채소류의 세포를 들 수 있다. 「식물 세포」에는, 예를 들어 식물의 개체를 구성하고 있는 세포, 식물로부터 분리한 기관이나 조직을 구성하는 세포, 식물의 조직에서 유래하는 배양 세포 등이 포함된다. 식물의 기관이나 조직으로서는, 예를 들어 잎, 줄기, 경정(생장점), 뿌리, 괴경, 캘러스 등을 들 수 있다. 식물의 예로서는, 벼, 옥수수, 바나나, 피넛, 해바라기, 토마토, 유채, 담배, 소맥, 대맥, 감자, 대두, 목화, 카네이션 등을 들 수 있고, 그의 번식 재료(예를 들어, 종자, 괴근, 괴경 등)도 포함된다.
-DNA의 편집-
본 발명에 있어서, 「진핵 세포의 DNA를 편집한다」란, 진핵 세포의 DNA의 편집을 생체 내에서 행하는 공정이어도 되고, 시험관 내에서 행하는 공정이어도 된다. 또한, 「DNA를 편집한다」란, 이하의 유형에 예시되는 조작(그의 조합을 포함한다)을 의도한다.
또한, 본 명세서에 있어서, 상기의 문맥에서 사용되는 DNA는, 세포핵 내에 존재하는 DNA뿐만 아니라, 미토콘드리아 DNA 등의 세포핵 이외에 존재하는 DNA 및 외래성 DNA도 포함한다.
1. 표적 부위에 있어서의 DNA쇄를 절단한다.
2. 표적 부위에 있어서의 DNA쇄의 염기를 결실시킨다.
3. 표적 부위에 있어서의 DNA쇄에 염기를 삽입한다.
4. 표적 부위에 있어서의 DNA쇄의 염기를 치환한다.
5. 표적 부위에 있어서의 DNA쇄의 염기를 수식한다.
6. 표적 부위에 있어서의 DNA(유전자)의 전사를 조절한다.
본 발명의 CRISPR-Cas3 시스템의 하나의 양태에 있어서는, DNA 절단을 도입하는 것 이외의 방법으로, 표적 DNA를 수식하는 효소 활성을 갖는 단백질을 이용한다. 이 양태는, 예를 들어 Cas3 혹은 캐스케이드를 원하는 효소 활성을 갖는 이종 단백질과 융합하여, 키메라 단백질로 함으로써 달성할 수 있다. 따라서, 본 발명에 있어서의 「Cas3」 및 「캐스케이드」에는, 이러한 융합 단백질도 포함된다. 융합하는 단백질의 효소 활성으로서는, 예를 들어 데아미나아제 활성(예를 들어, 시티딘 데아미나아제 활성, 아데노신 데아미나아제 활성), 메틸트랜스퍼라아제 활성, 탈메틸화 효소 활성, DNA 수복 활성, DNA 손상 활성, 디스뮤타아제 활성, 알킬화 활성, 탈퓨린 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사아제 활성, 리컴비나아제 활성, 폴리머라아제 활성, 리가아제 활성, 광회복 효소 활성 및 글리코실라아제 활성이 포함되지만, 이들에 제한되지 않는다. 이 경우, 반드시, Cas3의 뉴클레아제 활성이나 헬리카제 활성은 필요가 없는 것이므로, Cas3으로서는, 이들 활성의 일부 혹은 전부를 결실시킨 변이체(예를 들어, D 도메인 H74A의 변이체(dnCas3), SF2 도메인 모티프 1의 K320N의 변이체(dhCas3) 및 SF2 도메인 모티프 3의 S483A/T485A의 더블의 변이체(dh2Cas3))를 이용할 수 있다. 예를 들어, Cas3의 뉴클레아제 활성의 일부 또는 전부를 소실시킨 변이체와 데아미나아제와의 융합 단백질을 본 발명의 CRISPR-Cas3 시스템의 구성 요소로 함으로써, 표적 부위에 있어서의 큰 결실을 발생시키지 않고, 염기를 치환함으로써, 정밀한 게놈 편집이 가능해진다. CRISPR-Cas 시스템으로의 데아미나아제의 적용의 방법은 공지이며(Nishida K. et al., Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems, Science, DOI: 10.1126/science.aaf8729, (2016)), 그것을 본 발명의 CRISPR-Cas3 시스템에 응용하면 된다.
본 발명의 CRISPR-Cas3 시스템의 다른 양태에 있어서는, DNA 절단하지 않고, 본 시스템의 결합 부위에 있어서의 유전자의 전사를 조절한다. 이 양태는, 예를 들어 Cas3 혹은 캐스케이드를 원하는 전사 조절 단백질과 융합하고, 키메라 단백질로 함으로써 달성할 수 있다. 따라서, 본 발명에 있어서의 「Cas3」 및 「캐스케이드」에는, 이러한 융합 단백질도 포함된다. 전사 조절 단백질로서는, 예를 들어 광 유도성 전사 제어 인자, 소분자/약제 반응성 전사 제어 인자, 전사 인자, 전사 억제 인자 등을 들 수 있지만, 이들에 제한되지 않는다. 이 경우, 반드시, Cas3의 뉴클레아제 활성이나 헬리카제 활성은 필요가 없는 것이므로, Cas3으로서는, 이들 활성의 일부 혹은 전부를 결실시킨 변이체(예를 들어, D 도메인 H74A의 변이체(dnCas3), SF2 도메인 모티프 1의 K320N의 변이체(dhCas3) 및 SF2 도메인 모티프3의 S483A/T485A의 더블의 변이체(dh2Cas3))를 이용할 수 있다. CRISPR-Cas 시스템으로의 전사 조절 단백질의 적용 방법은, 당업자에게 공지이다.
또한, 본 발명의 CRISPR-Cas3 시스템에 있어서, 예를 들어 Cas3의 뉴클레아제 활성의 일부 혹은 전부를 결실시킨 변이체를 이용하는 경우, 다른 뉴클레아제 활성을 갖는 단백질을 Cas3 또는 캐스케이드와 융합해도 된다. 이러한 양태도, 본 발명에 포함된다.
또한, 본 발명의 CRISPR-Cas3 시스템에 있어서, Cas3의 뉴클레아제 활성의 일부 혹은 전부를 결실시킨 변이체를 이용하고, DNA의 편집에 있어서, 다른 단백질의 활성을 이용하는 경우에는, 본 명세서에 있어서의 「DNA의 절단 활성」은, 적절히, 당해 다른 단백질이 갖는 각종 활성으로 바꿔서 읽는 것으로 한다.
또한, DNA의 편집은, 개체 내의 특정한 세포에 포함되는 DNA에 대하여 행해지는 것이어도 된다. 이러한 DNA의 편집은, 예를 들어 동식물의 개체를 구성하는 세포 중, 특정한 세포를 표적으로 하여 행할 수 있다.
본 발명의 CRISPR-Cas3 시스템을 구성하는 분자를 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터의 형태로 진핵 세포에 도입하는 방법은, 특별히 한정되지 않는다. 예를 들어, 전기 천공법, 인산 칼슘법, 리포솜법, DEAE 덱스트란법, 미세주입법, 양이온성 지질 매개 트랜스펙션, 일렉트로포레이션, 형질 도입, 바이러스 벡터를 사용한 감염 등의 방법을 들 수 있다. 이러한 방법은, 「Leonard G. Daviset al., Basic methods in molecular biology, New York: Elsevier, 1986」 등, 많은 표준적 연구실 매뉴얼에 기재되어 있다.
본 발명의 CRISPR-Cas3 시스템을 분자를 단백질의 형태로 진핵 세포에 도입하는 방법은, 특별히 한정되지 않는다. 예를 들어, 일렉트로포레이션, 양이온성 지질 매개 트랜스펙션, 미세주입 등을 들 수 있다.
본 발명에 의한 DNA의 편집은, 여러 분야에 응용할 수 있다. 응용에는, 예를 들어 유전자 치료, 품종 개량, 트랜스제닉 동물 또는 세포의 제작, 유용 물질의 생산, 생명 과학 연구 등이 포함된다.
세포로부터 비인간 개체를 제작하는 방법으로서는, 공지된 방법을 이용할 수 있다. 동물에 있어서 세포로부터 비인간 개체를 제작하는 경우, 통상, 생식 세포 또는 다능성 줄기 세포가 이용된다. 예를 들어, 본 발명의 CRISPR-Cas3 시스템을 구성하는 분자를 난모 세포에 도입하고, 얻어진 난모 세포를 뒤이어, 거짓 임신 상태로 한 암컷 비인간 포유 동물의 자궁에 이식하고, 그 후 산자를 얻는다. 이식은 1세포기 배, 2세포기 배, 4세포기 배, 8세포기 배, 16세포기 배, 또는 상실기 배의 수정란에서 행할 수 있다. 난모 세포는 필요에 따라, 이식될 때까지 적당한 조건 하에서 배양할 수 있다. 난모 세포의 이식 및 배양은 종래 공지된 방법에 기초해서 행할 수 있다(Nagy A. et al., Manipulating the Mouse Embryo. Cold Spring Harbour, New York:Cold Spring Harbour Laboratory Press, 2003). 얻어진 비인간 개체로부터는, 원하는 DNA가 편집된 자손이나 클론을 얻을 수도 있다.
또한, 식물에 있어서는, 옛부터, 그의 체세포가 분화 전능성을 갖고 있는 것이 알려져 있고, 여러 식물에 있어서, 식물 세포로부터 식물체를 재생하는 방법이 확립되어 있다. 따라서, 예를 들어 본 발명의 CRISPR-Cas3 시스템을 구성하는 분자를 식물 세포에 도입하고, 얻어진 식물 세포로부터 식물체를 재생함으로써, 원하는 DNA가 녹-인된 식물체를 얻을 수 있다. 얻어진 식물체로부터는, 원하는 DNA가 편집된 자손, 클론 또는 번식 재료를 얻을 수도 있다. 조직 배양에 의해 식물의 조직을 재분화시켜서 개체를 얻는 방법으로서는, 본 기술 분야에 있어서 확립된 방법을 이용할 수 있다(형질 전환 프로토콜 [식물편] 다베이 유타카·편 가가꾸 도진 pp.340-347(2012)).
[2] CRISPR-Cas3 시스템에 사용되는 키트
본 발명의 CRISPR-Cas3 시스템에 사용되는 키트는, 이하의 (A) 및 (B)를 포함한다.
(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및
(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터
추가로, crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터를 포함해도 된다.
본 발명의 키트의 구성 요소는, 모두 또는 일부가 혼합된 양태여도 되고, 각각이 독립되어 있는 양태여도 된다.
본 발명의 키트는, 예를 들어 의약품, 식품, 축산, 수산, 공업, 바이오 공학, 생명과학 연구 등의 분야에 이용할 수 있다.
이하, 본 발명의 키트에 대해서, 의약품(약제)을 상정해서 설명한다. 또한, 상기 키트를 축산, 바이오 공학, 생명 과학 연구 등의 분야에서 사용하는 경우에는, 이하의 설명을, 당해 분야의 기술 상식에 기초하여 적절히 치환함으로써 실시할 수 있다.
본 발명의 CRISPR-Cas3 시스템을 사용하여, 인간을 포함하는 동물 세포의 DNA를 편집하기 위한 의약품은, 통상의 방법에 의해 제조될 수 있다. 보다 구체적으로는, 상기 본 발명의 CRISPR-Cas3 시스템을 구성하는 분자를, 예를 들어 의약품 첨가물과 조합함으로써 제조될 수 있다.
여기서 「의약품 첨가물」이란, 의약품에 포함되는 유효 성분 이외의 물질을 의도한다. 의약품 첨가물은, 제제화를 용이하게 하고, 품질의 안정화를 도모하고, 유용성을 높이는 등의 목적을 위해, 의약품에 포함되는 물질이다. 일례에 있어서, 상기 의약품 첨가물은, 부형제, 결합제, 붕괴제, 활택제, 유동화제(고형 방지제), 착색제, 캡슐 피막, 코팅제, 가소제, 교미제, 감미제, 착향제, 용제, 용해 보조제, 유화제, 현탁화제(점착제), 점조제, pH 조정제(산성화제, 알칼리화제, 완충제), 습윤제(가용화제), 항균성 보존제, 킬레이트제, 좌제 기재, 연고 기제, 경화제, 연화제, 의료용수, 분사제, 안정제, 보존제일 수 있다. 이들 의약품 첨가물은, 의도된 제형 및 투여 경로, 그리고 표준적인 약학적 관행에 따라, 당업자에 의해 용이하게 선택될 수 있다.
또한, 본 발명의 CRISPR-Cas3 시스템을 이용해서 동물 세포의 DNA를 편집하기 위한 의약품은, 가일층의 유효 성분을 포함하고 있어도 된다. 상기 가일층의 유효 성분으로서는, 특별히 한정되지 않고 당업자에 의해 적절히 설계할 수 있다.
이상으로 설명한 유효 성분 및 의약품 첨가물의 구체예는, 예를 들어 미국 식품 의약품국(FDA), 유럽 의약품청(EMA), 일본 후생 노동성 등이 책정하고 있는 기준에 의해, 알 수 있다.
의약품을 원하는 세포에 송달하는 방법으로서는, 예를 들어, 해당 세포를 표적으로 하는 바이러스 벡터(아데노 바이러스 벡터, 아데노 수반 바이러스 벡터, 렌티 바이러스 벡터, 센다이 바이러스 벡터 등), 해당 세포를 특이적으로 인식하는 항체 등을 사용한 방법을 들 수 있다. 의약품은, 목적에 따라 임의의 제형을 취할 수 있다. 또한 상기 의약품은, 의사 또는 의료 종사자에 의해, 적절히 처방된다.
본 발명의 키트는, 추가로 사용설명서를 구비하고 있는 것이 바람직하다.
실시예
이하, 실시예에 의해 본 발명을 더욱 상세히 설명하지만, 본 발명은 하기 실시예에만 한정되는 것은 아니다.
A. 진핵 세포에 있어서의 CRISPR-Cas3 시스템의 확립
〔재료와 방법〕
[1] 표적 서열을 포함하는 리포터 벡터의 제작
표적 서열은, 인간 CCR5 유전자 유래의 서열(서열 번호 19) 및 대장균의 CRISPR의 스페이서 서열(서열 번호 22)로 했다.
표적 서열을 벡터에 삽입하기 위해서, 인간 CCR5 유전자 유래의 표적 서열(서열 번호 19)을 포함하는 합성 폴리뉴클레오티드(서열 번호 20) 및 상기 표적 서열(서열 번호 19)에 상보적인 서열을 포함하는 합성 폴리뉴클레오티드(서열 번호 21)를 준비했다. 마찬가지로, 대장균의 CRISPR의 스페이서 서열 유래의 표적 서열(서열 번호 22)을 포함하는 합성 폴리뉴클레오티드(서열 번호 23) 및 상기 표적 서열(서열 번호 22)에 상보적인 서열을 포함하는 합성 폴리뉴클레오티드(서열 번호 24)를 준비했다. 상기 합성 폴리뉴클레오티드는, 모두 홋카이도 시스템 사이언스 가부시키가이샤로부터 입수했다.
상기의 폴리뉴클레오티드를, [Sakuma T et al. (2013) Efficient TALEN construction and evaluation methods for human cell and animal applications, Genes to Cells, Vol.18(Issue 4), pp.315-326]에 기재된 방법에 의해, 리포터 벡터에 삽입했다. 개략을 나타내면 이하와 같다. 먼저, 서로 상보적인 서열을 갖는 폴리뉴클레오티드(서열 번호 20의 폴리뉴클레오티드 및 서열 번호 21의 폴리뉴클레오티드; 서열 번호 23의 폴리뉴클레오티드 및 서열 번호 24의 폴리뉴클레오티드)를, 95℃에서 5분간 가열하고, 그 후 실온까지 냉각하고, 하이브리다이즈시켰다. 상기의 공정에는, 블록 인큐베이터(BI-515A, 아스텍크사)를 사용했다. 이어서, 하이브리다이즈시켜서 2중쇄 구조를 형성한 폴리뉴클레오티드를, 기재 벡터에 삽입하고, 리포터 벡터로 했다.
제작한 리포터 벡터의 서열을, 서열 번호 31(인간 CCR5 유전자 유래의 표적 서열을 포함하는 리포터 벡터) 및 서열 번호 32(대장균의 CRISPR의 스페이서 서열 유래의 표적 서열을 포함하는 리포터 벡터)에 나타낸다. 또한, 리포터 벡터의 구조를, 도 4의 (d)에 나타낸다.
[2] Cse1(Cas8), Cse2(Cas11), Cas5, Cas6, Cas7 및 crRNA 발현 벡터의 제작
[인서트의 증폭 및 제조]
Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7을 코딩하는, 개변된 염기 서열을 갖는 폴리뉴클레오티드(각각, 서열 번호 2, 서열 번호 3, 서열 번호 4, 서열 번호 5 및 서열 번호 6)에 대해서는, 먼저, 서열 번호 2-서열 번호 3-서열 번호 6-서열 번호 4-서열 번호 5의 순으로 연결된 폴리뉴클레오티드(Cse1(Cas8)-Cse2(Cas11)-Cas7-Cas5-Cas6의 순으로, 각각을 코딩하는 염기 서열이 연결된 폴리뉴클레오티드)를, 젠스크립트사에 제조 위임하고, 입수했다. Cse1(Cas8)-Cse2(Cas11)-Cas7-Cas5-Cas6의 각 단백질을 코딩하는 염기 서열간은, 2A 펩티드(아미노산 서열: GSGATNFSLLKQAGDVEENPGP(서열 번호 58))로 연결했다.
또한, 2A 펩티드를 코딩하는 염기 서열은, 각각의 Cas 단백질 연결부에 따라 약간 상이하고, 이하와 같았다. Cse1(Cas8)과 Cse2(Cas11) 사이에 있어서의 서열: GGAAGCGGAGCAACCAACTTCAGCCTGCTGAAGCAGGCCGGCGATGTGGAGGAGAATCCAGGCCCC(서열 번호 59). Cse2(Cas11)와 Cas7 사이에 있어서의 서열: GGCTCCGGCGCCACCAATTTTTCTCTGCTGAAGCAGGCAGGCGATGTGGAGGAGAACCCAGGACCT(서열 번호 60). Cas7과 Cas5 사이에 있어서의 서열: GGATCTGGAGCCACCAATTTCAGCCTGCTGAAGCAAGCAGGCGACGTGGAAGAAAACCCAGGACCA(서열 번호 61). Cas5와 Cas6 사이에 있어서의 서열: GGATCTGGGGCTACTAATTTTTCTCTGCTGAAGCAAGCCGGCGACGTGGAAGAGAATCCAGGACCG(서열 번호 62).
이어서, 하기 표의 PCR 조건(프라이머 및 타임 코스)에서, 각 폴리뉴클레오티드를 증폭했다. PCR에는, 2720 Thermal cycler(applied biosystems사)를 사용했다.
crRNA를 발현시키기 위한 염기 서열을 갖는 폴리뉴클레오티드로서, 하기의 상보적인 서열을 갖는 폴리뉴클레오티드를 입수했다.
1. 인간 CCR5 유전자 유래의 서열에 대응하는 crRNA를 발현시키기 위한 폴리뉴클레오티드(서열 번호 25 및 26, 홋카이도 시스템 사이언스사에서 입수)
2. 대장균의 CRISPR의 스페이서 서열에 대응하는 crRNA를 발현시키기 위한 폴리뉴클레오티드(서열 번호 27 및 28, 홋카이도 시스템 사이언스사에서 입수)
3. 인간 EMX1 유전자 유래의 서열에 대응하는 crRNA를 발현시키기 위한 폴리뉴클레오티드(서열 번호 29 및 30, 파스맥사에서 입수).
[라이게이션 및 형질 전환]
기재 플라스미드로서, pPB-CAG-EBNXN(Sanger Center로부터 공여)을 사용했다. NEB 버퍼 중에서, 기재 플라스미드 1.6㎍과, 제한 효소 BglII(New England Biolabs사) 1μl 및 XhoI(New England Biolabs사) 0.5μl를 혼합하고, 37℃에서 2시간 반응시켰다. 절단된 기재 플라스미드는, 겔 추출 키트(Gel extraction kit)(Qiagen사)로 정제했다.
이와 같이 제조한 기재 플라스미드 및 상기 인서트를, Gibson Assembly 시스템에서 라이게이션했다. 라이게이션에서는, 기재 플라스미드와 인서트와의 비율이 1:1이 되도록 하고, Gibson Assembly 시스템의 프로토콜에 따라 행하였다(50℃에서 25분간, 반응액의 전체 용량: 8μL).
이어서, 상기에서 얻어진 플라스미드의 용액(라이게이션 반응액) 6μL와, 컴피턴트 세포(다케다 연구실 제작)를 사용해서, 통상의 방법에 의해, 형질 전환을 행하였다.
그 후, 알칼리 프렙법으로, 형질 전환한 대장균으로부터 플라스미드 벡터를 정제했다. 간결하게는, QIAprep 스핀 미니프렙 키트(Spin Miniprep Kit)(Qiagen사)를 사용해서 플라스미드 벡터를 회수하고, 회수한 플라스미드 벡터를 에탄올 침전법으로 정제 후, TE 완충액 중에서 1㎍/μL의 농도가 되도록 제조했다.
각 플라스미드 벡터의 구조를, 도 4의 (a) 내지 (c)에 나타낸다. 또한, 프리 crRNA의 발현 벡터의 염기 서열을, 서열 번호 33(인간 CCR5 유전자 유래의 서열에 대응하는 crRNA를 발현시키는 발현 벡터), 서열 번호 34(대장균의 CRISPR의 스페이서 서열에 대응하는 crRNA를 발현시키는 발현 벡터) 및 서열 번호 35(인간 EMX1 유전자 유래의 서열에 대응하는 crRNA를 발현시키는 발현 벡터)에 나타낸다.
[3] Cas3 발현 벡터의 제작
Cas3을 코딩하는, 개변된 염기 서열을 갖는 폴리뉴클레오티드(서열 번호 1)는, 젠스크립트사에서 입수했다. 구체적으로는, 상기의 폴리뉴클레오티드가 혼입되어 있는 pUC57 벡터를, 젠스크립트사에서 입수했다.
상기의 벡터를, 제한 효소 NotI로 절단했다. 이어서, 클레나우 프래그먼트(Klenow Fragment)(다카라 바이오사)를 2U 및 2.5mM dNTP 혼합물(다카라 바이오사)을 1μL를 사용하여, 프래그먼트의 단 끝을 평활화시켰다. 그 후, 겔 추출(Qiagen사)을 사용하여, 상기 프래그먼트를 정제했다. 정제된 프래그먼트를, 제한 효소 XhoI로 더 절단하고, 겔 추출(Qiagen사)을 사용해서 정제했다.
정제된 프래그먼트를, 기재 플라스미드(pTL2-CAG-IRES-NEO 벡터, 다케다 연구실 제작) 및 라이게이션 키트(Mighty Mix, 다카라 바이오사)를 사용하여, 라이게이션했다. 그 후, [2]와 동일한 조작에 의해, 형질 전환 및 정제를 행하였다. 회수한 플라스미드 벡터는, TE 완충액 중에서 1㎍/μL의 농도가 되도록 제조했다.
[4] BPNLS를 포함하는 플라스미드 벡터의 제작
BPNLS를 5' 말단 및 3' 말단에 연결시킨, Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7 발현 벡터를 제작했다(도 7을 참조).
BPNLS를 양 말단에 포함하는 각 Cas 단백질군에 관한 인서트의 제작은, Thermo Fisher Scientific에 의뢰했다. 상기 인서트의 구체적인 서열은, (AGATCTTAATACGACTCACTATAGGGAGAGCCGCCACCATGGCC: 서열 번호 56)-(서열 번호 7 내지 12 중 어느 하나)-(TAATATCCTCGAG: 서열 번호 57)이다. 서열 번호 56은, BgIII에 의한 절단 개소를 마련한 서열이다. 서열 번호 57은, XhoI에 의한 절단 개소를 마련한 서열이다.
상기 서열이 혼입되어 있는 pMK 벡터를, 제한 효소 BgIII 및 XhoI로 절단하고, 겔 추출(Qiagen사)을 사용해서 정제했다. 정제한 프래그먼트를, 기재 플라스미드(pPB-CAG-EBNXN, Sanger Center로부터 공여) 및 라이게이션 키트(Mighty Mix, 다카라 바이오사)를 사용하여, 라이게이션했다. 그 후, [2]와 동일한 조작에 의해, 형질 전환 및 정제를 행하였다. 회수한 플라스미드 벡터는, TE 완충액 중에서 1㎍/μL의 농도가 되도록 제조했다.
[5] 캐스케이드(2A)를 포함하는 플라스미드 벡터의 제작
Cse1(Cas8), Cse2(Cas11), Cas7, Cas5 및 Cas6이, 이 순으로 연결된 염기 서열의 발현 벡터를 제작했다. 보다 구체적으로는, (NLS-Cse1(Cas8): 서열 번호 2)-2A-(NLS-Cse2(Cas11): 서열 번호 3)-2A-(NLS-Cas7: 서열 번호 6)-2A-(NLS-Cas5: 서열 번호 4)-2A-(NLS-Cas6: 서열 번호 5)의 순으로 배치된 발현 벡터를 제작했다(도 8 참조). 또한, NLS의 아미노산 서열은 PKKKRKV(서열 번호 52), 염기 서열은 CCCAAGAAGAAGCGGAAGGTG(서열 번호 53)이다. 또한, 2A 펩티드의 아미노산 서열은 GSGATNFSLLKQAGDVEENPGP(서열 번호 58)이다(대응하는 염기 서열은, 각각 서열 번호 59 내지 62이다).
상술한 염기 서열을 갖는 폴리펩티드를, 젠스크립트로부터 입수했다. 상기 서열이 혼입되어 있는 pUC57 벡터를, 제한 효소 EcoRI-HF로 절단하고, 겔 추출(Qiagen사)을 사용해서 정제했다. 정제한 프래그먼트를, 기재 플라스미드(pTL2-CAG-IRES-Puro 벡터, 다케다 연구실 제작) 및 라이게이션 키트(Mighty Mix, 다카라 바이오사)를 사용하여, 라이게이션했다. 그 후, [2]와 동일한 조작에 의해, 형질 전환 및 정제를 행하였다. 회수한 플라스미드 벡터는, TE 완충액 중에서 1㎍/μL의 농도가 되도록 제조했다.
〔실시예 A-1〕
염기 서열을 개변하고, 핵 이행 시그널을 부가한 Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7과, crRNA를 HEK(human embryonic kidney; 인간 배아 신장) 293T 세포에 발현시키고, 외인성 DNA의 표적 서열의 절단 활성을 평가했다.
트랜스펙션에 앞서, HEK293T 세포를 10㎝ 디쉬 중에서 배양했다. HEK293T 세포의 배양은, EF 배지(GIBCO사)에서, 37℃, 5% CO2 분위기 하에서 행하였다. EF 배지 중에 있어서의 HEK293T 세포의 밀도는, 3×104/100μL로 제조했다.
또한, 상기 리포터 벡터 100ng; Cas3 플라스미드, Cse1(Cas8) 플라스미드, Cse2(Cas11) 플라스미드, Cas5 플라스미드, Cas6 플라스미드, Cas7 플라스미드 및 crRNA 플라스미드 각 200ng; pRL-TK 벡터(레닐라 루시페라아제를 발현 가능, Promega사) 60ng; 그리고, pBluecscriptII KS(+) 벡터(Agilent Technologies사) 300ng를, Opti-MEM(Thermo Fisher Scientific사) 25μL에 혼합했다. 리포터 벡터로서, CCR5 유래의 표적 서열을 갖는 리포터 벡터를 사용한 조건이 도 1의 1에 상당하고, 대장균의 CRISPR의 스페이서 서열을 갖는 리포터 벡터를 사용한 조건이 도 1의 10에 상당한다.
리포펙타민(lipofectamine) 2000(Thermo Fisher Scientific사) 1.5μL와 OptiMEM(Thermo Fisher Scientific사) 25μL를 혼합하고, 실온에서 5분간 인큐베이트했다. 그 후, 상기의 플라스미드+OptiMEM 혼합물과 리포펙타민 2000+OptiMEM 혼합물을 혼합하고, 실온에서 20분간 인큐베이트했다. 얻어진 혼합물을, HEK293T 세포를 포함하는 상기 EF 배지 1mL와 혼합하고, 96웰 플레이트에 파종했다(각각의 벡터의 조합당 1웰씩, 합계 12웰에 파종했다).
37℃, 5% CO2 분위기 하에서 24시간 배양 후, 듀얼-글로 루시페라아제 검정 시스템(Dual-Glo Luciferase assay system)(Promega사)의 프로토콜에 따라, 듀얼- 루시페라아제 검정을 행하였다. 루시페라아제 및 레닐라 루시페라아제의 측정에는, Centro XS3 LB 960(BERTHOLD TECHNOLOGIES사)를 사용했다.
대조 실험으로서, 이하의 조건에서 마찬가지 실험을 행하였다.
1. Cas3 플라스미드, Cse1(Cas8) 플라스미드, Cse2(Cas11) 플라스미드, Cas5 플라스미드, Cas6 플라스미드 또는 Cas7 플라스미드 중 어느 하나 대신에 동량의 pBluecscriptII KS(+) 벡터(Agilent Technologies사)를 혼합하고, 발현시켰다(도 1의 2 내지 7).
2. 상기 조작 수순에서 사용한 crRNA 플라스미드 대신에, 표적 서열과는 상보적이지 않은 crRNA를 발현시키는 플라스미드를 혼합했다. 즉, CCR5 유전자 유래의 표적 서열에 대해서는, 대장균의 CRISPR의 스페이서 서열에 대응하는 crRNA를 발현시키는 플라스미드를 혼합시키고(도 1의 8), 대장균의 CRISPR의 스페이서 서열을 표적으로 하는 경우에는, CCR5 유전자 유래의 서열에 대응하는 crRNA를 발현시키는 플라스미드를 혼합하고, 발현시켰다(도 1의 11).
3. 네거티브 컨트롤로서, CCR5 유래의 표적 서열을 갖는 리포터 벡터만(도 1의 9), 대장균의 CRISPR의 스페이서 서열을 갖는 리포터 벡터만(도 1의 12)을 발현시켰다.
(결과)
듀얼-루시페라아제 검정의 결과를 도 1의 위의 그래프로, 실험 조건을 도 1의 아래의 표로 나타냈다. 도 1의 (b) 중, 「CCR5-표적」 및 「스페이서-표적」은, 각각 CCR5 유래의 표적 서열 및 대장균의 CRISPR의 스페이서 서열을 나타낸다. 또한, 「CCR5-crRNA」 및 「스페이서-crRNA」는, 각각 상기 CCR5-표적과 상보적인 서열 및 스페이서-표적과 상보적인 서열을 나타낸다.
도 1에 있어서, Cas3 플라스미드, Cse1(Cas8) 플라스미드, Cse2(Cas11) 플라스미드, Cas5 플라스미드, Cas6 플라스미드 및 Cas7 플라스미드 모두와, 표적 서열에 상보적인 crRNA 플라스미드를 도입한 시스템은, 그 밖의 시스템과 비교하여, 높은 절단 활성을 나타냈다(1과 2 내지 8, 10과 11을 각각 비교). 따라서, 본 발명의 일 실시 형태에 따른 발현 벡터를 사용함으로써, 인간 세포 중에 있어서, Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7을 발현시키는 것이 가능한 것을 알 수 있다.
또한, 상기 발현 벡터를 인간 세포에 도입함으로써, 인간 세포 중에서 Cas3, 캐스케이드 및 crRNA의 복합체가 형성되고, 표적 서열을 절단하는 것이 시사되었다.
또한, 도 1에 있어서, 8과 9 및 11과 12를 비교하면, 표적 서열과 상보적이지 않은 crRNA를 발현시킨 시스템에 있어서는, 절단 활성이 네거티브 컨트롤과 동등한 레벨이었다. 즉, 본 발명의 CRISPR-Cas3 시스템은, 포유 동물 세포 내에 있어서, crRNA와 상보적인 서열을 특이적으로 절단할 수 있는 것이 시사되었다.
〔실시예 A-2〕
실시예 A-1과 마찬가지 방법을 사용하여, 타입 I의 CRISPR-Cas 시스템에 의해 인간 세포의 내인성 DNA를 절단할 수 있는지 여부를 평가하기 위한 실험을 행하였다.
구체적으로는, 인간 세포에 있어서 염기 서열을 개변하고, 핵 이행 시그널을 부가한 Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7과, 프리 crRNA를 발현시키고, 상기 세포의 내인성 CCR5 유전자의 서열이 절단되는지의 여부를 평가했다.
실시예 A-1과 동일한 HEK239T 세포를, 1×105개/웰의 밀도로, 24웰 플레이트에 파종하고, 24시간 배양했다.
Cas3 플라스미드 1㎍, Cse1(Cas8) 플라스미드 1.3㎍, Cse2(Cas11) 플라스미드 1.3㎍, Cas5 플라스미드 1.1㎍, Cas6 플라스미드 0.8㎍, Cas7 플라스미드 0.3㎍ 및 crRNA 플라스미드 1㎍을, Opti-MEM(Thermo Fisher Scientific사) 50μL에 혼합했다. 이어서, 리포펙타민(등록상표) 2000(Thermo Fisher Scientific사) 5μL, Opti-MEM(Thermo Fisher Scientific사) 50μL 및 EF 배지 1mL의 혼합물을, 상기의 DNA 혼합물에 첨가했다. 그 후, 얻어진 혼합물 1mL를, 상기 24웰 플레이트에 첨가했다.
37℃, 5% CO2 분위기 하에서 24시간 배양 후, EF 배지 1mL로 배지를 교환했다. 트랜스펙션으로부터 48시간 후(배지 교환으로부터 24시간 후), 세포를 회수하고, PBS 중에서 1×104개/5μL의 농도로 조정했다.
상기 세포를, 95℃에서 10분간 가열했다. 이어서, 프로테이나제 K를 10㎎ 첨가하고, 55℃에서 70분간 인큐베이트했다. 또한, 95℃에서 10분간 가열 처리를 한 것을, PCR의 주형으로서 사용했다.
상기 주형 10μL를, 2스텝 PCR을 35사이클 실시함으로써, 증폭시켰다. 이때, PCR의 프라이머에는, 서열 번호 47 및 48의 서열을 갖는 프라이머를 사용했다. 또한, DNA 폴리머라아제에는 KOD FX(도요보사)를 사용하고, 2스텝 PCR의 수순은 KOD FX에 첨부된 프로토콜에 따랐다. PCR에 의해 증폭된 산물은, QIAquick PCR 정제 키트(QIAGEN사)를 사용해서 정제했다. 구체적인 수순은, 상기 키트에 첨부된 프로토콜에 따랐다.
rTaq DNA 폴리머라아제(도요보사)를 사용하여, 얻어진 정제 DNA의 3' 말단에 dA를 부가했다. 상기 정제 DNA를 2% 아가로오스 겔 중에서 전기 영동시켜서, 약 500 내지 700bp의 밴드를 잘라낸 후, 겔 추출 키트(QIAGEN사)를 사용하여, 잘라낸 겔로부터 DNA를 추출, 정제했다. 이어서, pGEM-T 이지 벡터 시스템즈(easy vector Systems)(Promega사)를 사용해서 TA 클로닝을 행하고, 상기 DNA를 클로닝했다. 마지막으로, 알칼리 프렙법에 의해 클로닝된 DNA를 추출하고, 생어 시퀀싱으로 해석했다. 해석에는, BigDye(등록상표) 종결인자 v3.1 사이클 시퀀싱 키트(Terminator v3.1 Cycle Sequencing Kit)(Thermo Fisher Scientific사) 및 Applied Biosystems 3730 DNA 분석기(Thermo Fisher Scientific사)를 사용했다.
본 실시예에 있어서의 CRISPR-Cas 시스템의 표적이 되는 내인성 CCR5 유전자 서열의 개요를, 도 2에 기초하여 설명한다. 또한 도 2에서는, 엑손은 대문자로, 인트론은 소문자로 나타냈다.
본 실시예에서는, 제3 염색체 단완(P) 21 영역에 위치하는, CCR5 유전자 내의 서열을 표적으로 했다(도 2; 서열 번호 46에 CCR5의 염기 서열의 전장을 나타낸다). 구체적으로는, CCR5 유전자의 엑손 3 내의 서열을 표적 서열로 했다. 컨트롤로서, Cas9의 표적 서열도, 거의 동일 위치에 배치했다. 즉, 하선부의 서열 전체가 타입 I의 CRISPR-Cas 시스템의 표적 서열(AAG 및 그것에 이어지는 32염기)이며, 이중 하선부의 서열이 Cas9의 표적 서열(CGG 및 그것에 앞서는 20염기)이다. 타입 I의 CRISPR-Cas 시스템의 표적 서열(AAG 및 그것에 이어지는 32 염기)에 대한 가이드를 가능하게 하도록, crRNA의 서열을 설계했다.
(결과)
상기 실험의 결과, 원래의 염기 서열과 비교하여, 401bp가 결실하고 있는 클론 1, 341bp가 결실하고 있는 클론 2, 268bp가 결실하고 있는 클론 3 및 344bp가 결실하고 있는 클론 4가 얻어졌다(도 3a 내지 d). 이러한 점에서, 본 발명의 CRISPR-Cas3 시스템에 의해, 인간 세포의 내인성 DNA를 결실할 수 있는 것이 나타났다. 즉, 상기 CRISPR-Cas 시스템에 의해, 인간 세포의 DNA의 편집이 가능한 것이 시사되었다.
본 실시예에서는, 염기쌍을 결실하고 있는 클론이 관찰되었다. 이 사실은, 본 발명의 CRISPR-Cas3 시스템에 의하면, 복수의 개소에서 DNA 절단이 발생하는 것을 지지하고 있다.
본 발명의 CRISPR-Cas3 시스템에 의해, 수백염기쌍(268 내지 401bp)의 DNA가 결실했다. 이것은, Cas9를 사용한 CRISPR-Cas 시스템에 의해 얻어지는 결실(통상 DNA 상의 1개소만에서 절단)보다, 광범위하게 걸치는 것이었다.
〔실시예 A-3〕
실시예 A-1과 마찬가지 방법을 사용하여, CRISPR-Cas3 시스템에 의해 인간 세포의 내인성 DNA를 절단할 수 있는지 여부를 평가하기 위한, 실험을 행하였다.
구체적으로는, 인간 세포에 있어서 염기 서열을 개변하고, 핵 이행 시그널을 부가한 Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7과, 프리 crRNA를 발현시키고, 상기 세포의 내인성 EMX1 유전자의 서열이 절단되는지 여부를 평가했다.
실시예 A-1과 동일한 HEK293T 세포를, 1×105개/웰의 밀도로, 24웰 플레이트에 파종하고, 24시간 배양했다.
Cas3 플라스미드 500ng, Cse1(Cas8) 플라스미드 500ng, Cse2(Cas11) 플라스미드 1㎍, Cas5 플라스미드 1㎍, Cas6 플라스미드 1㎍, Cas7 플라스미드 3㎍ 및 crRNA 플라스미드 500㎍을, Opti-MEM(Thermo Fisher Scientific사) 50μL에 혼합했다. 상기의 혼합물에, 리포펙타민(등록상표) 2000(Thermo Fisher Scientific사) 4μL, Opti-MEM(Thermo Fisher Scientific사) 50μL를, 더 첨가하고, 혼합했다. 얻어진 혼합물을, 실온에서 20분간 인큐베이트한 후, 상기 HEK293T 세포에 첨가했다.
여기서, 실시예 A-3에 있어서 사용한, Cas 단백질군의 발현 벡터의 구조를, 도 7에 도시한다. 도 7에 도시한 바와 같이, 상기 발현 벡터는, Cas 단백질군을 코딩하는 서열의 전후를 BPNLS(바이파타이트 NLS) 사이에 끼운 것이다([Suzuki K et al. (2016) In vivo genome editing via CRISPR/Cas9 mediated homology-independent targeted integration, Nature, Vol.540(Issue 7631), pp.144-149]를 참조). BPNLS의 아미노산 서열은 KRTADGSEFESPKKKRKVE(서열 번호 54), 염기 서열은 AAGCGGACTGCTGATGGCAGTGAATTTGAGTCCCCAAAGAAGAAGAGAAAGGTGGAA(서열 번호 55)이다.
상기 HEK293T 세포를, 37℃, 5% CO2 분위기 하에서 24시간 배양한 후, EF 배지 1mL(1웰당 1mL)와 배지를 교환했다. 트랜스펙션으로부터 48시간 후(배지 교환으로부터 24시간 후), 세포를 회수하고, PBS 중에서 1×104개/5μL의 농도로 조정했다.
상기 세포를, 95℃에서 10분간 가열했다. 이어서, 프로테이나제 K를 10㎎ 첨가하고, 55℃에서 70분간 인큐베이트했다. 추가로, 95℃에서 10분간 가열 처리를 한 것을, PCR의 주형으로서 사용했다.
상기 주형 10μL를, 3스텝 PCR을 40사이클 실시함으로써, 증폭시켰다. 이때, PCR의 프라이머에는, 서열 번호 50 및 51의 서열을 갖는 프라이머를 사용했다. 또한, DNA 폴리머라아제에는 Hotstartaq(QIAGEN사)를 사용하여, 3스텝 PCR의 수순은 Hotstartaq에 첨부된 프로토콜에 따랐다. PCR에 의해 증폭된 산물은, 2% 아가로오스 겔 중에서 전기 영동시켜서, 약 900 내지 1100bp의 밴드를 잘라낸 후, 겔 추출 키트(QIAGEN사)를 사용하여, 잘라낸 겔로부터 DNA를 추출, 정제했다. 구체적인 수순은, 상기 키트에 첨부된 프로토콜에 따랐다.
이어서, pGEM-T 이지 벡터 시스템즈(Promega사)를 사용해서 TA 클로닝을 행하고, 상기 DNA를 클로닝했다. 마지막으로, 알칼리 프렙법에 의해 클로닝된 DNA를 추출하고, 생어 시퀀싱으로 해석했다. 해석에는, BigDye(등록상표) 종결인자 v3.1 사이클 시퀀싱 키트(Thermo Fisher Scientific사) 및 Applied Biosystems 3730 DNA 분석기(Thermo Fisher Scientific사)를 사용했다.
실시예 A-3에 있어서 CRISPR-Cas3 시스템의 표적이 되는, 내인성 EMX1 유전자 서열의 개요를, 도 5에 기초하여 설명한다. 또한 도 5에서는, 엑손은 대문자로, 인트론은 소문자로 나타냈다.
실시예 A-3에서는, 제2 염색체 단완(P) 13 영역에 위치하는, EMX1 유전자 내의 서열을 표적으로 했다(도 5; 서열 번호 49에 EMX1의 염기 서열의 전장을 나타낸다). 구체적으로는, EMX1 유전자의 엑손 3 내의 서열을 표적 서열로 했다. 컨트롤로서, Cas9의 표적 서열도, 거의 동일 위치에 배치했다. 즉, 보다 상류에 있는 하선부의 서열이 타입 I의 CRISPR-Cas 시스템의 표적 서열(AAG 및 그것에 이어지는 32 염기)이며, 보다 하류에 있는 하선부의 서열이 Cas9의 표적 서열(TGG 및 그것에 앞서는 20염기)이다. 실시예 A-3에서 사용한 crRNA의 서열은, CRISPR-Cas3 시스템의 표적 서열(AAG 및 그것에 이어지는 32염기)에 대한 가이드를 가능하게 하도록 설계되어 있었다.
(결과)
상기 실험의 결과, 원래의 염기 서열과 비교하여, 513bp 및 363bp의 2군데가 결실하고 있는 클론 1, 그리고 694bp가 결실하고 있는 클론 2가 얻어졌다(도 6a, b). 이 실험 결과로부터도, 본 발명의 CRISPR-Cas3 시스템에 의해, 인간 세포의 내인성 DNA를 결실할 수 있는 것이 나타났다. 즉, 상기 CRISPR-Cas3 시스템에 의해, 인간 세포의 DNA의 편집이 가능한 것이 시사되었다.
또한, 2중쇄 DNA의 2군데 이상에 있어서 절단이 발생하고 있는 것 및 수백 염기쌍의 DNA가 결실하는 것도 실시예 A-2와 마찬가지였다. 따라서, 실시예 A-3의 결과는, 실시예 A-2에서 얻어진 시사를, 보다 견고하게 지지하는 것이다.
〔실시예 A-4〕
염기 서열을 개변하고, 추가로 캐스케이드 단백질을 코딩하는 염기 서열을 연결한 CRISPR-Cas3 시스템을, HEK293T 세포에 발현시키고, 외인성 DNA의 표적 서열의 절단 활성을 평가했다.
실시예 A-4에 있어서는, 리포터 벡터 100ng; Cas3 플라스미드, 캐스케이드(2A) 플라스미드 및 crRNA 플라스미드 각 200ng; pRL-TK 벡터(레닐라 루시페라아제를 발현 가능, Promega사) 60ng; 그리고, pBluecscriptII KS(+) 벡터(Agilent Technologies사) 300ng를, Opti-MEM(Thermo Fisher Scientific사) 25μL에 혼합했다. 리포터 벡터로서, CCR5 유래의 표적 서열을 갖는 리포터 벡터를 사용한 조건이 도 9의 (b)의 1에 상당하며, 대장균의 CRISPR의 스페이서 서열을 갖는 리포터 벡터를 사용한 조건이 도 9의 (b)의 6에 상당한다.
여기서, 상기 리포터 벡터는, 〔제조예〕의 [1]에서 제작한 2종류의 리포터 벡터(즉, 도 4의 (d)에 나타나 있는 구조의 벡터)를 사용했다. 또한, 상기 캐스케이드(2A) 플라스미드는, 〔제조예〕의 [4]에서 제작한 발현 벡터(즉, 도 8에 나타나 있는 구조의 벡터)를 사용했다.
상기의 발현 벡터를 사용한 것 이외에는, 실시예 A-1과 마찬가지 방법에 의해, 듀얼-루시페라아제 검정을 행하였다.
또한, 대조 실험으로서, 이하의 조건에서 마찬가지 실험을 행하였다.
1. Cas3 플라스미드 및 캐스케이드(2A) 플라스미드의 어느 한쪽 대신에, 동량의 pBluscriptII KS(+) 벡터(Agilent Technologies사)를 혼합하고, 발현시켰다(도 9의 2 및 3).
2. 상기의 조작 수순에서 사용한 crRNA 플라스미드 대신에, 표적 서열과는 상보적이지 않은 crRNA를 발현시키는 플라스미드를 혼합했다. 즉, CCR5 유전자 유래의 표적 서열에 대해서는, 대장균의 CRISPR의 스페이서 서열에 대응하는 crRNA를 발현시키는 플라스미드를 혼합시키고(도 9의 4), 대장균의 CRISPR의 스페이서 서열을 표적으로 하는 경우에는, CCR5 유전자 유래의 서열에 대응하는 gRNA를 발현시키는 플라스미드를 혼합하고, 발현시켰다(도 9의 7).
3. 네거티브 컨트롤로서, CCR5 유래의 표적 서열을 갖는 리포터 벡터만(도 9의 5), 대장균의 CRISPR의 스페이서 서열을 갖는 리포터 벡터만(도 9의 8)을 발현시켰다.
(결과)
듀얼-루시페라아제 검정의 결과를 도 9의 위의 그래프로, 실험 조건을 도 9의 아래의 표로 나타냈다. 도 9에 있어서, 「CCR5-표적」 및 「스페이서-표적」은, 각각 CCR5 유래의 표적 서열 및 대장균의 CRISPR의 스페이서 서열을 나타낸다. 또한, 「CCR5-crRNA」 및 「스페이서-crRNA」는, 각각, 상기 CCR5-표적과 상보적인 서열 및 스페이서-표적과 상보적인 서열을 나타낸다.
도 9에 도시한 바와 같이, Cas3 플라스미드 및 캐스케이드(2A) 플라스미드의 양쪽과, 표적 서열에 상보적인 crRNA 플라스미드를 도입한 시스템은, 그 외의 시스템과 비교하여, 유의미하게 높은 절단 활성을 나타냈다(1과 2 내지 5, 6과 7 내지 8을 각각 비교). 이러한 점에서, 캐스케이드 단백질을 코딩하는 염기 서열을 연결해서 발현시킨 시스템에 있어서도, 본 발명의 일 실시 형태에 관한 CRISPR-Cas 시스템에 의하면, 포유 동물 세포 내에 있어서, crRNA와 상보적인 서열을 특이적으로 절단할 수 있는 것이 시사되었다.
B. 진핵 세포에 있어서의 CRISPR-Cas3 시스템에 의한 게놈 편집에 영향을 주는 요소 등의 검증
〔재료와 방법〕
[1] Cas 유전자와 crRNA의 구성
bpNLS를 각각의 5'측 및 3'측에 부가한, 대장균 K-12주 유래의 Cas3과 캐스케이드의 구성 유전자(Cse1, Cse2, Cas5, Cas6, Cas7)를 설계하고, 포유 동물 세포에 코돈 옵티마이즈 후에 유전자 합성에 의해 클로닝했다. 이들 유전자는, 생어 연구소로부터 기증받은 pPB-CAG.EBNXN 플라스미드의 CAG 프로모터의 하류에 서브 클로닝했다. H74A(데드 니카제(dead nickase); dn), K320N(데드 헬리카제(dead helicase); dh), S483A와 T485A의 이중 변이체(데드 헬리카제 ver.2; dh2)라고 하는 Cas3의 변이체는, PrimeSTAR MAX의 PCR 산물을 셀프라이게이션함으로써 제작했다. crRNA의 발현 플라스미드에 관해서, U6 프로모터 하의 스페이서의 위치에 2군데의 BbsI 제한 효소 부위를 가지고 있는 crRNA의 서열을 합성했다. 모든 crRNA 발현 플라스미드는, BbsI 제한 효소 사이트에, 표적 서열의 32염기쌍에 2중쇄 올리고를 삽입함으로써 제작했다.
Cas9-sgRNA 발현 플라스미드인 pX330-U6-Chimeric_BB-CBh-hSpCas9는, Addgene으로부터 입수했다. gRNA를 설계하기 위해서, 인간 게놈에서의 유니크한 표적 부위를 예측하는 CRISPR 웹 툴, CRISPR 디자인 툴 및/또는 CRISPRdirect를 사용했다. 표적 서열은, Feng Zhang 연구소의 프로토콜에 따라, pX330의 sgRNA 스캐폴드에 클로닝했다.
2군데의 BsaI 제한 효소 부위를 포함하는 SSA 리포터 플라스미드는, 히로시마 대학의 야마모토 타카시 교수로부터 기증되었다. 게놈 영역의 표적 서열은, BsaI 사이트에 삽입했다. 레닐라 루시페라아제 벡터로서, pRL-TK(Promega사)를 입수했다. 모든 플라스미드는, PureLink 하이퓨어 플라스미드 정제 키트(HiPure Plasmid Purification Kit)(Thermo Fisher사)를 사용하여, 미디프렙 혹은 맥시프렙법에 의해 준비했다.
[2] HEK293T 세포에서의 DNA 절단 활성의 평가
포유 동물 세포에서 DNA 절단 활성을 검출하기 위해서, 실시예 A와 마찬가지로, SSA 검정을 실시했다. HEK293T 세포는, 10% 태아 소 혈청을 첨가한 고-글루코스 둘베코 변형 이글 배지(Dulbecco's modified Eagle's medium)(Thermo fisher사)에서, 37℃, 5% CO2 하에서 배양했다. 0.5×104개의 세포를 96구멍 플레이트의 웰에 파종하고, 24 시간 후에, Cas3, Cse1, Cse2, Cas7, Cas5, Cas6, crRNA 발현 플라스미드(각각 100ng), SSA 리포터 벡터(100ng), 레닐라 루시페라아제 벡터(60ng)를, 리포펙타민 2000 및 OptiMEM(Life Technologies사)를 사용하여, 조금 수정한 프로토콜에 따라, HEK293T 세포에 트랜스펙션했다. 트랜스펙션의 24시간 후에, 듀얼-글로 루시페라아제 검정 시스템(Promega사)을 사용하여, 프로토콜에 따라, 듀얼 루시페라아제 검정을 행하였다.
[3] HEK293T 세포에서의 인델의 검출
2.5×104개의 세포를 24구멍 플레이트의 웰에 파종한 24시간 후에, Cas3, Cse1, Cse2, Cas7, Cas5, Cas6, crRNA 발현 플라스미드(각각 250ng)를, 리포펙타민 2000과 OptiMEM(Life Technologies사)을 사용해서, 조금 수정한 프로토콜에 따라, HEK293T 세포에 트랜스펙션했다. 트랜스펙션의 2일 후, Tissue XS kit(다카라 바이오사)를 사용하여, 프로토콜에 따라, 회수한 세포로부터 전체 DNA를 추출했다. 표적 유전자좌를 Gflex(다카라 바이오사) 또는 Quick Taq HS DyeMix(TOYOBO사)를 사용해서 증폭하고, 아가로오스 겔로 전기 영동했다. PCR 산물에 있어서의 작은 삽입/결실 변이를 검출하기 위해서, SURVEYOR 변이 검출 기트(Mutation Detection Kit)(Integrated DNA Technologies사)를 프로토콜에 따라 사용했다. TA 클로닝에서는, pCR4Blunt-TOPO 플라스미드 벡터(Life Technologies사)를 프로토콜에 따라 사용했다. 서열 해석에는, BigDye 종결인자 사이클 시퀀싱 키트 및 ABI PRISM 3130 유전 분석기(Life Technologies사)를 사용했다.
진귀한 여러 변이를 검출하기 위해서, TruSeq 나노 DNA 라이브러리 프렙 키트(Illumina사)를 사용해서 PCR 증폭 산물의 DNA 라이브러리를 제조하고, Macrogen의 표준 수순에 따라서 MiSeq(2x150bp)로 앰플리콘 시퀀싱을 행하였다. 각각의 샘플의 로 리드(raw reads)를, BWA-MEM에 의해 인간 게놈의 hg38에 맵핑했다. 커버리지 데이터는, Integrative Genomics Viewer(IGV)로 시각화하고, 표적 영역에서의 히스토그램을 추출했다.
포유 동물 세포에서의 SNP-KI(스닙 녹-인)을 검출하기 위한, mCherry-P2A-EGFP c321C>G를 갖는 리포터 HEK293T 세포는, 나카다 신이치로 교수로부터 기증받았다. 리포터 세포는, 1㎍/ml의 퓨로마이신으로 배양했다. 500ng의 도너 플라스미드 또는 1중쇄 DNA를, CRISPR-Cas3과 함께, 상기의 방법으로 함께 도입했다. 트랜스펙션 5일 후에 전체 세포를 회수하고, AriaIIIu(BD)를 사용해서 FACS 해석을 행하였다. GFP 양성 세포를 분류하고, 상기 방법으로 전체 DNA를 추출했다. 게놈에 있어서의 SNP 교환은, HiDi DNA 폴리머라아제(myPOLS Biotec사)를 사용한 PCR 증폭에 의해 검출했다.
[4] 오프 타깃 부위의 후보 검출
타입 I-E CRISPR의 오프 타깃 후보는, 인간 게놈의 hg38에 있어서, 2개의 상이한 수순에 의해 GGGenome을 사용해서 검출했다. PAM 후보의 서열로서는, 기보(Leenay, R.T, et al. Mol. Cell 62, 137-147(2016), Jung, et al. Mol. Cell. 2017 Jung et al., Cell 170, 35-47(2017))에 따라, AAG, ATG, AGG, GAG, TAG, AAC를 선택했다. 6의 배수의 포지션은 표적 부위로서 인식되지 않는 것이 보고되고 있었던 점에서(Kunne et al., Molecular Cell 63, 1-13(2016)), 최초의 어프로치에서는, 이들을 제외한 표적 서열의 32염기쌍에 대하여, 보다 미스매치가 적은 것을 선택했다. 다음 어프로치에서는, 표적 서열의 PAM측 5'끝에 완전히 매칭하고 있는 영역을 검출하고, 높은 순으로 열거했다.
[5] 오프 타깃 해석의 딥 시퀀싱
전체 게놈 서열에서는, 트랜스펙션된 HEK293T 세포로부터 게놈 DNA를 추출하고, 코바리스 소니케이터(Covaris sonicator)를 사용해서 절단했다. TruSeq DNA PCR-프리 LT 라이브러리 프렙 키트(Illumina사)를 사용해서 DNA 라이브러리를 준비하고, 다카라 바이오의 표준 수순에 따라, HiSeq X(2×150bp)를 사용해서 게놈 시퀀싱을 행하였다. 각각의 샘플의 로 리드(raw reads)를, BWA-MEM에 의해 인간 게놈의 hg38에 맵핑하고, 트림모매틱 프로그램(Trimmomatic program)에 의해 클리닝했다. 디스코던트 리드 페어(Discordant read pairs)와 스플릿 리드(split reads)는, 각각 samtools와 Lumpy-sv에 의해 제외했다. 동일한 염색체에서의 큰 결실만을 검출하기 위해서, 게놈 분석 툴키트 프로그램(Genome Analysis Toolkit program)의 BadMateFilter를 사용하여, 다른 염색체에 맵핑된 리드 페어를 제거했다. 각각 100kb 영역에서의 디스코던트 리드 페어 또는 스플릿 리드의 총 수를 Bedtools로 카운트하여, 네거티브 컨트롤과의 에러율을 산출했다. 시퀀싱 전의 오프 타깃 후보를 풍부하게 하기 위해서, SureSelectXT 커스텀 DNA 프로브를 SureDesign에 의해 적절하게 엄격한 조건에서 설계하고, Agilent technologies가 제작했다. 표적 영역은, 이하와 같이, 선택했다. 표적 영역 부근의 프로브는, PAM의 상류 800kb와 하류 200kb를 커버했다. CRISPR-Cas3의 오프 타깃 영역 부근에서는, PAM 후보의 9kb 상류와 1kb 하류를 커버했다. CRISPR-Cas9의 오프 타깃 영역 부근에서는, PAM의 상류, 하류 각각 1kb를 커버했다. SureSelectXT 시약 키트(reagent kit)와 커스텀 프로프 키트(custom probe kit)에 의한 DNA 라이브러리의 준비 후, 다카라 바이오의 표준 수순에 따라, Hiseq 2500(2×150bp)에 의해, 게놈 시퀀싱을 행하였다. 동일한 염색체에서의 디스코던트 리드 페어와 스플릿 리드는, 상기의 방법으로 제외했다. 각각 10kb 영역에서의 디스코던트 리드 페어 또는 스플릿 리드의 총 수를 Bedtools로 카운트하고, 네거티브 컨트롤과의 에러율을 산출했다.
〔실시예 B-1〕 DNA 절단 활성에 있어서의 crRNA와 핵 이행 시그널의 종류의 영향
실시예 A에서는, 우연히도, crRNA로서 프리 crRNA(LRSR; 리더 서열-반복 서열-스페이서 서열-반복 서열)를 포함하는 CRISPR-Cas3 시스템을 이용해서 진핵 세포에 있어서의 게놈 편집에 성공했다. 여기서, 본 발명자는, 지금까지 오랜 세월에 걸쳐서 CRISPR-Cas3 시스템을 이용한 진핵 세포에서의 게놈 편집에 성공하지 못한 이유가, crRNA로서 성숙 crRNA가 사용되어 온 것에 있는 것은 아닌지 생각되었다. 그래서, crRNA로서, 프리 crRNA(LRSR) 외에, 프리 crRNA(RSR; 반복 서열-스페이서 서열-반복 서열)와 성숙 crRNA(5' 핸들 서열-스페이서 서열-3' 핸들 서열)를 제조하고, 실시예 A의 리포터 시스템에 의해 게놈 편집 효율을 검증했다(도 10a, b). 또한, 프리 crRNA(LRSR), 프리 crRNA(RSR), 성숙 crRNA의 염기 서열을, 각각 서열 번호: 63, 64, 65로 나타낸다.
그 결과, 성숙 crRNA를 사용한 CRISPR-Cas3 시스템에서는, 표적 DNA의 절단 활성이 확인되지 않았다. 그 반면, 놀랍게도, 프리 crRNA(LRSR, RSR)를 사용한 경우에는, 매우 높은 표적 DNA의 절단 활성이 확인되었다. CRISPR-Cas3 시스템에 있어서의 이 결과는, 성숙 crRNA를 사용함으로써 높은 DNA 절단 활성이 확인되는 CRISPR-Cas9 시스템과 대조적이다. 또한, 이 사실은, CRISPR-Cas3 시스템에 의해, 지금까지 진핵 세포에 있어서의 게놈 편집에 성공하지 않은 주된 이유 중 하나로서, 성숙 crRNA가 사용되어 온 것을 들 수 있는 것을 시사한다.
또한, Cas3에 부가하는 핵 이행 시그널로서, SV40 핵 이행 시그널과 바이파타이트 핵 이행 시그널을 사용한 검증도 행하였다(도 11). 그 결과, 바이파타이트 핵 이행 시그널을 사용한 경우에, 더 높은 표적 DNA의 절단 활성이 확인되었다.
따라서, 이후의 실험에서는, crRNA로서 프리 crRNA(LRSR)를, 핵 이행 시그널로서 바이파타이트 핵 이행 시그널을 사용했다.
〔실시예 B-2〕 DNA 절단 활성에 있어서의 PAM 서열의 영향
CRISPR-Cas3 시스템의 표적 특이성을 확인하기 위해서, DNA 절단 활성에 있어서의 여러 PAM 서열의 효과를 조사했다(도 12). SSA 검정에서는, 다른 PAM 서열에 의해 DNA 절단 활성은 다양한 결과가 되었다. 5'-AAG PAM이 가장 높은 활성을 나타내고, AGG, GAG, TAC, ATG, TAG도 주목해야 할 활성을 보였다.
〔실시예 B-3〕 DNA 절단 활성에 있어서의 crRNA와 스페이서 서열의 미스매치 영향
대장균의 캐스케이드의 결정 구조의 과거의 연구에서는, crRNA와 스페이서DNA 사이에서 5염기 구획의 헤테로 2중쇄를 형성하는 것이 나타나 있고, 이것은 Cas7 이펙터의 섬 엘리먼트에 의해, 6번째의 포지션마다 염기 접합이 파탄하는 것에 의한 것이다(도 13). DNA 절단 활성에서의 crRNA와 스페이서 서열의 미스매치의 영향을 평가했다(도 1g). 표적으로서 인식되지 않는 염기(포지션 6)를 제외하고, 시드(seed) 영역(포지션 1-8)에서의 어느 단일 미스매치에서도 절단 활성은 극적으로 떨어졌다.
〔실시예 B-4〕 DNA 절단 활성에 있어서의 Cas3의 각 도메인의 필요성의 검증
Cas3 단백의 촉매적 특징의 시험관 내에서의 성질 결정에서는, N 말단의 HD 뉴클레아제 도메인이 DNA 기질의 1중쇄 영역을 절단하고, 계속해서, C 말단의 SF2헬리카제 도메인이, ATP 의존적으로, 표적 DNA 상을 3'에서 5' 방향으로 진행해서 풀어 가는 것이 밝혀졌다. 3개의 Cas3의 변이체, 즉 HD 도메인 H74A의 변이체(dnCas3), SF2 도메인 모티프 1의 K320N의 변이체(dhCas3) 및 SF2 도메인 모티프3의 S483A/T485A의 더블의 변이체(dh2Cas3)를 제작하여, Cas3 도메인이 DNA 절단에 필요한지 여부를 검증했다(도 14). 그 결과, 3개 모든 Cas3 단백의 변이체에서 DNA 절단 활성이 완전히 소실되어 있어, Cas3은 HD 뉴클레아제 도메인과 SF2 헬리카제 도메인을 통해서 표적 DNA를 절단할 수 있는 것이 판명되었다.
〔실시예 B-5〕 여러 타입의 CRISPR-Cas3 시스템에 있어서의 DNA 절단 활성의 검증
타입 1의 CRISPR-Cas3 시스템은 고도로 다양화되어 있다(타입 1의 A 내지 G의 7종류). 상기 실시예에서는, 타입 I-E의 CRISPR-Cas3 시스템에 있어서의 진핵 세포에서의 DNA 절단 활성을 검증했지만, 본 실시예에서는, 그 이외의 타입 1의 CRISPR-Cas3 시스템(타입 I-F와 타입 I-G)에 있어서의 DNA 절단 활성의 검증을 행하였다. 구체적으로는, 타입 I-F의 쉬와넬라·푸트레파시엔스의 Cas3, Cas5-7 및 타입 I-G의 파이로코커스·퓨리어서스의 Cas5-8을 코돈 옵티마이즈하여 클로닝했다(도 15). 그 결과, DNA 절단 활성의 강도에 차이는 있기는 하지만, 293T 세포를 사용한 SSA 검정에 있어서, 이들 타입 1의 CRISPR-Cas3 시스템에도 DNA 절단 활성이 확인되었다.
〔실시예 B-6〕 CRISPR-Cas3 시스템에 의해 내인성 유전자에 도입된 변이의 검증
CRISPR-Cas3 시스템에 의해 내인성 유전자에 도입된 변이를, 타입 I-E 시스템을 이용해서 검증했다. EMX1 유전자와 CCR5 유전자를 표적 유전자로서 선택하고, 프리 crRNA(LRSR) 플라스미드를 제조했다. 293T 세포에 프리 crRNA와 6개의 Cas(3, 5-8, 11) 이펙터를 코딩하는 플라스미드를 리포펙션한 결과, CRISPR-Cas3에 의해 수백 내지 수천염기쌍의 결실이 주로 표적 영역의 스페이서 서열의 5'PAM의 상류 방향에서 일어난 것이 명백해졌다(도 16). 수복된 정션에서의 5-10염기쌍의 미세상동성을 확인할 수 있어, 어닐링 의존성의 수복 경로에 의한 상보쇄의 어닐링에 의해 일어난 것일지도 모른다. 또한, 성숙 crRNA 플라스미드에서는, EMX1과 CCR5 영역에서의 게놈 편집은 보이지 않았다.
PCR 산물의 TA 클로닝과 생어 시퀀싱에 의해, Cas3에 의한 게놈 편집을 특징짓기 위해서, 96개의 TA 클론을 픽업하고, 시퀀싱으로 야생형의 EMX1의 서열과 비교했다(도 17). 서열의 삽입을 확인할 수 있었던 49클론 중 24클론에서 최소 596염기쌍, 최대 1447염기쌍, 평균 985염기쌍의 결실을 확인했다(46.3%의 효율). 절반의 클론(n=12)에서 PAM과 스페이서의 서열을 포함해서 큰 결실을 만들고 있고, 나머지 절반에서는 PAM의 상류에서 결실하였다.
EMX1 유전자의 3.8kb, CCR5의 9.7kb라고 하는 보다 광역의 영역에 있어서의 프라이머 세트에서의 PCR 증폭 산물에서의 차세대 시퀀싱에 의해 가일층의 Cas3의 특징 지음을 행하였다. 또한, 타입 I-E CRISPR에서의 표적화를 위한 복수의 PAM 사이트(AAG, ATG, TTT)를 검증했다. 앰플리콘 시퀀싱에서는, AAG는 38.2%, ATG는 56.4%이고, TTT의 86.4%, EMX1을 표적으로 한 Cas9의 86.4%와 비교해서 PAM 사이트의 상류의 광범위한 게놈 영역에서의 커버리지율이 크게 감소하고 있었다. 커버리지의 감소는 CCR5 영역을 표적으로 한 경우도 마찬가지였다. 대조적으로, Cas9는 표적 부위에서의 작은 삽입, 작은 결실(인델)을 유발하고, 반면에 Cas3은 PAM이나 표적 부위에서의 작은 인델 변이는 전혀 없었다. 이들 결과는, CRISPR-Cas3 시스템이, 인간 세포에 있어서, 표적 부위의 상류의 폭넓은 영역에서 결실을 일으키는 것을 시사했다.
10kb 미만의 증폭이나 보다 짧은 PCR 단편에 유리한 강한 바이어스와 같은 PCR 해석의 한계를 고려하여, 표적으로 한 EMX1과 CCR5 유전자좌의 주위 1000kb 이상의 마이크로어레이-기반의 캡처 시퀀싱을 이용했다(도 18a, b). EMX1 유전자좌에서는 최대로 24kb, CCR5 유전자좌에서는 최대 43kb의 결실을 확인했지만, EMX1에서의 90%, CCR5에서의 95%의 변이는 10kb 미만이었다. 이들 결과는, CRISPR-Cas3 시스템이, 진핵 세포 게놈에서도 강력한 뉴클레아제와 헬리카제의 활성을 가질 수 있는 것을 시사했다.
또한, CRISPR-Cas9 시스템에서 나타낸 바와 같이, 비표적 게놈 영역에서 바람직하지 않은 오프 타깃 변이를 유발할 수 있는지 여부는, 특히 임상 적용에 관해서 큰 우려 사항이지만, CRISPR-Cas3 시스템에서는, 현저한 오프 타깃 효과는 보이지 않았다.
본 발명의 CRISPR-Cas3 시스템은, 진핵 세포의 DNA를 편집할 수 있기 때문에, 게놈 편집이 요구되고 있는 분야, 예를 들어 의약, 농림수산, 공업, 생명과학, 생명공학, 유전자 치료 등의 분야에 널리 이용할 수 있다.
SEQUENCE LISTING
<110> Osaka University
<120> DNAが編集された眞核細胞を製造する方法、および當該方法に用いられるキット
<130> G2018005(PCT)
<150> JP2017-113747
<151> 2017-06-08
<160> 65
<170> PatentIn version 3.5
<210> 1
<211> 2685
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cas3 with NLS
<400> 1
atgcccaaga agaagcggaa ggtggaacct tttaaatata tatgccatta ctggggaaaa 60
tcctcaaaaa gcttgacgaa aggaaatgat attcatctgt taatttatca ttgccttgat 120
gttgctgctg ttgcagattg ctggtgggat caatcagtcg tactgcaaaa tactttttgc 180
cgaaatgaaa tgctatcaaa acagagggtg aaggcctggc tgttattttt cattgctctt 240
catgatattg gaaagtttga tatacgattc caatataaat cagcagaaag ttggctgaaa 300
ttaaatcctg caacgccatc acttaatggt ccatcaacac aaatgtgccg taaatttaat 360
catggtgcag ccggtctgta ttggtttaac caggattcac tttcagagca atctctcggg 420
gattttttca gtttttttga tgccgctcct catccttatg agtcctggtt tccatgggta 480
gaggccgtta caggacatca tggttttata ttacattccc aggatcaaga taagtcgcgt 540
tgggaaatgc cagcttctct ggcatcttat gctgcgcaag ataaacaggc tcgtgaggag 600
tggatatctg tactggaagc attattttta acgccagcgg ggttatctat aaacgatata 660
ccacctgatt gttcatcact gttagcaggt ttttgctcgc ttgctgactg gttaggctcc 720
tggactacaa cgaatacctt tctgtttaat gaggatgcgc cttccgacat aaatgctctg 780
agaacgtatt tccaggaccg acagcaggat gcgagccggg tattggagtt gagtggactt 840
gtatcaaata agcgatgtta tgaaggtgtt catgcactac tggacaatgg ctatcaaccc 900
agacaattac aggtgttagt tgatgctctt ccagtagctc ccgggctgac ggtaatagag 960
gcacctacag gctccggtaa aacggaaaca gcgctggcct atgcttggaa acttattgat 1020
caacaaattg cggatagtgt tatttttgcc ctcccaacac aagctaccgc gaatgctatg 1080
cttacgagaa tggaagcgag cgcgagccac ttattttcat ccccaaatct tattcttgct 1140
catggcaatt cacggtttaa ccacctcttt caatcaataa aatcacgcgc gattactgaa 1200
caggggcaag aagaagcgtg ggttcagtgt tgtcagtggt tgtcacaaag caataagaaa 1260
gtgtttcttg ggcaaatcgg cgtttgcacg attgatcagg tgttgatatc ggtattgcca 1320
gttaaacacc gctttatccg tggtttggga attggtcgaa gtgttttaat tgttgatgaa 1380
gttcatgctt acgacaccta tatgaacggc ttgctggagg cagtgctcaa ggctcaggct 1440
gatgtgggag ggagtgttat tcttctttcc gcaaccctac caatgaaaca aaaacagaaa 1500
cttctggata cttatggtct gcatacagat ccagtggaaa ataactccgc atatccactc 1560
attaactggc gaggtgtgaa tggtgcgcaa cgttttgatc tgctagctca tccagaacaa 1620
ctcccgcccc gcttttcgat tcagccagaa cctatttgtt tagctgacat gttacctgac 1680
cttacgatgt tagagcgaat gatcgcagcg gcaaacgcgg gtgcacaggt ctgtcttatt 1740
tgcaatttgg ttgacgttgc acaagtatgc taccaacggc taaaggagct aaataacacg 1800
caagtagata tagatttgtt tcatgcgcgc tttacgctga acgatcgtcg tgaaaaagag 1860
aatcgagtta ttagcaattt cggcaaaaat gggaagcgaa atgttggacg gatacttgtc 1920
gcaacccagg tcgtggaaca atcactcgac gttgattttg attggttaat tactcagcat 1980
tgtcctgcag atttgctttt ccaacgattg ggccgtttac atcgccatca tcgcaaatat 2040
cgtcccgctg gttttgagat tcctgttgcc accattttgc tgcctgatgg cgagggttac 2100
ggacgacatg agcatattta tagcaacgtt agagtcatgt ggcggacgca gcaacatatt 2160
gaggagctta atggagcatc cttatttttc cctgatgctt accggcaatg gctggatagc 2220
atttacgatg atgcggaaat ggatgagcca gaatgggtcg gcaatggcat ggataaattt 2280
gaaagcgccg agtgtgaaaa aaggttcaag gctcgcaagg tcctgcagtg ggctgaagaa 2340
tatagcttgc aggataacga tgaaaccatt cttgcggtaa cgagggatgg ggaaatgagc 2400
ctgccattat tgccttatgt acaaacgtct tcaggtaaac aactgctcga tggccaggtc 2460
tacgaggacc taagtcatga acagcagtat gaggcgcttg cacttaatcg cgtcaatgta 2520
cccttcacct ggaaacgtag tttttctgaa gtagtagatg aagatgggtt actttggctg 2580
gaagggaaac agaatctgga tggatgggtc tggcagggta acagtattgt tattacctat 2640
acaggggatg aagggatgac cagagtcatc cctgcaaatc ccaaa 2685
<210> 2
<211> 1527
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cse1 with NLS
<400> 2
atgcccaaga agaagcggaa ggtgaacctg ctgattgaca actggatccc tgtgcgccca 60
cggaacggag gaaaagtcca gattattaat ctgcagagcc tgtactgctc ccgggatcag 120
tggagactga gcctgcccag agacgatatg gagctggccg ccctggccct gctggtgtgc 180
atcggccaga tcatcgcccc tgccaaggac gatgtggagt tcaggcaccg catcatgaac 240
cctctgaccg aggatgagtt tcagcagctg atcgccccat ggatcgacat gttctatctg 300
aatcacgccg agcacccctt catgcagaca aagggcgtga aggccaacga cgtgaccccc 360
atggagaagc tgctggcagg cgtgtccgga gcaacaaatt gcgccttcgt gaaccagcca 420
ggacagggag aggccctgtg cggaggctgt accgccatcg ccctgtttaa tcaggcaaac 480
caggcacctg gattcggagg aggctttaag tctggactga ggggaggaac cccagtgacc 540
acattcgtga gaggcatcga tctgaggagc acagtgctgc tgaatgtgct gaccctgcca 600
cggctgcaga agcagtttcc caatgagagc cacacagaga accagcccac ctggatcaag 660
cctatcaagt ctaacgagag catccctgcc agctccatcg gcttcgtgag aggcctgttt 720
tggcagccag cccacatcga gctgtgcgac cccatcggca tcggcaagtg ttcttgctgt 780
ggccaggaaa gcaatctgag gtacaccggc ttcctgaagg agaagttcac ctttacagtg 840
aacggcctgt ggccccaccc tcactctcca tgtctggtga cagtgaagaa gggcgaggtg 900
gaggagaagt tcctggcctt taccacatcc gccccctctt ggacccagat cagcagagtg 960
gtggtggaca agatcatcca gaacgagaat ggcaacagag tggccgccgt ggtgaatcag 1020
ttcaggaaca tcgccccaca gtctcccctg gagctgatca tgggcggcta caggaacaat 1080
caggccagca tcctggagcg gagacacgat gtgctgatgt ttaatcaggg ctggcagcag 1140
tatggcaatg tgatcaacga gatcgtgaca gtgggcctgg gctacaagac cgccctgaga 1200
aaggccctgt atacattcgc cgagggcttt aagaacaagg acttcaaggg agcaggcgtg 1260
agcgtgcacg agaccgccga gaggcacttt taccgccagt ccgagctgct gatccccgat 1320
gtgctggcca atgtgaactt ctcccaggcc gacgaagtga tcgccgatct gagggacaag 1380
ctgcaccagc tgtgcgagat gctgtttaac cagtctgtgg ccccatacgc ccaccacccc 1440
aagctgatca gcacactggc cctggcaagg gccaccctgt ataagcacct gagggagctg 1500
aagccacagg gaggaccttc taatgga 1527
<210> 3
<211> 501
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cse2 with NLS
<400> 3
atgcccaaga agaagcggaa ggtggccgat gagatcgacg caatggcact gtacagggca 60
tggcagcagc tggacaacgg atcttgcgca cagatcaggc gcgtgagcga gcctgatgag 120
ctgagggaca tcccagcctt ctatcggctg gtgcagccct ttggctggga gaatcctaga 180
caccagcagg ccctgctgag gatggtgttt tgtctgagcg ccggcaagaa cgtgatccgg 240
caccaggaca agaagagcga gcagaccaca ggaatctccc tgggacgcgc cctggccaat 300
tccggccgga tcaacgagcg gagaatcttc cagctgatca gggccgatcg cacagccgac 360
atggtgcagc tgaggcgcct gctgacccac gcagagcctg tgctggattg gccactgatg 420
gcccgcatgc tgacatggtg gggcaagcgg gagagacagc agctgctgga ggacttcgtg 480
ctgaccacaa ataagaacgc c 501
<210> 4
<211> 693
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cas5 with NLS
<400> 4
atgcccaaga agaagcggaa ggtgcgctcc tacctgatcc tgagactggc aggaccaatg 60
caggcatggg gacagcctac attcgaggga accaggccaa caggccgctt tcctacccgg 120
tctggactgc tgggactgct gggagcctgc ctgggcatcc agagggacga tacctctagc 180
ctgcaggccc tgagcgagtc cgtgcagttc gccgtgcgct gtgatgagct gatcctggac 240
gataggcgcg tgtccgtgac aggcctgcgg gattaccaca ccgtgctggg cgccagagag 300
gactataggg gcctgaagtc ccacgagacc atccagacat ggcgcgagta cctgtgcgac 360
gcctctttta cagtggccct gtggctgacc ccacacgcaa caatggtcat cagcgagctg 420
gagaaggccg tgctgaagcc acggtacacc ccctatctgg gccggagaag ctgccctctg 480
acacacccac tgttcctggg cacctgtcag gcctccgatc cccagaaggc cctgctgaac 540
tacgagcctg tgggcggcga catctattct gaggagagcg tgacaggcca ccacctgaag 600
ttcaccgcca gggatgagcc aatgatcaca ctgccaaggc agtttgcatc cagggagtgg 660
tatgtgatca agggaggaat ggacgtgagc cag 693
<210> 5
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cas6 with NLS
<400> 5
atgcccaaga agaagcggaa ggtgtacctg agcaaagtga tcatcgcaag ggcatggtcc 60
agggacctgt atcagctgca ccagggcctg tggcacctgt tccctaatag accagatgcc 120
gccagggact tcctgtttca cgtggagaag aggaacacac ccgagggctg tcacgtgctg 180
ctgcagtccg cccagatgcc cgtgagcacc gcagtggcca cagtgatcaa gaccaagcag 240
gtggagttcc agctgcaagt gggcgtgcca ctgtacttta ggctgcgcgc caatcccatc 300
aagaccatcc tggataacca gaagcgcctg gactctaagg gcaatatcaa gcggtgcaga 360
gtgcctctga tcaaggaggc cgagcagatc gcctggctgc agagaaagct gggcaacgcc 420
gccagggtgg aggatgtgca ccctatcagc gagcggccac agtatttcag cggcgacggc 480
aagtccggca agatccagac cgtgtgcttt gagggcgtgc tgaccatcaa cgatgcccca 540
gccctgatcg acctggtgca gcagggaatc ggacctgcta agtcaatggg atgtgggctg 600
ctgtcactgg cacctctg 618
<210> 6
<211> 1110
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cas7 with NLS
<400> 6
atgcccaaga agaagcggaa ggtgtccaat ttcatcaaca tccacgtgct gatctcccac 60
tctccaagct gcctgaatag agacgatatg aacatgcaga aggacgccat ctttggcggc 120
aagcggagag tgaggatctc tagccagtcc ctgaagcggg ccatgagaaa gtctggctac 180
tatgcccaga atatcggcga gtcctctctg aggaccatcc acctggcaca gctgagggac 240
gtgctgagac agaagctggg cgagcggttt gatcagaaga tcatcgacaa gacactggcc 300
ctgctgagcg gcaagtccgt ggatgaggcc gagaagatca gcgccgacgc agtgacccca 360
tgggtggtgg gagagatcgc atggttctgt gagcaggtgg ccaaggccga ggccgataat 420
ctggacgata agaagctgct gaaggtgctg aaggaggata tcgccgccat cagagtgaac 480
ctgcagcagg gagtggacat cgccctgagc ggcaggatgg ccacatccgg catgatgacc 540
gagctgggca aggtggacgg agcaatgtcc atcgcacacg ccatcaccac acaccaggtg 600
gactctgata tcgactggtt cacagccgtg gacgatctgc aggagcaggg aagcgcccac 660
ctgggaaccc aggagttcag ctccggcgtg ttttacagat atgccaatat caacctggca 720
cagctgcagg agaacctggg aggagcatcc agggagcagg ccctggagat cgccacacac 780
gtggtgcaca tgctggcaac cgaggtgcca ggagcaaagc agcgcaccta cgccgccttc 840
aatcctgccg atatggtcat ggtgaacttt tccgacatgc cactgtctat ggccaatgcc 900
ttcgagaagg ccgtgaaggc caaggatggc ttcctgcagc cttccatcca ggcctttaac 960
cagtactggg accgcgtggc caatggatat ggcctgaacg gagctgccgc ccagttttcc 1020
ctgtctgatg tggaccctat cacagcccag gtgaagcaga tgccaaccct ggagcagctg 1080
aagagctggg tgcggaacaa tggagaggca 1110
<210> 7
<211> 2775
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cas3 with BPNLS
<400> 7
aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaagaa 60
ccttttaaat atatatgcca ttactgggga aaatcctcaa aaagcttgac gaaaggaaat 120
gatattcatc tgttaattta tcattgcctt gatgttgctg ctgttgcaga ttgctggtgg 180
gatcaatcag tcgtactgca aaatactttt tgccgaaatg aaatgctatc aaaacagagg 240
gtgaaggcct ggctgttatt tttcattgct cttcatgata ttggaaagtt tgatatacga 300
ttccaatata aatcagcaga aagttggctg aaattaaatc ctgcaacgcc atcacttaat 360
ggtccatcaa cacaaatgtg ccgtaaattt aatcatggtg cagccggtct gtattggttt 420
aaccaggatt cactttcaga gcaatctctc ggggattttt tcagtttttt tgatgccgct 480
cctcatcctt atgagtcctg gtttccatgg gtagaggccg ttacaggaca tcatggtttt 540
atattacatt cccaggatca agataagtcg cgttgggaaa tgccagcttc tctggcatct 600
tatgctgcgc aagataaaca ggctcgtgag gagtggatat ctgtactgga agcattattt 660
ttaacgccag cggggttatc tataaacgat ataccacctg attgttcatc actgttagca 720
ggtttttgct cgcttgctga ctggttaggc tcctggacta caacgaatac ctttctgttt 780
aatgaggatg cgccttccga cataaatgct ctgagaacgt atttccagga ccgacagcag 840
gatgcgagcc gggtattgga gttgagtgga cttgtatcaa ataagcgatg ttatgaaggt 900
gttcatgcac tactggacaa tggctatcaa cccagacaat tacaggtgtt agttgatgct 960
cttccagtag ctcccgggct gacggtaata gaggcaccta caggctccgg taaaacggaa 1020
acagcgctgg cctatgcttg gaaacttatt gatcaacaaa ttgcggatag tgttattttt 1080
gccctcccaa cacaagctac cgcgaatgct atgcttacga gaatggaagc gagcgcgagc 1140
cacttatttt catccccaaa tcttattctt gctcatggca attcacggtt taaccacctc 1200
tttcaatcaa taaaatcacg cgcgattact gaacaggggc aagaagaagc gtgggttcag 1260
tgttgtcagt ggttgtcaca aagcaataag aaagtgtttc ttgggcaaat cggcgtttgc 1320
acgattgatc aggtgttgat atcggtattg ccagttaaac accgctttat ccgtggtttg 1380
ggaattggtc gaagtgtttt aattgttgat gaagttcatg cttacgacac ctatatgaac 1440
ggcttgctgg aggcagtgct caaggctcag gctgatgtgg gagggagtgt tattcttctt 1500
tccgcaaccc taccaatgaa acaaaaacag aaacttctgg atacttatgg tctgcataca 1560
gatccagtgg aaaataactc cgcatatcca ctcattaact ggcgaggtgt gaatggtgcg 1620
caacgttttg atctgctagc tcatccagaa caactcccgc cccgcttttc gattcagcca 1680
gaacctattt gtttagctga catgttacct gaccttacga tgttagagcg aatgatcgca 1740
gcggcaaacg cgggtgcaca ggtctgtctt atttgcaatt tggttgacgt tgcacaagta 1800
tgctaccaac ggctaaagga gctaaataac acgcaagtag atatagattt gtttcatgcg 1860
cgctttacgc tgaacgatcg tcgtgaaaaa gagaatcgag ttattagcaa tttcggcaaa 1920
aatgggaagc gaaatgttgg acggatactt gtcgcaaccc aggtcgtgga acaatcactc 1980
gacgttgatt ttgattggtt aattactcag cattgtcctg cagatttgct tttccaacga 2040
ttgggccgtt tacatcgcca tcatcgcaaa tatcgtcccg ctggttttga gattcctgtt 2100
gccaccattt tgctgcctga tggcgagggt tacggacgac atgagcatat ttatagcaac 2160
gttagagtca tgtggcggac gcagcaacat attgaggagc ttaatggagc atccttattt 2220
ttccctgatg cttaccggca atggctggat agcatttacg atgatgcgga aatggatgag 2280
ccagaatggg tcggcaatgg catggataaa tttgaaagcg ccgagtgtga aaaaaggttc 2340
aaggctcgca aggtcctgca gtgggctgaa gaatatagct tgcaggataa cgatgaaacc 2400
attcttgcgg taacgaggga tggggaaatg agcctgccat tattgcctta tgtacaaacg 2460
tcttcaggta aacaactgct cgatggccag gtctacgagg acctaagtca tgaacagcag 2520
tatgaggcgc ttgcacttaa tcgcgtcaat gtacccttca cctggaaacg tagtttttct 2580
gaagtagtag atgaagatgg gttactttgg ctggaaggga aacagaatct ggatggatgg 2640
gtctggcagg gtaacagtat tgttattacc tatacagggg atgaagggat gaccagagtc 2700
atccctgcaa atcccaaaaa gcggactgct gatggcagtg aatttgagtc cccaaagaag 2760
aagagaaagg tggaa 2775
<210> 8
<211> 1617
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cse1 with BPNLS
<400> 8
aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaaaac 60
ctgctgattg acaactggat ccctgtgcgc ccacggaacg gaggaaaagt ccagattatt 120
aatctgcaga gcctgtactg ctcccgggat cagtggagac tgagcctgcc cagagacgat 180
atggagctgg ccgccctggc cctgctggtg tgcatcggcc agatcatcgc ccctgccaag 240
gacgatgtgg agttcaggca ccgcatcatg aaccctctga ccgaggatga gtttcagcag 300
ctgatcgccc catggatcga catgttctat ctgaatcacg ccgagcaccc cttcatgcag 360
acaaagggcg tgaaggccaa cgacgtgacc cccatggaga agctgctggc aggcgtgtcc 420
ggagcaacaa attgcgcctt cgtgaaccag ccaggacagg gagaggccct gtgcggaggc 480
tgtaccgcca tcgccctgtt taatcaggca aaccaggcac ctggattcgg aggaggcttt 540
aagtctggac tgaggggagg aaccccagtg accacattcg tgagaggcat cgatctgagg 600
agcacagtgc tgctgaatgt gctgaccctg ccacggctgc agaagcagtt tcccaatgag 660
agccacacag agaaccagcc cacctggatc aagcctatca agtctaacga gagcatccct 720
gccagctcca tcggcttcgt gagaggcctg ttttggcagc cagcccacat cgagctgtgc 780
gaccccatcg gcatcggcaa gtgttcttgc tgtggccagg aaagcaatct gaggtacacc 840
ggcttcctga aggagaagtt cacctttaca gtgaacggcc tgtggcccca ccctcactct 900
ccatgtctgg tgacagtgaa gaagggcgag gtggaggaga agttcctggc ctttaccaca 960
tccgccccct cttggaccca gatcagcaga gtggtggtgg acaagatcat ccagaacgag 1020
aatggcaaca gagtggccgc cgtggtgaat cagttcagga acatcgcccc acagtctccc 1080
ctggagctga tcatgggcgg ctacaggaac aatcaggcca gcatcctgga gcggagacac 1140
gatgtgctga tgtttaatca gggctggcag cagtatggca atgtgatcaa cgagatcgtg 1200
acagtgggcc tgggctacaa gaccgccctg agaaaggccc tgtatacatt cgccgagggc 1260
tttaagaaca aggacttcaa gggagcaggc gtgagcgtgc acgagaccgc cgagaggcac 1320
ttttaccgcc agtccgagct gctgatcccc gatgtgctgg ccaatgtgaa cttctcccag 1380
gccgacgaag tgatcgccga tctgagggac aagctgcacc agctgtgcga gatgctgttt 1440
aaccagtctg tggccccata cgcccaccac cccaagctga tcagcacact ggccctggca 1500
agggccaccc tgtataagca cctgagggag ctgaagccac agggaggacc ttctaatgga 1560
aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaa 1617
<210> 9
<211> 591
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cse2 with BPNLS
<400> 9
aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaagcc 60
gatgagatcg acgcaatggc actgtacagg gcatggcagc agctggacaa cggatcttgc 120
gcacagatca ggcgcgtgag cgagcctgat gagctgaggg acatcccagc cttctatcgg 180
ctggtgcagc cctttggctg ggagaatcct agacaccagc aggccctgct gaggatggtg 240
ttttgtctga gcgccggcaa gaacgtgatc cggcaccagg acaagaagag cgagcagacc 300
acaggaatct ccctgggacg cgccctggcc aattccggcc ggatcaacga gcggagaatc 360
ttccagctga tcagggccga tcgcacagcc gacatggtgc agctgaggcg cctgctgacc 420
cacgcagagc ctgtgctgga ttggccactg atggcccgca tgctgacatg gtggggcaag 480
cgggagagac agcagctgct ggaggacttc gtgctgacca caaataagaa cgccaagcgg 540
actgctgatg gcagtgaatt tgagtcccca aagaagaaga gaaaggtgga a 591
<210> 10
<211> 783
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cas5 with BPNLS
<400> 10
aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaacgc 60
tcctacctga tcctgagact ggcaggacca atgcaggcat ggggacagcc tacattcgag 120
ggaaccaggc caacaggccg ctttcctacc cggtctggac tgctgggact gctgggagcc 180
tgcctgggca tccagaggga cgatacctct agcctgcagg ccctgagcga gtccgtgcag 240
ttcgccgtgc gctgtgatga gctgatcctg gacgataggc gcgtgtccgt gacaggcctg 300
cgggattacc acaccgtgct gggcgccaga gaggactata ggggcctgaa gtcccacgag 360
accatccaga catggcgcga gtacctgtgc gacgcctctt ttacagtggc cctgtggctg 420
accccacacg caacaatggt catcagcgag ctggagaagg ccgtgctgaa gccacggtac 480
accccctatc tgggccggag aagctgccct ctgacacacc cactgttcct gggcacctgt 540
caggcctccg atccccagaa ggccctgctg aactacgagc ctgtgggcgg cgacatctat 600
tctgaggaga gcgtgacagg ccaccacctg aagttcaccg ccagggatga gccaatgatc 660
acactgccaa ggcagtttgc atccagggag tggtatgtga tcaagggagg aatggacgtg 720
agccagaagc ggactgctga tggcagtgaa tttgagtccc caaagaagaa gagaaaggtg 780
gaa 783
<210> 11
<211> 708
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cas6 with BPNLS
<400> 11
aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaatac 60
ctgagcaaag tgatcatcgc aagggcatgg tccagggacc tgtatcagct gcaccagggc 120
ctgtggcacc tgttccctaa tagaccagat gccgccaggg acttcctgtt tcacgtggag 180
aagaggaaca cacccgaggg ctgtcacgtg ctgctgcagt ccgcccagat gcccgtgagc 240
accgcagtgg ccacagtgat caagaccaag caggtggagt tccagctgca agtgggcgtg 300
ccactgtact ttaggctgcg cgccaatccc atcaagacca tcctggataa ccagaagcgc 360
ctggactcta agggcaatat caagcggtgc agagtgcctc tgatcaagga ggccgagcag 420
atcgcctggc tgcagagaaa gctgggcaac gccgccaggg tggaggatgt gcaccctatc 480
agcgagcggc cacagtattt cagcggcgac ggcaagtccg gcaagatcca gaccgtgtgc 540
tttgagggcg tgctgaccat caacgatgcc ccagccctga tcgacctggt gcagcaggga 600
atcggacctg ctaagtcaat gggatgtggg ctgctgtcac tggcacctct gaagcggact 660
gctgatggca gtgaatttga gtccccaaag aagaagagaa aggtggaa 708
<210> 12
<211> 1200
<212> DNA
<213> Artificial Sequence
<220>
<223> modified Cas7 with BPNLS
<400> 12
aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaatcc 60
aatttcatca acatccacgt gctgatctcc cactctccaa gctgcctgaa tagagacgat 120
atgaacatgc agaaggacgc catctttggc ggcaagcgga gagtgaggat ctctagccag 180
tccctgaagc gggccatgag aaagtctggc tactatgccc agaatatcgg cgagtcctct 240
ctgaggacca tccacctggc acagctgagg gacgtgctga gacagaagct gggcgagcgg 300
tttgatcaga agatcatcga caagacactg gccctgctga gcggcaagtc cgtggatgag 360
gccgagaaga tcagcgccga cgcagtgacc ccatgggtgg tgggagagat cgcatggttc 420
tgtgagcagg tggccaaggc cgaggccgat aatctggacg ataagaagct gctgaaggtg 480
ctgaaggagg atatcgccgc catcagagtg aacctgcagc agggagtgga catcgccctg 540
agcggcagga tggccacatc cggcatgatg accgagctgg gcaaggtgga cggagcaatg 600
tccatcgcac acgccatcac cacacaccag gtggactctg atatcgactg gttcacagcc 660
gtggacgatc tgcaggagca gggaagcgcc cacctgggaa cccaggagtt cagctccggc 720
gtgttttaca gatatgccaa tatcaacctg gcacagctgc aggagaacct gggaggagca 780
tccagggagc aggccctgga gatcgccaca cacgtggtgc acatgctggc aaccgaggtg 840
ccaggagcaa agcagcgcac ctacgccgcc ttcaatcctg ccgatatggt catggtgaac 900
ttttccgaca tgccactgtc tatggccaat gccttcgaga aggccgtgaa ggccaaggat 960
ggcttcctgc agccttccat ccaggccttt aaccagtact gggaccgcgt ggccaatgga 1020
tatggcctga acggagctgc cgcccagttt tccctgtctg atgtggaccc tatcacagcc 1080
caggtgaagc agatgccaac cctggagcag ctgaagagct gggtgcggaa caatggagag 1140
gcaaagcgga ctgctgatgg cagtgaattt gagtccccaa agaagaagag aaaggtggaa 1200
<210> 13
<211> 2664
<212> DNA
<213> Escherichia coli
<400> 13
atggagccat tcaaatacat ctgccactac tgggggaaat catctaaaag cctgacaaag 60
gggaacgata tccacctgct gatctaccac tgcctggacg tggcagcagt ggcagattgt 120
tggtgggacc agagcgtggt gctgcagaat accttctgcc ggaacgagat gctgtccaag 180
cagagagtga aggcctggct gctgttcttt atcgccctgc acgatatcgg caagttcgac 240
atcaggtttc agtataagtc tgccgagagc tggctgaagc tgaatccagc cacaccctcc 300
ctgaacggcc cttctaccca gatgtgcagg aagttcaatc acggagcagc aggactgtac 360
tggtttaacc aggacagcct gtccgagcag tctctgggcg atttctttag cttctttgac 420
gccgcccctc acccatatga gagctggttc ccatgggtgg aggcagtgac aggacaccac 480
ggctttatcc tgcactccca ggaccaggat aagtctagat gggagatgcc agcatccctg 540
gcatcttacg cagcacagga taagcaggca agggaggagt ggatctctgt gctggaggcc 600
ctgttcctga ccccagcagg cctgagcatc aatgatatcc cacctgactg cagctccctg 660
ctggcaggct tttgtagcct ggcagactgg ctgggatcct ggaccacaac caatacattc 720
ctgtttaacg aggatgcccc ttctgacatc aacgccctgc gcacctactt ccaggatcgg 780
cagcaggacg ccagcagagt gctggagctg tctggcctgg tgagcaataa gcggtgctac 840
gagggagtgc acgcactgct ggataacggc tatcagccta gacagctgca ggtgctggtg 900
gacgcactgc ctgtggcacc aggactgaca gtgatcgagg caccaaccgg ctctggcaag 960
acagagaccg ccctggccta tgcctggaag ctgatcgatc agcagatcgc cgacagcgtg 1020
atcttcgcac tgccaacaca ggcaaccgca aatgccatgc tgaccaggat ggaggcctct 1080
gccagccacc tgttttctag ccctaacctg atcctggccc acggcaacag ccggttcaat 1140
cacctgtttc agagcatcaa gtccagagcc atcacagagc agggacagga ggaggcatgg 1200
gtgcagtgct gtcagtggct gtcccagtct aacaagaagg tgttcctggg ccagatcggc 1260
gtgtgcacca tcgatcaggt gctgatctcc gtgctgccag tgaagcacag gtttatcagg 1320
ggactgggaa tcggccgctc tgtgctgatc gtggatgagg tgcacgccta cgacacatat 1380
atgaacggcc tgctggaggc cgtgctgaag gcacaggcag acgtgggagg aagcgtgatc 1440
ctgctgtccg ccaccctgcc catgaagcag aagcagaagc tgctggatac atacggcctg 1500
cacaccgacc ctgtggagaa caatagcgcc tatccactga tcaattggag gggagtgaac 1560
ggagcacagc ggttcgacct gctggcacac ccagagcagc tgccaccacg gttttccatc 1620
cagcccgagc ctatctgcct ggccgatatg ctgcccgacc tgaccatgct ggagagaatg 1680
atcgctgccg ccaatgcagg agcacaggtg tgcctgatct gtaacctggt ggatgtggcc 1740
caggtgtgct accagcggct gaaggagctg aacaatacac aggtggacat cgatctgttc 1800
cacgccaggt ttaccctgaa tgaccggaga gagaaggaga accgcgtgat ctccaacttc 1860
ggcaagaatg gcaagagaaa cgtgggcagg atcctggtgg ccacacaggt ggtggagcag 1920
tctctggacg tggatttcga ctggctgatc acccagcact gccctgccga tctgctgttt 1980
cagcggctgg gcagactgca cagacaccac aggaagtaca ggccagcagg atttgagatc 2040
ccagtggcca caatcctgct gccagacgga gagggatacg gccggcacga gcacatctat 2100
agcaatgtgc gcgtgatgtg gcggacccag cagcacatcg aggagctgaa cggcgcctcc 2160
ctgttctttc ccgatgccta cagacagtgg ctggactcta tctatgacga tgccgagatg 2220
gatgagcctg agtgggtggg caatggcatg gacaagttcg agtccgccga gtgtgagaag 2280
cggttcaagg ccaggaaggt gctgcagtgg gccgaggagt acagcctgca ggataacgac 2340
gagacaatcc tggccgtgac cagggatggc gagatgtccc tgcccctgct gccttatgtg 2400
cagacatcct ctggcaagca gctgctggat ggccaggtgt acgaggacct gagccacgag 2460
cagcagtatg aggccctggc cctgaacagg gtgaatgtgc ccttcacctg gaagcgcagc 2520
ttttccgaag tggtggatga ggacggcctg ctgtggctgg agggcaagca gaatctggac 2580
ggctgggtgt ggcagggcaa ctccatcgtg attacctaca ccggagacga agggatgaca 2640
agagtgattc ctgctaaccc aaag 2664
<210> 14
<211> 1506
<212> DNA
<213> Escherichia coli
<400> 14
atgaatttgc ttattgataa ctggatccct gtacgcccgc gaaacggggg gaaagtccaa 60
atcataaatc tgcaatcgct atactgcagt agagatcagt ggcgattaag tttgccccgt 120
gacgatatgg aactggccgc tttagcactg ctggtttgca ttgggcaaat tatcgccccg 180
gcaaaagatg acgttgaatt tcgacatcgc ataatgaatc cgctcactga agatgagttt 240
caacaactca tcgcgccgtg gatagatatg ttctacctta atcacgcaga acatcccttt 300
atgcagacca aaggtgtcaa agcaaatgat gtgactccaa tggaaaaact gttggctggg 360
gtaagcggcg cgacgaattg tgcatttgtc aatcaaccgg ggcagggtga agcattatgt 420
ggtggatgca ctgcgattgc gttattcaac caggcgaatc aggcaccagg ttttggtggt 480
ggttttaaaa gcggtttacg tggaggaaca cctgtaacaa cgttcgtacg tgggatcgat 540
cttcgttcaa cggtgttact caatgtcctc acattacctc gtcttcaaaa acaatttcct 600
aatgaatcac atacggaaaa ccaacctacc tggattaaac ctatcaagtc caatgagtct 660
atacctgctt cgtcaattgg gtttgtccgt ggtctattct ggcaaccagc gcatattgaa 720
ttatgcgatc ccattgggat tggtaaatgt tcttgctgtg gacaggaaag caatttgcgt 780
tataccggtt ttcttaagga aaaatttacc tttacagtta atgggctatg gccccatccg 840
cattcccctt gtctggtaac agtcaagaaa ggggaggttg aggaaaaatt tcttgctttc 900
accacctccg caccatcatg gacacaaatc agccgagttg tggtagataa gattattcaa 960
aatgaaaatg gaaatcgcgt ggcggcggtt gtgaatcaat tcagaaatat tgcgccgcaa 1020
agtcctcttg aattgattat ggggggatat cgtaataatc aagcatctat tcttgaacgg 1080
cgtcatgatg tgttgatgtt taatcagggg tggcaacaat acggcaatgt gataaacgaa 1140
atagtgactg ttggtttggg atataaaaca gccttacgca aggcgttata tacctttgca 1200
gaagggttta aaaataaaga cttcaaaggg gccggagtct ctgttcatga gactgcagaa 1260
aggcatttct atcgacagag tgaattatta attcccgatg tactggcgaa tgttaatttt 1320
tcccaggctg atgaggtaat agctgattta cgagacaaac ttcatcaatt gtgtgaaatg 1380
ctatttaatc aatctgtagc tccctatgca catcatccta aattaataag cacattagcg 1440
cttgcccgcg ccacgctata caaacattta cgggagttaa aaccgcaagg agggccatca 1500
aatggc 1506
<210> 15
<211> 480
<212> DNA
<213> Escherichia coli
<400> 15
atggctgatg aaattgatgc aatggcttta tatcgagcct ggcaacaact ggataatgga 60
tcatgtgcgc aaattagacg tgtttcagaa cctgatgaat tacgcgatat ccctgcgttt 120
tataggctgg tgcaaccttt tggttgggaa aacccacgtc accagcaggc tcttttgcgc 180
atggtgtttt gcctgagcgc aggaaagaat gtcatccgac atcaggacaa aaaatcggag 240
caaacaacag gtatctcgtt gggaagagct ttagccaata gtggaagaat taacgagcgc 300
cgtatctttc aattaattcg ggctgacaga acagccgata tggtccagtt acgtcgatta 360
cttactcacg ccgaacccgt acttgactgg ccattaatgg ccaggatgtt gacctggtgg 420
ggaaagcgcg aacgccagca acttctggaa gattttgtat tgaccacaaa caaaaatgcg 480
<210> 16
<211> 672
<212> DNA
<213> Escherichia coli
<400> 16
atgagatctt atttgatctt gcggcttgct gggccaatgc aagcctgggg gcagccgacc 60
tttgaaggaa cgcgacctac cggaagattt ccgacccgaa gcgggttatt agggctactc 120
ggggcttgtc ttgggatcca acgtgatgat acttcttcat tacaggcgtt atcagagagt 180
gtgcaatttg cagtgcgctg cgatgaactc attcttgacg atcgtcgtgt gtctgtaacg 240
gggttgcgtg attaccatac agtccttgga gcgcgagaag attaccgtgg tttgaaaagt 300
catgaaacga ttcaaacatg gcgcgaatat ttatgtgatg cctcctttac cgtcgctctc 360
tggttaacac cccatgcaac gatggttatc tcagaacttg aaaaagcagt attaaagcct 420
cggtatacac cttacctggg gcggagaagt tgcccactaa cacacccgct ttttttgggg 480
acatgtcagg catcggatcc tcagaaggcg ctattaaatt atgagcccgt tggcggcgat 540
atatatagtg aggaatcagt tacagggcat catttaaaat ttacggcgcg cgacgaaccg 600
atgatcacct tgcctcgaca atttgcttcc cgagaatggt atgtgattaa aggaggtatg 660
gatgtatctc ag 672
<210> 17
<211> 597
<212> DNA
<213> Escherichia coli
<400> 17
atgtatctca gtaaagtcat cattgccagg gcctggagca gggatcttta ccaacttcac 60
cagggattat ggcatttatt tccaaacaga ccggatgctg ctcgtgattt tctttttcat 120
gttgagaagc gaaacacacc agaaggctgt catgttttat tgcagtcagc gcaaatgcct 180
gtttcaactg ccgttgcgac agtcattaaa actaaacagg ttgaatttca acttcaggtt 240
ggtgttccac tctattttcg gcttcgggca aatccgatca aaactattct cgacaatcaa 300
aagcgcctgg acagtaaagg gaatattaaa cgctgtcggg ttccgttaat aaaagaagca 360
gaacaaatcg cgtggttgca acgtaaattg ggcaatgcgg cgcgcgttga agatgtgcat 420
cccatatcgg aacggccaca gtatttttct ggtgatggta aaagtggaaa gatccaaacg 480
gtttgctttg aaggtgtgct caccatcaac gacgcgccag cgttaataga tcttgtacag 540
caaggtattg ggccagctaa atcgatggga tgtggcttgc tatctttggc tccactg 597
<210> 18
<211> 1086
<212> DNA
<213> Escherichia coli
<400> 18
tctaacttta tcaatattca tgttctgatc tctcacagcc cttcatgtct gaaccgcgac 60
gatatgaaca tgcagaaaga cgctattttc ggcggcaaaa gacgagtaag aatttcaagt 120
caaagcctta aacgtgcgat gcgtaaaagt ggttattacg cacaaaatat tggtgaatcc 180
agtctcagaa ccattcatct tgcacaatta cgtgatgttc ttcggcaaaa acttggtgaa 240
cgttttgacc aaaaaatcat cgataagaca ttagcgctgc tctccggtaa atcagttgat 300
gaagccgaaa agatttctgc cgatgcggtt actccctggg ttgtgggaga aatagcctgg 360
ttctgtgagc aggttgcaaa agcagaggct gataatctgg atgataaaaa gctgctcaaa 420
gttcttaagg aagatattgc cgccatacgt gtgaatttac agcagggtgt tgatattgcg 480
cttagtggaa gaatggcaac cagcggcatg atgactgagt tgggaaaagt tgatggtgca 540
atgtccattg cgcatgcgat cactactcat caggttgatt ctgatattga ctggttcacc 600
gctgtagatg atttacagga acaaggttct gcacatctgg gaactcagga attttcatcg 660
ggtgtttttt atcgttatgc caacattaac ctcgctcaac ttcaggaaaa tttaggtggt 720
gcctccaggg agcaggctct ggaaattgca acccatgttg ttcatatgct ggcaacagag 780
gtccctggag caaaacagcg tacttatgcc gcttttaacc ctgcggatat ggtaatggtt 840
aatttctccg atatgccact ttctatggca aatgcttttg aaaaagcggt taaagcgaaa 900
gatggctttt tgcaaccgtc tatacaggcg tttaatcaat attgggatcg cgttgccaat 960
ggatatggtc tgaacggagc tgctgcgcaa ttcagcttat ctgatgtaga cccaattact 1020
gctcaagtta aacaaatgcc tactttagaa cagttaaaat cctgggttcg taataatggc 1080
gaggcg 1086
<210> 19
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> target (CCR5)
<400> 19
tcaagtccaa tctatgacat caattattat acatcggag 39
<210> 20
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> reporter vector insert1 (CCR5)
<400> 20
gtcggattca agtccaatct atgacatcaa ttattataca tcggagaggt 50
<210> 21
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> reporter vector insert2 (CCR5)
<400> 21
cggtacctct ccgatgtata ataattgatg tcatagattg gacttgaatc 50
<210> 22
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> target (E. coli)
<400> 22
aagagcacaa atatcatcgc tcaaaccact tacgg 35
<210> 23
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> reporter vector insert1 (E. coli)
<400> 23
gtcggataag agcacaaata tcatcgctca aaccacttac ggaggt 46
<210> 24
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> reporter vector insert2 (E. coli)
<400> 24
cggtacctcc gtaagtggtt tgagcgatga tatttgtgct cttatc 46
<210> 25
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA insert1 (CCR5)
<400> 25
accgtccaat ctatgacatc aattattata catcgg 36
<210> 26
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA insert 2(CCR5)
<400> 26
acacccgatg tataataatt gatgtcatag attgga 36
<210> 27
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA insert1 (E.coli)
<400> 27
accgagcaca aatatcatcg ctcaaaccac ttacgg 36
<210> 28
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA insert 2(E.coli)
<400> 28
acacccgtaa gtggtttgag cgatgatatt tgtgct 36
<210> 29
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA insert 1(EMX1)
<400> 29
accgcaggcc aatggggagg acatcgatgt cacctc 36
<210> 30
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA insert 2(EMX1)
<400> 30
acacgaggtg acatcgatgt cctccccatt ggcctg 36
<210> 31
<211> 5701
<212> DNA
<213> Artificial Sequence
<220>
<223> reporter vector (CCR5)
<400> 31
ggcctaactg gccggtacct agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctggt ttagtgaacc 600
gtcagatccg ctagcgctac cggactcaga tctcgagctc aagcttggca atccggtact 660
gttggtaaag ccaccatgga agatgccaaa aacattaaga agggcccagc gccattctac 720
ccactcgaag acgggaccgc cggcgagcag ctgcacaaag ccatgaagcg ctacgccctg 780
gtgcccggca ccatcgcctt taccgacgca catatcgagg tggacattac ctacgccgag 840
tacttcgaga tgagcgttcg gctggcagaa gctatgaagc gctatgggct gaatacaaac 900
catcggatcg tggtgtgcag cgagaatagc ttgcagttct tcatgcccgt gttgggtgcc 960
ctgttcatcg gtgtggctgt ggccccagct aacgacatct acaacgagcg cgagctgctg 1020
aacagcatgg gcatcagcca gcccaccgtc gtattcgtga gcaagaaagg gctgcaaaag 1080
atcctcaacg tgcaaaagaa gctaccgatc atacaaaaga tcatcatcat ggatagcaag 1140
accgactacc agggcttcca aagcatgtac accttcgtga cttcccattt gccacccggc 1200
ttcaacgagt acgacttcgt gcccgagagc ttcgaccggg acaaaaccat cgccctgatc 1260
atgaacagta gtggcagtac cggattgccc aagggcgtag ccctaccgca ccgcaccgct 1320
tgtgtccgat tcagtcatgc ccgcgacccc atcttcggca accagatcat ccccgacacc 1380
gctatcctca gcgtggtgcc atttcaccac ggcttcggca tgttcaccac gctgggctac 1440
ttgatctgcg gctttcgggt cgtgctcatg taccgcttcg aggaggagct attcttgcgc 1500
agcttgcaag actataagat tcaatctgcc ctgctggtgc ccacactatt tagcttcttc 1560
gctaagagca ctctcatcga caagtacgac ctaagcaact tgcacgagat cgccagcggc 1620
ggggcgccgc tcagcaagga ggtaggtgag gccgtggcca aacgcttcca cctaccaggc 1680
atccgccagg gctacggcct gacagaaaca accagcgcca ttctgatcac ccccgaaggg 1740
gacgacaagc ctggcgcagt aggcaaggtg gtgcccttct tcgaggctaa ggtggtggac 1800
ttggactagg gtctctgtcg gattcaagtc caatctatga catcaattat tatacatcgg 1860
agaggtaccg tgagacctag gagcgcgagc tgctgaacag catgggcatc agccagccca 1920
ccgtcgtatt cgtgagcaag aaagggctgc aaaagatcct caacgtgcaa aagaagctac 1980
cgatcataca aaagatcatc atcatggata gcaagaccga ctaccagggc ttccaaagca 2040
tgtacacctt cgtgacttcc catttgccac ccggcttcaa cgagtacgac ttcgtgcccg 2100
agagcttcga ccgggacaaa accatcgccc tgatcatgaa cagtagtggc agtaccggat 2160
tgcccaaggg cgtagcccta ccgcaccgca ccgcttgtgt ccgattcagt catgcccgcg 2220
accccatctt cggcaaccag atcatccccg acaccgctat cctcagcgtg gtgccatttc 2280
accacggctt cggcatgttc accacgctgg gctacttgat ctgcggcttt cgggtcgtgc 2340
tcatgtaccg cttcgaggag gagctattct tgcgcagctt gcaagactat aagattcaat 2400
ctgccctgct ggtgcccaca ctatttagct tcttcgctaa gagcactctc atcgacaagt 2460
acgacctaag caacttgcac gagatcgcca gcggcggggc gccgctcagc aaggaggtag 2520
gtgaggccgt ggccaaacgc ttccacctac caggcatccg ccagggctac ggcctgacag 2580
aaacaaccag cgccattctg atcacccccg aaggggacga caagcctggc gcagtaggca 2640
aggtggtgcc cttcttcgag gctaaggtgg tggacttgga caccggtaag acactgggtg 2700
tgaaccagcg cggcgagctg tgcgtccgtg gccccatgat catgagcggc tacgttaaca 2760
accccgaggc tacaaacgct ctcatcgaca aggacggctg gctgcacagc ggcgacatcg 2820
cctactggga cgaggacgag cacttcttca tcgtggaccg gctgaagagc ctgatcaaat 2880
acaagggcta ccaggtagcc ccagccgaac tggagagcat cctgctgcaa caccccaaca 2940
tcttcgacgc cggggtcgcc ggcctgcccg acgacgatgc cggcgagctg cccgccgcag 3000
tcgtcgtgct ggaacacggt aaaaccatga ccgagaagga gatcgtggac tatgtggcca 3060
gccaggttac aaccgccaag aagctgcgcg gtggtgttgt gttcgtggac gaggtgccta 3120
aaggactgac cggcaagttg gacgcccgca agatccgcga gattctcatt aaggccaaga 3180
agggcggcaa gatcgccgtg aattcttaac tgcagtctag agtcggggcg gccggccgct 3240
tcgagcagac atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg 3300
aaaaaaatgc tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag 3360
ctgcaataaa caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga 3420
ggtgtgggag gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tcgataagga 3480
tccgtcgacc gatgcccttg agagccttca acccagtcag ctccttccgg tgggcgcggg 3540
gcatgactat cgtcgccgca cttatgactg tcttctttat catgcaactc gtaggacagg 3600
tgccggcagc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 3660
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 3720
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 3780
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 3840
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 3900
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 3960
ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 4020
taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 4080
gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 4140
gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 4200
ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg 4260
ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 4320
gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 4380
caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 4440
taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa 4500
aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagcggccgc 4560
aaatgctaaa ccactgcagt ggttaccagt gcttgatcag tgaggcaccg atctcagcga 4620
tctgcctatt tcgttcgtcc atagtggcct gactccccgt cgtgtagatc actacgattc 4680
gtgagggctt accatcaggc cccagcgcag caatgatgcc gcgagagccg cgttcaccgg 4740
cccccgattt gtcagcaatg aaccagccag cagggagggc cgagcgaaga agtggtcctg 4800
ctactttgtc cgcctccatc cagtctatga gctgctgtcg tgatgctaga gtaagaagtt 4860
cgccagtgag tagtttccga agagttgtgg ccattgctac tggcatcgtg gtatcacgct 4920
cgtcgttcgg tatggcttcg ttcaactctg gttcccagcg gtcaagccgg gtcacatgat 4980
cacccatatt atgaagaaat gcagtcagct ccttagggcc tccgatcgtt gtcagaagta 5040
agttggccgc ggtgttgtcg ctcatggtaa tggcagcact acacaattct cttaccgtca 5100
tgccatccgt aagatgcttt tccgtgaccg gcgagtactc aaccaagtcg ttttgtgagt 5160
agtgtatacg gcgaccaagc tgctcttgcc cggcgtctat acgggacaac accgcgccac 5220
atagcagtac tttgaaagtg ctcatcatcg ggaatcgttc ttcggggcgg aaagactcaa 5280
ggatcttgcc gctattgaga tccagttcga tatagcccac tcttgcaccc agttgatctt 5340
cagcatcttt tactttcacc agcgtttcgg ggtgtgcaaa aacaggcaag caaaatgccg 5400
caaagaaggg aatgagtgcg acacgaaaat gttggatgct catactcgtc ctttttcaat 5460
attattgaag catttatcag ggttactagt acgtctctca aggataagta agtaatatta 5520
aggtacggga ggtattggac aggccgcaat aaaatatctt tattttcatt acatctgtgt 5580
gttggttttt tgtgtgaatc gatagtacta acatacgctc tccatcaaaa caaaacgaaa 5640
caaaacaaac tagcaaaata ggctgtcccc agtgcaagtg caggtgccag aacatttctc 5700
t 5701
<210> 32
<211> 5697
<212> DNA
<213> Artificial Sequence
<220>
<223> reporter vector (E. coli)
<400> 32
ggcctaactg gccggtacct agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctggt ttagtgaacc 600
gtcagatccg ctagcgctac cggactcaga tctcgagctc aagcttggca atccggtact 660
gttggtaaag ccaccatgga agatgccaaa aacattaaga agggcccagc gccattctac 720
ccactcgaag acgggaccgc cggcgagcag ctgcacaaag ccatgaagcg ctacgccctg 780
gtgcccggca ccatcgcctt taccgacgca catatcgagg tggacattac ctacgccgag 840
tacttcgaga tgagcgttcg gctggcagaa gctatgaagc gctatgggct gaatacaaac 900
catcggatcg tggtgtgcag cgagaatagc ttgcagttct tcatgcccgt gttgggtgcc 960
ctgttcatcg gtgtggctgt ggccccagct aacgacatct acaacgagcg cgagctgctg 1020
aacagcatgg gcatcagcca gcccaccgtc gtattcgtga gcaagaaagg gctgcaaaag 1080
atcctcaacg tgcaaaagaa gctaccgatc atacaaaaga tcatcatcat ggatagcaag 1140
accgactacc agggcttcca aagcatgtac accttcgtga cttcccattt gccacccggc 1200
ttcaacgagt acgacttcgt gcccgagagc ttcgaccggg acaaaaccat cgccctgatc 1260
atgaacagta gtggcagtac cggattgccc aagggcgtag ccctaccgca ccgcaccgct 1320
tgtgtccgat tcagtcatgc ccgcgacccc atcttcggca accagatcat ccccgacacc 1380
gctatcctca gcgtggtgcc atttcaccac ggcttcggca tgttcaccac gctgggctac 1440
ttgatctgcg gctttcgggt cgtgctcatg taccgcttcg aggaggagct attcttgcgc 1500
agcttgcaag actataagat tcaatctgcc ctgctggtgc ccacactatt tagcttcttc 1560
gctaagagca ctctcatcga caagtacgac ctaagcaact tgcacgagat cgccagcggc 1620
ggggcgccgc tcagcaagga ggtaggtgag gccgtggcca aacgcttcca cctaccaggc 1680
atccgccagg gctacggcct gacagaaaca accagcgcca ttctgatcac ccccgaaggg 1740
gacgacaagc ctggcgcagt aggcaaggtg gtgcccttct tcgaggctaa ggtggtggac 1800
ttggactagg gtctctgtcg gataagagca caaatatcat cgctcaaacc acttacggag 1860
gtaccgtgag acctaggagc gcgagctgct gaacagcatg ggcatcagcc agcccaccgt 1920
cgtattcgtg agcaagaaag ggctgcaaaa gatcctcaac gtgcaaaaga agctaccgat 1980
catacaaaag atcatcatca tggatagcaa gaccgactac cagggcttcc aaagcatgta 2040
caccttcgtg acttcccatt tgccacccgg cttcaacgag tacgacttcg tgcccgagag 2100
cttcgaccgg gacaaaacca tcgccctgat catgaacagt agtggcagta ccggattgcc 2160
caagggcgta gccctaccgc accgcaccgc ttgtgtccga ttcagtcatg cccgcgaccc 2220
catcttcggc aaccagatca tccccgacac cgctatcctc agcgtggtgc catttcacca 2280
cggcttcggc atgttcacca cgctgggcta cttgatctgc ggctttcggg tcgtgctcat 2340
gtaccgcttc gaggaggagc tattcttgcg cagcttgcaa gactataaga ttcaatctgc 2400
cctgctggtg cccacactat ttagcttctt cgctaagagc actctcatcg acaagtacga 2460
cctaagcaac ttgcacgaga tcgccagcgg cggggcgccg ctcagcaagg aggtaggtga 2520
ggccgtggcc aaacgcttcc acctaccagg catccgccag ggctacggcc tgacagaaac 2580
aaccagcgcc attctgatca cccccgaagg ggacgacaag cctggcgcag taggcaaggt 2640
ggtgcccttc ttcgaggcta aggtggtgga cttggacacc ggtaagacac tgggtgtgaa 2700
ccagcgcggc gagctgtgcg tccgtggccc catgatcatg agcggctacg ttaacaaccc 2760
cgaggctaca aacgctctca tcgacaagga cggctggctg cacagcggcg acatcgccta 2820
ctgggacgag gacgagcact tcttcatcgt ggaccggctg aagagcctga tcaaatacaa 2880
gggctaccag gtagccccag ccgaactgga gagcatcctg ctgcaacacc ccaacatctt 2940
cgacgccggg gtcgccggcc tgcccgacga cgatgccggc gagctgcccg ccgcagtcgt 3000
cgtgctggaa cacggtaaaa ccatgaccga gaaggagatc gtggactatg tggccagcca 3060
ggttacaacc gccaagaagc tgcgcggtgg tgttgtgttc gtggacgagg tgcctaaagg 3120
actgaccggc aagttggacg cccgcaagat ccgcgagatt ctcattaagg ccaagaaggg 3180
cggcaagatc gccgtgaatt cttaactgca gtctagagtc ggggcggccg gccgcttcga 3240
gcagacatga taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa 3300
aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc 3360
aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg 3420
tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga taaggatccg 3480
tcgaccgatg cccttgagag ccttcaaccc agtcagctcc ttccggtggg cgcggggcat 3540
gactatcgtc gccgcactta tgactgtctt ctttatcatg caactcgtag gacaggtgcc 3600
ggcagcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 3660
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 3720
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 3780
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 3840
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 3900
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 3960
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 4020
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 4080
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 4140
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 4200
agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 4260
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 4320
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 4380
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 4440
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 4500
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagc ggccgcaaat 4560
gctaaaccac tgcagtggtt accagtgctt gatcagtgag gcaccgatct cagcgatctg 4620
cctatttcgt tcgtccatag tggcctgact ccccgtcgtg tagatcacta cgattcgtga 4680
gggcttacca tcaggcccca gcgcagcaat gatgccgcga gagccgcgtt caccggcccc 4740
cgatttgtca gcaatgaacc agccagcagg gagggccgag cgaagaagtg gtcctgctac 4800
tttgtccgcc tccatccagt ctatgagctg ctgtcgtgat gctagagtaa gaagttcgcc 4860
agtgagtagt ttccgaagag ttgtggccat tgctactggc atcgtggtat cacgctcgtc 4920
gttcggtatg gcttcgttca actctggttc ccagcggtca agccgggtca catgatcacc 4980
catattatga agaaatgcag tcagctcctt agggcctccg atcgttgtca gaagtaagtt 5040
ggccgcggtg ttgtcgctca tggtaatggc agcactacac aattctctta ccgtcatgcc 5100
atccgtaaga tgcttttccg tgaccggcga gtactcaacc aagtcgtttt gtgagtagtg 5160
tatacggcga ccaagctgct cttgcccggc gtctatacgg gacaacaccg cgccacatag 5220
cagtactttg aaagtgctca tcatcgggaa tcgttcttcg gggcggaaag actcaaggat 5280
cttgccgcta ttgagatcca gttcgatata gcccactctt gcacccagtt gatcttcagc 5340
atcttttact ttcaccagcg tttcggggtg tgcaaaaaca ggcaagcaaa atgccgcaaa 5400
gaagggaatg agtgcgacac gaaaatgttg gatgctcata ctcgtccttt ttcaatatta 5460
ttgaagcatt tatcagggtt actagtacgt ctctcaagga taagtaagta atattaaggt 5520
acgggaggta ttggacaggc cgcaataaaa tatctttatt ttcattacat ctgtgtgttg 5580
gttttttgtg tgaatcgata gtactaacat acgctctcca tcaaaacaaa acgaaacaaa 5640
acaaactagc aaaataggct gtccccagtg caagtgcagg tgccagaaca tttctct 5697
<210> 33
<211> 3391
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA vector (CCR5)
<400> 33
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 180
gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 240
tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 300
ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 360
tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 420
atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 480
gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 540
caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 600
ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 660
ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 720
ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 780
ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 840
gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 900
ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 960
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 1020
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 1080
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 1140
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 1200
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 1260
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 1320
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 1380
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 1440
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 1500
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 1560
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 1620
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 1680
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 1740
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 1800
ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 1860
agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 1920
aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat 1980
gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg 2040
tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt 2100
tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg 2160
ccaagcgcgc aattaaccct cactaaaggg aacaaaagct gggtaccggg ccccccctcg 2220
aggtcgacgg tatcgataag cttgatatcg aattgacgtg aattcttccc atgattcctt 2280
catatttgca tatacgatac aaggctgtta gagagataat tggaattaat ttgactgtaa 2340
acacaaagat attagtacaa aatacgtgac gtagaaagta ataatttctt gggtagtttg 2400
cagttttaaa attatgtttt aaaatggact atcatatgct taccgtaact tgaaagtatt 2460
tcgatttctt ggctttatat atcttgtgga aaggacgtgg atgtgttgtt tgtgtgatac 2520
tataaagttg gtagattgtg actggcttaa aaaatcatta attaataata ggttatgttt 2580
agagtgttcc ccgcgccagc ggggataaac cgtccaatct atgacatcaa ttattataca 2640
tcgggtgttc cccgcgccag cggggataaa ccgttttttg aattcctgca gcccggggga 2700
tccactagtt ctagagcggc cgccaccgcg gtggagctcc aattcgccct atagtgagtc 2760
gtattacgcg cgctcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 2820
tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 2880
ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat gggacgcgcc 2940
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 3000
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 3060
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 3120
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 3180
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 3240
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 3300
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 3360
ttttaacaaa atattaacgc ttacaattta g 3391
<210> 34
<211> 3391
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA vector (E. coli)
<400> 34
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 180
gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 240
tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 300
ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 360
tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 420
atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 480
gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 540
caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 600
ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 660
ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 720
ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 780
ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 840
gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 900
ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 960
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 1020
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 1080
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 1140
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 1200
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 1260
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 1320
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 1380
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 1440
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 1500
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 1560
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 1620
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 1680
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 1740
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 1800
ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 1860
agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 1920
aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat 1980
gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg 2040
tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt 2100
tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg 2160
ccaagcgcgc aattaaccct cactaaaggg aacaaaagct gggtaccggg ccccccctcg 2220
aggtcgacgg tatcgataag cttgatatcg aattgacgtg aattcttccc atgattcctt 2280
catatttgca tatacgatac aaggctgtta gagagataat tggaattaat ttgactgtaa 2340
acacaaagat attagtacaa aatacgtgac gtagaaagta ataatttctt gggtagtttg 2400
cagttttaaa attatgtttt aaaatggact atcatatgct taccgtaact tgaaagtatt 2460
tcgatttctt ggctttatat atcttgtgga aaggacgtgg atgtgttgtt tgtgtgatac 2520
tataaagttg gtagattgtg actggcttaa aaaatcatta attaataata ggttatgttt 2580
agagtgttcc ccgcgccagc ggggataaac cgagcacaaa tatcatcgct caaaccactt 2640
acgggtgttc cccgcgccag cggggataaa ccgttttttg aattcctgca gcccggggga 2700
tccactagtt ctagagcggc cgccaccgcg gtggagctcc aattcgccct atagtgagtc 2760
gtattacgcg cgctcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 2820
tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 2880
ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat gggacgcgcc 2940
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 3000
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 3060
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 3120
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 3180
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 3240
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 3300
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 3360
ttttaacaaa atattaacgc ttacaattta g 3391
<210> 35
<211> 3391
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA vector (EMX1)
<400> 35
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 180
gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 240
tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 300
ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 360
tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 420
atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 480
gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 540
caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 600
ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 660
ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 720
ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 780
ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 840
gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 900
ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 960
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 1020
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 1080
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 1140
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 1200
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 1260
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 1320
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 1380
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 1440
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 1500
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 1560
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 1620
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 1680
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 1740
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 1800
ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 1860
agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 1920
aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat 1980
gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg 2040
tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt 2100
tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg 2160
ccaagcgcgc aattaaccct cactaaaggg aacaaaagct gggtaccggg ccccccctcg 2220
aggtcgacgg tatcgataag cttgatatcg aattgacgtg aattcttccc atgattcctt 2280
catatttgca tatacgatac aaggctgtta gagagataat tggaattaat ttgactgtaa 2340
acacaaagat attagtacaa aatacgtgac gtagaaagta ataatttctt gggtagtttg 2400
cagttttaaa attatgtttt aaaatggact atcatatgct taccgtaact tgaaagtatt 2460
tcgatttctt ggctttatat atcttgtgga aaggacgtgg atgtgttgtt tgtgtgatac 2520
tataaagttg gtagattgtg actggcttaa aaaatcatta attaataata ggttatgttt 2580
agagtgttcc ccgcgccagc ggggataaac cgcaggccaa tggggaggac atcgatgtca 2640
cctcgtgttc cccgcgccag cggggataaa ccgttttttg aattcctgca gcccggggga 2700
tccactagtt ctagagcggc cgccaccgcg gtggagctcc aattcgccct atagtgagtc 2760
gtattacgcg cgctcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 2820
tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 2880
ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat gggacgcgcc 2940
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 3000
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 3060
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 3120
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 3180
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 3240
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 3300
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 3360
ttttaacaaa atattaacgc ttacaattta g 3391
<210> 36
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> primer1 (Cse1)
<400> 36
gcaaagaatt cagatctcca ccatgcctaa gaagaagaga aaagtgaacc tgctgattga 60
c 61
<210> 37
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> primer2 (Cse1)
<400> 37
tcatcgatgc atctcgagtt atccattaga aggtcctccc tgtggcttc 49
<210> 38
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> primer1 (Cse2)
<400> 38
gcaaagaatt cagatctcca ccatgcccaa gaagaagcgg aaggtggccg atgagatcga 60
c 61
<210> 39
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> primer2 (Cse2)
<400> 39
tcatcgatgc atctcgagtt aggcgttctt atttgtggtc agcacgaag 49
<210> 40
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> primer1 (Cas5)
<400> 40
gcaaagaatt cagatctcca ccatgcccaa gaagaagcgg aaggtgtcca atttcatcaa 60
c 61
<210> 41
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> primer2 (Cas5)
<400> 41
tcatcgatgc atctcgagtt atgcctctcc attgttccgc acccagctc 49
<210> 42
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> primer1 (Cas6)
<400> 42
gcaaagaatt cagatctcca ccatgcccaa gaagaagcgg aaagtgtacc tgagcaaagt 60
g 61
<210> 43
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> primer2 (Cas6)
<400> 43
tcatcgatgc atctcgagtt acagaggtgc cagtgacagc agcccac 47
<210> 44
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> primer1 (Cas7)
<400> 44
gcaaagaatt cagatctcca ccatgcccaa gaagaagcgg aaggtgcgct cctacctgat 60
c 61
<210> 45
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> primer2 (Cas7)
<400> 45
tcatcgatgc atctcgagtt actggctcac gtccattcct cccttgatc 49
<210> 46
<211> 6265
<212> DNA
<213> Homo sapiens
<400> 46
tcaccaaccg ccaagagagc ttgatatgac tgtatatagt atagtcataa agaacctgaa 60
cttgaccata tacttatgtc atgtggaaaa tttctcatag cttcagatag attatatctg 120
gagtgaagaa tcctgccacc tatgtatctg gcatagtgtg agtcctcata aatgcttact 180
ggtttgaagg gcaacaaaat agtgaacaga gtgaaaatcc ccactaagat cctgggtcca 240
gaaaaagatg ggaaacctgt ttagctcacc cgtgagccca tagttaaaac tctttagaca 300
acaggttgtt tccgtttaca gagaacaata atattgggtg gtgagcatct gtgtgggggt 360
tggggtggga taggggatac ggggagagtg gagaaaaagg ggacacaggg ttaatgtgaa 420
gtccaggatc cccctctaca tttaaagttg gtttaagttg gctttaatta atagcaactc 480
ttaagataat cagaattttc ttaacctttt agccttactg ttgaaaagcc ctgtgatctt 540
gtacaaatca tttgcttctt ggatagtaat ttcttttact aaaatgtggg cttttgacta 600
gatgaatgta aatgttcttc tagctctgat atcctttatt ctttatattt tctaacagat 660
tctgtgtagt gggatgagca gagaacaaaa acaaaataat ccagtgagaa aagcccgtaa 720
ataaaccttc agaccagaga tctattctct agcttatttt aagctcaact taaaaagaag 780
aactgttctc tgattctttt cgccttcaat acacttaatg atttaactcc accctccttc 840
aaaagaaaca gcatttccta cttttatact gtctatatga ttgatttgca cagctcatct 900
ggccagaaga gctgagacat ccgttcccct acaagaaact ctccccggta agtaacctct 960
cagctgcttg gcctgttagt tagcttctga gatgagtaaa agactttaca ggaaacccat 1020
agaagacatt tggcaaacac caagtgctca tacaattatc ttaaaatata atctttaaga 1080
taaggaaagg gtcacagttt ggaatgagtt tcagacggtt ataacatcaa agatacaaaa 1140
catgattgtg agtgaaagac tttaaaggga gcaatagtat tttaataact aacaatcctt 1200
acctctcaaa agaaagattt gcagagagat gagtcttagc tgaaatcttg aaatcttatc 1260
ttctgctaag gagaactaaa ccctctccag tgagatgcct tctgaatatg tgcccacaag 1320
aagttgtgtc taagtctggt tctctttttt ctttttcctc cagacaagag ggaagcctaa 1380
aaatggtcaa aattaatatt aaattacaaa cgccaaataa aattttcctc taatatatca 1440
gtttcatggc acagttagta tataattctt tatggttcaa aattaaaaat gagcttttct 1500
aggggcttct ctcagctgcc tagtctaagg tgcagggagt ttgagactca cagggtttaa 1560
taagagaaaa ttctcagcta gagcagctga acttaaatag actaggcaag acagctggtt 1620
ataagactaa actacccaga atgcatgaca ttcatctgtg gtggcagacg aaacattttt 1680
tattatatta tttcttgggt atgtatgaca actcttaatt gtggcaactc agaaactaca 1740
aacacaaact tcacagaaaa tgtgaggatt ttacaattgg ctgttgtcat ctatgacctt 1800
ccctgggact tgggcacccg gccatttcac tctgactaca tcatgtcacc aaacatctga 1860
tggtcttgcc ttttaattct cttttcgagg actgagaggg agggtagcat ggtagttaag 1920
agtgcaggct tcccgcattc aaaatcggtt gcttactagc tgtgtggctt tgagcaagtt 1980
actcaccctc tctgtgcttc aaggtccttg tctgcaaaat gtgaaaaata tttcctgcct 2040
cataaggttg ccctaaggat taaatgaatg aatgggtatg atgcttagaa cagtgattgg 2100
catccagtat gtgccctcga ggcctcttaa ttattactgg cttgctcata gtgcatgttc 2160
tttgtgggct aactctagcg tcaataaaaa tgttaagact gagttgcagc cgggcatggt 2220
ggctcatgcc tgtaatccca gcattctagg aggctgaggc aggaggatcg cttgagccca 2280
ggagttcgag accagcctgg gcaacatagt gtgatcttgt atctataaaa ataaacaaaa 2340
ttagcttggt gtggtggcgc ctgtagtccc cagccacttg gaggggtgag gtgagaggat 2400
tgcttgagcc cgggatggtc caggctgcag tgagccatga tcgtgccact gcactccagc 2460
ctgggcgaca gagtgagacc ctgtctcaca acaacaacaa caacaacaaa aaggctgagc 2520
tgcaccatgc ttgacccagt ttcttaaaat tgttgtcaaa gcttcattca ctccatggtg 2580
ctatagagca caagatttta tttggtgaga tggtgctttc atgaattccc ccaacagagc 2640
caagctctcc atctagtgga cagggaagct agcagcaaac cttcccttca ctacaaaact 2700
tcattgcttg gccaaaaaga gagttaattc aatgtagaca tctatgtagg caattaaaaa 2760
cctattgatg tataaaacag tttgcattca tggagggcaa ctaaatacat tctaggactt 2820
tataaaagat cactttttat ttatgcacag ggtggaacaa gatggattat caagtgtcaa 2880
gtccaatcta tgacatcaat tattatacat cggagccctg ccaaaaaatc aatgtgaagc 2940
aaatcgcagc ccgcctcctg cctccgctct actcactggt gttcatcttt ggttttgtgg 3000
gcaacatgct ggtcatcctc atcctgataa actgcaaaag gctgaagagc atgactgaca 3060
tctacctgct caacctggcc atctctgacc tgtttttcct tcttactgtc cccttctggg 3120
ctcactatgc tgccgcccag tgggactttg gaaatacaat gtgtcaactc ttgacagggc 3180
tctattttat aggcttcttc tctggaatct tcttcatcat cctcctgaca atcgataggt 3240
acctggctgt cgtccatgct gtgtttgctt taaaagccag gacggtcacc tttggggtgg 3300
tgacaagtgt gatcacttgg gtggtggctg tgtttgcgtc tctcccagga atcatcttta 3360
ccagatctca aaaagaaggt cttcattaca cctgcagctc tcattttcca tacagtcagt 3420
atcaattctg gaagaatttc cagacattaa agatagtcat cttggggctg gtcctgccgc 3480
tgcttgtcat ggtcatctgc tactcgggaa tcctaaaaac tctgcttcgg tgtcgaaatg 3540
agaagaagag gcacagggct gtgaggctta tcttcaccat catgattgtt tattttctct 3600
tctgggctcc ctacaacatt gtccttctcc tgaacacctt ccaggaattc tttggcctga 3660
ataattgcag tagctctaac aggttggacc aagctatgca ggtgacagag actcttggga 3720
tgacgcactg ctgcatcaac cccatcatct atgcctttgt cggggagaag ttcagaaact 3780
acctcttagt cttcttccaa aagcacattg ccaaacgctt ctgcaaatgc tgttctattt 3840
tccagcaaga ggctcccgag cgagcaagct cagtttacac ccgatccact ggggagcagg 3900
aaatatctgt gggcttgtga cacggactca agtgggctgg tgacccagtc agagttgtgc 3960
acatggctta gttttcatac acagcctggg ctgggggtgg ggtgggagag gtctttttta 4020
aaaggaagtt actgttatag agggtctaag attcatccat ttatttggca tctgtttaaa 4080
gtagattaga tcttttaagc ccatcaatta tagaaagcca aatcaaaata tgttgatgaa 4140
aaatagcaac ctttttatct ccccttcaca tgcatcaagt tattgacaaa ctctcccttc 4200
actccgaaag ttccttatgt atatttaaaa gaaagcctca gagaattgct gattcttgag 4260
tttagtgatc tgaacagaaa taccaaaatt atttcagaaa tgtacaactt tttacctagt 4320
acaaggcaac atataggttg taaatgtgtt taaaacaggt ctttgtcttg ctatggggag 4380
aaaagacatg aatatgatta gtaaagaaat gacacttttc atgtgtgatt tcccctccaa 4440
ggtatggtta ataagtttca ctgacttaga accaggcgag agacttgtgg cctgggagag 4500
ctggggaagc ttcttaaatg agaaggaatt tgagttggat catctattgc tggcaaagac 4560
agaagcctca ctgcaagcac tgcatgggca agcttggctg tagaaggaga cagagctggt 4620
tgggaagaca tggggaggaa ggacaaggct agatcatgaa gaaccttgac ggcattgctc 4680
cgtctaagtc atgagctgag cagggagatc ctggttggtg ttgcagaagg tttactctgt 4740
ggccaaagga gggtcaggaa ggatgagcat ttagggcaag gagaccacca acagccctca 4800
ggtcagggtg aggatggcct ctgctaagct caaggcgtga ggatgggaag gagggaggta 4860
ttcgtaagga tgggaaggag ggaggtattc gtgcagcata tgaggatgca gagtcagcag 4920
aactggggtg gatttgggtt ggaagtgagg gtcagagagg agtcagagag aatccctagt 4980
cttcaagcag attggagaaa cccttgaaaa gacatcaagc acagaaggag gaggaggagg 5040
tttaggtcaa gaagaagatg gattggtgta aaaggatggg tctggtttgc agagcttgaa 5100
cacagtctca cccagactcc aggctgtctt tcactgaatg cttctgactt catagatttc 5160
cttcccatcc cagctgaaat actgaggggt ctccaggagg agactagatt tatgaataca 5220
cgaggtatga ggtctaggaa catacttcag ctcacacatg agatctaggt gaggattgat 5280
tacctagtag tcatttcatg ggttgttggg aggattctat gaggcaacca caggcagcat 5340
ttagcacata ctacacattc aataagcatc aaactcttag ttactcattc agggatagca 5400
ctgagcaaag cattgagcaa aggggtccca tagaggtgag ggaagcctga aaaactaaga 5460
tgctgcctgc ccagtgcaca caagtgtagg tatcattttc tgcatttaac cgtcaatagg 5520
caaagggggg aagggacata ttcatttgga aataagctgc cttgagcctt aaaacccaca 5580
aaagtacaat ttaccagcct ccgtatttca gactgaatgg gggtgggggg ggcgccttag 5640
gtacttattc cagatgcctt ctccagacaa accagaagca acagaaaaaa tcgtctctcc 5700
ctccctttga aatgaatata ccccttagtg tttgggtata ttcatttcaa agggagagag 5760
agaggttttt ttctgttctg tctcatatga ttgtgcacat acttgagact gttttgaatt 5820
tgggggatgg ctaaaaccat catagtacag gtaaggtgag ggaatagtaa gtggtgagaa 5880
ctactcaggg aatgaaggtg tcagaataat aagaggtgct actgactttc tcagcctctg 5940
aatatgaacg gtgagcattg tggctgtcag caggaagcaa cgaagggaaa tgtctttcct 6000
tttgctctta agttgtggag agtgcaacag tagcatagga ccctaccctc tgggccaagt 6060
caaagacatt ctgacatctt agtatttgca tattcttatg tatgtgaaag ttacaaattg 6120
cttgaaagaa aatatgcatc taataaaaaa caccttctaa aataattcat tatattcttg 6180
ctctttcagt caagtgtaca tttagagaat agcacataaa actgccagag cattttataa 6240
gcagctgttt tcttccttag tgtgt 6265
<210> 47
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer1 (CCR5)
<400> 47
ccacttggag gggtgaggtg agaggattg 29
<210> 48
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer2 (CCR5)
<400> 48
taaagatgat tcctgggaga gacgc 25
<210> 49
<211> 25545
<212> DNA
<213> Homo sapiens
<400> 49
gcagtctttc tgccacagcc tcccaaagtg ctgagattat aggtgtgagc cattgtacct 60
ggcttggagt aatgtttttg agcaaagcaa atgtacagga catgcacaga gaggcacagg 120
gagcacagag tccctggatg aatgctctgg ctggtggcag tattgtcaca gggcaggcta 180
cccaaaggtg agcagaacac atgaggctag acaggtacaa cttgctcatg aagagcctcg 240
aatgccaagc ttaggagttt gaactttatt ggaacactga cactaatagt taatgtttac 300
tgagtgctta ctatgtgcta agagctatgc atgaatcacc tcattctaat tctcttaact 360
ctccacagca ggtcttatta tttccagatt gctgatgaaa aactgagtca cagagaggta 420
aaaaaaaaaa aacaaaaaca ccctgggtcc agagttgtgt gaaaaaattt taacaggtta 480
gagttgtgtt gtagaaatct ggtagccagc cacgtgtaag acgaattgta gaaaggagag 540
atcacaaatg gctatcataa gagaatcact gggaaaaggt aataagaacc caaattagag 600
gcaaggagaa cagaaagaaa tgaaagaatg caaagactga ctggatgtgc acagcagtga 660
ccgagagaaa ggaggtatca caggtgcctc ttagctgcta agcctgggtg tcctgcagaa 720
aggggcagct attatcagaa gagagaagcc agagagaggc acagatttgg tggggatgat 780
gttgagctcc gtttgggggt atggtgagtg tctagggggc ctgtaggaac ccctccagaa 840
aaattctcac aagcatttga aaatcagtga cttgatctgg agaaaaatat agggctggca 900
ttacaaacct gccggggtct gcattacagt attggttgaa agtgtggaaa ttgataatga 960
tagatggttg gtagatacat agatagatag atagatagat agatagatag atagatagat 1020
agatagatag atagaataaa tagcatgata catggaatga gggaagggct aaggataaag 1080
atgccttcat ggatgcccac agttaggaga agaaagtaga gcccatgaag gaacaactcc 1140
cagagtttgc agatccaggc aagtatcttg ttcagaaaat aaagggaagg gagtttccaa 1200
aagaaaaggg ggttgaaggt actcagatgc tgaggagcct ataaacaatt gtgactaaaa 1260
aagactcaaa tttggaaata aggtgtccta atgaacattt cagaggatgg agagagattc 1320
ttaaagtcag cctttggaag aataactata tagaacactt ccagaggcca aactagtgac 1380
aatggatcaa aagaattaaa atattgcata tctggaaatt acacagctag aaatatgtag 1440
aaaagaaaca caaacatgcg gtaagataca gctatggagc tgtttgtcga aattttgtta 1500
aaacagtgaa aatctgtaaa ctgtattaat gtccaacaat aaaaaatatt taatgagagg 1560
caaagatgct ttgattggtt ataaagataa agaagttaca atactatgta cagtatgatc 1620
ctttttttaa agggaggcac atatagaaag aactggaagg atatactgta agaatttcac 1680
gatgtttgtt tctgggtagt aggatttgac aattataaga tctctgtttt cccttcactc 1740
cccccttttg gattatctgt attttttata actctgtcca atagacatat aatgtgagac 1800
acataatttt aaatgttcta gtggccacat ttaaaaagta gaaagaaata gataaaataa 1860
tcttcttaag atatttcatt ttactcaata tatccattac tatgtgtaat cgatataaaa 1920
atattaatat tttaaatgtt ttagcactaa gcctgtttaa cactaaatgc agtggatatt 1980
cacatttaca gaacatctct gtttgggcca tccacttctc aagcaccaca ttaccgcatt 2040
tggctcctag cacggctcta tgaaataata gcagttaata tttatcaaaa gcctactatg 2100
ttccaggcac tgctccaagt tcatcaggtg gagattataa ctcattaggt ctcaataact 2160
ccatgaggtt gaacttattg tgctctccac aagcacgtgt tgcttgccct tgtcctcata 2220
ccataatgaa atgtttggag cttttgcaaa agccattttc ctaatatgat gggcatccaa 2280
gtctggttgc aaaggcttgg atagagggca agtgagagaa ttggagagag actaaaaatc 2340
attcaagaaa ttttgtggtg aaaaagacaa gtcaaaagac tgagagaaac atgaggacag 2400
aaaactcttt gtaaggcaag gagacataaa gatgaagtca ggctgaatag gaaagaagga 2460
ggtgaaaggt gaaagagaga tggctggggg tgtggctggt ccaaattctc acaagatctc 2520
tgttggagaa acattgcctg gcttgtgctg gtggcgagat gtacatagca gcttcccagc 2580
tagagggagc agggagtcat ggccttgtga gggagacaga tggagacaca cacaaccccc 2640
atcgcaggtg aatgctatga aagaatgggg tggagggctt cccagggaga tgaactgagt 2700
tttaagaacg aagttagcca gcaaagaagc aaaaggaaga ggatatagac ttgaggatta 2760
catcactgga tgactgagcc actgattgga tgtggaggat gagagagtga tgctttgagg 2820
tgattcccaa gttctccgca tggacaaagg cagagacaat aacttgtact gagtgctctt 2880
tggagtctga cattgatcca gtgcaccaca tatgttatct catttactcc tcacagaggt 2940
cccgtataac gcttgcaatt tcacagatac gcaagctgag gcaaaataat tggcccaggg 3000
ctcaccacta ataaatagga gagtctggat ttggggccag gttattccag aaatagagag 3060
agggagggaa aacgttaatg tggggccaga gccagaacag gtaggctagg ctgtatcagc 3120
ctgggaggca tcgggctatt ctccaaaaag tgaggctccg ggttgcagga gatgggacct 3180
ccaggaaact ggtgggaggc tggacagggg caaagtgaaa ggtaagcagc ctgaagatgg 3240
gtgggatgta gtggactcca gcgtgaagag cctccagtct ctggcagagc tcagcagctt 3300
gggtgggagg aaacgaaggg cagggagcag aaggtggtgg ggggaacggg ttttggttaa 3360
gatgggcagc tgtccagtgg tgaagagggg aagtatttgt gtatacgatc agttgtgggg 3420
gatggtggta gagggagcag tatgagagtc tgggaggaac agggcagggg agatggcaca 3480
ggagaagatt ggggtggggg tgggggcact gatactgaat ccagtacaca gaggcaggct 3540
tagagacccc ctgagggtga caaattcttc tcttaacttg ctgcagagga aacgacaaga 3600
gaataggtcc taagaggagt gaaaatagag gaaactggcc aagggataaa gataagcaga 3660
gctatggaag aaaaggaaga aaattaggga attactggag aggaagctga cagaaagggg 3720
cgctgggaga ggaaaaggtg agggaggacg aaaacggaac tcctatcacc cagcgcattc 3780
cagcaccccc tccccctccc ccgggaagtc tgcgactgca tcctcacagg gatggaatgg 3840
gagtggaagc taggccaggc tgggaccccg gggctgtccc agcccaacca agacggtgac 3900
cagactcaag ttactgatcc tccgctgttt cttcatctgt aaagtggagt taatgacaga 3960
cagctggatg tcaacgtttt ttgttgtttg ttttagagat gggatctccc tgtatcgccc 4020
aggctggagt gcagcggtat gatcacggct cactgcagcc tcgacctcct gggctcgaga 4080
gatcttcctg tctcagcctc ccgagtagaa atgtcagcat ttgaatgcct cacaagggaa 4140
ggtggtgtaa taaaaggtct attgatttag atatgaacaa gtatacccag agccacacga 4200
atgaaaggag gtggccagtg tagatgcaag tctaggacgg tcggtagatt ccaagcttct 4260
ctacctgccc agttaaacaa gttcgtggcc cctggccagc ctctcggtgg gggtctgcga 4320
cagaacgggt gggattcatt accaggctag gagcgcaagg ccctcgggcc gggttcagct 4380
tgctgggctc ctgtcttgtc tcagccccca gcacttgctc tgtcaccgca gagcacaggc 4440
ccaggcaacg tttacccaac tgaacccgca tccctgtggg aaccttgttc caacaaaatc 4500
ccgtcgttgt ctccttccat atggaacgaa aatctccttc tgtacctctg cccagctccg 4560
cacccccgcc cccttagaga tacggcctgg tcgggtcctg gtccccccct cggcggcgct 4620
tccacttttc ccagactgag ggtggggaaa aggaggaggg ggaagaaatc agaggaggaa 4680
aagtcgggag gtaggggagc cgggagacag gagaggggga aaataaagag cctgagacac 4740
aaacgagagg aaaagaccat cacagaaagc tggaaatctc cggagaggcc agcgagaacc 4800
cgcgctcccc acggattcca tcattccttc cgaaggcgcc tctgcggtgt ctcagccgtg 4860
ccaggccccg gggttcccag gacgcggagg agtgctgggt gcggccgcct cgcctcccca 4920
cccctggccg cccctcccca cctcgcccaa gggggccgga acggcgtcgg cgcgcggggg 4980
cttttcggag cagtcgagtg gaaaatagac tttaacccgc tttgtggcgg ccggggcgcc 5040
ctgagcgctc tccaaaccac ggctcccggc gctcaggcgg gccgctgcca agacccggcc 5100
tggagtcccc gcagagttgc gcggcgcacg gaccccgtgg ccttggggcg tcaggaggcc 5160
caacccagat ctgcgcgccc aggcagcgct caggccgcta gaatggaccc cggcagcggc 5220
gaggaagcgg aactctctgc ggctccctct ccgcagtgcg ccggcaaggt ccaggtccca 5280
gcctccccac cgccgcccgc gccctcctag gcctcggagc ggcgcctttc tgcggcctcg 5340
aaggtggggt gggaaagttt ggggagtccc ggctctcaca gcctgtcgtg agaactgccc 5400
ccggggaatt cgtccgccgt acggaaaaac tggccggagc agagtcgtcc gcggttccgc 5460
ggtcgcgggt ggaaggtgaa ggtcgaggga ggtcaggctg cttctgcgtg tcctgacggc 5520
tggcgtgttc tcttgagatg ggctcgggct acttggccag cttcaattta agccacagtg 5580
tctccgaggc cctgacctgg tccggcccgc cgacacttga gcccccagag cctcagagaa 5640
ggcgaggggg tggatctccc agtgccgagg cccgccgtcc tggtccaagc cggtcgcggc 5700
accgtgtctg ggcactggag ctgcttccag ccccgcgaac agctggaggg tggcagtggg 5760
accgctccgg cggcttctcc cgcgcagtgc cccgcctggc cccttgtgaa gggagtgagc 5820
gtcccctttc cagagctgtc ccccgtgaca tccagaaaac gcgaaacctc aggaacaagg 5880
tcgcagcttc agaccgcggc ccaggaggcc gatggtgggt gagtgggaga gtcccggaga 5940
gcaggggggc agagagctgg ttttcgggaa aaccaatgtg ttggacccca aacatccacc 6000
ctccgctcgg atccaagttc tctgagaact gaaacgacat cccgggacga atgggagagt 6060
taggctgagc tacacaccgg ggaggggagg gttggagttt agccccaagc ccttcggacg 6120
ccttcttcgg ctcccgcgtg ggttgagacg gcggcacggc caccagactc agctaaaggg 6180
cggagtcgcg aggagaagcc agtggcgagg ggaggaggag gcctggatct ccccgcgaag 6240
gctccagtcc ggcttttgcc tccgactgcg ggctccctcc ccacccgccg tccctcgccc 6300
cgccccgccc cgccccccac cttggggcag gtgagcggcg gccaatgggc gagcgcgggg 6360
caggtgcccg ctaactcgcg cctcgcagcg ctgggcggcc ggggctgggc agggcagtgc 6420
ggggacaccg ggggctgggg tcggtcccag cgggactccg aaaggaggga gacgagctca 6480
accctcgggc cttactggca gctcgcagcc tagcacggag cccgcgcctg tgcgggcgcc 6540
tggagctgcc cgctccgccg cagcagccgc cgcgcctggc cgtacgctgt ggccggaccc 6600
cgcggtcgct cgctcacaca cccctcgccg ctccgcgcct ggctcgcccg cgggggccga 6660
gcgcgagcgg gcgggcgggg gaggtgaggg gtgcgggcgg gtgtgcatgt gcctggctgg 6720
gtgcacaccc cgcaaggcgg cggcgccagg acgcggagcg ctccccagag cccggctgcc 6780
tcgcacagct cccgcggctg cgaccatgtt ccagcccgcg gccaagcgcg gctttaccat 6840
agagtccttg gtggccaagg acggcggcac cggcgggggc actggcggcg ggggcgcggg 6900
ctcccatctc ctggcggcgg ccgcctccga ggaaccgctc cggcccacgg cgctcaacta 6960
ccctcacccc agcgcggccg aggcggcctt cgtgagtggc ttccctgccg cggccgccgc 7020
gggcgcgggc cgctcgctct acggtgggcc cgagctcgtg ttccccgagg ccatgaacca 7080
ccccgcgctg accgtgcatc cggcgcacca gctgggcgcc tccccgctgc agcccccgca 7140
ctccttcttc ggcgcccagc accgggaccc tctccatttc tacccctggg tcctgcggaa 7200
ccgcttcttc ggccaccgct tccagggtga gtgtccacgc tgtgcccgcc gaggcggccg 7260
gccggcgccc gtgctgcggc gatgcggggg aggctcgggg gcgcgcgggg ctgtttagaa 7320
gttactgccg ggaaggctgc aggtccgcgg aggtagattc ccaggcaggg aagagctgtg 7380
cggcatccac ccgcgccttc gccgcgtagg tctccctccc aggaaagcag gtggagacct 7440
ccaggctttt ctagaaaata taccagttcg gacgcaagcc caggcgcgtc ctcggagcct 7500
gtgctggccc tcgccacagc ctgcccaatt ctctctccca gctgagccag tctcagacca 7560
gagtacaact cctcccgctc tccctccgcc cggcttaacc tcgcaccacg cttctctcgc 7620
aagtccacca ccacctccga gacctcagcc ttcgctggcg cgtccgggcg ggggaaagtc 7680
cattcgcgtg ccccagctct gggggaagca agggcagcag ggagggcgaa tcggagagtt 7740
aatgttcagt gtggagggcc tggctgtctt gggatgtttc tcggcaacct tggcccgact 7800
tctccaagtc acacgtgcct ctcctaccca aggtggggaa ggtttgcagt aagcaaactg 7860
gcttccgccg ttgctcgccg ccttcgggag ggagcccacc cggctgctgg aataccgagg 7920
acagttttcc cgggcagggg gcgggggcag agggctttta aggtcgtagc cagtccgaac 7980
cccggagttt gcatccagca atcggcttgc taataaagat cctccactgg ccctacacac 8040
acacacacac acacacacac acacacacac acgtttcaat tatttgtctt tcccggagaa 8100
aagagagttg catttgttgg agttcgtttt cttccttgaa atttgttgga gtttgttttt 8160
ttcttttctt tttttttaaa ttttatttta aagagtggcc ttgatttgta caggcatcac 8220
tttagtttcc agttttattt tgttagtgta gaccagacca cagccttgtg agaagggtct 8280
atggctcaga gctaggtaac ccggctttta gagaaacaaa tgaaagggac atggctggag 8340
cttcggctcc aggagctaat gtgacggtct gtagtctagg tctacagtca attagatgtt 8400
tggcacagtt gtttagataa taaaatgaaa attatctctt gacactttga ctttcacaga 8460
aaaccgcttt cccaggtccc gatttgtcag gcaatttttt cagtcccacc tggccaatag 8520
atgctgacct ggcagatacc acaaaaccag agaatgtaat tactagaata agaattgttg 8580
tgggtagcct tgcctcctct ttgaagattt caaagacttg cccaaatcca aatccgaaaa 8640
aacaaaaatg ctacaatgtc atctgccttg ggcaagagtt tctgccactt aaaaataaat 8700
gtttactgat aacatgagga tatctttaaa attgagcaat ctaccctggt cctccgtggg 8760
ctcgatccga agcctgggtc tcgaaacctg gcgcccaggg gccgagttgt agttggggcg 8820
gtgtgtgagc ccgcgggccg ccgcggccga ggggctggcg ggttggaggc ttgtggaggg 8880
ataggggctc ggaggagagg gcggggtcgt tcctaagtcc tgtggcctcc agccgttcag 8940
cttgtccgga gtcggcatcc tgggccgcac cctcggcttc gaatccagcc cctgacgccc 9000
tccgcaccgc ggttcctgcc tccgggcgcc gagggccggg ggcgcctgga gagaaatcca 9060
gctccggctc tgagcgtctc cagtcaggcg aggcggataa atccttcgca aaaccctctt 9120
ggaaattgcc gccgcttcct gagccatcag tcccagcggg tacgttatcg agtagcacaa 9180
acagttggat ttttccctca agaaccgagt ctggacgcgg agatggagcc aagtgtggct 9240
gcattttcgg acccggaaat ccgttgggca ctgaaggact tttcgaaccc tgtagcgctg 9300
ttgcttcgcg gtccatcgtc gccgctgcag acggatgcgc tccccggcgg ctctacgccc 9360
tccagtcccg gccaggcctc tgggctggga gccgagccgt ctcgggccct ccggcgccgc 9420
gttttctaga gaaccgggtc tcagcgatgc tcatttcagc cccgtcttaa tgcaacaaac 9480
gaaaccccac acgaacgaaa aggaacatgt ctgcgctctc tgcgcagcgc ttgggcggcg 9540
cggtcccggc gcgcggggaa gcggcgtctc cgctaaccga ggcgctggaa ggggaaaagc 9600
gaatgcggaa tcgtccagga ctccgaaggt cggggccgct cgcgagcacc gaaggggagg 9660
agccgacgaa gaccaggagt gggccgcatt tcggtactgt ttccccgaga tcaggaactt 9720
tccgggtcta ggagcaacgc ctggaggggg ctgtagagac ccagcccccc gggacccgca 9780
actacaatgg gccggagctt ctaaggtcgc ctttgttctg gcaggaggac ggggaatgag 9840
gttatctccg ccgcctgtcc tgcctctccc tctcctagcc ctagggccct ccgcccagcc 9900
gtccggccct gagcccctgg ccggcggcgg cctctccagc gaagactgcg gctcgaagac 9960
tgcagctcgg accccgggtg cttcggatcc ctagctccca cctccagctc cctcattcct 10020
gggaatctct tgtgctagtt cccagccatt gccttgaagg ggccctaaaa gagtggctgt 10080
agaaaaatcg gaggggtagg gaagcaggga ggagaggggt attcatttcc ctagctccag 10140
ggacggctat accagtccct ttccactttg ctaactgtcc tagtccgaaa ctgacagccc 10200
gttctcacag cccagaatta ctgcgtccaa acaggccgca ccctagaccc aagtttgttc 10260
tgcccttgtg gtccaggcaa gggaaactga acccctggta ggggtggttc aggcctcctt 10320
cccacaggtc ggggggcggg gcggtacagg tacctgtgca cctaaggcat cacccttgtc 10380
tttgcagaaa catgtagcaa ttgatctgtt tctcaggatg tttggtgttg tactaaacat 10440
cctctttcta acagggaaac gtccttattc ttttggaatc aaataacctg tcatcactta 10500
gcatcttgac tcatcctgca gtctcctgct tctctgtgat agggttagaa ggacccctgt 10560
atttttgcac atgcatgtga atataccctt taggacacat gctgtctacc acaactggac 10620
atgacaatga cctggggcca ttttctcagt aaggtagacc caaagcaacc tagcatcccc 10680
ctaaaataac cagacttgag gcaaaggggc atgtatgttg gtacagaagc ttgttgcctt 10740
catcctctca tctgggttta taaagacaaa cacagagcac tccaccacac aggtgactga 10800
catataccac ataattacaa aataatcact aagtcagaga cactggggca gactgcagac 10860
ctgcttcctc agccccacac tgcccttcac acctctgcct cctattcata cacacttacg 10920
gggctttcca cactgcagcc tcacttctga ccaacctggg ccagcccagc atctgaggcc 10980
aaaccctgcc aatgctggga tgagctaggc tttctctctc cctctctggt tcatttgtcc 11040
agaggaaacc actgttggga cttcacccag gttcataaca atgttgtttt ttgaagcaag 11100
ttattaacat taacaagaag catttgcttt ccacccacct ttccctggcc tacctcactg 11160
gccccacccc agagacttta atcttcctta ttccccacct ggagcaggct ccatattttt 11220
ctgcccttta ctcatctctg ccagaccacc tcccctgacc atctgtctat tccactatcc 11280
caagtcaaac ttctcttcag tcggacctga gggccctaga tctgcgccac ttgaataatc 11340
aaatggggtg tccctcaccc atctccctgt gatgtggtcc caccattttt gtggctgcac 11400
agatccaacc agttgaaatt gataaggtga ctggagatta ttgactgacc ccttccaggc 11460
actagccccg caatcctagc aactctgttc cacagaaaac tccagcaaaa acttggcttc 11520
tttaggtaac caaagcccag agacttggag gaagtaaggt cagggagttt ccaccaacag 11580
agggacaaga acagttacct ggagagtttt agctacagca tctcaattat ctgcttttga 11640
ttcacttaca tagatgtttc cagagatggg agatgttaac tgaattatcc aggtgattgt 11700
cttagagcaa agcaacaggt caaatcaagt ccaaccagta gccatctctg aagaaattaa 11760
ttggatcagt caatcccaac agctaattct gtcaaaataa tccatctagg gttccgtgtt 11820
tttggtgcat caggaggctg ttatgtgccc ttacatgaga atccatgggt gattttgtca 11880
gggcctgtta tgagtctgtt agcatgtgca accaagccag agattgtgtg agggcctagt 11940
ggggtgttca ttgagacagg cgctgtgggt agaggcttgt tttggcattg atagtttctg 12000
accccatctc ccctacccca gcttcatcca gtccagtgtt atcccttcct cctgcatgtg 12060
ggagctgagt ccctatgctg gccaacattt gctaagggac agtcacactc taaaaatcct 12120
atacagtaga taggaaaaaa gacagtaggg aggctggaac atatatttac acacgcccat 12180
gcagaaacca atatatctat atctatatat attagagaga aagatgacat ctagatattt 12240
atacacatgt ttctttagca agggactatt cagggatgaa gcagggatga agcttttccc 12300
accagacagt acttggagtc tccagtgtgt gtgttgggat agggggttgg gggcttaccc 12360
tagaggctgg gtctctggac cgccaaggcc tgggggagag agaggtggag aaaggggaag 12420
aaggagcctg actttccact tccaggtgct gcctggacca ctgacctagc cactggccta 12480
tttatacccc ctgcaagaca gagctagagc gtgctggcag gagtttttaa tgagttagta 12540
gcctgagcat tcagccgcaa gactagtgca agcaggtgtg aagggattgc tccttgtgta 12600
ccttctagtt cttgaatctg tgtttggcaa aggtgtgcct agcaccccgc tgctcccctt 12660
atcacgttcc tgacccccag ccctgcctct accctgggtc ctcttggagg gagatgcttt 12720
gcgaccagtt aactgaaagc aaatcgttgg ggctggcggc cagggcagcg cccctgggaa 12780
agggcggaga aagagcgcca tggacttttc ttccccaccc cttggcctct tccgctgccc 12840
caggcattgt gaatgtgggt ccacgcctcg tccggcctgc cccatctctt ggcttaacag 12900
agggatctgg agagctgtta ttccccgcgt tcccccgcgg agtggctctc gagtgcgggg 12960
aggtgttgcg gaggggagtg gacttaggga aggggcggca aaagggcaaa gggagaaatg 13020
gcgtgtgtgt gcgtgtcaag gaatggagag ggcagggcgc ttgggagcag ggcgcgaggc 13080
caggctctgt tgggccccgg ctcacggcgc cccttctctc tgtctgtacc tgcgtgtgtt 13140
gccgtcggcg gcggggccgc agccagcgac gtgccccagg acgggctgct tctgcacggc 13200
cccttcgcac gcaagcccaa gcggatccgc acggccttct cgccctcgca gctgctgcgg 13260
ctggagcgcg ccttcgagaa gaaccactac gtggtgggcg ccgagcggaa gcagctggcc 13320
ggcagtctca gcctctccga gacgcaggta atcacccccg gtcgcggcct gccctgcgcc 13380
cggagcccgg gtggaggtga gggtgcgcgg gtgcaggaga ggccctgagc ccgccccagc 13440
ccagccctgc tgggttccaa aaggccccca ttccccgcgg cgctgcggtc aagcccgtct 13500
ttagagcctc ttcctcgaga ctgcgtgcag cctgctgagc ccgcaggact tttgtcaagc 13560
gctaaagacc tagcaggagg cagagtaaat gcaaactgta tcccgagccc ggctcccaaa 13620
gctcctcacg gggggaccag gttccctgga ggaagcgggt cgcctcggga gcgggcagcg 13680
caggcagcac cgaggccact ggagctggct ccagccctgg cattcctgca gcccttttcc 13740
cgccactgtg tcggggcgct catagtcctg cggggagccg gtccgcactg gctttgctgc 13800
tgttcctggg caaaactggc ggggccttgg ctgcccacca gccaggagcg tctggggaga 13860
aagcccaggt gtcctcagac taccaacaga ggggcttaac cagggagggg ccagcccctg 13920
cttggggccc gagggttgct ctgatccggc ccaggccggc tgatagggct gtggaagcca 13980
cggtgtgcgc gcgcagagca tctgagtggc ctgggcctgg tgggaaatag accccgggta 14040
ctcaggtgct tctctgaatc actggaaagg ctgtcgaatg ggagaaggaa taaactccaa 14100
cggcgcctgg gcttgaactg agtgaaatta acaattaccg tgtagtgttt ttgtaactga 14160
tcgttaattt aagggaaaaa attaaagaat tagatgaaag ttatagggag gtggatttgg 14220
gttcattgta agtagacttt gccataaata aatgctgcct gggatcactg cataagctct 14280
tggtccaccc aggtccgacg tgttggagtg gggctcagcg accctcagcc tagctgctgc 14340
cctggaggtg gatttcagtc tctgcgtgcc ggccggctcc cagagttgcg agaggccggc 14400
tccgcggtct cccagctacc tcccggctga cttttcacct tccgctcccc tttcctccta 14460
gtctcgaccc tactacacca ccgtcccctc ccaagtcccg ggcagtgaga agatgcccgg 14520
catggggggc agccggagcc tccctttagc agccagagta ggaagggggc ttagtgaggg 14580
agcccagacc caaacttcat ccgcagcttt cttcggcgga ccttaccctc tcctccttca 14640
gtggcatttt ggcatctatt gtcgtcatat ctgtctgctg ccccacttaa tctacaaatc 14700
gctcacgggt cggaggcagg acccgtgcgt tttcagatgt actagctggg ctgttctaac 14760
tgcagggaaa aagcttacaa aacaagagtt aattttaaaa acgtttcaaa gaaagatgtg 14820
tttttaaaaa taagttaata aaataacact cccttttccc tcctggcagt gttttaaaat 14880
tattgtttga aacaaggtgt cagtttaaga atggtgttta taattaactt catttaaaca 14940
gtaatattta ttaaatttta attgcagaac tgtaagaaaa caaaaatggt ttttaatcct 15000
accacccaca gattaacact tgttgaaata atgtcattgt ttttaaactt tcaatttttt 15060
agctcagtga gagcattttt aattaactct ctttcaaact gaacctagct gcctgtcaat 15120
atttgctcct aacaatgcca gttagtaaac ggactgattg tttctttcat ttttattatg 15180
agacatttca aacatatatt taaaacaaaa ccagatagaa taacataaac gtatcctgct 15240
tcattaacta tcaaaactca gggctaatct tcttcccgtc tgtaaatgag ctgctttttg 15300
catatggtac aacaaaaaga atgaggggag gtttgagcct ggggaacctg ccgtggcagc 15360
ctgtccttcc aggtgaagac cctgagatgg agagatggtt tggacagagc ttcccaggtg 15420
ggcaaacacg attttaaata cctgcctccc tgctaactta ctgtgtaacc ctgggcaagt 15480
cacttaacct ctctgagctc tggtttcctc attgagaaaa tagttgttta atgattaaag 15540
gtacctcata tgagctcaaa taatattaat ccccatccct agtcccttcc ctttaaggta 15600
gtatgtcaga ttagtagcat aagaagatcc aaacctgtgt gtcctcttag tccagcgttc 15660
ttcctccctt atgcagtttc cgtcatcaac attgcctttc tgttgccctc ataacttatc 15720
atacggagcc aggctatata attagctact tctctatccg cctcttggta cttaccaggc 15780
aagcttacct gtcatttcca gctatcagct atttgtcaag catcagtcac ccccaacagc 15840
ccccctgcca tgcatttcta ctgttaatat ctgtatctgt ctccagagct ctctaatctg 15900
tcccaccccg tagctgtttt acatctagcc atatacttct gtctgctctc attaaactgc 15960
ctccccaaaa ctggctaatt tatatttccg attttctatt agttatatgt tcttcctaac 16020
aataagaact atttacccat ttgttcatta tctttgtcat ctattttacc ttctgtgttt 16080
ccaccattca tctcaaactt catctccata gagctatttc gcaactgaca aacagtatat 16140
tcatatgtct ggtaatggtt atctattatt ggctctggct ttgtcttctc tctgggtctg 16200
ggcctcagtt tctgtatctg tgagattgaa tgacacaaat tccagggttt tttctagtgc 16260
tgagtttctg tgactcctct acattctact tctctgtgtt tctgtatact acctcctcca 16320
cattctcaga gctcaccaca caacccctgc ctatcatgat atgcatcaaa ctttgttgtt 16380
attacttaat tatctgccat gtccaaacat caatctgtag accagcagta tgcgtctctc 16440
agggagatct taaaatacag attcctgggt ttcacccagg agattctctt aggaagtcca 16500
ggatagggtg caggaaaaag tttaaaaaca gttatttggg tgatcatgat taataacagg 16560
cctgagcatc ttagctctgg gaggcagagg ccaagcctgt ctgtttctta caggacccag 16620
ctcagtgccc gggatggagt acatgctcaa taaacatgta ttgaattaat gagcacattt 16680
ctctttgccc atacaaatac acactaactt tatcagtcat tccccttgct ctctgctgtc 16740
attgctccct ccctgtccct ctccttctat ctttcccttg tactttcaca gctgattgtt 16800
gatttagatt atgcatatac cagtttgtgg ataaaacttc tcggagggtt actcagatca 16860
gtgtgtgaat gagctcttaa tccagatctc agaagtctgt gcactcccca agctttagcc 16920
gggtgctagg aggtgggcaa cctgggtgac tctgtgtgtt tagtgggagt ggggtattcg 16980
tgctgggatg gccagtgcct caatctagga gatgagggaa gagccctggg caagggctag 17040
ttctcccttc aggttctaat gacttgttcc tcactgcttg ggtgccgccc tggagtatga 17100
ccaggaaggt accagtctaa gcttcagtcc tggtggctgg ttgggcagac ctgggcctgg 17160
gtcattgcag aggctcaagt ttaatgagta tgtgtaatgg gtgtgtgcaa catgtgtctg 17220
cccatgtggg gcaccaacgg gctttatgtg attgatgccc aaaggtcaga tgatagcata 17280
ggtacacatt agatgccatt aggcagtcat atgacatgga gtgcagcttg catgcttttg 17340
tgtgtgttcg tgtgtgtgtc gggggcaggg gtaagttagt tttaggggga gtgagagaaa 17400
gcacctggtt gctccaggct gatcaactgg tcagtgtttc cagctactcc ttctgctctg 17460
aacagatcag caggtgtttc ttgaccttgc ctgggttaga gtttagctga gcggtgaagg 17520
caaagggtac agaaacgtgg cctgtggctt tgaagatttc ttactgagtg atgaaggcta 17580
agtgcaaagc ttgcacattt gtgaaacatg cacaggaaga atgactaggg tcccctttga 17640
ggtcacagct gtgggctgag gggtgtcagg atagaaacgc ttgagaagat ggctccagga 17700
ggcctcagac ctggaagact tggggggatg cctaggatcc taggttggag ggaaagaagg 17760
gcagggtttg aggcaggcag atgaagatag agccaccatc ttggagccca agggcaggga 17820
gatcttggga ggcaggagtt acggtcacct gcctatggct ttttcccctc agaggcatgg 17880
aaaggaggat ttggagggtc ctttcctgct ctggaatgtt ctggccttag agggatggat 17940
aagaggggga tatccaagtg acctgaattt tagggaaaaa tcaagagaca tttgttccta 18000
gctcacggtg tgtccacatc tcttctctaa gtcttggctt ttcttcaaga acttctgcat 18060
ctcatgttcc aggagtcctg tgtgggagga tgagggggag ataaaggaga ttagagtggt 18120
tctgtgagga gctgggacca acatgtcctg aggtgaatct tatgatgtct ccctgagaga 18180
gacagaggaa gggtccaggc tgggctgaaa gaggaggaga cagggaggct tagggagatc 18240
atggttatgg ttggtgggga gctggaggtg acctcagctt actgaggtga aggttgaact 18300
tagcatggca ttgattgggc ttgaccttga gagtgggaac agcccacatg atcaaatgat 18360
aggaaatggg tccccaggga agagagaaag ctgaggggtg acttgactga tatctccagg 18420
ctcctgtcca ttctgggata tttgaaatct ttgaagacag gacacgtatt cacctgaaag 18480
tgtgcagggg cctggagcca cagacttttc catttgcagg agtggtgaaa aagaagggat 18540
ccagacctcg ttcattcaga atagcagatt attccaaagt aaagtctgat tagttctgaa 18600
atatcggctg gagccatagt ttgcttgttt gttagttcat ttttcccttt gttcttgcat 18660
gcatgtcttc atttattaat gcatacattg atcagtcctc tagcaaactg atacattcat 18720
tcatccatag cagtttcacc ttcttcattc tgcctgactc aagccaaccc ttcttctgcc 18780
cagcagtagg tgtccctcct ccaacttccc ctaaaagtgg ccaatccaat ttaccatgtg 18840
gaatattaaa aactggccct cttgcaaaag tgtccacaaa actaagaaaa agatccagtt 18900
tctccatcat tgagcacttc tcaaagcctt tgctgattag aattctaccc ctcttctgtt 18960
cattttctcc tgttttccag gtctggccca ggtacctctt gcctagagca taggcttgtc 19020
cagccagatg actatacatg gaacatgtcc tctgggcagg gcactgggac taacataaca 19080
gtttggctct ccagtctcat agtctggtga ggaggcagac gtaaataaat aaattagtgc 19140
acagtggggg tcactgttac tgagactggg aagaggtact aaggaactac aggcaggtga 19200
tggggcagga ccattaagga acatcaggac agggtcttga aggctaagga gagtattcca 19260
gggttggtaa gtcaggagaa tggagacttt tggaaggatg tggcctctga gaaactgaga 19320
tgttcacttc acagtgaaat gaggacttgg gagaccacaa gggacctctt gctacagcag 19380
agaggtcaga gtgggcaagg ggtcctccag ctaacattcc aactgtacct cggggcttag 19440
agagaggtga gtagtgtgtt tgtgttgggg atggggaggc atgtgcagga cagatccagc 19500
ctccaagcca taccatatga cccagctcct ttccagggcc tgttttctct agggaagggg 19560
ctctgaagga tccagagttg cctggctggg ttggagaggt catgaaatgt cactctcatc 19620
tcctaataca ctcagagccc agttcctttt ctttttccaa gtaaaaaata actaccatta 19680
tcaataatct attaaggaaa attcagaaaa gtagaaagaa gaaagaaaca tcacccacac 19740
tttaggtata tttccttcta gtcttttttc cccgtgtgta gattttgttt ttctatggtt 19800
gtgatcacac tgtgccagcc ttgtgcatcc tggcgtttcc attaatgcta tgaagtcata 19860
agcactaccc tgttattgca gtctttgtaa acagcatctg gacactcagc ccaaggctgt 19920
tctccggaag atggccaggc tgcacaggga gagggtttat gtccctgcct ctagagagat 19980
gcctacttga ccccagtatt tttcatggag aaaatattca gaatcacctt tcacttgggt 20040
gccctaggaa gctgcctctg gcctatcctg tgcctgaagt cgccatccaa agctttcctt 20100
ctttgagcca gtgttgctag tcaagggcag catgctgggc ccgtcccact acaggccaat 20160
gtgaccgtca gtctccttcc tgaaggacac ttggaaatgc atgtggaaag aggaaggtac 20220
agaaaagggc ccccggtccc tggtactgcc cgcatcacct gacagtcacc ttcggccagc 20280
ccacttgggc ttctcaggaa tgacaccccg gccctgcatc tggccctgag tcacgcacag 20340
gaggcagggt gagctcaccc gcccactgac tggcacagtc atagcaggct ccagggtggg 20400
gggcaggggc caggctgctg ccaaatggtt gtgctgagaa ccacccaggg tccaggtggc 20460
cctgcgccca aagataggtg ggcttggagt ccagcagcct gtgcccagag cctctgccat 20520
cctccacggc cggcctaggt gagatgtgca ggctatgggc ttggaaatga ggggagaatc 20580
cccttgccct cactccatcc atcgaggccg ggcaccaacc cttcctgggc cagctttcca 20640
gcccctggct ggctgctctg caggcactga atgccagctg cccccatccc catgccagtg 20700
ctctaaaatc agtgctctca aacaagggca gatggcgcag tggaagttct ggcaagaggg 20760
gactgtgagg ggaagtcctg gggtaggtgg gacagagagg actgcctggg aagggtgtag 20820
gggcagcacc tcctgggcat gaaaccatct gcagggcaca ggggccaggc ctgcctctgc 20880
atgcactgct tggccttgtg gctaaggcct gtgctttacc cagttctctg ggagcaggag 20940
cagtctttct gaggcctgcc ctcagccctg cccagggttc aaggatctct cctcagcatc 21000
attgctgctg ccaaaaccaa gaggctaccc accattcctc acccgcaact ctgccacgca 21060
gcaccgtctg cacagctgca gttggccaca tccacttgct tttaaatgtg ctgtcatttc 21120
ctggaaacca tccaggcctt gtagcctgcc ctctgcacct cctccccaag gggggcctct 21180
ggagcaagaa tccaagaggt gccctggcag ctgcaagtgt ccccagaaca tttcctctat 21240
gcatgaagga ctgaagccca gagggggaag ggacttagct gagaatcagt acccaggatc 21300
ctcctgccaa cgctgaagat ggtttgggtc tggcctgact ctgcaaagcc aagtaaagaa 21360
ccacggagtc agggagagtt gacagatgaa ggctttctcc acagcccaca agcactaagt 21420
ccagtccagg agccaggatg agcctcccag attatgcatg agaggacatt aagggctgtg 21480
tcctggacac tgaacagatg ctggaggagg agggaaaaga ggcttcctgg aggagatggc 21540
ttagaaccat agacctgccc tctgcctcat gcctcctcca tcatggagga tggttgtcca 21600
gtttctgttt gaaccccacc ccataccttg ccagggctct cactgccaga cacagaatag 21660
ggggctccct gggttcaaag tagagctcac ttctgtcccc tgggcttctc ctgactgttc 21720
cttgtgtgac ctgttcccac atctggatgg gctgcaggag ccagtgctgt ggggacagaa 21780
ggtctggagc tgcccgtgaa gggcagaatg ctgccctcag acccgcttcc tccctgtcct 21840
tgtctgtcca aggagaatga ggtctcactg gtggatttcg gactaccctg aggagctggc 21900
acctgaggga caaggccccc cacctgccca gctccagcct ctgatgaggg gtgggagaga 21960
gctacatgag gttgctaaga aagcctcccc tgaaggagac cacacagtgt gtgaggttgg 22020
agtctctagc agcgggttct gtgcccccag ggatagtctg gctgtccagg cactgctctt 22080
gatataaaca ccacctccta gttatgaaac catgcccatt ctgcctctct gtatggaaaa 22140
gagcatgggg ctggcccgtg gggtggtgtc cactttaggc cctgtgggag atcatgggaa 22200
cccacgcagt gggtcatagg ctctctcatt tactactcac atccactctg tgaagaagcg 22260
attatgatct ctcctctaga aactcgtaga gtcccatgtc tgccggcttc cagagcctgc 22320
actcctccac cttggcttgg ctttgctggg gctagaggag ctaggatgca cagcagctct 22380
gtgacccttt gtttgagagg aacaggaaaa ccacccttct ctctggccca ctgtgtcctc 22440
ttcctgccct gccatcccct tctgtgaatg ttagacccat gggagcagct ggtcagaggg 22500
gaccccggcc tggggcccct aaccctatgt agcctcagtc ttcccatcag gctctcagct 22560
cagcctgagt gttgaggccc cagtggctgc tctgggggcc tcctgagttt ctcatctgtg 22620
cccctccctc cctggcccag gtgaaggtgt ggttccagaa ccggaggaca aagtacaaac 22680
ggcagaagct ggaggaggaa gggcctgagt ccgagcagaa gaagaagggc tcccatcaca 22740
tcaaccggtg gcgcattgcc acgaagcagg ccaatgggga ggacatcgat gtcacctcca 22800
atgactaggg tgggcaacca caaacccacg agggcagagt gctgcttgct gctggccagg 22860
cccctgcgtg ggcccaagct ggactctggc cactccctgg ccaggctttg gggaggcctg 22920
gagtcatggc cccacagggc ttgaagcccg gggccgccat tgacagaggg acaagcaatg 22980
ggctggctga ggcctgggac cacttggcct tctcctcgga gagcctgcct gcctgggcgg 23040
gcccgcccgc caccgcagcc tcccagctgc tctccgtgtc tccaatctcc cttttgtttt 23100
gatgcatttc tgttttaatt tattttccag gcaccactgt agtttagtga tccccagtgt 23160
cccccttccc tatgggaata ataaaagtct ctctcttaat gacacgggca tccagctcca 23220
gccccagagc ctggggtggt agattccggc tctgagggcc agtgggggct ggtagagcaa 23280
acgcgttcag ggcctgggag cctggggtgg ggtactggtg gagggggtca agggtaattc 23340
attaactcct ctcttttgtt gggggaccct ggtctctacc tccagctcca cagcaggaga 23400
aacaggctag acatagggaa gggccatcct gtatcttgag ggaggacagg cccaggtctt 23460
tcttaacgta ttgagaggtg ggaatcaggc ccaggtagtt caatgggaga gggagagtgc 23520
ttccctctgc ctagagactc tggtggcttc tccagttgag gagaaaccag aggaaagggg 23580
aggattgggg tctgggggag ggaacaccat tcacaaaggc tgacggttcc agtccgaagt 23640
cgtgggccca ccaggatgct cacctgtcct tggagaaccg ctgggcaggt tgagactgca 23700
gagacagggc ttaaggctga gcctgcaacc agtccccagt gactcagggc ctcctcagcc 23760
caagaaagag caacgtgcca gggcccgctg agctcttgtg ttcacctgcc cttctgtttg 23820
tcccacttgt caggatgaag gtttcctgac aagcaaatct gcattcctaa gtctttccct 23880
tacgacatcc agacccctct ctttcttctt cacctcccat gtgctcatga aacctctgct 23940
ctttggcctc catgccacca ttctgccggt gctaatgaca gtcaccaacc acagtcactg 24000
gccaccccct tgtggccaaa ctcaaccact tcctgttggg ttcacctgct ccctgatctg 24060
ttggctatgc cctcctggat tctcccaccc cgctctgcct tcatttcggt agctctgact 24120
cctccttcag cctgagttca ttcagtgtga tccatgcctt gtcacctctg gccaccccca 24180
ggtcagtcct tgctctccct gactcctcat tatgtccttt gccttgtggg gatcacatcc 24240
acttccagga cttctctttg gctccctggc ctgtgtcttt agctgacctc tgctgagctg 24300
cagacccgtc aagccagctg cctgctccac cccctgcccc tcagcacctc aaagcccata 24360
catccacagc cggacgcacc tacccatctg tgcttctcca ggatcaccca cctcgacaaa 24420
cagcattaga catgtacaca gtttcccaag ctacaggaaa tctgggaatc ttcctcaagc 24480
ttcctctcct cttccccagc cccatccatt cccatctagt gggttgagtc tagactggct 24540
tcccaaccac acctccctaa tgcagcaccc cctacccccc tgcccagctc cctctgccac 24600
cggcctggcc tgggccctgc tcctctaggg aggtttctgt gaatgtcaag gatgaggtcc 24660
acttcaaagg aggccctcca tgttgcagct aggtttctct tccttgcacc caaacagggc 24720
agactcaccc ccttctgagc ccctttgccc catcttcttg ccttgctccc ggtacccttt 24780
gcttcagcat ccccatccct gtccctgagt gagccacagg ttttccctgt gctgtgcctt 24840
cgctcatgct gttcttccca cctggaatgt cgggtgcttg atcaatgtgg aactcactgg 24900
aaagatgtca gagacccagc cttgctgtct gggccacatg cagggatcca agcacacaag 24960
gtccttctgc tgggagcaca gacccaggtc ccactcgcac tctcagcgtc tctctcccac 25020
ctctgcccac ctcacttgtg tccagtcagt gctagaaacc aaagggcttt gtcccatccc 25080
aacaccccct ctccctccat cagtcaggaa tgcattctgc acatcttgaa agtcctaaca 25140
tggataagtc cagattaacc cacatggcga ccctcactgc caagcaggtg ggatcacttc 25200
tgggagcaca catgcccagg tgtggaagga aggtgggagg aagagtcatc cttttggccc 25260
cagtggggga cagagaaagg ggtgagctgt tcctctcaag atcctgcctc acttggtagg 25320
gggagggggt ccaggaagat cacagcagag caccccctgt catccgaata aagggctgga 25380
agggacccaa ggaaacctgc cagtctcccg aggccaggcc tgcggggggc ggggcgggga 25440
gtccctgccg cactcccatc caccccccat gttgtgcctc tccctgcaga cggtaaatat 25500
tggtgttgtg acttcattaa taaaggcttc tgtgagcctg aaaaa 25545
<210> 50
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer1 (EMX1)
<400> 50
gggcttctcc tgactgttcc ttgtgtgacc 30
<210> 51
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer2 (EMX1)
<400> 51
caggatggcc cttccctatg tctagcctgt 30
<210> 52
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> NLS (protein)
<400> 52
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 53
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> NLS (nucleotide)
<400> 53
cccaagaaga agcggaaggt g 21
<210> 54
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> BPNLS (protein)
<400> 54
Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg
1 5 10 15
Lys Val Glu
<210> 55
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> BPNLS (nucleotide)
<400> 55
aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaa 57
<210> 56
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> BPNLS insert upper
<400> 56
agatcttaat acgactcact atagggagag ccgccaccat ggcc 44
<210> 57
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<223> BPNLS insert lower
<400> 57
taatatcctc gag 13
<210> 58
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> 2A (protein)
<400> 58
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 59
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 2A (nucleotide Cse1-Cse2)
<400> 59
ggaagcggag caaccaactt cagcctgctg aagcaggccg gcgatgtgga ggagaatcca 60
ggcccc 66
<210> 60
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 2A(nucleotide Cse2-Cas7)
<400> 60
ggctccggcg ccaccaattt ttctctgctg aagcaggcag gcgatgtgga ggagaaccca 60
ggacct 66
<210> 61
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 2A(nucleotide Cas7-Cas5)
<400> 61
ggatctggag ccaccaattt cagcctgctg aagcaagcag gcgacgtgga agaaaaccca 60
ggacca 66
<210> 62
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> 2A(nucleotide Cas5-Cas6)
<400> 62
ggatctgggg ctactaattt ttctctgctg aagcaagccg gcgacgtgga agagaatcca 60
ggaccg 66
<210> 63
<211> 176
<212> DNA
<213> Artificial Sequence
<220>
<223> pre-crRNA(LRSR)
<400> 63
tggatgtgtt gtttgtgtga tactataaag ttggtagatt gtgactggct taaaaaatca 60
ttaattaata ataggttatg tttagagtgt tccccgcgcc agcggggata aaccgcaggc 120
caatggggag gacatcgatg tcacctcgtg ttccccgcgc cagcggggat aaaccg 176
<210> 64
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> pre-crRNA(RSR)
<400> 64
gtgttccccg cgccagcggg gataaaccgc aggccaatgg ggaggacatc gatgtcacct 60
cgtgttcccc gcgccagcgg ggataaaccg 90
<210> 65
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> mature crRNA
<400> 65
ataaaccgca ggccaatggg gaggacatcg atgtcacctc gtgttccccg cgccagcggg 60
g 61
Claims (11)
- DNA가 편집된 진핵 세포를 제조하는 방법으로서, 진핵 세포에 CRISPR-Cas3 시스템을 도입하는 것을 포함하고, CRISPR-Cas3 시스템이 이하의 (A) 내지 (C)를 포함하는 방법.
(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터,
(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및
(C) crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터 - DNA가 편집된 동물(단 인간을 제외함) 또는 식물을 제조하는 방법으로서, 동물(단 인간을 제외함) 또는 식물에 CRISPR-Cas3 시스템을 도입하는 것을 포함하고, CRISPR-Cas3 시스템이 이하의 (A) 내지 (C)를 포함하는 방법.
(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터,
(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및
(C) crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터 - 제1항 또는 제2항에 있어서, 진핵 세포에 CRISPR-Cas3 시스템을 도입한 후에, 캐스케이드 단백질을 구성하는 단백질에 의해 crRNA가 절단되는 공정을 포함하는, 방법.
- 제1항 또는 제2항에 있어서, crRNA가 프리 crRNA인, 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, Cas3 단백질 및/또는 캐스케이드 단백질에 핵 이행 시그널이 부가되어 있는, 방법.
- 제5항에 있어서, 핵 이행 시그널이 바이파타이트(bipartite) 핵 이행 시그널인, 방법.
- 이하의 (A) 및 (B)를 포함하는, 제1항 내지 제6항 중 어느 한 항에 기재된 방법에 사용하기 위한 키트.
(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및
(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터 - 제7항에 있어서, crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터를 더 포함하는, 키트.
- 제8항에 있어서, crRNA가 프리 crRNA인, 키트.
- 제7항 내지 제9항 중 어느 한 항에 있어서, Cas3 단백질 및/또는 캐스케이드 단백질에 핵 이행 시그널이 부가되어 있는, 키트.
- 제10항에 있어서, 핵 이행 시그널이 바이파타이트 핵 이행 시그널인, 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017113747 | 2017-06-08 | ||
JPJP-P-2017-113747 | 2017-06-08 | ||
PCT/JP2018/022066 WO2018225858A1 (ja) | 2017-06-08 | 2018-06-08 | Dnaが編集された真核細胞を製造する方法、および当該方法に用いられるキット |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200015700A true KR20200015700A (ko) | 2020-02-12 |
KR102541398B1 KR102541398B1 (ko) | 2023-06-07 |
Family
ID=64566087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207000115A KR102541398B1 (ko) | 2017-06-08 | 2018-06-08 | Dna가 편집된 진핵 세포를 제조하는 방법 및 당해 방법에 사용되는 키트 |
Country Status (14)
Country | Link |
---|---|
US (3) | US11807869B2 (ko) |
EP (2) | EP3636753B1 (ko) |
JP (6) | JP6480647B1 (ko) |
KR (1) | KR102541398B1 (ko) |
CN (2) | CN110770342B (ko) |
AU (1) | AU2018279457B2 (ko) |
BR (1) | BR112019025717A2 (ko) |
CA (1) | CA3066599A1 (ko) |
DK (1) | DK3636753T3 (ko) |
EA (1) | EA201992795A1 (ko) |
FI (1) | FI3636753T3 (ko) |
MX (1) | MX2019014497A (ko) |
PT (1) | PT3636753T (ko) |
WO (1) | WO2018225858A1 (ko) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11807869B2 (en) | 2017-06-08 | 2023-11-07 | Osaka University | Method for producing DNA-edited eukaryotic cell, and kit used in the same |
AU2018321021B2 (en) * | 2017-08-21 | 2022-10-06 | Tokushima University | Target sequence specific alteration technology using nucleotide target recognition |
BR112020019301A2 (pt) | 2018-03-26 | 2021-01-05 | National University Corporation Kobe University | Método para modificar um sítio alvo de um dna de fita dupla de uma célula. |
WO2020122104A1 (ja) * | 2018-12-11 | 2020-06-18 | 国立大学法人京都大学 | ゲノムdnaに欠失を誘導する方法 |
US10947534B2 (en) * | 2019-03-07 | 2021-03-16 | The Trustees Of Columbia University In The City Of New York | RNA-guided DNA integration using Tn7-like transposons |
JP7489112B2 (ja) | 2019-03-14 | 2024-05-23 | 国立大学法人徳島大学 | Crisprタイプi-dシステムを利用した標的配列改変技術 |
CN113646429A (zh) | 2019-04-05 | 2021-11-12 | 国立大学法人大阪大学 | 敲入细胞的制作方法 |
JP2023507566A (ja) * | 2019-12-18 | 2023-02-24 | インスクリプタ, インコーポレイテッド | 核酸誘導ヌクレアーゼ編集済み細胞のin vivo検出のためのカスケード/dCas3相補性アッセイ |
CN115003825A (zh) | 2020-01-24 | 2022-09-02 | C4U株式会社 | 检测试样中的特定dna的方法 |
WO2021251493A1 (ja) * | 2020-06-12 | 2021-12-16 | 国立研究開発法人産業技術総合研究所 | 卵白タンパク質遺伝子における目的タンパク質をコードする遺伝子がノックインされた家禽細胞またはその製造方法 |
EP4242237A1 (en) | 2020-11-06 | 2023-09-13 | Editforce, Inc. | Foki nuclease domain variant |
WO2022186063A1 (ja) | 2021-03-01 | 2022-09-09 | C4U株式会社 | Cas3タンパク質を製造する方法 |
WO2022251465A1 (en) * | 2021-05-26 | 2022-12-01 | The Regents Of The University Of Michigan | Crispr-cas3 systems for targeted genome engineering |
CN113549650B (zh) * | 2021-07-05 | 2023-05-09 | 天津协和生物科技开发有限公司 | 一种CRISPR-SaCas9基因编辑系统及其应用 |
CN115595330A (zh) * | 2021-07-12 | 2023-01-13 | 中国科学院微生物研究所(Cn) | 一种CRISPR-Cas3系统及其在抗植物病毒方面的应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015503535A (ja) | 2011-12-30 | 2015-02-02 | ヴァーヘニンヘン ウニフェルジテイト | 改変されたcascadeリボ核タンパク質およびそれらの用途 |
WO2017043573A1 (ja) * | 2015-09-09 | 2017-03-16 | 国立大学法人神戸大学 | 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体 |
WO2017066497A2 (en) * | 2015-10-13 | 2017-04-20 | Duke University | Genome engineering with type i crispr systems in eukaryotic cells |
JP2017512481A (ja) | 2014-04-08 | 2017-05-25 | ノースカロライナ ステート ユニバーシティーNorth Carolina State University | Crispr関連遺伝子を用いた、rna依存性の転写抑制のための方法および組成物 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3252160B1 (en) * | 2012-12-12 | 2020-10-28 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
WO2016205613A1 (en) * | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Crispr enzyme mutations reducing off-target effects |
US20190323038A1 (en) * | 2016-06-17 | 2019-10-24 | Montana State Univesity | Bidirectional targeting for genome editing |
US11807869B2 (en) | 2017-06-08 | 2023-11-07 | Osaka University | Method for producing DNA-edited eukaryotic cell, and kit used in the same |
AU2018321021B2 (en) * | 2017-08-21 | 2022-10-06 | Tokushima University | Target sequence specific alteration technology using nucleotide target recognition |
CN107557378A (zh) | 2017-09-19 | 2018-01-09 | 安徽大学 | 一种基于I型CRISPR‑Cas系统中基因cas7‑3的真核基因编辑方法 |
CN107557373A (zh) | 2017-09-19 | 2018-01-09 | 安徽大学 | 一种基于I‑B型CRISPR‑Cas系统基因cas3的基因编辑方法 |
CN113528408B (zh) * | 2021-06-08 | 2022-03-01 | 湖北大学 | 一种基于CRISPR-nCas3系统的高效基因组大片段删除方法及应用 |
-
2018
- 2018-06-08 US US16/611,308 patent/US11807869B2/en active Active
- 2018-06-08 FI FIEP18812837.5T patent/FI3636753T3/fi active
- 2018-06-08 PT PT188128375T patent/PT3636753T/pt unknown
- 2018-06-08 EA EA201992795A patent/EA201992795A1/ru unknown
- 2018-06-08 CN CN201880037636.XA patent/CN110770342B/zh active Active
- 2018-06-08 AU AU2018279457A patent/AU2018279457B2/en active Active
- 2018-06-08 MX MX2019014497A patent/MX2019014497A/es unknown
- 2018-06-08 EP EP18812837.5A patent/EP3636753B1/en active Active
- 2018-06-08 DK DK18812837.5T patent/DK3636753T3/da active
- 2018-06-08 EP EP24158618.9A patent/EP4349973A2/en active Pending
- 2018-06-08 JP JP2018554598A patent/JP6480647B1/ja active Active
- 2018-06-08 BR BR112019025717-9A patent/BR112019025717A2/pt unknown
- 2018-06-08 WO PCT/JP2018/022066 patent/WO2018225858A1/ja unknown
- 2018-06-08 CA CA3066599A patent/CA3066599A1/en active Pending
- 2018-06-08 CN CN202311603183.1A patent/CN117778466A/zh active Pending
- 2018-06-08 KR KR1020207000115A patent/KR102541398B1/ko active IP Right Grant
-
2019
- 2019-01-31 JP JP2019015315A patent/JP2019062921A/ja active Pending
- 2019-01-31 JP JP2019015318A patent/JP2019062922A/ja active Pending
- 2019-01-31 JP JP2019015319A patent/JP7301332B2/ja active Active
-
2023
- 2023-02-21 JP JP2023025086A patent/JP7430358B2/ja active Active
- 2023-09-14 US US18/467,356 patent/US20240117381A1/en active Pending
- 2023-09-14 US US18/467,297 patent/US20240124898A1/en active Pending
-
2024
- 2024-01-26 JP JP2024010099A patent/JP2024028649A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015503535A (ja) | 2011-12-30 | 2015-02-02 | ヴァーヘニンヘン ウニフェルジテイト | 改変されたcascadeリボ核タンパク質およびそれらの用途 |
JP2017512481A (ja) | 2014-04-08 | 2017-05-25 | ノースカロライナ ステート ユニバーシティーNorth Carolina State University | Crispr関連遺伝子を用いた、rna依存性の転写抑制のための方法および組成物 |
WO2017043573A1 (ja) * | 2015-09-09 | 2017-03-16 | 国立大学法人神戸大学 | 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体 |
WO2017066497A2 (en) * | 2015-10-13 | 2017-04-20 | Duke University | Genome engineering with type i crispr systems in eukaryotic cells |
Non-Patent Citations (4)
Title |
---|
Ahmed A. Gomaa et al. (2014) Programmable Reomoval of Bacterial Strains by Use of Genome Targeting CRISPR-Cas Systems, mbio. asm. org, Volume 5, Issue 1, e00928-13 |
Jinek M et al. (2012) A Programmable Dual-RNA Guided DNA Endonuclease in Adaptive Bacterial Immunity, Science, Vol.337(Issue 6096), pp.816-821 |
Mulepati S & Bailey S (2013) In Vitro Reconstitution of an Escherichia coli RNA-guided Immune System Reveals Unidirectional, ATP-dependent Degradation of DNA Target, Journal of Biological Chemistry, Vol.288(No.31), pp.22184-22192 |
Nature, 2016, vol. 540, pp.144-149 * |
Also Published As
Publication number | Publication date |
---|---|
AU2018279457A1 (en) | 2019-12-05 |
CN117778466A (zh) | 2024-03-29 |
JP2019062922A (ja) | 2019-04-25 |
JPWO2018225858A1 (ja) | 2019-06-27 |
US20200102580A1 (en) | 2020-04-02 |
EP3636753B1 (en) | 2024-04-03 |
JP2019062921A (ja) | 2019-04-25 |
JP7430358B2 (ja) | 2024-02-13 |
JP7301332B2 (ja) | 2023-07-03 |
CA3066599A1 (en) | 2018-12-13 |
JP2019062923A (ja) | 2019-04-25 |
EA201992795A1 (ru) | 2020-04-21 |
KR102541398B1 (ko) | 2023-06-07 |
US20240124898A1 (en) | 2024-04-18 |
DK3636753T3 (da) | 2024-05-06 |
WO2018225858A1 (ja) | 2018-12-13 |
JP2023054185A (ja) | 2023-04-13 |
BR112019025717A2 (pt) | 2020-09-01 |
PT3636753T (pt) | 2024-04-23 |
FI3636753T3 (fi) | 2024-05-03 |
EP3636753A1 (en) | 2020-04-15 |
US20240117381A1 (en) | 2024-04-11 |
CN110770342A (zh) | 2020-02-07 |
US11807869B2 (en) | 2023-11-07 |
AU2018279457B2 (en) | 2024-02-15 |
CN110770342B (zh) | 2023-11-17 |
EP3636753A4 (en) | 2021-03-31 |
JP2024028649A (ja) | 2024-03-04 |
MX2019014497A (es) | 2020-10-12 |
EP4349973A2 (en) | 2024-04-10 |
JP6480647B1 (ja) | 2019-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102541398B1 (ko) | Dna가 편집된 진핵 세포를 제조하는 방법 및 당해 방법에 사용되는 키트 | |
KR102386029B1 (ko) | 게놈 편집 면역 효과기 세포 | |
AU2019204429B2 (en) | Modified hematopoietic stem/progenitor and non-T effector cells, and uses thereof | |
KR102451510B1 (ko) | Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법 | |
AU2011266843C9 (en) | Animal models and therapeutic molecules | |
KR101982360B1 (ko) | 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도 | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
JP2023082141A (ja) | CasZ組成物及び使用方法 | |
AU2016337408A1 (en) | Inducible modification of a cell genome | |
CN110856724B (zh) | 包含核酸及car修饰的免疫细胞的治疗剂及其应用 | |
KR20200032174A (ko) | 강화된 키메라 항원 수용체 및 이의 용도 | |
CN108289933B (zh) | 作为认知和行为障碍药物的哺乳动物Klotho的分泌型剪接变体 | |
CN106661573B (zh) | 多核苷酸文库的重组酶介导的整合 | |
KR101961667B1 (ko) | 돼지유행성설사병 바이러스에 내성을 가지는 형질전환 복제돼지 및 이의 제조방법 | |
CN110785179A (zh) | Wiskott-Aldrich综合征和X连锁血小板减少症中的治疗性基因组编辑 | |
CN111621522A (zh) | 一种培育肠道特异性表达红色荧光转基因斑马鱼的方法 | |
CN107072183B (zh) | 消除种系细胞的nanos敲除 | |
CN115190912A (zh) | Rna指导核酸酶及其活性片段与变体以及使用方法 | |
KR20240001708A (ko) | 유전적 장애의 치료를 위해 생체내 뉴클레아제-매개의 유전자 표적화를 위한 조성물 및 방법 | |
US20040197317A1 (en) | Persistent expression of candidate molecule in proliferating stem and progenitor cells for delivery of therapeutic products | |
KR102143644B1 (ko) | 웅성불임유발 방법 | |
CN109082442B (zh) | 一种可解除免疫抑制并增强肿瘤靶向性杀伤的间充质干细胞的制备方法 | |
US20200017917A1 (en) | Mapping a Functional Cancer Genome Atlas of Tumor Suppressors Using AAV-CRISPR Mediated Direct In Vivo Screening | |
CN108949690B (zh) | 一种制备可实时检测间充质干细胞骨分化的细胞模型的方法 | |
CN113667017A (zh) | 一种可提高CRISPR/Cas9系统同源重组效率的方法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |