CN114591949A - 一种检测细胞内源性低丰度基因和lncRNA水平的方法 - Google Patents
一种检测细胞内源性低丰度基因和lncRNA水平的方法 Download PDFInfo
- Publication number
- CN114591949A CN114591949A CN202011409199.5A CN202011409199A CN114591949A CN 114591949 A CN114591949 A CN 114591949A CN 202011409199 A CN202011409199 A CN 202011409199A CN 114591949 A CN114591949 A CN 114591949A
- Authority
- CN
- China
- Prior art keywords
- artificial sequence
- sgrna
- dna
- endogenous
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 title claims abstract description 32
- 108020005198 Long Noncoding RNA Proteins 0.000 title description 2
- 230000014509 gene expression Effects 0.000 claims abstract description 114
- 108091027544 Subgenomic mRNA Proteins 0.000 claims abstract description 107
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 51
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 51
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 51
- 108091046869 Telomeric non-coding RNA Proteins 0.000 claims abstract description 42
- 238000001514 detection method Methods 0.000 claims abstract description 34
- 102000004169 proteins and genes Human genes 0.000 claims description 19
- 108020005345 3' Untranslated Regions Proteins 0.000 claims description 18
- 230000001413 cellular effect Effects 0.000 claims description 18
- 108700008625 Reporter Genes Proteins 0.000 claims description 15
- 230000008685 targeting Effects 0.000 claims description 13
- 108020004566 Transfer RNA Proteins 0.000 claims description 12
- 101100447432 Danio rerio gapdh-2 gene Proteins 0.000 claims description 10
- 101150112014 Gapdh gene Proteins 0.000 claims description 10
- 150000001875 compounds Chemical class 0.000 claims description 7
- 108091006106 transcriptional activators Proteins 0.000 claims description 7
- 238000011144 upstream manufacturing Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 5
- 108020005004 Guide RNA Proteins 0.000 claims description 4
- 108091036066 Three prime untranslated region Proteins 0.000 claims description 4
- 230000008519 endogenous mechanism Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000003556 assay Methods 0.000 claims description 3
- 125000006850 spacer group Chemical group 0.000 claims description 3
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 11
- 230000002068 genetic effect Effects 0.000 abstract description 8
- 230000008569 process Effects 0.000 abstract description 6
- 230000003915 cell function Effects 0.000 abstract description 3
- 230000002103 transcriptional effect Effects 0.000 abstract description 3
- 238000004519 manufacturing process Methods 0.000 abstract description 2
- 239000002131 composite material Substances 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 166
- 210000004027 cell Anatomy 0.000 description 59
- 238000003780 insertion Methods 0.000 description 20
- 230000037431 insertion Effects 0.000 description 20
- 239000002243 precursor Substances 0.000 description 19
- 239000002773 nucleotide Substances 0.000 description 15
- 125000003729 nucleotide group Chemical group 0.000 description 15
- 238000011529 RT qPCR Methods 0.000 description 13
- 230000004069 differentiation Effects 0.000 description 12
- 238000003491 array Methods 0.000 description 11
- 101150087690 ACTB gene Proteins 0.000 description 10
- 239000012190 activator Substances 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- -1 Nanog Proteins 0.000 description 6
- 108700023707 TUG1 Proteins 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 108091006047 fluorescent proteins Proteins 0.000 description 6
- 102000034287 fluorescent proteins Human genes 0.000 description 6
- 108700039887 Essential Genes Proteins 0.000 description 5
- 108091007767 MALAT1 Proteins 0.000 description 5
- 230000024245 cell differentiation Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- 101150099612 Esrrb gene Proteins 0.000 description 4
- 102100038554 Neurogenin-2 Human genes 0.000 description 4
- 101100247004 Rattus norvegicus Qsox1 gene Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 101100516508 Mus musculus Neurog2 gene Proteins 0.000 description 3
- 108091093018 PVT1 Proteins 0.000 description 3
- 101150026222 TUBB3 gene Proteins 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 230000031018 biological processes and functions Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 108091027963 non-coding RNA Proteins 0.000 description 3
- 102000042567 non-coding RNA Human genes 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 2
- 101100237015 Caenorhabditis elegans let-49 gene Proteins 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 241001123946 Gaga Species 0.000 description 2
- 101150113031 Jag1 gene Proteins 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 239000005089 Luciferase Substances 0.000 description 2
- 101100013967 Mus musculus Gata3 gene Proteins 0.000 description 2
- 101100183449 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) med-7 gene Proteins 0.000 description 2
- 101150079815 Sema3a gene Proteins 0.000 description 2
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 2
- 101150111019 Tbx3 gene Proteins 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 101150010353 Ascl1 gene Proteins 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 101100223219 Borrelia burgdorferi (strain ATCC 35210 / B31 / CIP 102532 / DSM 4680) hup gene Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 238000009007 Diagnostic Kit Methods 0.000 description 1
- 101100361074 Drosophila melanogaster RNaseZ gene Proteins 0.000 description 1
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 1
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 1
- 101150013707 HBB gene Proteins 0.000 description 1
- 102100032606 Heat shock factor protein 1 Human genes 0.000 description 1
- 101000867525 Homo sapiens Heat shock factor protein 1 Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 101100512909 Leuconostoc mesenteroides mesC gene Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 102000002150 RNase Z Human genes 0.000 description 1
- 108010001294 RNase Z Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 102000004167 Ribonuclease P Human genes 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 230000005966 endogenous activation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 210000002304 esc Anatomy 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000005155 neural progenitor cell Anatomy 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 238000011870 unpaired t-test Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6428—Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- Optics & Photonics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Analytical Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了。具体地,本发明提供了一种sgRNA响应型启动子以及包含所述sgRNA响应型启动子的用于检测细胞内源核酸的检测体系,以及相应的检测方法。利用本发明检测体系或方法可以可靠地检测到细胞内表达水平非常低的基因内源基因;并且还可以在活细胞中监控通常低表达的长非编码RNA(lncRNA)的转录活性。此外,本发明的方法能够放大内源信号以可视化细胞中低丰度基因和lncRNA表达的动态过程,提供了强大的平台来检测内源性遗传元件的活动和其潜在的细胞功能。
Description
技术领域
本发明属于生物技术领域,具体涉及一种检测细胞内源性低丰度基因和lncRNA水平的方法。
背景技术
检测内源信号并精确控制自然环境中的基因通路,以及精确操纵遗传信息对理解生物学过程以及确定生物体基本的生物学设计原则并实现在不同系统中更高的水平的调控至关重要。
以前的研究已经开发出了一系列遗传开关,用作传感器或实施其他功能。但是,这些策略主要受到处理内源信号的能力的限制。单向导RNA(sgRNA),类似于一个GPS可以将Cas核酸酶直接导向目标的的基因组位点,具有特异性,效率和多功能性。尽管各种诱导性sgRNA已经被开发用来接收活细胞中的内源信号,但这些方法只能显示出对小RNA的反应。通常检测内源基因活性的常规方法依靠将荧光蛋白精确插入蛋白编码框中。然而,对于以低丰度转录的基因,现有的方法并不适用,当前用于处理内源信息的工具非常有限。
此外,目前越来越多的证据表明长非编码RNA(lncRNA)在各种生物学过程中起重要作用。但是,lncRNA的功能注释极具有挑战性,因为它们不可翻译并且与编码RNA相比,它们通常表达水平较低。
因此,本领域迫切需要开发一种能够高效检测细胞内源的低丰度基因和lncRNA表达水平的广谱性的方法。
发明内容
本发明的目的就是提供一种能够高效检测细胞内源的低丰度基因和lncRNA表达水平的广谱性的方法。
在本发明的第一方面,提供了一种sgRNA响应型启动子,所述启动子能够响应于上游的由内源转录本控制表达的sgRNA,dCas9和转录激活因子所形成的复合物,并启动下游报告基因的表达。
在另一优选例中,所述的sgRNA响应型启动子是微型启动子。
在另一优选例中,所述的sgRNA响应型启动子是miniCMV启动子。
在另一优选例中,所述dCas9是dSpCas9蛋白。
在另一优选例中,所述的下游报告基因是编码报告蛋白的基因序列。
在另一优选例中,所述的报告蛋白包括荧光蛋白、荧光素酶(如:Luciferase),或任何可以用来作为报告指示的信号原件。
在另一优选例中,所述荧光蛋白选自下组:mCherry蛋白、GFP蛋白、ZsGreen,或其组合。
在另一优选例中,所述荧光蛋白为mCherry蛋白。
在本发明的第二方面,提供了一种细胞内源核酸的检测体系,包括:
(a)目标核酸编辑模块,包括:靶向报告系统目标核酸的sgRNA、tRNA;
其中,所述的目标核酸编辑模块中包括如式I所示的结构,
L1-(tRNA-sgRNA)n-tRNA-R1 (式I)
式中,
L1是5’端的同源臂;
R1是3’端的同源臂;
tRNA是能成功释放出有功能的sgRNA内源机制;
sgRNA是向导RNA;
n是≥1的正整数,优选地2≤n≤10;和
(b)目标核酸报告模块,包括:一报告核酸构建物、dCas蛋白、转录激活因子;
其中,所述的报告核酸构建物具有如式II所示的结构,
(TS-I)m-TS-P1-Z2 (式II)
式中,
TS是所述sgRNA的结合靶位点;
m是≥0的正整数,优选地2≤m≤4;
I是TS之间的间隔序列;
P1是如本发明第一方面所述的sgRNA响应型启动子;
Z2是报告基因序列。
在另一优选例中,所述细胞内源核酸包括细胞内源基因或长非编码RNA(lncRNA)。
在另一优选例中,所述的细胞内源基因可以是细胞内源低丰度基因。
在另一优选例中,所述的细胞内源低丰度基因是指当以Gapdh内参基因做相对定量时,在细胞内表达量<0.001的基因。
在另一优选例中,所述的细胞内源基因可选自下组:Ascl1、Neurog2、Lmx1b、Nkx2-2、Gata3、Hbb、Tubb3、Actb、Nanog、Esrrb、Sox2、Tet1、Neurog2、Lncenc1、Med7、Tert、Jag1、Slc7a11、Dancr、Firre、Pvt1、Tunar、Miat、或其组合。
在另一优选例中,当以Gapdh内参基因做相对定量时,所述的lncRNA在细胞内的表达量<0.001。
在另一优选例中,6≤n≤8。
在另一优选例中,所述(a)中的sgRNA靶向于所述目标核酸的3’端未翻译区域(3’UTR)。
在另一优选例中,所述tRNA能够被内切酶RNaseP和RNaseZ精确切割。
在另一优选例中,所述tRNA的核苷酸序列如SEQ ID NO:143(AACAAAGCACCAGTGGTCTAGTGGTAGAATAGTACCCTGCCACGGTACAGACCCGGGTTCGATTCCCGGCTGGTGCA)所示。
在另一优选例中,所述L1的长度为15-50bp,较佳地25-45bp,更佳地35bp。
在另一优选例中,所述R1的长度为15-50bp,较佳地25-45bp,更佳地35bp。
在另一优选例中,所述(a)中的核酸同源重组酶选自下组:SaKKHCas9、SaCas9。
在另一优选例中,所述(a)中的核酸内切酶选自下组:tRNA、核糖体(Ribosome),或其组合。
在另一优选例中,所述sgRNA的核苷酸序列如SEQ ID NO:1-49或50-61或62-88中任一所示。
在另一优选例中,当待检测的细胞内源基因为Ascl1时,所述sgRNA的核苷酸序列如SEQ ID NO:50或51所示。
在另一优选例中,当待检测的细胞内源基因为Neurog2时,所述sgRNA的核苷酸序列如SEQ ID NO:52或53所示。
在另一优选例中,当待检测的细胞内源基因为Lmx1b时,所述sgRNA的核苷酸序列如SEQ ID NO:54或55所示。
在另一优选例中,当待检测的细胞内源基因为Nkx2-2时,所述sgRNA的核苷酸序列如SEQ ID NO:56或57所示。
在另一优选例中,当待检测的细胞内源基因为Gata3时,所述sgRNA的核苷酸序列如SEQ ID NO:58或59所示。
在另一优选例中,当待检测的细胞内源基因为Hbb时,所述sgRNA的核苷酸序列如SEQ ID NO:60所示。
在另一优选例中,当待检测的细胞内源基因为LacZ时,所述sgRNA的核苷酸序列如SEQ ID NO:61所示。
在另一优选例中,所述目标核酸编辑模块中包括如SEQ ID NO:165或166所示的核苷酸序列。
在另一优选例中,1≤m≤3,更佳地m=2(即式II中具有3个TS)。
在另一优选例中,所述dCas9是dSpCas9蛋白。
在另一优选例中,所述的转录激活因子选自下组:HSF1、P65,或其组合。
在另一优选例中,所述的I的长度为0-100bp,较佳地为15-50bp,更佳地为30-40bp,最佳地为35bp。
在另一优选例中,所述sgRNA响应型启动子P1为miniCMV,其核苷酸序列如SEQ IDNO:144(TAGGCGTGTACGGTGGGAGGCCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGC)所示。
在另一优选例中,所述的报告基因为编码mCherry的序列,并且所述的报告基因序列Z的核苷酸序列如SEQ ID NO:145(ATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAA)所示。
在另一优选例中,所述式II中的(TS-I)m-TS-P1部分的核苷酸序列如SEQ ID NO:151-160中任一所示;优选地为SEQ ID NO:159。
在另一优选例中,所述报告核酸构建物的核苷酸序列如SEQ ID NO:150或162所示。
在另一优选例中,所述目标核酸报告模块中的dCas蛋白和转录激活因子的表达受同一启动子P2调控。
在另一优选例中,所述的启动子P2是CAG启动子。
在另一优选例中,所述目标核酸报告模块中包含用于表达dCas蛋白和转录激活因子的编码序列及其调控序列,其序列如SEQ ID NO:146或161所示。
在本发明的第三方面,提供了一种用于检测细胞内源核酸的试剂盒,包括如本发明第二方面所述的检测体系。
在另一优选例中,所述试剂盒中还包括用于检测目标核酸报告模块中的报告基因或其编码产物的试剂。
在另一优选例中,所述试剂盒中还包括用于检测所述细胞中的管家基因或内参基因的检测体系,其相应的目标核酸编辑模块中包含靶向所述管家基因或内参基因的3’UTR区域的sgRNA前体。
在另一优选例中,所述的管家基因或内参基因为Gapdh。
在本发明的第四方面,提供了一种检测细胞样本中是否存在目标内源核酸的方法,包括步骤:
(i)将如本发明第二方面所述的检测体系引入待检测细胞样本中;和
(ii)检测所述检测体系中的检测目标核酸报告模块中的报告基因或其编码产物的水平。
在另一优选例中,所述的方法包括定性检测和定量检测。
在另一优选例中,所述的方法包括动态检测细胞样本中的目标内源核酸的水平。
在另一优选例中,所述的方法是非诊断性的和/或非治疗性的。
在本发明的第五方面,提供了如本发明第一方面所述的sgRNA响应型启动子或如本发明第二方面所述的检测体系的用途,其特征在于,用于制备一试剂盒,所述的试剂盒用于检测细胞内源核酸。
在另一优选例中,所述的试剂盒是疾病诊断试剂盒,所述的疾病为细胞内源核酸表达异常相关的疾病。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了开发通过内源性启动子直接驱动sgRNA的内源性开关的过程和结果。
a.示意图显示了内源性启动子表达sgRNA。sgRNA前体是通过SaKKHCas9介导的同源介导的末端连接(HMEJ,800bp同源臂)或同源重组(HR,800bp同源臂),靶向插入内源基因的转录区域。而sgRNA(橙色)的两侧(紫色)
转录后被内源加工机制识别切割。sgRNA前体在内源性启动子驱动下随着基因转录一起转录,然后由内源性切割程序形成成熟的sgRNA。
b.不同mini启动子诱导的平均mCherry荧光强度,每组n=3次重复
c.miniCMV启动子上游两个sgRNA靶向位点(TS)之间的不同间隔长度的平均mCherry荧光强度,每组n=3次重复
d.sgRNA TS拷贝数对荧光强度的影响,每组n=3次重复
e.SPH-OminiCMV和不同常用启动子诱导的mCherry表达,每组n=3次重复
f.示意图,显示用于产生SPH-OminiCMV转基因mESC细胞系的载体和不同sgRNA释放系统的设计。首先是SPH-OminiCMV mESC示意图,然后是三个不同的sgRNA前体(三个sgRNAmiR30,自动剪接和tRNA,包含一个靶向mCherry的sgRNA)插入Actb的内含子,每组n=3次重复
g.均值mCherry不同释放策略诱导的表达强度,每n=3次重复组。
h.mCherry阳性细胞百分比,每组n=3次重复
i.示意图显示sgRNA前体在Nanog基因座中的插入位点。
j.mCherry的平均荧光强度,表明tRNA-sgRNA-tRNA在不同内含子中诱导不同水平的mCherry,坐标轴上的数字中的表示每组的细胞克隆数。
k.代表western blot.
i.Western blots定量数据显示插入内含子或3’UTR中的tRNA-sgRNA-tRNA不会影响Nanog蛋白的表达,每组n=3次重复。
所有值均以平均值±标准误差表示;未配对的t检验;*p<0.05,**p<0.01,***p<0.001。
图2显示了SPH-OminiCMV-Ents可以跟踪分化过程中低丰度的基因。
a.示意图显示SPH-OminiCMV-Ents策略检测内源基因表达的方法。将靶向mCherry的sgRNA前体插入到内源基因3‘UTR,sgRNA随着内源基因转录一起释放。
SPH-sgRNA复合物与OminiCMV的上游结合,从而导致mCherry的表达。
b.代表性图像显示由tRNA-sgRNA-tRNA或P2A-mCherry的mCherry表达。
c.在不同mESC细胞系中SPH-OminiCMV-Ents(红色三角形)和P2A-mCherry(绿色菱形)的mCherry强度和qPCR分析mESCs中不同基因的表达水平(紫色圆圈,紫色y轴)。将P2A-mCherry或tRNA-sgRNA-tRNA靶向插入每个基因的3’UTR。
d.代表性图像显示在分化的过程中SPH-OminiCMV-Ents-Actb和Actb-P2A-mCherry mESC细胞系中mCherry的表达。
e.通过qPCR定量Actb mRNA水平。将数据归一化至第0天。
f.代表性图像显示在分化的的过程中SPH-OminiCMV-Nanog和Nanog-P2A-mCherrymESC细胞系中mCherry的表达。
g.通过qPCR定量Nanog的mRNA水平。将数据归一化至第0天。
图3显示了用SPH-OminiCMV-Ents检测lncRNA的结果。
a.代表性图片展示SPH-OminiCMV-Malat1的mCherry表达和平均mCherry强度。
b.代表性图片展示在SPH-OminiCMV-Ents-Malat1 mESCs中,mCherry与Malat1共定位。请注意,通过RNA-FISH探针检测到Malat1的表达。
c.代表性图片展示SPH-OminiCMV-Lncenc1 mESCs中的mCherry表达和平均mCherry强度。
d.代表图像显示mCherry和Lncenc1在未分化(第0天)和分化(第9天)的SPH-OminiCMV-Ents-Lncenc1 mESC中的表达。请注意,Lncenc1是一种多能性相关的lncRNA,并且其表达由RNA-FISH探针检测到。
e.代表性图片展示在分化的SPH-OminiCMV-Ents-Lncenc1 mESCs中mCherry的表达。
f.qPCR分析在分化的SPH-OminiCMV-Ents-Lncenc1 mESC中Lncenc1的表达。数据归一化至第0天。
图4显示了编码多个sgRNA可提高SPH-OminiCMV-Ents的敏感性并可实现多重转录调控。
a.示意图显示SPH-OminiCMV-Ents mESC中插入一个或多个sgRNA前体
b.代表性图像显示在SPH-OminiCMV-Ents mESCs细胞系中,将一份sgRNA或sgRNA阵列插入基因或lncRNA(绿色)的3'UTR后,mCherry的表达情况。
c和d.代表图像显示在SPH-OminiCMV-Ents mESCs中通过在lncRNA Tug1的3'UTR中插入一个sgRNA或一个sgRNA阵列后细胞系中mCherry的表达情况。注意,用RNA-FISH探针检测到Tug1。
e.mCherry的荧光强度均值。LncRNA用深粉红色表示。
f.代表图像显示插入了sgRNA阵列的细胞未分化(第0天)和分化的(第9天)mCherry表达。
g.代表性图像显示在SPH-OminiCMV-Ents-Tubb3 mESC细胞系向神经元分化过程中的中表达mCherry的情况。sgRNA阵列包含8个sgRNA拷贝。箭头指示诱导的神经元。请注意,Tubb3在mESC中低表达,而在神经元中高表达。
i.示意图显示插入两个分别激活mCherry和Ngn2的sgRNA阵列,以及mCherry和Ngn2倍数变化。
j.示意图显示插入包含两个分别激活mCherry和Hbb的sgRNA阵列,以及mCherry和Hbb的倍数变化。
图5显示了通过单个启动子驱动dCas9和激活子实现mcherry的均质表达。
a.SPH载体的示意图和代表性图像显示mCherry在SPH-OminiCMV-Ents-Actb细胞克隆中的异质表达。请注意,dCas9和P65-HSF1分别由两个CAG启动子表达。
b.示意图显示了SPH(单个CAG)载体和SPH(单个CAG)-OminiCMV-Ents-Actb细胞克隆中mCherry的均质表达的代表图像。请注意,dCas9和p65-HSF1的表达是由一个启动子。
c.代表性图片展示P2A-mCherry和SPH(单个CAG)-OminiCMV-Ents的ESCs中的mCherry表达
d.SPH(单个CAG)-OminiCMV-Ents-一个sgRNA(蓝色),SPH(单个CAG)-OminiCMV-Ents-sgRNA阵列(红色)和P2A-mCherry(绿色)的mESC的mCherry强度,以及不同的基因mRNA的表达水平(紫色,qPCR,右紫色y轴)。通过r2=0.9405,p<0.0001显示了SPH(单个CAG)-OminiCMV-Ents-sgRNA的荧光强度和相对mRNA表达量之间的相关性。r2=0.5855,p=0.0023表示SPH(单个CAG)-OminiCMV-Ents-sgRNA阵列mESCs的荧光强度和相对mRNA表达之间的相关性。
e.代表性图片展示不同lncRNA的mCherry表达。
f.SPH(单个CAG)-OminiCMV-Ents-一个sgRNA(蓝色)和SPH(单个CAG)-OminiCMV-Ents-sgRNA阵列(红色)mESC的mCherry表达强度和相应的低丰度lncRNA的mRNA表达水平(紫色,qPCR,右紫色y-轴)。相关性显示为r2=0.2978,p=0.3414
图6显示了不同sgRNA诱导的平均mCherry强度。
图7显示了miniCMV启动子的优化和结果。
图8显示了SPH-OminiCMV诱导的基因表达水平高于SPH介导的内源性激活和CMV介导的过表达。
图9显示了SPH-OminiCMV的特异性。
图10显示了SPH-OminiCMV转基因mESC的产生和表征。
图11显示了将tRNA-sgRNA-tRNA定向插入3’UTR不会影响靶基因的正常蛋白质产生。
图12显示了SPH-OminiCMV-Ents可在细胞分化过程中可视化低丰度基因。
图13显示了将sgRNA阵列插入未表达的基因不会诱导mCherry表达。
图14显示了通过在单个启动子下驱动dCas9和激活子,mCherry的均质表达。
图15显示了mCherry表达的FACS分析。
图16显示了在分化过程中,不同策略的并排比较以及蛋白水平上的mCherry和Nanog的下调。
图17显示了SPH(单个CAG)-OminiCMV-Ents-sgRNA阵列诱导mCherry的最高表达。
图18显示了SPH(单个CAG)-OminiCMV-Ents的定量表征。
具体实施方式
本发明人经过广泛而深入的研究,经过大量的筛选,首次开发了一种通用的可用于检测细胞内源的低丰度基因和lncRNA表达水平的内源转录门控开关(Ents),在有内源性启动子存在的情况下释放单向导RNA(sgRNA)。当Ents与本发明的高度敏感的CRISPR-激活相关的报告系统SPH-OminiCMV结合,可以可靠地检测到内源基因,其中包括表达水平非常低的基因(<0.001,相对于Gadph,qPCR分析)。值得注意的是,本发明的方法还可以在活细胞中监控通常低表达的长非编码RNA(lncRNA)的转录活性。本发明的方法能够放大内源信号以可视化细胞中低丰度基因和lncRNA表达的动态过程,提供了强大的平台来检测内源性遗传元件的活动和其潜在的细胞功能。在此基础上完成了本发明。
术语
除非另外定义,否则本文中所用的全部技术与科学术语均具有如本发明所属领域的普通技术人员通常理解的相同含义。
如本文所用,在提到具体列举的数值中使用时,术语“约”意指该值可以从列举的值变动不多于1%。例如,如本文所用,表述“约100”包括99和101和之间的全部值(例如,99.1、99.2、99.3、99.4等)。
如本文所用,术语“含有”或“包括(包含)”可以是开放式、半封闭式和封闭式的。换言之,所述术语也包括“基本上由…构成”、或“由…构成”。
如本文所用,术语“多核苷酸”是指核苷酸聚合形成的链状化合物。
sgRNA响应型启动子
如本文所用,术语“sgRNA响应型启动子”是指在本发明的细胞内源核酸检测中,能够响应于所产生的sgRNA,并启动下游报告基因的一类启动子。
本发明所提供的sgRNA响应型启动子能够响应于上游的由内源转录本控制表达的sgRNA、dCas9和转录激活因子所形成的复合物,并启动下游报告基因的表达。
优选地,所述的sgRNA响应型启动子是微型启动子。更加优选地,所述的sgRNA是miniCMV启动子。
本发明检测体系
在本发明中,首次提供了一种可以用于检测细胞内源核酸,特别是低表达丰度的基因以及长非编码RNA(lncRNA)的检测体系。所述的检测体系包含目标核酸编辑和目标核酸报告这两大模块。
其中,所述的细胞内源低丰度基因是指当以Gapdh内参基因做相对定量时,在细胞内表达量<0.001的基因。
在一个实施方式中,所述的目标核酸编辑模块中包括如式I所示的结构,
L1-(tRNA-sgRNA)n-tRNA-R1 (式I)
式中,
L1是5’端的同源臂;
R1是3’端的同源臂;
tRNA是能成功释放出有功能的sgRNA内源机制;
sgRNA是向导RNA,其优选靶向于所述目标核酸的3’端未翻译区域(3’UTR);
n是≥1的正整数,优选地2≤n≤10,更加优选地6≤n≤8。
在一个实施方式中,所述的报告核酸构建物具有如式II所示的结构,
(TS-I)m-TS-P1-Z2 (式II)
式中,
TS是所述sgRNA的结合靶位点;
m是≥0的正整数,优选地2≤m≤4,更加优选地m=2(即所述式II结构中最优选包含3个TS重复序列);
I是TS之间的间隔序列,其优选具有35-37bp的长度;
P1是本发明的sgRNA响应型启动子;
Z2是报告基因序列,其中所述报告基因优选为mCherry的编码基因。
较佳地,所述目标核酸报告模块中的dCas蛋白和转录激活因子的表达受同一启动子P2调控;更佳地,所述的启动子P2是CAG启动子。
本发明所提供的检测体系可用于制备一用于检测细胞内源核酸的试剂盒。在一个优选的实施方式中,所述的试剂盒可用于疾病诊断,并且所述的疾病是相应的细胞内源核酸表达异常相关的疾病。
本发明检测方法
本发明还提供了一种检测细胞样本中是否存在目标内源核酸的方法,包括步骤:(i)将本发明的检测体系引入待检测细胞样本中;和(ii)检测所述检测体系中的检测目标核酸报告模块中的报告基因或其编码产物的水平。
本发明所述的方法包括定性检测和定量检测。特别地,所述的方法包括动态检测细胞样本中的目标内源核酸的水平。
在一个实施方式中,所述的方法是非诊断性的和/或非治疗性的。
本发明的主要优点包括:
1)本发明的检测体系和检测方法是转录本依赖的,其不依赖于蛋白表达。
2)本发明的检测体系和检测方法具有较强的放大效果,低表达的基因和LncRNA能被检测到,可用于目标基因的表达水平/Gapdh的表达水平<0.001的基因检测。
3)本发明的检测体系和检测方法能实时监测细胞内低丰度基因或LncRNA的动态表达。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
实施例1:SPH-OminiCMV-Ents系统的开发
Ent-switch的关键设计是靶向插入sgRNA前体到内源基因的转录区。sgRNA前体的两侧是转录后可被内源的机制识别后释放的序列,如图1a所示。靶向基因和sgRNA前体在内源性启动子驱动下转录成单个转录本,然后通过内源性切割程序释放成熟的sgRNA,如图1a所示。
在本实施例中,提供了一种高度敏感的CRISPR激活物相关报告系统,以有效检测释放的sgRNA的存在。在这个系统里,通过靶向一个最小的启动子(微型启动子),并使用本发明人先前开发的CRISPR-activator Suntag-P65-HSF1(SPH)激活系统诱导mCherry的表达。
为了诱导有效激活,首先对sgRNA进行了预筛选,并将能诱导mCherry强表达的sgRNA 2用于后续的实验(图6a和表1)。在表1中,列举了用来激活miniCMV-mCherry表达的各sgRNA(名称为Actb-Intron1、长度为21bp的序列),其均为把Trna-sgRNA敲入于actb基因的intron1位置时所使用的sgRNA。
然后,将SPH、U6驱动的sgRNA以及由微型启动子(Mini-TK、Luc2CP、TRE3G或miniCMV)驱动的mCherry共转到N2a细胞中。
结果表明,miniCMV启动子在没有sgRNA的诱导时显示出低背景,并且sgRNA诱导后,mCherry能够表达出最高的表达水平(图1b和图7a、b)。
表1预筛选的sgRNA序列
此外,还测试了驱动mCherry表达的miniCMV启动子上游sgRNA靶位点(TS)不同拷贝数和间隔的影响。
结果表明,miniCMV启动子上游有三个间隔为35bp的TS可诱导mCherry的最高表达水平(图1c,d和图7c,d)。值得注意的是,优化的miniCMV(OminiCMV)加上SPH诱导的mCherry表达水平高于常用的强启动子(CAG、CMV和EF1a)(图1e和图7e、f和8a、b,以及表2),并显示出了高位点特异性(图9a和表1)。
表2激活内源基因的sgRNA序列
由此,本实施例中进一步建立了工具,以高灵敏度和宽动态范围地检测sgRNA释放。接下来,探讨了高度敏感的报告系统是否可以有效地检测从包含基因和sgRNA前体的单个转录本中释放的sgRNA。SPH和OminiCMV-mCherry(SPH-OminiCMV)分别通过转基因整合到小鼠胚胎干细胞(mESC),之后三个不同的sgRNA前体miR30、自剪切和tRNA分别插入管家基因Actb的内含子(图1f和图10a-d和表3)。为避免在OminiCMV中切割sgRNA TS(SpCas9),使用SaKKHCas9来插入SpCas9 sgRNA前体(图1f和表3)。
表3用于插入sgRNA前体(SaKKHCas9)的sgRNA序列
结果表明,只有插入tRNA-sgRNA-tRNA前体可有效诱导mCherry(图1g、h)。如先前报道,tRNA可以以sgRNA-tRNA前体的形式插入外源基因并被内切酶RNase P和RNase Z精确切割,然后释放sgRNA。
为了研究插入位置对mCherry的诱导和蛋白质稳定性的影响,将tRNA-sgRNA-tRNA插入Nanog或Actb基因座的不同位点(图1i和图11a)。尽管所有插入在蛋白质水平上对Nanog稳定性都没有明显的影响,只有3’未翻译区域(3’UTR)插入稳定地诱导了mCherry高水平表达(图1j-1和图11a-c)。因此,在后续实验中选择了3’UTR插入。
此外,本发明人还将非目标tRNA-sgRNA-tRNA(sgLacZ)插入Actb的3’UTR,但未观察到mCherry表达的增加(图11d、e)。
实施例2:SPH-OminiCMV-Ents可以放大低丰度基因的信号并追踪分化过程中基因的动态表达
荧光可视化技术提供了一种简单的直接方法捕获细胞事件的时空信息。为了探究SPH-OminiCMV-Ents是否可以忠实地反映靶基因的表达水平,将tRNA-sgRNA-tRNA插入8个差异表达的基因的3’UTR区域,包括一个高度表达的管家基因Actb和七个多能性相关基因(图2a)。
结果表明,基因表达水平与mCherry强度有明显相关性(图2b、c,r2=0.8644,p=0.0008),这表明SPH-OminiCMV-Ents可以用作报告系统,在细胞层面监控基因表达水平。
本实施例中还比较了SPH-OminiCMV-Ent与P2A-mCherry策略诱导的荧光强度9。值得注意的是,SPH-OminiCMV-Ents诱导的mCherry表达水平高于P2A-mCherry策略,并可以检测到低丰度基因(靶基因的表达水平/Gapdh<0.01,qPCR分析),例如Sox2、Tet1、Sall4和Tbx3,这些基因用P2A-mCherry策略在显微镜下几乎看不见(图2b,c和表4)。
表4基因的相对表达水平
基因名称 | 相对mRNA表达(qPCR) |
Actb | 0.080380 |
Nanog | 0.028545 |
Med7 | 0.012146 |
Sox2 | 0.005398 |
Tet1 | 0.003195 |
Tbx3 | 0.002834 |
Sall4 | 0.002772 |
Esrrb | 0.001845 |
Terb | 0.000222 |
Jag1 | 0.000101 |
Fzd7 | 0.000050 |
Slc7a11 | 0.000016 |
Sema3a | 0.000005 |
LncRNA | 相对mRNA表达(qPCR) |
Malat1 | 0.003989 |
Lncenc1 | 0.008091 |
Tug1 | 0.003450 |
Dancr | 0.007491 |
Firre | 0.000511 |
Pvt1 | 0.000197 |
Tunar | 0.000073 |
Miat | 0.000014 |
接下来,检查了SPH-OminiCMV-Ents是否可以跟踪细胞分化过程中内源基因的表达动态。为了诱导mESC分化为神经祖细胞,在N2B27培养基中培养插入了tRNA-sgRNA-tRNA的SPH-OminiCMV mESC。在这种情况下,表达水平与多能性相关的Nanog、Esrrb、Sox2和Tet1等基因在细胞分化后表达水平降低(图2d-g和图12a-f、表5),这与以前的报告一致。值得注意的是,mCherry表达与这些多能性基因相关的基因在分化过程中一起降低,而在SPH-OminiCMV-Ents-Actb mESC中mCherry的表达仍然稳定(图2d-g和图12a、c、e)。
表5 qPCR引物
这些数据共同表明,SPH-OminiCMV-Ents可以可靠地跟踪基因活动,包括低丰度的基因。
实施例3:使用SPH-OminiCMV-Ents检测lncRNA活性
长非编码RNA(lncRNA)已被确定在多种生物学过程中扮演着重要的角色,其表达通常限于特定的细胞类型或处于特定的发育阶段。然而,lncRNA的检测和功能分析非常困难,因为共表达荧光蛋白的常规策略不适用于非翻译遗传元件。LncRNA也很难进行研究,因为它们通常以非常低的水平表达。
在本实施例中,测试了SPH-OminiCMV-Ents是否可用于检测lncRNA。在SPH-OminiCMV的mESC细胞系上将靶向mCherry的tRNA-sgRNA-tRNA盒分别插入malt1和Lncenc1这两个lncRNA的3’UTR。有趣的是,结果表明,mCherry在SPH-OminiCMV-Ents-Malat1和SPH-OminiCMV-Ents-Lncenc1细胞中表达,但不在SPH-OminiCMV mESC中表达(图3a-d)。
接下来,本发明人检查SPH-OminiCMV-Ents-Lncenc1 mESCs中的mCherry表达是否是因为在细胞分化过程中Lncenc1表达减少而关闭。结果与以前的报告一致,Lncenc1在mESC分化过程中的转录水平显著降低(图3d-f)。其中,mCherry的表达是随着分化过程中lncRNA的减少而下调的(图3d,e),这表明SPH-OminiCMV-Ents可用于跟踪lncRNA的动态表达。
实施例4:通过编码一个sgRNA阵列来提高SPH-OminiCMV-Ents灵敏度
在本实施例中,探讨了增加sgRNA拷贝数是否会进一步增强荧光蛋白的产生。本发明人构建了一个sgRNA前体包含六到八个串联的sgRNA拷贝,每个sgRNA的两侧是tRNA(图4a)。在SPH-OminiCMV mESC细胞系中,将sgRNA阵列分别插入一个未表达的基因Sema3a的3’UTR(相对于Gadph为0.000005),两个低丰度基因Tet1(0.003195)和Fzd7(0.000050),以及三个lncRNA,Lncenc1(0.008091)、Malat1(0.003989)和Tug1(0.003450)(图4b-e和表4)。
结果表明,对于一些低丰度的基因(Tet1和Fzd7),以及三个lncRNA中的两个(Lncenc1和Tug1)而言,插入sgRNA阵列比插入了一个拷贝的sgRNA的细胞表达更高水平的mCherry。相比之下,SPH-OminiCMV-Ents-Sema3a mESC中插入一个或多个sgRNA的细胞系没有mCherry表达(图13a-d)。值得注意的是,插入sgRNA阵列可实现可视化和跟踪非常低丰度的基因Fzd7和lncRNA Tug1,而它们仅用一个拷贝的sgRNA不能检测到表达(图4b-f)。
随后,测试了是否SPH-OminiCMV-Ents(sgRNA阵列)可以在细胞分化过程中随着基因表达增加而打开。
具体地,本发明人生成了SPH-OminiCMV-Ents-Tubb3(sgRNA阵列)mESC,并将其分化为神经元。结果表明,mCherry的表达随mESCs分化过程中Tubb3的表达增加而上调(图4g,h),这与以前的报道一致。
在许多情况下,可能需要对特定细胞类型的多个事件进行调节。为此,本发明人在SPH-OminiCMV mESC细胞系的Actb的3’UTR中插入了靶向mCherry的sgRNA和内源基因的多个sgRNA。
结果表明,插入两个分别靶向mCherry和Ngn2的sgRNA阵列,同时上调了mCherry和Ngn2的表达(图4i)。同样,mCherry和Hbb也可以通过插入靶向mCherry和Hbb的sgRNA阵列同时激活(图4j)。
综上,本发明人证明了在sgRNA前体中多种sgRNA的表达进一提高了SPH-OminiCMV-Ents的灵敏度并可以以细胞类型特异性方式进行多重转录调控。
实施例5:通过在一个启动子下驱动dCas9和激活子来实现mCherry的均质表达
本发明人已经注意到,某些细胞克隆显示出异质的mCherry表达(图5a和图14a、b)。探索异质性的原因,本发明人分选了mCherry-high(高5%)和mCherry-低(低5%)的mESC,并比较了这两组中的dCas9、P65-HSF1和sgRNA的表达水平。
qPCR结果显示,dCas9在mCherry-low细胞群中明显下调(图14c),表明异质性可能是两个CAG启动子分别驱动的dCas9和激活子在细胞中差异表达造成的。
为了减少异质性,本发明人构建了一个单CAG-SPH载体,在单个启动子下表达dCas9和激活子(图5b和图14d)。本发明人的结果显示,SPH(单个CAG)-OminiCMV-Ents诱导mCherry相比SPH-OminiCMV-Ents(双CAG)表达更加均一且表达量更高(图5b-d和图14e、10a、10b)。
此外,通过mCherry表达水平证明了,与SPH(单个CAG)–OminiCMV-Ents–单个sgRNA相比,结合SPH(单个CAG)和sgRNA阵列可进一步提高灵敏度(图5c、d和图15a、15b、11a-e、12a)。通过组合SPH(单个CAG)和sgRNA阵列,证明了SPH(单个CAG)-OminiCMV-Ents-sgRNA阵列可检测到SPH(单个CAG)-OminiCMV-Ents-单个sgRNA不能看到的低丰度的lncRNA(可能达到的目标lncRNA/Gapdh的表达水平<0.001,qPCR分析)(图5e、f)。
实施例6:Ents系统的定量表征
在分化过程中,对于Nanog-P2A-mCherry的细胞系,Nanog的表达降低是与mCherry减少严格相关的,而Ents系统的Nanog和mCherry表达之间存在时间差(图18a-d)。
为了确定Ents的特性,本实施例中设计了一个将tRNA-sgRNA-tRNA插入到GFP的3’UTR的Tet-On系统,向细胞培养物中添加强力霉素(Dox)可以诱导GFP和tRNA-sgRNA-tRNA表达(图18e)。
结果表明,当细胞暴露于不同浓度的Dox时,GFP和mCherry的表达水平相关性很高,提示使用SPH(单个CAG)-OminiCMV-Ents来指示内源基因的动态表达的可靠性(图18f、g)。
接下来,本发明人使用此系统探究在靶基因和报道基因之间表达和关闭的时间差。数据表明,打开时,在mRNA水平GFP和mCherry表达之间的时间差约为为0.5小时(图18h、i),蛋白质水平为6小时(图18j);而关闭时,在mRNA水平上,时间延迟约为4.5小时(图18k、1),蛋白质水平为18小时(图18m)。
表6本发明所涉及的核酸构建物及其序列编号
讨论
在本发明中,开发了由内源性启动子驱动的高度可编程的sgRNA开关(Ents),理论上可以处理任何转录本的信息。本发明的数据表明,当Ents与SPH-OminiCMV结合使用时,SPH-OminiCMV-Ents可以扩增内源性信号并可靠地检测低丰度基因和lncRNA的活性,为在活细胞中研究这些基因元件的功能作用开辟新途径。
对于P2A-mCherry策略,表达量相对于Gapdh为低于0.01的内源基因几乎无法可视化。本发明通过使用SPH(单个CAG)-OminiCMV-Ents-单个sgRNA系统,可以可视化表达水平相对于Gadph低至0.001845的基因(Esrrb),和表达水平相对于Gadph低至0.003989的lncRNA(Malat1)。对于SPH(单个CAG)-OminiCMV-Ents-sgRNA阵列系统,可以观察到基因表达水平相对于Gapdh低至0.000050的基因(Fzd7)和低至0.000197的1ncRNA(Pvt1)。
在本发明中,所有的实验都是在细胞中进行的。未来的工作将涉及在体内应用SPH-OminiCMV-Ents来做基因表达的时空谱并且应用于标记特定的细胞群。因为内源信号的处理是在sgRNA的支持下,此设计绕过了繁琐的传感器-效应器的识别过程,几乎提供无限数量的高特异性和高效率的触发器。Ents除了监视基因元件的表达外,还可以应用于执行许多功能。例如,Ents可以与不同的CRISPR效应子配对以实现细胞类型特异性基因破坏,碱基编辑或表观遗传修改。
本发明证明了Ents设计使得能够通过将多个靶向不同的位置的sgRNA整合到一个单一的前体中构建多输入逻辑运算,从而为探测内源性信号和在特定细胞类型中整合复杂的细胞功能提供了有希望的工具。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 中国科学院脑科学与智能技术卓越创新中心
<120> 一种检测细胞内源性低丰度基因和lncRNA水平的方法
<130> P2020-2075
<160> 166
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 1
ggtcatcgct agaacgaagc 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 2
gtcccctcca ccccacagtg 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 3
gcgataggta gtaagtcgcg 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 4
ctgacgatac cgcgtgatgt 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
ttctactggc gatcgtaatg 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 6
tacggtcgca taggacgcag 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
cgacgattac aatgcgccac 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 8
ttccagcgag ataagcggag 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
ggattcgaca catcgtgcct 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
taccttacgg tgatccgaag 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
atacacatga ggtacggtgc 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
cctagccatt aacgtacgga 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
atacattgac ggttaccaac 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
cgtgctacga cgtcataacg 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 15
cctcgttact cgaacgtagg 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
caccttgtgt agcgaaccgc 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
aatgactatc ttagcgatcg 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 18
cctcgagaag ttatggtgca 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 19
tccgacgttc gactatcacc 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 20
attgaccgat tacgtgacag 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 21
aacgttcaat accactcgag 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 22
tcgttcgaga acttatcacc 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 23
gtactagacg tcgcctatag 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 24
ctcgaattag ctcaagacgc 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 25
gcatgtcgag cacgaagatc 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 26
taaggatccg gatgagttag 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 27
aggttcgcaa ccgtgctcag 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 28
acatcttgct cgaaggtcgg 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 29
ttacctccta tacgcagtcg 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 30
tcttgagctt gtagtgcggt 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 31
tattcggtct accggtgttc 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 32
tcagttcgtg ccagtaatag 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 33
cgagttcttc gctgtaatag 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 34
cacgcagtct agatagtacg 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 35
tacgtgtgat gatcgttact 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 36
ctcgttcaac ggttcactac 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 37
tcactgttgc gtccagacgt 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 38
gcacagtatc cgacttcaag 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 39
gaccattcgt agctacgact 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 40
tcgacgatcc gtataagctc 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 41
cgattatgac gtgacaggtg 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 42
cttctgagcg cttcactagc 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 43
acatcggatt acacacgctc 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 44
agatcaagcg tggttcgacc 20
<210> 45
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 45
gaatggtacc gaactggcag 20
<210> 46
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 46
ctgtgtgcgg ttagttcgag 20
<210> 47
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 47
atagtggtcg ctcctgacgg 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 48
gctatgaacg cgattagatg 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 49
tgcgaatacg cccacgcgat 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 50
agctgaggag gtgggggaag 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 51
gagtttgcaa ggagcgggcg 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 52
gaaaacaatc agatctgccc 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 53
cgggggacca ggacaggcgg 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 54
tgcgcctcgt atcactgcgc 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 55
gcggctcctc gggcgcacca 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 56
agagagagga aacagaagcg 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 57
gagaaattaa ttggggtggg 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 58
gtggaggtga agtcctggag 20
<210> 59
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 59
cgcccctttc cggtcagtag 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 60
gcactaagat agtgtccagt 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 61
tgcgaatacg cccacgcgat 20
<210> 62
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 62
ccgggcagcc gcgctcccag c 21
<210> 63
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 63
ccaaagcatg gaccaactta c 21
<210> 64
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 64
ggtttacagt gtagatgcgg t 21
<210> 65
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 65
cttcacctcc cacacccatc c 21
<210> 66
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 66
aaagggacag gactaatgga c 21
<210> 67
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 67
ttgcgtaagt ctcatatttc a 21
<210> 68
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 68
ttgcgtaagt ctcatatttc a 21
<210> 69
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 69
gctctattta caacttggtg t 21
<210> 70
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 70
aacagtccgc ctagaagcac t 21
<210> 71
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 71
ttgcgtaagt ctcatatttc a 21
<210> 72
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 72
tggagatgct ggaggccaag g 21
<210> 73
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 73
agccctcaca tgtgcgacag g 21
<210> 74
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 74
cagttccctc acttcctgga g 21
<210> 75
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 75
agcctttaga cccaacgatt g 21
<210> 76
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 76
ggtaaggacc ggggctcata c 21
<210> 77
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 77
agccaagaga gaagttaaga c 21
<210> 78
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 78
tgcacaaaga agcacacaat g 21
<210> 79
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 79
tgccaagttc cattgctgct a 21
<210> 80
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 80
tgaaatgaat gaaaggccat g 21
<210> 81
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 81
cggaaggaga cagggttagt c 21
<210> 82
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 82
ggaaagtgcc cagagcttga a 21
<210> 83
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 83
gtcttctggt acaacttcta g 21
<210> 84
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 84
gtgttaggac aaattgctcc a 21
<210> 85
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 85
ctcagcttct tcaattacct t 21
<210> 86
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 86
atcactgtca gacaaggtgg c 21
<210> 87
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 87
accgtggctg tatgtatttt a 21
<210> 88
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 88
gagtgactgg tttataaggg a 21
<210> 89
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 89
ccaactactc caacgacttg a 21
<210> 90
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 90
ctcttgttcc tctgggctaa g 21
<210> 91
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 91
ccgcatgcac aacctaaac 19
<210> 92
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 92
gtgagcgccc agatgtaat 19
<210> 93
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 93
gtaccacttg ggctgtttct 20
<210> 94
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 94
gcaggtcttt ctccttctca tag 23
<210> 95
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 95
gagtcaccgg acaatgacaa 20
<210> 96
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 96
gtctgcgctt tggagaaga 19
<210> 97
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 97
agctgccaga tagcatgaag 20
<210> 98
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 98
tagggcggat aggtggtaat 20
<210> 99
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 99
gaaacccccg gattagagcc 20
<210> 100
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 100
gagcaaaggt ctccttgagg t 21
<210> 101
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 101
tagaccccag cggcaactat 20
<210> 102
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 102
gttccaggtt ccaagtccac c 21
<210> 103
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 103
ggctgtattc ccctccatcg 20
<210> 104
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 104
ccagttggta acaatgccat gt 22
<210> 105
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 105
tcttcctggt ccccacagtt t 21
<210> 106
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 106
gcaagaatag ttctcgggat gaa 23
<210> 107
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 107
gcacctgggc tctagttgc 19
<210> 108
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 108
tacagtcctc gtagctcttg c 21
<210> 109
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 109
gcggagtgga aacttttgtc c 21
<210> 110
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 110
cgggaagcgt gtacttatcc tt 22
<210> 111
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 111
acacagtggt gctaatgcag 20
<210> 112
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 112
agcatgaacg ggagaatcgg 20
<210> 113
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 113
aactccacgt ccccatacag 20
<210> 114
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 114
gaggcgcata acgatgcttc 20
<210> 115
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 115
ccagcgtcct gtggtaaag 19
<210> 116
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 116
gattctcatc ccctgcctat 20
<210> 117
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 117
catggccttc cgtgttccta 20
<210> 118
<211> 17
<212> DNA
<213> 人工序列(artificial sequence)
<400> 118
gcggcacgtc agatcca 17
<210> 119
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 119
aggacggcga gttcatcta 19
<210> 120
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 120
cccatggtct tcttctgcat ta 22
<210> 121
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 121
ccccaccaag caagagagac 20
<210> 122
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 122
ggggcaaatc atcgggcaa 19
<210> 123
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 123
gcactttggt tgcccaatg 19
<210> 124
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 124
gcacgtttct ctcgttgcg 19
<210> 125
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 125
cctcgggtca gtttgagctg 20
<210> 126
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 126
ccttgaggca cactttgaag ta 22
<210> 127
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 127
ggcaccgtca tcggatcag 19
<210> 128
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 128
ctccacaggc agaccagaaa a 21
<210> 129
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 129
cccttcttca tgtcccactg 20
<210> 130
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 130
aaacggcgag catgtcatag 20
<210> 131
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 131
ggagaaaggc agaaatgcag 20
<210> 132
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 132
cagtgttcca gctccagtga 20
<210> 133
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 133
cttgtatggg tggtggcttt 20
<210> 134
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 134
ccagggagag agtggtgtg 19
<210> 135
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 135
attgggaggg gacttaatgg 20
<210> 136
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 136
gtgttacgga gccagagagc 20
<210> 137
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 137
gggaggtgta taaagtgaga agct 24
<210> 138
<211> 25
<212> DNA
<213> 人工序列(artificial sequence)
<400> 138
gtatcccaag gaatgaagtc tgtct 25
<210> 139
<211> 18
<212> DNA
<213> 人工序列(artificial sequence)
<400> 139
gaaccgcatc gagctgaa 18
<210> 140
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 140
tgcttgtcgg ccatgatata g 21
<210> 141
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 141
tcaagatccg ccacaacatc 20
<210> 142
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 142
gtgctcaggt agtggttgtc 20
<210> 143
<211> 77
<212> DNA
<213> 人工序列(artificial sequence)
<400> 143
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgca 77
<210> 144
<211> 60
<212> DNA
<213> 人工序列(artificial sequence)
<400> 144
taggcgtgta cggtgggagg cctatataag cagagctcgt ttagtgaacc gtcagatcgc 60
<210> 145
<211> 711
<212> DNA
<213> 人工序列(artificial sequence)
<400> 145
atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60
gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120
cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180
ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240
cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300
gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 360
ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420
atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480
gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540
gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600
aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660
cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta a 711
<210> 146
<211> 9663
<212> DNA
<213> 人工序列(artificial sequence)
<400> 146
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
gagtcgctgc gttgccttcg ccccgtgccc cgctccgcgc cgcctcgcgc cgcccgcccc 720
ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780
gctgtaatta gcgcttggtt taatgacggc tcgtttcttt tctgtggctg cgtgaaagcc 840
ttaaagggct ccgggagggc cctttgtgcg ggggggagcg gctcgggggg tgcgtgcgtg 900
tgtgtgtgcg tggggagcgc cgcgtgcggc ccgcgctgcc cggcggctgt gagcgctgcg 960
ggcgcggcgc ggggctttgt gcgctccgcg tgtgcgcgag gggagcgcgg ccgggggcgg 1020
tgccccgcgg tgcggggggg ctgcgagggg aacaaaggct gcgtgcgggg tgtgtgcgtg 1080
ggggggtgag cagggggtgt gggcgcggcg gtcgggctgt aacccccccc tgcacccccc 1140
tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtgcgg ggcgtggcgc 1200
ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc 1260
gcctcgggcc ggggagggct cgggggaggg gcgcggcggc cccggagcgc cggcggctgt 1320
cgaggcgcgg cgagccgcag ccattgcctt ttatggtaat cgtgcgagag ggcgcaggga 1380
cttcctttgt cccaaatctg gcggagccga aatctgggag gcgccgccgc accccctcta 1440
gcgggcgcgg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg agggccttcg 1500
tgcgtcgccg cgccgccgtc cccttctcca tctccagcct cggggctgcc gcagggggac 1560
ggctgccttc gggggggacg gggcagggcg gggttcggct tctggcgtgt gaccggcggc 1620
tctagagcct ctgctaacca tgttcatgcc ttcttctttt tcctacagat ccttaattaa 1680
ctaggctacg cgcgccacca tgcccaagaa gaagcgcaag gtgggacgcg tctgcaggat 1740
atcaagcttg cggtaccgcg ggcccgggat cgccaccatg gacaagaagt acagcatcgg 1800
cctggccatc ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc 1860
cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga agaacctgat 1920
cggcgccctg ctgttcgaca gcggagaaac agccgaggcc acccggctga agagaaccgc 1980
cagaagaaga tacaccagac ggaagaaccg gatctgctat ctgcaagaga tcttcagcaa 2040
cgagatggcc aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga 2100
agaggataag aagcacgagc ggcaccccat cttcggcaac atcgtggacg aggtggccta 2160
ccacgagaag taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa 2220
ggccgacctg cggctgatct atctggccct ggcccacatg atcaagttcc ggggccactt 2280
cctgatcgag ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct 2340
ggtgcagacc tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc 2400
caaggccatc ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc tgatcgccca 2460
gctgcccggc gagaagaaga atggcctgtt cggcaacctg attgccctga gcctgggcct 2520
gacccccaac ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa 2580
ggacacctac gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga 2640
cctgtttctg gccgccaaga acctgtccga cgccatcctg ctgagcgaca tcctgagagt 2700
gaacaccgag atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca 2760
ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa 2820
agagattttc ttcgaccaga gcaagaacgg ctacgccggc tacatcgatg gcggagccag 2880
ccaggaagag ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga 2940
actgctcgtg aagctgaaca gagaggacct gctgcggaag cagcggacct tcgacaacgg 3000
cagcatcccc caccagatcc acctgggaga gctgcacgcc attctgcggc ggcaggaaga 3060
tttttaccca ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttccgcat 3120
cccctactac gtgggccctc tggccagggg aaacagcaga ttcgcctgga tgaccagaaa 3180
gagcgaggaa accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgccagcgc 3240
ccagagcttc atcgagcgga tgaccaactt cgataagaac ctgcccaacg agaaggtgct 3300
gcccaagcac agcctgctgt acgagtactt caccgtgtac aacgagctga ccaaagtgaa 3360
atacgtgacc gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaagccat 3420
cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga aagaggacta 3480
cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atcggttcaa 3540
cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga 3600
caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga 3660
cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat 3720
gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga agctgatcaa 3780
cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt ccgacggctt 3840
cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta aagaggacat 3900
ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg ccaatctggc 3960
cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt 4020
gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca gagagaacca 4080
gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg aagagggcat 4140
caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa 4200
cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg accaggaact 4260
ggacatcaac cggctgtccg actacgatgt ggacgctatc gtgcctcaga gctttctgaa 4320
ggacgactcc atcgataaca aagtgctgac tcggagcgac aagaaccggg gcaagagcga 4380
caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcgcc agctgctgaa 4440
tgccaagctg attacccaga ggaagttcga caatctgacc aaggccgaga gaggcggcct 4500
gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc ggcagatcac 4560
aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg agaacgacaa 4620
actgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa 4680
ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta 4740
cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt 4800
cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga 4860
aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac 4920
cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga caaacggcga 4980
aacaggcgag atcgtgtggg ataagggccg ggactttgcc accgtgcgga aagtgctgtc 5040
tatgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga 5100
gtctatcctg cccaagagga acagcgacaa gctgatcgcc agaaagaagg actgggaccc 5160
taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg tggtggccaa 5220
agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat 5280
catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca agggctacaa 5340
agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa 5400
cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg aactggccct 5460
gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc tgaagggctc 5520
ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaaacact acctggacga 5580
gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg ctaatctgga 5640
caaggtgctg agcgcctaca acaagcacag agacaagcct atcagagagc aggccgagaa 5700
tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca agtactttga 5760
caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat 5820
ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc tgggaggcga 5880
cgcctatccc tatgacgtgc ccgattatgc cagcctgggc agcggctccc ccaagaaaaa 5940
acgcaaggtg gaagatccta agaaaaagcg gaaagtggac ggcattggta gtgggagcaa 6000
cggcagcagc ggatccaacg gtccgactga cgccgcggaa gaagaacttt tgagcaagaa 6060
ttatcatctt gagaacgaag tggctcgtct taagaaaggt tctggcagtg gagaagaact 6120
gctttcaaag aattaccacc tggaaaatga ggtagctaga ctgaaaaagg ggagcggaag 6180
tggggaggag ttgctgagca aaaattatca tttggagaac gaagtagcac gactaaagaa 6240
agggtccgga tcgggtgagg agttactctc gaaaaattat catctcgaaa acgaagtggc 6300
tcggctaaaa aagggcagtg gttctggaga agagctatta tctaaaaact accacctcga 6360
aaatgaggtg gcacgcttaa aaaagggaag tggcagtggt gaagagctac tatccaagaa 6420
ttatcatctt gagaacgagg tagcgcgttt gaagaagggt tccggctcag gagaggaact 6480
gctctcgaag aactatcatc ttgaaaatga ggtcgctcga ttaaaaaagg gatcgggcag 6540
tggtgaggaa ctactttcaa agaattacca cctcgaaaac gaagtagctc gattaaagaa 6600
aggttcaggg tcgggtgaag aattactgag taaaaattat catctggaaa atgaggtagc 6660
gagactaaaa aaggggagtg gttctggcga ggaattgcta tcgaaaaatt atcatcttga 6720
gaacgaagtt gctaggctca aaaagggctc aggctcaggc accgcggtaa acataggtgg 6780
tggaaccggt ccgatggatc tacagcggcc gcaaggtgga ggtggaccca agaagaagcg 6840
caaggtggga agcggagcta ctaacttcag cctgctgaag caggctggag acgtggagga 6900
gaaccctgga cctgcaccag gaagtatgag cgagctgatt aaggagaaca tgcacatgaa 6960
gctgtacatg ggccccgaca tcgtgatgac ccagagcccc agcagcctga gcgccagcgt 7020
gggcgaccgc gtgaccatca cctgccgcag cagcaccggc gccgtgacca ccagcaacta 7080
cgccagctgg gtgcaggaga agcccggcaa gctgttcaag ggcctgatcg gcggcaccaa 7140
caaccgcgcc cccggcgtgc ccagccgctt cagcggcagc ctgatcggcg acaaggccac 7200
cctgaccatc agcagcctgc agcccgagga cttcgccacc tacttctgcg ccctgtggta 7260
cagcaaccac tgggtgttcg gccagggcac caaggtggag ctgaagcgcg gcggcggcgg 7320
cagcggcggc ggcggcagcg gcggcggcgg cagcagcggc ggcggcagcg aggtgaagct 7380
gctggagagc ggcggcggcc tggtgcagcc cggcggcagc ctgaagctga gctgcgccgt 7440
gagcggcttc agcctgaccg actacggcgt gaactgggtg cgccaggccc ccggccgcgg 7500
cctggagtgg atcggcgtga tctggggcga cggcatcacc gactacaaca gcgccctgaa 7560
ggaccgcttc atcatcagca aggacaacgg caagaacacc gtgtacctgc agatgagcaa 7620
ggtgcgcagc gacgacaccg ccctgtacta ctgcgtgacc ggcctgttcg actactgggg 7680
ccagggcacc ctggtgaccg tgagcagcta cccatacgat gttccagatt acgctggtgg 7740
aggcggaggt tctgggggag gaggtagtgg cggtggtggt tcaggaggcg gcggaagccc 7800
taagaaaaag aggaaggtgg cggccgctgg atccccttca gggcagatca gcaaccaggc 7860
cctggctctg gcccctagct ccgctccagt gctggcccag actatggtgc cctctagtgc 7920
tatggtgcct ctggcccagc cacctgctcc agcccctgtg ctgaccccag gaccacccca 7980
gtcactgagc gctccagtgc ccaagtctac acaggccggc gaggggactc tgagtgaagc 8040
tctgctgcac ctgcagttcg acgctgatga ggacctggga gctctgctgg ggaacagcac 8100
cgatcccgga gtgttcacag atctggcctc cgtggacaac tctgagtttc agcagctgct 8160
gaatcagggc gtgtccatgt ctcatagtac agccgaacca atgctgatgg agtaccccga 8220
agccattacc cggctggtga ccggcagcca gcggcccccc gaccccgctc caactcccct 8280
gggaaccagc ggcctgccta atgggctgtc cggagatgaa gacttctcaa gcatcgctga 8340
tatggacttt agtgccctgc tgtcacagat ttcctctagt gggcagggag gaggtggaag 8400
cggcttcagc gtggacacca gtgccctgct ggacctgttc agcccctcgg tgaccgtgcc 8460
cgacatgagc ctgcctgacc ttgacagcag cctggccagt atccaagagc tcctgtctcc 8520
ccaggagccc cccaggcctc ccgaggcaga gaacagcagc ccggattcag ggaagcagct 8580
ggtgcactac acagcgcagc cgctgttcct gctggacccc ggctccgtgg acaccgggag 8640
caacgacctg ccggtgctgt ttgagctggg agagggctcc tacttctccg aaggggacgg 8700
cttcgccgag gaccccacca tctccctgct gacaggctcg gagcctccca aagccaagga 8760
ccccactgtc tccgctagcg agggcagagg aagtctgcta acatgcgatt acaaagacga 8820
tgacgataag taaaatcaac ctctggatta caaaatttgt gaaagattga ctggtattct 8880
taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc 8940
tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt tgctgtctct 9000
ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga 9060
cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg ggactttcgc 9120
tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc gctgctggac 9180
aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaaat catcgtcctt 9240
tccttggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct tctgctacgt 9300
cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc 9360
tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg ccgcctcccc 9420
gcatcgatac cgtcgatcct gtgccttcta gttgccagcc atctgttgtt tgcccctccc 9480
ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg 9540
aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg 9600
acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta 9660
tgg 9663
<210> 147
<211> 1082
<212> DNA
<213> 人工序列(artificial sequence)
<400> 147
gtcccctcca ccccacagtg gggcgattcg catattaagg tgacgcgtgt ggcctcgaac 60
accgagcgac cctgcagcga cccgcttaac tggaacgcgt gccaccatgg tgagcaaggg 120
cgaggaggat aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg 180
ctccgtgaac ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg 240
cacccagacc gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat 300
cctgtcccct cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc 360
cgactacttg aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga 420
ggacggcggc gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta 480
caaggtgaag ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac 540
catgggctgg gaggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga 600
gatcaagcag aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac 660
ctacaaggcc aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga 720
catcacctcc cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg 780
ccactccacc ggcggcatgg acgagctgta caagtaaacc ggttaggggc ccgtttaaac 840
ccgctgatca gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc 900
cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga 960
aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga 1020
cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat 1080
gg 1082
<210> 148
<211> 1053
<212> DNA
<213> 人工序列(artificial sequence)
<400> 148
gtcccctcca ccccacagtg gggcgataga gggtatataa tggaagctcg acttccagct 60
ctggaacgcg tgccaccatg gtgagcaagg gcgaggagga taacatggcc atcatcaagg 120
agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag ttcgagatcg 180
agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg aaggtgacca 240
agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg tacggctcca 300
aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc ttccccgagg 360
gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc gtgacccagg 420
actcctccct gcaggacggc gagttcatct acaaggtgaa gctgcgcggc accaacttcc 480
cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc tccgagcgga 540
tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gaggctgaag ctgaaggacg 600
gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc gtgcagctgc 660
ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag gactacacca 720
tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg gacgagctgt 780
acaagtaaac cggttagggg cccgtttaaa cccgctgatc agcctcgact gtgccttcta 840
gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca 900
ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc 960
attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata 1020
gcaggcatgc tggggatgcg gtgggctcta tgg 1053
<210> 149
<211> 1409
<212> DNA
<213> 人工序列(artificial sequence)
<400> 149
gtcccctcca ccccacagtg gggcgatctt caagaattcc tcgagtttac tccctatcag 60
tgatagagaa cgtatgaaga gtttactccc tatcagtgat agagaacgta tgcagacttt 120
actccctatc agtgatagag aacgtataag gagtttactc cctatcagtg atagagaacg 180
tatgaccagt ttactcccta tcagtgatag agaacgtatc tacagtttac tccctatcag 240
tgatagagaa cgtatatcca gtttactccc tatcagtgat agagaacgta taagctttag 300
gcgtgtacgg tgggcgccta taaaagcaga gctcgtttag tgaaccgtca gatcgcctgg 360
agcaattcca caacactttt gtcttatacc aactttccgt accacttcct accctcgtaa 420
aacgcgtgcc accatggtga gcaagggcga ggaggataac atggccatca tcaaggagtt 480
catgcgcttc aaggtgcaca tggagggctc cgtgaacggc cacgagttcg agatcgaggg 540
cgagggcgag ggccgcccct acgagggcac ccagaccgcc aagctgaagg tgaccaaggg 600
tggccccctg cccttcgcct gggacatcct gtcccctcag ttcatgtacg gctccaaggc 660
ctacgtgaag caccccgccg acatccccga ctacttgaag ctgtccttcc ccgagggctt 720
caagtgggag cgcgtgatga acttcgagga cggcggcgtg gtgaccgtga cccaggactc 780
ctccctgcag gacggcgagt tcatctacaa ggtgaagctg cgcggcacca acttcccctc 840
cgacggcccc gtaatgcaga agaagaccat gggctgggag gcctcctccg agcggatgta 900
ccccgaggac ggcgccctga agggcgagat caagcagagg ctgaagctga aggacggcgg 960
ccactacgac gctgaggtca agaccaccta caaggccaag aagcccgtgc agctgcccgg 1020
cgcctacaac gtcaacatca agttggacat cacctcccac aacgaggact acaccatcgt 1080
ggaacagtac gaacgcgccg agggccgcca ctccaccggc ggcatggacg agctgtacaa 1140
gtaaaccggt taggggcccg tttaaacccg ctgatcagcc tcgactgtgc cttctagttg 1200
ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc 1260
cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc 1320
tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag 1380
gcatgctggg gatgcggtgg gctctatgg 1409
<210> 150
<211> 1081
<212> DNA
<213> 人工序列(artificial sequence)
<400> 150
gtcccctcca ccccacagtg gggcgaggta ggcgtgtacg gtgggaggcc tatataagca 60
gagctcgttt agtgaaccgt cagatcgcct ggaacgcgtg ccaccatggt gagcaagggc 120
gaggaggata acatggccat catcaaggag ttcatgcgct tcaaggtgca catggagggc 180
tccgtgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc 240
acccagaccg ccaagctgaa ggtgaccaag ggtggccccc tgcccttcgc ctgggacatc 300
ctgtcccctc agttcatgta cggctccaag gcctacgtga agcaccccgc cgacatcccc 360
gactacttga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 420
gacggcggcg tggtgaccgt gacccaggac tcctccctgc aggacggcga gttcatctac 480
aaggtgaagc tgcgcggcac caacttcccc tccgacggcc ccgtaatgca gaagaagacc 540
atgggctggg aggcctcctc cgagcggatg taccccgagg acggcgccct gaagggcgag 600
atcaagcaga ggctgaagct gaaggacggc ggccactacg acgctgaggt caagaccacc 660
tacaaggcca agaagcccgt gcagctgccc ggcgcctaca acgtcaacat caagttggac 720
atcacctccc acaacgagga ctacaccatc gtggaacagt acgaacgcgc cgagggccgc 780
cactccaccg gcggcatgga cgagctgtac aagtaaaccg gttaggggcc cgtttaaacc 840
cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 900
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 960
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 1020
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 1080
g 1081
<210> 151
<211> 119
<212> DNA
<213> 人工序列(artificial sequence)
<400> 151
gtcccctcca ccccacagtg ggggtcccct ccaccccaca gtggggacgt agctagcggt 60
aggcgtgtac ggtgggaggc ctatataagc agagctcgtt tagtgaaccg tcagatcgc 119
<210> 152
<211> 124
<212> DNA
<213> 人工序列(artificial sequence)
<400> 152
gtcccctcca ccccacagtg gggacgtagt cccctccacc ccacagtggg gacgtagcta 60
gcggtaggcg tgtacggtgg gaggcctata taagcagagc tcgtttagtg aaccgtcaga 120
tcgc 124
<210> 153
<211> 134
<212> DNA
<213> 人工序列(artificial sequence)
<400> 153
gtcccctcca ccccacagtg gggacgtaaa gggtttacgt cccctccacc ccacagtggg 60
gacgtagcta gcggtaggcg tgtacggtgg gaggcctata taagcagagc tcgtttagtg 120
aaccgtcaga tcgc 134
<210> 154
<211> 154
<212> DNA
<213> 人工序列(artificial sequence)
<400> 154
gtcccctcca ccccacagtg gggacgtaac aaccactacc tgagcgtgca gggtttacgt 60
cccctccacc ccacagtggg gacgtagcta gcggtaggcg tgtacggtgg gaggcctata 120
taagcagagc tcgtttagtg aaccgtcaga tcgc 154
<210> 155
<211> 169
<212> DNA
<213> 人工序列(artificial sequence)
<400> 155
gtcccctcca ccccacagtg gggacgtaac aaccactaca gaccccaacg agaactgagc 60
gtgcagggtt tacgtcccct ccaccccaca gtggggacgt agctagcggt aggcgtgtac 120
ggtgggaggc ctatataagc agagctcgtt tagtgaaccg tcagatcgc 169
<210> 156
<211> 219
<212> DNA
<213> 人工序列(artificial sequence)
<400> 156
gtcccctcca ccccacagtg gggacgtaac aaccactaca gaccctgaaa tggactatgt 60
agaagacaaa ctgtccagtg aatttgtctt caatccaacg agaactgagc gtgcagggtt 120
tacgtcccct ccaccccaca gtggggacgt agctagcggt aggcgtgtac ggtgggaggc 180
ctatataagc agagctcgtt tagtgaaccg tcagatcgc 219
<210> 157
<211> 110
<212> DNA
<213> 人工序列(artificial sequence)
<400> 157
ctgacgatac cgcgtgatgt gggtgcgaat acgcgtagtc cggctagcgg taggcgtgta 60
cggtgggagg cctatataag cagagctcgt ttagtgaacc gtcagatcgc 110
<210> 158
<211> 150
<212> DNA
<213> 人工序列(artificial sequence)
<400> 158
ctgacgatac cgcgtgatgt gggtgcgaat acgcgtagtc cgttgcgtat atacgcggtc 60
ctgacgatac cgcgtgatgt gggctagcgg taggcgtgta cggtgggagg cctatataag 120
cagagctcgt ttagtgaacc gtcagatcgc 150
<210> 159
<211> 210
<212> DNA
<213> 人工序列(artificial sequence)
<400> 159
ctgacgatac cgcgtgatgt gggtgcgaat acgcgtagtc cgttgcgtat atacgcgatc 60
ctgacgatac cgcgtgatgt gggtgcgaat acgcgtagtc cgttgcgtat atacgcggtc 120
ctgacgatac cgcgtgatgt gggctagcgg taggcgtgta cggtgggagg cctatataag 180
cagagctcgt ttagtgaacc gtcagatcgc 210
<210> 160
<211> 270
<212> DNA
<213> 人工序列(artificial sequence)
<400> 160
ctgacgatac cgcgtgatgt gggtgcgaat acgcgtagtc cgttgcgtat atacgcggtc 60
ctgacgatac cgcgtgatgt gggctagcgg taggcgtgta cgccgatatt aatcgggatc 120
ctgacgatac cgcgtgatgt gggtgcgaat acgcgtagtc cgttgcgtat atacgcggtc 180
ctgacgatac cgcgtgatgt gggctagcgg taggcgtgta cggtgggagg cctatataag 240
cagagctcgt ttagtgaacc gtcagatcgc 270
<210> 161
<211> 13597
<212> DNA
<213> 人工序列(artificial sequence)
<400> 161
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
gagtcgctgc gttgccttcg ccccgtgccc cgctccgcgc cgcctcgcgc cgcccgcccc 720
ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780
gctgtaatta gcgcttggtt taatgacggc tcgtttcttt tctgtggctg cgtgaaagcc 840
ttaaagggct ccgggagggc cctttgtgcg ggggggagcg gctcgggggg tgcgtgcgtg 900
tgtgtgtgcg tggggagcgc cgcgtgcggc ccgcgctgcc cggcggctgt gagcgctgcg 960
ggcgcggcgc ggggctttgt gcgctccgcg tgtgcgcgag gggagcgcgg ccgggggcgg 1020
tgccccgcgg tgcggggggg ctgcgagggg aacaaaggct gcgtgcgggg tgtgtgcgtg 1080
ggggggtgag cagggggtgt gggcgcggcg gtcgggctgt aacccccccc tgcacccccc 1140
tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtgcgg ggcgtggcgc 1200
ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc 1260
gcctcgggcc ggggagggct cgggggaggg gcgcggcggc cccggagcgc cggcggctgt 1320
cgaggcgcgg cgagccgcag ccattgcctt ttatggtaat cgtgcgagag ggcgcaggga 1380
cttcctttgt cccaaatctg gcggagccga aatctgggag gcgccgccgc accccctcta 1440
gcgggcgcgg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg agggccttcg 1500
tgcgtcgccg cgccgccgtc cccttctcca tctccagcct cggggctgcc gcagggggac 1560
ggctgccttc gggggggacg gggcagggcg gggttcggct tctggcgtgt gaccggcggc 1620
tctagagcct ctgctaacca tgttcatgcc ttcttctttt tcctacagat ccttaatatg 1680
ggccccgaca tcgtgatgac ccagagcccc agcagcctga gcgccagcgt gggcgaccgc 1740
gtgaccatca cctgccgcag cagcaccggc gccgtgacca ccagcaacta cgccagctgg 1800
gtgcaggaga agcccggcaa gctgttcaag ggcctgatcg gcggcaccaa caaccgcgcc 1860
cccggcgtgc ccagccgctt cagcggcagc ctgatcggcg acaaggccac cctgaccatc 1920
agcagcctgc agcccgagga cttcgccacc tacttctgcg ccctgtggta cagcaaccac 1980
tgggtgttcg gccagggcac caaggtggag ctgaagcgcg gcggcggcgg cagcggcggc 2040
ggcggcagcg gcggcggcgg cagcagcggc ggcggcagcg aggtgaagct gctggagagc 2100
ggcggcggcc tggtgcagcc cggcggcagc ctgaagctga gctgcgccgt gagcggcttc 2160
agcctgaccg actacggcgt gaactgggtg cgccaggccc ccggccgcgg cctggagtgg 2220
atcggcgtga tctggggcga cggcatcacc gactacaaca gcgccctgaa ggaccgcttc 2280
atcatcagca aggacaacgg caagaacacc gtgtacctgc agatgagcaa ggtgcgcagc 2340
gacgacaccg ccctgtacta ctgcgtgacc ggcctgttcg actactgggg ccagggcacc 2400
ctggtgaccg tgagcagcta cccatacgat gttccagatt acgctggtgg aggcggaggt 2460
tctgggggag gaggtagtgg cggtggtggt tcaggaggcg gcggaagccc taagaaaaag 2520
aggaaggtgg cggccgctgg atccccttca gggcagatca gcaaccaggc cctggctctg 2580
gcccctagct ccgctccagt gctggcccag actatggtgc cctctagtgc tatggtgcct 2640
ctggcccagc cacctgctcc agcccctgtg ctgaccccag gaccacccca gtcactgagc 2700
gctccagtgc ccaagtctac acaggccggc gaggggactc tgagtgaagc tctgctgcac 2760
ctgcagttcg acgctgatga ggacctggga gctctgctgg ggaacagcac cgatcccgga 2820
gtgttcacag atctggcctc cgtggacaac tctgagtttc agcagctgct gaatcagggc 2880
gtgtccatgt ctcatagtac agccgaacca atgctgatgg agtaccccga agccattacc 2940
cggctggtga ccggcagcca gcggcccccc gaccccgctc caactcccct gggaaccagc 3000
ggcctgccta atgggctgtc cggagatgaa gacttctcaa gcatcgctga tatggacttt 3060
agtgccctgc tgtcacagat ttcctctagt gggcagggag gaggtggaag cggcttcagc 3120
gtggacacca gtgccctgct ggacctgttc agcccctcgg tgaccgtgcc cgacatgagc 3180
ctgcctgacc ttgacagcag cctggccagt atccaagagc tcctgtctcc ccaggagccc 3240
cccaggcctc ccgaggcaga gaacagcagc ccggattcag ggaagcagct ggtgcactac 3300
acagcgcagc cgctgttcct gctggacccc ggctccgtgg acaccgggag caacgacctg 3360
ccggtgctgt ttgagctggg agagggctcc tacttctccg aaggggacgg cttcgccgag 3420
gaccccacca tctccctgct gacaggctcg gagcctccca aagccaagga ccccactgtc 3480
tccgctagcg agggcagagg aagtctgcta acatgcgatt acaaagacga tgacgataag 3540
taaaatcaac ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt 3600
gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc 3660
cgtatggctt tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag 3720
ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc 3780
actggttggg gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc 3840
cctattgcca cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg 3900
ctgttgggca ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg 3960
ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc 4020
ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt 4080
cttcgccttc gccctcagac gagtcggatc tccctttggg ccgcctcccc gcatcgatac 4140
cgtcgatcct gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 4200
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 4260
gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg 4320
ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tgggaattcc 4380
gaagttttaa ttaacgatcc tagttattaa tagtaatcaa ttacggggtc attagttcat 4440
agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 4500
cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 4560
gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 4620
catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 4680
gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 4740
gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt cactctcccc 4800
atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 4860
gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg gggcgagggg 4920
cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 4980
tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 5040
gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gcgccgcctc gcgccgcccg 5100
ccccggctct gactgaccgc gttactccca caggtgagcg ggcgggacgg cccttctcct 5160
ccgggctgta attagcgctt ggtttaatga cggctcgttt cttttctgtg gctgcgtgaa 5220
agccttaaag ggctccggga gggccctttg tgcggggggg agcggctcgg ggggtgcgtg 5280
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggcccgcgc tgcccggcgg ctgtgagcgc 5340
tgcgggcgcg gcgcggggct ttgtgcgctc cgcgtgtgcg cgaggggagc gcggccgggg 5400
gcggtgcccc gcggtgcggg ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg 5460
cgtggggggg tgagcagggg gtgtgggcgc ggcggtcggg ctgtaacccc cccctgcacc 5520
cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt gcggggcgtg 5580
gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 5640
ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggccccgga gcgccggcgg 5700
ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg taatcgtgcg agagggcgca 5760
gggacttcct ttgtcccaaa tctggcggag ccgaaatctg ggaggcgccg ccgcaccccc 5820
tctagcgggc gcgggcgaag cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc 5880
ttcgtgcgtc gccgcgccgc cgtccccttc tccatctcca gcctcggggc tgccgcaggg 5940
ggacggctgc cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg 6000
cggctctaga gcctctgcta accatgttca tgccttcttc tttttcctac agatccttaa 6060
ttaactaggc tacgcgcgcc accatgccca agaagaagcg caaggtggga cgcgtctgca 6120
ggatatcaag cttgcggtac cgcgggcccg ggatcgccac catggacaag aagtacagca 6180
tcggcctggc catcggcacc aactctgtgg gctgggccgt gatcaccgac gagtacaagg 6240
tgcccagcaa gaaattcaag gtgctgggca acaccgaccg gcacagcatc aagaagaacc 6300
tgatcggcgc cctgctgttc gacagcggag aaacagccga ggccacccgg ctgaagagaa 6360
ccgccagaag aagatacacc agacggaaga accggatctg ctatctgcaa gagatcttca 6420
gcaacgagat ggccaaggtg gacgacagct tcttccacag actggaagag tccttcctgg 6480
tggaagagga taagaagcac gagcggcacc ccatcttcgg caacatcgtg gacgaggtgg 6540
cctaccacga gaagtacccc accatctacc acctgagaaa gaaactggtg gacagcaccg 6600
acaaggccga cctgcggctg atctatctgg ccctggccca catgatcaag ttccggggcc 6660
acttcctgat cgagggcgac ctgaaccccg acaacagcga cgtggacaag ctgttcatcc 6720
agctggtgca gacctacaac cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg 6780
acgccaaggc catcctgtct gccagactga gcaagagcag acggctggaa aatctgatcg 6840
cccagctgcc cggcgagaag aagaatggcc tgttcggcaa cctgattgcc ctgagcctgg 6900
gcctgacccc caacttcaag agcaacttcg acctggccga ggatgccaaa ctgcagctga 6960
gcaaggacac ctacgacgac gacctggaca acctgctggc ccagatcggc gaccagtacg 7020
ccgacctgtt tctggccgcc aagaacctgt ccgacgccat cctgctgagc gacatcctga 7080
gagtgaacac cgagatcacc aaggcccccc tgagcgcctc tatgatcaag agatacgacg 7140
agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt 7200
acaaagagat tttcttcgac cagagcaaga acggctacgc cggctacatc gatggcggag 7260
ccagccagga agagttctac aagttcatca agcccatcct ggaaaagatg gacggcaccg 7320
aggaactgct cgtgaagctg aacagagagg acctgctgcg gaagcagcgg accttcgaca 7380
acggcagcat cccccaccag atccacctgg gagagctgca cgccattctg cggcggcagg 7440
aagattttta cccattcctg aaggacaacc gggaaaagat cgagaagatc ctgaccttcc 7500
gcatccccta ctacgtgggc cctctggcca ggggaaacag cagattcgcc tggatgacca 7560
gaaagagcga ggaaaccatc accccctgga acttcgagga agtggtggac aagggcgcca 7620
gcgcccagag cttcatcgag cggatgacca acttcgataa gaacctgccc aacgagaagg 7680
tgctgcccaa gcacagcctg ctgtacgagt acttcaccgt gtacaacgag ctgaccaaag 7740
tgaaatacgt gaccgaggga atgagaaagc ccgccttcct gagcggcgag cagaaaaaag 7800
ccatcgtgga cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag ctgaaagagg 7860
actacttcaa gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg gaagatcggt 7920
tcaacgcctc cctgggcaca taccacgatc tgctgaaaat tatcaaggac aaggacttcc 7980
tggacaatga ggaaaacgag gacattctgg aagatatcgt gctgaccctg acactgtttg 8040
aggacagaga gatgatcgag gaacggctga aaacctatgc ccacctgttc gacgacaaag 8100
tgatgaagca gctgaagcgg cggagataca ccggctgggg caggctgagc cggaagctga 8160
tcaacggcat ccgggacaag cagtccggca agacaatcct ggatttcctg aagtccgacg 8220
gcttcgccaa cagaaacttc atgcagctga tccacgacga cagcctgacc tttaaagagg 8280
acatccagaa agcccaggtg tccggccagg gcgatagcct gcacgagcac attgccaatc 8340
tggccggcag ccccgccatt aagaagggca tcctgcagac agtgaaggtg gtggacgagc 8400
tcgtgaaagt gatgggccgg cacaagcccg agaacatcgt gatcgaaatg gccagagaga 8460
accagaccac ccagaaggga cagaagaaca gccgcgagag aatgaagcgg atcgaagagg 8520
gcatcaaaga gctgggcagc cagatcctga aagaacaccc cgtggaaaac acccagctgc 8580
agaacgagaa gctgtacctg tactacctgc agaatgggcg ggatatgtac gtggaccagg 8640
aactggacat caaccggctg tccgactacg atgtggacgc tatcgtgcct cagagctttc 8700
tgaaggacga ctccatcgat aacaaagtgc tgactcggag cgacaagaac cggggcaaga 8760
gcgacaacgt gccctccgaa gaggtcgtga agaagatgaa gaactactgg cgccagctgc 8820
tgaatgccaa gctgattacc cagaggaagt tcgacaatct gaccaaggcc gagagaggcg 8880
gcctgagcga actggataag gccggcttca tcaagagaca gctggtggaa acccggcaga 8940
tcacaaagca cgtggcacag atcctggact cccggatgaa cactaagtac gacgagaacg 9000
acaaactgat ccgggaagtg aaagtgatca ccctgaagtc caagctggtg tccgatttcc 9060
ggaaggattt ccagttttac aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg 9120
cctacctgaa cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg 9180
agttcgtgta cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc 9240
aggaaatcgg caaggctacc gccaagtact tcttctacag caacatcatg aactttttca 9300
agaccgagat taccctggcc aacggcgaga tccggaagcg gcctctgatc gagacaaacg 9360
gcgaaacagg cgagatcgtg tgggataagg gccgggactt tgccaccgtg cggaaagtgc 9420
tgtctatgcc ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca 9480
aagagtctat cctgcccaag aggaacagcg acaagctgat cgccagaaag aaggactggg 9540
accctaagaa gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg ctggtggtgg 9600
ccaaagtgga aaagggcaag tccaagaaac tgaagagtgt gaaagagctg ctggggatca 9660
ccatcatgga aagaagcagc ttcgagaaga atcccatcga ctttctggaa gccaagggct 9720
acaaagaagt gaaaaaggac ctgatcatca agctgcctaa gtactccctg ttcgagctgg 9780
aaaacggccg gaagagaatg ctggcctctg ccggcgaact gcagaaggga aacgaactgg 9840
ccctgccctc caaatatgtg aacttcctgt acctggccag ccactatgag aagctgaagg 9900
gctcccccga ggataatgag cagaaacagc tgtttgtgga acagcacaaa cactacctgg 9960
acgagatcat cgagcagatc agcgagttct ccaagagagt gatcctggcc gacgctaatc 10020
tggacaaggt gctgagcgcc tacaacaagc acagagacaa gcctatcaga gagcaggccg 10080
agaatatcat ccacctgttt accctgacca atctgggagc ccctgccgcc ttcaagtact 10140
ttgacaccac catcgaccgg aagaggtaca ccagcaccaa agaggtgctg gacgccaccc 10200
tgatccacca gagcatcacc ggcctgtacg agacacggat cgacctgtct cagctgggag 10260
gcgacgccta tccctatgac gtgcccgatt atgccagcct gggcagcggc tcccccaaga 10320
aaaaacgcaa ggtggaagat cctaagaaaa agcggaaagt ggacggcatt ggtagtggga 10380
gcaacggcag cagcggatcc aacggtccga ctgacgccgc ggaagaagaa cttttgagca 10440
agaattatca tcttgagaac gaagtggctc gtcttaagaa aggttctggc agtggagaag 10500
aactgctttc aaagaattac cacctggaaa atgaggtagc tagactgaaa aaggggagcg 10560
gaagtgggga ggagttgctg agcaaaaatt atcatttgga gaacgaagta gcacgactaa 10620
agaaagggtc cggatcgggt gaggagttac tctcgaaaaa ttatcatctc gaaaacgaag 10680
tggctcggct aaaaaagggc agtggttctg gagaagagct attatctaaa aactaccacc 10740
tcgaaaatga ggtggcacgc ttaaaaaagg gaagtggcag tggtgaagag ctactatcca 10800
agaattatca tcttgagaac gaggtagcgc gtttgaagaa gggttccggc tcaggagagg 10860
aactgctctc gaagaactat catcttgaaa atgaggtcgc tcgattaaaa aagggatcgg 10920
gcagtggtga ggaactactt tcaaagaatt accacctcga aaacgaagta gctcgattaa 10980
agaaaggttc agggtcgggt gaagaattac tgagtaaaaa ttatcatctg gaaaatgagg 11040
tagcgagact aaaaaagggg agtggttctg gcgaggaatt gctatcgaaa aattatcatc 11100
ttgagaacga agttgctagg ctcaaaaagg gctcaggctc aggcaccgcg gtaaacatag 11160
gtggtggaac cggtccgatg gatctacagc ggccgcaagg tggaggtgga cccaagaaga 11220
agcgcaaggt gggaagcgga gtaagattac aaagacgatg acgataagta aaatcaacct 11280
ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc tccttttacg 11340
ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg tatggctttc 11400
attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt gtggcccgtt 11460
gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac tggttggggc 11520
attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc tattgccacg 11580
gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct gttgggcact 11640
gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct cgcctgtgtt 11700
gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct caatccagcg 11760
gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct tcgccttcgc 11820
cctcagacga gtcggatctc cctttgggcc gcctccccgc atcgataccg tcgatcctgt 11880
gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 11940
aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 12000
taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 12060
agacaatagc aggcatgctg gggatgcggt gggctctatg ggaattccga agttcctatt 12120
ctctagaaag tataggaact tcaggtctga agaggagttt acgtccagcg cgatgggtag 12180
gggaggcgct tttcccaagg cagtctggag catgcgcttt agcagccccg ctgggcactt 12240
ggcgctacac aagtggcctc tggcctcgca cacattccac atccaccggt aggcgccaac 12300
cggctccgtt ctttggtggc cccttcgcgc caccttctac tcctccccta gtcaggaagt 12360
tcccccccgc cccgcagctc gcgtcgtgca ggacgtgaca aatggaagta gcacgtctca 12420
ctagtctcgt gcagatggac agcaccgctg agcaatggaa gcgggtaggc ctttggggca 12480
gcggccaata gcagctttgc tccttcgctt tctgggctca gaggctggga aggggtgggt 12540
ccgggggcgg gctcaggggc gggctcaggg gcggggcggg cgcccgaagg tcctccggag 12600
gcccggcatt ctgcacgctt caaaagcgca cgtctgccgc gctgttctcc tcttcctcat 12660
ctccgggcct ttcgacctgc agcctgttga caattaatca tcggcatagt atatcggcat 12720
agtataatac gacaaggtga ggaactaaac catgaccgag tacaagccca cggtgcgcct 12780
cgccacccgc gacgacgtcc ccagggccgt acgcaccctc gccgccgcgt tcgccgacta 12840
ccccgccacg cgccacaccg tcgatccgga ccgccacatc gagcgggtca ccgagctgca 12900
agaactcttc ctcacgcgcg tcgggctcga catcggcaag gtgtgggtcg cggacgacgg 12960
cgccgcggtg gcggtctgga ccacgccgga gagcgtcgaa gcgggggcgg tgttcgccga 13020
gatcggcccg cgcatggccg agttgagcgg ttcccggctg gccgcgcagc aacagatgga 13080
aggcctcctg gcgccgcacc ggcccaagga gcccgcgtgg ttcctggcca ccgtcggcgt 13140
ctcgcccgac caccagggca agggtctggg cagcgccgtc gtgctccccg gagtggaggc 13200
ggccgagcgc gccggggtgc ccgccttcct ggaaacctcc gcgccccgca acctcccctt 13260
ctacgagcgg ctcggcttca ccgtcaccgc cgacgtcgag gtgcccgaag gaccgcgcac 13320
ctggtgcatg acccgcaagc ccggtgcctg aaaacccgct gatcagcctc gactgtgcct 13380
tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 13440
gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 13500
tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 13560
aatagcaggc atgctgggga tgcggtgggc tctatgg 13597
<210> 162
<211> 2232
<212> DNA
<213> 人工序列(artificial sequence)
<400> 162
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
tatcatgtct ggaaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 180
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 240
catcaatgta tcttatcatg tcctgaaact tgtttattgc agcttataat ggttacaaat 300
aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 360
gtttgtccaa actcatcaat gtatcttatc atgtctggat cggaggacga ctattaatcg 420
ggatccgttt acgtcccctc caccccacag tggggacgta acaaatggac tatatcgtag 480
aagagtttac gtcccctcca ccccacagtg gggacgtatc caacgagaac tgagcgtgca 540
gggtttacgt cccctccacc ccacagtggg gacgtagcta gcggtaggcg tgtacggtgg 600
gaggcctata taagcagagc tcgtttagtg aaccgtcaga tcgcctggaa cgcgtgccac 660
catggtgagc aagggcgagg aggataacat ggccatcatc aaggagttca tgcgcttcaa 720
ggtgcacatg gagggctccg tgaacggcca cgagttcgag atcgagggcg agggcgaggg 780
ccgcccctac gagggcaccc agaccgccaa gctgaaggtg accaagggtg gccccctgcc 840
cttcgcctgg gacatcctgt cccctcagtt catgtacggc tccaaggcct acgtgaagca 900
ccccgccgac atccccgact acttgaagct gtccttcccc gagggcttca agtgggagcg 960
cgtgatgaac ttcgaggacg gcggcgtggt gaccgtgacc caggactcct ccctgcagga 1020
cggcgagttc atctacaagg tgaagctgcg cggcaccaac ttcccctccg acggccccgt 1080
aatgcagaag aagaccatgg gctgggaggc ctcctccgag cggatgtacc ccgaggacgg 1140
cgccctgaag ggcgagatca agcagaggct gaagctgaag gacggcggcc actacgacgc 1200
tgaggtcaag accacctaca aggccaagaa gcccgtgcag ctgcccggcg cctacaacgt 1260
caacatcaag ttggacatca cctcccacaa cgaggactac accatcgtgg aacagtacga 1320
acgcgccgag ggccgccact ccaccggcgg catggacgag ctgtacaagt aaaccggaat 1380
caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct 1440
tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg 1500
gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg 1560
cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt 1620
tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc cctccctatt 1680
gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 1740
ggcactgaca attccgtggt gttgtcgggg aagctgacgt cctttccatg gctgctcgcc 1800
tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc ggccctcaat 1860
ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc gcgtctccgc 1920
cttcgccctc agacgagtcg gatctccctt tggccgcctc cccgccaccg gttaggggcc 1980
cgtttaaacc cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 2040
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 2100
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 2160
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 2220
gggctctatg gc 2232
<210> 163
<211> 2154
<212> DNA
<213> 人工序列(artificial sequence)
<400> 163
tcaaaaggag gggagagggg gtaaaaaaat gctgcactgt gcggcgaggc cggtgagtga 60
gcgacgcgga gccaatcagc gcccgccgtt ccgaaagttg ccttttatgg ctcgagtggc 120
cgctgtggcg tcctataaaa cccggcggcg caacgcgcag ccactgtcga gtcgcgtcca 180
cccgcgagca cagcttcttt gcagctcctt cgttgccggt ccacacccgc caccaggtaa 240
gcagggacgc cgggcccagc gggccttcgc tctctcgtgg ctagtacctc actgcagggt 300
cctgaggatc actcagaacg gacaccatgg gcgggtggag ggtggtgccg ggccgcggag 360
cggacactgg cacagccaac tttacgccta gcgtgtagac tctttgcagc cacattcccg 420
cggtgtagac actcgtgggc ccgctcccgc tcggtgcgtg gggcttgggg acacactagg 480
gtcgcggtgt gggcatttga tgagccggtg cggcttgcgg gtgttaaaag ccgtattagg 540
tccatcttga gagtacacag tattgggaac cagacgctac gatcacgcct caatggcctc 600
tgggtctttg tccaaaccgg tttgcctatt cggcttgccg ggcgggcggg cgggcgggcg 660
ggcgcggcag ggccggctcg gccgggtggg ggctgggatg ccactgcgcg tgcgctctct 720
atcactgggc atcgaggcgc gtgtgcgcta gggagggagc tcttcctctc cccctcttcc 780
tagttagctg cgcgtgcgta aggtgaaata ttaattaact cgactaggga taacagggta 840
attgtttgaa tgaggcttca gtactttaca gaatcgttgc ctgcacatct tggaaacact 900
tgctgggatt acttcttcag gttaacccaa cagaaggctc gaagaaggta tattgctgtt 960
gacagtgagc gcgacaagct ggagtacaac tacaatagtg aagccacaga tgtattgtag 1020
ttgtactcca gcttgtcatg cctactgcct cggacttcaa gggctacgat gtcccctcca 1080
ccccacagtg gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc 1140
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgatc caagaaggta tattgctgtt 1200
gacagtgagc gcgaagatcc gccacaacat cgagatagtg aagccacaga tgtatctcga 1260
tgttgtggcg gatcttcatg cctactgcct cggacttcaa ggggctactt taggagcaat 1320
tatcttgttt actaaaactg aataccttgc tatctctttg atacattttt acaaagctga 1380
attaaaatgg tataaattaa atcactttgg cgcgccttga ggctgggagc gcggctgccc 1440
ggggttgggc gagggcgggg ccgttgtccg gaaggggcgg ggtcacagtg gcacgggcgc 1500
cttgtttgcg cttcctgctg ggtgtggtcg cctcccgcgc gcgcacaagc cgcccgtcgg 1560
cgcagtgtag gcggagcttg cgcccgtttg gggagggggc ggaggtctgg cttcctgccc 1620
taggtccgcc tccgggccag cgtttgcctt ttatggtaat aatgcggccg gtctgcgctt 1680
cctttgtccc ctgagcttgg gcgcgcgccc cctggcggct cgagcccgcg gcttgccgga 1740
agtgggcagg gcggcagcgg ctgctcttgg cggccccgag gtgactatag ccttcttttg 1800
tgtcttgata gttcgccatg gatgacgata tcgctgcgct ggtcgtcgac aacggctccg 1860
gcatgtgcaa agccggcttc gcgggcgacg atgctccccg ggctgtattc ccctccatcg 1920
tgggccgccc taggcaccag gtaagtgacc tgttactttg ggagtggcaa gcctggggtt 1980
ttcttgggga tcgatgccgg tgctaagaag gctgttccct tccacagggt gtgatggtgg 2040
gaatgggtca gaaggactcc tatgtgggtg acgaggccca gagcaagaga ggtatcctga 2100
ccctgaagta ccccattgaa catggcattg ttaccaactg ggacgacatg gaga 2154
<210> 164
<211> 1688
<212> DNA
<213> 人工序列(artificial sequence)
<400> 164
tcaaaaggag gggagagggg gtaaaaaaat gctgcactgt gcggcgaggc cggtgagtga 60
gcgacgcgga gccaatcagc gcccgccgtt ccgaaagttg ccttttatgg ctcgagtggc 120
cgctgtggcg tcctataaaa cccggcggcg caacgcgcag ccactgtcga gtcgcgtcca 180
cccgcgagca cagcttcttt gcagctcctt cgttgccggt ccacacccgc caccaggtaa 240
gcagggacgc cgggcccagc gggccttcgc tctctcgtgg ctagtacctc actgcagggt 300
cctgaggatc actcagaacg gacaccatgg gcgggtggag ggtggtgccg ggccgcggag 360
cggacactgg cacagccaac tttacgccta gcgtgtagac tctttgcagc cacattcccg 420
cggtgtagac actcgtgggc ccgctcccgc tcggtgcgtg gggcttgggg acacactagg 480
gtcgcggtgt gggcatttga tgagccggtg cggcttgcgg gtgttaaaag ccgtattagg 540
tccatcttga gagtacacag tattgggaac cagacgctac gatcacgcct caatggcctc 600
tgggtctttg tccaaaccgg tttgcctatt cggcttgccg ggcgggcggg cgggcgggcg 660
ggcgcggcag ggccggctcg gccgggtggg ggctgggatg ccactgcgcg tgcgctctct 720
atcactgggc atcgaggcgc gtgtgcgcta gggagggagc tcttcctctc cccctcttcc 780
tagttagctg cgcgtgcgta aggtgaaata ttaattaagt gtcccctcca ccccacagtg 840
gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc cgttatcaac 900
ttgaaaaagt ggcaccgagt cggtgctgat tatttcttgc agggcgcgcc ttgaggctgg 960
gagcgcggct gcccggggtt gggcgagggc ggggccgttg tccggaaggg gcggggtcac 1020
agtggcacgg gcgccttgtt tgcgcttcct gctgggtgtg gtcgcctccc gcgcgcgcac 1080
aagccgcccg tcggcgcagt gtaggcggag cttgcgcccg tttggggagg gggcggaggt 1140
ctggcttcct gccctaggtc cgcctccggg ccagcgtttg ccttttatgg taataatgcg 1200
gccggtctgc gcttcctttg tcccctgagc ttgggcgcgc gccccctggc ggctcgagcc 1260
cgcggcttgc cggaagtggg cagggcggca gcggctgctc ttggcggccc cgaggtgact 1320
atagccttct tttgtgtctt gatagttcgc catggatgac gatatcgctg cgctggtcgt 1380
cgacaacggc tccggcatgt gcaaagccgg cttcgcgggc gacgatgctc cccgggctgt 1440
attcccctcc atcgtgggcc gccctaggca ccaggtaagt gacctgttac tttgggagtg 1500
gcaagcctgg ggttttcttg gggatcgatg ccggtgctaa gaaggctgtt cccttccaca 1560
gggtgtgatg gtgggaatgg gtcagaagga ctcctatgtg ggtgacgagg cccagagcaa 1620
gagaggtatc ctgaccctga agtaccccat tgaacatggc attgttacca actgggacga 1680
catggaga 1688
<210> 165
<211> 1824
<212> DNA
<213> 人工序列(artificial sequence)
<400> 165
tcaaaaggag gggagagggg gtaaaaaaat gctgcactgt gcggcgaggc cggtgagtga 60
gcgacgcgga gccaatcagc gcccgccgtt ccgaaagttg ccttttatgg ctcgagtggc 120
cgctgtggcg tcctataaaa cccggcggcg caacgcgcag ccactgtcga gtcgcgtcca 180
cccgcgagca cagcttcttt gcagctcctt cgttgccggt ccacacccgc caccaggtaa 240
gcagggacgc cgggcccagc gggccttcgc tctctcgtgg ctagtacctc actgcagggt 300
cctgaggatc actcagaacg gacaccatgg gcgggtggag ggtggtgccg ggccgcggag 360
cggacactgg cacagccaac tttacgccta gcgtgtagac tctttgcagc cacattcccg 420
cggtgtagac actcgtgggc ccgctcccgc tcggtgcgtg gggcttgggg acacactagg 480
gtcgcggtgt gggcatttga tgagccggtg cggcttgcgg gtgttaaaag ccgtattagg 540
tccatcttga gagtacacag tattgggaac cagacgctac gatcacgcct caatggcctc 600
tgggtctttg tccaaaccgg tttgcctatt cggcttgccg ggcgggcggg cgggcgggcg 660
ggcgcggcag ggccggctcg gccgggtggg ggctgggatg ccactgcgcg tgcgctctct 720
atcactgggc atcgaggcgc gtgtgcgcta gggagggagc tcttcctctc cccctcttcc 780
tagttagctg cgcgtgcgta aggtgaaata ttaattaaaa caaagcacca gtggtctagt 840
ggtagaatag taccctgcca cggtacagac ccgggttcga ttcccggctg gtgcagtccc 900
ctccacccca cagtggttta agagctatgc tggaaacagc atagcaagtt taaataaggc 960
tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg caacaaagca ccagtggtct 1020
agtggtagaa tagtaccctg ccacggtaca gacccgggtt cgattcccgg ctggtgcagg 1080
cgcgccttga ggctgggagc gcggctgccc ggggttgggc gagggcgggg ccgttgtccg 1140
gaaggggcgg ggtcacagtg gcacgggcgc cttgtttgcg cttcctgctg ggtgtggtcg 1200
cctcccgcgc gcgcacaagc cgcccgtcgg cgcagtgtag gcggagcttg cgcccgtttg 1260
gggagggggc ggaggtctgg cttcctgccc taggtccgcc tccgggccag cgtttgcctt 1320
ttatggtaat aatgcggccg gtctgcgctt cctttgtccc ctgagcttgg gcgcgcgccc 1380
cctggcggct cgagcccgcg gcttgccgga agtgggcagg gcggcagcgg ctgctcttgg 1440
cggccccgag gtgactatag ccttcttttg tgtcttgata gttcgccatg gatgacgata 1500
tcgctgcgct ggtcgtcgac aacggctccg gcatgtgcaa agccggcttc gcgggcgacg 1560
atgctccccg ggctgtattc ccctccatcg tgggccgccc taggcaccag gtaagtgacc 1620
tgttactttg ggagtggcaa gcctggggtt ttcttgggga tcgatgccgg tgctaagaag 1680
gctgttccct tccacagggt gtgatggtgg gaatgggtca gaaggactcc tatgtgggtg 1740
acgaggccca gagcaagaga ggtatcctga ccctgaagta ccccattgaa catggcattg 1800
ttaccaactg ggacgacatg gaga 1824
<210> 166
<211> 4513
<212> DNA
<213> 人工序列(artificial sequence)
<400> 166
cctgtcagtt aacggcagcc ggagtgcgca gccgccggca gcctcgctct gcccactggg 60
tggggcggga ggtaggtggg gtgaggcgag ctggacgtgc gggcgcggtc ggcctctggc 120
ggggcggggg aggggaggga gggtcagcga aagtagctcg cgcgcgagcg gccgcccacc 180
ctccccttcc tctgggggag tcgttttacc cgccgccggc cgggcctcgt cgtctgattg 240
gctctcgggg cccagaaaac tggcccttgc cattggctcg tgttcgtgca agttgagtcc 300
atccgccggc cagcgggggc ggcgaggagg cgctcccagg ttccggccct cccctcggcc 360
ccgcgccgca gagtctggcc gcgcgcccct gcgcaacgtg gcaggaagcg cgcgctgggg 420
gcggggacgg gcagtagggc tgagcggctg cggggcgggt gcaagcacgt ttccgacttg 480
agttgcctca agaggggcgt gctgagccag acctccatcg cgcactccgg ggagtggagg 540
gaaggagcga gggctcagtt gggctgtttt ggaggcagga agcacttgct ctcccaaagt 600
cgctctgagt tgttatcagt aagggagctg cagtggagta ggcggggaga aggccgcacc 660
cttctccgga ggggggaggg gagtgttgca atacctttct gggagttctc tgctgcctcc 720
tggcttctga ggaccgccct gggcctggga gaatcccttc cccctcttcc ctcgtgatct 780
gcaactccag tctttctaga ggcgcgcctg agggacagcc cccccccaaa gcccccaggg 840
atgtaattac gtccctcccc cgctaggggg cagcagcgag ccgcccgggg ctccgctccg 900
gtccggcgct ccccccgcat ccccgagccg gcagcgtgcg gggacagccc gggcacgggg 960
aaggtggcac gggatcgctt tcctctgaac gcttctcgct gctctttgag cctgcagaca 1020
cctgggggga tacggggaaa aggcctccac ggccactagt ctttcgtctt caagaattcc 1080
tcgagtttac tccctatcag tgatagagaa cgtatgaaga gtttactccc tatcagtgat 1140
agagaacgta tgcagacttt actccctatc agtgatagag aacgtataag gagtttactc 1200
cctatcagtg atagagaacg tatgaccagt ttactcccta tcagtgatag agaacgtatc 1260
tacagtttac tccctatcag tgatagagaa cgtatatcca gtttactccc tatcagtgat 1320
agagaacgta taagctttag gcgtgtacgg tgggcgccta taaaagcaga gctcgtttag 1380
tgaaccgtca gatcgcctgg agcaattcca caacactttt gtcttatacc aactttccgt 1440
accacttcct accctcgtaa aggtctagag gatgccgcgc tccttcctgg tcaggaagcc 1500
gtccgacccc cgccggaagc ccaactatag cgagctgcag gaatggtgag caagggcgag 1560
gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac 1620
aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag 1680
ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc 1740
tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag 1800
tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 1860
tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 1920
aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 1980
aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc 2040
aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 2100
acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 2160
gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 2220
gccgccggga tcactctcgg catggacgag ctgtacaagt aaaacaaagc accagtggtc 2280
tagtggtaga atagtaccct gccacggtac agacccgggt tcgattcccg gctggtgcag 2340
tcccctccac cccacagtgg tttaagagct atgctggaaa cagcatagca agtttaaata 2400
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcaacaa agcaccagtg 2460
gtctagtggt agaatagtac cctgccacgg tacagacccg ggttcgattc ccggctggtg 2520
cactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 2580
cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 2640
tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 2700
ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggcat cgatatcatc 2760
tgcgatcgct ccggtgcccg tcagtgggca gagcgcacat cgcccacagt ccccgagaag 2820
ttggggggag gggtcggcaa ttgaacgggt gcctagagaa ggtggcgcgg ggtaaactgg 2880
gaaagtgatg tcgtgtactg gctccgcctt tttcccgagg gtgggggaga accgtatata 2940
agtgcagtag tcgccgtgaa cgttcttttt cgcaacgggt ttgccgccag aacacagctg 3000
aagcttcgag gggctcgcat ctctccttca cgcgcccgcc gccctacctg aggccgccat 3060
ccacgccggt tgagtcgcgt tctgccgcct cccgcctgtg gtgcctcctg aactgcgtcc 3120
gccgtctagg taagtttaaa gctcaggtcg agaccgggcc tttgtccggc gctcccttgg 3180
agcctaccta gactcagccg gctctccacg ctttgcctga ccctgcttgc tcaactctac 3240
gtctttgttt cgttttctgt tctgcgccgt tacagatcca agctgtgacc ggcgcctact 3300
ctagagccgc catgtctaga ctggacaaga gcaaagtcat aaactctgct ctggaattac 3360
tcaatggagt cggtatcgaa ggcctgacga caaggaaact cgctcaaaag ctgggagttg 3420
agcagcctac cctgtactgg cacgtgaaga acaagcgggc cctgctcgat gccctgccaa 3480
tcgagatgct ggacaggcat catacccact cctgccccct ggaaggcgag tcatggcaag 3540
actttctgcg gaacaacgcc aagtcatacc gctgtgctct cctctcacat cgcgacgggg 3600
ctaaagtgca tctcggcacc cgcccaacag agaaacagta cgaaaccctg gaaaatcagc 3660
tcgcgttcct gtgtcagcaa ggcttctccc tggagaacgc actgtacgct ctgtccgccg 3720
tgggccactt tacactgggc tgcgtattgg aggaacagga gcatcaagta gcaaaagagg 3780
aaagagagac acctaccacc gattctatgc ccccacttct gaaacaagca attgagctgt 3840
tcgaccggca gggagccgaa cctgccttcc ttttcggcct ggaactaatc atatgtggcc 3900
tggagaaaca gctaaagtgc gaaagcggcg ggccgaccga cgcccttgac gattttgact 3960
tagacatgct cccagccgat gcccttgacg actttgacct tgatatgctg cctgctgacg 4020
ctcttgacga ttttgacctt gacatgctcc ccgggacaca cgggtagggc gcgccagatg 4080
ggcgggagtc ttctgggcag gcttaaaggc taacctggtg tgtgggcgtt gtcctgcagg 4140
ggaattgaac aggtgtaaaa ttggagggac aagacttccc acagattttc ggttttgtcg 4200
ggaagttttt taataggggc aaataaggaa aatgggagga taggtagtca tctggggttt 4260
tatgcagcaa aactacaggt tattattgct tgtgatccgc ctcggagtat tttccatcga 4320
ggtagattaa agacatgctc acccgagttt tatactctcc tgcttgagat ccttactaca 4380
gtatgaaatt acagtgtcgc gagttagact atgtaagcag aattttaatc atttttaaag 4440
agcccagtac ttcatatcca tttctcccgc tccttctgca gccttatcaa aaggtatttt 4500
agaacactca ttt 4513
Claims (10)
1.一种sgRNA响应型启动子,其特征在于,所述启动子能够响应于上游的由内源转录本控制表达的sgRNA、dCas9和转录激活因子所形成的复合物,并启动下游报告基因的表达。
2.如权利要求1所述的sgRNA响应型启动子,其特征在于,所述的sgRNA响应型启动子是miniCMV启动子。
3.一种细胞内源核酸的检测体系,其特征在于,包括:
(a)目标核酸编辑模块,包括:靶向报告系统目标核酸的sgRNA、tRNA;
其中,所述的目标核酸编辑模块中包括如式I所示的结构,
L1-(tRNA-sgRNA)n-tRNA-R1 (式I)
式中,
L1是5’端的同源臂;
R1是3’端的同源臂;
tRNA是能成功释放出有功能的sgRNA内源机制;
sgRNA是向导RNA;
n是≥1的正整数,优选地2≤n≤10;和
(b)目标核酸报告模块,包括:一报告核酸构建物、dCas蛋白、转录激活因子;
其中,所述的报告核酸构建物具有如式II所示的结构,
(TS-I)m-TS-P1-Z2 (式II)
式中,
TS是所述sgRNA的结合靶位点;
m是≥0的正整数,优选地2≤m≤4;
I是TS之间的间隔序列;
P1是如权利要求1所述的sgRNA响应型启动子;
Z2是报告基因序列。
4.如权利要求3所述的检测体系,其特征在于,所述细胞内源核酸包括细胞内源基因或长非编码RNA(lncRNA)。
5.如权利要求3所述的检测体系,其特征在于,所述的细胞内源低丰度基因是指当以Gapdh内参基因做相对定量时,在细胞内表达量<0.001的基因。
6.如权利要求3所述的检测体系,其特征在于,所述(a)中的sgRNA靶向于所述目标核酸的3’端未翻译区域(3’UTR)。
7.一种用于检测细胞内源核酸的试剂盒,其特征在于,包括如权利要求3所述的检测体系。
8.一种检测细胞样本中是否存在目标内源核酸的方法,其特征在于,包括步骤:
(i)将权利要求3所述的检测体系引入待检测细胞样本中;和
(ii)检测所述检测体系中的检测目标核酸报告模块中的报告基因或其编码产物的水平。
9.如权利要求8所述的方法,其特征在于,所述的方法包括动态检测细胞样本中的目标内源核酸的水平。
10.如权利要求1所述的sgRNA响应型启动子或如权利要求3所述的检测体系的用途,其特征在于,用于制备一试剂盒,所述的试剂盒用于检测细胞内源核酸。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011409199.5A CN114591949A (zh) | 2020-12-04 | 2020-12-04 | 一种检测细胞内源性低丰度基因和lncRNA水平的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011409199.5A CN114591949A (zh) | 2020-12-04 | 2020-12-04 | 一种检测细胞内源性低丰度基因和lncRNA水平的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114591949A true CN114591949A (zh) | 2022-06-07 |
Family
ID=81812854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011409199.5A Pending CN114591949A (zh) | 2020-12-04 | 2020-12-04 | 一种检测细胞内源性低丰度基因和lncRNA水平的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114591949A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109384833A (zh) * | 2017-08-04 | 2019-02-26 | 北京大学 | 特异性识别甲基化修饰dna碱基的tale rvd及其应用 |
US20200362345A1 (en) * | 2019-05-17 | 2020-11-19 | Massachusetts Institute Of Technology | Engineered post-poly a signal rna and uses thereof |
CN115386560A (zh) * | 2021-05-25 | 2022-11-25 | 中国科学院脑科学与智能技术卓越创新中心 | 在细胞和成体水平检测蛋白质旁切效应的系统 |
-
2020
- 2020-12-04 CN CN202011409199.5A patent/CN114591949A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109384833A (zh) * | 2017-08-04 | 2019-02-26 | 北京大学 | 特异性识别甲基化修饰dna碱基的tale rvd及其应用 |
US20200362345A1 (en) * | 2019-05-17 | 2020-11-19 | Massachusetts Institute Of Technology | Engineered post-poly a signal rna and uses thereof |
CN115386560A (zh) * | 2021-05-25 | 2022-11-25 | 中国科学院脑科学与智能技术卓越创新中心 | 在细胞和成体水平检测蛋白质旁切效应的系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023027162A (ja) | T細胞レセプターの同族抗原との相互作用の発見及び特徴決定のための遺伝子操作された二部構成細胞デバイス | |
KR20230091894A (ko) | 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물 | |
JP2024138266A (ja) | 新規Cas12b酵素およびシステム | |
KR20210143230A (ko) | 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물 | |
KR20210142678A (ko) | 변형된 원형 폴리리보뉴클레오티드를 포함하는 조성물 및 그의 용도 | |
KR20210143897A (ko) | 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합 | |
US20030027289A1 (en) | Recombinase-based methods for producing expression vectors and compositions for use in practicing the same | |
KR20210144861A (ko) | 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위 | |
KR20150016941A (ko) | 다중 면역 스크리닝 분석 | |
KR20160034901A (ko) | 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물 | |
KR20120097483A (ko) | 게놈 편집을 위한 방법 | |
KR20080031024A (ko) | 폴리단백질, 프로단백질 및 단백질분해를 사용한 sORF작제물 포함 다중 유전자 발현 및 방법 | |
KR102614328B1 (ko) | T-세포 수용체 합성 및 tcr-제시 세포에 대한 안정적인 게놈 통합을 위한 2-부분 디바이스 | |
US7157571B2 (en) | Hepatoma specific chimeric regulatory sequence | |
KR20100049084A (ko) | 질병 진단을 위한 방법 및 조성물 | |
KR102584628B1 (ko) | T-세포 수용체, t-세포 항원 및 이들의 기능성 상호작용의 식별 및 특징규명을 위한 조작된 다성분 시스템 | |
US7741113B2 (en) | Cell-specific molecule and method for importing DNA into osteoblast nuclei | |
US20030143597A1 (en) | Methods for making polynucleotide libraries, polynucleotide arrays, and cell libraries for high-throughput genomics analysis | |
CN108949794B (zh) | 一种tale表达载体及其快速构建方法和应用 | |
KR20220024647A (ko) | 원형 폴리리보뉴클레오티드의 투여 방법 | |
CA2665080A1 (en) | Regulatable fusion promoters | |
CA2523785A1 (en) | Small interfering rna libraries and methods of synthesis and use | |
LeBowitz | Transfection experiments with Leishmania | |
CN114591949A (zh) | 一种检测细胞内源性低丰度基因和lncRNA水平的方法 | |
AU2022257301A1 (en) | Casrx/cas13d systems targeting c9orf72 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |