CN107828858A - 一种基于转录组测序开发鬼针草植物ssr引物的方法 - Google Patents
一种基于转录组测序开发鬼针草植物ssr引物的方法 Download PDFInfo
- Publication number
- CN107828858A CN107828858A CN201711060755.0A CN201711060755A CN107828858A CN 107828858 A CN107828858 A CN 107828858A CN 201711060755 A CN201711060755 A CN 201711060755A CN 107828858 A CN107828858 A CN 107828858A
- Authority
- CN
- China
- Prior art keywords
- sequence
- fasta
- seqidno
- beggar
- ticks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 241000143476 Bidens Species 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 27
- 235000010662 Bidens pilosa Nutrition 0.000 claims abstract description 37
- 238000013461 design Methods 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 15
- 108020004999 messenger RNA Proteins 0.000 claims description 15
- 239000002299 complementary DNA Substances 0.000 claims description 14
- 239000011324 bead Substances 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 10
- 238000012163 sequencing technique Methods 0.000 claims description 9
- 238000012408 PCR amplification Methods 0.000 claims description 8
- 102100034343 Integrase Human genes 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 239000000523 sample Substances 0.000 claims description 6
- 238000003559 RNA-seq method Methods 0.000 claims description 5
- 238000009395 breeding Methods 0.000 claims description 5
- 230000001488 breeding effect Effects 0.000 claims description 5
- 230000004087 circulation Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 108090000623 proteins and genes Proteins 0.000 claims description 5
- 240000004082 Bidens tripartita Species 0.000 claims description 4
- 102000004594 DNA Polymerase I Human genes 0.000 claims description 4
- 108010017826 DNA Polymerase I Proteins 0.000 claims description 4
- 101710203526 Integrase Proteins 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 239000007853 buffer solution Substances 0.000 claims description 4
- 239000012634 fragment Substances 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 238000000246 agarose gel electrophoresis Methods 0.000 claims description 3
- 239000000872 buffer Substances 0.000 claims description 3
- 239000003153 chemical reaction reagent Substances 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 claims description 3
- 241000411851 herbal medicine Species 0.000 claims description 3
- 230000008439 repair process Effects 0.000 claims description 3
- 210000002966 serum Anatomy 0.000 claims description 3
- 241000842326 Bidens parviflora Species 0.000 claims description 2
- 244000104272 Bidens pilosa Species 0.000 claims description 2
- 238000001190 Q-PCR Methods 0.000 claims description 2
- 239000013614 RNA sample Substances 0.000 claims description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 2
- 238000007622 bioinformatic analysis Methods 0.000 claims description 2
- 230000008094 contradictory effect Effects 0.000 claims description 2
- 238000010790 dilution Methods 0.000 claims description 2
- 239000012895 dilution Substances 0.000 claims description 2
- 230000002255 enzymatic effect Effects 0.000 claims description 2
- 238000013467 fragmentation Methods 0.000 claims description 2
- 238000006062 fragmentation reaction Methods 0.000 claims description 2
- 239000012535 impurity Substances 0.000 claims description 2
- 239000003147 molecular marker Substances 0.000 claims description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000012372 quality testing Methods 0.000 claims description 2
- 238000004445 quantitative analysis Methods 0.000 claims description 2
- 239000002096 quantum dot Substances 0.000 claims description 2
- 238000000926 separation method Methods 0.000 claims description 2
- 241000842328 Bidens bipinnata Species 0.000 abstract description 7
- 244000025254 Cannabis sativa Species 0.000 abstract description 5
- 230000002068 genetic effect Effects 0.000 abstract description 5
- 108020004414 DNA Proteins 0.000 description 109
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 5
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 108091092878 Microsatellite Proteins 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 241001523383 Achnatherum Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 206010012735 Diarrhoea Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 101150050559 SOAT1 gene Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000012154 double-distilled water Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 208000001848 dysentery Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- HNJXPTMEWIVQQM-UHFFFAOYSA-M triethyl(hexadecyl)azanium;bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](CC)(CC)CC HNJXPTMEWIVQQM-UHFFFAOYSA-M 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- 208000019553 vascular disease Diseases 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6811—Selection methods for production or design of target specific oligonucleotides or binding molecules
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/6895—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Databases & Information Systems (AREA)
- Botany (AREA)
- Theoretical Computer Science (AREA)
- Mycology (AREA)
- Bioethics (AREA)
- Medical Informatics (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Evolutionary Biology (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开一种基于转录组测序开发鬼针草植物SSR引物的方法,包括如下步骤:(1)转录组数据的获得;(2)SSR引物的识别(3)SSR引物的设计;本发明的28对SSR引物是通过来源于鬼针草属6个种和鬼针草种中9个不同地理区域居群筛选得到,在15个鬼针草物种中均具有多态性,可以直接将本发明所提供的28个引物对应用于更多鬼针草品种上,进行种质资源和遗传多样性分析,为鬼针草分子标记辅助育种奠定了良好的基础。
Description
技术领域
本发明涉及一种基于转录组测序开发鬼针草植物SSR引物的方法,属于分子生物学技术领域。
背景技术
鬼针草(Bidens bipinnata L.)属于菊科鬼针草属植物,又名刺针草、婆婆针。一年生草本,茎直立,高30~120cm。生于路边荒地、山坡及田间,广布全国,全草入药,是一种重要的药用植物。可以清热、解毒、散瘀,被用于医治痢疾、腹泻、肝炎等疾病,同时也对心脑血管疾病、肿瘤具有一定疗效。由于,鬼针草属植物在我国南北均有分布,生态适应幅度大,形态上产生很多变异,导致鬼针草与同属的一些近缘种很难区分。同种异名、同名异种现象普遍存在,无法反映真实的亲缘关系和遗传特性,为确保鬼针草的正确和安全用药,对鬼针草及其近缘种进行一些分子标记的研究,以找到快速准确鉴定鬼针草的方法是非常必要的。
随着现代生物技术的发展,分子标记已经被广泛用于药材鉴别、种质资源遗传多样性分析以及辅助育种工作中。简单重复序列(simple sequence repeats,SSR)又称微卫星,其可直接反映遗传多样性,具有稳定性好、通用性强和多态性高等优点,被广泛应用于比较基因组学、遗传多样性分析、进化研究以及分子育种等方面。
目前,鬼针草尚无全基因组序列信息,关于其SSR引物数量非常有限。对于无参考基因组的物种来说,采用高通量测序技术对其转录组进行分析,将测序所得的序列拼接成转录本,以转录本作为参考序列,进行后续分析。因此,利用第二代高通量测序技术获得鬼针草转录组序列信息,批量开发EST-SSR引物,将会对鬼针草属植物种质资源鉴定、遗传多样性、重要性状基因定位及分子标记辅助选择育种等起重要推动作用。
发明内容
本发明的目的是提供一种基于转录组测序开发鬼针草植物SSR引物的方法,为了实现本发明目的,本发明的一种基于转录组测序开发鬼针草SSR引物的方法,所述方法包括以下步骤:
(1)转录组数据的获得
利用Trizol试剂提取鬼针草幼苗地上和地下部位的总RNA,用带有Oligo(dT)磁珠富集mRNA;随后加入fragmentation buffer将mRNA打断成短片段,以mRNA为模板,用六碱基随机引物(random hexamers)合成第一链cDNA,然后加入缓冲液、dNTPs和DNA polymeraseI和RNase H合成第二链cDNA,再用AMPure XP beads纯化双链cDNA;纯化的双链cDNA先进行末端修复、加A尾并连接测序接头,再用AMPure XP beads进行片段大小选择;最后进行PCR扩增,并用AMPure XP beads纯化PCR产物,得到最终的文库;文库构建完成后,先使用Qubit2.0进行初步定量,稀释文库至1.5ng/ul,随后使用Agilent 2100对文库的insertsize进行检测,insert size符合预期后,使用Q-PCR方法对文库的有效浓度进行准确定量(文库有效浓度>2nM),以保证文库质量;构建好的测序文库用IlluminaHiseq 2000进行测序;
(2)SSR引物的识别
安装Perl语言,从http://pgrc.1pk-gatersleben.de/misa/下载est_trimmer.pl并运行,去除转录组序列中小于100bp过短的序列和大于2000bp过长的序列,运行命令为:C:\perl\bin>perlest_trimmer,piA.fasta-amb=2,50-tr5=T,5,50-tr3=A,5,50-cut=100,2000;输出两个文件A.fasta.log和A.fasta.results,A为文件代号;从http://www.bioinformatics.org/cd-hit中下载CD_HIT软件,利用其去除冗余序列:把A.fasta.results复制到cd_hit文件夹中并重命名为B.fasta,运行cd_hit.exe,Perl环境下运行命令为:C:\perl\bin\cd_hit>cd_hit.exe-1B.fasta-oC.fasta-cl.00-n5-M2000,输出三个文件,其中C.fsata文件用于下一步处理,A、B和C均为文件代号;从http://pgrc.1pk-gatersleben.de/misa/下载misa.pi程序以识别和定位序列中的SSR;参数设置如下:单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的重复次数至少为10、6、5、3、3、3;将C.fsata文件拷贝至C盘perl\bin目录下,Perl环境下运行命令:C:\perl\bin>perlmisa.plC.fasta,运行后产生C.fasta.misa和C.fasta.statistics两个文件,其中C.fasta.misa用于后续引物设计;
(3)SSR引物的设计
使用Perl环境下primer3模块批量设计SSR引物:引物设计参数为Tm55-65℃,引物长度为18-22bp;运行p3_out.pi,Perl环境下运行命令为:C:\perl\bin>perlp3_in.plC.fasta.misa,产生了一个名为C.fasta.p3in的primer3的输入文件;再复制C.fasta.p3in文件到C盘perl\bin\primer3\bin根目录下,运行primer3_core.exe实现批量的引物设计,Perl环境下运行命令为:C:\perl\bin\primer3\bin>primer3_core.exe<C.fasta.p3in>C.fasta.p3out,产生一个名为C.fasta.p3out的文件;最后将C.fasta.p3out文件复制至C盘perl\bin目录下,运行p3_out.pi,其命令为:C:\perl\bin>perl p3_out.pl C.fasta.p3out C.fasta.misa,运行后得到C.fasta.results文件,此即为设计好的引物;然后鉴定SSR引物的多态性,用于鉴定SSR引物多态性的鬼针草属植物包括9个不同产地的鬼针草、兴安鬼针草、小花鬼针草、三叶鬼针草、狼把草和大狼把草。
所述步骤(1)的具体方法如下:
A、鬼针草Total RNA的提取方法和质量检测
采用常规的Trizol法提取、纯化和DNA酶处理后,通过琼脂糖凝胶电泳分析RNA降解程度以及是否有污染、Nanodrop检测RNA的纯度(OD260/280比值)、Qubit对RNA浓度进行精确定量、Agilent 2100精确检测RNA的完整性,获得浓度≥50ng/μl、总量≥5.2μg、OD260/280为1.8-2.2,RIN≧6.3的Total RNA样品;
B、mRNA的分离及随机打断
首先采用oligo-dT的磁珠分离出带有polyA的mRNA,然后利用超声波随机打断mRNA,以回收200-700bp的目的片段;
C、cDNA第一链及第二链的合成
第一链的合成是采用6碱基随机引物和Superscript II reverse transcriptase试剂盒;第二链则是使用RNase H和DNA聚合酶I共同完成;
D、在cDNA片段上锚定的接头序列:
5′RNA Adapter:
5′-GATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG-3′;
3′RNA Adapter:5′-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3′;
E、PCR扩增用上述接头序列中的引物进行15个循环的PCR扩增;
F、文库构建及检测利用上述步骤中得到的序列,按照Illumina公司sample prepkit进行文库构建及检测;
G、RNA-seq的测序
将建好的文库以5-7pM的浓度加到Illumina测序仪的相应通道上,运行36个循环;
H、数据分析
剔除杂质数据,对RNA-seq组装后的结果进行整合;之前的步骤得到的是原始数据,其中含有步骤4中加入的接头序列,去除接头后称为Clean reads,即可进行拼接与组装;具体方法是利用将得到的Clean reads,采用针对转录组拼接的Trinity软件(Grabherret al,2011)进行拼接;Trinity软件版本:v2012-10-05;参数设置:min_kmer_cov为2,其它参数为默认参数用Trinity将测序序列拼接成一个转录组,以此作为后续分析的参考序列;取每条基因中最长的转录本作为Unigene;
I、生物信息学分析
将上述得到的Unigene序列与蛋白数据库Nr、Swiss-Prot、KEGG和KOG进行blastx比对,evalue<0.00001,取比对结果最好的蛋白确定Unigene的序列方向;如果不同库之间的比对结果有矛盾,则按Nr、Swiss-Prot、KEGG和KOG的优先级确定Unigene的序列方向,跟上述4个库皆比不上的Unigene,用软件ESTScan预测其编码区并确定序列的方向;对于能确定序列方向的Unigene,给出其从5′到3′方向的序列;对于无法确定序列方向的Unigene,给出组装软件得到的序列;对这些基因进行了功能注释,包括KOG分类及GO注释。
在检测过程中使用50对引物;所述SSR引物的序列如SEQ ID No.1-100所示。
第1对引物,其序列如SEQIDNO:1和SEQIDNO:2所示;
第2对引物,其序列如SEQIDNO:3和SEQIDNO:4所示;
第3对引物,其序列如SEQIDNO:5和SEQIDNO:6所示;
第4对引物,其序列如SEQIDNO:7和SEQIDNO:8所示;
第5对引物,其序列如SEQIDNO:9和SEQIDNO:10所示;
第6对引物,其序列如SEQIDNO:11和SEQIDNO:12所示;
第7对引物,其序列如SEQIDNO:13和SEQIDNO:14所示;
第8对引物,其序列如SEQIDNO:15和SEQIDNO:16所示;
第9对引物,其序列如SEQIDNO:17和SEQIDNO:18所示;
第10对引物,其序列如SEQIDNO:19和SEQIDNO:20所示;
第11对引物,其序列如SEQIDNO:21和SEQIDNO:22所示;
第12对引物,其序列如SEQIDNO:23和SEQIDNO:24所示;
第13对引物,其序列如SEQIDNO:25和SEQIDNO:26所示;
第14对引物,其序列如SEQIDNO:27和SEQIDNO:28所示;
第15对引物,其序列如SEQIDNO:29和SEQIDNO:30所示;
第16对引物,其序列如SEQIDNO:31和SEQIDNO:32所示;
第17对引物,其序列如SEQIDNO:33和SEQIDNO:34所示;
第18对引物,其序列如SEQIDNO:35和SEQIDNO:36所示;
第19对引物,其序列如SEQIDNO:37和SEQIDNO:38所示;
第20对引物,其序列如SEQIDNO:39和SEQIDNO:40所示;
第21对引物,其序列如SEQIDNO:41和SEQIDNO:42所示;
第22对引物,其序列如SEQIDNO:43和SEQIDNO:44所示。
第23对引物,其序列如SEQIDNO:45和SEQIDNO:46所示;
第24对引物,其序列如SEQIDNO:47和SEQIDNO:48所示;
第25对引物,其序列如SEQIDNO:49和SEQIDNO:50所示;
第26对引物,其序列如SEQIDNO:51和SEQIDNO:52所示;
第27对引物,其序列如SEQIDNO:53和SEQIDNO:54所示;
第28对引物,其序列如SEQIDNO:55和SEQIDNO:56所示;
第29对引物,其序列如SEQIDNO:57和SEQIDNO:58所示;
第30对引物,其序列如SEQIDNO:59和SEQIDNO:60所示;
第31对引物,其序列如SEQIDNO:61和SEQIDNO:62所示;
第32对引物,其序列如SEQIDNO:63和SEQIDNO:64所示。
第33对引物,其序列如SEQIDNO:65和SEQIDNO:66所示;
第34对引物,其序列如SEQIDNO:67和SEQIDNO:68所示;
第35对引物,其序列如SEQIDNO:69和SEQIDNO:70所示;
第36对引物,其序列如SEQIDNO:71和SEQIDNO:72所示;
第37对引物,其序列如SEQIDNO:73和SEQIDNO:74所示;
第38对引物,其序列如SEQIDNO:75和SEQIDNO:76所示;
第39对引物,其序列如SEQIDNO:77和SEQIDNO:78所示;
第40对引物,其序列如SEQIDNO:79和SEQIDNO:80所示;
第41对引物,其序列如SEQIDNO:81和SEQIDNO:82所示;
第42对引物,其序列如SEQIDNO:83和SEQIDNO:84所示。
第43对引物,其序列如SEQIDNO:85和SEQIDNO:86所示;
第44对引物,其序列如SEQIDNO:87和SEQIDNO:88所示;
第45对引物,其序列如SEQIDNO:89和SEQIDNO:90所示;
第46对引物,其序列如SEQIDNO:91和SEQIDNO:92所示;
第47对引物,其序列如SEQIDNO:93和SEQIDNO:94所示;
第48对引物,其序列如SEQIDNO:95和SEQIDNO:96所示;
第49对引物,其序列如SEQIDNO:97和SEQIDNO:98所示;
第50对引物,其序列如SEQIDNO:99和SEQIDNO:100所示;
所述鬼针草SSR引物在鬼针草分子标记辅助育种中的应用及中草药识别的应用。
本发明的有益效果:
本发明的28对SSR引物是通过来源于鬼针草属6个种和鬼针草种中9个不同地理区域居群筛选得到,在15个鬼针草物种(表2)中均具有多态性,可以直接将本发明所提供的28个引物对应用于更多鬼针草品种上,进行种质资源和遗传多样性分析,为鬼针草分子标记辅助育种奠定了良好的基础。
附图说明
下面结合附图对本发明作进一步的说明。
图1是鬼针草建库测序流程示意图;
图2是鬼针草RNA-seq数据分析流程示意图;
图3是本发明的部分鬼针草SSR引物对在15个物种上进行多态性验证的结果。
具体实施方式
基于转录组测序开发的鬼针草SSR引物对,是通过鬼针草转录组测序(如图1所示)、SSR引物开发、DNA提取、SSR引物筛选及品种鉴定等过程得到。
本发明中,用转录组测序得到的EST序列开发鬼针草SSR引物对的具体做法是:
一、鬼针草转录组测序
采用Trizol法提取鬼针草属植物叶片总RNA后,用带有Oligo(dT)的磁珠富集真核生物mRNA;加入fragmentationbuffer将mRNA打断成短片段,以mRNA为模板,用六碱基随机引物(randomhexamers)合成第一条cDNA链,然后加入缓冲液、dNTPs、RNaseH和DNApolymeraseI合成第二条cDNA链,在经过QiaQuickPCR试剂盒纯化并加EB缓冲液洗脱之后做末端修复、加poly(A)并连接测序接头,然后用琼脂糖凝胶电泳进行片段大小选择,最后进行PCR扩增,建好的测序文库用IlluminaHiSeqTM2000进行测序,获得17140个unigene。
二、SSR引物开发
利用鬼针草转录组测序得到的120122个unigene,利用MISA软件寻找到17140个含有SSR的重复基元,选择SSR位点的重复基元为二核苷酸重复次数≥6次,三、四核苷酸重复次数≥5次,五、六核苷酸重复次数≥4次的SSR序列,用软件Primer3.0设计SSR引物,引物设计的原则为:最终产物长度为100-200bp,引物长度为18-24bp,退火温度为48-65℃。SSR密度分布出现频率最高的是单碱基微卫星,所占比例最高的是A/T,其次是三碱基微卫星,所占比例为38%(如表1所示)。挑选其中的50对引物,委托武汉金开瑞生物工程有限公司合成。
表1鬼针草SSR不同基序重复的数量分布
三、品种DNA提取
用CTAB(十六烷基三乙基溴化铵)法提取15个鬼针草属植物(表2)的基因组DNA,具体步骤:
表2本发明实现方案中所用到的不同鬼针草品种(除1自己采集外,其余均由农业部全国草业产品质量监督检验测试中心提供)
表2鬼针草属植物
(1)配制DNA提取缓冲液:4%CTAB,1M Tris-HCl,0.5M EDTA(pH=8.0),5M NaCl和10mg/mL的RNAase。
(2)对上述鬼针草属材料分别进行如下处理:
A、65℃水浴预热CTAB提取液;取嫩叶部分,在液氮中迅速研磨,将粉末状材料转入2mL离心管中(大概750μL),加入预热的CTAB提取液750μL,65℃保温60-90min,每隔10min轻轻颠倒混匀;加入等体积750μL的氯仿:异戊醇(24:1),混匀,4℃条件下,12000rpm离心10min,取上清转入新离心管,此过程重复两次。
B、在上述步骤A离心后所得的上清液中加入2/3体积预冷的异丙醇,轻轻混匀至DNA沉淀(4℃冰箱静置10min);12000rpm离心10min,弃上清。
C、将步骤B所得DNA沉淀物用1mL左右的75%的乙醇漂洗,室温条件下12000rpm离心5min,弃上清,重复洗一次;再用无水乙醇清洗一次。
D、将上述步骤C洗涤后的DNA室温风干并溶于50-100μL的超纯水中,加入1.2μL左右的RNAase酶(10mg/mL),37℃水浴30min以去除RNA。
E、紫外分光光度法检测上述步骤D所得的DNA样品的浓度,0.8%的琼脂糖凝胶电泳检测DNA的完整性。
四、SSR引物筛选
以提取的待测样品基因组DNA为模板进行步骤二所得50对引物的筛选,PCR采用20μL反应体系:10×PCR buffer(含Mg2+)2μL,2.5mM dNTP 2μL,5U/μL TaqDNA polymerase0.25μL,20μM正向引物0.5μL,20μM反向引物0.5μL,20ng/μLDNA模板1μL,加ddH2O至20μL。使用ProFlexTM PCR(Applied BiosystemsTM)进行PCR扩增,PCR扩增条件如下:94℃预变性3min,94℃(30s)/TM(30s)/72℃(45s)30个循环,最后72℃延伸5min。产物检测:PCR产物在2%的琼脂糖凝胶上电泳,120V,45min后,EB显色,凝胶成像仪上观察并照相。50对引物中,46对引物均能扩增出100-300bp的目的条带,说明引物设计较好。其中,28对引物在9个鬼针草居群及6个鬼针草属植物中均有扩增产物,且多态性高(部分引物对扩增结果如图3所示),说明这28对引物(即本发明所述引物对,其特征如下所示)可以用于鬼针草种质资源遗传多样性分析和亲缘关系研究中。
本发明提供28对鬼针草SSR引物,28对SSR引物的特征如下所示:
鬼针草SSR引物对特征:
第1对引物,其序列如SEQIDNO:1和SEQIDNO:2所示;
第5对引物,其序列如SEQIDNO:9和SEQIDNO:10所示;
第16对引物,其序列如SEQIDNO:31和SEQIDNO:32所示;
第18对引物,其序列如SEQIDNO:35和SEQIDNO:36所示;
第23对引物,其序列如SEQIDNO:45和SEQIDNO:46所示;
第24对引物,其序列如SEQIDNO:47和SEQIDNO:48所示;
第25对引物,其序列如SEQIDNO:49和SEQIDNO:50所示;
第27对引物,其序列如SEQIDNO:53和SEQIDNO:54所示;
第28对引物,其序列如SEQIDNO:55和SEQIDNO:56所示;
第30对引物,其序列如SEQIDNO:59和SEQIDNO:60所示;
第31对引物,其序列如SEQIDNO:61和SEQIDNO:62所示;
第32对引物,其序列如SEQIDNO:63和SEQIDNO:64所示;
第33对引物,其序列如SEQIDNO:65和SEQIDNO:66所示;
第34对引物,其序列如SEQIDNO:67和SEQIDNO:68所示;
第35对引物,其序列如SEQIDNO:69和SEQIDNO:70所示;
第36对引物,其序列如SEQIDNO:71和SEQIDNO:72所示;
第37对引物,其序列如SEQIDNO:73和SEQIDNO:74所示;
第38对引物,其序列如SEQIDNO:75和SEQIDNO:76所示;
第40对引物,其序列如SEQIDNO:79和SEQIDNO:80所示;
第41对引物,其序列如SEQIDNO:81和SEQIDNO:82所示;
第42对引物,其序列如SEQIDNO:83和SEQIDNO:84所示;
第43对引物,其序列如SEQIDNO:85和SEQIDNO:86所示。
第45对引物,其序列如SEQIDNO:89和SEQIDNO:90所示。
第46对引物,其序列如SEQIDNO:91和SEQIDNO:92所示。
第47对引物,其序列如SEQIDNO:93和SEQIDNO:94所示。
第48对引物,其序列如SEQIDNO:95和SEQIDNO:96所示。
第49对引物,其序列如SEQIDNO:97和SEQIDNO:98所示。
第50对引物,其序列如SEQIDNO:99和SEQIDNO:100所示。
本发明的28对SSR引物是通过来源于鬼针草属6个种和鬼针草种中9个不同地理区域居群筛选得到,在15个鬼针草物种(表1)中均具有多态性(部分如图3),可以直接将本发明所提供的28个引物对应用于更多鬼针草品种上,进行种质资源和遗传多样性分析,为鬼针草分子标记辅助育种奠定了良好的基础。
最后,还需要注意的是,以上列举的仅是本发明的若干个具体实施例。显然,本发明不限于以上实施例,还可以有许多变形。本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变形,均应认为是本发明的保护范围。
SEQUENCE LISTING
<110> 沈阳师范大学
<120> 一种基于转录组测序开发鬼针草植物SSR引物的方法
<130> 2017
<160> 100
<170> PatentIn version 3.3
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<400> 1
aagtcgaagg tcactcgcag 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<400> 2
gtccgcgacc tctgattcag 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<400> 3
aactttccac tcctaggcga 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<400> 4
acataacgtc gaatggtggt 20
<210> 5
<211> 25
<212> DNA
<213> 人工序列
<400> 5
gcccctctat cccttaaaag ataga 25
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<400> 6
acaatctgca actggtcggt 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<400> 7
gtgcacgtgt gttttctcgt 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<400> 8
aagaggaagc acacgtggag 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<400> 9
atcgaaaccc agttcgctgt 20
<210> 10
<211> 25
<212> DNA
<213> 人工序列
<400> 10
ccccaatctt tcgtttgaaa ttcac 25
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<400> 11
ttccgtgggt ccctgctata 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<400> 12
acagaaggtg ccggttatcc 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<400> 13
tcactattcc tgacgcgagc 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<400> 14
tttgcatcgg ggagacacaa 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<400> 15
caggctactg gtgcaagaca 20
<210> 16
<211> 22
<212> DNA
<213> 人工序列
<400> 16
tgctaacagt ttgcatcaca aa 22
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<400> 17
ttggacccct gagcatacct 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<400> 18
gcaagggaaa ggaaggggtt 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<400> 19
cctttcaatc cgcgcatcag 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<400> 20
tttcgatgct gctgctggta 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<400> 21
tcatacttca accggacgcc 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<400> 22
gtcgtgagaa tagccgggag 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<400> 23
ttgtcttgct aaacgacgca 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<400> 24
acacaacaac aacctcccca 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<400> 25
cggatgccca tgtagtccac 20
<210> 26
<211> 21
<212> DNA
<213> 人工序列
<400> 26
tgttgccggt ataagttggg t 21
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<400> 27
atcgacgtct ccacactctg 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<400> 28
ggtgtttgat gttggcgtcc 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<400> 29
ggctgaggaa gagctggatc 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<400> 30
cgaagatggc gatcgactgt 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<400> 31
ccaccgaggt agagaacacg 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<400> 32
cgagaagcgc atttctgtcg 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<400> 33
aacaacccag acacacgagg 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<400> 34
tccaggcagg cacttaaagg 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<400> 35
tggacgacaa ggatccgaac 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<400> 36
cacctccacc ctaccaacac 20
<210> 37
<211> 24
<212> DNA
<213> 人工序列
<400> 37
agggatgttc attcttcttc ttgt 24
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<400> 38
tcaacgcgta ggggttcatc 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<400> 39
tgggggatat agtctcgcgt 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<400> 40
cggagacttc acacggttga 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<400> 41
caacaaacca aaccgggtgg 20
<210> 42
<211> 19
<212> DNA
<213> 人工序列
<400> 42
cgccatgtgt cgacaacag 19
<210> 43
<211> 25
<212> DNA
<213> 人工序列
<400> 43
acatagaaaa acgtcaacaa acact 25
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<400> 44
acgccaccac tgttgatcta 20
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<400> 45
tttcaggttc ttgggctcct 20
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<400> 46
cgcgcgtccg agatctatta 20
<210> 47
<211> 24
<212> DNA
<213> 人工序列
<400> 47
agagataaaa gccattgatg acgt 24
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<400> 48
atgacttacc ggcgatgacc 20
<210> 49
<211> 21
<212> DNA
<213> 人工序列
<400> 49
accaaccatc cagatttggg t 21
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<400> 50
cgaacaaact ggcatggagc 20
<210> 51
<211> 25
<212> DNA
<213> 人工序列
<400> 51
tgctctgtag attagatgaa gtgct 25
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<400> 52
tggccacgtg tgactctttt 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<400> 53
cgctcagctt cagccaaaag 20
<210> 54
<211> 22
<212> DNA
<213> 人工序列
<400> 54
ctgtgtgtgt actcaggact gt 22
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<400> 55
gcggcaaaga tcgtagggaa 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<400> 56
gcatggtggc ttactttggc 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<400> 57
aggtgcaatg tacgaggcaa 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<400> 58
aagaagcgac gctcaaagtc 20
<210> 59
<211> 21
<212> DNA
<213> 人工序列
<400> 59
cgagcttcat caattgtgcg a 21
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<400> 60
cggatgtagc gcgtctgtat 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<400> 61
tcctgtttac gactggggga 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<400> 62
agaagaagaa tggcgagcga 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<400> 63
ctggaatcgc attgaagccg 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<400> 64
cttctccggc acccttgatt 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<400> 65
acttctcgtc aacggcttgt 20
<210> 66
<211> 20
<212> DNA
<213> 人工序列
<400> 66
gctccttatg cccctaaccc 20
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<400> 67
cttcgactac ttgaccgggg 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<400> 68
agcgtacgat ggctacgaag 20
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<400> 69
catcagcacc tccttcacgt 20
<210> 70
<211> 18
<212> DNA
<213> 人工序列
<400> 70
cttcaggctc ttcgggcg 18
<210> 71
<211> 20
<212> DNA
<213> 人工序列
<400> 71
ggggagatcc gatcgtccta 20
<210> 72
<211> 20
<212> DNA
<213> 人工序列
<400> 72
taaacggcgc ccctaactac 20
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<400> 73
accaccactc acaattcgct 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<400> 74
tcgttttcgg ttcggttcct 20
<210> 75
<211> 20
<212> DNA
<213> 人工序列
<400> 75
gcgaaaggcg agaggatgtt 20
<210> 76
<211> 20
<212> DNA
<213> 人工序列
<400> 76
ttgctcatga tcgcgtccag 20
<210> 77
<211> 23
<212> DNA
<213> 人工序列
<400> 77
ggtagcacaa cctcaattaa act 23
<210> 78
<211> 20
<212> DNA
<213> 人工序列
<400> 78
agagatgtcg ggccaaactg 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<400> 79
agaaggcatt tcgacagcca 20
<210> 80
<211> 20
<212> DNA
<213> 人工序列
<400> 80
ctcgttcggt tgcacttgtg 20
<210> 81
<211> 21
<212> DNA
<213> 人工序列
<400> 81
acaacccccg taatacgaga g 21
<210> 82
<211> 20
<212> DNA
<213> 人工序列
<400> 82
ttcgtgtacg caggatggaa 20
<210> 83
<211> 20
<212> DNA
<213> 人工序列
<400> 83
cacggacacc aaacctacca 20
<210> 84
<211> 20
<212> DNA
<213> 人工序列
<400> 84
tggttttggg tccgggtatg 20
<210> 85
<211> 20
<212> DNA
<213> 人工序列
<400> 85
ggctattgcg ctgacgattg 20
<210> 86
<211> 20
<212> DNA
<213> 人工序列
<400> 86
cagtcactgg ctagcagtgc 20
<210> 87
<211> 20
<212> DNA
<213> 人工序列
<400> 87
cattgggatc gacgtggaca 20
<210> 88
<211> 18
<212> DNA
<213> 人工序列
<400> 88
gcgcccttgg actgcttg 18
<210> 89
<211> 24
<212> DNA
<213> 人工序列
<400> 89
aaacgttaat gacatgtcta agca 24
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<400> 90
ttttgtccat ggcccgaact 20
<210> 91
<211> 20
<212> DNA
<213> 人工序列
<400> 91
gcacaacact ccaaacagca 20
<210> 92
<211> 20
<212> DNA
<213> 人工序列
<400> 92
gctttttgca ggctgtccaa 20
<210> 93
<211> 22
<212> DNA
<213> 人工序列
<400> 93
tgcctcacat gtgactcatt gt 22
<210> 94
<211> 20
<212> DNA
<213> 人工序列
<400> 94
ctaagcccgt cccatttggt 20
<210> 95
<211> 20
<212> DNA
<213> 人工序列
<400> 95
tgtgatggta attggcgcct 20
<210> 96
<211> 21
<212> DNA
<213> 人工序列
<400> 96
tggtatgcta agcaaccttg t 21
<210> 97
<211> 20
<212> DNA
<213> 人工序列
<400> 97
gagaagggtc tctccaacgc 20
<210> 98
<211> 20
<212> DNA
<213> 人工序列
<400> 98
gcggataaca ttcatccgcg 20
<210> 99
<211> 21
<212> DNA
<213> 人工序列
<400> 99
acatgaaagt ttggttggcg t 21
<210> 100
<211> 20
<212> DNA
<213> 人工序列
<400> 100
agagtgtgcc gtatgttgca 20
Claims (4)
1.一种基于转录组测序开发鬼针草植物SSR引物的方法,其特征在于,包括如下步骤:
(1)转录组数据的获得
利用Trizol试剂提取鬼针草幼苗地上和地下部位的总RNA,用带有Oligo(dT)磁珠富集mRNA;随后加入fragmentation buffer将mRNA打断成短片段,以mRNA为模板,用六碱基随机引物(random hexamers)合成第一链cDNA,然后加入缓冲液、dNTPs和DNA polymerase I和RNase H合成第二链cDNA,再用AMPure XP beads纯化双链cDNA;纯化的双链cDNA先进行末端修复、加A尾并连接测序接头,再用AMPure XP beads进行片段大小选择;最后进行PCR扩增,并用AMPure XP beads纯化PCR产物,得到最终的文库;文库构建完成后,先使用Qubit2.0进行初步定量,稀释文库至1.5ng/ul,随后使用Agilent 2100对文库的insertsize进行检测,insert size符合预期后,使用Q-PCR方法对文库的有效浓度进行准确定量(文库有效浓度>2nM),以保证文库质量;构建好的测序文库用IlluminaHiseq 2000进行测序;
(2)SSR引物的识别
安装Perl语言,从http://pgrc.1pk-gatersleben.de/misa/下载est_trimmer.pl并运行,去除转录组序列中小于100bp过短的序列和大于2000bp过长的序列,运行命令为:C:\perl\bin>perlest_trimmer,piA.fasta-amb=2,50-tr5=T,5,50-tr3=A,5,50-cut=100,2000;输出两个文件A.fasta.log和A.fasta.results,A为文件代号;从http://www.bioinformatics.org/cd-hit中下载CD_HIT软件,利用其去除冗余序列:把A.fasta.results复制到cd_hit文件夹中并重命名为B.fasta,运行cd_hit.exe,Perl环境下运行命令为:C:\perl\bin\cd_hit>cd_hit.exe-1B.fasta-oC.fasta-cl.00-n5-M2000,输出三个文件,其中C.fsata文件用于下一步处理,A、B和C均为文件代号;从http://pgrc.1pk-gatersleben.de/misa/下载misa.pi程序以识别和定位序列中的SSR;参数设置如下:单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的重复次数至少为10、6、5、3、3、3;将C.fsata文件拷贝至C盘perl\bin目录下,Perl环境下运行命令:C:\perl\bin>perlmisa.plC.fasta,运行后产生C.fasta.misa和C.fasta.statistics两个文件,其中C.fasta.misa用于后续引物设计;
(3)SSR引物的设计
使用Perl环境下primer3模块批量设计SSR引物:引物设计参数为Tm55-65℃,引物长度为18-22bp;运行p3_out.pi,Perl环境下运行命令为:C:\perl\bin>perlp3_in.plC.fasta.misa,产生了一个名为C.fasta.p3in的primer3的输入文件;再复制C.fasta.p3in文件到C盘perl\bin\primer3\bin根目录下,运行primer3_core.exe实现批量的引物设计,Perl环境下运行命令为:C:\perl\bin\primer3\bin>primer3_core.exe<C.fasta.p3in>C.fasta.p3out,产生一个名为C.fasta.p3out的文件;最后将C.fasta.p3out文件复制至C盘perl\bin目录下,运行p3_out.pi,其命令为:C:\perl\bin>perl p3_out.pl C.fasta.p3out C.fasta.misa,运行后得到C.fasta.results文件,此即为设计好的引物;然后鉴定SSR引物的多态性,用于鉴定SSR引物多态性的鬼针草属植物包括9个不同产地的鬼针草、兴安鬼针草、小花鬼针草、三叶鬼针草、狼把草和大狼把草。
2.根据权利要求1所述的一种基于转录组测序开发鬼针草植物SSR引物的方法,其特征在于,所述步骤(1)的具体方法如下:
A、鬼针草Total RNA的提取方法和质量检测
采用常规的Trizol法提取、纯化和DNA酶处理后,通过琼脂糖凝胶电泳分析RNA降解程度以及是否有污染、Nanodrop检测RNA的纯度(OD260/280比值)、Qubit对RNA浓度进行精确定量、Agilent 2100精确检测RNA的完整性,获得浓度≥50ng/μl、总量≥5.2μg、OD260/280为1.8-2.2,RIN≧6.3的Total RNA样品;
B、mRNA的分离及随机打断
首先采用oligo-dT的磁珠分离出带有polyA的mRNA,然后利用超声波随机打断mRNA,以回收200-700bp的目的片段;
C、cDNA第一链及第二链的合成
第一链的合成是采用6碱基随机引物和Superscript II reverse transcriptase试剂盒;第二链则是使用RNase H和DNA聚合酶I共同完成;
D、在cDNA片段上锚定的接头序列:
5′RNA Adapter:5′-GATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG-3′;
3′RNA Adapter:5′-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3′;
E、PCR扩增用上述接头序列中的引物进行15个循环的PCR扩增;
F、文库构建及检测利用上述步骤中得到的序列,按照Illumina公司sample prep kit进行文库构建及检测;
G、RNA-seq的测序
将建好的文库以5-7pM的浓度加到Illumina测序仪的相应通道上,运行36个循环;
H、数据分析
剔除杂质数据,对RNA-seq组装后的结果进行整合;之前的步骤得到的是原始数据,其中含有步骤4中加入的接头序列,去除接头后称为Clean reads,即可进行拼接与组装;具体方法是利用将得到的Clean reads,采用针对转录组拼接的Trinity软件(Grabherr et al,2011)进行拼接;Trinity软件版本:
v2012-10-05;参数设置:min_kmer_cov为2,其它参数为默认参数用Trinity将测序序列拼接成一个转录组,以此作为后续分析的参考序列;取每条基因中最长的转录本作为Unigene;
I、生物信息学分析
将上述得到的Unigene序列与蛋白数据库Nr、Swiss-Prot、KEGG和KOG进行blastx比对,evalue<0.00001,取比对结果最好的蛋白确定Unigene的序列方向;如果不同库之间的比对结果有矛盾,则按Nr、Swiss-Prot、KEGG和KOG的优先级确定Unigene的序列方向,跟上述4个库皆比不上的Unigene,用软件ESTScan预测其编码区并确定序列的方向;对于能确定序列方向的Unigene,给出其从5′到3′方向的序列;对于无法确定序列方向的Unigene,给出组装软件得到的序列;对这些基因进行了功能注释,包括KOG分类及GO注释。
3.根据权利要求1或2任一项所述方法开发的鬼针草植物SSR引物,其特征在于,在检测过程中使用50对引物;所述SSR引物的序列如SEQ ID No.1-100所示。
4.权利要求3所述鬼针草SSR引物在鬼针草植物分子标记辅助育种中的应用及中草药识别的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711060755.0A CN107828858B (zh) | 2017-11-02 | 2017-11-02 | 一种基于转录组测序开发鬼针草植物ssr引物的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711060755.0A CN107828858B (zh) | 2017-11-02 | 2017-11-02 | 一种基于转录组测序开发鬼针草植物ssr引物的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107828858A true CN107828858A (zh) | 2018-03-23 |
CN107828858B CN107828858B (zh) | 2021-04-20 |
Family
ID=61651543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711060755.0A Expired - Fee Related CN107828858B (zh) | 2017-11-02 | 2017-11-02 | 一种基于转录组测序开发鬼针草植物ssr引物的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107828858B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108315442A (zh) * | 2018-03-30 | 2018-07-24 | 中国水产科学研究院南海水产研究所 | 一种黄唇鱼微卫星dna标记及其筛选方法 |
CN112680542A (zh) * | 2021-01-29 | 2021-04-20 | 广东省农业科学院环境园艺研究所 | 一种兰科植物通用型ssr分子标记引物组合物及其应用 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2621159A (en) * | 2022-08-04 | 2024-02-07 | Wobble Genomics Ltd | Methods of preparing processed nucleic acid samples and detecting nucleic acids and devices therefor |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007015238A3 (en) * | 2005-08-01 | 2009-04-30 | Yeda Res & Dev | Methods of preventing gene flow in plants |
CN103233075A (zh) * | 2013-05-09 | 2013-08-07 | 南京农业大学 | 一种基于转录组测序开发菊属植物ssr引物的方法 |
CN103642912A (zh) * | 2013-11-29 | 2014-03-19 | 中国农业科学院作物科学研究所 | 基于转录组测序开发绿豆ssr引物的方法 |
CN105274198A (zh) * | 2015-05-26 | 2016-01-27 | 江苏省农业科学院 | 一种基于转录组测序开发鸟巢蕨est-ssr引物的方法 |
CN105886652A (zh) * | 2016-06-14 | 2016-08-24 | 山东省林业科学研究院 | 绒毛白蜡耐盐ssr分子标记 |
CN106834510A (zh) * | 2017-03-20 | 2017-06-13 | 西南林业大学 | 一种基于转录组序列开发绿绒蒿ssr引物的方法 |
CN106987648A (zh) * | 2017-06-01 | 2017-07-28 | 中国农业大学 | 一种高通量的植物器官发育相关ssr分子标记方法 |
-
2017
- 2017-11-02 CN CN201711060755.0A patent/CN107828858B/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007015238A3 (en) * | 2005-08-01 | 2009-04-30 | Yeda Res & Dev | Methods of preventing gene flow in plants |
CN103233075A (zh) * | 2013-05-09 | 2013-08-07 | 南京农业大学 | 一种基于转录组测序开发菊属植物ssr引物的方法 |
CN103642912A (zh) * | 2013-11-29 | 2014-03-19 | 中国农业科学院作物科学研究所 | 基于转录组测序开发绿豆ssr引物的方法 |
CN105274198A (zh) * | 2015-05-26 | 2016-01-27 | 江苏省农业科学院 | 一种基于转录组测序开发鸟巢蕨est-ssr引物的方法 |
CN105886652A (zh) * | 2016-06-14 | 2016-08-24 | 山东省林业科学研究院 | 绒毛白蜡耐盐ssr分子标记 |
CN106834510A (zh) * | 2017-03-20 | 2017-06-13 | 西南林业大学 | 一种基于转录组序列开发绿绒蒿ssr引物的方法 |
CN106987648A (zh) * | 2017-06-01 | 2017-07-28 | 中国农业大学 | 一种高通量的植物器官发育相关ssr分子标记方法 |
Non-Patent Citations (2)
Title |
---|
夏至 等: "鬼针草及其近缘种的分子鉴定和亲缘关系研究", 《中草药》 * |
李梅芳,周开达主编: "《水稻生物技术育种》", 31 August 2001, 中国农业科技出版社 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108315442A (zh) * | 2018-03-30 | 2018-07-24 | 中国水产科学研究院南海水产研究所 | 一种黄唇鱼微卫星dna标记及其筛选方法 |
CN108315442B (zh) * | 2018-03-30 | 2021-07-27 | 中国水产科学研究院南海水产研究所 | 一种黄唇鱼微卫星dna标记及其筛选方法 |
CN112680542A (zh) * | 2021-01-29 | 2021-04-20 | 广东省农业科学院环境园艺研究所 | 一种兰科植物通用型ssr分子标记引物组合物及其应用 |
CN112680542B (zh) * | 2021-01-29 | 2021-07-30 | 广东省农业科学院环境园艺研究所 | 一种兰科植物通用型ssr分子标记引物组合物及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN107828858B (zh) | 2021-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106754886B (zh) | 基于转录测序获得黑果枸杞ssr引物的方法 | |
CN103642912A (zh) | 基于转录组测序开发绿豆ssr引物的方法 | |
CN109486923B (zh) | 多重扩增子测序用引物系统、其应用以及测序文库的构建方法 | |
CN111808854B (zh) | 带有分子条码的平衡接头及快速构建转录组文库的方法 | |
JP2018201501A (ja) | 生薬鑑別用プライマーセット及びそれを用いた生薬鑑別方法 | |
CN107201408A (zh) | 一种基于转录组测序开发剑麻ssr引物的方法 | |
CN107345256A (zh) | 一种基于转录组测序开发山黧豆est‑ssr引物组及方法和应用 | |
CN107881250B (zh) | 基于转录组测序开发的牡丹est-ssr引物及其开发方法 | |
CN107828858A (zh) | 一种基于转录组测序开发鬼针草植物ssr引物的方法 | |
CN110951911B (zh) | 基于转录组的椴树属est-ssr引物及其筛选方法和应用 | |
CN116144819B (zh) | 与南瓜果肉类胡萝卜素主效qtl紧密连锁的snp分子标记及其应用 | |
CN103571822B (zh) | 一种用于新一代测序分析的多重目的dna片段富集方法 | |
CN109337997B (zh) | 一种山茶属多态性叶绿体基因组微卫星分子标记引物及筛选和甄别近缘种的方法 | |
CN111424110B (zh) | 一种鉴别皂荚的试剂盒及鉴别和定量方法 | |
CN108192893B (zh) | 基于转录组测序开发艾纳香ssr引物的方法 | |
CN104195245B (zh) | 基于转录组测序开发的红掌ssr引物对及试剂盒 | |
WO2024104130A1 (zh) | 一种利用简并引物扩增进行全基因组分子标记开发的方法 | |
CN108754018B (zh) | 一种刺五加目的基因ssr分子标记的筛选方法及应用 | |
CN111690759B (zh) | 柑橘溃疡病菌rpa检测的特异引物、试剂盒和方法 | |
CN110878376B (zh) | 用于鉴定霍山石斛的ssr分子标记引物及其应用 | |
CN116179752B (zh) | 一种用于对有毒蘑菇进行种鉴定的引物组和pcr检测方法 | |
CN113667714A (zh) | 一种目标区域捕获方法、试剂盒及测序方法 | |
CN113862394B (zh) | 一种番茄不孕病毒的rpa检测方法 | |
CN111235303B (zh) | 一种鉴别大米草和互花米草的方法 | |
CN108048596A (zh) | 红麻干旱响应基因est-ssr引物及试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210420 |