CN102174654A - 高效功能标记规模化开发和qtl定位候选基因的快速确定方法 - Google Patents
高效功能标记规模化开发和qtl定位候选基因的快速确定方法 Download PDFInfo
- Publication number
- CN102174654A CN102174654A CN2011100500475A CN201110050047A CN102174654A CN 102174654 A CN102174654 A CN 102174654A CN 2011100500475 A CN2011100500475 A CN 2011100500475A CN 201110050047 A CN201110050047 A CN 201110050047A CN 102174654 A CN102174654 A CN 102174654A
- Authority
- CN
- China
- Prior art keywords
- gene
- target
- qtl
- ssr
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及功能基因分子标记的规模化开发,属于分子遗传学和分子育种领域。本发明将其它物种已知功能的基因序列与所研究物种(靶物种)的基因组序列比对,找出同源基因序列,然后将已知功能的靶物种的同源基因序列及其上下游50kb区域序列提取出,找出简单序列重复(SSR)位点,开发出与目标性状紧密连锁的功能性SSR标记,整合QTL定位的结果,快速确定QTL所在区域的候选基因。本发明开发出的功能性SSR标记具有多态性高、结果稳定可靠、重复性好、操作简便和成本低等特点,特别适合QTL初步定位后快速进行加密标记和候选基因的确定,实现多个性状候选基因的规模化确认,打破了传统QTL初步定位后进一步加密标记和寻找候选基因费时和费力的瓶颈。
Description
技术领域
本发明属于分子遗传和分子育种技术领域,特别是涉及一种高效功能标记规模化开发和QTL定位候选基因的快速确定方法,专用于靶基因的功能标记开发,快速进行QTL精细定位和高效确定候选基因。
背景技术
SSR作为第二代基于PCR技术的分子标记技术,具多态性高、结果稳定可靠、重复性好、操作简便等特点,并且SSR标记覆盖整个基因组,主要表现为共显性遗传。此外,SSR分析对DNA 的数量和纯度要求不高。开发基因区域或者与基因紧密连锁区域的SSR可以秉承SSR标记的一系列优点,并且与其他标记相比它反映了靶基因遗传规律,可以直接获得基因表达的信息,为功能基因提供“绝对”的标记,还有可能对决定重要表型性状的等位基因进行直接鉴定,从而省去SSR引物开发过程中的克隆和测序步骤,可充分利用现有测序数据,降低开发成本,且在不同物种问通用性较好。
目前基因克隆的方法很多,最常用的基因克隆技术有转座子标签技术、图位克隆和同源基因克隆。转座子标签技术原理是由于携带有报告基因的转座子发生“跳跃”,插入到基因组的不同部位,若插入到基因区域,则基因发生突变,基因的表达量将发生变化,甚至导致基因失活,然后根据其保守序列设计引物向转座子的两侧进行PCR扩增,最终完成基因的克隆。由于转座子在不同的植物中转座的频率和活性差异很大,并且需要筛选大量的个体来鉴定转座子突变个体,植物基因组中多拷贝基因的存在还会限制转座子标签技术的应用,因而转座子标签技术的应用范围十分有限,特别是多倍体物种更是如此。到目前为止进行重要基因定位和克隆的方法中效果相对较好的方法还是图位克隆。图位克隆整个过程涉及分子标记的开发、遗传图谱构建、QTL初步定位、近等基因系等群体的建立、靶区域内多态性引物开发及多态性引物的筛选、物理图谱的构建、基因组文库或cDNA文库的建立与筛选、候选基因的确立、基因表达分析和互补测验等。由于该方法克隆出的基因是建立在QTL定位的基础上,所以克隆的基因一般可以高效表达,转化阳性单株可以产生明显的表型性状。其中最关键和难度最大的一步是在QTL初步定位的基础上进行分子标记的开发、多态性引物的筛选和加密标记等,需要大量的人力、时间和物力,并且目标基因精细定位和克隆受到物种基因组序列信息和标记类型的限制。所以目前利用此方法克隆的基因数目比较少。同源基因克隆是采用其它物种已知的基因序列进行引物设计,接着在靶物种中进行PCR扩增、测序和进行生物信息学分析,初步确定是否是靶基因,然后将确定的靶基因进行基因表达分析和互补测验等验证工作。尽管此技术可以在短时间内克隆大量的基因,但由于此技术没有建立在表型鉴定和筛选的基础上,所以克隆的基因阳性转化单株表型不明显。迄今为止还没有一种将图位克隆和同源基因克隆技术优点相结合的技术,能够大规模鉴定和克隆功能基因。
在进行遗传多样性分析,杂种优势群的划分和亲缘关系鉴定时,普遍采用非基因区域的多态性标记。例如利用SSR标记鉴定材料间的遗传多样性和亲缘关系已在多种作物中广泛应用,如水稻,花生,大豆,玉米,油菜等作物,但此类标记主要涉及非基因区域,其差异不能充分代表真实基因间的差异,也不能准确确定各物种或材料直接的进化关系。因此采用传统的分子标记方法划分出的杂种优势群以及反应出的材料间亲缘关系和进化关系会出现一定偏差。所以目前较少采用以目标基因区域或者与目标基因紧密连锁区域的分子标记来进行多样性分析的方式来克服非基因区域标记鉴定偏差的问题。
发明内容
本发明的目的是:提供一种高效功能标记规模化开发和QTL定位候选基因的快速确定方法。本发明基于如下原理:根据系统生物学,序列同源的基因有相同的功能。在自然进化和选择过程中,一定亲缘关系的物种控制同一性状的基因及侧翼序列有相近的进化模式、进化速度和进化方向,如同属一个科的芸薹属物种白菜型油菜和甘蓝型油菜与鼠耳芥属的拟南芥之间有75%以上的基因相类似。靶基因序列和侧翼序列中包括的简单重复序列(SSR)在近缘中具有较好的移植性。将已知物种基因序列与靶物种同源序列进行比对,然后将比对成功的靶物种的同源基因序列上下游延伸一定区域(一般为50kb),连同基因序列一起提取出,利用SSR搜寻软件(如SSR locator)进行SSR搜寻,然后利用引物设计软件进行SSR引物的设计,开发出与目标性状紧密连锁的功能型SSR标记,接着根据SSR标记与靶基因的远近和模体类型依次排列,首先在研究的群体中筛选离靶基因区域近的且具有优良多态性的SSR,然后再筛选离靶基因区域远的且具有优良多态性的SSR,直到筛选出有多态性的SSR引物为止,最后将标记与QTL扫描结果结合起来,确定目标QTL所在区域的候选基因并进行基因的克隆和验证等后续工作。本发明属于基于PCR的实用经济型标记,可以有效地寻找到基因区域或者与基因紧密连锁的上下游区域的SSR,整合QTL信息和快速确定候选基因。此种标记稳定性好,成本低,多态性好,可用于多种作物的功能标记开发,是一种能够快速寻找候选基因的有效分子标记方法。
本发明所提供的一种高效功能标记规模化开发和QTL定位候选基因的快速确定方法,具体方案如下:
1) 根据所研究的性状从模式植物的序列信息中寻找目标性状基因序列;
2) 在NCBI网站上(http://www.ncbi.nlm.nih.gov/)将已获得的功能基因序列与靶物种(定义为正在进行QTL定位研究的物种)进行BLAST,找出已知基因同源的靶基因(定位为靶物种中控制目标性状的基因)序列;
3) 按照同源比对上的目标物种的登陆号(Accession code),在www.ncbi.nlm.gov/sites/batchentrez 网站上对靶物种进行序列的批量下载;
4)利用在个人电脑上下载的blast程序,将下载的靶基因序列进行上下游延伸一定区域,一般为50kb;将基因区域与上下游延伸区域(称靶区域)进行整体提取出;
5)用AutoSSR、SSRHunter或SSR Locator软件对靶区域进行SSR搜索,并利用引物设计软件Primer5或Oligo 6进行引物设计;
6)根据SSR离靶基因的远近和模体构成确定引物的使用先后顺序:优先选择离靶基因近和由2-3个碱基模体组成的SSR;
7)在QTL定位群体中进行SSR标记检验,如果挑选出的引物在群体中无法扩增出多态性,再在剩余引物中继续挑选直至有多态性为止,然后进行QTL扫描,若开发的标记与靶性状的QTL紧密连锁,且LOD值符合≥3.0的目标,则可以初步判断此标记所连锁的基因即为候选基因;
8)将候选基因进行引物设计、克隆、测序、生物信息学分析和转化验证等工作。
步骤1)中模式植物根据不同的研究对象,是指拟南芥、水稻或玉米等。
本发明所提供的高效功能标记规模化开发和QTL定位候选基因的快速确定方法,具有如下的优点:
本发明作为一种新型分子标记,开发出的SSR主要来自目标基因区域或者与目标基因紧密连锁的区域,除具备传统基因组来源的SSR标记的优势外,还具有与功能基因紧密连锁的关系,从而强化了SSR标记在遗传研究中的应用,可以在QTL初步定位后快速进行标记加密和候选基因的确定,解决了长期困扰人们的QTL初步定位后开发和加密标记困难、寻找候选基因费时和费力的难题。
其次,从已知序列中设计SSR引物,避免了传统SSR标记开发需要构建基因组DNA文库等烦琐步骤,从而节省了大量的人力和物力。
同时,由于不同物种间基因的共线性和保守性,从一种作物中开发的功能基因SSR.可通用于其它多个近缘物种研究利用,因此利用该标记进行遗传作图可使物种之间靶基因的标记连锁信息和QTL定位信息进行有效交流和共享,并可作为参考标记,实现多个物种多个遗传图谱整合,进而为其它多个近缘物种比较基因组学研究和同源基因克隆提供新的途径。
再次,此类开发的功能性SSR标记除部分从基因区域寻找出外,主要从基因的侧翼序列中获得,所以大部分不同于其它功能性SSR标记,如EST-SSR,避免了功能基因内部的SSR数量有限,多态性较差的问题。
本发明的功能标记开发技术操作简单、稳定、多态性高,极易与目标基因发生共分离。适用于候选基因的精细定位。
具体实施方式
甘蓝型油菜开花期调控基因功能标记的开发和候选基因的确定
1. 确定研究的目标性状:甘蓝型油菜开花期调控基因;
2.下载拟南芥全基因组序列:进入拟南芥网站:http://www.arabidopsis.org/,点击“download”下拉框中的“sequence”,选择目录“whole chromosomes”,弹出页面后下载拟南芥的5条染色体,并保存到硬盘;
3.下载拟南芥开花期调控基因序列:进入拟南芥网站:http://www.arabidopsis.org/,点击“search”选项卡,在下拉菜单中选择“Genes”,弹出页面后,“Search by Name or Phenotype”下面根据需要选择相应的选择项,比如需要在基因名称中包含“开花期”,所以选择“Gene name”“contains”选项卡,输入“flowering time”,回车,弹出的页面显示的即是拟南芥开花期调控基因的信息。点击“check all”选项卡,点击“get all sequences”选项卡,在页面弹出后,在“Dataset”后面的下拉菜单中选择“AGI genomic locus sequences”,点击“get sequence”选项卡,保存拟南芥开花期调控基因的序列信息到移动硬盘,同时返回显示拟南芥开花期调控基因信息的页面,点击“check all”选项卡,点击“download all”选项卡,显示的即是关于拟南芥开花期调控基因的具体信息,比如该基因在染色体上的位置等,保存信息到硬盘;
4.拟南芥开花期调控基因序列与芸薹属BAC的BLAST比对:进入NCBI网站,http://www.ncbi.nlm.nih.gov/,点击“BLAST”,弹出页面后,在“Basic BLAST”下面点击“nucleotide blast”,弹出页面后,在upload file后面点击“浏览”选项卡,导入之前保存的拟南芥开花期调控基因的序列,在“database”后面选择“others”,下拉菜单中选择”Nucleotide collection(nr/nt)”,之后点击“BLAST”选项卡,进行拟南芥基因序列和芸薹属BAC的比对;弹出页面后,在“formatting options”的选项框中,在“show”栏选择“plain text”,点击“download”,选择“Text”格式保存到电脑硬盘,同时在“other reports”点击“Taxonomy reports”,结果显示与拟南芥开花基因匹配上的芸薹属序列号,保存到电脑硬盘,将芸薹属序列号单独列出以文本格式保存;
5.下载与拟南芥匹配上的芸薹属序列信息:登陆http://www.ncbi.nlm.nih.gov/sites/batchentrez网站,
在“Database”的下拉菜单中选择“Nucleotide”,点击“浏览”,导入之前保存的芸薹属序列信息号,点击“Retrieve”,下载芸薹属序列号对应的序列;
6. 整理与拟南芥开花期调控基因匹配上的基因序列及其上下游50kb序列:整理和芸薹属BAC比对上的靶基因序列号及其相应每个基因所在的位置,根据基因位置上下游滑动50kb(目前油菜基因组序列未完全公布,所以靶基因数目偏少),确定基因上下游50kb在各染色体中的位置;在http://www.jboss.org/jbossas/downloads.html网站下载“JMEBOSS”软件,按照软件安装说明安装软件,双击“Launch JEMBOSS”,在“EDIT”菜单中选择“extractseq Extract regions from a sequence”,点击“Browse files”导入甘蓝型油菜匹配上的序列,在“Regions to extract”选项卡中输入靶基因上下游50kb的位置,以“bp”为单位,点击“GO”,将甘蓝型油菜的靶基因及其上下游50kb区段的序列保存到文本文档;
7. SSR寻找和引物的设计:
在http://www.ufpel.edu.br/faem/fitotecnia/fitomelhoramento/faleconosco.ht网站下载“SSRLocator1”软件,根据安装说明安装“SSRLocator1”,将保存好的甘蓝型油菜开花期调控基因上下游50kb区段的序列和基因序列本身放到一个文本文档中,双击“SSRLocator1”图标,点击“Creat File”,下拉菜单中选择“Format File To SSRLocator Standart”,导入包含拟南芥序列和比对上的芸薹属序列的文本文档,命名输出文件,以“fasta”格式保存;点击“SSRs Search”下拉菜单中选择“SSRs Especifications”进行寻找SSR的参数设置:“Monomoer”:20;“Dimer”:10;“Trimer”:7;”Tetramer”:5;“Pentamer”:4;“Hexamer”:3;“Octamer”:3;“Nonamer”:3;“Decamer”:3;“Space between SSRs”:100;“Space between imperfect SSRs(<=)”:5;所有“Selected”选项卡都选上;参数设置完毕,再在“SSRs Search”下拉菜单中选择“Search SSRs”,导入之前保存的“Fasta”格式的序列,等待SSR扫描;完毕之后,再在“SSRs Search”下拉菜单中选择“Results SSRs –Sequence Loci”,显示SSR扫描结果,点击“Print TXT”选项卡保存SSR结果,接着进行SSR引物设计,点击“Primer Design”,在下拉菜单中选择“Set Parameters-Primer3”,“Amplicom size”:100-500;“GC clamp”:0;“Primer size”依次为:18,22,20;“TM”依次为55,65,60;“content G/C”:35,50;其余选项按软件默认格式;点击“Save”选项卡,再在“Primer Design”的下拉菜单中选择“Run Primer Design-Primer3”进行引物设计,引物设计完成之后再在“Primer Design”的下拉菜单中选择“View Result”,显示引物设计结果,点击“Print TXT”选项卡,选择保存到硬盘;搜索软件也可以用AutoSSR或SSRHunter,引物设计可用Oligo 6进行;
8.引物选择:根据各实验合成引物;
9.利用引物进行PCR反应:将合成的引物用ddH2O稀释为50ng/ul,-20℃保存备用;按CTAB法提取油菜叶片基因组DNA,以提取的DNA为模板,按下列反应体系进行:PCR反应的总体积为10μl,其体系为10×扩增缓冲液1.0μl,MgCl2(25mmol/L) 1.0μl,dNTP (10mmol/L pH7.5) 0.2μl,样品DNA (50ng/μl) 1.0μl,F-Primer(50ng/μl) 0.5μl,R-Primer(50ng/μl) 0.5μl,5U/μl Taq酶(购自上海 SABC公司) 0.1μl,ddH2O 5.7μl;PCR程序为 94℃ 3min,[94℃ 30s, 60℃ 45s,72℃ 1min] ×35cycles,72℃ 10min;PCR产物用10%的非变性丙烯酰胺凝胶进行电泳分离,银染法显带;
10.利用此项标记在分离群体中进行验证,发现功能型标记与开花期QTL紧密连锁,一次性地确定了23个与开花密切相关的基因。
Claims (2)
1.一种高效功能标记规模化开发和QTL定位候选基因的快速确定方法,其特征在于,具体方案如下:
1) 根据所研究的性状从模式植物的序列信息中寻找目标性状基因序列;
2) 在NCBI网站上http://www.ncbi.nlm.nih.gov/将已获得的功能基因序列与靶物种即正在进行QTL定位研究的物种进行BLAST,找出已知基因同源的靶基因即靶物种中控制目标性状的基因序列;
3) 按照同源比对上的目标物种的登陆号Accession code,在www.ncbi.nlm.gov/sites/batchentrez 网站上对靶物种进行序列的批量下载;
4)利用在个人电脑上下载的blast程序,将下载的靶基因序列进行上下游延伸一定区域,一般为50kb;将基因区域与上下游延伸区域即靶区域进行整体提取出;
5)用AutoSSR、SSRHunter或SSR Locator软件对靶区域进行SSR搜索,并利用引物设计软件Primer5或Oligo 6进行引物设计;
6)根据SSR离靶基因的远近和模体构成确定引物的使用先后顺序:优先选择离靶基因近和由2-3个碱基模体组成的SSR;
7)在QTL定位群体中进行SSR标记检验,如果挑选出的引物在群体中无法扩增出多态性,再在剩余引物中继续挑选直至有多态性为止,然后进行QTL扫描,若开发的标记与靶性状的QTL紧密连锁,且LOD值符合≥3.0的目标,则可以初步判断此标记所连锁的基因即为候选基因;
8)将候选基因进行引物设计、克隆、测序、生物信息学分析和转化验证等工作。
2.根据权利要求1所述的方法,其特征在于,步骤1)中模式植物根据不同的研究对象,是指拟南芥、水稻或玉米。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011100500475A CN102174654A (zh) | 2011-03-02 | 2011-03-02 | 高效功能标记规模化开发和qtl定位候选基因的快速确定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011100500475A CN102174654A (zh) | 2011-03-02 | 2011-03-02 | 高效功能标记规模化开发和qtl定位候选基因的快速确定方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102174654A true CN102174654A (zh) | 2011-09-07 |
Family
ID=44517892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011100500475A Pending CN102174654A (zh) | 2011-03-02 | 2011-03-02 | 高效功能标记规模化开发和qtl定位候选基因的快速确定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102174654A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105331701A (zh) * | 2015-11-11 | 2016-02-17 | 山西省农业科学院作物科学研究所 | 普通小麦抗病序列的全基因组ssr特异分子标记及开发方法 |
CN106480179A (zh) * | 2016-09-28 | 2017-03-08 | 南京农业大学 | 水稻种子快速萌发QTL qGS11的分子标记及其应用 |
CN107523633A (zh) * | 2017-10-09 | 2017-12-29 | 扬州大学 | 一种基于猪sine 转座子插入多态性研发新型分子标记的方法 |
-
2011
- 2011-03-02 CN CN2011100500475A patent/CN102174654A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105331701A (zh) * | 2015-11-11 | 2016-02-17 | 山西省农业科学院作物科学研究所 | 普通小麦抗病序列的全基因组ssr特异分子标记及开发方法 |
CN106480179A (zh) * | 2016-09-28 | 2017-03-08 | 南京农业大学 | 水稻种子快速萌发QTL qGS11的分子标记及其应用 |
CN107523633A (zh) * | 2017-10-09 | 2017-12-29 | 扬州大学 | 一种基于猪sine 转座子插入多态性研发新型分子标记的方法 |
CN107523633B (zh) * | 2017-10-09 | 2020-07-03 | 扬州大学 | 一种基于猪sine转座子插入多态性研发新型分子标记的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sato et al. | RiceXPro version 3.0: expanding the informatics resource for rice transcriptome | |
Schmidt et al. | Comparative structural genomics in the Brassicaceae family | |
Deshmukh et al. | Identification of RAPD and ISSR markers for drought tolerance in wheat (Triticum aestivum L.) | |
CN107345256A (zh) | 一种基于转录组测序开发山黧豆est‑ssr引物组及方法和应用 | |
Krattinger et al. | Map-based cloning of genes in Triticeae (wheat and barley) | |
Giraldo et al. | Validation of microsatellite markers for cytotype discrimination in the model grass Brachypodium distachyon | |
Qiu et al. | Development of new PCR-based markers specific for chromosome arms of rye (Secale cereale L.) | |
CN115786565B (zh) | 一种与小麦小穗数qtl连锁的snp分子标记及其应用 | |
CN103013986B (zh) | 利用est序列的冗余性开发辣椒ssr标记及其方法 | |
Zhang et al. | Characterizing the transcriptome and microsatellite markers for almond (Amygdalus communis L.) using the Illumina sequencing platform | |
Palliyarakkal et al. | Microsatellites in palm (Arecaceae) sequences | |
Xu et al. | A novel set of 223 EST-SSR markers in Casuarina L. ex Adans.: polymorphisms, cross-species transferability, and utility for commercial clone genotyping | |
CN102174654A (zh) | 高效功能标记规模化开发和qtl定位候选基因的快速确定方法 | |
Liu et al. | Isolation, characterization and mapping of genes differentially expressed during fibre development between Gossypium hirsutum and G. barbadense by cDNA-SRAP | |
Pang et al. | Promoter anchored amplified polymorphism based on random amplified polymorphic DNA (PAAP-RAPD) in cotton | |
Xiang et al. | Development of a Brassica seed cDNA microarray | |
CN106282345A (zh) | 一种鉴别水稻光敏色素基因phyb野生型和突变体的分子标记 | |
Roorkiwal et al. | Mining functional microsatellites in legume unigenes | |
Xie et al. | Characterization, development and exploitation of EST-derived microsatellites in Porphyra haitanensis Chang et Zheng (Bangiales, Rhodophyta) | |
WO2009031740A1 (en) | Functional data integrated genetic marker system, ssr-fmm, and improved genetic research and marker assisted selection with ssr-fmm | |
Reddy et al. | Use of diversity arrays technology markers for integration into a cotton reference map and anchoring to a recombinant inbred line map | |
CN102399799A (zh) | 青藏高原野生大麦HsCIPK26基因 | |
Azarin et al. | Data on the polymorphic sites in the chloroplast genomes of the sunflower alloplasmic CMS lines | |
Sathishkumar et al. | Mining of simple sequence repeats in the Genome of Gentianaceae | |
Kotrappa et al. | Intra and intergeneric transferable gene-derived orthologous microsatellite markers in Eucalyptus and Corymbia species |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20110907 |