CN102154452B - 一种鉴定顺式和反式调控作用的方法和系统 - Google Patents

一种鉴定顺式和反式调控作用的方法和系统 Download PDF

Info

Publication number
CN102154452B
CN102154452B CN2010106149628A CN201010614962A CN102154452B CN 102154452 B CN102154452 B CN 102154452B CN 2010106149628 A CN2010106149628 A CN 2010106149628A CN 201010614962 A CN201010614962 A CN 201010614962A CN 102154452 B CN102154452 B CN 102154452B
Authority
CN
China
Prior art keywords
gene
snp
parents
cis
trans
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2010106149628A
Other languages
English (en)
Other versions
CN102154452A (zh
Inventor
宋驰
徐讯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Technology Solutions Co Ltd
Original Assignee
BGI Technology Solutions Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Technology Solutions Co Ltd filed Critical BGI Technology Solutions Co Ltd
Priority to CN2010106149628A priority Critical patent/CN102154452B/zh
Publication of CN102154452A publication Critical patent/CN102154452A/zh
Priority to HK11111363.3A priority patent/HK1156986A1/xx
Application granted granted Critical
Publication of CN102154452B publication Critical patent/CN102154452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开一种鉴定顺式和反式调控作用的方法和系统。该方法包括:选择两个亲本及其杂交分离子代群体进行重测序,将测序得到的片段比对到参考基因组上确定有效SNP位点;通过滑动窗口方法构建SNP-block图,以确定子代染色体的亲本来源;对两个亲本及其杂交分离子代群体进行表达谱测序,确定具有显著性差异的基因;根据基因在两个亲本和杂交分离子代群中表达量的差异情况结合SNP信息确定顺式和反式调控作用。本发明提供的方法和系统,应用新一代测序技术,通过重测序和表达谱测序相结合的方法,在全基因组水平鉴定顺式和反式调控作用。与传统技术方案相比,在SNP检测水平,基因表达量检测的准确性和敏感性方面都有了很高的提升。

Description

一种鉴定顺式和反式调控作用的方法和系统
技术领域
本发明涉及生物信息技术领域,尤其涉及一种鉴定顺式和反式调控作用的方法和系统。
背景技术
种内不同个体之间或者近缘物种及其杂交分离子代群体之间的表型差异,主要是由于同源基因的差异表达而导致的。这些基因的差异表达主要是由于顺式调控(cis-regulatory)作用和反式调控(trans-regulatory)作用而产生的。顺式调控的改变主要影响基因转录的起始、转录的效率和(或)转录物的稳定性;反式调控的改变主要是通过修饰和顺式作用序列相互作用因子的活性或表达而起作用的,即反式调控起作用的方式,主要是通过修饰与顺式作用序列相互作用因子的活性或表达而完成的。
单核苷酸多态性(Single Nucleotide Polymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失所致。但通常所说的SNP并不包括后两种情况。
现有技术中用于检验顺式和反式调控作用的方法包括:基于杂交一代(F1)群体内部候选基因在亲本和F1群体中的表达量差异确定顺式和反式调控作用;基于表达数量性状座位(eQTL)作图的方法确定顺式和反式调控作用。现有技术的方法或是基于已知候选基因的基础上,通过表达量的差异来研究顺式和反式调控,不能从全基因组水平上说明顺式和反式调控作用;或是通过eQTL的方法找到候选基因后,再通过表达量的差异和基因芯片等方法来研究顺式和反式调控作用,由于基因芯片的方法在定量及准确性方面的缺陷,不能够更准确的定性顺式和反式调控作用。到目前为止,关于顺式和反式调控对基因表达影响的贡献大小还没有明确的认识。
发明内容
本发明要解决的一个技术问题是提供一种鉴定顺式和反式调控作用的方法,具有更高的准确性。
根据本发明的一个方面,提供一种鉴定顺式和反式调控作用的方法,包括:
选择两个亲本及其杂交分离子代群体进行重测序,将测序得到的序列片段比对到参考基因组上确定有效SNP位点;
对于每个子代,通过滑动窗口方法构建SNP-block图,以确定子代染色体的片段的亲本来源;
对两个亲本及其杂交分离子代群体进行表达谱测序,确定具有显著性差异的基因;
根据基因在两个亲本和杂交分离子代群中表达量的差异情况结合SNP信息确定顺式和反式调控作用。
根据本发明的一个实施例,上述确定的有效SNP位点应包括:当在一个SNP位点上,两个亲本中核苷酸不同,而子代和其中一个亲本核苷酸相同,则确定该SNP位点为有效SNP位点。
根据本发明的一个实施例,上述根据基因在两个亲本和子代中表达量的差异情况,结合SNP信息确定顺式和反式调控作用的步骤包括:
判断基因是否满足如下条件:(1)基因在两亲本中有表达差异,在该基因的预定区域范围中存在SNP位点;(2)对于任何一个子代,该基因的表达量和该子代的具有相同SNP信息的亲本之间没有差异,和该子代的具有不同SNP信息的另一亲本之间存在差异;
如果同时满足上述条件,则确定该基因为受到顺式调控的作用;否则,确定该基因为受反式调控的作用。
根据本发明的一个实施例,上述通过滑动窗口方法构建SNP-block图的步骤包括:将分布在染色体上的有效SNP位点以预定长度作为一个窗口在染色体上从头至尾进行滑动,分别统计每一个窗口有效SNP位点来自不同亲本的比例,将窗口所在的染色体片段标记为来自占比例较高的亲本,构建SNP-block图。
本发明提供的鉴定顺式和反式调控作用的方法,应用新一代测序技术,通过重测序和表达谱测序相结合的方法,在全基因组水平鉴定顺式和反式调控作用。与传统方法相比,在SNP检测水平,基因表达量检测的准确性和敏感性方面都有了很高的提升。
本发明要解决的另一个技术问题是提供一种鉴定顺式和反式调控作用的系统,具有更高的准确性。
根据本发明的一个方面,提供一种鉴定顺式和反式调控作用的系统,包括:
有效位点确定装置,用于选择两个亲本及其杂交分离子代群体进行重测序,将测序得到的序列片段比对到参考基因组上确定有效SNP位点;
图构建装置,用于对于每个子代,通过滑动窗口方法构建SNP-block图,以确定子代染色体的片段的亲本来源;
表达谱测序装置,用于对两个亲本及其杂交分离子代群体进行表达谱测序,确定具有显著性差异的基因;
调控作用确定装置,用于根据基因在两个亲本和杂交分离子代群中表达量的差异情况结合SNP信息确定顺式和反式调控作用。
根据本发明系统的一个实施例,有效位点确定装置包括:
位点确定单元,用于选择两个亲本及其杂交分离子代群体进行重测序,将测序得到的序列片段比对到参考基因组上,确定SNP位点;
有效位点判断单元,用于对于位点确定单元确定的SNP位点,判断该SNP位点是否在两个亲本中核苷酸不同而子代和其中一个亲本核苷酸相同,如果是,则判断该SNP位点为有效SNP位点。
根据本发明系统的一个实施例,调控作用确定装置用于判断基因是否满足:
(1)基因在两亲本中有表达差异,在该基因的预定区域范围中存在SNP位点;
(2)对于任何一个子代,该基因的表达量和该子代的具有相同SNP信息的亲本之间没有差异,和该子代的具有不同SNP信息的另一亲本之间存在差异;
如果同时满足上述条件,则确定该基因为受到顺式调控的作用;否则,确定该基因为受反式调控的作用。
根据本发明系统的一个实施例,图构建装置用于将分布在染色体上的有效SNP位点以预定长度作为一个窗口在染色体上从头至尾进行滑动,分别统计每一个窗口有效SNP位点来自不同亲本的比例,将窗口所在的染色体片段标记为来自占比例较高的亲本。
根据本发明系统的一个实施例,表达谱测序装置包括:
表达谱测序单元,用于对两个亲本及其杂交分离子代群体进行表达谱测序;
差异基因判断单元,用于根据表达谱测序单元获得的表达谱测序结果确定具有显著性差异的基因。
本发明提供的系统,应用高通量的新一代测序技术,通过重测序和表达谱测序相结合的方法,在全基因组水平鉴定顺式和反式调控作用。与传统技术方案相比,在SNP检测水平,基因表达量检测的准确性和敏感性方面都有了很高的提升。
附图说明
图1示出本发明的鉴定顺式和反式调控作用的方法的一个实施例的流程图;
图2示出本发明的鉴定顺式和反式调控作用的方法的另一个实施例的流程图;
图3示出本发明的SNP-block图的图示;
图4示出本发明的鉴定顺式和反式调控作用的系统的一个实施例的框图;
图5示出本发明的鉴定顺式和反式调控作用的系统的另一个实施例的框图。
具体实施方式
下面参照附图对本发明进行更全面的描述,其中说明本发明的示例性实施例。
与传统的测序方法相比,新一代测序技术如454(Roche)、Solexa(Illumina)和SOLiD(ABI)的诞生,使得测序通量迅速提升,测序成本急剧下降。测序技术上的突破极大地推动了基因组科学的发展。大量物种的全基因组序列被发表,包括James Watson的个人基因组、第一个亚洲人的基因组、大熊猫、黄瓜等;重要物种的驯化历史通过重测序的方法被揭示,包括家蚕、水稻、家鸡等。这种高通量的新一代测序技术适用于新物种的测序、重测序以及表达谱等研究。
新一代测序技术的广泛应用,提供了一个从测序水平出发,从全基因组水平发现SNP,探测全部基因表达量,从而更好的研究顺式和反式调控作用的契机。
图1示出本发明的鉴定顺式和反式调控作用的方法的一个实施例的流程图。
如图1所示,在步骤102,选择两个亲本及其杂交分离子代群体(至少一株)进行重测序,将测序得到的序列片段比对到参考基因组上确定有效SNP位点。
参考基因组是指已经完成全基因组测序工作的物种的基因组序列,在进行单核苷酸多态性、基因组结构变异的研究方面,其基因组序列可以作为同种或者近缘物种的参考。基于已知的参考基因组序列,选取待研究的同种或者近缘物种,利用例如高通量的测序技术,进行全基因组覆盖度例如3到5倍的测序,将测序得到的短序列比对回参考基因组。可以通过任何一种检测SNP方法,如SOAPsnp等程序,将测序技术得到的测序片段比对到参考基因组序列上,并检测相应的单核苷酸多态性SNP位点信息,即在待研究物种和参考序列之间发生单个碱基的变异的位点,确定SNP位点。有效SNP位点指在该SNP位点上,两个亲本中核苷酸相异,子代和其中一个亲本核苷酸相同。
在步骤104,对于每个子代,通过滑动窗口方法构建SNP-block图(SNP块图),以确定子代染色体的片段的亲本来源。
将分布在染色体上的有效SNP位点以预定个数作为一个窗口,在染色体上从头至尾进行滑动,分别统计每一个窗口中SNP来自不同亲本的比例,将窗口所在的染色体片段标记为来自占比例较高的亲本,构建SNP-block图。例如两个亲本分别记为A和B,如果窗口中SNP属于亲本A的比例大于属于亲本B的比例,则记为此窗口所在的染色体片段来自亲本A;反之,则记为来自亲本B。将得到的这些区段按照不同的染色体来源,分别画出每一个子代每一条染色体的片段的来源信息。
滑动窗口的取值应根据重测序的深度和检测得到的SNP位点的密度来相应的决定。测序深度越深,相应的SNP的密度就越高,所选取的滑动窗口的值则可以相应提高。在一个实施例中,所选取的滑动窗口的范围覆盖基因组的500kb左右的长度,过高或者过低都会导致检测精度的下降。
在步骤106,对两个亲本及其杂交分离子代群体(至少一株)进行表达谱测序,确定具有显著性差异的基因。本发明实施例应选取大于等于F2代的杂交分离子代群体,对子代群体的要求不绝对限定。相对来说,分离群体的代数越高,等位基因出现杂合的概率就越低,检测到纯和的SNP的概率就越高,相应此发明的检测精度就越高。在本发明的一个实施例中,采用F5代以上的杂交分离子代群体。
在步骤108,根据基因在两个亲本和杂交分离子代群中表达量的差异情况结合SNP信息确定顺式和反式调控作用。假设基因A在两亲本中有表达差异;在该基因上游某长度区域(例如,100kb)至下游某长度区域(例如,10kb)存在SNP位点;对于任何一个子代来讲,基因A的表达量和其具有相同SNP信息的亲本之间没有差异,同时和具有不同SNP信息的另一亲本之间存在差异。同时满足上述要求的基因,则定义为受到顺式调控的作用,其他的差异表达基因定义为受到反式调控的作用。
在本发明的一个实施例中,通过步骤104根据滑动窗口的方法建立了SNP-block图,即已经确定子代中某一片段来自于哪个亲本的信息。子代的不同片段中包含了相应的基因,根据这些基因的表达量的相关信息,来判断这一基因的表达是受到顺式调控作用还是反式调控作用。以一个基因为例,首先要判断该基因在两个亲本之间是否是差异表达的基因,如果是,则判断在该基因的预定区域范围(例如,起始密码子上游100kb至终止密码子下游10kb)内所包含的SNP的信息:若该范围内包含SNP,该表达量差异不存在和该基因所在片段具有相同的SNP信息的亲本之间,同时存在于和该基因所在片段具有不同的SNP信息的亲本之间,则认为这个基因的表达量差异是由于SNP的存在而产生的,这个基因受到顺式作用调控;若该范围内包含SNP,该表达量差异存在和该基因所在片段具有相同的SNP信息的亲本之间,则认为这种差异不是由SNP造成的,则该基因受到反式作用调控;若该范围内不包含SNP,则该基因的表达量变化不受到SNP的影响,则该基因受到反式作用调控;
在该实施例中,应用高通量的新一代测序技术,通过重测序和表达谱测序相结合的方法,在全基因组水平鉴定顺式和反式调控作用。与传统方法相比,在SNP检测水平,基因表达量检测的准确性和敏感性方面都有了很高的提升。
图2示出本发明的鉴定顺式和反式调控作用的方法的另一个实施例的流程图。
如图2所示,在步骤202,将两个亲本和其杂交分离子代群体(两株)重测序,检测SNP位点。在该实施例中,通过高通量测序技术进行重测序。新一代高通量测序技术包括Illumina Genome Analyzer(GA),AB SOLiD,以及Roche 454 FLX。这些测序技术显著地提高了测序通量,极大地降低了成本。已经被广泛的应用于基因组学的研究中。James Watson的个人基因组测序采用了Roche 454FLX,黄瓜的基因组序列采用了Illumina Genome Analyzer(GA),以及目前正在广泛开展的千种动植物基因组测序都将广泛的应用新一代的高通量测序技术,如Illumina Genome Analyzer(GA)等。可以通过任何一种检测SNP的程序,如SOAPsnp等程序,将高通量测序技术得到的测序片段比对到参考基因组序列上,并检测相应的SNP位点信息。
在步骤204中,确定有效SNP位点,即在该SNP位点上,两个亲本中核苷酸相异,并且子代和其中一个亲本核苷酸相同。在该实施例中,进一步选择在所有子代中同时为有效SNP位点的信息作为有效SNP位点。
在步骤206中,利用滑动窗口方法构建SNP-block图。对于每一个子代的每一条染色体中,都分布着大量的有效SNP位点。由于子代是由两个亲本杂交而产生的,同源染色体片段发生交换之后,子代的每一条染色体都应该交错着来自不同亲本的大片段。在该实施例中,将分布在染色体上的有效SNP位点以预定个数作为一个窗口(该窗口可根据实际情况进行变动),在染色体上从头至尾进行滑动,分别统计每一个窗口中SNP位点来自不同亲本的比例,构建SNP-block图,确定子代染色体中不同片段的亲本来源。
在步骤208中,进行表达谱测序,确定差异表达基因。在该实施例中,选择两亲本和两个子代均处于种子发芽阶段的个体,分别对地上部分(L)和根部(R)进行表达谱测序。选取的参考基因为重测序参考基因组的全部注释基因。对表达谱测序得到的数据进行标准化之后,选取表达量差异在一倍以上,FDR(False Discovery Rate,错误发现率))值小于等于0.001的基因作为显著表达差异的基因。本领域的技术人员应当理解,差异基因的选取可以采用其他的标准。
在步骤210中,根据基因在两亲本中和子代中表达量的差异情况,结合SNP信息确定顺式和反式调控作用
假设基因A在两亲本中有表达差异;在该基因上游100kb区域至下游10kb区域存在SNP位点;对于任何一个子代来讲,基因A的表达量和其具有相同SNP信息的亲本之间没有差异,同时和具有不同SNP信息的另一亲本之间存在差异。同时满足上述要求的基因,则定义为受到顺式调控的作用。其他的差异表达基因定义为受到反式调控的作用,如在所选择区域内不存在SNP位点信息,或者虽存在SNP位点信息,但是SNP位点的来源信息和表达量的差异情况不一致等。
下面将结合野生大豆介绍本发明上述实施例的一个应用例,在该应用例中,针对野生大豆的两个亲本和其杂交分离子代(F7代)群体两株进行研究。具体步骤包括:
首先,采用高通量测序技术将两个亲本和其杂交分离子代群体(两株)重测序,然后通过检测SNP的程序如SOAPsnp将高通量测序技术得到的测序片段比对到参考全基因组序列上,并检测相应的SNP位点信息。在该应用例中,共在两个亲本之间检测到3,225,968个SNP位点。
其次,选择在两个子代中同时为有效SNP位点的信息作为有效SNP位点。在本应用例中,通过分析共得到1,479,244个有效位点,占全部SNP位点信息的46%。被过滤掉的位点主要包括部分位点信息只存在一个子代中而不存在另外一个中;还有很少一部分SNP位点为杂合位点。
再次,将分布在染色体上的有效SNP位点以15个作为一个窗口(在应用中该窗口可根据实际情况进行变动),在染色体上从头至尾进行滑动,分别统计每一个窗口中SNP位点来自不同亲本的比例。例如两个亲本分别记为A和B,如果15个SNP位点分属两个亲本的比例大于等于8∶7,则记为此窗口所在的染色体片段来自亲本A;反之,则记为来自亲本B。将得到的这些区段按照不同的染色体来源,分别画出每一个子代每一条染色体的来源信息,具体情况参见图3。在图3中,分别用实体框和透明框来表示来自不同亲本C08和W05的基因片段。
然后,选择两亲本和两个子代均处于种子发芽阶段的个体,分别对地上部分(L)和根部(R)进行表达谱测序。参考基因为重测序参考基因组的全部注释基因。对表达谱测序得到的数据进行标准化(例如,取每百万条tag中包含的该转录本的tag数目,单位为TPM(Transcript Per Million clean tags))之后,选取表达量差异在一倍以上,FDR(False Discovery Rate,错误发现率))值小于等于0.001的基因作为显著表达差异的基因。
最后,根据基因在两亲本中和子代中表达量的差异情况,结合SNP信息确定顺式和反式调控作用。本实施例中共选取参考序列48794条,在样品L中,共得到受顺式调控作用的基因10个,反式调控作用的27个;在样品R中,得到受顺式调控作用的基因72个,反式调控作用的111个,具体结果参见下表1:
Figure BDA0000041771440000101
表1
图4示出本发明的鉴定顺式和反式调控作用的系统的一个实施例的框图。如图4所示,该实施例的系统包括有效位点确定装置41、图构建装置42、表达谱测序装置43和调控作用确定装置44。其中,有效位点确定装置41用于选择两个亲本及其杂交分离子代群体进行重测序,将测序得到的序列片段比对到参考基因组上确定有效SNP位点;图构建装置42用于对于每个子代,通过滑动窗口方法构建SNP-block图,以确定子代染色体的片段的亲本来源;表达谱测序装置43用于对两个亲本及其杂交分离子代群体进行表达谱测序,确定具有显著性差异的基因;调控作用确定装置44用于根据基因在两个亲本和杂交分离子代群中表达量的差异情况结合SNP信息确定顺式和反式调控作用。根据本发明的系统的一个实施例,调控作用确定装置44用于判断基因是否满足:(1)基因在两亲本中有表达差异,在该基因的预定区域范围中存在SNP位点;(2)对于任何一个子代,该基因的表达量和该子代的具有相同SNP信息的亲本之间没有差异,和该子代的具有不同SNP信息的另一亲本之间存在差异;如果同时满足上述条件,则确定该基因为受到顺式调控的作用;否则,确定该基因为受反式调控的作用。
根据本发明的一个系统的实施例,图构建装置用于将分布在染色体上的有效SNP位点以预定长度作为一个窗口在染色体上从头至尾进行滑动,分别统计每一个窗口有效SNP位点来自不同亲本的比例,将窗口所在的染色体片段标记为来自占比例较高的亲本。
图5示出本发明的鉴定顺式和反式调控作用的系统的另一个实施例的框图。如图5所示,该实施例的系统包括有效位点确定装置51、图构建装置42、表达谱测序装置53和调控作用确定装置44。其中,图构建装置42和调控作用确定装置44可以参见图4中对应装置的描述,为简洁起见在此不再详述。有效位点确定装置51包括位点确定单元511和有效位点判断单元512。其中,位点确定单元511用于选择两个亲本及其杂交分离子代群体进行重测序,将测序得到的序列片段比对到参考基因组上,确定SNP位点;有效位点判断单元512用于对于位点确定单元511确定的SNP位点,判断该SNP位点是否在两个亲本中核苷酸不同而子代和其中一个亲本核苷酸相同,如果是,则判断该SNP位点为有效SNP位点。表达谱测序装置53包括表达谱测序单元531和差异基因判断单元532。其中,表达谱测序单元531用于对两个亲本及其杂交分离子代群体进行表达谱测序;差异基因判断单元532用于根据表达谱测序单元531获得的表达谱测序结果确定具有显著性差异的基因。
对于图4和图5中各个装置或单元的功能,可以参考上文中关于本发明方法的实施例中对应部分的说明,为简洁起见,在此不再详述。
本领域的技术人员应当理解,对于图4、5中的各个装置,可以通过单独的计算处理设备实现,或者将其集成为一个独立的设备实现。在图4和图5中用框示出以说明它们的功能。这些功能块可以用硬件、软件、固件、中间件、微代码、硬件描述语音或者它们的任意组合来实现。举例来说,一个或者两个功能块都可以利用运行在微处理器、数字信号处理器(DSP)或任何其他适当计算设备上的代码实现。代码可以表示过程、功能、子程序、程序、例行程序、子例行程序、模块或者指令、数据结构或程序语句的任意组合。代码可以位于计算机可读介质中。计算机可读介质可以包括一个或者多个存储设备,例如,包括RAM存储器、闪存存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或本领域公知的其他任何形式的存储介质。计算机可读介质还可以包括编码数据信号的载波。
本领域技术人员将意识到硬件、固件和软件配置在这些情况下的可替换性,以及如何最好地实现每个特定应用地所述功能。
本发明提供的系统,应用高通量的新一代测序技术,通过重测序和表达谱测序相结合的方法,在全基因组水平鉴定顺式和反式调控作用。与传统技术方案相比,在SNP检测水平,基因表达量检测的准确性和敏感性方面都有了很高的提升。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (10)

1.一种鉴定顺式和反式调控作用的方法,其特征在于,包括:
选择两个亲本及其杂交分离子代群体进行重测序,将测序得到的序列片段比对到参考基因组上确定有效单核苷酸多态性SNP位点;
对于每个子代,通过滑动窗口方法构建SNP-block图,以确定子代染色体的片段的亲本来源;
对两个亲本及其杂交分离子代群体进行表达谱测序,确定具有显著性差异的基因;
根据基因在两个亲本和杂交分离子代群中表达量的差异情况结合SNP信息确定顺式和反式调控作用;
其中,所述确定有效SNP位点的步骤包括:
当在一个SNP位点上,两个亲本中核苷酸不同,而子代和其中一个亲本核苷酸相同,则确定该SNP位点为有效SNP位点;
所述根据基因在两个亲本和子代中表达量的差异情况结合SNP信息确定顺式和反式调控作用的步骤包括:
判断基因是否满足如下条件:
基因在两亲本中有表达差异,在该基因的预定区域范围中存在SNP位点;
对于任何一个子代,该基因的表达量和该子代的具有相同SNP信息的亲本之间没有差异,和该子代的具有不同SNP信息的另一亲本之间存在差异;
如果同时满足上述条件,则确定该基因为受到顺式调控的作用;否则,确定该基因为受反式调控的作用。
2.根据权利要求1所述的鉴定顺式和反式调控作用的方法,其特征在于,所述对于每个子代,通过滑动窗口方法构建SNP-block图的步骤包括:
将分布在染色体上的有效SNP位点以预定长度作为一个窗口在染色体上从头至尾进行滑动,分别统计每一个窗口有效SNP位点来自不同亲本的比例,将窗口所在的染色体片段标记为来自占比例较高的亲本,构建SNP-block图。
3.根据权利要求1所述的鉴定顺式和反式调控作用的方法,其特征在于,所述对两个亲本及其杂交分离子代群体进行表达谱测序的步骤包括:
选择两个亲本及其杂交分离子代群体的待研究发育阶段和组织样本进行表达谱测序。
4.根据权利要求1所述的鉴定顺式和反式调控作用的方法,其特征在于,所述确定具有显著性差异的基因的条件为:基因的表达量差异在一倍以上,且错误发现率FDR小于等于0.001。
5.根据权利要求1所述的鉴定顺式和反式调控作用的方法,其特征在于,所述杂交分离子代群体至少包括两株,所述杂交分离子代为大于等于F2。
6.一种鉴定顺式和反式调控作用的系统,其特征在于,包括:
有效位点确定装置,用于选择两个亲本及其杂交分离子代群体进行重测序,将测序得到的序列片段比对到参考基因组上确定有效单核苷酸多态性SNP位点;
图构建装置,用于对于每个子代,通过滑动窗口方法构建SNP-block图,以确定子代染色体的片段的亲本来源;
表达谱测序装置,用于对两个亲本及其杂交分离子代群体进行表达谱测序,确定具有显著性差异的基因;
调控作用确定装置,用于根据基因在两个亲本和杂交分离子代群中表达量的差异情况结合SNP信息确定顺式和反式调控作用;
其中,所述有效位点确定装置包括:
位点确定单元,用于选择两个亲本及其杂交分离子代群体进行重测序,将测序得到的序列片段比对到参考基因组上,确定SNP位点;
有效位点判断单元,用于对于位点确定单元确定的SNP位点,判断该SNP位点是否在两个亲本中核苷酸不同而子代和其中一个亲本核苷酸相同,如果是,则判断该SNP位点为有效SNP位点;
所述调控作用确定装置用于判断基因是否满足:
基因在两亲本中有表达差异,在该基因的预定区域范围中存在SNP位点;
对于任何一个子代,该基因的表达量和该子代的具有相同SNP信息的亲本之间没有差异,和该子代的具有不同SNP信息的另一亲本之间存在差异;
如果同时满足上述条件,则确定该基因为受到顺式调控的作用;否则,确定该基因为受反式调控的作用。
7.根据权利要求6所述的鉴定顺式和反式调控作用的系统,其特征在于,所述图构建装置用于将分布在染色体上的有效SNP位点以预定长度作为一个窗口在染色体上从头至尾进行滑动,分别统计每一个窗口有效SNP位点来自不同亲本的比例,将窗口所在的染色体片段标记为来自占比例较高的亲本。
8.根据权利要求6所述的鉴定顺式和反式调控作用的系统,其特征在于,所述表达谱测序装置包括:
表达谱测序单元,用于对两个亲本及其杂交分离子代群体进行表达谱测序;
差异基因判断单元,用于根据表达谱测序单元获得的表达谱测序结果确定具有显著性差异的基因。
9.根据权利要求6所述的鉴定顺式和反式调控作用的系统,其特征在于,所述表达谱测序装置确定具有显著性差异的基因的条件为表达量差异在一倍以上,且错误发现率FDR小于等于0.001的基因。
10.根据权利要求6所述的鉴定顺式和反式调控作用的系统,其特征在于,所述杂交分离子代群体至少包括两株,所述杂交分离子代为大于等于F2。
CN2010106149628A 2010-12-30 2010-12-30 一种鉴定顺式和反式调控作用的方法和系统 Active CN102154452B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2010106149628A CN102154452B (zh) 2010-12-30 2010-12-30 一种鉴定顺式和反式调控作用的方法和系统
HK11111363.3A HK1156986A1 (en) 2010-12-30 2011-10-21 Method and system for detecting cis-regulatory effect and trans-regulatory effect

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010106149628A CN102154452B (zh) 2010-12-30 2010-12-30 一种鉴定顺式和反式调控作用的方法和系统

Publications (2)

Publication Number Publication Date
CN102154452A CN102154452A (zh) 2011-08-17
CN102154452B true CN102154452B (zh) 2013-11-20

Family

ID=44436122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010106149628A Active CN102154452B (zh) 2010-12-30 2010-12-30 一种鉴定顺式和反式调控作用的方法和系统

Country Status (2)

Country Link
CN (1) CN102154452B (zh)
HK (1) HK1156986A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101295784B1 (ko) * 2011-10-31 2013-08-12 삼성에스디에스 주식회사 목표 유전체 서열 내의 신규서열 생성 장치 및 방법
CN103336916B (zh) * 2013-07-05 2016-04-06 中国科学院数学与系统科学研究院 一种测序序列映射方法及系统
TWI571763B (zh) * 2014-12-01 2017-02-21 財團法人資訊工業策進會 次世代定序分析系統及其次世代定序分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基因表达数量性状定位的研究进展;陈颖等;《生命科学》;20090228;第21卷(第1期);38-42 *
陈颖等.基因表达数量性状定位的研究进展.《生命科学》.2009,第21卷(第1期),38-42.

Also Published As

Publication number Publication date
CN102154452A (zh) 2011-08-17
HK1156986A1 (en) 2012-06-22

Similar Documents

Publication Publication Date Title
Silva‐Junior et al. A flexible multi‐species genome‐wide 60K SNP chip developed from pooled resequencing of 240 Eucalyptus tree genomes across 12 species
US9976191B2 (en) Rice whole genome breeding chip and application thereof
Yang et al. Target SSR-Seq: a novel SSR genotyping technology associate with perfect SSRs in genetic analysis of cucumber varieties
CN109346130B (zh) 一种直接从全基因组重测序数据中得到微单体型及其分型的方法
SA517381091B1 (ar) طرق وأنظمة لتحليل بيانات توالي الحمض النووي
CN103088120B (zh) 基于SLAFseq技术的大规模样品基因分型方法
AU2021269294A1 (en) Validation methods and systems for sequence variant calls
CN117778576A (zh) 游离dna末端特征
CN107090494B (zh) 与谷子码粒数性状相关的分子标记及其检测引物和应用
WO2020237184A1 (en) Systems and methods for determining whether a subject has a cancer condition using transfer learning
CN111088382B (zh) 一种玉米全基因组snp芯片及其应用
CN109337997B (zh) 一种山茶属多态性叶绿体基因组微卫星分子标记引物及筛选和甄别近缘种的方法
CN102154452B (zh) 一种鉴定顺式和反式调控作用的方法和系统
US20160078169A1 (en) Method of and apparatus for providing information on a genomic sequence based personal marker
CN105907860B (zh) 一种利用|Δ(SNP-index)|进行性状定位的QTL-seq方法及其应用
CN103184275A (zh) 一种水稻基因组基因标识的新方法
CN107447022B (zh) 一种预测玉米杂种优势的snp分子标记及应用
JP4468773B2 (ja) 遺伝子情報の表示方法及び表示装置
CN113564266B (zh) Snp分型遗传标记组合、检测试剂盒及用途
CN114945987A (zh) 从单一样品预估肿瘤纯度
CN116904611B (zh) 山羊srd5a2基因中与产羔数关联的分子标记及其应用
WO2013073929A1 (en) Method and apparatus for detecting nucleic acid variation(s)
CN115862876B (zh) 基于免疫微环境基因群预测肺腺癌患者预后的装置
Weidhaas Identifying MicroRNA Pathway Variants as Biomarkers of Patient Selection for Immune Therapy
KR101840028B1 (ko) miRNA 및 mRNA 발현 데이터를 통합 분석하는 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1156986

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: BGI TECHNOLOGY SOLUTIONS CO., LTD.

Free format text: FORMER OWNER: BGI-SHENZHEN CO., LTD.

Effective date: 20130422

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20130422

Address after: 518083 science and Technology Pioneer Park, comprehensive building, Beishan Industrial Zone, Yantian District, Guangdong, Shenzhen 201

Applicant after: BGI Technology Solutions Co., Ltd.

Address before: Beishan Industrial Zone Building in Yantian District of Shenzhen city of Guangdong Province in 518083

Applicant before: BGI-Shenzhen Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1156986

Country of ref document: HK