CN102542178A - 一种基因内含子进化重构装置及方法 - Google Patents

一种基因内含子进化重构装置及方法 Download PDF

Info

Publication number
CN102542178A
CN102542178A CN2011104597130A CN201110459713A CN102542178A CN 102542178 A CN102542178 A CN 102542178A CN 2011104597130 A CN2011104597130 A CN 2011104597130A CN 201110459713 A CN201110459713 A CN 201110459713A CN 102542178 A CN102542178 A CN 102542178A
Authority
CN
China
Prior art keywords
introne
site
node
intermediate node
evolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104597130A
Other languages
English (en)
Other versions
CN102542178B (zh
Inventor
向浏欣
蔡应繁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201110459713.0A priority Critical patent/CN102542178B/zh
Publication of CN102542178A publication Critical patent/CN102542178A/zh
Application granted granted Critical
Publication of CN102542178B publication Critical patent/CN102542178B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种基因内含子进化重构装置及方法,所述装置包括同源基因数据获取单元,用于获取同源基因数据;内含子位点判断单元,用于对获取的同源基因数据进行判断是否有内含子位点数据;内含子位点标定单元,用于对同源基因数据标定内含子位点;系统进化树构建单元,用于对带有内含子位点的同源基因数据集构建系统进化树;内含子进化重构单元,用于对构建的系统进化树根据最大简约法重构内含子进化;本发明在系统进化树的基础上重构内含子进化,客观地描述内含子进化历程,是后续内含子功能研究的基础,本发明对进化树的数量和每棵进化树的同源基因的数量没有限制,对同源基因内含子的任何存在形式都可以重构,具有广泛性应用前景。

Description

一种基因内含子进化重构装置及方法
技术领域
本发明涉及生物技术领域,特别涉及一种基因内含子进化重构装置及方法。
背景技术
内含子是基因内的间隔序列或不编码序列,又称沉默DNA,它把单个真核基因分成许多不连续的区域,在转录后通过加工被切除,不被表达于蛋白质分子或成熟的mRNA中。大多数真核生物和古细菌的基因都有内含子。基因的编码部分称外显子,内含子通常比外显子长,且占基因更大的比例。内含子的功能研究目前尚处于起步阶段,对其功能研究既是基因组序列功能研究的一部分,又能为研究编码序列功能提供重要工具,促进对基因表达调控的进一步理解,同时还能提供有关生命起源进化的大量信息。内含子进化研究是内含子功能研究的一个方面,通过进化重构可以分析内含子的进化动力和内含子的功能或潜在的功能,在医学领域和动植物生长发育领域研究中具有广泛的应用前景。而在基因进化过程中内含子的长度和碱基序列变化较大,使得通过序列进行内含子进化重构有较大困难,但是内含子在基因中的位置非常保守,因而可以利用同源基因中内含子的位置来重构内含子的进化。
现有文献《双翅目昆虫(黑腹果蝇和冈比亚按蚊)内含子丢失的比较分析》(昆虫学报2006,49(3):373-380)公开了一种重构内含子进化的方法,包括获取一组同源基因,通过各自基因的基因组序列和蛋白序列比对获得内含子位点(位置),然后判断这些内含子的得失情况,如若同一位点(位置)只有一个基因存在内含子,其它都不存在,则认为该内含子是在进化过程中获得的,这是因为一次得到事件较几次独立的丢失的可能性要大;如果同一位点,只有一个基因不存在内含子,则认为该内含子是在进化过程中丢失的,这是因为一次丢失事件较几次独立的得到事件的可能性要大;若同一位点都存在内含子,则认为其共同的祖先中也存在,没有得失。该方法对于当内含子的存在情况比较复杂,如同一位点部分基因存在部分基因不存在,尤其是对大量同源基因或从基因组层面上对多组大量同源基因进行内含子得失计算时将不再有效,并且该方法仅仅是判断现存基因的内含子的得失情况(在进化中是获得的还是丢失的),未对内含子的进化历程做出判断和推断,对后续的内含子功能研究具有较大局限性。
发明内容
本发明所要解决的技术问题是提供一种能客观地描述内含子进化历程的内含子进化重构方法,该方法适合任何数量、任何规模的同源基因的内含子重构,具有应用广泛性。
为解决上述技术问题,本发明提供一种基因内含子进化重构装置,包括:
同源基因数据获取单元,用于获取同源基因数据;
内含子位点判断单元,用于对获取的同源基因数据进行判断是否有内含子位点数据;
内含子位点标定单元,用于对同源基因数据标定内含子位点;
系统进化树构建单元,用于对带有内含子位点的同源基因数据集构建系统进化树;
内含子进化重构单元,用于对构建的系统进化树根据最大简约法重构内含子进化。
优选的,所述内含子进化重构单元对构建的系统进化树根据最大简约法重构内含子进化为根据进化树叶结点的内含子存在情况确定根结点和中间结点;根结点和中间结点的内含子位点与叶结点的内含子位点一一对应;首先判断根结点各内含子位点的内含子存在情况,然后从根结点向叶结点方向依次判断各中间结点的内含子存在情况;根结点或某中间结点的某内含子位点的内含子存在情况的判断方法如下:若两分支中均有1个或多个叶结点的相应内含子位点存在内含子,则判断此根结点或中间结点在此位点为存在内含子;若两分支中一支有1个或多个叶结点的相应内含子位点存在内含子而另一支的所有叶结点的相应内含子位点均不存在内含子,对于根结点,则判断其在此位点为不存在内含子,对于中间结点,则考察其父母结点的相应内含子位点,父母结点存在则其存在,反之不存在。
优选的,所述内含子进化重构单元对构建的系统进化树根据最大简约法重构内含子进化为从进化树叶结点至根结点的方向判断中间结点和根结点的内含子存在情况;每个中间结点和根结点均由两个子女结点组成,某中间结点的某内含子位点的内含子存在情况的判断方法如下:若其两子女结点相应内含子位点均存在内含子,则判断此中间结点在此位点为存在内含子;若其两子女结点相应内含子位点均不存在内含子,则判断此中间结点在此位点为不存在内含子;若其中一个子女结点相应内含子位点存在内含子而另一个不存在,则考察此中间结点的兄弟结点结点,若兄弟结点相应内含子位点存在内含子,则判断此中间结点在此位点为存在,反之不存在。
优选的,所述同源基因数据获取单元与同源基因库相连接,从同源基因库获得同源基因数据集。
优选的,所述同源基因数据获取单元与基因库相连接,从基因库下载目的基因的基因组序列和蛋白序列,比较基因组序列和蛋白序列得到内含子位点。
为解决上述技术问题,本发明还提供一种基因内含子进化重构方法,包括获取同源基因数据集,判断是否有内含子位点数据,若无,则先标定内含子位点,得到带有内含子位点的同源基因数据,根据带有内含子位点的同源基因数据集构建系统进化树;对构建的系统进化树根据最大简约法重构内含子进化;所述同源基因数据集为一组或多组已标定内含子位点的同源基因;所述构建系统进化树的方法为邻接法、距离法和似然法中的一任意一种。
优选的,所述对构建的系统进化树根据最大简约法重构内含子进化为根据进化树叶结点的内含子存在情况确定根结点和中间结点;根结点和中间结点的内含子位点与叶结点的内含子位点一一对应;首先判断根结点各内含子位点的内含子存在情况,然后从根结点向叶结点方向依次判断各中间结点的内含子存在情况;根结点或某中间结点的某内含子位点的内含子存在情况的判断方法如下:若两分支中均有1个或多个叶结点的相应内含子位点存在内含子,则判断此根结点或中间结点在此位点为存在内含子;若两分支中一支有1个或多个叶结点的相应内含子位点存在内含子而另一支的所有叶结点的相应内含子位点均不存在内含子,对于根结点,则判断其在此位点为不存在内含子,对于中间结点,则考察其父母结点的相应内含子位点,父母结点存在则其存在,反之不存在。
优选的,所述对构建的系统进化树根据最大简约法重构内含子进化为从进化树叶结点至根结点的方向判断中间结点和根结点的内含子存在情况;每个中间结点和根结点均由两个子女结点组成,某中间结点的某内含子位点的内含子存在情况的判断方法如下:若其两子女结点相应内含子位点均存在内含子,则判断此中间结点在此位点为存在内含子;若其两子女结点相应内含子位点均不存在内含子,则判断此中间结点在此位点为不存在内含子;若其中一个子女结点相应内含子位点存在内含子而另一个不存在,则考察此中间结点的兄弟结点结点,若兄弟结点相应内含子位点存在内含子,则判断此中间结点在此位点为存在,反之不存在。
优选的,所述同源基因数据集从同源基因库获得。
优选的,所述同源基因数据集根据研究目的直接提供,具体包括,从基因库下载目的基因的基因组序列和蛋白序列,比较基因组序列和蛋白序列得到内含子位点。
相对于现有技术,本发明基因内含子进化重构装置和方法根据获取的同源基因数据集和系统进化树重构内含子进化具有显著进步,根据已知的同源基因的内含子情况推导系统进化树中各个中间结点基因的内含子存在情况,从而直观地展现了内含子的进化历程,同时很方便判断内含子在进化过程中的丢失和获得情况。内含子进化根据最大简约法重构方法,以最小改变为理论基础,认为得失数越小的进化方式越接近真实的进化过程,且简单可行。本发明内含子进化重构装置和方法对系统进化树的数量和每棵进化树的同源基因的数量没有限制,并且对同源基因内含子的任何存在形式都可以重构,由此为进一步分析内含子的作用和功能打下基础。
附图说明
图1为本发明基因内含子进化重构装置优选实施方式示意图;
图2为本发明同源基因系统进化树优选实施方式示意图;
图3为本发明基因内含子进化重构优选实施方式结果图。
图4为本发明基因内含子进化重构方法优选实施方式流程图;
具体实施方式
本发明不限于下述实施方式或实施例,凡不违背本发明精神所做出的修改及变形,均应包括在本发明范围之内。
本发明提供一种基因内含子进化重构装置,优选实施方式如图1所示,包括:
同源基因数据获取单元,用于获取同源基因数据;
本发明所述同源基因数据集为一组或多组已标定内含子位点的同源基因,每组同源基因的数量不限,获取同源基因的一种方法为从同源基因库(ftp://ftp.ncbi.nih.gov/pub/koonin/intron_evolution/LSEs/)下载,另一种方法为根据研究需要直接提供。直接提供的同源基因从基因库下载基因组序列和蛋白序列,并通过比对基因组序列和蛋白序列获得内含子位点。
内含子位点判断单元,用于对获取的同源基因数据进行判断是否有内含子位点数据;
内含子位点标定单元,用于对无内含子数据的同源基因数据标定内含子位点;
所述内含子位点标定通过比对基因组序列和蛋白序列获得内含子位点。
系统进化树构建单元,用于对带有内含子位点的同源基因数据集构建系统进化树;
所述系统进化树是一棵二叉树,进化树的叶结点代表现存在的、具体的多个同源基因和一个外类群基因,中间结点和根结点表示下一级两个结点基因的祖先,根结点也表示所有基因的共同祖先,根结点和中间结点有上下两个分支,根结点的上分支为同源基因、下分支为参照基因即外类群基因,树的拓扑结构简明地表示了基因的进化历程和亲缘关系。如图2示意,由3个同源基因a、b、c和1个外类群基因d构成的系统进化树,其中中间结点α表示基因a和b的祖先(中间结点α也叫基因a和b的父母结点,反之基因a和b叫中间结点α的子女结点,基因a与b称兄弟结点);中间结点β表示α和c的祖先;根结点γ表示β和d的祖先,也是所有基因共同的祖先;A、B、C、D表示内含子位点;0表示该位点不存在内含子;1表示该位点存在内含子。
本发明采用的系统进化树构建方法是现有方法,如邻接法、距离法、似然法等,也有相应的软件如专门的进化树构建软件PHYLIP(PHYLogeny InferencePackage)、PAUP(Phylogenetic Analysis Using Parsimony)、MEGA(MolecularEvolutionary Genetics Analysis)等,还有包含进化树构建的多功能序列分析软件如DNAMAN、GeneStar等,将同源基因的序列导入软件即可生成系统进化树。
内含子进化重构单元,用于对构建的系统进化树根据最大简约法重构内含子进化。
所述内含子的进化重构即是判断系统进化树的中间结点基因的内含子存在情况,之后可以统计内含子在进化中的得到数、丢失数以及总的改变数(得到数和丢失数之和)。
本发明重构内含子进化的一种实施方式为:根据进化树叶结点的内含子存在情况确定根结点和中间结点;根结点和中间结点的内含子位点与叶结点的内含子位点一一对应;首先判断根结点各内含子位点的内含子存在情况,然后从根结点向叶结点方向依次判断各中间结点的内含子存在情况;根结点或某中间结点的某内含子位点的内含子存在情况的判断方法如下:若两分支中均有1个或多个叶结点的相应内含子位点存在内含子,则判断此根结点或中间结点在此位点为存在内含子;若两分支中一支有1个或多个叶结点的相应内含子位点存在内含子而另一支的所有叶结点的相应内含子位点均不存在内含子,对于根结点,则判断其在此位点为不存在内含子,对于中间结点,则考察其父母结点的相应内含子位点,父母结点存在则其存在,反之不存在。根结点和中间结点各内含子位点的内含子存在情况按前述方法判断完成后,进化树中内含子的得失数统计方法为:统计去掉了根结点和外类群基因的进化树的内含子得失数;从根结点至叶结点方向统计;若某结点某位点为1、其下一级结点(子女结点)此位点为0,则表示丢失1个内含子;若某结点某位点为0、其下一级结点此位点为1,则表示得到1个内含子;若某结点和其下一级结点某位点相同(均为1或0),则表示没有内含子得失。最后得到了内含子总的改变数(得到数加丢失数)。如图3所示,根据叶结点同源基因按照上述方法推导中间结点基因内含子存在情况,白方框表示丢失该内含子,灰方框表示获得该内含子。各内含子位点的内含子进化历程清楚直观地展示出来。
本发明重构内含子进化的另一种优选实施方式为:从进化树叶结点至根结点的方向判断中间结点和根结点的内含子存在情况;每个中间结点和根结点均由两个子女结点组成,某中间结点的某内含子位点的内含子存在情况的判断方法如下:若其两子女结点相应内含子位点均存在内含子,则判断此中间结点在此位点为存在内含子;若其两子女结点相应内含子位点均不存在内含子,则判断此中间结点在此位点为不存在内含子;若其中一个子女结点相应内含子位点存在内含子而另一个不存在,则考察此中间结点的兄弟结点结点,若兄弟结点相应内含子位点存在内含子,则判断此中间结点在此位点为存在,反之不存在。内含子得失数统计方法为:从根结点至叶结点方向统计;若某结点某位点存在内含子、其下一级结点(子女结点)此位点不存在,则表示丢失1个内含子;若某结点某位点不存在内含子、其下一级结点此位点存在,则表示得到1个内含子;若某结点和其下一级结点某位点均存在或均不存在内含子,则表示没有内含子得失。内含子总的改变数为内含子得到数加丢失数。
本发明提供一种基因内含子进化重构方法,优选实施方式如图4所示,包括获取同源基因数据集,判断是否有内含子位点数据,若无,则先标定内含子位点,得到带有内含子位点的同源基因数据,根据带有内含子位点的同源基因数据集构建系统进化树;对构建的系统进化树根据最大简约法重构内含子进化;所述同源基因数据集为一组或多组已标定内含子位点的同源基因;所述构建系统进化树的方法为邻接法、距离法和似然法中的一任意一种。
该方法为在系统进化树的基础上重构内含子进化历程,包括进化树中被分化的中间结点基因的内含子存在情况。系统进化树反映了基因的进化历程和亲缘关系,其根据编码区序列构建,由于编码区序列被翻译为蛋白质,在生命过程中起重要作用,进化过程中其相对内含子保守,因此以系统进化树重构内含子进化是可行的。
本发明所述同源基因数据集为一组或多组已标定内含子位点的同源基因,每组同源基因的数量不限,获取同源基因的一种方法为从同源基因库(ftp://tip.ncbi.nih.gov/pub/koonin/intron_evolution/LSEs/)下载,另一种方法为根据研究需要直接提供。直接提供的同源基因从基因库下载基因组序列和蛋白序列,并通过比对基因组序列和蛋白序列获得内含子位点。本发明采用的系统进化树构建方法是现有方法,如邻接法、距离法、似然法等,也有相应的软件如专门的进化树构建软件PHYLIP(PHYLogeny Inference Package)、PAUP(Phylogenetic Analysis Using Parsimony)、MEGA(Molecular EvolutionaryGenetics Analysis)等,还有包含进化树构建的多功能序列分析软件如DNAMAN、GeneStar等,将同源基因的序列导入软件,立即可生成系统进化树。系统进化树是一棵二叉树,进化树的叶结点代表现存在的、具体的多个同源基因和一个外类群基因,中间结点和根结点表示下一级两个结点基因的祖先,根结点也表示所有基因的共同祖先,根结点和中间结点有上下两个分支,根结点的上分支为同源基因、下分支为参照基因即外类群基因,树的拓扑结构简明地表示了基因的进化历程和亲缘关系。如图2示意,由3个同源基因a、b、c和1个外类群基因d构成的系统进化树,其中中间结点α表示基因a和b的祖先(中间结点α也叫基因a和b的父母结点,反之基因a和b叫中间结点α的子女结点,基因a与b称兄弟结点);中间结点β表示α和c的祖先;根结点γ表示β和d的祖先,也是所有基因共同的祖先;A、B、C、D表示内含子位点;0表示该位点不存在内含子;1表示该位点存在内含子。
根据系统进化树重构内含子进化的方法是本发明提出的新方法,其根据最大简约理论,以最小改变为理论基础,认为得失数越小的进化方式越接近真实的进化过程,该方法简单可行。内含子的进化重构即是判断中间结点基因的内含子存在情况,最后还可以统计内含子在进化中的得到数、丢失数以及总的改变数(得到数和丢失数之和)。
本发明重构内含子进化的一种实施方式为:根据进化树叶结点的内含子存在情况确定根结点和中间结点;根结点和中间结点的内含子位点与叶结点的内含子位点一一对应;首先判断根结点各内含子位点的内含子存在情况,然后从根结点向叶结点方向依次判断各中间结点的内含子存在情况;根结点或某中间结点的某内含子位点的内含子存在情况的判断方法如下:若两分支中均有1个或多个叶结点的相应内含子位点存在内含子,则判断此根结点或中间结点在此位点为存在内含子;若两分支中一支有1个或多个叶结点的相应内含子位点存在内含子而另一支的所有叶结点的相应内含子位点均不存在内含子,对于根结点,则判断其在此位点为不存在内含子,对于中间结点,则考察其父母结点的相应内含子位点,父母结点存在则其存在,反之不存在。根结点和中间结点各内含子位点的内含子存在情况按前述方法判断完成后,进化树中内含子的得失数统计方法为:统计去掉了根结点和外类群基因的进化树的内含子得失数;从根结点至叶结点方向统计;若某结点某位点为1、其下一级结点(子女结点)此位点为0,则表示丢失1个内含子;若某结点某位点为0、其下一级结点此位点为1,则表示得到1个内含子;若某结点和其下一级结点某位点相同(均为1或0),则表示没有内含子得失。最后得到了内含子总的改变数(得到数加丢失数)。如图3所示,根据叶结点同源基因按照上述方法推导中间结点基因内含子存在情况,白方框表示丢失该内含子,灰方框表示获得该内含子。各内含子位点的内含子进化历程清楚直观地展示出来。
本发明重构内含子进化的另一种优选实施方式为:从进化树叶结点至根结点的方向判断中间结点和根结点的内含子存在情况;每个中间结点和根结点均由两个子女结点组成,某中间结点的某内含子位点的内含子存在情况的判断方法如下:若其两子女结点相应内含子位点均存在内含子,则判断此中间结点在此位点为存在内含子;若其两子女结点相应内含子位点均不存在内含子,则判断此中间结点在此位点为不存在内含子;若其中一个子女结点相应内含子位点存在内含子而另一个不存在,则考察此中间结点的兄弟结点结点,若兄弟结点相应内含子位点存在内含子,则判断此中间结点在此位点为存在,反之不存在。内含子得失数统计方法为:从根结点至叶结点方向统计;若某结点某位点存在内含子、其下一级结点(子女结点)此位点不存在,则表示丢失1个内含子;若某结点某位点不存在内含子、其下一级结点此位点存在,则表示得到1个内含子;若某结点和其下一级结点某位点均存在或均不存在内含子,则表示没有内含子得失。内含子总的改变数为内含子得到数加丢失数。
相对于现有技术,本发明基因内含子进化重构装置和方法根据获取的同源基因数据集和系统进化树重构内含子进化具有显著进步,根据已知的同源基因的内含子情况推导系统进化树中各个中间结点基因的内含子存在情况,从而直观地展现了内含子的进化历程,同时很方便判断内含子在进化过程中的丢失和获得情况。本发明内含子进化根据最大简约法重构方法,以最小改变为理论基础,认为得失数越小的进化方式越接近真实的进化过程,且简单可行。本发明内含子进化重构装置和方法对系统进化树的数量和每棵进化树的同源基因的数量没有限制,并且对同源基因内含子的任何存在形式都可以重构,由此为进一步分析内含子的作用和功能打下基础,在医学领域和动植物生长发育领域具有广泛的应用前景。
本发明所举实施方式或者实施例对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施方式或者实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种基因内含子进化重构装置,其特征在于,包括:
同源基因数据获取单元,用于获取同源基因数据;
内含子位点判断单元,用于对获取的同源基因数据进行判断是否有内含子位点数据;
内含子位点标定单元,用于对同源基因数据标定内含子位点;
系统进化树构建单元,用于对带有内含子位点的同源基因数据集构建系统进化树;
内含子进化重构单元,用于对构建的系统进化树根据最大简约法重构内含子进化。
2.如权利要求1所述装置,其特征在于,所述内含子进化重构单元对构建的系统进化树根据最大简约法重构内含子进化为根据进化树叶结点的内含子存在情况确定根结点和中间结点;根结点和中间结点的内含子位点与叶结点的内含子位点一一对应;首先判断根结点各内含子位点的内含子存在情况,然后从根结点向叶结点方向依次判断各中间结点的内含子存在情况;根结点或某中间结点的某内含子位点的内含子存在情况的判断方法如下:若两分支中均有1个或多个叶结点的相应内含子位点存在内含子,则判断此根结点或中间结点在此位点为存在内含子;若两分支中一支有1个或多个叶结点的相应内含子位点存在内含子而另一支的所有叶结点的相应内含子位点均不存在内含子,对于根结点,则判断其在此位点为不存在内含子,对于中间结点,则考察其父母结点的相应内含子位点,父母结点存在则其存在,反之不存在。
3.如权利要求1所述装置,其特征在于,所述内含子进化重构单元对构建的系统进化树根据最大简约法重构内含子进化为从进化树叶结点至根结点的方向判断中间结点和根结点的内含子存在情况;每个中间结点和根结点均由两个子女结点组成,某中间结点的某内含子位点的内含子存在情况的判断方法如下:若其两子女结点相应内含子位点均存在内含子,则判断此中间结点在此位点为存在内含子;若其两子女结点相应内含子位点均不存在内含子,则判断此中间结点在此位点为不存在内含子;若其中一个子女结点相应内含子位点存在内含子而另一个不存在,则考察此中间结点的兄弟结点结点,若兄弟结点相应内含子位点存在内含子,则判断此中间结点在此位点为存在,反之不存在。
4.如权利要求1所述装置,其特征在于,所述同源基因数据获取单元与同源基因库相连接,从同源基因库获得同源基因数据集。
5.如权利要求1所述装置,其特征在于,所述同源基因数据获取单元与基因库相连接,从基因库下载目的基因的基因组序列和蛋白序列,比较基因组序列和蛋白序列得到内含子位点。
6.一种基因内含子进化重构方法,其特征在于,包括获取同源基因数据集,判断是否有内含子位点数据,若无,则先标定内含子位点,得到带有内含子位点的同源基因数据,根据带有内含子位点的同源基因数据集构建系统进化树;对构建的系统进化树根据最大简约法重构内含子进化;所述同源基因数据集为一组或多组已标定内含子位点的同源基因;所述构建系统进化树的方法为邻接法、距离法和似然法中的一任意一种。
7.如权利要求6所述的方法,其特征在于,所述对构建的系统进化树根据最大简约法重构内含子进化为根据进化树叶结点的内含子存在情况确定根结点和中间结点;根结点和中间结点的内含子位点与叶结点的内含子位点一一对应;首先判断根结点各内含子位点的内含子存在情况,然后从根结点向叶结点方向依次判断各中间结点的内含子存在情况;根结点或某中间结点的某内含子位点的内含子存在情况的判断方法如下:若两分支中均有1个或多个叶结点的相应内含子位点存在内含子,则判断此根结点或中间结点在此位点为存在内含子;若两分支中一支有1个或多个叶结点的相应内含子位点存在内含子而另一支的所有叶结点的相应内含子位点均不存在内含子,对于根结点,则判断其在此位点为不存在内含子,对于中间结点,则考察其父母结点的相应内含子位点,父母结点存在则其存在,反之不存在。
8.如权利要求6所述的方法,其特征在于,所述对构建的系统进化树根据最大简约法重构内含子进化为从进化树叶结点至根结点的方向判断中间结点和根结点的内含子存在情况;每个中间结点和根结点均由两个子女结点组成,某中间结点的某内含子位点的内含子存在情况的判断方法如下:若其两子女结点相应内含子位点均存在内含子,则判断此中间结点在此位点为存在内含子;若其两子女结点相应内含子位点均不存在内含子,则判断此中间结点在此位点为不存在内含子;若其中一个子女结点相应内含子位点存在内含子而另一个不存在,则考察此中间结点的兄弟结点结点,若兄弟结点相应内含子位点存在内含子,则判断此中间结点在此位点为存在,反之不存在。
9.如权利要求6所述的方法,其特征在于,所述同源基因数据集从同源基因库获得。
10.如权利要求6所述的方法,其特征在于,所述同源基因数据集根据研究目的直接提供,具体包括,从基因库下载目的基因的基因组序列和蛋白序列,比较基因组序列和蛋白序列得到内含子位点。
CN201110459713.0A 2011-12-31 2011-12-31 一种基因内含子进化重构装置及方法 Active CN102542178B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110459713.0A CN102542178B (zh) 2011-12-31 2011-12-31 一种基因内含子进化重构装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110459713.0A CN102542178B (zh) 2011-12-31 2011-12-31 一种基因内含子进化重构装置及方法

Publications (2)

Publication Number Publication Date
CN102542178A true CN102542178A (zh) 2012-07-04
CN102542178B CN102542178B (zh) 2015-01-14

Family

ID=46349049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110459713.0A Active CN102542178B (zh) 2011-12-31 2011-12-31 一种基因内含子进化重构装置及方法

Country Status (1)

Country Link
CN (1) CN102542178B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426700A (zh) * 2015-12-18 2016-03-23 江苏省农业科学院 一种批量计算基因组直系同源基因进化速率的方法
CN116895328A (zh) * 2023-09-07 2023-10-17 中国人民解放军军事科学院军事医学研究院 一种面向模块化基因结构的进化事件检测方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894211A (zh) * 2010-06-30 2010-11-24 深圳华大基因科技有限公司 一种基因注释方法和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894211A (zh) * 2010-06-30 2010-11-24 深圳华大基因科技有限公司 一种基因注释方法和系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
IGOR B. ROGOZIN ET AL.: "Remarkable Interkingdom Conservation of Intron Positions and Massive, Lineage-Specific Intron Loss and Gain in Eukaryotic Evolution", 《CURRENT BIOLOGY》, vol. 13, 2 September 2003 (2003-09-02) *
陈岩等: "如何用分子数据进行系统发育关系分析", 《昆虫学研究进展》, 30 June 2005 (2005-06-30) *
雷小春等: "运用重叠延伸PCR技术构建在甘丙肽全长cDNA嵌入第二内含子的重构分子", 《生物技术通报》, no. 4, 31 December 2010 (2010-12-31), pages 156 - 160 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426700A (zh) * 2015-12-18 2016-03-23 江苏省农业科学院 一种批量计算基因组直系同源基因进化速率的方法
CN105426700B (zh) * 2015-12-18 2018-05-22 江苏省农业科学院 一种批量计算基因组直系同源基因进化速率的方法
CN116895328A (zh) * 2023-09-07 2023-10-17 中国人民解放军军事科学院军事医学研究院 一种面向模块化基因结构的进化事件检测方法及系统
CN116895328B (zh) * 2023-09-07 2023-12-08 中国人民解放军军事科学院军事医学研究院 一种面向模块化基因结构的进化事件检测方法及系统

Also Published As

Publication number Publication date
CN102542178B (zh) 2015-01-14

Similar Documents

Publication Publication Date Title
Matlhodi et al. Evaluating land use and land cover change in the Gaborone dam catchment, Botswana, from 1984–2015 using GIS and remote sensing
He et al. Sky islands of southwest China. I: an overview of phylogeographic patterns
Tabuce et al. Early Tertiary mammals from North Africa reinforce the molecular Afrotheria clade
Ryberg et al. An evolutionary perspective on morphological and ecological characters in the mushroom family Inocybaceae (Agaricomycotina, Fungi)
Bacon et al. Geographic and taxonomic disparities in species diversity: Dispersal and diversification rates across Wallace's line
Ren et al. Phylogeny and biogeography of Primula sect. Armerina: implications for plant evolution under climate change and the uplift of the Qinghai-Tibet Plateau
Jaloviar et al. Gap structure and regeneration in the mixed old-growth forests of National Nature Reserve Sitno, Slovakia
Tejero-Cicuéndez et al. Reconstructing squamate biogeography in Afro-Arabia reveals the influence of a complex and dynamic geologic past
CN102542178A (zh) 一种基因内含子进化重构装置及方法
Schmidt et al. The evolving faces of the SARS-CoV-2 genome
He et al. Estimating carbon sequestration potential of forest and its influencing factors at fine spatial-scales: a case study of Lushan city in southern China
Záveská et al. Evidence for glacial refugia of the forest understorey species Helleborus niger (Ranunculaceae) in the Southern as well as in the Northern Limestone Alps
Zhao The climate fluctuation of the 8.2 ka BP cooling event and the transition into Neolithic lifeways in North China
Moreno et al. Another lineage of secotioid fungi is discovered: Psathyrella secotioides sp. nov. from Mexico
Gatto et al. The challenge in the management of historic trees in urban environments during climate change: The case of corso trieste (Rome, Italy)
Pardos et al. Adaptive Strategies of Seedlings of Four Mediterranean Co-Occurring Tree Species in Response to Light and Moderate Drought: A Nursery Approach
Yan et al. Cooling effect of trees with different attributes and layouts on the surface heat island of urban street canyons in summer
Zeng et al. Distribution changes of phosphorus in soil–plant systems of larch plantations across the chronosequence
Marquez et al. Early growth of 11 native and three alien tree species in northeastern Mindanao, Philippines
Johansson Site index curves for young hybrid larch growing on former farmland in Sweden
Farwagi et al. Phylogenetic patterns of gene rearrangements in four mitochondrial genomes from the green algal family Hydrodictyaceae (Sphaeropleales, Chlorophyceae)
He et al. Genetic Structure and Differentiation of Endangered Cycas Species Indicate a Southward Migration Associated with Historical Cooling Events
Wang et al. The shift from energy to water limitation in local canopy height from temperate to tropical forests in China
Giambastiani et al. Modelling the effect of keyline practice on soil erosion control
CN101673411A (zh) 一种虚拟玉米叶片模型可控面元划分方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant