CN101110095A - 一种对常见脑疾病易感基因的批量检测方法 - Google Patents
一种对常见脑疾病易感基因的批量检测方法 Download PDFInfo
- Publication number
- CN101110095A CN101110095A CNA2006101032560A CN200610103256A CN101110095A CN 101110095 A CN101110095 A CN 101110095A CN A2006101032560 A CNA2006101032560 A CN A2006101032560A CN 200610103256 A CN200610103256 A CN 200610103256A CN 101110095 A CN101110095 A CN 101110095A
- Authority
- CN
- China
- Prior art keywords
- gene
- network
- brain
- tumor susceptibility
- disease
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 189
- 238000000034 method Methods 0.000 title claims abstract description 32
- 208000014644 Brain disease Diseases 0.000 title abstract 5
- 210000004556 brain Anatomy 0.000 claims abstract description 71
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 34
- 201000010099 disease Diseases 0.000 claims abstract description 33
- 238000012360 testing method Methods 0.000 claims abstract description 20
- 238000001514 detection method Methods 0.000 claims abstract description 15
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 6
- 206010028980 Neoplasm Diseases 0.000 claims description 58
- 208000018152 Cerebral disease Diseases 0.000 claims description 51
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000013399 early diagnosis Methods 0.000 claims description 7
- 230000002068 genetic effect Effects 0.000 claims description 7
- 230000003993 interaction Effects 0.000 claims description 7
- 238000002474 experimental method Methods 0.000 claims description 6
- 108020004635 Complementary DNA Proteins 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 5
- 230000002596 correlated effect Effects 0.000 claims description 4
- 230000014509 gene expression Effects 0.000 claims description 4
- 238000007689 inspection Methods 0.000 claims description 4
- 238000013179 statistical model Methods 0.000 claims description 4
- 238000013461 design Methods 0.000 claims description 3
- 238000011835 investigation Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 238000003012 network analysis Methods 0.000 claims description 2
- 230000007170 pathology Effects 0.000 claims description 2
- 230000003234 polygenic effect Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 claims 1
- 238000011160 research Methods 0.000 abstract description 14
- 230000008569 process Effects 0.000 abstract description 5
- 230000001575 pathological effect Effects 0.000 abstract 1
- 241001269238 Data Species 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000004850 protein–protein interaction Effects 0.000 description 3
- 238000013456 study Methods 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 101150037123 APOE gene Proteins 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 102100029470 Apolipoprotein E Human genes 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 108010058643 Fungal Proteins Proteins 0.000 description 1
- 101000617536 Homo sapiens Presenilin-1 Proteins 0.000 description 1
- 101000617546 Homo sapiens Presenilin-2 Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 102100022033 Presenilin-1 Human genes 0.000 description 1
- 102100022036 Presenilin-2 Human genes 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 241001632422 Radiola linoides Species 0.000 description 1
- 208000036752 Schizophrenia, paranoid type Diseases 0.000 description 1
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003291 dopaminomimetic effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 208000037805 labour Diseases 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 208000002851 paranoid schizophrenia Diseases 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000002948 stochastic simulation Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及生物信息学技术领域的一种基于复杂脑基因网络的常见脑疾病易感基因检测方法,用计算机计算的手段大规模检测各种常见脑疾病的易感基因。包括两大部分:1.基于贝叶斯模型集成基因组、蛋白质组等多种可利用的公共生物学数据构建复杂脑基因网络,并分析该网络的统计特性;2.在此网络的基础上,引入某常见脑疾病的先验信息,然后根据网络的连接特性对网络中所有脑基因进行重要性排序,选取分数较高的基因构成相关基因子网络,从而大规模地、便捷地处理该疾病相关易感基因。本发明可以快速实现常见脑疾病易感基因的批量检测,在普通的微机上即可完成,可方便快捷地为传统遗传学研究以及各种病理研究提供非常有价值的线索。
Description
技术领域
本发明属于生物信息学技术以及遗传学领域,涉及一种基于复杂脑基因网络对常见脑疾病易感基因进行批量检测。
背景技术
当前,复杂网络研究正在成为国际上最热门的研究课题之一。自从1998年Strogatz率先在Nature上提出小世界网络开始[1](Watts DJ andStrogatz SH.Collective dynamics of‘small-world’networks.Nature,393:440-442,1998),世界权威杂志Nature和Science每年都有大量文章涉及到复杂网络的建模、统计分析以及在社会网络、生物网络等方面的应用[2-5](Barabasi AL and Albert R.Emergence of scaling in random networks.Science,286:509-12,1999;Albert R.,Jeong H.,and Barabasi AL.diameter of the world wideweb.Nature,401:130-131,1999;Guimera R.,Amaral LAN.,Functional cartographyof complex metabolic networks.Nature,433:895-900,2005;Han JD.,Bertin N.,andHao T.et al.Evidence for dynamically organized modularity in the yeast protein-proteininteraction network.Nature,430:88-93,2004)。同时,随着人类基因组计划(Human Genome Proj ect,HGP)的实施与完成[6-8](Roberts L,DavenportRJ,Pennisi E,Marshall E.A histroy of the Human Genome Project.Science.291:1195,2001;Lander ES et al.Initial sequencing and analysis of the human genome.Nature,409:860-921,2001;Venter JC et al.The sequence of the huuman genome.Science,291:1304-1351,2001.),人类进入了后基因组时代,随之发展了各种高通量的生物技术,带动了各种生物学数据(包括DNA/蛋白质序列数据、蛋白质结构数据、基因芯片数据以及各种蛋白-蛋白交互作用数据等)的迅猛增长,为重建和分析复杂生物网络奠定了物质基础。有关单细胞模式生物的各种复杂生物网络重建以及相关分析的研究已经获得了很大的成功[9-13](Uetz P.et al.A comprehensive analysis of protein-protein interactions inSaccharomyces cerevisiae.Nature 403,623-627,2000;Ito T.et al.A comprehensivetwo-hybrid analysis to explore the yeast protein interactome.Proc.Natl Acad.Sci.USA98,4569-4574,2001;Gavin AC.et al.Functional organization of the yeast proteome bysystematic analysis of protein complexes.Nature 415,141-147,2002;Tsuang M.Schizophrenia:genes and environment.Biol.Psychiatry.47,210-220,2000;Allam MF,Castillo AS and Navajas RF.Parkinson′s disease risk factors:genetic,environmental,orboth?Neurol.Res.27,206-208,2005.),但是对于高级物种尤其人类复杂基因网络的研究,则要远远困难的多。
人类各种常见脑疾病不仅使病人本身承受着巨大的生理和心理痛苦,而且给病人家庭乃至人类社会带来了巨大影响。无疑,人类各种常见脑疾病都是复杂性疾病,即它不是由单一基因所决定的,而是由多基因、多因素,遗传和环境共同作用的结果[14,15](Li S.et al.A map of theinteractome network of the metazoan C.elegans.Science 303,540-543,2004;Giot L.et al.A protein interaction map of Drosophila melanogaster.Science 302,1727-1736,2003.)。各种常见脑疾病的分子机制,正成为各国科学家努力攻克的难题。然而,传统的遗传学研究检测单个候选基因与脑疾病的关联,不仅太费时耗力,而且对于复杂疾病的研究,重复性很差。因此,亟待产生快速有效,方便便捷的计算检测方法,从系统学以及复杂网络的观点考察复杂疾病分子机制的研究[16](Xu Q et al.Association study of an SNP combinationpattern in the dopaminergic pathway in paranoid schizophrenia:a novel strategy forcomplex disorders.Mol Psychiatry.;9(5):510-21,2004)正成为当今世界研究的热点问题,有望产生突破性的科学成果。对于网络分析来说,当前的研究还有两方面的局限性,一是和疾病结合起来研究的很少,二是和多种生物学数据结合起来研究的少。
发明内容
传统的遗传学研究检测单个候选基因与脑疾病的关联,不仅太费时耗力,而且对于复杂疾病的研究,重复性很差,为了解决上述技术的问题,本发明的目的是提供一种快速有效、方便便捷、重复性好的批量检测常见脑疾病易感基因的方法。
本发明是一种基于复杂脑基因网络的常见脑疾病易感基因检测方法,步骤如下:
利用提取大规模数据集,基于贝叶斯模型构建复杂脑基因网络,并对复杂脑基因网络的分析;对常见脑疾病易感基因的批量检测;对检测结果进行验证。
根据本发明的实施例,所述提取大规模数据集,是将大规模基因组、蛋白质组公共生物学数据,存入数据处理器中,基于贝叶斯统计模型将所述的不同数据集统一到同一框架下。
根据本发明的实施例,所述构建复杂脑基因网络,是通过集成了不同的数据集,来构建较为精确的复杂脑基因网络。
根据本发明的实施例,所述复杂脑基因网络的分析,是分析复杂脑基因网络的统计特性。
根据本发明的实施例,所述复杂脑基因网络的统计特性,是引入某常见脑疾病的先验信息,然后根据定义的准则对网络中所有脑基因进行重要性排序,选取分数较高的基因构成相关基因子网络。
根据本发明的实施例,所述对常见脑疾病易感基因的批量检测,是在相关基因子网络中大规模地处理得到脑疾病的多个相关易感基因。
根据本发明的实施例,所述对检测结果进行验证,是对多个相关易感基因和常见脑疾病的多基因进行处理,获得常见脑疾病的多基因相互作用病理相吻合的检测结果。
根据本发明的实施例,所述集成的数据集步骤为:选取人脑中表达的基因,基于这一基因集;利用人脑各不同状态、不同脑区的基因表达数据集以及各种生物、实验验证及其它的基因相互作用网络数据,并全部将其对应到人脑,保存相关结果。
根据本发明的实施例,所述构建较为精确的复杂脑基因网络步骤为:对多种生物学数据集采用一个统一的评分准则,对所有数据集进行重新评分,然后基于统一的分数,用简单的贝叶斯分类器,对各数据集进行综合,构建出一个较为准确的复杂脑基因网络。
根据本发明的实施例,所述定义的准则,是定义所研究脑疾病的一个或多个比较明确的重要易感基因;然后基于定义的种子基因和前面所建立的复杂脑基因网络,判别网络内其他基因相对于这些种子基因的重要程度;按此重要程度对所有脑基因进行排序并选取得分较高的一些基因作为该疾病的重要易感基因;以检测的这些重要易感基因构成的网络作为该疾病基因子网络。
根据本发明的实施例,所述脑基因重要性排序的步骤如下:根据复杂脑基因网络的连接特性,计算所有基因相对于种子基因的最短图论距离,然后计算每一基因相对于各种子基因的距离之和,把它作为网络中这一基因相对于种子基因的重要程度,并根据此重要程度的高低对所有基因进行排序。
根据本发明的实施例,所述多个相关易感基因和常见脑疾病的多基因进行处理步骤如下:是以已有疾病易感基因的知识为标准,检验检测结果的敏感性和特异性;与多次随机种子基因的检测结果相比较,检验检测结果的准确性;以检测到的该疾病多个重要易感基因为特征,对病人和正常人的基因芯片数据设计分类器,并考察分类结果,如能达到很好的分类结果,说明检测的多个易感基因可作为该疾病的重要生物标记进行疾病的早期诊断;最后进一步实验验证检测结果的准确性以指导疾病的早期诊断与治疗。
本发明的优点和积极效果:本发明从系统科学的角度,从多因素、多层次、多方面入手,从整体上系统构建出人脑复杂基因网络,分析验证这一复杂网络,并试图从该网络中找出与常见脑疾病的易感基因子网络。
因此,本发明在当前研究的基础上,和常见脑疾病结合,和多种生物学数据结合,开发出了更加满足实际情况的方法,可以提供更加先进的疾病生物标记,而且对理解各种常见脑疾病发生发展的机理开辟了新的道路,无疑会对人类各种常见脑疾病的早期诊断和疗效评价,对人类健康有着深远重大的意义。
该基于复杂脑基因网络对常见脑疾病易感基因进行检测的计算方法有着非常广泛的应用前景。与当前传统的遗传学实验方法相比较,该方法有如下优点:
1、利用计算机计算的手段进行易感基因的检测,比传统的遗传实验方法节省大量的时间和劳力,方便快捷。
2、基于脑基因网络信息寻找脑疾病易感基因,从系统层次上进行分析检测,更符合常见脑疾病是多基因相互作用的致病机理。
3、基于贝叶斯框架集成不同的数据集构建脑基因网络,充分利用已有的信息,大大降低网络连接的假阳性率。
4、充分利用了人类基因组的各种数据信息,使结果的重复性好、可信性增加。
附图说明
图1是本发明对常见脑疾病易感基因的批量检测方法实现过程的流程图。
图2是本发明含大规模数据收集和复杂脑基因网络构建的流程图。
图3是本发明对常见脑疾病易感基因的检测的流程图。
具体实施方式
下面将结合附图对本发明加以详细说明,应指出的是,所描述的实施例仅旨在便于对本发明的理解,而对其不起任何限定作用。
本发明收集各种可利用的大规模基因组、蛋白质组等各种公共生物学数据,将这些数据存储于计算机中,并基于贝叶斯统计模型集成这些不同的数据集,来构建较为精确的复杂脑基因网络,并分析该网络的统计特性;在此网络的基础上,引入某常见脑疾病的先验信息,然后根据本发明定义的准则对网络中所有脑基因进行重要性排序,选取分数较高的基因构成相关基因子网络,从而大规模地、便捷地发现该疾病的多个相关易感基因。
本发明对常见脑疾病易感基因的批量检测方法实现过程的技术流程如图1所示,可具体分为以下五个步骤:
步骤S1:各种大规模数据集的收集如图2;
从文献和实验信息中选取人脑中表达的基因,所有脑基因网络相关研究都是基于这一基因集。搜集:
①人脑各不同状态、不同脑区的基因表达数据集;
②从PubMed上下载包含关键词为“human”和“brain”的文献摘要;
③从DIP数据库下载模式生物的大规模基因网络,并把这些基因与人脑基因进行同源对应,以此构建脑基因网络;
④从HPRD数据库中下载部分实验验证的人脑基因网络;
⑤下载PreBIND以及其它相关的人类基因网络,并将其都对应到人脑,保存相关结果。
步骤S2:复杂脑基因网络的构建如图2。
如图2是本发明对复杂脑基因网络构建的子流程图所示,将上述这些不同来源的数据统一到贝叶斯框架下进行集成,对多种生物学数据集采用一个统一的评分规则,也即是对以前没有分数的数据进行打分,对以前有一定分数的数据进行重新打分,所有的打分都依据简单的贝叶斯统计模型,这样可以对不同来源的数据可信度有个客观的评判,以利于进一步的数据集成。例如,HPRD数据库是可信度较高的实验验证的基因相互作用数据,而根据基因表达数据集得到的相互作用网络假阳性则较高,根据我们的评分规则重新评分以后,HPRD中的数据得到了较高的分数,而基于基因芯片数据的网络则得到了较低的分数。然后基于统一的分数,用简单的贝叶斯分类器,对各数据集进行综合,构建出一个较为准确的复杂脑基因网络。这样就构建出了一个以人脑基因为节点,基因与基因之间的相互作用为连接的脑基因相互作用网络,是一个由约8000个人脑基因以及它们之间的40,000多条相互连接所构成的复杂网络。这一网络具有scale-free的特性,也即网络中有少数的“关键节点”存在,也即少数的基因具有高度的连接,而大多数基因具有比较少的连接。
步骤S3:复杂脑基因网络的分析。
对于构建的复杂脑基因网络,基于数据库中对基因功能的注释信息,分析网络中少数“关键节点”的作用,分析人脑基因网络功能模块的属性,并探索其与脑功能机制的相互关系;进行网络拓扑特异性和稳定性分析,以发现复杂脑基因网络与其他类似网络相比所具有的特有属性。
步骤S4:如图3常见脑疾病易感基因的检测所示。
寻找所研究脑疾病的一个或多个比较明确的重要易感基因,这里可以叫做种子基因如图3,S41;然后基于种子基因和上一步骤所建立的复杂脑基因网络,判别网络内其它基因相对于这些种子基因的重要程度;此处的重要程度是通过计算网络中所有基因相对于种子基因的最短图论距离,也即最短路径长度如图3,S42,然后把每一基因相对于所有种子基因的距离相加,以此作为此基因相对于种子基因的重要程度如图3,S43;按此重要程度的分数高低对所有脑基因进行排序如图3,S44,并选取得分较高的一些基因作为该疾病的重要易感基因如图3,S45;以检测的这些重要易感基因之间的相互作用所构成的网络作为该疾病基因子网络如图3,S4。
步骤S5:检测结果的验证。
以已有疾病易感基因的知识为标准,检验已有疾病易感基因检测结果的敏感性和特异性;与多次随机种子基因的检测结果相比较,检验检测结果的准确性;以检测到的该疾病多个重要易感基因为特征,对病人和正常人的基因芯片数据设计分类器,并考察分类结果,如能达到很好的分类结果,说明检测的多个易感基因可作为该疾病的重要生物标记进行疾病的早期诊断;最后进一步实验验证检测结果的准确性以指导疾病的早期诊断与治疗。
下面是利用图1的方法检测阿尔茨海默氏病易感基因为例说明本发明的具体实现过程:
步骤S1:各种大规模数据集的收集:收集建立复杂脑基因网络所需的各类公共数据,进行相关的预处理以及整理分类工作;以阿尔茨海默氏病为关键词搜寻OMIM数据库,保存结果,然后针对其中的每个基因,在PubMed中搜寻和疾病相关的文献支持。如果有多个证据支持,则定义该基因为这一疾病的易感基因,以此定义的46个易感基因作为标准,验证检测算法的敏感性和特异性。
步骤S2与步骤S3同上。
步骤S4:阿尔茨海默氏病易感基因的检测:以APOE、APP、PSEN1、PSEN2四个已知的阿尔茨海默氏病易感基因为种子节点,计算复杂脑基因网络中其余每个基因相对于这些种子基因的最短图论距离,然后基于这些距离对每个基因的重要程度进行打分,得分较高的前46个基因被认为是阿尔茨海默氏病的易感基因。
步骤S5:检测结果的验证:在检测到的46个阿尔茨海默氏病易感基因中,有23个与步骤一中定义的标准相吻合,并且剩余的23个基因中,还有14个能找到相关的文献报导证据支持检测结果,远远好于随机模拟的结果;另外通过增加噪声分析该结果的稳定性,表明有很好的稳定性和鲁棒性。
上面的描述仅仅是用于实现本发明及其实施例,因此,本发明的范围不应由该描述来限定。本领域的技术人员应该理解,在不脱离本发明的范围的任何修改或局部替换,均属于本发明权利要求来限定的范围。
Claims (12)
1.一种对常见脑疾病易感基因的批量检测方法,其特征在于:步骤如下:
根据提取的大规模数据集,基于贝叶斯模型构建复杂脑基因网络,并对复杂脑基因网络分析,对常见脑疾病易感基因的批量检测,对常见脑疾病易感基因的检测结果进行验证。
2.根据权利要求1所述对常见脑疾病易感基因的批量检测方法,其特征在于:所述提取大规模数据集,是将大规模基因组、蛋白质组公共生物学数据,存入数据处理器中,基于贝叶斯统计模型将所述的不同数据集统一到同一框架下。
3.根据权利要求1和2所述对常见脑疾病易感基因的批量检测方法,其特征在于:所述数据集,是通过集成不同的数据集,来构建较为精确的复杂脑基因网络。
4.根据权利要求1所述对常见脑疾病易感基因的批量检测方法,其特征在于,所述复杂脑基因网络的分析,是分析复杂脑基因网络的统计特性。
5.根据权利要求1和4所述对常见脑疾病易感基因的批量检测方法,其特征在于,所述复杂脑基因网络的统计特性,是基于某常见脑疾病的先验信息,基于定义准则对网络中所有脑基因进行重要性排序,选取分数较高的基因构成相关基因子网络。
6.根据权利要求1和5所述对常见脑疾病易感基因的批量检测方法,其特征在于,所述对常见脑疾病易感基因的批量检测,是在相关基因子网络中对脑基因的数据处理得到脑疾病的多个相关易感基因。
7.根据权利要求1和6所述对常见脑疾病易感基因的批量检测方法,其特征在于,所述对检测结果进行验证,是对多个相关易感基因和常见脑疾病的多基因的数据进行处理,获得常见脑疾病的多基因相互作用病理相吻合的检测结果。
8.根据权利要求2所述对常见脑疾病易感基因的批量检测方法,其特征在于,所述集成的数据集步骤为:选取人脑中表达的基因,基于这一基因集;利用人脑各不同状态、不同脑区的基因表达数据集以及各种生物、实验验证及其它的基因相互作用网络数据,并全部将其对应到人脑,保存相关结果。
9.根据权利要求3所述对常见脑疾病易感基因的批量检测方法,其特征在于,所述构建较为精确的复杂脑基因网络步骤为:对多种生物学数据集采用一个统一的评分准则,对所有数据集进行重新评分,然后基于统一的分数,用简单的贝叶斯分类器,对各数据集进行综合,构建出一个较为准确的复杂脑基因网络。
10.根据权利要求5所述对常见脑疾病易感基因的批量检测方法,其特征在于,所述定义准则,是定义脑疾病的一个或多个比较明确的重要易感基因;基于定义的种子基因和所建立的复杂脑基因网络,判别网络内其它基因相对于这些种子基因的重要程度;按此重要程度对所有脑基因进行排序并选取得分较高的一些基因作为该疾病的重要易感基因,以检测的这些重要易感基因构成的网络作为该疾病基因子网络。
11.根据权利要求5所述对常见脑疾病易感基因的批量检测方法,其特征在于,所述脑基因重要性排序的步骤如下:根据复杂脑基因网络的连接特性,计算所有基因相对于种子基因的最短图论距离,然后计算每一基因相对于各种子基因的距离之和,把它作为网络中这一基因相对于种子基因的重要程度,并根据此重要程度的高低对所有基因进行排序。
12.根据权利要求6所述对常见脑疾病易感基因的批量检测方法,其特征在于,所述多个相关易感基因和常见脑疾病的多基因进行处理步骤如下:是以已有疾病易感基因为标准,检验已有疾病易感基因检测结果的敏感性和特异性;与多次随机种子基因的检测结果相比较,检验检测结果的准确性;以检测到的该疾病多个重要易感基因为特征,对病人和正常人的基因芯片数据设计分类器,并考察分类结果,若达到很好的分类结果,则将检测的多个易感基因作为该疾病的重要生物标记进行疾病的早期诊断;最后进一步实验验证检测结果的准确性以指导疾病的早期诊断与治疗。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2006101032560A CN101110095B (zh) | 2006-07-20 | 2006-07-20 | 一种对常见脑疾病易感基因的批量检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2006101032560A CN101110095B (zh) | 2006-07-20 | 2006-07-20 | 一种对常见脑疾病易感基因的批量检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101110095A true CN101110095A (zh) | 2008-01-23 |
CN101110095B CN101110095B (zh) | 2010-06-30 |
Family
ID=39042163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006101032560A Expired - Fee Related CN101110095B (zh) | 2006-07-20 | 2006-07-20 | 一种对常见脑疾病易感基因的批量检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101110095B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049678A (zh) * | 2012-11-23 | 2013-04-17 | 中国科学院自动化研究所 | 基于蛋白质交互作用网络的异病同治分子机理分析方法 |
CN104704499A (zh) * | 2012-06-21 | 2015-06-10 | 菲利普莫里斯生产公司 | 与基于网络的生物标记签名相关的系统和方法 |
CN105808906A (zh) * | 2014-10-27 | 2016-07-27 | 三星Sds株式会社 | 患者个人特性的分析方法及其装置 |
WO2017024682A1 (zh) * | 2015-08-12 | 2017-02-16 | 快克生物有限责任公司 | 生物标记物的功能验证芯片的制备方法 |
CN108614536A (zh) * | 2018-06-11 | 2018-10-02 | 云南中烟工业有限责任公司 | 一种卷烟制丝工艺关键因素的复杂网络构建方法 |
CN110827916A (zh) * | 2019-10-24 | 2020-02-21 | 南方医科大学南方医院 | 一种精神分裂症基因-基因互作网络及其构建方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1592852A (zh) * | 2001-09-26 | 2005-03-09 | Gni株式会社 | 应用产生自多重破坏表达文库的基因调控网络的生物发现 |
CN1271213C (zh) * | 2003-04-14 | 2006-08-23 | 赵雨杰 | 一种脑膜炎检测芯片及其制备工艺和使用方法 |
-
2006
- 2006-07-20 CN CN2006101032560A patent/CN101110095B/zh not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104704499A (zh) * | 2012-06-21 | 2015-06-10 | 菲利普莫里斯生产公司 | 与基于网络的生物标记签名相关的系统和方法 |
CN104704499B (zh) * | 2012-06-21 | 2018-12-11 | 菲利普莫里斯生产公司 | 与基于网络的生物标记签名相关的系统和方法 |
CN103049678A (zh) * | 2012-11-23 | 2013-04-17 | 中国科学院自动化研究所 | 基于蛋白质交互作用网络的异病同治分子机理分析方法 |
CN103049678B (zh) * | 2012-11-23 | 2015-09-09 | 中国科学院自动化研究所 | 基于蛋白质交互作用网络的异病同治分子机理分析方法 |
CN105808906A (zh) * | 2014-10-27 | 2016-07-27 | 三星Sds株式会社 | 患者个人特性的分析方法及其装置 |
CN105808906B (zh) * | 2014-10-27 | 2018-05-11 | 三星Sds株式会社 | 患者个人特性的分析方法及其装置 |
WO2017024682A1 (zh) * | 2015-08-12 | 2017-02-16 | 快克生物有限责任公司 | 生物标记物的功能验证芯片的制备方法 |
CN108614536A (zh) * | 2018-06-11 | 2018-10-02 | 云南中烟工业有限责任公司 | 一种卷烟制丝工艺关键因素的复杂网络构建方法 |
CN108614536B (zh) * | 2018-06-11 | 2020-10-27 | 云南中烟工业有限责任公司 | 一种卷烟制丝工艺关键因素的复杂网络构建方法 |
CN110827916A (zh) * | 2019-10-24 | 2020-02-21 | 南方医科大学南方医院 | 一种精神分裂症基因-基因互作网络及其构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101110095B (zh) | 2010-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022268283B2 (en) | Phenotype/disease specific gene ranking using curated, gene library and network based data structures | |
Frise et al. | Systematic image‐driven analysis of the spatial Drosophila embryonic expression landscape | |
Liu et al. | Early diagnosis of complex diseases by molecular biomarkers, network biomarkers, and dynamical network biomarkers | |
Zou et al. | miRClassify: an advanced web server for miRNA family classification and annotation | |
US20160232224A1 (en) | Categorization and filtering of scientific data | |
CN106021984A (zh) | 一种全外显子组测序数据分析系统 | |
CN101110095B (zh) | 一种对常见脑疾病易感基因的批量检测方法 | |
CN108121896B (zh) | 一种基于miRNA的疾病间关系分析方法和装置 | |
Sefer | A comparison of topologically associating domain callers over mammals at high resolution | |
Varshavsky et al. | Compact: A comparative package for clustering assessment | |
Sun et al. | Smolign: a spatial motifs-based protein multiple structural alignment method | |
Liu et al. | Cross-generation and cross-laboratory predictions of Affymetrix microarrays by rank-based methods | |
CN115458055A (zh) | 基于目标特征预测突变致病性分析方法、系统及设备 | |
CN111383708B (zh) | 基于化学基因组学的小分子靶标预测算法及其应用 | |
Hossain et al. | Protein complex detection in ppi network by identifying mutually exclusive protein-protein interactions | |
Yu et al. | A supervised approach to detect protein complex by combining biological and topological properties | |
KR20100021205A (ko) | 유전자 온톨로지 트리를 이용한 생물학적 시료의 유전자 발현 패턴 시각화 및 분석 장치 및 그 방법 | |
US20020021299A1 (en) | Method for displaying results of hybridization experiment | |
Majhi et al. | Artificial Intelligence in Bioinformatics | |
Huang et al. | An evolutionary algorithm for discovering biclusters in gene expression data of breast cancer | |
Patruno | Computational strategies for single-cell multi-omics data analysis and integration | |
CN117219172A (zh) | 三阴性乳腺癌肿瘤细胞通路分群方法、应用及系统 | |
CN111128297A (zh) | 一种基因芯片的制备方法 | |
Shon et al. | Beyond similarity-based methods to associate genes for the inference of function | |
Baldwin et al. | Computational, integrative and comparative methods for the elucidation of gene regulatory networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100630 Termination date: 20170720 |