CN105009130A - 基于网络熵的对生物体状态迁移的预兆检测予以辅助的检测装置、检测方法以及检测程序 - Google Patents

基于网络熵的对生物体状态迁移的预兆检测予以辅助的检测装置、检测方法以及检测程序 Download PDF

Info

Publication number
CN105009130A
CN105009130A CN201380066255.1A CN201380066255A CN105009130A CN 105009130 A CN105009130 A CN 105009130A CN 201380066255 A CN201380066255 A CN 201380066255A CN 105009130 A CN105009130 A CN 105009130A
Authority
CN
China
Prior art keywords
project
sub
unit
detection
biosome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380066255.1A
Other languages
English (en)
Other versions
CN105009130B (zh
Inventor
合原一幸
陈洛南
刘锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Publication of CN105009130A publication Critical patent/CN105009130A/zh
Application granted granted Critical
Publication of CN105009130B publication Critical patent/CN105009130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Fuzzy Systems (AREA)
  • Veterinary Medicine (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供能够高精度地检测表示从健康状态向疾病状态的状态迁移的预兆的疾病前状态的检测装置、检测方法以及检测程序。执行:获取与生物体相关的基因、蛋白质等测定数据作为高通量数据的获取处理(s1)、差异生物体分子的选出处理(s2)、局域网的SNE的计算(s3)、生物标志物的候选项的选择(s4)、整个网络的平均SNE的计算(s5)和判定并检测是否处于疾病前状态的检测处理(s6)。

Description

基于网络熵的对生物体状态迁移的预兆检测予以辅助的检测装置、检测方法以及检测程序
技术领域
本发明涉及基于通过与生物体相关的测定所得的多个因子项目的测定数据对作为测定对象的生物体的状态迁移的预兆检测予以辅助的检测装置、检测方法以及检测程序。
背景技术
根据各种各样的研究结果可知,众多疾病特别是复杂疾病的恶化发展的过程,与气候系统、生态系统、经济系统等系统同样地,若到达超过了某一临界阈值的时间点、即所谓的分支点,则状态迁移突然发生、从健康的稳定状态急剧地变化为疾病状态(例如参照非专利文献1~5)。在这样的与复杂疾病的动态机理相关的研究中,疾病恶化(例如喘息发作、癌的发病)的发展过程作为依赖于时间的非线性动力学系统而模型化,通过对模型化了的系统的动态进行解析,已经明确了病情因在分支点的状态迁移而急剧恶化(参照非专利文献1、6)。
图1是示意性地表示疾病的发展过程的说明图。图1的a示意性地表示疾病的发展过程。图1的b、c以及d为在发展过程的过程中将上述系统的稳定性用位函数表示、横轴取系统的状态变量而纵轴取位函数的值而示意地示出的示意图。如图1的a所示,疾病恶化的发展过程能够表示为正常状态(健康状态)、疾病前状态、疾病状态。正常状态中系统稳定,如图1的b所示,位函数的值变为最小值。疾病前状态中,系统如图1的c所示,位函数的值变高。因此,为容易受到外部干扰的影响的状态,位于由于仅受到小的外部干扰就会状态迁移的分支点的附近、即正常状态的极限位置。但是,该疾病前状态通过适当的处置常常能够恢复到正常状态。另一方面,在疾病状态,系统再次稳定化,如图1的d所示,位函数的值大体上变为最小值。因此,因从正常状态的分支所导致的状态迁移所产生的该疾病状态是难以恢复到正常状态的。
因此,如果能够检测到疾病前状态,在迁移到疾病状态前,告知患者正在向疾病状态迁移这一情况,则通过采取适当的措施,很有可能使患者从疾病前状态向正常状态恢复。
即、如果能够检测到分支点(临界阈值),则能够预测状态迁移,能够实现病情的早期诊断。但是,在复杂疾病的情况下,状态迁移的预测是极其困难的。其理由如下所述。
·第一,疾病前状态为正常状态的极限,在达到分支点前难以检测出显著的变化。因此,在以往的利用生物标志物、快照(snapshot)测定等手法所进行的诊断中,难以将正常状态与疾病前状态区别开。
·第二,在进行各种各样的研究期间,尚未开发出能够高精度地检测用于预测分支点的早期诊断用警告信号的高可靠性疾病模型。尤其是即使是同一疾病,疾病恶化的发展过程也是因人而异的,所以模型库的诊断方法其成功的概率很低。
·第三,疾病前状态的检测对象为患者,通常,从一名患者那里所得的样本数量是有限的,所以难以长期地获取预测所需的足够的样本。
相对于此,本申请发明者们提出了检测能用作为表示从正常状态向疾病状态迁移前的疾病前状态的警告信号的生物标志物候选项的方法(非专利文献7)。根据该手法,能够通过检测在即将迁移到疾病状态前出现的动态网络生物标志物(DNB),实现病情的早期诊断。
现有技术文献
非专利文献
非专利文献1:Venegas,J.G.等著,“Self-organized patchiness inasthma as a prelude to catastrophic shifts.”,(英国),Nature,NaturePublishing Group,2005年,434卷,p.777-782
非专利文献2:McSharry,P.E.、Smith,L.A.、Tarassenko,L著,“Prediction of epileptic seizures:are nonlinear methods relevant.”,(英国),Nature Medicine,Nature Publishing Group,2003年,9卷,p.241-242
非专利文献3:Roberto,P.B.、Eliseo,G.、“Transition models forchange-point estimation in logistic regression.”,(美国),Statistics inMedicine,Wiley-Blackwell,2003年,22卷,p.1141-1162
非专利文献4:Paek,S.等著,“Hearing preservation after gammaknife stereotactic radiosurgery of vestibular schwannoma”,(美国),Cancer,Wiley-Blackwell,2005年,1040卷,p.580-590
非专利文献5:Liu,J.K.、Rovit,R.L.、Couldwell,W.T.,“PituitaryApoplexy”(美国),Seminars in neurosurgery,Thieme,2001年,12卷,p.315-320
非专利文献6:Tanaka,G.,Tsumoto,K.,Tsuji,S.,Aihara,K.著,“Bifurcation analysis on a hybrid systems model of intermittenthormonal therapy for prostate cancer.”,(美国),Physical Review,美国物理学会,2008年,237卷,p.2616-2627
非专利文献7:陈洛南(Luonan Chen),刘锐(Rui Liu),刘治平(Zhi-Ping Liu),李美仪(Meiyi Li),合原一幸(KazuyukiAihara)著,「動的ネットワークバイオマーカーによる复杂な病情の突然の恶化に対する早期予兆信号の検出(Detectingearly-warning signals for sudden deterioration of complex diseases bydynamical network biomarkers.)」,SCIENTIFIC REPORTS,2012年3月29日,<URL:http://www.natureasia.com/ja-jp/srep/abstracts/35129>
发明内容
发明要解决的课题
针对这样的与疾病相关的早期发现以及早期治疗方面有效的疾病前状态,社会大众要求研究人员提供各种各样的检测方法。此外,非专利文献7所示的动态网络生物标志物(DNB:Dynamical NetworkBiomarker)的检测方法中,由于从生物体样本测定的基因等数据所含的噪音的影响,有时检测精度降低。另外,因为从大量的高通量数据中检测满足成为DNB的条件的DNB的候选项,所以需要巨大的计算量。
本发明是鉴于这一状况而完成的,其中,在迁移状态下,将关注的因子以及与该因子动态地直接连接的连接因子的状态变化作为局域网熵,基于局域网熵来检测向疾病状态迁移前的疾病前状态。由此,本发明的目的在于提供能够通过新方法检测疾病前状态的检测装置、检测方法以及检测程序。
用于解决课题的技术方案
用了达成上述目的,本发明所涉及的检测装置,基于通过与生物体相关的测定所得的多个因子项目的测定数据,对作为测定对象的生物体的状态迁移的预兆的检测予以辅助,其特征在于,具备:选出单元,针对所述各因子项目,选出该因子项目的测定数据的时间序列变化为规定的基准以上的因子项目;微观计算单元,在基于由所述选出单元选出的因子项目的相关关系求出的表示各因子项目间的动态结合关系的网络中,针对每个因子项目计算该因子项目与相邻的其他因子项目之间的统计力学上的微观熵;和检测单元,在由所述微观计算单元计算出的微观熵的减少程度超过规定的检测基准的情况下,将此检测为状态迁移的预兆。
在具有上述特征的检测装置中,能够基于在表示生物体的状态在多个因子项目间的动态结合关系的网络中、以统计力学方式计算出的微观熵,对生物体的状态迁移的预兆检测予以辅助。
另外,其特征在于,还具备选择单元,在由所述微观计算单元计算出的微观熵的减少程度超过规定的选择基准的情况下,所述选择单元选择该微观熵所涉及的因子项目作为是生物体症状指标的生物标志物的候选项,在所述选择单元选择出的因子项目所涉及的微观熵的减少程度超过规定的检测基准的情况下,所述检测单元将此检测为状态迁移的预兆。
因此,能够筛选成为计算对象的因子项目,所以能够降低的噪音的混入以提高检测精度,而且,能够降低计算量,所以能够实现处理负荷的减轻以及计算的高速化。
另外,其特征在于,还具备宏观计算单元,所述宏观计算单元基于由所述微观计算单元计算出的每个因子项目的微观熵,以统计方式计算出宏观熵(其为选出的所有因子项目的代表值),在由所述宏观计算单元计算出的宏观熵的减少程度超过第1检测基准的情况下,并且当由所述微观计算单元计算出的微观熵的减少程度超过第2检测基准时,所述检测单元将此检测为状态迁移的预兆。
因此,能够基于宏观熵来检测系统整体是否变为不稳定的状态。
另外,其特征在于,还具备访问记录有所述因子项目间的相互作用的数据库的单元,所述微观计算单元包括基于所述数据库所记录的因子项目间的相互作用来导出表示因子项目间的动态结合关系的网络的单元。
因此,能够构筑基于因子项目的关系的网络。
另外,其特征在于,所述微观计算单元,对于各因子项目根据基于概率密度函数的测定数据的概率与该概率的对数之积的总和来计算微观熵,其中,所述概率密度函数表示相邻的全部其他因子项目所涉及的测定数据的状态变化的分布。
因此,能够将统计力学以及信息理论上的熵宽展应用为网络的熵。
另外,其特征在于,所述微观计算单元,按每个因子项目,根据相对于基于以前的扰动所确定的阈值的变化大小而对测定数据进行2值化,假设2值化后的测定数据遵循多变量正态分布,对概率密度函数加以计算,基于对计算出概率密度函数进行多重积分所得的迁移概率来计算成为常态分布的所述测定数据的概率。
因此,能够基于因子项目的大小变化来计算网络的熵。
另外,其特征在于,还具备差异检测单元,所述差异检测单元检测所述各因子项目的各自的测定数据是否显著性地经时变化,所述选出单元选出被检测为经时变化具有显著性的因子项目。
因此,能够选出表现出显著变化的因子项目。
另外,其特征在于,所述因子项目为与基因相关的测定项目、与蛋白质相关的测定项目或与代谢物相关的测定项目。
因此,通过将因子项目设为基因、蛋白质或代谢物,能够定量地把握生物体内的生物学变化。
本发明所涉及的检测方法,该检测方法使用基于通过与生物体相关的测定所得的多个因子项目的测定数据、对作为测定对象的生物体的状态迁移的预兆的检测予以辅助的检测装置,其特征在于,所述检测装置执行:选出步骤,针对所述各因子项目选出该因子项目的测定数据的时间序列变化为规定的基准以上的因子项目;微观计算步骤,在基于由所述选出步骤选出的因子项目的相关关系求出的表示各因子项目间的动态结合关系的网络中,针对每个因子项目计算该因子项目与相邻的其他因子项目之间的统计力学上的微观熵;和检测步骤,在由所述微观计算步骤计算出的微观熵的减少程度超过规定的检测基准的情况下,将此检测为状态迁移的预兆。
在具有上述特征的检测方法中,能够基于在表示生物体的状态在多个因子项目间的动态结合关系的网络中、以统计力学方式计算出的微观熵,对生物体的状态迁移的预兆检测予以辅助。
本发明所涉及的检测程序,是使计算机基于通过与生物体相关的测定所得的多个因子项目的测定数据,对作为测定对象的生物体的状态迁移的预兆的检测予以辅助的检测程序,其特征在于,使计算机执行:选出步骤,针对所述各因子项目选出该因子项目的测定数据的时间序列变化为规定的基准以上的因子项目;微观计算步骤,在基于由所述选出步骤选出的因子项目的相关关系求出的表示各因子项目间的动态结合关系的网络中,针对每个因子项目计算该因子项目与相邻的其他因子项目之间的统计力学上的微观熵;和检测步骤,在由所述微观计算步骤计算出的微观熵的减少程度超过规定的检测基准的情况下,将此检测为状态迁移的预兆。
通过使计算机执行具有上述特征的检测程序,从而计算机作为检测装置工作,所以能够在表示生物体的状态在多个因子项目间的动态结合关系的网络中,基于以统计力学方式计算出的微观熵对生物体的状态迁移的预兆检测予以辅助。
发明效果
根据本发明,从诊断对象采集生物体样本,基于通过对采集到的生物体样本的测定所得的多个因子项目的测定数据,在表示生物体的状态在多个因子项目间的动态结合关系的网络中,以统计力学的方式计算微观熵。而且,基于计算出的熵的时间序列变化,对生物体的状态迁移的预兆检测予以辅助。由此,提出新的疾病前状态的检测方法,起到能够实现与疾病相关的早期发现以及早期治疗等优异效果。
附图说明
图1是说明的疾病的发展过程的示意图。
图2是表示SNE与DNB的关系的图表。
图3是表示疾病的发展过程中DNB与SNE的特性的示意图。
图4是表示实施方式中的DNB的检测方法的一例的流程图。
图5是表示实施方式中的差异生物体分子的选出处理的一例的流程图。
图6是表示实施方式中的局域网的SNE计算处理的一例的流程图。
图7是表示实施方式中的生物标志物候选项的选择处理的一例的流程图。
图8是表示本发明涉及的检测装置的构成例的框图。
图9是表示由本发明涉及的检测装置所进行的生物体的状态迁移的检测处理的一例的流程图。
具体实施方式
<基本理论>
本发明的发明者们,利用能够从1个样本得到大量(例如数千个)数据、即多维数据的基因高通量技术(ゲノム高通量テクノロジー,genome high-throughput technology),基于分支理论构筑复杂疾病的时间发展的数理模型,进行了分子网络水平上的疾病恶化的发展机理的研究。其结果揭示了能够在疾病前状态下检测出状态迁移发生前的即将分支(突然恶化)状态的动态网络生物标记(DNB:Dynamical Network Biomarker)的存在。通过将该动态网络生物标志物用作疾病前状态的警告信号,则不需要疾病模型,仅用少量样本就能够实现复杂疾病的早期诊断。
通常,疾病的发展过程所涉及的系统(以下称为系统(1))能够用下记的数学式(1)来表示。
Z(k+1)=f(Z(k);P)…数学式(1)
在数学式(1)中,Z(k)=(z1(k),...,zn(k))为表示在时刻k(k=0,1,...)观测到的系统(1)的动态状态的变量,能够设为蛋白质表达量、基因表达量、代谢物表达量等信息。详细而言,为涉及蛋白质、基因等分子的浓度、个数等的信息。P表示驱动系统(1)的状态迁移的缓慢变化的参数,能够设为例如SBP、CNV等遗传因素、甲基化、乙酰化等非遗传因素等信息。f=(f1,...,fn)为Z(k)的非线性函数。
正常状态、疾病状态分别能够用状态方程式Z(k+1)=f(Z(k);P)的固定点吸引子来表示。复杂疾病的发展过程具有非常复杂的动态特性,所以函数f是具有数千个变量的非线性函数。而且,驱动系统(1)的参数P的要素难以确定。因此,构筑并解析正常状态以及疾病状态的系统模型是非常困难的。
但是,系统(1)中,存在具有下面(A1)~(A3)所示的特性的固定点。
(A1)如果Z*取系统(1)的固定点,则Z*=f(Z*;P);
(A2)如果Pc取系统分支的阈值,则在P=Pc时,雅克比矩阵的1个实数特征值或一对复共轭特征值的绝对值成为1;
(A3)在P≠Pc时,一般而言系统(1)的特征值的绝对值不是1。
本申请发明者们根据上述特性从理论上解释清楚了:若系统(1)变为状态迁移点附近,则表现出下面这样的特异特性。即、若系统(1)变为状态迁移点附近,则在将系统(1)的各变量z1,...,zn分别作为节点所构成的网络(1)中,出现由一部分节点形成的支配集(子网络)。在状态迁移点附近出现的支配集,理想地具有下面的(B1)~(B3)所示的特异的特性。
(B1)在zi和zj为属于支配集的节点的情况下,
PCC(zi,zj)→±1;
SD(zi)→∞;
SD(zj)→∞。
(B2)在zi为属于支配集的节点但zj不是属于支配集的节点的情况下,
PCC(zi,zj)→0;
SD(zi)→∞;
SD(zj)→有界值。
(B3)zi和zj均不是属于支配集的节点的情况下,
PCC(zi,zj)→α、α∈(-1,1);
SD(zi)→有界值;
SD(zj)→有界值.
在此,PCC(zi,zj)是zi与zj之间的皮尔逊相关系数,SD(zi)、SD(zj)为zi与zj的标准偏差。
即、网络(1)中,具有上述特异的特性(B1)~(B3)的支配集的出现可被视为表示系统(1)处于临界迁移状态(疾病前状态)的征兆。因此,通过检测出该支配集,能够检测到系统(1)的状态迁移的预兆。即,能够将该支配集作为表示状态迁移、即疾病即将恶化的疾病前状态的警告信号。即、不管系统(1)多么复杂、另外即使驱动参数因数不明,只要能够检测到成为警告信号支配集,就能够确定处于疾病前状态,不再直接对系统(1)的数理模型进行处理。通过确定了处于疾病前状态,从而能够实现对于疾病的事前对策以及早期治疗。如作为非专利文献7所示那样,本申请发明者们将成为表示该疾病前状态的警告信号的该支配集称为动态网络生物标志物(以下简称为DNB)。非专利文献7中公开的所谓DNB是将表示仅在特定定时发生有效结合的理论动态结合关系的网络用作生物标志物的标记。
如上所述,DNB是具有特异的特性(B1)~(B3)的支配集,并且,作为由多个节点形成的子网络,在系统(1)处于疾病前状态时出现在网络(1)中。网络(1)中,如果作为针对基因、蛋白质、代谢物物等生物体分子取各节点(z1,...,zn)作为测定对象的因子项目,则DNB为由满足上述特异的特性(B1)~(B3)的部分生物体分子所涉及的因子项目形成的集(子网络)。
直接利用上述特异的特性(B1)~(B3)来检测成为DNB的候选项的方法,在非专利文献7中已有公开。根据该方法,能够从生物体样本中检测警告将迁移到疾病状态的DNB。但是,在测定数据含噪音的情况下,检测精度恶化。另外,需要从大量的测定数据中检测满足上述条件(B1)~(B3)的DNB,所以计算量巨大、检测效率不高。
相对于此,本申请发明者们提出了能够高精度且高效率地检测DNB的、使用基于迁移状态的局域网熵的疾病前状态的检测方法。接下来,对该方法具体地进行说明。下面将说明的所谓局域网熵,是表示仅在特定定时产生有效结合的理论动态结合关系的网络中、着眼于这一个节点按统计力学方式计算的微观熵。此外,在本申请中,还进一步根据局域网熵进行网络整体的宏观熵的计算。
<基于迁移状态的局域网熵>
上述的系统(1)的动态动作在分支点附近能够近似地用下面的数学式(2)表示。
Z(t+1)=A(P)Z(t)+ε(t)…数学式(2)
数学式(2)中,ε(t)为高斯噪音,P是对系统(1)的非线性函数f的雅克比矩阵A进行控制的参数矢量。而且,若将Z的变化量即为Δzi(t)=zi(t)-zi(t-1)(i=1,2,...,n),则基于分支理论以及中心流形理论,能够证明下面的(C1)以及(C2)的结论。
(C1)在P不存在于状态迁移点或分支点附近的情况下,
关于任意节点i、j(包括i=j的情况),Δzi(t+T)是相对于Δzi(t)在统计方面独立的(i,j=1,2,...,n)。
(C2)在P存在于状态迁移点或分支点附近的情况下,
·在节点i和j均存在于支配集或DNB时,Δzi(t+T)与Δzj(t)之间的相关度变高。
·在节点i和j均不存在于支配集或DNB时,Δzi(t+T)是相对于Δzj(t)在统计方面独立的。
基于上述结论(C1)以及(C2),本申请发明者们着眼于迁移状态,发现了使用局域网熵(下面根据需要称为SNE(State-transition-based local network entropy))而更高精度且更高效地检测DNB的方法。下面,关于基于迁移状态的SNE的概念以及SNE与DNB的关系进行说明。
·关于迁移状态(transition states)
对于时刻t的任意变量zi,将其设为用满足作为数学式(3)以及数学式(4)所示的下面的条件的xi(t)来表示迁移状态。
如果|zi(t)-zi(t-1)|>di,则xi(t)=1…数学式(3)
如果|zi(t)-zi(t-1)|≦di,则xi(t)=0…数学式(4)
数学式(3)以及数学式(4)中,di为确定在时刻t节点i的变化是否很大的阈值。本发明中,将X(t)=(x1(t),...,xn(t))定义为时刻t时系统(1)的“迁移状态”。能够从上述DNB的特异的特性以及结论(C1)以及(C2)导出下面的(D1)以及(D2)的迁移状态的特性。
(D1)在节点i和节点j为属于支配集或DNB的节点的情况下,迁移状态xi(t+T)与xi(t)之间的相关度急剧增大,而且
p(xi(t+T)=1|xj(t)=γ)→1
p(xi(t+T)=0|xj(t)=γ)→0
在此,γ∈{0,1},p为迁移概率。
(D2)在节点i和节点j均不是属于支配集或DNB的节点的情况下,迁移状态xi(t+T)在统计方面相对于xj(t)独立,而且
p(xi(t+T)=γi|xj(t)=γj)=p(xi(t+T)=γi)→α
在此,γi,γj∈{0,1},α∈(0,1)。
此外,系统如果为正常状态则面对外部干扰能够迅速恢复,但是如果为疾病前状态则即使面对很小的外部干扰也会很敏感的,所以上述阈值di必须设定为能够将正常状态的“小变化”和疾病前状态的“大变化”区分开。在此,系统为正常状态(t=t0),在各节点k,设为p(|zk(t0)|>dk)=α,并将各阈值d设定为下面的数学式(5)。根据基于数学式(5)所设定的各阈值d,判别在从以前的状态zi(t-1)到成为判别对象的时间点的状态zi(t)期间是否发生了大的变化或状态迁移。此外,在数学式(5)中,i1,i2,...,im表示与节点i相连的m个相邻节点。
[数1]
p ( | z i ( t 0 ) | > d i , | z i 1 ( t 0 ) | > d i 1 , . . . , | z i m ( t 0 ) | > d i m ) &le; &alpha; . …数学式(5)
例如,基于在正常状态时期获取的样本,针对正常状态下的扰动设定各阈值di使得α=0.5。
·关于局域网
在节点i与m个节点相连即节点i具有m个相邻节点(i1,i2,...,im)的情况下,将以节点i为中心的网络定义为局域网。该情况下,以节点i为中心的局域网在时刻t的迁移状态成为Xi(t)=(Xi(t),Xi1(t),...,Xim(t))。下面,为了使数学式简化,省略“i”而将Xi(t)记述为X(t)。
各节点i的连接关系是基于节点间的相互作用而设定的。例如,在将蛋白质用作节点的情况下,能够使用表示蛋白质间的相互作用的PPI(Protein-Protein Interaction)等的数据库中所记录的信息。这样的数据库,也能够从例如BioGrid(www.thebiogrid.org)、TRED(www.rulai.cshl.edu/cgi-bin/TRED/)、KEGG(www.gnome.jp/kegg)、HPRD(www.hprd.org)等网页获得。在将蛋白质用作节点的情况下,基于表示蛋白质间的相互作用的PPI等数据库,设定相邻节点以及基于相邻节点的局域网和整个网络,在将其他因子用作节点的情况下,使用与该因子相关的数据库。
基于该时刻t的迁移状态X(t)的下一时刻t+1的迁移状态,具有2m+1种的可能性。这些可能的迁移状态分别是概率事件,能够用{Au}u=1,2,...,2 m+1作为下面的数学式(6)来表示。
Au={xi=γ0,xi1=γ1,...,xim=γm}…数学式(6)
其中,γ1∈{0,1}、I∈{0,1,2,…,m}
因此,局域网中,离散概率过程为下面的数学式(7)。
{X(t+i)}i=0,1,...={X(t),X(t+1),...,X(t+i),...}…数学式(7)
其中,X(t+i)=Au,u∈{1,2,...,2m+1}。
即、在系统(1)为正常状态或疾病前状态的情况下,该离散概率过程为马尔科夫随机过程(stochastic Markov process),可以用马尔科夫矩阵P=(pu,v)来定义。据此,能够用下面的数学式(8)来表示从状态u向状态v的迁移路径。
[数2]
pu,v(t)=Pr(X(t+1)=Av|X(t)=Au)…数学式(8)
其中、u,v∈{1,2,...,2m+1},
&Sigma; v p u , v ( t ) = 1 ,
Pr:离散概率.
.关于局域网熵
在一定期间中,上述的局域网的状态迁移矩阵恒定,假设不变化。pu,v(t)为状态迁移矩阵中第u行第v列的要素,为任意2个可能的状态Au与Av之间的迁移概率。因此,在特定期间(正常状态或疾病前状态),用下面的数学式(9)所示的概率过程为恒定马尔科夫随机过程。
[数3]
概率过程{X(t)}t∈[t1,t2]…数学式(9)
而且,存在满足下面的数学式(10)的常态分布π=(π1,…,π2 m+1)。
[数4]
&Sigma; v &pi; v p u , v = &pi; u …数学式(10)
据此,能够对下面的数学式(11)所示的局域网熵进行定义。
[数5]
H i ( t ) = H ( x ) = - &Sigma; u , v &pi; v p u , v log P u , v …数学式(11)
数学式(11)中,序号“i”表示局域网的中心节点i,X表示局域网的状态迁移过程X(t),X(t+1),...,X(t+T)。作为数学式(11)示出的局域网熵为扩展了统计力学上的微观熵所得的概念。
以下,将上述局域网熵称为SNE。如上所述,在一定期间,概率过程式X(t),X(t+1),...为马尔科夫随机过程,根据马尔科夫链的性质等能够得到下面的数学式(12)。
[数6]
H i ( t ) = H ( x ) = : lim T &RightArrow; &infin; 1 T H ( X ( t ) , X ( t + 1 ) , . . . , X ( t + T ) ) …数学式(12)
因此,SNE为附条件的熵,也可以说是依存于状态迁移的平均迁移熵。因此,能够用下面的数学式(13)来表示。
Hi(t)
=H(X(t)|X(t-1))=H(X(t),X(t-1))-H(X(t-1))
…数学式(13)
另外,SNE具有下面(E1)~(E3)所示的性质。
(E1)在系统(1)为正常状态或疾病状态的情况下,系统(1)相对于小的外部干扰是稳定的,所以X(t)与X(t-1)大致彼此独立。
因此,
成为H(X(t),X(t-1))≒H(X(t))+H(X(t-1))>0,
所以成为Hi(t)≒H(X(t)),SNE的值不会大幅减小。
(E2)在系统(1)为疾病前状态的情况下,系统(1)相对于小的外部干扰仍不稳定,所以X(t)与X(t-1)较强地相关。
因此,
成为H(X(t),X(t-1))≒H(X(t-1)),
所以成为Hi(t)≒0,Hi(t)急剧减小。
(E3)能够将各局域网的SNE的平均值设为整个网络的SNE。即、如下面的数学式(14)所示,作为具有n个节点的整个网络SNE的H(t)成为作为以各节点为中心的局域网的SNE的Hi(t)的平均值。
[数7]
H ( t ) = 1 n &Sigma; i = 1 n H i ( t ) …数学式(14)
作为数学式(14)所示的整体网络的SNE为扩展了统计力学上的宏观熵所得的概念。
就以上那样定义的SNE与作为能够检测疾病前状态的其他方法的DNB的关系进行说明。在本申请中,网络中的节点能够根据与属于DNB的自节点以及他节点的关系而分类成下面的4种类型。
·类型1(DNB核心节点):将其自身为DNB节点、与其相连的节点也全部为DNB节点的节点定义为“DNB核心节点”。
·类型2(DNB边界节点):将其自身为DNB节点、但与其相连的节点中包括至少1个不是DNB节点的节点的节点定义为“DNB边界节点”。
·类型3(非DNB核心节点):将其自身不是DNB节点但是至少与1个DNB相连的节点定义为“非DNB核心节点”。
·类型4(非DNB边界节点):将其自身不是DNB节点也不与DNB节点相连的节点定义为“非DNB边界节点”。
另一方面,若将系统为正常状态下的SNE记为Hnor(X),将疾病前状态下的SNE记为Hpre(X),则分别能够用下面的数学式(15)以及数学式(16)表示。
[数8]
H nor ( x ) = - &Sigma; u , v &pi; u nor p u , v nor log p u , v nor …数学式(15)
其中、
pnor(xi(t)=1)=pnor(|Δzi|≥di)=α,
pnor(xi(t)=0)=pnor(|Δzi|<di)=1-α.
H pre ( x ) = - &Sigma; u , v &pi; u pre p u , v pre log p u , v pre …数学式(16)
其中、
ppre(xj(t)=1)=ppre(|Δzj(t)|≥dj)→1,
ppre(xj(t)=0)=ppre(|Δzj(t)|<dj)→0.
图2是表示SNE与DNB的关系的图表。图2是按每种类型与节点种类、中心节点的状态迁移以及局域SNE的状态相对应地示出基于上述关系式以及DNB的特性所证明的SNE与DNB之间的关系。
图2中,β为β∈(0,1)的常数。即、在中心节点为类型1的DNB核心节点的局域网中,中心节点的状态迁移为接近1的值,SNE急剧减小直至0。在中心节点为类型2的DNB边界节点的局域网中,中心节点的状态迁移为接近1的值,SNE减少。在中心节点为类型3的非DNB核心节点的局域网中,中心节点的状态迁移为接近规定的常数β的值,SNE减少。在中心节点为类型4的非DNB边界节点的局域网中,中心节点的状态迁移为接近规定的常数β的值,SNE不大变化。
图3是例示疾病的发展过程中的DNB与SNE的特性的示意图。图3概念性地表示疾病的发展过程中的DNB与SNE的特性。图3中示出了由表示基因等的节点z1~z6形成的网络。
图3的(a)表示正常状态、疾病前状态以及疾病状态,示出:虽然能够从疾病前状态恢复到正常状态,但是要从疾病状态恢复到疾病前状态是很困难的。
图3的(b)用圆圈表示出正常状态下的节点z1~z6,示出:各节点的标准偏差(用圆圈内的斜线的密度来表示)以及各节点间的相关系数。
图3的(c)表示疾病前状态下的节点z1~z6,示出:z1~z3的标准偏差变大(圆圈内的斜线的密度变密),彼此的相关系数变高(连接的线变粗),但是与其他节点之间的相关系数降低(与其他节点相连的线变细)。因此,在疾病前状态下作为DNB的成员的z1~z3显著化。
图3的(d)表示疾病状态下的节点z1~z6,示出:虽然节点z1~z3的标准偏差变得比正常状态稍大,但是各节点间的相关系数变得均等。
图3的(e)表示以往的利用生物标志物所实现的诊断方法。在图3的(e)中,横轴表示特定的蛋白质的浓度等以往的生物标志物的指标,表示从左向右、浓度等指标越来越高。如图3的(e)所示,在以往的利用生物标志物所实现的诊断方法中,在疾病前状态下,无法将用圆圈表示的正常样本与用星号表示的疾病前样本明确地区别开。
图3的(f)表示将SNE用作指标并对图3的(e)所示的样本进行了再配置的例子,示出从右向左、SNE越来越低而作为指标的警告的程度越来越高。如图3的(f)所示,使用SNE将用圆圈表示的正常样本与用星号表示的疾病前样本明确地分离开。因此,通过将SNE用作指标,从而能够检测疾病前状态。
图3的(g)将疾病发展过程中网络的平均SNE值的变化示为横轴为时间、纵轴为SNE的值的线图。示出:在正常状态以及疾病状态下,SNE的值高、系统具有高健壮性,相对于此,在疾病前状态下,SNE的值急剧减少、系统的健壮性变低。
<利用SNE所实现的疾病前状态的检测>
如上所述,若系统变为状态迁移点附近、即疾病前状态,则出现包括DNB节点的支配集,将系统从正常状态拉入疾病状态。如果利用上述图2的图表所记载的SNE与DNB的关系,在各采样时刻t,分别计算整个网络中的以各节点i为中心节点的局域网的SNE,则能够检测到SNE的值急剧减少的节点作为DNB节点。进一步,根据计算出的各局域网的SNE计算整个网络的平均SNE,在该值急剧减少了的情况下,存在多个DNB节点,意味着出现了由DNB节点形成的支配集,能够判定为系统处于疾病前状态。另外,如图2的图表所示,在类型1~4的节点中,SNE的值不会增加。因此,在整个网络的平均SNE的计算中,如果仅使用值减少了的局域网的SNE,则能够防止噪音的混入,所以能够预见检测精度的提高,而且,因为能够降低计算量所以能够提高计算效率。
<DNB的检测方法>
接下来,基于上述理论就利用SNE来检测疾病前状态的具体方法进行说明。图4是表示实施方式中的疾病前状态的检测方法的一例的流程图。在本发明的检测方法中,首先,需要通过与生物体有关的测定来获得测定数据。如果利用DNA芯片等高通量技术,则能够从1个生物体样本中测定2万个以上的基因的表达量。为了从统计学角度进行分析,本发明中,在不同时刻从测定对象采集多个生物体样本,对测定采集到的生物体样本所得的测定数据进行累计而获得统计数据。本发明中的DNB的检测方法,主要是如图4所示那样包括:高通量数据的获取处理(s1)、差异生物体分子的选出处理(s2)、局域网的SNE的计算处理(s3)、生物标志物的候选项的选择处理(s4)、整个网络的平均SNE的计算处理(s5)和判定并检测是否处于疾病前状态的检测处理(s6)。接下来,就这些各处理详细地进行说明。
步骤s1的高通量数据的获取处理是如下的处理:以成为检测对象的样本为案例样本,以参照用样本为对照样本,从样本分别获取高通量生理学的数据即生物体分子的表达量的测定数据(例如微阵列数据)。所谓参照用样本为事先从成为检测对象的患者采集到的样本、在采集时最初采集到的样本等样本,用作以测定装置的校正等为目的的对照样本。对照样本不是必需的,但其对于排除误差原因、提高测定的可靠性有用。
步骤s2的差异生物体分子的选出处理是选择表达量表现出显著变化的生物体分子的处理。图5是表示实施方式中的差异生物体分子的选出处理的一例的流程图。图5是详细地示出图4所示的步骤s2的差异生物体分子的生物体处理的附图。
如图5所示,首先,将基于从n个案例样本分别测定的高通量数据(生物体分子的表达量)的统计数据设为D1c,将从对照样本测定的数据设为Dr(s21)。接着,对各案例样本生物体分子D1c进行t检验,选出与对照样本的高通量数据Dr相比表达量表现出显著变化的生物体分子D2c(s22)。步骤s22中,作为选出表达量表现出显著变化的生物体分子D2c的方法,例示了t检验,但是不特别限定手法。例如,也可以应用U检验等其他检验方法,利用这样的无参数手法所进行的检验,在成为母体的D1c不按照正态分布的情况下,特别有效。另外,在进行t检验的情况下,显著水准α的值也能够适宜地设定为0.05、0.01等值。
接着,使用误表达率FDR对各案例样本生物体分子D2c修正多个比较(multiple comparisons)或多个t检验,选出修正后的各案例样本基因或蛋白数据D3c(s23)。接着,使用两倍变化方法(Thetwo-fold change method),从修正后的各案例样本基因或蛋白数据D3c中选出标准偏差SD变化比较大的Dc作为差异生物体分子(s24)。这里所选出的差异生物体分子Dc,不仅与对照样本的生物体分子Dr相比表现出显著的差异,而且较之其自身的平均值也有较大差异。步骤s23中,检测方法也不限定于t检验。
接下来,进行局域网SNE的计算(图4的步骤s3)。图6是表示实施方式中的局域网的SNE计算处理的一例的流程图。首先,用下面的式(17)将在步骤s24中选择的差异生物体分子Dc所涉及的测定数据标准化(步骤s31)。此外,在下面的计算中,使用通过数学式(17)标准化了的数据。
A=(Dcase-mean(Ncontrol))/SD(Ncontrol)…数学式(17)
其中,Dcase:基因、蛋白质的浓度等的测定数据
mean(Ncontrol):对照样本的平均值
SD(Ncontrol):对照样本的标准偏差
接着,使用PPI等数据库导出分别以在步骤s24中选择的差异生物体分子Dc中的各生物体分子为中心节点的局域网(步骤s32)
另外,针对所选择的N个中心节点分别确定阈值d={d1,...,dN}(步骤s33)。步骤s33中确定的各节点的阈值d为用于通过上述数学式(3)以及数学式(4)来确定迁移状态的阈值,基于在作为正常状态的时刻t1采集到样本,针对正常状态下的扰动,在各节点k确定阈值,以使被规定为p(|zk(t1)|>dk)=α的α例如为0.5。
而且,关于导出的各局域网,分别计算下面的数学式(18)所示的概率密度函数f(省略了数学式(18)的左边而表记)(步骤s34)。此外,步骤s34中,用通过阈值d对标准化了测定数据进行2值化后的数据,来计算概率密度函数f。
[数9]
f t k ( Z ) = 1 ( 2 &pi; ) k / 2 | &Sigma; ( t k ) | 1 / 2 exp ( - 1 2 ( Z - u ( t k ) ) T &Sigma; ( t k ) - 1 ( Z - u ( t k ) ) ) …数学式(18)
数学式(18)是假定具有k个节点的样本按照多变量正态分布而计算出的概率密度函数f。数学式(18)中,Z=(z1,...,zN),各局域网的各时刻t的平均值μ(tk)=(μ1(tk),...,μN(tk))。另外,Σμ(tk)是局域网中的共分散矩阵。而且,通过在各自的积分区域对数学式(18)所示的概率密度函数f进行多重积分,如下面的数学式(19)所示,计算时刻tk的各局域网的迁移概率pu、v(tk)(步骤s35)。
[数10]
p u , v ( t k ) = Pr ( X ( t k ) = A v | X ( t k - 1 ) = A u ) = Pr ( X ( t k ) = A v , X ( t k - 1 ) = A u ) Pr ( X ( t k - 1 ) = A u ) = &Integral; . . . &Integral; Z &Element; &Omega; u , Z ~ &Element; &Omega; v f t k ( Z , Z ~ ) d z 1 . . . d z N d z ~ 1 . . . d z ~ N &Integral; . . . &Integral; Z &Element; &Omega; u f t k ( Z ) d z 1 . . . d z N , …数学式(19)
在数学式(19)中,Z=(z1,...,zN)、Z=(z 1,...,z N)、Ωu以及Ωv分别表示状态Au以及Av下的积分区域(此外Z是在Z的上方附带的符号)。数学式(19)中,使用附条件的多变量正态分布或高斯核函数推定来求出迁移概率pu,v(tk)。进一步,利用下面的数学式(20)根据迁移概率pu,v(tk),计算时刻tk时的常态分布πv(tk)(步骤s36)。
[数11]
&Sigma; v &pi; v ( t k ) p u , v ( t k ) = &pi; u ( t k ) …数学式(20)
而且,使用计算所得的迁移概率pu,v(tk)以及常态分布πv(tk)通过下面的数学式(21),计算以时刻tk的各节点i(i=1,...,N)为中心的各局域网的熵H(tk)(步骤s37)。
[数12]
H i ( t k ) = - &Sigma; u , v &pi; v ( t k ) p u , v ( t k ) log P u , v ( t k ) …数学式(21)
接下来,进行生物标志物的候选项的选择(图4的步骤s4)。图7是示出实施方式中的生物标志物候选项的选择处理的一例的流程图。在生物标志物的候选项的选择处理中,基于步骤s36的计算,根据从处于正常状态的时刻t-1到成为判定是否处于疾病前状态的对象的时刻t为止的期间的时间序列变化,来求出SNE的值急剧减少到0为止的局域网的中心节点,将求出的中心节点作为DNB的成员加以存储(步骤s41)。进一步,存储SNE的值减少了的局域网的SNE作为“SNE集”的成员(步骤s42)。步骤s41~s42的处理是在局域网的SNE的减少程度超过规定的选择基准的情况下、选择该SNE所涉及的因子项目作为成为生物体的症状指标的生物标志物的候选项的处理。此外,步骤s41以及s42的存储是针对后述的检测装置的存储部或存储部而进行的。
接下来,进行整个网络的平均SNE的计算(图4的步骤s5)。步骤s5中,在各时刻,仅使用在上述步骤s42中存储的SNE集的成员的SNE通过上述数学式(14)来计算整个网络的平均SNE。通过仅使用SNE集的成员的SNE,能够防止噪音的混入以提高精度,而且能够降低计算量。
接着,进行是否处于疾病前状态的检测处理(图4的步骤s6)。具体而言,判定在上述步骤s5中计算出的各时刻的整个网络的SNE之中是否存在值以超过规定的检测基准的程度急剧减少的SNE,在存在急剧地减少了的SNE的情况下,在SNE减少了的时刻判定为系统处于疾病前状态。即、检测为处于疾病前状态。另一方面,在不存在值急剧减少了的SNE的情况下,即在减少程度为不超过规定检测基准的程度的情况下,判定为系统不处于疾病前状态。在存在这样急剧地减少了的SNE的情况下,在医疗诊断中,支持医师作出处于疾病前状态的可能性高等的诊断,能够成为进行进一步检查等诊断的契机。
<检测装置>
以上详细描述了的根据SNE所实现的疾病前状态的检测方法,能够作为使用了计算机的检测装置而将本发明具体化。图8是表示本发明所涉及的检测装置的构成例的框图。图8所示的检测装置1使用个人计算机、连接于服务器计算机的客户计算机、其他各种计算机来实现。检测装置1具备控制部10、存储部11、存储部12、输入部13、输出部14、获取部15、通信部16等各种机构。
控制部10使用CPU(Central Processing Unit)等电路而构成,为对整个检测装置1进行控制的机构。
存储部11为HDD(Hard Disk Drive,硬盘驱动器)等磁记录机构、SSD(Solid State Disk,固态盘)等非易失性半导体记录机构等非易失性辅助记录机构。存储部11中存储有本发明所涉及的检测程序11a等各种程序以及数据。进一步,存储部11中存储有表示在疾病前状态的检测中使用的因子项目间的关系的关系数据库11b。关系数据库11b例如使用作为因子项目间的关系表示了蛋白质间的相互作用的PPI等数据库。控制部10能够访问关系数据库11b并读出所存储的各因子项目间的关系。
存储部12是SDRAM(Synchronous Dynamic Random AccessMemory,同步动态随机存储器)、SRAM(Static Random AccessMemory,静态随机存取存储器)等易失性主存储机构。
输入部13为具备键盘、鼠标等硬件、以及驱动程序等软件的输入机构。
输出部14具备监视器、打印机等硬件、以及驱动程序等软件的输出机构。
获取部15为从外部获取各种数据的机构。具体而言,为经由LAN(Local Area Network)等内部通信网得到数据的LAN端口、连接于能够连接于测定设备的并行缆线等专用线的端口等各种硬件、以及驱动程度等软件。
通信部16为经由互联网等外部通信网得到数据的LAN端口等各种硬件、以及驱动程序等软件。此外,在用LAN端口构成获取部15的情况下,也可以并用获取部15以及通信部16。另外,通信部16能够从经由外部通信网所连接的网络服务器等外部记录装置中记录的关系数据库16a得到信息。即、控制部10能够访问关系数据库16a并得到所记录的各因子项目间的关系。
而且,通过将存储部11中记录的检测程序11a存储于存储部12、并基于控制部10的控制而执行该检测程序11a,从而计算机执行检测程序11a所涉及的各种步骤,作为本发明的检测装置1发挥作用。此外,为了方便,区分为存储部11和存储部12,但是两者都是具有各种信息的记录这一同样的功能的机构,能够根据装置的规格、运行方式等来适宜地确定使信息记录于哪一个存储部。
图9是表示由本发明所涉及的检测装置1所进行的生物体的状态迁移的检测处理的一例的流程图。本发明所涉及的检测装置1是执行利用上述SNE所进行的疾病前状态的检测处理的装置。检测装置1的控制部10通过获取部15来获取针对通过与生物体相关的测定所得到的多个因子项目的测定数据(Sc1)。步骤Sc1与作为图4的步骤s1所示的高通量数据的获取处理相对应。此外,在此,表现为计算机处理的对象,所以虽然表现为因子项目,但是在此所说的因子项目表示与能够成为上述DNB的节点的基因相关的测定项目、与蛋白质相关的测定项目、与代谢物相关的测定项目等测定项目。
控制部10检验获取到的因子项目的各自的测定数据是否显著地随时间发生了变化,基于检验到的结果选出差异生物体分子(Sc2)。步骤Sc2与图4的步骤s2所示的差异生物体分子的选出处理相对应。
因此,步骤Sc2的处理中包括下述处理:控制部10基于各因子项目的测定数据与按因子项目以每个时间序列所设定的参照数据的比较结果,进行与显著性相关的检验(Sc21),选出被检验为时效变化具有显著性的因子项目(Sc22)。即、执行图5所示的各种处理。此外,所谓检测装置1用作参照数据进行处理的数据为对照样本,例如,基于将最初获取的样本作为对照样本等的设定,检测装置1对该样本进行作为参照数据的处置。
控制部10,在基于选出的因子项目的时间序列变化的相关关系求出的表示各因子项目间的动态结合关系的网络中,作为每个因子项目与其相邻的另一因子项目之间的统计力学上的微观熵,来计算局域网的SNE(Sc3)。步骤Sc3与图4的步骤s3所示的局域网的SNE的计算处理相对应。
因此,步骤Sc3的处理中,控制部10访问关系数据库11b或16a,基于所记录的因子项目间的相互作用,导出表示因子项目间的动态结合关系的网络(Sc31)。进一步,控制部10对于每个因子项目,根据相对于基于以前的扰动所确定的阈值的变化大小而对测定数据进行2值化(Sc32),以使2值化后的测定数据遵循多变量正态分布的方式计算概率密度函数(Sc33),基于对计算出的概率密度函数进行多重积分所得的迁移概率来计算成为常态分布的测定数据的概率(Sc34)。接着,控制部10对于各因子项目,根据基于概率密度函数的测定数据的概率与该概率的对数之积的总和,来计算局域网的SNE(Sc35),其中,所述概率密度函数表示相邻的其他全部因子项目所涉及的测定数据的状态变化的分布。即、执行图6所示的各种处理。
控制部10,在计算出的局域网的SNE的减少程度超过规定的判定基准的情况下,将成为该局域网中心的因子项目特定为成为生物体的症状指标的生物标志物的候选项(Sc4)。步骤Sc4与图4的步骤s3所示的局域网的SNE计算处理中的、步骤s33~步骤s3的处理相对应。
因此,步骤Sc4的处理包括下述处理:在局域网的SNE的值急剧减少到了0的情况下,控制部10将成为该局域网中心的因子项目作为DNB的成员存储于存储部11或存储部12(Sc41),进一步,将SNE的值减少了的局域网作为SNE的“SNE集”的成员存储于存储部11或存储部12(Sc42)。
控制部10基于作为每个因子项目的微观熵而计算的各SNE,以统计方式计算成为选出的所有因子项目的代表值的宏观熵作为整体的SNE(Sc5)。步骤Sc5与使用上述数学式(14)来计算将图4的步骤s4所示的整个网络的平均SNE的处理相对应。
而且,控制部10,基于步骤Sc41中存储了的因子项目以及步骤Sc42中存储了的SNE来检测疾病前状态作为症状变化的预兆(Sc6)。步骤Sc6与图4的步骤s6的判定是否处于疾病前状态的判定处理相对应。
因此,步骤Sc6的处理包括下述处理:控制部10判断步骤Sc4中计算出的各时刻的整个网络的SNE之中是否存在值急剧减少了的SNE,在存在急剧减少了的SNE的情况下,在SNE减少了的时刻,判定为系统处于疾病前状态,另一方面,在不存在值急剧减少了的SNE的情况下,判定为系统不处于疾病前状态。
而且,控制部10将包括判定结果的检测结果从输出部14输出,并结束处理。另外,医师能够基于输出的检测结果来判断是否要采取进一步的检查、诊查、诊断、治疗等行为,患者能够基于输出的检测结果来把握自身的身体状态。
上述实施方式只不过是公开了本发明的无数实施例的一部分,也可以在考虑了疾病种类、应检测的目的等各种因素的基础上适宜地进行设计变更。尤其是,作为因子项目,如果是通过与生物体相关的测定所得到的信息,则可以使用各种各样的测定数据。例如,不限于上述的与基因、蛋白质、代谢物相关的测定数据,也可以通过基于由CT扫描仪等测定装置输出的体内图像,对各部位的各种状况进行数值化,从而将数值化结果用作测定数据。
附图标记说明
1 检测装置
10 控制部
11 存储部
11a 检测程序
11b 关系数据库
12 存储部
13 输入部
14 输出部
15 获取部
16 通信部
16a 关系数据库

Claims (10)

1.一种检测装置,所述装置基于通过与生物体相关的测定所得的多个因子项目的测定数据,对作为测定对象的生物体的状态迁移的预兆的检测予以辅助,其特征在于,具备:
选出单元,针对所述各因子项目,选出该因子项目的测定数据的时间序列变化为规定的基准以上的因子项目;
微观计算单元,在基于由所述选出单元选出的因子项目的相关关系求出的表示各因子项目间的动态结合关系的网络中,针对每个因子项目计算该因子项目与相邻的其他因子项目之间的统计力学上的微观熵;和
检测单元,在由所述微观计算单元计算出的微观熵的减少程度超过规定的检测基准的情况下,所述检测单元将这一情况检测为状态迁移的预兆。
2.根据权利要求1所述的检测装置,其特征在于,
还具备选择单元,在由所述微观计算单元计算出的微观熵的减少程度超过规定的选择基准的情况下,所述选择单元选择该微观熵所涉及的因子项目作为成为生物体症状指标的生物标志物的候选项,
所述检测单元,在所述选择单元选择出的因子项目所涉及的微观熵的减少程度超过规定的检测基准的情况下,将此检测为状态迁移的预兆。
3.根据权利要求1或2所述的检测装置,其特征在于,
还具备宏观计算单元,所述宏观计算单元基于由所述微观计算单元计算出的每个因子项目的微观熵,以统计方式计算出作为选出的所有因子项目的代表值的宏观熵,
在由所述宏观计算单元计算出的宏观熵的减少程度超过第1检测基准的情况下,并且当由所述微观计算单元计算出的微观熵的减少程度超过第2检测基准时,所述检测单元将此检测为状态迁移的预兆。
4.根据权利要求1到3中任一项所述的检测装置,其特征在于,
还具备访问记录有所述因子项目间的相互作用的数据库的单元,
所述微观计算单元包括基于所述数据库所记录的因子项目间的相互作用来导出表示因子项目间的动态结合关系的网络的单元。
5.根据权利要求1到4中任一项所述的检测装置,其特征在于,
所述微观计算单元,对于各因子项目根据基于概率密度函数的测定数据的概率与该概率的对数之积的总和来计算微观熵,其中,所述概率密度函数表示相邻的全部其他因子项目所涉及的测定数据的状态变化的分布。
6.根据权利要求5所述的检测装置,其特征在于,
所述微观计算单元,
按每个因子项目,根据相对于基于以前的扰动所确定的阈值的变化大小而对测定数据进行2值化,
以2值化后的测定数据遵循多变量正态分布为前提,对概率密度函数加以计算,
基于对计算出概率密度函数进行多重积分所得的迁移概率来计算成为常态分布的所述测定数据的概率。
7.根据权利要求1到6中任一项所述的检测装置,其特征在于,
还具备差异检测单元,所述差异检测单元检验所述各因子项目的各自的测定数据是否显著性地经时变化,
所述选出单元选出被检验为经时变化具有显著性的因子项目。
8.根据权利要求1到7中任一项所述的检测装置,其特征在于,
所述因子项目为与基因相关的测定项目、与蛋白质相关的测定项目或与代谢物相关的测定项目。
9.一种检测方法,该检测方法使用如下的检测装置:基于通过与生物体相关的测定所得的多个因子项目的测定数据、对作为测定对象的生物体的状态迁移的预兆的检测予以辅助,所述检测方法的特征在于,
所述检测装置执行:
选出步骤,针对所述各因子项目,选出该因子项目的测定数据的时间序列变化为规定的基准以上的因子项目;
微观计算步骤,在基于由所述选出步骤选出的因子项目的相关关系求出的表示各因子项目间的动态结合关系的网络中,针对每个因子项目计算该因子项目与相邻的其他因子项目之间的统计力学上的微观熵;和
检测步骤,在由所述微观计算步骤计算出的微观熵的减少程度超过规定的检测基准的情况下,将此检测为状态迁移的预兆。
10.一种检测程序,是使计算机基于通过与生物体相关的测定所得的多个因子项目的测定数据,对作为测定对象的生物体的状态迁移的预兆的检测予以辅助的检测程序,其特征在于,
使计算机执行:
选出步骤,针对所述各因子项目,选出该因子项目的测定数据的时间序列变化为规定的基准以上的因子项目;
微观计算步骤,在基于由所述选出步骤选出的因子项目的相关关系求出的表示各因子项目间的动态结合关系的网络中,针对每个因子项目计算该因子项目与相邻的其他因子项目之间的统计力学上的微观熵;和
检测步骤,在由所述微观计算步骤计算出的微观熵的减少程度超过规定的检测基准的情况下,将此检测为状态迁移的预兆。
CN201380066255.1A 2012-10-23 2013-10-15 基于网络熵的对生物体状态迁移的预兆检测予以辅助的检测装置、检测方法以及检测程序 Active CN105009130B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012-233886 2012-10-23
JP2012233886A JP6164678B2 (ja) 2012-10-23 2012-10-23 ネットワークエントロピーに基づく生体の状態遷移の予兆の検出を支援する検出装置、検出方法及び検出プログラム
PCT/JP2013/077929 WO2014065155A1 (ja) 2012-10-23 2013-10-15 ネットワークエントロピーに基づく生体の状態遷移の予兆の検出を支援する検出装置、検出方法及び検出プログラム

Publications (2)

Publication Number Publication Date
CN105009130A true CN105009130A (zh) 2015-10-28
CN105009130B CN105009130B (zh) 2017-07-28

Family

ID=50544535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380066255.1A Active CN105009130B (zh) 2012-10-23 2013-10-15 基于网络熵的对生物体状态迁移的预兆检测予以辅助的检测装置、检测方法以及检测程序

Country Status (7)

Country Link
US (1) US10431341B2 (zh)
EP (1) EP2913770B1 (zh)
JP (1) JP6164678B2 (zh)
KR (1) KR102221067B1 (zh)
CN (1) CN105009130B (zh)
CA (1) CA2894566C (zh)
WO (1) WO2014065155A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709274A (zh) * 2017-02-27 2017-05-24 新疆大学 一种通过熵变分析生物功能基因在其生长发育中协同调控物理机制的方法
CN110291589A (zh) * 2017-02-14 2019-09-27 富士胶片株式会社 生物物质分析方法及装置以及程序
CN110603592A (zh) * 2017-05-12 2019-12-20 国立研究开发法人科学技术振兴机构 生物标志物检测方法、疾病判断方法、生物标志物检测装置和生物标志物检测程序

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11266355B2 (en) * 2017-05-19 2022-03-08 Cerner Innovation, Inc. Early warning system and method for predicting patient deterioration
CN113889180B (zh) * 2021-09-30 2024-05-24 山东大学 一种基于动态网络熵的生物标记物识别方法与系统
JPWO2023210304A1 (zh) * 2022-04-28 2023-11-02

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040076984A1 (en) * 2000-12-07 2004-04-22 Roland Eils Expert system for classification and prediction of generic diseases, and for association of molecular genetic parameters with clinical parameters
US20060122816A1 (en) * 2002-05-20 2006-06-08 Schadt Eric E Computer systems and methods for subdividing a complex disease into component diseases
WO2008102825A1 (ja) * 2007-02-20 2008-08-28 Articell Systems Corporation 遺伝子発現パターンから遺伝子を分類する方法
JP2009057337A (ja) * 2007-08-31 2009-03-19 Dainippon Sumitomo Pharma Co Ltd メタボロームデータの解析方法および代謝関与マーカー
CN102272764A (zh) * 2009-01-06 2011-12-07 皇家飞利浦电子股份有限公司 进化聚类算法
US20120109615A1 (en) * 2010-10-27 2012-05-03 Samsung Sds Co., Ltd. Apparatus and method for extracting biomarkers

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009158620A2 (en) * 2008-06-26 2009-12-30 Dana-Farber Cancer Institute, Inc. Signatures and determinants associated with metastasis methods of use thereof

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040076984A1 (en) * 2000-12-07 2004-04-22 Roland Eils Expert system for classification and prediction of generic diseases, and for association of molecular genetic parameters with clinical parameters
US20060122816A1 (en) * 2002-05-20 2006-06-08 Schadt Eric E Computer systems and methods for subdividing a complex disease into component diseases
WO2008102825A1 (ja) * 2007-02-20 2008-08-28 Articell Systems Corporation 遺伝子発現パターンから遺伝子を分類する方法
JP2009057337A (ja) * 2007-08-31 2009-03-19 Dainippon Sumitomo Pharma Co Ltd メタボロームデータの解析方法および代謝関与マーカー
CN102272764A (zh) * 2009-01-06 2011-12-07 皇家飞利浦电子股份有限公司 进化聚类算法
US20120109615A1 (en) * 2010-10-27 2012-05-03 Samsung Sds Co., Ltd. Apparatus and method for extracting biomarkers

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHEN.L: "Detecting early-warning signals for sudden deterioration of complex diseases by dynamical network bi", 《SCIENTIFIC REPORTS》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110291589A (zh) * 2017-02-14 2019-09-27 富士胶片株式会社 生物物质分析方法及装置以及程序
CN110291589B (zh) * 2017-02-14 2023-08-08 富士胶片株式会社 生物物质分析方法及装置以及计算机可读的存储介质
CN106709274A (zh) * 2017-02-27 2017-05-24 新疆大学 一种通过熵变分析生物功能基因在其生长发育中协同调控物理机制的方法
CN110603592A (zh) * 2017-05-12 2019-12-20 国立研究开发法人科学技术振兴机构 生物标志物检测方法、疾病判断方法、生物标志物检测装置和生物标志物检测程序
CN110603592B (zh) * 2017-05-12 2024-04-19 国立研究开发法人科学技术振兴机构 生物标志物检测方法、疾病判断方法、生物标志物检测装置和生物标志物检测程序

Also Published As

Publication number Publication date
US10431341B2 (en) 2019-10-01
US20150302165A1 (en) 2015-10-22
EP2913770B1 (en) 2016-11-09
KR20150099726A (ko) 2015-09-01
KR102221067B1 (ko) 2021-02-25
JP2014083194A (ja) 2014-05-12
EP2913770A1 (en) 2015-09-02
JP6164678B2 (ja) 2017-07-19
WO2014065155A1 (ja) 2014-05-01
CA2894566C (en) 2021-03-30
CA2894566A1 (en) 2014-05-01
CN105009130B (zh) 2017-07-28
EP2913770A4 (en) 2015-11-11

Similar Documents

Publication Publication Date Title
Rahman et al. Deep learning using convolutional LSTM estimates biological age from physical activity
CN105009130A (zh) 基于网络熵的对生物体状态迁移的预兆检测予以辅助的检测装置、检测方法以及检测程序
US9687199B2 (en) Medical imaging system providing disease prognosis
Hagar et al. Survival analysis with electronic health record data: Experiments with chronic kidney disease
Liu et al. Clinical time series prediction: Toward a hierarchical dynamical system framework
Kuznetsov et al. Power considerations for the application of detrended fluctuation analysis in gait variability studies
CN111095232A (zh) 发掘用于机器学习技术中的基因组
Gumpfer et al. Detecting myocardial scar using electrocardiogram data and deep neural networks
CN106528111B (zh) 一种数据结构作业程序相似性度量方法
Inácio et al. Nonparametric Bayesian estimation of the three‐way receiver operating characteristic surface
Saranya et al. Diagnosing chronic kidney disease using KNN algorithm
JP5963198B2 (ja) 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム
Ong Ly et al. Shortcut learning in medical AI hinders generalization: method for estimating AI model generalization without external data
Svenson et al. Sepsis deterioration prediction using channelled long short-term memory networks
JP6198161B2 (ja) 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム
Hallgrímsson et al. Learning individualized cardiovascular responses from large-scale wearable sensors data
Ghosh Proportional hazards regression for cancer studies
Deng et al. Enhancing skeletal age estimation accuracy using support vector regression models
JP6948722B2 (ja) 検出装置及び検出プログラム
Sîrbu et al. Variation partitioning in double-constrained multivariate analyses: linking communities, environment, space, functional traits, and ecological niches
Qiu et al. Dynamic disease screening by joint modelling of survival and longitudinal data
DeShon et al. Prediction of sepsis onset in hospital admissions using survival analysis
US20170340272A1 (en) Decision support system for cns drug development
Raghavendra et al. Classification and Prediction Model using Hybrid Technique for Medical Datasets
McIntosh Strengthening the assessment of factorial invariance across population subgroups: a commentary on Varni et al.(2013)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Saitama Prefecture, Japan

Patentee after: State-run research and development legal person JST

Address before: Saitama Prefecture, Japan

Patentee before: Independent Administrative Corporation Japan Science & Tech Corp.