CN111276191A - 胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置 - Google Patents

胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置 Download PDF

Info

Publication number
CN111276191A
CN111276191A CN202010041304.8A CN202010041304A CN111276191A CN 111276191 A CN111276191 A CN 111276191A CN 202010041304 A CN202010041304 A CN 202010041304A CN 111276191 A CN111276191 A CN 111276191A
Authority
CN
China
Prior art keywords
molecular weight
blood
sugar
mean square
square error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010041304.8A
Other languages
English (en)
Other versions
CN111276191B (zh
Inventor
范时浩
Original Assignee
范时浩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 范时浩 filed Critical 范时浩
Priority to CN202010041304.8A priority Critical patent/CN111276191B/zh
Publication of CN111276191A publication Critical patent/CN111276191A/zh
Application granted granted Critical
Publication of CN111276191B publication Critical patent/CN111276191B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供一种胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置,所述方法包括以下步骤:接收胰腺癌病人血液中糖的分子量数据集、健康人血液中糖的分子量数据集、待检查人血液中糖的分子量数据集;计算得到胰腺癌病人血液中糖的分子量的均方差Dy(p,b);计算得到健康人血液中糖的分子量的均方差Dy(p,a);计算得到第一待检查人血液中糖的分子量的均方差Dy(p,b');计算得到第二待检查人血液中糖的分子量的均方差Dy(p,a');|Dy(p,b)‑Dy(p,b')|为第一绝对值;|Dy(p,a)‑Dy(p,a')|为第二绝对值;通过比较所述第一绝对值的和与所述第二绝对值的和的大小判断所述待检查人是否患胰腺癌。本发明的一种胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置,用于血液中糖的分子量数据,建立起统计数学模型构,造出识别率高的均值方差胰腺癌症识别法。

Description

胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置
技术领域
本发明涉及数据处理技术领域,特别是涉及一种胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置。
背景技术
胰腺癌癌症引起死亡,胰腺癌癌症病人经常发生糖基异常,其中之一是N-聚糖异常,研究N-聚糖异常表达是识别胰腺癌癌症的重要途径。在胰腺癌癌症患者的血清中,N-聚糖有显著的异常表达,血液中糖的的分子量是识别胰腺癌重要的指标。因此,在近年来的胰腺癌癌症研究中,血清中的N-聚糖是识别癌症分子标志物的研究热点。Rudd等人的N-聚糖研究指出,N-聚糖是重要的癌症分子标志物,特别适用于癌症的早期诊断、分期识别,以及预后监测。大量研究表明,在癌症病人的血清中,N-聚糖的表达量异常显著。例如,乳腺癌和肺癌研究中,发现唾酸化和岩藻糖基化出现异常;在肝癌研究中也发现,糖基转移酶发生变化,能引起N-聚糖含量发生改变。在前列腺癌、结直肠癌等癌症的研究中,均发现了类似现象。然而,在N-聚糖因癌症而引发的表达异常被普遍关注的同时,关于N-聚糖与癌症分期的关联却较少被报道。N-聚糖的表达量异常会造成血液中糖的分子量的异常。
胰腺癌存活率和较差治疗率,是生物医学和临床领域所面临的最具挑战性的问题。如何提高胰腺癌患者远期的生存率及改善患者的预后目前已经成为亟待攻克的问题。
因此,希望能够解决如何利用血液中糖的分子量进行胰腺癌血液中糖的分子量统计识别的问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置,用于解决现有技术中如何利用血液中糖的分子量进行胰腺癌血液中糖的分子量统计识别的问题。
为实现上述目的及其他相关目的,本发明提供一种胰腺癌血液中糖的分子量统计识别方法,包括以下步骤:接收胰腺癌病人血液中糖的分子量数据集、健康人血液中糖的分子量数据集、待检查人血液中糖的分子量数据集;
基于胰腺癌病人血液中糖的分子量数据集通过预设的均方差计算方法计算得到胰腺癌病人血液中糖的分子量的均方差Dy(p,b);基于健康人血液中糖的分子量数据集通过预设的均方差计算方法计算得到健康人血液中糖的分子量的均方差Dy(p,a);
将待检查人血液中糖的分子量数据集的数据代入胰腺癌病人血液中糖的分子量数据集中得到第一待检查人血液中糖的分子量数据集,基于第一待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第一待检查人血液中糖的分子量的均方差Dy(p,b');将待检查人血液中糖的分子量数据集的数据代入健康人血液中糖的分子量数据集中得到第二待检查人血液中糖的分子量数据集,基于第二待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第二待检查人血液中糖的分子量的均方差Dy(p,a');
计算胰腺癌病人血液中糖的分子量的均方差Dy(p,b)与胰腺癌病人和第一待检查人血液中糖的分子量的均方差Dy(p,b')的差值的绝对值|Dy(p,b)-Dy(p,b')|为第一绝对值;计算健康人血液中糖的分子量的均方差Dy(p,a)与健康人和第二待检查人血液中糖的分子量的均方差Dy(p,a')的差值的绝对值|Dy(p,a)-Dy(p,a')|为第二绝对值;
通过比较所述第一绝对值的和与所述第二绝对值的和的大小判断所述待检查人是否患胰腺癌。
于本发明的一实施例中,还包括展示所述第一待检查人血液中糖的分子量的均方差Dy(p,b')、第二待检查人血液中糖的分子量的均方差Dy(p,a')、胰腺癌病人血液中糖的分子量的均方差Dy(p,b)和健康人血液中糖的分子量的均方差Dy(p,a)的折线图。
于本发明的一实施例中,所述预设的均方差计算方法包括以下步骤:
已知分子量数据集为:
U={ujk,j=1,2,..,J;k=1,2,..K};
计算所述分子量数据集的和:
Figure BDA0002367867540000021
计算每个分子量所占分子量数据集的和的百分比:
Figure BDA0002367867540000022
计算每个分子量所占分子量数据集的和的百分比的平均数:
Figure BDA0002367867540000023
记x(j,k)=xjk为第k个人处于第j个分子量测量数据,作变换:
Figure BDA0002367867540000031
再求y(j,k)的均值:
Figure BDA0002367867540000032
继续求前p个数据的{z(1),z(2),...,z(p)}的均方差,记为:Dy(p),p=2,3,..,J通过均方差公式得到均方差:
Figure BDA0002367867540000033
为实现上述目的,本发明还提供一种胰腺癌血液中糖的分子量统计识别系统,包括:接收模块、第一均方差计算模块、第二均方差计算模块、绝对值计算模块和绝对值比较模块;所述接收模块用于接收胰腺癌病人血液中糖的分子量数据集、健康人血液中糖的分子量数据集、待检查人血液中糖的分子量数据集;所述第一均方差计算模块用于基于胰腺癌病人血液中糖的分子量数据集通过预设的均方差计算方法计算得到胰腺癌病人血液中糖的分子量的均方差Dy(p,b);基于健康人血液中糖的分子量数据集通过预设的均方差计算方法计算得到健康人血液中糖的分子量的均方差Dy(p,a);所述第二均方差计算模块用于将待检查人血液中糖的分子量数据集的数据代入胰腺癌病人血液中糖的分子量数据集中得到第一待检查人血液中糖的分子量数据集,基于第一待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第一待检查人血液中糖的分子量的均方差Dy(p,b');将待检查人血液中糖的分子量数据集的数据代入健康人血液中糖的分子量数据集中得到第二待检查人血液中糖的分子量数据集,基于第二待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第二待检查人血液中糖的分子量的均方差Dy(p,a');所述绝对值计算模块用于计算胰腺癌病人血液中糖的分子量的均方差Dy(p,b)与胰腺癌病人和第一待检查人血液中糖的分子量的均方差Dy(p,b')的差值的绝对值|Dy(p,b)-Dy(p,b')|为第一绝对值;计算健康人血液中糖的分子量的均方差Dy(p,a)与健康人和第二待检查人血液中糖的分子量的均方差Dy(p,a')的差值的绝对值
|Dy(p,a)-Dy(p,a')|为第二绝对值;所述绝对值比较模块用于通过比较所述第一绝对值的和与所述第二绝对值的和的大小判断所述待检查人是否患胰腺癌。
于本发明的一实施例中,还包括展示所述第一待检查人血液中糖的分子量的均方差Dy(p,b')、第二待检查人血液中糖的分子量的均方差Dy(p,a')、胰腺癌病人血液中糖的分子量的均方差Dy(p,b)和健康人血液中糖的分子量的均方差Dy(p,a)的折线图。
于本发明的一实施例中,所述预设的均方差计算方法包括以下步骤:
已知分子量数据集为:
U={ujk,j=1,2,..,J;k=1,2,..K};
计算所述分子量数据集的和:
Figure BDA0002367867540000041
计算每个分子量所占分子量数据集的和的百分比:
Figure BDA0002367867540000042
计算每个分子量所占分子量数据集的和的百分比的平均数:
Figure BDA0002367867540000043
记x(j,k)=xjk为第k个人处于第j个分子量测量数据,作变换:
Figure BDA0002367867540000044
再求y(j,k)的均值:
Figure BDA0002367867540000045
继续求前p个数据的{z(1),z(2),...,z(p)}的均方差,记为:Dy(p),p=2,3,..,J通过均方差公式得到均方差:
Figure BDA0002367867540000046
为实现上述目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一上述胰腺癌血液中糖的分子量统计识别方法。
为实现上述目的,本发明还提供一种胰腺癌血液中糖的分子量统计识别装置,包括:处理器和存储器;所述存储器用于存储计算机程序;所述处理器与所述存储器相连,用于执行所述存储器存储的计算机程序,以使所述胰腺癌血液中糖的分子量统计识别装置执行任一上述的胰腺癌血液中糖的分子量统计识别方法。
如上所述,本发明的一种胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置,具有以下有益效果:用于血液中糖的分子量数据,建立起统计数学模型构,造出识别率高的均值方差胰腺癌症识别法。
附图说明
图1a显示为本发明的胰腺癌血液中糖的分子量统计识别方法于一实施例中的流程图;
图1b显示为本发明的胰腺癌病人的血液中糖的的分子量平均值统计分布图;
图1c显示为本发明的胰腺癌病人的血液中糖的的分子量均方差的统计分布图;
图1d显示为本发明的胰腺癌病人血液中糖的分子量的均方差与健康人血液中糖的分子量的均方差的统计分布图;
图2显示为本发明的胰腺癌血液中糖的分子量统计识别系统于一实施例中的结构示意图;
图3显示为本发明的胰腺癌血液中糖的分子量统计识别装置于一实施例中的结构示意图。
元件标号说明
21 接收模块
22 第一均方差计算模块
23 第二均方差计算模块
24 绝对值计算模块
25 绝对值比较模块
31 处理器
32 存储器
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,故图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明的胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置,用于血液中糖的分子量数据,建立起统计数学模型构,造出识别率高的均值方差胰腺癌症识别法。
如图1所示,于一实施例中,本发明的胰腺癌血液中糖的分子量统计识别方法,包括以下步骤:
步骤S11、接收胰腺癌病人血液中糖的分子量数据集、健康人血液中糖的分子量数据集、待检查人血液中糖的分子量数据集。
具体地,设u为血液中糖的的分子量,取值为uj,j=1,2,..,J,第k个人的分子量测量数据为ujk,k=1,2,..K.每个人测量数据相加之和为:
Figure BDA0002367867540000061
即分子量数据集为:
U={ujk,j=1,2,..,J;k=1,2,..K}。设病人测量数据为一行,第k个病人测量数据为第k行,则K个病人数据形成K行J列的表格。
那么胰腺癌病人血液中糖的分子量数据集表示为:
U={ujk,j=1,2,..,J;k=1,2,..K};
健康人血液中糖的分子量数据集表示为:
V={vjk,j=1,2,..,n;k=1,2,..m};
待检查人血液中糖的分子量数据集表示为:
A={wjk,j=1,2,..,n,k=1}。
例如:某一实验中测量了27个胰腺癌病人的血液中糖的的分子量,分子量取值共47个,共获得1269个数据。图1b胰腺癌病人的血液中糖的的分子量平均值统计分布图给出了胰腺癌病人的分子量平均值的部分计算数据。由计算数据可知,当x轴坐标分子量为2792.4时,对应y轴坐标平均值最大为42.175。当分子量为1998时,对应平均值最小为0.025456。
步骤S12、基于胰腺癌病人血液中糖的分子量数据集通过预设的均方差计算方法计算得到胰腺癌病人血液中糖的分子量的均方差Dy(p,b);基于健康人血液中糖的分子量数据集通过预设的均方差计算方法计算得到健康人血液中糖的分子量的均方差Dy(p,a)。
具体地,所述所述预设的均方差计算方法包括以下步骤:
已知分子量数据集为:
U={ujk,j=1,2,..,J;k=1,2,..K};
计算所述分子量数据集的和:
Figure BDA0002367867540000062
计算每个分子量所占分子量数据集的和的百分比:
Figure BDA0002367867540000071
计算每个分子量所占分子量数据集的和的百分比的平均数:即第j个取值的平均数;
Figure BDA0002367867540000072
上式是表格中第j列数据平均值。
记x(j,k)=xjk为第k个人处于第j个分子量测量数据,作变换:
Figure BDA0002367867540000073
再求y(j,k)的均值:
Figure BDA0002367867540000074
继续求前p个数据的{z(1),z(2),...,z(p)}的均方差,记为:Dy(p),p=2,3,..,J通过均方差公式得到均方差:
Figure BDA0002367867540000075
例如图1c胰腺癌病人的血液中糖的的分子量均方差的统计分布图给出了胰腺癌病人的分子量均方差的计算数据。由图可知,当x轴坐标分子量为2792.4时,对应y轴坐标均方差最大为5.4877。当分子量为1998.9时,对应均方差最小为0.033291。
即按照上述预设的均方差计算方法计算出胰腺癌病人血液中糖的分子量的均方差Dy(p,b)和健康人血液中糖的分子量的均方差Dy(p,a)。其中b和a只是为了区分做的识别标记,没有其他含义。即Dy(p,b)也可以表示为Dy(p)-b,Dy(p,a)也可以表示为Dy(p)-a。
具体地,根据胰腺癌病人与健康人的测量数据,计算了均方差,结果见图1d胰腺癌病人血液中糖的分子量的均方差与健康人血液中糖的分子量的均方差的统计分布图图中胰腺癌病人为三角线,健康人为五角星线。由图可知胰腺癌病人与健康人的均方差完全分离。其中x轴坐标代表糖的分子量,y轴坐标代表糖的分子量的均方差,即D(y(j))代表上式中的Dy(p)。
具体地,还包括展示所述第一待检查人血液中糖的分子量的均方差Dy(p,b')、第二待检查人血液中糖的分子量的均方差Dy(p,a')、胰腺癌病人血液中糖的分子量的均方差Dy(p,b)和健康人血液中糖的分子量的均方差Dy(p,a)的折线图。如图1d胰腺癌病人血液中糖的分子量的均方差与健康人血液中糖的分子量的均方差的统计分布图图中胰腺癌病人为三角线,健康人为五角星线。即为展示了胰腺癌病人血液中糖的分子量的均方差Dy(p,b),p=2,3,..,J和健康人血液中糖的分子量的均方差Dy(p,a),p=2,3,..,J的折线图。
步骤S13、将待检查人血液中糖的分子量数据集的数据代入胰腺癌病人血液中糖的分子量数据集中得到第一待检查人血液中糖的分子量数据集,基于第一待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第一待检查人血液中糖的分子量的均方差Dy(p,b');将待检查人血液中糖的分子量数据集的数据代入健康人血液中糖的分子量数据集中得到第二待检查人血液中糖的分子量数据集,基于第二待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第二待检查人血液中糖的分子量的均方差Dy(p,a')。其中b'和a'只是为了区分做的识别标记,没有其他含义。即Dy(p,b')也可以表示为Dy(p)-b',Dy(p,a')也可以表示为Dy(p)-a'。
具体地,即分子量数据集为:
U={ujk,j=1,2,..,J;k=1,2,..K}。设病人测量数据为一行,第k个病人测量数据为第k行,则K个病人数据形成K行J列的表格。
那么胰腺癌病人血液中糖的分子量数据集表示为:
U={ujk,j=1,2,..,J;k=1,2,..K};
健康人血液中糖的分子量数据集表示为:
V={vjk,j=1,2,..,n;k=1,2,..m};
待检查人血液中糖的分子量数据集表示为:
A={wjk,j=1,2,..,n,k=1}。
将待检查人血液中糖的分子量数据集的数据代入胰腺癌病人血液中糖的分子量数据集中得到第一待检查人血液中糖的分子量数据集,即将待检查人血液中糖的分子量数据集加到胰腺癌病人血液中糖的分子量数据集中,用集合(U(A))中数据计算均方差,(U(A))={ujk,j=1,2,..,J;k=1,2,..K},即第一待检查人血液中糖的分子量数据集。即为用A={wjk,j=1,2,..,n,k=1},替换了U={ujk,j=1,2,..,J;k=1,2,..K};中的ujk,j=1,2,..,J;k=1。基于第一待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第一待检查人血液中糖的分子量的均方差Dy(p,b'),p=2,3,..,J。
将待检查人血液中糖的分子量数据集的数据代入健康人血液中糖的分子量数据集中得到第二待检查人血液中糖的分子量数据集,即将待检查人血液中糖的分子量数据集加到健康人血液中糖的分子量数据集中,集合(V(A))中数据计算均方差,(V(A))={vjk,j=1,2,..,J;k=1,2,..K},记为Dy(p,a'),p=2,3,..,J。即为用A={wjk,j=1,2,..,n,k=1},替换了V={vjk,j=1,2,..,n;k=1,2,..m};中的vjk,j=1,2,..,n;k=1。基于第二待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第二待检查人血液中糖的分子量的均方差Dy(p,a'),p=2,3,..,J。
步骤S14、计算胰腺癌病人血液中糖的分子量的均方差Dy(p,b)与胰腺癌病人和第一待检查人血液中糖的分子量的均方差Dy(p,b')的差值的绝对值|Dy(p,b)-Dy(p,b')|为第一绝对值;计算健康人血液中糖的分子量的均方差Dy(p,a)与健康人和第二待检查人血液中糖的分子量的均方差Dy(p,a')的差值的绝对值|Dy(p,a)-Dy(p,a')|为第二绝对值。
具体地,计算胰腺癌病人血液中糖的分子量的均方差Dy(p,b),p=2,3,..,J与胰腺癌病人和第一待检查人血液中糖的分子量的均方差Dy(p,b'),p=2,3,..,J的差值的绝对值|Dy(p,b)-Dy(p,b')|,p=2,3,..,J为第一绝对值;计算健康人血液中糖的分子量的均方差Dy(p,a),p=2,3,..,J与健康人和第二待检查人血液中糖的分子量的均方差Dy(p,a'),p=2,3,..,J的差值的绝对值|Dy(p,a)-Dy(p,a')|,p=2,3,..,J为第二绝对值。
步骤S15、通过比较所述第一绝对值的和与所述第二绝对值的和的大小判断所述待检查人是否患胰腺癌。
具体地,若Σ|Dy(p,b)-Dy(p,b')|<Σ|Dy(p,a)-Dy(p,a')|,则待检查人是癌症病人,否则是健康人。式中Σ是对所有p求和,p=2,3,..,J。
具体地,应用上面均值方差方法,计算了51人统计值,结果列于表1中。由表中数据可知,识别癌症病人正确概率为(26-4)/26=84.6%,识别健康人正确概率为(25-3)/25=88%.总体正确率为(51-7)/51=86%。识别结果见表1。而传统的分类方法正确概率最高值为43%详见参考文献(Miyamoto S,Taylor S L,Barupal D K,et al.SystemicMetabolomic Changes in Blood Samples of Lung Cancer Patients Identified byGas Chromatography Time-of-Flight Mass Spectrometry[J].Metabolites.2015,5(2):192-210.)。
表1,识别结果
Figure BDA0002367867540000091
具体地,本发明研究了胰腺癌血液中糖的分子量统计识别问题。对测量数据进行了分析研究,发现胰腺癌病人测量数据波动较大,由此构造出均值方差识别法。此法先计算测量者的平均值,然后对平均值计算均方差。根据均值方差法,对51个测量者进行了识别计算,结果表明,本发明的均值方差识别法对胰腺癌的识别率高达86%。
而目前采用传统的分类方法其正确概率最高值仅有43%。所以相对而言,本发明提出的均值方差识别法才具有实际的临床运用价值。也具有切实的公共价值。
如图2所示,于一实施例中,本发明的胰腺癌血液中糖的分子量统计识别系统,接收模块21、第一均方差计算模块22、第二均方差计算模块23、绝对值计算模块24和绝对值比较模块25。
所述接收模块21用于接收胰腺癌病人血液中糖的分子量数据集、健康人血液中糖的分子量数据集、待检查人血液中糖的分子量数据集;
所述第一均方差计算模块22用于基于胰腺癌病人血液中糖的分子量数据集通过预设的均方差计算方法计算得到胰腺癌病人血液中糖的分子量的均方差Dy(p,b);基于健康人血液中糖的分子量数据集通过预设的均方差计算方法计算得到健康人血液中糖的分子量的均方差Dy(p,a);
所述第二均方差计算模块23用于将待检查人血液中糖的分子量数据集的数据代入胰腺癌病人血液中糖的分子量数据集中得到第一待检查人血液中糖的分子量数据集,基于第一待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第一待检查人血液中糖的分子量的均方差Dy(p,b');将待检查人血液中糖的分子量数据集的数据代入健康人血液中糖的分子量数据集中得到第二待检查人血液中糖的分子量数据集,基于第二待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第二待检查人血液中糖的分子量的均方差Dy(p,a');
所述绝对值计算模块24用于计算胰腺癌病人血液中糖的分子量的均方差Dy(p,b)与胰腺癌病人和第一待检查人血液中糖的分子量的均方差Dy(p,b')的差值的绝对值|Dy(p,b)-Dy(p,b')|为第一绝对值;计算健康人血液中糖的分子量的均方差Dy(p,a)与健康人和第二待检查人血液中糖的分子量的均方差Dy(p,a')的差值的绝对值|Dy(p,a)-Dy(p,a')|为第二绝对值;
所述绝对值比较模块25用于通过比较所述第一绝对值的和与所述第二绝对值的和的大小判断所述待检查人是否患胰腺癌。
具体地,还包括展示所述第一待检查人血液中糖的分子量的均方差Dy(p,b')、第二待检查人血液中糖的分子量的均方差Dy(p,a')、胰腺癌病人血液中糖的分子量的均方差Dy(p,b)和健康人血液中糖的分子量的均方差Dy(p,a)的折线图。
具体地,所述预设的均方差计算方法包括以下步骤:
已知分子量数据集为:
U={ujk,j=1,2,..,J;k=1,2,..K};
计算所述分子量数据集的和:
Figure BDA0002367867540000111
计算每个分子量所占分子量数据集的和的百分比:
Figure BDA0002367867540000112
计算每个分子量所占分子量数据集的和的百分比的平均数:
Figure BDA0002367867540000113
记x(j,k)=xjk为第k个人处于第j个分子量测量数据,作变换:
Figure BDA0002367867540000114
再求y(j,k)的均值:
Figure BDA0002367867540000115
继续求前p个数据的{z(1),z(2),...,z(p)}的均方差,记为:Dy(p),p=2,3,..,J通过均方差公
式得到均方差:
Figure BDA0002367867540000116
需要说明的是,接收模块21、第一均方差计算模块22、第二均方差计算模块23、绝对值计算模块24和绝对值比较模块25的结构和原理与上述胰腺癌血液中糖的分子量统计识别方法中的步骤一一对应,故在此不再赘述。
需要说明的是,应理解以上系统的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,x模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(Digital Singnal Processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
于本发明一实施例中,本发明还包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一所述胰腺癌血液中糖的分子量统计识别方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。即发明的基于胰腺癌血液中糖的分子量统计识别方法生成数学模型,可直接生成相应的计算程序。录入常规的血液中糖的的分子量数据,根据计算程序即可实时得到对应的结果。
如图3所示,于一实施例中,本发明的胰腺癌血液中糖的分子量统计识别装置包括:处理器31和存储器32;所述存储器32用于存储计算机程序;所述处理器31与所述存储器32相连,用于执行所述存储器32存储的计算机程序,以使所述胰腺癌血液中糖的分子量统计识别装置执行任一所述的胰腺癌血液中糖的分子量统计识别方法。
具体地,所述存储器32包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
优选地,所述处理器31可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
综上所述,本发明胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置,用于血液中糖的分子量数据,建立起统计数学模型构造出识别率高的均值方差胰腺癌症识别法。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (8)

1.一种胰腺癌血液中糖的分子量统计识别方法,其特征在于,包括以下步骤:
接收胰腺癌病人血液中糖的分子量数据集、健康人血液中糖的分子量数据集、待检查人血液中糖的分子量数据集;
基于胰腺癌病人血液中糖的分子量数据集通过预设的均方差计算方法计算得到胰腺癌病人血液中糖的分子量的均方差Dy(p,b);基于健康人血液中糖的分子量数据集通过预设的均方差计算方法计算得到健康人血液中糖的分子量的均方差Dy(p,a);
将待检查人血液中糖的分子量数据集的数据代入胰腺癌病人血液中糖的分子量数据集中得到第一待检查人血液中糖的分子量数据集,基于第一待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第一待检查人血液中糖的分子量的均方差Dy(p,b');将待检查人血液中糖的分子量数据集的数据代入健康人血液中糖的分子量数据集中得到第二待检查人血液中糖的分子量数据集,基于第二待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第二待检查人血液中糖的分子量的均方差Dy(p,a');
计算胰腺癌病人血液中糖的分子量的均方差Dy(p,b)与胰腺癌病人和第一待检查人血液中糖的分子量的均方差Dy(p,b')的差值的绝对值|Dy(p,b)-Dy(p,b')|为第一绝对值;计算健康人血液中糖的分子量的均方差Dy(p,a)与健康人和第二待检查人血液中糖的分子量的均方差Dy(p,a')的差值的绝对值|Dy(p,a)-Dy(p,a')|为第二绝对值;
通过比较所述第一绝对值的和与所述第二绝对值的和的大小判断所述待检查人是否患胰腺癌。
2.根据权利要求1所述的胰腺癌血液中糖的分子量统计识别方法,其特征在于,还包括展示所述第一待检查人血液中糖的分子量的均方差Dy(p,b')、第二待检查人血液中糖的分子量的均方差Dy(p,a')、胰腺癌病人血液中糖的分子量的均方差Dy(p,b)和健康人血液中糖的分子量的均方差Dy(p,a)的折线图。
3.根据权利要求1所述的胰腺癌血液中糖的分子量统计识别方法,其特征在于,所述预设的均方差计算方法包括以下步骤:
已知分子量数据集为:
U={ujk,j=1,2,..,J;k=1,2,..K};
计算所述分子量数据集的和:
Figure FDA0002367867530000021
计算每个分子量所占分子量数据集的和的百分比:
Figure FDA0002367867530000022
计算每个分子量所占分子量数据集的和的百分比的平均数:
Figure FDA0002367867530000023
记x(j,k)=xjk为第k个人处于第j个分子量测量数据,作变换:
Figure FDA0002367867530000024
再求y(j,k)的均值:
Figure FDA0002367867530000025
继续求前p个数据的{z(1),z(2),...,z(p)}的均方差,记为:Dy(p),p=2,3,..,J通过均方差公式得到均方差:
Figure FDA0002367867530000026
4.一种胰腺癌血液中糖的分子量统计识别系统,其特征在于,包括:接收模块、第一均方差计算模块、第二均方差计算模块、绝对值计算模块和绝对值比较模块;
所述接收模块用于接收胰腺癌病人血液中糖的分子量数据集、健康人血液中糖的分子量数据集、待检查人血液中糖的分子量数据集;
所述第一均方差计算模块用于基于胰腺癌病人血液中糖的分子量数据集通过预设的均方差计算方法计算得到胰腺癌病人血液中糖的分子量的均方差Dy(p,b);基于健康人血液中糖的分子量数据集通过预设的均方差计算方法计算得到健康人血液中糖的分子量的均方差Dy(p,a);
所述第二均方差计算模块用于将待检查人血液中糖的分子量数据集的数据代入胰腺癌病人血液中糖的分子量数据集中得到第一待检查人血液中糖的分子量数据集,基于第一待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第一待检查人血液中糖的分子量的均方差Dy(p,b');将待检查人血液中糖的分子量数据集的数据代入健康人血液中糖的分子量数据集中得到第二待检查人血液中糖的分子量数据集,基于第二待检查人血液中糖的分子量数据集通过预设的均方差计算方法计算得到第二待检查人血液中糖的分子量的均方差Dy(p,a');
所述绝对值计算模块用于计算胰腺癌病人血液中糖的分子量的均方差Dy(p,b)与胰腺癌病人和第一待检查人血液中糖的分子量的均方差Dy(p,b')的差值的绝对值|Dy(p,b)-Dy(p,b')|为第一绝对值;计算健康人血液中糖的分子量的均方差Dy(p,a)与健康人和第二待检查人血液中糖的分子量的均方差Dy(p,a')的差值的绝对值|Dy(p,a)-Dy(p,a')|为第二绝对值;
所述绝对值比较模块用于通过比较所述第一绝对值的和与所述第二绝对值的和的大小判断所述待检查人是否患胰腺癌。
5.根据权利要求4所述的胰腺癌血液中糖的分子量统计识别系统,其特征在于,还包括展示所述第一待检查人血液中糖的分子量的均方差Dy(p,b')、第二待检查人血液中糖的分子量的均方差Dy(p,a')、胰腺癌病人血液中糖的分子量的均方差Dy(p,b)和健康人血液中糖的分子量的均方差Dy(p,a)的折线图。
6.根据权利要求4所述的胰腺癌血液中糖的分子量统计识别系统,其特征在于,所述预设的均方差计算方法包括以下步骤:
已知分子量数据集为:
U={ujk,j=1,2,..,J;k=1,2,..K};
计算所述分子量数据集的和:
Figure FDA0002367867530000031
计算每个分子量所占分子量数据集的和的百分比:
Figure FDA0002367867530000032
计算每个分子量所占分子量数据集的和的百分比的平均数:
Figure FDA0002367867530000033
记x(j,k)=xjk为第k个人处于第j个分子量测量数据,作变换:
Figure FDA0002367867530000041
再求y(j,k)的均值:
Figure FDA0002367867530000042
继续求前p个数据的{z(1),z(2),...,z(p)}的均方差,记为:Dy(p),p=2,3,..,J通过均方差公式得到均方差:
Figure FDA0002367867530000043
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行,以实现权利要求1至3中任一项所述胰腺癌血液中糖的分子量统计识别方法。
8.一种胰腺癌血液中糖的分子量统计识别装置,其特征在于,包括:处理器和存储器;
所述存储器用于存储计算机程序;
所述处理器与所述存储器相连,用于执行所述存储器存储的计算机程序,以使所述胰腺癌血液中糖的分子量统计识别装置执行权利要求1至3中任一项所述的胰腺癌血液中糖的分子量统计识别方法。
CN202010041304.8A 2020-01-15 2020-01-15 胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置 Active CN111276191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010041304.8A CN111276191B (zh) 2020-01-15 2020-01-15 胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010041304.8A CN111276191B (zh) 2020-01-15 2020-01-15 胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置

Publications (2)

Publication Number Publication Date
CN111276191A true CN111276191A (zh) 2020-06-12
CN111276191B CN111276191B (zh) 2020-12-18

Family

ID=71000259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010041304.8A Active CN111276191B (zh) 2020-01-15 2020-01-15 胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置

Country Status (1)

Country Link
CN (1) CN111276191B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103380428A (zh) * 2010-12-16 2013-10-30 皇家飞利浦电子股份有限公司 用于使用基于病例的推理的治疗计划的临床决策支持的系统和方法
CN105487526A (zh) * 2016-01-04 2016-04-13 华南理工大学 一种Fast RVM污水处理故障诊断方法
CN106202968A (zh) * 2016-07-28 2016-12-07 北京博源兴康科技有限公司 癌症的数据分析方法及装置
US20170249739A1 (en) * 2016-02-26 2017-08-31 Biomediq A/S Computer analysis of mammograms
CN107246944A (zh) * 2017-04-07 2017-10-13 重庆大学 一种基于统计矩理论的结构损伤识别方法
CN108062570A (zh) * 2017-12-25 2018-05-22 重庆大学 一种用于肺癌筛查的模式识别系统
CN109658411A (zh) * 2019-01-21 2019-04-19 杭州英库医疗科技有限公司 一种基于ct影像学特征与非小细胞肺癌患者预后情况的相关性分析方法
CN109829488A (zh) * 2019-01-17 2019-05-31 桂林电子科技大学 一种头颈部癌症局部复发预测装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103380428A (zh) * 2010-12-16 2013-10-30 皇家飞利浦电子股份有限公司 用于使用基于病例的推理的治疗计划的临床决策支持的系统和方法
CN105487526A (zh) * 2016-01-04 2016-04-13 华南理工大学 一种Fast RVM污水处理故障诊断方法
US20170249739A1 (en) * 2016-02-26 2017-08-31 Biomediq A/S Computer analysis of mammograms
CN106202968A (zh) * 2016-07-28 2016-12-07 北京博源兴康科技有限公司 癌症的数据分析方法及装置
CN107246944A (zh) * 2017-04-07 2017-10-13 重庆大学 一种基于统计矩理论的结构损伤识别方法
CN108062570A (zh) * 2017-12-25 2018-05-22 重庆大学 一种用于肺癌筛查的模式识别系统
CN109829488A (zh) * 2019-01-17 2019-05-31 桂林电子科技大学 一种头颈部癌症局部复发预测装置
CN109658411A (zh) * 2019-01-21 2019-04-19 杭州英库医疗科技有限公司 一种基于ct影像学特征与非小细胞肺癌患者预后情况的相关性分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DERYA ARSLAN;MERVE ERKINAY ÖZDEMIR;MUSTAFA TURAN ARSLAN: "Diagnosis of pancreatic cancer by pattern recognition methods using gene expression profiles", 《2017 INTERNATIONAL ARTIFICIAL INTELLIGENCE AND DATA PROCESSING SYMPOSIUM (IDAP)》 *
王玉彬等: "miRNAs联合CA19-9对胰腺癌的诊断效能", 《军医进修学院学报》 *

Also Published As

Publication number Publication date
CN111276191B (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
CN104216349B (zh) 利用制造设备的传感器数据的成品率分析系统及方法
RU2018119771A (ru) Сопоставление больниц из обезличенных баз данных здравоохранения без очевидных квазиидентификаторов
US20140067813A1 (en) Parallelization of synthetic events with genetic surprisal data representing a genetic sequence of an organism
JP2009036758A (ja) 画像におけるオブジェクトの整列のためのシステムおよび方法
CN107423578A (zh) 检测体细胞突变的装置
Baid et al. Comparative study of k-means, gaussian mixture model, fuzzy c-means algorithms for brain tumor segmentation
Monsalve et al. Macromorphoscopic trait expression in a cranial sample from Medellín, Colombia
US20180210925A1 (en) Reliability measurement in data analysis of altered data sets
CN117542536B (zh) 一种基于体检数据的智能护理方法及系统
US20230273973A1 (en) Method and device for homogenization conversion of same index detected by different equipment, and electronic equipment
CN111415758A (zh) 基于adr监测报告和离群点检测技术的药物风险评估方法
Li et al. Quantified choice of root-mean-square errors of approximation for evaluation and power analysis of small differences between structural equation models.
EP3788640A1 (en) Method and apparatus for subtyping subjects based on phenotypic information
WO2018097765A1 (ru) Способ диагностики неинфекционных заболеваний на основе статистических методов обработки данных
CN111276191B (zh) 胰腺癌血液中糖的分子量统计识别方法、系统、介质及装置
CN113823414A (zh) 主诊断与主手术匹配检测方法、装置、计算设备和存储介质
WO2021058942A1 (en) Molecular phenotype classification
US20190189248A1 (en) Methods, systems and apparatus for subpopulation detection from biological data based on an inconsistency measure
Liu et al. Joint analysis of multi‐level repeated measures data and survival: an application to the end stage renal disease (ESRD) data
CN111986819A (zh) 药物不良反应监测方法、装置、电子设备及可读存储介质
CN113327655B (zh) 多维度数据的离群值检测方法、装置、设备和介质
Keogh et al. Effects of classical exposure measurement error on the shape of exposure-disease associations
CN113782121B (zh) 随机分组方法、装置、计算机设备及存储介质
Del Coco et al. Characterization of a collection of colored lentil genetic resources using a novel computer vision approach
Faris et al. An intelligence model for detection of PCOS based on K‐means coupled with LS‐SVM

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant