CN107358014A - 一种生理数据的临床前处理方法及系统 - Google Patents

一种生理数据的临床前处理方法及系统 Download PDF

Info

Publication number
CN107358014A
CN107358014A CN201610952462.2A CN201610952462A CN107358014A CN 107358014 A CN107358014 A CN 107358014A CN 201610952462 A CN201610952462 A CN 201610952462A CN 107358014 A CN107358014 A CN 107358014A
Authority
CN
China
Prior art keywords
data
disease
sorting technique
disease association
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610952462.2A
Other languages
English (en)
Other versions
CN107358014B (zh
Inventor
朱佳
赵淦森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong SUCHUANG Data Technology Co.,Ltd.
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN201610952462.2A priority Critical patent/CN107358014B/zh
Publication of CN107358014A publication Critical patent/CN107358014A/zh
Application granted granted Critical
Publication of CN107358014B publication Critical patent/CN107358014B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明公开了一种生理数据的临床前处理方法及系统,方法包括:对基于时间序列的生理数据进行预处理;根据计算的突变得分采用多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络;在疾病关联网络中采用改进的聚类算法选取疾病关联网络特征,并根据疾病关联网络特征和历史数据得出疾病的诊断结果,所述改进的聚类算法基于非负矩阵分解理论和自我学习机制,并通过调整子图的密度从疾病关联网络的大图数据中提取相应的连接子图作为疾病关联网络特征。本发明具有适用性广、灵活、方便、效率高和精度高的优点,可广泛应用于数据处理领域。

Description

一种生理数据的临床前处理方法及系统
技术领域
本发明涉及数据处理领域,尤其是一种生理数据的临床前处理方法及系统。
背景技术
人体生理数据的常规处理领域,通常采用基于能量代谢守恒法来检测处理人体相关生理参数并建立相关数学模型,从而间接地测量人体的某项指标。目前的代谢热整合法数据模型比较成熟,但该模型只能针对某一项参数或者某一类参数进行处理,而不能统筹处理多种数据,该局限性注定其不适合用来进行多用途监测,特别是不适用于海量数据的监测,因其数据处理成本较高。
许多复杂的疾病(如II型糖尿病的形成原因)尚未被鉴定出来,但是许多医学研究人员认为复杂疾病是由遗传,环境和生活方式等几个因素的组合引起的。由于复杂疾病不具备明显的临床症状,所以越早发现这些复杂疾病可以起到预防病情加重和提早治疗的作用。现代医疗数据库中复杂疾病数据量越来越多,大大增加了数据的可用性,如患者的血糖历史数据;传统的人工分析手段已经略显不足,因此应用数据挖掘技术来发现病情的趋势,可以尽早地发现潜在疾病并推荐有效的诊断决定。
目前数据挖掘已被广泛地应用到医学上。关联规则分析,作为数据挖掘的方法之一,已被应用到包括生物医学在内的很多领域。然而由于其以真实世界的遗传学和生理数据变化测量作为定量属性,目前基于关联规则分析的解决方案是不够的,因为它们不能解释累积效应,只能获取一个变更集内的变化关系。因此,我们需要一个变化检测模型用于捕捉多个变更集分布在每一个时间间隔的变化关系。
有人提出了一个图形理论框架,可以从一个有已知紊乱基因和疾病的关联网络中探索所有已知表型和疾病基因关系。然而,由于当前临床医生和医学研究人员是基于二分图来分享共性病因或病理的,这种框架不能用来处理像图像、文字、视频和数据流等复杂的输入数据,适用性不广。
也有人针对复杂的生理和遗传数据提出了一种关联规则分析框架。虽然他们的工作可以处理复杂的输入数据,并检测复杂数据的变化,但他们在各关联规则所设立的阈值仍然是基于专家的知识,所以其并不能有效地根据具体需要进行优化,不够灵活和方便。
还有人提出了利用支持向量机(SVM)的检测方法,从病人的医疗记录历史数据获取信息。该方法提供了一个为医生和其他人早期发现II型糖尿病患者决策支持的方案。实验结果表明支持向量机有比其他分类算法更好的精度。然而,该方法是基于纯粹的医疗记录的,并不适用于新诊断患者和医疗的突变情况。
另外,目前大多数数据挖掘算法仅针对生理参数进行处理,并使用预定义的阈值来产生关联规则,效率不高。
而在对生理信号处理过程中,现有的机器学习算法无法完全有效解决基因名称的消歧问题(原因在于每种方法都有各自局限性,一种方法对一个数据集有效但不一定对另一个数据集有效),导致现有的算法在学习的过程中无法有效控制该算法的本地行为,精度不高。
发明内容
为解决上述技术问题,本发明的目的在于:提供一种适用性广、灵活、方便、效率高和精度高的,生理数据的临床前处理方法。
本发明的另一目的在于:提供一种适用性广、灵活、方便、效率高和精度高的,生理数据的临床前处理系统。
本发明所采取的技术方案是:
一种生理数据的临床前处理方法,包括以下步骤:
对基于时间序列的生理数据进行预处理,所述预处理包括标准化处理以及计算标准化处理后的生理数据中每项数据的突变得分和所有数据的总突变得分,所述生理数据包括文本数据以及图像数据,其中,文本数据包括但不限于血糖、2小时血清胰岛素、血压、年龄、性别,图像数据包括但不限于视网膜图像;
根据计算的突变得分采用多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络;
在疾病关联网络中采用改进的聚类算法选取疾病关联网络特征,并根据疾病关联网络特征和历史数据得出疾病的诊断结果,所述改进的聚类算法基于非负矩阵分解理论和自我学习机制,并通过调整子图的密度从疾病关联网络的大图数据中提取相应的连接子图作为疾病关联网络特征。
进一步,所述对基于时间序列的生理数据进行预处理这一步骤,其包括:
对基于时间序列的生理数据进行标准化处理;
根据标准化处理后的生理数据的类型计算每项数据的突变得分和所有数据的总突变得分:若标准化处理后的生理数据为文本数据,则采用欧氏距离计算每项数据的突变得分和所有数据的总突变得分;若标准化处理后的生理数据为图像数据,则采用DBSCAN算法来抽取图像中心线的部分并对每两个图像中的每一个像素计算相似度,然后根据计算的相似度计算每项数据的突变得分和所有数据的总突变得分。
进一步,所述预处理还包括对图像数据进行非线性降维的步骤,所述对图像数据进行非线性降维这一步骤,其包括:
在通过DBSCAN算法将图像数据转换为高维空间中的数据集合后,对转换后的数据进行非线性降维,得到降维后的数据;
从降维后的数据中找出图像数据在高维数据流本征结构中的一维表示向量,并以找出的一维表示向量作为图像数据的特征表达向量。
进一步,所述根据计算的突变得分采用多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络这一步骤,其包括:
根据计算的突变得分构建多维突变检测模型;
将基于时间序列的生理数据作为源数据输入到多维突变检测模型中;
在多维突变检测模型中采用融合多分类器的集成学习算法进行关联规则分析;
根据关联规则分析的结果得到疾病关联网络。
进一步,所述在多维突变检测模型中采用融合多分类器的集成学习算法进行关联规则分析这一步骤,其包括:
采用不同的分类器对样本进行分类学习和判断;
根据分类器的全局准确率从所有分类方法中选择效果最佳的前N个分类方法组成集成学习算法,其中,N为集成学习算法包含的分类方法总数;
根据集成学习算法中每种分类方法对样本的判断结果采用动态投票制计算每种分类方法的票数或权重,所述动态投票制在每次投票时综合根据本地正确率、多样化正确率和局部泛化误差来计算每种分类方法的票数与权重,其中,本地正确率是指每次判断的结果,多样化正确率是指分类器之间的判断差异;
根据每种分类方法的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果。
进一步,所述根据每种分类方法的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果这一步骤,其包括:
采用基于决策模板的算法对每种分类方法的票数或权重进行处理,得到每种分类方法决策模板处理后的票数或权重,所述基于决策模板的算法根据每种分类方法的票数或权重、可能的结果以及信心度建立一个决策矩阵并设置了一系列的规则来对该决策矩阵进行运算,其中,每种分类方法的信心度的指数与该分类方法以往的判断结果有关;
根据每种分类方法决策模板处理后的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果。
进一步,所述在疾病关联网络中采用改进的聚类算法选取疾病关联网络特征,并根据疾病关联网络特征和历史数据得出疾病的诊断结果这一步骤,其包括:
在疾病关联网络中采用自我学习机制确定非负矩阵分解理论最佳的划分类数,其中,自我学习机制先给予一个理论上最高的数字进行聚类,然后在聚类后通过分析各类所含有的核心点及其连接的附加点来不断调整类数的上下边界,最终得出非负矩阵分解理论最佳的划分类数;
根据确定的划分类数采用非负矩阵分解理论从疾病关联网络中选出疾病关联网络特征,所述非负矩阵分解理论优先选取关键子图作为疾病关联网络特征;
根据疾病关联网络特征和历史数据进行相似学习,得出疾病的诊断结果。
本发明所采取的另一技术方案是:
一种生理数据的临床前处理系统,包括:
预处理模块,用于对基于时间序列的生理数据进行预处理,所述预处理包括标准化处理以及计算标准化处理后的生理数据中每项数据的突变得分和所有数据的总突变得分,所述生理数据包括文本数据以及图像数据,其中,文本数据包括但不限于血糖、2小时血清胰岛素、血压、年龄、性别,图像数据包括但不限于视网膜图像;
关联网络构建模块,用于根据计算的突变得分采用多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络;
疾病诊断模块,用于在疾病关联网络中采用改进的聚类算法选取疾病关联网络特征,并根据疾病关联网络特征和历史数据得出疾病的诊断结果,所述改进的聚类算法基于非负矩阵分解理论和自我学习机制,并通过调整子图的密度从疾病关联网络的大图数据中提取相应的连接子图作为疾病关联网络特征。
进一步,所述关联网络构建模块包括:
多维突变检测模型构建单元,用于根据计算的突变得分构建多维突变检测模型;
输入单元,用于将基于时间序列的生理数据作为源数据输入到多维突变检测模型中;
关联规则分析单元,用于在多维突变检测模型中采用融合多分类器的集成学习算法进行关联规则分析;
疾病关联网络生成单元,用于根据关联规则分析的结果得到疾病关联网络。
进一步,所述关联规则分析单元包括:
分类判断子单元,用于采用不同的分类器对样本进行分类学习和判断;
分类方法选取单元,用于根据分类器的全局准确率从所有分类方法中选择效果最佳的前N个分类方法组成集成学习算法,其中,N为集成学习算法包含的分类方法总数;
计算子单元,用于根据集成学习算法中每种分类方法对样本的判断结果采用动态投票制计算每种分类方法的票数或权重,所述动态投票制在每次投票时综合根据本地正确率、多样化正确率和局部泛化误差来计算每种分类方法的票数与权重,其中,本地正确率是指每次判断的结果,多样化正确率是指分类器之间的判断差异;
融合子单元,用于根据每种分类方法的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果。
本发明的方法的有益效果是:先对生理数据进行预处理,然后进行关联规则分析,得出疾病关联网络,最后选取疾病关联网络特征并得出疾病的诊断结果,预处理的生理数据包括文本数据以及图像数据,能处理图像、文字、视频和数据流等复杂的输入数据,适用性更广;采用了多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络,采用了多维突变检测模型,能统筹处理多种数据并适用于新诊断患者和医疗的突变情况,进一步提升了算法的适用性;融合了多分类器的集成学习算法来进行关联规则分析,降低了对关联规则阈值设置的依赖程度,能有效地根据具体需要优化关联规则,更加灵活和方便,并解决了预定义阈值法产生关联规则效率不高的问题;采用了改进的聚类算法来选取疾病关联网络特征,通过非负矩阵分解理论和自我学习机制提取具有代表性的连接子图作为疾病关联网络特征,有效解决了基因名称的消歧问题,精度更高。
本发明的系统的有益效果是:包括预处理模块、关联网络构建模块和疾病诊断模块,预处理模块预处理的生理数据包括文本数据以及图像数据,能处理图像、文字、视频和数据流等复杂的输入数据,适用性更广;在关联网络构建模块中采用了多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络,采用了多维突变检测模型,能统筹处理多种数据并适用于新诊断患者和医疗的突变情况,进一步提升了算法的适用性;在关联网络构建模块中融合了多分类器的集成学习算法来进行关联规则分析,降低了对关联规则阈值设置的依赖程度,能有效地根据具体需要优化关联规则,更加灵活和方便,并解决了预定义阈值法产生关联规则效率不高的问题;在疾病诊断模块中采用了改进的聚类算法来选取疾病关联网络特征,通过非负矩阵分解理论和自我学习机制提取具有代表性的连接子图作为疾病关联网络特征,有效解决了基因名称的消歧问题,精度更高。
附图说明
图1为本发明一种生理数据的临床前处理方法的整体流程图;
图2是本发明应用于临床前的人体生理数据检测处理流程图;
图3是对应于图2流程的数据处理框架。
具体实施方式
参照图1,一种生理数据的临床前处理方法,包括以下步骤:
对基于时间序列的生理数据进行预处理,所述预处理包括标准化处理以及计算标准化处理后的生理数据中每项数据的突变得分和所有数据的总突变得分,所述生理数据包括文本数据以及图像数据,其中,文本数据包括但不限于血糖、2小时血清胰岛素、血压、年龄、性别,图像数据包括但不限于视网膜图像;
根据计算的突变得分采用多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络;
在疾病关联网络中采用改进的聚类算法选取疾病关联网络特征,并根据疾病关联网络特征和历史数据得出疾病的诊断结果,所述改进的聚类算法基于非负矩阵分解理论和自我学习机制,并通过调整子图的密度从疾病关联网络的大图数据中提取相应的连接子图作为疾病关联网络特征。
其中,大图数据是指构建的疾病关联网络中的海量生理数据。
进一步作为优选的实施方式,所述对基于时间序列的生理数据进行预处理这一步骤,其包括:
对基于时间序列的生理数据进行标准化处理;
根据标准化处理后的生理数据的类型计算每项数据的突变得分和所有数据的总突变得分:若标准化处理后的生理数据为文本数据,则采用欧氏距离计算每项数据的突变得分和所有数据的总突变得分;若标准化处理后的生理数据为图像数据,则采用DBSCAN算法来抽取图像中心线的部分并对每两个图像中的每一个像素计算相似度,然后根据计算的相似度计算每项数据的突变得分和所有数据的总突变得分。
进一步作为优选的实施方式,所述预处理还包括对图像数据进行非线性降维的步骤,所述对图像数据进行非线性降维这一步骤,其包括:
在通过DBSCAN算法将图像数据转换为高维空间中的数据集合后,对转换后的数据进行非线性降维,得到降维后的数据;
从降维后的数据中找出图像数据在高维数据流本征结构中的一维表示向量,并以找出的一维表示向量作为图像数据的特征表达向量。
进一步作为优选的实施方式,所述根据计算的突变得分采用多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络这一步骤,其包括:
根据计算的突变得分构建多维突变检测模型;
将基于时间序列的生理数据作为源数据输入到多维突变检测模型中;
在多维突变检测模型中采用融合多分类器的集成学习算法进行关联规则分析;
根据关联规则分析的结果得到疾病关联网络。
进一步作为优选的实施方式,所述在多维突变检测模型中采用融合多分类器的集成学习算法进行关联规则分析这一步骤,其包括:
采用不同的分类器对样本进行分类学习和判断;
根据分类器的全局准确率从所有分类方法中选择效果最佳的前N个分类方法组成集成学习算法,其中,N为集成学习算法包含的分类方法总数;
根据集成学习算法中每种分类方法对样本的判断结果采用动态投票制计算每种分类方法的票数或权重,所述动态投票制在每次投票时综合根据本地正确率、多样化正确率和局部泛化误差来计算每种分类方法的票数与权重,其中,本地正确率是指每次判断的结果,多样化正确率是指分类器之间的判断差异;
根据每种分类方法的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果。
其中,N可以根据实际的需要预先设定。
进一步作为优选的实施方式,所述根据每种分类方法的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果这一步骤,其包括:
采用基于决策模板的算法对每种分类方法的票数或权重进行处理,得到每种分类方法决策模板处理后的票数或权重,所述基于决策模板的算法根据每种分类方法的票数或权重、可能的结果以及信心度建立一个决策矩阵并设置了一系列的规则来对该决策矩阵进行运算,其中,每种分类方法的信心度的指数与该分类方法以往的判断结果有关;
根据每种分类方法决策模板处理后的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果。
进一步作为优选的实施方式,所述在疾病关联网络中采用改进的聚类算法选取疾病关联网络特征,并根据疾病关联网络特征和历史数据得出疾病的诊断结果这一步骤,其包括:
在疾病关联网络中采用自我学习机制确定非负矩阵分解理论最佳的划分类数,其中,自我学习机制先给予一个理论上最高的数字进行聚类,然后在聚类后通过分析各类所含有的核心点及其连接的附加点来不断调整类数的上下边界,最终得出非负矩阵分解理论最佳的划分类数;
根据确定的划分类数采用非负矩阵分解理论从疾病关联网络中选出疾病关联网络特征,所述非负矩阵分解理论优先选取关键子图作为疾病关联网络特征;
根据疾病关联网络特征和历史数据进行相似学习,得出疾病的诊断结果。
其中,最高的数字,是指待聚类数据集中包含的记录总个数。待聚类数据集中有多少个记录,最高数字就是多少。
参照图1,一种生理数据的临床前处理系统,包括:
预处理模块,用于对基于时间序列的生理数据进行预处理,所述预处理包括标准化处理以及计算标准化处理后的生理数据中每项数据的突变得分和所有数据的总突变得分,所述生理数据包括文本数据以及图像数据,其中,文本数据包括但不限于血糖、2小时血清胰岛素、血压、年龄、性别,图像数据包括但不限于视网膜图像;
关联网络构建模块,用于根据计算的突变得分采用多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络;
疾病诊断模块,用于在疾病关联网络中采用改进的聚类算法选取疾病关联网络特征,并根据疾病关联网络特征和历史数据得出疾病的诊断结果,所述改进的聚类算法基于非负矩阵分解理论和自我学习机制,并通过调整子图的密度从疾病关联网络的大图数据中提取相应的连接子图作为疾病关联网络特征。
进一步作为优选的实施方式,所述关联网络构建模块包括:
多维突变检测模型构建单元,用于根据计算的突变得分构建多维突变检测模型;
输入单元,用于将基于时间序列的生理数据作为源数据输入到多维突变检测模型中;
关联规则分析单元,用于在多维突变检测模型中采用融合多分类器的集成学习算法进行关联规则分析;
疾病关联网络生成单元,用于根据关联规则分析的结果得到疾病关联网络。
进一步作为优选的实施方式,所述关联规则分析单元包括:
分类判断子单元,用于采用不同的分类器对样本进行分类学习和判断;
分类方法选取单元,用于根据分类器的全局准确率从所有分类方法中选择效果最佳的前N个分类方法组成集成学习算法,其中,N为集成学习算法包含的分类方法总数;
计算子单元,用于根据集成学习算法中每种分类方法对样本的判断结果采用动态投票制计算每种分类方法的票数或权重,所述动态投票制在每次投票时综合根据本地正确率、多样化正确率和局部泛化误差来计算每种分类方法的票数与权重,其中,本地正确率是指每次判断的结果,多样化正确率是指分类器之间的判断差异;
融合子单元,用于根据每种分类方法的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果。
下面结合说明书附图和具体实施例对本发明作进一步解释和说明。
实施例一
针对现有技术适用性不广、不够灵活、不够方便、效率低和精度低的问题,本发明提出了一种生理数据的临床前处理方法。
如图3所示,本发明构建了一个海量生理数据的处理框架,利用数据挖掘技术对复杂的疾病(如糖尿病等)进行临床前的监测。
本发明的一个具体应用是采用本发明优化的聚类分析方法寻找可能的蛋白质复合物,这是在现代生物学中数据挖掘最重要的挑战之一。由于数据是大量的二进制蛋白质相互作用数据,本发明提出了一种新的聚类算法,通过调整子图的密度从复杂的大图数据中检测出密集的连接子图(因为如果一个集群有更多的点,则其子图的密度就较小)。
本发明的数据处理是基于多维变化的检测模型(即多维突变检测模型)的:首先,收集基于时间序列的生理数据,然后使用这些数据作为原始输入源输入到多维变化的检测模型,每种类型的数据都将是一个维度,图2中,A、B、C、D和E分别代表一个维度。该检测模型的核心部分是结合数据挖掘技术,如支持向量机和神经网络等,使用对应的算法以产生一个有意义的关联规则列表。再接着,通过进一步分析关联规则列表的这些关联规则,就可以构造一个疾病关联网络。最后,根据疾病关联网络选取相应的特征后,就可以从历史数据中学习相似的模式,并结合患者的历史模式和来自其他患者类似的模式,用一个更精确和可重复的方式为患者疾病的进一步发展趋势进行预测,以为医生做诊断决定提供理论的支持。
如图2和3所示,本发明应用于临床前的人体生理数据检测处理流程如下:
(一)进行生理数据的预处理。
生理数据包括血糖、2小时血清胰岛素、血压、年龄、性别以及视网膜图像,其中,前五种生理数据属于文本数据,而视网膜图像则是图像类型数据,从数据类型可见数据的不同,其所代表的含义也不统一。本发明基于现有的算法对数据进行预处理,使数据统一化,然后根据具体的数据类型计算每项数据的突变得分和所有数据的总突变得分:对于文本数据,使用流行的欧氏距离来测量突变得分;对于视网膜图像数据,则采用DBSCAN技术来抽取图像中心线的部分并对每两个图像的每一个像素计算相似度,这样就可以知道视网膜图像的变化,并计算突变得分。
不同类型的海量数据变化被输入到检测模型中,因此如何正确地减少所考虑的随机变量的数量以避免维度灾难则是至关重要的,这个过程被称为降维。在将视网膜图像通过DBSCAN转换为高维空间中的数据集合后,对其进行非线性降维,寻求视网膜图像高维数据流本征结构的一维表示向量,并将该一维表示向量作为图像数据的特征表达向量,这样就大大降低了计算的复杂程度和减少了冗余信息所造成的识别误差,提高了识别精度。
(二)关联规则分析并构建疾病关联网络。
关联规则分析的目的是从海量数据中挖掘出有价值的数据项之间的相关关系。考虑到大多数现有数据挖掘技术的局限性,也即针对现有的生理信号处理方法使用预定义阈值来产生关联规则的效率并不高这一问题,本发明融合了多种现有算法,采用了融合多分类器的集成学习算法来进行关联规则分析。
本发明提出了一种着重考虑分类器本地行为的多分类器集成学习算法,该算法的具体过程如下:
(1)选择合适的分类方法。
该方法的具体过程为:在预处理阶段,用单一的分类器进行判断,选择获得最佳结果的前N个方法组成集成学习算法。在此阶段,最佳结果仅取决于分类器的全局准确率,即不考虑分类器某一阶段的准确率,只考虑最后阶段最高的准确率。
(2)权重计算。
在选择好一组基于全局准确率的最佳方法组成集成学习算法后,就可以在样本被分类后根据每种方法的判断结果来计算应该给予该方法的权重。
在计算权重时,本发明采用了动态分配权重的机制来为每个方法给予不同的权重以达到合理平衡的结果。
本发明优先选用投票制来计算权重。投票制是指,每种方法都占有一定的票数从而保证最终结果的均衡性,但票数的计算过程是动态的(即每次投票时每种方法所需的票数都会根据上次的判断结果进行增加或减少)。本发明除了考虑本地正确率(即每次判断的结果)和多样化正确率(即分类器之间的判断差异)之外,还把局部泛化误差也考虑为票数,这样该算法就不仅考虑了每种分类方法训练时产生的错误,还考虑了每种分类方法的灵敏度。该集成学习算法主要在结果判断时运行而无需重复训练,因此该算法在处理海量生理数据时也不会给整个框架增加很大的负担。
在收集到每种分类方法的票数或权重后,需要对这些票数或权重进行下一步的处理,否则当完全两种不同结果的分立类方法具有两种相同票数或权重时,采用本发明的融合算法将无法产生最终的融合结果。基于以上考虑,本发明提出一种基于决策模板的算法,将各个方法的票数或权重以及可能的结果用来建立一个决策矩阵并设置了一系列的规则来对该决策矩阵进行运算。此外为了提高算法的精度,该算法还考虑了各种分类方法的信心度,而信心度的指数会随着各种分类方法以往的判断结果优劣而变化。
(3)根据每种分类方法的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果,并结合最后的关联分析结果得到疾病关联网络。
(三)选择关联网络特征并进行疾病诊断。
该过程可进一步细分为如下过程:
(1)选择关联网络特征。
在进行疾病诊断前需要构造特征向量以提供给分类器。本发明提出了一种提取代表性的链接及其所在子图作为特征的聚类算法,在保证所选择的特征运行速度高的同时,又不会降低消歧的精度。该聚类算法基于非负矩阵分解理论,可以有效检测出大图数据里的高度密合的子图。而基于非负矩阵分解理论的聚类算法,需要先定义划分的类数,类数划分的好坏直接影响后面聚类的质量。因此本发明的聚类算法还采用了一种自我学习的机制,先给予一个理论上最高的数字来进行聚类,然后在聚类后通过发现和分析各类所含有的核心点及其连接的附加点来不断调整类数的上下边界,最后得出最佳的类数。在完成聚类后,由于非负矩阵分解理论还可以支持软聚类,即一个元素可以同时属于多个类,因此本发明还可以进一步通过定义一系列的规则,如存在于最多类的核心点,核心点所处最高概率的类等,来优化选取关键子图作为特征来构造向量。
(2)进行疾病诊断。
选择好关联网络特征后,就可以结合历史数据来进行相似学习,为患者疾病的进一步发展趋势进行预测,并根据预测的结果为医生做诊断决定提供理论的支持。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.一种生理数据的临床前处理方法,其特征在于:包括以下步骤:
对基于时间序列的生理数据进行预处理,所述预处理包括标准化处理以及计算标准化处理后的生理数据中每项数据的突变得分和所有数据的总突变得分,所述生理数据包括文本数据以及图像数据,其中,文本数据包括但不限于血糖、2小时血清胰岛素、血压、年龄、性别,图像数据包括但不限于视网膜图像;
根据计算的突变得分采用多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络;
在疾病关联网络中采用改进的聚类算法选取疾病关联网络特征,并根据疾病关联网络特征和历史数据得出疾病的诊断结果,所述改进的聚类算法基于非负矩阵分解理论和自我学习机制,并通过调整子图的密度从疾病关联网络的大图数据中提取相应的连接子图作为疾病关联网络特征。
2.根据权利要求1所述的一种生理数据的临床前处理方法,其特征在于:所述对基于时间序列的生理数据进行预处理这一步骤,其包括:
对基于时间序列的生理数据进行标准化处理;
根据标准化处理后的生理数据的类型计算每项数据的突变得分和所有数据的总突变得分:若标准化处理后的生理数据为文本数据,则采用欧氏距离计算每项数据的突变得分和所有数据的总突变得分;若标准化处理后的生理数据为图像数据,则采用DBSCAN算法来抽取图像中心线的部分并对每两个图像中的每一个像素计算相似度,然后根据计算的相似度计算每项数据的突变得分和所有数据的总突变得分。
3.根据权利要求2所述的一种生理数据的临床前处理方法,其特征在于:所述预处理还包括对图像数据进行非线性降维的步骤,所述对图像数据进行非线性降维这一步骤,其包括:
在通过DBSCAN算法将图像数据转换为高维空间中的数据集合后,对转换后的数据进行非线性降维,得到降维后的数据;
从降维后的数据中找出图像数据在高维数据流本征结构中的一维表示向量,并以找出的一维表示向量作为图像数据的特征表达向量。
4.根据权利要求1所述的一种生理数据的临床前处理方法,其特征在于:所述根据计算的突变得分采用多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络这一步骤,其包括:
根据计算的突变得分构建多维突变检测模型;
将基于时间序列的生理数据作为源数据输入到多维突变检测模型中;
在多维突变检测模型中采用融合多分类器的集成学习算法进行关联规则分析;
根据关联规则分析的结果得到疾病关联网络。
5.根据权利要求4所述的一种生理数据的临床前处理方法,其特征在于:所述在多维突变检测模型中采用融合多分类器的集成学习算法进行关联规则分析这一步骤,其包括:
采用不同的分类器对样本进行分类学习和判断;
根据分类器的全局准确率从所有分类方法中选择效果最佳的前N个分类方法组成集成学习算法,其中,N为集成学习算法包含的分类方法总数;
根据集成学习算法中每种分类方法对样本的判断结果采用动态投票制计算每种分类方法的票数或权重,所述动态投票制在每次投票时综合根据本地正确率、多样化正确率和局部泛化误差来计算每种分类方法的票数与权重,其中,本地正确率是指每次判断的结果,多样化正确率是指分类器之间的判断差异;
根据每种分类方法的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果。
6.根据权利要求5所述的一种生理数据的临床前处理方法,其特征在于:所述根据每种分类方法的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果这一步骤,其包括:
采用基于决策模板的算法对每种分类方法的票数或权重进行处理,得到每种分类方法决策模板处理后的票数或权重,所述基于决策模板的算法根据每种分类方法的票数或权重、可能的结果以及信心度建立一个决策矩阵并设置了一系列的规则来对该决策矩阵进行运算,其中,每种分类方法的信心度的指数与该分类方法以往的判断结果有关;
根据每种分类方法决策模板处理后的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果。
7.根据权利要求1-6任一项所述的一种生理数据的临床前处理方法,其特征在于:所述在疾病关联网络中采用改进的聚类算法选取疾病关联网络特征,并根据疾病关联网络特征和历史数据得出疾病的诊断结果这一步骤,其包括:
在疾病关联网络中采用自我学习机制确定非负矩阵分解理论最佳的划分类数,其中,自我学习机制先给予一个理论上最高的数字进行聚类,然后在聚类后通过分析各类所含有的核心点及其连接的附加点来不断调整类数的上下边界,最终得出非负矩阵分解理论最佳的划分类数;
根据确定的划分类数采用非负矩阵分解理论从疾病关联网络中选出疾病关联网络特征,所述非负矩阵分解理论优先选取关键子图作为疾病关联网络特征;
根据疾病关联网络特征和历史数据进行相似学习,得出疾病的诊断结果。
8.一种生理数据的临床前处理系统,其特征在于:包括:
预处理模块,用于对基于时间序列的生理数据进行预处理,所述预处理包括标准化处理以及计算标准化处理后的生理数据中每项数据的突变得分和所有数据的总突变得分,所述生理数据包括文本数据以及图像数据,其中,文本数据包括但不限于血糖、2小时血清胰岛素、血压、年龄、性别,图像数据包括但不限于视网膜图像;
关联网络构建模块,用于根据计算的突变得分采用多维突变检测模型和融合多分类器的集成学习算法进行关联规则分析,并根据关联规则分析的结果得出疾病关联网络;
疾病诊断模块,用于在疾病关联网络中采用改进的聚类算法选取疾病关联网络特征,并根据疾病关联网络特征和历史数据得出疾病的诊断结果,所述改进的聚类算法基于非负矩阵分解理论和自我学习机制,并通过调整子图的密度从疾病关联网络的大图数据中提取相应的连接子图作为疾病关联网络特征。
9.根据权利要求8所述的一种生理数据的临床前处理系统,其特征在于:所述关联网络构建模块包括:
多维突变检测模型构建单元,用于根据计算的突变得分构建多维突变检测模型;
输入单元,用于将基于时间序列的生理数据作为源数据输入到多维突变检测模型中;
关联规则分析单元,用于在多维突变检测模型中采用融合多分类器的集成学习算法进行关联规则分析;
疾病关联网络生成单元,用于根据关联规则分析的结果得到疾病关联网络。
10.根据权利要求9所述的一种生理数据的临床前处理系统,其特征在于:所述关联规则分析单元包括:
分类判断子单元,用于采用不同的分类器对样本进行分类学习和判断;
分类方法选取单元,用于根据分类器的全局准确率从所有分类方法中选择效果最佳的前N个分类方法组成集成学习算法,其中,N为集成学习算法包含的分类方法总数;
计算子单元,用于根据集成学习算法中每种分类方法对样本的判断结果采用动态投票制计算每种分类方法的票数或权重,所述动态投票制在每次投票时综合根据本地正确率、多样化正确率和局部泛化误差来计算每种分类方法的票数与权重,其中,本地正确率是指每次判断的结果,多样化正确率是指分类器之间的判断差异;
融合子单元,用于根据每种分类方法的票数或权重采用oracle方式来融合各分类方法的结果,得出最后的关联分析结果。
CN201610952462.2A 2016-11-02 2016-11-02 一种生理数据的临床前处理方法及系统 Active CN107358014B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610952462.2A CN107358014B (zh) 2016-11-02 2016-11-02 一种生理数据的临床前处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610952462.2A CN107358014B (zh) 2016-11-02 2016-11-02 一种生理数据的临床前处理方法及系统

Publications (2)

Publication Number Publication Date
CN107358014A true CN107358014A (zh) 2017-11-17
CN107358014B CN107358014B (zh) 2021-01-26

Family

ID=60271560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610952462.2A Active CN107358014B (zh) 2016-11-02 2016-11-02 一种生理数据的临床前处理方法及系统

Country Status (1)

Country Link
CN (1) CN107358014B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108091396A (zh) * 2017-12-25 2018-05-29 中山大学 一种心脏病智能预测和心脏保健信息推荐系统及其方法
CN108597614A (zh) * 2018-04-12 2018-09-28 上海熙业信息科技有限公司 一种基于中文电子病历的辅助诊断决策方法
CN108960491A (zh) * 2018-06-15 2018-12-07 常州瑞信电子科技有限公司 基于rbf神经网络的光伏发电量预测方法
CN109448855A (zh) * 2018-09-17 2019-03-08 大连大学 一种基于cnn和模型融合的糖尿病血糖预测方法
CN109741804A (zh) * 2019-01-16 2019-05-10 四川大学华西医院 一种信息提取方法、装置、电子设备及存储介质
CN109907753A (zh) * 2019-04-23 2019-06-21 杭州电子科技大学 一种多维度ecg信号智能诊断系统
CN110033863A (zh) * 2019-04-23 2019-07-19 科大讯飞股份有限公司 应用于临床决策支持系统的不合理疾病诊断检测方法、装置
CN111798439A (zh) * 2020-07-11 2020-10-20 大连东软教育科技集团有限公司 线上线下融合的医疗影像质量判读方法、系统及存储介质
CN111859898A (zh) * 2019-04-16 2020-10-30 中森云链(成都)科技有限责任公司 一种基于隐藏关联网络的多领域文本隐式特征抽取方法及计算机存储介质
CN113611425A (zh) * 2021-07-20 2021-11-05 上海齐网网络科技有限公司 基于软件定义的智能化区域医疗集成数据库的方法及系统
CN113782216A (zh) * 2021-09-15 2021-12-10 平安科技(深圳)有限公司 一种失能权重确定方法及装置、电子设备、存储介质
CN114504298A (zh) * 2022-01-21 2022-05-17 南京航空航天大学 基于多源健康感知数据融合的生理特征判别方法及系统
WO2024032810A1 (zh) * 2022-08-12 2024-02-15 深圳迈瑞生物医疗电子股份有限公司 生命信息处理系统和生命信息处理方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295309A (zh) * 2008-05-22 2008-10-29 江苏大学 一种医学图像识别的方法
CN101305373A (zh) * 2005-11-08 2008-11-12 皇家飞利浦电子股份有限公司 使用聚类检测多参数患者监护和临床数据中的危险趋势的方法
US7734652B2 (en) * 2003-08-29 2010-06-08 Oracle International Corporation Non-negative matrix factorization from the data in the multi-dimensional data table using the specification and to store metadata representing the built relational database management system
KR20100072577A (ko) * 2008-12-22 2010-07-01 포항공과대학교 산학협력단 비음수 행렬의 직교 분해를 이용한 문서 집단화 방법, 이를수행하기 위한 컴퓨팅 장치 및 이를 수행하기 위한 프로그램 기록매체
CN103235900A (zh) * 2013-03-28 2013-08-07 中山大学 蛋白质复合体挖掘的加权组装聚类方法
US8615291B2 (en) * 2009-03-13 2013-12-24 National Institutes Of Health (Nih) Method, system and computer program method for detection of pathological fluctuations of physiological signals to diagnose human illness
CN104866727A (zh) * 2015-06-02 2015-08-26 陈宽 基于深度学习对医疗数据进行分析的方法及其智能分析仪
US20160098519A1 (en) * 2014-06-11 2016-04-07 Jorge S. Zwir Systems and methods for scalable unsupervised multisource analysis
CN105930663A (zh) * 2016-04-26 2016-09-07 北京科技大学 一种帕金森病早期诊断方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7734652B2 (en) * 2003-08-29 2010-06-08 Oracle International Corporation Non-negative matrix factorization from the data in the multi-dimensional data table using the specification and to store metadata representing the built relational database management system
CN101305373A (zh) * 2005-11-08 2008-11-12 皇家飞利浦电子股份有限公司 使用聚类检测多参数患者监护和临床数据中的危险趋势的方法
CN101295309A (zh) * 2008-05-22 2008-10-29 江苏大学 一种医学图像识别的方法
KR20100072577A (ko) * 2008-12-22 2010-07-01 포항공과대학교 산학협력단 비음수 행렬의 직교 분해를 이용한 문서 집단화 방법, 이를수행하기 위한 컴퓨팅 장치 및 이를 수행하기 위한 프로그램 기록매체
US8615291B2 (en) * 2009-03-13 2013-12-24 National Institutes Of Health (Nih) Method, system and computer program method for detection of pathological fluctuations of physiological signals to diagnose human illness
CN103235900A (zh) * 2013-03-28 2013-08-07 中山大学 蛋白质复合体挖掘的加权组装聚类方法
US20160098519A1 (en) * 2014-06-11 2016-04-07 Jorge S. Zwir Systems and methods for scalable unsupervised multisource analysis
CN104866727A (zh) * 2015-06-02 2015-08-26 陈宽 基于深度学习对医疗数据进行分析的方法及其智能分析仪
CN105930663A (zh) * 2016-04-26 2016-09-07 北京科技大学 一种帕金森病早期诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JIAZHU,QINGXIE,KAIZHENG: "An improved early detection method of type-2 diabetes mellitus using multiple classifier system", 《INFORMATION SCIENCES》 *
JINGHE ETC: "An Association Rule Analysis Framework for Complex Physiological and Genetic Data", 《HEALTH INFORMATION SCIENCE. HIS 2012. LECTURE NOTES IN COMPUTER SCIENCE》 *
马小科: "复杂网络社团结构模型与算法及其在生物网络中的应用", 《中国博士学位论文全文数据库》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108091396A (zh) * 2017-12-25 2018-05-29 中山大学 一种心脏病智能预测和心脏保健信息推荐系统及其方法
CN108597614A (zh) * 2018-04-12 2018-09-28 上海熙业信息科技有限公司 一种基于中文电子病历的辅助诊断决策方法
CN108960491A (zh) * 2018-06-15 2018-12-07 常州瑞信电子科技有限公司 基于rbf神经网络的光伏发电量预测方法
CN109448855A (zh) * 2018-09-17 2019-03-08 大连大学 一种基于cnn和模型融合的糖尿病血糖预测方法
CN109741804A (zh) * 2019-01-16 2019-05-10 四川大学华西医院 一种信息提取方法、装置、电子设备及存储介质
CN109741804B (zh) * 2019-01-16 2023-03-31 四川大学华西医院 一种信息提取方法、装置、电子设备及存储介质
CN111859898A (zh) * 2019-04-16 2020-10-30 中森云链(成都)科技有限责任公司 一种基于隐藏关联网络的多领域文本隐式特征抽取方法及计算机存储介质
CN111859898B (zh) * 2019-04-16 2024-01-16 中森云链(成都)科技有限责任公司 一种基于隐藏关联网络的多领域文本隐式特征抽取方法及计算机存储介质
CN110033863A (zh) * 2019-04-23 2019-07-19 科大讯飞股份有限公司 应用于临床决策支持系统的不合理疾病诊断检测方法、装置
CN110033863B (zh) * 2019-04-23 2021-06-04 科大讯飞股份有限公司 应用于临床决策支持系统的不合理疾病诊断检测方法、装置
CN109907753A (zh) * 2019-04-23 2019-06-21 杭州电子科技大学 一种多维度ecg信号智能诊断系统
CN111798439A (zh) * 2020-07-11 2020-10-20 大连东软教育科技集团有限公司 线上线下融合的医疗影像质量判读方法、系统及存储介质
CN113611425A (zh) * 2021-07-20 2021-11-05 上海齐网网络科技有限公司 基于软件定义的智能化区域医疗集成数据库的方法及系统
CN113611425B (zh) * 2021-07-20 2023-11-24 上海德衡数据科技有限公司 基于软件定义的智能化区域医疗集成数据库的方法及系统
CN113782216A (zh) * 2021-09-15 2021-12-10 平安科技(深圳)有限公司 一种失能权重确定方法及装置、电子设备、存储介质
CN113782216B (zh) * 2021-09-15 2023-10-24 平安科技(深圳)有限公司 一种失能权重确定方法及装置、电子设备、存储介质
CN114504298A (zh) * 2022-01-21 2022-05-17 南京航空航天大学 基于多源健康感知数据融合的生理特征判别方法及系统
CN114504298B (zh) * 2022-01-21 2024-02-13 南京航空航天大学 基于多源健康感知数据融合的生理特征判别方法及系统
WO2024032810A1 (zh) * 2022-08-12 2024-02-15 深圳迈瑞生物医疗电子股份有限公司 生命信息处理系统和生命信息处理方法

Also Published As

Publication number Publication date
CN107358014B (zh) 2021-01-26

Similar Documents

Publication Publication Date Title
CN107358014A (zh) 一种生理数据的临床前处理方法及系统
CN108806792B (zh) 深度学习面诊系统
CN109509551A (zh) 一种常见疾病智能诊断方法及系统
CN107403072A (zh) 一种基于机器学习的2型糖尿病预测预警方法
CN111261282A (zh) 一种基于机器学习的脓毒症早期预测方法
CN108648827A (zh) 心脑血管疾病风险预测方法及装置
CN110097975A (zh) 一种基于多模型融合的医院感染智能诊断方法及系统
CN107249455A (zh) 逐次姿势识别装置及植物性神经功能信息取得装置、方法和程序
CN109528197A (zh) 基于脑功能图谱的猴-人跨物种迁移进行精神疾病的个体化预测方法和系统
CN111951965B (zh) 基于时序知识图谱的全景式健康动态监测与预测系统
Zhao et al. Early prediction of sepsis based on machine learning algorithm
CN110115563A (zh) 一种中医证型预测系统
CN113838577B (zh) 便捷化分层老年mods早期死亡风险评估模型、装置及建立方法
CN114023441A (zh) 基于可解释机器学习模型的严重aki早期风险评估模型、装置及其开发方法
CN114926477A (zh) 一种基于深度学习的脑肿瘤多模态mri影像分割方法
CN112786203A (zh) 一种机器学习糖尿病视网膜病变发病风险预测方法及应用
CN107292103A (zh) 一种预测图像生成方法及装置
CN112733774A (zh) 一种基于BiLSTM与串并多尺度CNN结合的轻量化ECG分类方法
CN107767960A (zh) 临床检测项目的数据处理方法、装置及电子设备
Pandiaraj et al. Effective heart disease prediction using hybridmachine learning
CN107169264B (zh) 一种复杂疾病诊断系统
CN111540467A (zh) 精神分裂症分类识别方法、运行控制装置及医疗设备
KR20110098286A (ko) 퍼지 추론기법을 이용한 한방 자가 진단방법
CN109841285B (zh) 一种临床研究协作系统及方法
CN112967803A (zh) 基于集成模型的急诊患者早期死亡率预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220328

Address after: 510000 5548, floor 5, No. 1023, Gaopu Road, Tianhe District, Guangzhou City, Guangdong Province

Patentee after: Guangdong SUCHUANG Data Technology Co.,Ltd.

Address before: 510631 School of computer science, South China Normal University, 55 Zhongshan Avenue West, Tianhe District, Guangzhou City, Guangdong Province

Patentee before: SOUTH CHINA NORMAL University