CN114864108B - 一种用于证候与药方匹配数据的处理方法及处理系统 - Google Patents

一种用于证候与药方匹配数据的处理方法及处理系统 Download PDF

Info

Publication number
CN114864108B
CN114864108B CN202210782184.6A CN202210782184A CN114864108B CN 114864108 B CN114864108 B CN 114864108B CN 202210782184 A CN202210782184 A CN 202210782184A CN 114864108 B CN114864108 B CN 114864108B
Authority
CN
China
Prior art keywords
data
prescription
neural network
graph structure
self
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210782184.6A
Other languages
English (en)
Other versions
CN114864108A (zh
Inventor
叶展
贺涛
杨楚悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yuandaomiao Medical Technology Co ltd
Original Assignee
Shenzhen Yuandaomiao Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yuandaomiao Medical Technology Co ltd filed Critical Shenzhen Yuandaomiao Medical Technology Co ltd
Priority to CN202210782184.6A priority Critical patent/CN114864108B/zh
Publication of CN114864108A publication Critical patent/CN114864108A/zh
Application granted granted Critical
Publication of CN114864108B publication Critical patent/CN114864108B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/90ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/04Protocols for data compression, e.g. ROHC
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明涉及数据处理技术领域,具体涉及一种用于证候与药方匹配数据的处理方法及处理系统,该方法包括:获取证候数据及证候数据对应的药方数据,构建初始自编码神经网络并进行训练;根据药方数据的药材种类构建药方矩阵,根据药方矩阵计算每两个药方数据的相似性,根据每两个药方数据的相似性对药方数据进行分类并获取类别中心,计算每个类别的第一近似程度值,每两个类别中心的第二近似程度值,并计算每个类别的压缩系数,根据压缩系数得到重构损失函数,根据重构损失函数得到最终损失函数,基于最终损失函数对初始自编码神经网络训练,利用训练好的自编码神经网络的实现数据的传输,本发明方法降低了压缩损失,提高了数据传输的精度。

Description

一种用于证候与药方匹配数据的处理方法及处理系统
技术领域
本发明涉及数据处理技术领域,具体涉及一种用于证候与药方匹配数据的处理方法及处理系统。
背景技术
目前,中医诊断往往是根据自身行医经验来的,对于同样的症候,不同的中医给出的药方可能有所不同,且中医诊断都是自我诊断,在开药时多是凭借自身经验,各家自成体系,与其他医生之间缺少一定信息上的沟通与交流,所以通过大数据统计平台,可以让医生借鉴其他医生历史所出具的药方。
然而,医生每天都在不断的开药方,大量的药方数据会导致系统内部的信息传输压力过大,利用传统的神经网络进行数据压缩传输时,近似的药方数据会造成较高的压缩损失,进而使得在数据库中病症药方数据传输后,呈现在系统内的数据库中病症药方数据与原数据出现误差,影响数据的完整性。
因此,需要提供一种用于证候与药方匹配数据的处理方法及处理系统,予以解决上述问题。
发明内容
本发明提供一种用于证候与药方匹配数据的处理方法及处理系统,以解决现有的问题。
本发明的一种用于证候与药方匹配数据的处理方法采用如下技术方案:该方法包括:
获取历史数据中的多个证候数据及证候数据对应的药方数据,构建初始自编码神经网络,将证候数据及其对应的药方数据同时作为初始自编码神经网络输入和输出,并对初始自编码神经网络训练;
根据药方数据对应的药材种类构建药方矩阵,以每个药方数据为顶点构建图结构数据,根据图结构数据中各个顶点的药方矩阵中对应位置的元素值计算每两个顶点之间的边权值,并记为顶点对应的两个药方数据的相似性;
根据药方数据的相似性对图结构数据进行分类得到多类图结构数据,并获取每类图结构数据的类别中心;
获取每类图结构数据中的最小边权值并作为第一近似程度值,获取每类图结构数据与其最相似的其他类图结构数据的第二近似程度值;根据第一近似程度值与第二近似程度计算该类图结构数据的压缩系数;
根据压缩系数对初始自编码神经网络的损失函数重构得到重构损失函数,基于证候数据构建均方差损失函数,根据均方差损失函数和重构损失函数获取自编码神经网络的最终损失函数;优选的,根据压缩系数对初始自编码神经网络的损失函数重构得到重构损失函数的步骤包括:
根据下式(2)获取重构损失函数:
Figure DEST_PATH_IMAGE002
(2)
其中,
Figure DEST_PATH_IMAGE004
表示自编码神经网络训练时所输入的训练数据的个数;
Figure DEST_PATH_IMAGE006
表示当前第
Figure DEST_PATH_IMAGE008
个药方数据对应的压缩系数;
Figure 398560DEST_PATH_IMAGE008
表示第
Figure 272975DEST_PATH_IMAGE008
个药方数据;
Figure DEST_PATH_IMAGE010
表示第
Figure 712047DEST_PATH_IMAGE008
个药方数据重构后的重构药方数据;
基于最终损失函数对初始自编码神经网络进行监督训练得到训练好的自编码神经网络,将自编码神经网络分别存储在数据发送端和数据接收端,数据发送端的自编码神经网络的自编码部分对所有历史数据进行压缩得到压缩数据,并将压缩数据传输至数据接收端的自编码神经网络的解码部分进行解压。
优选的,根据药材种类构建药方矩阵的步骤包括:
对每个药方数据进行编号;
获取历史数据中所有药方数据中的药材种类,并对每种药材进行编号;
其中,药方矩阵中的位置即表示某个编号的药方数据的某个编号的药材,且每个位置的元素值表示是否有该类药材,有该类药材的元素值记为1,反之则元素值记为0。
优选的,根据图结构数据中各个顶点的药方矩阵中对应位置的元素值计算每两个药方数据的相似性的步骤包括:
获取图结构数据中各个顶点所对应的药方矩阵;
计算每两个药方矩阵之间对应位置的元素值的差值;
将两个药方矩阵之间所有对应位置的元素值的差值的和作为两个药方数据的相似性。
优选的,根据最小边权法获取每类图结构数据的最小边权值。
优选的,获取每类图结构数据与其最相似的其他类图结构数据的第二近似程度值的步骤包括:
获取每类图结构数据的类别中心对应顶点的药方矩阵,并记为中心药方矩阵;
计算每两个中心药方矩阵中对应位置的元素值的差值之和,并记为两个类别中心对应的顶点之间的边权值;
获取每个类别中心与其他所有类别中心对应的顶点之间的所有边权值中的最小边权值;
将最小边权值记为第二近似程度值。
优选的,根据第一近似程度值与第二近似程度计算该类图结构数据的压缩系数的步骤包括:
根据下式(1)计算药方数据的压缩系数:
Figure DEST_PATH_IMAGE012
(1)
其中,
Figure DEST_PATH_IMAGE014
表示第m类图结构数据的类别中心与其他所有类别中心的对应顶点之间边权值中的最小边权值;
Figure DEST_PATH_IMAGE016
表示第m类图结构数据中所有边权值中的最小边权值;
n表示第m类图结构数据中顶点的总数。
本发明的一种用于证候与药方匹配数据的处理系统,该系统包括:
数据发送端、数据接收端及分别存储在数据发送端和数据接收端的相同的自编码神经网络;数据发送端的自编码神经网络的自编码部分用于对所有历史数据进行压缩得到压缩数据,并将压缩数据传输至数据接收端;数据接收端的自编码神经网络的解码部分用于对压缩数据进行解压;
其中,自编码神经网络包括:
初始自编码神经网络,用于获取历史数据中的多个证候数据及证候数据对应的药方数据,构建初始自编码神经网络,将证候数据及其对应的药方数据同时作为初始自编码神经网络输入和输出,并对初始自编码神经网络训练;
第一参数计算模块,用于根据药方数据对应的药材种类构建药方矩阵,以每个药方数据为顶点构建图结构数据,根据图结构数据中各个顶点的药方矩阵中对应位置的元素值计算每两个顶点之间的边权值,并记为顶点对应的两个药方数据的相似性;
分类模块,用于根据药方数据的相似性对图结构数据进行分类得到多类图结构数据,并获取每类图结构数据的类别中心;
第二参数计算模块,用于获取每类图结构数据中的最小边权值并作为第一近似程度值,获取每类图结构数据与其最相似的其他类图结构数据的第二近似程度值;根据第一近似程度值与第二近似程度计算该类图结构数据的压缩系数;
损失函数重构模块,用于根据压缩系数对初始自编码神经网络的损失函数重构得到重构损失函数,基于证候数据构建均方差损失函数,根据均方差损失函数和重构损失函数获取自编码神经网络的最终损失函数;根据下式(2)获取重构损失函数:
Figure 253886DEST_PATH_IMAGE002
(2)
其中,
Figure 221842DEST_PATH_IMAGE004
表示自编码神经网络训练时所输入的训练数据的个数;
Figure 583554DEST_PATH_IMAGE006
表示当前第
Figure 295158DEST_PATH_IMAGE008
个药方数据对应的压缩系数;
Figure 425925DEST_PATH_IMAGE008
表示第
Figure 830361DEST_PATH_IMAGE008
个药方数据;
Figure 413789DEST_PATH_IMAGE010
表示第
Figure 929084DEST_PATH_IMAGE008
个药方数据重构后的重构药方数据;
自编码神经网络训练模块,用于基于最终损失函数对初始自编码神经网络进行监督训练得到训练好的自编码神经网络。
本发明的有益效果是:本发明的一种用于证候与药方匹配数据的处理方法及处理系统,通过获取多个药方数据中的药方数据的相似性关系,然后对药方数据进行划分类别,根据同一类图结构数据的第一近似程度值和不同类图结构数据之间的第二近似程度值计算每类图结构数据的压缩系数,根据压缩系数重构初始自编码神经网络的损失函数,基于重构后的损失函数对初始自编码神经网络训练得到自编码神经网络,使得在利用自编码神经网络对药方数据进行压缩传输时,降低药方数据的压缩损失,从而实现药方数据的高精度传输。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种用于证候与药方匹配数据的处理方法及处理系统的实施例总体步骤的流程图;
图2为本发明的实施例中步骤S4的流程图;
图3为本发明的实施例中图结构数据的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的一种用于证候与药方匹配数据的处理方法及处理系统的实施例,如图1所示,该方法包括:
S1、获取历史数据中的多个证候数据及证候数据对应的药方数据,构建初始自编码神经网络,将证候数据及其对应的药方数据同时作为初始自编码神经网络输入和输出,并对初始自编码神经网络训练;具体的,获取在对每个病人诊疗时,其所犯疾病的证候,在进行记录时只记录证候,进而得到历史疾病的症候数据,并对证候治疗所出具的药方进行保存,并得到中药的药方数据,然后将每个证候数据与对应的药方数据在作为初始自编码神经网络的输入的同时,也作为初始自编码神经网络的输出,对初始神经网络训练。
S2、由于同一种证候数据可能对应多个药方数据,即不同的中医所开对同一种病症所开药方略有差别,即同一种证候数据对应的多个药方数据之间的药材可能有区别,为提高自编码神经网络的压缩重构精度,多个药方数据中的近似药方数据应当具有高压缩系数,因此根据药方数据对应的药材种类构建药方矩阵,如图3示,以每个药方数据为顶点构建图结构数据,根据图结构数据中各个顶点的药方矩阵中对应位置的元素值计算每两个顶点之间的边权值,在图3中边权值为两个顶点之间的数字,将边权值记为顶点对应的两个药方数据的相似性。
具体的,构建药方矩阵的步骤:对每个药方数据进行编号;获取历史数据中所有药方数据中的药材种类,并对每种药材进行编号;其中,药方矩阵中的位置即表示某个编号的药方数据的某个编号的药材,且每个位置的元素值表示是否有该类药材,有该类药材的元素值记为1,反之则元素值记为0;具体的,获取两个药方数据的相似性的步骤获取图结构数据中各个顶点所对应的药方矩阵;计算每两个药方矩阵之间对应位置的元素值的差值;将两个药方矩阵之间所有对应位置的元素值的差值的和作为两个药方数据的相似性。
S3、根据药方数据的相似性对图结构数据进行分类得到多类图结构数据,并获取每类图结构数据的类别中心。
具体的,根据药方数据的相似性找到图结构数据中具有相似特征的顶点,然后将相似特征顶点的分为一类图结构数据,对所有相似的进行分类得到多类图结构数据,获取每个类图结构数据中的顶点数量,然后采用谱聚类的方法获取每类图结构数据的类别中心。
S4、获取每类图结构数据中的最小边权值并作为第一近似程度值,获取每类图结构数据与其最相似的其他类图结构数据的第二近似程度值;根据第一近似程度值与第二近似程度计算该类图结构数据的压缩系数。
具体的,利用最小边权法获取每类图结构数据的最小边权值,最小边权法为现有技术,此处不再赘述,并将每类图结构数据的最小边权值作为每类图结构数据的第一近似程度值,这里需要说明的是,获取第一近似程度值是要说明每类图结构数据的类内的相似度,其目的是为了保证每类图结构数据内近似数据可以能够保证高精度重建。
具体的,由于在分类时,每类图结构数据与其他类图结构数据虽然被分开,但是也可能存在每类图结构数据的边缘数据与另一类图结构数据的边缘数据的近似,所以不同类图结构数据之间近似性所对应的压缩系数也应当不一致,故获取每类图结构数据与其最相似的其他类图结构数据的第二近似程度值的步骤包括:如图2所示,S41、获取每类图结构数据的类别中心对应顶点的药方矩阵,并记为中心药方矩阵;S42、计算每两个中心药方矩阵中对应位置的元素值的差值之和,并记为两个类别中心对应的顶点之间的边权值;S43、获取每个类别中心与其他所有类别中心对应的顶点之间的所有边权值中的最小边权值;S44、将最小边权值记为第二近似程度值,其中,需要说明的是,第二近似程度值表示最相似的两类图结构数据之间的近似程度值。
具体的,根据第一近似程度值与第二近似程度计算该类图结构数据的压缩系数,其中,根据下式(1)计算药方数据的压缩系数:
Figure 914358DEST_PATH_IMAGE012
(1)
其中,
Figure 489696DEST_PATH_IMAGE014
表示第m类图结构数据的类别中心与其他所有类别中心的对应顶点之间边权值中的最小边权值,其边权值越小相对的近似程度越大,则压缩系数应当越高,所以做负相关映射exp(-x);
Figure 560420DEST_PATH_IMAGE016
表示第m类图结构数据中所有边权值中的最小边权值;
n表示第m类图结构数据中顶点的总数;
Figure DEST_PATH_IMAGE018
表示药方数据的压缩系数,即药方数据中存在与其越相似的数据,在进行压缩重构时,压缩系数应当越大,从而保证的压缩重构的精度。
S5、根据压缩系数获取初始自编码神经网络的重构损失函数
Figure DEST_PATH_IMAGE020
,基于证候数据构建均方差损失函数,并将均方差损失函数记为
Figure DEST_PATH_IMAGE022
,根据均方差损失函数和重构损失函数获取自编码神经网络的最终损失函数。
具体的,根据下式(2)获取重构损失函数:
Figure 144985DEST_PATH_IMAGE002
(2)
其中,
Figure 984765DEST_PATH_IMAGE004
表示初始自编码神经网络训练时所输入的训练数据的个数;
Figure 731004DEST_PATH_IMAGE006
表示当前第
Figure 23445DEST_PATH_IMAGE008
个药方数据对应的压缩系数;
Figure 146122DEST_PATH_IMAGE008
表示第
Figure 840409DEST_PATH_IMAGE008
个药方数据;
Figure 757549DEST_PATH_IMAGE010
表示第
Figure 802865DEST_PATH_IMAGE008
个药方数据重构后的重构药方数据,具体的,重构药方矩阵为预测数据,即根据初始自编码神经网络得到的预测数据。
具体的,自编码神经网络的最终损失函数L即可以表示为L=
Figure 463654DEST_PATH_IMAGE020
+
Figure 12447DEST_PATH_IMAGE022
S6、基于最终损失函数对初始自编码神经网络进行监督训练得到训练好的自编码神经网络,将自编码神经网络分别存储在数据发送端和数据接收端,数据发送端的自编码神经网络的自编码部分对所有历史数据进行压缩得到压缩数据,其中,每次输入的药方数据和证候数据均作为历史数据,并将压缩数据传输至数据接收端的自编码神经网络的解码部分进行解压。
具体的,数据发送端和数据接收端存储的自编码神经网络为相同的训练好的自编码神经网络,且对自编码神经网络进行横向拆分为自编码部分和解码部分,数据发送端的数据发送端的自编码部分对输入的证候数据及对应的药方数据进行压缩得到隐变量数据,隐变量数据即压缩数据,然后通过数据发送端将压缩数据发送至数据接收端,通过数据接收端的自编码神经网络的解码部分对压缩数据进行解压得到解压数据,从而实现药方数据与证候数据的无低损传输,以供其他医生查看。
还公开了一种用于证候与药方匹配数据的处理系统,该系统包括:数据发送端、数据接收端及分别存储在数据发送端和数据接收端的相同的自编码神经网络;数据发送端的自编码神经网络的自编码部分用于对所有历史数据进行压缩得到压缩数据,并将压缩数据传输至数据接收端;数据接收端的自编码神经网络的解码部分用于对压缩数据进行解压。
其中,自编码神经网络包括:初始自编码神经网络训练模块、第一参数计算模块、分类模块、第二参数计算模块、损失函数重构模块及自编码神经网络训练模块,初始自编码神经网络训练模块用于获取历史数据中的多个证候数据及证候数据对应的药方数据,构建初始自编码神经网络,将证候数据及其对应的药方数据同时作为初始自编码神经网络输入和输出,并对初始自编码神经网络训练;第一参数计算模块用于根据药方数据对应的药材种类构建药方矩阵,以每个药方数据为顶点构建图结构数据,根据图结构数据中各个顶点的药方矩阵中对应位置的元素值计算每两个顶点之间的边权值,并记为顶点对应的两个药方数据的相似性;分类模块用于根据药方数据的相似性对图结构数据进行分类得到多类图结构数据,并获取每类图结构数据的类别中心;第二参数计算模块用于获取每类图结构数据中的最小边权值并作为第一近似程度值,获取每类图结构数据与其最相似的其他类图结构数据的第二近似程度值;根据第一近似程度值与第二近似程度计算该类图结构数据的压缩系数;损失函数重构模块用于根据压缩系数对初始自编码神经网络的损失函数重构得到重构损失函数,基于证候数据构建均方差损失函数,根据均方差损失函数和重构损失函数获取自编码神经网络的最终损失函数;自编码神经网络训练模块用于基于最终损失函数对初始自编码神经网络进行监督训练得到训练好的自编码神经网络。
综上所述,本发明提供一种用于证候与药方匹配数据的处理方法及处理系统,通过获取多个药方数据中的药方数据的相似性关系,然后对药方数据进行划分类别,根据同一类图结构数据的第一近似程度值和不同类图结构数据之间的第二近似程度值计算每类图结构数据的压缩系数,根据压缩系数重构初始自编码神经网络的损失函数,基于重构后的损失函数对初始自编码神经网络训练得到自编码神经网络,使得在利用自编码神经网络对药方数据进行压缩传输时,降低药方数据的压缩损失,从而实现药方数据的高精度传输。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种用于证候与药方匹配数据的处理方法,其特征在于,该方法包括:
获取历史数据中的多个证候数据及证候数据对应的药方数据,构建初始自编码神经网络,将证候数据及其对应的药方数据同时作为初始自编码神经网络输入和输出,并对初始自编码神经网络训练;
根据药方数据对应的药材种类构建药方矩阵,以每个药方数据为顶点构建图结构数据,根据图结构数据中各个顶点的药方矩阵中对应位置的元素值计算每两个顶点之间的边权值,并记为顶点对应的两个药方数据的相似性;
根据药方数据的相似性对图结构数据进行分类得到多类图结构数据,并获取每类图结构数据的类别中心;
获取每类图结构数据中的最小边权值并作为第一近似程度值,获取每类图结构数据与其最相似的其他类图结构数据的第二近似程度值,根据第一近似程度值与第二近似程度计算该类图结构数据的压缩系数;
根据压缩系数对初始自编码神经网络的损失函数重构得到重构损失函数,基于证候数据构建均方差损失函数,根据均方差损失函数和重构损失函数获取自编码神经网络的最终损失函数;根据下式(2)获取重构损失函数:
Figure 738786DEST_PATH_IMAGE001
(2)
其中,
Figure 424982DEST_PATH_IMAGE002
表示初始自编码神经网络训练时所输入的训练数据的个数;
Figure 897551DEST_PATH_IMAGE003
表示当前第
Figure 11001DEST_PATH_IMAGE004
个药方数据对应的压缩系数;
Figure 201811DEST_PATH_IMAGE004
表示第
Figure 426119DEST_PATH_IMAGE004
个药方数据;
Figure 753195DEST_PATH_IMAGE005
表示第
Figure 37546DEST_PATH_IMAGE004
个药方数据重构后的重构药方数据;
基于最终损失函数对初始自编码神经网络进行监督训练得到训练好的自编码神经网络,将自编码神经网络分别存储在数据发送端和数据接收端,数据发送端的自编码神经网络的自编码部分对所有历史数据进行压缩得到压缩数据,并将压缩数据传输至数据接收端的自编码神经网络的解码部分进行解压。
2.根据权利要求1所述的一种用于证候与药方匹配数据的处理方法,其特征在于,根据药材种类构建药方矩阵的步骤包括:
对每个药方数据进行编号;
获取历史数据中所有药方数据中的药材种类,并对每种药材进行编号;
其中,药方矩阵中的位置即表示某个编号的药方数据的某个编号的药材,且每个位置的元素值表示是否有该类药材,有该类药材的元素值记为1,反之则元素值记为0。
3.根据权利要求1所述的一种用于证候与药方匹配数据的处理方法,其特征在于,根据图结构数据中各个顶点的药方矩阵中对应位置的元素值计算每两个药方数据的相似性的步骤包括:
获取图结构数据中各个顶点所对应的药方矩阵;
计算每两个药方矩阵之间对应位置的元素值的差值;
将两个药方矩阵之间所有对应位置的元素值的差值的和作为两个药方数据的相似性。
4.根据权利要求1所述的一种用于证候与药方匹配数据的处理方法,其特征在于,根据最小边权法获取每类图结构数据的最小边权值。
5.根据权利要求1所述的一种用于证候与药方匹配数据的处理方法,其特征在于,获取每类图结构数据与其最相似的其他类图结构数据的第二近似程度值的步骤包括:
获取每类图结构数据的类别中心对应顶点的药方矩阵,并记为中心药方矩阵;
计算每两个中心药方矩阵中对应位置的元素值的差值之和,并记为两个类别中心对应的顶点之间的边权值;
获取每个类别中心与其他所有类别中心对应的顶点之间的所有边权值中的最小边权值;
将最小边权值记为第二近似程度值。
6.根据权利要求1所述的一种用于证候与药方匹配数据的处理方法,其特征在于,根据第一近似程度值与第二近似程度计算该类图结构数据的压缩系数的步骤包括:
根据下式(1)计算药方数据的压缩系数:
Figure 715652DEST_PATH_IMAGE006
(1)
其中,
Figure 743651DEST_PATH_IMAGE007
表示第m类图结构数据的类别中心与其他所有类别中心的对应顶点之间边 权值中的最小边权值;
Figure 190813DEST_PATH_IMAGE008
表示第m类图结构数据中所有边权值中的最小边权值;
n表示第m类图结构数据中顶点的总数。
7.一种用于证候与药方匹配数据的处理系统,其特征在于,该系统包括:数据发送端、数据接收端及分别存储在数据发送端和数据接收端的相同的自编码神经网络;数据发送端的自编码神经网络的自编码部分用于对所有历史数据进行压缩得到压缩数据,并将压缩数据传输至数据接收端;数据接收端的自编码神经网络的解码部分用于对压缩数据进行解压;
其中,所述自编码神经网络包括:
初始自编码神经网络,用于获取历史数据中的多个证候数据及证候数据对应的药方数据,构建初始自编码神经网络,将证候数据及其对应的药方数据同时作为初始自编码神经网络输入和输出,并对初始自编码神经网络训练;
第一参数计算模块,用于根据药方数据对应的药材种类构建药方矩阵,以每个药方数据为顶点构建图结构数据,根据图结构数据中各个顶点的药方矩阵中对应位置的元素值计算每两个顶点之间的边权值,并记为顶点对应的两个药方数据的相似性;
分类模块,用于根据药方数据的相似性对图结构数据进行分类得到多类图结构数据,并获取每类图结构数据的类别中心;
第二参数计算模块,用于获取每类图结构数据中的最小边权值并作为第一近似程度值,获取每类图结构数据与其最相似的其他类图结构数据的第二近似程度值;根据第一近似程度值与第二近似程度计算该类图结构数据的压缩系数;
损失函数重构模块,用于根据压缩系数对初始自编码神经网络的损失函数重构得到重构损失函数,基于证候数据构建均方差损失函数,根据均方差损失函数和重构损失函数获取自编码神经网络的最终损失函数;根据下式(2)获取重构损失函数:
Figure 380485DEST_PATH_IMAGE001
(2)
其中,
Figure 280308DEST_PATH_IMAGE002
表示初始自编码神经网络训练时所输入的训练数据的个数;
Figure 111998DEST_PATH_IMAGE003
表示当前第
Figure 413666DEST_PATH_IMAGE004
个药方数据对应的压缩系数;
Figure 39820DEST_PATH_IMAGE004
表示第
Figure 426939DEST_PATH_IMAGE004
个药方数据;
Figure 62320DEST_PATH_IMAGE005
表示第
Figure 952915DEST_PATH_IMAGE004
个药方数据重构后的重构药方数据;
自编码神经网络训练模块,用于基于最终损失函数对初始自编码神经网络进行监督训练得到训练好的自编码神经网络。
CN202210782184.6A 2022-07-05 2022-07-05 一种用于证候与药方匹配数据的处理方法及处理系统 Active CN114864108B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210782184.6A CN114864108B (zh) 2022-07-05 2022-07-05 一种用于证候与药方匹配数据的处理方法及处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210782184.6A CN114864108B (zh) 2022-07-05 2022-07-05 一种用于证候与药方匹配数据的处理方法及处理系统

Publications (2)

Publication Number Publication Date
CN114864108A CN114864108A (zh) 2022-08-05
CN114864108B true CN114864108B (zh) 2022-09-09

Family

ID=82626723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210782184.6A Active CN114864108B (zh) 2022-07-05 2022-07-05 一种用于证候与药方匹配数据的处理方法及处理系统

Country Status (1)

Country Link
CN (1) CN114864108B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116305223B (zh) * 2023-05-23 2023-08-04 北京茄豆网络科技有限公司 一种自助瓶装水标贴数据实时制作的方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428091A (zh) * 2020-03-19 2020-07-17 腾讯科技(深圳)有限公司 一种编码器的训练方法、信息推荐的方法以及相关装置
CN114372112A (zh) * 2021-12-28 2022-04-19 上海国民集团健康科技有限公司 基于中药名的经验方剂数据处理方法、系统、终端及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11055575B2 (en) * 2018-11-13 2021-07-06 CurieAI, Inc. Intelligent health monitoring
CN110321484B (zh) * 2019-06-18 2023-06-02 中国平安财产保险股份有限公司 一种产品推荐方法及装置
CN114640356A (zh) * 2022-04-02 2022-06-17 河南伴龙电子科技有限公司 基于神经网络的大数据压缩方法、系统及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428091A (zh) * 2020-03-19 2020-07-17 腾讯科技(深圳)有限公司 一种编码器的训练方法、信息推荐的方法以及相关装置
CN114372112A (zh) * 2021-12-28 2022-04-19 上海国民集团健康科技有限公司 基于中药名的经验方剂数据处理方法、系统、终端及存储介质

Also Published As

Publication number Publication date
CN114864108A (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
CN110309847B (zh) 一种模型压缩方法及装置
EP3547226A1 (en) Cross-modal neural networks for prediction
CN107153775B (zh) 一种智能分诊方法及装置
CN114864108B (zh) 一种用于证候与药方匹配数据的处理方法及处理系统
CN107908819B (zh) 预测用户状态变化的方法和装置
Al-Marridi et al. Convolutional autoencoder approach for eeg compression and reconstruction in m-health systems
CN111696660A (zh) 基于人工智能的患者分群方法、装置、设备及存储介质
US20200250496A1 (en) Sequential minimal optimization algorithm for learning using partially available privileged information
US20230401756A1 (en) Data Encoding Method and Related Device
WO2021139351A1 (zh) 图像分割方法、装置、介质及电子设备
CN111046882A (zh) 基于剖面隐式马尔科夫模型的疾病名称标准化方法和系统
Dover et al. Computing the polytomous discrimination index
Lu A generalization of Shannon's information theory
US20190205787A1 (en) Dimension reduction of claims data
CN111933302B (zh) 药物推荐方法、装置、计算机设备及存储介质
US11615286B2 (en) Computing system and compressing method for neural network parameters
CN115330901B (zh) 一种基于压缩感知网络的图像重构方法和装置
WO2023174256A1 (zh) 一种数据压缩方法以及相关设备
Huang et al. Image Inpainting with Bilateral Convolution
CN114664400A (zh) 病历档案归档方法及装置
Ashraf et al. Absolutely lossless compression of medical images
CN114627993A (zh) 信息预测方法、装置、存储介质及计算机设备
CN110175645B (zh) 一种确定保护装置型号的方法及计算装置
CN114613505A (zh) 基于二分图的信息推荐方法、信息推荐装置及终端设备
CN113658688A (zh) 基于无分词深度学习的临床决策支持方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant