CN114613505A - 基于二分图的信息推荐方法、信息推荐装置及终端设备 - Google Patents
基于二分图的信息推荐方法、信息推荐装置及终端设备 Download PDFInfo
- Publication number
- CN114613505A CN114613505A CN202210238387.9A CN202210238387A CN114613505A CN 114613505 A CN114613505 A CN 114613505A CN 202210238387 A CN202210238387 A CN 202210238387A CN 114613505 A CN114613505 A CN 114613505A
- Authority
- CN
- China
- Prior art keywords
- information
- health
- bipartite graph
- probability
- hidden danger
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Pathology (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请适用于人工智能技术领域,提供了一种基于二分图的信息推荐方法、基于二分图的信息推荐装置、终端设备及存储介质。该生成方法包括:基于预处理后的健康信息确定用户存在每个预设的健康隐患的隐患概率,健康隐患至少有一个;基于健康隐患和预设的至少两种信息元素构建第一二分图;基于信息元素和信息元素组合构建第二二分图,信息元素组合包括任意一种信息元素或者信息元素所能够组成的组合;基于隐患概率、第一二分图及第二二分图确定目标信息元素组合,目标信息元素组合用于生成向用户推荐的健康建议信息。该方法能够基于用户的健康信息为用户提供个性化的健康建议,提高健康建议推荐的准确性。此外本申请还涉及区块链技术。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种基于二分图的信息推荐方法、基于二分图的信息推荐装置、终端设备及计算机可读存储介质。
背景技术
现如今,越来越多的人注重自身的身体状况,且愿意花费时间和金钱到医院做健康检查。健康检查的项目种类繁多,一套完整的健康检查,会产生大量的电子病历,这些电子病历中包含了丰富的健康信息,这类健康信息的挖掘,能够辅助医生快速给出健康建议信息。
目前的健康建议信息推荐方法,是医生先根据患者的电子病历确定辅助信息,然后基于辅助信息从数据库中查询与该辅助信息匹配的健康建议信息,最后将该健康建议信息推荐给患者。该过程中健康建议信息是通过套用模板的方式获得,但是不同的患者的实际情况可能有所不同,因此该方法不能针对患者提供个性化的健康建议信息,导致健康建议信息的推荐准确性不足。
发明内容
有鉴于此,本申请实施例提供了一种基于二分图的信息推荐方法、基于二分图的信息推荐装置、终端设备及计算机可读存储介质,能够基于用户的健康信息为用户提供个性化的健康建议,提高健康建议推荐的准确性。
本申请实施例的第一方面提供了一种基于二分图的信息推荐方法,包括:
基于预处理后的健康信息确定用户存在每个预设的健康隐患的隐患概率,上述健康隐患至少有一个;
基于上述健康隐患和预设的至少两种信息元素构建第一二分图;
基于上述信息元素和信息元素组合构建第二二分图,上述信息元素组合包括任意一种信息元素或者上述信息元素所能够组成的组合;
基于上述隐患概率、上述第一二分图及上述第二二分图确定目标信息元素组合,上述目标信息元素组合用于生成向上述用户推荐的健康建议信息。
本申请实施例的第二方面提供了基于二分图的信息推荐装置,包括:
第一确定模块,用于基于预处理后的健康信息确定用户存在每个预设的健康隐患的隐患概率,上述健康隐患至少有一个;
第一构建模块,用于基于上述健康隐患和预设的至少两种信息元素构建第一二分图;
第二构建模块,用于基于上述信息元素和信息元素组合构建第二二分图,上述信息元素组合包括任意一种信息元素或者上述信息元素所能够组成的组合;
第二确定模块,用于基于上述隐患概率、上述第一二分图及上述第二二分图确定目标信息元素组合,上述目标信息元素组合用于生成向上述用户推荐的健康建议信息。
本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在上述存储器中并可在终端设备上运行的计算机程序,上述处理器执行上述计算机程序时实现第一方面提供的基于二分图的信息推荐方法的各步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现第一方面提供的基于二分图的信息推荐方法的各步骤。
实施本申请实施例提供的一种基于二分图的信息推荐方法、基于二分图的信息推荐装置、终端设备及计算机可读存储介质具有以下有益效果:
基于用户预处理后的健康信息,确定用户所可能存在的健康隐患,即确定用户存在每个预设的健康隐患的隐患概率。然后以健康隐患和预设的至少两信息元素为顶点生成第一二分图,并基于信息元素和信息元素组合为顶点生成第二二分图,其中,信息元素组合中包括至少一种信息元素,或者包括信息元素所能够组成的组合。最终基于隐患概率和两个二分图确定出目标信息元素组合,该目标信息元素组合可以用于生成向用户推荐的健康建议信息。通过该方法为用户推荐的健康建议信息,是基于用户的健康信息所确定的目标信息元素组合生成的,并非通过套用模板的方式直接选取预先存储的健康建议信息,因此相较于现有技术,该方法能够为用户提供个性化的健康建议,提高健康建议推荐的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种基于二分图的信息推荐方法的实现流程图;
图2是本申请实施例提供的一种应用场景下的基于二分图的信息推荐方法的流程示意图;
图3是本申请实施例提供的一种第一二分图的结构示意图;
图4是本申请实施例提供的一种基于二分图的信息推荐装置的结构框图;
图5是本申请实施例提供的一种终端设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例所涉及的基于二分图的信息推荐方法,可以由终端设备,例如笔记本电脑、超级移动个人计算机(ultra-mobilepersonalcomputer,UMPC)、上网本或个人数字助理(personaldigitalassistant,PDA)执行。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
另外,本申请实施例涉及的基于二分图的信息推荐方法,可以应用于智慧医疗场景中,从而推动智慧城市的建设。
请参阅图1,图1示出了本申请实施例提供的一种基于二分图的信息推荐方法的实现流程图。该生成方法包括:
步骤110、基于预处理后的健康信息确定用户存在每个预设的健康隐患的隐患概率。
为了提高数据处理便捷性,一般在获得数据后,可以对这些数据进行预处理。数据的预处理方法没有标准的流程,针对不同的任务和不同数据属性,所使用的处理操作各不相同。常用的数据处理方法包括但不限于缺失数据填充、去除唯一属性信息、编码操作以及标准化操作等,其中标准化操作即对数据进行正则化操作。
因此,为了提高数据处理的效率,在确定用户存在每个健康隐患的隐患概率时,可以基于预处理后的健康信息进行确定。具体地,健康隐患指的是可能导致用户患上某种疾病的诱因,可以根据健康隐患在日常中出现的概率,预先设置至少一个常见的健康隐患。针对每个健康隐患,可以基于健康信息确定用户存在该健康隐患的隐患概率。当健康隐患概率为多个时,可以根据健康信息计算出多个与该健康隐患一一对应的隐患概率。其中隐患概率也即用户存在某种健康隐患的概率。
可选地,健康信息可以是通过用户上传的相关信息获取得到,也可以是在获取到用户权限后通过相关应用程序获取得到,相关应用程序包括但不限于用户就诊的医院系统或应用程序。后一种获取方式无需用户进行下载或上传操作,可以进一步提升用户的体验感。
可选地,健康信息的载体可以是多模态数据,例如病历、问卷调查文件以及基因为外在表现形式的多元化数据。多模态数据的应用更贴近现实场景,能够提高健康信息获取的便利性和全面性。
步骤120、基于健康隐患和预设的至少两种信息元素构建第一二分图。
要降低某个隐患概率,可以根据该隐患概率所对应的健康隐患的属性和特性确定对应的关键信息,即信息元素。进一步地,为了能够准确确定出有效的信息元素,可以基于健康隐患和信息元素构建二分图,其中,健康隐患和信息元素作为该二分图的顶点。为了与后续提到的另一个二分图形成区别,将此处基于健康隐患和信息元素构建二分图记作第一二分图,将后续出现的二分图记作第二二分图。
步骤130、基于信息元素和信息元素组合构建第二二分图。
要获得完整的健康建议,仅有信息元素是不够的,还要基于健康元素进一步确定有效的信息元素组合,也即后续提及的目标信息元素组合。该信息元素组合可以包括任意一种信息元素,或者也可以包括两种以上的信息元素。当信息元素为多种时,多种信息元素之间应当是能够组合在一起的,也即多种信息元素之间是兼容的,不会出现互斥或者相互削弱甚至抵消的情况。
步骤140、基于隐患概率、第一二分图及第二二分图确定目标信息元素组合。
在确定出隐患概率,且构建完两个二分图之后,即可通过隐患概率和两个二分图确定出有效的元素组合,也即确定出目标信息元素组合,该目标信息元素组合的个数可以是一个及以上。在确定出目标信息元素组合后,即可基于该目标信息元素组合生成该用户专属的个性化的健康建议信息,可以将该健康建议信息推荐给该用户,用户可以根据该健康建议信息调节作息和身体,降低自身存在各个健康隐患的隐患概率。应当理解的是,当目标信息元素组合为多个时,多个目标信息元素组合之间也应当是兼容的。
基于用户预处理后的健康信息,确定用户所可能存在的健康隐患,即确定用户存在每个预设的健康隐患的隐患概率。然后以健康隐患和预设的至少两信息元素为顶点生成第一二分图,并基于信息元素和信息元素组合为顶点生成第二二分图。其中,信息元素组合中包括至少一种信息元素,或者包括信息元素所能够组成的组合。最终基于隐患概率和两个二分图确定出目标信息元素组合,该目标信息元素组合可以用于生成向用户推荐的健康建议信息。通过该方法为用户推荐的健康建议信息,是基于用户的健康信息所确定目标信息元素组合生成的,并非通过套用模板的方式直接选取预先存储的健康建议信息,因此相较于现有技术,该方法能够为用户提供个性化的健康建议,提高健康建议推荐的准确性。
在一些实施例中,为了提高数据处理的便捷性,在上述步骤110之前,还包括:
A1、获取用户的病历。
A2、从病历中提取健康信息,健康信息包括结构化健康信息和非结构化健康信息。
A3、对结构化信息健康信息执行标准化操作,并对非结构化信息健康信息执行编码操作,得到预处理后的健康信息。
在步骤110中有提到,健康信息的载体包括但不限于病历和用户填写的健康问卷调查等。其中病历涵盖了基于影像学所获得的各类图像、健康检查报告以及医生的诊断信息等。显然,在各类健康信息的载体中,病历相对于健康问卷调查而言,是相对较专业且涵盖信息较广泛的一类载体。因此,优选地,可以获取用户的病历,通过病历高效获取较为全面的健康信息。其中,该病历包括电子病历和纸质病历的扫描件等。
提取得到的健康信息包括两种数据类型,一种数据类型是结构化的,另一种数据类型是非结构化的。结构化数据也称作行数据,是由二维表结构来进行逻辑表达和实现的数据,严格地遵循数据格式与长度规范。非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。相对于结构化数据来说,非结构化数据是数据处理过程中容易遇到的数据类型,常见非结构化数据包括:办公文档、文本、图片、各类报表以及音频/视频信息等。
为了便于后续对健康信息进行处理,对于两种不同数据类型的健康信息,可以采取不同的方式对该健康信息进行数据预处理。具体地,对于结构化健康信息,可以进行标准化处理,常用的标准化处理包括但不限于极差标准化法、标准差标准化法以及线性比例标准化法。在选择标准化处理方法时,可以根据处理后的数据要求选择对应的标准化方法进行处理。例如对离散特征如性别、过敏史进行独热编码(one-hot)以便计算机识别和后续处理,对连续特征如年龄进行标准化处理以消除特征间尺度差异的影响,加快模型收敛速度。而对于非结构化健康信息,则可以构建形如<词,ID>的词表,将非结构化健康信息中出现的词映射为整数ID。例如“我头疼两天”,根据预先构建的词表可以转换成“2,5,6,32,70”;“我感觉头疼”可以转换成“2,73,75,5,6”。对数据预处理的过程通常是自然语言处理任务中的第一步,因为在自然语言处理中对文本中的每个词会建立相应的词向量,作为模型的输入。词表的建立,能够和形如<ID,词向量>的词向量表对应,可以直接根据词所对应的ID取到相应的词向量输入模型中参与计算,提高模型的计算效率。
在一些实施例中,上述步骤110具体包括:
步骤111、对预处理后的健康信息进行特征提取,得到特征向量。
步骤112、基于特征向量确定用户存在每个健康隐患的隐患概率。
在得到预处理后的健康信息后,可以从该健康信息中提取出更具代表性的特征信息,以生成特征向量,之后即可直接基于特征向量来确定用户存在每个健康隐患的隐患概率。
可选地,在特征提取的过程中,为了能够提取出具有代表性的特征,可以采用不同的神经网络分别对两种预处理后的健康信息进行特征提取。例如,可以将预处理后的结构化健康信息输入全连接神经网络中,即狭义的深度神经网络(DeepNeuralNetworks,DNN),以得到对应的特征向量;可以将预处理后的非结构化健康信息输入卷积神经网络(ConvolutionalNeuralNetwork,CNN)或者递归神经网络(RecurrentNeuralNetwork,RNN)中,以得到对应的特征向量。虽然两种数据类型的健康信息进行特征提取得到的都是特征向量,但在本申请中,为了区分两种特征向量,可以将基于结构化健康信息得到的特征向量记作第一特征向量e1=NN1(input1),将基于非结构化健康信息得到的特征向量记作第二特征向量e2=f1(input1),f∈{CNN,RNN},两个特征向量合起来即为健康信息所对应的特征向量,简称特征向量e=concatenate(e1,e2),也即后续提到特征向量特指第一特征向量和第二特征向量。
可选地,在获得特征向量以后,可以利用神经网络基于该特征向量确定用户存在每个健康隐患的隐患概率。具体地,通过神经网络的全连接层来确定出隐患概率。全连接层的神经元的数量与预设的健康隐患的数量相同,因此,全连接层的每个输出即可作为每个健康隐患的隐患概率,可表示为ph=NN2(e),ph∈R|H|,其中H是所有健康隐患的集合,pi h指用户存在第i个健康隐患的概率。
在一些实施例中,为了提高目标信息元素组合组合确定的准确性,上述步骤140具体包括:
步骤141、基于隐患概率和第一二分图确定各个信息元素的权重。
步骤142、基于权重和第二二分图确定各个信息元素组合被确定为目标信息元素组合的确定概率。
步骤143、将确定概率大于预设的概率阈值的信息元素组合确定为目标信息元素组合。
在确定出隐患概率后,可以将该隐患概率输入第一二分图,以确定各个信息元素的权重。在确定出权重后,可以将权重输入第二二分图,以确定各个信息元素组合被确定为目标信息元素组合的确定概率。在得到各个信息元素组合所对应的确定概率后,可以将每个确定概率与预设的概率阈值进行比较,以判断该确定概率所对应的信息元素组合是否为目标信息元素组合。针对每个信息元素组合,当其对应的确定概率大于概率阈值时,该确定概率所对应的信息元素组合即为目标信息元素组合;当其对应的确定概率小于或等于概率阈值时,该确定概率所对应的信息元素组合则不是目标信息元素组合。其中,概率阈值可以根据经验设定,例如0.7。在确定出所有目标信息元素组合后,即可根据该目标信息元素组合生成健康建议信息。用y表示健康建议,则=[y1,y2,…,yi,…],其中:
在一些实施例中,上述步骤141具体包括:
步骤1411、基于隐患概率计算第一二分图的第一邻接矩阵和第一矩阵参数。
步骤1412、基于第一邻接矩阵优化第一矩阵参数。
步骤1413、基于优化后的第一矩阵参数确定各个信息元素的权重。
针对各个信息元素,可以先计算健康隐患和信息元素之间的参数矩阵和邻接矩阵,基于邻接矩阵优化该参数矩阵中的参数,基于该参数确定各个第一信息元素的权重。鉴于后文也会出现相同的概念,为了区别开来,此处,将参数矩阵记作第一参数矩阵,用符号w1∈R|H|×|E|表示;将邻接矩阵记作第一邻接矩阵,用符号A1∈R|H|×|E|表示;E是信息元素的集合。
具体地,权重的计算公式如下:
其中,是按照元素相乘,此处的元素并非指的信息元素,而是矩阵中的各个元素;b1是偏差项,f1是是激活函数。实际上,该计算过程可以视为对健康隐患和信息元素执行全连接操作,执行全连接操作所使用到的参数矩阵被第一二分图的邻接矩阵所替代。
在一些实施例中,上述步骤142具体包括:
步骤1421、基于权重计算第二二分图的第二邻接矩阵和第二矩阵参数。
步骤1422、基于第二邻接矩阵优化第二矩阵参数。
步骤1423、基于优化后的第二矩阵参数确定各个信息元素组合被确定为目标信息元素组合的概率。
针对各个信息元素组合,可以先计算信息元素与信息元素组合之间的参数矩阵和邻接矩阵,分别记作第二参数矩阵和第二邻接矩阵,第二参数矩阵用符号w2∈R|H|×|E|表示,第二邻接矩阵用符号A2∈R|H|×|E|表示。通过第二邻接矩阵,优化第二参数矩阵中的各个参数,以确定出各个信息元素组合被确定为目标信息元素组合的确定概率,该确定概率的计算公式如下:
其中,b2是偏差项,f2是激活函数。
在一些实施例中,为了进一步提高健康建议信息的个性化和准确性,在上述步骤140之后,还包括:
步骤B1、基于目标信息元素组合确定候选健康建议信息。
步骤B2、基于用户的禁忌信息对候选健康建议信息进行修正。
步骤B3、将修正后的候选健康建议信息确定为健康建议信息。
在最终形成健康建议信息之前,为了避免因用户的禁忌信息导致推送的健康建议信息不具备可行性,或者采纳该健康建议信息后引发其它的健康隐患,在确定出目标信息元素组合之后,可以先基于该目标信息元素组合确定出候选健康建议信息,然后根据用户的禁忌信息对候选健康建议信息进行修订。该过程可以是医生根据禁忌信息进行修正,也可以是根据预设的规则进行修正,以形成最终的健康建议信息。该健康建议信息更贴近用户的实际需求,能够提高该健康建议信息的可靠新和可行性。
在一些实施例中,上述生成方法还包括:
将上述健康信息、隐患概率、第一二分图、第二二分图、目标信息元素组合和/或健康建议信息部署至区块链(Blockchain)中。
其中,为了保证数据的安全性和对用户的公正透明性,可以将健康信息、隐患概率、第一二分图、第二二分图、目标信息元素组合和/或健康建议信息部署至区块链进行存证。用户随后即可通过各自的设备从区块链中下载获得健康信息、隐患概率、第一二分图、第二二分图、目标信息元素组合和/或健康建议信息,以便查证这些数据是否被篡改。本实施例所指区块链是采用分布式数据存储、点对点传输、共识机制及加密算法等计算机技术的新型应用模式。区块链,本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
为了应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
为便于理解,下面以实际应用场景来说明本申请提出的基于二分图的信息推荐方法。具体地,该信息为处方信息,相应地,药物为诊断结果,信息元素为药物成分,信息元素组合为药物。参见图2,该处方基于二分图的信息推荐方法可以通过以下步骤实现:
首先,获取患者的电子病历,得到健康信息,健康信息包括结构化健康信息和非结构化健康信息,对这两种健康信息分别进行预处理,得到预处理后的健康信息。
然后,针对预处理后的健康信息,可以对患者的身体状况进行表示,即从该健康信息中提取对应的特征,以生成对应的特征向量。具体地,在对健康信息进行特征提取的过程中,可以对两种健康信息采用不同神经网络进行处理。基于结构化健康信息得到的第一特征向量e1=NN1(input1),基于非结构化健康信息得到第二特征向量e2=f1(input1),f∈{CNN,RNN},两个特征向量合起来即为健康信息所对应的特征向量,简称特征向量e=concatenate(e1,e2)。
其次,针对特征向量,可以通过全连接层生成诊断结果,也即针对患者得出某种诊断的概率。全连接层的神经元数量与电子病历中所有诊断的数量相等,这样全连接层的输出可看作诊断的概率pd=NN2(e),pd∈R|D|,,其中D是所有诊断的集合,pi d指患者患第i个诊断的概率。
再次,基于诊断结果生成候选处方。在生成候选处方之前,为了提高候选处方生成的准确性,可以先根据医学知识构建两个二分图,分别是“诊断-药物成分”二分图与“药物成分-药物”二分图,相应的邻接矩阵分别是A1∈R|D|×|C|,A2∈R|C|×|Drug|,其中D,C,Drug分别是所有诊断、所有药物成分,所有药物的集合。在构建好两个二分图之后,可以先通过“诊断-药物成分”二分图计算药物成分的权重其中w1∈R|D|×|C|是二分图全连接时的参数矩阵,是按元素相乘,b1是偏差项,f1是激活函数。
参阅图3,图3示出了“诊断-药物成分”二分图的结构示意图,该二分图中两边顶点的连接关系是根据邻接矩阵A1和参数矩阵w1确定的,具体地,中诊断-药物成分二分图的邻接矩阵A1和参数矩阵w1可以参见下表。
邻接矩阵A<sub>1</sub> | 药物成分1 | 药物成分2 | 药物成分3 | 药物成分4 |
诊断1 | 1 | 0 | 1 | 0 |
诊断2 | 0 | 1 | 0 | 0 |
诊断3 | 0 | 1 | 0 | 1 |
表1
表2
结合两个表格和图3可以看出,在药物成分权重确定的过程中,如上述两个表,一共有3个诊断,4个药物成分,那么二部图的左侧就是3个节点,右侧就是4个节点,邻接矩阵大小是3*4,值是非0即1的,1该邻接矩阵中的两个元素之间有边,表示“诊断-药物成分”二部图的结构。而参数矩阵大小也是3*4,值是左边和右边的权重,在具体计算的时候,目的在于优化参数矩阵中的权重,邻接矩阵是不变的,需要用邻接矩阵*参数矩阵把左边顶点和右边顶点之间没有边的左边顶点权重置为0,这样算出来的右边顶点的输出是根据有连边的左边节点计算得到的。
参阅上述两个表格和图3可知,对于药物成分1和诊断2,这两个顶点在邻接矩阵中的值为0,那么相对应的,这两个顶点之间没有边;当0与参数矩阵中的0.28相乘后,诊断2的权重归零。而对于药物成分1与诊断1,两个顶点在邻接矩阵中的值为1,那么相对应的,这两个顶点之间没有边,相对应地,两个矩阵相乘后,1与参数矩阵中的0.15相乘,直接还以0.15的权重参与到计算中。
类似地,通过“药物成分-药物”二分图计算得出所有药物被开具的概率其中w2∈R|C|×|Drug|是二分图全连接时的参数矩阵,b2是偏差项,f2是激活函数,如果pi>概率阈值,表示第i个药物会被开具;如果pi≤概率阈值表示第i个药物不被开具,概率阈值是根据经验值设定,一般选0.5。因此候选处方为:则=[y1,y2,…,yi,…],其中:
最后,可以根据药物说明书上的用药禁忌去除候选处方y中年龄和过敏史禁忌的药物,得到修正后的推荐处方,返回处方报告供医生查看和参考。处方报告中包括:修正后的推荐处方和患者对应每个诊断的概率和/或每个诊断对应的药物成分的概率和/或每个药物成分对应的药物的概率,使得处方信息的形成更具解释性:将开方过程显示构建“诊断-药物成分”和“药物成分-药物”二部图,且在最终的处方报告中返回患者相应诊断、药物成分以及药物的概率,有利于医生参考以及年轻医生的学习。
应当理解的是,上述表格中的数据与图2中的数据没有对应关系,两个表格仅与图3结合对计算过程进行补充说明。
此外,本申请实施例还提供了一种基于二分图的信息推荐装置。
请参阅图4,图4是本申请实施例提供的一种基于二分图的信息推荐装置的结构框图。本实施例中该终端设备包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1以及图所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图4,基于二分图的信息推荐装置40包括:
第一确定模块41,用于基于预处理后的健康信息确定用户存在每个预设的健康隐患的隐患概率,健康隐患至少有一个;
第一构建模块42,用于基于健康隐患和预设的至少两种信息元素构建第一二分图;
第二构建模块43,用于基于信息元素和信息元素组合构建第二二分图,信息元素组合包括任意一种信息元素或者信息元素所能够组成的组合;
第二确定模块44,用于基于隐患概率、第一二分图及第二二分图确定目标信息元素组合,目标信息元素组合用于生成向用户推荐的健康建议信息。
作为本申请一实施例,上述信息推荐装置40还可以包括:
获取模块,用于在基于预处理后的健康信息确定用户存在每个预设的健康隐患的隐患概率之前,获取用户的病历;
提取模块,用于从病历中提取健康信息,健康信息包括结构化健康信息和非结构化健康信息;
预处理模块,用于对结构化信息健康信息执行标准化操作,并对非结构化信息健康信息执行编码操作,得到预处理后的健康信息。
作为本申请一实施例,上述第一确定模块41可以包括:
提取单元,用于对预处理后的健康信息进行特征提取,得到特征向量;
第一确定单元,用于基于特征向量确定用户存在每个健康隐患的隐患概率。
作为本申请一实施例,上述第二确定模块44可以包括:
第二确定单元,用于基于隐患概率和第一二分图确定各个信息元素的权重;
第三确定单元,用于基于权重和第二二分图确定各个信息元素组合被确定为目标信息元素组合的确定概率;
第四确定单元,用于将确定概率大于预设的概率阈值的信息元素组合确定为目标信息元素组合。
作为本申请一实施例,上述第二确定单元可以包括:
计算子单元,用于基于隐患概率计算第一二分图的第一邻接矩阵和第一矩阵参数;
优化子单元,用于基于第一邻接矩阵优化第一矩阵参数;
确定子单元,用于于优化后的第一矩阵参数确定各个信息元素的权重。
作为本申请一实施例,上述基于二分图的信息推荐装置40还可以包括:
第三确定模块,用于在基于隐患概率、第一二分图及第二二分图确定目标信息元素组合之后,基于目标元素组合确定候选健康建议信息;
修正模块,用于基于用户的禁忌信息对候选健康建议信息进行修正;
第四确定模块,用于将修正后的候选健康建议信息确定为健康建议信息。
作为本申请一实施例,上述基于二分图的信息推荐装置40还可以包括:
数据部署模块,用于将健康信息、隐患概率、第一二分图、第二二分图、目标信息元素组合和/或健康建议信息部署至区块链中。
应当理解的是,图4示出的基于二分图的信息推荐装置的结构框图中,各单元用于执行图1对应的实施例中的各步骤,而对于图1对应的实施例中的各步骤已在上述实施例中进行详细解释,具体请参阅图1以及图1所对应的实施例中的相关描述,此处不再赘述。
图5是本申请另一实施例提供的一种终端设备的结构框图。如图5所示,该实施例的终端设备50包括:处理器51、存储器52以及存储在上述存储器52中并可在上述处理器51上运行的计算机程序53,例如基于二分图的信息推荐方法的程序。处理器51执行上述计算机程序53时实现上述各个基于二分图的信息推荐方法各实施例中的步骤,例如图1所示的110至140。或者,所述处理器51执行所述计算机程序53时实现上述图4对应的实施例中各模块的功能,例如,图4所示的模块41至44的功能,具体请参阅图4对应的实施例中的相关描述,此处不赘述。
示例性的,所述计算机程序53可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器52中,并由所述处理器51执行,以完成本申请。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序53在所述终端50中的执行过程。例如,所述计算机程序53可以被分割成第一确定模块41、第一构建模块42、第二构建模块43以及第二确定模块44,各模块具体功能如上所述。
所述终端设备可包括,但不仅限于,处理器51、存储器52。本领域技术人员可以理解,图5仅仅是终端设备50的示例,并不构成对终端设备50的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器51可以是中央处理单元(CentralProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器52可以是所述终端设备50的内部存储单元,例如终端设备50的硬盘或内存。所述存储器52也可以是所述终端设备50的外部存储设备,例如所述终端设备50上配备的插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)等。进一步地,所述存储器52还可以既包括所述终端设备50的内部存储单元也包括外部存储设备。所述存储器52用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器52还可以用于暂时地存储已经输出或者将要输出的数据。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于二分图的信息推荐方法,其特征在于,所述信息推荐方法包括:
基于预处理后的健康信息确定用户存在每个预设的健康隐患的隐患概率,所述健康隐患至少有一个;
基于所述健康隐患和预设的至少两种信息元素构建第一二分图;
基于所述信息元素和信息元素组合构建第二二分图,所述信息元素组合包括任意一种信息元素或者所述信息元素所能够组成的组合;
基于所述隐患概率、所述第一二分图及所述第二二分图确定目标信息元素组合,所述目标信息元素组合用于生成向所述用户推荐的健康建议信息。
2.根据权利要求1所述的信息推荐方法,其特征在于,在所述基于预处理后的健康信息确定用户存在每个预设的健康隐患的隐患概率之前,包括:
获取所述用户的病历;
从所述病历中提取健康信息,所述健康信息包括结构化健康信息和非结构化健康信息;
对所述结构化信息健康信息执行标准化操作,并对所述非结构化信息健康信息执行编码操作,得到预处理后的所述健康信息。
3.根据权利要求1所述的信息推荐方法,其特征在于,所述基于预处理后的健康信息确定用户存在每个预设的健康隐患的隐患概率,包括:
对预处理后的所述健康信息进行特征提取,得到特征向量;
基于所述特征向量确定所述用户存在每个所述健康隐患的隐患概率。
4.根据权利要求1所述的信息推荐方法,其特征在于,所述基于所述隐患概率、所述第一二分图及所述第二二分图确定目标信息元素组合,包括:
基于所述隐患概率和所述第一二分图确定各个所述信息元素的权重;
基于所述权重和所述第二二分图确定各个信息元素组合被确定为目标信息元素组合的确定概率;
将所述确定概率大于预设的概率阈值的信息元素组合确定为目标信息元素组合。
5.根据权利要求4所述的信息推荐方法,其特征在于,所述基于所述隐患概率和所述第一二分图确定各个所述信息元素的权重,包括:
基于所述隐患概率计算所述第一二分图的第一邻接矩阵和第一矩阵参数;
基于所述第一邻接矩阵优化所述第一矩阵参数;
基于优化后的所述第一矩阵参数确定各个所述信息元素的权重。
6.根据权利要求1-5任意一项所述的信息推荐方法,其特征在于,在所述基于所述隐患概率、所述第一二分图及所述第二二分图确定目标信息元素组合之后,还包括:
基于所述目标信息元素组合确定候选健康建议信息;
基于所述用户的禁忌信息对所述候选健康建议信息进行修正;
将修正后的所述候选健康建议信息确定为所述健康建议信息。
7.根据权利要求1-5任意一项所述的信息推荐方法,其特征在于,所述生成方法还包括:
将所述健康信息、所述隐患概率、所述第一二分图、所述第二二分图、所述目标信息元素组合和/或所述健康建议信息部署至区块链中。
8.一种信息推荐装置,其特征在于,所述信息推荐装置包括:
第一确定模块,用于基于预处理后的健康信息确定用户存在每个预设的健康隐患的隐患概率,所述健康隐患至少有一个;
第一构建模块,用于基于所述健康隐患和预设的至少两种信息元素构建第一二分图;
第二构建模块,用于基于所述信息元素和信息元素组合构建第二二分图,所述信息元素组合包括任意一种信息元素或者所述信息元素所能够组成的组合;
第二确定模块,用于基于所述隐患概率、所述第一二分图及所述第二二分图确定目标信息元素组合,所述目标信息元素组合用于生成向所述用户推荐的健康建议信息。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210238387.9A CN114613505A (zh) | 2022-03-10 | 2022-03-10 | 基于二分图的信息推荐方法、信息推荐装置及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210238387.9A CN114613505A (zh) | 2022-03-10 | 2022-03-10 | 基于二分图的信息推荐方法、信息推荐装置及终端设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114613505A true CN114613505A (zh) | 2022-06-10 |
Family
ID=81862923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210238387.9A Pending CN114613505A (zh) | 2022-03-10 | 2022-03-10 | 基于二分图的信息推荐方法、信息推荐装置及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114613505A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115860590A (zh) * | 2023-03-02 | 2023-03-28 | 广东慧航天唯科技有限公司 | 一种企业排放污染数据的智能分析预警方法及系统 |
-
2022
- 2022-03-10 CN CN202210238387.9A patent/CN114613505A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115860590A (zh) * | 2023-03-02 | 2023-03-28 | 广东慧航天唯科技有限公司 | 一种企业排放污染数据的智能分析预警方法及系统 |
CN115860590B (zh) * | 2023-03-02 | 2023-04-28 | 广东慧航天唯科技有限公司 | 一种企业排放污染数据的智能分析预警方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021073277A1 (zh) | 一种个性化精准用药推荐方法及装置 | |
US11922348B2 (en) | Generating final abnormality data for medical scans based on utilizing a set of sub-models | |
CN108630322B (zh) | 药物相互作用建模与风险评估方法、终端设备及存储介质 | |
CN112259246B (zh) | 一种融合医学概念层级结构的疾病预测方法及相关设备 | |
US20210097381A1 (en) | Model training method and apparatus | |
CN112259245B (zh) | 待检查项确定方法、装置、设备及计算机可读存储介质 | |
CN111710383A (zh) | 病历质控方法、装置、计算机设备和存储介质 | |
CN112951362A (zh) | 药物推荐方法、装置、设备及存储介质 | |
Paranjay et al. | A neural network aided real-time hospital recommendation system | |
CN113724830B (zh) | 基于人工智能的用药风险检测方法及相关设备 | |
CN114613505A (zh) | 基于二分图的信息推荐方法、信息推荐装置及终端设备 | |
CN113657086A (zh) | 词语处理方法、装置、设备及存储介质 | |
Fitzke et al. | Rapidread: Global deployment of state-of-the-art radiology AI for a large veterinary teleradiology practice | |
KR102145858B1 (ko) | 문서 이미지로부터 인식된 용어를 표준화하기 위한 방법 | |
CN114627993A (zh) | 信息预测方法、装置、存储介质及计算机设备 | |
CN114758743A (zh) | 信息预测方法、装置、存储介质及计算机设备 | |
EP4226383A1 (en) | A system and a way to automatically monitor clinical trials - virtual monitor (vm) and a way to record medical history | |
CN113689924A (zh) | 相似病历检索方法、装置、电子设备及可读存储介质 | |
CN113782146A (zh) | 基于人工智能的全科用药推荐方法、装置、设备及介质 | |
Alsayat et al. | Multi-Layer Preprocessing and U-Net with Residual Attention Block for Retinal Blood Vessel Segmentation | |
CN117275649B (zh) | 文档病历图片的排序方法和装置、电子设备和存储介质 | |
CN110648741A (zh) | 基于局部离群因子的识别开药异常的医生的方法及装置 | |
CN111524096B (zh) | 一种肌肉骨骼x光片分类方法、控制装置及存储介质 | |
Aasen et al. | De-identification of medical images using object-detection models, generative adversarial networks and perceptual loss | |
EP3920190A1 (en) | Bias detection in sensor signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |