CN113345570A - 基于区块链和智慧医疗的大数据提取方法及大数据系统 - Google Patents
基于区块链和智慧医疗的大数据提取方法及大数据系统 Download PDFInfo
- Publication number
- CN113345570A CN113345570A CN202110682219.4A CN202110682219A CN113345570A CN 113345570 A CN113345570 A CN 113345570A CN 202110682219 A CN202110682219 A CN 202110682219A CN 113345570 A CN113345570 A CN 113345570A
- Authority
- CN
- China
- Prior art keywords
- target
- behavior
- big data
- user portrait
- medical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/60—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
- G16H40/67—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开实施例提供一种基于区块链和智慧医疗的大数据提取方法及大数据系统,目标用户画像特征是基于智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征生成的,可以表示反馈行为大数据的行为画像特征,在处理反馈行为大数据时综合考虑反馈行为大数据的行为持续特征以及行为画像特征,最终可以得到准确的行为倾向属性,从而提高反馈行为大数据的分类准确性,进而更新后续智慧医疗大数据的大数据提取策略,以更有针对性地对特定的智慧医疗大数据进行挖掘,提高大数据挖掘效率和精度。
Description
技术领域
本公开涉及智慧医疗技术领域,具体而言,涉及一种基于区块链和智慧医疗的大数据提取方法及大数据系统。
背景技术
智慧医疗是医疗信息化的升级发展,通过与大数据、云计算技术的深度融合,以医疗云数据中心为载体,为各方提供医疗大数据服务,实现医生与病人、医生与护士、大型医院与社区医院、医疗与保险、医疗机构与卫生管理部门、医疗机构与药品管理之间的六个协同,逐步构建智慧化医疗服务体系。其中,健康大数据平台的搭建为智慧医疗奠定了基础。
针对大数据在智慧医疗应用中担当的角色,大数据技术和手段的融合,会大大完善和加速对健康医疗信息推送和管理和处理的步伐。例如,基于对大数据进行挖掘处理以分析出用户的意图信息,进而便于进行信息推送优化和业务迭代更新,然而当前的大数据分析策略,通常是针对全量级别的大数据进行处理,在用户行为倾向不断变化的过程中,没有考虑到针对性地对特定的关键智慧医疗大数据进行挖掘,导致挖掘的准确性和挖掘效率仍旧有待提高。
发明内容
为了至少克服现有技术中的上述不足,本公开的目的在于提供一种基于区块链和智慧医疗的大数据提取方法及大数据系统。
第一方面,本公开提供一种基于区块链和智慧医疗的大数据提取方法,应用于大数据系统,所述大数据系统与多个智慧医疗分布式设备通信连接,所述方法包括:
根据基于所述智慧医疗分布式设备的智慧医疗大数据获得的每个医疗意图热点的信息推送策略,生成向所述智慧医疗分布式设备推送的医疗热点推送信息,并获取所述智慧医疗分布式设备针对所述医疗热点推送信息在指定业务挖掘周期内反馈的目标反馈行为大数据,其中,所述目标智慧医疗服务大数据基于所述智慧医疗分布式设备所在区块链网络的多个区块链节点进行搜集获得;
获取所述智慧医疗分布式设备的智慧医疗用户对应的目标用户画像特征,所述目标用户画像特征是基于所述智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征生成的;
提取所述目标反馈行为大数据对应的目标行为持续特征,将所述目标用户画像特征融合至所述目标行为持续特征得到目标融合特征;
提取所述目标融合特征对应的目标行为倾向特征,基于所述目标行为倾向特征得到所述目标反馈行为大数据对应的行为倾向属性,并根据所述的行为倾向属性更新所述智慧医疗大数据的大数据提取策略,其中,所述大数据提取策略用于上传到当前所述智慧医疗分布式设备对应的区块链网络的多个区块链节点中。
第二方面,本公开实施例还提供一种基于区块链和智慧医疗的大数据提取系统,所述基于区块链和智慧医疗的大数据提取系统包括大数据系统以及与所述大数据系统通信连接的多个智慧医疗分布式设备;
所述大数据系统,用于:
根据基于所述智慧医疗分布式设备的智慧医疗大数据获得的每个医疗意图热点的信息推送策略,生成向所述智慧医疗分布式设备推送的医疗热点推送信息,并获取所述智慧医疗分布式设备针对所述医疗热点推送信息在指定业务挖掘周期内反馈的目标反馈行为大数据,其中,所述目标智慧医疗服务大数据基于所述智慧医疗分布式设备所在区块链网络的多个区块链节点进行搜集获得;
获取所述智慧医疗分布式设备的智慧医疗用户对应的目标用户画像特征,所述目标用户画像特征是基于所述智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征生成的;
提取所述目标反馈行为大数据对应的目标行为持续特征,将所述目标用户画像特征融合至所述目标行为持续特征得到目标融合特征;
提取所述目标融合特征对应的目标行为倾向特征,基于所述目标行为倾向特征得到所述目标反馈行为大数据对应的行为倾向属性,并根据所述的行为倾向属性更新所述智慧医疗大数据的大数据提取策略,其中,所述大数据提取策略用于上传到当前所述智慧医疗分布式设备对应的区块链网络的多个区块链节点中。
根据上述任意一个方面,本公开提供的实施方式中,目标用户画像特征是基于智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征生成的,可以表示反馈行为大数据的行为画像特征,在处理反馈行为大数据时综合考虑反馈行为大数据的行为持续特征以及行为画像特征,最终可以得到准确的行为倾向属性,从而提高反馈行为大数据的分类准确性,进而更新后续智慧医疗大数据的大数据提取策略,以更有针对性地对特定的智慧医疗大数据进行挖掘,提高大数据挖掘效率和精度。
附图说明
图1为本公开实施例提供的基于区块链和智慧医疗的大数据提取系统的应用场景示意图;
图2为本公开实施例提供的基于区块链和智慧医疗的大数据提取方法的流程示意图;
图3为本公开实施例提供的基于区块链和智慧医疗的大数据提取装置的功能模块示意图;
图4为本公开实施例提供的用于实现上述的基于区块链和智慧医疗的大数据提取方法的大数据系统的结构示意框图。
具体实施方式
下面结合说明书附图,对本公开实施例的方案进行详细说明。以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本公开具体实施例。
图1是本公开一种实施例提供的基于区块链和智慧医疗的大数据提取系统10的场景示意图。基于区块链和智慧医疗的大数据提取系统10可以包括大数据系统100以及与大数据系统100通信连接的智慧医疗分布式设备200。图1所示的基于区块链和智慧医疗的大数据提取系统10仅为一种可行的示例,在其它可行的实施例中,该基于区块链和智慧医疗的大数据提取系统10也可以仅包括图1所示组成部分的其中的至少部分或者还可以包括其它的组成部分。
本实施例中,基于区块链和智慧医疗的大数据提取系统10中的大数据系统100和智慧医疗分布式设备200可以通过配合执行以下方法实施例所描述的基于区块链和智慧医疗的大数据提取方法,具体大数据系统100和智慧医疗分布式设备200的执行步骤部分可以参照以下方法实施例的详细描述。
为了解决前述背景技术中的技术问题,图2为本公开实施例提供的基于区块链和智慧医疗的大数据提取方法的流程示意图,本实施例提供的基于区块链和智慧医疗的大数据提取方法可以由图1中所示的大数据系统100执行,下面对该基于区块链和智慧医疗的大数据提取方法进行详细介绍。
步骤S110,根据基于所述智慧医疗分布式设备的智慧医疗大数据获得的每个医疗意图热点的信息推送策略,生成向所述智慧医疗分布式设备推送的医疗热点推送信息,并获取所述智慧医疗分布式设备针对所述医疗热点推送信息在指定业务挖掘周期内反馈的目标反馈行为大数据。
例如,大数据系统可以在本地、或从其它智慧医疗分布式设备、服务器获取智慧医疗分布式设备反馈的目标反馈行为大数据。目标反馈行为大数据可以是实时采集的反馈行为大数据,可以包括智慧医疗用户以及智慧医疗用户的关联用户(例如患者用户的亲属用户)针对该医疗热点推送信息的反馈行为数据,如订阅行为数据、分享行为数据、收藏行为数据、建议行为数据等,但不限于此。大数据系统可以实时对最新的反馈行为大数据进行分类得到对应的行为倾向属性。当然,目标反馈行为大数据也可以是历史时间采集的反馈行为大数据。大数据系统可以从数据库中获取历史时间采集的反馈行为大数据,对反馈行为大数据进行分类得到对应的行为倾向属性。
步骤S120,获取智慧医疗分布式设备的智慧医疗用户对应的目标用户画像特征,目标用户画像特征是基于智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征生成的。
其中,智慧医疗用户可以具有多个画像分类单元,一个画像分类单元对应一个用户画像维度。因此,可以基于智慧医疗用户的多个用户画像维度的画像分量特征生成用户画像特征,从而在对反馈行为大数据进行分类时,可以借助用户画像特征对反馈行为大数据进行数据处理、信息融合,从而得到更准确的行为倾向属性。用户画像特征是用于描述各个用户画像维度之间关联关系的特征信息。各个用户画像维度之间的关联关系可以根据各个用户画像维度的画像分量特征确定。进一步的,不同的智慧医疗用户的用户画像维度的特征是不同的,因此,需要针对每一种智慧医疗用户建立对应的用户画像特征,目标用户画像特征是指智慧医疗用户对应的用户画像特征。
例如,大数据系统基于用户画像维度上各个用户画像维度的画像分量特征可以生成该智慧医疗用户对应的用户画像特征。大数据系统可以预先生成各个智慧医疗用户分别对应的用户画像特征。因此,在获取到智慧医疗分布式设备反馈的目标反馈行为大数据后,大数据系统可以直接获取预先生成的目标用户画像特征。当然,大数据系统也可以实时生成智慧医疗用户对应的目标用户画像特征。因此,在获取到智慧医疗分布式设备反馈的目标反馈行为大数据后,大数据系统可以获取智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征,基于智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征实时生成目标用户画像特征。
一种实施例中,大数据系统可以基于各个用户画像维度之间的画像分量特征关联度确定行为持续指标上关联的若干个用户画像维度,将行为持续指标上关联的若干个用户画像维度建立关联关系,基于存在关联关系的用户画像维度生成用户画像特征。两个用户画像维度在行为持续指标上关联具体可以是用户画像维度之间的行为持续指标差异小于差异阈值。
一种实施例中,为了提高用户画像特征的准确性,大数据系统可以将各个用户画像维度的画像分量特征映射到用户画像知识图谱上,得到各个用户画像维度的知识图谱实体,基于各个用户画像维度之间的知识图谱实体距离确定紧密联系的若干个用户画像维度,将紧密联系的若干个用户画像维度建立关联关系,基于存在关联关系的用户画像维度生成用户画像特征。由紧密联系的若干个用户画像维度形成的用户画像实体的实体展现特征具有特定特点,因此可以基于用户画像实体的实体展现特征来判断用户画像维度是否紧密联系。可以理解,由于差异阈值是一个平均值,主要适用于大部分用户画像维度,精度不是特别高,基于差异阈值可能会遗漏一部分紧密联系的用户画像维度,从而生成的用户画像特征的准确性不是特别高。
步骤S130,提取目标反馈行为大数据对应的目标行为持续特征,将目标用户画像特征融合至目标行为持续特征得到目标融合特征。
例如,大数据系统可以对目标反馈行为大数据进行行为持续特征提取,得到目标反馈行为大数据对应的目标行为持续特征,再将目标用户画像特征融合至目标行为持续特征得到目标融合特征。
一种实施例中,大数据系统可以对目标反馈行为大数据进行多次行为持续特征提取,得到多个中间行为持续特征,各个中间行为持续特征组成目标行为持续特征。那么,在将目标用户画像特征融合至目标行为持续特征时,可以将目标用户画像特征分别融合至各个中间行为持续特征,得到各个中间行为持续特征对应的初始融合特征,由各个初始融合特征组成目标融合特征。
一种实施例中,目标行为持续特征可以表示一个业务行为在时间维度或者空间业务维度上的持续特征(如持续时间段范围、持续业务段范围等特征),可以通过编码信息来表示。将目标用户画像特征融合至目标行为持续特征得到目标融合特征具体可以通过两个矩阵相乘得到表示目标融合特征的目标融合至矩阵。
步骤S140,提取目标融合特征对应的目标行为倾向特征,基于目标行为倾向特征得到目标反馈行为大数据对应的行为倾向属性,并根据所述的行为倾向属性更新所述智慧医疗大数据的大数据提取策略。其中,所述大数据提取策略用于上传到当前所述智慧医疗分布式设备对应的区块链网络的多个区块链节点中。
例如,得到目标融合特征后,大数据系统可以进一步对目标反馈行为大数据进行行为倾向特征提取,得到目标反馈行为大数据对应的目标行为倾向特征,再基于目标行为倾向特征得到最终的行为倾向属性。
一种实施例中,大数据系统可以对目标融合特征进行多次行为倾向特征提取,得到多个中间行为倾向特征,各个中间行为倾向特征组成目标行为倾向特征。
一种实施例中,大数据系统可以借助机器学习模型对目标反馈行为大数据进行分类处理,得到目标反馈行为大数据对应的行为倾向属性。大数据系统可以预先将用户画像特征集成到行为倾向预测网络的处理层中,从而将用户画像特征集成到行为倾向预测网络中。那么。当获取到智慧医疗分布式设备反馈的目标反馈行为大数据后,大数据系统可以获取智慧医疗分布式设备对应的目标行为倾向预测网络,将目标反馈行为大数据输入目标行为倾向预测网络,通过目标行为倾向预测网络对目标反馈行为大数据进行数据处理得到对应的行为倾向属性。其中,目标行为倾向预测网络配置有智慧医疗用户对应的目标用户画像特征。
一种实施例中,基于目标行为倾向特征得到目标反馈行为大数据对应的行为倾向属性,包括:对目标行为倾向特征进行非线性处理,得到目标拟合特征;对目标拟合特征进行分类处理,得到行为倾向属性。
例如,在基于目标行为倾向特征得到行为倾向属性时,大数据系统可以对目标行为倾向特征进行非线性处理得到目标拟合特征,再对目标拟合特征进行分类处理,从而得到行为倾向属性。其中,非线性处理可以去除目标行为倾向特征中的一些冗余数据,引入非线性因素,增强模型的表达能力。分类处理是用于确定最终的行为倾向属性。
一种实施例中,大数据系统可以借助机器学习模型对目标反馈行为大数据进行分类处理。那么,大数据系统具体可以通过目标行为倾向预测网络内非线性层中的激活函数进行非线性处理,通过目标行为倾向预测网络中的全连接层进行分类处理,输出行为倾向属性。之后,譬如可以根据该行为倾向属性对所述智慧医疗大数据的大数据提取策略中相对应的提取业务节点的权重进行调整(如行为倾向属性为倾向于某个业务节点A,且该业务节点A的倾向判定次数为M,那么可以获取M对应的更新权重对大数据提取策略中相对应的提取业务节点的权重进行调整),从而基于更新后的大数据提取策略对后续采集的智慧医疗大数据进行关键数据提取,以更有针对性地对特定的智慧医疗大数据进行挖掘。
基于以上步骤,目标用户画像特征是基于智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征生成的,可以表示反馈行为大数据的行为画像特征,在处理反馈行为大数据时综合考虑反馈行为大数据的行为持续特征以及行为画像特征,最终可以得到准确的行为倾向属性,从而提高反馈行为大数据的分类准确性,进而更新后续智慧医疗大数据的大数据提取策略,以更有针对性地对特定的智慧医疗大数据进行挖掘,提高大数据挖掘效率和精度。
一种实施例中,获取智慧医疗用户对应的目标用户画像特征,包括:
获取智慧医疗分布式设备对应的目标行为倾向预测网络;目标行为倾向预测网络配置有智慧医疗用户对应的目标用户画像特征,目标行为倾向预测网络用于提取目标反馈行为大数据对应的目标行为持续特征,将目标用户画像特征融合至目标行为持续特征得到目标融合特征,提取目标融合特征对应的目标行为倾向特征,基于目标行为倾向特征得到目标反馈行为大数据对应的行为倾向属性。
其中,行为倾向预测网络是机器学习模型,用于对反馈行为大数据进行分类。行为倾向预测网络有多个,不同的智慧医疗用户对应不同的行为倾向预测网络,一个智慧医疗用户可以对应至少一个行为倾向预测网络。目标行为倾向预测网络是指智慧医疗分布式设备对应的行为倾向预测网络,并且是已训练的行为倾向预测网络。
例如,大数据系统可以将用户画像特征集成到机器学习模型中,并借助机器学习模型对目标反馈行为大数据进行分类处理。因此,当获取到智慧医疗分布式设备反馈的目标反馈行为大数据后,大数据系统可以直接获取智慧医疗分布式设备对应的目标行为倾向预测网络,将目标反馈行为大数据输入目标行为倾向预测网络,通过目标行为倾向预测网络提取目标反馈行为大数据对应的目标行为持续特征,将目标用户画像特征融合至目标行为持续特征得到目标融合特征,通过目标行为倾向预测网络提取目标融合特征对应的目标行为倾向特征,基于目标行为倾向特征得到目标反馈行为大数据对应的行为倾向属性,最终目标行为倾向预测网络输出该行为倾向属性。
一种实施例中,目标行为倾向预测网络包括行为持续特征提取单元、网络融合至层、行为持续指标特征提取单元、非线性层和全连接层,网络融合至层配置有目标用户画像特征。大数据系统可以通过行为持续特征提取单元提取目标反馈行为大数据对应的目标行为持续特征,通过网络融合至层将目标用户画像特征融合至目标行为持续特征得到目标融合特征,通过行为持续指标特征提取单元提取目标融合特征对应的目标行为倾向特征,通过非线性层对目标行为倾向特征进行非线性处理得到目标拟合特征,通过全连接层对目标拟合特征进行分类处理得到行为倾向属性,最后输出行为倾向属性。
本实施例中,将用户画像特征集成到目标行为倾向预测网络中,针对同一智慧医疗用户采集的不同反馈行为大数据仅需计算一次目标用户画像特征,能够有效提高反馈行为大数据的分类效率。此外,通过目标行为倾向预测网络就可以实现对目标反馈行为大数据的一系列数据处理,得到行为倾向属性,能够进一步提高反馈行为大数据的分类效率。
一种实施例中,获取智慧医疗分布式设备对应的目标行为倾向预测网络,包括:
确定目标大数据挖掘计划;获取目标大数据挖掘计划对应的多个候选行为倾向预测网络;候选行为倾向预测网络存在对应的候选智慧医疗用户;从各个候选行为倾向预测网络中确定智慧医疗分布式设备对应的目标行为倾向预测网络。
例如,一个智慧医疗用户可以对应多个行为倾向预测网络。不同的行为倾向预测网络对应不同的大数据挖掘计划。因此,大数据系统可以先从多个候选大数据挖掘计划中确定目标大数据挖掘计划,获取目标大数据挖掘计划对应的多个候选行为倾向预测网络,各个候选行为倾向预测网络分别对应不同的候选智慧医疗用户。为了处理智慧医疗分布式设备反馈的目标反馈行为大数据,大数据系统可以从各个候选行为倾向预测网络中确定智慧医疗分布式设备对应的目标行为倾向预测网络,进而将目标反馈行为大数据输入目标行为倾向预测网络中,进行在目标大数据挖掘计划上的分类。
一种实施例中,大数据系统可以将各个候选大数据挖掘计划依次作为目标大数据挖掘计划。进而,大数据系统最终可以得到目标反馈行为大数据在各个大数据挖掘计划上对应的行为倾向属性。
一种实施例中,大数据系统可以获取行为倾向预测请求,行为倾向预测请求携带目标计划ID和智慧医疗分布式设备反馈的目标反馈行为大数据,行为倾向预测请求用于请求对目标反馈行为大数据进行分类。大数据系统可以根据目标计划ID确定目标大数据挖掘计划,从目标大数据挖掘计划对应的多个候选行为倾向预测网络中确定智慧医疗分布式设备对应的目标行为倾向预测网络,将目标反馈行为大数据输入目标行为倾向预测网络,从而得到目标反馈行为大数据对应的行为倾向属性。其中,行为倾向预测请求可以是根据用户作用于智慧医疗分布式设备的相关界面上的触发操作生成。例如,用户可以在相关界面上选择目标大数据挖掘计划和智慧医疗分布式设备反馈的目标反馈行为大数据,进而触发生成行为倾向预测请求。行为倾向预测请求也可以是自动生成的。例如,智慧医疗分布式设备采集到反馈行为大数据,智慧医疗分布式设备就自动生成行为倾向预测请求,行为倾向预测请求中的目标计划ID可以包括一个候选大数据挖掘计划对应的计划ID,也可以包括各个候选大数据挖掘计划分别对应的计划ID。
本实施例中,一个智慧医疗用户可以对应多个行为倾向预测网络,不同的行为倾向预测网络对应不同的大数据挖掘计划,各个行为倾向预测网络各司其职,专注在自己大数据挖掘计划上的数据处理。这样,通过专门的行为倾向预测网络对目标反馈行为大数据进行数据处理,可以进一步提高行为倾向属性的准确性。
一种实施例中,目标用户画像特征的生成包括以下步骤:
(1)将各个用户画像维度的画像分量特征映射到用户画像知识图谱上,得到各个用户画像维度的知识图谱实体。
(2)从各个用户画像维度中获取目标数量个用户画像维度分别作为目标用户画像维度,得到目标数量个目标用户画像维度。
(3)基于各个目标用户画像维度的知识图谱实体生成目标用户画像实体。
例如,大数据系统可以将各个用户画像维度的画像分量特征映射到用户画像知识图谱上,得到各个用户画像维度在该用户画像知识图谱上的知识图谱实体。例如,智慧医疗分布式设备上的各个用户画像维度的行为持续指标部分位于同一行为持续指标空间中,可以将各个用户画像维度统一投影到用户画像知识图谱上,从而得到各个用户画像维度的用户画像知识图谱实体位置。进而,大数据系统可以从各个用户画像维度中获取目标数量个用户画像维度分别作为目标用户画像维度,得到目标数量个目标用户画像维度,再基于各个目标用户画像维度的知识图谱实体生成目标用户画像实体,目标用户画像实体是由各个目标用户画像维度构成的用户画像知识图谱区域。大数据系统具体可以将各个目标用户画像维度分别作为一个实体关联节点,得到多个实体关联节点,按照实体关系的方向依次连接各个实体关联节点,由各个实体关联节点构成的用户画像知识图谱部分就是目标用户画像实体。其中,目标数量可以根据实际需要进行设置。
(4)当目标用户画像实体对应的实体展现特征为预设展现特征、且目标用户画像实体内没有其它用户画像维度时,将各个目标用户画像维度建立关联关系。
其中,实体展现特征是用于描述目标用户画像实体的实体表征属性的特征信息。
例如,当目标用户画像实体对应的实体展现特征为预设展现特征、且目标用户画像实体内没有其它用户画像维度时,表明组成目标用户画像实体的各个用户画像维度为互相紧密联系的用户画像维度,此时可以将目标用户画像实体对应的各个目标用户画像维度建立关联关系。因此,当两个用户画像维度之间存在关联关系时,可以确定这两个用户画像维度彼此是紧密联系的用户画像维度。
(5)基于存在关联关系的各个用户画像维度生成目标用户画像特征。
例如,在确定各个用户画像维度之间的关联关系后,大数据系统可以基于存在关联关系的各个用户画像维度生成目标用户画像特征。大数据系统具体可以基于存在关联关系的各个用户画像维度生成智慧医疗用户对应的用户画像分布,基于用户画像分布得到目标用户画像特征。其中,用户画像分布的画像分布维度为智慧医疗用户的用户画像维度的画像维度数量,用户画像分布中的各个画像维度置信度可以反映任意两个用户画像维度之间是否存在关联关系。例如,当画像维度置信度为0时,表示对应的用户画像维度之间不存在关联关系,当画像维度置信度为1时,表示对应的用户画像维度之间存在关联关系。
本实施例中,通过将各个用户画像维度的画像分量特征映射到用户画像知识图谱上,得到各个用户画像维度的知识图谱实体;从各个用户画像维度中获取目标数量个用户画像维度分别作为目标用户画像维度,得到目标数量个目标用户画像维度;基于各个目标用户画像维度的知识图谱实体生成目标用户画像实体;当目标用户画像实体对应的实体展现特征为预设展现特征、且目标用户画像实体内没有其它用户画像维度时,将各个目标用户画像维度建立关联关系;基于存在关联关系的各个用户画像维度生成目标用户画像特征。这样,对各个目标区域画像维度的知识图谱实体进行分析能够快速准确地查找出彼此紧密联系的用户画像维度,从而生成准确的目标用户画像特征。
一种实施例中,基于各个目标用户画像维度的知识图谱实体生成目标用户画像实体,包括:
将各个目标用户画像维度分别作为实体关联节点,得到多个实体关联节点;将各个实体关联节点依次连接,得到目标用户画像实体。
例如,在生成目标用户画像实体时,大数据系统可以将各个目标用户画像维度分别作为实体关联节点,得到多个实体关联节点,按照实体关系的方向依次连接各个实体关联节点,由各个顶点连线包围而成的用户画像知识图谱区域即为当前用户画像维度对应的目标用户画像实体。这样,可以快速生成目标用户画像实体。
一种实施例中,实体展现特征包括目标用户画像实体的各个实体关联节点对应的实体属性,当目标用户画像实体对应的实体展现特征为预设展现特征、且目标用户画像实体内没有其它用户画像维度时,将各个目标用户画像维度建立关联关系,包括:
当各个实体属性均在预设正常实体属性区间内时,确定目标用户画像实体对应的实体展现特征为预设展现特征;当实体展现特征为预设展现特征的目标用户画像实体内没有其它用户画像维度时,基于各个实体关联节点之间的连接关系建立各个目标用户画像维度之间的关联关系。
例如,一个目标用户画像实体的实体关联节点对应的实体属性可以用于反映区域的实体展现特征。因此,大数据系统可以计算目标用户画像实体的各个实体关联节点对应的实体属性,由目标用户画像实体的各个实体关联节点对应的实体属性组成目标用户画像实体对应的实体展现特征,也就是,实体展现特征包括目标用户画像实体的各个实体关联节点对应的实体属性。大数据系统具体可以通过各个实体关联节点之间的关系参数计算各个实体关联节点对应的实体属性。
相应的,当一个目标用户画像实体的展现特征为预设展现特征时,该区域对应的实体属性是具备一定特点的。因此,可以预先设置实体展现特征为预设展现特征的用户画像实体的实体属性所对应的参考属性区间。当各个实体属性均在预设正常实体属性区间内时,大数据系统就可以确定目标用户画像实体对应的实体展现特征为预设展现特征。进一步的,当实体展现特征为预设展现特征的目标用户画像实体内没有其它用户画像维度时,表明在该目标用户画像实体内没有其它冗余用户画像维度,组成目标用户画像实体的各个目标用户画像维度是一个紧密联系的用户画像维度组合,此时可以基于各个实体关联节点之间的连接关系建立各个目标用户画像维度之间的关联关系。
一种实施例中,基于存在关联关系的各个用户画像维度生成目标用户画像特征,包括:
(1)基于存在关联关系的各个用户画像维度生成初始用户画像特征。
(2)对初始用户画像特征进行规范化处理,得到目标用户画像特征。
其中,规范化处理是用于将初始用户画像特征限制在一定区间内,以便后续将目标用户画像特征融合至目标行为持续特征。具体可以通过自定义公式对初始用户画像特征进行规范化处理,得到目标用户画像特征。
例如,在基于存在关联关系的各个用户画像维度生成目标用户画像特征时,大数据系统可以直接基于存在关联关系的各个用户画像维度生成目标用户画像特征。然而,为了后续将目标用户画像特征融合至目标行为持续特征时,不改变原始触发行为的赋值范围,大数据系统也可以先基于存在关联关系的各个用户画像维度生成初始用户画像特征,对初始用户画像特征进行规范化处理后得到目标用户画像特征。
一种实施例中,用户画像特征可以通过编码特征信息来表示,编码特征信息的维度为智慧医疗用户的用户画像维度的画像维度数量。后续在将目标用户画像特征融合至目标行为持续特征时,可以是进行编码特征信息的融合。
本实施例中,通过基于存在关联关系的各个用户画像维度生成初始用户画像特征,对初始用户画像特征进行规范化处理,得到目标用户画像特征。规范化处理能够提高目标用户画像特征的有效性和准确性,以便后续将目标用户画像特征融合至目标行为持续特征。
一种实施例中对初始用户画像特征进行规范化处理,得到目标用户画像特征,包括:
(1)基于初始用户画像特征生成初始用户画像分布。
例如,大数据系统可以基于初始用户画像特征生成初始用户画像分布,以矩阵的形式来表示初始用户画像特征,以便后续的计算处理。
一种实施例中,基于初始用户画像特征生成初始用户画像分布包括以下方式中的任意一种:
基于智慧医疗用户的用户画像维度的画像维度数量确定初始用户画像分布的画像分布维度,将存在关联关系的各个用户画像维度对应的画像维度置信度确定为第一目标值,将其它用户画像维度对应的画像维度置信度确定为第二目标值,得到初始用户画像分布;
基于智慧医疗用户的用户画像维度的画像维度数量确定初始用户画像分布的画像分布维度,基于存在关联关系的各个用户画像维度之间的画像分量特征关联度,确定存在关联关系的各个用户画像维度对应的画像维度置信度,将其它用户画像维度对应的画像维度置信度确定为第二目标值,得到初始用户画像分布。
例如,初始用户画像分布可以是一个无权网络,只包含用户画像维度之间的关联关系。因此,在生成初始用户画像分布时,大数据系统可以将智慧医疗用户的用户画像维度的画像维度数量作为初始用户画像分布的画像分布维度,将存在关联关系的各个用户画像维度对应的画像维度置信度设置为第一目标值,将其它用户画像维度对应的画像维度置信度设置为第二目标值,从而得到初始用户画像分布。其中,第一目标值和第二目标值可以根据需要进行设置。
初始用户画像分布也可以是一个有权网络,包含用户画像维度之间的关联关系和画像分量特征关联度。因此,在生成初始用户画像分布时,大数据系统可以基于智慧医疗用户的用户画像维度的画像维度数量确定初始用户画像分布的画像分布维度,基于存在关联关系的各个用户画像维度之间的画像分量特征关联度确定存在关联关系的各个用户画像维度对应的画像维度置信度,将其它用户画像维度对应的画像维度置信度确定为第二目标值,从而得到初始用户画像分布。其中,可以将画像分量特征关联度的倒数作为画像维度置信度。
(2)获取基础用户画像分布,融合基础用户画像分布和初始用户画像分布得到中间用户画像分布。
(3)获取初始用户画像分布对应的扩展用户画像分布,融合扩展用户画像分布和中间用户画像分布得到目标用户画像分布。
(4)基于目标用户画像分布得到目标用户画像特征。
一种实施例中,目标反馈行为大数据包括各个用户画像维度分别对应的反馈行为大数据,提取目标反馈行为大数据对应的目标行为持续特征,包括:
获取至少一个行为持续提取单元;基于同一行为持续提取单元分别提取各个反馈行为大数据对应的行为持续子特征,得到各个行为持续提取单元分别对应的多个行为持续子特征;基于同一行为持续提取单元对应的多个行为持续子特征生成中间行为持续特征,得到各个行为持续提取单元对应的中间行为持续特征;基于各个中间行为持续特征得到目标行为持续特征。
例如,不同的行为持续提取单元用于提取不同持续原因的行为持续特征,例如,一个行为持续提取单元侧重于提取触发行为的起始行为持续特征,一个行为持续提取单元侧重于提取触发行为的末尾行为持续特征。在提取目标反馈行为大数据对应的目标行为持续特征时,大数据系统可以基于行为持续提取单元对各个用户画像维度对应的反馈行为大数据分别提取行为持续特征,也就是,基于同一行为持续提取单元分别提取各个反馈行为大数据对应的行为持续子特征。因为行为持续提取单元有多个,所以最终可以得到各个行为持续提取单元分别对应的多个行为持续子特征。进而,大数据系统可以基于同一行为持续提取单元对应的多个行为持续子特征生成中间行为持续特征,例如,将同一行为持续提取单元对应的多个行为持续子特征进行拼接得到中间行为持续特征。最后,大数据系统可以基于各个中间行为持续特征得到目标行为持续特征,例如,由各个中间行为持续特征组成目标行为持续特征。
一种实施例中,目标行为倾向预测网络包括行为持续特征提取单元,行为持续特征提取单元用于提取目标反馈行为大数据的行为持续特征。行为持续特征提取单元包括至少一个行为持续提取单元。大数据系统将目标反馈行为大数据输入目标行为倾向预测网络后,可以通过行为持续特征提取单元提取目标反馈行为大数据对应的目标行为持续特征。在行为持续特征提取单元中,基于同一行为持续提取单元分别提取各个反馈行为大数据对应的行为持续子特征,得到各个行为持续提取单元分别对应的多个行为持续子特征,基于同一行为持续提取单元对应的多个行为持续子特征生成中间行为持续特征,得到各个行为持续提取单元对应的中间行为持续特征,基于各个中间行为持续特征得到目标行为持续特征。
本实施例中,行为持续特征提取单元包括至少一个行为持续提取单元,不同的行为持续提取单元用于提取不同持续原因的行为持续特征,从而目标行为持续特征可以包括多个行为原因的行为持续特征,提高了目标行为持续特征的丰富度和准确性。
一种实施例中,目标行为持续特征包括多个中间行为持续特征,将目标用户画像特征融合至目标行为持续特征得到目标融合特征,包括:
将目标用户画像特征分别融合至各个中间行为持续特征,得到各个中间行为持续特征对应的初始融合特征;基于各个初始融合特征得到目标融合特征。
例如,当目标行为持续特征为单个行为持续特征时,大数据系统可以将目标用户画像特征直接融合至目标行为持续特征,得到目标融合特征。当目标行为持续特征包括多个行为持续特征,也就是,目标行为持续特征包括多个中间行为持续特征时,大数据系统就需要将目标用户画像特征分别融合至各个中间行为持续特征,得到各个中间行为持续特征对应的初始融合特征,再将各个初始融合特征组成目标融合特征。
本实施例中,当目标行为持续特征包括多个中间行为持续特征时,需要将目标用户画像特征分别融合至各个中间行为持续特征,得到各个中间行为持续特征对应的初始融合特征;基于各个初始融合特征得到目标融合特征。这样,能够得到比较准确的目标融合特征。
一种实施例中,用户画像特征包括各个用户画像维度分别对应的画像子特征,中间行为持续特征包括各个用户画像维度分别对应的行为持续子特征。将目标用户画像特征分别融合至各个中间行为持续特征,得到各个中间行为持续特征对应的初始融合特征,包括:
在当前中间行为持续特征中,将同一用户画像维度对应的画像子特征融合至对应的行为持续子特征,得到各个用户画像维度分别对应的融合至子特征;基于各个融合至子特征得到当前中间行为持续特征对应的初始融合特征。
例如,用户画像特征包括各个用户画像维度分别对应的画像子特征,中间行为持续特征包括各个用户画像维度分别对应的行为持续子特征。在将目标用户画像特征融合至中间行为持续特征时,需要将同一用户画像维度对应的画像子特征和行为持续子特征进行融合。因此,以当前中间行为持续特征为例,大数据系统可以将同一用户画像维度对应的画像子特征融合至对应的行为持续子特征,得到各个用户画像维度分别对应的融合至子特征,再由各个融合至子特征组成当前中间行为持续特征对应的初始融合特征。同理,对其它中间行为持续特征进行类似处理,最终可以得到各个中间行为持续特征分别对应的初始融合特征。
本实施例中,将同一用户画像维度对应的画像子特征和行为持续子特征进行融合,能够得到比较准确的初始融合特征。
一种实施例中,提取目标融合特征对应的目标行为倾向特征,包括:
获取至少一个行为倾向提取单元;基于各个行为倾向提取单元分别对目标融合特征进行行为倾向特征提取,得到各个行为倾向提取单元分别对应的中间行为倾向特征;基于各个中间行为倾向特征得到目标行为倾向特征。
例如,不同的行为倾向提取单元用于提取不同持续原因的行为倾向特征。在提取目标融合特征对应的目标行为倾向特征时,大数据系统可以基于行为倾向提取单元对目标融合特征进行行为倾向特征提取,得到中间行为倾向特征。因为行为倾向提取单元有多个,所以最终可以得到各个行为倾向提取单元分别对应的中间行为倾向特征。进而,大数据系统可以基于各个中间行为倾向特征得到目标行为倾向特征,例如,由各个中间行为倾向特征组成目标行为倾向特征。
一种实施例中,目标行为倾向预测网络包括行为持续指标特征提取单元,行为持续指标特征提取单元用于提取目标反馈行为大数据的行为倾向特征,行为持续指标特征提取单元包括至少一个行为倾向提取单元。大数据系统可以通过目标行为倾向预测网络中的行为持续指标特征提取单元提取目标融合特征对应的目标行为倾向特征。在行为持续指标特征提取单元中,基于各个行为倾向提取单元分别对目标融合特征进行行为倾向特征提取,得到各个行为倾向提取单元分别对应的中间行为倾向特征,基于各个中间行为倾向特征得到目标行为倾向特征。
本实施例中,行为持续指标特征提取单元包括至少一个行为倾向提取单元,不同的行为倾向提取单元用于提取不同持续原因的行为倾向特征,从而目标行为倾向特征可以包括多持续原因的行为倾向特征,提高了目标行为倾向特征的丰富度和准确性。
一种实施例中,提供了一种基于区块链和智慧医疗的大数据提取方法,基于区块链和智慧医疗的大数据提取方法包括以下步骤:
步骤S210,获取智慧医疗分布式设备采集的样本反馈行为大数据和样本反馈行为大数据对应的样本标注信息。
其中,样本反馈行为大数据是指用于模型训练的反馈行为大数据。样本标注信息是指样本反馈行为大数据对应的正确行为倾向属性。
例如,大数据系统可以获取智慧医疗分布式设备采集的样本反馈行为大数据和样本反馈行为大数据对应的样本标注信息,基于样本反馈行为大数据和对应的样本标注信息对智慧医疗分布式设备对应的初始行为倾向预测网络进行有监督训练,得到智慧医疗分布式设备对应的目标行为倾向预测网络。
步骤S220,将样本反馈行为大数据输入智慧医疗分布式设备对应的初始行为倾向预测网络;初始行为倾向预测网络包括智慧医疗用户对应的目标用户画像特征,目标用户画像特征是基于智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征生成的。
其中,初始行为倾向预测网络是指待训练的行为倾向预测网络。
例如,大数据系统可以基于智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征生成智慧医疗用户对应的目标用户画像特征,将目标用户画像特征集成到智慧医疗分布式设备对应的初始行为倾向预测网络中。进而,大数据系统可以获取智慧医疗分布式设备采集的样本反馈行为大数据和样本反馈行为大数据对应的样本标注信息,基于样本反馈行为大数据和对应的样本标注信息对初始行为倾向预测网络进行有监督训练,得到目标行为倾向预测网络。
其中,生成目标用户画像特征的具体过程可以参照前述行为倾向预测处理方法的各个相关实施例所述的基于区块链和智慧医疗的大数据提取方法,此处不再赘述。
步骤S230,通过初始行为倾向预测网络提取样本反馈行为大数据对应的目标行为持续特征,将目标用户画像特征融合至目标行为持续特征得到目标融合特征。
步骤S240,通过初始行为倾向预测网络提取目标融合特征对应的目标行为倾向特征,基于目标行为倾向特征得到样本反馈行为大数据对应的分类信息。
其中,分类信息是指初始行为倾向预测网络输出的预测行为倾向属性。
例如,大数据系统可以通过初始行为倾向预测网络提取样本反馈行为大数据对应的目标行为持续特征,将目标用户画像特征融合至目标行为持续特征得到目标融合特征,提取目标融合特征对应的目标行为倾向特征,基于目标行为倾向特征得到样本反馈行为大数据对应的分类信息。
其中,模型对输入数据进行数据处理的具体过程可以参照前述行为倾向预测处理方法的各个相关实施例所述的基于区块链和智慧医疗的大数据提取方法,此处不再赘述。
步骤S250,基于样本标注信息和分类信息的差异调整初始行为倾向预测网络的模型参数,直至满足收敛条件,得到目标行为倾向预测网络,基于所述目标行为倾向预测网络对指定业务挖掘周期内反馈的目标反馈行为大数据进行预测,得到所述目标反馈行为大数据对应的行为倾向属性,并根据所述的行为倾向属性更新所述智慧医疗大数据的大数据提取策略,其中,所述大数据提取策略用于上传到当前所述智慧医疗分布式设备对应的区块链网络的多个区块链节点中。
其中,目标行为倾向预测网络是指训练完成的行为倾向预测网络。
例如,大数据系统将样本反馈行为大数据输入智慧医疗分布式设备对应的初始行为倾向预测网络,可以得到样本反馈行为大数据对应的分类信息,再基于样本标注信息和分类信息的差异计算训练模型评估指标值,基于训练模型评估指标值进行反向传播更新,调整初始行为倾向预测网络的模型参数,直至满足收敛条件,得到目标行为倾向预测网络。收敛条件可以是训练模型评估指标值小于模型评估指标值阈值、模型迭代次数达到迭代阈值等。
一种实施例中,可以选择交叉熵损失函数作为模型的损失函数,使用经典的梯度反向传播算法进行模型参数更新。
一种实施例中,一个智慧医疗用户可以对应多个行为倾向预测网络。不同的行为倾向预测网络对应不同的大数据挖掘计划。因此,样本标注信息可以是样本反馈行为大数据在目标大数据挖掘计划下对应的样本标注信息。那么,大数据系统基于样本反馈行为大数据和对应的样本标注信息训练得到目标行为倾向预测网络,该目标行为倾向预测网络是专门输出对目标反馈行为大数据在目标大数据挖掘计划下对应的行为倾向属性。
如此设计,目标用户画像特征是基于智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征生成的,可以表示反馈行为大数据的行为画像特征。在处理反馈行为大数据时综合考虑反馈行为大数据的行为持续特征以及行为画像特征,最终可以得到准确的行为倾向属性,从而提高反馈行为大数据的分类准确性。此外,将目标用户画像特征集成至模型中,针对同一智慧医疗用户采集的不同反馈行为大数据仅需计算一次目标用户画像特征,从而有效提高反馈行为大数据的分类效率。
一种实施例中,本公开实施例提供的基于区块链和智慧医疗的大数据提取方法,还可以包括以下步骤:
步骤A110,获取目标智慧医疗服务大数据,从目标智慧医疗服务大数据中确定目标查询行为数据,并分别从目标查询行为数据和目标查询行为数据对应的跳转查询行为数据中提取查询意图对象,生成各个查询意图对象对应的查询意图分量,得到目标查询行为数据对应的目标查询意图分量序列和跳转查询行为数据对应的跳转查询意图分量序列;目标查询意图分量序列包括目标查询行为数据中的各个目标查询意图对象分别对应的查询意图分量,跳转查询意图分量序列包括跳转查询行为数据中的各个跳转查询意图对象分别对应的查询意图分量。
目标查询意图对象是从目标查询行为数据中提取到的查询意图对象,跳转查询意图对象是从跳转查询行为数据中提取得到的查询意图对象。目标查询意图分量序列包括目标查询行为数据中的各个目标查询意图对象分别对应的查询意图分量。跳转查询意图分量序列包括跳转查询行为数据中的各个跳转查询意图对象分别对应的查询意图分量。
例如,大数据系统100可以从目标查询行为数据中提取查询意图对象,得到至少一个目标查询意图对象,生成各个目标查询意图对象对应的查询意图分量,从而得到目标查询行为数据对应的目标查询意图分量序列。大数据系统100可以从跳转查询行为数据中提取查询意图对象,得到至少一个跳转查询意图对象,生成各个跳转查询意图对象对应的查询意图分量,从而得到跳转查询行为数据对应的跳转查询意图分量序列。
步骤A120,基于目标查询意图对象和跳转查询意图对象之间的分量相关度,将目标查询意图对象和跳转查询意图对象进行匹配,并基于匹配成功的目标查询意图对象和跳转查询意图对象的跳转相关度生成目标查询意图对象对应的跳转属性分量。
例如,目标查询意图对象和跳转查询意图对象之间的分量相关度是指目标查询意图对象对应的查询意图分量和跳转查询意图对象对应的查询意图分量之间的相似行为的量化值。大数据系统100可以基于目标查询意图对象和跳转查询意图对象之间的分量相关度进行目标查询意图对象和跳转查询意图对象的匹配,来确定相互匹配的目标查询意图对象和跳转查询意图对象。
其中,目标查询意图对象和跳转查询意图对象的跳转相关度是指目标查询意图对象和跳转查询意图对象的意图在跳转过程中的相似行为的量化值。跳转属性分量是用于表示目标查询意图对象的跳转信息。
例如,在进行目标查询意图对象和跳转查询意图对象的匹配时,有的目标查询意图对象可以找到相互匹配的跳转查询意图对象,有的目标查询意图对象找不到相互匹配的跳转查询意图对象。当目标查询意图对象和跳转查询意图对象相互匹配时,表明目标查询意图对象和跳转查询意图对象匹配成功。匹配成功的目标查询意图对象和跳转查询意图对象可以认为是在不同查询行为数据上的同一查询意图对象,因此,基于匹配成功的目标查询意图对象和跳转查询意图对象的跳转相关度可以生成目标查询意图对象对应的跳转属性分量。
一种实施例中,跳转查询行为数据包括前向查询行为数据和后向查询行为数据中的至少一种。可以将前向查询行为数据中的查询意图对象作为前向查询意图对象,基于匹配成功的目标查询意图对象和前向查询意图对象的跳转相关度可以生成目标查询意图对象对应的前向跳转属性分量。同理,可以将后向查询行为数据中的查询意图对象作为后向查询意图对象,基于匹配成功的目标查询意图对象和后向查询意图对象的跳转相关度可以生成目标查询意图对象对应的后向跳转属性分量。由于目标查询行为数据中通常包括多个目标查询意图对象,因此,最终可以得到多个前向跳转属性分量和多个后向跳转属性分量,各个前向跳转属性分量可以组成前向跳转属性分量序列,各个后向跳转属性分量可以组成后向跳转属性分量序列。
一种实施例中,可以直接将匹配成功的目标查询意图对象和跳转查询意图对象的跳转相关度作为对应的目标查询意图对象的跳转属性分量。
步骤A130,将同一目标查询意图对象对应的跳转属性分量和查询意图分量进行融合,得到对应的融合意图分量,基于融合意图分量更新目标查询意图分量序列,得到更新查询意图分量序列。
例如,当确定目标查询意图对象对应的跳转属性分量后,大数据系统100可以将目标查询意图对象对应的跳转属性分量和查询意图分量进行融合,得到该目标查询意图对象对应的融合意图分量。跳转属性分量可以表示目标查询意图对象的跳转信息,特征可以表示目标查询意图对象对应的局部查询行为数据部分的查询行为数据信息,将跳转属性分量和查询意图分量融合得到的融合意图分量可以同时表示目标查询意图对象的跳转信息和查询行为数据信息。进而,大数据系统100可以基于融合意图分量更新目标查询意图分量序列,得到更新查询意图分量序列。
步骤A140,基于目标查询行为数据对应的更新查询意图分量序列得到目标智慧医疗服务大数据对应的跳转挖掘意图。
其中,跳转挖掘意图是用于代表智慧医疗服务大数据内容的意图挖掘信息,跳转挖掘意图可以应用于智慧医疗服务大数据推荐、智慧医疗服务大数据搜索等应用场景。
例如,大数据系统100基于目标查询行为数据对应的更新查询意图分量序列得到目标智慧医疗服务大数据对应的跳转挖掘意图。可以理解,当目标查询行为数据有多个时,大数据系统100可以得到各个目标查询行为数据分别对应的更新查询意图分量序列,各个更新查询意图分量序列组成目标智慧医疗服务大数据对应的跳转挖掘意图。更新查询意图分量序列也可以作为目标查询行为数据对应的查询行为数据意图。
在进行智慧医疗服务大数据匹配时,可以计算第一智慧医疗服务大数据的查询行为数据和第二智慧医疗服务大数据的查询行为数据中查询意图对象之间的更新分量相关度,从而确定查询行为数据之间的相似查询意图对象数量,基于查询行为数据之间的相似查询意图对象数量计算匹配查询意图对象比例,从而基于匹配查询意图对象比例确定查询行为数据是否为相似查询行为数据。进而,基于相似查询行为数据数量确定相似查询行为数据比例,从而基于相似查询行为数据比例确定第一智慧医疗服务大数据和第二智慧医疗服务大数据的智慧医疗服务大数据匹配结果。智慧医疗服务大数据匹配的具体过程可以参照后述智慧医疗服务大数据匹配方法的各个相关实施例所述的基于区块链和智慧医疗的大数据提取方法,此处不再赘述。
基于上述步骤,查询意图对象的特征信息可以用于表示查询行为数据的部分意图信息,不同的查询意图对象对应不同的部分意图信息,基于各个查询行为数据中各个查询意图对象的特征信息生成的跳转挖掘意图的信息更丰富更全面,能够有效提高跳转挖掘意图的准确性。进一步的,查询意图对象的特征信息不仅包括查询行为数据信息还包括跳转信息,相应的,跳转挖掘意图不仅包括查询行为数据信息还包括跳转信息,那么在基于跳转挖掘意图进行查询行为数据匹配时,可以有效提高智慧医疗服务大数据匹配的准确性。
一种实施例中,在前述实施例的基础上,该方法可以包括以下步骤。
步骤B110,基于目标智慧医疗服务大数据对应的跳转挖掘意图在应用各个智慧医疗推荐词条时生成的第一医疗意图热点序列中每个医疗意图热点的多个热点反馈行为,确定对应的第一热点有效匹配度,并从第一热点有效匹配度的降序结果中选取预设数量的多个医疗意图热点,以形成第二医疗意图热点序列。
步骤B120,对第二医疗意图热点序列中每个医疗意图热点的多个热点反馈行为进行特征提取,得到对应每个医疗意图热点的多个热点反馈知识点特征。
步骤B130,基于第二医疗意图热点序列中每个医疗意图热点的多个热点反馈知识点特征,确定对应的第二热点有效匹配度。
步骤B140,基于第二医疗意图热点序列中每个医疗意图热点的第二热点有效匹配度的降序结果,分别执行每个医疗意图热点的信息推送策略的策略规则配置。
其中,医疗意图热点可以是指可能产生跳转挖掘意图的应用各个智慧医疗推荐词条时所针对的与之匹配的推送热点信息,热点反馈行为可以用于表征产生热点反馈时的行为特征情况。热点有效匹配度可以用于表示在产生热点反馈行为可以转换到具有有效推送价值的概率。热点反馈知识点特征可以用于表示产生热点反馈行为时的指数特征情况以一预设图网络为向量填充单位的特征向量。
本实施例中,在步骤B140中,可以基于第二医疗意图热点序列中每个医疗意图热点的第二热点有效匹配度的降序结果,分别执行每个医疗意图热点的信息推送策略的策略规则配置,这样每个医疗意图热点的信息推送策略的层级可以按照第二热点有效匹配度的由高到低的顺序进行依次配置,由此在之后的威胁防护过程中可以以热点有效匹配度更高的医疗意图热点进行优先启用推送,从而可以保证信息推送策略的针对性和精度。
基于上述步骤,本实施例通过将热点反馈行为用于第一热点有效匹配度确定,并在进行第二热点有效匹配度的确定时复用对应同样特征的热点反馈知识点特征,减少了不同阶段热点有效匹配度的确定过程中所需要进行多次数据处理所带来的工作量,通过分阶段热点有效匹配度确定的方式,相比于对大量信息进行一次性进行热点有效匹配度的确定,效率更高,且基于热点反馈知识点特征进一步确定第二热点有效匹配度可以进一步提高确定热点有效匹配度的精度且降低信息推送策略的复杂度,从而基于第一热点有效匹配度和第二热点有效匹配度能够对医疗意图热点进行全面的排序,并以此进行后续的信息推送策略的层级确定,保证了信息推送策略的针对性和精度。
一种实施例中,针对步骤B110,第一医疗意图热点序列通过以下方式获得:
子步骤B111,获取目标智慧医疗服务大数据对应的跳转挖掘意图在应用智慧医疗推荐词条时解析到的智慧医疗推荐数据源在应用业务范围内每个应用业务节点的应用推荐内容数据。
子步骤B112,根据每个应用业务节点的应用推荐内容数据确定与智慧医疗推荐数据源对应的每个应用数据源目标,对于每个应用数据源目标,从剩余的应用业务节点的应用推荐内容数据中分别确定与当前应用数据源目标存在联动应用的目标应用数据源目标。
子步骤B113,对当前应用数据源目标进行热点更新特征查找,并对目标应用数据源目标进行热点更新特征查找,分别得到当前应用数据源目标的第一热点更新特征查找信息和目标应用数据源目标的第二热点更新特征查找信息。
子步骤B114,根据第一热点更新特征查找信息和第二热点更新特征查找信息生成每个当前应用数据源目标与对应的目标应用数据源目标的热点更新关联特征。
子步骤B115,根据热点更新关联特征分别对每个当前应用数据源目标与对应的目标应用数据源目标进行解析,并将解析到的源热点标签信息按照时序排列的方式进行组合后,得到多个组合源热点标签信息序列,并基于随机森林树模型对每个组合源热点标签信息序列进行生成智慧医疗推荐数据源的源热点分类属性。
子步骤B116,根据源热点分类属性所对应的热点匹配信息获取对应的医疗意图热点,作为第一医疗意图热点序列。
本实施例中,智慧医疗推荐数据源可以是指目标智慧医疗服务大数据对应的跳转挖掘意图200预先配置的推送规则所指定的数据源,应用业务范围可以根据不同的业务需求进行灵活设置,对于此不作具体限制。每个应用业务节点可以用于针对应用过程中的不同应用参数进行应用匹配,具体可根据实际的应用环境进行灵活设计,在此不作具体限制。
本实施例中,应用数据源目标可以理解为可能进行后续推送信息配置的数据源对象。
本实施例中,第一热点更新特征查找信息和第二热点更新特征查找信息分别包括各自对应的热点更新源的更新日志信息,热点更新源可以分别为各自对应的热点应用服务所关联的多个预设的更新源对象。
基于上述设计,本实施例通过确定出每个应用业务节点的每个应用数据源目标以及与当前应用数据源目标存在联动应用的目标应用数据源目标,因而可以基于应用数据源目标和目标应用数据源目标的关联关系进行热点更新特征查找后,通过随机森林树模型进行解析,从而可以能够提高智慧医疗推荐数据源在应用业务范围内的热点更新源上的医疗意图热点行为的判别准确性,提高医疗意图热点识别的准确性。
一种实施例中,仍旧针对步骤B110,每个医疗意图热点的热点反馈行为可以通过以下详细的实施方式获得:
子步骤B117,针对第一医疗意图热点序列中的每个医疗意图热点,从意图热点知识图谱的热点反馈行为数据集合中,查询与医疗意图热点的热点特征属性对应的热点反馈行为。
其中,意图热点知识图谱可以用于基于热点反馈行为确定第一热点有效匹配度。例如,可以预先收集大量的热点反馈行为的样本和对应的热点有效匹配度进行模型训练,从而可以得到意图热点知识图谱,得到的意图热点知识图谱可以具有热点有效匹配度的预测能力。
子步骤B118,当医疗意图热点的热点特征属性是对应意图热点知识图谱的热点特征属性,且从意图热点知识图谱的热点反馈行为数据集合中未查询到热点特征属性时,将热点特征属性的热点操作行为数据转化为操作行为特征信息,并将操作行为特征信息进行编码,得到操作行为特征编码信息。
子步骤B119,将热点特征属性的热点标签信息进行编码得到热点标签编码信息,并将热点标签编码信息以及操作行为特征编码信息进行融合,得到医疗意图热点的热点反馈行为。
其中,作为一种可能的示例,针对步骤B115,在基于随机森林树模型对每个组合源热点标签信息序列进行生成智慧医疗推荐数据源的源热点分类属性的过程中,可以通过以下示例性的子步骤实现,详细描述如下。
子步骤B1151,基于随机森林树模型提取每个组合源热点标签信息序列的特征信息,并将组合源热点标签信息序列的特征信息输入到分类层进行分类,输出组合源热点标签信息序列的特征信息在每个热点匹配信息的置信度。
子步骤B1152,根据组合源热点标签信息序列的特征信息在每个热点匹配信息的置信度得到智慧医疗推荐数据源的源热点分类属性。
例如,假设组合源热点标签信息序列的特征信息在某个热点匹配信息A的置信度大于设定置信度,则表示源热点分类属性为热点匹配信息A,从而以便于后续的信息推送策略的选定。例如,可以选定不同热点匹配信息对应的信息推送策略,具体配置过程可以根据实际业务的具体情况进行配置,在此不作具体限制。
一种实施例中,对于步骤B120而言,当热点反馈行为为单一反馈行为时,可以将分别对应多个热点反馈行为的影响权重,与对应的热点反馈行为进行权重计算,得到对应每个医疗意图热点的多个热点反馈知识点特征。
本实施例中,权重计算的方式可以是指乘以各自对应的权重参数后,再一起进行融合处理。值得说明的是,在之后的权重计算的过程中可以参照以上示例进行,此后的描述中不再进行赘述。
又例如,在另一种可能的情况下,当热点反馈行为为复合反馈行为时,将分别对应多个热点反馈行为的影响权重,与对应的热点反馈行为的多个行为分量进行权重计算,并对权重计算结果进行加权处理,得到对应每个医疗意图热点的多个热点反馈知识点特征。
另一种实施例中,对于步骤B120而言,可以针对第二医疗意图热点序列中的每个医疗意图热点,获取医疗意图热点的预期反馈行为,且预期反馈行为与每次被生成的候选反馈行为相关。
例如,当热点反馈行为和预期反馈行为为单一反馈行为时,将分别对应多个预期反馈行为的影响权重,与对应的预期反馈行为进行权重计算,得到对应每个医疗意图热点的多个热点反馈知识点特征。在此基础上,可以将分别对应多个热点反馈行为的影响权重,与对应的热点反馈行为进行权重计算,得到对应每个医疗意图热点的多个热点反馈知识点特征。
再例如,在另一种可能的情况下,当热点反馈行为和预期反馈行为为复合反馈行为时,将分别对应多个预期反馈行为的影响权重,与对应的预期反馈行为的多个行为分量进行权重计算,并将得到的对应预期反馈行为的多个行为分量的权重计算结果进行加权处理,得到对应每个医疗意图热点的多个热点反馈知识点特征,将分别对应多个热点反馈行为的影响权重,与对应的热点反馈行为的多个行为分量进行权重计算,并将得到的对应热点反馈行为的多个行为分量的权重计算结果进行加权处理,得到对应每个医疗意图热点的多个热点反馈知识点特征。
一种实施例中,医疗意图热点的预期反馈行为的类型可以包括单维向量和多维向量。基于此,在获取医疗意图热点的预期反馈行为的过程中,可以获取医疗意图热点的被生成的候选反馈行为的多个反馈单元的反馈特征向量,并将每个反馈单元的反馈特征向量作为单维向量。
由此,可以通过以下组合方式至少之一得到多维向量:
例如,将被生成的候选反馈行为的至少一个反馈单元的反馈特征向量与医疗意图热点的至少一个反馈单元相关的反馈特征向量进行组合。
再例如,将被生成的候选反馈行为的至少一个反馈单元的反馈特征向量与环境相关的至少一个反馈单元的反馈特征向量进行组合。
一种实施例中,对于步骤B130而言,可以通过以下的示例性子步骤实现,详细描述如下。
子步骤B131,基于第二医疗意图热点序列中每个医疗意图热点的多个热点反馈知识点特征,以及多个热点反馈知识点特征之间的关联关系,确定对应的第三热点有效匹配度。
子步骤B132,对医疗意图热点的多个热点反馈知识点特征进行融合,并将融合结果与随机森林树分类网络的分类属性进行融合,得到对应医疗意图热点的分类属性特征。
子步骤B133,将分类属性特征从分类属性特征行为持续指标映射到热点有效匹配度行为持续指标,得到对应医疗意图热点的第四热点有效匹配度。
子步骤B134,对第二医疗意图热点序列中每个医疗意图热点的第三热点有效匹配度以及第四热点有效匹配度进行加权,得到对应的第二热点有效匹配度。
示例性地,在子步骤B131中,可以通过以下详细的实施方式来实现,描述如下。
(1)针对第二医疗意图热点序列中每个医疗意图热点执行以下处理:
(2)将医疗意图热点的多个热点反馈知识点特征进行按照以下方式中的至少之一进行组合,以得到对应的融合特征向量:
1)将对应至少两个热点反馈行为的热点反馈知识点特征进行权重计算,将得到的相乘结果作为对应的融合特征向量。
2)将对应至少一个热点反馈行为的热点反馈知识点特征和对应至少一个预期反馈行为的热点反馈知识点特征进行权重计算,将得到的相乘结果作为对应的融合特征向量。
3)将分别对应至少两个预期反馈行为的热点反馈知识点特征进行权重计算,将得到的权重计算结果作为对应的融合特征向量,其中,每次组合所使用的热点反馈知识点特征部分不同或完全不同,以形成医疗意图热点的多个融合特征向量。
4)将医疗意图热点的多个融合特征向量进行加权,得到第一加权信息,并以多个热点反馈行为以及多个预期反馈行为分别对应的热点有效匹配度环境影响参数为权重参数,对多个热点反馈行为以及多个预期反馈行为进行加权处理,得到第二加权信息。
5)将第一加权信息作为医疗意图热点的第三热点有效匹配度,或者,将第一加权信息和第二加权信息的加和进行加权处理,并将加权处理结果作为医疗意图热点的第三热点有效匹配度。
由此,通过结合预期反馈行为进行一系列的加权处理,以考虑到不同维度的情况,从而可以提高第三热点有效匹配度的判定准确率。
图3为本公开实施例提供的基于区块链和智慧医疗的大数据提取装置300的功能模块示意图,下面分别对该基于区块链和智慧医疗的大数据提取装置300的各个功能模块的功能进行详细阐述。
第一获取模块310,用于根据基于智慧医疗分布式设备的智慧医疗大数据获得的每个医疗意图热点的信息推送策略,生成向智慧医疗分布式设备推送的医疗热点推送信息,并获取智慧医疗分布式设备针对医疗热点推送信息在指定业务挖掘周期内反馈的目标反馈行为大数据,其中,目标智慧医疗服务大数据基于智慧医疗分布式设备所在区块链网络的多个区块链节点进行搜集获得;
第二获取模块320,用于获取智慧医疗分布式设备的智慧医疗用户对应的目标用户画像特征,目标用户画像特征是基于智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征生成的;
提取模块330,用于提取目标反馈行为大数据对应的目标行为持续特征,将目标用户画像特征融合至目标行为持续特征得到目标融合特征;
更新模块340,用于提取目标融合特征对应的目标行为倾向特征,基于目标行为倾向特征得到目标反馈行为大数据对应的行为倾向属性,并根据的行为倾向属性更新智慧医疗大数据的大数据提取策略,其中,大数据提取策略用于上传到当前智慧医疗分布式设备对应的区块链网络的多个区块链节点中。
图4示出了本公开实施例提供的用于实现上述的基于区块链和智慧医疗的大数据提取方法的大数据系统100的硬件结构示意图,如图4所示,大数据系统100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。
在具体实现过程中,至少一个处理器110执行机器可读存储介质120存储的计算机执行指令,使得处理器110可以执行如上方法实施例的基于区块链和智慧医疗的大数据提取方法,处理器110、机器可读存储介质120以及通信单元140通过总线130连接,处理器110可以用于控制通信单元140的收发动作,从而可以与前述的智慧医疗分布式设备200进行数据收发。
处理器110的具体实现过程可参见上述大数据系统100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
此外,本公开实施例还提供一种可读存储介质,所述可读存储介质中预设有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上基于区块链和智慧医疗的大数据提取方法。
最后,应当理解的是,本说明书中实施例仅用以说明本说明书实施例的原则。其它的变形也可能属于本说明书范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导匹配。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
Claims (10)
1.一种基于区块链和智慧医疗的大数据提取方法,其特征在于,应用于大数据系统,所述大数据系统与多个智慧医疗分布式设备通信连接,所述方法包括:
根据基于所述智慧医疗分布式设备的智慧医疗大数据获得的每个医疗意图热点的信息推送策略,生成向所述智慧医疗分布式设备推送的医疗热点推送信息,并获取所述智慧医疗分布式设备针对所述医疗热点推送信息在指定业务挖掘周期内反馈的目标反馈行为大数据,其中,所述目标智慧医疗服务大数据基于所述智慧医疗分布式设备所在区块链网络的多个区块链节点进行搜集获得;
获取所述智慧医疗分布式设备的智慧医疗用户对应的目标用户画像特征,所述目标用户画像特征是基于所述智慧医疗分布式设备的智慧医疗用户的多个用户画像维度的画像分量特征生成的;
提取所述目标反馈行为大数据对应的目标行为持续特征,将所述目标用户画像特征融合至所述目标行为持续特征得到目标融合特征;
提取所述目标融合特征对应的目标行为倾向特征,基于所述目标行为倾向特征得到所述目标反馈行为大数据对应的行为倾向属性,并根据所述的行为倾向属性更新所述智慧医疗大数据的大数据提取策略,其中,所述大数据提取策略用于上传到当前所述智慧医疗分布式设备对应的区块链网络的多个区块链节点中。
2.根据权利要求1所述的基于区块链和智慧医疗的大数据提取方法,其特征在于,所述获取所述智慧医疗分布式设备的智慧医疗用户对应的目标用户画像特征,包括:
获取所述智慧医疗分布式设备对应的目标行为倾向预测网络;其中,所述目标行为倾向预测网络配置有所述智慧医疗用户对应的目标用户画像特征,所述目标行为倾向预测网络用于提取所述目标反馈行为大数据对应的目标行为持续特征,将所述目标用户画像特征融合至所述目标行为持续特征得到目标融合特征,提取所述目标融合特征对应的目标行为倾向特征,基于所述目标行为倾向特征得到所述目标反馈行为大数据对应的行为倾向属性。
3.根据权利要求1所述的基于区块链和智慧医疗的大数据提取方法,其特征在于,所述目标用户画像特征的生成包括以下步骤:
将各个用户画像维度的画像分量特征映射到用户画像知识图谱上,得到各个用户画像维度的知识图谱实体;
从各个用户画像维度中获取目标数量个用户画像维度分别作为目标用户画像维度,得到目标数量个目标用户画像维度;
基于各个目标用户画像维度的知识图谱实体生成目标用户画像实体;
当所述目标用户画像实体对应的实体展现特征为预设展现特征、且所述目标用户画像实体内没有其它用户画像维度时,将各个目标用户画像维度建立关联关系;
基于存在关联关系的各个用户画像维度生成所述目标用户画像特征。
4.根据权利要求3所述的基于区块链和智慧医疗的大数据提取方法,其特征在于,所述实体展现特征包括目标用户画像实体的各个实体关联节点对应的实体属性,所述当所述目标用户画像实体对应的实体展现特征为预设展现特征、且所述目标用户画像实体内没有其它用户画像维度时,将各个目标用户画像维度建立关联关系,包括:
当各个实体属性均在预设正常实体属性区间内时,确定所述目标用户画像实体对应的实体展现特征为预设展现特征;
当实体展现特征为预设展现特征的目标用户画像实体内没有其它用户画像维度时,基于各个实体关联节点之间的连接关系建立各个目标用户画像维度之间的关联关系;
其中,所述基于存在关联关系的各个用户画像维度生成所述目标用户画像特征,包括:
基于存在关联关系的各个用户画像维度生成初始用户画像特征;
基于所述初始用户画像特征生成初始用户画像分布;
获取基础用户画像分布,融合所述基础用户画像分布和所述初始用户画像分布得到中间用户画像分布;
获取所述初始用户画像分布对应的扩展用户画像分布,融合所述扩展用户画像分布和所述中间用户画像分布得到目标用户画像分布;
基于所述目标用户画像分布得到所述目标用户画像特征;
其中,所述基于所述初始用户画像特征生成初始用户画像分布包括以下方式中的任意一种:
基于所述智慧医疗用户的用户画像维度的画像维度数量确定所述初始用户画像分布的画像分布维度,将存在关联关系的各个用户画像维度对应的画像维度置信度确定为第一目标值,将其它用户画像维度对应的画像维度置信度确定为第二目标值,得到所述初始用户画像分布;
基于所述智慧医疗用户的用户画像维度的画像维度数量确定所述初始用户画像分布的画像分布维度,基于存在关联关系的各个用户画像维度之间的画像分量特征关联度,确定存在关联关系的各个用户画像维度对应的画像维度置信度,将其它用户画像维度对应的画像维度置信度确定为第二目标值,得到所述初始用户画像分布。
5.根据权利要求1所述的基于区块链和智慧医疗的大数据提取方法,其特征在于,所述目标反馈行为大数据包括各个用户画像维度分别对应的反馈行为大数据, 所述提取所述目标反馈行为大数据对应的目标行为持续特征,包括:
获取至少一个行为持续提取单元;
基于同一行为持续提取单元分别提取各个反馈行为大数据对应的行为持续子特征,得到各个行为持续提取单元分别对应的多个行为持续子特征;
基于同一行为持续提取单元对应的多个行为持续子特征生成中间行为持续特征,得到各个行为持续提取单元对应的中间行为持续特征;
基于各个中间行为持续特征得到所述目标行为持续特征。
6.根据权利要求1所述的基于区块链和智慧医疗的大数据提取方法,其特征在于,所述目标行为持续特征包括多个中间行为持续特征,所述将所述目标用户画像特征融合至所述目标行为持续特征得到目标融合特征,包括:
将所述目标用户画像特征分别融合至各个中间行为持续特征,得到各个中间行为持续特征对应的初始融合特征;
基于各个初始融合特征得到所述目标融合特征。
7.根据权利要求6所述的基于区块链和智慧医疗的大数据提取方法,其特征在于,所述用户画像特征包括各个用户画像维度分别对应的画像子特征,所述中间行为持续特征包括各个用户画像维度分别对应的行为持续子特征;
所述将所述目标用户画像特征分别融合至各个中间行为持续特征,得到各个中间行为持续特征对应的初始融合特征,包括:
在当前中间行为持续特征中,将同一用户画像维度对应的画像子特征融合至对应的行为持续子特征,得到各个用户画像维度分别对应的融合至子特征;
基于各个融合至子特征得到所述当前中间行为持续特征对应的初始融合特征。
8.根据权利要求1所述的基于区块链和智慧医疗的大数据提取方法,其特征在于,所述提取所述目标融合特征对应的目标行为倾向特征,包括:
获取至少一个行为倾向提取单元;
基于各个行为倾向提取单元分别对所述目标融合特征进行行为倾向特征提取,得到各个行为倾向提取单元分别对应的中间行为倾向特征;
基于各个中间行为倾向特征得到所述目标行为倾向特征。
9.根据权利要求1-8中任意一项所述的基于区块链和智慧医疗的大数据提取方法,其特征在于,所述方法还包括:
获取所述智慧医疗分布式设备的目标智慧医疗服务大数据,从所述目标智慧医疗服务大数据中确定目标查询行为数据,分别从所述目标查询行为数据和所述目标查询行为数据对应的跳转查询行为数据中提取查询意图对象,生成各个查询意图对象对应的查询意图分量,得到目标查询行为数据对应的目标查询意图分量序列和跳转查询行为数据对应的跳转查询意图分量序列;所述目标查询意图分量序列包括目标查询行为数据中的各个目标查询意图对象分别对应的查询意图分量,所述跳转查询意图分量序列包括跳转查询行为数据中的各个跳转查询意图对象分别对应的查询意图分量,其中,所述目标智慧医疗服务大数据基于所述智慧医疗分布式设备所在区块链网络的多个区块链节点进行搜集获得;
基于目标查询意图对象和跳转查询意图对象之间的分量相关度,将目标查询意图对象和跳转查询意图对象进行匹配,基于匹配成功的目标查询意图对象和跳转查询意图对象的跳转相关度生成目标查询意图对象对应的跳转属性分量;
将同一目标查询意图对象对应的跳转属性分量和查询意图分量进行融合,得到对应的融合意图分量,基于融合意图分量更新所述目标查询意图分量序列,得到更新查询意图分量序列;
基于目标查询行为数据对应的更新查询意图分量序列得到所述目标智慧医疗服务大数据对应的跳转挖掘意图;
基于所述目标智慧医疗服务大数据对应的跳转挖掘意图在应用各个智慧医疗推荐词条时生成的第一医疗意图热点序列中每个医疗意图热点的多个热点反馈行为,确定对应的第一热点有效匹配度,并从所述第一热点有效匹配度的降序结果中选取预设数量的多个医疗意图热点,以形成第二医疗意图热点序列;
对所述第二医疗意图热点序列中每个医疗意图热点的多个热点反馈行为进行特征提取,得到对应所述每个医疗意图热点的多个热点反馈知识点特征;
基于所述第二医疗意图热点序列中每个医疗意图热点的多个热点反馈知识点特征,确定对应的第二热点有效匹配度;
基于所述第二医疗意图热点序列中每个医疗意图热点的第二热点有效匹配度的降序结果,分别执行每个医疗意图热点的信息推送策略的策略规则配置。
10.一种大数据系统,其特征在于,所述大数据系统包括处理器、机器可读存储介质和通信单元,所述机器可读存储介质、所述通信单元以及所述处理器之间通过总线系统相关联,所述通信单元用于与至少一个智慧医疗分布式设备通信连接,所述机器可读存储介质用于存储计算机指令,所述处理器用于执行所述机器可读存储介质中的计算机指令,以执行权利要求1-9中任意一项的基于区块链和智慧医疗的大数据提取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110682219.4A CN113345570A (zh) | 2021-06-20 | 2021-06-20 | 基于区块链和智慧医疗的大数据提取方法及大数据系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110682219.4A CN113345570A (zh) | 2021-06-20 | 2021-06-20 | 基于区块链和智慧医疗的大数据提取方法及大数据系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113345570A true CN113345570A (zh) | 2021-09-03 |
Family
ID=77477791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110682219.4A Withdrawn CN113345570A (zh) | 2021-06-20 | 2021-06-20 | 基于区块链和智慧医疗的大数据提取方法及大数据系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113345570A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114154069A (zh) * | 2021-12-07 | 2022-03-08 | 宁安市伟恒互联网信息服务有限公司 | 基于大数据信息反馈的信息推送方法及人工智能预测系统 |
CN114781624A (zh) * | 2022-05-23 | 2022-07-22 | 百色市恒赢电脑网络有限公司 | 基于大数据分析的用户行为意图挖掘方法及大数据系统 |
CN114996347A (zh) * | 2022-06-24 | 2022-09-02 | 中国电信股份有限公司 | 一种用户画像管理方法、装置、电子设备及存储介质 |
-
2021
- 2021-06-20 CN CN202110682219.4A patent/CN113345570A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114154069A (zh) * | 2021-12-07 | 2022-03-08 | 宁安市伟恒互联网信息服务有限公司 | 基于大数据信息反馈的信息推送方法及人工智能预测系统 |
CN114154069B (zh) * | 2021-12-07 | 2022-08-12 | 湖南湘谷信息科技有限公司 | 基于大数据信息反馈的信息推送方法及人工智能预测系统 |
CN114781624A (zh) * | 2022-05-23 | 2022-07-22 | 百色市恒赢电脑网络有限公司 | 基于大数据分析的用户行为意图挖掘方法及大数据系统 |
CN114996347A (zh) * | 2022-06-24 | 2022-09-02 | 中国电信股份有限公司 | 一种用户画像管理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113345570A (zh) | 基于区块链和智慧医疗的大数据提取方法及大数据系统 | |
US9542412B2 (en) | Method and system for large scale data curation | |
CN110362660A (zh) | 一种基于知识图谱的电子产品质量自动检测方法 | |
US11775610B2 (en) | Flexible imputation of missing data | |
Kanagal et al. | Lineage processing over correlated probabilistic databases | |
CN110795527A (zh) | 候选实体排序方法、训练方法及相关装置 | |
CN117235238B (zh) | 问答方法、装置、存储介质及计算机设备 | |
CN113222149A (zh) | 模型训练方法、装置、设备和存储介质 | |
CN111966793A (zh) | 基于知识图谱的智慧问答方法、系统和知识图谱更新系统 | |
CN114492601A (zh) | 资源分类模型的训练方法、装置、电子设备及存储介质 | |
CN114153995B (zh) | 医学术语的处理方法、装置、计算机设备和存储介质 | |
US8650180B2 (en) | Efficient optimization over uncertain data | |
Swidan et al. | A model for processing skyline queries in crowd-sourced databases | |
CN114221991A (zh) | 基于大数据的会话推荐反馈处理方法及深度学习服务系统 | |
CN113345571A (zh) | 基于智慧医疗服务的大数据处理方法及区块链医疗系统 | |
CN116861373A (zh) | 一种查询选择率估算方法、系统、终端设备及存储介质 | |
CN112992367B (zh) | 基于大数据的智慧医疗交互方法及智慧医疗云计算系统 | |
Logan et al. | A vision for managing extreme-scale data hoards | |
CN111638926A (zh) | 人工智能在Django框架中的一种实现方法 | |
CN115472257A (zh) | 一种招募用户的方法、装置、电子设备及存储介质 | |
CN111125541A (zh) | 面向多用户的可持续多云服务组合的获取方法 | |
CN117217392B (zh) | 一种通用装备保障需求的确定方法及装置 | |
Mehmood et al. | Knowledge Graph Embedding in Intent-Based Networking | |
CN115458103B (zh) | 医疗数据处理方法、装置、电子设备及可读存储介质 | |
CN113014603B (zh) | 基于网络安全大数据的防护联动配置方法及大数据云系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210903 |