CN116564538A

CN116564538A - 一种基于大数据的医院就医信息实时查询方法及系统

Info

Publication number: CN116564538A
Application number: CN202310815083.9A
Authority: CN
Inventors: 雷晓莉; 靳银敏; 黄启祥
Original assignee: Zhaoqing Gaoyao District People's Hospital
Current assignee: Zhaoqing Gaoyao District People's Hospital
Priority date: 2023-07-05
Filing date: 2023-07-05
Publication date: 2023-08-08
Anticipated expiration: 2043-07-05
Also published as: CN116564538B

Abstract

本发明提供了一种基于大数据的医院就医信息实时查询方法及系统，其中，所述方法包括：获取用户样本集，所述用户样本集中包括用户样本和所述用户样本对应的标准就医信息；通过实时查询模型提取所述用户样本的样本特征，并生成所述样本特征对应的预测就医信息；对比所述标准就医信息和所述预测就医信息，并根据对比结果生成误差信息，利用所述误差信息对所述实时查询模型进行校正，以使得根据校正后的实时查询模型生成的预测就医信息与所述标准就医信息保持一致。本发明提供的技术方案，能够提高就医的效率。

Description

一种基于大数据的医院就医信息实时查询方法及系统

技术领域

本发明涉及数据处理技术领域，特别涉及一种基于大数据的医院就医信息实时查询方法及系统。

背景技术

目前，居民就医的方式通常以居民的选择为主，当居民身体出现不适后，会去往就近的医院，然后通过医院的咨询台进行挂号就医。

然而，现有的这种方式，过分依赖居民的专业程度，同时在医院的咨询台也需要部署对应的专业人员，耗费了较大的人力和物力。

鉴于此，目前需要一种更加高效的就医方式。

发明内容

本发明提供一种基于大数据的医院就医信息实时查询方法及系统，能够提高就医的效率。

鉴于此，本发明一方面提供一种基于大数据的医院就医信息实时查询方法，所述方法包括：

获取用户样本集，所述用户样本集中包括用户样本和所述用户样本对应的标准就医信息；

通过实时查询模型提取所述用户样本的样本特征，并生成所述样本特征对应的预测就医信息；

对比所述标准就医信息和所述预测就医信息，并根据对比结果生成误差信息，利用所述误差信息对所述实时查询模型进行校正，以使得根据校正后的实时查询模型生成的预测就医信息与所述标准就医信息保持一致。

在一个实施方式中，获取用户样本集包括：

针对待采集信息的目标用户，获取所述目标用户的用户信息，所述用户信息至少表征所述目标用户的性别、年龄及健康指标；

识别所述目标用户的历史就医信息，所述历史就医信息至少表征所述目标用户就医的医院标识；

将所述目标用户的用户信息作为用户样本，并将所述目标用户的历史就医信息作为所述用户样本对应的标准就医信息；

由于用户提供的信息可能有很多垃圾信息或者无效信息，对此类信息进行解析或者处理不仅会降低系统运行效率，还会降低预测准确性，为了解决上述问题，在获取用户信息后，对相关信息进行识别判定，剔除垃圾、无用信息，从而提升系统运行效率，提高系统预测准确率，具体过程如下：

对用户信息进行分词后，则分词后文本d是垃圾信息的概率为：

其中为文本d是垃圾信息的概率，/>表示文本d在整个用户信息库中出现的概率，/>表示整个用户信息库中垃圾信息的概率，/>为差异因子，其计算公式为：

其中为文本d在整个用户信息库中为非垃圾信息的频数，/>为文本d在整个用户信息库中为垃圾信息的频数。

表示在整个用户信息库中当文本信息为d时其是垃圾信息的概率，其计算公式如下：

其中n为用户信息库中含有文本信息d的信息总量，i为用户信息库中含有文本信息d的信息编号，i为整数且大于等于1小于等于n。为编号为i的用户信息库中含有文本信息d的信息中文本信息d是垃圾信息的概率。因此分词后文本d是垃圾信息的概率为：

当大于0.5时，文本d为垃圾信息，予以忽略，不做处理；当/>小于等于0.5时，文本d为有效信息，对其进行后续处理分析。

在一个实施方式中，提取所述用户样本的样本特征包括：

识别所述用户样本中的各个信息项，并将所述各个信息项归一化为对应的信息指标；

按照样本特征中元素的排序方式对归一化后的信息指标进行排序，以生成由各个所述信息指标构成的指标向量，并基于所述指标向量生成所述用户样本的样本特征。

在一个实施方式中，所述方法还包括：

获取就医查询请求，所述就医查询请求中包括用户信息；

响应于所述就医查询请求，利用所述实时查询模型生成所述用户信息对应的推荐就医信息；

判断所述推荐就医信息是否正确，若不正确，根据所述用户信息和修正后的就医信息，构建校正样本，并利用所述校正样本对所述实时查询模型进行校正。

在一个实施方式中，生成所述样本特征对应的预测就医信息包括：

将所述样本特征输入第一预测分支和第二预测分支，以通过所述第一预测分支和所述第二预测分支分别输出第一预测结果和第二预测结果；

从所述第一预测结果中提取前缀特征，并从所述第二预测结果中提取后缀特征，并基于所述前缀特征和所述后缀特征构成待处理特征；

将所述待处理特征输入全连接层，并通过所述全连接层输出所述样本特征的预测就医信息。

本发明另一方面提供一种基于大数据的医院就医信息实时查询系统，所述系统包括：

数据获取单元，用于获取用户样本集，所述用户样本集中包括用户样本和所述用户样本对应的标准就医信息；

信息生成单元，用于通过实时查询模型提取所述用户样本的样本特征，并生成所述样本特征对应的预测就医信息；

校正单元，用于对比所述标准就医信息和所述预测就医信息，并根据对比结果生成误差信息，利用所述误差信息对所述实时查询模型进行校正，以使得根据校正后的实时查询模型生成的预测就医信息与所述标准就医信息保持一致。

在一个实施方式中，所述数据获取单元，具体用于针对待采集信息的目标用户，获取所述目标用户的用户信息，所述用户信息至少表征所述目标用户的性别、年龄及健康指标；识别所述目标用户的历史就医信息，所述历史就医信息至少表征所述目标用户就医的医院标识；将所述目标用户的用户信息作为用户样本，并将所述目标用户的历史就医信息作为所述用户样本对应的标准就医信息。

在一个实施方式中，所述信息生成单元具体用于，识别所述用户样本中的各个信息项，并将所述各个信息项归一化为对应的信息指标；按照样本特征中元素的排序方式对归一化后的信息指标进行排序，以生成由各个所述信息指标构成的指标向量，并基于所述指标向量生成所述用户样本的样本特征。

在一个实施方式中，所述系统还包括：

请求获取单元，用于获取就医查询请求，所述就医查询请求中包括用户信息；

请求响应单元，用于响应于所述就医查询请求，利用所述实时查询模型生成所述用户信息对应的推荐就医信息；

处理单元，用于判断所述推荐就医信息是否正确，若不正确，根据所述用户信息和修正后的就医信息，构建校正样本，并利用所述校正样本对所述实时查询模型进行校正。

在一个实施方式中，所述信息生成单元，还用于将所述样本特征输入第一预测分支和第二预测分支，以通过所述第一预测分支和所述第二预测分支分别输出第一预测结果和第二预测结果；从所述第一预测结果中提取前缀特征，并从所述第二预测结果中提取后缀特征，并基于所述前缀特征和所述后缀特征构成待处理特征；将所述待处理特征输入全连接层，并通过所述全连接层输出所述样本特征的预测就医信息。

本发明提供的技术方案，可以通过大数据训练出实时查询模型，后续，用户通过输入自身的就医查询请求，该实时查询模型就可以基于用户信息自动生成推荐就医信息，从而可以为不具备专业医学知识的用户服务，同时也可以减轻医院咨询台的压力，提高了就医效率。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中一种基于大数据的医院就医信息实时查询方法的步骤示意图；

图2为本发明实施例中一种基于大数据的医院就医信息实时查询系统的功能模块示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

请参阅图1，本申请一个实施方式提供一种基于大数据的医院就医信息实时查询方法，所述方法包括：

S1：获取用户样本集，所述用户样本集中包括用户样本和所述用户样本对应的标准就医信息；

S2：通过实时查询模型提取所述用户样本的样本特征，并生成所述样本特征对应的预测就医信息；

S3：对比所述标准就医信息和所述预测就医信息，并根据对比结果生成误差信息，利用所述误差信息对所述实时查询模型进行校正，以使得根据校正后的实时查询模型生成的预测就医信息与所述标准就医信息保持一致。

在一个实施方式中，获取用户样本集包括：

识别所述目标用户的历史就医信息，所述历史就医信息至少表征所述目标用户就医的医院标识；该医院标识例如可以是医院名称和挂号的科室；

将所述目标用户的用户信息作为用户样本，并将所述目标用户的历史就医信息作为所述用户样本对应的标准就医信息。

在一个实施方式中，提取所述用户样本的样本特征包括：

其中，信息项可以指用户样本中包含的性别、年龄及健康指标等。对于不同的信息项，都可以采用归一化的方式，将信息项的数值（性别可以用0和1标识）转换到0至1的区间中。后续，样本特征中的各个元素可以具备预设的排序方式，例如排序方式可以是按照性别、年龄、健康指标这样的顺序进行排列。通过该预设的排序方式对归一化后的信息指标进行排序，从而可以生成指标向量，该指标向量便可以作为用户样本的样本特征。

通过大量的用户样本对实时查询模型进行训练，可以得到预测结果准确的实时查询模型。

在一个实施方式中，所述方法还包括：

获取就医查询请求，所述就医查询请求中包括用户信息；

在该实施方式中，如果推荐就医信息经过认为判断是不正确的，那么可以通过人工标注的方式给出修正后的就医信息，并构建用户信息与该修正后的就医信息之间的正样本。利用该正样本，可以继续对实时查询模型进行校正。

在本实施方式中，第一预测分支和第二预测分支可以是预测精度不同的分支，其中，第一预测分支可以生成精度较高的前半段特征，而第二预测分支可以生成精度较高的后半段特征。这样，通过提取各自的精度较高的特征，可以拼接成完整的待处理特征，该待处理特征的整个字段精度都较高。这样，通过全连接层对该待处理特征进行处理，从而可以得到预测就医信息。该预测就医信息可以是一个概率向量，概率向量中的每个概率值都可以对应某个医院和/或某个科室的推荐概率。最终，概率最高的医院和/或科室，就可以作为推荐就医信息表征的医院和/或科室。

请参阅图2，本发明另一方面提供一种基于大数据的医院就医信息实时查询系统，所述系统包括：

在一个实施方式中，所述系统还包括：

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于大数据的医院就医信息实时查询方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，获取用户样本集包括：

在获取所述目标用户的用户信息后，所述方法还包括：

其中为文本d在整个用户信息库中为非垃圾信息的频数，/>为文本d在整个用户信息库中为垃圾信息的频数；

其中n为用户信息库中含有文本信息d的信息总量，i为用户信息库中含有文本信息d的信息编号，i为整数且大于等于1小于等于n，为编号为i的用户信息库中含有文本信息d的信息中文本信息d是垃圾信息的概率，因此分词后文本d是垃圾信息的概率为：

3.根据权利要求1或2所述的方法，其特征在于，提取所述用户样本的样本特征包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取就医查询请求，所述就医查询请求中包括用户信息；

5.根据权利要求1所述的方法，其特征在于，生成所述样本特征对应的预测就医信息包括：

6.一种基于大数据的医院就医信息实时查询系统，其特征在于，所述系统包括：

7.根据权利要求6所述的系统，其特征在于，所述数据获取单元，具体用于针对待采集信息的目标用户，获取所述目标用户的用户信息，所述用户信息至少表征所述目标用户的性别、年龄及健康指标；识别所述目标用户的历史就医信息，所述历史就医信息至少表征所述目标用户就医的医院标识；将所述目标用户的用户信息作为用户样本，并将所述目标用户的历史就医信息作为所述用户样本对应的标准就医信息；

其中，对用户信息进行分词后，则分词后文本d是垃圾信息的概率为：

8.根据权利要求6所述的系统，其特征在于，所述信息生成单元具体用于，识别所述用户样本中的各个信息项，并将所述各个信息项归一化为对应的信息指标；按照样本特征中元素的排序方式对归一化后的信息指标进行排序，以生成由各个所述信息指标构成的指标向量，并基于所述指标向量生成所述用户样本的样本特征。

9.根据权利要求6所述的系统，其特征在于，所述系统还包括：

10.根据权利要求6所述的系统，其特征在于，

所述信息生成单元，还用于将所述样本特征输入第一预测分支和第二预测分支，以通过所述第一预测分支和所述第二预测分支分别输出第一预测结果和第二预测结果；从所述第一预测结果中提取前缀特征，并从所述第二预测结果中提取后缀特征，并基于所述前缀特征和所述后缀特征构成待处理特征；将所述待处理特征输入全连接层，并通过所述全连接层输出所述样本特征的预测就医信息。