CN116564538A - 一种基于大数据的医院就医信息实时查询方法及系统 - Google Patents
一种基于大数据的医院就医信息实时查询方法及系统 Download PDFInfo
- Publication number
- CN116564538A CN116564538A CN202310815083.9A CN202310815083A CN116564538A CN 116564538 A CN116564538 A CN 116564538A CN 202310815083 A CN202310815083 A CN 202310815083A CN 116564538 A CN116564538 A CN 116564538A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- text
- sample
- medical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000013598 vector Substances 0.000 claims description 15
- 230000036541 health Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 3
- 238000009223 counseling Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于大数据的医院就医信息实时查询方法及系统,其中,所述方法包括:获取用户样本集,所述用户样本集中包括用户样本和所述用户样本对应的标准就医信息;通过实时查询模型提取所述用户样本的样本特征,并生成所述样本特征对应的预测就医信息;对比所述标准就医信息和所述预测就医信息,并根据对比结果生成误差信息,利用所述误差信息对所述实时查询模型进行校正,以使得根据校正后的实时查询模型生成的预测就医信息与所述标准就医信息保持一致。本发明提供的技术方案,能够提高就医的效率。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种基于大数据的医院就医信息实时查询方法及系统。
背景技术
目前,居民就医的方式通常以居民的选择为主,当居民身体出现不适后,会去往就近的医院,然后通过医院的咨询台进行挂号就医。
然而,现有的这种方式,过分依赖居民的专业程度,同时在医院的咨询台也需要部署对应的专业人员,耗费了较大的人力和物力。
鉴于此,目前需要一种更加高效的就医方式。
发明内容
本发明提供一种基于大数据的医院就医信息实时查询方法及系统,能够提高就医的效率。
鉴于此,本发明一方面提供一种基于大数据的医院就医信息实时查询方法,所述方法包括:
获取用户样本集,所述用户样本集中包括用户样本和所述用户样本对应的标准就医信息;
通过实时查询模型提取所述用户样本的样本特征,并生成所述样本特征对应的预测就医信息;
对比所述标准就医信息和所述预测就医信息,并根据对比结果生成误差信息,利用所述误差信息对所述实时查询模型进行校正,以使得根据校正后的实时查询模型生成的预测就医信息与所述标准就医信息保持一致。
在一个实施方式中,获取用户样本集包括:
针对待采集信息的目标用户,获取所述目标用户的用户信息,所述用户信息至少表征所述目标用户的性别、年龄及健康指标;
识别所述目标用户的历史就医信息,所述历史就医信息至少表征所述目标用户就医的医院标识;
将所述目标用户的用户信息作为用户样本,并将所述目标用户的历史就医信息作为所述用户样本对应的标准就医信息;
由于用户提供的信息可能有很多垃圾信息或者无效信息,对此类信息进行解析或者处理不仅会降低系统运行效率,还会降低预测准确性,为了解决上述问题,在获取用户信息后,对相关信息进行识别判定,剔除垃圾、无用信息,从而提升系统运行效率,提高系统预测准确率,具体过程如下:
对用户信息进行分词后,则分词后文本d是垃圾信息的概率为:
其中为文本d是垃圾信息的概率,/>表示文本d在整个用户信息库中出现的概率,/>表示整个用户信息库中垃圾信息的概率,/>为差异因子,其计算公式为:
其中为文本d在整个用户信息库中为非垃圾信息的频数,/>为文本d在整个用户信息库中为垃圾信息的频数。
表示在整个用户信息库中当文本信息为d时其是垃圾信息的概率,其计算公式如下:
其中n为用户信息库中含有文本信息d的信息总量,i为用户信息库中含有文本信息d的信息编号,i为整数且大于等于1小于等于n。为编号为i的用户信息库中含有文本信息d的信息中文本信息d是垃圾信息的概率。因此分词后文本d是垃圾信息的概率为:
当大于0.5时,文本d为垃圾信息,予以忽略,不做处理;当/>小于等于0.5时,文本d为有效信息,对其进行后续处理分析。
在一个实施方式中,提取所述用户样本的样本特征包括:
识别所述用户样本中的各个信息项,并将所述各个信息项归一化为对应的信息指标;
按照样本特征中元素的排序方式对归一化后的信息指标进行排序,以生成由各个所述信息指标构成的指标向量,并基于所述指标向量生成所述用户样本的样本特征。
在一个实施方式中,所述方法还包括:
获取就医查询请求,所述就医查询请求中包括用户信息;
响应于所述就医查询请求,利用所述实时查询模型生成所述用户信息对应的推荐就医信息;
判断所述推荐就医信息是否正确,若不正确,根据所述用户信息和修正后的就医信息,构建校正样本,并利用所述校正样本对所述实时查询模型进行校正。
在一个实施方式中,生成所述样本特征对应的预测就医信息包括:
将所述样本特征输入第一预测分支和第二预测分支,以通过所述第一预测分支和所述第二预测分支分别输出第一预测结果和第二预测结果;
从所述第一预测结果中提取前缀特征,并从所述第二预测结果中提取后缀特征,并基于所述前缀特征和所述后缀特征构成待处理特征;
将所述待处理特征输入全连接层,并通过所述全连接层输出所述样本特征的预测就医信息。
本发明另一方面提供一种基于大数据的医院就医信息实时查询系统,所述系统包括:
数据获取单元,用于获取用户样本集,所述用户样本集中包括用户样本和所述用户样本对应的标准就医信息;
信息生成单元,用于通过实时查询模型提取所述用户样本的样本特征,并生成所述样本特征对应的预测就医信息;
校正单元,用于对比所述标准就医信息和所述预测就医信息,并根据对比结果生成误差信息,利用所述误差信息对所述实时查询模型进行校正,以使得根据校正后的实时查询模型生成的预测就医信息与所述标准就医信息保持一致。
在一个实施方式中,所述数据获取单元,具体用于针对待采集信息的目标用户,获取所述目标用户的用户信息,所述用户信息至少表征所述目标用户的性别、年龄及健康指标;识别所述目标用户的历史就医信息,所述历史就医信息至少表征所述目标用户就医的医院标识;将所述目标用户的用户信息作为用户样本,并将所述目标用户的历史就医信息作为所述用户样本对应的标准就医信息。
在一个实施方式中,所述信息生成单元具体用于,识别所述用户样本中的各个信息项,并将所述各个信息项归一化为对应的信息指标;按照样本特征中元素的排序方式对归一化后的信息指标进行排序,以生成由各个所述信息指标构成的指标向量,并基于所述指标向量生成所述用户样本的样本特征。
在一个实施方式中,所述系统还包括:
请求获取单元,用于获取就医查询请求,所述就医查询请求中包括用户信息;
请求响应单元,用于响应于所述就医查询请求,利用所述实时查询模型生成所述用户信息对应的推荐就医信息;
处理单元,用于判断所述推荐就医信息是否正确,若不正确,根据所述用户信息和修正后的就医信息,构建校正样本,并利用所述校正样本对所述实时查询模型进行校正。
在一个实施方式中,所述信息生成单元,还用于将所述样本特征输入第一预测分支和第二预测分支,以通过所述第一预测分支和所述第二预测分支分别输出第一预测结果和第二预测结果;从所述第一预测结果中提取前缀特征,并从所述第二预测结果中提取后缀特征,并基于所述前缀特征和所述后缀特征构成待处理特征;将所述待处理特征输入全连接层,并通过所述全连接层输出所述样本特征的预测就医信息。
本发明提供的技术方案,可以通过大数据训练出实时查询模型,后续,用户通过输入自身的就医查询请求,该实时查询模型就可以基于用户信息自动生成推荐就医信息,从而可以为不具备专业医学知识的用户服务,同时也可以减轻医院咨询台的压力,提高了就医效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于大数据的医院就医信息实时查询方法的步骤示意图;
图2为本发明实施例中一种基于大数据的医院就医信息实时查询系统的功能模块示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
请参阅图1,本申请一个实施方式提供一种基于大数据的医院就医信息实时查询方法,所述方法包括:
S1:获取用户样本集,所述用户样本集中包括用户样本和所述用户样本对应的标准就医信息;
S2:通过实时查询模型提取所述用户样本的样本特征,并生成所述样本特征对应的预测就医信息;
S3:对比所述标准就医信息和所述预测就医信息,并根据对比结果生成误差信息,利用所述误差信息对所述实时查询模型进行校正,以使得根据校正后的实时查询模型生成的预测就医信息与所述标准就医信息保持一致。
在一个实施方式中,获取用户样本集包括:
针对待采集信息的目标用户,获取所述目标用户的用户信息,所述用户信息至少表征所述目标用户的性别、年龄及健康指标;
识别所述目标用户的历史就医信息,所述历史就医信息至少表征所述目标用户就医的医院标识;该医院标识例如可以是医院名称和挂号的科室;
将所述目标用户的用户信息作为用户样本,并将所述目标用户的历史就医信息作为所述用户样本对应的标准就医信息。
由于用户提供的信息可能有很多垃圾信息或者无效信息,对此类信息进行解析或者处理不仅会降低系统运行效率,还会降低预测准确性,为了解决上述问题,在获取用户信息后,对相关信息进行识别判定,剔除垃圾、无用信息,从而提升系统运行效率,提高系统预测准确率,具体过程如下:
对用户信息进行分词后,则分词后文本d是垃圾信息的概率为:
其中为文本d是垃圾信息的概率,/>表示文本d在整个用户信息库中出现的概率,/>表示整个用户信息库中垃圾信息的概率,/>为差异因子,其计算公式为:
其中为文本d在整个用户信息库中为非垃圾信息的频数,/>为文本d在整个用户信息库中为垃圾信息的频数。
表示在整个用户信息库中当文本信息为d时其是垃圾信息的概率,其计算公式如下:
其中n为用户信息库中含有文本信息d的信息总量,i为用户信息库中含有文本信息d的信息编号,i为整数且大于等于1小于等于n。为编号为i的用户信息库中含有文本信息d的信息中文本信息d是垃圾信息的概率。因此分词后文本d是垃圾信息的概率为:
当大于0.5时,文本d为垃圾信息,予以忽略,不做处理;当/>小于等于0.5时,文本d为有效信息,对其进行后续处理分析。
在一个实施方式中,提取所述用户样本的样本特征包括:
识别所述用户样本中的各个信息项,并将所述各个信息项归一化为对应的信息指标;
按照样本特征中元素的排序方式对归一化后的信息指标进行排序,以生成由各个所述信息指标构成的指标向量,并基于所述指标向量生成所述用户样本的样本特征。
其中,信息项可以指用户样本中包含的性别、年龄及健康指标等。对于不同的信息项,都可以采用归一化的方式,将信息项的数值(性别可以用0和1标识)转换到0至1的区间中。后续,样本特征中的各个元素可以具备预设的排序方式,例如排序方式可以是按照性别、年龄、健康指标这样的顺序进行排列。通过该预设的排序方式对归一化后的信息指标进行排序,从而可以生成指标向量,该指标向量便可以作为用户样本的样本特征。
通过大量的用户样本对实时查询模型进行训练,可以得到预测结果准确的实时查询模型。
在一个实施方式中,所述方法还包括:
获取就医查询请求,所述就医查询请求中包括用户信息;
响应于所述就医查询请求,利用所述实时查询模型生成所述用户信息对应的推荐就医信息;
判断所述推荐就医信息是否正确,若不正确,根据所述用户信息和修正后的就医信息,构建校正样本,并利用所述校正样本对所述实时查询模型进行校正。
在该实施方式中,如果推荐就医信息经过认为判断是不正确的,那么可以通过人工标注的方式给出修正后的就医信息,并构建用户信息与该修正后的就医信息之间的正样本。利用该正样本,可以继续对实时查询模型进行校正。
在一个实施方式中,生成所述样本特征对应的预测就医信息包括:
将所述样本特征输入第一预测分支和第二预测分支,以通过所述第一预测分支和所述第二预测分支分别输出第一预测结果和第二预测结果;
从所述第一预测结果中提取前缀特征,并从所述第二预测结果中提取后缀特征,并基于所述前缀特征和所述后缀特征构成待处理特征;
将所述待处理特征输入全连接层,并通过所述全连接层输出所述样本特征的预测就医信息。
在本实施方式中,第一预测分支和第二预测分支可以是预测精度不同的分支,其中,第一预测分支可以生成精度较高的前半段特征,而第二预测分支可以生成精度较高的后半段特征。这样,通过提取各自的精度较高的特征,可以拼接成完整的待处理特征,该待处理特征的整个字段精度都较高。这样,通过全连接层对该待处理特征进行处理,从而可以得到预测就医信息。该预测就医信息可以是一个概率向量,概率向量中的每个概率值都可以对应某个医院和/或某个科室的推荐概率。最终,概率最高的医院和/或科室,就可以作为推荐就医信息表征的医院和/或科室。
请参阅图2,本发明另一方面提供一种基于大数据的医院就医信息实时查询系统,所述系统包括:
数据获取单元,用于获取用户样本集,所述用户样本集中包括用户样本和所述用户样本对应的标准就医信息;
信息生成单元,用于通过实时查询模型提取所述用户样本的样本特征,并生成所述样本特征对应的预测就医信息;
校正单元,用于对比所述标准就医信息和所述预测就医信息,并根据对比结果生成误差信息,利用所述误差信息对所述实时查询模型进行校正,以使得根据校正后的实时查询模型生成的预测就医信息与所述标准就医信息保持一致。
在一个实施方式中,所述数据获取单元,具体用于针对待采集信息的目标用户,获取所述目标用户的用户信息,所述用户信息至少表征所述目标用户的性别、年龄及健康指标;识别所述目标用户的历史就医信息,所述历史就医信息至少表征所述目标用户就医的医院标识;将所述目标用户的用户信息作为用户样本,并将所述目标用户的历史就医信息作为所述用户样本对应的标准就医信息。
在一个实施方式中,所述信息生成单元具体用于,识别所述用户样本中的各个信息项,并将所述各个信息项归一化为对应的信息指标;按照样本特征中元素的排序方式对归一化后的信息指标进行排序,以生成由各个所述信息指标构成的指标向量,并基于所述指标向量生成所述用户样本的样本特征。
在一个实施方式中,所述系统还包括:
请求获取单元,用于获取就医查询请求,所述就医查询请求中包括用户信息;
请求响应单元,用于响应于所述就医查询请求,利用所述实时查询模型生成所述用户信息对应的推荐就医信息;
处理单元,用于判断所述推荐就医信息是否正确,若不正确,根据所述用户信息和修正后的就医信息,构建校正样本,并利用所述校正样本对所述实时查询模型进行校正。
在一个实施方式中,所述信息生成单元,还用于将所述样本特征输入第一预测分支和第二预测分支,以通过所述第一预测分支和所述第二预测分支分别输出第一预测结果和第二预测结果;从所述第一预测结果中提取前缀特征,并从所述第二预测结果中提取后缀特征,并基于所述前缀特征和所述后缀特征构成待处理特征;将所述待处理特征输入全连接层,并通过所述全连接层输出所述样本特征的预测就医信息。
本发明提供的技术方案,可以通过大数据训练出实时查询模型,后续,用户通过输入自身的就医查询请求,该实时查询模型就可以基于用户信息自动生成推荐就医信息,从而可以为不具备专业医学知识的用户服务,同时也可以减轻医院咨询台的压力,提高了就医效率。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种基于大数据的医院就医信息实时查询方法,其特征在于,所述方法包括:
获取用户样本集,所述用户样本集中包括用户样本和所述用户样本对应的标准就医信息;
通过实时查询模型提取所述用户样本的样本特征,并生成所述样本特征对应的预测就医信息;
对比所述标准就医信息和所述预测就医信息,并根据对比结果生成误差信息,利用所述误差信息对所述实时查询模型进行校正,以使得根据校正后的实时查询模型生成的预测就医信息与所述标准就医信息保持一致。
2.根据权利要求1所述的方法,其特征在于,获取用户样本集包括:
针对待采集信息的目标用户,获取所述目标用户的用户信息,所述用户信息至少表征所述目标用户的性别、年龄及健康指标;
识别所述目标用户的历史就医信息,所述历史就医信息至少表征所述目标用户就医的医院标识;
将所述目标用户的用户信息作为用户样本,并将所述目标用户的历史就医信息作为所述用户样本对应的标准就医信息;
在获取所述目标用户的用户信息后,所述方法还包括:
对用户信息进行分词后,则分词后文本d是垃圾信息的概率为:
其中为文本d是垃圾信息的概率,/>表示文本d在整个用户信息库中出现的概率,/>表示整个用户信息库中垃圾信息的概率,/>为差异因子,其计算公式为:
其中为文本d在整个用户信息库中为非垃圾信息的频数,/>为文本d在整个用户信息库中为垃圾信息的频数;
表示在整个用户信息库中当文本信息为d时其是垃圾信息的概率,其计算公式如下:
其中n为用户信息库中含有文本信息d的信息总量,i为用户信息库中含有文本信息d的信息编号,i为整数且大于等于1小于等于n,为编号为i的用户信息库中含有文本信息d的信息中文本信息d是垃圾信息的概率,因此分词后文本d是垃圾信息的概率为:
当大于0.5时,文本d为垃圾信息,予以忽略,不做处理;当/>小于等于0.5时,文本d为有效信息,对其进行后续处理分析。
3.根据权利要求1或2所述的方法,其特征在于,提取所述用户样本的样本特征包括:
识别所述用户样本中的各个信息项,并将所述各个信息项归一化为对应的信息指标;
按照样本特征中元素的排序方式对归一化后的信息指标进行排序,以生成由各个所述信息指标构成的指标向量,并基于所述指标向量生成所述用户样本的样本特征。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取就医查询请求,所述就医查询请求中包括用户信息;
响应于所述就医查询请求,利用所述实时查询模型生成所述用户信息对应的推荐就医信息;
判断所述推荐就医信息是否正确,若不正确,根据所述用户信息和修正后的就医信息,构建校正样本,并利用所述校正样本对所述实时查询模型进行校正。
5.根据权利要求1所述的方法,其特征在于,生成所述样本特征对应的预测就医信息包括:
将所述样本特征输入第一预测分支和第二预测分支,以通过所述第一预测分支和所述第二预测分支分别输出第一预测结果和第二预测结果;
从所述第一预测结果中提取前缀特征,并从所述第二预测结果中提取后缀特征,并基于所述前缀特征和所述后缀特征构成待处理特征;
将所述待处理特征输入全连接层,并通过所述全连接层输出所述样本特征的预测就医信息。
6.一种基于大数据的医院就医信息实时查询系统,其特征在于,所述系统包括:
数据获取单元,用于获取用户样本集,所述用户样本集中包括用户样本和所述用户样本对应的标准就医信息;
信息生成单元,用于通过实时查询模型提取所述用户样本的样本特征,并生成所述样本特征对应的预测就医信息;
校正单元,用于对比所述标准就医信息和所述预测就医信息,并根据对比结果生成误差信息,利用所述误差信息对所述实时查询模型进行校正,以使得根据校正后的实时查询模型生成的预测就医信息与所述标准就医信息保持一致。
7.根据权利要求6所述的系统,其特征在于,所述数据获取单元,具体用于针对待采集信息的目标用户,获取所述目标用户的用户信息,所述用户信息至少表征所述目标用户的性别、年龄及健康指标;识别所述目标用户的历史就医信息,所述历史就医信息至少表征所述目标用户就医的医院标识;将所述目标用户的用户信息作为用户样本,并将所述目标用户的历史就医信息作为所述用户样本对应的标准就医信息;
其中,对用户信息进行分词后,则分词后文本d是垃圾信息的概率为:
其中为文本d是垃圾信息的概率,/>表示文本d在整个用户信息库中出现的概率,/>表示整个用户信息库中垃圾信息的概率,/>为差异因子,其计算公式为:
其中为文本d在整个用户信息库中为非垃圾信息的频数,/>为文本d在整个用户信息库中为垃圾信息的频数;
表示在整个用户信息库中当文本信息为d时其是垃圾信息的概率,其计算公式如下:
其中n为用户信息库中含有文本信息d的信息总量,i为用户信息库中含有文本信息d的信息编号,i为整数且大于等于1小于等于n,为编号为i的用户信息库中含有文本信息d的信息中文本信息d是垃圾信息的概率,因此分词后文本d是垃圾信息的概率为:
当大于0.5时,文本d为垃圾信息,予以忽略,不做处理;当/>小于等于0.5时,文本d为有效信息,对其进行后续处理分析。
8.根据权利要求6所述的系统,其特征在于,所述信息生成单元具体用于,识别所述用户样本中的各个信息项,并将所述各个信息项归一化为对应的信息指标;按照样本特征中元素的排序方式对归一化后的信息指标进行排序,以生成由各个所述信息指标构成的指标向量,并基于所述指标向量生成所述用户样本的样本特征。
9.根据权利要求6所述的系统,其特征在于,所述系统还包括:
请求获取单元,用于获取就医查询请求,所述就医查询请求中包括用户信息;
请求响应单元,用于响应于所述就医查询请求,利用所述实时查询模型生成所述用户信息对应的推荐就医信息;
处理单元,用于判断所述推荐就医信息是否正确,若不正确,根据所述用户信息和修正后的就医信息,构建校正样本,并利用所述校正样本对所述实时查询模型进行校正。
10.根据权利要求6所述的系统,其特征在于,
所述信息生成单元,还用于将所述样本特征输入第一预测分支和第二预测分支,以通过所述第一预测分支和所述第二预测分支分别输出第一预测结果和第二预测结果;从所述第一预测结果中提取前缀特征,并从所述第二预测结果中提取后缀特征,并基于所述前缀特征和所述后缀特征构成待处理特征;将所述待处理特征输入全连接层,并通过所述全连接层输出所述样本特征的预测就医信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310815083.9A CN116564538B (zh) | 2023-07-05 | 2023-07-05 | 一种基于大数据的医院就医信息实时查询方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310815083.9A CN116564538B (zh) | 2023-07-05 | 2023-07-05 | 一种基于大数据的医院就医信息实时查询方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116564538A true CN116564538A (zh) | 2023-08-08 |
CN116564538B CN116564538B (zh) | 2023-12-19 |
Family
ID=87500431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310815083.9A Active CN116564538B (zh) | 2023-07-05 | 2023-07-05 | 一种基于大数据的医院就医信息实时查询方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116564538B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017167067A1 (zh) * | 2016-03-30 | 2017-10-05 | 阿里巴巴集团控股有限公司 | 网页文本分类的方法和装置,网页文本识别的方法和装置 |
WO2020057413A1 (zh) * | 2018-09-17 | 2020-03-26 | 阿里巴巴集团控股有限公司 | 垃圾文本的识别方法、装置、计算设备及可读存储介质 |
CN111241265A (zh) * | 2020-01-09 | 2020-06-05 | 平安国际智慧城市科技股份有限公司 | 信息推荐方法、设备、存储介质及装置 |
WO2021135446A1 (zh) * | 2020-06-19 | 2021-07-08 | 平安科技(深圳)有限公司 | 文本分类方法、装置、计算机设备及存储介质 |
WO2021151358A1 (zh) * | 2020-09-08 | 2021-08-05 | 平安科技(深圳)有限公司 | 基于解释模型的分诊信息推荐方法、装置、设备及介质 |
CN114203285A (zh) * | 2021-11-12 | 2022-03-18 | 姜德秋 | 应用于智慧医疗的大数据分析方法及智慧医疗服务器 |
CN114783586A (zh) * | 2022-04-12 | 2022-07-22 | 郑州大学第三附属医院(河南省妇幼保健院) | 一种基于5g技术的智慧医疗管理方法、系统、终端及介质 |
CN114817321A (zh) * | 2022-04-05 | 2022-07-29 | 黄菲 | 一种基于物联网的医院就医信息实时查询方法及系统 |
CN115130545A (zh) * | 2022-04-29 | 2022-09-30 | 腾讯科技(深圳)有限公司 | 数据处理方法、电子设备、程序产品及介质 |
CN116226320A (zh) * | 2021-12-03 | 2023-06-06 | 腾讯科技(深圳)有限公司 | 一种预测下文信息的方法、装置、电子设备及存储介质 |
-
2023
- 2023-07-05 CN CN202310815083.9A patent/CN116564538B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017167067A1 (zh) * | 2016-03-30 | 2017-10-05 | 阿里巴巴集团控股有限公司 | 网页文本分类的方法和装置,网页文本识别的方法和装置 |
WO2020057413A1 (zh) * | 2018-09-17 | 2020-03-26 | 阿里巴巴集团控股有限公司 | 垃圾文本的识别方法、装置、计算设备及可读存储介质 |
CN111241265A (zh) * | 2020-01-09 | 2020-06-05 | 平安国际智慧城市科技股份有限公司 | 信息推荐方法、设备、存储介质及装置 |
WO2021139146A1 (zh) * | 2020-01-09 | 2021-07-15 | 平安国际智慧城市科技股份有限公司 | 信息推荐方法、设备、计算机可读存储介质及装置 |
WO2021135446A1 (zh) * | 2020-06-19 | 2021-07-08 | 平安科技(深圳)有限公司 | 文本分类方法、装置、计算机设备及存储介质 |
WO2021151358A1 (zh) * | 2020-09-08 | 2021-08-05 | 平安科技(深圳)有限公司 | 基于解释模型的分诊信息推荐方法、装置、设备及介质 |
CN114203285A (zh) * | 2021-11-12 | 2022-03-18 | 姜德秋 | 应用于智慧医疗的大数据分析方法及智慧医疗服务器 |
CN116226320A (zh) * | 2021-12-03 | 2023-06-06 | 腾讯科技(深圳)有限公司 | 一种预测下文信息的方法、装置、电子设备及存储介质 |
CN114817321A (zh) * | 2022-04-05 | 2022-07-29 | 黄菲 | 一种基于物联网的医院就医信息实时查询方法及系统 |
CN114783586A (zh) * | 2022-04-12 | 2022-07-22 | 郑州大学第三附属医院(河南省妇幼保健院) | 一种基于5g技术的智慧医疗管理方法、系统、终端及介质 |
CN115130545A (zh) * | 2022-04-29 | 2022-09-30 | 腾讯科技(深圳)有限公司 | 数据处理方法、电子设备、程序产品及介质 |
Non-Patent Citations (3)
Title |
---|
刘洁: "基于IMI-WNB算法的垃圾邮件过滤技术研究", vol. 46, no. 12, pages 3 * |
阳国华;姜川;: "基于文本分类的智能垃圾回收机设计", 集成电路应用, no. 07 * |
韩洪勇;姜锦琨;杨超然;陈照奇;: "基于朴素贝叶斯的新闻文本分类", 科技风, no. 14 * |
Also Published As
Publication number | Publication date |
---|---|
CN116564538B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112256828B (zh) | 医学实体关系抽取方法、装置、计算机设备及可读存储介质 | |
CN111949759A (zh) | 病历文本相似度的检索方法、系统及计算机设备 | |
CN113724848A (zh) | 基于人工智能的医疗资源推荐方法、装置、服务器及介质 | |
CN110246572B (zh) | 一种基于词向量的医疗分诊方法及系统 | |
CN110659346B (zh) | 表格提取方法、装置、终端及计算机可读存储介质 | |
CN116719520B (zh) | 代码生成方法及装置 | |
CN113779179B (zh) | 一种基于深度学习和知识图谱的icd智能编码的方法 | |
CN109063171B (zh) | 基于语义的资源匹配方法 | |
CN113642562A (zh) | 基于图像识别的数据解读方法、装置、设备及存储介质 | |
CN111180060A (zh) | 一种疾病诊断自动编码方法及装置 | |
CN109783483A (zh) | 一种数据整理的方法、装置、计算机存储介质及终端 | |
CN116564538B (zh) | 一种基于大数据的医院就医信息实时查询方法及系统 | |
CN111640517B (zh) | 病历编码方法、装置、存储介质及电子设备 | |
CN111104422B (zh) | 一种数据推荐模型的训练方法、装置、设备及存储介质 | |
CN105808735B (zh) | 一种数据处理的方法及装置 | |
CN112035646A (zh) | 关键内容提取方法 | |
CN115577694B (zh) | 标准编写的智能推荐方法 | |
CN116469505A (zh) | 数据处理方法、装置、计算机设备及可读存储介质 | |
CN116431746A (zh) | 基于编码库的地址映射方法、装置、电子设备及存储介质 | |
CN115862840A (zh) | 关节疼痛疾病的智能辅助诊断方法和装置 | |
CN114238639A (zh) | 一种医学术语标准化框架的构建方法、装置、电子设备 | |
US20210064704A1 (en) | Context-based image tag translation | |
CN113779373A (zh) | 一种体检项目确定方法、装置、设备及存储介质 | |
JP4259889B2 (ja) | データベース管理システム、データベース管理装置、データベース管理方法、及びデータベース管理プログラム | |
CN111881681A (zh) | 实体样本获取方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |