CN116487060A - 基于科室维度的收费异常识别方法、装置、设备及介质 - Google Patents
基于科室维度的收费异常识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116487060A CN116487060A CN202310452517.3A CN202310452517A CN116487060A CN 116487060 A CN116487060 A CN 116487060A CN 202310452517 A CN202310452517 A CN 202310452517A CN 116487060 A CN116487060 A CN 116487060A
- Authority
- CN
- China
- Prior art keywords
- department
- doctor
- data vector
- vector
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 239000013598 vector Substances 0.000 claims abstract description 307
- 238000003745 diagnosis Methods 0.000 claims abstract description 129
- 230000002159 abnormal effect Effects 0.000 claims abstract description 49
- 230000005856 abnormality Effects 0.000 claims abstract description 45
- 238000003062 neural network model Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 17
- 238000012935 Averaging Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 238000011282 treatment Methods 0.000 abstract description 11
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000007689 inspection Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Epidemiology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及数字医疗领域,公开了一种基于科室维度的收费异常识别方法、装置、设备及介质,方法包括:获取预设时间段的科室的就诊数据,将就诊数据输入至就诊数据向量表示模型中获取就诊数据向量;获取预设时间段的科室的医生数据,将医生数据输入至医生数据向量表示模型中获取医生数据向量;将就诊数据向量和医生数据向量进行融合获取科室的科室综合向量;将科室综合向量输入至对收费异常识别模型中,获取科室的收费正常或异常情况,收费异常识别模型为多层感知器神经网络模型。本发明通过在科室维度自动识别收费异常,能够从海量的、复杂的数据中发现异常数据,从而达到最终控费目的,且异常识别的准确率更高,提升了效率,大大解放了人力。
Description
技术领域
本发明涉及数字医疗技术领域,尤其涉及一种基于科室维度的收费异常识别方法、装置、设备及介质。
背景技术
控制不合理的医疗费用增长是目前我国医改的重要目标之一。存在多种原因会导致不合理的医疗费用支出,针对医疗控费的目的,不同地区已经提出了多种措施进行医疗控费。
现有的方法一般是通过人工挑选一些病例进行检查,另一方面在医疗项目的费用维度应用一些统计模型发现费用异常高的病例的方法进行医疗费用控制,然而这些方法普遍存在人工参与高,效率低,无法发现复杂的、隐蔽的异常医疗收费的问题。
发明内容
本发明提供一种科室维度的收费异常识别方法、装置、计算机设备及介质,以解决现有方法普遍存在人工参与高,效率低,无法发现复杂的、隐蔽的异常医疗收费的技术问题。
第一方面,提供了一种基于科室维度的收费异常识别方法,包括:
获取预设时间段的科室的就诊数据,将所述就诊数据输入至就诊数据向量表示模型中,获取就诊数据向量;其中,所述就诊数据向量表示模型为第一自编码器;
获取预设时间段的所述科室的医生数据,将所述医生数据输入至医生数据向量表示模型中,获取医生数据向量;其中,所述医生数据向量表示模型为第二自编码器;
将所述就诊数据向量和所述医生数据向量进行融合获取所述科室的科室综合向量;
将所述科室综合向量输入至对收费异常识别模型中,获取所述科室的收费正常或异常情况,其中,所述收费异常识别模型为多层感知器神经网络模型。
第二方面,提供了一种基于科室维度的收费异常识别装置,包括:
就诊数据向量获取模块,用于获取预设时间段的科室的就诊数据,将所述就诊数据输入至就诊数据向量表示模型中,获取就诊数据向量;其中,所述就诊数据向量表示模型为第一自编码器;
医生数据向量获取模块,用于获取预设时间段的所述科室的医生数据,将所述医生数据输入至医生数据向量表示模型中,获取医生数据向量;其中,所述医生数据向量表示模型为第二自编码器;
科室综合向量获取模块,用于将所述就诊数据向量和所述医生数据向量进行融合获取所述科室的科室综合向量;
收费识别模块,用于将所述科室综合向量输入至对收费异常识别模型中,获取所述科室的收费正常或异常情况,其中,所述收费异常识别模型为多层感知器神经网络模型。
第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于科室维度的收费异常识别方法的步骤。
第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述基于科室维度的收费异常识别方法的步骤。
上述基于科室维度的收费异常识别方法、装置、设备及介质所实现的方案中,可以通过获取一定段内某一科室的就诊数据和医生数据,并根据其就诊数据和医生数据分别获取该科室的就诊数据向量和医生数据向量,并将该就诊数据向量和医生数据向量进行融合以获取该科室的科室综合向量,然后将该科室的科室综合向量输入至通过利用带有标签的科室综合向量对多层感知器进行训练完成后构建的收费异常识别模型中,以判断该科室是否存在收费异常的情况,在本发明中,针对医院中某一科室中获取到海量的、复杂的数据进行特征提取融合,从而获取该科室的科室综合向量,通过该科室综合向量从科室的维度上来判断科室是否存在收费异常的情况,能够从海量的、复杂的数据中发现异常数据模式,从而达到最终控费的目的,相较于已有的、常见的通过费用检查的方法进行异常识别的方法,本方案提出的方法建立的模型异常识别的准确率更高,同时,能够在科室维度自动识别收费异常,相较于之前人工检查的方式,提升了效率,大大解放了人力。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供基于科室维度的收费异常识别方法的应用环境示意图。
图2为本发明提供的基于科室维度的收费异常识别方法的流程示意图。
图3为本发明提供的基于科室维度的收费异常识别方法中获取就诊数据向量的流程示意图。
图4为本发明提供的基于科室维度的收费异常识别方法中获取初始就诊数据向量的流程示意图。
图5为设置为5层的自编码器的示意图。
图6本发明提供的基于科室维度的收费异常识别方法中获取医生数据向量的流程示意图。
图7为本发明提供的获取所述科室的收费正常或异常情况流程示意图。
图8为本发明实施例提供的建立收费异常识别模型流程示意图。
图9为本发明实施例提供的获取各个科室的带有是否收费异常的标签的科室综合向量作为训练集样本一个流程示意图。
图10为本发明提出的一种基于科室维度的收费异常识别装置的结构框图。
图11为本发明提出的一种计算机设备内部结构图。
图12为本发明提出的一种计算机设备另一种内部结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于科室维度的收费异常识别方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务端进行通信。服务端可以获取任一科室的在某一时间段内的就诊数据和医生数据,并根据其就诊数据和医生数据分别获取该科室的就诊数据向量和医生数据向量,并将该就诊数据向量和医生数据向量进行融合以获取该科室的科室综合向量,然后将该科室的科室综合向量输入至通过利用带有标签的科室综合向量对多层感知器进行训练完成后构建的收费异常识别模型中,以判断该科室是否存在收费异常的情况,并其将其收费异常的识别结果反馈给客户端。在本发明中,在本发明中,针对医院中某一科室中获取到海量的、复杂的数据进行特征提取融合,从而获取该科室的科室综合向量,通过该科室综合向量从科室的维度上来判断科室是否存在收费异常的情况,能够从海量的、复杂的数据中发现异常数据模式,从而达到最终控费的目的。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机和平板电脑便携式。下面通过具体的实施例对本发明进行详细的描述。
请参阅图2所示,图2为本发明实施例提供的基于科室维度的收费异常识别方法的一个流程示意图,包括如下步骤:
S10:获取预设时间段的科室的就诊数据,将所述就诊数据输入至就诊数据向量表示模型中,获取就诊数据向量;其中,所述就诊数据向量表示模型为第一自编码器。其中,所述就诊数据为该科室的各种收费数据。需要说明的是,每就诊一个人次则产生一次就诊数据。
请参阅图3所示,图3为本发明实施例提供的基于科室维度的收费异常识别方法中获取就诊数据向量的一个流程示意图,在本实施例中,所述获取科室的就诊数据,将所述就诊数据输入至就诊数据向量表示模型中以获取就诊数据向量包括:
S11:获取就诊数据,根据所述就诊数据获取初始就诊数据向量;
请参阅图4所示,图4为本发明实施例提供的基于科室维度的收费异常识别方法中获取初始就诊数据向量的一个流程示意图,具体的,包括:
S111:获取所述科室中的多个收费项目;例如,从所述科室中获取M个收费项目,并将所述M个收费项目用M维向量表示,其中,M个收费项目分别与M维向量中的不同维一一对应。例如,从科室中所有的收费项目中选择单价费用较高的M个项目,将该M个项目用一个M维向量i表示,其中,i=(M1;M2;…;Mm),M1,M2,…,Mm分别对应该M个项目。
S112:获取所述科室中的就诊数据,并将所述就诊数据收费项目相关联,构成初始就诊数据向量;例如,获取所述科室中的就诊数据,将任意一个就诊数据与所述M个收费项目比对。例如,从该科室中获取就诊数据,且每个就诊数据包括不同的收费项目,将该就诊数据上的收费项目与上述M维向量中的M个收费项目进行比对。若就诊数据中出现某一收费项目,则将该收费项目在所述M维向量中对应的位置记为1,否则,记为0,以构成初始就诊数据向量。例如,若该就诊数据上出现了M个收费项目中的收费项目j,则将该收费项目在向量i中所对应位置Mj记为1,未出现M个收费项目中的收费项目在向量i中所对应的位置记为0,以构成初始就诊数据向量。
S12:将所述初始就诊数据向量输入至第一自编码器中,通过所述第一自编码器对所述初始就诊数据向量进行降维处理,获取中间就诊数据向量;
标准自编码器是一个三层网络,可以看作由编码器和解码器两部分组成。把网络fθ切分为两个部分,前面的子网络尝试学习映射关系:gθ1:x→z,后面的子网络尝试学习映射关系:把gθ1看成一个数据编码(Encode)的过程,把高维度的输入x编码成低维度的中间层隐藏变量z(Latent Variable,或隐藏变量),称为Encoder网络(编码器)。hθ2看成数据解码(Decode)的过程,把编码过后的输入z解码为高维度的/>称为Decoder网络(解码器),编码器和解码器共同完成了输入数据x的编码和解码过程,把整个网络模型fθ叫做自动编码器(Auto-Encoder),简称自编码器。
请参阅图5所示,图5为自编码器的设置为5层的示意图。在本实施例中,应用K层,例如K=5的自编码器网络建立就诊数据向量表示模型,将所述初始就诊数据向量i=(M1;M2;…;Mm)作为该自编码器网络的输入层的输入,经过自编码器的编码过程中把高维度的初始就诊数据向量i变换到低维度的中间层隐藏变量z,再经过自编码器的解码过程中将低维度的中间层隐藏变量z变换到高维度的向量并将上述训练过程中的得到的中间层隐藏变量z作为中间就诊数据向量。需要说明的是,在本实施例中,中间就诊数据向量为N维向量,N远小于M。即通过非监督的方法训练模型,将高维稀疏的向量(指输入M维向量)转换为低维、紧密的向量(指中间层N维向量),最后,选取模型的中间层N维向量,作为就诊数据向量表示。
S13:将所有就诊数据对应的中间就诊数据向量进行平均,获取所述科室的就诊数据向量。即每个就诊数据经自编码器训练后均获取一个对应的中间就诊数据向量,再将获取的所有中间就诊数据向量进行平均处理,平均处理后得到的向量即为该科室的就诊数据向量u。
S20:获取预设时间段的所述科室的医生数据,将所述医生数据输入至医生数据向量表示模型中获取医生数据向量;其中,所述医生数据向量表示模型为第二自编码器;需要说明的是,该科室与上述收集就诊数据的科室相同。
请参阅图6所示,图6本发明实施例提供的基于科室维度的收费异常识别方法中获取医生数据向量的一个流程示意图,在本实施例中,获取所述科室的医生数据,将所述医生数据输入至医生数据向量表示模型中获取医生数据向量包括:
S21:从所述科室中获取每个医生的多个问诊数据,并生成每个医生的初始医生数据向量;例如,从所述科室中获取每个医生的P个问诊数据,并将所述P个问诊数据用P维向量表示,其中,P个问诊数据分别与P维向量中的不同维一一对应;
在本实施例中,该P个问诊数据为医生的P个特征,即每个医生由P个特征表示,例如,包括医生的个人信息特征和医生开出的就诊数据统计特征,个人信息特征例如包括年龄、性别、学历水平、从医时长等,医生开出的就诊数据统计特征例如包括按天平均就诊次数、开出的就诊收费单平均金额、开出的就诊收费单金额中位数、开出的就诊收费单最大金额、开出的就诊收费单中检验类别平均金额、开出的就诊收费单中药品类别平均金额等,即由上述P个特征组成P维向量,用该P维向量作为该医生的初始医生数据向量。
S22:将每个医生的所述初始医生数据向量输入至第二自编码器中,将所述初始就诊数据向量输入至第二自编码器中,通过所述第二自编码器对所述初始医生数据向量进行降维处理,获取每个医生的中间医生数据向量;例如,将所述P维的初始医生数据向量输入至第二自编码器中进行无监督训练,以获取训练过程中的中间层的N维向量作为中间医生数据向量;即将所述P维向量作为初始医生数据向量输入至自编码器中进行训练,该自编码器例如设置为H层,例如H=7,需要说明的是,该训练过程与上述实施例中训练就诊数据向量的过程类似,以获取N维的中间医生数据向量,且N远小于P。即通过非监督的方法训练模型,将高维稀疏的向量(指输入P维向量)转换为低维、紧密的向量(指中间层N维向量),最后,选取模型的中间层N维向量,作为中间医生数据向量表示。还需要说明的是,获取到中间医生数据向量与上述中间就诊数据向量的维数相同。
S23:将所有医生的中间医生数据向量进行平均,获取所述科室的医生数据向量。即每个医生的多个问诊数据经自编码器训练后均获取一个对应的中间医生数据向量,再将获取的所有中间医生数据向量进行平均处理,平均处理后得到的向量即为该科室的医生数据向量v。
S30:将所述就诊数据向量和所述医生数据向量进行融合获取所述科室的科室综合向量。
在本实施例中,融合过程为将就诊数据向量u、医生数据向量v、就诊数据向量u与医生数据向量v之和、就诊数据向量u与医生数据向量v之间差值的绝对值构建为所述科室综合向量X,其中X为(u;v;u+v;|u-v|)。
S40:将所述科室综合向量输入至对收费异常识别模型中,获取所述科室的收费正常或异常情况,其中,所述收费异常识别模型为多层感知器神经网络模型。
请参阅图7所示,图7为本发明实施例提供的获取所述科室的收费正常或异常情况一个流程示意图,所述科室综合向量输入至收费异常识别模型中,获取所述科室的收费正常或异常情况包括:
S41:将所述科室综合向量输入至收费异常识别模型,获取收费异常的概率;其中所述概率属于[0,1],即将上述实施例中获取到的科室综合向量输入至训练好的收费异常识别模型中,以获取其收费异常的概率值。
S42:将所述概率与预设的概率阈值对比,判断科室是否存在收费异常情况;将所述概率与预设的概率阈值对比,在本实施例中,所述阈值例如设置为0.5,从而判断科室是否存在收费异常情况。
S43:若所述概率大于所述概率阈值,则所述科室综合向量所对应的科室存在收费异常;否则,则收费正常。
所述收费异常识别方法包括:所述多层感知器神经网络模型是训练样本集训练获得的,其中,所述训练样本集为带有是否收费异常的标签的科室综合向量组成;请参阅图8所示,图8为本发明实施例提供的构建所述收费异常识别模型一个流程示意图,具体的,对多层感知器神经网络模型进行训练包括:
S401:获取各个科室的带有是否收费异常的标签的科室综合向量作为训练集样本。例如,将其中存在收费异常科室的科室综合向量的标签记为1;否则,标签记为0。
S402:将所述训练集样本输入至待训练的多层感知器神经网络模型中迭代训练,反复迭代和调整所述多层感知器模型的训练参数,直至所述多层感知器模型的损失值收敛至第一目标,以获取训练后的多层感知器神经网络模型。
例如,构建一个多层感知机模型,该多层感知机的最左边是输入层,用于接收一个或多个科室的科室综合向量;该多层感知机的中间是若干隐藏层,用于对所输入的科室综合向量的特征进行提取计算;该多层感知机的最右边是输出层,输出的是所输入的科室综合向量经过多层感知机模型判断之后属于收费异常的概率,根据概率值可确定该科室是否存在收费异常的情况,即将所述概率值与预设的阈值对比,以判断科室是否存在收费异常情况。
例如将所述科室综合向量和该科室综合向量的标签分别作为多层感知器的输入和输出,不断对该多层感知器进行训练迭代,直至所述多层感知器模型的损失值收敛至第一目标,以获取训练后的多层感知器神经网络模型。
请参阅图9所示,图9为本发明实施例提供的获取各个科室的带有是否收费异常的标签的科室综合向量作为训练集样本一个流程示意图,具体的,其包括:
S4011:获取多个不同时间段内不同科室的经过费用检查后的就诊数据和医生数据;例如,获取固定时间段内(例如最近1年的数据)的多家医院内不同科室的就诊数据和医生数据,且存在收费异常的科室的就诊数据和医生数据的标签为1,不存在异常的科室的就诊数据和医生数据的标签为0;即获取的就诊数据和医生数据为经过费用检查后以确定是否存在收费异常的电子病历数据。
S4012:将多个所述就诊数据输入至所述就诊数据向量表示模型中获取就诊数据向量;需要说明的是,其获取过程与上述实施例中所述描述的获取就诊数据向量的过程相同,在此不再重复赘述。
S4013:将多个所述医生数据输入至所述医生数据向量表示模型中获取医生数据向量;需要说明的是,其获取过程与上述实施例中所述描述的获取医生数据向量的过程相同,在此不再重复赘述。
S4014:将多个所述就诊数据向量和多个所述医生数据向量进行融合获取不同时间段的不同科室的多个科室综合向量。
S4015:按照费用检查的结果对多个科室综合向量添加对应的是否收费异常标签,构成所述训练样本集;其中,存在收费异常科室的科室综合向量的标签记为1;否则,标签记为0。
可见,在上述方案中,针对医院中某一科室中获取到海量的、复杂的数据进行特征提取融合,从而获取该科室的科室综合向量,通过该科室综合向量从科室的维度上来判断科室是否存在收费异常的情况,能够从海量的、复杂的数据中发现异常数据模式,从而达到最终控费的目的,相较于已有的、常见的通过费用检查的方法进行异常识别的方法,本方案提出的方法建立的模型异常识别的准确率更高,同时,能够在科室维度自动识别收费异常,相较于之前人工检查的方式,提升了效率,大大解放了人力。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种基于科室维度的收费异常识别装置,该基于科室维度的收费异常识别装置与上述实施例中基于科室维度的收费异常识别方法一对应。请参阅图10所示,图10为本发明提出的一种基于科室维度的收费异常识别装置的结构框图,该收费异常识别装置100包括就诊数据向量获取模块101、医生数据向量获取模块102、科室综合向量获取模块103和收费识别模块104。各功能模块详细说明如下:
诊数据向量获取模块101,用于获取预设时间段的科室的就诊数据,将所述就诊数据输入至就诊数据向量表示模型中,获取就诊数据向量;其中,所述就诊数据向量表示模型为第一自编码器;
医生数据向量获取模块102,用于获取预设时间段的所述科室的医生数据,将所述医生数据输入至医生数据向量表示模型中,获取医生数据向量;其中,所述医生数据向量表示模型为第二自编码器;
科室综合向量获取模块103,用于将所述就诊数据向量和所述医生数据向量进行融合获取所述科室的科室综合向量;
收费识别模块104,用于将所述科室综合向量输入至对收费异常识别模型中,获取所述科室的收费正常或异常情况,其中,所述收费异常识别模型为多层感知器神经网络模型。
请参阅图9所示,在一实施例中,诊数据向量获取模块101,具体用于获取预设时间段的就诊数据,并将所述就诊数据输入至所述就诊数据向量模型中,获取就诊数据向量。具体的,诊数据向量获取模块101用于:
获取就诊数据,根据所述就诊数据获取初始就诊数据向量;
将所述初始就诊数据向量输入至第一自编码器中,通过所述第一自编码器对所述初始就诊数据向量进行降维处理,获取中间就诊数据向量;
将所有就诊数据对应的中间就诊数据向量进行平均,以获取所述科室的就诊数据向量。
请参阅图9所示,在一实施例中,医生数据向量获取模块102,具体用于获取预设时间段的医生数据,并将所述就诊数据输入至所述医生数据向量模型中,获取医生数据向量。具体的,
从所述科室中获取每个医生的多个问诊数据,并生成每个医生的初始医生数据向量;
将每个医生的所述初始医生数据向量输入至第二自编码器中,将所述初始就诊数据向量输入至第二自编码器中,通过所述第二自编码器对所述初始医生数据向量进行降维处理,获取每个医生的中间医生数据向量;
将所有医生的中间医生数据向量进行平均,获取所述科室的医生数据向量。
请参阅图9所示,在一实施例中,科室综合向量获取模块103,具体用于:将就诊数据向量u、医生数据向量v、就诊数据向量u与医生数据向量v之和以及就诊数据向量u与医生数据向量v之间差值的绝对值构建为所述科室综合向量X,其中X为(u;v;u+v;|u-v|)。
请参阅图8所示,在一实施例中,收费识别模块104,具体用于:
将所述科室综合向量输入至收费异常识别模型中,获取所述科室的收费正常或异常情况包括:
将所述科室综合向量输入至收费异常识别模型,获取收费异常的概率;
将所述概率与预设的概率阈值对比,判断科室是否存在收费异常情况;
若所述概率值大于所述概率阈值,则所述科室综合向量所对应的科室存在收费异常;否则,则收费正常。
在另一实施例中,还包括数据获取模块,所述数据获取模块用于获取一定时间段内一家医院中一个或多个科室的就诊数据和医生数据;或用于获取一定时间段内多家医院中多个科室的就诊数据和医生数据,就诊数据向量获取模块101和医生数据向量获取模块102从所述数据获取模块中分别获取就诊数据和医生数据,再根据就诊数据和医生数据分别获取就诊数据向量和医生数据向量。
本发明提供了一种收费异常识别装置,其从医院中某一科室中获取到海量的、复杂的数据获取就诊数据和医生数据,以形成就诊数据向量和医生数据向量,并将其进行融合,从而获取该科室的科室综合向量,将该科室综合向量输入至收费识别模块中,以判断该科室是否存在收费异常的情况,即通过该科室综合向量从科室的维度上来判断科室是否存在收费异常的情况,能够从海量的、复杂的数据中发现异常数据模式,从而达到最终控费的目的,相较于已有的、常见的通过费用检查的方法进行异常识别的方法,本方案提出的装置建立的模型异常识别的准确率更高,同时,能够在科室维度自动识别收费异常,相较于之前人工检查的方式,提升了效率,大大解放了人力。
关于收费异常识别装置的具体限定可以参见上文中对于收费异常识别方法的限定,在此不再赘述。上述收费异常识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于科室维度的收费异常识别装置方法服务端侧的功能或步骤。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种基于科室维度的收费异常识别装置客户端侧的功能或步骤
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
获取预设时间段的科室的就诊数据,将所述就诊数据输入至就诊数据向量表示模型中,获取就诊数据向量;其中,所述就诊数据向量表示模型为第一自编码器;
获取预设时间段的所述科室的医生数据,将所述医生数据输入至医生数据向量表示模型中,获取医生数据向量;其中,所述医生数据向量表示模型为第二自编码器;
将所述就诊数据向量和所述医生数据向量进行融合获取所述科室的科室综合向量;
将所述科室综合向量输入至对收费异常识别模型中,获取所述科室的收费正常或异常情况,其中,所述收费异常识别模型为多层感知器神经网络模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取预设时间段的科室的就诊数据,将所述就诊数据输入至就诊数据向量表示模型中,获取就诊数据向量;其中,所述就诊数据向量表示模型为第一自编码器;
获取预设时间段的所述科室的医生数据,将所述医生数据输入至医生数据向量表示模型中,获取医生数据向量;其中,所述医生数据向量表示模型为第二自编码器;
将所述就诊数据向量和所述医生数据向量进行融合获取所述科室的科室综合向量;
将所述科室综合向量输入至对收费异常识别模型中,获取所述科室的收费正常或异常情况,其中,所述收费异常识别模型为多层感知器神经网络模型。
需要说明的是,上述关于计算机可读存储介质或计算机设备所能实现的功能或步骤,可对应参阅前述方法实施例中,服务端侧以及客户端侧的相关描述,为避免重复,这里不再一一描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于科室维度的收费异常识别方法,其特征在于,包括:
获取预设时间段的科室的就诊数据,将所述就诊数据输入至就诊数据向量表示模型中,获取就诊数据向量;其中,所述就诊数据向量表示模型为第一自编码器;
获取预设时间段的所述科室的医生数据,将所述医生数据输入至医生数据向量表示模型中,获取医生数据向量;其中,所述医生数据向量表示模型为第二自编码器;
将所述就诊数据向量和所述医生数据向量进行融合获取所述科室的科室综合向量;
将所述科室综合向量输入至对收费异常识别模型中,获取所述科室的收费正常或异常情况,其中,所述收费异常识别模型为多层感知器神经网络模型。
2.根据权利要求1所述的基于科室维度的收费异常识别方法,其特征在于,所述获取科室的就诊数据,将所述就诊数据输入至就诊数据向量表示模型中,获取就诊数据向量包括:
获取就诊数据,并根据所述就诊数据生成初始就诊数据向量;
将所述初始就诊数据向量输入至第一自编码器中,通过所述第一自编码器对所述初始就诊数据向量进行降维处理,获取中间就诊数据向量;
将所有就诊数据对应的中间就诊数据向量进行平均,获取所述科室的就诊数据向量。
3.根据权利要求2所述的基于科室维度的收费异常识别方法,其特征在于,获取就诊数据,根据所述就诊数据获取初始就诊数据向量的步骤包括:
获取所述科室中的多个收费项目;
获取所述科室中的就诊数据,并将所述就诊数据收费项目相关联,构成初始就诊数据向量。
4.根据权利要求1所述的基于科室维度的收费异常识别方法,其特征在于,获取所述科室的医生数据,将所述医生数据输入至医生数据向量表示模型中获取医生数据向量包括:
从所述科室中获取每个医生的多个问诊数据,并生成每个医生的初始医生数据向量;
将每个医生的所述初始医生数据向量输入至第二自编码器中,将所述初始就诊数据向量输入至第二自编码器中,通过所述第二自编码器对所述初始医生数据向量进行降维处理,获取每个医生的中间医生数据向量;
将所有医生的中间医生数据向量进行平均,获取所述科室的医生数据向量。
5.根据权利要求1所述的基于科室维度的收费异常识别方法,其特征在于,所述将所述就诊数据向量和所述医生数据向量进行融合获取所述科室的科室综合向量包括:
将就诊数据向量u、医生数据向量v、就诊数据向量u与医生数据向量v之和以及就诊数据向量u与医生数据向量v之间差值的绝对值构建为所述科室综合向量X,其中X为(u;v;u+v;|u-v|)。
6.根据权利要求1所述的基于科室维度的收费异常识别方法,其特征在于,将所述科室综合向量输入至收费异常识别模型中,获取所述科室的收费正常或异常情况包括:
将所述科室综合向量输入至收费异常识别模型,获取收费异常的概率;
将所述概率与预设的概率阈值对比,判断科室是否存在收费异常情况;
若所述概率值大于所述概率阈值,则所述科室综合向量所对应的科室存在收费异常;否则,则收费正常。
7.根据权利要求1所述的基于科室维度的收费异常识别方法,其特征在于,所述多层感知器神经网络模型是训练样本集训练获得的,其中,所述训练样本集为带有是否收费异常的标签的科室综合向量组成;所述训练集样本集是按照如下步骤获得的:
获取多个不同时间段内不同科室的经过费用检查后的就诊数据和医生数据;
将多个所述就诊数据输入至所述就诊数据向量表示模型中获取多个就诊数据向量;
将多个所述医生数据输入至所述医生数据向量表示模型中获取多个医生数据向量;
将多个所述就诊数据向量和多个所述医生数据向量进行融合获取不同时间段的不同科室的多个科室综合向量;
按照费用检查的结果对多个科室综合向量添加对应的是否收费异常标签,构成所述训练样本集。
8.一种基于科室维度的收费异常识别装置,其特征在于,包括:
就诊数据向量获取模块,用于获取预设时间段的科室的就诊数据,将所述就诊数据输入至就诊数据向量表示模型中,获取就诊数据向量;其中,所述就诊数据向量表示模型为第一自编码器;
医生数据向量获取模块,用于获取预设时间段的所述科室的医生数据,将所述医生数据输入至医生数据向量表示模型中,获取医生数据向量;其中,所述医生数据向量表示模型为第二自编码器;
科室综合向量获取模块,用于将所述就诊数据向量和所述医生数据向量进行融合获取所述科室的科室综合向量;
收费识别模块,用于将所述科室综合向量输入至对收费异常识别模型中,获取所述科室的收费正常或异常情况,其中,所述收费异常识别模型为多层感知器神经网络模型。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于科室维度的收费异常识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于科室维度的收费异常识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310452517.3A CN116487060A (zh) | 2023-04-24 | 2023-04-24 | 基于科室维度的收费异常识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310452517.3A CN116487060A (zh) | 2023-04-24 | 2023-04-24 | 基于科室维度的收费异常识别方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116487060A true CN116487060A (zh) | 2023-07-25 |
Family
ID=87213410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310452517.3A Pending CN116487060A (zh) | 2023-04-24 | 2023-04-24 | 基于科室维度的收费异常识别方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116487060A (zh) |
-
2023
- 2023-04-24 CN CN202310452517.3A patent/CN116487060A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11922348B2 (en) | Generating final abnormality data for medical scans based on utilizing a set of sub-models | |
US11669965B2 (en) | AI-based label generating system and methods for use therewith | |
CN111339126B (zh) | 医疗数据筛选方法、装置、计算机设备和存储介质 | |
CN109887562B (zh) | 电子病历的相似度确定方法、装置、设备和存储介质 | |
KR20220064395A (ko) | 이미지들 및 전문 지식으로부터 피부 상태들을 수집하고 식별하기 위한 시스템 | |
CA3137079A1 (en) | Computer-implemented machine learning for detection and statistical analysis of errors by healthcare providers | |
JP6793774B2 (ja) | パラメータの多次元時系列を分類するためのシステムおよび方法 | |
CN110797101B (zh) | 医学数据处理方法、装置、可读存储介质和计算机设备 | |
CN112035674B (zh) | 导诊数据获取方法、装置、计算机设备和存储介质 | |
CN111145910A (zh) | 基于人工智能的异常案例识别方法、装置、计算机设备 | |
CN112016279A (zh) | 电子病历结构化方法、装置、计算机设备和存储介质 | |
CN111180086B (zh) | 数据匹配方法、装置、计算机设备和存储介质 | |
CN112035611B (zh) | 目标用户推荐方法、装置、计算机设备和存储介质 | |
CN111914562B (zh) | 电子信息分析方法、装置、设备及可读存储介质 | |
WO2020034801A1 (zh) | 医疗特征筛选方法、装置、计算机设备和存储介质 | |
CN112132624A (zh) | 医疗理赔数据预测系统 | |
CN110729054B (zh) | 异常就诊行为检测方法、装置、计算机设备及存储介质 | |
CN111710383A (zh) | 病历质控方法、装置、计算机设备和存储介质 | |
Ali et al. | A novel approach for best parameters selection and feature engineering to analyze and detect diabetes: Machine learning insights | |
CN111767192B (zh) | 基于人工智能的业务数据检测方法、装置、设备和介质 | |
CN112201359A (zh) | 基于人工智能的重症问诊数据识别方法及装置 | |
CN112288279A (zh) | 基于自然语言处理和线性回归的业务风险评估方法和装置 | |
CN112035619A (zh) | 基于人工智能的医疗问诊单筛选方法、装置、设备和介质 | |
CN113707304B (zh) | 分诊数据处理方法、装置、设备及存储介质 | |
CN109493975B (zh) | 基于xgboost模型的慢性病复发预测方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |