CN111340641A - 一种异常就医行为检测方法 - Google Patents

一种异常就医行为检测方法 Download PDF

Info

Publication number
CN111340641A
CN111340641A CN202010442547.2A CN202010442547A CN111340641A CN 111340641 A CN111340641 A CN 111340641A CN 202010442547 A CN202010442547 A CN 202010442547A CN 111340641 A CN111340641 A CN 111340641A
Authority
CN
China
Prior art keywords
behavior
network
representing
hospitalizing
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010442547.2A
Other languages
English (en)
Other versions
CN111340641B (zh
Inventor
俞山青
韩忙
王甬琪
孙佳慧
宣琦
陈晋音
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010442547.2A priority Critical patent/CN111340641B/zh
Publication of CN111340641A publication Critical patent/CN111340641A/zh
Application granted granted Critical
Publication of CN111340641B publication Critical patent/CN111340641B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一种异常就医行为检测方法,包括:1)构建就医行为网络;2)获取网络节点特征表示;3)构建就医行为网络邻接矩阵;4)构建边特征矩阵;5)构建伪特征矩阵,获取就医行为特征表示;6)构建K‑GRU网络,提取就医行为时序信息;7)将特征压缩,并对压缩后的特征进行聚类;8)将压缩后的就医行为特征进行特征重构,使得重构后的特征趋近于原始就医行为特征;根据特征重构误差以及聚类误差优化模型;9)基于重构损失以及聚类损失,得到总的模型损失函数;10)交替优化聚类损失与重构损失直至模型收敛,判断异常就医行为。本发明有助于预防医保欺诈行为。

Description

一种异常就医行为检测方法
技术领域
本发明涉及图网络以及深度学习技术领域,具体而言,涉及一种异常就医行为检测方法。
背景技术
医疗保险是为患病的社会成员提供必要的物资帮助,减轻医疗费用负担,从而补偿劳动者因疾病风险造成的经济损失而建立的一项社会保障制度。目前,我国医保覆盖面以达到95%以上,但资金缺口严重,骗保形势严峻。
现有的医保审核模式,以人工审核为主,由于医保报销单据数据量巨大,很难对每一张单据做到及时有效的审核。因此推进智能化医保审核系统建设,是预防医保欺诈的有效手段。尽管目前各地区开始借助信息化力量构建智能医保审核系统,但是其核心方法依然是基于规则的方法,很难从海量的数据中发现异常就医行为,防止医保欺诈。
随着机器学习技术的日臻完善,一种医保欺诈行为识别方法、装置及设备将医保欺诈转化为分类任务,采用支持向量机识别患者是否发生医保欺诈行为。一种基于主成分分析算法的医保欺诈识别方法通过对医保数据进行清洗、整理,采取主成分分析方法,对与欺诈行为相关的变量进行特征降维,根据统计学方法计算异常阈值。然而以上方法均需要手动提取特征,难以从海量的数据中发现异常就医行为,防止医保欺诈。
近年来,随着深度学习技术在图像领域以及自然语言处理领域的成功应用,如何将深度学习技术应用于异常就医行为检测,有效预防医保欺诈是当下热门的研究内容。例如基于TLSTM的医疗保险欺诈检测模型,通过分析用户行为序列来判断医保欺诈的可能性。虽然该方法能够克服就医行为时间分布不均匀、样本不平衡的问题,但是模型能够处理的特征比较单一,无法综合分析多元化就医行为数据,发现异常就医行为,预防医保欺诈。
图网络技术在医保欺诈的应用也是当下研究热点,例如基于图卷积神经网络和变分自编码器的单分类医保欺诈检测模型,虽然该模型挖掘了病人与医生直接的权重特征,用来分析异常就医行为,但是该模型未能挖掘网络节点与节点之间连边的特征信息以及就医行为之间的时序特征信息,发现异常就医行为,从而有效的预防医保欺诈。
发明内容
本发明要克服现有技术的上述缺点,提供一种异常就医行为检测方法。
为了综合分析多元化就医行为数据,本发明构建以就医行为节点为中心的就医行为网络,设计一种特有的提取边特征的方法,充分挖掘就医行为节点和医生、药品等其他关联节点之间连边的特征信息;为了克服就医行为之间时长跨度不统一问题,提出了一种新的循环神经网络结构获取就医行为时间上的关联性信息;将压缩后的低维就医行为特征进行聚类,发现异常就医行为。
本发明解决的技术问题所采取的技术方案是:
一种异常就医行为检测方法,包括如下步骤:
1)构建就医行为网络;以患者历史就医行为数据为基础,构建就医行为网络
Figure 645185DEST_PATH_IMAGE001
Figure 42406DEST_PATH_IMAGE002
,其中n表示患者数量,
Figure 221715DEST_PATH_IMAGE003
表示第i个患者就 医行为网络集合,T表示该患者就医行为总数量。
Figure 575467DEST_PATH_IMAGE004
Figure 546834DEST_PATH_IMAGE005
表示患者的第j个就医行 为网络。V表示就医行为网络节点,E表示就医行为网络节点与节点之间的关系。
2)获取网络节点特征表示;提取节点和连边上的相关文本的词向量,作为节点和连边的特征。
3)构建网络邻接矩阵;基于1)构建的就医行为网络建立对应的邻接矩阵,
Figure 295102DEST_PATH_IMAGE006
Figure 351919DEST_PATH_IMAGE007
。其中,Ai表示就医行为网络集合
Figure 633996DEST_PATH_IMAGE003
对应的邻接矩阵集合。
Figure 476181DEST_PATH_IMAGE008
表示就医行为网络
Figure 310145DEST_PATH_IMAGE005
对应的邻接矩阵,K表示邻接矩阵中的节点 的数量。邻接矩阵由0,1构成,1表示两个节点之间存在关系,0表示两个节点之间不存在关 系。
4)构建网络边特征矩阵;为了获取就医行为网络节点之间的关系特征,以就医行 为网络的邻接矩阵为基础,构建对应的边特征矩阵
Figure 729625DEST_PATH_IMAGE009
。其中,
Figure 517190DEST_PATH_IMAGE010
表示邻接矩阵
Figure 338516DEST_PATH_IMAGE011
对应的边特征矩阵,边特征矩阵构建过程如下:邻接矩阵为1的地方替换为关系特征,等于0 的地方则不做更改,公式如下:
Figure 359693DEST_PATH_IMAGE012
(1)
其中,
Figure 125523DEST_PATH_IMAGE013
表示邻接矩阵
Figure 14982DEST_PATH_IMAGE008
中节点p跟节点q之间存在关系,
Figure 64715DEST_PATH_IMAGE014
表示邻接矩阵
Figure 240482DEST_PATH_IMAGE015
中节点p跟节点q之间不存在关系,
Figure 244341DEST_PATH_IMAGE016
表示节点p跟节点q之间的关系特征;
5)构建网络伪特征矩阵
Figure 671911DEST_PATH_IMAGE017
,获取就医行为特征表示;网络伪特征矩阵
Figure 326883DEST_PATH_IMAGE017
元素全由1组 成,大小与节点特征矩阵
Figure 453977DEST_PATH_IMAGE018
大小相同。基于构建的邻接矩阵、边特征矩阵以及伪特征矩阵, 得到就医行为节点的特征表示,公式如下:
Figure 335346DEST_PATH_IMAGE019
(2)
Figure 425661DEST_PATH_IMAGE020
(3)
Figure 685872DEST_PATH_IMAGE021
(4)
其中,
Figure 609966DEST_PATH_IMAGE022
表示就医行为节点聚合相邻节点以及边的特征后的输出,
Figure 837685DEST_PATH_IMAGE018
表示就医行为 网络
Figure 715380DEST_PATH_IMAGE023
的节点特征矩阵,D表示矩阵
Figure 79365DEST_PATH_IMAGE024
的度值矩阵,
Figure 174360DEST_PATH_IMAGE025
表示激活函数,
Figure 640108DEST_PATH_IMAGE026
表示单位矩 阵,维度与邻接矩阵
Figure 72226DEST_PATH_IMAGE008
相同,W,b表示网络的训练参数。
6)提取就医行为时间上的关联信息;患者就医行为在时间上存在关联性信息,采用GRU循环神经网络获取时间上的关联性信息,然而由于GRU循环神经网络输入特征之间时间间隔应该是相等的,对GRU网络结构进行更改,构建K-GRU网络,使其适用于就医行为特征提取,过程如下:
6.1)当前就医行为的输入除了当前就医行为的特征以外新增与上一次的就医行为时 间差特征
Figure 697243DEST_PATH_IMAGE027
Figure 805882DEST_PATH_IMAGE028
Figure 477035DEST_PATH_IMAGE029
表示第i次的就医行为的时间。
6.2)基于时间差特征
Figure 729156DEST_PATH_IMAGE030
,构建时间控制门kt,用来控制时间差特征对就医行为特 征的影响,最终K-GRU网络公式如下:
Figure 208678DEST_PATH_IMAGE031
(5)
Figure 504531DEST_PATH_IMAGE032
(6)
Figure 443405DEST_PATH_IMAGE033
(7)
Figure 92693DEST_PATH_IMAGE034
(8)
Figure 551356DEST_PATH_IMAGE035
(9)
Figure 768842DEST_PATH_IMAGE036
(10)
Figure 414587DEST_PATH_IMAGE037
(11)
Figure 133144DEST_PATH_IMAGE038
(12)
其中,
Figure 695581DEST_PATH_IMAGE039
表示上一次就医行为状态信息输入;
Figure 333236DEST_PATH_IMAGE040
表示时间控制门影响的部分就医行 为状态信息,
Figure 482589DEST_PATH_IMAGE041
表示时间控制门,控制时间差
Figure 4837DEST_PATH_IMAGE030
对就医行为状态信息的影响,
Figure 172513DEST_PATH_IMAGE042
表 示激活函数,
Figure 230337DEST_PATH_IMAGE043
是时间差映射函数,本发明中令
Figure 726040DEST_PATH_IMAGE044
Figure 176613DEST_PATH_IMAGE045
表示上一次就医行为经过 时间控制门后的输出;
Figure 683949DEST_PATH_IMAGE046
表示当前时刻的就医行为特征,rt是重置门,表示上一次的就医行 为信息有多少保留到了当前时刻;
Figure 663406DEST_PATH_IMAGE047
记忆了当前时刻的就医行为状态信息,zt表示更新门, 在0到1之间,越接近于1表示当前时刻就医行为信息保留下来的越多,ht表示当前时刻就医 行为隐藏状态的输出,yt表示当前时刻就医行为的输出,
Figure 177564DEST_PATH_IMAGE048
表示可训练 参数。
7)就医行为特征压缩,聚类;基于(6)得到的就医行为特征,经过一层非线性变换 函数将其压缩到低维特征空间,然后采用k-means聚类算法将低维特征聚合成k簇,
Figure 149937DEST_PATH_IMAGE049
,公式如下:
Figure 26626DEST_PATH_IMAGE050
(13)
Figure 317930DEST_PATH_IMAGE051
(14)
其中:
Figure 929171DEST_PATH_IMAGE052
表示第i个就医行为经过K-GRU神经网络特征的的输出,
Figure 190388DEST_PATH_IMAGE053
表示可训练参 数,Zi表示压缩后就医行为的特征,
Figure 328108DEST_PATH_IMAGE054
表示压缩后的特征维度,M表示不同簇的中心点构成的 矩阵,N表示就医行为网络总数量,
Figure 164215DEST_PATH_IMAGE055
,当
Figure 121807DEST_PATH_IMAGE052
属于第j个簇时,此时Sji= 1,否则Sji=0,LC表示聚类损失函数。
8)就医行为特征重构;将压缩后的就医行为特征经过非线性变换特征函数以及逆向K-GRU网络进行特征重构,使得重构后的特征趋近于原始就医行为特征。根据特征重构误差以及聚类误差训练模型。公式如下:
Figure 452294DEST_PATH_IMAGE056
(15)
Figure 54308DEST_PATH_IMAGE057
(16)
其中,
Figure 546469DEST_PATH_IMAGE058
表示重构模型函数,
Figure 991357DEST_PATH_IMAGE059
表示重构模型的训练参数,
Figure 109223DEST_PATH_IMAGE060
表示重构后的特征,
Figure 80590DEST_PATH_IMAGE061
表 示初始就医行为特征。
Figure 884598DEST_PATH_IMAGE062
表示重构损失函数。
9)构建损失函数;基于重构损失以及聚类损失,得到总的模型损失函数L,公式如下:
Figure 426569DEST_PATH_IMAGE063
(17)
其中,
Figure 364438DEST_PATH_IMAGE064
是权重系数,表示聚类损失与重构损失的权重大小。
10)模型优化,判断异常就医行为;交替优化聚类损失与重构损失,过程如下:
10.1)在最小化重构损失时,固定聚类损失参数M、Si,采用随机梯度下降算法最小化重构损失。
10.2)在优化聚类损失参数Si时,固定网络训练参数以及M,优化公式如下:
Figure 65678DEST_PATH_IMAGE065
(18)
其中
Figure 148909DEST_PATH_IMAGE066
表示第
Figure 693023DEST_PATH_IMAGE067
个簇的中心节点。
10.3)在优化聚类损失参数M时,固定网络训练参数以及Si,最终使得总的损失函数L收敛,停止训练;如果被输入的就医行为不属于这k个簇中一个,则该就医行为属于异常就医行为。
优选地,步骤1)所述的节点与节点之间的关系,是药物和疾病之间的治疗关系、或者疾病和症状之间的表现关系。
优选地,步骤1)所述的就医行为网络节点V,由患者、医院、医生、药物、症状、疾病、检查方式构成。
本发明的有益效果是:提出了一种基于图网络和深度学习技术的异常就医行为检测方法。将医保审核与大数据相结合,综合分析多元化就医行为数据,提升医保审核效率,有效的预防医保欺诈行为的发生。
附图说明
图1为本发明方法的流程图。
图2为本发明提供的就医行为网络结构示意图。
图3为本发明提供的K-GRU网络结构示意图。
图4为本发明提供的异常检测就医行为框架示意图。
具体实施方式
下面结合附图对本发明进一步描述。
参照图1到图4,一种异常就医行为检测方法,包括以下步骤:
步骤S1)构建就医行为网络;以患者历史就医行为数据为基础,构建就医行为网络集合
Figure 654157DEST_PATH_IMAGE001
Figure 209903DEST_PATH_IMAGE068
,其中n表示患者数量,
Figure 949189DEST_PATH_IMAGE003
表示第i个患者就 医行为网络集合,T表示该患者就医行为总数量。
Figure 964288DEST_PATH_IMAGE069
Figure 978380DEST_PATH_IMAGE070
表示患者的第j个就医行 为网络。V表示就医行为网络节点,由患者、医院、医生、药物、症状、疾病、检查方式构成,E表 示就医行为网络节点与节点之间的关系。
步骤S2)获取网络节点特征表示;提取节点和连边上的相关文本的词向量,作为节点和连边的特征。
步骤S3)构建网络邻接矩阵;基于1)构建的就医行为网络建立对应的邻接矩阵,
Figure 263999DEST_PATH_IMAGE006
Figure 580711DEST_PATH_IMAGE007
。其中,Ai表示就医行为网络集合
Figure 833838DEST_PATH_IMAGE003
对应的邻接矩阵集合。
Figure 452555DEST_PATH_IMAGE071
表示就医行为网络
Figure 123839DEST_PATH_IMAGE072
对应的邻接矩阵,K表示邻接矩阵中的节 点的数量。邻接矩阵由0,1构成,1表示两个节点之间存在关系,0表示两个节点之间不存在 关系。
步骤S4)构建网络边特征矩阵;为了获取就医行为网络节点之间的关系特征,以就 医行为网络的邻接矩阵为基础,构建对应的边特征矩阵
Figure 470506DEST_PATH_IMAGE009
。其中,
Figure 820716DEST_PATH_IMAGE010
表示邻接 矩阵
Figure 691458DEST_PATH_IMAGE008
对应的边特征矩阵,边特征矩阵构建过程如下:邻接矩阵为1的地方替换为关系特 征,等于0的地方则不做更改,公式如下:
Figure 200937DEST_PATH_IMAGE012
(1)
其中,
Figure 859451DEST_PATH_IMAGE073
=1表示邻接矩阵
Figure 837903DEST_PATH_IMAGE074
中节点p跟节点q之间存在关系,
Figure 731909DEST_PATH_IMAGE073
=0表示邻接矩阵
Figure 345162DEST_PATH_IMAGE074
中节点p跟节点q之间不存在关系,
Figure 174578DEST_PATH_IMAGE016
表示节点p跟节点q之间的关系特征。
步骤S5)构建网络伪特征矩阵,获取就医行为特征表示;网络伪特征矩阵
Figure 889593DEST_PATH_IMAGE017
元素 全由1组成,大小与节点特征矩阵
Figure 338023DEST_PATH_IMAGE018
大小相同。基于构建的邻接矩阵、边特征矩阵以及伪特 征矩阵,得到就医行为节点的特征表示,公式如下:
Figure 697460DEST_PATH_IMAGE075
(2)
Figure 87990DEST_PATH_IMAGE076
(3)
Figure 8411DEST_PATH_IMAGE077
(4)
其中,
Figure 385165DEST_PATH_IMAGE078
表示就医行为节点聚合相邻节点以及边的特征后的输出,
Figure 723743DEST_PATH_IMAGE079
表示激活函数,
Figure 770327DEST_PATH_IMAGE018
表示就医行为网络
Figure 335301DEST_PATH_IMAGE080
的节点特征矩阵,D表示矩阵
Figure 640380DEST_PATH_IMAGE081
的度值矩阵,IN表示单位矩阵,维度 与邻接矩阵
Figure 348311DEST_PATH_IMAGE008
相同,W,b表示网络的训练参数。
步骤S6)提取就医行为时间上的关联信息;如图4所示,采用GRU循环神经网络获取时间上的关联性信息,然而由于GRU循环神经网络输入特征之间时间间隔应该是相等的,对GRU网络结构进行更改,构建K-GRU网络,使其适用于就医行为特征提取,过程如下:
1) 当前时刻的输入除了当前时刻的特征以外新增与上一次就医行为时间差特征
Figure 956010DEST_PATH_IMAGE082
Figure 867334DEST_PATH_IMAGE083
,ti表示第i次就医行为的时间。
2)如图3所示,基于时间差特征
Figure 585891DEST_PATH_IMAGE084
,构建时间控制门kt,用来控制时间差特征对就 医行为特征的影响,最终K-GRU网络公式如下:
Figure 915373DEST_PATH_IMAGE085
(5)
Figure 553027DEST_PATH_IMAGE086
(6)
Figure 561435DEST_PATH_IMAGE087
(7)
Figure 457584DEST_PATH_IMAGE088
(8)
Figure 625260DEST_PATH_IMAGE089
(9)
Figure 574762DEST_PATH_IMAGE090
(10)
Figure 476990DEST_PATH_IMAGE091
(11)
Figure 271770DEST_PATH_IMAGE092
(12)
其中,
Figure 825112DEST_PATH_IMAGE093
表示上一次就医行为状态信息输入;
Figure 53836DEST_PATH_IMAGE094
表示时间控制门影响的部分就医行为 状态信息,
Figure 302415DEST_PATH_IMAGE095
表示激活函数;kt表示时间控制门,控制时间差
Figure 25521DEST_PATH_IMAGE084
对就医行为状态 信息的影响,
Figure 308734DEST_PATH_IMAGE096
是时间差映射函数,令
Figure 475405DEST_PATH_IMAGE097
Figure 70334DEST_PATH_IMAGE098
表示上一次就医行为经过时间控 制门后的输出;
Figure 738076DEST_PATH_IMAGE099
表示当前时刻的就医行为特征,rt是重置门,表示上一次的就医行为信息 有多少保留到了当前时刻;
Figure 249697DEST_PATH_IMAGE100
记忆了当前时刻的就医行为状态信息,zt表示更新门,在0到1 之间,越接近于1表示当前时刻就医行为信息保留下来的越多,ht表示当前时刻就医行为隐 藏状态的输出,yt表示当前时刻就医行为的输出,
Figure 446324DEST_PATH_IMAGE101
表示可训练参数。
步骤S7)就医行为特征压缩,聚类;如图4所示,基于步骤S6得到的就医行为特征, 经过一层非线性变换函数将其压缩到低维特征空间,然后采用k-means聚类算法将低维特 征聚合成k簇,
Figure 528549DEST_PATH_IMAGE102
,公式如下:
Figure 875348DEST_PATH_IMAGE103
(13)
Figure 867575DEST_PATH_IMAGE104
(14)
其中:
Figure 359736DEST_PATH_IMAGE105
表示第i个就医行为经过K-GRU神经网络特征的的输出,
Figure 70203DEST_PATH_IMAGE106
表示可训练参 数,
Figure 188069DEST_PATH_IMAGE107
表示压缩后的就医行为特征,
Figure 159436DEST_PATH_IMAGE108
表示压缩后的特征维度,N表示就医行为网络总数量,M 表示不同簇的中心点构成的矩阵,
Figure 229024DEST_PATH_IMAGE109
,当
Figure 770994DEST_PATH_IMAGE110
属于第j个簇时,此时
Figure 584230DEST_PATH_IMAGE111
,否则
Figure 144524DEST_PATH_IMAGE112
,Lc表示聚类损失函数。
步骤S8)就医行为特征重构;如图4所示,将压缩后的就医行为特征经过非线性变换特征函数以及逆向K-GRU网络进行特征重构,使得重构后的特征趋近于原始就医行为特征。根据特征重构误差以及聚类误差训练模型。公式如下:
Figure 758914DEST_PATH_IMAGE113
(15)
Figure 912815DEST_PATH_IMAGE114
(16)
其中,
Figure 388795DEST_PATH_IMAGE115
表示重构模型函数,
Figure 819908DEST_PATH_IMAGE116
表示重构模型的训练参数,
Figure 231298DEST_PATH_IMAGE117
表示重构后的特征,
Figure 997128DEST_PATH_IMAGE118
表 示初始就医行为特征。
Figure 152166DEST_PATH_IMAGE119
表示重构损失函数。
步骤S9)构建损失函数;如图4所示,基于重构损失以及聚类损失,得到总的模型损失函数L,公式如下:
Figure 936320DEST_PATH_IMAGE120
(17)
其中,
Figure 643245DEST_PATH_IMAGE121
是权重系数,表示聚类损失与重构损失的权重大小。
步骤S10)模型优化,判断异常就医行为;如图4所示,交替优化聚类损失与重构损失,过程如下:
1)如图4所示,在最小化重构损失时,固定聚类损失参数M、Si,采用随机梯度下降算法最小化重构损失;
2)如图4所示,在优化聚类损失参数Si时,固定网络训练参数以及M,优化公式如下:
Figure 771738DEST_PATH_IMAGE122
(18)
其中
Figure 340254DEST_PATH_IMAGE123
表示第
Figure 136172DEST_PATH_IMAGE124
个簇的中心节点;
3)如图4所示,在优化聚类损失参数M时,固定网络训练参数以及Si,最终使得总的损失函数L收敛,停止训练。如果被输入的就医行为不属于这k个簇中一个,则该就医行为属于异常就医行为。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (3)

1.一种异常就医行为检测方法,包括如下步骤:
1)构建就医行为网络;以患者历史就医行为数据为基础,构建就医行为网络集合
Figure 898876DEST_PATH_IMAGE001
Figure 393180DEST_PATH_IMAGE002
,其中n表示患者数量,
Figure 376180DEST_PATH_IMAGE003
表示第i个患者 就医行为网络集合,T表示该患者就医行为总数量;
Figure 364865DEST_PATH_IMAGE004
表示患者的第j个就医 行为网络;V表示就医行为网络节点,E表示就医行为网络节点与节点之间的关系;
2)获取网络节点特征表示;提取节点和连边上的相关文本的词向量,作为节点和连边的特征;
3)构建网络邻接矩阵;基于1)构建的就医行为网络建立对应的邻接矩阵,
Figure 257865DEST_PATH_IMAGE005
Figure 611486DEST_PATH_IMAGE006
;其中,
Figure 721263DEST_PATH_IMAGE007
表示就医行为网络集合
Figure 982480DEST_PATH_IMAGE003
对应的邻接矩阵集合;
Figure 667670DEST_PATH_IMAGE008
表示就医行为网络
Figure 988930DEST_PATH_IMAGE009
对应的邻接矩阵,K表示邻接矩阵中的节 点的数量;邻接矩阵由0,1构成,1表示两个节点之间存在关系,0表示两个节点之间不存在 关系;
4)构建网络边特征矩阵;为了获取就医行为网络节点之间的关系特征,以就医行为网 络的邻接矩阵为基础,构建对应的边特征矩阵
Figure 343860DEST_PATH_IMAGE010
;其中,
Figure 612031DEST_PATH_IMAGE011
表示邻接矩阵
Figure 214045DEST_PATH_IMAGE008
对 应的边特征矩阵,边特征矩阵构建过程如下:邻接矩阵为1的地方替换为关系特征,等于0的 地方则不做更改,公式如下:
Figure 17790DEST_PATH_IMAGE012
(1)
其中,
Figure 587312DEST_PATH_IMAGE013
=1表示邻接矩阵
Figure 331277DEST_PATH_IMAGE014
中节点p跟节点q之间存在关系,
Figure 53376DEST_PATH_IMAGE013
=0表示邻接矩阵
Figure 982018DEST_PATH_IMAGE014
中 节点p跟节点q之间不存在关系,
Figure 914202DEST_PATH_IMAGE015
表示节点p跟节点q之间的关系特征;
5)构建网络伪特征矩阵
Figure 835759DEST_PATH_IMAGE016
,获取就医行为特征表示;网络伪特征矩阵
Figure 661633DEST_PATH_IMAGE016
元素全由1组 成,大小与节点特征矩阵
Figure 308646DEST_PATH_IMAGE017
大小相同;基于构建的邻接矩阵、边特征矩阵以及伪特征矩阵, 得到就医行为节点的特征表示,公式如下:
Figure 462547DEST_PATH_IMAGE018
(2)
Figure 922216DEST_PATH_IMAGE019
(3)
Figure 415645DEST_PATH_IMAGE020
(4)
其中,
Figure 827035DEST_PATH_IMAGE021
表示就医行为节点聚合相邻节点以及边的特征后的输出,
Figure 858445DEST_PATH_IMAGE022
表示激活函数,
Figure 856226DEST_PATH_IMAGE017
表示就医行为网络
Figure 532058DEST_PATH_IMAGE023
的节点特征矩阵,D表示矩阵
Figure 973403DEST_PATH_IMAGE024
的度值矩阵,IN表示单位矩阵,维度 与邻接矩阵
Figure 977263DEST_PATH_IMAGE014
相同,W,b表示网络的训练参数;
6)提取就医行为时间上的关联信息;患者就医行为在时间上存在关联性信息,采用GRU循环神经网络获取时间上的关联性信息,然而由于GRU循环神经网络输入特征之间时间间隔应该是相等的,对GRU网络结构进行更改,构建K-GRU网络,使其适用于就医行为特征提取,过程如下:
6.1)当前时刻的输入除了当前时刻的特征以外新增与上一次就医行为时间差特征
Figure 670412DEST_PATH_IMAGE025
Figure 59805DEST_PATH_IMAGE026
,ti表示第i次就医行为的时间;
6.2)基于时间差特征
Figure 186899DEST_PATH_IMAGE027
,构建时间控制门kt,用来控制时间差特征对就医行为特征的 影响,最终K-GRU网络公式如下:
Figure 802688DEST_PATH_IMAGE028
(5)
Figure 424162DEST_PATH_IMAGE029
(6)
Figure 684373DEST_PATH_IMAGE030
(7)
Figure 342888DEST_PATH_IMAGE031
(8)
Figure 147770DEST_PATH_IMAGE032
(9)
Figure 182723DEST_PATH_IMAGE033
(10)
Figure 812287DEST_PATH_IMAGE034
(11)
Figure 641703DEST_PATH_IMAGE035
(12)
其中,
Figure 373030DEST_PATH_IMAGE036
表示上一次就医行为状态信息输入;
Figure 805148DEST_PATH_IMAGE037
表示时间控制门影响的部分就医行为 状态信息,
Figure 272907DEST_PATH_IMAGE038
表示激活函数;kt表示时间控制门,控制时间差
Figure 273224DEST_PATH_IMAGE039
对就医行为状态 信息的影响,
Figure 475535DEST_PATH_IMAGE040
是时间差映射函数,令
Figure 727656DEST_PATH_IMAGE041
Figure 207179DEST_PATH_IMAGE042
表示上一次就医行为经过时间控制 门后的输出;
Figure 503031DEST_PATH_IMAGE043
表示当前时刻的就医行为特征,rt是重置门,表示上一次的就医行为信息有 多少保留到了当前时刻;
Figure 68005DEST_PATH_IMAGE044
记忆了当前时刻的就医行为状态信息,zt表示更新门,在0到1之 间,越接近于1表示当前时刻就医行为信息保留下来的越多,ht表示当前时刻就医行为隐藏 状态的输出,yt表示当前时刻就医行为的输出,
Figure 356773DEST_PATH_IMAGE045
表示可训练参数;
7)就医行为特征压缩,聚类;基于步骤(6)得到的就医行为特征,经过一层非线性变换 函数将其压缩到低维特征空间,然后采用k-means聚类算法将低维特征聚合成k簇,
Figure 815436DEST_PATH_IMAGE046
,公式如下:
Figure 423135DEST_PATH_IMAGE047
(13)
Figure 724672DEST_PATH_IMAGE048
(14)
其中:
Figure 584175DEST_PATH_IMAGE049
表示第i个就医行为经过K-GRU神经网络特征的的输出,
Figure 271246DEST_PATH_IMAGE050
表示可训练参 数,
Figure 456370DEST_PATH_IMAGE051
表示压缩后的就医行为特征,
Figure 104258DEST_PATH_IMAGE052
表示压缩后的特征维度,N表示就医行为网络总数量,M 表示不同簇的中心点构成的矩阵,
Figure 501873DEST_PATH_IMAGE053
,当
Figure 138390DEST_PATH_IMAGE054
属于第j个簇时,此时
Figure 196214DEST_PATH_IMAGE055
,否 则
Figure 957497DEST_PATH_IMAGE056
Figure 142490DEST_PATH_IMAGE057
表示聚类损失函数;
8)就医行为特征重构;将压缩后的就医行为特征经过非线性变换特征函数以及逆向K-GRU网络进行特征重构,使得重构后的特征趋近于原始就医行为特征;根据特征重构误差以及聚类误差训练模型;公式如下:
Figure 180985DEST_PATH_IMAGE058
(15)
Figure 35808DEST_PATH_IMAGE059
(16)
其中,
Figure 674600DEST_PATH_IMAGE060
表示重构模型函数,
Figure 646973DEST_PATH_IMAGE061
表示重构模型的训练参数,
Figure 664607DEST_PATH_IMAGE062
表示重构后的特征,
Figure 346125DEST_PATH_IMAGE063
表 示初始就医行为特征;
Figure 816420DEST_PATH_IMAGE064
表示重构损失函数;
9)构建损失函数;基于重构损失以及聚类损失,得到总的模型损失函数L,公式如下:
Figure 93949DEST_PATH_IMAGE065
(17)
其中,
Figure 825144DEST_PATH_IMAGE066
是权重系数,表示聚类损失与重构损失的权重大小;
10)模型优化,判断异常就医行为;交替优化聚类损失与重构损失,过程如下:
10.1)在最小化重构损失时,固定聚类损失参数M、Si,采用随机梯度下降算法最小化重构损失;
10.2)在优化聚类损失参数Si时,固定网络训练参数以及M,优化公式如下:
Figure 395672DEST_PATH_IMAGE067
(18)
其中
Figure 477897DEST_PATH_IMAGE068
表示第
Figure 683751DEST_PATH_IMAGE069
个簇的中心节点;
10.3)在优化聚类损失参数M时,固定网络训练参数以及Si, 最终使得总的损失函数L收敛,停止训练;如果被输入的就医行为不属于这k个簇中一个,则该就医行为属于异常就医行为。
2.如权利要求1所述的一种异常就医行为检测方法,其特征在于:步骤1)所述的节点与节点之间的关系,是药物和疾病之间的治疗关系、或者疾病和症状之间的表现关系。
3.如权利要求1所述的一种异常就医行为检测方法,其特征在于:步骤1)所述的就医行为网络节点V,由患者、医院、医生、药物、症状、疾病、检查方式构成。
CN202010442547.2A 2020-05-22 2020-05-22 一种异常就医行为检测方法 Active CN111340641B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010442547.2A CN111340641B (zh) 2020-05-22 2020-05-22 一种异常就医行为检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010442547.2A CN111340641B (zh) 2020-05-22 2020-05-22 一种异常就医行为检测方法

Publications (2)

Publication Number Publication Date
CN111340641A true CN111340641A (zh) 2020-06-26
CN111340641B CN111340641B (zh) 2020-11-13

Family

ID=71186462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010442547.2A Active CN111340641B (zh) 2020-05-22 2020-05-22 一种异常就医行为检测方法

Country Status (1)

Country Link
CN (1) CN111340641B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111798324A (zh) * 2020-07-16 2020-10-20 浙江工业大学 一种基于动态就医行为对齐的医保欺诈发现方法
CN112445957A (zh) * 2020-11-05 2021-03-05 西安电子科技大学 社交网络异常用户检测方法、系统、介质、设备、终端
CN112801804A (zh) * 2021-01-15 2021-05-14 浙江大学山东工业技术研究院 一种用于检测异常医保数据的图神经网络的方法
CN113657548A (zh) * 2021-08-31 2021-11-16 平安医疗健康管理股份有限公司 医保异常检测方法、装置、计算机设备及存储介质
CN113707331A (zh) * 2021-07-30 2021-11-26 电子科技大学 一种中医辨证数据生成方法与系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657536A (zh) * 2017-02-20 2018-02-02 平安科技(深圳)有限公司 社保欺诈行为的识别方法和装置
CN108492196A (zh) * 2018-03-08 2018-09-04 平安医疗健康管理股份有限公司 通过数据分析推断医疗保险违规行为的风控方法
CN109598633A (zh) * 2018-12-13 2019-04-09 平安医疗健康管理股份有限公司 社保违规检测方法、装置、设备及计算机存储介质
CN109636613A (zh) * 2018-10-19 2019-04-16 平安医疗健康管理股份有限公司 医疗数据异常识别方法、装置、终端及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657536A (zh) * 2017-02-20 2018-02-02 平安科技(深圳)有限公司 社保欺诈行为的识别方法和装置
CN108492196A (zh) * 2018-03-08 2018-09-04 平安医疗健康管理股份有限公司 通过数据分析推断医疗保险违规行为的风控方法
CN109636613A (zh) * 2018-10-19 2019-04-16 平安医疗健康管理股份有限公司 医疗数据异常识别方法、装置、终端及存储介质
CN109598633A (zh) * 2018-12-13 2019-04-09 平安医疗健康管理股份有限公司 社保违规检测方法、装置、设备及计算机存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111798324A (zh) * 2020-07-16 2020-10-20 浙江工业大学 一种基于动态就医行为对齐的医保欺诈发现方法
CN111798324B (zh) * 2020-07-16 2024-04-02 浙江工业大学 一种基于动态就医行为对齐的医保欺诈发现方法
CN112445957A (zh) * 2020-11-05 2021-03-05 西安电子科技大学 社交网络异常用户检测方法、系统、介质、设备、终端
CN112801804A (zh) * 2021-01-15 2021-05-14 浙江大学山东工业技术研究院 一种用于检测异常医保数据的图神经网络的方法
CN113707331A (zh) * 2021-07-30 2021-11-26 电子科技大学 一种中医辨证数据生成方法与系统
CN113707331B (zh) * 2021-07-30 2023-04-07 电子科技大学 一种中医辨证数据生成方法与系统
CN113657548A (zh) * 2021-08-31 2021-11-16 平安医疗健康管理股份有限公司 医保异常检测方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN111340641B (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN111340641B (zh) 一种异常就医行为检测方法
Krishnan et al. Deep kalman filters
WO2022227294A1 (zh) 一种基于多模态融合的疾病风险预测方法和系统
US10140422B2 (en) Progression analytics system
Maghari COVID-19 Detection in X-ray Images using CNN Algorithm
CN109243620B (zh) 基于血药浓度监测的药效优化方法及装置
CN108682457B (zh) 患者长期预后定量预测和干预系统及方法
US20190287680A1 (en) Techniques for integrating proxy nodes into graph-model-based investigatory-event mappings
Do et al. Classification of asthma severity and medication using TensorFlow and multilevel databases
CN113657548A (zh) 医保异常检测方法、装置、计算机设备及存储介质
Ramkumar et al. IoT-based patient monitoring system for predicting heart disease using deep learning
Raju et al. Optimized building of machine learning technique for thyroid monitoring and analysis
Cai et al. Using ensemble of ensemble machine learning methods to predict outcomes of cardiac resynchronization
Alturki et al. Predictors of readmissions and length of stay for diabetes related patients
Marathe et al. Prediction of heart disease and diabetes using naive Bayes algorithm
Duhamel et al. A preprocessing method for improving data mining techniques. Application to a large medical diabetes database
Zeghlache et al. Longitudinal self-supervised learning using neural ordinary differential equation
Rao et al. A hybrid deep learning strategy for image based automated prognosis of skin disease
Huang et al. Design of a clinical decision support model for predicting pneumonia readmission
CN111680798A (zh) 联合学习模型系统和方法、装置和计算机可读存储介质
Ono et al. Introduction to supervised machine learning in clinical epidemiology
WO2022178995A1 (zh) Ct图像去噪处理方法、装置、计算机设备及介质
Sumathi et al. Machine learning based pattern detection technique for diabetes mellitus prediction
CN115064276A (zh) 一种使用自注意力机制的疾病预测方法
Merkelbach et al. Novel architecture for gated recurrent unit autoencoder trained on time series from electronic health records enables detection of ICU patient subgroups

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant