CN108492196B - 通过数据分析推断医疗保险违规行为的风控方法 - Google Patents

通过数据分析推断医疗保险违规行为的风控方法 Download PDF

Info

Publication number
CN108492196B
CN108492196B CN201810191862.5A CN201810191862A CN108492196B CN 108492196 B CN108492196 B CN 108492196B CN 201810191862 A CN201810191862 A CN 201810191862A CN 108492196 B CN108492196 B CN 108492196B
Authority
CN
China
Prior art keywords
wind
diagnosis
data
visit
wind control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810191862.5A
Other languages
English (en)
Other versions
CN108492196A (zh
Inventor
程吉安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Medical Health Technology Service Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN201810191862.5A priority Critical patent/CN108492196B/zh
Priority to PCT/CN2018/097746 priority patent/WO2019169826A1/zh
Publication of CN108492196A publication Critical patent/CN108492196A/zh
Application granted granted Critical
Publication of CN108492196B publication Critical patent/CN108492196B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Abstract

本发明涉及通过数据分析推断医疗保险违规行为的风控方法,包括:步骤1、获取风控对象的当前及历史就诊行为数据、与风控对象相关的个人信息和公共数据;步骤2、从在步骤1获取的数据中提取与风控对象的就诊行为相关的特征;步骤3、根据所提取的特征,将风控对象的当前及历史就诊行为中的每次就诊行为划分到相应的就诊类别,形成就诊类别序列;步骤4、将步骤3中形成的就诊类别序列作为观测序列,将就诊目的作为隐含状态,根据隐马尔可夫模型计算出最可能的隐含状态序列,其中包含了风控对象最可能的就诊目的;步骤5、如果隐含状态序列中包含的风控对象最可能的就诊目的对应于异常目的,则输出与风控对象的当前及历史就诊行为相关的医疗数据。

Description

通过数据分析推断医疗保险违规行为的风控方法
技术领域
本发明涉及互联网数据处理技术领域,尤其涉及通过数据分析推断医疗 保险违规行为、为系统审核或人工稽核提供依据的风控方法。
背景技术
在医保社会体系中,每天都有数以万计的门诊、医院医疗行为的交易数 据发生,主要包括病人与医疗机构的交易、医疗机构与保险机构的交易等。 目前,现有医保处理系统在处理支付交易时难以精准识别病人的真正需求, 参保人或医疗机构有从中谋取不当利益的可能性。医疗欺诈行为的存在严重 影响了医疗保险基金的收支平衡,侵害了参保人的利益和社会公益。
政府和相关部门已致力于采用大数据方法鉴别医保欺诈行为,控制医保 风险。然而,现有的医保风控方案多基于设定阈值红线以达到监测欺诈、浪 费、滥用等违规行为,而因违规行为常随医保政策、支付方式及监管力度变 化,故简单的阈值划分不适合多场景、参保人员组成、政策更替的实际应用 环境。
发明内容
有鉴于此,针对现有技术的上述缺点,存在采用机器学习和分类器建模 等技术手段来解决上述问题的需要。
根据本发明的实施例,提供了一种通过数据分析推断医疗保险违规行为 的风控方法,其特征在于,风控对象的就诊目的被划分为正常目的和异常目 的,所述方法包括以下步骤:步骤1、获取风控对象的当前及历史就诊行为 数据、以及与风控对象相关的个人信息和公共数据;步骤2、从在步骤1获取 的数据中提取与风控对象的就诊行为相关的特征;步骤3、根据所提取的特 征,将风控对象的当前及历史就诊行为中的每次就诊行为划分到相应的就诊 类别,形成就诊类别序列;步骤4、将在步骤3中形成的就诊类别序列作为观 测序列,将就诊目的作为隐含状态,根据隐马尔可夫模型计算出最可能的隐 含状态序列;步骤5、如果所述最可能的隐含状态序列中包含的一个或多个 隐含状态对应于异常目的,则输出与所述风控对象的当前及历史就诊行为相 关的医疗数据。
根据本发明的实施例,提供了一种用于进行如权利要求1至7中的一个 所述的方法的风控系统,包括:风控对象数据获取模块,被配置用于获取风 控对象的当前及历史就诊行为数据、以及与风控对象相关的个人信息和公共 数据;特征提取模块,被配置用于从所述风控对象数据获取模块获取的数据 中提取与风控对象的就诊行为相关的特征;就诊分类模块,被配置用于根据 所提取的特征,将风控对象的当前及历史就诊行为中的每次就诊行为划分到 相应的就诊类别,形成就诊类别序列;就诊目的推测模块,被配置用于将在所述就诊类别序列作为观测序列,将就诊目的作为隐含状态,根据隐马尔可 夫模型计算出最可能的隐含状态序列;异常输出模块,被配置用于在所述隐 含状态序列中包含的隐含状态中的一个对应于异常目的的情况下,输出与所 述风控对象的当前及历史就诊行为相关的医疗数据。
根据本发明的实施例,提供了一种计算机可读存储介质,其上存储用于 执行通过数据分析推断医疗保险违规行为的风控方法的程序,所述程序在被 处理器执行时,实现根据所述方法的步骤。
本发明的有益效果主要在于:
1、提高了医保基金风控的灵活性与适应性;
2、通过现有行为组合预演可能发生的违规;
3、在风险识别和控制的过程中自动存留相关证据链,以供后序处理。
附图说明
图1为根据本发明的实施例的通过数据分析推断医疗保险违规行为的风 控方法的流程示意图;
图2为根据本发明的实施例的通过数据分析推断医疗保险违规行为的风 控系统的功能模块示意图;
图3示出了根据HMM模型计算出隐含的就诊目的序列后判断是否纳入 异常监督的总体流程;
图4示出了根据本发明的实施例的安装了应用程序的系统的运行环境。
具体实施方式
下面,结合附图对技术方案的实施作进一步的详细描述。
本领域的技术人员能够理解,尽管以下的说明涉及到有关本发明的实施 例的很多技术细节,但这仅为用来说明本发明的原理的示例、而不意味着任 何限制。本发明能够适用于不同于以下例举的技术细节之外的场合,只要它 们不背离本发明的原理和精神即可。
另外,为了避免使本说明书的描述限于冗繁,在本说明书中的描述中, 可能对可在现有技术资料中获得的部分技术细节进行了省略、简化、变通等 处理,这对于本领域的技术人员来说是可以理解的,并且这不会影响本说明 书的公开充分性。
下文中,将参照附图描述本发明的实施例。
注意,将以下面的次序给出描述:1、通过数据分析推断医疗保险违规行 为的风控方法(图1);2、通过数据分析推断医疗保险违规行为的系统(图 2-3);3、安装了用于实现本发明的实施例的应用程序的系统、以及存储所述应用程序的计算机可读介质(图4)。
1、通过数据分析推断医疗保险违规行为的风控方法
图1为根据本发明的实施例的通过数据分析推断医疗保险违规行为的风 控方法的流程示意图。
如图1所示,根据本发明的实施例的通过数据分析推断医疗保险违规行 为的风控方法主要包括以下步骤:
步骤S100、数据获取,即,获取与数据分析相关的各类信息,包括参保 人(风控对象)信息和公共信息。
其中,参保人(风控对象)信息包括参保人的当前及历史就诊行为数据、 以及与参保人相关的个人信息;
所述参保人信息包括参保人的医保结算数据、参保人的年龄、性别、文 化、职业等人口学信息,所述公共信息包括结合公开数据库如公司工商注册 数据获取的医疗机构规模、地理、等级数据、医生职称、注册情况等信息、 从新闻等公开信息抓取的各地医保基金稽核情况和通报情况、既往医保基金 稽核中识别为问题的个案行为,等等。
步骤S200、从上一步骤获取的信息中提取特征,即,从在步骤S100获取 的数据中提取与参保人的就诊行为相关的特征。
具体地,从上述各类数据中提取数据特征,以进行下一步的分类,所提 取的特征主要分为以下几类:
人口学特征:包括年龄、性别、职业、文化水平等;
地理特征:参保人籍贯、公司地理位置、医疗机构地理位置、参保区域 等;
时间特征:就诊时间、就诊间期、参保时间;
医疗特征:诊断、就诊科室、医疗消费清单、医疗机构规模、医疗机构 等级、医疗机构既往案底标签、医生职称等;
费用特征:单次花费、时间段总花费、费用构成比例(诊疗费用、药品 费用、检验检查费用、材料费用)等;
步骤S300、建立就诊类别分类,即,根据在步骤S200中所提取的特征, 将参保人的当前及历史就诊行为中的每次就诊行为划分到相应的就诊类别, 形成就诊类别序列,
具体地,根据在步骤S200中提取的特征,使用无监督学习的方式,将医 保结算数据的就诊类别聚类为不同的类型。
步骤S400、建立隐马尔可夫模型(HMM)模型
以参保人为轴线构建隐马尔可夫模型。
其中,以参保人维度构建的隐含状态包括:体检、初诊、复诊、配药、 住院、异常。
将在步骤S300中建立的就诊类别作为观测序列,利用Baum-Welch算法 推导出隐马尔可夫模型参数(观测概率矩阵和状态转移矩阵)。
步骤S500、利用在步骤S400中建立的HMM模型,根据参保人的当前行 为数据以及历史行为数据,输出推理结果及证据链。
具体地,将在步骤S300中形成的就诊类别序列作为观测序列,将就诊目 的作为隐含状态,根据隐马尔可夫模型计算出最可能的隐含状态序列。
其中,当根据观测概率矩阵和状态转移矩阵推理某个参保人有异常就诊 行为时,将相应的参保人为风险目标输出,并将其记录的行为特征状态转移 情况作为证据链输出到系统审核或人工稽核。
作为示例,在步骤S100中,医保结算数据及参保人人口学特征由实施地 社保结算系统提供;公司工商注册信息可通过中华人民共和国国家工商行政 管理总局网站公开渠道获取;医疗机构规模、地理、等级数据可通过各地卫 生和计划生育委员会网站及医院主页公开渠道获取;医生职称、注册情况可 通过各地卫生和计划生育委员会网站公开渠道获取;各地医保基金稽核情况 和通报情况可通过新闻网络爬虫收集及整理;既往医保基金稽核中识别为问 题的个案行为需从实施地社保历年数据获取。
作为示例,在步骤S200中,所提取的特征包括以下几类。
人口学特征:包括年龄、性别、职业、文化水平、工作单位等,从实施 地社保数据库直接提取,工作单位通过与工商注册信息相关联。
地理特征:通过网络地理位置提供商,将参保人籍贯、公司地理位置、 医疗机构地理位置、参保区域、各地理位置间的距离转换为坐标值和数值进 行储存。例如将籍贯“上海”作为输入到百度地图API以获取上海的GPS坐 标,将某某小区与某某医院为输入地图API以获取两地的地理距离。
时间特征:就诊时间、就诊间期、参保时间。就诊时间、参保时间由数 据直接提取,就诊间期为前后两次就诊日期的差值。
医疗特征:诊断、就诊科室、医疗消费清单、医疗机构规模、医疗机构 等级、医疗机构既往案底标签、医生职称
费用特征:单次花费、时间段总花费、费用构成比例(诊疗费用、药品 费用、检验检查费用、材料费用)等
作为示例,在步骤S300中,可使用K-means算法或者RVM分类器,将 在步骤S200中提取的特征聚类为不同的就诊类别类别。如将肿瘤病人就诊分 为以消费检验检查为主的初诊状态和以药品为主的化疗状态。
作为示例,在步骤S400中,可如下建立隐马尔可夫模型(HMM)模型。
将提取的不同就诊类别分类作为观测序列O,患者就诊的目的(体检、 初诊、复诊、配药、住院、异常)作为隐含状态,使用Baum-Welch算法求解 出隐马尔可夫模型参数(观测概率矩阵和状态转移矩阵)。
假设在步骤S300中将就诊类别分为4类(就诊类别),则计算出的观测 状态概率矩阵和状态转移概率矩阵分别举例如下(为便于理解,以表格方式 呈现)。
表1观测状态概率矩阵
Figure BDA0001591940240000061
表2状态转移概率矩阵
Figure BDA0001591940240000062
Figure BDA0001591940240000071
上述表格中数据(矩阵中的值)为通过数据统计获得的概率,其可为从 医疗机构获取的已知数据中汇总得出。
作为示例,在步骤S500中,根据在步骤S400中计算出的观测概率矩阵 和状态转移矩阵,依据患者就诊行为,能够动态推理出患者每次就诊的目的。
例如,如某患者既往4次就诊的观测序列为O=(就诊类别1,就诊类别3, 就诊类别2,就诊类别2),则依据HMM模型(并非一定对应于上面示例的模 型,可以是任意其它HMM模型)推理的最可能的隐含状态(就诊目的)序 列可为I=(住院,配药,初诊,初诊)。接下来,当患者第5次就诊时,就诊 类别为“就诊类别2”,此时,观测序列变为O=(就诊类别1,就诊类别3,就 诊类别2,就诊类别2,就诊类别2),根据HMM模型,计算出最可能的隐含 状态序列将变为I=(住院,配药,初诊,异常,初诊)。由此,当隐含状态序 列中出现异常状态(对应于异常的就诊目的)时,可将该参保人纳入异常人 群(特别监控人群),并将该隐含状态序列(就诊目的序列)和观测序列(就 诊类别序列)作为特征输出作为证据,提供给系统审核或人工稽核处理。
可选地,还可根据隐含状态序列中出现异常状态(对应于异常的就诊目 的)的数目、计算出的出现异常状态的隐含状态序列的总概率,将相关参保 人(风控对象)划分为不同监控级别的异常人群。
可选地,还可将包括异常状态的全部可能的隐含状态序列的发生概率相 加,得到包含异常状态(异常就诊目的)的总概率,如果所述总概率高于预 定阈值,则可将该风控对象划入特别监控人群。
需要说明的是,上述表格中的数据、以及观测序列为O和隐含状态序列 I的具体内容仅为用于例示本发明的原理的示例,并帮助本领域的技术人员理 解实现本发明的方式,其与真实应用情况并不构成严格的对应关系,同时, 上述数据和具体内容也不构成对本发明的任何限定。
作为可选实施例,如图3所示,还可将疑似不合理的就诊行为(包含异 常就诊目的)划分为如下两种情况:
1、单次或多次就诊目的异常:如上述示例中出现标注为异常的状态,此 时,默认将该风控对象划入特别监控对象,或者需要系统审核或人工稽核处 理;
2、医疗行为序列(隐状态序列)异常:计算出的最可能的隐含状态序列 尽管不包含异常状态,但其发生概率低于预定阈值,例如,该可将所述预定 阈值默认设定为同等长度的最可能的隐含状态序列的发生概率的25%,并可 根据需要随时更改。
例如,某风控对象的4次连续就诊类别序列为(体检,体检,体检,体 检)发生概率低于发生4次连续就诊人群最常见序列发生概率的25%,则认 为是医疗行为序列异常,提示工作人员该风控对象在设定时间段内发生4次 以体检为目的的行为是异常的,并将与该风控对象的体检行为相关的特征(年 龄、性别、就诊无药品消费、检验检查费高、多次检查项目雷同、总费用一 致等)作为证据链输出到后台。
2、通过数据分析推断医疗保险违规行为的系统
根据本发明的实施例,提供了一种用于通过数据分析推断医疗保险违规 行为的系统,其用于实现上述方法,该系统主要包括:
风控对象数据获取模块,被配置用于获取风控对象的当前及历史就诊行 为数据、以及与风控对象相关的个人信息和公共数据;
特征提取模块,被配置用于从所述风控对象数据获取模块获取的数据中 提取与风控对象的就诊行为相关的特征;
就诊分类模块,被配置用于根据所提取的特征,将风控对象的当前及历 史就诊行为中的每次就诊行为划分到相应的就诊类别,形成就诊类别序列;
就诊目的推测模块,被配置用于将在所述就诊类别序列作为观测序列, 将就诊目的作为隐含状态,根据隐马尔可夫模型计算出最可能的隐含状态序 列,其中包含了风控对象最可能的就诊目的;
异常输出模块,被配置用于在所述隐含状态序列中包含的所述风控对象 最可能的就诊目的对应于异常目的的情况下,输出与所述风控对象的当前及 历史就诊行为相关的医疗数据。
根据本发明的实施例,该系统还可包括:
隐马尔可夫模型建立模块,被配置用于利用Baum-Welch算法,基于从医 疗机构或公开数据源获取的大数据,计算出隐马尔可夫模型对应的观测概率 矩阵和状态转移概率矩阵。
3、安装了用于实现本发明的实施例的应用程序的系统、以及存储所述应用程序的 计算机可读介质
此外,本发明的不同实施例也可以通过软件模块或存储在一个或多个计 算机可读介质上的计算机可读指令的方式实现,其中,所述计算机可读指令 当被处理器或设备组件执行时,执行本发明所述的不同的实施例。类似地, 软件模块、计算机可读介质和硬件部件的任意组合都是本发明预期的。所述 软件模块可以被存储在任意类型的计算机可读存储介质上,例如RAM、 EPROM、EEPROM、闪存、寄存器、硬盘、CD-ROM、DVD等等。
具体地,本发明的另一个方面涉及使用硬件和/或软件实现上述不同的实 施例。本领域的技术人员应该理解,可以使用计算设备或者一个或多个处理 器实现或执行本发明的实施例。计算设备或处理器可以是例如通用处理器、 数字信号处理器(DSP)、专用集成芯片(ASIC)、现场可编程门阵列(FPGA) 或其他可编程逻辑设备,等等。本发明不同的实施例也可以被这些设备的组 合执行或体现。
参照图4,其示出了根据本发明的实施例的安装了应用程序的系统的运 行环境。
在本实施例中,所述的安装应用程序的系统安装并运行于电子装置中。 所述电子装置可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。 该电子装置可包括但不限于存储器、处理器及显示器。图4仅示出了具有上 述组件的电子装置,但是应理解的是,并不要求实施所有示出的组件,可以 替代的实施更多或者更少的组件。
所述存储器在一些实施例中可以是所述电子装置的内部存储单元,例如 该电子装置的硬盘或内存。所述存储器在另一些实施例中也可以是所述电子 装置的外部存储设备,例如所述电子装置上配备的插接式硬盘,智能存储卡 (Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器还可以既包括所述电子装置的内部存储单 元也包括外部存储设备。所述存储器用于存储安装于所述电子装置的应用软 件及各类数据,例如所述安装应用程序的系统的程序代码等。所述存储器还 可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器在一些实施例中可以是中央处理单元(Central Processing Unit,CPU)、微处理器或其他数据处理芯片,用于运行所述存储器中存储的程序代 码或处理数据,例如执行所述安装应用程序的系统等。
所述显示器在一些实施例中可以是LED显示器、液晶显示器、触控式液 晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸 器等。所述显示器用于显示在所述电子装置中处理的信息以及用于显示可视 化的用户界面,例如应用菜单界面、应用图标界面等。所述电子装置的部件 通过系统总线相互通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解,上述 实施方式中的方法可借助软件加必需的通用硬件平台的方式来实现,当然也 可以通过硬件来实现,但很多情况下前者是更佳的实施方式。基于这样的理 解,本发明本申请的技术方案本质上或者说对现有技术做出贡献的部分可以 以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如 ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以 是手机,计算机,服务器,空调器,或者网络设备等)执行本发明本申请各 个实施例所述的方法。
也就是说,根据本发明的实施例,还提供了一种计算机可读存储介质, 其上存储用于执行通过数据分析推断医疗保险违规行为的风控方法的程序, 所述程序在被处理器执行时,实现根据所述方法的步骤。
由上,将理解,为了说明的目的,这里已描述了本发明的具体实施例, 但是,可作出各个修改,而不会背离本发明的范围。本领域的技术人员将理 解,流程图步骤中所绘出或这里描述的操作和例程可以多种方式变化。更具 体地,可重新安排步骤的次序,可并行执行步骤,可省略步骤,可包括其它 步骤,可作出例程的各种组合或省略。因而,本发明仅由所附权利要求限制。

Claims (6)

1.一种通过数据分析推断医疗保险违规行为的风控方法,其特征在于,风控对象的就诊目的被划分为正常目的和异常目的,所述方法包括以下步骤:
步骤1、获取风控对象的当前及历史就诊行为数据、以及与风控对象相关的个人信息和公共数据;
步骤2、从在步骤1获取的数据中提取与风控对象的就诊行为相关的特征;
步骤3、根据所提取的特征,将风控对象的当前及历史就诊行为中的每次就诊行为划分到相应的就诊类别,形成就诊类别序列;
步骤4、将在步骤3中形成的就诊类别序列作为观测序列,将就诊目的作为隐含状态,根据隐马尔可夫模型计算出最可能的隐含状态序列;所述隐马尔可夫模型包含观测概率矩阵和状态转移概率矩阵,其中,所述观测概率矩阵中记录有每个就诊目的下的各个就诊类别的概率,所述状态转移概率矩阵中记录有从一个就诊目的转移到另一个就诊目的的概率;
步骤5、如果所述最可能的隐含状态序列中包含的一个或多个隐含状态对应于异常目的、或者所述最可能的隐含状态序列的发生概率低于预定阈值,则输出与所述风控对象的当前及历史就诊行为相关的医疗数据;
如果包含异常目的的全部隐含状态序列的发生概率之和高于预定阈值,则将所述风控对象识别为风险目标并输出到后端系统;
和/或,如果所述最可能的隐含状态序列中包含的所述风控对象的就诊目的中的一个或多个对应于异常目的,则将所述风控对象识别为风险目标并输出到后端系统;
和/或,如果所述最可能的隐含状态序列中不包含异常目的、但所述最可能的隐含状态序列的发生概率低于预定阈值,则将所述风控对象识别为风险目标并输出到后端系统。
2.根据权利要求1所述的通过数据分析推断医疗保险违规行为的风控方法,其特征在于,在步骤3中,使用K-Means或者RVM分类器,将风控对象的当前及历史就诊行为中的每次就诊行为划分到相应的就诊类别,
其中,与风控对象相关的个人数据包括风控对象的医保结算数据、风控对象的人口学数据,
与风控对象相关的公共数据包括医疗机构相关数据、以及医保基金稽核数据。
3.根据权利要求1所述的通过数据分析推断医疗保险违规行为的风控方法,其特征在于,所述正常就诊目的包括:体检、初诊、复诊、配药、住院,
观测概率矩阵和状态转移概率矩阵是利用Baum-Welch算法推导出的。
4.根据权利要求1所述的通过数据分析推断医疗保险违规行为的风控方法,其特征在于,在步骤2中,所述特征包括:
人口学特征,包括风控对象的年龄、性别、职业、文化水平;
地理特征,包括风控对象的籍贯、公司地理位置、医疗机构地理位置、参保区域等;
时间特征,包括风控对象的就诊时间、就诊间期、参保时间;
医疗特征,包括风控对象的诊断数据、就诊科室、医疗消费清单、医疗机构规模、医疗机构等级、医疗机构的既往案底标签、医生平均职称;
费用特征,包括风控对象的单次花费、时间段总花费、费用构成比例。
5.一种用于进行如权利要求1至4中的一个所述的方法的风控系统,包括:
风控对象数据获取模块,被配置用于获取风控对象的当前及历史就诊行为数据、以及与风控对象相关的个人信息和公共数据;
特征提取模块,被配置用于从所述风控对象数据获取模块获取的数据中提取与风控对象的就诊行为相关的特征;
就诊分类模块,被配置用于根据所提取的特征,将风控对象的当前及历史就诊行为中的每次就诊行为划分到相应的就诊类别,形成就诊类别序列;
就诊目的推测模块,被配置用于将在所述就诊类别序列作为观测序列,将就诊目的作为隐含状态,根据隐马尔可夫模型计算出最可能的隐含状态序列;
异常输出模块,被配置用于在所述隐含状态序列中包含的隐含状态中的一个对应于异常目的的情况下,输出与所述风控对象的当前及历史就诊行为相关的医疗数据;以及
隐马尔可夫模型建立模块,被配置用于利用Baum-Welch算法,基于从医疗机构或公开数据源获取的大数据,计算出隐马尔可夫模型对应的观测概率矩阵和状态转移概率矩阵。
6.一种计算机可读存储介质,其上存储有用于执行通过数据分析推断医疗保险违规行为的风控方法的程序,所述程序被处理器执行时,实现根据权利要求1至4中的一个所述的方法的步骤。
CN201810191862.5A 2018-03-08 2018-03-08 通过数据分析推断医疗保险违规行为的风控方法 Active CN108492196B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810191862.5A CN108492196B (zh) 2018-03-08 2018-03-08 通过数据分析推断医疗保险违规行为的风控方法
PCT/CN2018/097746 WO2019169826A1 (zh) 2018-03-08 2018-07-30 通过数据分析推断医疗保险违规行为的风控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810191862.5A CN108492196B (zh) 2018-03-08 2018-03-08 通过数据分析推断医疗保险违规行为的风控方法

Publications (2)

Publication Number Publication Date
CN108492196A CN108492196A (zh) 2018-09-04
CN108492196B true CN108492196B (zh) 2020-11-10

Family

ID=63338027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810191862.5A Active CN108492196B (zh) 2018-03-08 2018-03-08 通过数据分析推断医疗保险违规行为的风控方法

Country Status (2)

Country Link
CN (1) CN108492196B (zh)
WO (1) WO2019169826A1 (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109377388B (zh) * 2018-09-13 2023-08-18 深圳平安医疗健康科技服务有限公司 医保投保方法、装置、计算机设备和存储介质
CN109636623A (zh) * 2018-10-19 2019-04-16 平安医疗健康管理股份有限公司 医疗数据异常检测方法、装置、设备及存储介质
CN109308793A (zh) * 2018-10-22 2019-02-05 平安医疗健康管理股份有限公司 基于数据处理的药品费用超标预警方法及装置
CN109524098A (zh) * 2018-10-27 2019-03-26 平安医疗健康管理股份有限公司 基于数据分析的就诊信息处理方法、装置、设备及介质
CN109524097A (zh) * 2018-10-27 2019-03-26 平安医疗健康管理股份有限公司 基于人脸识别的挂床行为检测方法、装置、服务器及介质
CN109523396A (zh) * 2018-10-27 2019-03-26 平安医疗健康管理股份有限公司 基于数据分析的医保基金风控方法、装置、服务器及介质
CN109559090A (zh) * 2018-10-27 2019-04-02 平安医疗健康管理股份有限公司 基于数据分析的医疗项目风控方法、装置、服务器及介质
CN109377207A (zh) * 2018-10-30 2019-02-22 平安医疗健康管理股份有限公司 异常住院行为判定的方法及相关产品
CN109584086A (zh) * 2018-10-30 2019-04-05 平安医疗健康管理股份有限公司 基于预测模型预测住院合理性的方法及相关产品
CN109545387B (zh) * 2018-10-30 2024-02-27 平安科技(深圳)有限公司 一种基于神经网络的异常病例识别方法及计算设备
CN109559806A (zh) * 2018-10-30 2019-04-02 平安医疗健康管理股份有限公司 异常住院行为的判定方法及相关产品
CN109637615B (zh) * 2018-11-30 2022-10-14 平安医疗健康管理股份有限公司 异常医疗处方的判断方法、装置、设备及可读存储介质
CN109615204B (zh) * 2018-11-30 2023-02-03 平安医疗健康管理股份有限公司 医疗数据的质量评估方法、装置、设备及可读存储介质
CN109636627B (zh) * 2018-12-04 2020-11-03 泰康保险集团股份有限公司 基于区块链的保险产品管理方法、装置、介质及电子设备
CN109659035A (zh) * 2018-12-13 2019-04-19 平安医疗健康管理股份有限公司 基于机器学习的就诊数据异常识别方法、设备及存储介质
CN109658267A (zh) * 2018-12-13 2019-04-19 平安医疗健康管理股份有限公司 社保违规检测方法、装置、设备及计算机存储介质
CN109635044A (zh) * 2018-12-13 2019-04-16 平安医疗健康管理股份有限公司 住院数据异常检测方法、装置、设备及可读存储介质
CN109636650A (zh) * 2018-12-13 2019-04-16 平安医疗健康管理股份有限公司 用药方案异常的识别方法、装置、终端及可读存储介质
CN109544391A (zh) * 2018-12-13 2019-03-29 平安医疗健康管理股份有限公司 异常购药的识别方法、装置、终端及计算机可读存储介质
CN109598633A (zh) * 2018-12-13 2019-04-09 平安医疗健康管理股份有限公司 社保违规检测方法、装置、设备及计算机存储介质
CN109636421A (zh) * 2018-12-13 2019-04-16 平安医疗健康管理股份有限公司 基于机器学习的就诊数据异常识别方法、设备及存储介质
CN109615012A (zh) * 2018-12-13 2019-04-12 平安医疗健康管理股份有限公司 基于机器学习的就诊数据异常识别方法、设备及存储介质
CN109559242A (zh) * 2018-12-13 2019-04-02 平安医疗健康管理股份有限公司 异常数据的处理方法、装置、设备及计算机可读存储介质
CN110245960A (zh) * 2019-05-21 2019-09-17 何金星 一种基于计算机控制的医保防欺诈系统及方法
CN111210356B (zh) * 2020-01-14 2023-03-21 平安医疗健康管理股份有限公司 医保数据分析方法、装置、计算机设备和存储介质
CN111340641B (zh) * 2020-05-22 2020-11-13 浙江工业大学 一种异常就医行为检测方法
CN112131277B (zh) * 2020-09-28 2023-04-18 深圳平安医疗健康科技服务有限公司 基于大数据的医疗数据异常分析方法、装置和计算机设备
CN112541831A (zh) * 2020-12-16 2021-03-23 中国人寿保险股份有限公司 一种医疗保险的风险识别方法、装置、介质及电子设备
CN114866351B (zh) * 2022-07-06 2022-10-14 湖南创星科技股份有限公司 一种基于区块链的区域医疗处方监管方法及系统
CN116976879B (zh) * 2023-09-22 2024-01-09 广州扬盛计算机软件有限公司 自助设备的支付系统异常监控方法及系统
CN117151902B (zh) * 2023-10-25 2024-01-23 北京创智和宇科技有限公司 一种大数据分析对drg及dip医保支付风险监控和预警的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102013084A (zh) * 2010-12-14 2011-04-13 江苏大学 用于检测医疗保险门诊欺诈性交易的系统和方法
CN103761748A (zh) * 2013-12-31 2014-04-30 北京邮电大学 异常行为检测方法和装置
CN107402921A (zh) * 2016-05-18 2017-11-28 阿里巴巴集团控股有限公司 识别用户行为的事件时序数据处理方法、装置及系统
CN107464115A (zh) * 2017-07-20 2017-12-12 北京小米移动软件有限公司 个人特征信息验证方法及装置
CN107609980A (zh) * 2017-09-07 2018-01-19 平安医疗健康管理股份有限公司 医疗数据处理方法、装置、计算机设备及存储介质
CN107657536A (zh) * 2017-02-20 2018-02-02 平安科技(深圳)有限公司 社保欺诈行为的识别方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160110818A1 (en) * 2014-10-21 2016-04-21 Hartford Fire Insurance Company System for dynamic fraud detection
US11132615B2 (en) * 2015-03-10 2021-09-28 International Business Machines Corporation Generating an expected prescriptions model using graphical models
US20160379309A1 (en) * 2015-06-24 2016-12-29 IGATE Global Solutions Ltd. Insurance Fraud Detection and Prevention System
CN104952000A (zh) * 2015-07-01 2015-09-30 华侨大学 基于马尔科夫链的风电机组运行状态模糊综合评价方法
CN107240024A (zh) * 2017-05-22 2017-10-10 中国平安人寿保险股份有限公司 保险理赔的反欺诈识别方法及装置
CN107680602A (zh) * 2017-08-24 2018-02-09 平安科技(深圳)有限公司 语音欺诈识别方法、装置、终端设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102013084A (zh) * 2010-12-14 2011-04-13 江苏大学 用于检测医疗保险门诊欺诈性交易的系统和方法
CN103761748A (zh) * 2013-12-31 2014-04-30 北京邮电大学 异常行为检测方法和装置
CN107402921A (zh) * 2016-05-18 2017-11-28 阿里巴巴集团控股有限公司 识别用户行为的事件时序数据处理方法、装置及系统
CN107657536A (zh) * 2017-02-20 2018-02-02 平安科技(深圳)有限公司 社保欺诈行为的识别方法和装置
CN107464115A (zh) * 2017-07-20 2017-12-12 北京小米移动软件有限公司 个人特征信息验证方法及装置
CN107609980A (zh) * 2017-09-07 2018-01-19 平安医疗健康管理股份有限公司 医疗数据处理方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN108492196A (zh) 2018-09-04
WO2019169826A1 (zh) 2019-09-12

Similar Documents

Publication Publication Date Title
CN108492196B (zh) 通过数据分析推断医疗保险违规行为的风控方法
CN108511059B (zh) 慢病管理方法及系统
US20200242626A1 (en) Fraud lead detection system for efficiently processing database-stored data and automatically generating natural language explanatory information of system results for display in interactive user interfaces
US11600390B2 (en) Machine learning clinical decision support system for risk categorization
Joudaki et al. Using data mining to detect health care fraud and abuse: a review of literature
US10372879B2 (en) Medical claims lead summary report generation
US20140006044A1 (en) System and method for preparing healthcare service bundles
KR102028692B1 (ko) 병원 운영 솔루션 제공 방법, 서버 및 프로그램
US20150356272A1 (en) Prescription analysis system and method for applying probabilistic model based on medical big data
CN106793957B (zh) 用于预测患者护理未来结果的医疗系统和方法
US20150149215A1 (en) System and method to detect and visualize finding-specific suggestions and pertinent patient information in radiology workflow
Hunter-Zinck et al. Predicting emergency department orders with multilabel machine learning techniques and simulating effects on length of stay
CN108898316A (zh) 理赔费用预警方法及系统
Liu et al. Mining patient-specific and contextual data with machine learning technologies to predict cancellation of children’s surgery
CN113707337A (zh) 基于多源数据的疾病预警方法、装置、设备及存储介质
US20210056438A1 (en) Data driven featurization and modeling
CN111933246B (zh) 医疗处方分析方法、系统、电子设备及存储介质
US20160259896A1 (en) Segmented temporal analysis model used in fraud, waste, and abuse detection
Lim et al. Deriving a sophisticated clinical pathway based on patient conditions from electronic health record data
CN113821641B (zh) 基于权重分配的药品分类的方法、装置、设备及存储介质
Ma et al. Predictive analytics for outpatient appointments
Stargardt et al. A framework to evaluate the effects of small area variations in healthcare infrastructure on diagnostics and patient outcomes of rare diseases based on administrative data
CN112750046A (zh) 一种基于异常检测算法的医保控费方法和系统
Ney et al. Computerized prescriber order entry and opiate prescription in ambulatory care visits
Settipalli et al. Provider profiling and labeling of fraudulent health insurance claims using Weighted MultiTree

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1251803

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220520

Address after: 518000 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province

Patentee after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd.

Address before: Room 12G, Area H, 666 Beijing East Road, Huangpu District, Shanghai 200001

Patentee before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd.

TR01 Transfer of patent right