CN113657549A - 医疗数据审核方法、装置、设备以及存储介质 - Google Patents

医疗数据审核方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN113657549A
CN113657549A CN202111016189.XA CN202111016189A CN113657549A CN 113657549 A CN113657549 A CN 113657549A CN 202111016189 A CN202111016189 A CN 202111016189A CN 113657549 A CN113657549 A CN 113657549A
Authority
CN
China
Prior art keywords
data
auditing
dimension
participation
multidimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111016189.XA
Other languages
English (en)
Inventor
满天龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Medical Health Technology Service Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN202111016189.XA priority Critical patent/CN113657549A/zh
Publication of CN113657549A publication Critical patent/CN113657549A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及数字医疗领域,提供了一种医疗数据审核方法、装置、设备以及存储介质,其中,方法包括:通过数据提取节点获取各个参保人员的多维参保数据,进行聚类处理,得到多个参保数据集,计算离散值,并提取到目标多维参保数据,再将所述目标多维参保数据发送给各个所述维度审核节点进行审核,根据审核情况判定所述目标多维参保数据是否异常。从而实现了无需进行投入巨大的人力成本,即可完成对各个参保人员的自动化审核。另外,通过区块链可以实现多个审核节点共同审核的机制,可以实现对各个参保人员的多维度审核,提高了审核的全面性。

Description

医疗数据审核方法、装置、设备以及存储介质
技术领域
本发明涉及数字医疗领域,特别涉及一种医疗数据审核方法、装置、设备以及存储介质。
背景技术
医疗保险金是由职工、单位和国家按一定的缴费比例三方共同出资而形成的。当参保职工因病就诊时,可以从中获得部分或全部的报销额。随着医疗制度的不断完善,参保覆盖面也越来越广,由于一些别有用心的人员会进行骗保,以此谋取自身的利益,因此需要对各个参保人员的医疗数据进行审核。
目前,审核医疗数据的方式主要是通过人为审核,然而人员审核的方式需要投入巨大的人力成本。
发明内容
本发明的主要目的为提供一种医疗数据审核方法、装置、设备以及存储介质,旨在解决人为审核医疗数据需要投入巨大的人力成本的问题。
本发明提供了一种医疗数据审核方法,所述医疗数据审核方法基于区块链实现,所述区块链至少包括数据提取节点和多个维度审核节点,所述方法包括:
通过数据提取节点获取医保知识图谱中各个参保人员的多维参保数据;
通过预设的聚类算法将各所述多维参保数据进行聚类处理,得到多个参保数据集;
在同一所述参保数据集中,计算每个参保人员与其他参保人员的欧式距离并求和,得到每个所述参保人员在所属的参保数据集中的离散值;
将所述离散值大于离散阈值的参保人员的目标多维参保数据进行提取;
将所述目标多维参保数据发送给各个所述维度审核节点,并通过各个所述维度审核节点进行审核;
接收各个所述维度审核节点的审核情况判定所述目标多维参保数据是否异常。
进一步地,所述通过数据提取节点获取医保知识图谱中各个参保人员的多维参保数据的步骤之前,还包括:
获取医保数据库中各个参保人员的多维参保数据;
为所述多维参保数据中的每个维度建立对应的知识图谱维度层,并将各所述多维参保数据中对应的维度映射至各个所述知识图谱维度层中;
对各个所述知识图谱维度层进行信息抽取,得到各个所述知识图谱维度层的实体类型以及与其他知识图谱维度层的实体关系;
基于所述实体类型和所述实体关系建立所述知识图谱维度层之间的关系,得到所述医保知识图谱。
进一步地,所述通过预设的聚类算法将各所述多维参保数据进行聚类处理,得到多个参保数据集的步骤,包括:
将各所述多维参保数据生成对应的多维向量X1,X2,…,Xi,…,Xn
在所述多维向量对应的多维空间中,随机选取k个聚类质心点Y1,Y2,…,Xj,…,Yk
根据公式
Figure BDA0003240282930000021
计算各个所述多维向量与各个所述聚类质心点的相似度;
根据所述相似度为各个多维向量选取相似度最大的初步聚类质心进行初步聚类;
计算每个聚类质心点中所具有的多维向量中各个维度的平均值,并作为新的聚类质心点,并通过所述新的聚类质心点进行聚类并计算下一个聚类质心点,直至得到的目标聚类质心点达到第一预设条件;
获取各个所述目标聚类质心点中所有的多维向量,从而得到多个参保数据集。
进一步地,所述各个所述维度审核节点包括高频取药审核节点,所述通过各个所述维度审核节点进行审核的步骤,包括:
通过所述高频取药审核节点获取所述目标多维参保数据中所述参保人员的取药时间点的时间维度数据集;
计算所述时间维度数据集的平均值,作为第一暂时中间点;
采集距离所述第一暂时中间点预设时间长度范围内的目标取药时间点;
计算各所述第一暂时中间点对应的目标取药时间点的平均值,作为新的第一暂时中间点,并返回所述采集距离所述第一暂时中间点预设时间长度范围内的目标取药时间点的步骤,直至得到达到第二预设条件的第二暂时中间点;
获取距离所述第二暂时中间点所述预设时间长度范围内对应的目标取药时间点的时间点数量;
检测所述时间点数量是否达到了预设的时间点数量;
根据检测结果判定各所述目标多维参保数据是否在取药频率中是否异常。
进一步地,所述各个所述维度审核节点包括额度取药审核节点,所述通过各个所述维度审核节点进行审核的步骤,包括:
通过所述额度取药审核节点获取所述目标多维参保数据中所述参保人员的每次取药金额;
从所述每次取药金额中获取数值最大的最大取药金额;
检测所述最大取药金额是否超过了其对应参保人员对应的最大额度;
根据检测结果判定各所述目标多维参保数据是否在取药金额中是否异常。
进一步地,所述各个所述维度审核节点包括新药取药审核节点,所述通过各个所述维度审核节点进行审核的步骤,包括:
通过所述新药取药审核节点根据预设的新药数据库获取所述目标多维参保数据中所述参保人员的每次报销的新药数量;
从所述每次报销的新药数量中获取数量最多的最大新药数量;
检测所述最大新药数量是否超过了预设的新药数值;
根据检测结果判定各所述目标多维参保数据是否在新药数量的维度是否异常。
进一步地,所述将所述目标多维参保数据发送给各个所述维度审核节点,并通过各个所述维度审核节点进行审核的步骤之前,还包括:
从所述各个参保人员的目标多维参保数据中获取到各个参保人员的各种慢病信息;
基于所述各种慢病信息获取各个慢病信息在各个维度的限定信息;
将各个维度的限定信息对应发送给各个维度审核节点。
本发明还提供了一种医疗数据审核装置,包括:
获取模块,用于通过数据提取节点获取医保知识图谱中各个参保人员的多维参保数据;
聚类模块,用于通过预设的聚类算法将各所述多维参保数据进行聚类处理,得到多个参保数据集;
计算模块,用于在同一所述参保数据集中,计算每个参保人员与其他参保人员的欧式距离并求和,得到每个所述参保人员在所属的参保数据集中的离散值;
提取模块,用于将所述离散值大于离散阈值的参保人员的目标多维参保数据进行提取;
发送模块,用于将所述目标多维参保数据发送给各个所述维度审核节点,并通过各个所述维度审核节点进行审核;
接收模块,用于接收各个所述维度审核节点的审核情况判定所述目标多维参保数据是否异常。
本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本发明的有益效果:通过数据提取节点获取各个参保人员的多维参保数据,进行聚类处理,得到多个参保数据集,计算离散值,并提取到目标多维参保数据,再将所述目标多维参保数据发送给各个所述维度审核节点进行审核,根据审核情况判定所述目标多维参保数据是否异常。从而实现了无需进行投入巨大的人力成本,即可完成对各个参保人员的自动化审核。另外,通过区块链可以实现多个审核节点共同审核的机制,可以实现对各个参保人员的多维度审核,提高了审核的全面性。
附图说明
图1是本发明一实施例的一种医疗数据审核方法的流程示意图;
图2是本发明一实施例的一种医疗数据审核装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后等)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变,所述的连接可以是直接连接,也可以是间接连接。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参照图1,本发明提出一种医疗数据审核方法,所述医疗数据审核方法基于区块链实现,所述区块链至少包括数据提取节点和多个维度审核节点,所述方法包括:
S1:通过数据提取节点获取医保知识图谱中各个参保人员的多维参保数据;
S2:通过预设的聚类算法将各所述多维参保数据进行聚类处理,得到多个参保数据集;
S3:在同一所述参保数据集中,计算每个参保人员与其他参保人员的欧式距离并求和,得到每个所述参保人员在所属的参保数据集中的离散值;
S4:将所述离散值大于离散阈值的参保人员的目标多维参保数据进行提取;
S5:将所述目标多维参保数据发送给各个所述维度审核节点,并通过各个所述维度审核节点进行审核;
S6:接收各个所述维度审核节点的审核情况判定所述目标多维参保数据是否异常。
如上述步骤S1所述,通过数据提取节点获取医保知识图谱中各个参保人员的多维参保数据。其中,医保知识图谱为根据各个参保人员的维度数据所构成的图谱,包含了诸如参保人员的慢病信息,取药信息,取药金额等各个维度的信息,其构成的方式后续有说明,此处不再赘述,从而基于该医保知识图谱可以获取到各个参保人员的多维参保数据。其中,数据提取节点为区块链中的一个节点,用于与参保数据库连接,并获取到其中的数据。
如上述步骤S2所述,通过预设的聚类算法将各所述多维参保数据进行聚类处理,得到多个参保数据集。其中,将各个多维参保数据进行聚类处理,其中聚类处理的方式可以是任意的聚类方式,例如可以是K-means算法、DBSCAN算法、密度最大值聚类DPCA中的任意一个聚类算法,其目的为获取到同类参保人员中数据较为异常的目标多维参保数据,应当理解的是,骗保的参保人员只是极少数的部分,因此,只需要对这部分人进行分析即可,即提取出异常的目标多维参保数据进行分析。
如上述步骤S3所述,在同一所述参保数据集中,计算每个参保人员与其他参保人员的欧式距离并求和,得到每个所述参保人员在所属的参保数据集中的离散值。其中,离散值的计算方式可以通过公式
Figure BDA0003240282930000071
其中,xj表示参保数据集中第j个参保人员,xi表示表示参保数据集中第i个参保人员,Lj表示第j个参保人员的离散值,也可以通过孤立森林的方式进行计算。
如上述步骤S4所述,将所述离散值大于离散阈值的参保人员的目标多维参保数据进行提取,由于不同的离散阈值的计算方式,其得到的离散阈值也会有数值上的差异,因此可以根据计算离散阈值的方式,限定对应的离散阈值,其中离散阈值可以根据一些骗保人员的离散值预先设定,该离散阈值的设定应该介于一般参保人员的离散值和骗保人员的离散值之间,以便于提取异常的目标多维参保数据。当然,仍可能存在一些参保人员病情较为严重,因此需要获取到对应的目标多维参保数据进行进一步地分析。
如上述步骤S5所述,将所述目标多维参保数据发送给各个所述维度审核节点,并通过各个所述维度审核节点进行审核。即针对目标多维数据进行多个维度的审核,即将其输入至区块链中的各个维度审核节点中进行多维度审核,其中,在区块链中,各个审核节点只是获取到了维度的审核数据,并没有获取到全部的审核数据,因此,可以保证数据的保密性能,有利于各个参保人员的数据安全,另外,通过区块链可以实现多个审核节点共同审核的机制,可以实现对各个参保人员的多维度审核,提高了审核的全面性。
如上述步骤S6所述,接收各个所述维度审核节点的审核情况判定所述目标多维参保数据是否异常。即各个维度审核节点只要有一个审核节点审核未通过,则可以认为该目标多维参保数据异常,可以将该目标多维参保数据提取进行再一次的分析,也可以直接认定为该目标多维参保数据对应的参保人员具有骗保行为。从而无需进行投入巨大的人力成本,即可完成对各个参保人员的自动化审核。
在一个实施例中,所述通过数据提取节点获取医保知识图谱中各个参保人员的多维参保数据的步骤S1之前,还包括:
S001:获取医保数据库中各个参保人员的多维参保数据;
S002:为所述多维参保数据中的每个维度建立对应的知识图谱维度层,并将各所述多维参保数据中对应的维度映射至各个所述知识图谱维度层中;
S003:对各个所述知识图谱维度层进行信息抽取,得到各个所述知识图谱维度层的实体类型以及与其他知识图谱维度层的实体关系;
S004:基于所述实体类型和所述实体关系建立所述知识图谱维度层之间的关系,得到所述医保知识图谱。
如上述步骤S001-S004所述,实现了对医保知识图谱的构建,具体地,即先获取到各个参保人员的多维参保数据,为每个维度建立对应的知识图谱层,即将各个参保人员的多维参保数据渗透至每个知识图谱层中,并找出对应的关系,其中,建立知识图谱层,可以便于计算各个多维参保数据之间的距离,即便于后续的聚类处理,其中,对各个所述知识图谱维度层进行信息抽取,得到各个所述知识图谱维度层的实体类型以及与其他知识图谱维度层的实体关系,可以使各个实体关系,参保人员之间的数据联系更加清晰,以便于后续进行数据分析,例如,在得到了对应的目标多维参保数据之后,可以基于该医保知识图谱获取到该参保人员的详细情况,以便于更好的分析。
在一个实施例中,所述通过预设的聚类算法将各所述多维参保数据进行聚类处理,得到多个参保数据集的步骤S2,包括:
S201:将各所述多维参保数据生成对应的多维向量X1,X2,…,Xi,…,Xn
S202:在所述多维向量对应的多维空间中,随机选取k个聚类质心点Y1,Y2,…,Xj,…,Yk
S203:根据公式
Figure BDA0003240282930000091
计算各个所述多维向量与各个所述聚类质心点的相似度;
S204:根据所述相似度为各个多维向量选取相似度最大的初步聚类质心进行初步聚类;
S205:计算每个聚类质心点中所具有的多维向量中各个维度的平均值,并作为新的聚类质心点,并通过所述新的聚类质心点进行聚类并计算下一个聚类质心点,直至得到的目标聚类质心点达到第一预设条件;
S206:获取各个所述目标聚类质心点中所有的多维向量,从而得到多个参保数据集。
如上述步骤S201-S206所述,实现了对参保数据集的聚类处理,其中,可以将各个多维参保数据生成对应的多维向量,其中,多维向量中的每个维度对应多维参保数据中的各个维度,在所述多维向量对应的多维空间中,随机选取k个聚类质心点,其中,k表示分类的分类簇,即只有k个分类,根据公式
Figure BDA0003240282930000101
计算相似度,并根据相似度进行初步聚类,使得各个多维参保数据分至对应的分类簇中,其中,若存在一个多维参保数据与多个聚类质心点的距离相同,则该多维参保数据同时属于多个分类簇,并重新计算新的聚类质心点,反复多次,直至达到第一预设条件,该第一预设条件可以是当每个聚类质心点不再改变,或者达到了预设的循环次数,或者满足这两个预设条件中任意一个条件。从而实现了对各个多维参保数据的合理分类,避免出现因为慢病或者其他因素不同,而导致报销数据存在差异而形成的误差,此处将相近的数据进行聚类,再从聚类后的参保数据集进行分析,可以有效减少上述误差,使分析结果更加可靠。
在一个实施例中,所述各个所述维度审核节点包括高频取药审核节点,所述通过各个所述维度审核节点进行审核的步骤S5,包括:
S501:通过所述高频取药审核节点获取所述目标多维参保数据中所述参保人员的取药时间点的时间维度数据集;
S502:计算所述时间维度数据集的平均值,作为第一暂时中间点;
S503:采集距离所述第一暂时中间点预设时间长度范围内的目标取药时间点;
S504:
计算各所述第一暂时中间点对应的目标取药时间点的平均值,作为新的第一暂时中间点,并返回所述采集距离所述第一暂时中间点预设时间长度范围内的目标取药时间点的步骤,直至得到达到第二预设条件的第二暂时中间点;
S505:获取距离所述第二暂时中间点所述预设时间长度范围内对应的目标取药时间点的时间点数量;
S506:检测所述时间点数量是否达到了预设的时间点数量;
S507:根据检测结果判定各所述目标多维参保数据是否在取药频率中是否异常。
如上述步骤S501-S507所述,实现了取药频率维度的异常审核。由于一般而言,医保数据库中不会统计各个患者买药的频率,且也不会统计患者在单位时间内买药的频率,因此需要通过取药时间点来进行获取。具体地,先获取到各个参保人员的取药时间点,并为各个参保人员构建对应的时间维度数据集,然后作为第一暂时中间点,采集距离第一暂时中间点预设时间长度范围内的目标取药时间点,由于其平均值往往会靠近频率更高的时间区域,因此先获取到其对应的第一暂时中间点,然后再根据距离所述第一暂时中间点预设时间长度范围内的目标取药时间点,调整第一暂时中间点的位置,从而可以达到第二预设条件,其中,第二预设条件可以是当第一暂时中间点不再改变,或者达到了预设的循环次数,或者满足这两个预设条件中任意一个条件。从而实现了对最大取药频率(即时间点数量)的获取,进而判断是否在取药频率中异常。
在一个实施例中,所述各个所述维度审核节点包括额度取药审核节点,所述通过各个所述维度审核节点进行审核的步骤S5,包括:
S511:通过所述额度取药审核节点获取所述目标多维参保数据中所述参保人员的每次取药金额;
S512:从所述每次取药金额中获取数值最大的最大取药金额;
S513:检测所述最大取药金额是否超过了其对应参保人员对应的最大额度;
S514:根据检测结果判定各所述目标多维参保数据是否在取药金额中是否异常。
如上述步骤S511-S514所述,实现了从取药金额维度的判断,由于骗保人员为了谋取利益,其取药的金额会比较多,因此需要对其取药的金额进行审核,具体地审核方法为,在获取到各个参保人员的每次取药金额后,选取最大的取药金额进行判断,在另一个实施例中,也可以是一段时间内的取药金额。根据各种慢病信息设定各个参保人员对应的最大额度,若超出了该最大额度,表明该参保人员的取药是异常的,从而实现了对取药金额维度的判断。
在一个实施例中,所述各个所述维度审核节点包括新药取药审核节点,所述通过各个所述维度审核节点进行审核的步骤S5,包括:
S521:通过所述新药取药审核节点根据预设的新药数据库获取所述目标多维参保数据中所述参保人员的每次报销的新药数量;
S522:从所述每次报销的新药数量中获取数量最多的最大新药数量;
S523:检测所述最大新药数量是否超过了预设的新药数值;
S524:根据检测结果判定各所述目标多维参保数据是否在新药数量的维度是否异常。
如上述步骤S521-S524所述,实现了从新药取药的维度进行判断,由于新药一般短缺,转卖容易获利。若投保人取药中大量包含新药,说明投保人有较高的风险转卖新药,从中牟利。因此可以获取到各个参保人员每次报销的新药数量,根据每次报销的新药数量中获取数量最多的最大新药数量,在一些实施例中,也可以是一段时间内的新药报销数量,该新药数据库为预先构建的数据库,该数据库可以是人工进行建立,也可以从对应的报销药库中获取到各个药品的发行时间,根据发行时间确定报销药品是否为新药。再根据各个参保人员的报销的新药数量进行判定,若超过了预设的新药数值,则可以认为其在新药数量的维度异常。从而实现了从新药数量的维度判定参保数据是否异常,
在一个实施例中,所述将所述目标多维参保数据发送给各个所述维度审核节点,并通过各个所述维度审核节点进行审核的步骤S5之前,还包括:
S531:从所述各个参保人员的目标多维参保数据中获取到各个参保人员的各种慢病信息;
S532:基于所述各种慢病信息获取各个慢病信息在各个维度的限定信息;
S533:将各个维度的限定信息对应发送给各个维度审核节点。
如上述步骤S531-S533所述,实现了对各个维度审核节点的审核标准的更新,即获取到各个参保人员的各种慢病信息,即现有的慢病信息,然后实时获取当前在各个维度的限定信息,该限定信息可以是由对应的人员预先设定的限定信息,在一些实施例中,若无特殊说明,对应的限定信息,如预设的新药数值,最大额度,预设的时间点数量,均为事先自行设置的,也可以是临时设置并由数据获取节点获取并输入至对应的维度审核节点中,由于,该限定信息可能随着时间的变化也会发生变化,因此也可以进行更新,各个维度审核节点也可以保存对应的限定信息,从而实现了限定信息的获取或更新。
参照图2,本发明还提供了一种医疗数据审核装置,所述医疗数据审核装置基于区块链实现,所述区块链至少包括数据提取节点和多个维度审核节点,包括:
获取模块10,用于通过数据提取节点获取医保知识图谱中各个参保人员的多维参保数据;
聚类模块20,用于通过预设的聚类算法将各所述多维参保数据进行聚类处理,得到多个参保数据集;
计算模块30,用于在同一所述参保数据集中,计算每个参保人员与其他参保人员的欧式距离并求和,得到每个所述参保人员在所属的参保数据集中的离散值;
提取模块40,用于将所述离散值大于离散阈值的参保人员的目标多维参保数据进行提取;
发送模块50,用于将所述目标多维参保数据发送给各个所述维度审核节点,并通过各个所述维度审核节点进行审核;
接收模块60,用于接收各个所述维度审核节点的审核情况判定所述目标多维参保数据是否异常。
在一个实施例中,医疗数据审核装置,还包括:
多维参保数据获取模块,用于获取医保数据库中各个参保人员的多维参保数据;
知识图谱维度层建立模块,用于为所述多维参保数据中的每个维度建立对应的知识图谱维度层,并将各所述多维参保数据中对应的维度映射至各个所述知识图谱维度层中;
信息抽取模块,用于对各个所述知识图谱维度层进行信息抽取,得到各个所述知识图谱维度层的实体类型以及与其他知识图谱维度层的实体关系;
关系建立模块,用于基于所述实体类型和所述实体关系建立所述知识图谱维度层之间的关系,得到所述医保知识图谱。
在一个实施例中,聚类模块20,包括:
多维向量生成子模块,用于将各所述多维参保数据生成对应的多维向量X1,X2,…,Xi,…,Xn
随机选取子模块,用于在所述多维向量对应的多维空间中,随机选取k个聚类质心点Y1,Y2,…,Xj,…,Yk
相似度计算子模块,用于根据公式
Figure BDA0003240282930000141
计算各个所述多维向量与各个所述聚类质心点的相似度;
初步聚类子模块,用于根据所述相似度为各个多维向量选取相似度最大的初步聚类质心进行初步聚类;
平均值计算子模块,用于计算每个聚类质心点中所具有的多维向量中各个维度的平均值,并作为新的聚类质心点,并通过所述新的聚类质心点进行聚类并计算下一个聚类质心点,直至得到的目标聚类质心点达到第一预设条件;
参保数据集获取子模块,用于获取各个所述目标聚类质心点中所有的多维向量,从而得到多个参保数据集。
在一个实施例中,发送模块50,包括:
时间维度数据集获取子模块,用于通过所述高频取药审核节点获取所述目标多维参保数据中所述参保人员的取药时间点的时间维度数据集;
第一暂时中间点计算子模块,用于计算所述时间维度数据集的平均值,作为第一暂时中间点;
目标取药时间点采集子模块,用于采集距离所述第一暂时中间点预设时间长度范围内的目标取药时间点;
循环子模块,用于计算各所述第一暂时中间点对应的目标取药时间点的平均值,作为新的第一暂时中间点,并返回所述采集距离所述第一暂时中间点预设时间长度范围内的目标取药时间点的步骤,直至得到达到第二预设条件的第二暂时中间点;
时间点数量获取子模块,用于获取距离所述第二暂时中间点所述预设时间长度范围内对应的目标取药时间点的时间点数量;
时间点数量检测子模块,用于检测所述时间点数量是否达到了预设的时间点数量;
检测结果判定子模块,用于根据检测结果判定各所述目标多维参保数据是否在取药频率中是否异常。
在一个实施例中,发送模块50,包括:
取药金额获取子模块,用于通过所述额度取药审核节点获取所述目标多维参保数据中所述参保人员的每次取药金额;
最大取药金额获取子模块,用于从所述每次取药金额中获取数值最大的最大取药金额;
最大额度检测子模块,用于检测所述最大取药金额是否超过了其对应参保人员对应的最大额度;
取药金额判断子模块,用于根据检测结果判定各所述目标多维参保数据是否在取药金额中是否异常。
在一个实施例中,发送模块50,包括:
新药数量获取子模块,用于通过所述新药取药审核节点根据预设的新药数据库获取所述目标多维参保数据中所述参保人员的每次报销的新药数量;
最大新药数量获取子模块,用于从所述每次报销的新药数量中获取数量最多的最大新药数量;
最大新药数量检测子模块,用于检测所述最大新药数量是否超过了预设的新药数值;
新药数量判断子模块,用于根据检测结果判定各所述目标多维参保数据是否在新药数量的维度是否异常。
在一个实施例中,医疗数据审核装置,还包括:
慢病信息获取模块,用于从所述各个参保人员的目标多维参保数据中获取到各个参保人员的各种慢病信息;
限定信息获取模块,用于基于所述各种慢病信息获取各个慢病信息在各个维度的限定信息;
限定信息发送模块,用于将各个维度的限定信息对应发送给各个维度审核节点。
本发明的有益效果:通过数据提取节点获取各个参保人员的多维参保数据,进行聚类处理,得到多个参保数据集,计算离散值,并提取到目标多维参保数据,再将所述目标多维参保数据发送给各个所述维度审核节点进行审核,根据审核情况判定所述目标多维参保数据是否异常。从而实现了无需进行投入巨大的人力成本,即可完成对各个参保人员的自动化审核。另外,通过区块链可以实现多个审核节点共同审核的机制,可以实现对各个参保人员的多维度审核,提高了审核的全面性。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各种多维参保数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时可以实现上述任一实施例所述的医疗数据审核方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时可以实现上述任一实施例所述的医疗数据审核方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM一多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种医疗数据审核方法,其特征在于,所述医疗数据审核方法基于区块链实现,所述区块链至少包括数据提取节点和多个维度审核节点,所述方法包括:
通过数据提取节点获取医保知识图谱中各个参保人员的多维参保数据;
通过预设的聚类算法将各所述多维参保数据进行聚类处理,得到多个参保数据集;
在同一所述参保数据集中,计算每个参保人员与其他参保人员的欧式距离并求和,得到每个所述参保人员在所属的参保数据集中的离散值;
将所述离散值大于离散阈值的参保人员的目标多维参保数据进行提取;
将所述目标多维参保数据发送给各个所述维度审核节点,并通过各个所述维度审核节点进行审核;
接收各个所述维度审核节点的审核情况判定所述目标多维参保数据是否异常。
2.如权利要求1所述的医疗数据审核方法,其特征在于,所述通过数据提取节点获取医保知识图谱中各个参保人员的多维参保数据之前,还包括:
获取医保数据库中各个参保人员的多维参保数据;
为所述多维参保数据中的每个维度建立对应的知识图谱维度层,并将各所述多维参保数据中对应的维度映射至各个所述知识图谱维度层中;
对各个所述知识图谱维度层进行信息抽取,得到各个所述知识图谱维度层的实体类型以及与其他知识图谱维度层的实体关系;
基于所述实体类型和所述实体关系建立所述知识图谱维度层之间的关系,得到所述医保知识图谱。
3.如权利要求1所述的医疗数据审核方法,其特征在于,所述通过预设的聚类算法将各所述多维参保数据进行聚类处理,得到多个参保数据集包括:
将各所述多维参保数据生成对应的多维向量X1,X2,…,Xi,…,Xn
在所述多维向量对应的多维空间中,随机选取k个聚类质心点Y1,Y2,…,Xj,…,Yk
根据公式
Figure FDA0003240282920000021
计算各个所述多维向量与各个所述聚类质心点的相似度;
根据所述相似度为各个多维向量选取相似度最大的初步聚类质心进行初步聚类;
计算每个聚类质心点中所具有的多维向量中各个维度的平均值,并作为新的聚类质心点,并通过所述新的聚类质心点进行聚类并计算下一个聚类质心点,直至得到的目标聚类质心点达到第一预设条件;
获取各个所述目标聚类质心点中所有的多维向量,从而得到多个参保数据集。
4.如权利要求1所述的医疗数据审核方法,其特征在于,所述各个所述维度审核节点包括高频取药审核节点,所述通过各个所述维度审核节点进行审核包括:
通过所述高频取药审核节点获取所述目标多维参保数据中,所述参保人员的取药时间点的时间维度数据集;
计算所述时间维度数据集的平均值,作为第一暂时中间点;
采集距离所述第一暂时中间点预设时间长度范围内的目标取药时间点;
计算各所述第一暂时中间点对应的目标取药时间点的平均值,作为新的第一暂时中间点,并返回所述采集距离所述第一暂时中间点预设时间长度范围内的目标取药时间点的步骤,直至得到达到第二预设条件的第二暂时中间点;
获取距离所述第二暂时中间点所述预设时间长度范围内对应的目标取药时间点的时间点数量;
检测所述时间点数量是否达到了预设的时间点数量;
根据检测结果判定各所述目标多维参保数据是否在取药频率中是否异常。
5.如权利要求1所述的医疗数据审核方法,其特征在于,所述各个所述维度审核节点包括额度取药审核节点,所述通过各个所述维度审核节点进行审核包括:
通过所述额度取药审核节点获取所述目标多维参保数据中所述参保人员的每次取药金额;
从所述每次取药金额中获取数值最大的最大取药金额;
检测所述最大取药金额是否超过了其对应参保人员对应的最大额度;
根据检测结果判定各所述目标多维参保数据是否在取药金额中是否异常。
6.如权利要求1所述的医疗数据审核方法,其特征在于,所述各个所述维度审核节点包括新药取药审核节点,所述通过各个所述维度审核节点进行审核包括:
通过所述新药取药审核节点根据预设的新药数据库,获取所述目标多维参保数据中所述参保人员的每次报销的新药数量;
从所述每次报销的新药数量中获取数量最多的最大新药数量;
检测所述最大新药数量是否超过了预设的新药数值;
根据检测结果判定各所述目标多维参保数据是否在新药数量的维度是否异常。
7.如权利要求1所述的医疗数据审核方法,其特征在于,所述将所述目标多维参保数据发送给各个所述维度审核节点,并通过各个所述维度审核节点进行审核之前,还包括:
从所述各个参保人员的目标多维参保数据中获取到各个参保人员的各种慢病信息;
基于所述各种慢病信息获取各个慢病信息在各个维度的限定信息;
将各个维度的限定信息对应发送给各个维度审核节点。
8.一种医疗数据审核装置,所述医疗数据审核装置基于区块链实现,所述区块链至少包括数据提取节点和多个维度审核节点,其特征在于,包括:
获取模块,用于通过数据提取节点获取医保知识图谱中各个参保人员的多维参保数据;
聚类模块,用于通过预设的聚类算法将各所述多维参保数据进行聚类处理,得到多个参保数据集;
计算模块,用于在同一所述参保数据集中,计算每个参保人员与其他参保人员的欧式距离并求和,得到每个所述参保人员在所属的参保数据集中的离散值;
提取模块,用于将所述离散值大于离散阈值的参保人员的目标多维参保数据进行提取;
发送模块,用于将所述目标多维参保数据发送给各个所述维度审核节点,并通过各个所述维度审核节点进行审核;
接收模块,用于接收各个所述维度审核节点的审核情况判定所述目标多维参保数据是否异常。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202111016189.XA 2021-08-31 2021-08-31 医疗数据审核方法、装置、设备以及存储介质 Pending CN113657549A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111016189.XA CN113657549A (zh) 2021-08-31 2021-08-31 医疗数据审核方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111016189.XA CN113657549A (zh) 2021-08-31 2021-08-31 医疗数据审核方法、装置、设备以及存储介质

Publications (1)

Publication Number Publication Date
CN113657549A true CN113657549A (zh) 2021-11-16

Family

ID=78482597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111016189.XA Pending CN113657549A (zh) 2021-08-31 2021-08-31 医疗数据审核方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN113657549A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117877736A (zh) * 2024-03-12 2024-04-12 深圳市魔样科技有限公司 基于机器学习的智能戒指异常健康数据预警方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117877736A (zh) * 2024-03-12 2024-04-12 深圳市魔样科技有限公司 基于机器学习的智能戒指异常健康数据预警方法
CN117877736B (zh) * 2024-03-12 2024-05-24 深圳市魔样科技股份有限公司 基于机器学习的智能戒指异常健康数据预警方法

Similar Documents

Publication Publication Date Title
CN111897673A (zh) 运维故障根因识别方法、装置、计算机设备和存储介质
CN107657536A (zh) 社保欺诈行为的识别方法和装置
Azzini et al. A fuzzy approach to multimodal biometric continuous authentication
CN114283932B (zh) 医疗资源管理方法、装置、电子设备以及存储介质
CN112036749A (zh) 基于医疗数据识别风险用户的方法、装置和计算机设备
CN101872436A (zh) 多人同步指纹验证的方法
CN112949468A (zh) 人脸识别方法、装置、计算机设备和存储介质
CN110175697A (zh) 一种不良事件风险预测系统及方法
CN112950569A (zh) 黑色素瘤图像识别方法、装置、计算机设备及存储介质
CN113657549A (zh) 医疗数据审核方法、装置、设备以及存储介质
CN113742776A (zh) 基于生物识别技术的数据校验方法、装置和计算机设备
CN110197705A (zh) 一种基于云平台的临床数据服务系统及方法
CN113434310A (zh) 多线程任务分配方法、装置、设备及存储介质
CN112036497A (zh) 欺诈案件识别模型的训练方法、装置和计算机设备
CN111506710A (zh) 基于谣言预测模型的信息发送方法、装置和计算机设备
CN113986581A (zh) 数据聚合处理方法、装置、计算机设备和存储介质
CN112685012A (zh) 基于区块链的微服务架构实现方法、装置、设备及介质
CN111275059A (zh) 一种图像处理方法、装置和计算机可读存储介质
CN114416875A (zh) 基于区块链的任务处理方法、装置、设备以及存储介质
CN113643067A (zh) 基于人工智能的客户筛选方法、装置、设备及存储介质
CN112330402A (zh) 信息推荐方法、装置、计算机设备和存储介质
CN114399361A (zh) 业务请求的处理方法、装置、计算机设备和存储介质
CN112200738A (zh) 形状的突起识别方法、装置以及计算机设备
CN112035543A (zh) 药品用量数据的异常识别方法、装置和计算机设备
CN113946579A (zh) 基于模型的数据生成方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220525

Address after: 518000 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd.

Address before: Room 12G, Block H, 666 Beijing East Road, Huangpu District, Shanghai 200000

Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd.