CN112035543A - 药品用量数据的异常识别方法、装置和计算机设备 - Google Patents
药品用量数据的异常识别方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN112035543A CN112035543A CN202010889820.6A CN202010889820A CN112035543A CN 112035543 A CN112035543 A CN 112035543A CN 202010889820 A CN202010889820 A CN 202010889820A CN 112035543 A CN112035543 A CN 112035543A
- Authority
- CN
- China
- Prior art keywords
- quartile
- value
- data
- usage data
- medicine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003814 drug Substances 0.000 title claims abstract description 402
- 238000000034 method Methods 0.000 title claims abstract description 72
- 230000005856 abnormality Effects 0.000 title claims description 56
- 229940079593 drug Drugs 0.000 claims abstract description 158
- 230000002159 abnormal effect Effects 0.000 claims abstract description 122
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000004364 calculation method Methods 0.000 claims description 72
- 238000003745 diagnosis Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 25
- 230000006870 function Effects 0.000 description 8
- 238000007726 management method Methods 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 4
- 208000005189 Embolism Diseases 0.000 description 3
- 208000001435 Thromboembolism Diseases 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 3
- 238000012550 audit Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000007901 soft capsule Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012954 risk control Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Optimization (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Probability & Statistics with Applications (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Fuzzy Systems (AREA)
- Algebra (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请涉及智慧城市的数字医疗领域,提供药品用量数据的异常识别方法、装置和计算机设备,方法包括:从就诊明细数据提取药品用量数据,生成药品用量数据序列;计算药品用量数据序列的第一四分位数、第三四分位数及中位数;计算在药品用量数据序列的中位数两侧的任意两个药品用量数据对应的所有距离值;对所有距离值进行取中位数处理,生成指定数值;计算药品用量数据序列的第一加权极端值与第二加权极端值;获取指定药品用量数据;计算指定药品用量数据的异常程度值;根据第三四分位数及指定数值计算加权阈值;判断异常程度值是否大于加权阈值;若是,判定指定药品用量数据属于异常用量数据。本申请提高了药品用量数据的异常识别效率与准确性。
Description
技术领域
本申请涉及数字医疗领域,具体涉及一种药品用量数据的异常识别方法、装置和计算机设备。
背景技术
随着社会医疗服务的普及,越来越多的人使用医保享受一系列相关的医疗服务。
医保控费是一项关乎民生的社会责任型任务,如何将有限的医保费用用在尽可能合理的病患身上是一个民生难题。虽然社会医保制度日益完善,但是近年来却出现了许多医保诈骗事件,例如病患通过看诊得到多于合理剂量的药品并进行倒卖以赚取差价,这样会导致医保费用的不合理输出。现有的医保费用风险控制主要是通过规则制定,即根据指定的药品使用规范上的合理用量来计算病患用户的药品使用量是否超标或异常,医保局再根据对应的风险场景对疑似滥用病例进行筛查和审计,进而追回医保资金以保证其他病患的就医费用得以报销。然而,现有的识别病患用户的药品使用量是否存在异常的方法,需要花费大量的人工工作量,识别效率低,且通过基于人为设定的药品合理用量来进行药品使用量的异常识别,存在识别准确性低的问题。
发明内容
本申请的主要目的为提供一种药品用量数据的异常识别方法、装置、计算机设备和存储介质,旨在解决现有的识别病患用户的药品使用量是否存在异常的方法,需要花费大量的人工工作量,识别效率低,且通过基于人为设定的药品合理用量来进行药品使用量的异常识别,存在识别准确性低的技术问题。
本申请提出一种药品用量数据的异常识别方法,所述方法包括步骤:
按照预设的就诊项目分组维度,从预先获取的就诊明细数据中提取出与所述就诊项目分组维度对应的药品用量数据,并根据所述药品用量数据生成对应的药品用量数据序列;
计算所述药品用量数据序列的第一四分位数、第三四分位数以及中位数;
计算在所述药品用量数据序列的所述中位数一侧的每一个药品用量数据分别与在所述中位数另一侧的所有药品用量数据的距离值;
对所有所述距离值进行取中位数处理,生成对应的指定数值;
根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值;
获取指定药品用量数据,其中,所述指定药品用量数据为所述药品用量数据序列包括的所有药品用量数据中的任意一个药品用量数据;
基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值;
根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值;
判断所述异常程度值是否大于所述加权阈值;
若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据。
可选地,所述根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值的步骤,包括:
计算所述第三四分位数与所述第一四分位数之间的第一差值;
判断所述指定数值是否大于0;
若所述指定数值大于0,则根据所述第一差值、所述指定数值、所述第一四分位数以及所述第三四分位数,调用预设的第一计算公式计算出所述第一加权极端值;以及,
调用预设的第二计算公式计算出所述第二加权极端值。
可选地,所所述根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值的步骤,包括:
计算所述第三四分位数与所述第一四分位数之间的第二差值;
判断所述指定数值是否小于0;
若所述指定数值小于0,则根据所述第二差值、所述指定数值、所述第一四分位数以及所述第三四分位数,调用预设的第三计算公式计算出所述第一加权极端值;以及,
调用预设的第四计算公式计算出所述第二加权极端值。
可选地,所述基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值的步骤,包括:判断所述指定药品用量数据是否大于所述中位数;
若所述指定药品用量数据大于所述中位数,则根据所述指定药品用量数据、所述中位数以及所述第二加权极端值,调用预设的第五计算公式计算出所述异常程度值。
可选地,所述基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值的步骤,包括:判断所述指定药品用量数据是否小于所述中位数;
若所述指定药品用量数据小于所述中位数,则根据所述中位数、所述指定药品用量数据以及所述第一加权极端值,调用预设的第六计算公式计算出所述异常程度值。
可选地,所述根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值的步骤,包括:
计算所述第三四分位数与所述第一四分位数之间的第三差值;
根据所述第三四分位数、所述指定数值以及所述第三差值,调用预设的第七计算公式计算出与所述数据序列对应的所述加权阈值。
可选地,所述若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据的步骤之后,包括:
获取与所述异常用量数据对应的指定用户信息;
对所述指定用户信息添加风险标识。
本申请还提供一种药品用量数据的异常识别装置,包括:
提取模块,用于按照预设的就诊项目分组维度,从预先获取的就诊明细数据中提取出与所述就诊项目分组维度对应的药品用量数据,并根据所述药品用量数据生成对应的药品用量数据序列;
第一计算模块,用于计算所述药品用量数据序列的第一四分位数、第三四分位数以及中位数;
第二计算模块,用于计算在所述药品用量数据序列的所述中位数一侧的每一个药品用量数据分别与在所述中位数另一侧的所有药品用量数据的距离值;
生成模块,用于对所有所述距离值进行取中位数处理,生成对应的指定数值;
第三计算模块,用于根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值;
第一获取模块,用于获取指定药品用量数据,其中,所述指定药品用量数据为所述药品用量数据序列包括的所有药品用量数据中的任意一个药品用量数据;
第四计算模块,用于基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值;
第五计算模块,用于根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值;
判断模块,用于判断所述异常程度值是否大于所述加权阈值;
判定模块,用于若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本申请中提供的药品用量数据的异常识别方法、装置、计算机设备和存储介质,具有以下有益效果:
本申请中提供的药品用量数据的异常识别方法、装置、计算机设备和存储介质,与现有只根据药品使用规范上的合理用量来人工简单地判断病患用户的药品使用量是否异常的方式不同,本申请首先会按照预设的就诊项目分组维度从预先获取的就诊明细数据中提取出需要进行异常识别处理的药品用量数据,在获取到药品用量数据后,会再计算与所有药品用量数据相关的分位数数据以及距离数据,并会进一步采用一系列的与该分位数数据以及距离数据相关的计算公式计算出每一个药品用量数据的异常程度值,以及计算出与药品用量数据对应的加权阈值,进而通过将异常程度值与加权阈值进行比较,以根据比较结果来快速且准确地识别出所有药品用量数据中存在的异常用量数据,大大减少了人工的工作量,有效地提高了异常药品用量数据的识别效率与识别准确性。
附图说明
图1是本申请一实施例的药品用量数据的异常识别方法的流程示意图;
图2是本申请一实施例的药品用量数据的异常识别装置的结构示意图;
图3是本申请一实施例的计算机设备的结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用于解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本方案可应用于智慧城市中的数字医疗领域,从而推动智慧城市的建设。
参照图1,本申请一实施例的药品用量数据的异常识别方法,包括:
S1:按照预设的就诊项目分组维度,从预先获取的就诊明细数据中提取出与所述就诊项目分组维度对应的药品用量数据,并根据所述药品用量数据生成对应的药品用量数据序列;
S2:计算所述药品用量数据序列的第一四分位数、第三四分位数以及中位数;
S3:计算在所述药品用量数据序列的所述中位数一侧的每一个药品用量数据分别与在所述中位数另一侧的所有药品用量数据的距离值;
S4:对所有所述距离值进行取中位数处理,生成对应的指定数值;
S5:根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值;
S6:获取指定药品用量数据,其中,所述指定药品用量数据为所述药品用量数据序列包括的所有药品用量数据中的任意一个药品用量数据;
S7:基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值;
S8:根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值;
S9:判断所述异常程度值是否大于所述加权阈值;
S10:若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据。
如上述步骤S1至S10所述,本方法实施例的执行主体为一种药品用量数据的异常识别装置。在实际应用中,上述药品用量数据的异常识别装置可以通过虚拟装置,例如软件代码实现,也可以通过写入或集成有相关执行代码的实体装置实现,且可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。本实施例中的基于医疗数据识别风险用户的装置能够从药品用量数据中快速且精准地识别出异常用量数据,有效地提高了异常用量数据的识别效率与识别准确性。具体地,首先按照预设的就诊项目分组维度,从预先获取的就诊明细数据中提取出与上述就诊项目分组维度对应的药品用量数据,并根据上述药品用量数据生成对应的药品用量数据序列。其中,上述就诊项目分组维度是指与异常用量数据之间影响较小的数据维度,可包括患者分类维度、就诊画像及就诊项目的组合维度,例如可包括诊断编码、是否手术、是否与住院天数相关、项目名称、性别、年龄组等维度。可根据实际使用需求对就诊项目分组维度进行维度选择,如果就诊项目分组维度包括诊断编码、无手术、不与住院天数相关、项目名称:血塞通软胶囊、性别男、年龄组为50-60,则根据该就诊项目分组维度,会从就诊明细数据中只筛选出符合无手术、无住院、年龄为50-60的男性的分组维度的关于血塞通软胶囊的药品用量数据。通过利用上述就诊项目分组维度,可以对初始的所有药品用量数据中进行初步筛选,剔除掉一些会对异常数据造成较大影响的数据,而只筛选出相应的一部分具有实际考察意义的药品用量数据,有效地减少了后续的数据处理量,避免了无效功耗的产生,提高了处理效率。而且由于只需从就诊明细数据中筛选出与就诊项目分组维度相关的药品用量数据,便能根据该药品用量数据来精准地识别出人群中药品用量使用异常的行为,大大减少了对于数据质量的依赖。以及单纯从数据出发的方式来识别药品用量使用异常的行为的方式,无需对数据进行项目级别明细的标准化对码,简化了数据清理的流程,并降低了数据治理的周期。另外,上述药品用量数据序列可表示为Xn={x1,x2,...,xn},且可通过将上述药品用量数据序列中包含的所有药品用量数据按照数值由小到大的顺序排列得到该药品用量数据序列。然后计算上述药品用量数据序列的第一四分位数、第三四分位数以及中位数。其中,计算上述第一四分位数、第三四分位数以及中位数的计算过程可包括:四分位数(Quartile)是统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。上述第一四分位数,又称“较小四分位数”,等于上述药品用量数据序列中包含的所有药品用量数据按照数值由小到大排列后第25%的数字。上述第三四分位数,又称“较大四分位数”,等于上述药品用量数据序列中包含的所有药品用量数据按照数值由小到大排列后第75%的数字。上述中位数,又称“第二四分位数”,等于上述药品用量数据序列中包含的所有药品用量数据按照数值由小到大排列后第50%的数字。另外,上述中位数的计算方法为:把上述药品用量数据序列中包含的所有药品用量数据按照数值由小到大的顺序排列。如果数据的个数是奇数,则药品用量数据序列中间的那个数据就是药品用量数据序列的中位数;如果数据的个数是偶数,则中间那2个数据的算术平均值就是药品用量数据序列的中位数。在得到了上述中位数后,再计算在上述药品用量数据序列的上述中位数两侧的任意两个药品用量数据的距离值。其中,在上述中位数两侧的任意两个药品用量数据的距离值是指计算出:分别计算出在上述药品用量数据序列的中位数一侧的每一个药品用量数据与在上述中位数另一侧包括的所有药品用量数据的距离值。另外,上述中位数两侧的任意两个药品用量数据的距离值的计算过程可包括:通过公式来进行对于上述距离值的计算,其中,h(xi,xj)为药品用量数据序列的中位数两侧的药品用量数据xi与药品用量数据xj的距离值,med(Xn)为中位数,xj>med(Xn)>xi。在得到了上述距离值后,再对所有上述距离值进行取中位数处理,生成对应的指定数值。其中,上述对所有上述距离值进行取中位数处理是指求取出所有距离值的中位数,也即上述指定数值。上述指定数值的生成过程包括:可通过公式来计算出上述指定数值,其中,h(xi,xj)为药品用量数据序列的中位数两侧的药品用量数据Xi与药品用量数据Xj的距离值,xj>med(Xn)>xi,为对药品用量数据序列的中位数两侧的任意两个数据值的对应的所有距离值取中位数处理,MC(Xn)为上述指定数值,后续可将MC(Xn)可简称为MC,用于衡量的是药品用量数据序列的离散程度,药品用量数据序列的数据离散度越高,分布尾部值越密集,则MC(Xn)的值越高。之后根据上述指定数值、上述第一四分位数以及上述第三四分位数,计算出与上述药品用量数据序列对应的第一加权极端值以及第二加权极端值。其中,可采用与上述指定数值、上述第一四分位数以及上述第三四分位数相关的计算公式来计算出上述第一加权极端值与第二加权极端值。在得到了上述第一加权极端值以及第二加权极端值后,再获取指定药品用量数据,并基于上述指定药品用量数据与上述中位数的大小比较结果,调用与上述第一加权极端值相关的公式,或者调用与上述第二加权极端值相关的公式计算上述指定药品用量数据在上述药品用量数据序列中的异常程度值。其中,上述指定药品用量数据为上述药品用量数据序列包括的所有药品用量数据中的任意一个药品用量数据。以及根据上述第一四分位数、上述第三四分位数以及上述指定数值,计算出与上述药品用量数据序列对应的加权阈值。其中,可采用与上述第一四分位数、上述第三四分位数以及上述指定数值相关的计算公式来计算出上述加权阈值。最后在得到了上述加权阈值时,判断上述异常程度值是否大于上述加权阈值。如果判断出上述异常程度值大于上述加权阈值,则判定上述指定药品用量数据属于异常用量数据。而如果判断出上述异常程度值不大于上述加权阈值,则判定上述指定药品用量数据不属于异常用量数据。举例地,基于药品用量数据序列,如果当前需要考察是否属于异常用量数据的指定药品用量数据为x10,经过相应的计算公式计算得到与x10对应的异常程度值为1.4,以及经过相应的计算公式计算出药品用量数据序列Xn的加权阈值为0.93,由于存在异常程度值1.4大于加权阈值0.93的情况,表明x10对应的异常程度值超出了加权阈值的范围,则会直接判定指定药品用量数据x10为异常用量数据。本方案可应用于智慧城市中的数字医疗领域,从而推动智慧城市的建设。与现有只根据药品使用规范上的合理用量来人工简单地判断病患用户的药品使用量是否异常的方式不同,本实施例首先会按照预设的就诊项目分组维度从预先获取的就诊明细数据中提取出需要进行异常识别处理的药品用量数据,在获取到药品用量数据后,会再计算与所有药品用量数据相关的分位数数据以及距离数据,并会进一步采用一系列的与该分位数数据以及距离数据相关的计算公式计算出每一个药品用量数据的异常程度值,以及计算出与药品用量数据对应的加权阈值,进而通过将异常程度值与加权阈值进行比较,以根据比较结果来快速且准确地识别出所有药品用量数据中存在的异常用量数据,大大减少了人工的工作量,有效地提高了异常药品用量数据的识别效率与识别准确性。
进一步地,本申请一实施例中,上述根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值的步骤S5,包括:
S500:计算所述第三四分位数与所述第一四分位数之间的第一差值;
S501:判断所述指定数值是否大于0;
S502:若所述指定数值大于0,则根据所述第一差值、所述指定数值、所述第一四分位数以及所述第三四分位数,调用预设的第一计算公式计算出所述第一加权极端值;以及,
S503:调用预设的第二计算公式计算出所述第二加权极端值。
如上述步骤S500至S503所述,关于上述指定数值会存在其数值大于0或者数值小于0的两种情况,对于这两种情况会对应设置有两种不同的用于求取上述第一加权极端值与上述第二加权极端值的计算方式。具体地,上述根据上述指定数值、上述第一四分位数以及上述第三四分位数,计算出与上述药品用量数据序列对应的第一加权极端值以及第二加权极端值的步骤可包括:首先计算上述第三四分位数与上述第一四分位数之间的第一差值。其中,上述第三四分位数与上述第一四分位数之间的第一差值,具体是指上述第三四分位数减去上述第一四分位数得到的差值。可通过公式IQR=Q3-Q1计算出上述第一差值,IQR为上述上述第三四分位数与上述第一四分位数之间的差值,Q3为上述第三四分位数,Q1为上述第一四分位数。然后判断上述指定数值是否大于0。如果判断出上述指定数值大于0,则根据上述第一差值、上述指定数值、上述第一四分位数以及上述第三四分位数,调用预设的第一计算公式计算出上述第一加权极端值。以及调用预设的第二计算公式计算出上述第二加权极端值。其中,上述第一计算公式为:W1=Q1-1.5e-4MCIQR,W1为第一加权极端值,Q1为第一四分位数,IQR为第三四分位数减去第一四分位数得到的差值。另外。上述第二计算公式为:W2=Q3+1.5e3MCIQR,W2为第二加权极端值,Q3为第一四分位数,IQR为第三四分位数减去第一四分位数得到的差值。本实施例通过采用与上述指定数值、上述第一四分位数以及上述第三四分位数相关的计算公式来计算出上述第一加权极端值与第二加权极端值,有利于后续根据该第一加权极端值与第二加权极端值来快速地计算出指定药品用量数据在上述药品用量数据序列包含的所有用量数据中的异常程度值,进而根据该异常程度值与预设的加权阈值之间的大小比较结果来快速准确的判别出该指定药品用量数据是否属于异常用量数据,有效地提高了对于药品用量数据的异常识别效率及识别准确性。
进一步地,本申请一实施例中,上述根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值的步骤S5,包括:
S510:计算所述第三四分位数与所述第一四分位数之间的第二差值;
S511:判断所述指定数值是否小于0;
S512:若所述指定数值小于0,则根据所述第二差值、所述指定数值、所述第一四分位数以及所述第三四分位数,调用预设的第三计算公式计算出所述第一加权极端值;以及,
S513:调用预设的第四计算公式计算出所述第二加权极端值。
如上述步骤S510至S513所述,上述根据上述指定数值、上述第一四分位数以及上述第三四分位数,计算出与上述药品用量数据序列对应的第一加权极端值以及第二加权极端值的步骤,具体可包括:首先计算上述第三四分位数与上述第一四分位数之间的第二差值。其中,可通过公式IQR=Q3-Q1计算出上述第二差值,IQR为上述上述第三四分位数与上述第一四分位数之间的差值,Q3为上述第三四分位数,Q1为上述第一四分位数。然后判断上述指定数值是否小于0。如果判断出上述指定数值小于0,则根据上述第二差值、上述指定数值、上述第一四分位数以及上述第三四分位数,调用预设的第三计算公式计算出上述第一加权极端值。以及调用预设的第四计算公式计算出上述第二加权极端值。其中,上述第三计算公式为:W1=Q1-1.5e-3MCIQR,W1为第一加权极端值,Q1为第一四分位数,MC为指定数值,IQR为第三四分位数减去第一四分位数得到的差值。另外,上述第四计算公式为:W2=Q3+1.5e4MCIQR,W2为第二加权极端值,Q3为第三四分位数,MC为指定数值,IQR为第三四分位数减去第一四分位数得到的差值。本实施例通过采用与上述指定数值、上述第一四分位数以及上述第三四分位数相关的计算公式来计算出上述第一加权极端值与第二加权极端值,有利于后续根据该第一加权极端值与第二加权极端值来快速地计算出指定药品用量数据在上述药品用量数据序列包含的所有用量数据中的异常程度值,进而根据该异常程度值与预设的加权阈值之间的大小比较结果来快速准确的判别出该指定药品用量数据是否属于异常用量数据,有效地提高了对于药品用量数据的异常识别效率及识别准确性。
进一步地,本申请一实施例中,上述基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值的步骤S7,包括:
S700:判断所述指定药品用量数据是否大于所述中位数;
S701:若所述指定药品用量数据大于所述中位数,则根据所述指定药品用量数据、所述中位数以及所述第二加权极端值,调用预设的第五计算公式计算出所述异常程度值。
如上述步骤S700至S701所述,关于上述指定用量数据会存在其数值大于上述述药品用量数据序列的中位数或者小于该中位数的两种情况,对于这两种情况会对应设置有两种不同的用于求取上述异常程度值的计算方式。具体地,上述基于上述指定药品用量数据与上述中位数的大小比较结果,调用与上述第一加权极端值相关的公式,或者调用与上述第二加权极端值相关的公式计算上述指定药品用量数据在上述药品用量数据序列中的异常程度值的步骤可包括:首先判断上述指定药品用量数据是否大于上述中位数。如果判断出上述指定药品用量数据大于上述中位数,则根据上述指定药品用量数据、上述中位数以及上述第二加权极端值,调用预设的第五计算公式来计算出指定药品用量数据在上述药品用量数据序列中的异常程度值。其中,当上述指定药品用量数据大于上述药品用量数据序列的中位数时,会相应调用预设的第五计算公式来计算上述异常程度值。上述第五计算公式为:AOi为异常程度值,xa为指定药品用量数据,med(Xn)为药品用量数据序列的中位数,W2为第二加权极端值。本实施例通过采用与上述指定药品用量数据、上述中位数以及上述第二加权极端值相关的计算公式来计算出上述异常程度值,有利于后续能够根据该异常程度值与预设的加权阈值之间的大小比较结果来快速准确的判别出该指定药品用量数据是否属于异常用量数据,有效地提高了对于药品用量数据的异常识别效率及识别准确性。
进一步地,本申请一实施例中,上述基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值的步骤S7,包括:
S710:判断所述指定药品用量数据是否小于所述中位数;
S711:若所述指定药品用量数据小于所述中位数,则根据所述中位数、所述指定药品用量数据以及所述第一加权极端值,调用预设的第六计算公式计算出所述异常程度值。
如上述步骤S710至S711所述,上述基于上述指定药品用量数据与上述中位数的大小比较结果,调用与上述第一加权极端值相关的公式,或者调用与上述第二加权极端值相关的公式计算上述指定药品用量数据在上述药品用量数据序列中的异常程度值的步骤,具体可包括:首先判断上述指定药品用量数据是否小于上述中位数。如果判断出上述指定药品用量数据小于上述中位数,则根据上述中位数、上述指定药品用量数据以及上述第一加权极端值,调用预设的第六计算公式计算出上述异常程度值。其中,当上述指定药品用量数据小于上述药品用量数据序列的中位数时,会相应调用预设的第六计算公式来计算出指定药品用量数据在上述药品用量数据序列中的异常程度值。上述第六计算公式为:AOi为异常程度值,xa为指定药品用量数据,med(Xn)为药品用量数据序列的中位数,W1为第一加权极端值。本实施例通过采用与上述指定药品用量数据、上述中位数以及上述第一加权极端值相关的计算公式来计算出上述异常程度值,有利于后续能够根据该异常程度值与预设的加权阈值之间的大小比较结果来快速准确的判别出该指定药品用量数据是否属于异常用量数据,有效地提高了对于药品用量数据的异常识别效率及识别准确性。
进一步地,本申请一实施例中,上述根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值的步骤,包括:
S800:计算所述第三四分位数与所述第一四分位数之间的第三差值;
S801:根据所述第三四分位数、所述指定数值以及所述第三差值,调用预设的第七计算公式计算出与所述数据序列对应的所述加权阈值。
如上述步骤S800至S801所述,上述根据上述第一四分位数、上述第三四分位数以及上述指定数值,计算出与上述药品用量数据序列对应的加权阈值的步骤,具体可包括:首先计算上述第三四分位数与上述第一四分位数之间的第三差值。其中,可通过公式IQR=Q3-Q1计算出上述第三差值,IQR为上述上述第三四分位数与上述第一四分位数之间的差值,Q3为上述第三四分位数,Q1为上述第一四分位数。然后根据上述第三四分位数、上述指定数值以及上述第三差值,调用预设的第七计算公式计算出与上述数据序列对应的上述加权阈值。其中,上述第七计算公式为:cutoff=Q3+1.5e3MCIQR,cutoff为加权阈值,Q3为第三四分位数,MC为指定数值,IQR为第三四分位数与第一四分位数之间的差值。本实施例通过采用与上述第三四分位数、上述指定数值以及上述第三差值相关的计算公式来计算出上述加权阈值,有利于后续能够根据上述异常程度值与该加权阈值之间的大小比较结果来快速准确的判别出该指定药品用量数据是否属于异常用量数据,有效地提高了对于药品用量数据的异常识别效率及识别准确性。
进一步地,本申请一实施例中,上述若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据的步骤S10之后,包括:
S11:获取与所述异常用量数据对应的指定用户信息;
S12:对所述指定用户信息添加风险标识。
如上述步骤S11至S12所述,在识别出上述指定药品用量数据属于异常用量数据,后续还可以对与该异常用量数据对应的指定用户信息进行风险标识处理。具体地,上述若上述异常程度值大于上述加权阈值,则判定上述指定药品用量数据属于异常用量数据的步骤之后,还可包括:获取与上述异常用量数据对应的指定用户信息。在得到了上述指定用户信息后,再对上述指定用户信息添加风险标识。本实施例在识别出上述指定用量数据为异常用量数据后,通过对该异常用量数据对应的指定用户信息添加风险标识,以便后续能够智能地对于存在药品用量数据异常的风险用户进行监控处理,进而减少医保基金的违法输出,实现医保基金费用的合理控制。
本申请实施例中的药品用量数据的异常识别方法还可以应用于区块链领域,如将上述加权阈值等数据存储于区块链上。通过使用区块链来对上述加权阈值进行存储和管理,能够有效地保证上述加权阈值的安全性与不可篡改性。
上述区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
参照图2,本申请一实施例中还提供了一种药品用量数据的异常识别装置,包括:
提取模块1,用于按照预设的就诊项目分组维度,从预先获取的就诊明细数据中提取出与所述就诊项目分组维度对应的药品用量数据,并根据所述药品用量数据生成对应的药品用量数据序列;
第一计算模块2,用于计算所述药品用量数据序列的第一四分位数、第三四分位数以及中位数;
第二计算模块3,用于计算在所述药品用量数据序列的所述中位数一侧的每一个药品用量数据分别与在所述中位数另一侧的所有药品用量数据的距离值;
生成模块4,用于对所有所述距离值进行取中位数处理,生成对应的指定数值;
第三计算模块5,用于根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值;
第一获取模块6,用于获取指定药品用量数据,其中,所述指定药品用量数据为所述药品用量数据序列包括的所有药品用量数据中的任意一个药品用量数据;
第四计算模块7,用于基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值;
第五计算模块8,用于根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值;
判断模块9,用于判断所述异常程度值是否大于所述加权阈值;
判定模块10,用于若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据。
本实施例中,上述药品用量数据的异常识别装置中的提取模块、第一计算模块、第二计算模块、生成模块、第三计算模块、第一获取模块、第四计算模块、第五计算模块、判断模块与判定模块的功能和作用的实现过程具体详见上述药品用量数据的异常识别方法中对应步骤S1至S10的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第三计算模块,包括:
第一计算单元,用于计算所述第三四分位数与所述第一四分位数之间的第一差值;
第一判断单元,用于判断所述指定数值是否大于0;
第二计算单元,用于若所述指定数值大于0,则根据所述第一差值、所述指定数值、所述第一四分位数以及所述第三四分位数,调用预设的第一计算公式计算出所述第一加权极端值;以及,
第三计算单元,用于调用预设的第二计算公式计算出所述第二加权极端值。
本实施例中,上述药品用量数据的异常识别装置中的第一计算单元、第一判断单元、第二计算单元与第三计算单元的功能和作用的实现过程具体详见上述药品用量数据的异常识别方法中对应步骤S500至S503的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第三计算模块,包括:
第四计算单元,用于计算所述第三四分位数与所述第一四分位数之间的第二差值;
第二判断单元,用于判断所述指定数值是否小于0;
第五计算单元,用于若所述指定数值小于0,则根据所述第二差值、所述指定数值、所述第一四分位数以及所述第三四分位数,调用预设的第三计算公式计算出所述第一加权极端值;以及,
第六计算单元,用于调用预设的第四计算公式计算出所述第二加权极端值。
本实施例中,上述药品用量数据的异常识别装置中的第四计算单元、第一判断单元、第五计算单元与第六计算单元的功能和作用的实现过程具体详见上述药品用量数据的异常识别方法中对应步骤S510至S513的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第四计算模块,包括:
第三判断单元,用于判断所述指定药品用量数据是否大于所述中位数;
第七计算单元,用于若所述指定药品用量数据大于所述中位数,则根据所述指定药品用量数据、所述中位数以及所述第二加权极端值,调用预设的第五计算公式计算出所述异常程度值。
本实施例中,上述药品用量数据的异常识别装置中的第三判断单元与第七计算单元的功能和作用的实现过程具体详见上述药品用量数据的异常识别方法中对应步骤S700至S701的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第四计算模块,包括:
第四判断单元,用于判断所述指定药品用量数据是否小于所述中位数;
第八计算单元,用于若所述指定药品用量数据小于所述中位数,则根据所述中位数、所述指定药品用量数据以及所述第一加权极端值,调用预设的第六计算公式计算出所述异常程度值。
本实施例中,上述药品用量数据的异常识别装置中的第四判断单元与第八计算单元的功能和作用的实现过程具体详见上述药品用量数据的异常识别方法中对应步骤S710至S711的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第五计算模块,包括:
第九计算单元,用于计算所述第三四分位数与所述第一四分位数之间的第三差值;
第十计算单元,用于根据所述第三四分位数、所述指定数值以及所述第三差值,调用预设的第七计算公式计算出与所述数据序列对应的所述加权阈值。
本实施例中,上述药品用量数据的异常识别装置中的第九计算单元与第十计算单元的功能和作用的实现过程具体详见上述药品用量数据的异常识别方法中对应步骤S800至S801的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述药品用量数据的异常识别装置,还包括:
第二获取模块,用于获取与所述异常用量数据对应的指定用户信息;
添加模块,用于对所述指定用户信息添加风险标识。
本实施例中,上述药品用量数据的异常识别装置中的第二获取模块与添加模块的功能和作用的实现过程具体详见上述药品用量数据的异常识别方法中对应步骤S11至S12的实现过程,在此不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、输入装置和数据库。其中,该计算机设备设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储药品用量数据、药品用量数据序列、指定数值、第一加权极端值、第二加权极端值、异常程度值以及加权阈值等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示屏是计算机中必不可少的一种图文输出设备,用于将数字信号转换为光信号,使文字与图形在显示屏的屏幕上显示出来。该计算机设备的输入装置是计算机与用户或其他设备之间进行信息交换的主要装置,用于把数据、指令及某些标志信息等输送到计算机中去。该计算机程序被处理器执行时以实现一种药品用量数据的异常识别方法。
上述处理器执行上述药品用量数据的异常识别方法的步骤:
按照预设的就诊项目分组维度,从预先获取的就诊明细数据中提取出与所述就诊项目分组维度对应的药品用量数据,并根据所述药品用量数据生成对应的药品用量数据序列;
计算所述药品用量数据序列的第一四分位数、第三四分位数以及中位数;
计算在所述药品用量数据序列的所述中位数一侧的每一个药品用量数据分别与在所述中位数另一侧的所有药品用量数据的距离值;
对所有所述距离值进行取中位数处理,生成对应的指定数值;
根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值;
获取指定药品用量数据,其中,所述指定药品用量数据为所述药品用量数据序列包括的所有药品用量数据中的任意一个药品用量数据;
基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值;
根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值;
判断所述异常程度值是否大于所述加权阈值;
若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的装置、计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种药品用量数据的异常识别方法,具体为:
按照预设的就诊项目分组维度,从预先获取的就诊明细数据中提取出与所述就诊项目分组维度对应的药品用量数据,并根据所述药品用量数据生成对应的药品用量数据序列;
计算所述药品用量数据序列的第一四分位数、第三四分位数以及中位数;
计算在所述药品用量数据序列的所述中位数一侧的每一个药品用量数据分别与在所述中位数另一侧的所有药品用量数据的距离值;
对所有所述距离值进行取中位数处理,生成对应的指定数值;
根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值;
获取指定药品用量数据,其中,所述指定药品用量数据为所述药品用量数据序列包括的所有药品用量数据中的任意一个药品用量数据;
基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值;
根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值;
判断所述异常程度值是否大于所述加权阈值;
若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据。
综上所述,本申请实施例中提供的药品用量数据的异常识别方法、装置、计算机设备和存储介质,按照预设的就诊项目分组维度,从预先获取的就诊明细数据中提取出与所述就诊项目分组维度对应的药品用量数据,并根据所述药品用量数据生成对应的药品用量数据序列;计算所述药品用量数据序列的第一四分位数、第三四分位数以及中位数;计算在所述药品用量数据序列的所述中位数一侧的每一个药品用量数据分别与在所述中位数另一侧的所有药品用量数据的距离值;对所有所述距离值进行取中位数处理,生成对应的指定数值;根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值;获取指定药品用量数据,其中,所述指定药品用量数据为所述药品用量数据序列包括的所有药品用量数据中的任意一个药品用量数据;基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值;根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值;判断所述异常程度值是否大于所述加权阈值;若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据。本方案可应用于智慧城市中的数字医疗领域,从而推动智慧城市的建设。与现有只根据药品使用规范上的合理用量来人工简单地判断病患用户的药品使用量是否异常的方式不同,本申请实施例首先会按照预设的就诊项目分组维度从预先获取的就诊明细数据中提取出需要进行异常识别处理的药品用量数据,在获取到药品用量数据后,会再计算与所有药品用量数据相关的分位数数据以及距离数据,并会进一步采用一系列的与该分位数数据以及距离数据相关的计算公式计算出每一个药品用量数据的异常程度值,以及计算出与药品用量数据对应的加权阈值,进而通过将异常程度值与加权阈值进行比较,以根据比较结果来快速且准确地识别出所有药品用量数据中存在的异常用量数据,大大减少了人工的工作量,有效地提高了异常药品用量数据的识别效率与识别准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种药品用量数据的异常识别方法,其特征在于,包括:
按照预设的就诊项目分组维度,从预先获取的就诊明细数据中提取出与所述就诊项目分组维度对应的药品用量数据,并根据所述药品用量数据生成对应的药品用量数据序列;
计算所述药品用量数据序列的第一四分位数、第三四分位数以及中位数;
计算在所述药品用量数据序列的所述中位数一侧的每一个药品用量数据分别与在所述中位数另一侧的所有药品用量数据的距离值;
对所有所述距离值进行取中位数处理,生成对应的指定数值;
根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值;
获取指定药品用量数据,其中,所述指定药品用量数据为所述药品用量数据序列包括的所有药品用量数据中的任意一个药品用量数据;
基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值;
根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值;
判断所述异常程度值是否大于所述加权阈值;
若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据。
2.根据权利要求1所述的药品用量数据的异常识别方法,其特征在于,所述根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值的步骤,包括:
计算所述第三四分位数与所述第一四分位数之间的第一差值;
判断所述指定数值是否大于0;
若所述指定数值大于0,则根据所述第一差值、所述指定数值、所述第一四分位数以及所述第三四分位数,调用预设的第一计算公式计算出所述第一加权极端值;以及,
调用预设的第二计算公式计算出所述第二加权极端值。
3.根据权利要求1所述的药品用量数据的异常识别方法,其特征在于,所所述根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值的步骤,包括:
计算所述第三四分位数与所述第一四分位数之间的第二差值;
判断所述指定数值是否小于0;
若所述指定数值小于0,则根据所述第二差值、所述指定数值、所述第一四分位数以及所述第三四分位数,调用预设的第三计算公式计算出所述第一加权极端值;以及,
调用预设的第四计算公式计算出所述第二加权极端值。
4.根据权利要求1所述的药品用量数据的异常识别方法,其特征在于,所述基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值的步骤,包括:
判断所述指定药品用量数据是否大于所述中位数;
若所述指定药品用量数据大于所述中位数,则根据所述指定药品用量数据、所述中位数以及所述第二加权极端值,调用预设的第五计算公式计算出所述异常程度值。
5.根据权利要求1所述的药品用量数据的异常识别方法,其特征在于,所述基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值的步骤,包括:
判断所述指定药品用量数据是否小于所述中位数;
若所述指定药品用量数据小于所述中位数,则根据所述中位数、所述指定药品用量数据以及所述第一加权极端值,调用预设的第六计算公式计算出所述异常程度值。
6.根据权利要求1所述的药品用量数据的异常识别方法,其特征在于,所述根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值的步骤,包括:
计算所述第三四分位数与所述第一四分位数之间的第三差值;
根据所述第三四分位数、所述指定数值以及所述第三差值,调用预设的第七计算公式计算出与所述数据序列对应的所述加权阈值。
7.根据权利要求1所述的药品用量数据的异常识别方法,其特征在于,所述若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据的步骤之后,包括:
获取与所述异常用量数据对应的指定用户信息;
对所述指定用户信息添加风险标识。
8.一种药品用量数据的异常识别装置,其特征在于,包括:
提取模块,用于按照预设的就诊项目分组维度,从预先获取的就诊明细数据中提取出与所述就诊项目分组维度对应的药品用量数据,并根据所述药品用量数据生成对应的药品用量数据序列;
第一计算模块,用于计算所述药品用量数据序列的第一四分位数、第三四分位数以及中位数;
第二计算模块,用于计算在所述药品用量数据序列的所述中位数一侧的每一个药品用量数据分别与在所述中位数另一侧的所有药品用量数据的距离值;
生成模块,用于对所有所述距离值进行取中位数处理,生成对应的指定数值;
第三计算模块,用于根据所述指定数值、所述第一四分位数以及所述第三四分位数,计算出与所述药品用量数据序列对应的第一加权极端值以及第二加权极端值;
第一获取模块,用于获取指定药品用量数据,其中,所述指定药品用量数据为所述药品用量数据序列包括的所有药品用量数据中的任意一个药品用量数据;
第四计算模块,用于基于所述指定药品用量数据与所述中位数的大小比较结果,调用与所述第一加权极端值相关的公式,或者调用与所述第二加权极端值相关的公式计算所述指定药品用量数据在所述药品用量数据序列中的异常程度值;
第五计算模块,用于根据所述第一四分位数、所述第三四分位数以及所述指定数值,计算出与所述药品用量数据序列对应的加权阈值;
判断模块,用于判断所述异常程度值是否大于所述加权阈值;
判定模块,用于若所述异常程度值大于所述加权阈值,则判定所述指定药品用量数据属于异常用量数据。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010889820.6A CN112035543A (zh) | 2020-08-28 | 2020-08-28 | 药品用量数据的异常识别方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010889820.6A CN112035543A (zh) | 2020-08-28 | 2020-08-28 | 药品用量数据的异常识别方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112035543A true CN112035543A (zh) | 2020-12-04 |
Family
ID=73587117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010889820.6A Pending CN112035543A (zh) | 2020-08-28 | 2020-08-28 | 药品用量数据的异常识别方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112035543A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112768062A (zh) * | 2021-01-26 | 2021-05-07 | 武汉大学 | 提高医疗数值型数据矫正效率的方法、系统及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636635A (zh) * | 2018-12-13 | 2019-04-16 | 平安医疗健康管理股份有限公司 | 违规开药的识别方法、装置、终端及计算机可读存储介质 |
CN110781222A (zh) * | 2019-10-14 | 2020-02-11 | 平安医疗健康管理股份有限公司 | 异常医保申请检测方法、装置、计算机设备和存储介质 |
CN111242459A (zh) * | 2020-01-07 | 2020-06-05 | 中国南方电网有限责任公司 | 全网设备参数异常值辨识方法及系统 |
WO2020119403A1 (zh) * | 2018-12-13 | 2020-06-18 | 平安医疗健康管理股份有限公司 | 住院数据异常检测方法、装置、设备及可读存储介质 |
-
2020
- 2020-08-28 CN CN202010889820.6A patent/CN112035543A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636635A (zh) * | 2018-12-13 | 2019-04-16 | 平安医疗健康管理股份有限公司 | 违规开药的识别方法、装置、终端及计算机可读存储介质 |
WO2020119403A1 (zh) * | 2018-12-13 | 2020-06-18 | 平安医疗健康管理股份有限公司 | 住院数据异常检测方法、装置、设备及可读存储介质 |
CN110781222A (zh) * | 2019-10-14 | 2020-02-11 | 平安医疗健康管理股份有限公司 | 异常医保申请检测方法、装置、计算机设备和存储介质 |
CN111242459A (zh) * | 2020-01-07 | 2020-06-05 | 中国南方电网有限责任公司 | 全网设备参数异常值辨识方法及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112768062A (zh) * | 2021-01-26 | 2021-05-07 | 武汉大学 | 提高医疗数值型数据矫正效率的方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020034873A1 (zh) | 数据标准化处理方法、装置、计算机设备和存储介质 | |
CN112329865B (zh) | 基于自编码器的数据异常识别方法、装置和计算机设备 | |
CN109993233B (zh) | 基于机器学习来预测数据审核目标的方法及系统 | |
CN112528259A (zh) | 身份验证方法、装置、计算机设备和存储介质 | |
CN104134092A (zh) | 一种医保报销行为监控系统及监控方法 | |
CN112464117A (zh) | 请求处理方法、装置、计算机设备和存储介质 | |
CN112036749A (zh) | 基于医疗数据识别风险用户的方法、装置和计算机设备 | |
US20220351284A1 (en) | System and method for the rapid, flexible approval and disbursement of a loan | |
CN110729028A (zh) | 一种健康数据处理方法、装置、电子设备及存储介质 | |
WO2022141883A1 (zh) | 企业营收趋势的预测方法、装置、计算机设备及存储介质 | |
CN112637282B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN112668041A (zh) | 单证文件的生成方法、装置、计算机设备和存储介质 | |
CN111883251A (zh) | 医疗误诊检测方法、装置、电子设备及存储介质 | |
CN110598478A (zh) | 基于区块链的证据校验方法、装置、设备和存储介质 | |
CN113742776A (zh) | 基于生物识别技术的数据校验方法、装置和计算机设备 | |
CN112035543A (zh) | 药品用量数据的异常识别方法、装置和计算机设备 | |
CN113051372B (zh) | 材料数据的处理方法、装置、计算机设备和存储介质 | |
CN113986581A (zh) | 数据聚合处理方法、装置、计算机设备和存储介质 | |
CN112965981A (zh) | 数据核对方法、装置、计算机设备和存储介质 | |
CN112966787B (zh) | 相似患者的识别方法、装置、计算机设备和存储介质 | |
CN113177396B (zh) | 报表生成方法、装置、计算机设备和存储介质 | |
CN113535260B (zh) | 基于模拟器的数据处理方法、装置、设备及存储介质 | |
CN112650659B (zh) | 埋点设置方法、装置、计算机设备和存储介质 | |
CN113420307B (zh) | 密文数据的评估方法、装置、计算机设备和存储介质 | |
CN113191146B (zh) | 诉求数据的分配方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220601 Address after: 518000 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd. Address before: Room 12G, Block H, 666 Beijing East Road, Huangpu District, Shanghai 200000 Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd. |