CN108962342A - 一种同质人群筛选方法与装置 - Google Patents

一种同质人群筛选方法与装置 Download PDF

Info

Publication number
CN108962342A
CN108962342A CN201810615269.9A CN201810615269A CN108962342A CN 108962342 A CN108962342 A CN 108962342A CN 201810615269 A CN201810615269 A CN 201810615269A CN 108962342 A CN108962342 A CN 108962342A
Authority
CN
China
Prior art keywords
homogeneity
crowd
information
medical
data information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810615269.9A
Other languages
English (en)
Inventor
詹开明
吴钒
吴治中
祝明洲
董代宇
郭炫志
于静
尹波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Xing Zheng E-Government Operations Services Ltd
SICHUAN JIUYUAN YINHAI SOFTWARE CO Ltd
Original Assignee
Chengdu Xing Zheng E-Government Operations Services Ltd
SICHUAN JIUYUAN YINHAI SOFTWARE CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Xing Zheng E-Government Operations Services Ltd, SICHUAN JIUYUAN YINHAI SOFTWARE CO Ltd filed Critical Chengdu Xing Zheng E-Government Operations Services Ltd
Priority to CN201810615269.9A priority Critical patent/CN108962342A/zh
Publication of CN108962342A publication Critical patent/CN108962342A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例提出一种同质人群筛选方法与装置,涉及医疗技术领域。通过获取预设区域内的所有患者的就诊数据信息,然后对所述就诊数据信息按预设定模型算法进行处理,以筛选出同质人群患者。本发明提供的同质人群筛选方法与装置具有高效、实用以及精确的优点。

Description

一种同质人群筛选方法与装置
技术领域
本发明涉及医疗技术领域,具体而言,涉及一种同质人群筛选 方法与装置。
背景技术
医疗领域一直是人们重点关注的领域,自从国家医保政策实施 以来,实现了人们看病易且看病更加便宜的效果。并且,目前为方 便人们看病,我国医院的数量还在不断增长中。
但是,随着医保政策实施以来,也可能存在伪造报销记录的行 为,相关的审查人员也可能由于报销人数众多等原因没有发现这一 行为。
有鉴于此,如何改善上述问题,是本领域技术人员关注的重点。
发明内容
有鉴于此,本发明的目的在于提供一种同质人群筛选方法,以 解决现有技术中存在伪造报销记录,而相关审查人员由于报销人数 众多等客观原因无法发现的问题。
本发明的另一目的在于提供一种同质人群筛选装置,以解决现 有技术中存在伪造报销记录,而相关审查人员由于报销人数众多等 客观原因无法发现的问题。
为了实现上述目的,本发明实施例采用的技术方案如下:
一方面,本发明实施例提出了一种同质人群筛选方法,所述同 质人群筛选方法包括:
获取预设区域内的所有患者的就诊数据信息,其中,所述就诊 数据信息包括就诊时间、就诊地点、就诊费用以及报销单位信息中 的至少一项信息;
对所述就诊数据信息按预设定模型算法进行处理,以筛选出 信息多次相同的同质人群患者。
另一方面,本发明实施例还提供了一种同质人群筛选装置,所 述同质人群筛选装置包括:
信息获取单元,用于获取预设区域内的所有患者的就诊数据信 息,其中,所述就诊数据信息包括就诊时间、就诊地点、就诊费用 以及报销单位信息中的至少一项信息;
信息处理单元,用于对所述就诊数据信息按预设定模型算法进 行处理,,以筛选出信息多次相同的同质人群患者。
相对现有技术,本发明具有以下有益效果:
本发明提供了一种同质人群筛选方法与装置,通过获取预设区 域内的所有患者的就诊数据信息,然后对所述就诊数据信息按预设 定模型算法进行处理,以筛选出同质人群患者。本发明提供的同质 人群筛选方法与装置能够通过所有患者的数据进行筛选,一方面, 由于该同质人群筛选方法与装置能够筛选出同质人群患者,所以能 够方便审查人员进行审查,有效找出存在伪造报销记录的信息,更 加高效且实用。另一方面,由于该同质人群筛选方法与装置获取的 数据信息为预设区域内的所有患者的信息,数据充足,所以处理更 加精确。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举 较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例 中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了 本发明的某些实施例,因此不应被看作是对范围的限定,对于本领 域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据 这些附图获得其他相关的附图。
图1示出了本发明的实施例提供的服务器的功能模块示意图。
图2示出了本发明的实施例提供的同质人群筛选方法的流程 图。
图3示出了图2中步骤S103的子步骤的流程图。
图4示出了图2中步骤S107的子步骤的流程图。
图5示出了本发明的施例提供的同质人群筛选装置的模块示意 图。
图6示出了本发明的施例提供的同质人群表生成单元的模块示 意图。
图标:10-服务器;12-存储器;13-存储控制器;14-处理器;100- 同质人群筛选装置;110-信息获取单元;120-信息剔除单元;130- 信息处理单元;140-判断单元;150-同质人群表生成单元;151-信 息标记模块;152-赋值模块;153-排序模块;154-重要值定义模块; 155-同质人群表生成模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结 合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、 完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是 全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件 可以以各种不同的配置来布置和设计。
下面将结合本发明实施例中附图,对本发明实施例中的技术方 案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一 部分实施例,而不是全部的实施例。通常在此处附图中描述和示出 的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限 制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。 基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前 提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此, 一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行 进一步定义和解释。同时,在本发明的描述中,还需要说明的是,除 非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例 如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是 机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介 间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员 而言,可以具体情况理解上述术语在本发明中的具体含义。下面结合 附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下 述的实施例及实施例中的特征可以相互组合。
如图1所示,是本发明提供的服务器10的功能模块示意图。 该服务器10包括如图1所示,是本发明提供的服务器10的功能模 块示意图。该服务器10包括同质人群筛选装置100、存储器12、 存储控制器13以及处理器14。
所述存储器12、存储控制器13以及处理器14各元件相互之间 直接或间接地电性连接,以实现数据的传输或交互。例如,这些元 件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所 述同质人群筛选装置100包括至少一个可以软件或固件(firmware) 的形式存储于所述存储器12中或固化在所述服务器10的操作系统(operating system,OS)中的软件功能模块。所述处理器14用于 执行存储器12中存储的可执行模块,例如所述同质人群筛选装置 100包括的软件功能模块或计算机程序。
其中,存储器12可以是,但不限于,随机存取存储器12 (Random Access Memory,RAM),只读存储器12(Read Only Memory,ROM),可编程只读存储器12(Programmable Read-Only Memory,PROM),可擦除只读存储器12(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器12(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中, 存储器12用于存储程序,所述处理器14在接收到执行指令后,执 行所述程序,前述本发明实施例任一实施例揭示的流过程定义的服 务器10所执行的方法可以应用于处理器14中,或者由处理器14 实现。
处理器14可能是一种集成电路芯片,具有信号的处理能力。 上述的处理器14可以是通用处理器14,包括中央处理器 14(Central Processing Unit,简称CPU)、网络处理器14(Network Processor,简称NP)等;还可以是数字信号处理器 14(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其 他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。 可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器14可以是微处理器14或者该处理器14也可以是 任何常规的处理器14等。
请参阅图2,是本发明较佳实施例提供的应用于图1所示的同 质人群筛选方法的流程图。下面将对图2所示的具体流程进行详细 阐述。
步骤S101,获取预设区域内的所有患者的就诊数据信息。
在本实施例中,由于需要筛选出同质人群患者,所以需要获取 一定区域范围内的所有患者的额就诊数据信息,其中,该就诊数据 信息包括就诊时间、就诊地点、就诊费用以及报销单位信息中的至 少一项信息。
需要说明的是,在本实施例中,同质人群表示有相同性质的人 群,进一步地,本实施例所述的同质人群表示就诊时间、就诊地点、 就诊费用以及报销单位信息中任一数据出现多次相同的人群。例 如,在所有患者中,存在就诊时间相同多次相同的患者。由于如有“卡贩子”伪造报销记录,则在进行伪造报销记录时,伪造的报销 记录之间一般存在关联,通过找到数据之间的关联性,即可找到同 质人群患者,监管人员进而可以对“卡贩子”进行监管与控制。例 如,一批患者在多次在同一时间内进行治疗,例如星期一的10点、 星期三的10点以及星期五的10点,该批患者均有治疗记录,则该 批患者定义为同质人群患者。同理地,对就诊地点、就诊费用以及 报销单位信息中也能得到同质人群患者。
还需要说明的是,由于“卡贩子”在伪造报销记录时,可能是 对某一地区内的数据进行伪造,所以在本实施例中,为了实现数据 的可靠性,需获取预设区域内的所有患者的就诊数据信息,例如, 获取成都市某个区内的所有患者的就诊数据信息。
步骤S102,剔除所述就诊时间、就诊地点、就诊费用以及报销 单位信息中的至少一项数据损失的就诊数据信息。
在获取了所有患者的就诊数据信息,由于可能出现某些患者的 就诊数据遗失等情况,导致若将出现数据遗失的就诊数据信息进行 一起处理以筛选同质人群患者时,该部分出现数据遗失的就诊数据 信息并没有实际的参考价值,甚至可能出现整个处理过程的故障, 因此,需要对该就诊数据信息进行除杂,即剔除所述就诊时间、就 诊地点、就诊费用以及报销单位信息中的至少一项数据损失的就诊 数据信息。
在本实施例中,对就诊数据信息进行处理的过程可以分为两 种,一种方法为对所有数据同时进行处理,另一种方法为对所有数 据按序依次进行处理,例如,先对就诊时间进行处理,然后再对就 诊地点进行处理,以此类推。当在依次进行处理的过程中,当有些患者的就诊数据信息出现数据遗失时,可相应对出现遗失的就诊数 据信息进行细化处理。例如,当某位患者的就诊数据信息中的就诊 时间遗失时,当在对就诊时间进行处理时,则或提出该患者的就诊 数据信息,而当在对就诊地点进行处理时,则会保留该患者的就诊数据信息,从而保证了该预设区域范围内的患者的就诊数据信息的 完整性,使得结果更加精确。
步骤S103,对所述就诊数据信息按预设定模型算法进行处理, 以筛选出信息多次相同的同质人群患者。
当在对就诊数据信息进行除杂的过程后,即需要按预设定模型 算法对所有患者的就诊数据信息进行处理,以筛选出信息多次相同 的同质人群患者。
具体地,请参阅图3,在本实施例中,步骤S103包括:
子步骤S1031,对所述数据信息按FP-GROWTH算法进行处理。
FP-Growth算法是一种关联分析算法,它采用将提供频繁项集 的数据库压缩到一棵频繁模式树(FP-tree),但仍保留项集关联信 息的方式对数据进行处理。其中,FP-tree是一种特殊的前缀树,由 频繁项头表和项前缀树构成。FP-Growth算法基于以上的结构加快 整个挖掘过程。
由于在预设的区域范围内的患者的就诊数据信息较多,因此, 需要对该就诊数据信息进行压缩,以使处理的过程更快。
子步骤S1032,对处理后的所述数据信息按Apriori关联分析算 法进行关联分析,以筛选出就诊时间、就诊地点、就诊费用以及报 销单位信息中的至少一项信息多次相同的多个就诊数据信息。
在进行了数据压缩后,即需要对所有的就诊数据信息进行关联 系分析,以得到同质人群患者。需要说明的是,关联分析又称关联 挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于 项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。而Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想 是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项 集,所以在本实施例中,利用Apriori关联分析算法对压缩后的就 诊数据信息进行关联分析,从而筛选出就诊时间、就诊地点、就诊 费用以及报销单位信息中的至少一项信息多次相同的多个就诊数 据信息,该就诊数据信息对应的多个患者即为同质人群患者。当然 地,在其它的一些实施例中,也可以采用其它的分析方法对就诊数 据信息进行分析处理,本实施例对此并不做任何限定。
需要说明的是,本实施例获取的数据包括患者的多次就诊数 据,其中,若多个患者只是一次出现数据相同的情况,则可能纯属 巧合的情况,不能作为筛选同质人群患者的依据。当是,当多个患 者的就诊数据出现多次相同的情况时,则出现巧合的概率较低,需将改群患者作为同质人群进行处理。例如,当多个患者仅在星期五 早上10点的同一时间进行就诊,则可能为一巧合事件;但当该多 个患者还在星期一早上10点、星期三早上10点以及星期天早上10 均同一时间进行就诊,则该时间为巧合时间的概率极低,应将该多 个患者作为同质人群患者。
步骤S104,获取每个患者的疾病类型。
当确认同质人群患者后,需要对该多个患者进行疾病类型的确 认,由于目前的疾病类型分为周期性疾病与非周期形疾病,例如糖 尿病患者,需定期前往医院进行胰岛素的注射,所有,在一些情况 下,即使多个患者的多次治疗时间相同,也可能是因为该多个患者均患有相同的周期性疾病。因此,在本实施例中,需要对其患者的 疾病类型进行判断。
步骤S105,判断所述疾病类型是否为周期性疾病类型,如果是, 则执行步骤S106。
步骤S106,从所述多个就诊数据信息中剔除与所述周期性疾病 类型关联的就诊数据信息。
当患者的疾病为周期性的疾病时,则需要对该疾病对应的数据 进行剔除。例如,在同时在多个时间段进行治疗的患者,其中一部 分的患者为周期性疾病患者,而另一部分疾病患者为非周期性疾病 患者,则在实际运行中,会将该部分周期性疾病患者剔除,即在同 质人群患者中不包含周期性疾病患者。
步骤S107,依据所述同质人群患者生成同质人群表。
在本实施例中,为了使相关审查人员更易查看,还会依据所述 同质人群患者生成同质人群表。其中,同质人群表包括所述同质人 群患者的就诊数据信息。例如,同质人群表为“患者姓名-就诊时间 -就诊地点-就诊费用-报销单位信息”的方式排列的表格。
其中,请参阅图4,步骤S107包括:
子步骤S1071,将与所述周期性疾病类型关联的就诊数据信息 进行标记。
在本实施例中,虽然从同质人群患者中剔除了周期性疾病患 者,但不会对其进行删除。所以需在同质人群表中对与所述周期性 疾病类型关联的就诊数据信息进行标记,以突出显示周期性疾病患 者,例如,通过采用不同颜色、不同字体的方式显示周期性疾病患者。
子步骤S1072,对所述周期性疾病类型赋予第一参数值,并对 所述非周期性疾病类型赋予第二参数值。
子步骤S1073,据所述第一参数值与所述第二参数值对所述疾 病类型进行排序。
在本实施例中,除了会将周期性疾病患者进行突出显示,为了 便于审查人员观看,还会对周期性疾病患者与非周期性进行排序, 例如,将赋予第一参数值的疾病类型排在赋予第二参数值的疾病类 型的前面,从而便于审查人员进行审查,通过人工的形式再次判断 该周期性疾病患者是否属于同质人群患者中,更加方便与精确。
子步骤S1074,依据所述就诊时间、就诊地点、就诊费用以及 报销单位信息中的相同信息的个数定义所述同质人群患者的重要 值。
由于在实际应用中,可能出现其中一部分患者的多项信息相 同,而另一部分患者的一项或两项相同,因此,在本实施例中,还 会依据所述就诊时间、就诊地点、就诊费用以及报销单位信息中的 相同信息的个数定义所述同质人群患者的重要值。例如,当多个患者的就诊数据信息中的就诊时相同,而就诊地点、就诊费用以及报 销单位信息不同时,则定义其重要值为1,当多个患者的就诊时间、 就诊地点均相同,而就诊费用与报销单位信息不同时,则定义其重 要值为2。
子步骤S1075,依据所述同质人群患者的重要值与所述同质人 群患者生成同质人群表。
在定义重要之后,服务器10还会依据同质人群患者的重要值 与所述同质人群患者生成同质人群表,例如,按重要值从大到小进 行排序,以使重要值大的数据信息排在该同质人群表的前面。
由于在实际操作中,多相信息相同多个患者,更可能是同质人 群患者,所以按照相同项数进行排序,能够便于审查人员进行审查。
第二实施例
请参阅图5,本发明实施例提供的图1所示的同质人群筛选装 置100的功能单元示意图。需要说明的是,本实施例所提供的同质 人群筛选装置100,其基本原理及产生的技术效果和上述实施例相 同,为简要描述,本发明实施例部分未提及之处,可参考上述的实 施例中相应内容。同质人群筛选装置100包括:
信息获取单元110,用于获取预设区域内的所有患者的就诊数 据信息。
可以理解的,通过信息获取单元110可执行步骤S101。
信息剔除单元120,用于剔除所述就诊时间、就诊地点、就诊 费用以及报销单位信息中的至少一项数据损失的就诊数据信息。
可以理解的,通过信息剔除单元120可执行步骤S102。
信息处理单元130,用于对所述就诊数据信息按预设定模型算 法进行处理,以筛选出信息多次相同的同质人群患者。
可以理解的,通过信息处理单元130可执行步骤S103。
其中,信息处理单元130包括:
信息处理模块,用于对所述数据信息按FP-GROWTH算法进行 处理。
可以理解的,通过信息处理模块可执行子步骤S1031。
关联分析模块,用于对处理后的所述数据信息按Apriori关联 分析算法进行关联分析,以筛选出就诊时间、就诊地点、就诊费用 以及报销单位信息中的至少一项信息多次相同的多个就诊数据信 息。
可以理解的,通过关联分析模块可执行子步骤S1032。
信息获取单元110,还用于获取每个患者的疾病类型。
可以理解的,通过信息获取单元110可执行步骤S104。
判断单元140,用于判断所述疾病类型是否为周期性疾病类型。
可以理解的,通过判断单元140可执行步骤S105。
信息处理单元130,还用于从所述多个就诊数据信息中剔除与 所述周期性疾病类型关联的就诊数据信息。
可以理解的,通过信息处理单元130可执行步骤S106。
同质人群表生成单元150,用于依据所述同质人群患者生成同 质人群表。
可以理解的,通过同质人群表生成单元150可执行步骤S107。
其中,请参阅图6,同质人群表生成单元150包括:
信息标记模块151,用于将与所述周期性疾病类型关联的就诊 数据信息进行标记。
可以理解的,通过信息标记单元可执行子步骤S1071。
赋值模块152,用于对所述周期性疾病类型赋予第一参数值, 并对所述非周期性疾病类型赋予第二参数值。
可以理解的,通过赋值模块152可执行子步骤S1072。
排序模块153,用于依据所述第一参数值与所述第二参数值对 所述疾病类型进行排序。
可以理解的,通过赋值模块152可执行子步骤S1073。
重要值定义模块154,用于依据所述就诊时间、就诊地点、就 诊费用以及报销单位信息中的相同信息的个数定义所述同质人群 患者的重要值。
可以理解的,通过重要值定义模块154可执行子步骤S1074。
同质人群表生成模块155,用于依据所述同质人群患者的重要 值与所述同质人群患者生成同质人群表。
可以理解的,通过同质人群表生成模块155可执行子步骤 S1075。
综上所述,本发明提供了一种同质人群筛选方法与装置,通过 获取预设区域内的所有患者的就诊数据信息,然后对所述就诊数据 信息按预设定模型算法进行处理,以筛选出同质人群患者。本发明 提供的同质人群筛选方法与装置能够通过所有患者的数据进行筛 选,一方面,由于该同质人群筛选方法与装置能够筛选出同质人群 患者,所以能够方便审查人员进行审查,有效找出存在伪造报销记 录的信息,更加高效且实用。另一方面,由于该同质人群筛选方法 与装置获取的数据信息为预设区域内的所有患者的信息,数据充足,所以处理更加精确。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的 关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分 开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实 际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其 他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过 程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确 列出的其他要素,或者是还包括为这种过程、方法、物品或者设备 所固有的要素。在没有更多限制的情况下,由语句“包括一 个……”限定的要素,并不排除在包括所述要素的过程、方法、物 品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发 明,对于本领域的技术人员来说,本发明可以有各种更改和变化。 凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进 等,均应包含在本发明的保护范围之内。应注意到:相似的标号和 字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中 被定义,则在随后的附图中不需要对其进行进一步定义和解释。

Claims (10)

1.一种同质人群筛选方法,其特征在于,所述同质人群筛选方法包括:
获取预设区域内的所有患者的就诊数据信息,其中,所述就诊数据信息包括就诊时间、就诊地点、就诊费用以及报销单位信息中的至少一项信息;
对所述就诊数据信息按预设定模型算法进行处理,以筛选出信息多次相同的同质人群患者。
2.如权利要求1所述的同质人群筛选方法,其特征在于,在所述对所述就诊数据信息按预设定模型算法进行处理的步骤之前,所述同质人群筛选方法还包括:
剔除所述就诊时间、就诊地点、就诊费用以及报销单位信息中的至少一项数据损失的就诊数据信息。
3.如权利要求1所述的同质人群筛选方法,其特征在于,所述对所述就诊数据信息按预设定模型算法进行处理的步骤包括:
对所述数据信息按FP-GROWTH算法进行处理;
对处理后的所述数据信息按Apriori关联分析算法进行关联分析,以筛选出就诊时间、就诊地点、就诊费用以及报销单位信息中的至少一项信息多次相同的多个就诊数据信息。
4.如权利要求3所述的同质人群筛选方法,其特征在于,所述同质人群筛选方法还包括:
获取每个患者的疾病类型;
判断所述疾病类型是否为周期性疾病类型;
当所述疾病类型为周期性疾病类型时,从所述多个就诊数据信息中剔除与所述周期性疾病类型关联的就诊数据信息。
5.如权利要求4所述的同质人群筛选方法,其特征在于,在所述筛选出同质人群患者的步骤之后,所述同质人群筛选方法还包括:
依据所述同质人群患者生成同质人群表;其中,所述同质人群表包括所述同质人群患者的就诊数据信息;
在所述判断所述疾病类型是否为周期性疾病类型的步骤之后,所述同质人群筛选方法还包括:
当所述疾病类型为周期性疾病类型时,将与所述周期性疾病类型关联的就诊数据信息进行标记。
6.如权利要求5所述的同质人群筛选方法,其特征在于,在所述将与所述周期性疾病类型关联的就诊数据信息进行标记的步骤之后,所述同质人群筛选方法还包括:
当所述疾病类型为周期性疾病类型时,对所述周期性疾病类型赋予第一参数值;
当所述疾病类型为非周期性疾病类型时,对所述非周期性疾病类型赋予第二参数值;
依据所述第一参数值与所述第二参数值对所述疾病类型进行排序。
7.如权利要求5所述的同质人群筛选方法,其特征在于,所述依据所述同质人群患者生成同质人群表的步骤包括:
依据所述就诊时间、就诊地点、就诊费用以及报销单位信息中的相同信息的个数定义所述同质人群患者的重要值;
依据所述同质人群患者的重要值与所述同质人群患者生成同质人群表。
8.一种同质人群筛选装置,其特征在于,所述同质人群筛选装置包括:
信息获取单元,用于获取预设区域内的所有患者的就诊数据信息,其中,所述就诊数据信息包括就诊时间、就诊地点、就诊费用以及报销单位信息中的至少一项信息;
信息处理单元,用于对所述就诊数据信息按预设定模型算法进行处理,以筛选出信息多次相同的同质人群患者。
9.如权利要求8所述的同质人群筛选装置,其特征在于,所述同质人群筛选装置还包括:
信息剔除单元,用于剔除所述就诊时间、就诊地点、就诊费用以及报销单位信息中的至少一项数据损失的就诊数据信息。
10.如权利要求8所述的同质人群筛选装置,其特征在于,所述信息处理单元包括:
信息处理模块,用于对所述数据信息按FP-GROWTH算法进行处理;
关联分析模块,用于对处理后的所述数据信息按Apriori关联分析算法进行关联分析,以筛选出就诊时间、就诊地点、就诊费用以及报销单位信息中的至少一项信息多次相同的多个就诊数据信息。
CN201810615269.9A 2018-06-14 2018-06-14 一种同质人群筛选方法与装置 Pending CN108962342A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810615269.9A CN108962342A (zh) 2018-06-14 2018-06-14 一种同质人群筛选方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810615269.9A CN108962342A (zh) 2018-06-14 2018-06-14 一种同质人群筛选方法与装置

Publications (1)

Publication Number Publication Date
CN108962342A true CN108962342A (zh) 2018-12-07

Family

ID=64489056

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810615269.9A Pending CN108962342A (zh) 2018-06-14 2018-06-14 一种同质人群筛选方法与装置

Country Status (1)

Country Link
CN (1) CN108962342A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408481A (zh) * 2015-07-28 2017-02-15 平安科技(深圳)有限公司 异常刷卡人员信息自动提取系统及方法
CN107145587A (zh) * 2017-05-11 2017-09-08 成都四方伟业软件股份有限公司 一种基于大数据挖掘的医保反欺诈系统
CN107609980A (zh) * 2017-09-07 2018-01-19 平安医疗健康管理股份有限公司 医疗数据处理方法、装置、计算机设备及存储介质
CN107657536A (zh) * 2017-02-20 2018-02-02 平安科技(深圳)有限公司 社保欺诈行为的识别方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408481A (zh) * 2015-07-28 2017-02-15 平安科技(深圳)有限公司 异常刷卡人员信息自动提取系统及方法
CN107657536A (zh) * 2017-02-20 2018-02-02 平安科技(深圳)有限公司 社保欺诈行为的识别方法和装置
CN107145587A (zh) * 2017-05-11 2017-09-08 成都四方伟业软件股份有限公司 一种基于大数据挖掘的医保反欺诈系统
CN107609980A (zh) * 2017-09-07 2018-01-19 平安医疗健康管理股份有限公司 医疗数据处理方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
US9430616B2 (en) Extracting clinical care pathways correlated with outcomes
US20050075832A1 (en) System and method for continuous data analysis of an ongoing clinical trial
CA2465760A1 (en) Patient data mining for quality adherence
CN110597946B (zh) 一种案例存储方法、装置、设备及存储介质
CN109598628A (zh) 医保欺诈行为的识别方法、装置、设备及可读存储介质
CN107612730A (zh) 一种日志采集分析方法、装置以及系统
CN111180024A (zh) 基于词频逆文档频率的数据处理方法、装置和计算机设备
CN106408481A (zh) 异常刷卡人员信息自动提取系统及方法
CN111312351A (zh) 一种区域病历数据分析方法及系统
CN114005530A (zh) 区域内医学重复检查、检验智能提醒与监管方法及系统
CN111354448A (zh) 孕检项目处理方法、装置、计算机设备和存储介质
CN115148370A (zh) 一种生成dip病种目录的方法及系统
CN110718276A (zh) 一种临床路径管理信息系统
CN108962342A (zh) 一种同质人群筛选方法与装置
KR102198829B1 (ko) 성분명 기반 알레르기 위험도 평가 방법
CN109411079B (zh) 审核诊疗规则生成方法、装置、计算机设备和存储介质
CN108847275A (zh) 化验结果的处理方法、装置及电子设备
CN103761344A (zh) 一种健康档案信息存储及分析处理方法及系统
CN111259089B (zh) 医保数据处理方法、装置、计算机设备和存储介质
CN108847281A (zh) 体检数据的处理方法、装置及电子设备
JP2005108209A (ja) 臨床試験検査管理システム
CN114120177A (zh) 一种基于智慧健康监控的用户行为引导方法及系统
CN113284589A (zh) 一种基于区域区块链的大数据统计系统及统计方法
CN110379478A (zh) 处方智能点评系统
Chazard et al. Detection of adverse drug events detection: data agregation and data mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181207