CN109635112A - 异常透析数据筛选方法、装置、设备及存储介质 - Google Patents
异常透析数据筛选方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN109635112A CN109635112A CN201811530683.6A CN201811530683A CN109635112A CN 109635112 A CN109635112 A CN 109635112A CN 201811530683 A CN201811530683 A CN 201811530683A CN 109635112 A CN109635112 A CN 109635112A
- Authority
- CN
- China
- Prior art keywords
- data
- dialysis
- abnormal
- cluster
- standardized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000502 dialysis Methods 0.000 title claims abstract description 273
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 101
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000012216 screening Methods 0.000 title claims abstract description 52
- 230000008569 process Effects 0.000 claims abstract description 36
- 230000008520 organization Effects 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000003058 natural language processing Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000009738 saturating Methods 0.000 description 5
- 239000003814 drug Substances 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000001631 haemodialysis Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 208000001647 Renal Insufficiency Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000000322 hemodialysis Effects 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 230000003907 kidney function Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- External Artificial Organs (AREA)
Abstract
本发明属于人工智能技术领域,公开了一种基于聚类算法的异常透析数据筛选方法、装置、设备及存储介质,该方法包括:从定点医疗机构收集待筛选的透析数据;根据预设流程对所述透析数据进行处理,获得标准化数据;通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。本发明基于聚类算法,通过透析次数聚类模型对透析数据进行筛选,提高了透析数据筛选的效率和准确性。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种异常透析数据筛选方法、装置、设备及存储介质。
背景技术
目前,透析已纳入医保报销范筹,参保人在定点医疗机构进行结算时只需要支付医保报销后的费用。因此为保障医保基金的合理支出,负责管理医保的相关部门需要对参保人透析数据进行异常检测,以减少虚假报销的发生。由于需要筛选的数据量大,如果依靠人工进行筛选,则效率低,准确性不高。
发明内容
本发明提供一种异常透析数据筛选方法、装置、设备及存储介质,旨在提高透析数据筛选的效率和准确性。
为实现上述目的,本发明提供一种异常透析数据筛选方法,所述方法包括:
从定点医疗机构中获取待筛选的透析数据;
根据预设流程对所述透析数据进行处理,获得标准化数据;
通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。
优选地,所述预设流程是自然语言处理NLP流程,所述根据预设流程对所述透析数据进行处理,获得标准化数据的步骤包括:
对所述透析数据进行预处理,将所述透析数据的格式转换为可供后续处理的纯文本格式;
使用基于字符匹配的分词方法对纯文本格式的所述透析数据进行分词,得到词组序列;
将所述词组序列与预先设置的关键词模板进行匹配,得到标准化数据。
优选地,所述从定点医疗机构收集待筛选的透析数据的步骤之前还包括:
建立透析次数聚类模型。
优选地,所述建立透析次数聚类模型的步骤包括:
从定点医疗机构收集正常透析的历史数据;
将所述历史数据按预设流程进行处理后获得样本数据;
从所述样本数据中随机选择k个数据,所述k个数据中的每一个数据表示对应的簇的初始聚类中心,其中,k大于1;
计算所述k个数据之外的剩余样本数据与所述初始聚类中心的聚类距离;
将所述剩余样本数据分类至聚类距离最近的簇,获得重新分类的k个簇;
分别计算所述k个簇的平均值,将所述平均值更新为聚类中心;
重复更新聚类中心,直至簇的平均值不再变化,则完成了透析次数聚类模型的建立。
优选地,所述通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据的步骤包括:
所述透析次数聚类模型对所述标准化数据进行聚类,获得聚类结果;
根据所述聚类结果计算所述标准化数据与对应聚类中心的聚类距离,将所述聚类距离与阈值进行比较;
若所述聚类距离大于所述阈值,则将所述聚类距离大于所述阈值的标准化数据标记为异常透析数据。
优选地,所述通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据的步骤之后还包括:
将所述异常透析数据发送至相关平台,以供所述相关平台对所述异常透析数据进行分析并输出相应的决策。
优选地,所述方法还包括:
从所述待筛选的透析数据中去除所述异常透析数据,将所述历史数据和所述待筛选的透析数据中的正常透析数据,作为更新样本数据;
根据所述更新样本数据训练所述透析次数聚类模型,获得更新后的透析次数聚类模型。
此外,为实现上述目的,本发明还提供一种异常透析数据筛选装置,所述异常透析数据筛选装置包括:
获取模块,用于从定点医疗机构中获取待筛选的透析数据;
处理模块,用于根据预设流程对所述透析数据进行处理,获得标准化数据;
分析模块,用于通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。
此外,为实现上述目的,本发明还提供一种异常透析数据筛选设备,所述异常透析数据筛选设备包括处理器,存储器以及存储在所述存储器中的异常透析数据筛选程序,所述异常透析数据筛选程序被所述处理器运行时,实现如上所述的异常透析数据筛选方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机存储介质,所述计算机存储介质上存储有异常透析数据筛选程序,所述异常透析数据筛选程序被处理器运行时实现如上所述异常透析数据筛选方法的步骤。
相比现有技术,本发明提出的一种异常透析数据筛选方法、装置、设备及存储介质,从定点医疗机构收集待筛选的透析数据;根据预设流程对所述透析数据进行处理,获得标准化数据;通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。本发明基于聚类算法,通过透析次数聚类模型对透析数据进行筛选,提高了透析数据筛选的效率和准确性。
附图说明
图1是本发明各实施例涉及的异常透析数据筛选设备的硬件结构示意图;
图2是本发明异常透析数据筛选方法第一实施例的流程示意图;
图3是本发明异常透析数据筛选方法第二实施例的流程示意图;
图4是本发明异常透析数据筛选方法第三实施例的流程示意图;
图5是本发明异常透析数据筛选装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例主要涉及的异常透析数据筛选设备是指能够实现网络连接的网络连接设备,所述异常透析数据筛选设备可以是服务器、云平台等。
参照图1,图1是本发明各实施例涉及的异常透析数据筛选设备的硬件结构示意图。本发明实施例中,异常透析数据筛选设备可以包括处理器1001(例如中央处理器Central Processing Unit、CPU),通信总线1002,输入端口1003,输出端口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;输入端口1003用于数据输入;输出端口1004用于数据输出,存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种可读存储介质的存储器1005可以包括操作系统、网络通信模块、应用程序模块以及异常透析数据筛选程序。在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的异常透析数据筛选程序,并执行本发明实施例提供的异常透析数据筛选方法。
本发明实施例提供了一种异常透析数据筛选方法。
参照图2,图2是本发明异常透析数据筛选方法第一实施例的流程示意图。
本实施例中,所述异常透析数据筛选方法应用于异常透析数据筛选设备,所述方法包括:
步骤S101,从定点医疗机构中获取待筛选的透析数据;
一般地,参保人使用社保卡在定点医疗机构就诊后,定点医疗机构会保存相关诊疗、用药、费用等数据。对于肾功能衰竭的病人,无法通过自身肾功能将体内有害物质排出去,就需要进行透析,一般地,对于病情稳定的患者透析次数是固定的,若透析次数忽然增大,则说明透析次数异常。
本实施例中,从定点医疗机构中获取与透析相关的数据作为待筛选的透析数据,所述透析数据包括参保人信息、诊疗信息、用药信息、透析类型、透析时间、透析次数、透析费用等,其中所述透析类型包括血液透析以及腹膜透析。具体地,获取具有透析记录的社保卡在设定时段内的所有信息,可以将时段设定为一年、半年或一个月。将与透析相关的所有社保卡的数据作为待筛选的透析数据。
步骤S102,根据预设流程对所述透析数据进行处理,获得标准化数据;
本实施例中,获取到待筛选的透析数据后,则根据预设流程对所述透析数据进行处理,获得标准化数据。所述预设流程是自然语言处理(Natural Language Processing,NLP)流程,NLP是人工智能的一个子领域,主要用于语音识别、自动分词、词性标注、句法分析、信息检索、文字核对、信息抽取等。
本实施例中通过NLP流程对所述透析数据依次进行预处理、分词、关键词模板匹配的处理流程,得到标准化数据。具体地,首先对所述透析数据进行预处理,将所述透析数据的格式转换为可供后续处理的纯文本格式,由于所述透析数据中包括日期、数值等非文本格式的信息,需要将所述非文本格式的信息转换成文本格式,以免在后续处理过程中出现格式错误。然后使用基于字符匹配的分词方法对所述透析数据进行分词,得到词组序列,所述透析数据往往是复杂凌乱且没有统一规则的文本或数字,因此在利用所述透析数据之前需要将所述纯文本格式的透析数据进行分词,得到一系列的可进行机器处的词组序列,再对所述词组序列进行浅层语义分析,标注语义角色,得到关键词逻辑序列。将处理后的透析数据与预先设置的关键词模板进行匹配,以获得标准化数据。可以预先在所述关键词模板中设置所需要的关键词,例如透析时间、透析次数等。所述标准化数据是指经过自然语言处理流程后获得的数据,所述标准化数据是将所述透析数据中的诊疗信息、药品信息、透析时间、透析次数等信息匹配到相应的标准化字段中。
此外,对于复杂的透析数据,也可以通过循环神经网络(Recurrent NeuralNetwork,RNN)来处理,神经网络是一种节点定向连接成环的人工神经网络。这种网络的内部状态可以展示动态时序行为。RNN可以利用内部的记忆来处理任意时序的输入序列,这让它可以更容易处理如不分段的手写识别、语音识别、数据文本等。一般地,RNN包括输入层、隐藏层以及输出层,在输入层中设置好词向量,由输出层进行结果输出。
步骤S103,通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。
本实施例中,将所述标准化数据输入预先建立的透析次数聚类模型中。所述透析次数聚类模型接收到所述标准化数据后,对所述标准化数据进行聚类,获得聚类结果;具体地,将所述标准化数据分别聚类至预先分好的簇中,所述标准化数据中的每一个数据都由所述透析次数聚类模型聚类至最合适的簇中。根据所述聚类结果计算所述标准化数据与对应聚类中心的聚类距离,也即计算所述标准化数据与各自所在的簇的聚类中心的距离,并将所述聚类距离与阈值进行比较。所述阈值可以设置为所述透析次数聚类模型中与所述距离中心最远的那个数据与所述聚类中心的距离。若所述聚类距离大于所述阈值,则将所述聚类距离大于所述阈值的标准化数据标记为异常透析数据。由于若述聚类距离大于所述阈值,则说明该数据与簇中的其它数据的差异过大,因此可以将所述聚类距离大于所述阈值的标准化数据标记为异常透析数据。若所述聚类距离小于或等于所述阈值,则将所述聚类距离小于或等于所述阈值的标准化数据标记为正常透析数据。
进一步地,对所述异常透析数据进行二次分析,去除假阳性异常透析数据。具体地,可以根据异常透析数据的透析次数将所述异常透析数据进行分类,例如分为透析次数过多和透析次数过少两类,再分别对透析次数过多的异常数据和透析次数过少的异常透析次数进行细化分析。如果所述透析数据是年度透析数据,则再将所述年度透析数据细化成多个月度透析数据,从所述多个月度透析数据中获取多个月度透析次数,分别将所述月度透析次数与预设正常月度透析次数进行比较,获得月度透析次数异常的一个或多个月度透析次数,若所述异常的一个或多个月度透析次数的个数与对应的多个月度透析次数的个数的百分比大于阈值,则认为所述多个月度透析次数对应的异常透析数据是真正的异常透析数据;反之,若所述异常的一个或多个月度透析次数的个数与对应的多个月度透析次数的个数的百分比小于或等于阈值,则认为所述多个月度透析次数对应的异常透析数据是假阳性的异常透析数据。例如,若所述异常透析数据中有12个月的透析记录,则分别获取每个月的透析次数,将所述每个月的透析次数分别表示为A1—A12,将所述A1—A12分别与预设的正常月度透析次数进行对比,可以将所述正常月度透析次数设置为8,记录A1—A12中大于8的数据的个数,若所述A1—A12中有6个数据大于8,则所述个数是8,并计算得到8与12的百分比66.7%。若所述阈值是50%,则A1—A12对应的异常透析数据是真正的异常透析数据。
本实施例通过上述方案,从定点医疗机构收集待筛选的透析数据;根据预设流程对所述透析数据进行处理,获得标准化数据;通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。由此,基于聚类算法,通过透析次数聚类模型对透析数据进行筛选,提高了透析数据筛选的效率和准确性。
如图3所示,本发明第二实施例提出一种异常透析数据筛选方法,基于上述图2所示的第一实施例,所述从定点医疗机构收集待筛选的透析数据的步骤之前还包括:
步骤S100,建立透析次数聚类模型。
本实施例中,预先透析次数聚类模型用于筛查异常透析数据。本实施例中使用无监督学习法中的K-means算法建立所述透析次数聚类模型。K-means算法具有简洁快速等优点,其基本过程是以样本数据中的k个点为中心进行聚类,对最靠近所述中心的对象归类。通过迭代的方法,逐次更新各簇的中心,直至得到最好的聚类结果。
具体地,通过从定点医疗机构收集正常透析的历史数据;将所述正常透析的历史数据作为建立所述透析次数聚类模型的样本。将所述历史数据按预设流程进行处理后获得样本数据。
本实施例中,通过NLP流程对所述透析数据依次进行预处理、分词、关键词模板匹配的处理流程,得到标准化数据。具体地,首先对所述透析数据进行预处理,将所述透析数据的格式转换为可供后续处理的纯文本。然后使用基于字符匹配的分词方法对所述透析数据进行分词,得到词组序列,对所述词组序列进行浅层语义分析,标注语义角色,得到关键词逻辑序列。将处理后的透析数据与预先设置的关键词模板进行匹配,以获得标准化数据。所述标准化数据是指经过自然语言处理流程后获得的数据,所述标准化数据是将所述透析数据中的诊疗信息、药品信息、透析时间、透析次数等信息匹配到相应的标准化字段中。
从所述样本数据中随机选择k个数据,所述k个数据中的每一个数据表示对应的簇的初始聚类中心,其中,k大于1,k的取值可以根据样本数据来确定,一般地,若样本数据较多,则k可以取较大的值;计算所述k个数据之外的剩余样本数据与所述初始聚类中心的聚类距离;将所述剩余样本数据分类至聚类距离最近的簇,获得重新分类的k个簇,以此优化簇的划分;分别计算所述k个簇的平均值,将所述平均值更新为聚类中心,由于重新分簇,故需要计算新形成的簇的新平均值,并将新平均值更新为聚类中心;重复更新聚类中心,直至簇的平均值不再变化,反复更新聚类中心,直至平均值不在变化,以此得到最优的平均值,则完成透析次数聚类模型的建立。
进一步地,通过所述透析次数聚类模型对待筛选数据进行筛选之后,还可以利用所述待筛选数据中的正常透析数据对所述透析次数聚类模型进行更新。具体地,当根据所述聚类结果计算所述标准化数据与对应聚类中心的聚类距离,将所述聚类距离与阈值进行比较;若所述聚类距离大于所述阈值,则将所述聚类距离大于所述阈值的标准化数据标记为异常透析数据,输出所述异常透析数据后,从所述待筛选的透析数据中去除所述异常透析数据,将所述历史数据和所述待筛选的透析数据中的正常透析数据,作为更新样本数据;基于所述更新样本数据分别计算所述透析次数聚类模型中k个簇的平均值,将所述平均值更新为聚类中心;反复更新聚类中心,直至簇的平均值不再变化,则获得更新后的透析次数聚类模型。由此,简单方便地对所述透析次数模型进行更新,极大提高了工作效率和所述待筛选数据的利用率,并提高了所述透析次数聚类模型进行数据筛选的准确性。
本发明实施例通过无监督学习法中的K-means算法建立透析次数聚类模型,通过透析次数聚类模型对透析数据进行筛选,提高了透析数据筛选的效率和准确性。
如图4所示,本发明第三实施例提出一种异常透析数据筛选方法,基于上述图2、图3所示的第一实施例和第二实施例,所述通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据的步骤之后还包括:
步骤S104,将所述异常透析数据发送至相关平台,以供所述相关平台对所述异常透析数据进行分析并输出相应的决策。
本实施例中,所述相关平台可以是社保局的数据处理平台,将所述异常透析数据发送至相关平台,所述相关平台基于所述异常透析数据获取与所述异常透析数据相关的全部信息,所述全部信息包括对应的参保人、对应的定点医疗机构以及对所述参保人的报销费用,以供所述相关平台对所述异常透析数据进行分析并输出相应的决策。例如,对虚假报销的参保人进行警告、处分、罚款。若某定点医疗机构出现大量的异常透析数据,导致虚假报销的数量明显超出其它定点医疗机构,则对该定点医疗机构进行全面的审查。
本实施例通过将所述异常透析数据发送至相关平台,以供所述相关平台对所述异常透析数据进行分析并输出相应的决策,由此,对医保报销进行监督,提高了医保费用的利用率,并减少了骗保事件的发生。
此外,本实施例还提供一种异常透析数据筛选装置。参照图5,图5为本发明异常透析数据筛选装置第一实施例的功能模块示意图。
本发明提供的异常透析数据筛选装置是虚拟装置,存储于图1所示的异常透析数据筛选设置的存储器1005中,用于从定点医疗机构中获取待筛选的透析数据;用于根据预设流程对所述透析数据进行处理,获得标准化数据;用于通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。
具体地,本实施例中,所示异常透析数据筛选装置包括:
获取模块10,用于从定点医疗机构中获取待筛选的透析数据;
处理模块20,用于根据预设流程对所述透析数据进行处理,获得标准化数据;
分析模块30,用于通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。
进一步地,所述处理模块还用于:
对所述透析数据进行预处理,将所述透析数据的格式转换为可供后续处理的纯文本格式;
使用基于字符匹配的分词方法对纯文本格式的所述透析数据进行分词,得到词组序列;
将所述词组序列与预先设置的关键词模板进行匹配,得到标准化数据。
进一步地,所述处理模块还用于:
建立透析次数聚类模型。
进一步地,所述处理模块还用于:
从定点医疗机构收集正常透析的历史数据;
将所述历史数据按预设流程进行处理后获得样本数据;
从所述样本数据中随机选择k个数据,所述k个数据中的每一个数据表示对应的簇的初始聚类中心,其中,k大于1;
计算所述k个数据之外的剩余样本数据与所述初始聚类中心的聚类距离;
将所述剩余样本数据分类至聚类距离最近的簇,获得重新分类的k个簇;
分别计算所述k个簇的平均值,将所述平均值更新为聚类中心;
重复更新聚类中心,直至簇的平均值不再变化,则完成透析次数聚类模型的建立。
进一步地,所述分析模块还用于:
所述透析次数聚类模型对所述标准化数据进行聚类,获得聚类结果;
根据所述聚类结果计算所述标准化数据与对应聚类中心的聚类距离,将所述聚类距离与阈值进行比较;
若所述聚类距离大于所述阈值,则将所述聚类距离大于所述阈值的标准化数据标记为异常透析数据。
进一步地,所述分析模块还用于:
将所述异常透析数据发送至相关平台,以供所述相关平台对所述异常透析数据进行分析并输出相应的决策。
进一步地,所述处理模块还用于:
从所述待筛选的透析数据中去除所述异常透析数据,将所述历史数据和输入的所述待筛选的透析数据中的正常透析数据,作为更新样本数据;
根据所述更新样本数据训练所述透析次数聚类模型,获得更新后的透析次数聚类模型。
此外,本发明还提出一种种计算机存储介质,所述计算机存储介质上存储有异常透析数据筛选程序,所述异常透析数据筛选程序被处理器运行时实现如上所述异常透析数据筛选方法的步骤,在此不再赘述。
相比现有技术,本发明提出的一种异常透析数据筛选方法、装置、设备及存储介质,从定点医疗机构收集待筛选的透析数据;根据预设流程对所述透析数据进行处理,获得标准化数据;通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。本发明基于聚类算法,通过透析次数聚类模型对透析数据进行筛选,提高了透析数据筛选的效率和准确性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种异常透析数据筛选方法,其特征在于,所述方法应用于异常透析数据筛选设备,所述方法包括:
从定点医疗机构中获取待筛选的透析数据;
根据预设流程对所述透析数据进行处理,获得标准化数据;
通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。
2.根据权利要求1所述的方法,其特征在于,所述预设流程是自然语言处理NLP流程,所述根据预设流程对所述透析数据进行处理,获得标准化数据的步骤包括:
对所述透析数据进行预处理,将所述透析数据的格式转换为可供后续处理的纯文本格式;
使用基于字符匹配的分词方法对纯文本格式的所述透析数据进行分词,得到词组序列;
将所述词组序列与预先设置的关键词模板进行匹配,得到标准化数据。
3.根据权利要求1所述的方法,其特征在于,所述从定点医疗机构收集待筛选的透析数据的步骤之前还包括:
建立透析次数聚类模型。
4.根据权利要求3所述的方法,其特征在于,所述建立透析次数聚类模型的步骤包括:
从定点医疗机构收集正常透析的历史数据;
将所述历史数据按预设流程进行处理后获得样本数据;
从所述样本数据中随机选择k个数据,所述k个数据中的每一个数据表示对应的簇的初始聚类中心,其中,k大于1;
计算所述k个数据之外的剩余样本数据与所述初始聚类中心的聚类距离;
将所述剩余样本数据分类至聚类距离最近的簇,获得重新分类的k个簇;
分别计算所述k个簇的平均值,将所述平均值更新为聚类中心;
重复更新聚类中心,直至簇的平均值不再变化,则完成透析次数聚类模型的建立。
5.根据权利要求1所述的方法,其特征在于,所述通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据的步骤包括:
所述透析次数聚类模型对所述标准化数据进行聚类,获得聚类结果;
根据所述聚类结果计算所述标准化数据与对应聚类中心的聚类距离,将所述聚类距离与阈值进行比较;
若所述聚类距离大于所述阈值,则将所述聚类距离大于所述阈值的标准化数据标记为异常透析数据。
6.根据权利要求1所述的方法,其特征在于,所述通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据的步骤之后还包括:
将所述异常透析数据发送至相关平台,以供所述相关平台对所述异常透析数据进行分析并输出相应的决策。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述方法还包括:
从所述待筛选的透析数据中去除所述异常透析数据,将所述历史数据和所述待筛选的透析数据中的正常透析数据,作为更新样本数据;
根据所述更新样本数据训练所述透析次数聚类模型,获得更新后的透析次数聚类模型。
8.一种异常透析数据筛选装置,其特征在于,所述异常透析数据筛选装置包括:
获取模块,用于从定点医疗机构中获取待筛选的透析数据;
处理模块,用于根据预设流程对所述透析数据进行处理,获得标准化数据;
分析模块,用于通过预先建立的透析次数聚类模型对所述标准化数据进行分析,获得异常透析数据。
9.一种异常透析数据筛选设备,其特征在于,所述异常透析数据筛选设备包括处理器,存储器以及存储在所述存储器中的异常透析数据筛选程序,所述异常透析数据筛选程序被所述处理器运行时,实现如权利要求1-7中任一项所述的异常透析数据筛选方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有异常透析数据筛选程序,所述异常透析数据筛选程序被处理器运行时实现如权利要求1-7中任一项所述异常透析数据筛选方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811530683.6A CN109635112A (zh) | 2018-12-13 | 2018-12-13 | 异常透析数据筛选方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811530683.6A CN109635112A (zh) | 2018-12-13 | 2018-12-13 | 异常透析数据筛选方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109635112A true CN109635112A (zh) | 2019-04-16 |
Family
ID=66073823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811530683.6A Pending CN109635112A (zh) | 2018-12-13 | 2018-12-13 | 异常透析数据筛选方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109635112A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263618A (zh) * | 2019-04-30 | 2019-09-20 | 阿里巴巴集团控股有限公司 | 一种核身模型的迭代方法和装置 |
CN113577422A (zh) * | 2021-07-12 | 2021-11-02 | 健帆生物科技集团股份有限公司 | 透析器的质检方法及组装方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103001825A (zh) * | 2012-11-15 | 2013-03-27 | 中国科学院计算机网络信息中心 | Dns流量异常的检测方法和系统 |
CN105159948A (zh) * | 2015-08-12 | 2015-12-16 | 成都数联易康科技有限公司 | 一种基于多特征的医疗保险欺诈检测方法 |
CN106650228A (zh) * | 2016-11-08 | 2017-05-10 | 浙江理工大学 | 改进k‑means算法的噪声数据去除方法及实施系统 |
CN107861945A (zh) * | 2017-11-01 | 2018-03-30 | 平安科技(深圳)有限公司 | 金融数据分析方法、应用服务器及计算机可读存储介质 |
CN108831559A (zh) * | 2018-06-20 | 2018-11-16 | 清华大学 | 一种中文电子病历文本分析方法与系统 |
-
2018
- 2018-12-13 CN CN201811530683.6A patent/CN109635112A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103001825A (zh) * | 2012-11-15 | 2013-03-27 | 中国科学院计算机网络信息中心 | Dns流量异常的检测方法和系统 |
CN105159948A (zh) * | 2015-08-12 | 2015-12-16 | 成都数联易康科技有限公司 | 一种基于多特征的医疗保险欺诈检测方法 |
CN106650228A (zh) * | 2016-11-08 | 2017-05-10 | 浙江理工大学 | 改进k‑means算法的噪声数据去除方法及实施系统 |
CN107861945A (zh) * | 2017-11-01 | 2018-03-30 | 平安科技(深圳)有限公司 | 金融数据分析方法、应用服务器及计算机可读存储介质 |
CN108831559A (zh) * | 2018-06-20 | 2018-11-16 | 清华大学 | 一种中文电子病历文本分析方法与系统 |
Non-Patent Citations (1)
Title |
---|
吴剑: "基于离群点检测的医保欺诈检测研究", 《中国优秀硕士学位论文全文数据库 (经济与管理科学辑)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263618A (zh) * | 2019-04-30 | 2019-09-20 | 阿里巴巴集团控股有限公司 | 一种核身模型的迭代方法和装置 |
CN110263618B (zh) * | 2019-04-30 | 2023-10-20 | 创新先进技术有限公司 | 一种核身模型的迭代方法和装置 |
CN113577422A (zh) * | 2021-07-12 | 2021-11-02 | 健帆生物科技集团股份有限公司 | 透析器的质检方法及组装方法 |
CN113577422B (zh) * | 2021-07-12 | 2023-05-26 | 健帆生物科技集团股份有限公司 | 透析器的质检方法及组装方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110781298B (zh) | 药品分类方法、装置、计算机设备及存储介质 | |
CN107785058A (zh) | 反欺诈识别方法、存储介质和承载平安脑的服务器 | |
CN112365987A (zh) | 诊断数据异常检测方法、装置、计算机设备及存储介质 | |
CN107895168A (zh) | 数据处理的方法、数据处理的装置及计算机可读存储介质 | |
CN109635044A (zh) | 住院数据异常检测方法、装置、设备及可读存储介质 | |
CN111695593A (zh) | 基于XGBoost的数据分类方法、装置、计算机设备及存储介质 | |
CN109741826A (zh) | 麻醉评估决策树构建方法及设备 | |
CN110490750B (zh) | 数据识别的方法、系统、电子设备及计算机存储介质 | |
CN108595657A (zh) | His系统的数据表分类映射方法和装置 | |
WO2020119114A1 (zh) | 检查数据筛选方法、装置、设备及存储介质 | |
CN112214515B (zh) | 数据自动匹配方法、装置、电子设备及存储介质 | |
CN115050442B (zh) | 基于挖掘聚类算法的病种数据上报方法、装置及存储介质 | |
CN109635112A (zh) | 异常透析数据筛选方法、装置、设备及存储介质 | |
CN111611786B (zh) | 文本相似度的计算方法及装置 | |
CN112926332A (zh) | 一种实体关系联合抽取方法及装置 | |
CN117272204A (zh) | 异常数据检测方法、装置、存储介质和电子设备 | |
CN107480426B (zh) | 自迭代病历档案聚类分析系统 | |
CN113642672A (zh) | 医保数据的特征加工方法、装置、计算机设备及存储介质 | |
CN117316409A (zh) | 一种基于大数据的医院信息管理方法及系统 | |
CN107273493A (zh) | 一种大数据环境下的数据优化及快速抽样方法 | |
CN113241193A (zh) | 药物推荐模型训练方法、推荐方法、装置、设备及介质 | |
CN109636648A (zh) | 社保违规检测方法、装置、设备及计算机存储介质 | |
CN113824580A (zh) | 一种网络指标预警方法及系统 | |
CN115115369A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN108491487A (zh) | 一种临床指南知识编码方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190416 |
|
RJ01 | Rejection of invention patent application after publication |