CN110750621A - 单据数据核查处理方法、装置、计算机设备和存储介质 - Google Patents
单据数据核查处理方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN110750621A CN110750621A CN201910842557.2A CN201910842557A CN110750621A CN 110750621 A CN110750621 A CN 110750621A CN 201910842557 A CN201910842557 A CN 201910842557A CN 110750621 A CN110750621 A CN 110750621A
- Authority
- CN
- China
- Prior art keywords
- information
- product
- detected
- abnormal
- document data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Computational Linguistics (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及异常监控的一种单据数据核查处理方法,所述方法包括:获取多个待测单据数据,对多个待测单据数据分配相应的处理线程;将待测单据数据输入已训练的信息提取模型,输出待测产品信息、待测项目信息和决策信息;根据产品应用范围表和项目应用范围表确定对应的产品属性值和项目属性值;将决策信息与产品属性值不匹配的待测产品信息确定为异常产品,与产品属性值不匹配的待测项目信息确定为异常项目;获取待测单据数据的异常产品数值和异常项目数值;若异常产品数值和异常项目数值超过预设阈值,将对应的待测数据标记为异常单据数据,生成相应的异常提示信息并发送至核验终端。采用本方法能够准确有效地识别和核查存在异常的单据数据。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及异常监控的一种单据数据核查处理方法、装置、计算机设备和存储介质。
背景技术
单据是在经济业务发生时所取得或填制的、载明交易、事项实际情况的书面证明,是进行会计核算的原始资料和重要依据。随着计算机技术领域的迅速发展,许多单据数据采用电子单据形式,以便于对单据数据进行核查。例如,医疗结算单据是用户在医疗机构消费记录的明细数据。结算单据既作为医疗机构对用户的收款凭证,也是用户对医疗机构的缴费凭证。医疗机构会依据结算单据来核对财务收支是否有纰漏,用户会依据结算单据来核对是否有多收费或者不合规收费。同时,收费明细数据是对结算单据的详细补充,可具体查找到收费项目的具体明细及使用时间。
现有的识别异常单据方式中,通常是通过识别预设字段,并划分不同类型的目标字段,将目标字段与预先设置的异常值进行匹配,进而判断单据是否存在异常。然而,对于一些特定领域的单据,例如医疗单据,包含了大量的领域专业信息。现有的方式无法准确有效地识别出单据中的特定目标信息,导致识别异常单据的准确性不高。因此,如何有效提高识别异常单据数据的准确性,成为目前需要解决的技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够准确有效地识别存在异常的单据数据的单据数据核查处理方法、装置、计算机设备和存储介质。
一种单据数据核查处理方法,所述方法包括:
获取多个待测单据数据,所述待测单据数据包括单据标识;
调用多个线程,根据单据标识对多个待测单据数据分配相应的处理线程;
将所述待测单据数据输入至已训练的信息提取模型中,输出所述待测单据数据对应的待测产品信息、待测项目信息和决策信息;
根据预设的产品应用范围表确定与所述待测产品信息对应的产品属性值,根据预设的项目应用范围表确定所述待测项目信息对应的项目属性值;
将所述决策信息与所述产品属性值不匹配的待测产品信息确定为异常产品,将所述决策信息与所述产品属性值不匹配的待测项目信息确定为异常项目;
获取所述待测单据数据中的异常产品数值和异常项目数值;
当所述异常产品数值和异常项目数值超过预设阈值时,将对应的待测数据标记为异常单据数据,根据所述单据标识生成异常提示信息并发送至核验终端。
在其中一个实施例中,所述将所述待测单据数据输入至已训练的信息提取模型中,输出所述待测单据数据对应的待测产品信息、待测项目信息和决策信息的步骤包括:对所述待测单据数据进行分词处理,生成多个候选关键词;根据所述多个候选关键词构建多个节点的候选关键词图集;根据预设算法计算所述多个节点的节点权重,并对节点权重进行排序;根据所述节点权重提取关键词,并生成产品关键词序列、项目关键词序列和决策关键词序列;根据所述产品关键词序列、项目关键词序列和决策关键词序列分别得到对应的待测产品信息和待测项目信息以及决策信息。
在其中一个实施例中,所述对所述待测单据数据进行分词处理,生成多个候选关键词的步骤包括:对所述待测单据数据进行分词处理,得到多个分词结果;根据预设的信息标注算法对分词结果进行标注,得到与分词结果对应的标注序列;对所述标注序列进行指代消解处理,得到多个信息类别对应的候选关键词。
在其中一个实施例中,所述方法还包括:将所述待测产品信息输入已训练的产品冲突检测模型中,通过所述产品冲突检测模型生成多个待测产品信息对;计算多个待测产品信息对的冲突特征,根据所述冲突特征计算多个待测产品信息对的冲突权重;当所述待测产品信息对的冲突权重超过预设冲突阈值时,输出存在冲突特征的待测产品信息对,并将所述待测产品信息对应的待测单据数据标记异常单据数据。
在其中一个实施例中,在根据预设的产品应用范围表确定与所述待测产品信息对应的产品属性值的步骤之前,还包括:获取多个产品数据和项目数据;将所述多个产品数据和项目数据输入已训练的信息提取模型中,提取多个产品数据对应的产品属性信息和多个项目数据对应的项目属性信息;根据多个产品属性信息确定对应的产品应用范围信息,以及多个项目属性信息对应的项目应用范围信息;根据多个产品应用范围信息生成产品应用范围表,根据多个项目应用范围信息生成项目应用范围表。
在其中一个实施例中,所述方法还包括:获取多个产品数据对应的更新产品应用范围,以及多个项目数据对应的更新项目应用范围;根据所述更新产品应用范围生成更新产品应用范围表,根据所述更新项目应用范围生成更新项目应用范围表;将所述更新产品应用范围表作为产品应用范围表,将所述更新项目应用范围表作为项目应用范围表。
一种单据数据核查处理装置,所述装置包括:
数据获取模块,用于获取多个待测单据数据,所述待测单据数据包括单据标识;
任务分配模块,用于调用多个线程,根据单据标识对多个待测单据数据分配相应的处理线程;
信息提取模块,用于将所述待测单据数据输入至已训练的信息提取模型中,输出所述待测单据数据对应的待测产品信息、待测项目信息和决策信息;根据预设的产品应用范围表确定与所述待测产品信息对应的产品属性值,根据预设的项目应用范围表确定所述待测项目信息对应的项目属性值;
异常检测模块,用于将所述决策信息与所述产品属性值不匹配的待测产品信息确定为异常产品,将所述决策信息与所述产品属性值不匹配的待测项目信息确定为异常项目;获取所述待测单据数据中的异常产品数值和异常项目数值;当所述异常产品数值和异常项目数值超过预设阈值时,将对应的待测数据标记为异常单据数据;
异常提示模块,用于根据所述单据标识生成异常提示信息并发送至核验终端。
在其中一个实施例中,所述信息提取模块还用于对所述待测单据数据进行分词处理,生成多个候选关键词;根据所述多个候选关键词构建多个节点的候选关键词图集;根据预设算法计算所述多个节点的节点权重,并对节点权重进行排序;根据所述节点权重提取关键词,并生成产品关键词序列、项目关键词序列和决策关键词序列;根据所述产品关键词序列、项目关键词序列和决策关键词序列分别得到对应的待测产品信息和待测项目信息以及决策信息。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请任意一个实施例中提供的单据数据核查处理方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请任意一个实施例中提供的单据数据核查处理方法的步骤。
上述单据数据核查处理方法、装置、计算机设备和存储介质,服务器获取多个待测单据数据后,对多个待测单据数据分配相应的处理线程进行处理。服务器则通过已训练的信息提取模型提取出待测单据数据中的待测产品信息、待测项目信息和决策信息,通过信息提取模型能够准确有效地提取出待测单据数据中的待测产品信息、待测项目信息和决策信息。服务器进一步根据产品应用范围表和项目应用范围表确定产品属性值和项目属性值,进而将决策信息与产品属性值不匹配的待测产品信息确定为异常产品,将决策信息与产品属性值不匹配的待测项目信息确定为异常项目,从而能够有效分析出待测单据数据中的异常产品和异常项目。服务器获取待测单据数据中的异常产品数值和异常项目数值,当异常产品数值和异常项目数值超过预设阈值时,将对应的待测数据标记为异常单据数据,根据单据标识生成异常提示信息并发送至核验终端,从而能够准确有效识别出存在异常的待测单据数据,并有效对存在异常的单据数据进行监控。
附图说明
图1为一个实施例中单据数据核查处理方法的应用场景图;
图2为一个实施例中单据数据核查处理方法的流程示意图;
图3为一个实施例中对待测单据数据进行信息提取步骤的流程示意图;
图4为一个实施例中对待测单据数据进行分词步骤的流程示意图;
图5为一个实施例中单据数据核查处理装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的单据数据核查处理方法,可以应用于如图1所示的应用环境中。其中,用户终端或结算终端102通过网络与服务器104进行通信,服务器104通过网络与核验终端106进行通信。服务器104可以获取多个用户终端或结算终端102中的待测单据数据,服务器104则对多个待测单据数据分配相应的处理线程进行处理。通过已训练的信息提取模型提取出待测单据数据中的待测产品信息、待测项目信息和决策信息,进一步根据产品应用范围表和项目应用范围表确定产品属性值和项目属性值,进而将决策信息与产品属性值不匹配的待测产品信息确定为异常产品,将决策信息与产品属性值不匹配的待测项目信息确定为异常项目。服务器104获取待测单据数据中的异常产品数值和异常项目数值,当异常产品数值和异常项目数值超过预设阈值时,将对应的待测数据标记为异常单据数据,根据单据标识生成异常提示信息并发送至核验终端106。其中,用户终端或结算终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现,核验终端106可以但不限于是各种个人计算机、笔记本电脑和平板电脑。
在一个实施例中,如图2所示,提供了一种单据数据核查处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取多个待测单据数据,待测单据数据包括单据标识。
其中,待测单据数据可以为待核查的费用结算单据,费用结算单据既作为特定机构对用户的收款凭证,也是用户对相应机构的缴费凭证。
大量的单据数据可以采用分布式存储的方式存储在各个数据库中。服务器可从各个终端或其他分布式服务器中获取多个单据数据。其中,单据数据包括单据标识,还可以包括用户标识。单据数据中包含了产品信息和项目信息以及决策信息。
例如,费用结算单据可以为医疗费用结算单据,医疗费用结算单据包括用户在医疗机构的消费记录以及产品信息和检查项目对应的明细数据。医疗机构会依据结算单据来核对财务收支是否有纰漏;患者会依据结算单据来核对是否有多收费或者不合规收费。同时,收费明细数据是对结算单据的详细补充,可具体查找到收费项目的具体明细及使用时间。可以理解的是,医疗单据数据包括全量医疗结算单据数据以及医疗消费明细数据。
步骤204,调用多个线程,根据单据标识对多个待测单据数据分配相应的处理线程。
服务器获取多个待测单据数据后,则调用多个线程,并根据单据标识对多个待测单据数据分配相应的处理线程,服务器则可以利用多个线程同时对多个待测单据数据进行分析,以实时并行对多个待测单据数据进行核查处理,从而能够有效提高单据数据的核查处理效率。
在其中一个实施例中,为了提高多个待测单据数据的核查处理效率,服务器可以为服务器集群。其中,服务器集群中可以包括多个从节点。服务器获取多个待测单据数据后,根据单据标识将每个待测单数数据生成相应的单据核查任务。服务器根据单据标识将多个单据核查任务分配至对应的从节点,根据节点标识对集群中的多个从节点的当前负载权重进行轮询,得到每个从节点的当前负载权重,主节点根据每个从节点的当前负载权重为多个单据核查任务选择对应的从节点标识。对选择的从节点标识对应的当前负载权重进行平滑处理,利用平滑处理后的结果选择下一个单据标识,直到为多个单据核查任务选择出对应的节点标识。主节点根据被选择的从节点标识将多个单据核查任务分别分配至对应的从节点,使得多个从节点调用多个线程同步对多个单据核查任务进行核查处理。通过多个节点对多个单据核查任务进行并行核查处理,从而能够有效提高单据数据的核查处理效率。
步骤206,将待测单据数据输入至已训练的信息提取模型中,输出待测单据数据对应的待测产品信息、待测项目信息和决策信息。
其中,信息提取模型是指预先训练的用于提取文本信息的模型,信息提取模型可以是基于神经网络的模型。
服务器进一步将将待测单据数据输入至已训练的信息提取模型中,输出待测单据数据对应的待测产品信息、待测项目信息和决策信息。具体地,服务器对待测单据数据进行分词处理,生成多个候选关键词,进而根据多个候选关键词构建多个节点的候选关键词图集。服务器根据预设算法计算多个节点的节点权重,并对节点权重进行排序。根据排序后的节点权重提取关键词,并生成产品关键词序列、项目关键词序列和决策关键词序列。服务器则根据产品关键词序列、项目关键词序列和决策关键词序列分别得到对应的待测产品信息和待测项目信息以及决策信息。
步骤208,根据预设的产品应用范围表确定与待测产品信息对应的产品属性值,根据预设的项目应用范围表确定待测项目信息对应的项目属性值。
其中,产品应用范围表和项目应用范围表可以是预先配置的数据表,也可以利用信息提取模型对大量的单据数据进行分析后,生成的产品应用范围表和项目应用范围表。产品属性值可以表示产品应用范围值,项目属性值可以表示产品应用范围值,产品属性值和项目属性值可以为范围区间相应的数值。
服务器通过信息提取模型提取出待测单据数据中的待测产品信息、待测项目信息和决策信息后,进一步获取产品应用范围表和项目应用范围表,根据预设的产品应用范围表确定与待测产品信息对应的产品属性值,根据预设的项目应用范围表确定待测项目信息对应的项目属性值。
步骤210,将决策信息与产品属性值不匹配的待测产品信息确定为异常产品,将决策信息与产品属性值不匹配的待测项目信息确定为异常项目。
服务器得到待测产品信息对应的产品属性值和待测项目信息对应的项目属性值后,分别将决策信息与产品属性值和项目属性值进行匹配比对,以判断决策信息是否满足相应的产品属性值和项目属性值。
当决策信息与产品属性值不匹配时,表示待测产品信息与实际的决策信息不符,服务器则将对应的待测产品信息确定为异常产品。当决策信息与产品属性值不匹配时,表示待测项目信息与实际的决策信息不符,服务器则将对应的待测项目信息确定为异常项目。
步骤212,获取待测单据数据中的异常产品数值和异常项目数值。
步骤214,当异常产品数值和异常项目数值超过预设阈值时,将对应的待测数据标记为异常单据数据,根据单据标识生成异常提示信息并发送至核验终端。
其中,待测单据数据中可能包含多个产品和项目,当待测单据数据中存在的异常产品以及异常项目超过一定数量时,则表示待测单据数据存在异常。核验终端是指用于进行异常单据数据进行核验的终端。
服务器分析出待测单据数据中的异常产品和异常项目后,获取待测单据数据中的异常产品数值和异常项目数值,当异常产品数值和异常项目数值超过预设阈值时,表示待测单据数据存在异常。服务器则将对应的待测数据标记为异常单据数据,对待测单据数据添加异常标识,根据单据标识生成异常提示信息,服务器进而将异常提示信息发送至相应的核验终端。通过信息提取模型能够准确有效地提取出待测单据数据中的待测产品信息、待测项目信息和决策信息,进而能够有效分析出待测单据数据中的异常产品和异常项目,从而能够准确有效识别出存在异常的待测单据数据。
举例说明,在其中一个实施例中,待测单据数据可以为医疗单据数据,待测产品信息可以是医疗药品信息,医疗药品信息是指存在于各个医疗单据信息中的药品信息。待测项目信息可以是医疗检查信息,医疗检查信息是指存在于各个医疗单据信息中的检查信息,医疗检查信息包括但不限于B超、CT、MRI、放射等。主体诊断信息是指存在于各个医疗单据信息中对于患者的疾病诊断信息,例如该患者患了何种疾病等。医疗单据数据包括医疗药品信息、医疗检查信息以及主体诊断信息中的至少一种。由于每种药品可同时应用至多个病症中,因此药品应用范围是指各个药品对应的疾病应用范围,可具体适用于相应的疾病。检查应用范围是指该项检查可以适用于哪些疾病中。药品应用范围表中包括多个药品对应的使用范围,检查应用范围表中包括多个检测项目对应的使用范围。
服务器获取与各个医疗单据信息对应的主体诊断信息时,可利用已训练的信息提取模型进行提取。服务器根据主体诊断信息确定与各个医疗药品信息对应的药品应用范围,与各个医疗检查信息对应的检查应用范围。例如,当医疗单据信息中的主体诊断信息为“感冒”时,其对应的医疗药品信息为“头孢克洛分散片、维生素C片剂”,则可以得到头孢克洛分散片和维生素C片剂的药品应用范围包括“感冒”。当一医疗单据信息中的主体诊断信息为“感冒”时,其对应的医疗检查信息为“血液检查”,则可以得到血液检查的检查应用范围包括“感冒”。
其中,待检测主体诊断信息是指存在于各个待检测医疗单据信息中对于患者的疾病诊断信息。服务器将待检测主体诊断信息不存在于待检测药品应用范围中时所对应的待检测药品标记为异常药品,将待检测主体诊断信息不存在于待检测检查应用范围中时所对应的待检测检查标记为异常检查。服务器获取异常药品数量信息以及异常检查数量信息,将异常药品数量信息和异常检查数量信息超过预设条件的待检测医疗单据信息列为异常医疗单据信息。通过分析医疗消费单据中的明细数据,可以准确有效地分析出存在异常的医疗消费行为,从而能够有效地对异常医疗单据信息进行核查。
在其中一个实施例中,服务器识别出待测单据数据中的异常产品和异常项目后,将对应的待测数据标记为异常单据数据。进一步地,服务器还可以将异常产品和异常项目在对应的待测单据数据中进行突出显示,其中,突出显示包括但不限于以不同颜色突出显示文本、添加下划线、加粗和对文字进行高亮处理等。从而得到突出显示后的异常单据数据,并根据单据标识生成异常提示信息,服务器进而将突出显示后的异常单据数据和异常提示信息发送至核验终端,使得核验终端对异常单据数据进行进一步核验,接收核验终端发送的与突出显示后的异常单据数据对应的单据核验结果;根据单据核验结果确定异常产品和异常项目。通过引入核验终端,能够使得对于异常产品和异常项目的核查更加准确,从而能够准确有效识别出存在异常的待测单据数据。
上述单据数据核查处理方法中,服务器获取多个待测单据数据后,对多个待测单据数据分配相应的处理线程进行处理。服务器则通过已训练的信息提取模型提取出待测单据数据中的待测产品信息、待测项目信息和决策信息,通过信息提取模型能够准确有效地提取出待测单据数据中的待测产品信息、待测项目信息和决策信息。服务器进一步根据产品应用范围表和项目应用范围表确定产品属性值和项目属性值,进而将决策信息与产品属性值不匹配的待测产品信息确定为异常产品,将决策信息与产品属性值不匹配的待测项目信息确定为异常项目,从而能够有效分析出待测单据数据中的异常产品和异常项目。服务器获取待测单据数据中的异常产品数值和异常项目数值,当异常产品数值和异常项目数值超过预设阈值时,将对应的待测数据标记为异常单据数据,根据单据标识生成异常提示信息并发送至核验终端,从而能够准确有效识别出存在异常的待测单据数据,并有效对存在异常的单据数据进行监控。
在一个实施例中,如图3所示,将待测单据数据输入至已训练的信息提取模型中,输出待测单据数据对应的待测产品信息、待测项目信息和决策信息的步骤,具体包括以下内容:
步骤302,对待测单据数据进行分词处理,生成多个候选关键词。
步骤304,根据多个候选关键词构建多个节点的候选关键词图集。
步骤306,根据预设算法计算多个节点的节点权重,并对节点权重进行排序。
步骤308,根据节点权重提取关键词,并生成产品关键词序列、项目关键词序列和决策关键词序列。
步骤310,根据产品关键词序列、项目关键词序列和决策关键词序列分别得到对应的待测产品信息和待测项目信息以及决策信息。
服务器获取多个待测单据数据后,根据每个待测单据数据的单据标识对多个待测单据数据分配相应的处理线程进行处理。服务器则获取已训练的信息提取模型,将待测单据数据输入至信息提取模型中,通过信息提取模型提取出待测单据数据中的待测产品信息、待测项目信息和决策信息。
具体地,服务器对待测单据数据进行分词处理,生成多个候选关键词,进而根据多个候选关键词构建多个节点的候选关键词图集。服务器根据预设算法计算多个节点的节点权重,并对节点权重进行排序。根据排序后的节点权重提取关键词,并生成产品关键词序列、项目关键词序列和决策关键词序列。服务器则根据产品关键词序列、项目关键词序列和决策关键词序列分别得到对应的待测产品信息和待测项目信息以及决策信息,从而能够准确有效地提取出待测单据数据中的待测产品信息、待测项目信息和决策信息。
在其中一个实施例中,当单据数据为医疗单据时,服务器可以通过信息提取模型提取出医疗单据中的药品信息和医疗检查信息以及诊断信息。具体地,服务器首先对医疗单据信息进行文本句分割,得到多个文本句。服务器进而对多个文本句进行分词处理和词性标注,提取出重要性较高的词汇。服务器则利用提取出的词汇生成候选关键词,并利用候选关键词生成候选关键词图集,生成的候选关键词图集中包括多个节点集和节点。服务器进而根据预设算法计算每个节点的节点权重,并对节点权重进行排序,提取出节点权重达到阈值的节点,进而将提取出的节点对应的词汇作为关键词。服务器进一步计算相邻词汇的相关性,若相关性满足预设阈值,则将多个关键词进行组合,生成关键词序列。例如,服务器可以构建候选关键词图G=(V,E),其中V为节点集,由生成的候选关键词组成,然后采用共现关系构造任两点之间的边,两个节点之间存在边仅当它们对应的词汇在长度为K的窗口中共现。例如,可以根据PageRank算法中的衡量重要性的公式,初始化各节点的权重,然后迭代计算各节点的权重,直至收敛。服务器进而对节点权重进行倒序排序,从而得到最重要的多个单词,作为关键词。服务器根据得到最重要的多个关键词,在医疗单据信息中进行标记,若形成相邻词组,则组合成多词关键词。
服务器进而对生成的关键词进行分类,识别出产品关键词序列、项目关键词序列和决策关键词序列。例如,医疗单据信息中有句子“CT检查…头孢克洛分散片一盒”,如果“CT检查”和“头孢克洛分散片一盒”均属于候选关键词,则组合成“CT检查头孢克洛分散片一盒”加入关键词序列,再进一步得到与各个医疗单据信息对应的医疗药品信息和医疗检查信息以及诊断信息。通过信息提取模型提取关键信息,从而能够准确有效地提取出医疗单据信息中的待测药品信息、待测项目信息和诊断信息。
在一个实施例中,如图4所示,对待测单据数据进行分词处理,生成多个候选关键词的步骤,具体包括以下内容:
步骤402,对待测单据数据进行分词处理,得到多个分词结果。
步骤404,根据预设的信息标注算法对分词结果进行标注,得到与分词结果对应的标注序列。
步骤406,对标注序列进行指代消解处理,得到多个信息类别对应的候选关键词。
其中,单据数据中可能包括汉语文字,和大部分西方语言不同,汉语书面词语之间没有明显的空格标记,文本中的句子以字串的形式出现。因此需要将输入的字串切分为单独的词语,然后在此基础进行其他更高级的分析,这一过程就是分词。标注过程的进行是利用序列标注思想,使用深度学习模型学习各字段的内在联系和特征。标注的输入是一个序列,其输出也是一个序列,进行标注过程中可用词性标注算法进行标注,得到对应的标注序列。
服务器获取多个待测单据数据后,根据每个待测单据数据的单据标识对多个待测单据数据分配相应的处理线程进行处理。服务器则获取已训练的信息提取模型,将待测单据数据输入至信息提取模型中,通过信息提取模型提取出待测单据数据中的待测产品信息、待测项目信息和决策信息。
具体地,服务器首先对医疗单据信息进行文本句分割,得到多个文本句。服务器进而利用预设词库对多个文本句进行分词处理,得到多个分词结果。服务器进而根据预设的信息标注算法对多个分词结果进行标注。其中,标注可以包括词性标注和类别标注。服务器对分词结果进行标注后,则可以得到与分词结果对应的标注序列。服务器进而对标注序列进行指代消解处理,得到多个信息类别对应的候选关键词,从而能够有效地提取出重要性较高的关键词汇。服务器则利用提取出的候选关键词生成候选关键词图集,生成的候选关键词图集中包括多个节点集和节点。服务器根据预设算法计算多个节点的节点权重,并对节点权重进行排序。根据排序后的节点权重提取关键词,并生成产品关键词序列、项目关键词序列和决策关键词序列。服务器则根据产品关键词序列、项目关键词序列和决策关键词序列分别得到对应的待测产品信息和待测项目信息以及决策信息,从而能够准确有效地提取出待测单据数据中的待测产品信息、待测项目信息和决策信息。
例如,当单据数据为医疗单据时,服务器可以利用预先配置的医疗词库对多个文本句进行分词,将医疗单据信息进行分词处理后,能在后续更精确的对医疗单据信息进行标注。服务器可以利用词性标注算法,例如可以采用Pos Tagging算法进行标注,得到对应的标注序列。服务器进一步标注序列进行指代消解处理,得到多个信息类别对应的候选关键词,从而确定各个医疗单据信息对应的医疗药品信息以及医疗检查信息。通过利用指代消解可以找到医疗单据信息中的指代词的实际对象,指代消解就是在篇章中确定代词指向哪个名词短语的问题,指代词即可理解为存在于标注序列中的信息,实际对象为医疗药品信息以及医疗检查信息。通过将医疗单据信息进行分词处理、标注处理、指代消解处理等多个步骤间的配合,能够使得提取出的医疗药品信息以及医疗检查信息更加准确。
在一个实施例中,该方法还包括:将待测产品信息输入已训练的产品冲突检测模型中,通过产品冲突检测模型生成多个待测产品信息对;计算多个待测产品信息对的冲突特征,根据冲突特征计算多个待测产品信息对的冲突权重;当待测产品信息对的冲突权重超过预设冲突阈值时,输出存在冲突特征的待测产品信息对,并将待测产品信息对应的待测单据数据标记异常单据数据。
其中,产品冲突检测模型是指预先训练的用于检测产品之间是否存在冲突的模型,待测产品信息对是指待测产品信息两两组合后检测出存在冲突信息的产品信息对,冲突权重信息是指将待测产品信息对进行冲突打分后得到的权重信息。
服务器获取多个待测单据数据后,对多个待测单据数据分配相应的处理线程进行处理。服务器则通过已训练的信息提取模型提取出待测单据数据中的待测产品信息、待测项目信息和决策信息,通过信息提取模型能够准确有效地提取出待测单据数据中的待测产品信息、待测项目信息和决策信息。服务器进一步根据产品应用范围表和项目应用范围表确定产品属性值和项目属性值。
进而将决策信息与产品属性值不匹配的待测产品信息确定为异常产品,将决策信息与产品属性值不匹配的待测项目信息确定为异常项目,从而能够有效分析出待测单据数据中的异常产品和异常项目。服务器获取待测单据数据中的异常产品数值和异常项目数值,当异常产品数值和异常项目数值超过预设阈值时,表示待测单据数据存在异常,服务器则将对应的待测数据标记为异常单据数据。
进一步地,服务器还可以对产品信息的冲突情况进行分析。具体地,服务器通过信息提取模型提取出待测单据数据中的待测产品信息后,还可以将待测产品信息输入至已训练的产品冲突检测模型中,检测待测产品信息是否存在相互冲突的产品。具体地,服务器通过产品冲突检测模型对待测产品信息中的多个产品信息进行两两组合,生成多个待测产品信息对。服务器进而计算多个待测产品信息对的冲突特征,并利用冲突特征计算多个待测产品信息对的冲突权重。当待测产品信息对的冲突权重超过预设冲突阈值时,则表示待待测产品对之间存在冲突,即待测单据数据存在异常。服务器则通过产品冲突检测模型输出存在冲突特征的待测产品信息对,并将该待测产品信息对应的待测单据数据标记异常单据数据。
服务器根据异常单据数据的单据标识生成异常提示信息,并将异常提示信息发送至核验终端,以使得核验终端对异常单据数据进行核验处理。通过利用产品冲突检测模型检测单据数据中存在冲突的产品信息,从而能够准确有效识别出存在异常的待测单据数据,并有效对存在异常的单据数据进行监控。
例如,当待测产品信息中包括多个药品信息时,服务器可以通过产品冲突检测模型检测出待测产品信息是否存在相冲突的药品信息,当待检测医疗药品信息对的冲突权重高于预设冲突阈值时,再将与待检测医疗药品信息对对应的待检测医疗单据信息列为异常医疗单据信息,能够识别出待检测医疗单据信息中存在冲突特性的药品信息,并将存在冲突特性的药品信息所在的医疗单据标记为异常医疗单据,能够进一步及时给出异常医疗消费行为反馈,及时预防异常医疗消费行为的发生。
在一个实施例中,在根据预设的产品应用范围表确定与所述待测产品信息对应的产品属性值的步骤之前,还包括以下步骤:获取多个产品数据和项目数据;将多个产品数据和项目数据输入已训练的信息提取模型中,提取多个产品数据对应的产品属性信息和多个项目数据对应的项目属性信息;根据多个产品属性信息确定对应的产品应用范围信息,以及多个项目属性信息对应的项目应用范围信息;根据多个产品应用范围信息生成产品应用范围表,根据多个项目应用范围信息生成项目应用范围表。
服务器在对待测单据数据进行核查处理之前,还可以预先构建相应领域的产品应用范围表和项目应用范围表。具体地,服务器获取多个产品数据和项目数据,其中,产品数据包括产品标识,项目数据包括项目标识。服务器对多个产品数据和项目数据进行预处理后,输入至已训练的信息提取模型中,通过信息提取模型识别出多个产品数据对应的产品属性信息,以及多个项目数据对应的项目属性信息。服务器进而根据多个产品属性信息确定各个产品对应的产品应用范围信息,以及根据多个项目属性信息确定各个项目对应的项目应用范围信息。服务器则利用分析得到的多个产品应用范围信息和相应的产品标识构建产品应用范围表,产品应用范围表中包括多个产品标识和对应的产品应用范围。同时利用多个项目应用范围信息和相应的项目标识构建项目应用范围表,项目应用范围表中包括多个项目标识和对应的项目应用范围。从而能够准确有效地构建大量产品信息和项目信息对应的产品应用范围表和项目应用范围表。
例如,服务器可以预先获取大量的医疗产品信息和医疗检查项目信息,通过信息提取模型识别并提取出各个药品信息和检查项目信息对应的药品属性信息以及检查属性信息。并根据药品属性信息确定各个药品信息对应的药品应用范围,与各个检查项目信息对应的项目应用范围,进而根据各个药品信息对应的药品应用范围生成药品应用范围表,根据各个检查项目信息对应的项目应用范围生成项目应用范围表,由此能够有效地构建出包括多个药品信息的药品应用范围表和包括多个检测项目的项目应用范围表。
在一个实施例中,该方法还包括:获取多个产品数据对应的更新产品应用范围,以及多个项目数据对应的更新项目应用范围;根据更新产品应用范围生成更新产品应用范围表,根据更新项目应用范围生成更新项目应用范围表;将更新产品应用范围表作为产品应用范围表,将更新项目应用范围表作为项目应用范围表。
其中,由于科研的不断发展和进步,产品信息的应用范围也可能扩大或者缩小,因此更新产品应用范围是指更新后的产品应用范围,更新项目应用范围是指更新后的项目应用范围。
服务器获取多个产品数据和项目数据;将多个产品数据和项目数据输入已训练的信息提取模型中,提取多个产品数据对应的产品属性信息和多个项目数据对应的项目属性信息;根据多个产品属性信息确定对应的产品应用范围信息,以及多个项目属性信息对应的项目应用范围信息;根据多个产品应用范围信息生成产品应用范围表,根据多个项目应用范围信息生成项目应用范围表。
服务器构建出产品应用范围表和项目应用范围表后,还可以进一步根据预设周期频率对产品应用范围表和项目应用范围表进行更新。具体地,服务器获取多个产品数据对应的更新产品应用范围,以及多个项目数据对应的更新项目应用范围。其中,产品信息库中可以预先存储大量的产品信息以及对应的产品属性信息和大量的项目信息,项目信息库中可以预先存储大量的项目信息以及对应的项目属性信息。当服务器检测到产品信息库中存在更新产品应用范围的产品信息,以及项目信息库中存在更新项目应用范围的项目信息时,获取获取多个产品数据对应的更新产品应用范围,以及多个项目数据对应的更新项目应用范围。服务器进而根据更新产品应用范围生成更新产品应用范围表,根据更新项目应用范围生成更新项目应用范围表,并将更新产品应用范围表作为产品应用范围表,将更新项目应用范围表作为项目应用范围表。通过对产品应用范围表和项目应用范围表进行更新,能够使得对于异常单据数据的识别更加准确,从而能够有效提高异常单据数据的核查准确性。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种单据数据核查处理装置,包括:数据获取模块502、任务分配模块504、信息提取模块506、异常检测模块508和异常提示模块510,其中:
数据获取模块502,用于获取多个待测单据数据,待测单据数据包括单据标识;
任务分配模块504,用于调用多个线程,根据单据标识对多个待测单据数据分配相应的处理线程;
信息提取模块506,用于将待测单据数据输入至已训练的信息提取模型中,输出待测单据数据对应的待测产品信息、待测项目信息和决策信息;根据预设的产品应用范围表确定与待测产品信息对应的产品属性值,根据预设的项目应用范围表确定待测项目信息对应的项目属性值;
异常检测模块508,用于将决策信息与产品属性值不匹配的待测产品信息确定为异常产品,将决策信息与产品属性值不匹配的待测项目信息确定为异常项目;获取待测单据数据中的异常产品数值和异常项目数值;当异常产品数值和异常项目数值超过预设阈值时,将对应的待测数据标记为异常单据数据;
异常提示模块510,用于根据单据标识生成异常提示信息并发送至核验终端。
在一个实施例中,信息提取模块506还用于对待测单据数据进行分词处理,生成多个候选关键词;根据多个候选关键词构建多个节点的候选关键词图集;根据预设算法计算多个节点的节点权重,并对节点权重进行排序;根据节点权重提取关键词,并生成产品关键词序列、项目关键词序列和决策关键词序列;根据产品关键词序列、项目关键词序列和决策关键词序列分别得到对应的待测产品信息和待测项目信息以及决策信息。
在一个实施例中,信息提取模块506还用于对待测单据数据进行分词处理,得到多个分词结果;根据预设的信息标注算法对分词结果进行标注,得到与分词结果对应的标注序列;对标注序列进行指代消解处理,得到多个信息类别对应的候选关键词。
在一个实施例中,异常检测模块508还用于将待测产品信息输入已训练的产品冲突检测模型中,通过产品冲突检测模型生成多个待测产品信息对;计算多个待测产品信息对的冲突特征,根据冲突特征计算多个待测产品信息对的冲突权重;当待测产品信息对的冲突权重超过预设冲突阈值时,输出存在冲突特征的待测产品信息对,并将待测产品信息对应的待测单据数据标记异常单据数据。
在一个实施例中,信息提取模块506还用于获取多个产品数据和项目数据;将多个产品数据和项目数据输入已训练的信息提取模型中,提取多个产品数据对应的产品属性信息和多个项目数据对应的项目属性信息;根据多个产品属性信息确定对应的产品应用范围信息,以及多个项目属性信息对应的项目应用范围信息;根据多个产品应用范围信息生成产品应用范围表,根据多个项目应用范围信息生成项目应用范围表。
在一个实施例中,该装置还包括信息更新模块,用于获取多个产品数据对应的更新产品应用范围,以及多个项目数据对应的更新项目应用范围;根据更新产品应用范围生成更新产品应用范围表,根据更新项目应用范围生成更新项目应用范围表;将更新产品应用范围表作为产品应用范围表,将更新项目应用范围表作为项目应用范围表。
关于单据数据核查处理装置的具体限定可以参见上文中对于单据数据核查处理方法的限定,在此不再赘述。上述单据数据核查处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待测单据数据、产品应用范围表和项目应用范围表等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现本申请任意一个实施例中提供的单据数据核查处理方法的步骤。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请任意一个实施例中提供的单据数据核查处理方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种单据数据核查处理方法,所述方法包括:
获取多个待测单据数据,所述待测单据数据包括单据标识;
调用多个线程,根据单据标识对多个待测单据数据分配相应的处理线程;
将所述待测单据数据输入至已训练的信息提取模型中,输出所述待测单据数据对应的待测产品信息、待测项目信息和决策信息;
根据预设的产品应用范围表确定与所述待测产品信息对应的产品属性值,根据预设的项目应用范围表确定所述待测项目信息对应的项目属性值;
将所述决策信息与所述产品属性值不匹配的待测产品信息确定为异常产品,将所述决策信息与所述产品属性值不匹配的待测项目信息确定为异常项目;
获取所述待测单据数据中的异常产品数值和异常项目数值;
当所述异常产品数值和异常项目数值超过预设阈值时,将对应的待测数据标记为异常单据数据,根据所述单据标识生成异常提示信息并发送至核验终端。
2.根据权利要求1所述的方法,其特征在于,所述将所述待测单据数据输入至已训练的信息提取模型中,输出所述待测单据数据对应的待测产品信息、待测项目信息和决策信息的步骤包括:
对所述待测单据数据进行分词处理,生成多个候选关键词;
根据所述多个候选关键词构建多个节点的候选关键词图集;
根据预设算法计算所述多个节点的节点权重,并对节点权重进行排序;
根据所述节点权重提取关键词,并生成产品关键词序列、项目关键词序列和决策关键词序列;
根据所述产品关键词序列、项目关键词序列和决策关键词序列分别得到对应的待测产品信息和待测项目信息以及决策信息。
3.根据权利要求2所述的方法,其特征在于,所述对所述待测单据数据进行分词处理,生成多个候选关键词的步骤包括:
对所述待测单据数据进行分词处理,得到多个分词结果;
根据预设的信息标注算法对分词结果进行标注,得到与分词结果对应的标注序列;
对所述标注序列进行指代消解处理,得到多个信息类别对应的候选关键词。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
将所述待测产品信息输入已训练的产品冲突检测模型中,通过所述产品冲突检测模型生成多个待测产品信息对;
计算多个待测产品信息对的冲突特征,根据所述冲突特征计算多个待测产品信息对的冲突权重;
当所述待测产品信息对的冲突权重超过预设冲突阈值时,输出存在冲突特征的待测产品信息对,并将所述待测产品信息对应的待测单据数据标记异常单据数据。
5.根据权利要求1所述的方法,其特征在于,在根据预设的产品应用范围表确定与所述待测产品信息对应的产品属性值的步骤之前,还包括:
获取多个产品数据和项目数据;
将所述多个产品数据和项目数据输入已训练的信息提取模型中,提取多个产品数据对应的产品属性信息和多个项目数据对应的项目属性信息;
根据多个产品属性信息确定对应的产品应用范围信息,以及多个项目属性信息对应的项目应用范围信息;
根据多个产品应用范围信息生成产品应用范围表,根据多个项目应用范围信息生成项目应用范围表。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取多个产品数据对应的更新产品应用范围,以及多个项目数据对应的更新项目应用范围;
根据所述更新产品应用范围生成更新产品应用范围表,根据所述更新项目应用范围生成更新项目应用范围表;
将所述更新产品应用范围表作为产品应用范围表,将所述更新项目应用范围表作为项目应用范围表。
7.一种单据数据核查处理装置,所述装置包括:
数据获取模块,用于获取多个待测单据数据,所述待测单据数据包括单据标识;
任务分配模块,用于调用多个线程,根据单据标识对多个待测单据数据分配相应的处理线程;
信息提取模块,用于将所述待测单据数据输入至已训练的信息提取模型中,输出所述待测单据数据对应的待测产品信息、待测项目信息和决策信息;根据预设的产品应用范围表确定与所述待测产品信息对应的产品属性值,根据预设的项目应用范围表确定所述待测项目信息对应的项目属性值;
异常检测模块,用于将所述决策信息与所述产品属性值不匹配的待测产品信息确定为异常产品,将所述决策信息与所述产品属性值不匹配的待测项目信息确定为异常项目;获取所述待测单据数据中的异常产品数值和异常项目数值;当所述异常产品数值和异常项目数值超过预设阈值时,将对应的待测数据标记为异常单据数据;
异常提示模块,用于根据所述单据标识生成异常提示信息并发送至核验终端。
8.根据权利要求7所述的装置,其特征在于,所述信息提取模块还用于对所述待测单据数据进行分词处理,生成多个候选关键词;根据所述多个候选关键词构建多个节点的候选关键词图集;根据预设算法计算所述多个节点的节点权重,并对节点权重进行排序;根据所述节点权重提取关键词,并生成产品关键词序列、项目关键词序列和决策关键词序列;根据所述产品关键词序列、项目关键词序列和决策关键词序列分别得到对应的待测产品信息和待测项目信息以及决策信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910842557.2A CN110750621A (zh) | 2019-09-06 | 2019-09-06 | 单据数据核查处理方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910842557.2A CN110750621A (zh) | 2019-09-06 | 2019-09-06 | 单据数据核查处理方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110750621A true CN110750621A (zh) | 2020-02-04 |
Family
ID=69276128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910842557.2A Pending CN110750621A (zh) | 2019-09-06 | 2019-09-06 | 单据数据核查处理方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110750621A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114612887A (zh) * | 2021-09-01 | 2022-06-10 | 腾讯科技(深圳)有限公司 | 单据异常检测方法、装置、设备及计算机可读存储介质 |
CN115841302A (zh) * | 2022-11-15 | 2023-03-24 | 四川智慧高速科技有限公司 | 数据核查方法、电子设备和可读介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944011A (zh) * | 2017-12-08 | 2018-04-20 | 中国平安财产保险股份有限公司 | 团体保单数据的处理方法、装置、服务器和存储介质 |
CN108537592A (zh) * | 2018-04-10 | 2018-09-14 | 网易(杭州)网络有限公司 | 交易检测方法、装置,存储介质和电子装置 |
CN109191314A (zh) * | 2018-08-14 | 2019-01-11 | 平安医疗健康管理股份有限公司 | 单据报销方法、装置、计算机设备和存储介质 |
CN109255013A (zh) * | 2018-08-14 | 2019-01-22 | 平安医疗健康管理股份有限公司 | 理赔决策方法、装置、计算机设备和存储介质 |
CN109545387A (zh) * | 2018-10-30 | 2019-03-29 | 平安科技(深圳)有限公司 | 一种基于神经网络的异常病例识别方法及计算设备 |
CN109635005A (zh) * | 2018-12-13 | 2019-04-16 | 平安医疗健康管理股份有限公司 | 异常数据检测方法、装置、设备及存储介质 |
-
2019
- 2019-09-06 CN CN201910842557.2A patent/CN110750621A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944011A (zh) * | 2017-12-08 | 2018-04-20 | 中国平安财产保险股份有限公司 | 团体保单数据的处理方法、装置、服务器和存储介质 |
CN108537592A (zh) * | 2018-04-10 | 2018-09-14 | 网易(杭州)网络有限公司 | 交易检测方法、装置,存储介质和电子装置 |
CN109191314A (zh) * | 2018-08-14 | 2019-01-11 | 平安医疗健康管理股份有限公司 | 单据报销方法、装置、计算机设备和存储介质 |
CN109255013A (zh) * | 2018-08-14 | 2019-01-22 | 平安医疗健康管理股份有限公司 | 理赔决策方法、装置、计算机设备和存储介质 |
CN109545387A (zh) * | 2018-10-30 | 2019-03-29 | 平安科技(深圳)有限公司 | 一种基于神经网络的异常病例识别方法及计算设备 |
CN109635005A (zh) * | 2018-12-13 | 2019-04-16 | 平安医疗健康管理股份有限公司 | 异常数据检测方法、装置、设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114612887A (zh) * | 2021-09-01 | 2022-06-10 | 腾讯科技(深圳)有限公司 | 单据异常检测方法、装置、设备及计算机可读存储介质 |
CN115841302A (zh) * | 2022-11-15 | 2023-03-24 | 四川智慧高速科技有限公司 | 数据核查方法、电子设备和可读介质 |
CN115841302B (zh) * | 2022-11-15 | 2023-11-21 | 四川智慧高速科技有限公司 | 数据核查方法、电子设备和可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Alimova et al. | Multiple features for clinical relation extraction: A machine learning approach | |
CN109446511B (zh) | 裁判文书处理方法、装置、计算机设备和存储介质 | |
CN110021439A (zh) | 基于机器学习的医疗数据分类方法、装置和计算机设备 | |
CN111339126A (zh) | 医疗数据筛选方法、装置、计算机设备和存储介质 | |
CN112035674B (zh) | 导诊数据获取方法、装置、计算机设备和存储介质 | |
Verbeke et al. | A statistical relational learning approach to identifying evidence based medicine categories | |
CN108664595B (zh) | 领域知识库构建方法、装置、计算机设备和存储介质 | |
US10445623B2 (en) | Label consistency for image analysis | |
CN111145910A (zh) | 基于人工智能的异常案例识别方法、装置、计算机设备 | |
WO2020177365A1 (zh) | 基于数据挖掘的社保数据处理方法、装置和计算机设备 | |
CN110797101A (zh) | 医学数据处理方法、装置、可读存储介质和计算机设备 | |
CN111180086B (zh) | 数据匹配方法、装置、计算机设备和存储介质 | |
CN110782965A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN110555103A (zh) | 生物医学实体展示平台的构建方法、装置和计算机设备 | |
US11481722B2 (en) | Automated extraction, inference and normalization of structured attributes for product data | |
Erraguntla et al. | Inference of missing ICD 9 codes using text mining and nearest neighbor techniques | |
CN112035619A (zh) | 基于人工智能的医疗问诊单筛选方法、装置、设备和介质 | |
CN110750621A (zh) | 单据数据核查处理方法、装置、计算机设备和存储介质 | |
CN112035614A (zh) | 测试集生成方法、装置、计算机设备和存储介质 | |
Williams et al. | Understanding and inferring units in spreadsheets | |
Roller et al. | Self-supervised relation extraction using UMLS | |
CN113241193B (zh) | 药物推荐模型训练方法、推荐方法、装置、设备及介质 | |
CN109997201A (zh) | 针对多种医学知识模块的利用数据驱动方法的精确临床决策支持 | |
CN114662477A (zh) | 基于中医对话的停用词表生成方法、装置及存储介质 | |
JP2022504508A (ja) | モデル支援型事象予測のためのシステム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200204 |
|
RJ01 | Rejection of invention patent application after publication |