CN118095794A - 基于正则算法的工单信息提取方法及系统 - Google Patents

基于正则算法的工单信息提取方法及系统 Download PDF

Info

Publication number
CN118095794A
CN118095794A CN202410491086.6A CN202410491086A CN118095794A CN 118095794 A CN118095794 A CN 118095794A CN 202410491086 A CN202410491086 A CN 202410491086A CN 118095794 A CN118095794 A CN 118095794A
Authority
CN
China
Prior art keywords
work order
division
level
type
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410491086.6A
Other languages
English (en)
Other versions
CN118095794B (zh
Inventor
王芳禄
鲁菲
姜凌
韩彦国
刘武
隋政澔
梁海洪
沈晓舟
匡倩莹
周涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Liaoning Electric Power Co Ltd
Original Assignee
State Grid Liaoning Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Liaoning Electric Power Co Ltd filed Critical State Grid Liaoning Electric Power Co Ltd
Priority to CN202410491086.6A priority Critical patent/CN118095794B/zh
Publication of CN118095794A publication Critical patent/CN118095794A/zh
Application granted granted Critical
Publication of CN118095794B publication Critical patent/CN118095794B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种基于正则算法的工单信息提取方法及系统,涉及信息提取技术领域,该方法包括:对工单设置参数进行类型标注;基于标注类型对各工单设置参数进行聚类,设定各聚类集群的正则表达式;根据作业人员时间分工、等级分工、类型分工配置多级分工决策树,提取各级别匹配分类参数;建立各级别匹配分类参数与各正则表达式的映射关系,构建多级正则表达式;利用多级正则表达式进行内容提取及分工匹配。通过本申请可以解决现有工单信息提取方法存在待分配工单与作业人员属性的分析匹配度较低,造成工单信息提取的准确性和可靠性较低的技术问题,可以确保工单信息提取的准确性和可靠性,达到提高工单分派的效率和准确性的效果。

Description

基于正则算法的工单信息提取方法及系统
技术领域
本申请涉及信息提取技术领域,尤其涉及一种基于正则算法的工单信息提取方法及系统。
背景技术
客户投诉处理是企业与客户沟通的重要环节,它涉及从接收投诉、分析原因、解决问题到后续跟踪的一系列步骤,对企业具有极其重要的意义,它不仅是维护客户关系的必要手段,也是企业改进产品和服务、提升竞争力的关键途径。
传统投诉处理过程中,主要依靠人工客服进行信息记录和分类整理,然后再将任务指派给相关部门和人员进行处理,这种方法无法精准分析待分配工单需求与作业人员信息的匹配度,导致工单信息提取的准确性和可靠性较低,造成工单分配的准确性和可靠性较差,同时人工派单的作业方式速度较慢,影响了工单分配的效率。
综上所述,现有工单信息提取方法由于无法针对性地对待分配工单与作业人员属性进行精准匹配分析,导致待分配工单与作业人员属性的分析匹配度较低,造成工单信息提取的准确性和可靠性较低的技术问题。
发明内容
本申请的目的是提供一种基于正则算法的工单信息提取方法及系统,用以解决现有工单信息提取方法由于无法针对性地对待分配工单与作业人员属性进行精准匹配分析,导致待分配工单与作业人员属性的分析匹配度较低,造成工单信息提取的准确性和可靠性较低的技术问题。
鉴于上述问题,本申请提供了一种基于正则算法的工单信息提取方法及系统。
第一方面,本申请提供了一种基于正则算法的工单信息提取方法,所述方法通过一种基于正则算法的工单信息提取系统实现,其中,所述方法包括:获取工单设置参数,对所述工单设置参数进行类型标注,其中,标注类型包括数字、时间、文本、网络链接;采集作业人员分工,包括作业人员时间分工、作业等级分工、作业类型分工;基于所述标注类型,对各工单设置参数进行聚类,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取;根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,提取各级别匹配分类参数,所述各级别匹配分类参数为多级分工决策树中各级分类的参数类别,所述参数类别包括作业人员时间、作业等级、作业类型;建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,其中,所述映射关系为所述参数类别与正则表达式中标注类型的一一映射关系;利用所述多级正则表达式生成提取模块,对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息。
第二方面,本申请还提供了一种基于正则算法的工单信息提取系统,用于执行如第一方面所述的一种基于正则算法的工单信息提取方法,其中,所述系统包括:参数类型标注模块,所述参数类型标注模块用于获取工单设置参数,对所述工单设置参数进行类型标注,其中,标注类型包括数字、时间、文本、网络链接;作业人员分工采集模块,所述作业人员分工采集模块用于采集作业人员分工,包括作业人员时间分工、作业等级分工、作业类型分工;正则表达式设定模块,所述正则表达式设定模块用于基于所述标注类型,对各工单设置参数进行聚类,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取;匹配分类参数提取模块,所述匹配分类参数提取模块用于根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,提取各级别匹配分类参数,所述各级别匹配分类参数为多级分工决策树中各级分类的参数类别,所述参数类别包括作业人员时间、作业等级、作业类型;多级正则表达式构建模块,所述多级正则表达式构建模块用于建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,其中,所述映射关系为所述参数类别与正则表达式中标注类型的一一映射关系;工单信息获取模块,所述工单信息获取模块用于利用所述多级正则表达式生成提取模块,对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
通过获取工单设置参数,对所述工单设置参数进行类型标注,其中,标注类型包括数字、时间、文本、网络链接;采集作业人员分工,包括作业人员时间分工、作业等级分工、作业类型分工;基于所述标注类型,对各工单设置参数进行聚类,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取;根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,提取各级别匹配分类参数,所述各级别匹配分类参数为多级分工决策树中各级分类的参数类别,所述参数类别包括作业人员时间、作业等级、作业类型;建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,其中,所述映射关系为所述参数类别与正则表达式中标注类型的一一映射关系;利用所述多级正则表达式生成提取模块,对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息。也就是说,通过基于标注类型对工单设置参数进行聚类,得到各聚类集群的正则表达式;另一方面根据作业人员时间分工、作业等级分工、作业类型分工配置多级分工决策树,提取获得各级别匹配分类参数;接着建立各级别匹配分类参数与各聚类集群的正则表达式的映射关系,并基于映射关系构建多级正则表达式;最后利用多级正则表达式对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息,可以提高待分配工单与作业人员属性分析的精细化程度,进而提高待分配工单与作业人员属性的适配度,达到确保工单信息提取的准确性和可靠性,进而提高工单分派的效率、准确性和可靠性的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其他特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请一种基于正则算法的工单信息提取方法的流程示意图;
图2为本申请一种基于正则算法的工单信息提取方法中设定各聚类集群的正则表达式的流程示意图;
图3为本申请一种基于正则算法的工单信息提取系统的结构示意图。
附图标记说明:
参数类型标注模块11,作业人员分工采集模块12,正则表达式设定模块13,匹配分类参数提取模块14,多级正则表达式构建模块15,工单信息获取模块16。
具体实施方式
本申请通过提供一种基于正则算法的工单信息提取方法及系统,解决了现有工单信息提取方法由于无法针对性地对待分配工单与作业人员属性进行精准匹配分析,导致待分配工单与作业人员属性的分析匹配度较低,造成工单信息提取的准确性和可靠性较低的技术问题。可以提高待分配工单与作业人员属性分析的精细化程度,进而提高待分配工单与作业人员属性的适配度,达到确保工单信息提取的准确性和可靠性,进而提高工单分派的效率、准确性和可靠性的技术效果。
下面,将参考附图对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。基于本申请的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部。
实施例一
请参阅附图1,本申请提供了一种基于正则算法的工单信息提取方法,其中,所述方法应用于一种基于正则算法的工单信息提取系统,所述方法具体包括如下步骤:
步骤一:获取工单设置参数,对所述工单设置参数进行类型标注,其中,标注类型包括数字、时间、文本、网络链接;
具体而言,本申请提供的方法用于基于正则算法对现有的工单信息提取方法进行优化,来达到确保工单信息提取的准确性和可靠性,进而提高工单分派的效率、准确性和可靠性的技术效果,所述方法具体实施于一种基于正则算法的工单信息提取系统。
首先,获取工单设置参数,所述工单设置参数是指工单的设置类目,包括工单类型、工单优先级、工单状态、处理时间、截止日期等,可根据实际情况进行设置。然后对所述工单设置参数进行类型标注,其中标注类型包括数字、时间、文本和网络链接,其中网络链接是指从一个网页指向一个目标的连接关系,这个目标可以是另一个网页、图片、电子邮件地址等,通过点击这个链接,可以方便地跳转到目标内容或执行相应的操作。通过对工单设置参数进行类型标注,为下一步进行工单设置参数聚类提供了支持,同时可以提高工单设置参数聚类的精细度和准确性。
步骤二:采集作业人员分工,包括作业人员时间分工、作业等级分工、作业类型分工;
具体而言,连接人员管理系统,并基于所述人员管理系统采集作业人员分工,其中所述作业人员分工包括作业人员时间分工、作业等级分工、作业类型分工,所述作业人员时间分工是指作业人员的工作时间段;所述作业等级分工是指作业人员处理问题的能力,其中作业人员能力越强,作业等级越高,例如:等级高的作业人员可用于处理VIP客户;所述作业类型分工可基于实际情况进行设置,例如:应急抢修、故障处理等。通过获取作业人员分工,可以清晰获取作业人员属性信息,同时为下一步进行多级分工决策,得到各级别匹配分类参数提供了数据支持。
步骤三:基于所述标注类型,对各工单设置参数进行聚类,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取;
具体而言,根据所述标注类型对各工单设置参数进行聚类,即将处于同一标注类型的工单设置参数聚为一类,得到多个聚类集群;进一步基于正则算法对所述多个聚类集群进行正则表达式设置,得到各聚类集群的正则表达式,其中所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取,所述正则表达式包括多种字符串类型,即提取工单内容中符合类型要求的字符串。通过构建各聚类集群的正则表达式,可以提高工单信息提取的精细度和准确性,同时可以提高工单信息提取效率和自动化程度。
步骤四:根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,提取各级别匹配分类参数,所述各级别匹配分类参数为多级分工决策树中各级分类的参数类别,所述参数类别包括作业人员时间、作业等级、作业类型;
具体而言,首先,对所述作业人员时间分工、作业等级分工、作业类型分工进行优先级划分,其中优先级划分结果基于工单处理要求进行设置,哪项指标的重要程度越高,则对应的优先级越高。然后基于优先级划分结果配置多级分工决策树,其中所述多级分工决策树包括存在优先级的时间分工决策分支、等级分工决策分支和类型分工决策分支;接着基于所述多级分工决策树提取各级别匹配分类参数,其中各级别匹配分类参数为多级分工决策树中各级分类的参数类别,所述参数类别包括作业人员时间、作业等级、作业类型。
通过基于工单处理要求对作业人员时间分工、作业等级分工、作业类型分工进行优先级划分,并根据优先级划分结果配置多级分工决策树,可以提高作业人员属性信息划分的精细度,从而提高作业人员与待分配工单匹配的精度和准确性。
步骤五:建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,其中,所述映射关系为所述参数类别与正则表达式中标注类型的一一映射关系;
具体而言,接着建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,即将所述各级别匹配分类参数中不同级别对应参数类别与所述各聚类集群的正则表达式中的标注类型进行映射关联,比如:假设参数类别为工单时间,则建立工单时间与时间正则表达式的映射关联,基于所述映射关联生成多级正则表达式。
通过将各级别匹配分类参数与各聚类集群的正则表达式映射关联,生成多级正则表达式,可以提高匹配分类参数与正则表达式的匹配度,从而提高工单信息提取的准确性和可靠性。
步骤六:利用所述多级正则表达式生成提取模块,对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息。
具体而言,基于所述多级正则表达式构建信息提取模块,并将所述待分配工单信息输入所述信息提取模块进行内容提取,得到工单提取信息;进一步根据所述工单提取信息匹配获得作业人员,得到工单匹配分工信息,最后根据所述工单匹配分工信息自动进行工单分派,可以提高工单废牌的效率和准确性。
所述一种基于正则算法的工单信息提取方法应用于一种基于正则算法的工单信息提取系统,可以解决现有工单信息提取方法由于无法针对性地对待分配工单与作业人员属性进行精准匹配分析,导致待分配工单与作业人员属性的分析匹配度较低,造成工单信息提取的准确性和可靠性较低的技术问题。首先,获取工单设置参数,对所述工单设置参数进行类型标注,其中,标注类型包括数字、时间、文本、网络链接;然后,采集作业人员分工,包括作业人员时间分工、作业等级分工、作业类型分工;接着,基于所述标注类型,对各工单设置参数进行聚类,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取;接下来,根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,提取各级别匹配分类参数;此外,建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式;最后,利用所述多级正则表达式生成提取模块,对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息。通过基于标注类型对工单设置参数进行聚类,得到各聚类集群的正则表达式;另一方面根据作业人员时间分工、作业等级分工、作业类型分工配置多级分工决策树,提取获得各级别匹配分类参数;接着建立各级别匹配分类参数与各聚类集群的正则表达式的映射关系,并基于映射关系构建多级正则表达式;最后利用多级正则表达式对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息,可以提高待分配工单与作业人员属性分析的精细化程度,进而提高待分配工单与作业人员属性的适配度,达到确保工单信息提取的准确性和可靠性,进而提高工单分派的效率、准确性和可靠性的技术效果。
进一步,对所述工单设置参数进行类型标注,本申请步骤一包括:
基于所述工单设置参数,获取参数录入内容;
根据所述数字、时间、文本、网络链接,确定识别特征;
对所述参数录入内容进行类型、格式分析,与所述识别特征进行遍历匹配,确定所述工单设置参数的内容类型,设置所述数字、时间、文本、网络链接的类型标识,利用所述类型标识对所述工单设置参数进行类型标注。
具体而言,首先,根据所述工单设置参数,读取参数录入内容,所述参数录入内容是指工单设置参数对应的具体值,例如:工单截止日期3月18日,工单类型故障投诉等;然后根据所述数字、时间、文本、网络链接对所述参数录入内容进行识别,确定所述参数录入内容的类型特征。接着对所述参数录入内容进行类型、格式分析,其中类型分析是指确定所述参数录入内容的数据类型,其中包括数值型数据、字符型数据、日期数据、文字数据等;格式分析是指确定所述参数录入内容的数据格式,例如:纯文本格式、音频格式等,得到类型分析结果和格式分析结果;进一步将所述类型分析结果和所述格式分析结果进行遍历匹配,确定所述工单设置参数的内容类型,并对所述参数录入内容进行数字、时间、文本、网络链接的类型标识,并根据所述类型标识对所述工单设置参数进行类型标注。
进一步,本申请还包括如下步骤:
获取异常提取样本集;
基于所述异常提取样本集,进行工单设置参数追溯,确定异常工单设置参数,并提取所述异常工单设置参数的工单内容;
对所述异常工单设置参数的工单内容进行异常识别,判断与所述识别特征的匹配度;
若匹配度不满足要求,对所述异常工单设置参数的工单内容进行格式转换,判断格式转换后内容是否与识别特征匹配;
若仍不匹配,根据所述异常工单设置参数的工单内容进行类型分析,对所述异常工单设置参数的标注类型进行调整。
具体而言,获取异常提取样本集,其中异常提取样本是指不符合预期要求的工单提取信息或者明显存在错误的工单提取信息。然后基于所述异常提取样本集进行工单设置参数追溯,得到异常提取样本对应的异常工单设置参数,其中异常工单设置参数和异常提取样本一一对应,并获取所述异常工单设置参数的工单内容。接着对所述异常工单设置参数的工单内容进行异常识别,确定工单内容识别结果,进一步将所述工单内容识别结果与所述识别特征进行偏差比对,根据偏差值生成匹配度,其中偏差值和匹配度成反比,即偏差值越小,对应的匹配度越大。
获取预设匹配度阈值,所述预设匹配度阈值本领域技术人员可根据实际需求进行设置,其中需求质量越高,则预设匹配度阈值越大。基于所述预设匹配度阈值对所述匹配度进行判断,若所述匹配度小于所述预设匹配度阈值,表征所述匹配度不满足要求,则对所述异常工单设置参数的工单内容进行格式转换,并进一步判断格式转换后的内容与所述识别特征的匹配度是否大于等于所述预设匹配度阈值,若否,则根据所述异常工单设置参数的工单内容进行类型分析,并根据类型分析结果对所述异常工单设置参数的标注类型进行调整,比如:新增标注类型等。例如:针对个别应用场景,可能存在参数格式不固定或者存在异常特征的情况,此时对异常的识别案例进行分析,并根据分析结果确定是否存在特殊格式,比如不是纯数字的参数录入内容,无法进行数字表达式识别,可以调整为文本类型,或者按照数字和文字的组合表达式进行类型标注。
通过对异常个例进行分析,并根据分析结果对异常工单设置参数的标注类型进行调整,可以提高标注类型设置的灵活性和准确性,进而提高工单设置参数聚类的精准度。
进一步,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取,如附图2所示,本申请步骤三包括:
获取正则算法的表达式组成要求,包括表达式基础结构、元字符、锚点、分组、转义字符、量词;
基于所述标注类型,采集正则提取案例,并基于所述表达式组成要求进行标识,构建学习样本集;
利用所述学习样本集进行神经网络模型训练,构建正则表达式识别构建模型;
将所述各聚类集群的工单内容、提取要求作为模型输入,通过所述正则表达式识别构建模型进行分解识别、并按照基础结构进行投射组合,获取正则表达式。
具体而言,正则表达式是一种非常强大的文本处理工具,它在文本搜索、数据验证、文本替换和提取等方面有着广泛的应用,熟练掌握正则表达式的使用,可以极大地提高文本处理的效率和准确性。
首先,获取正则算法的表达式组成要求,其中所述表达式组成要求包括表达式基础结构、元字符、锚点、分组、转义字符、量词,其中表达式基础结构是指最基本的正则表达式元素的基本架构;元字符是指具有特殊意义的字符,用于定义搜索模式的规则,如*代表0次或多次匹配,+代表1次或多次匹配等;锚点用于指定匹配,必须出现在行首或行尾;分组是指使用()将字符组合在一起作为一个整体进行匹配;转义字符通过使用反斜杠\对其进行转义,转义字符使得特殊字符失去其原有的特殊意义,从而可以匹配该字符本身;量词是指前面的字符或字符集出现的次数。接着以所述标注类型为检索条件,采集正则提取案例,所述正则提取案例是指与所述标注类型相同的历史正则提取记录;进一步基于所述表达式组成要求对所述正则提取案例进行标识,即将所述正则提取案例中的内容标识为表达式基础结构、元字符、锚点、分组、转义字符、量词等类型,并基于标识后的正则提取案例构建学习样本集。
基于BP神经网络构建正则表达式识别构建模型,所述正则表达式识别构建模型为机器学习中可以进行迭代优化的神经网络模型,通过训练数据集进行监督训练获得;所述正则表达式识别构建模型包括输入层、多个隐含层和一个输出层,其中输入层的输入数据为工单内容、表达式组成要求,输出层的输出数据为内容提取结果;然后将所述学习样本集作为样本训练数据,对所述正则表达式识别构建模型进行监督训练,直到获得符合预期收敛约束的正则表达式识别构建模型,所述预期收敛约束为输出准确率指标,本领域技术人员可基于实际情况进行设置。
最后将所述各聚类集群的工单内容、提取要求作为输入数据输入所述正则表达式识别构建模型,所述提取要求为所述表达式组成要求中的多个或全部,可根据实际需求自行设置,通过所述正则表达式识别构建模型进行分解识别,得到内容提取结果;进一步将内容提取结果按照基础结构进行投射组合,得到正则表达式。通过基于BP神经网络构建正则表达式识别构建模型,可以通过神经网络对表达式组成格式进行监督训练,从而提高正则表达式得到的效率和准确性。其中正则表达式的是通过匹配、替换、提取字符串的方式进行信息提取,其中匹配过程包括扫描文本、尝试匹配、回溯、获取匹配结果,然后基于匹配结果进行信息提取,例如:提取电子邮件地址、URL、电话号码、身份证号码等;比如提取电话号码的正则表达式为:\b\d{3}[-\s.]?\d{3}[-\s.]?\d{4}\b,在这个正则表达式中,\b单词边界,确保我们匹配的是整个电话号码而不是文本中的部分数字;\d{3},匹配恰好三个数字,这通常是区号的一部分;[-\s.]?,匹配一个可选的短横线、空格或点号,问号表示前面的字符或组是可选的,可以出现零次或一次;\d{3},再次匹配三个数字,这通常是交换码的一部分;[-\s.]?,另一个可选的分隔符;\d{4},匹配四个数字,这通常是电话号码的其余部分;\b,另一个单词边界。
进一步,根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,本申请步骤四包括:
根据工单处理要求,配置所述作业人员时间分工、作业等级分工、作业类型分工的分配优先级;
基于所述作业人员时间分工、作业等级分工、作业类型分工的差异化特征,设定各级分类特征;
基于所述各级分类特征、所述分配优先级,构建多级分工决策树框架;
获取训练样本集,利用所述训练样本集对所述多级分工决策树框架进行训练,获得所述多级分工决策树。
具体而言,基于工单处理要求,对所述作业人员时间分工、作业等级分工、作业类型分工进行优先级分配,其中所述工单处理要求中哪项指标的重要程度越高,则对应的优先级越高,得到所述作业人员时间分工、作业等级分工、作业类型分工的优先级序列;进一步基于所述作业人员时间分工、作业等级分工、作业类型分工的差异化特征,确定各级分类特征,其中各级分类特征是指不同类型指标的划分范围,可根据实际情况进行设置,其中每级指标包括多个分类特征,例如:将作业等级的分类特征设置为2,即将等级偏差在2之内的作业人员划分为一类。
接着基于所述分配优先级,按照先后顺序构建多级分工决策树,并基于所述各级分类特征构建多级分工决策树框架;获取训练样本集,所述训练样本集包括工单处理要求以及对应的匹配作业人员,然后利用所述训练样本集对所述多级分工决策树框架进行训练,得到所述多级分工决策树。通过构建多级分工决策树进行作业人员匹配,可以提高作业人员匹配的精细度和准确性,同时可以提高匹配效率。
进一步,建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,本申请步骤五包括:
根据所述各级别匹配分类参数,与所述各聚类集群的正则表达式进行元素匹配,建立所述映射关系;
获取元素提取特征,所述元素提取特征为所述各级别匹配分类参数进行多级决策中的分类特征,包括作业时间范围、作业等级范围、作业类型特征;将各级元素提取特征进行正则化格式转换,并根据所述映射关系进行投射,完成所述多级正则表达式的构建。
具体而言,将所述各级别匹配分类参数与所述各聚类集群的正则表达式进行元素匹配,即对所述各级别匹配分类参数进行类型标注,基于类型标注结果与各聚类集群的映射关系,建立各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系。然后获取元素提取特征,所述元素提取特征为所述各级别匹配分类参数进行多级决策中的分类特征,其中包括作业时间范围、作业等级范围和作业类型特征,比如:假设作业时间范围为早上8时至12时,则正则表达式的时间提取的范围变量中,对应的元素提取范围为8至12。
接着将各级元素提取特征进行正则化格式转换,并根据所述映射关系进行组合,得到所述多级正则表达式。通过将各级别匹配分类参数与各聚类集群的正则表达式映射关联,生成多级正则表达式,可以提高匹配分类参数与正则表达式的匹配度,从而提高工单信息提取的准确性和可靠性。
进一步,本申请步骤六包括:
基于所述工单设置参数,对待分配工单信息进行内容完整性识别,对存在缺失内容进行影响性分析,确定影响分析结果,其中,影响性分析是指利用预设影响性内容库与缺失内容进行比对;
若所述影响分析结果为是,则对缺失内容进行补充,其中,补充方式包括根据上下工单进行内容衔接补充、提取工单生成序列进行语音或文本提取;基于所述标注类型,确定标准化格式列表,对工单内容进行识别并与所述标准化格式列表进行匹配识别,对不满足要求的工单内容按照所述标准化格式进行转化。
具体而言,基于所述工单设置参数对待分配工单信息进行内容完整性识别,确定缺失内容,其中缺失内容是指工单设置参数对应的内容提取结果为空,即没有提取得到的信息;进一步对缺失内容进行影响性分析,其中影响性分析是指利用预设影响性内容库与缺失内容进行比对,所述预设影响内容库包括多个必要内容,所述必要内容是指该内容缺失会对工单信息提取结果产生影响的内容,例如:作业时间、作业等级等,可根据实际情况进行设置;得到影响分析结果,所述影响分析结果包括是或否,其中若缺失内容为所述预设影响性内容库中的内容,则影响分析结果为是,若缺失内容不属于所述预设影响性内容库中的内容,则影响分析结果为否。
若所述影响分析结果为是,则对缺失内容进行补充,其中内容补充方法包括根据上下工单进行内容衔接补充、提取工单生成序列进行语音或文本提取。例如:对待分配工单信息中存在遗漏的内容,比如时间信息,可以按照前后生成的表单进行推测,若存在无法推测的内容,则可以调取对应的语音或者文本内容进行再提取转化。通过对待分配工单信息进行完整性识别,并对必要性缺失内容进行针对性补充,可以提高待分配工单信息的完整性,进而提高工单信息提取的准确性。
接着基于所述标注类型确定标准化格式列表,其中标准化格式是指工单内容对应的固定格式,例如:时间按照统一的识别内容进行录入,工单按照数字串进行排列、文本和网站中间需要通过字符分割等标准;然后根据所述标准化格式列表对工单内容进行格式识别,并对不满足要求的工单内容按照所述标准化格式进行转化调整。通过对不满足标准化格式的工单内容进行格式调整,可以确保内容提取结果的可靠性。
综上所述,本申请所提供的一种基于正则算法的工单信息提取方法具有如下技术效果:
1.通过基于标注类型对工单设置参数进行聚类,得到各聚类集群的正则表达式;另一方面根据作业人员时间分工、作业等级分工、作业类型分工配置多级分工决策树,提取获得各级别匹配分类参数;接着建立各级别匹配分类参数与各聚类集群的正则表达式的映射关系,并基于映射关系构建多级正则表达式;最后利用多级正则表达式对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息,可以提高待分配工单与作业人员属性分析的精细化程度,进而提高待分配工单与作业人员属性的适配度,达到确保工单信息提取的准确性和可靠性,进而提高工单分派的效率、准确性和可靠性的技术效果。
2.通过基于工单处理要求对作业人员时间分工、作业等级分工、作业类型分工进行优先级划分,并根据优先级划分结果配置多级分工决策树,可以提高作业人员属性信息划分的精细度,从而提高作业人员与待分配工单匹配的精度和准确性。
3.通过基于BP神经网络构建正则表达式识别构建模型,可以通过神经网络对表达式组成格式进行监督训练,从而提高正则表达式得到的效率和准确性。
实施例二
基于与前述实施例中一种基于正则算法的工单信息提取方法,同样发明构思,本申请还提供了一种基于正则算法的工单信息提取系统,请参阅附图3,所述系统包括:
参数类型标注模块11,所述参数类型标注模块11用于获取工单设置参数,对所述工单设置参数进行类型标注,其中,标注类型包括数字、时间、文本、网络链接;
作业人员分工采集模块12,所述作业人员分工采集模块12用于采集作业人员分工,包括作业人员时间分工、作业等级分工、作业类型分工;
正则表达式设定模块13,所述正则表达式设定模块13用于基于所述标注类型,对各工单设置参数进行聚类,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取;
匹配分类参数提取模块14,所述匹配分类参数提取模块14用于根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,提取各级别匹配分类参数,所述各级别匹配分类参数为多级分工决策树中各级分类的参数类别,所述参数类别包括作业人员时间、作业等级、作业类型;
多级正则表达式构建模块15,所述多级正则表达式构建模块15用于建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,其中,所述映射关系为所述参数类别与正则表达式中标注类型的一一映射关系;
工单信息获取模块16,所述工单信息获取模块16用于利用所述多级正则表达式生成提取模块,对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息。
进一步,所述系统中的所述参数类型标注模块11还用于:
基于所述工单设置参数,获取参数录入内容;
根据所述数字、时间、文本、网络链接,确定识别特征;
对所述参数录入内容进行类型、格式分析,与所述识别特征进行遍历匹配,确定所述工单设置参数的内容类型,设置所述数字、时间、文本、网络链接的类型标识,利用所述类型标识对所述工单设置参数进行类型标注。
进一步,所述系统中的所述参数类型标注模块11还用于:
获取异常提取样本集;
基于所述异常提取样本集,进行工单设置参数追溯,确定异常工单设置参数,并提取所述异常工单设置参数的工单内容;
对所述异常工单设置参数的工单内容进行异常识别,判断与所述识别特征的匹配度;
若匹配度不满足要求,对所述异常工单设置参数的工单内容进行格式转换,判断格式转换后内容是否与识别特征匹配;
若仍不匹配,根据所述异常工单设置参数的工单内容进行类型分析,对所述异常工单设置参数的标注类型进行调整。
进一步,所述系统中的所述正则表达式设定模块13还用于:
获取正则算法的表达式组成要求,包括表达式基础结构、元字符、锚点、分组、转义字符、量词;
基于所述标注类型,采集正则提取案例,并基于所述表达式组成要求进行标识,构建学习样本集;
利用所述学习样本集进行神经网络模型训练,构建正则表达式识别构建模型;
将所述各聚类集群的工单内容、提取要求作为模型输入,通过所述正则表达式识别构建模型进行分解识别、并按照基础结构进行投射组合,获取正则表达式。
进一步,所述系统中的所述匹配分类参数提取模块14还用于:
根据工单处理要求,配置所述作业人员时间分工、作业等级分工、作业类型分工的分配优先级;
基于所述作业人员时间分工、作业等级分工、作业类型分工的差异化特征,设定各级分类特征;
基于所述各级分类特征、所述分配优先级,构建多级分工决策树框架;
获取训练样本集,利用所述训练样本集对所述多级分工决策树框架进行训练,获得所述多级分工决策树。
进一步,所述系统中的所述多级正则表达式构建模块15还用于:
根据所述各级别匹配分类参数,与所述各聚类集群的正则表达式进行元素匹配,建立所述映射关系;
获取元素提取特征,所述元素提取特征为所述各级别匹配分类参数进行多级决策中的分类特征,包括作业时间范围、作业等级范围、作业类型特征;将各级元素提取特征进行正则化格式转换,并根据所述映射关系进行投射,完成所述多级正则表达式的构建。
进一步,所述系统中的所述工单信息获取模块16还用于:
基于所述工单设置参数,对待分配工单信息进行内容完整性识别,对存在缺失内容进行影响性分析,确定影响分析结果,其中,影响性分析是指利用预设影响性内容库与缺失内容进行比对;
若所述影响分析结果为是,则对缺失内容进行补充,其中,补充方式包括根据上下工单进行内容衔接补充、提取工单生成序列进行语音或文本提取;基于所述标注类型,确定标准化格式列表,对工单内容进行识别并与所述标准化格式列表进行匹配识别,对不满足要求的工单内容按照所述标准化格式进行转化。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,前述实施例一中的一种基于正则算法的工单信息提取方法和具体实例同样适用于本实施例的一种基于正则算法的工单信息提取系统,通过前述对一种基于正则算法的工单信息提取方法的详细描述,本领域技术人员可以清楚知道本实施例中一种基于正则算法的工单信息提取系统,所以为了说明书的简洁,在此不再详述。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (8)

1.基于正则算法的工单信息提取方法,其特征在于,所述方法包括:
获取工单设置参数,对所述工单设置参数进行类型标注,其中,标注类型包括数字、时间、文本、网络链接;
采集作业人员分工,包括作业人员时间分工、作业等级分工、作业类型分工;
基于所述标注类型,对各工单设置参数进行聚类,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取;
根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,提取各级别匹配分类参数,所述各级别匹配分类参数为多级分工决策树中各级分类的参数类别,所述参数类别包括作业人员时间、作业等级、作业类型;
建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,其中,所述映射关系为所述参数类别与正则表达式中标注类型的一一映射关系;
利用所述多级正则表达式生成提取模块,对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息。
2.如权利要求1所述的方法,其特征在于,对所述工单设置参数进行类型标注,包括:
基于所述工单设置参数,获取参数录入内容;
根据所述数字、时间、文本、网络链接,确定识别特征;
对所述参数录入内容进行类型、格式分析,与所述识别特征进行遍历匹配,确定所述工单设置参数的内容类型,设置所述数字、时间、文本、网络链接的类型标识,利用所述类型标识对所述工单设置参数进行类型标注。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
获取异常提取样本集;
基于所述异常提取样本集,进行工单设置参数追溯,确定异常工单设置参数,并提取所述异常工单设置参数的工单内容;
对所述异常工单设置参数的工单内容进行异常识别,判断与所述识别特征的匹配度;
若匹配度不满足要求,对所述异常工单设置参数的工单内容进行格式转换,判断格式转换后内容是否与识别特征匹配;
若仍不匹配,根据所述异常工单设置参数的工单内容进行类型分析,对所述异常工单设置参数的标注类型进行调整。
4.如权利要求1所述的方法,其特征在于,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取,包括:
获取正则算法的表达式组成要求,包括表达式基础结构、元字符、锚点、分组、转义字符、量词;
基于所述标注类型,采集正则提取案例,并基于所述表达式组成要求进行标识,构建学习样本集;
利用所述学习样本集进行神经网络模型训练,构建正则表达式识别构建模型;
将所述各聚类集群的工单内容、提取要求作为模型输入,通过所述正则表达式识别构建模型进行分解识别、并按照基础结构进行投射组合,获取正则表达式。
5.如权利要求1所述的方法,其特征在于,根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,包括:
根据工单处理要求,配置所述作业人员时间分工、作业等级分工、作业类型分工的分配优先级;
基于所述作业人员时间分工、作业等级分工、作业类型分工的差异化特征,设定各级分类特征;
基于所述各级分类特征、所述分配优先级,构建多级分工决策树框架;
获取训练样本集,利用所述训练样本集对所述多级分工决策树框架进行训练,获得所述多级分工决策树。
6.如权利要求1所述的方法,其特征在于,建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,包括:
根据所述各级别匹配分类参数,与所述各聚类集群的正则表达式进行元素匹配,建立所述映射关系;
获取元素提取特征,所述元素提取特征为所述各级别匹配分类参数进行多级决策中的分类特征,包括作业时间范围、作业等级范围、作业类型特征;
将各级元素提取特征进行正则化格式转换,并根据所述映射关系进行投射,完成所述多级正则表达式的构建。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述工单设置参数,对待分配工单信息进行内容完整性识别,并对存在缺失内容进行影响性分析,确定影响分析结果,其中,影响性分析是指利用预设影响性内容库与缺失内容进行比对;
若所述影响分析结果为是,则对缺失内容进行补充,其中,补充方式包括根据上下工单进行内容衔接补充、提取工单生成序列进行语音或文本提取;
基于所述标注类型,确定标准化格式列表,对工单内容进行识别并与所述标准化格式列表进行匹配识别,对不满足要求的工单内容按照所述标准化格式进行转化。
8.基于正则算法的工单信息提取系统,其特征在于,用于实施权利要求1至7中任意一项所述方法的步骤,所述系统包括:
参数类型标注模块,所述参数类型标注模块用于获取工单设置参数,对所述工单设置参数进行类型标注,其中,标注类型包括数字、时间、文本、网络链接;
作业人员分工采集模块,所述作业人员分工采集模块用于采集作业人员分工,包括作业人员时间分工、作业等级分工、作业类型分工;
正则表达式设定模块,所述正则表达式设定模块用于基于所述标注类型,对各工单设置参数进行聚类,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取;
匹配分类参数提取模块,所述匹配分类参数提取模块用于根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,提取各级别匹配分类参数,所述各级别匹配分类参数为多级分工决策树中各级分类的参数类别,所述参数类别包括作业人员时间、作业等级、作业类型;
多级正则表达式构建模块,所述多级正则表达式构建模块用于建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,其中,所述映射关系为所述参数类别与正则表达式中标注类型的一一映射关系;
工单信息获取模块,所述工单信息获取模块用于利用所述多级正则表达式生成提取模块,对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息。
CN202410491086.6A 2024-04-23 2024-04-23 基于正则算法的工单信息提取方法及系统 Active CN118095794B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410491086.6A CN118095794B (zh) 2024-04-23 2024-04-23 基于正则算法的工单信息提取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410491086.6A CN118095794B (zh) 2024-04-23 2024-04-23 基于正则算法的工单信息提取方法及系统

Publications (2)

Publication Number Publication Date
CN118095794A true CN118095794A (zh) 2024-05-28
CN118095794B CN118095794B (zh) 2024-06-25

Family

ID=91155461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410491086.6A Active CN118095794B (zh) 2024-04-23 2024-04-23 基于正则算法的工单信息提取方法及系统

Country Status (1)

Country Link
CN (1) CN118095794B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305050A (zh) * 2018-02-08 2018-07-20 贵州小爱机器人科技有限公司 报案信息及服务需求信息的提取方法、装置、设备及介质
CN110175272A (zh) * 2019-05-21 2019-08-27 中国太平洋保险(集团)股份有限公司 一种基于特征建模实现工单收敛的控制方法及控制装置
CN110489198A (zh) * 2019-08-22 2019-11-22 阿里巴巴集团控股有限公司 一种工单处理的方法和系统
CN111784277A (zh) * 2020-05-22 2020-10-16 贵州电网有限责任公司 一种it客服工单质检分析方法
CN112837175A (zh) * 2021-01-11 2021-05-25 佰聆数据股份有限公司 基于信息抽取技术的电力频繁停电工单信息抽取方法及系统
CN112947944A (zh) * 2019-12-11 2021-06-11 中盈优创资讯科技有限公司 业务工单处理方法及装置
CN114218958A (zh) * 2021-11-19 2022-03-22 阿里巴巴(中国)有限公司 工单处理方法、装置、设备和存储介质
CN114331001A (zh) * 2021-11-26 2022-04-12 国网山东省电力公司营销服务中心(计量中心) 一种自适应匹配的电力终端异常工单分派方法及系统
CN114358014A (zh) * 2021-12-23 2022-04-15 佳源科技股份有限公司 基于自然语言的工单智能诊断方法、装置、设备及介质
CN115456421A (zh) * 2022-09-16 2022-12-09 中国工商银行股份有限公司 工单的分派方法及装置、处理器和电子设备
CN116150316A (zh) * 2022-09-30 2023-05-23 马上消费金融股份有限公司 工单数据处理方法、装置、电子设备及存储介质
US20230176829A1 (en) * 2021-12-07 2023-06-08 Microsoft Technology Licensing, Llc Multi-modal program inference
CN116797195A (zh) * 2023-06-21 2023-09-22 中国电信股份有限公司 工单处理方法、装置、计算机设备和计算机可读存储介质
CN116955600A (zh) * 2022-04-15 2023-10-27 中国移动通信集团江苏有限公司 工单聚类方法、装置、电子设备、及存储介质
CN117034949A (zh) * 2023-08-17 2023-11-10 中国工商银行股份有限公司 咨询工单的分类方法、装置、电子设备及存储介质
CN117715003A (zh) * 2023-11-10 2024-03-15 博瑞得科技有限公司 基于工单计费条目的稽核方法

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305050A (zh) * 2018-02-08 2018-07-20 贵州小爱机器人科技有限公司 报案信息及服务需求信息的提取方法、装置、设备及介质
CN110175272A (zh) * 2019-05-21 2019-08-27 中国太平洋保险(集团)股份有限公司 一种基于特征建模实现工单收敛的控制方法及控制装置
CN110489198A (zh) * 2019-08-22 2019-11-22 阿里巴巴集团控股有限公司 一种工单处理的方法和系统
CN112947944A (zh) * 2019-12-11 2021-06-11 中盈优创资讯科技有限公司 业务工单处理方法及装置
CN111784277A (zh) * 2020-05-22 2020-10-16 贵州电网有限责任公司 一种it客服工单质检分析方法
CN112837175A (zh) * 2021-01-11 2021-05-25 佰聆数据股份有限公司 基于信息抽取技术的电力频繁停电工单信息抽取方法及系统
CN114218958A (zh) * 2021-11-19 2022-03-22 阿里巴巴(中国)有限公司 工单处理方法、装置、设备和存储介质
CN114331001A (zh) * 2021-11-26 2022-04-12 国网山东省电力公司营销服务中心(计量中心) 一种自适应匹配的电力终端异常工单分派方法及系统
US20230176829A1 (en) * 2021-12-07 2023-06-08 Microsoft Technology Licensing, Llc Multi-modal program inference
CN114358014A (zh) * 2021-12-23 2022-04-15 佳源科技股份有限公司 基于自然语言的工单智能诊断方法、装置、设备及介质
CN116955600A (zh) * 2022-04-15 2023-10-27 中国移动通信集团江苏有限公司 工单聚类方法、装置、电子设备、及存储介质
CN115456421A (zh) * 2022-09-16 2022-12-09 中国工商银行股份有限公司 工单的分派方法及装置、处理器和电子设备
CN116150316A (zh) * 2022-09-30 2023-05-23 马上消费金融股份有限公司 工单数据处理方法、装置、电子设备及存储介质
CN116797195A (zh) * 2023-06-21 2023-09-22 中国电信股份有限公司 工单处理方法、装置、计算机设备和计算机可读存储介质
CN117034949A (zh) * 2023-08-17 2023-11-10 中国工商银行股份有限公司 咨询工单的分类方法、装置、电子设备及存储介质
CN117715003A (zh) * 2023-11-10 2024-03-15 博瑞得科技有限公司 基于工单计费条目的稽核方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
钟爱等: ""基于正则算法和命名实体识别模型的95598工单结构化信息自动提取"", 《电力大数据》, no. 12, 31 December 2021 (2021-12-31), pages 38 - 45 *

Also Published As

Publication number Publication date
CN118095794B (zh) 2024-06-25

Similar Documents

Publication Publication Date Title
CN108256074B (zh) 校验处理的方法、装置、电子设备和存储介质
CN107992609B (zh) 一种基于文本分类技术和决策树的投诉倾向判断方法
CN110826320A (zh) 一种基于文本识别的敏感数据发现方法及系统
CN110728453B (zh) 一种基于大数据的政策自动匹配分析系统
CN113468317B (zh) 一种简历筛选方法、系统、设备和存储介质
CN113064992A (zh) 投诉工单结构化处理方法、装置、设备及存储介质
CN115630621A (zh) 一种基于pdf财务数据报表的数据采集、处理的方法及系统
CN112184484A (zh) 一种电力用户差异化服务方法及系统
CN115794798A (zh) 一种市场监管信息化标准管理与动态维护系统及方法
CN116627913B (zh) 一种数据多通道快速存储管理方法及系统
CN118095794B (zh) 基于正则算法的工单信息提取方法及系统
CN110688445B (zh) 一种数字化档案建设方法
CN115482075A (zh) 财务数据的异常分析方法、装置、电子设备及存储介质
CN113642291B (zh) 上市公司报告的逻辑结构树构建方法、系统、存储介质及终端
CN115544235A (zh) 一种基于文本解析的电网规划智能问答系统
CN110826326B (zh) 一种基于文本分类的小样本数据描述规范化预处理方法
CN113127647A (zh) 一种基于大数据分析的工艺知识库构建方法
CN111258953A (zh) 一种财务数据转换成评估数据规范化的方法
CN117252715B (zh) 基于规则引擎的保险核保检查方法、系统
CN117112791B (zh) 一种未知日志分类决策系统、方法、装置及可读存储介质
CN112215494B (zh) 一种居民用电的房屋租赁识别方法及系统
CN113592537B (zh) 一种土壤修复工程造价概算方法、装置及计算机系统
CN117493960A (zh) 一种基于数据标识复合关联度的分类分级方法和装置
CN112712177A (zh) 一种基于协同处理的知识工程方法与装置
CN115759575A (zh) 一种基于机器学习及权责清单识别的智能工单分派方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant