CN115983264A - 服务工单的处理方法及设备 - Google Patents
服务工单的处理方法及设备 Download PDFInfo
- Publication number
- CN115983264A CN115983264A CN202310011192.5A CN202310011192A CN115983264A CN 115983264 A CN115983264 A CN 115983264A CN 202310011192 A CN202310011192 A CN 202310011192A CN 115983264 A CN115983264 A CN 115983264A
- Authority
- CN
- China
- Prior art keywords
- word
- word segmentation
- result
- work order
- service work
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Machine Translation (AREA)
Abstract
本申请提供一种服务工单的处理方法及设备,包括对服务工单文本进行分词和词性标注处理获得输入词表;使用输入词表对初始词表进行补充更新获得更新后的词表;使用更新后的词表对服务工单文本进行分词和词性标注处理获得服务工单文本的分词标注结果;对服务工单文本的分词标注结果进行关键字提取获得服务工单的关键信息,通过使用输入词表更新初始词表,保证了词表的信息完整性和信息及时性,提升关键字提取的准确性。
Description
技术领域
本申请涉及自然语言处理技术,尤其涉及一种服务工单的处理方法及设备。
背景技术
随着数字化、信息化水平的不断深入发展,智能化服务也越来越普遍。用户通过在服务平台上发起服务工单,服务商基于服务平台为用户提供服务。
为了提高服务质量,越来越多服务商对于服务工单的文本进行分析,由于采用手工统计的方式对人力依赖比较大,可使用文本的热点分析方法对服务工单进行分析。现有文本的热点分析常用方法是,根据分词工具对文本进行分词,并将分词后的全量词进行聚类分析。
然而,现有的文本的热点分析方法在服务工单中出现新词后,分析准确率则明显降低。
发明内容
本申请一实施例提供一种服务工单的处理方法,包括:
对服务工单文本进行分词和词性标注处理,获得输入词表;
使用输入词表对初始词表进行补充更新,获得更新后的词表;
使用更新后的词表对服务工单文本进行分词和词性标注处理,获得服务工单文本的分词标注结果;
对服务工单文本的分词标注结果进行关键字提取,获得服务工单的关键信息。
在一些实施例中,在对服务工单文本进行分词和标注处理获得输入词表之前,方法还包括:
获取历史服务工单文本,并剔除工单文本长度小于预设长度阈值的工单文本,获得更新后的历史服务工单文本;
对更新后的历史服务工单文本进行分词处理,获得更新后的历史服务工单文本的分词结果;
对更新后的历史服务工单文本的分词结果进行词性标注处理,获得分词结果的词性标记结果;
根据历史服务工单的分词处理结果和分词结果的词性标记结果构建初始词表。
在一些实施例中,根据历史服务工单的分词处理结果和分词结果的词性标记结果构建初始词表,具体包括:
根据分词结果的词性标记结果对历史服务工单的分词处理结果进行分类,构建名词词表、动词词表以及情绪词词表。
在一些实施例中,词性标记结果包括地点名词、人名名词和名词;
根据分词结果的词性标记结果对历史服务工单的分词处理结果进行分类,构建名词词表,具体包括:
根据词性标注结果为地点名词的分词结果构建地点名词词表;
根据词性标注结果为人名名词的分词结果构建人名名词词表;
根据词性标注结果为名词的分词结果构建业务名词词表。
在一些实施例中,根据词性标注结果为地点名词的分词结果构建地点名词词表,具体包括:
若多个词性标注结果为地点名词的分词结果连续排列,将多个连续的词性标注结果为地点名词的分词结果组合成一个地点词;
若某一词性标注结果为地点名词的分词结果与其他词性标注结果的分词结果相邻,将一个词性标注结果为地点名词的分词结果作为一个地点词;
相应地,根据词性标注结果为名词的分词结果构建业务名词词表,具体包括:
从词性标注结果为名词的分词结果中提取业务分词结果;
若多个业务分词结果连续排列,将多个连续的业务分词结果组合成一个业务词;
若某一业务分词结果与其他词性标注结果的分词结果相邻,将一个业务分词结果作为一个业务词。
在一些实施例中,词性标记结果包括动词;
根据分词结果的词性标记结果对历史服务工单的分词处理结果进行分类,构建动词词表,具体包括:
使用关键词提取方法对词性标注结果为动词的分词结果进行关键信息提取,并根据提取后的关键信息构建动词词表。
在一些实施例中,词性标记结果包括形容词和副词;
根据分词结果的词性标记结果对历史服务工单的分词处理结果进行分类,构建情绪词词表,具体包括:
若多个词性标记结果为形容词和/或副词的分词结果连续排列,将多个连续的词性标记结果为形容词和/或副词的分词结果组合成一个情绪词;
根据获得的多个情绪词构建情绪词表。
在一些实施例中,对服务工单文本的分词结果进行关键字提取,获得服务工单的关键信息,具体包括:
使用TF-IDF算法对服务工单文本的分词结果进行关键字提取,获得服务工单的关键信息;或者
使用LDA文档主题生成模型对服务工单文本的分词结果进行关键字提取,获得服务工单的关键信息。
本申请一实施例还提供一种服务工单的处理装置,包括:
获取模块,用于对服务工单文本进行分词和词性标注处理,获得输入词表;
处理模块,用于使用输入词表对初始词表进行补充更新,获得更新后的词表;使用更新后的词表对服务工单文本进行分词和标注处理,获得服务工单文本的分词标注结果;以及对服务工单文本的分词标注结果进行关键字提取,获得服务工单的关键信息。
本申请一实施例还提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;
存储器存储计算机执行指令;
处理器执行存储器存储的计算机执行指令,以实现上述实施例所涉及的方法。
本申请一实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现上述实施例所涉及的方法。
本申请一实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述实施例所涉及的方法。
本申请提供的一种服务工单的处理方法及设备,在获得服务工单时,先使用分词工具对服务工单进行分词和标注处理获得输入词表,使用输入词表对初始词表进行更新,使用更新后的词表对服务工单进行分词和标注,使用关键字提取方法对分词和标注后的服务工单进行关键字提取,通过使用输入词表更新初始词表,保证了词表的信息完整性和信息及时性,提升关键字提取的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请一实施例提供的服务工单的处理方法的流程图;
图2为本申请提供的分词处理过程的原理示意图;
图3为本申请提供的关键字提取原理的示意图;
图4为本申请提供的初始词表构建的原理示意图;
图5为本申请提供的名词词表构建的原理示意图;
图6为本申请提供的情绪词表构建的原理示意图;
图7为本申请一实施例提供的服务工单的处理装置的结构示意图;
图8为本申请提供的电子设备的示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
随着数字化、信息化水平的不断深入发展,智能化服务也越来越普遍。用户通过在服务平台上发起服务工单,由智能机器人先处理服务工单。若用户不满足智能机器人的服务,则转入人工服务。为了了解用户所服务的热点,需要对服务工单进行分析。上述服务工单可以为办理某一业务的工单,也可以为投诉服务质量的工单,此处不不做限制。
传统服务工单分析方法采用手工统计的方式,这种分析方式依赖人工的统计处理习惯,针对服务工单的投诉内容和处理内容进行人工分析,对出现的关键业务名词和关键投诉词进行人工提取。
然而,传统手工统计方法依赖人工对业务流程的熟悉度、敏感度,同时需要耗费大量的人力,另一方面,当面对批量的工单内容,手工分析很难从整体对工单投诉内容进行有效的信息提取,也很难不遗漏重要关键词。
可使用文本的热点分析方法对服务工单进行分析。现有文本的热点分析常用方法是,根据分词工具对文本进行分词,并将分词后的全量词进行聚类分析。聚类分析通常有三类。第一种是使用基于TF-IDF词频统计的关键词抽取,该方法利用词语频次和逆文档频率相乘得到词语的权重值。权重值越高,表明该词语越有可能作为文档的关键词。第二种为基于TextRank的关键词提取方法,该方法是一种基于图的排序算法,通过构建文档的拓扑结构,根据文档内部的词语间的语义信息对词句进行排序,根据排序结果提取关键词。第三种是基于LDA模型的关键词抽取方法,该方法将候选的关键词与抽取的主题计算相似度,并进行排序,得到最终的关键词。
然而,现有的文本的热点分析方法在服务工单中出现新词后,分析准确率则明显降低。基于上述考虑,本申请提供一种服务工单的处理方法。下面结合下述实施例描述方案。
如图1所示,本申请一实施例提供一种服务工单的处理方法,该处理方法包括如下步骤:
S101、对服务工单文本进行分词和词性标注处理获得输入词表。
其中,使用分词工具对服务工单文本进行分词,并用词性标注工具对分词结果进行词性标注处理,获得输入词表。
词性标注是指进行地点名词标注、人名名词标注、业务名词标注、动词标注和情绪词标注。
更具体地,可使用jieba分词工具对服务工单文本进行分词,使用LTP工具进行词性标注。
S102、使用输入词表对初始词表进行补充更新获得更新后的词表。
其中,初始词表是通过历史服务工单进行分词和标注产生的,初始词表包括地点名词词表、人名名词词表、业务名词词表、动词词表和情绪词词表。
在获得输入词表和初始词表后,将输入词表和初始词表进行融合补充,获得更新后的词表。通过利用输入词表针对初始词表中未出现项进行补充更新,并将更新后的词表作为分词词表进行输出。
S103、使用更新后的词表对服务工单文本进行分词和标注处理,获得服务工单文本的分词标注结果。
其中,对服务工单文本进行分词处理过程的原理参见图2,先使用分词工具根据更新后的词表对名词进行分词,使用分词工具根据更新后的词表对动词进行分词,使用分词工具根据更新后的词表对情绪词进行分词。
在使用分词工具根据更新后的词表对名词进行分词时,遵循先长后短的匹配规则,也就是若两个关联文本与词表中两个词匹配时,优先匹配长度更长的词。在对动词或者情绪词进行分词时也遵循上述规则,此处不再赘述。
在一些实施例中,在词表中出现的组合词一旦经过匹配标记,则不对组合词中单一词进行分词及词性标注。整个分词过程遵循一旦匹配成功则不进行二次匹配的原则,输出结果为带词性标注的文本,以及部分未出现在词表的未标注文本,后者作为停用词添加至停用词表。
S104、对服务工单文本的分词标注结果进行关键字提取,获得服务工单的关键信息。
其中,可以结合多种关键字提取方法对服务工单文本的分词标注结果进行关键字提取,获得服务工单的关键信息。如此,可以更加准确的提取服务工单中的关键字。
在选择关键词提取方法时,可以根据关键字提取需求选择关键字提取方法。对于与单一词性的分词结果关联的关键字,可以使用TF-IDF算法对服务工单文本的分词结果进行关键字提取。对于与多个词性的分词结果关联的关键字,使用LDA文档主题生成模型对服务工单文本的分词结果进行关键字提取。
根据客服处理原则制定关键词提取规则,分别从业务层面、服务层面、处理效率等几个角度对分词结果进行关键词抽取。如图3所示,为词性与关键字之间映射关系表,由于客户动作和客户情绪具有单一词性来源,因此采用TF-IDF方法进行关键词抽取。例如:获取业务详情类的关键字,需将业务名词以及其他名词统一放在候选词集中,并针对这一候选词集进行TF-IDF关键词抽取。
人员服务评价、信号及户外评价、业务处理评价和业务详情具有非单一词性来源,因此采用LDA文档主题生成模型进行关键词抽取。在使用LDA文档主体生成模型进行关键词抽取之前,需要利用TF-IDF方法生成过程所需词向量。再使用LDA文档主体生成模型对词向量进行关键字提取,然后对关键字进行融合。
例如:获取人员服务评价类关键词,需将人物名词以及情绪词分别放在候选热点词集中,分别利用LDA方法进行关键词抽取,最终根据比例将关键词统一输出,若比例为1:1,则输出关键词中人物名词和情绪词比例各占50%,此类关键词输出在反映人员信息的同时,也能够表达评价人的情绪,情绪质量的不同对应不同的评价级别。
其中,TF-IDF的计算公式如下:
TF-IDF=TFw*IDF
某一特定文件内的高词语频率,以及该词语在整个文件集合中的逆文件频率,可以产生出高权重的TF-IDF。某个词对文本的重要性越高,它的TF-IDF值就越大。
在上述技术方案中,在获得服务工单时,先使用分词工具对服务工单进行分词和标注处理获得输入词表,使用输入词表对初始词表进行更新,使用更新后的词表对服务工单进行分词和标注,使用关键字提取方法对分词和标注后的服务工单进行关键字提取,通过使用输入词表更新初始词表,保证了词表的信息完整性和信息及时性,提升关键字提取的准确性。
在一些实施例中,采用如下步骤构建初始词表,该步骤可在S101之前:
S201、获取历史服务工单文本,并剔除工单文本长度小于预设长度阈值的工单文本,获得更新后的历史服务工单文本。
其中,工单文本长度小于预设长度阈值的工单文本通常为无效工单,在获得历史服务工单文本后,剔除无效工单。通常可以选择文本长度小于10的服务工单。
S202、对更新后的历史服务工单文本进行分词处理,获得更新后的历史服务工单文本的分词结果。
其中,使用分词工具对更新后的历史服务工单文本进行分词处理。例如:可以使用jieba分词工具进行分词。
S203、对更新后的历史服务工单文本的分词结果进行词性标注处理,获得分词结果的词性标记结果。
其中,使用词性标注工具对更新后的历史服务工单文本的分词结果进行词性标注处理。例如:利用LTP工具进行词性标注。
在一些实施例中,词性标记结果包括地点名词、人名名词、名词、动词、形容词和副词。
S204、根据历史服务工单的分词处理结果和分词结果的词性标记结果构建初始词表。
其中,如图4所示,初始词表包括名词词表、动词词表以及情绪词词表。根据分词结果的词性标记结果对历史服务工单的分词处理结果进行分类,构建名词词表、动词词表以及情绪词词表。
在一些实施例中,如图5所示,采用如下方式构建名词词表:
S301、根据词性标注结果为地点名词的分词结果构建地点名词词表。
其中,针对分词结果,筛选词性标注为地点名词的分词结果组成地点词表。并针对组合地点名词进行筛选,添加至地点词表中。组合地点名词的筛选规则根据词性进行组合,当连续出现多个地点名词词性的词语,则对词语进行拼接,组成新的地点名词。
若多个词性标注结果为地点名词的分词结果连续排列,将多个连续的词性标注结果为地点名词的分词结果组合成一个地点词。例如:青岛市市南区山东路的文本分词后结果为,青岛市、市南区和山东路,青岛市、市南区和山东路的词性标注结果均为地点名词,三个地点名词的词连续排列,则将三个地点名词进行组合为一个地点名词“青岛市市南区山东路”。
若某一词性标注结果为地点名词的分词结果与其他词性标注结果的分词结果相邻,将一个词性标注结果为地点名词的分词结果作为一个地点词。例如:我在山东路办公的文本分词后结果为我、在、山东路、办公,山东路为地点名词,地点名词相邻的为“办公”和“在”,“办公”的词性为动词,“在”的词性为副词,则将山东路作为一个地点名词。
针对上述词表构建中涉及的组合词,在组合过程中以标点作为界限,仅对同一句子中连续的出现的分词进行组合,而不跨标点进行跨句组合。
S302、根据词性标注结果为人名名词的分词结果构建人名名词词表。
其中,对分词结果,筛选词性标注为人名名词的词语组成人名名词词表。人名名词词表多为处理业务的业务员,人名根据工单信息匹配工号作为唯一标识。
S303、根据词性标注结果为名词的分词结果构建业务名词词表。
其中,针对分词结果,筛选词性标注为名词的词语组成临时词表。从临时词表中提取业务名词构建业务名词词表。并针对组合业务名词进行筛选,添加至业务词表中。组合业务名词的规律为连续出现多个业务名词词性的词语,该规则遵循了电信业务名称特有的构词规律,例如:视频彩铃乐酷会员,针对连续词语进行拼接,组成新的业务名词添加至词表。
更具体地,从词性标注结果为名词的分词结果中提取业务分词结果。多个业务分词结果连续排列,将多个连续的业务分词结果组合成一个业务词。若某一业务分词结果与其他词性标注结果的分词结果相邻,将一个业务分词结果作为一个业务词。
S304、针对剩余名词统一归档其他名词词表。
在一些实施例中,采用如下方式构建动词词表:选择动词词性的词语组成候选词表,使用关键词提取方法对词性标注结果为动词的分词结果进行关键信息提取,并根据提取后的关键信息构建动词词表。
在上述技术方案中,由于简单的分词工具,例如:jieba分词工具,虽然能够将长句子拆分,但颗粒度较小的分词结果在一定程度上也破坏原有结构,尤其是针对常用组合,组合词更能体现热点价值。本申请对地点名词和业务名词进行组合,提升构建词表的准确性,为服务工单准确分词和标注提供基础。
在一些实施例中,利用TF-IDF方法进行关键词抽取,筛选服务工单中动词词语组成动词词表,例如停机,断网。
在一些实施例中,如图6所示,采用如下方式构建情绪词表:选择形容词词性、副词词性的词语组成候选词表,若多个词性标记结果为形容词和/或副词的分词结果连续排列,将多个连续的词性标记结果为形容词和/或副词的分词结果组合成一个情绪词,根据获得的多个情绪词构建情绪词表。
也就是,多个词性标记结果为形容词的分词结果连续排列,则将多个词性标记结果为形容词的分词结果组合成一个情绪词。多个词性标记结果为副词的分词结果连续排列,则将多个词性标记结果为副词的分词结果组合成一个情绪词。多个连续排列的分词结果词性为副词和形容词的组合,则将多个分词结果组合成一个情绪词。
在上述技术方案中,提出了将词性作为分词的重要参考,按照词性对服务工单文本进行多轮词性清洗,减少了人工干预和人工筛选,一方面保证了词表构建的准确性,另一方面减少了手工构建词表的工作量,同时,由于引入情绪词表,也保留了服务工单中的情感特征,在服务工单为投诉类服务工单时,采用融合词性特征的关键字提取方法,在输出客服业务投诉关键词的同时,输出表达用户情绪的关键词,以此作为判定投诉热点的重要参考。为保留句子的完整结构,同时为了辅助组合词筛选,针对客服服务工单的投诉内容不进行停用词筛选,同时完整保留标点符号,有利于构建更精准的词表。
如图7所示,本申请一实施例提供一种服务工单的处理装置,装置包括:
获取模块401,用于对服务工单文本进行分词和词性标注处理,获得输入词表;
处理模块402,用于使用输入词表对初始词表进行补充更新,获得更新后的词表;
使用更新后的词表对服务工单文本进行分词和词性标注处理,获得服务工单文本的分词标注结果;以及
对服务工单文本的分词标注结果进行关键字提取,获得服务工单的关键信息。
在一些实施例中,处理模块402,还用于:
获取历史服务工单文本,并剔除工单文本长度小于预设长度阈值的工单文本,获得更新后的历史服务工单文本;
对更新后的历史服务工单文本进行分词处理,获得更新后的历史服务工单文本的分词结果;
对更新后的历史服务工单文本的分词结果进行词性标注处理,获得分词结果的词性标记结果;
根据历史服务工单的分词处理结果和分词结果的词性标记结果构建初始词表。
在一些实施例中,处理模块402,具体用于:
根据分词结果的词性标记结果对历史服务工单的分词处理结果进行分类,构建名词词表、动词词表以及情绪词词表。
在一些实施例中,词性标记结果包括地点名词、人名名词和名词;处理模块402,具体用于:
根据词性标注结果为地点名词的分词结果构建地点名词词表;
根据词性标注结果为人名名词的分词结果构建人名名词词表;
根据词性标注结果为名词的分词结果构建业务名词词表。
在一些实施例中,处理模块402,具体用于:
若多个词性标注结果为地点名词的分词结果连续排列,将多个连续的词性标注结果为地点名词的分词结果组合成一个地点词;
若某一词性标注结果为地点名词的分词结果与其他词性标注结果的分词结果相邻,将一个词性标注结果为地点名词的分词结果作为一个地点词;
在一些实施例中,处理模块402,具体用于:
从词性标注结果为名词的分词结果中提取业务分词结果;
若多个业务分词结果连续排列,将多个连续的业务分词结果组合成一个业务词;
若某一业务分词结果与其他词性标注结果的分词结果相邻,将一个业务分词结果作为一个业务词。
在一些实施例中,词性标记结果包括动词,处理模块402,具体用于:
使用关键词提取方法对词性标注结果为动词的分词结果进行关键信息提取,并根据提取后的关键信息构建动词词表。
在一些实施例中,词性标记结果包括形容词和副词;处理模块402,具体用于:
若多个词性标记结果为形容词和/或副词的分词结果连续排列,将多个连续的词性标记结果为形容词和/或副词的分词结果组合成一个情绪词;
根据获得的多个情绪词构建情绪词表。
在一些实施例中,处理模块402,具体用于:
使用TF-IDF算法对服务工单文本的分词结果进行关键字提取,获得服务工单的关键信息;或者
使用LDA文档主题生成模型对服务工单文本的分词结果进行关键字提取,获得服务工单的关键信息。
如图8所示,本申请一实施例提供一种电子设备500,电子设备500包括存储器501和处理器502。
其中,存储器501用于存储处理器可执行的计算机指令;
处理器502在执行计算机指令时实现上述实施例中方法中的各个步骤。具体可以参见前述方法实施例中的相关描述。
可选地,上述存储器501既可以是独立的,也可以跟处理器502集成在一起。当存储器501独立设置时,该电子设备还包括总线,用于连接存储器501和处理器502。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机指令,当处理器执行计算机指令时,实现上述实施例中方法中的各个步骤。
本申请实施例还提供一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现上述实施例中方法中的各个步骤。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。
Claims (10)
1.一种服务工单的处理方法,其特征在于,包括:
对所述服务工单文本进行分词和词性标注处理,获得输入词表;
使用所述输入词表对初始词表进行补充更新,获得更新后的词表;
使用更新后的词表对所述服务工单文本进行分词和词性标注处理,获得所述服务工单文本的分词标注结果;
对所述服务工单文本的分词标注结果进行关键字提取,获得所述服务工单的关键信息。
2.根据权利要求1所述的处理方法,其特征在于,在对所述服务工单文本进行分词和标注处理获得输入词表之前,所述方法还包括:
获取历史服务工单文本,并剔除工单文本长度小于预设长度阈值的工单文本,获得更新后的历史服务工单文本;
对所述更新后的历史服务工单文本进行分词处理,获得所述更新后的历史服务工单文本的分词结果;
对所述更新后的历史服务工单文本的分词结果进行词性标注处理,获得分词结果的词性标记结果;
根据所述历史服务工单的分词处理结果和所述分词结果的词性标记结果构建初始词表。
3.根据权利要求2所述的处理方法,其特征在于,根据所述历史服务工单的分词处理结果和所述分词结果的词性标记结果构建初始词表,具体包括:
根据所述分词结果的词性标记结果对所述历史服务工单的分词处理结果进行分类,构建名词词表、动词词表以及情绪词词表。
4.根据权利要求3所述的处理方法,其特征在于,所述词性标记结果包括地点名词、人名名词和名词;
根据所述分词结果的词性标记结果对所述历史服务工单的分词处理结果进行分类,构建名词词表,具体包括:
根据词性标注结果为地点名词的分词结果构建地点名词词表;
根据词性标注结果为人名名词的分词结果构建人名名词词表;
根据词性标注结果为名词的分词结果构建业务名词词表。
5.根据权利要求4所述的处理方法,其特征在于,根据词性标注结果为地点名词的分词结果构建地点名词词表,具体包括:
若多个词性标注结果为地点名词的分词结果连续排列,将多个连续的词性标注结果为地点名词的分词结果组合成一个地点词;
若某一词性标注结果为地点名词的分词结果与其他词性标注结果的分词结果相邻,将一个所述词性标注结果为地点名词的分词结果作为一个地点词;
相应地,根据词性标注结果为名词的分词结果构建业务名词词表,具体包括:
从词性标注结果为名词的分词结果中提取业务分词结果;
若多个业务分词结果连续排列,将多个连续的业务分词结果组合成一个业务词;
若某一业务分词结果与其他词性标注结果的分词结果相邻,将一个所述业务分词结果作为一个业务词。
6.根据权利要求3所述的处理方法,其特征在于,所述词性标记结果包括动词;
根据所述分词结果的词性标记结果对所述历史服务工单的分词处理结果进行分类,构建动词词表,具体包括:
使用关键词提取方法对词性标注结果为动词的分词结果进行关键信息提取,并根据提取后的关键信息构建动词词表。
7.根据权利要求3所述的处理方法,其特征在于,所述词性标记结果包括形容词和副词;
根据所述分词结果的词性标记结果对所述历史服务工单的分词处理结果进行分类,构建情绪词词表,具体包括:
若多个词性标记结果为形容词和/或副词的分词结果连续排列,将多个连续的词性标记结果为形容词和/或副词的分词结果组合成一个情绪词;
根据获得的多个情绪词构建情绪词表。
8.根据权利要求1至7中任意一项所述的处理方法,其特征在于,对所述服务工单文本的分词结果进行关键字提取,获得所述服务工单的关键信息,具体包括:
使用TF-IDF算法对所述服务工单文本的分词结果进行关键字提取,获得所述服务工单的关键信息;或者
使用LDA文档主题生成模型对所述服务工单文本的分词结果进行关键字提取,获得所述服务工单的关键信息。
9.一种服务工单的处理装置,其特征在于,包括:
获取模块,用于对所述服务工单文本进行分词和词性标注处理,获得输入词表;
处理模块,用于使用所述输入词表对初始词表进行补充更新,获得更新后的词表;使用更新后的词表对所述服务工单文本进行分词和标注处理,获得所述服务工单文本的分词标注结果;以及对所述服务工单文本的分词标注结果进行关键字提取,获得所述服务工单的关键信息。
10.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310011192.5A CN115983264A (zh) | 2023-01-05 | 2023-01-05 | 服务工单的处理方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310011192.5A CN115983264A (zh) | 2023-01-05 | 2023-01-05 | 服务工单的处理方法及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115983264A true CN115983264A (zh) | 2023-04-18 |
Family
ID=85967881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310011192.5A Pending CN115983264A (zh) | 2023-01-05 | 2023-01-05 | 服务工单的处理方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115983264A (zh) |
-
2023
- 2023-01-05 CN CN202310011192.5A patent/CN115983264A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bagheri et al. | Care more about customers: Unsupervised domain-independent aspect detection for sentiment analysis of customer reviews | |
CN113704451B (zh) | 一种电力用户诉求筛选方法、系统、电子设备和存储介质 | |
CN108664615A (zh) | 一种面向学科教育资源的知识图谱构建方法 | |
US20150286928A1 (en) | Causal Modeling and Attribution | |
CN110929038A (zh) | 基于知识图谱的实体链接方法、装置、设备和存储介质 | |
Erdmann et al. | Improving the extraction of bilingual terminology from Wikipedia | |
US20210056261A1 (en) | Hybrid artificial intelligence system for semi-automatic patent pinfringement analysis | |
Singh et al. | An approach towards feature specific opinion mining and sentimental analysis across e-commerce websites | |
CN112699645B (zh) | 语料标注方法、装置及设备 | |
CN111259645A (zh) | 一种裁判文书结构化方法及装置 | |
CN112100396A (zh) | 一种数据处理方法和装置 | |
CN107577713B (zh) | 基于电力词典的文本处理方法 | |
US20220365956A1 (en) | Method and apparatus for generating patent summary information, and electronic device and medium | |
Tang et al. | Research on automatic labeling of imbalanced texts of customer complaints based on text enhancement and layer-by-layer semantic matching | |
Pham et al. | Information extraction for Vietnamese real estate advertisements | |
Mangairkarasi et al. | Semantic based text summarization using universal networking language | |
US9569538B1 (en) | Generating content based on a work of authorship | |
CN115983264A (zh) | 服务工单的处理方法及设备 | |
CN111753540B (zh) | 一种对于文本数据进行收集以进行自然语言处理nlp的方法及系统 | |
Roy et al. | A lexicon based algorithm for noisy text normalization as pre processing for sentiment analysis | |
KR102381387B1 (ko) | 챗봇 학습용 데이터 생성 방법 | |
CN110851560B (zh) | 信息检索方法、装置及设备 | |
CN114048742A (zh) | 文本信息的知识实体和关系抽取方法及文本质量评估方法 | |
Anley et al. | Opinion Mining of Tourists' Sentiments: Towards a Comprehensive Service Improvement of Tourism Industry | |
CN107783957B (zh) | 本体创建方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |