CN115080732A - 投诉工单处理方法、装置、电子设备和存储介质 - Google Patents

投诉工单处理方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN115080732A
CN115080732A CN202110283122.6A CN202110283122A CN115080732A CN 115080732 A CN115080732 A CN 115080732A CN 202110283122 A CN202110283122 A CN 202110283122A CN 115080732 A CN115080732 A CN 115080732A
Authority
CN
China
Prior art keywords
work order
complaint work
complaint
processing
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110283122.6A
Other languages
English (en)
Inventor
王娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Jiangsu Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Jiangsu Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Jiangsu Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202110283122.6A priority Critical patent/CN115080732A/zh
Publication of CN115080732A publication Critical patent/CN115080732A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Abstract

本发明提供投诉工单处理方法、装置、电子设备和存储介质,包括:获取待预测投诉工单;将所述待预测投诉工单输入至预先训练好的投诉工单分类模型,得到投诉工单预测类别结果;其中所述投诉工单分类模型,是基于自然语言算法处理得到的投诉工单样本集,以及按照历史投诉工单文本数据的类别标签训练得到的。本发明通过采用基于自然语言处理技术的投诉工单自动化处理,完成对投诉工单的分类、实体提取和语义理解,准确识别工单的核心诉求,进而能够快速、准确地自动化处理工单,大幅提高了海量数据场景下的业务投诉工单的自动化预测效率。

Description

投诉工单处理方法、装置、电子设备和存储介质
技术领域
本发明涉及自然语言技术领域,尤其涉及投诉工单处理方法、装置、电子设备和存储介质。
背景技术
随着通信技术的快速发展,客户服务系统的不断优化升级,以及大数据存储、分析技术的飞速发展,企业产生了大量的业务支撑系统的投诉工单。
目前针对支撑系统每日所产生的大量支撑投诉工单,都是通过投入较多的人力资源进行手动处理,这种较为简单粗暴的处理方式导致了处理效率低时限长、处理结果不准确等诸多问题,影响内外部客户满意度。
当前使用人工方式进行投诉工单处理在实际场景中主要有下列几项缺点:
1、人工处理周期长、成本高:
首先人工处理投诉工单过程中存在着大量重复性的操作且有一定的规则性,这为工单智能化处理提供了可能;其次人工操作需要一定的时间成本,无法达到自动化处理的便捷性;而且人工处理的经济成本与自动化处理相比也更高。
2、处理过程缺乏记录,无法提供后续分析:
处理投诉工单过程中需要融合多种操作才能最终完成对结论的挖掘,但是在人工处理过程中掺杂着较多无法记录的个人操作和行为意识,仅仅对最终的处理结果进行了记录,而缺少了对更为关键的中间过程的记录,造成了后期无法对历史工单的处理流程统计分析,无法为简化处理流程提供参考。
3、无法提供全天候服务:
使用人工方式时,无法24小时全天候不间断对业务侧生成的投诉工单进行处理,时效性较差。对于一些对时效性要求比较高的投诉无法做到及时响应,容易造成不必要的经济损失。而且即便是很简单的投诉工单也需要在人工干预的情况下才能够完成,严重影响了处理速度。
4、严重依赖业务人员的熟练程度,业务人员的培训周期长:
由于投诉工单的处理需要依赖于对业务内容一定程度的理解,而且投诉工单涉及的业务内容往往错综复杂,这对处理人员的素质提出了较高的需要求。工单处理的质量严重依赖于业务人员对业务内容的熟悉程度,造成了对业务人员的培养成本较高。
因此,需要提出一种新的处理投诉工单的智能化方法,克服上述不足。
发明内容
本发明提供投诉工单处理方法、装置、电子设备和存储介质,用以解决现有技术中通过人工处理投诉工单带来的效率低和准确性低的缺陷。
第一方面,本发明提供投诉工单处理方法,包括:
获取待预测投诉工单;
将所述待预测投诉工单输入至预先训练好的投诉工单分类模型,得到投诉工单预测类别结果;其中所述投诉工单分类模型,是基于自然语言算法处理得到的投诉工单样本集,以及按照历史投诉工单文本数据的类别标签训练得到的。
在一个实施例中,所述投诉工单分类模型,通过以下步骤获得:
获取带有所述类别标签的历史投诉工单文本数据,基于所述历史投诉工单文本数据构建工单文本数据集;
建立工单处理业务领域范围专用词表,结合中文常用停用词库,对所述工单文本数据集进行分词和非关键单词进行清洗,得到分词预处理数据集;
结合预设范围高频关键单词进行再次无用词清洗,并生成专业领域词向量库;
由所述专业领域词向量库中的词向量对所述工单文本数据集中的工单数据进行逐条处理,得到每条工单数据的词向量矩阵;
对所述工单文本数据集进行有监督的文本分类算法训练,得到预训练模型;
基于核心要素信息对所述预训练模型进行处理,得到所述投诉工单分类模型。
在一个实施例中,所述建立工单处理业务领域范围专用词表,结合中文常用停用词库,对所述工单文本数据集进行分词和非关键单词进行清洗,得到分词预处理数据集,之前还包括:
采用通用词性分词工具,去除所述工单文本数据集中的非核心信息单词。
在一个实施例中,所述结合预设范围高频关键单词进行再次无用词清洗,并生成专业领域词向量库,还包括:
将所述专业领域词向量库中的特征词以one-hot向量进行表示,并对比多个预设词向量训练模型对所述专业领域词向量库的处理结果。
在一个实施例中,所述对所述工单文本数据集进行有监督的文本分类算法训练,得到预训练模型,具体包括:
将所述工单文本数据集按照预设比例分成训练集和验证集;
采用预设神经网络模型对所述训练集进行训练,利用所述验证集进行效果验证,并选择分类算法,得到所述预训练模型。
在一个实施例中,所述基于核心要素信息对所述预训练模型进行处理,得到所述投诉工单分类模型,具体包括:
获取人工整理的核心要素信息先验知识,汇总关键核心要素信息种类,基于预设小批量文本标注数据进行中文文本关键信息抽取,得到所述投诉工单分类模型。
在一个实施例中,还包括:
基于所述投诉工单预测类别结果,完成对应投诉工单的自动化处理。
第二方面,本发明还提供投诉工单处理装置,包括:
获取模块,用于获取待预测投诉工单;
处理模块,用于将所述待预测投诉工单输入至预先训练好的投诉工单分类模型,得到投诉工单预测类别结果;其中所述投诉工单分类模型,是基于自然语言算法处理得到的投诉工单样本集,以及按照历史投诉工单文本数据的类别标签训练得到的。
第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述投诉工单处理方法的步骤。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述投诉工单处理方法的步骤。
本发明提供的投诉工单处理方法、装置、电子设备和存储介质,通过采用基于自然语言处理技术的投诉工单自动化处理,完成对投诉工单的分类、实体提取和语义理解,准确识别工单的核心诉求,进而能够快速、准确地自动化处理工单,大幅提高了海量数据场景下的业务投诉工单的自动化预测效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的投诉工单处理方法的流程示意图;
图2是本发明提供的投诉工单处理装置的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着深度学习算法AI软硬件技术的不断成熟,人工智能应用不断渗透各业务领域,诸如在收入预测、人脸识别等应用场景方面。而工单数据通常是以文字形式存在于数据库之中,借助AI中台NLP(Natural Language Processing,自然语言处理)技术,可以完成对投诉工单地智能化诊断、高效化处理,快速闭环回复,有效改善回复及时率和精准度,进而提升内外部客户满意度,深化服务为先、客户为本的服务理念。本发明正是利用自然语言处理领域的相关技术,克服上述不足,提供一种更为智能的工单自动化处理方式。
图1是本发明提供的投诉工单处理方法的流程示意图,如图1所示,包括:
101,获取待预测投诉工单;
102,将所述待预测投诉工单输入至预先训练好的投诉工单分类模型,得到投诉工单预测类别结果;其中所述投诉工单分类模型,是基于自然语言算法处理得到的投诉工单样本集,以及按照历史投诉工单文本数据的类别标签训练得到的。
具体地,本发明通过构建投诉工单分类模型,实现对投诉工单的基于NLP的自动化处理方法,首先通过文本分类技术实现投诉工单智能分类功能,其次根据不同种类工单的核心要素不同,结合精准标注关键信息要素、预训练语言模型等技术实现关键信息抽取的模型训练,得到投诉工单分类模型,将待预测投诉工单输入该模型,即可得到投诉工单预测类别结果。
本发明通过采用基于自然语言处理技术的投诉工单自动化处理,完成对投诉工单的分类、实体提取和语义理解,准确识别工单的核心诉求,进而能够快速、准确地自动化处理工单,大幅提高了海量数据场景下的业务投诉工单的自动化预测效率。
基于上述实施例,所述投诉工单分类模型,通过以下步骤获得:
获取带有所述类别标签的历史投诉工单文本数据,基于所述历史投诉工单文本数据构建工单文本数据集;
建立工单处理业务领域范围专用词表,结合中文常用停用词库,对所述工单文本数据集进行分词和非关键单词进行清洗,得到分词预处理数据集;
结合预设范围高频关键单词进行再次无用词清洗,并生成专业领域词向量库;
由所述专业领域词向量库中的词向量对所述工单文本数据集中的工单数据进行逐条处理,得到每条工单数据的词向量矩阵;
对所述工单文本数据集进行有监督的文本分类算法训练,得到预训练模型;
基于核心要素信息对所述预训练模型进行处理,得到所述投诉工单分类模型。
其中,所述建立工单处理业务领域范围专用词表,结合中文常用停用词库,对所述工单文本数据集进行分词和非关键单词进行清洗,得到分词预处理数据集,之前还包括:
采用通用词性分词工具,去除所述工单文本数据集中的非核心信息单词。
其中,所述结合预设范围高频关键单词进行再次无用词清洗,并生成专业领域词向量库,还包括:
将所述专业领域词向量库中的特征词以one-hot向量进行表示,并对比多个预设词向量训练模型对所述专业领域词向量库的处理结果。
其中,所述对所述工单文本数据集进行有监督的文本分类算法训练,得到预训练模型,具体包括:
将所述工单文本数据集按照预设比例分成训练集和验证集;
采用预设神经网络模型对所述训练集进行训练,利用所述验证集进行效果验证,并选择分类算法,得到所述预训练模型。
其中,所述基于核心要素信息对所述预训练模型进行处理,得到所述投诉工单分类模型,具体包括:
获取人工整理的核心要素信息先验知识,汇总关键核心要素信息种类,基于预设小批量文本标注数据进行中文文本关键信息抽取,得到所述投诉工单分类模型。
具体地,本发明所提出的投诉工单分类模型,是通过下面步骤得到:
1)历史数据整理:汇聚带有类别标签的历史投诉工单文本数据,构建工单文本数据集;
2)分词和预处理:建立工单处理业务领域范围内的专用词表,结合中文常用的停用词库,对投诉工单的文本数据进行分词,除了能够完成文本分词之外,还能够将非关键单词进行清洗;
此处,在分词过程中融入了投诉工单领域范围内的专用词表以及中文常用停用词库,此外为了达到更优的效果,还可以先利用通用的词性分析工具,去除一些非核心信息的单词,减少不必要的信息输入;
3)词向量训练:待分词预处理完成后,统计预设范围内的词频,例如词频top5000的单词,其中非高频词通常是有关区域性地理名称,机构单位专用词等非核心词,在步骤2)中分词预处理的基础上再次清洗无用词;此外,对高频top5000的关键单词进行词向量训练,生成专业特殊领域的词向量库,与通用的中文词向量相比,专业性更强,更能体现在工单处理领域的词单元的上下文语境;
这里的词向量(Word embedding),又叫Word嵌入式自然语言处理(NLP)中的一组语言建模和特征学习技术的统称,其中来自词汇表的单词或短语被映射到实数的向量。从概念上讲,它涉及从每个单词一维的空间到具有更低维度的连续向量空间的数学嵌入。生成这种映射的方法包括神经网络,单词共生矩阵的降维,概率模型,可解释的知识库方法,和术语的显式表示单词出现的背景。当用作底层输入表示时,单词和短语嵌入已经被证明可以提高NLP任务的性能,例如语法分析和情感分析。
可以理解的是,特征词都首先以one-hot向量形式表达,而后可以对比Skip-gram词向量训练模型和CBOW词向量训练模型对后续自然语言处理结果的影响;
4)工单内容向量化:利用步骤3)中训练生成的词向量对工单数据进行逐条处理,得到每条工单的词向量矩阵;
5)工单分类:利用步骤1)中收集到的工单标签数据,进行有监督的文本分类算法训练;在此步骤中,将历史工单的70%作为训练集,30%作为验证集,训练算法包括但不仅限于卷积神经网络文本分类、循环神经网络文本分类、fasttext等算法;利用预留的验证集对训练模型进行效果验证,选择分类算法,调节网络参数;
此处,由于涉及投诉工单的分类较多,而且数据倾斜问题较严重,在利用不同有监督分类算法时,可以结合其他手段消除数据问题造成的影响,其中FastText算法中通过引入霍夫曼树代替标准softmax对数据质量问题有一定的消除作用;
6)核心要素提取:由于不同种类的工单所需要的关键核心信息不同,需要结合前期业务人员整理的不同工单种类的核心要素信息等先验知识,汇总需要提取的关键核心要素信息的种类,再基于小批量文本标注数据利用预训练语言模型完成中文文本关键信息抽取模型的训练,得到最终的模型;
这里的文本标注具体是,在序列标注中,若想对一个序列的每一个元素标注一个标签,一般来说,一个序列指的是一个句子,而一个元素指的是句子中的一个词,比如信息提取问题可以认为是一个序列标注问题,如提取出会议时间、地点等。
需要说明的是,由于模型训练使用了预训练模型,所以只需要少量文本数据的标注信息;所述文本标注使用了BIO标注法,分别以“B-X”、“I-X”或者“O”代表短语的开头,中间及其他。
本发明涉及的预训练模型的应用通常分为两步:第一步:在计算性能满足的情况下用某个较大的数据集训练出一个较好的模型;第二步:根据不同的任务,改造预训练模型,用新任务的数据集在预训练模型上进行微调。预训练模型的好处是训练代价较小,配合下游任务可以实现更快的收敛速度,并且能够有效地提高模型性能,尤其是对一些训练数据比较稀缺的任务。
本发明所提出的投诉工单分类模型,将完整的处理流程进行了阶段划分,为能够将投诉工单智能化处理这一复杂的系统级服务开发部署,打下了坚实的基础。
基于上述任一实施例,该方法还包括:
基于所述投诉工单预测类别结果,完成对应投诉工单的自动化处理。
具体地,在得到投诉工单预测类别结果后,调用不同的业务支持平台相对应的处理接口,完成对该工单的自动化处理。
本发明通过深入分析业务人员的工单处理步骤,然后与自然语言处理技术进行了融合,配合后端业务支撑平台的功能,完成了整个工单处理流程的闭环,通过大量减少人工的介入,能够带来处理效率提升的提升,有效节约了成本。
下面对本发明提供的投诉工单处理装置进行描述,下文描述的投诉工单处理装置与上文描述的投诉工单处理方法可相互对应参照。
图2是本发明提供的投诉工单处理装置的结构示意图,如图2所示,包括:获取模块21和处理模块22;其中:
获取模块21用于获取待预测投诉工单;处理模块22用于将所述待预测投诉工单输入至预先训练好的投诉工单分类模型,得到投诉工单预测类别结果;其中所述投诉工单分类模型,是基于自然语言算法处理得到的投诉工单样本集,以及按照历史投诉工单文本数据的类别标签训练得到的。
本发明通过采用基于自然语言处理技术的投诉工单自动化处理,完成对投诉工单的分类、实体提取和语义理解,准确识别工单的核心诉求,进而能够快速、准确地自动化处理工单,大幅提高了海量数据场景下的业务投诉工单的自动化预测效率。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(CommunicationsInterface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行投诉工单处理方法,该方法包括:获取待预测投诉工单;将所述待预测投诉工单输入至预先训练好的投诉工单分类模型,得到投诉工单预测类别结果;其中所述投诉工单分类模型,是基于自然语言算法处理得到的投诉工单样本集,以及按照历史投诉工单文本数据的类别标签训练得到的。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的投诉工单处理方法,该方法包括:获取待预测投诉工单;将所述待预测投诉工单输入至预先训练好的投诉工单分类模型,得到投诉工单预测类别结果;其中所述投诉工单分类模型,是基于自然语言算法处理得到的投诉工单样本集,以及按照历史投诉工单文本数据的类别标签训练得到的。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的投诉工单处理方法,该方法包括:获取待预测投诉工单;将所述待预测投诉工单输入至预先训练好的投诉工单分类模型,得到投诉工单预测类别结果;其中所述投诉工单分类模型,是基于自然语言算法处理得到的投诉工单样本集,以及按照历史投诉工单文本数据的类别标签训练得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.投诉工单处理方法,其特征在于,包括:
获取待预测投诉工单;
将所述待预测投诉工单输入至预先训练好的投诉工单分类模型,得到投诉工单预测类别结果;其中所述投诉工单分类模型,是基于自然语言算法处理得到的投诉工单样本集,以及按照历史投诉工单文本数据的类别标签训练得到的。
2.根据权利要求1所述的投诉工单处理方法,其特征在于,所述投诉工单分类模型,通过以下步骤获得:
获取带有所述类别标签的历史投诉工单文本数据,基于所述历史投诉工单文本数据构建工单文本数据集;
建立工单处理业务领域范围专用词表,结合中文常用停用词库,对所述工单文本数据集进行分词和非关键单词进行清洗,得到分词预处理数据集;
结合预设范围高频关键单词进行再次无用词清洗,并生成专业领域词向量库;
由所述专业领域词向量库中的词向量对所述工单文本数据集中的工单数据进行逐条处理,得到每条工单数据的词向量矩阵;
对所述工单文本数据集进行有监督的文本分类算法训练,得到预训练模型;
基于核心要素信息对所述预训练模型进行处理,得到所述投诉工单分类模型。
3.根据权利要求2所述的投诉工单处理方法,其特征在于,所述建立工单处理业务领域范围专用词表,结合中文常用停用词库,对所述工单文本数据集进行分词和非关键单词进行清洗,得到分词预处理数据集,之前还包括:
采用通用词性分词工具,去除所述工单文本数据集中的非核心信息单词。
4.根据权利要求2所述的投诉工单处理方法,其特征在于,所述结合预设范围高频关键单词进行再次无用词清洗,并生成专业领域词向量库,还包括:
将所述专业领域词向量库中的特征词以one-hot向量进行表示,并对比多个预设词向量训练模型对所述专业领域词向量库的处理结果。
5.根据权利要求2所述的投诉工单处理方法,其特征在于,所述对所述工单文本数据集进行有监督的文本分类算法训练,得到预训练模型,具体包括:
将所述工单文本数据集按照预设比例分成训练集和验证集;
采用预设神经网络模型对所述训练集进行训练,利用所述验证集进行效果验证,并选择分类算法,得到所述预训练模型。
6.根据权利要求2所述的投诉工单处理方法,其特征在于,所述基于核心要素信息对所述预训练模型进行处理,得到所述投诉工单分类模型,具体包括:
获取人工整理的核心要素信息先验知识,汇总关键核心要素信息种类,基于预设小批量文本标注数据进行中文文本关键信息抽取,得到所述投诉工单分类模型。
7.根据权利要求1所述的投诉工单处理方法,其特征在于,还包括:
基于所述投诉工单预测类别结果,完成对应投诉工单的自动化处理。
8.投诉工单处理装置,其特征在于,包括:
获取模块,用于获取待预测投诉工单;
处理模块,用于将所述待预测投诉工单输入至预先训练好的投诉工单分类模型,得到投诉工单预测类别结果;其中所述投诉工单分类模型,是基于自然语言算法处理得到的投诉工单样本集,以及按照历史投诉工单文本数据的类别标签训练得到的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述投诉工单处理方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述投诉工单处理方法的步骤。
CN202110283122.6A 2021-03-16 2021-03-16 投诉工单处理方法、装置、电子设备和存储介质 Pending CN115080732A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110283122.6A CN115080732A (zh) 2021-03-16 2021-03-16 投诉工单处理方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110283122.6A CN115080732A (zh) 2021-03-16 2021-03-16 投诉工单处理方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN115080732A true CN115080732A (zh) 2022-09-20

Family

ID=83245568

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110283122.6A Pending CN115080732A (zh) 2021-03-16 2021-03-16 投诉工单处理方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN115080732A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117172508A (zh) * 2023-10-31 2023-12-05 无锡容智技术有限公司 一种基于城运投诉工单识别的自动派单方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117172508A (zh) * 2023-10-31 2023-12-05 无锡容智技术有限公司 一种基于城运投诉工单识别的自动派单方法及系统
CN117172508B (zh) * 2023-10-31 2024-02-27 无锡容智技术有限公司 一种基于城运投诉工单识别的自动派单方法及系统

Similar Documents

Publication Publication Date Title
CN109522556B (zh) 一种意图识别方法及装置
CN107886231B (zh) 客服的服务质量评价方法与系统
CN111182162B (zh) 基于人工智能的电话质检方法、装置、设备和存储介质
CN107833059B (zh) 客服的服务质量评价方法与系统
CN112163424A (zh) 数据的标注方法、装置、设备和介质
CN109710766B (zh) 一种工单数据的投诉倾向分析预警方法及装置
CN114612251A (zh) 风险评估方法、装置、设备及存储介质
CN111462752A (zh) 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法
CN110825839A (zh) 一种对文本信息中目标的关联关系分析方法
CN107766560B (zh) 客服服务流程的评价方法和系统
CN111782793A (zh) 智能客服处理方法和系统及设备
CN113590764B (zh) 训练样本构建方法、装置、电子设备和存储介质
CN111160034A (zh) 一种实体词的标注方法、装置、存储介质及设备
CN113486174B (zh) 模型训练、阅读理解方法、装置、电子设备及存储介质
CN115080732A (zh) 投诉工单处理方法、装置、电子设备和存储介质
CN110362828B (zh) 网络资讯风险识别方法及系统
CN107886233B (zh) 客服的服务质量评价方法和系统
CN110414819B (zh) 一种工单评分方法
CN113095723A (zh) 优惠券的推荐方法及装置
CN107886232B (zh) 客服的服务质量评价方法和系统
CN111460107A (zh) 一种应答方法和应答系统
CN116341990B (zh) 一种基础设施工程的知识管理评价方法及系统
CN107798480B (zh) 客服的服务质量评价方法与系统
CN113886553A (zh) 一种文本生成方法、装置、设备以及存储介质
CN115455184A (zh) 一种投诉工单分类的方法、装置及相关产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination