CN109635292A - 基于机器学习算法的工单质检方法和装置 - Google Patents

基于机器学习算法的工单质检方法和装置 Download PDF

Info

Publication number
CN109635292A
CN109635292A CN201811482026.9A CN201811482026A CN109635292A CN 109635292 A CN109635292 A CN 109635292A CN 201811482026 A CN201811482026 A CN 201811482026A CN 109635292 A CN109635292 A CN 109635292A
Authority
CN
China
Prior art keywords
information
work order
report knot
vector
knot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811482026.9A
Other languages
English (en)
Other versions
CN109635292B (zh
Inventor
李道勋
吴志清
李欢欢
颜奕
陈亚萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU DONGFANG COMMUNICATION SOFTWARE TECHNOLOGY Co Ltd
Original Assignee
HANGZHOU DONGFANG COMMUNICATION SOFTWARE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU DONGFANG COMMUNICATION SOFTWARE TECHNOLOGY Co Ltd filed Critical HANGZHOU DONGFANG COMMUNICATION SOFTWARE TECHNOLOGY Co Ltd
Priority to CN201811482026.9A priority Critical patent/CN109635292B/zh
Publication of CN109635292A publication Critical patent/CN109635292A/zh
Application granted granted Critical
Publication of CN109635292B publication Critical patent/CN109635292B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Factory Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例提供基于机器学习的工单质检方法和装置。在一个例子中,工单质检方法包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与实际的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。本发明实施例有助于提高工单质检准确率。

Description

基于机器学习算法的工单质检方法和装置
技术领域
本发明涉及移动通信的网管技术领域,具体地说涉及EOMS系统中的工单内容进行质检的方法和装置。
背景技术
现有EOMS系统(Electric Operation Maintenance System,电子运维系统)中包含了一整套工单流转与处理的流程。客服平台生成的投诉工单流转至EOMS系统,监控室投诉处理班组对部分字段根据规则和经验进行判断是否符合。在整个环节中,主要在受理、预处理、报结这3个环节需要人工进行检查。人工检查费时费力,且由于工单量大、人力成本高,通常只能做到抽检,无法对全量工单进行检查。
为了解决人工检查费时费力的问题,现有通常的做法是通过设定固定的质检规则的方式来对工单文本进行判断。这种方式通常需要经验丰富的质检人员设定检测规则、构建检测字典等方式。但是,由于工单内容通常为非结构化文本,通常缺少固定的格式,导致构建能够覆盖全面的规则的难度较大,且构建规则时的判断费时费力,准确率也不高。
发明内容
根据本发明第一方面,提供一种基于机器学习算法的工单质检方法,包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。
根据本发明第二方面,提供一种基于机器学习算法的工单质检方法,包括:从待质检工单中抽取出附加报结信息、解决情况这两个信息;利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;分别对分词后的附加报结信息进行向量化;基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致。
根据本发明第三方面,提供一种基于机器学习算法的工单质检方法,包括:从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量结果合并为第三向量;基于上述合并后的第三向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致。
根据本发明第四方面,提供一种工单质检装置,包括:抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;预测单元,基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;对比单元,将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。
根据本发明第五方面,提供一种工单质检装置,包括:抽取单元,从待质检工单中抽取出附加报结信息、解决情况这两个信息;分词单元,利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;向量化单元,分别对分词后的附加报结信息进行向量化;预测单元,基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;对比单元,将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致。
根据本发明第六方面,提供一种工单质检装置,包括:抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;弱覆盖信息与场景信息向量化单元和合并单元,对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量合并;预测单元,基于上述合并后的第三向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;对比单元,将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致。
采用本发明实施例的技术优点:能够通过增加特征、SVM的模型调优等方式来获得效果最优的模型,从而提高结果判断准确率。不需要人工提炼规则,只需要利用历史数据就能对模型进行迭代更新。在未来新增工单内容、新增投诉类别等信息之后也能快速迭代。由于大部分合格工单已经被筛选过滤,所以能够大量减少人工审核工单的数量。
附图说明
图1是根据本发明实施例的基于业务类别分类模型的工单质检方法示意图;
图2是根据本发明实施例的基于解决情况分类模型的工单质检方法示意图;
图3是根据本发明实施例的基于报结意见分类模型的工单质检方法示意图;
图4示意了根据本说明书实施例的可用于实现上述各种技术的设备的详细结构图;
图5是基于业务类别分类模型的工单质检装置的示意图;
图6是基于解决情况分类模型的工单质检装置的示意图;
图7是基于报结意见分类模型的工单质检装置的示意图。
具体实施方式
本发明实施例基于机器学习的文本分类算法自动对工单内容进行分类。利用历史工单数据对模型进行训练和迭代优化。然后通过训练后的模型获得准确的工单类别,并与实际填写的内容进行比对。将比对失败的工单标记为质检不合格并输出。
当前情况下,每月大致有例如15万以上的工单,每个待质检工单中均包含:投诉内容、附加报结信息、投诉业务类别、解决情况、报结意见。在质检时,主要判断投诉业务类别、解决情况、报结意见是否填写正确,是否和投诉内容、附加报结信息相匹配。如果利用人工质检,则费时费力,如果利用规则质检,则准确率不高且规则设定是否困难。
本发明实施例基于机器学习中的TFIDF(term frequency–inverse documentfrequency词频-逆文本频率指数)和SVM(Support Vector Machine,支持向量机)算法,基于投诉内容、附加报结信息、投诉业务类别、解决情况、报结意见等字段中的一个或多个分别构建文本分类模型,利用训练后的模型对工单进行质检。
TFIDF是一种统计方法,通过计算文本中的词频数和逆向文件频率的乘积来给词赋值,从而对文本进行向量化。一个词在一段文本中出现的次数越多,在所有文本中出现的次数越少,则越能代表该段文本,其TFIDF的值越大。
SVM算法是机器学习算法中的一种分类模型。它的分类思想是根据正负样本,通过寻找一个超平面对样本进行分割。
在工单质检的流程当中,需要以投诉内容、附加报结信息作为特征,再分别将投诉业务类别、解决情况、报结意见作为标签,构建与优化三个分类模型对类别进行预测。
图1是根据本发明实施例的基于业务类别分类模型的工单质检方法示意图。首先,具体介绍业务类别分类模型的训练过程。具体模型训练过程说明如下:
从历史工单中筛选出业务类别正确的工单;
利用人工构造的分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;
利用TFIDF分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;
将向量作为特征、投诉业务类别作为标签,利用SVM构建模型并优化。
如图1所示,基于业务类别分类模型的工单质检方法包括如下步骤:
在步骤S102,从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息。
在步骤S104,利用人工构造的分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作。
在步骤S106,利用TFIDF分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量。
在步骤S108,基于TFIDF向量,利用训练后的SVM模型进行预测,获取预测结果。
在步骤S112,将预测结果与实际的业务类别进行对比,如果一致则返回正确,不一致则返回预测的业务类别。
图2是根据本发明实施例的基于解决情况分类模型的工单质检方法示意图。首先,对解决情况分类模型的具体模型训练过程说明如下:
从历史工单中筛选出解决情况正确的工单;
利用人工构造的分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;
利用TFIDF分别对分词后的附加报结信息进行向量化;
将向量作为特征、解决情况作为标签,利用SVM构建模型并优化。
如图2所示,基于解决情况分类模型的工单质检方法包括如下步骤:
在步骤S202,从待质检工单中抽取出附加报结信息、解决情况这两个信息。
在步骤S204,利用人工构造的分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;
在步骤S206,利用TFIDF分别对分词后的附加报结信息进行向量化;
在步骤S208,基于TFIDF向量,利用训练后的SVM模型进行预测,获取预测结果。
在步骤S212,将预测结果与实际的解决情况进行对比,如果一致则返回正确,不一致则返回预测的解决情况。
图3是根据本发明实施例的基于报结意见分类模型的工单质检方法示意图。首先,对报结意见分类模型的具体模型训练过程说明如下:
从历史工单中筛选出报结意见正确的工单,再取集中小区状态表的数据。
利用人工构造的分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作。
利用TFIDF分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量。
利用莱温斯坦算法对投诉工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息(乡村、城镇等),将弱覆盖信息与场景信息转化为Onehot向量并与TFIDF的向量结果合并。
将上一步生成的向量作为特征、报结意见作为标签,利用SVM构建模型并优化。
如图3所示,基于报结意见分类模型的工单质检方法包括如下步骤:
在步骤S302,从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据。
在步骤S304,利用人工构造的分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作。
在步骤S306,利用TFIDF分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量。
在步骤S308,利用莱温斯坦算法对投诉工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息(乡村、城镇等),将弱覆盖信息与场景信息转化为Onehot向量并与TFIDF的向量结果合并。当然,向量合并也可以采取一步完成。
在步骤S310,基于上一步生成的向量,利用训练后的SVM模型进行预测,获取预测结果。
在步骤S312,将预测结果与实际的报结意见进行对比,如果一致则返回正确,不一致则返回预测的报结意见。
在一个例子中,可以将三个质检均返回正确的工单认为是质检通过工单,其余工单则需人工再次确认。
图4示意了根据本说明书实施例的可用于实现上述各种技术的设备的详细结构图。该结构图示意了可实现图1-3所示方法流程的硬件基础。如图4所示,设备可包括处理器402,该处理器用于控制设备的总体操作的微处理器或控制器411。数据总线415可用于在存储装置440、处理器402和控制器417等之间进行数据传输。控制器511可用于通过设备控制总线417与不同设备进行交互并对其进行控制。设备还可包括耦接至数据链路412的网络/总线接口414。在无线连接的情况下,网络/总线接口414可包括无线收发器。
设备还包括存储装置440。该存储装置存储有软件;在运行时,软件自RAM440中加载于RAM420中,并且由此控制处理器402执行相应操作。
在一个例子中,操作包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。
在另一个例子中,操作包括:从待质检工单中抽取出附加报结信息、解决情况这两个信息;利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;分别对分词后的附加报结信息进行向量化;基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致。
在再一个例子中,操作包括:从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量合并为第三向量;基于上述合并后的第三向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致。
应当理解,这里描述的设备在很多方面可以利用前面描述的方法实施例或与之结合。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书各实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图1-图3所描述的方法。
图5-图7示意了本说明书各实施例所描述的功能采用硬件、固件或者其组合或者与软件组合时的一些可能的方案。
具体地,图5是基于业务类别分类模型的工单质检装置的示意图,该工单质检装置包括:抽取单元502,从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;分词单元504,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;向量化单元506,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;预测单元508,基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;对比单元510,将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。
图6是基于解决情况分类模型的工单质检装置的示意图,该工单质检装置包括:抽取单元602,从待质检工单中抽取出附加报结信息、解决情况这两个信息;分词单元604,利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;向量化单606元,分别对分词后的附加报结信息进行向量化;预测单元608,基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;对比单元610,将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致。
图7是基于报结意见分类模型的工单质检装置的示意图,该工单质检装置包括:抽取单元702,从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;分词单元704,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;向量化单元706,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;弱覆盖信息与场景信息向量化单元和合并单元708,对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为Onehot向量,即第二向量并与第一向量合并成为第三向量;预测单元710,基于上述第三向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;对比单元712,将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致。
应当理解,这里描述的多声道响度均衡设备在很多方面可以利用前面描述的方法实施例或与之结合。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
虽然上文结合TFIDF和SVM算法对本发明的实施例做了说明,但是,很显然,除TFIDF以外的其它统计方法,以及除SVM算法的其它分类方法也是可行的。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种基于机器学习算法的工单质检方法,包括:
从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;
利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;
分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;
基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;
将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。
2.一种基于机器学习算法的工单质检方法,包括:
从待质检工单中抽取出附加报结信息、解决情况这两个信息;
利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;
分别对分词后的附加报结信息进行向量化;
基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;
将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致。
3.一种基于机器学习算法的工单质检方法,包括:
从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;
利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;
分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;
对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量结果合并为第三向量;
基于上述合并后的向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;
将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致。
4.一种工单质检装置,包括:
抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;
分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;
向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;
预测单元,基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;
对比单元,将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。
5.一种工单质检装置,包括:
抽取单元,从待质检工单中抽取出附加报结信息、解决情况这两个信息;
分词单元,利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;
向量化单元,分别对分词后的附加报结信息进行向量化;
预测单元,基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;
对比单元,将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致。
6.一种工单质检装置,包括:
抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;
分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;
向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;
弱覆盖信息与场景信息向量化单元和合并单元,对投诉工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量合并成为第三向量;
预测单元,基于上述第三向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;
对比单元,将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致。
7.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-3之一所述的方法。
8.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-3之一所述的方法。
CN201811482026.9A 2018-12-05 2018-12-05 基于机器学习算法的工单质检方法和装置 Active CN109635292B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811482026.9A CN109635292B (zh) 2018-12-05 2018-12-05 基于机器学习算法的工单质检方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811482026.9A CN109635292B (zh) 2018-12-05 2018-12-05 基于机器学习算法的工单质检方法和装置

Publications (2)

Publication Number Publication Date
CN109635292A true CN109635292A (zh) 2019-04-16
CN109635292B CN109635292B (zh) 2023-07-28

Family

ID=66071226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811482026.9A Active CN109635292B (zh) 2018-12-05 2018-12-05 基于机器学习算法的工单质检方法和装置

Country Status (1)

Country Link
CN (1) CN109635292B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472866A (zh) * 2019-08-13 2019-11-19 中国铁塔股份有限公司 一种工单质检分析方法及装置
CN110704616A (zh) * 2019-09-09 2020-01-17 中盈优创资讯科技有限公司 设备告警工单识别方法及装置
CN111191449A (zh) * 2019-12-26 2020-05-22 航天信息股份有限公司 一种税务反馈信息的处理方法及装置
CN111191614A (zh) * 2020-01-02 2020-05-22 中国建设银行股份有限公司 一种单据分类方法和装置
CN112685555A (zh) * 2019-10-17 2021-04-20 中国移动通信集团浙江有限公司 投诉工单质量检测方法及装置
CN112800215A (zh) * 2021-01-29 2021-05-14 北京大米科技有限公司 一种文本处理方法、装置、可读存储介质和电子设备
CN113095515A (zh) * 2019-12-19 2021-07-09 中国移动通信集团辽宁有限公司 业务故障信息处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458676A (zh) * 2007-12-11 2009-06-17 中国移动通信集团公司 质检确定方法、质检系统及神经网络
CN107861942A (zh) * 2017-10-11 2018-03-30 国网浙江省电力公司电力科学研究院 一种基于深度学习的电力疑似投诉工单识别方法
CN108470022A (zh) * 2018-01-18 2018-08-31 南京邮电大学 一种基于运维管理的智能工单质检方法
CN108876039A (zh) * 2018-06-21 2018-11-23 浙江工业大学 一种基于支持向量机的含分布式电源配电网电能质量预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458676A (zh) * 2007-12-11 2009-06-17 中国移动通信集团公司 质检确定方法、质检系统及神经网络
CN107861942A (zh) * 2017-10-11 2018-03-30 国网浙江省电力公司电力科学研究院 一种基于深度学习的电力疑似投诉工单识别方法
CN108470022A (zh) * 2018-01-18 2018-08-31 南京邮电大学 一种基于运维管理的智能工单质检方法
CN108876039A (zh) * 2018-06-21 2018-11-23 浙江工业大学 一种基于支持向量机的含分布式电源配电网电能质量预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
罗欣: "深度学习在电力潜在投诉识别分类中的应用", 《浙江电力》 *
罗欣: "深度学习在电力潜在投诉识别分类中的应用", 《浙江电力》, 31 December 2017 (2017-12-31) *
罗欣: "深度学习在电力潜在投诉识别分类中的应用", 浙江电力 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472866A (zh) * 2019-08-13 2019-11-19 中国铁塔股份有限公司 一种工单质检分析方法及装置
CN110704616A (zh) * 2019-09-09 2020-01-17 中盈优创资讯科技有限公司 设备告警工单识别方法及装置
CN112685555A (zh) * 2019-10-17 2021-04-20 中国移动通信集团浙江有限公司 投诉工单质量检测方法及装置
CN112685555B (zh) * 2019-10-17 2023-04-18 中国移动通信集团浙江有限公司 投诉工单质量检测方法及装置
CN113095515A (zh) * 2019-12-19 2021-07-09 中国移动通信集团辽宁有限公司 业务故障信息处理方法及装置
CN111191449A (zh) * 2019-12-26 2020-05-22 航天信息股份有限公司 一种税务反馈信息的处理方法及装置
CN111191614A (zh) * 2020-01-02 2020-05-22 中国建设银行股份有限公司 一种单据分类方法和装置
CN111191614B (zh) * 2020-01-02 2023-08-29 中国建设银行股份有限公司 一种单据分类方法和装置
CN112800215A (zh) * 2021-01-29 2021-05-14 北京大米科技有限公司 一种文本处理方法、装置、可读存储介质和电子设备

Also Published As

Publication number Publication date
CN109635292B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN109635292A (zh) 基于机器学习算法的工单质检方法和装置
CN109214719B (zh) 一种基于人工智能的营销稽查分析的系统和方法
CN110221145B (zh) 电力设备故障诊断方法、装置及终端设备
CN104965787B (zh) 一种基于三支决策的两阶段软件缺陷预测方法
US20240142063A1 (en) Method for troubleshooting potential safety hazards of compressor in smart gas pipeline network and internet of things system thereof
CN103246355A (zh) 在线输入法评测方法、系统及装置
CN103905275A (zh) 基于iec61850取代服务的电力远动装置测试方法
CN110826228B (zh) 一种地区电网运行品质极限评估方法
CN114519524A (zh) 基于知识图谱的企业风险预警方法、装置及存储介质
CN105141446A (zh) 一种基于客观权重确定的网络设备健康度评估方法
CN111582645B (zh) 基于因子分解机的app风险评估方法、装置和电子设备
CN115423009A (zh) 一种面向云边协同的电力设备故障识别方法及系统
CN109905268B (zh) 网络运维的方法及装置
CN110472866A (zh) 一种工单质检分析方法及装置
CN107463680A (zh) 一种整合单据的方法及装置
CN107292175A (zh) 服务器设备安全管理方法及装置
CN110601214A (zh) 一种配电网无功电压治理监控系统
CN107517474A (zh) 一种网络分析优化方法及装置
CN114912854A (zh) 地铁列车运行调整方法、装置、电子设备及存储介质
CN115470854A (zh) 信息系统故障分类方法及分类系统
CN107580329A (zh) 一种网络分析优化方法及装置
CN114385398A (zh) 一种请求响应状态确定方法、装置、设备和存储介质
CN113807704A (zh) 一种城市轨道交通数据的智能算法平台构建方法
KR20150142459A (ko) 인스트루먼트 인덱스 자동화 시스템 및 방법
CN116541527B (zh) 一种基于模型集成和数据扩充的公文分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant