CN113868427A - 一种数据处理方法、装置及电子设备 - Google Patents
一种数据处理方法、装置及电子设备 Download PDFInfo
- Publication number
- CN113868427A CN113868427A CN202010612814.6A CN202010612814A CN113868427A CN 113868427 A CN113868427 A CN 113868427A CN 202010612814 A CN202010612814 A CN 202010612814A CN 113868427 A CN113868427 A CN 113868427A
- Authority
- CN
- China
- Prior art keywords
- target
- work order
- vector
- order data
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 239000013598 vector Substances 0.000 claims abstract description 179
- 238000012545 processing Methods 0.000 claims abstract description 106
- 238000004458 analytical method Methods 0.000 claims abstract description 49
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 23
- 230000015654 memory Effects 0.000 claims description 32
- 238000003860 storage Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 20
- 238000007499 fusion processing Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 12
- 230000011218 segmentation Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Biophysics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种数据处理方法、装置及电子设备,所述方法包括:获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据;基于所述目标工单数据和预先构建的知识图谱,确定与所述目标工单数据对应的目标故障解决方案,所述知识图谱包括目标向量对应的实体节点和所述目标向量之间的关联关系对应的实体节点之间的关联关系,所述目标向量是基于历史工单数据和预先构建的文本分析模型确定的,所述文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型;基于所述目标故障解决方案,对所述目标用户的故障处理需求进行处理。通过上述处理方法,可以提高目标用户的故障处理需求的处理效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法、装置及电子设备。
背景技术
随着通信服务与经济的快速发展,运营商为用户提供的业务种类越来越多,用户对通信业务的故障处理需求的数量也逐渐增加,而且用户针对业务的故障处理需求通常具有口语化、多样化的特点,所以,如何提高对用户的故障处理需求的处理效率成为运营商关注的焦点。
目前,可以通过人工服务的方式,对接收到的用户的故障处理需求进行处理,例如,用户可以通过运营商提供的热线语音服务,将自己的故障处理需求发送给对应的工作人员,工作人员可以记录用户的故障处理需求,并将记录有用户的故障处理需求的工单派单到二线或三线工作人员进行处理,然后在给用户进行反馈(即处理用户的故障处理需求)。
但是,通过上述方式进行故障处理需求时,存在以下问题,由于运营商提供的业务种类较多,用户数量也较为庞大,人工处理故障处理需求就存在人工成本高,处理效率低的问题,且热线接续能力有限,尤其在故障高峰时点,大量故障处理需求无法及时得到响应,用户体验差。
发明内容
本发明实施例的目的是提供一种数据处理方法,以解决现有技术中对开户渠道进行风险监控时,存在的成本较高、效率较低,以及风险防范滞后性的问题。
为解决上述技术问题,本发明实施例是这样实现的:
第一方面,本发明实施例提供的一种数据处理方法,所述方法包括:
获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据;
基于所述目标工单数据和预先构建的知识图谱,确定与所述目标工单数据对应的目标故障解决方案,所述知识图谱包括目标向量对应的实体节点和所述目标向量之间的关联关系对应的实体节点之间的关联关系,所述目标向量是基于历史工单数据和预先构建的文本分析模型确定的,所述文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型;
基于所述目标故障解决方案,对所述目标用户的故障处理需求进行处理。
第二方面,本发明实施例提供了一种数据处理装置,所述装置包括:
第一获取模块,用于获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据;
方案确定模块,用于基于所述目标工单数据和预先构建的知识图谱,确定与所述目标工单数据对应的目标故障解决方案,所述知识图谱包括目标向量对应的实体节点和所述目标向量之间的关联关系对应的实体节点之间的关联关系,所述目标向量是基于历史工单数据和预先构建的文本分析模型确定的,所述文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型;
需求处理模块,用于基于所述目标故障解决方案,对所述目标用户的故障处理需求进行处理。
第三方面,本发明实施例提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述实施例提供的数据处理方法的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的数据处理方法的步骤。
由以上本发明实施例提供的技术方案可见,本发明实施例通过获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据,基于目标工单数据和预先构建的知识图谱,确定与目标工单数据对应的目标故障解决方案,知识图谱包括目标向量对应的实体节点和目标向量之间的关联关系对应的实体节点之间的关联关系,目标向量是基于历史工单数据和预先构建的文本分析模型确定的,文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型,基于目标故障解决方案,对目标用户的故障处理需求进行处理。这样,通过知识图谱和目标工单数据,可以准确的定位到用于处理目标用户的故障处理需求的目标故障解决方案,故障解决方案的确定效率高,即可以提高目标用户的故障处理需求的处理效率,同时,避免了在故障高峰时点,无法及时对大量处长处理需求进行响应的问题,提高用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种数据处理方法的流程示意图;
图2为本发明另一种数据处理方法的流程示意图;
图3为本发明一种预设的知识图谱模式的示意图;
图4为本发明一种数据处理装置的结构示意图;
图5为本发明一种电子设备的结构示意图。
具体实施方式
本发明实施例提供一种数据处理方法、装置及电子设备。
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例一
如图1所示,本发明实施例提供一种数据处理方法,该方法的执行主体可以为服务器,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。该方法具体可以包括以下步骤:
在S102中,获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据。
其中,目标业务可以是任意移动通讯业务,故障处理需求可以是目标用户在使用目标业务时出现的任意故障处理需求,故障处理需求中可以包括故障内容描述、故障原因、故障归属、故障详细描述、故障发生地点等需求中的任意一项或多项,目标工单数据可以是基于上述故障处理需求以及获取的目标用户的基本信息(如目标用户的用户号码、用户资费、关联需求、使用的套餐内容等)生成的工单数据。
在实施中,随着通信服务与经济的快速发展,运营商为用户提供的业务种类越来越多,用户对通信业务的故障处理需求的数量也逐渐增加,而且用户针对业务的故障处理需求通常具有口语化、多样化的特点,所以,如何提高对用户的故障处理需求的处理效率成为运营商关注的焦点。目前,可以通过人工服务的方式,对接收到的用户的故障处理需求进行处理,例如,用户可以通过运营商提供的热线语音服务,将自己的故障处理需求发送给对应的工作人员,工作人员可以记录用户的故障处理需求,并将记录有用户的故障处理需求的工单派单到二线或三线工作人员进行处理,然后在给用户进行反馈(即处理用户的故障处理需求)。
但是,通过上述方式进行故障处理需求时,存在以下问题,由于运营商提供的业务种类较多,用户数量也较为庞大,人工处理故障处理需求就存在人工成本高,处理效率低的问题,且热线接续能力有限,尤其在故障高峰时点,大量故障处理需求无法及时得到响应,用户体验差。
为此,本说明书实施例提供一种可以解决上述问题的技术方案,具体可以参见下述内容。
目标用户在使用运营商提供的目标业务的过程中,如发生无法使用等故障,目标用户可以通过运营商提供的热线语音服务,将故障处理需求以语音数据的方式发送给运营商用于处理故障处理需求的服务器,即服务器可以获取的目标用户对目标业务的故障处理需求,可以是目标用户的语音数据。服务器可以基于预设转换算法,将目标用户的语音数据转换为可识别的文字数据,并根据转换得到的文字数据,以及获取的目标用户的基本信息生成对应的目标工单数据。
或者,目标用户还可以在运营商提供的故障处理平台,输入对目标业务的故障处理需求,即服务器可以直接获取故障处理需求的文字数据,并生成对应的目标工单数据。
在实际应用场景中,可以获取到多个目标用户针对目标业务的故障处理需求,可以分别对每个目标用户的故障处理需求,生成对应的目标工单数据。
在S104中,基于目标工单数据和预先构建的知识图谱,确定与目标工单数据对应的目标故障解决方案。
其中,知识图谱可以包括目标向量对应的实体节点和目标向量之间的关联关系对应的实体节点之间的关联关系,目标向量可以是基于历史工单数据和预先构建的文本分析模型确定的,文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型。
在实施中,通过预先构建的文本分析模型,对历史工单数据进行处理,可以得到对应的目标向量以及目标向量之间的关联关系,在基于目标向量以及目标向量之间的关联关系构建知识图谱,其中,构建的知识图谱的组织方式可以是“实体节点-关系-实体节点”,目标向量对应的实体节点可以代表对故障的描述、故障原因以及对应的故障解决方案。
可以基于目标工单数据,在预先构建的知识图谱中进行图谱检索,以确定对应的目标故障解决方案。例如,历史工单数据中包含用户1在时间和地点1发送的关于目标业务的故障处理需求以及对应的故障解决方案a,以及用户2在时间2和地点1发送的关于目标业务的故障处理需求。可以基于预先构建的文本分析模型,分别对上述2条历史工单数据进行处理,得到对应的目标向量1和目标向量2,这两个目标向量之间可以基于地点1建立关联关系,其中,每个目标向量还可以包含多个向量分量,可以基于目标向量1和目标向量2包含的向量分量以及这两个目标向量之间的关联关系构建知识图谱,即将每个向量分量确定为实体节点。
在接收到目标用户对目标业务的故障处理需求后,可以生成对应的目标工单数据,并根据目标工单数据,在构建的知识图谱中进行图谱检索,如目标工单数据为:目标用户在时间2在地点2发送的关于目标业务的故障处理需求,则根据时间2可以在知识图谱中确定对应的实体节点(即“时间2”对应的实体节点),在知识图谱中可以确定与该实体节点具有关联关系的,与故障解决方案对应的实体节点,然后将该实体节点的内容确定为目标故障解决方案(即目标故障解决方案上述故障解决方案a)。
在S106中,基于目标故障解决方案,对目标用户的故障处理需求进行处理。
在实施中,在确定了目标故障解决方案后,可以将故障解决方案下发给对应的故障处理工作人员进行故障处理,或者,还可以将目标故障解决方案发送给目标用户,以使目标用户根据目标故障解决方案对故障处理需求进行处理。
例如,针对目标用户的故障鼓励需求,可以将下述内容反馈给目标用户:
“您好,经过智能分析,我猜您正在问的问题是“XXX故障现象”,为您推荐如下可能的解决方案:
请参考:
1.故障现象->目标故障解决方案1->解决方案详细描述(67%已解决)
2.故障现象->目标故障解决方案2->解决方案详细描述(22%已解决)
3.故障现象->目标故障解决方案3->解决方案详细描述(11%已解决)”。
目标用户可以选择上述三个目标故障解决方案中的任意一个,以解决赌赢的故障处理需求。
本发明实施例提供一种数据处理方法,通过获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据,基于目标工单数据和预先构建的知识图谱,确定与目标工单数据对应的目标故障解决方案,知识图谱包括目标向量对应的实体节点和目标向量之间的关联关系对应的实体节点之间的关联关系,目标向量是基于历史工单数据和预先构建的文本分析模型确定的,文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型,基于目标故障解决方案,对目标用户的故障处理需求进行处理。这样,通过知识图谱和目标工单数据,可以准确的定位到用于处理目标用户的故障处理需求的目标故障解决方案,故障解决方案的确定效率高,即可以提高目标用户的故障处理需求的处理效率,同时,避免了在故障高峰时点,无法及时对大量处长处理需求进行响应的问题,提高用户体验。
实施例二
如图2所示,本发明实施例提供一种数据处理方法,该方法的执行主体可以为终端设备,其中,该终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备,该终端设备可以为用户能够基于通讯号码使用通讯业务的终端设备。该方法具体可以包括以下步骤:
在S202中,获取基于用户对目标业务的故障处理需求而生成的历史工单数据。
其中,历史工单数据可以包括故障解决方案,历史工单数据可以是预设时间段内基于用户对目标业务的历史故障处理需求而生成的历史工单数据。
上述S202的具体处理过程可以参见上述实施例一中的S102的相关内容,在此不再赘述。
在S204中,基于预先构建的文本分析模型对历史工单数据进行向量化处理,得到与历史工单数据对应的目标向量以及目标向量之间的关联关系。
在实施中,在进行向量化处理前,可以基于预设专业词汇数据库,对历史工单数据进行数据清洗处理,以得到包含有与目标业务相关语义信息的文本内容,其中,预设专业词汇数据库可以是根据目标业务预设的数据库,本发明实施例对预设专业词汇数据库的具体预设方法不作具体限定。
在进行数据清洗处理后,可以对处理后的历史工单数据进行分词处理,分词处理可以包括以下三个过程:确定分词模式为精确模式、构建分词算法模型以及添加自定义词典。
其中,分词模式可以包括精确模式、全模式以及搜索引擎模式(精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用搜索引擎分词)。
在构建分词算法模型时,可以基于前缀词典实现高效的词图扫描,生成历史工单数据中,句子中汉字所有可能成词情况所构成的有向无环图,在采用用动态规划查找最大概率路径,以找出基于词频的最大切分组合,而对于未登录词,可以采用基于汉字成词能力的隐马尔科夫模型,以及维特比算法。
自定义词典可以包括术语词典、业务词典以及停用词典等,其中,术语词典中可以包括限速规则、集团公司维护等术语词,业务词典中可以包括4G上网套餐588元档、集团套餐15等业务词,停用词典中可以包括不管、不至于等停用词。
另外,在构建文本分析模型时,可以启动BiLSTM,引入一个memory cell,对历史信息进行记录,并且这个记录是有控制有选择的。定义三个控制门,分别控制长短期记忆(Long short-termmemory,LSTM)单元的输入、读取和输出。其中,输入门和输出门的激活函数可以使用sigmoid函数。
通过LSTM网络的处理,可以得到对输入数据的表示方法,然后可以将LSTM与条件随机场算法CRF结合,即是在输出端CRF结合起来,使用LSTM解决提取序列特征的问题,使用CRF有效利用了句子级别的标记信息。在LSTM+CRF模型下,输出的将不再是相互独立的标签,而是最佳的标签序列(即带有置信度的目标向量构成的向量序列)。这里引入的CRF,其实只是对输出标签二元组进行了建模,然后使用动态规划进行计算即可,最终根据得到的最优路径进行标注。
在进行分词处理后,可以根据下述步骤一~步骤二对分词处理后的历史工单数据进行处理,得到对应的目标向量。
步骤一,基于预先构建的文本分析模型,确定与历史工单数据对应的第一向量以及每个第一向量的置信度。
步骤二,将第一向量中置信度满足预设选取要求的第一向量确定为目标向量。
此外,还可以基于预先构建的文本分析模型对历史工单数据进行向量化处理,得到目标向量之间的关联关系,即对目标向量进行关系识别。
关系识别是对非结构化文档处理的重要环节,自然语言中对事件的描述往往会以多个子句的形式存在,且多句之间具有相关性,关系识别需要对工单数据的上下文,进行依存句法相关性分析,从而找出实体间存在哪种关系,以及关系周边的实体分别是什么,例如“A导致了B”,“C的故障原因是D”,“E的变更产生了F现象”,关系识别是构建资源描述框架(resource description framework,RDF)三元组的基础。
例如,历史工单数据1为:用户是全家享融合套餐的副卡,前期资料异常导致未变成对应的副卡且无法共享语音与流量,所以给客户进行产品变更。对该历史工单数据1进行分析处理,得到的分词处理后的该历史工单数据1可以为:该、用户、是、全家享融合套餐、的、副卡、前期、资料、异常、导致、未变成、对应的、副卡、且无法、共享、语音、与、流量、所以、给、客户、进行、产品变更。
基于预先构建的文本分析模型,对上述分词处理后的该历史工单数据1进行处理,可以得到对应的目标向量以及目标向量之间的关联关系,例如,如下表1可以为部分目标向量以及目标向量之间的关联关系。
表1
在S206中,基于目标向量和目标向量之间的关联关系,构建知识图谱。
在实际应用中,上述S206的处理方式可以多种多样,以下提供一种可选的实现方式,具体可以参见下述步骤一~步骤二处理。
步骤一,基于预设聚类算法,对目标向量进行聚类处理,得到聚类处理后的目标向量。
在实施中,由于目标向量可能是包含较多文字的向量,因此,可以对相近的实体节点进行聚类处理,以提升系统感知。可以通过集成长句上下文理解能力,提取出目标向量中的关键信息语句,在对关键信息语句进行聚类,形成聚类,如可以基于层次聚类法,对目标向量进行聚类。
步骤二,基于聚类处理后的目标向量和目标向量之间的关联关系,构建知识图谱。
在实施中,可以在相同类的目标向量中,提取出中心语句,作为聚类处理后的目标向量对应的实体节点的名称。
另外,在构建知识图谱前,可以对知识图谱进行模式设计,例如,设计的知识图谱的模式可以如图3所示。
在S208中,获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据。
在S210中,基于文本分析模型,确定与目标工单数据对应的第二向量。
在S212中,对知识图谱进行知识融合处理,得到目标知识图谱。
在实施中,知识图谱在进行知识抽取时所使用的数据源是多样化的,存在知识重复、知识间关系不明确等问题。知识融合可消除实体、关系等与事实对象间的歧义,使不同来源的知识能够得到规范化整合。为了让知识图谱内容具备通用性,可以对知识图谱进行知识融合处理,即可以对目标向量进行二次分析,将根据词性及依存句法抽取出的实体节点进行聚类,将涉及同类内容的实体节点进行融合,组成完整语义的回复答案,即可以得到目标知识图谱。
在实际应用中,上述S212的处理方式可以多种多样,以下提供一种可选的实现方式,具体可以参见下述步骤一~步骤五处理。
步骤一,获取知识图谱中每个实体节点对应的目标向量。
步骤二,基于每个目标向量包含的向量分量,确定每个目标向量与其他目标向量之间的第一相似度。
在实施中,第一相似度可以根据下述公式确定:
S=w1*sim(x1,y1)+…+wN*sim(xN,yN)
其中,S为目标向量1和目标向量2之间的第一相似度,xN为目标向量1的第N个向量分量,yN为目标向量2的第N个向量分量,sim为相似度计算函数,wN为预设的第N个相似度权重。
步骤三,将第一相似度大于预设第一相似度阈值的目标向量划分为第一数据集。
在实施中,确定的第一数据集可以如下表2所示。
表2
步骤四,基于第一数据集包含的目标向量与其他第一数据集包含的目标向量之间的关联关系,确定第一数据集之间的关联关系。
步骤五,基于第一数据集以及第一数据集之间的关联关系,构建目标知识图谱,目标知识图谱包括由第一数据集对应的实体节点和第一数据集之间的关联关系对应的实体节点之间的关联关系。
在S214中,基于第二向量和目标知识图谱,确定与目标工单数据对应的故障解决方案。
在实际应用中,上述S214的处理方式可以多种多样,以下再提供一种可选的实现方式,具体可以参见下述步骤一~步骤四处理。
步骤一,获取第二向量与目标知识图谱中包含的每个第一数据集之间的第二相似度。
步骤二,获取第一数据集中,第二相似度大于预设第二相似度阈值的第二数据集。
步骤三,在目标知识图谱包含的第一数据集中,获取与第二数据集具有关联关系的故障解决方案对应的第三数据集,且将第二数据集中故障解决方案对应的第二数据集确定为第三数据集。
步骤四,基于第二相似度,从第三数据集中确定目标数据集,并将目标数据集对应的故障解决方案确定为与目标工单数据对应的故障解决方案。
在S216中,基于目标故障解决方案,对目标用户的故障处理需求进行处理。
在实施中,可以为目标用户提供可视化的界面,在可视化界面中,可以以粗细展示目标知识图谱中各个实体节点之间的关系权重,可以通过粗细关系线表现关系的强弱,这样,目标用户可以更直观,更清晰的查看目标知识图谱。在智能机器人回复目标用户的故障处理需求时,根据关系强弱对目标故障解决方案进行排序,向目标用户推荐目标故障解决方案时更有针对性。其中,实体节点之间的关系权重可以根据实体节点之间的相似度确定。
本发明实施例提供一种数据处理方法,通过获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据,基于目标工单数据和预先构建的知识图谱,确定与目标工单数据对应的目标故障解决方案,知识图谱包括目标向量对应的实体节点和目标向量之间的关联关系对应的实体节点之间的关联关系,目标向量是基于历史工单数据和预先构建的文本分析模型确定的,文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型,基于目标故障解决方案,对目标用户的故障处理需求进行处理。这样,通过知识图谱和目标工单数据,可以准确的定位到用于处理目标用户的故障处理需求的目标故障解决方案,故障解决方案的确定效率高,即可以提高目标用户的故障处理需求的处理效率,同时,避免了在故障高峰时点,无法及时对大量处长处理需求进行响应的问题,提高用户体验。
实施例三
以上为本发明实施例提供的数据处理方法,基于同样的思路,本发明实施例还提供一种数据处理装置,如图4所示。
该数据处理装置包括:第一获取模块401、方案确定模块402和需求处理模块403,其中:
第一获取模块401,用于获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据;
方案确定模块402,用于基于所述目标工单数据和预先构建的知识图谱,确定与所述目标工单数据对应的目标故障解决方案,所述知识图谱包括目标向量对应的实体节点和所述目标向量之间的关联关系对应的实体节点之间的关联关系,所述目标向量是基于历史工单数据和预先构建的文本分析模型确定的,所述文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型;
需求处理模块403,用于基于所述目标故障解决方案,对所述目标用户的故障处理需求进行处理。
在本发明实施例中,所述装置还包括:
第二获取模块,用于获取基于用户对所述目标业务的故障处理需求而生成的所述历史工单数据,所述历史工单数据包括故障解决方案;
处理模块,用于基于所述预先构建的文本分析模型对所述历史工单数据进行向量化处理,得到与所述历史工单数据对应的目标向量以及所述目标向量之间的关联关系;
构建模块,用于基于所述目标向量和所述目标向量之间的关联关系,构建所述知识图谱。
在本发明实施例中,所述处理模块,用于:
基于所述预先构建的文本分析模型,确定与所述历史工单数据对应的第一向量以及每个所述第一向量的置信度;
将所述第一向量中置信度满足预设选取要求的所述第一向量确定为所述目标向量。
在本发明实施例中,所述构建模块,用于:
基于预设聚类算法,对所述目标向量进行聚类处理,得到聚类处理后的所述目标向量;
基于所述聚类处理后的目标向量和所述目标向量之间的关联关系,构建所述知识图谱。
在本发明实施例中,所述方案确定模块402,用于:
基于所述文本分析模型,确定与所述目标工单数据对应的第二向量;
对所述知识图谱进行知识融合处理,得到目标知识图谱;
基于所述第二向量和所述目标知识图谱,确定与所述目标工单数据对应的故障解决方案。
在本发明实施例中,所述方案确定模块402,用于:
获取所述知识图谱中每个所述实体节点对应的所述目标向量;
基于每个所述目标向量包含的向量分量,确定每个所述目标向量与其他所述目标向量之间的第一相似度;
将所述第一相似度大于预设第一相似度阈值的所述目标向量划分为第一数据集;
基于所述第一数据集包含的目标向量与其他所述第一数据集包含的目标向量之间的关联关系,确定所述第一数据集之间的关联关系;
基于所述第一数据集以及所述第一数据集之间的关联关系,构建所述目标知识图谱,所述目标知识图谱包括由所述第一数据集对应的实体节点和所述第一数据集之间的关联关系对应的实体节点之间的关联关系。
在本发明实施例中,所述方案确定模块402,用于:
获取所述第二向量与所述目标知识图谱中包含的每个第一数据集之间的第二相似度;
获取所述第一数据集中,所述第二相似度大于预设第二相似度阈值的第二数据集;
在所述目标知识图谱包含的第一数据集中,获取与所述第二数据集具有关联关系的故障解决方案对应的所述第三数据集,且将所述第二数据集中故障解决方案对应的第二数据集确定为所述第三数据集;
基于所述第二相似度,从所述第三数据集中确定目标数据集,并将所述目标数据集对应的故障解决方案确定为所述与所述目标工单数据对应的故障解决方案。
本发明实施例提供一种数据处理装置,通过获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据,基于目标工单数据和预先构建的知识图谱,确定与目标工单数据对应的目标故障解决方案,知识图谱包括目标向量对应的实体节点和所述目标向量之间的关联关系对应的实体节点之间的关联关系,目标向量是基于历史工单数据和预先构建的文本分析模型确定的,文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型,基于目标故障解决方案,对目标用户的故障处理需求进行处理。这样,通过知识图谱和目标工单数据,可以准确的定位到用于处理目标用户的故障处理需求的目标故障解决方案,故障解决方案的确定效率高,即可以提高目标用户的故障处理需求的处理效率,同时,避免了在故障高峰时点,无法及时对大量处长处理需求进行响应的问题,提高用户体验。
实施例四
图5为实现本发明各个实施例的一种电子设备的硬件结构示意图,
该电子设备500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解,图5中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器510,用于获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据;基于所述目标工单数据和预先构建的知识图谱,确定与所述目标工单数据对应的目标故障解决方案,所述知识图谱包括目标向量对应的实体节点和所述目标向量之间的关联关系对应的实体节点之间的关联关系,所述目标向量是基于历史工单数据和预先构建的文本分析模型确定的,所述文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型;基于所述目标故障解决方案,对所述目标用户的故障处理需求进行处理。
此外,处理器510,还用于获取基于用户对所述目标业务的故障处理需求而生成的所述历史工单数据,所述历史工单数据包括故障解决方案;基于所述预先构建的文本分析模型对所述历史工单数据进行向量化处理,得到与所述历史工单数据对应的目标向量以及所述目标向量之间的关联关系;基于所述目标向量和所述目标向量之间的关联关系,构建所述知识图谱。
另外,处理器510,还用于基于所述预先构建的文本分析模型,确定与所述历史工单数据对应的第一向量以及每个所述第一向量的置信度;将所述第一向量中置信度满足预设选取要求的所述第一向量确定为所述目标向量。
此外,处理器510,还用于基于预设聚类算法,对所述目标向量进行聚类处理,得到聚类处理后的所述目标向量;基于所述聚类处理后的目标向量和所述目标向量之间的关联关系,构建所述知识图谱。
另外,处理器510,还用于基于所述文本分析模型,确定与所述目标工单数据对应的第二向量;对所述知识图谱进行知识融合处理,得到目标知识图谱;基于所述第二向量和所述目标知识图谱,确定与所述目标工单数据对应的故障解决方案。
此外,处理器510,还用于取所述知识图谱中每个所述实体节点对应的所述目标向量;基于每个所述目标向量包含的向量分量,确定每个所述目标向量与其他所述目标向量之间的第一相似度;将所述第一相似度大于预设第一相似度阈值的所述目标向量划分为第一数据集;基于所述第一数据集包含的目标向量与其他所述第一数据集包含的目标向量之间的关联关系,确定所述第一数据集之间的关联关系;基于所述第一数据集以及所述第一数据集之间的关联关系,构建所述目标知识图谱,所述目标知识图谱包括由所述第一数据集对应的实体节点和所述第一数据集之间的关联关系对应的实体节点之间的关联关系。
另外,处理器510,还用于获取所述第二向量与所述目标知识图谱中包含的每个第一数据集之间的第二相似度;获取所述第一数据集中,所述第二相似度大于预设第二相似度阈值的第二数据集;在所述目标知识图谱包含的第一数据集中,获取与所述第二数据集具有关联关系的故障解决方案对应的所述第三数据集,且将所述第二数据集中故障解决方案对应的第二数据集确定为所述第三数据集;基于所述第二相似度,从所述第三数据集中确定目标数据集,并将所述目标数据集对应的故障解决方案确定为所述与所述目标工单数据对应的故障解决方案。
本发明实施例提供一种电子设备,通过获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据,基于目标工单数据和预先构建的知识图谱,确定与目标工单数据对应的目标故障解决方案,知识图谱包括目标向量对应的实体节点和所述目标向量之间的关联关系对应的实体节点之间的关联关系,目标向量是基于历史工单数据和预先构建的文本分析模型确定的,文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型,基于目标故障解决方案,对目标用户的故障处理需求进行处理。这样,通过知识图谱和目标工单数据,可以准确的定位到用于处理目标用户的故障处理需求的目标故障解决方案,故障解决方案的确定效率高,即可以提高目标用户的故障处理需求的处理效率,同时,避免了在故障高峰时点,无法及时对大量处长处理需求进行响应的问题,提高用户体验。
应理解的是,本发明实施例中,射频单元501可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器510处理;另外,将上行的数据发送给基站。通常,射频单元501包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元501还可以通过无线通信系统与网络和其他电子设备通信。
电子设备通过网络模块502为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元503还可以提供与电子设备500执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。
输入单元504用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元506上。经图形处理器5041处理后的图像帧可以存储在存储器509(或其它存储介质)中或者经由射频单元501或网络模块502进行发送。麦克风5042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。
电子设备500还包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度,接近传感器可在电子设备500移动到耳边时,关闭显示面板5061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元506可包括显示面板5061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。
用户输入单元507可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器510,接收处理器510发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071,用户输入单元507还可以包括其他输入设备5072。具体地,其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板5071可覆盖在显示面板5061上,当触控面板5071检测到在其上或附近的触摸操作后,传送给处理器510以确定触摸事件的类型,随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。虽然在图5中,触控面板5071与显示面板5061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板5071与显示面板5061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元508为外部装置与电子设备500连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备500内的一个或多个元件或者可以用于在电子设备500和外部装置之间传输数据。
存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器510是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器510可包括一个或多个处理单元;优选的,处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
电子设备500还可以包括给各个部件供电的电源511(比如电池),优选的,电源511可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
优选的,本发明实施例还提供一种电子设备,包括处理器510,存储器509,存储在存储器509上并可在所述处理器510上运行的计算机程序,该计算机程序被处理器510执行时实现上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
实施例五
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-OnlyMemory,简称ROM)、随机存取存储器(RandomAccess Memory,简称RAM)、磁碟或者光盘等。
本发明实施例提供一种计算机可读存储介质,通过获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据,基于目标工单数据和预先构建的知识图谱,确定与目标工单数据对应的目标故障解决方案,知识图谱包括目标向量对应的实体节点和所述目标向量之间的关联关系对应的实体节点之间的关联关系,目标向量是基于历史工单数据和预先构建的文本分析模型确定的,文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型,基于目标故障解决方案,对目标用户的故障处理需求进行处理。这样,通过知识图谱和目标工单数据,可以准确的定位到用于处理目标用户的故障处理需求的目标故障解决方案,故障解决方案的确定效率高,即可以提高目标用户的故障处理需求的处理效率,同时,避免了在故障高峰时点,无法及时对大量处长处理需求进行响应的问题,提高用户体验。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的定界,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (10)
1.一种数据处理方法,其特征在于,所述方法包括:
获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据;
基于所述目标工单数据和预先构建的知识图谱,确定与所述目标工单数据对应的目标故障解决方案,所述知识图谱包括目标向量对应的实体节点和所述目标向量之间的关联关系对应的实体节点之间的关联关系,所述目标向量是基于历史工单数据和预先构建的文本分析模型确定的,所述文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型;
基于所述目标故障解决方案,对所述目标用户的故障处理需求进行处理。
2.根据权利要求1所述的方法,其特征在于,在所述获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据之前,所述方法还包括:
获取基于用户对所述目标业务的故障处理需求而生成的所述历史工单数据,所述历史工单数据包括故障解决方案;
基于所述预先构建的文本分析模型对所述历史工单数据进行向量化处理,得到与所述历史工单数据对应的目标向量以及所述目标向量之间的关联关系;
基于所述目标向量和所述目标向量之间的关联关系,构建所述知识图谱。
3.根据权利要求2所述的方法,其特征在于,所述基于所述预先构建的文本分析模型对所述历史工单数据进行向量化处理,得到与所述历史工单数据对应的目标向量,包括:
基于所述预先构建的文本分析模型,确定与所述历史工单数据对应的第一向量以及每个所述第一向量的置信度;
将所述第一向量中置信度满足预设选取要求的所述第一向量确定为所述目标向量。
4.根据权利要求3所述的方法,其特征在于,所述基于所述目标向量和所述目标向量之间的连接关系,构建知识图谱,包括:
基于预设聚类算法,对所述目标向量进行聚类处理,得到聚类处理后的所述目标向量;
基于所述聚类处理后的目标向量和所述目标向量之间的关联关系,构建所述知识图谱。
5.根据权利要求4所述的方法,其特征在于,所述基于所述目标工单数据和预先构建的知识图谱,确定与所述目标工单数据对应的目标故障解决方案,包括:
基于所述文本分析模型,确定与所述目标工单数据对应的第二向量;
对所述知识图谱进行知识融合处理,得到目标知识图谱;
基于所述第二向量和所述目标知识图谱,确定与所述目标工单数据对应的故障解决方案。
6.根据权利要求5所述的方法,其特征在于,所述对所述知识图谱进行知识融合处理,得到目标知识图谱,包括:
获取所述知识图谱中每个所述实体节点对应的所述目标向量;
基于每个所述目标向量包含的向量分量,确定每个所述目标向量与其他所述目标向量之间的第一相似度;
将所述第一相似度大于预设第一相似度阈值的所述目标向量划分为第一数据集;
基于所述第一数据集包含的目标向量与其他所述第一数据集包含的目标向量之间的关联关系,确定所述第一数据集之间的关联关系;
基于所述第一数据集以及所述第一数据集之间的关联关系,构建所述目标知识图谱,所述目标知识图谱包括由所述第一数据集对应的实体节点和所述第一数据集之间的关联关系对应的实体节点之间的关联关系。
7.根据权利要求6所述的方法,其特征在于,所述基于所述第二向量和所述目标知识图谱,确定与所述目标工单数据对应的故障解决方案,包括:
获取所述第二向量与所述目标知识图谱中包含的每个第一数据集之间的第二相似度;
获取所述第一数据集中,所述第二相似度大于预设第二相似度阈值的第二数据集;
在所述目标知识图谱包含的第一数据集中,获取与所述第二数据集具有关联关系的故障解决方案对应的所述第三数据集,且将所述第二数据集中故障解决方案对应的第二数据集确定为所述第三数据集;
基于所述第二相似度,从所述第三数据集中确定目标数据集,并将所述目标数据集对应的故障解决方案确定为所述与所述目标工单数据对应的故障解决方案。
8.一种数据处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取基于目标用户对目标业务的故障处理需求而生成的目标工单数据;
方案确定模块,用于基于所述目标工单数据和预先构建的知识图谱,确定与所述目标工单数据对应的目标故障解决方案,所述知识图谱包括目标向量对应的实体节点和所述目标向量之间的关联关系对应的实体节点之间的关联关系,所述目标向量是基于历史工单数据和预先构建的文本分析模型确定的,所述文本分析模型包括基于LSTM网络和CRF算法构建的Bert模型;
需求处理模块,用于基于所述目标故障解决方案,对所述目标用户的故障处理需求进行处理。
9.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的数据处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的数据处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010612814.6A CN113868427A (zh) | 2020-06-30 | 2020-06-30 | 一种数据处理方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010612814.6A CN113868427A (zh) | 2020-06-30 | 2020-06-30 | 一种数据处理方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113868427A true CN113868427A (zh) | 2021-12-31 |
Family
ID=78981135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010612814.6A Pending CN113868427A (zh) | 2020-06-30 | 2020-06-30 | 一种数据处理方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113868427A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114626592A (zh) * | 2022-03-02 | 2022-06-14 | 广东省电信规划设计院有限公司 | 一种电力通信网络提升优化的方法及装置 |
CN114726710A (zh) * | 2022-04-27 | 2022-07-08 | 国家电网有限公司 | 故障处理方法及装置 |
CN115221892A (zh) * | 2022-07-12 | 2022-10-21 | 中国电信股份有限公司 | 工单数据处理方法及装置、存储介质及电子设备 |
CN116108169A (zh) * | 2022-12-12 | 2023-05-12 | 长三角信息智能创新研究院 | 一种基于知识图谱的热线工单智能分派方法 |
CN116129551A (zh) * | 2022-12-09 | 2023-05-16 | 浙江凌骁能源科技有限公司 | 汽车故障根因分析方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509483A (zh) * | 2018-01-31 | 2018-09-07 | 北京化工大学 | 基于知识图谱的机械故障诊断知识库构建方法 |
CN110704636A (zh) * | 2019-09-27 | 2020-01-17 | 吉林大学 | 一种改进的基于Node2vec的知识图谱向量表示方法 |
CN110807085A (zh) * | 2019-09-12 | 2020-02-18 | 口碑(上海)信息技术有限公司 | 故障信息的查询方法及装置、存储介质、电子装置 |
CN110929149A (zh) * | 2019-11-12 | 2020-03-27 | 广东工业大学 | 一种工业设备故障维修推荐方法和系统 |
-
2020
- 2020-06-30 CN CN202010612814.6A patent/CN113868427A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509483A (zh) * | 2018-01-31 | 2018-09-07 | 北京化工大学 | 基于知识图谱的机械故障诊断知识库构建方法 |
CN110807085A (zh) * | 2019-09-12 | 2020-02-18 | 口碑(上海)信息技术有限公司 | 故障信息的查询方法及装置、存储介质、电子装置 |
CN110704636A (zh) * | 2019-09-27 | 2020-01-17 | 吉林大学 | 一种改进的基于Node2vec的知识图谱向量表示方法 |
CN110929149A (zh) * | 2019-11-12 | 2020-03-27 | 广东工业大学 | 一种工业设备故障维修推荐方法和系统 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114626592A (zh) * | 2022-03-02 | 2022-06-14 | 广东省电信规划设计院有限公司 | 一种电力通信网络提升优化的方法及装置 |
CN114726710A (zh) * | 2022-04-27 | 2022-07-08 | 国家电网有限公司 | 故障处理方法及装置 |
CN115221892A (zh) * | 2022-07-12 | 2022-10-21 | 中国电信股份有限公司 | 工单数据处理方法及装置、存储介质及电子设备 |
CN115221892B (zh) * | 2022-07-12 | 2024-02-27 | 中国电信股份有限公司 | 工单数据处理方法及装置、存储介质及电子设备 |
CN116129551A (zh) * | 2022-12-09 | 2023-05-16 | 浙江凌骁能源科技有限公司 | 汽车故障根因分析方法、装置、计算机设备和存储介质 |
CN116108169A (zh) * | 2022-12-12 | 2023-05-12 | 长三角信息智能创新研究院 | 一种基于知识图谱的热线工单智能分派方法 |
CN116108169B (zh) * | 2022-12-12 | 2024-02-20 | 长三角信息智能创新研究院 | 一种基于知识图谱的热线工单智能分派方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113868427A (zh) | 一种数据处理方法、装置及电子设备 | |
US20190220513A1 (en) | Method and apparatus for determining a reply statement | |
CN111813910B (zh) | 客服问题的更新方法、系统、终端设备及计算机存储介质 | |
KR20160124182A (ko) | 연락처들을 그룹화하기 위한 방법 및 장치 | |
CN110825863B (zh) | 一种文本对融合方法及装置 | |
CN107093423A (zh) | 一种语音输入修正方法、装置及计算机可读存储介质 | |
CN111539212A (zh) | 文本信息处理方法、装置、存储介质及电子设备 | |
CN110162600B (zh) | 一种信息处理的方法、会话响应的方法及装置 | |
CN114357278B (zh) | 一种话题推荐方法、装置及设备 | |
CN113079123B (zh) | 一种恶意网站的检测方法、装置及电子设备 | |
CN109545221B (zh) | 参数调整方法、移动终端及计算机可读存储介质 | |
CN111159338A (zh) | 一种恶意文本的检测方法、装置、电子设备及存储介质 | |
CN108595107B (zh) | 一种界面内容处理方法及移动终端 | |
CN111553163A (zh) | 文本相关度的确定方法、装置、存储介质及电子设备 | |
CN111125307A (zh) | 一种聊天记录查询方法及电子设备 | |
CN112749252A (zh) | 一种基于人工智能的文本匹配方法和相关装置 | |
CN110597957B (zh) | 一种文本信息检索的方法及相关装置 | |
CN110781274A (zh) | 一种问答对生成的方法与装置 | |
CN114328908A (zh) | 一种问答语句质检方法、装置及相关产品 | |
CN110390102B (zh) | 一种情感分析的方法和相关装置 | |
CN108491471B (zh) | 一种文本信息的处理方法、移动终端 | |
CN111723783B (zh) | 一种内容识别方法和相关装置 | |
CN110807330B (zh) | 语义理解模型评估方法、装置及存储介质 | |
CN113505596A (zh) | 话题切换标记方法、装置及计算机设备 | |
CN113704482A (zh) | 一种用于知识图谱的模板确定方法和相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |