CN111522949A - 一种基于文本聚类的智能回答方法及系统 - Google Patents
一种基于文本聚类的智能回答方法及系统 Download PDFInfo
- Publication number
- CN111522949A CN111522949A CN202010335319.5A CN202010335319A CN111522949A CN 111522949 A CN111522949 A CN 111522949A CN 202010335319 A CN202010335319 A CN 202010335319A CN 111522949 A CN111522949 A CN 111522949A
- Authority
- CN
- China
- Prior art keywords
- work order
- question
- knowledge
- index
- result set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000008676 import Effects 0.000 claims description 8
- 239000002699 waste material Substances 0.000 abstract description 5
- 238000001556 precipitation Methods 0.000 abstract description 4
- 230000006872 improvement Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于文本聚类的智能回答方法及系统,包括:收集预设数量的工单问题;对工单问题进行文本聚类,形成工单Top问题;对工单Top问题进行知识采编,并存储在知识存储数据库内;输入问题;将问题生成索引;基于索引从知识存储数据库中搜索结果集,实现问题的智能回答。本发明通过对工单进行文本聚类、知识采编等操作实现知识沉淀,然后通过智能回答展现知识,从而解决了人力成本过高及浪费的问题。
Description
技术领域
本发明涉及电信运营商技术领域,具体涉及一种基于文本聚类的智能回答方法及系统。
背景技术
在电信运营商(如:中国电信、中国移动、中国联通)领域,各大运营商每月IT工单的支撑数量都要在几十万单甚至百万单以上。在这些工单中,存在大量的重复性或者同类问题工单,对于上述重复性或者同类问题的每类工单同样需要IT支撑人员进行答复或提供解决方案,从而造成IT支撑人员大量的人力成本浪费。
发明内容
针对现有技术中存在的上述问题,本发明提供一种基于文本聚类的智能回答方法及系统,其通过对工单进行文本聚类、知识采编等操作实现知识沉淀,然后通过智能回答展现知识,从而解决了人力成本过高及浪费的问题。
本发明公开了一种基于文本聚类的智能回答方法,包括:
收集预设数量的工单问题;
对所述工单问题进行文本聚类,形成工单Top问题;
对所述工单Top问题进行知识采编,并存储在知识存储数据库内;
输入问题;
将所述问题生成索引;
基于所述索引从所述知识存储数据库中搜索结果集,实现所述问题的智能回答。
作为本发明的进一步改进,所述收集预设数量的工单问题,包括:
收集移动端和/或PC端提出的工单问题;和/或,
批量导入工单问题。
作为本发明的进一步改进,还包括:
判断所述工单Top问题是否可作为知识进行推广,若是,则对所述工单Top问题进行知识采编。
作为本发明的进一步改进,所述将所述问题生成索引,包括:
将所述问题生成工单;
对所述工单进行处理、派发、提交XML文件,生成索引。
作为本发明的进一步改进,所述基于所述索引从所述知识存储数据库中搜索结果集,实现所述问题的智能回答;包括:
基于所述索引从所述知识存储数据库中搜索结果集;
返回所述结果集,展示所述结果集;
判断所述结果集是否可解决提问,若可解决,则撤单。
本发明还公开了一种基于文本聚类的智能回答系统,包括:前端和后端;
所述前端,用于:
输入问题;
所述后端,用于:
收集预设数量的工单问题,并存储在工单问题存储数据库内;
通过聚类模块对所述工单问题进行文本聚类,形成工单Top问题;
通过搜索模块对所述工单Top问题进行知识采编,并存储在知识存储数据库内;
通过回答模块将所述问题生成索引,并基于所述索引从所述知识存储数据库中搜索结果集,实现所述问题的智能回答。
作为本发明的进一步改进,所述前端包括移动端和PC端,所述后端包括导入模块;
所述后端,用于:
收集移动端和/或PC端提出的工单问题;和/或,
通过所述导入模块批量导入工单问题。
作为本发明的进一步改进,所述后端还包括:
判断模块,用于判断所述工单Top问题是否可作为知识进行推广,若是,则对所述工单Top问题进行知识采编。
作为本发明的进一步改进,在所述回答模块中:
所述将所述问题生成索引,包括:
将所述问题生成工单;
对所述工单进行处理、派发、提交XML文件,生成索引。
作为本发明的进一步改进,在所述回答模块中:
所述基于所述索引从所述知识存储数据库中搜索结果集,实现所述问题的智能回答;包括:
基于所述索引从所述知识存储数据库中搜索结果集;
返回所述结果集,展示所述结果集;
判断所述结果集是否可解决提问,若可解决,则撤单。
与现有技术相比,本发明的有益效果为:
1.本发明通过定期不断的知识沉淀(工单Top问题转知识),知识存储数据库里面的知识越来越多,支撑的范围越来越广;同时,也可以通过批量导入的方式来快速丰富知识存储数据库内容;
2.本发明结合智能问答,减少人员成本的重复投入和浪费,若工单问题已经得到解决,则无需IT支撑人员处理。
附图说明
图1为本发明一种实施例公开的基于文本聚类的智能回答方法的工单问题转知识的流程图;
图2为本发明一种实施例公开的基于文本聚类的智能回答方法的智能回答的时序图;
图3为本发明一种实施例公开的基于文本聚类的智能回答系统的框架图;
图4为本发明一种实施例公开的工单问题聚类的效果图;
图5~图7为本发明一种实施例公开的智能回答的界面图。
图中:
10、前端;11、移动端;12、PC端;
20、后端;21、导入接口;22、工单问题存储数据库;23、聚类模块;24、判断模块;25、搜索模块;26、知识存储数据库;27、回答模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图对本发明做进一步的详细描述:
本发明提供一种基于文本聚类的智能回答方法,该智能回答方法基于前端(移动端和/或PC端)和后端(工单问题处理系统)实现用户所提问题的智能回答,具体包括:工单问题转知识的方法以及智能回答的方法;其中:
如图1所示,本发明的工单问题转知识的方法,包括:
步骤1、后端收集预设数量的工单问题;其中,
上述收集问题的方式为:收集移动端和/或PC端提出的工单问题;和/或,批量导入工单问题。进一步,本发明在智能回答所收集的用户提问问题也可作为工单问题转知识所需的工作问题,从而实现在智能回答的过程中不断实现知识的优化。
步骤2、对工单问题进行文本聚类,形成工单Top问题;其中,
工单问题聚类主要采用文本聚类分析技术,其聚类效果如图4所示;
步骤3、判断工单Top问题是否可作为知识进行推广,若是,则进入步骤4;若否,则结束;
步骤4、对工单Top问题进行知识采编,并存储在知识存储数据库内。
在上述工作问题转知识进行聚类并采编完成后,本发明的后端(工单问题处理系统)可实现对用户所提问题的智能回答。如图2所示,本发明智能回答的方法,包括:
步骤5、用户通过移动端或PC端输入问题;其中,
输入问题的界面如图5所示;
步骤6、后端将问题生成索引;具体生成方法为:
将问题生成工单;
对工单进行处理、派发、提交XML文件,生成索引。
步骤7、基于索引从知识存储数据库中搜索结果集,实现问题的智能回答;具体实现方法为:
基于索引从知识存储数据库中搜索结果集;
依次返回结果集至后端和前端,并在前端展示结果集;
用户判断结果集是否可解决提问,若可解决,则撤单。
其中,
问题匹配界面如图6所示,智能问答搜索到的结果集如图7所示。
如图3所示,本发明提供一种基于文本聚类的智能回答系统,包括:前端10和后端20,前端10包括移动端11和PC端12,后端20包括导入接口21、工单问题存储数据库22、聚类模块23、判断模块24、搜索模块25、知识存储数据库26和回答模块27,基于上述框架系统可实现工单问题转知识以及智能回答。具体的:
本发明工单问题转知识的具体实现过程为:
后端20收集移动端11和/或PC端12提出的工单问题;和/或,通过导入接口21批量导入工单问题;手机的工单问题存储在工单问题存储数据库22内。进一步,本发明在智能回答所收集的用户提问问题也可作为工单问题转知识所需的工作问题,从而实现在智能回答的过程中不断实现知识的优化。
后端20通过聚类模块23对工单问题进行文本聚类,形成工单Top问题;其中,工单问题聚类主要采用文本聚类分析技术,其聚类效果如图4所示;
后端20通过判断模块24判断工单Top问题是否可作为知识进行推广,若是,则进行知识采编;若否,则结束;
后端20通过搜索模块25对工单Top问题进行知识采编,并存储在知识存储数据库26内。
在上述工作问题转知识进行聚类并采编完成后,本发明的后端(工单问题处理系统)可实现对用户所提问题的智能回答。如图2所示,本发明智能回答的具体实现过程为:
用户通过前端10的移动端11或PC端12输入问题;其中,输入问题的界面如图5所示;
后端20通过回答模块27将问题生成索引;并基于索引从知识存储数据库中搜索结果集,实现问题的智能回答。具体实现方法为:
后端20通过回答模块27将问题生成工单,对工单进行处理、派发、提交XML文件,生成索引;基于索引从知识存储数据库中搜索结果集;依次返回结果集至后端和前端,并在前端展示结果集;用户判断结果集是否可解决提问,若可解决,则撤单。其中,问题匹配界面如图6所示,智能问答搜索到的结果集如图7所示。
本发明的优点为:
1.本发明通过定期不断的知识沉淀(工单Top问题转知识),知识存储数据库里面的知识越来越多,支撑的范围越来越广;同时,也可以通过批量导入的方式来快速丰富知识存储数据库内容;
2.本发明结合智能问答,减少人员成本的重复投入和浪费,若工单问题已经得到解决,则无需IT支撑人员处理。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于文本聚类的智能回答方法,其特征在于,包括:
收集预设数量的工单问题;
对所述工单问题进行文本聚类,形成工单Top问题;
对所述工单Top问题进行知识采编,并存储在知识存储数据库内;
输入问题;
将所述问题生成索引;
基于所述索引从所述知识存储数据库中搜索结果集,实现所述问题的智能回答。
2.如权利要求1所述的智能回答方法,其特征在于,所述收集预设数量的工单问题,包括:
收集移动端和/或PC端提出的工单问题;和/或,
批量导入工单问题。
3.如权利要求1所述的智能回答方法,其特征在于,还包括:
判断所述工单Top问题是否可作为知识进行推广,若是,则对所述工单Top问题进行知识采编。
4.如权利要求1所述的智能回答方法,其特征在于,所述将所述问题生成索引,包括:
将所述问题生成工单;
对所述工单进行处理、派发、提交XML文件,生成索引。
5.如权利要求1所述的智能回答方法,其特征在于,所述基于所述索引从所述知识存储数据库中搜索结果集,实现所述问题的智能回答;包括:
基于所述索引从所述知识存储数据库中搜索结果集;
返回所述结果集,展示所述结果集;
判断所述结果集是否可解决提问,若可解决,则撤单。
6.一种基于文本聚类的智能回答系统,其特征在于,包括:前端和后端;
所述前端,用于:
输入问题;
所述后端,用于:
收集预设数量的工单问题,并存储在工单问题存储数据库内;
通过聚类模块对所述工单问题进行文本聚类,形成工单Top问题;
通过搜索模块对所述工单Top问题进行知识采编,并存储在知识存储数据库内;
通过回答模块将所述问题生成索引,并基于所述索引从所述知识存储数据库中搜索结果集,实现所述问题的智能回答。
7.如权利要求6所述的智能回答系统,其特征在于,所述前端包括移动端和PC端,所述后端包括导入模块;
所述后端,用于:
收集移动端和/或PC端提出的工单问题;和/或,
通过所述导入模块批量导入工单问题。
8.如权利要求6所述的智能回答系统,其特征在于,所述后端还包括:
判断模块,用于判断所述工单Top问题是否可作为知识进行推广,若是,则对所述工单Top问题进行知识采编。
9.如权利要求6所述的智能回答系统,其特征在于,在所述回答模块中:
所述将所述问题生成索引,包括:
将所述问题生成工单;
对所述工单进行处理、派发、提交XML文件,生成索引。
10.如权利要求6所述的智能回答系统,其特征在于,在所述回答模块中:
所述基于所述索引从所述知识存储数据库中搜索结果集,实现所述问题的智能回答;包括:
基于所述索引从所述知识存储数据库中搜索结果集;
返回所述结果集,展示所述结果集;
判断所述结果集是否可解决提问,若可解决,则撤单。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010335319.5A CN111522949A (zh) | 2020-04-24 | 2020-04-24 | 一种基于文本聚类的智能回答方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010335319.5A CN111522949A (zh) | 2020-04-24 | 2020-04-24 | 一种基于文本聚类的智能回答方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111522949A true CN111522949A (zh) | 2020-08-11 |
Family
ID=71910834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010335319.5A Pending CN111522949A (zh) | 2020-04-24 | 2020-04-24 | 一种基于文本聚类的智能回答方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111522949A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1645371A (zh) * | 2005-02-23 | 2005-07-27 | 新浪网技术(中国)有限公司 | 一种基于搜索引擎技术的提问式知识聚合方法以及知识共享方法 |
CN103942220A (zh) * | 2013-01-23 | 2014-07-23 | 成都勤智数码科技股份有限公司 | 一种适用于it运维系统的工单智能关联知识库知识的方法 |
CN104008107A (zh) * | 2013-02-25 | 2014-08-27 | 成都勤智数码科技股份有限公司 | 运维知识库的实现方法 |
CN105224683A (zh) * | 2015-10-28 | 2016-01-06 | 北京护航科技有限公司 | 一种自然语言分析智能交互方法及装置 |
CN108491378A (zh) * | 2018-03-08 | 2018-09-04 | 国网福建省电力有限公司 | 电力信息运维智能应答系统 |
CN109241413A (zh) * | 2018-08-20 | 2019-01-18 | 安徽智恒信科技有限公司 | 一种运维工单的知识推荐方法和运维工作平台 |
-
2020
- 2020-04-24 CN CN202010335319.5A patent/CN111522949A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1645371A (zh) * | 2005-02-23 | 2005-07-27 | 新浪网技术(中国)有限公司 | 一种基于搜索引擎技术的提问式知识聚合方法以及知识共享方法 |
CN103942220A (zh) * | 2013-01-23 | 2014-07-23 | 成都勤智数码科技股份有限公司 | 一种适用于it运维系统的工单智能关联知识库知识的方法 |
CN104008107A (zh) * | 2013-02-25 | 2014-08-27 | 成都勤智数码科技股份有限公司 | 运维知识库的实现方法 |
CN105224683A (zh) * | 2015-10-28 | 2016-01-06 | 北京护航科技有限公司 | 一种自然语言分析智能交互方法及装置 |
CN108491378A (zh) * | 2018-03-08 | 2018-09-04 | 国网福建省电力有限公司 | 电力信息运维智能应答系统 |
CN109241413A (zh) * | 2018-08-20 | 2019-01-18 | 安徽智恒信科技有限公司 | 一种运维工单的知识推荐方法和运维工作平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111192060A (zh) | 一种基于电力it服务全渠道自助应答实现方法 | |
CN107239538B (zh) | 具有自学习功能的平行客服机器人系统及其自学习方法 | |
CN110727776B (zh) | 一种基于人工智能的汽车问答交互系统及交互方法 | |
CN105893482A (zh) | 发动机试验数据全自动化提取与Word报告生成方法 | |
CN111324648B (zh) | 一种时序数据的处理方法及装置 | |
CN111859046A (zh) | 一种基于污染要素源解析的水污染溯源系统及方法 | |
CN111522949A (zh) | 一种基于文本聚类的智能回答方法及系统 | |
CN113377696A (zh) | 一种基于计算机设备的总线数据处理方法 | |
CN109523031B (zh) | 一种用于深度分析的大数据智能机器学习系统 | |
CN115563292A (zh) | 一种危险废物名录知识图谱的建立方法及构建装置 | |
CN110990430A (zh) | 一种大规模数据并行处理系统 | |
CN114706990A (zh) | 一种智慧法律大数据信息融合生态系统及方法 | |
CN115248854B (zh) | 一种基于知识图谱的自动问答方法、系统及存储介质 | |
CN102521239B (zh) | 一种基于owl的互联网问答信息匹配系统及其匹配方法 | |
CN113779363B (zh) | 一种基于深度神经网络的搜索优化方法及装置 | |
CN112163885A (zh) | 一种基于移动通信数据的用户关系挖掘方法及系统 | |
CN114817549A (zh) | 一种基于非结构化海量数据的智能分析方法 | |
CN110796429A (zh) | 一种智能语音分析终端办事平台 | |
CN113392632A (zh) | 一种可提供用户获取创新思路的创新辅助系统及其应用 | |
CN116228117A (zh) | 一种基于大数据的碳排放智能分析系统 | |
CN116340547A (zh) | 一种对话式报表可视化生产方法及系统 | |
CN106897293B (zh) | 一种数据处理方法和装置 | |
CN118037442A (zh) | 面向主流区块链系统的通用交易分析框架 | |
CN112052335A (zh) | 一种基于多维数据源的企业信息的获取方法及系统 | |
CN114549084A (zh) | 一种基于派氏废钢价格指数的动态权重指数计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200811 |