CN112527995A - 问题反馈处理方法、装置、设备及可读存储介质 - Google Patents
问题反馈处理方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN112527995A CN112527995A CN202011502234.8A CN202011502234A CN112527995A CN 112527995 A CN112527995 A CN 112527995A CN 202011502234 A CN202011502234 A CN 202011502234A CN 112527995 A CN112527995 A CN 112527995A
- Authority
- CN
- China
- Prior art keywords
- text
- answer
- answer text
- question
- feedback
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
本发明涉及语义解析技术,揭露一种问题反馈处理方法,包括:对问题反馈文本进行实体抽取,得到问题实体;对问题反馈图像进行文本识别,得到图像文本;对图像文本进行语义分析,得到问题类别特征;利用至少一个答案知识库对问题实体进行查询,得到至少一组答案文本集;对至少一组答案文本集中的答案文本进行相关度计算,得到待选答案文本集;利用问题类别特征对待选答案文本集中的待选答案文本进行加权计算,得到最终答案文本,将最终答案文本推送至预设的终端设备。本发明还涉及一种区块链技术,所述答案知识库可以部署在区块链中。本发明还提出一种问题反馈处理装置、电子设备以及可读存储介质。本发明可以提高问题反馈处理的准确率。
Description
技术领域
本发明涉及语义解析领域,尤其涉及一种问题反馈处理方法、装置、电子设备及可读存储介质。
背景技术
随着互联网技术的发展,应用程序在人们生活中越来越不可或缺,但是当用户反馈软件出现问题时,怎么对反馈的问题进行处理让用户获取解决问题的答案及怎么让开发者定位对应的问题类别成为了人们越来越关心的问题。
目前的反馈问题处理方法只能根据用户问题反馈文本信息在单一答案库中进行匹配,且不能对问题反馈图像进行识别,无法准确的定位问题类别,反馈问题答案,导致问题反馈处理的准确率低。
发明内容
本发明提供一种问题反馈处理方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高问题反馈处理的准确率。
为实现上述目的,本发明提供的一种问题反馈处理方法,包括:
获取问题反馈文本及对应的问题反馈图像;
对所述问题反馈文本进行分词处理及实体抽取处理,得到问题实体;
对所述问题反馈图像进行预处理及文本识别,得到图像文本;
利用训练完成的的问题语义分析模型对所述图像文本进行语义分析,得到问题类别特征;
利用预构建的至少一个答案知识库对所述问题实体进行查询,得到至少一组答案文本集;
对所述至少一组答案文本集中的答案文本进行相关度计算与分析,得到待选答案文本集;
利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,得到最终答案文本,并将所述最终答案文本推送至预设的终端设备。
可选地,所述对所述问题反馈图像进行预处理及文本识别,得到图像文本,包括:
裁剪所述问题反馈图像中的感兴趣区域,得到关键区域;
对所述关键区域进行灰度化处理,得到灰度化区域;
对所述灰度化区域进行滤波处理,得到所述标准区域;
利用预设文本提取算法对所述标准区域进行文本识别处理,得到所述图像文本。
可选地,所述利用训练完成的问题语义分析模型对所述图像文本进行语义分析,得到问题类别特征之前,还包括:
获取历史图像文本集,对所述历史图像文本集进行问题类别特征标记,得到训练集;
利用所述训练集对预构建的问题语义分析模型进行迭代训练,直至所述预构建的问题语义分析模型收敛,得到训练完成的问题语义分析模型。
可选地,所述对所述答案文本集中的答案文本进行相关度计算与分析,得到待选答案文本集,包括:
将所述答案文本集中的每个答案文本转化为对应的答案文本向量;
将所述问题反馈文本转化为问题文本向量;
计算所述答案文本向量与所述问题文本向量的相关度值,汇总所有相关度值得到相关度值集;
将所述相关度值集中相关度值进行排序,得到最大相关度值;
在所述答案文本集中选取所述最大相关度值对应的答案文本向量,并将选取的答案文本向量对应的答案文本作为该答案文本集对应的待选答案文本;
汇总所述待选答案文本,得到所述待选答案文本集。
可选地,所述将所述答案文本集中的每个答案文本转化为对应的答案文本向量,包括:
利用预先训练的字向量词典获取所述答案文本集中每个答案文本包含的每个字符的字向量;
计算每个答案文本中所有字符的字向量的算术平均值作为每个答案文本对应的答案文本向量。
可选地,所述利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,得到最终答案文本,并将所述最终答案文本推送至预设的终端设备,包括:
将所述问题类别特征转化为问题类别特征向量;
计算所述问题类别特征向量与每个待选答案文本对应的答案文本向量的相关度值,得到待选答案文本相关度值;
计算所述至少一组答案文本集中的答案文本的总数目;
计算所述至少一组答案文本集中每组答案文本集中的答案文本数目与所述答案文本的总数目的比值,得到每组答案文本集权重;
将所述待选答案文本所在的答案文本集对应的答案文本集权重与该待选答案文本对应的待选答案文本相关度值相乘,得到待选答案文本权重值;
汇总所述待选答案文本权重值得到待选答案文本权重值集;
根据所述待选答案文本权重值集对所述待选答案文本集进行筛选,得到所述最终答案文本,并将所述最终答案文本推送至预设的终端设备。
可选地,所述根据所述待选答案文本权重值集对所述待选答案文本集进行筛选,得到所述最终答案文本,并将所述最终答案文本推送至预设的终端设备,包括:
判断所述待选答案文本权重值集中最大待选答案文本权重值是否大于预设答案阈值;
若大于预设答案阈值,将所述待选答案文本权重值集中最大待选答案文本权重值确定为目标权重值,选取所述待选答案文本集中所述目标权重值对应的待选答案文本作为所述最终答案文本,将所述最终答案文本推送至所述问题反馈文本及所述问题反馈图像对应的用户的终端设备;
若不大于预设答案阈值,将所述问题反馈文本及所述问题反馈图像发送至所述问题类别特征对应的软件维护人员的终端设备。
为了解决上述问题,本发明还提供一种问题反馈处理装置,所述装置包括:
文本处理模块,用于获取问题反馈文本及对应的问题反馈图像;对所述问题反馈文本进行分词处理及实体抽取处理,得到问题实体;
图像处理模块,用于对所述问题反馈图像进行预处理及文本识别,得到图像文本;
答案计算推送模块,用于利用训练完成的的问题语义分析模型对所述图像文本进行语义分析,得到问题类别特征;利用预构建的至少一个答案知识库对所述问题实体进行查询,得到至少一组答案文本集;对所述至少一组答案文本集中的答案文本进行相关度计算与分析,得到待选答案文本集;利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,得到最终答案文本,并将所述最终答案文本推送至预设的终端设备。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个计算机程序;及
处理器,执行所述存储器中存储的计算机程序以实现上述所述的问题反馈处理方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的问题反馈处理方法。
本发明实施例对所述问题反馈文本进行分词处理及实体抽取处理,得到问题实体,通过所述分词处理及实体抽取处理可以剔除所述问题反馈文本中的无意义词语,避免无意义词语对后续答案查询的影响;对所述问题反馈图像进行预处理及文本识别,得到图像文本,帮助识别用户反馈的问题;利用训练完成的的问题语义分析模型对所述图像文本进行语义分析,得到问题类别特征;利用预构建的至少一个答案知识库对所述问题实体进行查询,得到至少一组答案文本集,利用多个知识库进行查询,查询范围更大更准确;对所述至少一组答案文本集中的答案文本进行相关度计算与分析,得到待选答案文本集;利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,得到最终答案文本,通过问题类别特征缩小筛选范围,使答案的筛选更准确。因此,本发明实施例提出的问题反馈处理方法、装置、电子设备及计算机可读存储介质提高了问题反馈处理的准确率。
附图说明
图1为本发明一实施例提供的问题反馈处理方法的流程示意图;
图2为本发明一实施例中得到所述最终答案文本的详细流程示意图;
图3为本发明一实施例提供的问题反馈处理装置的模块示意图;
图4为本发明一实施例提供的实现问题反馈处理方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供一种问题反馈处理方法。所述问题反馈处理方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述问题反馈处理方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示的本发明一实施例提供的问题反馈处理方法的流程示意图,在本发明实施例中,所述问题反馈处理方法包括:
S1、获取问题反馈文本及对应的问题反馈图像;
本发明实施例中,所述问题反馈文本为用户反馈的软件问题的文字描述,所述问题反馈图像为用户反馈的软件问题对应的问题截图;进一步地,本发明实施例中,所述问题反馈文本及对应的问题反馈图像可以通过软件或网页的问题反馈文本及所述问题反馈图像输入模块进行获取。
S2、对所述问题反馈文本进行分词处理及实体抽取处理,得到问题实体;
本发明实施例中所述问题反馈文本为用户输入的想要咨询或反馈的问题,例如:“软件怎么不是能横屏播放”、“软件怎么连不上网”,可通过网页的文本输入模块获取所述问题反馈文本。
进一步地,本发明实施例对所述问题反馈文本进行分词处理及实体抽取处理,得到问题实体,其中,所述分词处理包括:
步骤I:利用预构建的分词词典对所述问题反馈文本进行分词操作,其中,所述预构建的分词词典中最大词条所含的字符数目为n个;判断所述问题反馈文本的所有字符数目是否小于n个;若所述问题反馈文本的所有字符数目小于n个,则将所述问题反馈文本作为匹配字段,若所述问题反馈文本的所有字符数目等于或大于n个,则将所述问题反馈文本的前n个字符作为所述匹配字段;
步骤II:利用所述匹配字段在所述分词词典中进行遍历匹配;判断所述分词词典中是否含有与所述匹配字段相同的词语;若所述分词词典中含有与所述匹配字段相同的词语,确定匹配成功,从所述问题反馈文本中分出所述匹配字段,执行步骤IV;若所述分词词典中不含有与所述匹配字段相同的词语,则执行步骤III;
步骤III:判断所述匹配字段中包含的字符数目是否大于1;若所述匹配字段中包含的字符数目等于1,从所述问题反馈文本中分出所述匹配字段,执行步骤IV;若所述匹配字段中包含的字符数目大于1,将所述匹配字段的最后一个字符剔除,用剔除后的字段替换更新所述匹配字段,返回步骤II;
步骤IV:判断所述问题反馈文本中所述匹配字段后的字符数目是否等于0个;若所述问题反馈文本匹配字段后的字符数目不等于0个,执行步骤V,若所述问题反馈文本匹配字段后的字符数目等于0个,则停止分词处理;
步骤V:判断所述问题反馈文本中所述匹配字段后的字符数目是否小于n个;若所述问题反馈文本中所述匹配字段后的字符数目小于n个,则以所述问题反馈文本中所述匹配字段后的所有字符替换更新所述匹配字段,同时返回所述步骤II;若所述问题反馈文本中所述匹配字段后的字符数目不小于n个,则以所述问题反馈文本匹配字段后的顺序的n个字符替换更新所述匹配字段,同时返回所述步骤II。
通过上述实施方式,以正向切分的方式进行分词处理,分词效果更准确且分词速度更快。
较佳地,本发明实施例中所述实体抽取处理包括:利用命名实体识别技术(NamedEntity Recognition,简称NER)对所述分词处理后的问题反馈文本进行识别,得到问题实体。其中,利用命名实体识别技术能够识别出问题反馈文本中具有特定意义的实体(如,人名、地名、机构名、专有名词等)。例如:所述分词处理后的问题反馈文本为“美国总统”“是”“谁”,利用所述命名实体识别技术对所述问题反馈文本进行识别可得到问题实体为“美国总统”。
通过所述分词处理及实体抽取处理可以剔除所述问题反馈文本中的无意义词语,避免无意义词语对后续答案查询的影响。
S3、对所述问题反馈图像进行预处理及文本识别,得到图像文本;
本发明实施例中,所述问题反馈图像为用户反馈的软件问题的截图,所述问题反馈图像中的信息更能帮助识别用户反馈的问题,因此对所述问题反馈图像进行预处理及文本识别,得到所述图像文本。
详细地,本发明实施例中为了去除所述问题反馈图像中无关区域的影响,裁剪所述问题反馈图像中的感兴趣区域,得到关键区域,较佳地,本发明实施例中所述感兴趣区域为所述问题反馈图像报错文本显示区域。
详细地,由于所述关键区域可能存在不同的颜色,为了降低数据量、减少存储空间、降低图像处理时间,对所述关键区域进行灰度化处理;进一步地,由于所述关键区域中存在图像噪声,为了降低图像噪声对后续处理的影响,本发明实施例对所述关键区域进行滤波处理,较佳地,本发明实施例利用中值滤波算法对所述关键区域进行滤波处理。
进一步地,为了获取所述关键区域中文本信息,本发明实施例采用文本提取算法对所述关键区域进行文本提取处理,以将所述关键区域中的文字提取出来。本发明其中一个实施例中,所述文本提取算法可以为已知的OCR(Optical Character Recognition,光学字符识别)算法。
因此,综上所述,本发明实施例中,所述对所述问题反馈图像进行预处理及文本识别,包括:裁剪所述问题反馈图像中的感兴趣区域,得到所述关键区域;对所述关键区域进行灰度化处理,得到灰度化区域;对所述灰度化区域进行滤波处理,得到所述标准区域;利用预设文本提取算法对所述标准区域进行文本识别处理,得到所述图像文本。
S4、利用训练完成的问题语义分析模型对所述图像文本进行语义分析,得到问题类别特征;
本发明实施例中,利用训练完成的语义分析模型对所述图像文本进行语义分析,得到所述问题类别特征。例如:图像文本为“服务器开小差了”,得到所述图像文本的问题类别特征为“服务器类别”;图像文本为“视频播放错误”,得到所述图像文本的问题类别特征为“播放类别”。
详细地,本发明实施例中,所述利用训练完成的语义分析模型对所述图像文本性语义分析,得到问题类别特征之前,还包括:
步骤A:获取历史图像文本集,对所述历史图像文本集进行问题类别特征标记,得到训练集;
本发明实施例中,所述历史图像文本集为不同的历史图像文本的集合,所述历史图像文本可以为与所述识别出来的图像文本具有不同内容但属于相同类型的文本数据。进一步,本发明实施例标记所述历史图像文本集中每个历史图像文本的问题类别特征,得到所述训练集。
步骤B:利用所述训练集对预构建的语义分析模型进行迭代训练,直至所述预构建的语义分析模型收敛,得到训练完成的语义分析模型。
较佳地,本发明实施例中所述预构建的语义分析为BERT网络模型。
通过对所述图像文本进行语义分析得到问题类别特征,利用问题类别特征缩小筛选范围,后续对答案的筛选更准确。
S5、利用预构建的至少一个答案知识库对所述问题实体进行查询,得到至少一组答案文本集;
本发明实施例中,为了保证答案的准确度,预构建不同的答案知识库,如软件答案知识库,其中,所述软件功能答案知识库是限定功能类别的软件知识组成的数据库。例如:软件涵盖多个功能类别,包括:视频播放功能、网络连接功能、视频下载功能等多个功能类别,本发明实施例将视频播放相关的的知识汇总存储到数据库得到视频播放功能答案知识库、将网络连接相关的的知识汇总存储到数据库得到网络连接功能答案知识库、将视频下载功能相关的的知识汇总存储到数据库得到视频下载功能答案知识库。
本发明的另一实施例中所述答案知识库为限定领域知识组成,并可以部署在区块链上。
进一步地,利用预构建的至少一个答案知识库对所述问题实体进行查询,得到至少一组答案文本集;以软件功能答案知识库为例,共有视频播放功能答案知识库、网络连接功能答案知识库、视频下载功能答案知识库三种预构建的软件功能答案知识库,分别在这三种软件功能知识库中对所述问题实体进行查询得到多组业务答案文本集,在视频播放功能答案知识库查询得到视频播放功能答案文本集、在网络连接功能答案知识库查询得到网络连接功能答案文本集、在视频下载功能答案知识库查询得到视频下载功能答案文本集,共3组答案文本集。
S6、对所述至少一组答案文本集中的答案文本进行相关度计算与分析,得到待选答案文本集;
本发明实施例中,为了筛选出更准确的答案,将所述答案文本集中的每个答案文本转化为对应的答案文本向量,将所述问题反馈文本转化为问题文本向量。
较佳地,利用预先训练的字向量词典获取所述答案文本集中每个答案文本包含的每个字符的字向量;计算每个答案文本中所有字符的字向量的算术平均值作为每个答案文本对应的答案文本向量。
进一步地,所述算术平均值的计算公式如下:
其中,a1至an表示每个答案文本中每个字符的字向量,n表示该答案文本中字符的个数,W表示该答案文本的答案文本向量。
进一步地,获取预设尺寸的维度窗口;将所述问题反馈文本输入至所述维度窗口中,生成维度查询文本;利用预设编码算法对所述维度查询文本进行编码,生成问题文本向量。
例如,维度窗口为k*k的维度窗口,其中,k为大于或者等于1的正整数。
较佳地,本实施例中,所述预设编码算法可以为哈夫曼编码算法。
进一步地,计算所述答案文本向量与所述问题文本向量的相关度值,汇总所有相关度值得到相关度值集;将所述相关度值集中相关度值进行排序,得到最大相关度值;在所述答案文本集中选取所述最大相关度值对应的答案文本向量,并将选取的答案文本向量对应的答案文本作为该答案文本集对应的待选答案文本。
详细地,所述相关度值计算可用如下公式:
其中,xi为所述答案文本向量,i为正整数,y为所述问题文本向量,sim(xi,y)为所述答案文本向量与所述问题文本向量的相关度值。
进一步地,汇总所述待选答案文本,得到所述待选答案文本集。
S7、利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,得到最终答案文本,并将所述最终答案文本推送至预设的终端设备。
详细地,本发明实施例为了进一步对答案进行筛选,保证答案的准确度,本发明实施例利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,包括:
S71、将所述问题类别特征转化为问题类别特征向量;
S72、计算所述问题类别特征向量与每个待选答案文本对应的答案文本向量的相关度值,得到待选答案文本相关度值;
S73、计算所述至少一组答案文本集中的答案文本的总数目;
例如:所述所述至少一组答案文本集包含网络连接功能答案文本集、视频播放功能答案文本集共两组答案文本集,网络连接功能答案文本集中有100个答案文本,视频播放功能答案文本集中共有50个答案文本,那么所述至少一组答案文本集中的答案文本的总数目为150。
S74、计算所述至少一组答案文本集中每组答案文本集中的答案文本数目与所述答案文本的总数目的比值,得到每组答案文本集权重;
例如:所述所述至少一组答案文本集包含网络连接功能答案文本集、视频播放功能答案文本集共两组答案文本集,网络连接功能答案文本集中有100个答案文本,视频播放功能答案文本集中共有50个答案文本,所述至少一组答案文本集中的答案文本的总数目为150,那么网络连接功能答案文本集的权重为100/150=0.67,视频播放功能答案文本集的权重为50/150=0.33。
S75、将所述待选答案文本所在的答案文本集对应的答案文本集权重与该待选答案文本对应的待选答案文本相关度值相乘,得到待选答案文本权重值,汇总所述待选答案文本权重值得到待选答案文本权重值集;
例如:所述所述至少一组答案文本集包含网络连接功能答案文本集、视频播放功能答案文本集共两组答案文本集,网络连接功能答案文本集的权重为0.67,视频播放功能答案文本集的权重为0.33,待选答案文本A为网络连接功能答案文本集中的答案文本,待选答案文本B为视频播放功能答案文本集中的答案文本,待选答案文本A对应的待选答案文本相关度值为0.2,待选答案文本B对应的待选答案文本相关度值为0.1,那么待选答案文本A权重值为0.67*0.2=0.134,待选答案文本B权重值为0.33*0.1=0.033。
S76、根据所述待选答案文本权重值集对所述待选答案文本集进行筛选,得到所述最终答案文本,并将所述最终答案文本推送至预设的终端设备。
详细地,本发明实施例判断所述待选答案文本权重值集中最大待选答案文本权重值是否大于预设答案阈值;若大于预设答案阈值,将所述待选答案文本权重值集中最大待选答案文本权重值确定为目标权重值,选取所述待选答案文本集中所述目标权重值对应的待选答案文本作为所述最终答案文本,将所述最终答案文本推送至所述问题反馈文本及所述问题反馈图像对应的用户的终端设备,若不大于预设答案阈值,将所述问题反馈文本及所述问题反馈图像发送至所述问题类别特征对应的软件维护人员的终端设备。
进一步地,本发明实施例将最终答案文本推送给用户,同时获取用户对所述最终答案文本是否认可的反馈信息,并基于所述反馈信息对所述答案知识库中的数据进行对应更新,实现对所述答案知识库的纠错处理。
如图3所示,是本发明问题反馈处理装置的功能模块图。
本发明所述问题反馈处理装置100可以安装于电子设备中。根据实现的功能,所述问题反馈处理装置可以包括文本处理模块101、图像处理模块102、答案计算推送模块103,本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述文本处理模块101用于获取问题反馈文本及对应的问题反馈图像;对所述问题反馈文本进行分词处理及实体抽取处理,得到问题实体。
本发明实施例中,所述问题反馈文本为用户反馈的软件问题的文字描述,所述问题反馈图像为用户反馈的软件问题对应的问题截图;进一步地,本发明实施例中,所述问题反馈文本及对应的问题反馈图像可以通过软件或网页的问题反馈文本及所述问题反馈图像输入模块进行获取。
本发明实施例中所述问题反馈文本为用户输入的想要咨询或反馈的问题,例如:“软件怎么不是能横屏播放”、“软件怎么连不上网”,可通过网页的文本输入模块获取所述问题反馈文本。
进一步地,本发明实施例对所述问题反馈文本进行分词处理及实体抽取处理,得到问题实体,其中,所述文本处理模块101利用下述手段进行分词处理包括:
步骤I:利用预构建的分词词典对所述问题反馈文本进行分词操作,其中,所述预构建的分词词典中最大词条所含的字符数目为n个;判断所述问题反馈文本的所有字符数目是否小于n个;若所述问题反馈文本的所有字符数目小于n个,则将所述问题反馈文本作为匹配字段,若所述问题反馈文本的所有字符数目等于或大于n个,则将所述问题反馈文本的前n个字符作为所述匹配字段;
步骤II:利用所述匹配字段在所述分词词典中进行遍历匹配;判断所述分词词典中是否含有与所述匹配字段相同的词语;若所述分词词典中含有与所述匹配字段相同的词语,确定匹配成功,从所述问题反馈文本中分出所述匹配字段,执行步骤IV;若所述分词词典中不含有与所述匹配字段相同的词语,则执行步骤III;
步骤III:判断所述匹配字段中包含的字符数目是否大于1;若所述匹配字段中包含的字符数目等于1,从所述问题反馈文本中分出所述匹配字段,执行步骤IV;若所述匹配字段中包含的字符数目大于1,将所述匹配字段的最后一个字符剔除,用剔除后的字段替换更新所述匹配字段,返回步骤II;
步骤IV:判断所述问题反馈文本中所述匹配字段后的字符数目是否等于0个;若所述问题反馈文本匹配字段后的字符数目不等于0个,执行步骤V,若所述问题反馈文本匹配字段后的字符数目等于0个,则停止分词处理;
步骤V:判断所述问题反馈文本中所述匹配字段后的字符数目是否小于n个;若所述问题反馈文本中所述匹配字段后的字符数目小于n个,则以所述问题反馈文本中所述匹配字段后的所有字符替换更新所述匹配字段,同时返回所述步骤II;若所述问题反馈文本中所述匹配字段后的字符数目不小于n个,则以所述问题反馈文本匹配字段后的顺序的n个字符替换更新所述匹配字段,同时返回所述步骤II。
通过上述实施方式,以正向切分的方式进行分词处理,分词效果更准确且分词速度更快。
较佳地,本发明实施例中,所述所述文本处理模块101利用下述手段进行实体抽取处理,包括:利用命名实体识别技术(Named Entity Recognition,简称NER)对所述分词处理后的问题反馈文本进行识别,得到问题实体。其中,利用命名实体识别技术能够识别出问题反馈文本中具有特定意义的实体(如,人名、地名、机构名、专有名词等)。例如:所述分词处理后的问题反馈文本为“美国总统”“是”“谁”,利用所述命名实体识别技术对所述问题反馈文本进行识别可得到问题实体为“美国总统”。
通过所述分词处理及实体抽取处理可以剔除所述问题反馈文本中的无意义词语,避免无意义词语对后续答案查询的影响。
所述图像处理模块102用于对所述问题反馈图像进行预处理及文本识别,得到图像文本。
本发明实施例中,所述问题反馈图像为用户反馈的软件问题的截图,所述问题反馈图像中的信息更能帮助识别用户反馈的问题,因此所述图像处理模块102对所述问题反馈图像进行预处理及文本识别,得到所述图像文本。
详细地,本发明实施例中为了去除所述问题反馈图像中无关区域的影响,所述图像处理模块102裁剪所述问题反馈图像中的感兴趣区域,得到关键区域,较佳地,本发明实施例中所述感兴趣区域为所述问题反馈图像报错文本显示区域。
详细地,由于所述关键区域可能存在不同的颜色,为了降低数据量、减少存储空间、降低图像处理时间,所述图像处理模块102对所述关键区域进行灰度化处理;进一步地,由于所述关键区域中存在图像噪声,为了降低图像噪声对后续处理的影响,本发明实施例,所述图像处理模块102对所述关键区域进行滤波处理,较佳地,本发明实施例利用中值滤波算法对所述关键区域进行滤波处理。
进一步地,为了获取所述关键区域中文本信息,本发明实施例,所述图像处理模块102采用文本提取算法对所述关键区域进行文本提取处理,以将所述关键区域中的文字提取出来。本发明其中一个实施例中,所述文本提取算法可以为已知的OCR(OpticalCharacter Recognition,光学字符识别)算法。
因此,综上所述,本发明实施例中,所述图像处理模块102利用下述手段对所述问题反馈图像进行预处理及文本识别,包括:裁剪所述问题反馈图像中的感兴趣区域,得到所述关键区域;对所述关键区域进行灰度化处理,得到灰度化区域;对所述灰度化区域进行滤波处理,得到所述标准区域;利用预设文本提取算法对所述标准区域进行文本识别处理,得到所述图像文本。
所述答案计算推送模块103用于利用训练完成的的问题语义分析模型对所述图像文本进行语义分析,得到问题类别特征;利用预构建的至少一个答案知识库对所述问题实体进行查询,得到至少一组答案文本集;对所述至少一组答案文本集中的答案文本进行相关度计算与分析,得到待选答案文本集;利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,得到最终答案文本,并将所述最终答案文本推送至预设的终端设备。
本发明实施例中,所述答案计算推送模块103利用训练完成的语义分析模型对所述图像文本进行语义分析,得到所述问题类别特征。例如:图像文本为“服务器开小差了”,得到所述图像文本的问题类别特征为“服务器类别”;图像文本为“视频播放错误”,得到所述图像文本的问题类别特征为“播放类别”。
详细地,本发明实施例中,所述答案计算推送模块103利用训练完成的语义分析模型对所述图像文本性语义分析,得到问题类别特征之前,还包括下述手段:
步骤A:获取历史图像文本集,对所述历史图像文本集进行问题类别特征标记,得到训练集;
本发明实施例中,所述历史图像文本集为不同的历史图像文本的集合,所述历史图像文本可以为与所述识别出来的图像文本具有不同内容但属于相同类型的文本数据。进一步,本发明实施例标记所述历史图像文本集中每个历史图像文本的问题类别特征,得到所述训练集。
步骤B:利用所述训练集对预构建的语义分析模型进行迭代训练,直至所述预构建的语义分析模型收敛,得到训练完成的语义分析模型。
较佳地,本发明实施例中所述预构建的语义分析为BERT网络模型。
通过对所述图像文本进行语义分析得到问题类别特征,利用问题类别特征可以对答案进行更准确的筛选。
本发明实施例中,为了保证答案的准确度,所述答案计算推送模块103预构建不同的答案知识库,如软件答案知识库,其中,所述软件功能答案知识库是限定功能类别的软件知识组成的数据库。例如:软件涵盖多个功能类别,包括:视频播放功能、网络连接功能、视频下载功能等多个功能类别,本发明实施例将视频播放相关的的知识汇总存储到数据库得到视频播放功能答案知识库、将网络连接相关的的知识汇总存储到数据库得到网络连接功能答案知识库、将视频下载功能相关的的知识汇总存储到数据库得到视频下载功能答案知识库。
本发明的另一实施例中所述答案知识库为限定领域知识组成,并可以部署在区块链上。
进一步地,所述答案计算推送模块103利用预构建的至少一个答案知识库对所述问题实体进行查询,得到至少一组答案文本集;以软件功能答案知识库为例,共有视频播放功能答案知识库、网络连接功能答案知识库、视频下载功能答案知识库三种预构建的软件功能答案知识库,分别在这三种软件功能知识库中对所述问题实体进行查询得到多组业务答案文本集,在视频播放功能答案知识库查询得到视频播放功能答案文本集、在网络连接功能答案知识库查询得到网络连接功能答案文本集、在视频下载功能答案知识库查询得到视频下载功能答案文本集,共3组答案文本集。
本发明实施例中,为了筛选出更准确的答案,所述答案计算推送模块103将所述答案文本集中的每个答案文本转化为对应的答案文本向量,将所述问题反馈文本转化为问题文本向量。
较佳地,所述答案计算推送模块103利用预先训练的字向量词典获取所述答案文本集中每个答案文本包含的每个字符的字向量;计算每个答案文本中所有字符的字向量的算术平均值作为每个答案文本对应的答案文本向量。
进一步地,所述算术平均值的计算公式如下:
其中,a1至an表示每个答案文本中每个字符的字向量,n表示该答案文本中字符的个数,W表示该答案文本的答案文本向量。
进一步地,所述答案计算推送模块103获取预设尺寸的维度窗口;将所述问题反馈文本输入至所述维度窗口中,生成维度查询文本;利用预设编码算法对所述维度查询文本进行编码,生成问题文本向量。
例如,维度窗口为k*k的维度窗口,其中,k为大于或者等于1的正整数。
较佳地,本实施例中,所述预设编码算法可以为哈夫曼编码算法。
进一步地,所述答案计算推送模块103计算所述答案文本向量与所述问题文本向量的相关度值,汇总所有相关度值得到相关度值集;将所述相关度值集中相关度值进行排序,得到最大相关度值;在所述答案文本集中选取所述最大相关度值对应的答案文本向量,并将选取的答案文本向量对应的答案文本作为该答案文本集对应的待选答案文本。
详细地,所述相关度值计算可用如下公式:
其中,xi为所述答案文本向量,i为正整数,y为所述问题文本向量,sim(xi,y)为所述答案文本向量与所述问题文本向量的相关度值。
进一步地,所述答案计算推送模块103汇总所述待选答案文本,得到所述待选答案文本集。
详细地,本发明实施例为了进一步对答案进行筛选,保证答案的准确度,本发明实施例所述答案计算推送模块103利用下述手段对所述待选答案文本集中的待选答案文本进行加权计算与分析,包括:
将所述问题类别特征转化为问题类别特征向量;
计算所述问题类别特征向量与每个待选答案文本对应的答案文本向量的相关度值,得到待选答案文本相关度值;
计算所述至少一组答案文本集中的答案文本的总数目;
例如:所述所述至少一组答案文本集包含网络连接功能答案文本集、视频播放功能答案文本集共两组答案文本集,网络连接功能答案文本集中有100个答案文本,视频播放功能答案文本集中共有50个答案文本,那么所述至少一组答案文本集中的答案文本的总数目为150。
计算所述至少一组答案文本集中每组答案文本集中的答案文本数目与所述答案文本的总数目的比值,得到每组答案文本集权重;
例如:所述所述至少一组答案文本集包含网络连接功能答案文本集、视频播放功能答案文本集共两组答案文本集,网络连接功能答案文本集中有100个答案文本,视频播放功能答案文本集中共有50个答案文本,所述至少一组答案文本集中的答案文本的总数目为150,那么网络连接功能答案文本集的权重为100/150=0.67,视频播放功能答案文本集的权重为50/150=0.33。
将所述待选答案文本所在的答案文本集对应的答案文本集权重与该待选答案文本对应的待选答案文本相关度值相乘,得到待选答案文本权重值,汇总所述待选答案文本权重值得到待选答案文本权重值集;
例如:所述所述至少一组答案文本集包含网络连接功能答案文本集、视频播放功能答案文本集共两组答案文本集,网络连接功能答案文本集的权重为0.67,视频播放功能答案文本集的权重为0.33,待选答案文本A为网络连接功能答案文本集中的答案文本,待选答案文本B为视频播放功能答案文本集中的答案文本,待选答案文本A对应的待选答案文本相关度值为0.2,待选答案文本B对应的待选答案文本相关度值为0.1,那么待选答案文本A权重值为0.67*0.2=0.134,待选答案文本B权重值为0.33*0.1=0.033。
根据所述待选答案文本权重值集对所述待选答案文本集进行筛选,得到所述最终答案文本,并将所述最终答案文本推送至预设的终端设备。
详细地,本发明实施例判断所述待选答案文本权重值集中最大待选答案文本权重值是否大于预设答案阈值;若大于预设答案阈值,将所述待选答案文本权重值集中最大待选答案文本权重值确定为目标权重值,选取所述待选答案文本集中所述目标权重值对应的待选答案文本作为所述最终答案文本,将所述最终答案文本推送至所述问题反馈文本及所述问题反馈图像对应的用户的终端设备,若不大于预设答案阈值,将所述问题反馈文本及所述问题反馈图像发送至所述问题类别特征对应的软件维护人员的终端设备。
进一步地,本发明实施例将最终答案文本推送给用户,同时获取用户对所述最终答案文本是否认可的反馈信息,并基于所述反馈信息对所述答案知识库中的数据进行对应更新,实现对所述答案知识库的纠错处理。
如图4所示,是本发明实现问题反馈处理方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如问题反馈处理程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如问题反馈处理程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如问题反馈处理程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(perIPheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图4仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的问题反馈处理程序12是多个计算机程序的组合,在所述处理器10中运行时,可以实现:
获取问题反馈文本及对应的问题反馈图像;
对所述问题反馈文本进行分词处理及实体抽取处理,得到问题实体;
对所述问题反馈图像进行预处理及文本识别,得到图像文本;
利用训练完成的的问题语义分析模型对所述图像文本进行语义分析,得到问题类别特征;
利用预构建的至少一个答案知识库对所述问题实体进行查询,得到至少一组答案文本集;
对所述至少一组答案文本集中的答案文本进行相关度计算与分析,得到待选答案文本集;
利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,得到最终答案文本,并将所述最终答案文本推送至预设的终端设备。
具体地,所述处理器10对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以是非易失性的,也可以是易失性的。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明实施例还可以提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取问题反馈文本及对应的问题反馈图像;
对所述问题反馈文本进行分词处理及实体抽取处理,得到问题实体;
对所述问题反馈图像进行预处理及文本识别,得到图像文本;
利用训练完成的的问题语义分析模型对所述图像文本进行语义分析,得到问题类别特征;
利用预构建的至少一个答案知识库对所述问题实体进行查询,得到至少一组答案文本集;
对所述至少一组答案文本集中的答案文本进行相关度计算与分析,得到待选答案文本集;
利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,得到最终答案文本,并将所述最终答案文本推送至预设的终端设备。
进一步地,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种问题反馈处理方法,其特征在于,所述方法包括:
获取问题反馈文本及对应的问题反馈图像;
对所述问题反馈文本进行分词处理及实体抽取处理,得到问题实体;
对所述问题反馈图像进行预处理及文本识别,得到图像文本;
利用训练完成的的问题语义分析模型对所述图像文本进行语义分析,得到问题类别特征;
利用预构建的至少一个答案知识库对所述问题实体进行查询,得到至少一组答案文本集;
对所述至少一组答案文本集中的答案文本进行相关度计算与分析,得到待选答案文本集;
利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,得到最终答案文本,并将所述最终答案文本推送至预设的终端设备。
2.如权利要求1所述的问题反馈处理方法,其特征在于,所述对所述问题反馈图像进行预处理及文本识别,得到图像文本,包括:
裁剪所述问题反馈图像中的感兴趣区域,得到关键区域;
对所述关键区域进行灰度化处理,得到灰度化区域;
对所述灰度化区域进行滤波处理,得到所述标准区域;
利用预设文本提取算法对所述标准区域进行文本识别处理,得到所述图像文本。
3.如权利要求1所述的问题反馈处理方法,其特征在于,所述利用训练完成的问题语义分析模型对所述图像文本进行语义分析,得到问题类别特征之前,还包括:
获取历史图像文本集,对所述历史图像文本集进行问题类别特征标记,得到训练集;
利用所述训练集对预构建的问题语义分析模型进行迭代训练,直至所述预构建的问题语义分析模型收敛,得到训练完成的问题语义分析模型。
4.如权利要求1所述的问题反馈处理方法,其特征在于,所述对所述答案文本集中的答案文本进行相关度计算与分析,得到待选答案文本集,包括:
将所述答案文本集中的每个答案文本转化为对应的答案文本向量;
将所述问题反馈文本转化为问题文本向量;
计算所述答案文本向量与所述问题文本向量的相关度值,汇总所有相关度值得到相关度值集;
将所述相关度值集中相关度值进行排序,得到最大相关度值;
在所述答案文本集中选取所述最大相关度值对应的答案文本向量,并将选取的答案文本向量对应的答案文本作为该答案文本集对应的待选答案文本;
汇总所述待选答案文本,得到所述待选答案文本集。
5.如权利要求4所述的问题反馈处理方法,其特征在于,所述将所述答案文本集中的每个答案文本转化为对应的答案文本向量,包括:
利用预先训练的字向量词典获取所述答案文本集中每个答案文本包含的每个字符的字向量;
计算每个答案文本中所有字符的字向量的算术平均值作为每个答案文本对应的答案文本向量。
6.如权利要求4所述的问题反馈处理方法,其特征在于,所述利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,得到最终答案文本,并将所述最终答案文本推送至预设的终端设备,包括:
将所述问题类别特征转化为问题类别特征向量;
计算所述问题类别特征向量与每个待选答案文本对应的答案文本向量的相关度值,得到待选答案文本相关度值;
计算所述至少一组答案文本集中的答案文本的总数目;
计算所述至少一组答案文本集中每组答案文本集中的答案文本数目与所述答案文本的总数目的比值,得到每组答案文本集权重;
将所述待选答案文本所在的答案文本集对应的答案文本集权重与该待选答案文本对应的待选答案文本相关度值相乘,得到待选答案文本权重值;
汇总所述待选答案文本权重值得到待选答案文本权重值集;
根据所述待选答案文本权重值集对所述待选答案文本集进行筛选,得到所述最终答案文本,并将所述最终答案文本推送至预设的终端设备。
7.如权利要求6所述的问题反馈处理方法,其特征在于,所述根据所述待选答案文本权重值集对所述待选答案文本集进行筛选,得到所述最终答案文本,并将所述最终答案文本推送至预设的终端设备,包括:
判断所述待选答案文本权重值集中最大待选答案文本权重值是否大于预设答案阈值;
若大于预设答案阈值,将所述待选答案文本权重值集中最大待选答案文本权重值确定为目标权重值,选取所述待选答案文本集中所述目标权重值对应的待选答案文本作为所述最终答案文本,将所述最终答案文本推送至所述问题反馈文本及所述问题反馈图像对应的用户的终端设备;
若不大于预设答案阈值,将所述问题反馈文本及所述问题反馈图像发送至所述问题类别特征对应的软件维护人员的终端设备。
8.一种问题反馈处理装置,其特征在于,包括:
文本处理模块,用于获取问题反馈文本及对应的问题反馈图像;对所述问题反馈文本进行分词处理及实体抽取处理,得到问题实体;
图像处理模块,用于对所述问题反馈图像进行预处理及文本识别,得到图像文本;
答案计算推送模块,用于利用训练完成的的问题语义分析模型对所述图像文本进行语义分析,得到问题类别特征;利用预构建的至少一个答案知识库对所述问题实体进行查询,得到至少一组答案文本集;对所述至少一组答案文本集中的答案文本进行相关度计算与分析,得到待选答案文本集;利用所述问题类别特征对所述待选答案文本集中的待选答案文本进行加权计算与分析,得到最终答案文本,并将所述最终答案文本推送至预设的终端设备。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序指令,所述计算机程序指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一所述的问题反馈处理方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一所述的问题反馈处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011502234.8A CN112527995A (zh) | 2020-12-18 | 2020-12-18 | 问题反馈处理方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011502234.8A CN112527995A (zh) | 2020-12-18 | 2020-12-18 | 问题反馈处理方法、装置、设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112527995A true CN112527995A (zh) | 2021-03-19 |
Family
ID=75001313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011502234.8A Pending CN112527995A (zh) | 2020-12-18 | 2020-12-18 | 问题反馈处理方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112527995A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
CN105095272A (zh) * | 2014-05-12 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 基于图像识别的问答处理方法、装置及系统 |
CN107766511A (zh) * | 2017-10-23 | 2018-03-06 | 深圳市前海众兴电子商务有限公司 | 智能问答方法、终端及存储介质 |
CN108345672A (zh) * | 2018-02-09 | 2018-07-31 | 平安科技(深圳)有限公司 | 智能应答方法、电子装置及存储介质 |
CN109240931A (zh) * | 2018-09-21 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 问题反馈信息处理方法和装置 |
-
2020
- 2020-12-18 CN CN202011502234.8A patent/CN112527995A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
CN105095272A (zh) * | 2014-05-12 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 基于图像识别的问答处理方法、装置及系统 |
CN107766511A (zh) * | 2017-10-23 | 2018-03-06 | 深圳市前海众兴电子商务有限公司 | 智能问答方法、终端及存储介质 |
CN108345672A (zh) * | 2018-02-09 | 2018-07-31 | 平安科技(深圳)有限公司 | 智能应答方法、电子装置及存储介质 |
CN109240931A (zh) * | 2018-09-21 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 问题反馈信息处理方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112016304A (zh) | 文本纠错方法、装置、电子设备及存储介质 | |
CN112380859A (zh) | 舆情信息的推荐方法、装置、电子设备及计算机存储介质 | |
CN113312461A (zh) | 基于自然语言处理的智能问答方法、装置、设备及介质 | |
CN112883730B (zh) | 相似文本匹配方法、装置、电子设备及存储介质 | |
CN113268615A (zh) | 资源标签生成方法、装置、电子设备及存储介质 | |
CN112988963A (zh) | 基于多流程节点的用户意图预测方法、装置、设备及介质 | |
CN113360768A (zh) | 基于用户画像的产品推荐方法、装置、设备及存储介质 | |
CN113064994A (zh) | 会议质量评估方法、装置、设备及存储介质 | |
CN113886708A (zh) | 基于用户信息的产品推荐方法、装置、设备及存储介质 | |
CN115238670A (zh) | 信息文本抽取方法、装置、设备及存储介质 | |
CN113869456A (zh) | 采样监测方法、装置、电子设备及存储介质 | |
CN113821602A (zh) | 基于图文聊天记录的自动答疑方法、装置、设备及介质 | |
CN113706322A (zh) | 基于数据分析的服务分发方法、装置、设备及存储介质 | |
CN112579781A (zh) | 文本归类方法、装置、电子设备及介质 | |
CN113344125A (zh) | 长文本匹配识别方法、装置、电子设备及存储介质 | |
CN112633988A (zh) | 用户产品推荐方法、装置、电子设备及可读存储介质 | |
CN115409041B (zh) | 一种非结构化数据提取方法、装置、设备及存储介质 | |
CN115525761A (zh) | 一种文章关键词筛选类别的方法、装置、设备及存储介质 | |
CN114943306A (zh) | 意图分类方法、装置、设备及存储介质 | |
CN112632264A (zh) | 智能问答方法、装置、电子设备及存储介质 | |
CN114996386A (zh) | 业务角色识别方法、装置、设备及存储介质 | |
CN112527995A (zh) | 问题反馈处理方法、装置、设备及可读存储介质 | |
CN113515591A (zh) | 文本不良信息识别方法、装置、电子设备及存储介质 | |
CN113704474A (zh) | 银行网点设备操作指引生成方法、装置、设备及存储介质 | |
CN112287676A (zh) | 新词发现方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |