CN112966071B - 一种用户反馈信息分析方法、装置、设备及可读存储介质 - Google Patents

一种用户反馈信息分析方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN112966071B
CN112966071B CN202110151615.4A CN202110151615A CN112966071B CN 112966071 B CN112966071 B CN 112966071B CN 202110151615 A CN202110151615 A CN 202110151615A CN 112966071 B CN112966071 B CN 112966071B
Authority
CN
China
Prior art keywords
data
feedback information
information
user feedback
call audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110151615.4A
Other languages
English (en)
Other versions
CN112966071A (zh
Inventor
朱征
陈慕菁
龚亚勋
周晓敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Open Distance Education Center Co ltd
Original Assignee
Beijing Open Distance Education Center Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Open Distance Education Center Co ltd filed Critical Beijing Open Distance Education Center Co ltd
Priority to CN202110151615.4A priority Critical patent/CN112966071B/zh
Publication of CN112966071A publication Critical patent/CN112966071A/zh
Application granted granted Critical
Publication of CN112966071B publication Critical patent/CN112966071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明提供了一种用户反馈信息分析方法、装置、设备及可读存储介质,所述方法包括:获取用户反馈信息;将第一通话音频信息和第二通话音频信息分别转为文本信息,得到第一文本信息和第二文本信息;将第一文本信息和第二文本信息分别进行文本向量化处理,得到第一数据和第二数据;利用第一数据对朴素贝叶斯分类器模型进行训练,得到训练后的朴素贝叶斯模型;利用训练后的朴素贝叶斯分类器模型对第一数据和第二数据中存在的问题进行分类标注,得到分类标注的结果,根据结果得到各类问题的统计数据;根据统计数据,生成用户反馈信息数据分析表。本发明对于通话音频信息进行多标签分类标注,便于运营部分准确把握用户反馈的热点。

Description

一种用户反馈信息分析方法、装置、设备及可读存储介质
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种用户反馈信息分析方法、装置、设备及可读存储介质。
背景技术
目前对用户反馈的处理存在以下问题:需要投入大量人工对通话进行标注,标注存在一定的主观性;由于系统的限制,每个通话只能属于一个分类,但实际一次通话往往不止反映一个问题,只属于一个分类会导致问题统计的缺失;相当多的用户反馈没有精力进行标注,进而导致对用户反馈的信息处理不及时。
发明内容
本发明的目的在于提供一种用户反馈信息分析方法、装置、设备及可读存储介质,以改善上述问题。
为了实现上述目的,本申请实施例提供了如下技术方案:
一方面,本申请实施例提供了一种用户反馈信息分析方法,所述方法包括:
获取所述用户反馈信息,所述用户反馈信息包括第一通话音频信息和第二通话音频信息,所述第一通话音频信息包括人工标注过问题分类的通话音频信息,所述第二通话音频信息包括人工未标注过问题分类的通话音频信息;
将所述第一通话音频信息和第二通话音频信息分别转为文本信息,得到第一文本信息和第二文本信息;
将所述第一文本信息和第二文本信息分别进行文本向量化处理,得到第一数据和第二数据;
利用所述第一数据对朴素贝叶斯分类器模型进行训练,得到训练后的朴素贝叶斯模型;
利用所述训练后的朴素贝叶斯分类器模型对所述第一数据和第二数据中存在的问题进行分类标注,得到分类标注的结果,根据所述结果得到各类问题的统计数据;
根据所述统计数据,计算各类问题的比例,生成用户反馈信息数据分析表。
可选的,所述获取所述用户反馈信息后,还包括:
查询所述用户的历史反馈信息,根据所述历史反馈信息,判断用户当前的反馈是否可信,若判断结果为可信,则进入下一步,若判断结果为不可信,则将此条反馈信息删除。
可选的,所述利用所述训练后的朴素贝叶斯分类器模型对所述第一数据和第二数据中存在的问题进行分类标注,得到分类标注的结果,根据所述结果得到各类问题的统计数据后,还包括:
根据各类问题的统计数据,得到统计数据中的最大值,将所述最大值对应的问题定义为出现次数最多的问题;
获取次数阈值,所述次数阈值包括所述出现次数最多的问题所对应的出现次数阈值;
判断所述最大值与所述次数阈值之间的关系,若所述最大值大于所述次数阈值,则发送第一控制命令,所述第一控制命令包括控制显示器显示出现次数最多的问题,以指示工作人员根据显示器的显示信息进行相应培训。
可选的,所述根据所述统计数据,计算各类问题的比例,生成用户反馈信息数据分析表后,还包括:
将所述用户反馈信息数据分析表导入数据库中;
将所述用户反馈信息数据分析表中各个问题及各个问题出现的次数与数据库中已有的问题及已有问题出现的次数进行统计分析,得到更新之后的数据库,其中若新导入的问题在已有的问题中存在,则更新此问题出现的次数,若新导入的问题在已有的问题中不存在,则新增此问题和此问题的出现的次数;
基于所述更新之后的数据库,根据预设的数据库问题选取个数,按照各个问题出现的次数大小依次选取相应的问题,得到问题集合;
将所述问题集合发送到智能问答系统中,替换所述智能问答系统中原有的问题。
第二方面,本申请实施例提供了一种用户反馈信息分析装置,所述装置包括:第一获取模块、转化模块、处理模块、训练模块、标注模块和计算模块。
所述第一获取模块,用于获取所述用户反馈信息,所述用户反馈信息包括第一通话音频信息和第二通话音频信息,所述第一通话音频信息包括人工标注过问题分类的通话音频信息,所述第二通话音频信息包括人工未标注过问题分类的通话音频信息;
所述转化模块,用于将所述第一通话音频信息和第二通话音频信息分别转为文本信息,得到第一文本信息和第二文本信息;
所述处理模块,用于将所述第一文本信息和第二文本信息分别进行文本向量化处理,得到第一数据和第二数据;
所述训练模块,用于利用所述第一数据对朴素贝叶斯分类器模型进行训练,得到训练后的朴素贝叶斯模型;
所述标注模块,用于利用所述训练后的朴素贝叶斯分类器模型对所述第一数据和第二数据中存在的问题进行分类标注,得到分类标注的结果,根据所述结果得到各类问题的统计数据;
所述计算模块,用于根据所述统计数据,计算各类问题的比例,生成用户反馈信息数据分析表。
可选的,所述第一获取模块,包括:
查询单元,用于查询所述用户的历史反馈信息,根据所述历史反馈信息,判断用户当前的反馈是否可信,若判断结果为可信,则进入下一步,若判断结果为不可信,则将此条反馈信息删除。
可选的,所述装置,还包括:
统计模块,用于根据各类问题的统计数据,得到统计数据中的最大值,将所述最大值对应的问题定义为出现次数最多的问题;
第二获取模块,用于获取次数阈值,所述次数阈值包括所述出现次数最多的问题所对应的出现次数阈值;
判断模块,用于判断所述最大值与所述次数阈值之间的关系,若所述最大值大于所述次数阈值,则发送第一控制命令,所述第一控制命令包括控制显示器显示出现次数最多的问题,以指示工作人员根据显示器的显示信息进行相应培训。
可选的,所述装置,还包括:
导入模块,用于将所述用户反馈信息数据分析表导入数据库中;
更新模块,用于将所述用户反馈信息数据分析表中各个问题及各个问题出现的次数与数据库中已有的问题及已有问题出现的次数进行统计分析,得到更新之后的数据库,其中若新导入的问题在已有的问题中存在,则更新此问题出现的次数,若新导入的问题在已有的问题中不存在,则新增此问题和此问题的出现的次数;
选取模块,用于基于所述更新之后的数据库,根据预设的数据库问题选取个数,按照各个问题出现的次数大小依次选取相应的问题,得到问题集合;
发送模块,用于将所述问题集合发送到智能问答系统中,替换所述智能问答系统中原有的问题。
第三方面,本申请实施例提供了一种用户反馈信息分析设备,所述设备包括存储器和处理器。存储器用于存储计算机程序;处理器用于执行所述计算机程序时实现上述用户反馈信息分析方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述用户反馈信息分析方法的步骤。
本发明的有益效果为:
1、本发明利用模型进行分类标注后,一方面不会存在漏标,一方面可以对一个通话音频信息根据问题相关度给与多个问题分类,便于运营部分准确把握用户反馈的热点。
2、本发明借助通话音频信息训练出的模型,可以很快将通话音频信息进行问题分类,减少大量的时间成本。
3、本发明及时将通话音频信息转成文本,便于后续查看与检索。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例中所述的一用户反馈信息分析方法流程示意图;
图2是本发明实施例中所述的一种用户反馈信息分析装置结构示意图;
图3是本发明实施例中所述的一种用户反馈信息分析设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号或字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1
如图1所示,本实施例提供了一种用户反馈信息分析方法,该方法包括步骤S1、步骤S2、步骤S3、步骤S4、步骤S5和步骤S6。
步骤S1、获取所述用户反馈信息,所述用户反馈信息包括第一通话音频信息和第二通话音频信息,所述第一通话音频信息包括人工标注过问题分类的通话音频信息,所述第二通话音频信息包括人工未标注过问题分类的通话音频信息;
步骤S2、将所述第一通话音频信息和第二通话音频信息分别转为文本信息,得到第一文本信息和第二文本信息;
步骤S3、将所述第一文本信息和第二文本信息分别进行文本向量化处理,得到第一数据和第二数据;
步骤S4、利用所述第一数据对朴素贝叶斯分类器模型进行训练,得到训练后的朴素贝叶斯模型;
步骤S5、利用所述训练后的朴素贝叶斯分类器模型对所述第一数据和第二数据中存在的问题进行分类标注,得到分类标注的结果,根据所述结果得到各类问题的统计数据;
步骤S6、根据所述统计数据,计算各类问题的比例,生成用户反馈信息数据分析表。
本实施例中,现有的通话记录的标注分类是由人工完成的,这种做法存在两个问题:首先,由于工作量的问题,人工标记存在一定的漏标率;其次,目前只能对一个通话记录归属到一个分类。由于这两个问题,导致通话记录的标注是不完整不全面的,会直接影响运营分析的结果。通过上述步骤,利用模型进行分类标注后,一方面不会存在漏标,一方面可以对一个通话音频信息根据问题相关度给与多个问题分类,比如一个通话音频信息谈及多个问题,则标注时会标注多个问题分类。同时分类后的数据非常容易统计,统计之后可以为运营部门提出有价值的信息。
在本公开的一种具体实施方式中,所述步骤S5中,还可以利用所述训练后的朴素贝叶斯分类器模型对智能问答数据中存在的问题进行分类标注,所述智能问答数据为将智能问答信息进行文本向量化处理之后得到的。目前对于智能问答数据没有进行问题分类,如果靠人工的话,每天2000+的会话数量会带来沉重的成本。借助通话音频信息训练出的模型,作用于智能问答数据,可以很快将智能问答数据进行问题分类,减少大量的人工成本。
在本公开的一种具体实施方式中,所述步骤S1后,还可以包括步骤S11。
步骤S11、查询所述用户的历史反馈信息,根据所述历史反馈信息,判断用户当前的反馈是否可信,若判断结果为可信,则进入下一步,若判断结果为不可信,则将此条反馈信息删除。
本实施例中,通过步骤S11查询所述用户的历史反馈信息,可以提高用户反馈信息的精度,进而提高模型的精准性。
在本公开的一种具体实施方式中,所述步骤S3,还可以包括步骤S31和步骤S32。
步骤S31、基于所述第一文本信息中的出现的单词,生成字典,所述字典中每个所述单词均不相同;
步骤S32、为所述字典中的每一个单词分配一个唯一的数值,构建一个N*M的矩阵,所述N*M的矩阵即为第一数据,其中N代表所述第一文本信息中文本的数量,M代表所述字典中单词的数量。
在本公开的一种具体实施方式中,所述步骤S4后,还可以包括步骤S41和步骤S42。
步骤S41、将所述第一通话音频信息进行审核,得到审核后的第一通话音频信息;
步骤S42、将审核后的第一通话音频信息替换所述第一通话音频信息重新参与训练。
本实施例中,通过对所述第一通话音频信息进行审核,审核之后再次参与训练,可以确保不断改善模型质量。
在本公开的一种具体实施方式中,所述步骤S5后,还可以包括步骤S51、步骤S52和步骤S53。
步骤S51、根据各类问题的统计数据,得到统计数据中的最大值,将所述最大值对应的问题定义为出现次数最多的问题;
步骤S52、获取次数阈值,所述次数阈值包括所述出现次数最多的问题所对应的出现次数阈值;
步骤S53、判断所述最大值与所述次数阈值之间的关系,若所述最大值大于所述次数阈值,则发送第一控制命令,所述第一控制命令包括控制显示器显示出现次数最多的问题,以指示工作人员根据显示器的显示信息进行相应培训。
本实施例中,通过上述步骤可以得到用户最关心的问题,通过显示器显示出出现次数最多的问题,可以提醒相关的管理工作者对这类问题进行相应的培训,提高在通话的过程中,工作人员的回答准确性及回答效率,提高客户的满意度。
在本公开的一种具体实施方式中,所述步骤S5后,还可以包括步骤S54、步骤S55和步骤S56。
步骤S54、根据分类标注的结果,得到标注问题最多的数据;
步骤S56、根据所述标注问题最多的数据,得到第三通话音频信息,所述第三通话音频信息为根据所述标注问题最多的数据查找到的对应的通话音频信息;
步骤S57、发送第二控制命令,所述第二控制命令包括控制显示器显示所述第一信息,以指示工作人员根据显示器的显示信息查找接听所述第三通话音频信息的客服人员,并对其进行相应管理。
本实施例中,通过上述步骤可以得到接听问题最多的工作人员,可以对其进行相应的管理,比如邀请这位工作人员进行相关的经验分享,保证其他人员在遇到相同的情况下可以轻松的回答应对。
在本公开的一种具体实施方式中,所述步骤S6后,还可以包括步骤S7、步骤S8、步骤S9和步骤S10。
步骤S7、将所述用户反馈信息数据分析表导入数据库中;
步骤S8、将所述用户反馈信息数据分析表中各个问题及各个问题出现的次数与数据库中已有的问题及已有问题出现的次数进行统计分析,得到更新之后的数据库,其中若新导入的问题在已有的问题中存在,则更新此问题出现的次数,若新导入的问题在已有的问题中不存在,则新增此问题和此问题的出现的次数;
步骤S9、基于所述更新之后的数据库,根据预设的数据库问题选取个数,按照各个问题出现的次数大小依次选取相应的问题,得到问题集合;
步骤S10、将所述问题集合发送到智能问答系统中,替换所述智能问答系统中原有的问题。
本实施例中,通过上述步骤可以得到客户最关心的几类问题,将这几类问题发送到智能问答系统中,并在智能问答系统中添加这几类问题处理的对策,通过智能问答系统更新客户最关心的问题可以减少通话时间和通话次数,进而降低人工成本。
实施例2
如图2所示,本实施例提供了一种用户反馈信息分析装置,所述装置包括:第一获取模块701、转化模块702、处理模块703、训练模块704、标注模块705和计算模块706。
所述第一获取模块701,用于获取所述用户反馈信息,所述用户反馈信息包括第一通话音频信息和第二通话音频信息,所述第一通话音频信息包括人工标注过问题分类的通话音频信息,所述第二通话音频信息包括人工未标注过问题分类的通话音频信息;
所述转化模块702,用于将所述第一通话音频信息和第二通话音频信息分别转为文本信息,得到第一文本信息和第二文本信息;
所述处理模块703,用于将所述第一文本信息和第二文本信息分别进行文本向量化处理,得到第一数据和第二数据;
所述训练模块704,用于利用所述第一数据对朴素贝叶斯分类器模型进行训练,得到训练后的朴素贝叶斯模型;
所述标注模块705,用于利用所述训练后的朴素贝叶斯分类器模型对所述第一数据和第二数据中存在的问题进行分类标注,得到分类标注的结果,根据所述结果得到各类问题的统计数据;
所述计算模块706,用于根据所述统计数据,计算各类问题的比例,生成用户反馈信息数据分析表。
本实施例中,通过本装置进行分类标注后,可以避免出现漏标问题,同时还可以提高标注的准确性和全面性;同时生成的用户反馈信息数据分析表可以为运营部门提出有价值的信息,帮助运营部门做出相应决策。
在本公开的一种具体实施方式中,所述所述第一获取模块701还包括查询单元7011。
所述查询单元7011,用于查询所述用户的历史反馈信息,根据所述历史反馈信息,判断用户当前的反馈是否可信,若判断结果为可信,则进入下一步,若判断结果为不可信,则将此条反馈信息删除。
在本公开的一种具体实施方式中,所述处理模块703包括生成单元7031和构建单元7032。
所述生成单元7031,用于基于所述第一文本信息中的出现的单词,生成字典,所述字典中每个所述单词均不相同;
所述构建单元7032,用于为所述字典中的每一个单词分配一个唯一的数值,构建一个N*M的矩阵,所述N*M的矩阵即为第一数据,其中N代表所述第一文本信息中文本的数量,M代表所述字典中单词的数量。
在本公开的一种具体实施方式中,所述装置还包括审核模块707和替换模块708。
所述审核模块707,用于将所述第一通话音频信息进行审核,得到审核后的第一通话音频信息;
所述替换模块708,用于将审核后的第一通话音频信息替换所述第一通话音频信息重新参与训练。
本实施例中,本装置通过将进行审核后的第一通话音频信息重新参与训练,可以提高模型的准确性。
在本公开的一种具体实施方式中,所述装置还包括统计模块709、第二获取模块710和判断模块711。
所述统计模块709,用于根据各类问题的统计数据,得到统计数据中的最大值,将所述最大值对应的问题定义为出现次数最多的问题;
所述第二获取模块710,用于获取次数阈值,所述次数阈值包括所述出现次数最多的问题所对应的出现次数阈值;
所述判断模块711,用于判断所述最大值与所述次数阈值之间的关系,若所述最大值大于所述次数阈值,则发送第一控制命令,所述第一控制命令包括控制显示器显示出现次数最多的问题,以指示工作人员根据显示器的显示信息进行相应培训。
在本公开的一种具体实施方式中,所述装置还包括分类模块712、查找模块713和显示模块714。
所述分类模块712,用于根据分类标注的结果,得到标注问题最多的数据;
所述查找模块713,用于根据所述标注问题最多的数据,得到第三通话音频信息,所述第三通话音频信息为根据所述标注问题最多的数据查找到的对应的通话音频信息;
所述显示模块714,用于发送第二控制命令,所述第二控制命令包括控制显示器显示所述第一信息,以指示工作人员根据显示器的显示信息查找接听所述第三通话音频信息的客服人员,并对其进行相应管理。
在本公开的一种具体实施方式中,所述装置还包括导入模块715、更新模块716、选取模块717和发送模块718。
所述导入模块715,用于将所述用户反馈信息数据分析表导入数据库中;
所述更新模块716,用于将所述用户反馈信息数据分析表中各个问题及各个问题出现的次数与数据库中已有的问题及已有问题出现的次数进行统计分析,得到更新之后的数据库,其中若新导入的问题在已有的问题中存在,则更新此问题出现的次数,若新导入的问题在已有的问题中不存在,则新增此问题和此问题的出现的次数;
所述选取模块717,用于基于所述更新之后的数据库,根据预设的数据库问题选取个数,按照各个问题出现的次数大小依次选取相应的问题,得到问题集合;
所述发送模块718,用于将所述问题集合发送到智能问答系统中,替换所述智能问答系统中原有的问题。
本实施例中,通过本装置可以得到客户最关心的几类问题,将这几类问题发送到智能问答系统中,并在智能问答系统中添加这几类问题处理的对策,通过智能问答系统更新客户最关心的问题可以减少通话时间和通话次数,进而降低人工成本。
需要说明的是,关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例3
相应于上面的方法实施例,本公开实施例还提供了一种用户反馈信息分析设备,下文描述的一种用户反馈信息分析设备与上文描述的一种用户反馈信息分析方法可相互对应参照。
图3是根据一示例性实施例示出的一种用户反馈信息分析设备800的框图。如图3所示,该用户反馈信息分析设备800可以包括:处理器801,存储器802。该用户反馈信息分析设备800还可以包括多媒体组件803,输入/输出(I/O)接口804,以及通信组件805中的一者或多者。
其中,处理器801用于控制该用户反馈信息分析设备800的整体操作,以完成上述的用户反馈信息分析方法中的全部或部分步骤。存储器402用于存储各种类型的数据以支持在该用户反馈信息分析设备800的操作,这些数据例如可以包括用于在该用户反馈信息分析设备800上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random AccessMemory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable ProgrammableRead-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable ProgrammableRead-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口804为处理器801和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该用户反馈信息分析设备800与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件805可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,该用户反馈信息分析设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal ProcessingDevice,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的用户反馈信息分析方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的用户反馈信息分析方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器802,上述程序指令可由该用户反馈信息分析设备800的处理器801执行以完成上述的用户反馈信息分析的方法。
实施例4
相应于上面的方法实施例,本公开实施例还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种用户反馈信息分析方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的用户反馈信息分析方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用户反馈信息分析方法,其特征在于,包括:
获取所述用户反馈信息,所述用户反馈信息包括第一通话音频信息和第二通话音频信息,所述第一通话音频信息包括人工标注过问题分类的通话音频信息,所述第二通话音频信息包括人工未标注过问题分类的通话音频信息;
将所述第一通话音频信息和第二通话音频信息分别转为文本信息,得到第一文本信息和第二文本信息;
将所述第一文本信息和第二文本信息分别进行文本向量化处理,得到第一数据和第二数据;
利用所述第一数据对朴素贝叶斯分类器模型进行训练,得到训练后的朴素贝叶斯模型;
利用所述训练后的朴素贝叶斯分类器模型对所述第一数据和第二数据中存在的问题进行分类标注,得到分类标注的结果,根据所述结果得到各类问题的统计数据;
根据所述统计数据,计算各类问题的比例,生成用户反馈信息数据分析表。
2.根据权利要求1所述的用户反馈信息分析方法,其特征在于,所述获取所述用户反馈信息后,还包括:
查询所述用户的历史反馈信息,根据所述历史反馈信息,判断用户当前的反馈是否可信,若判断结果为可信,则进入下一步,若判断结果为不可信,则将此条反馈信息删除。
3.根据权利要求1所述的用户反馈信息分析方法,其特征在于,所述利用所述训练后的朴素贝叶斯分类器模型对所述第一数据和第二数据中存在的问题进行分类标注,得到分类标注的结果,根据所述结果得到各类问题的统计数据后,还包括:
根据各类问题的统计数据,得到统计数据中的最大值,将所述最大值对应的问题定义为出现次数最多的问题;
获取次数阈值,所述次数阈值包括所述出现次数最多的问题所对应的出现次数阈值;
判断所述最大值与所述次数阈值之间的关系,若所述最大值大于所述次数阈值,则发送第一控制命令,所述第一控制命令包括控制显示器显示出现次数最多的问题,以指示工作人员根据显示器的显示信息进行相应培训。
4.根据权利要求1所述的用户反馈信息分析方法,其特征在于,所述根据所述统计数据,计算各类问题的比例,生成用户反馈信息数据分析表后,还包括:
将所述用户反馈信息数据分析表导入数据库中;
将所述用户反馈信息数据分析表中各个问题及各个问题出现的次数与数据库中已有的问题及已有问题出现的次数进行统计分析,得到更新之后的数据库,其中若新导入的问题在已有的问题中存在,则更新此问题出现的次数,若新导入的问题在已有的问题中不存在,则新增此问题和此问题的出现的次数;
基于所述更新之后的数据库,根据预设的数据库问题选取个数,按照各个问题出现的次数大小依次选取相应的问题,得到问题集合;
将所述问题集合发送到智能问答系统中,替换所述智能问答系统中原有的问题。
5.一种用户反馈信息分析装置,其特征在于,包括:
第一获取模块,用于获取所述用户反馈信息,所述用户反馈信息包括第一通话音频信息和第二通话音频信息,所述第一通话音频信息包括人工标注过问题分类的通话音频信息,所述第二通话音频信息包括人工未标注过问题分类的通话音频信息;
转化模块,用于将所述第一通话音频信息和第二通话音频信息分别转为文本信息,得到第一文本信息和第二文本信息;
处理模块,用于将所述第一文本信息和第二文本信息分别进行文本向量化处理,得到第一数据和第二数据;
训练模块,用于利用所述第一数据对朴素贝叶斯分类器模型进行训练,得到训练后的朴素贝叶斯模型;
标注模块,用于利用所述训练后的朴素贝叶斯分类器模型对所述第一数据和第二数据中存在的问题进行分类标注,得到分类标注的结果,根据所述结果得到各类问题的统计数据;
计算模块,用于根据所述统计数据,计算各类问题的比例,生成用户反馈信息数据分析表。
6.根据权利要求5所述的用户反馈信息分析装置,其特征在于,所述第一获取模块,包括:
查询单元,用于查询所述用户的历史反馈信息,根据所述历史反馈信息,判断用户当前的反馈是否可信,若判断结果为可信,则进入下一步,若判断结果为不可信,则将此条反馈信息删除。
7.根据权利要求5所述的用户反馈信息分析装置,其特征在于,所述装置,还包括:
统计模块,用于根据各类问题的统计数据,得到统计数据中的最大值,将所述最大值对应的问题定义为出现次数最多的问题;
第二获取模块,用于获取次数阈值,所述次数阈值包括所述出现次数最多的问题所对应的出现次数阈值;
判断模块,用于判断所述最大值与所述次数阈值之间的关系,若所述最大值大于所述次数阈值,则发送第一控制命令,所述第一控制命令包括控制显示器显示出现次数最多的问题,以指示工作人员根据显示器的显示信息进行相应培训。
8.根据权利要求5所述的用户反馈信息分析装置,其特征在于,所述装置,还包括:
导入模块,用于将所述用户反馈信息数据分析表导入数据库中;
更新模块,用于将所述用户反馈信息数据分析表中各个问题及各个问题出现的次数与数据库中已有的问题及已有问题出现的次数进行统计分析,得到更新之后的数据库,其中若新导入的问题在已有的问题中存在,则更新此问题出现的次数,若新导入的问题在已有的问题中不存在,则新增此问题和此问题的出现的次数;
选取模块,用于基于所述更新之后的数据库,根据预设的数据库问题选取个数,按照各个问题出现的次数大小依次选取相应的问题,得到问题集合;
发送模块,用于将所述问题集合发送到智能问答系统中,替换所述智能问答系统中原有的问题。
9.一种用户反馈信息分析设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述用户反馈信息分析方法的步骤。
10.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述用户反馈信息分析方法的步骤。
CN202110151615.4A 2021-02-03 2021-02-03 一种用户反馈信息分析方法、装置、设备及可读存储介质 Active CN112966071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110151615.4A CN112966071B (zh) 2021-02-03 2021-02-03 一种用户反馈信息分析方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110151615.4A CN112966071B (zh) 2021-02-03 2021-02-03 一种用户反馈信息分析方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN112966071A CN112966071A (zh) 2021-06-15
CN112966071B true CN112966071B (zh) 2023-09-08

Family

ID=76274899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110151615.4A Active CN112966071B (zh) 2021-02-03 2021-02-03 一种用户反馈信息分析方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112966071B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127042A (zh) * 2007-09-21 2008-02-20 浙江大学 一种基于语言模型的情感分类方法
JP2016133956A (ja) * 2015-01-19 2016-07-25 株式会社デンソーアイティーラボラトリ 形態素解析モデル生成装置、形態素解析モデル生成方法、及び、プログラム
CN106598947A (zh) * 2016-12-15 2017-04-26 山西大学 一种基于同义词扩展的贝叶斯词义消歧方法
CN107169001A (zh) * 2017-03-31 2017-09-15 华东师范大学 一种基于众包反馈和主动学习的文本分类模型优化方法
CN109074502A (zh) * 2018-07-26 2018-12-21 深圳前海达闼云端智能科技有限公司 训练人工智能模型的方法、装置、存储介质及机器人
CN109460462A (zh) * 2018-11-15 2019-03-12 中通天鸿(北京)通信科技股份有限公司 一种中文相似问题生成系统与方法
CN110309216A (zh) * 2019-05-10 2019-10-08 焦点科技股份有限公司 一种基于文本分类的客服语音质检方法
CN110399490A (zh) * 2019-07-17 2019-11-01 武汉斗鱼网络科技有限公司 一种弹幕文本分类方法、装置、设备及存储介质
CN110737700A (zh) * 2019-10-16 2020-01-31 百卓网络科技有限公司 一种基于贝叶斯算法的进销存用户分类方法及系统
CN111291168A (zh) * 2018-12-07 2020-06-16 北大方正集团有限公司 图书检索方法、装置及可读存储介质
CN111341305A (zh) * 2020-03-05 2020-06-26 苏宁云计算有限公司 一种音频数据标注方法、装置及系统
CN111783873A (zh) * 2020-06-30 2020-10-16 中国工商银行股份有限公司 基于增量朴素贝叶斯模型的用户画像方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI396184B (zh) * 2009-09-17 2013-05-11 Tze Fen Li 一種語音辨認所有語言及用語音輸入單字的方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127042A (zh) * 2007-09-21 2008-02-20 浙江大学 一种基于语言模型的情感分类方法
JP2016133956A (ja) * 2015-01-19 2016-07-25 株式会社デンソーアイティーラボラトリ 形態素解析モデル生成装置、形態素解析モデル生成方法、及び、プログラム
CN106598947A (zh) * 2016-12-15 2017-04-26 山西大学 一种基于同义词扩展的贝叶斯词义消歧方法
CN107169001A (zh) * 2017-03-31 2017-09-15 华东师范大学 一种基于众包反馈和主动学习的文本分类模型优化方法
CN109074502A (zh) * 2018-07-26 2018-12-21 深圳前海达闼云端智能科技有限公司 训练人工智能模型的方法、装置、存储介质及机器人
CN109460462A (zh) * 2018-11-15 2019-03-12 中通天鸿(北京)通信科技股份有限公司 一种中文相似问题生成系统与方法
CN111291168A (zh) * 2018-12-07 2020-06-16 北大方正集团有限公司 图书检索方法、装置及可读存储介质
CN110309216A (zh) * 2019-05-10 2019-10-08 焦点科技股份有限公司 一种基于文本分类的客服语音质检方法
CN110399490A (zh) * 2019-07-17 2019-11-01 武汉斗鱼网络科技有限公司 一种弹幕文本分类方法、装置、设备及存储介质
CN110737700A (zh) * 2019-10-16 2020-01-31 百卓网络科技有限公司 一种基于贝叶斯算法的进销存用户分类方法及系统
CN111341305A (zh) * 2020-03-05 2020-06-26 苏宁云计算有限公司 一种音频数据标注方法、装置及系统
CN111783873A (zh) * 2020-06-30 2020-10-16 中国工商银行股份有限公司 基于增量朴素贝叶斯模型的用户画像方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种具有分类细化功能的垃圾语言识别方法;李小娇等;《 郑州轻工业学院学报(自然科学版) 》;第94-97页,第108页 *

Also Published As

Publication number Publication date
CN112966071A (zh) 2021-06-15

Similar Documents

Publication Publication Date Title
US20230385321A1 (en) Systems and methods for processing a natural language query in data tables
CN109859829B (zh) 一种基于微信公众平台的医疗设备报修系统及其运行方法
TW202133005A (zh) 在線資料採集的方法及系統
CN109766368B (zh) 一种基于Hive的数据查询多类型视图产出系统及方法
CN108628609A (zh) 一种利用问卷处理业务的方法及装置
US20230259824A1 (en) Automatic generation of an explanation, based on data lineage and user feedback, of a prediction produced by a machine learning system
CN116910561A (zh) 数据集构建的方法和服务器
CN101000624A (zh) 实现数据挖掘模型转换和应用的方法、系统及装置
CN112926941A (zh) 财务稽核规则的管理方法、装置、存储介质及服务器
CN111723515A (zh) 一种运行算子的方法、装置及系统
US20230252978A1 (en) Systems and methods of material compliance
TW202036323A (zh) 智能線上客服匯流核心系統
CN101710927B (zh) 基于语音平台提供信息服务的方法和系统
CN112825161A (zh) 产品良率预测方法、装置、计算机装置及存储介质
CN109710747B (zh) 信息处理方法、装置及电子设备
CN109120613B (zh) 通讯数据的监控方法和系统
CN112966071B (zh) 一种用户反馈信息分析方法、装置、设备及可读存储介质
CN112199488B (zh) 面向电力客服问答的渐增式知识图谱实体抽取方法和系统
CN107943835A (zh) 一种用于电力系统的报送数据自动分析与归类系统
CN115168603B (zh) 一种彩铃业务流程自动反馈应答方法、装置及存储介质
CN111061855A (zh) 答复内容的生成方法和装置、在线聊天的处理方法以及电子设备
CN112765254B (zh) 实现数据可视化及数据整合etl的解决方法及系统
CN111625616B (zh) 一种能够海量存储的企业级的数据管理系统
CN114500215B (zh) 存储设备的集中管理方法、装置、设备及可读存储介质
CN110955754A (zh) 一种用于重复来电分析识别的模型构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant