CN113407718A - 题库的生成方法、装置、计算机可读存储介质及处理器 - Google Patents

题库的生成方法、装置、计算机可读存储介质及处理器 Download PDF

Info

Publication number
CN113407718A
CN113407718A CN202110640184.8A CN202110640184A CN113407718A CN 113407718 A CN113407718 A CN 113407718A CN 202110640184 A CN202110640184 A CN 202110640184A CN 113407718 A CN113407718 A CN 113407718A
Authority
CN
China
Prior art keywords
hot spot
question
hotspot
data
questions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110640184.8A
Other languages
English (en)
Inventor
李健
谢园园
陈明
武卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sinovoice Technology Co Ltd
Original Assignee
Beijing Sinovoice Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sinovoice Technology Co Ltd filed Critical Beijing Sinovoice Technology Co Ltd
Priority to CN202110640184.8A priority Critical patent/CN113407718A/zh
Publication of CN113407718A publication Critical patent/CN113407718A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • G06Q50/2057Career enhancement or continuing education service
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种题库的生成方法、装置、计算机可读存储介质及处理器。其中,该方法包括:获取的热点问题数据;对热点问题数据中的热点问题进行分类,得到分类结果;依据分类结果和热点问题数据,生成目标题库,其中,目标题库包括:不同类型的热点问题以及热点问题对应的答案。本发明解决了现有技术中的客服培训通常采用手动的出题,无法快速智能化的生成用于客服人员练习的题库的技术问题。

Description

题库的生成方法、装置、计算机可读存储介质及处理器
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种题库的生成方法、装置、计算机可读存储介质及处理器。
背景技术
当前,提高座席话务品质与服务水平越来越被企业重视,内部培训工作已经成为突破发展瓶颈、寻求发展蓝海的“利器”。然而我们发现,由于企业业务更新快、新业务内容多而复杂、客服中心人员规模庞大等问题,导致培训的工作量日益增大,同时,在本企业培养晋升的内部培训师由于缺乏培训经验,也增加了培训难度。
另外,大部分的培训都是通过手动的出题,通过和人工坐席的模拟对话对人工坐席的话术进行评分,对其缺点进行优化培训,该方式无法快速有效的提升坐席的服务水平,因为手动出题的模式很难精准定位到客户会问的问题。
针对上述现有技术中的客服培训通常采用手动的出题,无法快速智能化的生成用于客服人员练习的题库的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种题库的生成方法、装置、计算机可读存储介质及处理器,以至少解决现有技术中的客服培训通常采用手动的出题,无法快速智能化的生成用于客服人员练习的题库的技术问题。
根据本发明实施例的一个方面,提供了一种题库的生成方法,包括:获取的热点问题数据;对所述热点问题数据中的热点问题进行分类,得到分类结果;依据所述分类结果和所述热点问题数据,生成目标题库,其中,所述目标题库包括:不同类型的所述热点问题以及所述热点问题对应的答案。
可选地,获取的热点问题数据,包括:按照预设时间周期获取至少一个热点问题以及所述至少一个热点问题对应的答案;将所述至少一个热点问题以及所述至少一个热点问题对应的答案确定为所述热点问题数据。
可选地,获取至少一个热点问题,包括:获取多个问题的命中次数;依据所述命中次数对所述多个问题进行排序,得到所述多个问题的排名序列;从所述排名序列中筛选出排名大于或者等于预设排名阈值的问题,得到所述至少一个热点问题。
可选地,将所述至少一个热点问题以及所述至少一个热点问题对应的答案确定为所述热点问题数据,包括:判断热点问题以及所述热点问题对应的答案是否已经记录为热点问题数据;若所述热点问题以及所述热点问题对应的答案已经记录为所述热点问题数据,则删除所述热点问题以及所述热点问题对应的答案;若所述热点问题以及所述热点问题对应的答案未记录为所述热点问题数据,则添加所述热点问题以及所述热点问题对应的答案作为所述热点问题数据。
可选地,在获取的热点问题数据之后,以及在对所述热点问题数据中的热点问题进行分类,得到分类结果之前,还包括:对所述热点问题数据中的热点问题进行文本预处理,得到文本预处理后的热点问题;提取所述文本预处理后的热点问题的关键词,并依据所述关键词对所述热点问题数据中的热点问题的进行标识,以使不同的标识对应不同类型的热点问题;基于不同类型的热点问题生成对应的扩展问,其中,每一个所述热点问题作为一个标准问,且所述标准问对应至少一个扩展问。
可选地,对所述热点问题数据中的热点问题进行文本预处理,得到文本预处理后的热点问题,包括:依据停用词和/或分词词库对所述热点问题数据中的热点问题进行文本预处理,得到所述文本预处理后的热点问题。
可选地,依据所述分类结果和所述热点问题数据,生成目标题库,包括:对所述分类结果和所述热点问题数据进行聚类处理,得到聚类结果;依据所述聚类结果,生成所述目标题库。
根据本发明实施例的另一方面,还提供了一种题库的生成装置,包括:获取模块,用于获取的热点问题数据;分类模块,用于对所述热点问题数据中的热点问题进行分类,得到分类结果;第一生成模块,用于依据所述分类结果和所述热点问题数据,生成目标题库,其中,所述目标题库包括:不同类型的所述热点问题以及所述热点问题对应的答案。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行上述中任意一项所述的题库的生成方法。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的题库的生成方法。
在本发明实施例中,采用获取的热点问题数据;对所述热点问题数据中的热点问题进行分类,得到分类结果;依据所述分类结果和所述热点问题数据,生成目标题库,其中,所述目标题库包括:不同类型的所述热点问题以及所述热点问题对应的答案,通过对热点问题进行分类,并结合热点问题数据,生成不同类型的题库,达到了自动生成不同类型的热点题库的目的,从而实现了智能化的形成不同分类的价值高、有针对性训练的题库,有利于客服人员快速的提升自己的业务水平的技术效果,进而解决了现有技术中的客服培训通常采用手动的出题,无法快速智能化的生成用于客服人员练习的题库的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的题库的生成方法的流程图;
图2是根据本发明实施例的题库的生成装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种题库的生成方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的题库的生成方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取的热点问题数据;
在具体实施过程中,上述热点问题数据包括但不限于热点问题及其对应的答案。
步骤S104,对热点问题数据中的热点问题进行分类,得到分类结果;
步骤S106,依据分类结果和热点问题数据,生成目标题库,其中,目标题库包括:不同类型的热点问题以及热点问题对应的答案。
上述分类结果包括不同的热点问题所对应的类别,可以依据分类结果对热点问题数据进行划分,从而得到不同类别的题库。
需要说明的是,上述方法可以应用于智能培训机器人,从而可以基于智能培训机器人这一载体实现将热点问题自动生成不同类型的热点题库,该题库可以用于日常业务人员、坐席人员等的考试试题。
通过上述步骤,可以实现通过对热点问题进行分类,并结合热点问题数据,生成不同类型的题库,达到了自动生成不同类型的热点题库的目的,从而实现了智能化的形成不同分类的价值高、有针对性训练的题库,有利于客服人员快速的提升自己的业务水平的技术效果,进而解决了现有技术中的客服培训通常采用手动的出题,无法快速智能化的生成用于客服人员练习的题库的技术问题。
可选地,获取的热点问题数据,包括:按照预设时间周期获取至少一个热点问题以及至少一个热点问题对应的答案;将至少一个热点问题以及至少一个热点问题对应的答案确定为热点问题数据。
上述预设时间周期可以根据具体应用场景而设定,例如,预设时间周期可以为一天、一周、一个月、半年等;
在一种可选的实施方式中,为了使热点问题数据更加符合用户需求,可以按照预先设置的时间周期获取一个热点问题以及该热点问题对应的答案,并将一个热点问题以及该热点问题对应的答案作为热点问题数据;还可以按照预先设置的时间周期获取多个热点问题以及该多个热点问题对应的答案,并将多个热点问题以及该多个热点问题对应的答案作为热点问题数据。通过上述实施方式可以有效获取某一时间范围内的热点问题数据。
需要说明的是,上述至少一个热点问题以及至少一个热点问题对应的答案的来源包括但不限于智能客服、智能语音导航、坐席辅助等系统。
可选地,获取至少一个热点问题,包括:获取多个问题的命中次数;依据命中次数对多个问题进行排序,得到多个问题的排名序列;从排名序列中筛选出排名大于或者等于预设排名阈值的问题,得到至少一个热点问题。
在获取热点问题的过程中,并不是任何问题都是热点问题,为了更好的筛选出热点问题,可以分别获取多个问题的命中次数,然后按照这些问题的命中次数从多到少进行排序,就能够得到多个问题的排名序列,其中,排名序列中命中次数最多的问题排在最前面,命中次数最少的问题排在最后面。需要说明的是,上述命中次数为问题被点击或者提及的次数。
上述预设排名阈值可以根据实际应用场景而设定,例如,预设排名阈值为5时,就可以从排名序列中筛选出排名大于或者等于5的问题,从而得到热点问题。另外,如果预设排名阈值大于或者等于排名序列中的问题数量,则排名序列中所有的问题均作为热点问题。通过利用命中次数排序得到的排名序列,并从排名序列中筛选出排名靠前的问题作为热点问题,可以实现不间断地或者周期性的更新热点问题。
可选地,将至少一个热点问题以及至少一个热点问题对应的答案确定为热点问题数据,包括:判断热点问题以及热点问题对应的答案是否已经记录为热点问题数据;若热点问题以及热点问题对应的答案已经记录为热点问题数据,则删除热点问题以及热点问题对应的答案;若热点问题以及热点问题对应的答案未记录为热点问题数据,则添加热点问题以及热点问题对应的答案作为热点问题数据。
在将至少一个热点问题以及至少一个热点问题对应的答案确定为热点问题数据过程中,还需要判断热点问题以及热点问题对应的答案是否已经记录为热点问题数据,在该热点问题以及该热点问题对应的答案已经记录为热点问题数据的情况下,需要删除该热点问题以及该热点问题对应的答案;在热点问题以及热点问题对应的答案未记录为热点问题数据,需要添加该热点问题以及该热点问题对应的答案作为热点问题数据。
通过上述实施方式可以对热点问题数据进行去重和更新,避免了同一热点问题数据被多次记录的问题。
需要说明的是,上述热点问题数据可以存储在服务器、云端以及机器人数据库中。
可选地,在获取的热点问题数据之后,以及在对热点问题数据中的热点问题进行分类,得到分类结果之前,还包括:对热点问题数据中的热点问题进行文本预处理,得到文本预处理后的热点问题;提取文本预处理后的热点问题的关键词,并依据关键词对热点问题数据中的热点问题的进行标识,以使不同的标识对应不同类型的热点问题;基于不同类型的热点问题生成对应的扩展问,其中,每一个热点问题作为一个标准问,且标准问对应至少一个扩展问。
上述文本预处理包括但不限于文本分词、文本词过滤等,其中,文本分词主要用于对热点问题的进行词语切分,切分结果以空格符分割两个相邻的词语,以方便后续的文本分析工作;上述文本词过滤主要是对与热点问题中文本核心内容关系较弱的词语进行过滤,例如,一些弱词性的语气词、助词以及一些公共的停用词,从而剔除文本的冗余词语,保留文本中有效的词语信息。需要说明的是,上述热点问题以文本的方式实现后续分类。
上述提取文本预处理后的热点问题的关键词,主要是对文本中的关键词和关键词组进行提取,并可以设置提取词和词组的数量。
上述依据关键词对热点问题数据中的热点问题的进行标识包括:设置关键词对应的标识,其中,该标识的形式包括但不限于标签等,利用关键词对应的标识结合文本预处理后的热点问题的关键词,对热点问题数据中的热点问题的进行标识。通过不同的标识可以得到不同类型的热点问题。
另外,在得到不同类型的热点问题之后,可以生成不同类型的热点问题对应的扩展问。需要说明的是,每一个热点问题作为一个标准问,一个标准问对应一个或者多个扩展问,其中,一个或者多个扩展问的答案与其对应的标准问的答案是一样的。通过上述实施方式实现同样一个问题可以使用不同的问法,避免在实际应用中,同样一个问题,只是换个问法就不知道如何进行回答了的问题。
可选地,对热点问题数据中的热点问题进行文本预处理,得到文本预处理后的热点问题,包括:依据停用词和/或分词词库对热点问题数据中的热点问题进行文本预处理,得到文本预处理后的热点问题。
在一种可选的实施方式中,可以使用停用词和/或分词词库对热点问题数据中的热点问题进行文本预处理,进而得到文本预处理后的热点问题。需要说明的是,上述停用词、分词词库均可以根据应用场景而灵活设置。
可选地,依据分类结果和热点问题数据,生成目标题库,包括:对分类结果和热点问题数据进行聚类处理,得到聚类结果;依据聚类结果,生成目标题库。
在一种可选的实施方式中,可以采用聚类算法对分类结果和热点问题数据进行聚类处理,并依据聚类结果生成目标题库。上述聚类算法包括但不限于基于划分聚类算法、基于层次聚类算法、基于密度的聚类算法、基于网格聚类算法以及基于模型聚类算法等。例如,基于划分聚类算法可以为K-means:它的一个聚类的中心来代表一个簇,即在迭代过程中选择聚点不一定是聚类中的一个点;基于层次聚类算法可以为CURE:采用抽样技术先对数据集随机抽取样本,再采用分区技术对样本进行分区,然后对每个分区局部聚类,最后对局部聚类进行全局聚类;基于密度的聚类算法可以为DBSCAN:采用空间索引技术来搜索对象的邻域,引入了“核心对象”和“密度可达”等概念,从核心对象出发,把所有密度可达的对象组成一个簇;基于网格聚类算法可以为STING:利用网格单元保存数据统计信息,从而实现多分辨率的聚类;基于模型聚类算法可以为自组织神经网络SOM:由外界输入不同的样本到人工的自组织映射网络中,一开始时,输入样本引起输出兴奋细胞的位置各不相同,但自组织后会形成一些细胞群,它们分别代表了输入样本,反映了输入样本的特征。需要说明的是,在具体实施过程中,可以采用的聚类算法并不局限于上述例子中所描述的内容,在此不再一一赘述。
通过上述实施方式可以形成不同分类的价值高、有针对性训练的题库,用于客服人员快速的提升自己的业务水平。
实施例2
根据本发明实施例的另一方面,还提供了一种题库的生成装置,图2是根据本发明实施例的题库的生成装置的示意图,如图2所示,该题库的生成装置包括:获取模块22、分类模块24和第一生成模块26。下面对该题库的生成装置进行详细说明。
获取模块22,用于获取的热点问题数据;分类模块24,连接至上述获取模块22,用于对热点问题数据中的热点问题进行分类,得到分类结果;第一生成模块26,连接至上述分类模块24,用于依据分类结果和热点问题数据,生成目标题库,其中,目标题库包括:不同类型的热点问题以及热点问题对应的答案。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,例如,对于后者,可以通过以下方式实现:上述各个模块可以位于同一处理器中;和/或,上述各个模块以任意组合的方式位于不同的处理器中。
在上述实施例中,该题库的生成装置可以通过对热点问题进行分类,并结合热点问题数据,生成不同类型的题库,达到了自动生成不同类型的热点题库的目的,从而实现了智能化的形成不同分类的价值高、有针对性训练的题库,有利于客服人员快速的提升自己的业务水平的技术效果,进而解决了现有技术中的客服培训通常采用手动的出题,无法快速智能化的生成用于客服人员练习的题库的技术问题。
此处需要说明的是,上述获取模块22、分类模块24和第一生成模块26对应于实施例1中的步骤S102至S106,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
可选地,上述获取模块22包括:获取单元,用于按照预设时间周期获取至少一个热点问题以及至少一个热点问题对应的答案;确定单元,用于将至少一个热点问题以及至少一个热点问题对应的答案确定为热点问题数据。
可选地,上述获取单元包括:获取子单元,用于获取多个问题的命中次数;排序子单元,用于依据命中次数对多个问题进行排序,得到多个问题的排名序列;筛选子单元,用于从排名序列中筛选出排名大于或者等于预设排名阈值的问题,得到至少一个热点问题。
可选地,上述确定单元包括:判断子单元,用于判断热点问题以及热点问题对应的答案是否已经记录为热点问题数据;删除子单元,用于若热点问题以及热点问题对应的答案已经记录为热点问题数据,则删除热点问题以及热点问题对应的答案;添加子单元,用于若热点问题以及热点问题对应的答案未记录为热点问题数据,则添加热点问题以及热点问题对应的答案作为热点问题数据。
可选地,上述装置还包括:预处理模块,用于在获取的热点问题数据之后,以及在对热点问题数据中的热点问题进行分类,得到分类结果之前,对热点问题数据中的热点问题进行文本预处理,得到文本预处理后的热点问题;提取模块,用于提取文本预处理后的热点问题的关键词,并依据关键词对热点问题数据中的热点问题的进行标识,以使不同的标识对应不同类型的热点问题;第二生成模块,用于基于不同类型的热点问题生成对应的扩展问,其中,每一个热点问题作为一个标准问,且标准问对应至少一个扩展问。
可选地,上述预处理包括:预处理单元,用于依据停用词和/或分词词库对热点问题数据中的热点问题进行文本预处理,得到文本预处理后的热点问题。
可选地,上述第一生成模块26包括:聚类单元,用于对分类结果和热点问题数据进行聚类处理,得到聚类结果;生成单元,用于依据聚类结果,生成目标题库。
实施例3
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,该计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述中任意一项的题库的生成方法。
可选地,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,和/或位于移动终端群中的任意一个移动终端中,上述计算机可读存储介质包括存储的程序。
可选地,在程序运行时控制计算机可读存储介质所在设备执行以下功能:获取的热点问题数据;对热点问题数据中的热点问题进行分类,得到分类结果;依据分类结果和热点问题数据,生成目标题库,其中,目标题库包括:不同类型的热点问题以及热点问题对应的答案。
实施例4
根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述中任意一项的题库的生成方法。
本发明实施例提供了一种设备,该设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取的热点问题数据;对热点问题数据中的热点问题进行分类,得到分类结果;依据分类结果和热点问题数据,生成目标题库,其中,目标题库包括:不同类型的热点问题以及热点问题对应的答案。
本发明还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取的热点问题数据;对热点问题数据中的热点问题进行分类,得到分类结果;依据分类结果和热点问题数据,生成目标题库,其中,目标题库包括:不同类型的热点问题以及热点问题对应的答案。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种题库的生成方法,其特征在于,包括:
获取的热点问题数据;
对所述热点问题数据中的热点问题进行分类,得到分类结果;
依据所述分类结果和所述热点问题数据,生成目标题库,其中,所述目标题库包括:不同类型的所述热点问题以及所述热点问题对应的答案。
2.根据权利要求1所述的方法,其特征在于,获取的热点问题数据,包括:
按照预设时间周期获取至少一个热点问题以及所述至少一个热点问题对应的答案;
将所述至少一个热点问题以及所述至少一个热点问题对应的答案确定为所述热点问题数据。
3.根据权利要求2所述的方法,其特征在于,获取至少一个热点问题,包括:
获取多个问题的命中次数;
依据所述命中次数对所述多个问题进行排序,得到所述多个问题的排名序列;
从所述排名序列中筛选出排名大于或者等于预设排名阈值的问题,得到所述至少一个热点问题。
4.根据权利要求2所述的方法,其特征在于,将所述至少一个热点问题以及所述至少一个热点问题对应的答案确定为所述热点问题数据,包括:
判断热点问题以及所述热点问题对应的答案是否已经记录为热点问题数据;
若所述热点问题以及所述热点问题对应的答案已经记录为所述热点问题数据,则删除所述热点问题以及所述热点问题对应的答案;
若所述热点问题以及所述热点问题对应的答案未记录为所述热点问题数据,则添加所述热点问题以及所述热点问题对应的答案作为所述热点问题数据。
5.根据权利要求1所述的方法,其特征在于,在获取的热点问题数据之后,以及在对所述热点问题数据中的热点问题进行分类,得到分类结果之前,还包括:
对所述热点问题数据中的热点问题进行文本预处理,得到文本预处理后的热点问题;
提取所述文本预处理后的热点问题的关键词,并依据所述关键词对所述热点问题数据中的热点问题的进行标识,以使不同的标识对应不同类型的热点问题;
基于不同类型的热点问题生成对应的扩展问,其中,每一个所述热点问题作为一个标准问,且所述标准问对应至少一个扩展问。
6.根据权利要求5所述的方法,其特征在于,对所述热点问题数据中的热点问题进行文本预处理,得到文本预处理后的热点问题,包括:
依据停用词和/或分词词库对所述热点问题数据中的热点问题进行文本预处理,得到所述文本预处理后的热点问题。
7.根据权利要求1至6中任意一项所述的方法,其特征在于,依据所述分类结果和所述热点问题数据,生成目标题库,包括:
对所述分类结果和所述热点问题数据进行聚类处理,得到聚类结果;
依据所述聚类结果,生成所述目标题库。
8.一种题库的生成装置,其特征在于,包括:
获取模块,用于获取的热点问题数据;
分类模块,用于对所述热点问题数据中的热点问题进行分类,得到分类结果;
第一生成模块,用于依据所述分类结果和所述热点问题数据,生成目标题库,其中,所述目标题库包括:不同类型的所述热点问题以及所述热点问题对应的答案。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的题库的生成方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的题库的生成方法。
CN202110640184.8A 2021-06-08 2021-06-08 题库的生成方法、装置、计算机可读存储介质及处理器 Pending CN113407718A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110640184.8A CN113407718A (zh) 2021-06-08 2021-06-08 题库的生成方法、装置、计算机可读存储介质及处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110640184.8A CN113407718A (zh) 2021-06-08 2021-06-08 题库的生成方法、装置、计算机可读存储介质及处理器

Publications (1)

Publication Number Publication Date
CN113407718A true CN113407718A (zh) 2021-09-17

Family

ID=77683196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110640184.8A Pending CN113407718A (zh) 2021-06-08 2021-06-08 题库的生成方法、装置、计算机可读存储介质及处理器

Country Status (1)

Country Link
CN (1) CN113407718A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140119531A1 (en) * 2012-10-30 2014-05-01 Kenneth D. Tuchman Method for providing support using answer engine and dialog rules
CN105608199A (zh) * 2015-12-25 2016-05-25 上海智臻智能网络科技股份有限公司 用于智能问答系统中的标准问的扩展方法和装置
CN107038196A (zh) * 2016-11-28 2017-08-11 阿里巴巴集团控股有限公司 一种客服问题回答处理方法及装置
CN109033270A (zh) * 2018-07-09 2018-12-18 深圳追科技有限公司 一种基于人工客服日志自动构建客服知识库的方法
WO2019080417A1 (zh) * 2017-10-26 2019-05-02 平安科技(深圳)有限公司 基于海量问题的知识库构建方法、电子装置及存储介质
CN109858021A (zh) * 2019-01-02 2019-06-07 平安科技(深圳)有限公司 业务问题统计方法、装置、计算机设备及其存储介质
CN110096512A (zh) * 2019-05-05 2019-08-06 广东小天才科技有限公司 题库建立方法、装置、学习设备及存储介质
CN112053597A (zh) * 2020-10-13 2020-12-08 北京灵伴即时智能科技有限公司 人工坐席培训考核方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140119531A1 (en) * 2012-10-30 2014-05-01 Kenneth D. Tuchman Method for providing support using answer engine and dialog rules
CN105608199A (zh) * 2015-12-25 2016-05-25 上海智臻智能网络科技股份有限公司 用于智能问答系统中的标准问的扩展方法和装置
CN107038196A (zh) * 2016-11-28 2017-08-11 阿里巴巴集团控股有限公司 一种客服问题回答处理方法及装置
WO2019080417A1 (zh) * 2017-10-26 2019-05-02 平安科技(深圳)有限公司 基于海量问题的知识库构建方法、电子装置及存储介质
CN109033270A (zh) * 2018-07-09 2018-12-18 深圳追科技有限公司 一种基于人工客服日志自动构建客服知识库的方法
CN109858021A (zh) * 2019-01-02 2019-06-07 平安科技(深圳)有限公司 业务问题统计方法、装置、计算机设备及其存储介质
CN110096512A (zh) * 2019-05-05 2019-08-06 广东小天才科技有限公司 题库建立方法、装置、学习设备及存储介质
CN112053597A (zh) * 2020-10-13 2020-12-08 北京灵伴即时智能科技有限公司 人工坐席培训考核方法及系统

Similar Documents

Publication Publication Date Title
CN107229708B (zh) 一种个性化出行服务大数据应用系统及方法
CN107729468B (zh) 基于深度学习的答案抽取方法及系统
CN110019149A (zh) 一种客服知识库的建立方法、装置及设备
CN110209764A (zh) 语料标注集的生成方法及装置、电子设备、存储介质
CN109299271B (zh) 训练样本生成、文本数据、舆情事件分类方法及相关设备
CN106156365A (zh) 一种知识图谱的生成方法及装置
CN109002492B (zh) 一种基于LightGBM的绩点预测方法
CN111177322A (zh) 一种领域知识图谱的本体模型构建方法
CN109800354B (zh) 一种基于区块链存储的简历修改意图识别方法及系统
CN106886567A (zh) 基于语义扩展的微博突发事件检测方法及装置
CN111339277A (zh) 基于机器学习的问答交互方法及装置
US20190130030A1 (en) Generation method, generation device, and recording medium
CN110046943A (zh) 一种网络消费者细分的优化方法及优化系统
CN110968664A (zh) 一种文书检索方法、装置、设备及介质
CN115063035A (zh) 基于神经网络的客户评估方法、系统、设备及存储介质
CN110069686A (zh) 用户行为分析方法、装置、计算机装置及存储介质
CN106844743B (zh) 维吾尔语文本的情感分类方法及装置
CN108959577A (zh) 基于非主属性离群点检测的实体匹配方法和计算机程序
CN110377706B (zh) 基于深度学习的搜索语句挖掘方法及设备
CN114048294B (zh) 相似人群扩展模型训练方法、相似人群扩展方法和装置
CN113407718A (zh) 题库的生成方法、装置、计算机可读存储介质及处理器
CN112767933B (zh) 公路养护管理系统的语音交互方法、装置、设备及介质
CN110941638A (zh) 应用分类规则库构建方法、应用分类方法及装置
CN111061853B (zh) 一种快速获取faq模型训练语料的方法
CN114003706A (zh) 关键词组合生成模型训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination