CN110457448A - 问题推送方法、装置、计算机可读存储介质和计算机设备 - Google Patents

问题推送方法、装置、计算机可读存储介质和计算机设备 Download PDF

Info

Publication number
CN110457448A
CN110457448A CN201910598175.XA CN201910598175A CN110457448A CN 110457448 A CN110457448 A CN 110457448A CN 201910598175 A CN201910598175 A CN 201910598175A CN 110457448 A CN110457448 A CN 110457448A
Authority
CN
China
Prior art keywords
node
related information
trouble
database
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910598175.XA
Other languages
English (en)
Inventor
朱涛
王剑辉
罗剑波
毕姚姚
彭建博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weimin Insurance Agency Co Ltd
Original Assignee
Weimin Insurance Agency Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weimin Insurance Agency Co Ltd filed Critical Weimin Insurance Agency Co Ltd
Priority to CN201910598175.XA priority Critical patent/CN110457448A/zh
Publication of CN110457448A publication Critical patent/CN110457448A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种问题推送方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取输入的问题;在问答数据库中确定与所述问题相对应的问题节点;获取所述问题节点与所述问答数据库中其它的问题节点之间的关联信息,所述关联信息包括转移概率或跳转概率中的至少一个;根据所述关联信息在所述其它的问题节点中确定待推送问题。本申请提供的方案可以实现推送问题与用户输入的问题有关联,提高推送问题的准确性。

Description

问题推送方法、装置、计算机可读存储介质和计算机设备
技术领域
本申请涉及计算机互联网技术领域,特别是涉及一种问题推送方法、装置、计算机可读存储介质和计算机设备。
背景技术
随着FAQ(Frequently Asked Questions,常见问题解答)的发展,出现了智能客服机器人,智能客服机器人可根据用户输入的问题输出回答,并且也会输出推送问题,以引导用户进一步了解相关内容。
然而,推送问题一般是人工统计的高频问题,一般与用户输入的问题没有关联,导致推送问题准确性低。
发明内容
基于此,有必要针对推送问题准确性低的技术问题,提供一种问题推送方法、装置、计算机可读存储介质和计算机设备。
一种问题推送方法,包括:
获取输入的问题;
在问答数据库中确定与所述问题相对应的问题节点;
获取所述问题节点与所述问答数据库中其它的问题节点之间的关联信息,所述关联信息包括转移概率或跳转概率中的至少一个;
根据所述关联信息在所述其它的问题节点中确定待推送问题。
一种问题推送装置,所述装置包括:
获取模块,用于获取输入的问题;
确定模块,用于在问答数据库中确定与所述问题相对应的问题节点;
所述获取模块,还用于获取所述问题节点与所述问答数据库中其它的问题节点之间的关联信息,所述关联信息包括转移概率或跳转概率中的至少一个;
所述确定模块,还用于根据所述关联信息在所述其它的问题节点中确定待推送问题。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述问题推送方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述问题推送方法的步骤。
上述问题推送方法、装置、计算机可读存储介质和计算机设备,预先设置问答数据库,问答数据库中包括问题节点和问题节点之间的关联信息,以在获取到用户输入的问题时,确定用户输入的问题对应的问题节点,通过该问题节点与其它的问题节点之间的关联信息,在其它的问题节点中确定待推送问题,使得推送问题与用户输入的问题有关联,提高了推送问题的准确性。
附图说明
图1为一个实施例中问题推送方法的应用环境图;
图2为一个实施例中问题推送方法的流程示意图;
图3为一个实施例中问题推送方法的界面示意图;
图4为一个实施例中深度匹配网络示意图;
图5为一个实施例中二分类模型示意图;
图6为又一个实施例中问题推送方法的流程示意图;
图7为再一个实施例中问题推送方法的流程示意图;
图8为另一个实施例中问题推送方法的流程示意图;
图9为另一个实施例中问题推送装置的结构框图;
图10为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中问题推送方法的应用环境图。参照图1,该问题推送方法应用于问题推送系统,该问题推送系统包括终端102和服务器104。终端102和服务器104通过网络连接。终端102具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,在一个实施例中,提供了一种问题推送方法。本实施例主要以该方法应用于上述图1中的终端102(或服务器104)来举例说明。参照图2,该问题推送方法具体包括如下步骤:
步骤202,获取输入的问题。
其中,输入的问题可为用户在应用界面通过文字、语音等方式输入的问题,也可点击应用界面中的展示的推送问题。比如,如图3所示的应用界面,用户可基于应用界面下方的输入区域输入文字、语音等,也可直接点击应用界面中的推送问题,比如“保单在哪里查收”。
步骤204,在问答数据库中确定与所述问题相对应的问题节点。
其中,问答数据库是预先建立的数据库,问答数据库中具有通过大量的会话数据统计得到的问题节点,这些问题节点涵盖了用户关注的大部分问题。
其中,会话数据是指记录的用户与人工客服之间的历史交互数据,或者用户与机器人之间的历史交互数据。比如,在一会话框中,用户输入问题,人工客服基于用户输入的问题输出答案,问题数据和答案数据均为会话数据。首先,在会话数据中可获得用户关注的问题,其次,由于答案是人工客服针对用户的问题给出的,因此答案较为准确,故利用会话数据构建问答数据库,使得问答数据库不仅涵盖用户关注的大部分问题,并且涵盖针对问题的准确答案。
其中,问答数据库中包括至少两个问题节点和问题节点之间的关联信息。问题节点包括针对同一类问题的问题数据和与所述问题数据对应的答案数据。具体地,在会话数据中确定至少两个问题节点的方式可以是:对会话数据中的问题数据和与所述问题数据对应的答案数据执行匹配操作,对匹配结果执行聚类操作,得到至少两个问题节点。
由于不同的用户语言习惯不同,因此针对同一个问题,不同的用户的问法可能不同,因此在获取到用户输入的问题时,分析该问题的查询意图,以在问答数据库中确定与该问题相对应的问题节点,从而得到答案数据;同时,在问答数据库中确定与该问题相对应的问题节点,根据问题节点与问答数据库中其它的问题节点之间的关联关系,在其它的问题节点中确定待推送问题。
具体地,用户输入问题,终端或服务器确定该问题对应的问题节点。确定问题对应的问题节点的方式可以是:通过各个问题节点的预设知识点模型确定问题对应的问题节点。利用各个问题节点的预设知识点模型对问题进行概率计算,得到问题属于每个问题节点的概率,获取概率满足预设条件的预设知识点模型,并将预设知识点模型对应的问题节点作为问题对应的问题节点。其中,获取概率满足预设条件的预设知识点模型可以是:对各个预设知识点模型的概率进行排序,由高到低选取预设数量的预设知识点模型。
或者,在利用各个问题节点的预设知识点模型对问题进行概率计算的步骤之前,可以获取问题与预设问题节点集合之间的相似度,根据相似度确定问题对应的预设问题节点集合,再通过预设问题节点集合中的预设知识点模型对问题进行概率计算,以减少运算量。其中,预设问题节点集合是指涉及相同或者相似的知识点的问题节点集合。可以理解,每个预设知识点模型通过对应的问题节点的训练数据训练得到。
步骤206,获取所述问题节点与所述问答数据库中其它的问题节点之间的关联信息,所述关联信息包括转移概率或跳转概率中的至少一个。
其中,关联信息用于表征问题节点之间的转移关系。比如,用户输入第一个问题,人工客服基于用户输入的第一个问题输出第一个答案,用户在了解了第一个问题后,对第二个问题感兴趣,于是输入第二个问题,人工客服基于用户输入的第二个问题输出第二个答案,那么第一个问题和第二个问题之间就产生了关联信息。
其中,关联信息可通过转移概率或者跳转概率来量化。转移概率和跳转概率均是指用户咨询一个问题后,咨询另一个问题的概率。不同的是,在一会话框中,用户先输入第一问题,然后输入第二问题,若第二问题为高频问题,那么通过转移概率量化第一问题和第二问题之间的关联信息,若第二问题为低频问题,那么通过跳转概率量化第一问题和第二问题之间的关联信息。可根据会话数据中问题节点出现的频次与频率阈值之间的大小关系判断问题节点属于高频还是低频,如果问题节点的频次大于频率阈值,将该问题节点作为高频问题节点,如果问题节点的频次不大于频率阈值,将该问题节点作为低频问题节点。
具体地,问答数据库中包括至少两个问题节点和问题节点之间的关联信息,根据问题节点和问题节点之间的关联信息生成问题节点有向图,以表征多个问题节点之间的关联。故通过问答数据库,可得到问题节点与问答数据库中其它的问题节点之间的关联信息。
步骤208,根据所述关联信息在所述其它的问题节点中确定待推送问题。
具体地,获取与问题对应的问题节点关联性较大的其它的问题节点,在这些问题节点中确定待推送问题。关联性的大小可通过问题对应的问题节点与其它的问题节点之间的转移概率或者跳转概率来量化。这样,问题节点之间的关联信息能实现低频问题推送;基于序列转移的方法挖掘问题之间递进关系,使得推送问题具有层次性。
本实施例公开的技术方案中,预先设置问答数据库,问答数据库中包括问题节点和问题节点之间的关联信息,以在获取到用户输入的问题时,确定用户输入的问题对应的问题节点,通过该问题节点与其它的问题节点之间的关联信息,在其它的问题节点中确定待推送问题,使得推送问题与用户输入的问题有关联,提高了推送问题的准确性。
在一个实施例中,所述获取输入的问题的步骤之后,所述方法还包括:当所述问答数据库中没有与所述问题相对应的问题节点时,获取所述问题的答案;根据所述问题和所述问题的答案更新所述问答数据库;或者,当所述问答数据库中没有与所述问题相对应的问题节点时,获取所述问题的答案,以及与问题序列中所述问题的相邻问题之间的关联信息;根据所述问题、所述问题的答案和与所述相邻问题之间的关联信息更新所述问答数据库。
具体地,当问答数据库中没有与问题相对应的问题节点时,说明该问题没有被问答数据库收录,因此可将该问题和该问题对应的答案收录至问答数据库。
比如,用户输入第一个问题,终端或者服务器没有在问答数据库中找到与该问题相对应的问题节点,此时可能有以下几种情况:
1、用户转人工客服,人工客服基于用户输入的第一个问题输出第一个答案,将第一个问题和第一个答案相关联,将关联结果上传至问答数据库;或者将关联结果发送至权限为工作人员的用户标识所在的终端,当接收到权限为工作人员的用户标识所在的终端响应的确认信息,则将关联结果上传到问答数据库。
2、用户结束咨询。可将用户输入的第一个问题发送至权限为工作人员的用户标识所在的终端,当接收到权限为工作人员的用户标识所在的终端响应的问题和答案,则将问题和答案关联上传到问答数据库。
3、在用户输入第一个问题后,不论是否在问答数据库中获取到答案,可能还会输入第二个、第三个……第N个问题,那么问题之间产生了关联,可获取问题之间的关联信息,并将问题、答案和关联信息一并上传到问答数据库。
其中,问题序列是指按照输入时间对同一个会话框中的问题进行排序得到的序列。
以用户输入第一个问题后,输入第二个问题为例:第二个问题是数据库中已经存在的问题,那么可用转移概率来表征第一个问题与第二个问题之间的关联性;第二个问题不是数据库中已经存在的问题,那么可用跳转概率来表征第一个问题与第二个问题之间的关联性。
将问题、答案和关联信息一并收录至数据库之前,也可将问题、答案和关联信息发送至权限为工作人员的用户标识所在的终端,当接收到权限为工作人员的用户标识所在的终端响应的确认信息,将问题、答案和关联信息上传至数据库。
本实施例公开的技术方案中,当问答数据库中没有与问题相对应的问题节点时,根据该问题更新问答数据库,提高问答数据库的问题覆盖率。
在一个实施例中,所述获取输入的问题的步骤之后,所述方法还包括:当所述问答数据库中没有与所述问题相对应的问题节点时,在预设的问题节点中确定所述待推送问题。
其中,预设的问题节点是指预先指定的问题节点,比如高频的问题节点。
具体地,当问答数据库中没有与问题相对应的问题节点时,此时很难获取到与该问题有关联性的问题,那么可推送一些预设的问题给用户,比如高频的问题。
本实施例公开的技术方案中,当问答数据库中没有与问题相对应的问题节点时,推送预设的问题给用户,激发用户了解相关内容的兴趣。
在一个实施例中,所述问答数据库的构建方式包括:获取会话数据,在所述会话数据中确定至少两个所述问题节点;确定至少两个所述问题节点之间的关联信息;根据至少两个所述问题节点和至少两个所述问题节点之间的关联信息生成所述问答数据库。
其中,问答数据库是预先建立的数据库,问答数据库中具有通过大量的会话数据统计得到的问题节点,这些问题节点涵盖了用户关注的大部分问题,通过问答数据库,智能客服机器人可针对用户输入的问题进行智能解答。
其中,会话数据是指记录的用户与人工客服之间的历史交互数据,或者用户与机器人之间的历史交互数据。在会话数据中确定至少两个问题节点的方式可以是:对会话数据中的问题数据和与所述问题数据对应的答案数据执行匹配操作,对匹配结果执行聚类操作,得到至少两个问题节点。
其中,问答数据库中包括至少两个问题节点和问题节点之间的关联信息,问题节点包括针对同一类问题的问题数据和与所述问题数据对应的答案数据,关联信息用于表征问题节点之间的转移关系。关联信息可通过转移概率或者跳转概率来量化。转移概率和跳转概率均是指用户咨询一个问题后,咨询另一个问题的概率。
具体地,根据问题节点和问题节点之间的关联信息生成问题节点有向图,以表征多个问题节点之间的关联。故通过问答数据库,可得到问题节点与问答数据库中其它的问题节点之间的关联信息。
本实施例公开的技术方案中,预先设置问答数据库,以通过问答数据库确定与输入的问题具有关联性的待推送问题。
在一个实施例中,所述确定至少两个所述问题节点之间的关联信息的步骤,包括:获取第一问题节点和第二问题节点分别对应的频次;当所述第二问题节点的频次大于频次阈值时,获取所述第一问题节点的转移概率,将所述转移概率作为所述第一问题节点与所述第二问题节点之间的关联信息;当所述第二问题节点的频次不大于所述频次阈值时,获取所述第一问题节点的跳转概率,将所述跳转概率作为所述第一问题节点与第二问题节点之间的关联信息。
其中,第一问题节点和第二问题节点之间存在关联信息,第一问题节点对应的问题在问题序列中的位置先于第二问题节点对应的问题在问题序列中的位置,即在一会话框中,用户先输入第一问题节点对应的问题,然后输入第二问题节点对应的问题。
其中,频次阈值用于区分问题节点是高频问题还是低频问题。可以理解,频次阈值也可以是多个,将问题节点区分为高频、中高频、中频、中低频、低频等,本申请为了方便表述,只表述了高频问题和低频问题。频次阈值可根据实际应用进行设置,本发明不做具体限定。
具体地,转移概率的计算方式可以是:由一个高频问题或者低频问题跳转至每一个高频问题的概率是相等的,假设有M个高频问题,那么由一个高频问题或者一个低频问题跳转至另一个高频问题的概率为1/M。或者,以用户为单位,统计每一个会话中用户的问题序列,构建问题-问题的二维矩阵,归一化频数,以频率代表问题节点之间关系强弱,去掉低概率节点边,根据连接边数量得到转移概率。
具体地,跳转概率的计算方式可以是:由一个高频问题或者低频问题跳转至每一个低频问题的概率也是相等的,假设有N个低频问题,那么由一个高频问题或者一个低频问题跳转至另一个低频问题的概率为1/N。或者,以每个问题节点为起点,创建预定数量的初始粒子沿着问题节点有向图进行随机游走,根据边和概率大小进行跳转,通过落到每个问题节点的粒子数得到跳转概率。预定数量可根据实际应用进行设置。本实施例公开的技术方案中,通过转移概率或者跳转概率量化问题节点之间的关联性。
在一个实施例中,所述在所述会话数据中确定至少两个所述问题节点的步骤,包括:对所述会话数据中的问题数据和答案数据执行匹配操作;对匹配结果执行聚类操作,得到至少两个所述问题节点。
其中,匹配操作是指将问题数据和问题数据对应的答案数据关联起来。
具体地,将会话数据中每个会话框中的上下问答对作为正样本(有时会出现错位情况,可当作少量噪声)输入,通过如图4所示的BiMPM深度匹配网络,训练出问答匹配模型,根据问答匹配模型对问题数据和答案数据执行匹配操作,保证了问答对匹配的准确性。
可以理解,在匹配操作前,可滤除无效会话数据,比如“谢谢”、“你好”等。如图5所示,可训练二分类模型识别无效会话数据。
其中,聚类操作是指将针对同一类问题的问题数据和与所述问题数据对应的答案数据关联起来。
通过问答匹配模型匹配出有效问答对后,可进行Kmeans聚类,归一化问题节点;或者,如图6-图7所示,由于人工客服对同一类问题的回答相对比较固定,所以先进行SimHash粗聚;继而将同一簇下的集合进行Kmeans再次聚类;将双聚类后的结果发送至工作人员标注(只需要对簇中心标注即可);最后将标注了簇中心的元素映射回标注结果,得到有效的问答对。可以理解,在硬件条件允许的情况下,可用AP聚类替代SimHash聚类执行粗聚操作。
本实施例公开的技术方案中,通过匹配操作和聚类操作得到问题节点,实现问答数据库的有序性。
在一个实施例中,所述根据所述关联信息在所述其它的问题节点中确定待推送问题的步骤,包括:按照所述关联信息计算所述其它的问题节点的推送数值;根据所述推送数值确定所述待推送问题。
其中,推送数值是指根据问题节点与其它的问题节点之间的关联信息计算得到的数值,其可表征问题节点与其它的问题节点之间的关联强度。
具体地,根据关联信息计算推送数值的方式可以是:将转移概率或者跳转概率作为推送数值;或者,根据转移概率和跳转概率计算推送数值,比如对转移概率和跳转概率分别设置预设权值,根据转移概率和转移概率的预设权值、跳转概率和跳转概率的预设权值计算推送数值。
具体地,根据推送数值确定待推送问题的方式可以是:按照推送数值由高到低的顺序选取预设数量的问题节点,预设数量可根据实际应用进行设置。
本实施例公开的技术方案中,通过推送数值选取与输入的问题关联性高的待推送问题,提高了推送问题与输入的问题之间的关联性。
在一个实施例中,所述按照所述关联信息计算所述其它的问题节点的推送数值的步骤,包括:获取所述关联信息对应的预设权值;根据所述关联信息和所述关联信息对应的预设权值计算所述其它的问题节点的推送数值。
其中,预设权值是指预先设置的关联信息对应的权值,比如针对转移概率和跳转概率分别设置转移概率对应的预设权值和跳转概率对应的预设权值。两者之间的预设权值可以不同,比如设置转移概率对应的预设权值高于跳转概率对应的预设权值。
具体地,推送数值可根据关联信息和关联信息对应的预设权值计算得到,比如,通过以下公式计算问题节点的推送数值:
score=w1x1+w2x2+b
其中,score为推送数值,x1为转移概率,w1为转移概率对应的预设权值,x2为跳转概率,w2为跳转概率对应的预设权值,b为偏倚值。
本实施例公开的技术方案中,根据关联信息和关联信息对应的预设权值计算得到推送数值,保证了推送数值的可参考性。
可选的,下面对一实施例进行说明:
如图8所示,获取会话数据,滤除会话数据中的无效数据,将会话数据中的问题数据和答案数据依次执行匹配操作和聚类操作,得到问题节点,根据问题节点和问题节点之间的关联信息生成问答数据库,问答数据库中包括问题节点有向图;
当获取到输入的问题时,在问答数据库中确定与该问题对应的问题节点,获取该问题节点与问答数据库中其它的问题节点之间的关联信息,以在其它的问题节点中确定待推送问题。
本实施例公开的技术方案使得推送问题与用户输入的问题有关联,提高了推送问题的准确性。
图2为一个实施例中问题推送方法的流程示意图。应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种问题推送装置900,包括:获取模块902和确定模块904,其中:
获取模块902,用于获取输入的问题;
确定模块904,用于在问答数据库中确定与所述问题相对应的问题节点;
所述获取模块902,还用于获取所述问题节点与所述问答数据库中其它的问题节点之间的关联信息,所述关联信息包括转移概率或跳转概率中的至少一个;
所述确定模块904,还用于根据所述关联信息在所述其它的问题节点中确定待推送问题。在一个实施例中,问题推送装置900还包括:更新模块,其中:所述获取模块902,还用于当所述问答数据库中没有与所述问题相对应的问题节点时,获取所述问题的答案;所述更新模块,用于根据所述问题和所述问题的答案更新所述问答数据库;所述获取模块902,还用于当所述问答数据库中没有与所述问题相对应的问题节点时,获取所述问题的答案,以及与问题序列中所述问题的相邻问题之间的关联信息;所述更新模块,还用于根据所述问题、所述问题的答案和与所述相邻问题之间的关联信息更新所述问答数据库。
在一个实施例中,所述确定模块904,还用于当所述问答数据库中没有与所述问题相对应的问题节点时,在预设的问题节点中确定所述待推送问题。
在一个实施例中,问题推送装置900还包括:生成模块,其中:所述获取模块902,还用于获取会话数据,在所述会话数据中确定至少两个所述问题节点;所述确定模块904,还用于确定至少两个所述问题节点之间的关联信息;所述生成模块,用于根据至少两个所述问题节点和至少两个所述问题节点之间的关联信息生成所述问答数据库。
在一个实施例中,所述确定模块904还用于获取第一问题节点和第二问题节点分别对应的频次;当所述第二问题节点的频次大于频次阈值时,获取所述第一问题节点的转移概率,将所述转移概率作为所述第一问题节点与所述第二问题节点之间的关联信息;当所述第二问题节点的频次不大于所述频次阈值时,获取所述第一问题节点的跳转概率,将所述跳转概率作为所述第一问题节点与第二问题节点之间的关联信息。
在一个实施例中,所述获取模块902,还用于对所述会话数据中的问题数据和答案数据执行匹配操作;对匹配结果执行聚类操作,得到至少两个所述问题节点。
在一个实施例中,所述确定模块904,还用于按照所述关联信息计算所述其它的问题节点的推送数值;根据所述推送数值确定所述待推送问题。
在一个实施例中,所述确定模块904,还用于获取所述关联信息对应的预设权值;根据所述关联信息和所述关联信息对应的预设权值计算所述其它的问题节点的推送数值。
图10示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端102(或服务器104)。如图10所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现问题推送方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行问题推送方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的问题推送装置可以实现为一种计算机程序的形式,计算机程序可在如图10所示的计算机设备上运行。计算机设备的存储器中可存储组成该问题推送装置的各个程序模块,比如,图9所示的获取模块和确定模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的问题推送方法中的步骤。
例如,图10所示的计算机设备可以通过如图9所示的问题推送装置中的获取模块902执行步骤202,计算机设备可通过确定模块904执行步骤204,计算机设备可通过获取模块902执行步骤206,计算机设备可通过确定模块904执行步骤208。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述问题推送方法的步骤。此处问题推送方法的步骤可以是上述各个实施例的问题推送方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述问题推送方法的步骤。此处问题推送方法的步骤可以是上述各个实施例的问题推送方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (11)

1.一种问题推送方法,包括:
获取输入的问题;
在问答数据库中确定与所述问题相对应的问题节点;
获取所述问题节点与所述问答数据库中其它的问题节点之间的关联信息,所述关联信息包括转移概率或跳转概率中的至少一个;
根据所述关联信息在所述其它的问题节点中确定待推送问题。
2.根据权利要求1所述的方法,其特征在于,所述获取输入的问题的步骤之后,所述方法还包括:
当所述问答数据库中没有与所述问题相对应的问题节点时,获取所述问题的答案;
根据所述问题和所述问题的答案更新所述问答数据库;
或者,当所述问答数据库中没有与所述问题相对应的问题节点时,获取所述问题的答案,以及与问题序列中所述问题的相邻问题之间的关联信息;
根据所述问题、所述问题的答案和与所述相邻问题之间的关联信息更新所述问答数据库。
3.根据权利要求1所述的方法,其特征在于,所述获取输入的问题的步骤之后,所述方法还包括:
当所述问答数据库中没有与所述问题相对应的问题节点时,在预设的问题节点中确定所述待推送问题。
4.根据权利要求1所述的方法,其特征在于,所述问答数据库的构建方式包括:
获取会话数据,在所述会话数据中确定至少两个所述问题节点;
确定至少两个所述问题节点之间的关联信息;
根据至少两个所述问题节点和至少两个所述问题节点之间的关联信息生成所述问答数据库。
5.根据权利要求4所述的方法,其特征在于,所述确定至少两个所述问题节点之间的关联信息的步骤,包括:
获取第一问题节点和第二问题节点分别对应的频次;
当所述第二问题节点的频次大于频次阈值时,获取所述第一问题节点的转移概率,将所述转移概率作为所述第一问题节点与所述第二问题节点之间的关联信息;
当所述第二问题节点的频次不大于所述频次阈值时,获取所述第一问题节点的跳转概率,将所述跳转概率作为所述第一问题节点与第二问题节点之间的关联信息。
6.根据权利要求4所述的方法,其特征在于,所述在所述会话数据中确定至少两个所述问题节点的步骤,包括:
对所述会话数据中的问题数据和答案数据执行匹配操作;
对匹配结果执行聚类操作,得到至少两个所述问题节点。
7.根据权利要求1所述的方法,其特征在于,所述根据所述关联信息在所述其它的问题节点中确定待推送问题的步骤,包括:
按照所述关联信息计算所述其它的问题节点的推送数值;
根据所述推送数值确定所述待推送问题。
8.根据权利要求7所述的方法,其特征在于,所述按照所述关联信息计算所述其它的问题节点的推送数值的步骤,包括:
获取所述关联信息对应的预设权值;
根据所述关联信息和所述关联信息对应的预设权值计算所述其它的问题节点的推送数值。
9.一种问题推送装置,其特征在于,所述装置包括:
获取模块,用于获取输入的问题;
确定模块,用于在问答数据库中确定与所述问题相对应的问题节点;
所述获取模块,还用于获取所述问题节点与所述问答数据库中其它的问题节点之间的关联信息,所述关联信息包括转移概率或跳转概率中的至少一个;
所述确定模块,还用于根据所述关联信息在所述其它的问题节点中确定待推送问题。
10.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。
CN201910598175.XA 2019-07-04 2019-07-04 问题推送方法、装置、计算机可读存储介质和计算机设备 Pending CN110457448A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910598175.XA CN110457448A (zh) 2019-07-04 2019-07-04 问题推送方法、装置、计算机可读存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910598175.XA CN110457448A (zh) 2019-07-04 2019-07-04 问题推送方法、装置、计算机可读存储介质和计算机设备

Publications (1)

Publication Number Publication Date
CN110457448A true CN110457448A (zh) 2019-11-15

Family

ID=68482090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910598175.XA Pending CN110457448A (zh) 2019-07-04 2019-07-04 问题推送方法、装置、计算机可读存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN110457448A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112164277A (zh) * 2020-09-11 2021-01-01 南京景玉信息科技有限公司 一种基于信息技术的提问系统及其工作方法
CN112445903A (zh) * 2020-11-26 2021-03-05 北京沃东天骏信息技术有限公司 确定输出内容的方法、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112164277A (zh) * 2020-09-11 2021-01-01 南京景玉信息科技有限公司 一种基于信息技术的提问系统及其工作方法
CN112445903A (zh) * 2020-11-26 2021-03-05 北京沃东天骏信息技术有限公司 确定输出内容的方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110942086B (zh) 数据预测优化方法、装置、设备及可读存储介质
CN108899012A (zh) 语音交互设备评测方法、系统、计算机设备和存储介质
CN110417607B (zh) 一种流量预测方法、装置及设备
Marewski On the theoretical precision and strategy selection problem of a single‐strategy approach: A comment on Glöckner, Betsch, and Schindler (2010)
CN109145168A (zh) 一种专家服务机器人云平台
WO2021208535A1 (zh) 基于自动特征分组的推荐方法及装置
WO2020151170A1 (zh) 一种岗位画像设置方法、岗位画像设置装置及终端设备
CN111723305B (zh) 一种预测用户下一轨迹点的方法
CN110457448A (zh) 问题推送方法、装置、计算机可读存储介质和计算机设备
CN106850289A (zh) 结合高斯过程与强化学习的服务组合方法
CN110110899A (zh) 知识掌握度的预测方法、自适应学习方法及电子设备
CN110263181A (zh) 知识结构的挖掘方法及学习路径的规划方法
CN108279954A (zh) 一种应用程序排序的方法及装置
CN108153902A (zh) 多轮会话交互方法、装置、计算机设备和存储介质
CN109408708A (zh) 用户推荐的方法、装置、计算机设备和存储介质
CN112418508A (zh) 基于物理空间与社交网络空间交互的人口分布预测方法
CN115860179A (zh) 轨迹预测方法、装置、设备、存储介质及程序产品
CN112395505B (zh) 一种基于协同注意力机制的短视频点击率预测方法
CN111402028A (zh) 一种信息处理方法、装置及设备
CN116861236A (zh) 违规用户识别方法、装置、设备、存储介质以及产品
CN114757155A (zh) 一种会议文档的生成方法及装置
Shen et al. [Retracted] International Chinese Education Expert System Based on Artificial Intelligence and Machine Learning Algorithms
Patlan et al. A review of dialogue systems: from trained monkeys to stochastic parrots
CN114492905A (zh) 基于多模型融合的客诉率预测方法、装置和计算机设备
Smith et al. Greater than the sum of its parts: exploring a systemic design-inspired responsible innovation framework for addressing ICT carbon emissions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination