CN107704580A - 基于用户时期的问答推送方法、装置、服务器及存储介质 - Google Patents

基于用户时期的问答推送方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN107704580A
CN107704580A CN201710922750.8A CN201710922750A CN107704580A CN 107704580 A CN107704580 A CN 107704580A CN 201710922750 A CN201710922750 A CN 201710922750A CN 107704580 A CN107704580 A CN 107704580A
Authority
CN
China
Prior art keywords
user
answer
period
question
scope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710922750.8A
Other languages
English (en)
Inventor
孙健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710922750.8A priority Critical patent/CN107704580A/zh
Publication of CN107704580A publication Critical patent/CN107704580A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于用户时期的问答推送方法、装置、服务器及存储介质。其中,该方法包括:确定问题所在时期;确定用户所在时期;依据预设的问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围;依据所述问题所在时期以及所述用户答题时期范围,将属于所述用户答题时期范围的问题推送给所述用户。本发明通过问题与用户所在时期的确定,明确用户答题时期范围,增强推送信息与用户之间的粘黏度,实现根据问题所在时期,有针对性地将属于用户答题时期范围的问题推送给经历过该时期且有能力解答的用户供用户进行有效地解答,解决仅通过标签来推送问题的局限性,提高问题的回答率和准确率,实现互助学习、分享经验的效果。

Description

基于用户时期的问答推送方法、装置、服务器及存储介质
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于用户时期的问答推送方法、装置、服务器及存储介质。
背景技术
问答系统作为互联网产品之一,承载了内容生产和社区建设的主要功能,应用在各个主流的社区平台上。问答系统以解决问题为目标,帮助用户找到答案。
目前业界推出的问答推送系统主要通过预测问题的标签,并让用户自己选择所擅长的领域标签,根据用户所勾选的标签,推送涵盖这些领域标签的问题,或者提供涵盖这些问题标签的答案,至此用户可以根据自己的兴趣和能力来回答问答系统上的问题,或者通过问题标签获取问题的答案。
然而,对于没有标签体系的内容平台,特别是初创平台,在还没有获取用户所擅长的领域标签或者用户所勾选的标签时,问答系统无法识别用户的擅长领域以及需要获取答案的领域。此外,对于垂直产品,例如母婴产品,单独地识别用户和问题的领域标签,用户和问题得不到细化,往往对于用户和问题的识别不够准确和全面,无法满足用户的需要,用户获取不到能够解答的问题或者准确的答案,推送信息与用户之间的粘黏度较低。
发明内容
本发明实施例提供了一种基于用户时期的问答推送方法、装置、服务器及存储介质,能够有针对性的将问题推送给时期符合的用户供用户进行有效地解答,并且将问答对推送给时期符合的用户供用户有效地学习,提高了推送信息与用户之间的粘黏度。
第一方面,本发明实施例提供了一种基于用户时期的问答推送方法,包括:
确定问题所在时期;
确定用户所在时期;
依据预设的问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围;
依据所述问题所在时期以及所述用户答题时期范围,将属于所述用户答题时期范围的问题推送给所述用户。
第二方面,本发明实施例提供了一种基于用户时期的问答推送装置,包括:
问题时期确定模块,用于确定问题所在时期;
用户时期确定模块,用于确定用户所在时期;
答题时期范围确定模块,用于依据预设的问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围;
问题推送模块,用于依据所述问题所在时期以及所述用户答题时期范围,将属于所述用户答题时期范围的问题推送给所述用户。
第三方面,本发明实施例提供了一种服务器,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例所述的基于用户时期的问答推送方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述任一实施例所述的基于用户时期的问答推送方法。
本发明通过分别确定问题所在时期和用户所在时期;根据预设的问题采集时间长度及用户所在时期,确定用户答题时期范围;将属于所述用户答题时期范围的问题推送给所述用户。解决了仅通过标签来推送问题的局限性,通过问题与用户所在时期的确定,明确用户答题时期范围,增强了推送信息与用户之间的粘黏度,实现了根据问题所在时期,有针对性地将属于用户答题时期范围的问题推送给经历过该时期且有能力解答的用户供用户进行有效地解答,并且将问答对推送给用户供用户进行有效地学习,提高了问题的回答率和准确率,实现了互助学习,分享经验的效果。
附图说明
图1为本发明实施例一提供的一种基于用户时期的问答推送方法的流程图;
图2为本发明实施例二提供的一种基于用户时期的问答推送方法的流程图;
图3为本发明实施例三提供的一种基于用户时期的问答推送方法的流程图;
图4为本发明实施例四提供的一种基于用户时期的问答推送方法的流程图;
图5为本发明实施例五提供的一种基于用户时期的问答推送装置的结构示意图;
图6为本发明实施例六提供的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种基于用户时期的问答推送方法的流程图,本实施例可适用于问答推送系统中问题推送的情况,该方法可以由基于用户时期的问答推送装置来执行,该基于用户时期的问答推送装置可以采用软件和/或硬件的方式实现。参考图1,该方法具体可以包括如下:
S110、确定问题所在时期。
在问答系统中,提问者可以对所提出的问题进行时间的限定,例如新生儿期的感冒发烧处理方式,如果仅通过标签“感冒发烧”来对问题进行回答,而不以问题所在时期为依据,由于人生的阶段时期较多,问题的答案往往差别较大,且不一定符合提问用户的用户需要。因此通过问题的时期判断可以有效地推断问题描述的症状或者细节。
根据问题的所描述的时间范围,可以通过规则方式或者机器学习方法预测提问问题所在的时期。问题所在时期是指问题的主体用户所在的人生阶段时期,其中人生阶段时期可以包括:备孕、孕早期、孕中期、孕晚期、新生儿期、1月-1岁内、1-3岁以及3岁后等;所述的人生阶段时期还可以包括具体的时间点,例如孕18周、孕27+3周以及宝3月等。
具体的,对提问问题的语义信息预测归纳为上述描述的人生阶段时期,例如备孕、孕早期、孕晚期等;同时提取问题的具体时间点,并将指代为同一个时间点但表述不同的时间点归一化展示,例如怀孕90天和孕早期3个月,指的是同一个时间点,即孕13周,因此将怀孕90天、孕早期3个月、孕13周以及其他与其指代相同的时间点统一归一化为孕13周的展示方式。
对于问题所在时期的确定,首先需要对问题内容的文本进行分词处理,提取问题描述的关键词。其次根据预先获取的描述时期的种子词,例如备孕、孕期、孕3月、宝宝、黄疸以及新生儿等种子词,计算每个关键词与每个种子词的相似度,取得最大的相似度值并记为m,m属于[0,1]。然后可以利用TF-IDF统计方法计算每个关键词的得分,其得分公式为:tf*(1+m)*idf,其中,tf指词频,即某个词语在文件中出现的频率,其中,ni,j表示某词在文件中的出现次数,∑knk,j表示在文件中所有词语的出现次数之和;idf指逆向文件频率,是对某个词语普遍重要性的度量,其中,|D|表示语料库中的文件总数,j表示包含词语ti的文件d的数目。最后根据得分情况对排名靠前的关键词进行筛选,提取筛选后的关键词作为特征词,通过One-Hot(One-Hot Code,独热码)编码方式,将特征词组成高维稀疏特征,并通过分类预测模型,预测问题所在的时期。其中,所述分类预测模型是在前序步骤中训练获得的,是利用样本的特征值以及样本标签通过分类模型训练得出。
S120、确定用户所在时期。
提问用户通常是根据自己或家人所在的时期来提出问题,以此来获得符合自己时期或者即将要步入的时期的相关问题的答案,解决现在遇到的问题以及为后续时期做好准备;或者所述要被推送问题的用户为已经经历过问题描述的时期,具备问题描述的时期及其之前时期的人生经历,有能力对所述问题进行解答。因此通过用户所在的时期可以有针对性地将所述问题推送给时期符合的用户进行有效地解答,或者将符合用户时期的问题及答案有针对性地推送给提出类似于所述问题的用户进行有效地学习。
本发明的实施例可以通过第三方平台或者画像平台推算并获取用户所在时期。具体的,利用第三方平台获取用户所在的人生阶段时期时,第三方平台首先从注册平台获取用户注册时的时期,例如用户注册系统时,注册系统保存的该用户的注册记录显示该用户的预产期时间;然后以此根据注册时间及预产期时间,推算得出当前用户所在时期。示例性的,某注册记录显示某用户是在2017年3月11日注册的某第三方平台,且该注册记录显示该用户的预产期为2017年10月7日,因此根据该第三方平台中该用户的注册时间及预产期时间,推算得出2017年5月1日时,该用户的所在时期为孕17周+2天。或者,利用画像平台获取用户所在的时期时,通过用户请求的查询日志,预测用户请求的查询所描述的时期,推算用户所在的时期。示例性的,可以通过语义分析系统,对某用户请求的查询日志进行分析,预测2017年3月11日时该用户所在时期为孕10周,因此推算得出2017年5月1日时,该用户的所在时期为孕17周+2天。
S130、依据预设的问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围。
为了有效地对问题进行解答,本发明实施例可以预设问题采集时间长度,并根据用户当前所在时期,确定用户的答题时期范围,使答题用户对自己当前时期及之前的预设时间段内的问题进行解答。由于此范围内是用户刚刚经历过的人生阶段,因此用户可以根据自己的经验对问题进行有效地解答,而不会导致时间过去较长,用户对较长时间前的经验淡忘而导致回答有误的结果。
S140、依据所述问题所在时期以及所述用户答题时期范围,将属于所述用户答题时期范围的问题推送给所述用户。
在上述步骤的基础上,分别确定了问题的所在时期和用户的答题时期范围,为了获取准确全面地答案,将属于所述用户答题时期范围的问题有针对性地推送给所述用户,因此用户可以进行有效地解答。
本实施例的技术方案,分别确定问题所在时期和用户所在时期;根据预设的问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围;并将属于所述用户答题时期范围的问题推送给所述用户。解决了仅通过标签来推送问题的局限性,通过对问题的时期判断可以有效地推断问题描述的症状或者细节,增加了问题与用户的粘黏度,通过对用户所在时期的确定可以有针对性地将所述问题推送给时期符合的用户进行有效地解答,或者将符合用户时期的问题及答案推送给提出类似所述问题的用户进行有效地学习,提高了问题的回答率和准确率,实现了互助学习,分享经验的效果。
实施例二
本实施例在上述实施例一的基础上,提供了基于用户时期的问答推送方法的一个优选实施方式,能够对所推送的问题进行有效地筛选。图2为本发明实施例二提供的一种基于用户时期的问答推送方法的流程图,如图2所示,该方法包括以下具体步骤:
S210、确定问题所在时期。
S220、确定用户所在时期。
S230、依据预设的问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围。
进一步的,可以将所述用户所在时期与所述问题采集时间长度之差作为所述用户答题时期范围的下限值,将所述用户所在时期作为所述用户答题时期范围的上限值。
示例性的,问题采集时间长度可以依据需要设定,如设为8周,某用户当前所在时期为孕28周,则该用户的答题时期范围为孕20周至孕28周,因此凡是问题所在时期在该答题时期范围内的问题,都可以经过进一步地筛选推送给该用户。
同时,随着时间的推移,用户所在时期变化,用户答题时期范围的下限值和上限值也在随之变动。因此答题用户可以随时根据自己的近期经验进行有效地解答。
S240、将问题所在时期属于所述用户答题时期范围的问题按照主题词进行分组,获得至少一组问题集。
同上述问题所在时期确定的步骤,对于问题主题词的确定,需要对问题内容的文本进行分词处理,提取问题描述的主题词。其中,所述主题词包括以下方面的任何一种或多种的组合,包括但不局限于:问题的主体、问题的分类、问题的标签、问题的实体以及问题的关键词等,所述主题词组成主题词集合。然后将问题所在时期属于所述用户答题时期范围的问题按照主题词进行分组,则每个主题词都对应着一组问题集。通常有效的问题中至少包括一个主题词,进而根据主题词进行分组,可以获得至少一组问题集。
S250、针对所述问题集中的每一问题,若所述问题的推送次数大于预设的推送次数阈值,则从所述问题集中剔除所述问题。
为了有效地对问题进行解答,避免用户资源的浪费,因此本发明实施例可以预设一个推送次数阈值。当某个问题被推送的次数达到或者超过该推送次数阈值时,说明该问题已经推送给足够数量的用户来解答,很大概率上该问题已经获得充分的解答,无需再推送给其他用户,占用其他用户的答题时间和精力。因此,对于每个主题词对应的问题集中的每个问题,当判断该问题的推送次数大于预设的推送次数阈值时,则从所述问题集中剔除该问题。
S260、每组问题集中包含的问题按照问题的生成时间从大到小排列。
同样为了有效地对问题进行解答,避免时间过去较长,用户对较长时间之前的经验淡忘而导致回答有误的结果,将每组问题集中包含的问题按照问题的生成时间从大到小排列,将问题所在时期距离用户所在时期最近的问题优先推送给用户,然后以此类推推送排在后面的问题。
S270、从主题词集合中选择第一数值个主题词作为目标问题主题词。
S280、从所述目标问题主题词关联的问题集中选择排序在前的问题推送给用户。
为了保持推送问题的多样性,而不仅仅集中于某一主题词所对应的问题集,因此首先从主题词集合中随机选择第一数值个主题词作为目标问题主题词,然后从目标问题主题词对应的问题集合中选择排序第一的问题,并将所有问题主题词对应的问题集合中排序第一的问题按照问题的生成时间从大到小重新排列,最后选择排序在前的问题推送给用户。
示例性的,设定问题采集时间长度为CQ,用户所在时期为P,则用户答题时期范围为[P-CQ,P]。将问题所在时期在[P-CQ,P]范围内的问题组成预推送给该用户的问题集合S,将问题集合S中的问题根据主题词按照问题的生成时间从大到小排列,所述主题词组成主题词集合为K。如下式所示,其中C代表不同的主题词,[qm1,qm2,qm3,…,qmnm]表示与主题词Cm对应的按照问题的生成时间从大到小排列好的问题集合,m代表主题词的个数,n代表问题集合中问题的个数。
K:[C1,C2,……,Cm];
C1:[q11,q12,q13,…,q1n1];
C2:[q21,q22,q23,…,q2n2];
……;
Cm:[qm1,qm2,qm3,…,qmnm]。
设定问题推送个数为TQ,一般TQ小于主题词的个数m。为了保持推送问题的多样性,首先从主题词集合K中随机选取TQ个主题词,其次选取每个所述TQ个主题词C对应的问题集合中排列第一的问题,并按照所选取问题的问题生成时间从大到小重新排列组合生成包含TQ个问题的问题集合,将其推送给当前用户。
本实施例的技术方案,分别确定问题所在时期和用户所在时期;根据预设的问题采集时间长度以及所述用户所在时期,明确确定所述用户答题时期范围;并将属于所述用户答题时期范围的问题,经过多层筛选后推送给所述用户。解决了仅通过标签来推送问题的局限性,通过对问题的时期判断可以有效地推断问题描述的症状或者细节,增加了问题与用户的粘黏度,通过对问题时期的进一步判断和筛选,有针对性地将多样性的且与用户所在时期距离最近的问题推送给时期符合的用户进行有效地解答,提高了问题的回答率和准确率,实现了互助学习,分享经验的效果。
实施例三
本实施例在上述实施例一的基础上,提供了一种基于用户时期的问答推送方法,如图3所示,图3为本发明实施例三提供的一种基于用户时期的问答推送方法的流程图,本实施例可适用于问答推送系统中问答对推送的情况,该方法可以由基于用户时期的问答推送装置来执行,该基于用户时期的问答推送装置可以采用软件和/或硬件的方式实现。参考图3,该方法具体可以包括如下:
S310、确定问题所在时期。
S320、确定用户所在时期。
S330、依据预设的学习时间长度以及所述用户所在时期,确定用户学习时期范围。
为了有效地给用户推送问题及答案,本发明实施例可以预设学习时间长度,并根据用户当前所在时期,确定用户的学习时期范围,使想要获取答案的用户对自己当前时期及之后近期的预设时间段内即将可能会遇到的问题及答案进行学习。由于此范围内是用户即将经历的人生阶段,因此用户可以根据收到的推送问题及答案有效地学习前人的经验。用户学习时期范围的设定让用户学习即将进入的人生阶段的经验,而不会因为获得的经验所在的人生阶段距离用户此时的人生阶段过于久远,而导致降低用户的学习效率,甚至是无效的学习。
S340、依据所述问题所在时期以及所述用户学习时期范围,将属于所述用户学习时期范围的问题及答案组成的问答对推送给用户。
在上述步骤的基础上,分别确定了问题的所在时期和用户的学习时期范围,为了让用户获取准确全面地答案,把问题及其答案组成问答对,将属于所述用户学习时期范围的问答对有针对性地推送给所述用户,因此用户可以进行有效地学习。
本实施例的技术方案,分别确定问题所在时期和用户所在时期;根据预设的学习时间长度以及所述用户所在时期,确定所述用户学习时期范围;并将属于所述用户学习时期范围的问答对推送给所述用户。解决了仅通过标签来推送问题的局限性,通过对问题的时期判断可以有效地推断问题描述的症状或者细节,增加了问题与用户的粘黏度,通过对用户所在时期的确定可以有针对性地将所述问答对推送给时期符合的用户进行有效地学习,提高了用户的学习效率,实现了互助学习,分享经验的效果。
实施例四
本实施例在上述实施例三的基础上,提供了基于用户时期的问答推送方法的一个优选实施方式,能够对所推送的问题的答案进行有效地筛选。图4为本发明实施例四提供的一种基于用户时期的问答推送方法的流程图,如图4所示,该方法包括以下具体步骤:
S401、确定问题所在时期。
S402、确定用户所在时期。
S403、依据预设的问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围。
进一步的,可以将所述用户所在时期与所述问题采集时间长度之差作为所述用户答题时期范围的下限值,将所述用户所在时期作为所述用户答题时期范围的上限值。
S404、依据所述问题所在时期以及所述用户答题时期范围,将属于所述用户答题时期范围的问题推送给所述用户。
S405、获取所述用户回答所述问题的答案。
S406、依据所述答案的内容长度、所述答案与所述问题的相关性以及回答者身份中的至少一种,确定所述答案的质量因子。
S407、依据所述答案的质量因子对所述答案进行筛选,并依据筛选结果确定问答对。
为了提供给用户高质量的答案,本发明实施例在将问题推送给用户进行回答后,收集有回复内容的问题及其答案,并对答案计算质量因子,以此来评定答案质量的高低。所述质量因子是通过对答案的内容长度、所述答案与所述问题的相关性以及回答者身份中的至少一种进行打分来获得的,其次可以通过逻辑回归预测模型或其他分类模型,预测答案是否为高质量的答案,将高质量的答案作为筛选后的问题答案,并与问题组成问答对,将问答对推送给用户。其中,所述预测模型是在前序步骤中训练获得的,是利用答案文本的长度、答案文本与问题相关性、回答者身份以及样本标签等特征通过分类模型训练得出。
S408、依据预设的学习时间长度以及所述用户所在时期,确定用户学习时期范围。
进一步的,将所述用户所在时期作为所述用户学习时期范围的下限值,将所述用户所在时期与所述问答对学习时间长度之和作为用户学习时期范围的上限值。
示例性的,预设学习时间长度为8周,某用户当前所在时期为孕20周,则该用户的学习时期范围为孕20周至孕28周,因此凡是问题所在时期在该学习时期范围内的问题,都可以对所述问题的答案经过进一步地筛选并连同问题组成问答对推送给该用户。用户学习时期范围的设定让用户学习即将进入的人生阶段的经验,而不会因为获得的经验所在的人生阶段距离用户此时的人生阶段过于久远,而导致降低用户的学习效率,甚至是无效的学习。
同时,随着时间的推移,用户学习时期范围的下限值和上限值也在随之变动。因此学习用户可以随时对自己即将要进入的人生阶段的经验进行有效地学习。
S409、将问题所在时期属于所述用户学习时期范围的问答对按照主题词进行分组,获得至少一组问答对集。
对于问答对主题词的确定,需要对问题内容的文本进行分词处理,提取问题描述的主题词。其中,所述主题词包括以下方面的任何一种或多种的组合,包括但不局限于:问题的主体、问题的分类、问题的标签、问题的实体以及问题的关键词等,所述主题词组成主题词集合。然后将问答对所在时期属于所述用户学习时期范围的问答对按照主题词进行分组,则每个主题词都对应着一组问答对集。通常有效的问题中至少包括一个主题词,进而根据主题词进行分组,可以获得至少一组问答对集。
S410、每组问答对集中包含的问答对按照问题的生成时间从小到大排列。
为了提供给与学习用户粘黏度较高的问答对,避免由于获得的问答对中的经验所在的人生阶段距离学习用户此时的人生阶段过于久远,而导致降低用户的学习效率,甚至是无效的学习,因此将每组问答对集中包含的问答对按照问题的生成时间从小到大排列,将问题所在时期距离用户所在时期最近的问答对优先推送给用户,然后以此类推推送排在后面的问答对。
S411、从所述问答对主题词集合中随机选择第二数值个主题词作为目标问答对主题词。
S412、从所述目标问题对主题词关联的问答对集中选择排序在前的问答对推送给所述用户。
为了保持推送问答对的多样性,而不仅仅集中于某一主题词所对应的问答对集,因此首先从主题词集合中随机选择第二数值个主题词作为目标问答对主题词,然后从目标问答对主题词对应的问答对集合中选择排序第一的问答对,并将所有问答对主题词对应的问答对集合中排序第一的问答对按照问题的生成时间从小到大重新排列,最后选择排序在前的问答对推送给用户。
示例性的,设定学习时间长度为CQA,用户所在时期为P,则用户学习时期范围为[P,P+CQA]。将问题所在时期在[P,P+CQA]范围内的问答对组成预推送给该用户的问答对集合SA,将问答对集合SA中的问答对根据主题词按照问题的生成时间从小到大排列,所述主题词组成主题词集合为KA。如下式所示,其中C代表不同的主题词,[qm1,qm2,qm3,…,qmnm]表示与主题词Cm对应的按照问题的生成时间从小到大排列好的问答对集合,m代表主题词的个数,n代表问答对集合中问答对的个数。
KA:[C1,C2,……,Cm];
C1:[q11,q12,q13,…,q1n1];
C2:[q21,q22,q23,…,q2n2];
……;
Cm:[qm1,qm2,qm3,…,qmnm]。
设定问答对推送个数为TQA,一般TQA小于主题词的个数m。为了保持推送问答对的多样性,首先从主题词集合KA中随机选取TQA个主题词,其次选取每个所述TQA个主题词C对应的问答对集合中排列第一的问答对,并按照所述选取的问答对的问题生成时间从小到大重新排列组合生成包含TQA个问答对的问答对集合,将其推送给当前用户。
本实施例的技术方案,分别确定问题所在时期和用户所在时期;根据预设的学习时间长度以及所述用户所在时期,明确确定所述用户学习时期范围;并将属于所述用户学习时期范围的问答对,经过多层筛选后推送给所述用户。解决了仅通过标签来推送问答对的局限性,通过对问题的时期判断可以有效地推断问答对描述的症状或者细节,增加了问答对与用户的粘黏度,通过对问题时期的进一步判断和筛选,有针对性地将多样性的且与用户所在时期距离最近的问答对推送给时期符合的用户进行有效地学习,提高了用户的学习效率,实现了互助学习,分享经验的效果。
实施例五
图5为本发明实施例五提供的一种基于用户时期的问答推送装置的结构示意图,本实施例可适用于问答推送系统中问答推送的情况,可执行本发明任意实施例所提供的基于用户时期的问答推送方法。参考图5,该装置的具体结构如下:
问题时期确定模块510,用于确定问题所在时期;
用户时期确定模块520,用于确定用户所在时期;
答题时期范围确定模块530,用于依据预设的问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围;
问题推送模块540,用于依据所述问题所在时期以及所述用户答题时期范围,将属于所述用户答题时期范围的问题推送给所述用户。
优选的,所述答题时期范围确定模块530,具体用于将所述用户所在时期与所述问题采集时间长度之差作为所述用户答题时期范围的下限值,将所述用户所在时期作为所述用户答题时期范围的上限值。
进一步的,所述问题推送模块540,包括:问题分组单元,用于将问题所在时期属于所述用户答题时期范围的问题按照主题词进行分组,获得至少一组问题集;目标问题主题词单元,用于从所述问题主题词集合中选择第一数值个主题词作为目标问题主题词;问题推送单元,用于从所述目标问题主题词关联的问题集中选择一个问题推送给所述用户。
优选的,所述推送单元,包括:问题排序子单元,用于将每组问题集中包含的问题按照问题的生成时间从大到小排列;问题推送子单元,从目标问题主题词关联的问题集中选择排序在前的问题推送给用户。
优选的,所述问题分组单元,包括:问题剔除子单元,用于针对所述问题集中的每一问题,若所述问题的推送次数大于预设的推送次数阈值,则从所述问题集中剔除所述问题。
优选的,所述装置还包括:
答案获取模块550,用于在所述将属于所述用户答题时期范围的问题推送给所述用户之后,获取所述用户回答所述问题的答案;
答案质量确定模块560,用于依据所述答案的内容长度、所述答案与所述问题的相关性以及回答者身份中的至少一种,确定所述答案的质量因子;
问答对确定模块570,用于依据所述答案的质量因子对所述答案进行筛选,并依据筛选结果确定问答对。
进一步的,所述装置还包括:
学习时期范围确定模块580,用于在所述确定用户所在时期之后,依据预设的学习时间长度以及所述用户所在时期,确定所述用户学习时期范围;
问答对推送模块590,用于依据所述问题所在时期以及所述用户学习时期范围,将属于所述用户学习时期范围的问题及答案组成的问答对推送给用户。
优选的,所述学习时期范围确定模块580,具体用于将所述用户所在时期作为所述用户学习时期范围的下限值,将所述用户所在时期与所述问答对学习时间长度之和作为用户学习时期范围的上限值。
进一步的,所述问答对推送模块590,包括:问答对分组单元,用于将问题所在时期属于所述用户学习时期范围的问答对按照主题词进行分组,获得至少一组问答对集;目标问答对主题词选择单元,用于从所述问答对主题词集合中随机选择第二数值个主题词作为目标问答对主题词;问答对推送单元,用于从所述目标问答对主题词关联的问答对集中选择一个问答对推送给所述用户。
优选的,所述问答对推送单元,包括:问答对排序子单元,用于将每组问答对集中包含的问答对按照问题的生成时间从小到大排列;问答对推送子单元,用于从所述目标问题对主题词关联的问答对集中选择排序在前的问答对推送给所述用户。
本实施例的技术方案,通过各个模块间的相互配合,实现了问题所在时期和用户所在时期的确定、用户答题和学习时期范围的确定、问题及答案的筛选以及推送等功能,解决了仅通过标签来推送问题的局限性,增强了推送信息与用户之间的粘黏度,能够有针对性地将属于用户答题时期范围的问题推送给经历过该时期且有能力解答的用户供用户进行有效地解答,并且将问答对推送给用户供用户进行有效地学习,提高了问题的回答率和准确率,实现了互助学习,分享经验的效果。
实施例六
图6为本发明实施例六提供的一种服务器的结构示意图。图6示出了适于用来实现本发明实施方式的示例性服务器12的框图。图6显示的服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,服务器12以通用计算设备的形式表现。服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该服务器12交互的设备通信,和/或与使得该服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的基于用户时期的问答推送方法。
实施例七
本发明实施例七还提供一种计算机可读存储介质,其上存储有计算机程序(或称为计算机可执行指令),该程序被处理器执行时用于执行一种基于用户时期的问答推送方法,该方法包括:
确定问题所在时期;
确定用户所在时期;
依据预设的问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围;
依据所述问题所在时期以及所述用户答题时期范围,将属于所述用户答题时期范围的问题推送给所述用户。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (16)

1.一种基于用户时期的问答推送方法,其特征在于,包括:
确定问题所在时期;
确定用户所在时期;
依据预设的问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围;
依据所述问题所在时期以及所述用户答题时期范围,将属于所述用户答题时期范围的问题推送给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述依据所述问题所在时期以及所述用户答题时期范围,将属于所述用户答题时期范围的问题推送给所述用户,包括:
将问题所在时期属于所述用户答题时期范围的问题按照主题词进行分组,获得至少一组问题集;
从主题词集合中选择第一数值个主题词作为目标问题主题词;
从所述目标问题主题词关联的问题集中选择一个问题推送给所述用户。
3.根据权利要求2所述的方法,其特征在于,所述从所述目标问题主题词关联的问题集中选择一个问题推送给所述用户,包括:
每组问题集中包含的问题按照问题的生成时间从大到小排列;
从所述目标问题主题词关联的问题集中选择排序在前的问题推送给用户。
4.根据权利要求2所述的方法,其特征在于,所述获得至少一组问题集之后,还包括:
针对所述问题集中的每一问题,若所述问题的推送次数大于预设的推送次数阈值,则从所述问题集中剔除所述问题。
5.根据权利要求1所述的方法,其特征在于,所述依据预设的所述问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围,包括:
将所述用户所在时期与所述问题采集时间长度之差作为所述用户答题时期范围的下限值,将所述用户所在时期作为所述用户答题时期范围的上限值。
6.根据权利要求1所述的方法,其特征在于,在所述确定用户所在时期之后,还包括:
依据预设的学习时间长度以及所述用户所在时期,确定用户学习时期范围;
依据所述问题所在时期以及所述用户学习时期范围,将属于所述用户学习时期范围的问题及答案组成的问答对推送给用户。
7.根据权利要求6所述的方法,其特征在于,所述依据所述问题所在时期以及所述用户学习时期范围,将属于所述用户学习时期范围的问题及答案组成的问答对推送给用户,包括:
将问题所在时期属于所述用户学习时期范围的问答对按照主题词进行分组,获得至少一组问答对集;
从所述问答对主题词集合中随机选择第二数值个主题词作为目标问答对主题词;
从所述目标问答对主题词关联的问答对集中选择一个问答对推送给所述用户。
8.根据权利要求7所述的方法,其特征在于,所述从所述目标问答对主题词关联的问答对集中选择一个问答对推送给所述用户,包括:
每组问答对集中包含的问答对按照问题的生成时间从小到大排列;
从所述目标问题对主题词关联的问答对集中选择排序在前的问答对推送给所述用户。
9.根据权利要求6所述的方法,其特征在于,所述依据所述预设的问答对学习时间长度以及所述用户所在时期,确定所述用户学习时期范围,包括:
将所述用户所在时期作为所述用户学习时期范围的下限值,将所述用户所在时期与所述问答对学习时间长度之和作为用户学习时期范围的上限值。
10.根据权利要求1所述的方法,其特征在于,在所述将属于所述用户答题时期范围的问题推送给所述用户之后,还包括:
获取所述用户回答所述问题的答案;
依据所述答案的内容长度、所述答案与所述问题的相关性以及回答者身份中的至少一种,确定所述答案的质量因子;
依据所述答案的质量因子对所述答案进行筛选,并依据筛选结果确定问答对。
11.一种基于用户时期的问答推送装置,其特征在于,包括:
问题时期确定模块,用于确定问题所在时期;
用户时期确定模块,用于确定用户所在时期;
答题时期范围确定模块,用于依据预设的问题采集时间长度以及所述用户所在时期,确定所述用户答题时期范围;
问题推送模块,用于依据所述问题所在时期以及所述用户答题时期范围,将属于所述用户答题时期范围的问题推送给所述用户。
12.根据权利要求11所述的装置,其特征在于,所述问题推送模块,包括:
问题分组单元,用于将问题所在时期属于所述用户答题时期范围的问题按照主题词进行分组,获得至少一组问题集;
目标问题主题词单元,用于从问题主题词集合中选择第一数值个主题词作为目标问题主题词;
问题推送单元,用于从所述目标问题主题词关联的问题集中选择一个问题推送给所述用户。
13.根据权利要求11所述的装置,其特征在于,所述装置还包括:
学习时期范围确定模块,用于在所述确定用户所在时期之后,依据预设的学习时间长度以及所述用户所在时期,确定用户学习时期范围;
问答对推送模块,用于依据所述问题所在时期以及所述用户学习时期范围,将属于所述用户学习时期范围的问题及答案组成的问答对推送给用户。
14.根据权利要求13所述的装置,其特征在于,所述问答对推送模块,包括:
问答对分组单元,用于将问题所在时期属于所述用户学习时期范围的问答对按照主题词进行分组,获得至少一组问答对集;
目标问答对主题词选择单元,用于从所述问答对主题词集合中随机选择第二数值个主题词作为目标问答对主题词;
问答对推送单元,用于从所述目标问答对主题词关联的问答对集中选择一个问答对推送给所述用户。
15.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至10中任一项所述的基于用户时期的问答推送方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至10中任一项所述的基于用户时期的问答推送方法。
CN201710922750.8A 2017-09-30 2017-09-30 基于用户时期的问答推送方法、装置、服务器及存储介质 Pending CN107704580A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710922750.8A CN107704580A (zh) 2017-09-30 2017-09-30 基于用户时期的问答推送方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710922750.8A CN107704580A (zh) 2017-09-30 2017-09-30 基于用户时期的问答推送方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN107704580A true CN107704580A (zh) 2018-02-16

Family

ID=61184054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710922750.8A Pending CN107704580A (zh) 2017-09-30 2017-09-30 基于用户时期的问答推送方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN107704580A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408678A (zh) * 2018-09-21 2019-03-01 广州神马移动信息科技有限公司 问答交互方法及其装置
CN111353015A (zh) * 2018-12-24 2020-06-30 阿里巴巴集团控股有限公司 众包题目推荐方法、装置、设备及存储介质
CN111737561A (zh) * 2019-06-20 2020-10-02 北京京东尚科信息技术有限公司 信息推送方法和推送系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7457768B2 (en) * 2000-07-31 2008-11-25 Microsoft Corporation Methods and apparatus for predicting and selectively collecting preferences based on personality diagnosis
CN102637170A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 一种问题推送方法及系统
CN104133817A (zh) * 2013-05-02 2014-11-05 深圳市世纪光速信息技术有限公司 网络社区交互方法、装置及网络社区平台
CN104572734A (zh) * 2013-10-23 2015-04-29 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统
CN106251174A (zh) * 2016-07-26 2016-12-21 北京小米移动软件有限公司 信息推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7457768B2 (en) * 2000-07-31 2008-11-25 Microsoft Corporation Methods and apparatus for predicting and selectively collecting preferences based on personality diagnosis
CN102637170A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 一种问题推送方法及系统
CN104133817A (zh) * 2013-05-02 2014-11-05 深圳市世纪光速信息技术有限公司 网络社区交互方法、装置及网络社区平台
CN104572734A (zh) * 2013-10-23 2015-04-29 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统
CN106251174A (zh) * 2016-07-26 2016-12-21 北京小米移动软件有限公司 信息推荐方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408678A (zh) * 2018-09-21 2019-03-01 广州神马移动信息科技有限公司 问答交互方法及其装置
CN111353015A (zh) * 2018-12-24 2020-06-30 阿里巴巴集团控股有限公司 众包题目推荐方法、装置、设备及存储介质
CN111353015B (zh) * 2018-12-24 2024-03-15 阿里巴巴集团控股有限公司 众包题目推荐方法、装置、设备及存储介质
CN111737561A (zh) * 2019-06-20 2020-10-02 北京京东尚科信息技术有限公司 信息推送方法和推送系统

Similar Documents

Publication Publication Date Title
CN110795543B (zh) 基于深度学习的非结构化数据抽取方法、装置及存储介质
CN113159095A (zh) 一种训练模型的方法、图像检索的方法以及装置
CN108363790A (zh) 用于对评论进行评估的方法、装置、设备和存储介质
CN107423278B (zh) 评价要素的识别方法、装置及系统
CN108875067A (zh) 文本数据分类方法、装置、设备及存储介质
CN109657054A (zh) 摘要生成方法、装置、服务器及存储介质
WO2021218028A1 (zh) 基于人工智能的面试内容精炼方法、装置、设备及介质
CN113011186B (zh) 命名实体识别方法、装置、设备及计算机可读存储介质
CN112836487B (zh) 一种自动评论方法、装置、计算机设备及存储介质
US20180350250A1 (en) Network terminal-based learning display device
CN113393370A (zh) 中国书法文字图像风格迁移的方法、系统、智能终端
CN109858024B (zh) 一种基于word2vec的房源词向量训练方法及装置
CN112231485A (zh) 文本推荐方法、装置、计算机设备及存储介质
WO2023159755A1 (zh) 虚假新闻检测方法、装置、设备及存储介质
CN107704580A (zh) 基于用户时期的问答推送方法、装置、服务器及存储介质
KR102213763B1 (ko) 자연어 처리와 딥러닝 네트워크를 이용하여 선별된 기사를 제공하는 방법 및 기사 분류 시스템
WO2020135054A1 (zh) 视频推荐方法、装置、设备及存储介质
CN111444335B (zh) 中心词的提取方法及装置
CN113360659B (zh) 一种基于半监督学习的跨领域情感分类方法及系统
Sharadga et al. Journalists’ perceptions towards employing artificial intelligence techniques in Jordan TV’s newsrooms
CN113591881A (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN113254814A (zh) 网络课程视频打标签方法、装置、电子设备及介质
CN117516937A (zh) 基于多模态特征融合增强的滚动轴承未知故障检测方法
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质
CN107451194A (zh) 一种图片搜索方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180216