CN110232077A - 事件脉络生成方法及装置 - Google Patents
事件脉络生成方法及装置 Download PDFInfo
- Publication number
- CN110232077A CN110232077A CN201910532944.6A CN201910532944A CN110232077A CN 110232077 A CN110232077 A CN 110232077A CN 201910532944 A CN201910532944 A CN 201910532944A CN 110232077 A CN110232077 A CN 110232077A
- Authority
- CN
- China
- Prior art keywords
- thought
- train
- factor
- event
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种事件脉络生成方法,该方法包括:获取用户的需求特征;将预定话题下的全部事件节点按时间先后顺序进行排序;基于设定的算法要素和全部所述事件节点,根据增强学习算法训练得出决策模型;其中,所述算法要素包括:状态描述、动作集合以及评价函数;所述状态描述包括:当前脉络、当前待判断事件节点和后续可选事件节点三个元素;所述动作集合包括:选择当前判断节点、跳过当前判断节点和结束生成;所述评价函数与用户需求因子相关,用于计算一条脉络的价值分值,所述用户需求因子基于所获取的用户的需求特征构建;利用所述决策模型遍历全部所述事件节点,以生成所述预定话题的事件脉络。本公开还提供了一种事件脉络生成装置。
Description
技术领域
本公开实施例涉及计算机技术领域,特别涉及事件脉络生成方法及装置。
背景技术
事件脉络指的是在对事件的理解基础上,通过整合事件的相关资讯,而从中整理出能概括事件发生前因后果的一种事件信息展现形式。伴随着信息量的爆发式增长,通过获取事件脉络来了解某个话题事件的前因后果成为人们快速掌握信息的便捷方法。现有技术中在形成事件脉络时,常规的方法是对与事件相关的所有资讯进行聚合以形成事件簇,再不断将新增的事件添加到事件末尾形成一个事件脉络,这种方法虽然能够快速获取到事件脉络,但无法基于用户的需求来形成与用户关注倾向相匹配的事件脉络,这导致用户体验度降低。
发明内容
本公开实施例提供一种事件脉络生成方法及装置。
第一方面,本公开实施例提供了一种事件脉络生成方法,包括:
获取用户的需求特征;
将预定话题下的全部事件节点按时间先后顺序进行排序;
基于设定的算法要素和全部所述事件节点,根据增强学习算法训练得出决策模型;其中,所述算法要素包括:状态描述、动作集合以及评价函数;所述状态描述包括:当前脉络、当前待判断事件节点和后续可选事件节点三个元素;所述动作集合包括:选择当前判断节点、跳过当前判断节点和结束生成;所述评价函数与用户需求因子相关,用于计算一条脉络的价值分值,所述用户需求因子基于所获取的用户的需求特征构建;
利用所述决策模型遍历全部所述事件节点,以生成所述预定话题的事件脉络,所述事件脉络包括多个事件节点。
在一些实施例中,所述用户需求因子为:
其中,Sintent表示脉络所对应的用户需求因子的取值,q表示用户的需求特征,vi表示当前脉络中的第i个事件节点的事件特征,n表示脉络中事件节点的数量,sim(q,vi)表示用户的需求特征q与事件特征vi的相似度。
在一些实施例中,所述评价函数中还与脉络合理因子、脉络长度因子和脉络新颖度因子中的一个或多个相关。
在一些实施例中,所述脉络合理因子为:
其中,Ssmooth表示脉络对应的脉络合理因子的取值,vi表示脉络中的第i个事件节点的事件特征,p(vi+1|vi)为预先训练得到的事件节点顺延概率函数,表示由当前事件节点vi顺延至下一事件节点vi+1的概率,sigmoid()函数为下述函数:
在一些实施例中,所述脉络长度因子为:
其中,Slength表示脉络所对应的脉络长度因子的取值,l表示脉络中事件节点的数量。
在一些实施例中,所述脉络新颖度因子为:
Snew=1-sigmoid(Tnew-tv)
其中,Snew为脉络所对应的脉络新颖度因子的取值,Tnew为所有所述事件节点中最新的节点日期;tv为脉络中的所有事件节点中最新一个节点的日期;sigmoid()函数为下述函数:
在一些实施例中,所述评价函数与所述用户需求因子、所述脉络合理因子、所述脉络长度因子以及所述脉络新颖度因子均相关,所述评价函数为:
S=a*Sintent+b*Ssmooth+c*Slenth+d*Snew
其中,S为脉络所对应的价值分值,所述Sintent为所述用户需求因子的取值,所述Ssmooth为所述脉络合理因子的取值,所述Slength为所述脉络长度因子的取值,所述Snew为所述脉络新颖度因子的取值;参数a、b、c和d为评价函数中各因子的调节权重。
另一方面,本公开还提供一种事件脉络生成装置,包括:
获取模块,用于获取用户的需求特征;
排序模块,用于将预定话题下的全部事件节点按时间先后顺序进行排序;
训练模块,用于基于设定的算法要素和全部所述事件节点,根据增强学习算法训练得出决策模型;其中,所述算法要素包括:状态表示、动作集合以及评价函数;其中,所述算法要素包括:状态描述、动作集合以及评价函数;所述状态描述包括:当前脉络、当前待判断事件节点和后续可选事件节点三个元素;所述动作集合包括:选择当前判断节点、跳过当前判断节点和结束生成;所述评价函数与用户需求因子相关,用于计算一条脉络的价值分值,所述用户需求因子基于所获取的用户的需求特征构建;
生成模块,用于利用所述训练模块所训练出的决策模型遍历全部所述事件节点,以生成所述预定话题的事件脉络,所述事件脉络包括多个事件节点。
在一些实施例中,所述用户需求因子为:
其中,Sintent表示脉络所对应的用户需求因子的取值,q表示用户的需求特征,vi表示当前脉络中的第i个事件节点的事件特征,n表示脉络中事件节点的数量,sim(q,vi)表示用户的需求特征q与节点事件vi的事件特征的相似度。
在一些实施例中,所述评价函数中还与脉络合理因子、脉络长度因子和脉络新颖度因子中的一个或多个相关。
在一些实施例中,
所述脉络合理因子为:
其中,Ssmooth表示脉络对应的脉络合理因子的取值,vi表示脉络中的第i个事件节点的事件特征,p(vi+1|vi)为预先训练得到的事件节点顺延概率函数,表示由当前事件节点vi顺延至下一事件节点vi+1的概率,sigmoid()函数为下述函数:
在一些实施例中,所述脉络长度因子为:
其中,Slength表示脉络所对应的脉络长度因子的取值,l表示脉络中事件节点的数量。
在一些实施例中,所述脉络新颖度因子为:
Snew=1-sigmoid(Tnew-tv)
其中,Snew为脉络所对应的脉络新颖度因子的取值,Tnew为所有所述事件节点中最新的节点日期;tv为脉络中的所有事件节点中最新一个节点的日期;sigmoid()函数为下述函数:
在一些实施例中,所述评价函数与所述用户需求因子、所述脉络合理因子、所述脉络长度因子以及所述脉络新颖度因子均相关,所述评价函数为:
S=a*Sintent+b*Ssmooth+c*Slenth+d*Snew
其中,S为脉络所对应的价值分值,所述Sintent为所述用户需求因子的取值,所述Ssmooth为所述脉络合理因子的取值,所述Slength为所述脉络长度因子的取值,所述Snew为所述脉络新颖度因子的取值;参数a、b、c和d为评价函数中各因子的调节权重。
再一方面,本公开还提供一种服务器,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本公开所提供的方法。
最后一方面,本公开提供一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现本公开所提供的方法。
本公开实施例提供的事件脉络生成方法及装置,设置评价函数与用户的需求因子相关,并利用该评价函数,基于增强学习算法来生成预定话题的事件脉络,从而使得最终生成的事件脉络能够与用户的需求相关,即,考虑用户的关注倾向,进而提高了用户获取事件脉络的体验度。
附图说明
附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
图1为本公开实施例提供的一种事件脉络生成方法的流程图;
图2为本公开实施例提供的一种事件脉络生成装置的结构示意图。
具体实施方式
为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的事件脉络生成方法及装置进行详细描述。
在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。
如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。
如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或其群组。
本文所述实施例可借助本公开的理想示意图而参考平面图和/或截面图进行描述。因此,可根据制造技术和/或容限来修改示例图示。因此,实施例不限于附图中所示的实施例,而是包括基于制造工艺而形成的配置的修改。因此,附图中例示的区具有示意性属性,并且图中所示区的形状例示了元件的区的具体形状,但并不旨在是限制性的。
除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
本公开提供的事件脉络生成方法基于增强学习算法来实现,即将增强学习算法应用至事件脉络生成场景中,通过设置增强学习算法的算法要素来使得所生成的事件脉络能够考虑用户的关注倾向。
如图1所示,本公开实施例提供的事件脉络生成方法包括:
步骤S1,获取用户的需求特征。
步骤S2,将预定话题下的全部事件节点按时间先后顺序进行排序。
步骤S3,基于设定的算法要素和全部事件节点,根据增强学习算法训练得出决策模型。
步骤S4,利用所述决策模型遍历全部事件节点,以生成所述预定话题的事件脉络。
在步骤S1中,用户需求特征指的是能表达用户关注倾向的一个文本或者是将文本向量化表示的一个向量,当然还可以是基于其他任意的算法模型转化出的其他表现形式,用户需求特征可由用户自行提供或基于用户肖像来提取。
在步骤S2中,预定话题下的全部事件节点指的是与该预定话题相关的在一段时间内所发生的所有事件报道,每个事件报道均称为一个事件节点,每个事件节点具有特定的发生时间,例如预定话题为“某明星离婚事件”,该话题相关的事件节点包括“某年某月某日,某明星被拍到与神秘女子同游”、“某年某月某日,某明星出轨被抓”、“某年某月某日,某明星偷偷转移婚内财产”等等,所述事件节点可以通过在网上查找获取。
在步骤S3中,首先对增强学习算法的算法过程进行简单介绍,增强学习算法是一种智能学习算法,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题,也就是说,增强学习算法能够训练出一个决策模型,使得智能体能够在某个状态下选择做出回报最高的动作,增强学习算法无需额外的训练样本,训练样本完全由智能体不断尝试产生。在使用增强学习算法时,通常只需要构建三个算法要素即可使用增强学习算法进行增强学习训练,该三个算法要素为应用增强学习算法进行增强学习训练所必须的要素,分别为:1.状态描述,2.动作集合,3.评价函数,其中,状态描述表示智能体当前所处的环境状态,动作集合表示智能体在某个环境状态下所能做出的所有动作的集合,评价函数用于计算智能体在当前状态下选择做出动作集合中的动作时,所能得到的回报值,即价值分数。增强学习算法的增强学习训练过程如下:
1)初始化一个决策模型;该决策模型表示智能体在某个状态下做出某个动作所能得到的价值分数的对应关系,该决策模型可以以矩阵形式表示,或者还可以以其他函数形式表示。
2)使智能体随机处于某一个状态下,基于评价函数计算使智能体随机选择做出动作集合中的某一个动作的价值分数,并将所得的价值分数更新至所述决策模型中对应的位置,判断智能体在选择做出该动作后所达到的新状态是否为预设的目标状态,若未达到,则在当前新状态下继续做出选择以及计算价值分数,并更新决策模型,直至达到预设的目标状态。
3)重复步骤2),直到达到预定的迭代次数或决策模型达到收敛状态为止。
增强学习算法的实现过程为本领域的现有技术,本公开实施例不再做进一步的详细描述。本公开实施例在将增强学习算法应用至事件脉络生成场景中时,所构建的算法要素如下:
算法要素包括:状态描述、动作集合以及评价函数;其中,状态描述包括:当前脉络、当前待判断事件节点和后续可选事件节点三个元素,该三个元素组合在一起用来表示在事件脉络生成过程中的一个状态,该三个元素可以以向量的形式进行表示,当然还可以以其他形式进行表示,只要能表征智能体在学习过程中的一个状态即可;动作集合包括:选择当前判断节点、跳过当前判断节点和结束生成;评价函数为预设的价值评价函数,用于计算一条脉络的价值分值,该评价函数为一个具体的函数,本公开实施例中,该评价函数与用户需求因子相关,所述用户需求因子指的是与用户的需求相关的,用于构成评价函数的因子,该用户需求因子基于所获取到的用户的需求特征来构建,所述相关是指相应因子作为该评价函数中的一个变量存在。本公开中,需求因子只要能体现出用户需求与事件节点的关联度即可,当然,评价函数中还可包含其他因子,即,当在生成事件脉络过程中还考虑其他因素时,可加入其他因子。
在基于事件脉络生成场景构建出适用于增强学习算法的算法要素后,将上述算法要素应用至增强学习算法中,通过对所获取到的某话题下的所有事件节点进行训练即可得到一个决策模型,该决策模型表示在事件脉络生成过程中,每个事件脉络状态下,选择后续各事件节点所能得到的价值分值,这些价值分值充分考虑了用户的需求,与用户的关注倾向息息相关。
基于增强学习算法进行训练的训练过程属于本领域的现有技术,本公开实施例在描述了将事件脉络生成场景应用至增强学习算法中的算法要素后,不再对具体的训练过程进行赘述,具体训练过程可参见现有技术中的增强学习算法训练过程。
另外,本公开实施例中对所采用的增强学习算法不做具体限定,只要能实现上述过程的增强学习算法均可,当然优选的,可选择Q-Learning算法以及DQN算法。
在步骤S4中,当在步骤S3中训练得出决策模型后,按时间先后顺序遍历所有事件节点,基于决策模型选择出在每个当前状态下能够获得最大价值分数的下一个事件节点,并将选择出的事件节点添加至当前已经形成的事件脉络上,从而形成事件脉络,最终形成的事件脉络中包括多个事件节点。
本公开实施例提供的事件脉络生成方法,设置评价函数与用户的需求因子相关,并利用该评价函数,基于增强学习算法来生成预定话题的事件脉络,从而使得最终生成的事件脉络能够与用户的需求相关,即,考虑了用户的关注倾向,进而提高了用户获取事件脉络的体验度。
在一些实施例中,基于上述实施例所描述的评价函数中的用户需求因子可限定为:
在公式(1)中,Sintent表示脉络所对应的用户需求因子的取值,q表示用户的需求特征,vi表示当前脉络中的第i个事件节点的事件特征,需要说明的是,需求特征q和事件特征vi可以以文本形式进行表示,也可以是将文本向量化后进行表示,当然还可以是基于其他任意的算法模型转化出的表现形式;n表示当前脉络中事件节点的数量,sim(q,vi)表示用户的需求特征q与事件特征vi的相似度,该相似度的计算可以采用本领域中任意的文本相似度计算方法,例如余弦相似度算法、Jaccard相似度算法等。
在一些实施例中,基于上述实施例所构造的评价函数还与脉络合理因子、脉络长度因子以及脉络新颖度因子中的一个或多个相关。
其中,脉络合理因子用来衡量脉络中相邻事件节点之间的顺延关系,通过在评价函数中加入该因子,能够使所得出的脉络中的各事件节点之间的逻辑更顺畅清晰;脉络长度因子表征的是对脉络的长度进行的限定,脉络的长度指的是脉络中事件节点的数量,加入该因子能够使最终获得脉络趋于符合预先所设定的长度;脉络新颖度因子用来表征脉络中事件节点的新鲜度,该新鲜度指的是事件节点的日期新鲜度,加入该因子,能够使最终获得的事件脉络中的事件节点尽可能为日期较新的节点,避免脉络中过多包含时间陈旧的事件节点。
上述因子可以基于现有技术而进行自由构造,只要能使所构造出的因子在评价函数中表征出脉络的对应特性即可。
在一些实施例中,脉络合理因子可设置为:
在公式(2)中,Ssmooth表示脉络对应的脉络合理因子的取值,vi表示脉络中的第i个事件节点的事件特征,同公式(1)中含义相同,p(vi+1|vi)为预先训练得到的事件节点顺延概率函数,表示由当前事件节点vi顺延至下一事件节点vi+1的概率,该顺延概率函数可基于神经网络二分模型对预先准备的语料库进行训练获得,该训练过程属于本领域的现有技术,此处不再赘述;公式(2)中sigmoid()函数采用下述函数:
在一些实施例中,脉络长度因子可设置为:
在公式(3)中,Slength表示脉络所对应的脉络长度因子的取值,l表示脉络中事件节点的数量;该脉络长度因子表示,当脉络中的事件节点的数量在4-11范围内时,该因子的取值为1,当事件节点数量不在该范围内,该因子的取值为0。
在一些实施例中,脉络新颖度因子可设置为:
Snew=1-sigmoid(Tnew-tv) (4)
在公式(4)中,Snew为脉络所对应的脉络新颖度因子的取值,Tnew为全部事件节点中最新的节点日期;tv为当前脉络中的所有事件节点中最新一个节点的日期;sigmoid()函数采用下述函数:
在一些实施中,当评价函数与上述所描述的用户需求因子、脉络合理因子、脉络长度因子以及脉络新颖度因子均相关时,评价函数可构造为:
S=a*Sintent+b*Ssmooth+c*Slenth+d*Snew (5)
在公式(5)中,S为脉络所对应的价值分值,Sintent为用户需求因子的取值,Ssmooth为脉络合理因子的取值,Slength为脉络长度因子的取值,Snew为脉络新颖度因子的取值;参数a、b、c和d为评价函数中各因子的调节权重,各因子的调节权重可根据实际情况而进行调配,由本领域技术人员根据实际经验进行设置。
本公开实施例还提供一种事件脉络生成装置,用于实现本公开上述实施例所提供的事件脉络生成方法。
如图2所示,该装置包括:获取模块11、排序模块12、训练模块13以及生成模块14;其中,获取模块11用于获取用户的需求特征;排序模块12用于将预定话题下的全部事件节点按时间先后顺序进行排序;训练模块13用于基于设定的算法要素和全部所述事件节点,根据增强学习算法训练得出决策模型;其中,所述算法要素包括:状态表示、动作集合以及评价函数;其中,所述算法要素包括:状态描述、动作集合以及评价函数;所述状态描述包括:当前脉络、当前待判断事件节点和后续可选事件节点三个元素;所述动作集合包括:选择当前判断节点、跳过当前判断节点和结束生成;所述评价函数与用户需求因子相关,用于计算一条脉络的价值分值,所述用户需求因子基于所获取的用户的需求特征构建;生成模块14用于利用所述训练模块所训练出的决策模型遍历全部所述事件节点,以生成所述预定话题的事件脉络,所述事件脉络包括多个事件节点。
本公开实施例中上述各个模块的具体工作原理请参见方法实施例中对应步骤的介绍,此处不再赘述。
本公开实施例提供的事件脉络生成装置,设置评价函数与用户的需求因子相关,并利用该评价函数,基于增强学习算法来生成预定话题的事件脉络,从而使得最终生成的事件脉络能够与用户的需求相关,即,考虑了用户的关注倾向,进而提高了用户获取事件脉络的体验度。
在一些实施例中,训练模块13所采用的评价函数中的用户需求因子可设置为:
在公式(1)中,Sintent表示脉络所对应的用户需求因子的取值,q表示用户的需求特征,vi表示当前脉络中的第i个事件节点的事件特征,需要说明的是,需求特征q和事件特征vi可以以文本形式进行表示,也可以是将文本向量化后进行表示,当然还可以是基于其他任意的算法模型转化出的表现形式;n表示当前脉络中事件节点的数量,sim(q,vi)表示用户的需求q与事件节点vi的相似度,该相似度的计算可以采用本领域中任意的文本相似度计算方法,例如余弦相似度算法、Jaccard相似度算法等。
在一些实施例中,训练模块13所采用的评价函数还与脉络合理因子、脉络长度因子以及脉络新颖度因子中的一个或多个相关。
其中,脉络合理因子用来衡量脉络中相邻事件节点之间的顺延关系,通过在评价函数中加入该因子,能够使所得出的脉络中的各事件节点之间的逻辑更顺畅清晰;脉络长度因子表征的是对脉络的长度进行的限定,脉络的长度指的是脉络中事件节点的数量,加入该因子能够使最终获得脉络趋于符合预先所设定的长度;脉络新颖度因子用来表征脉络中事件节点的新鲜度,该新鲜度指的是事件节点的日期新鲜度,加入该因子,能够使最终获得的事件脉络中的事件节点尽可能为日期较新的节点,避免脉络中过多包含时间陈旧的事件节点。
上述因子可以基于现有技术而进行自由构造,只要能使所构造出的因子在评价函数中表征出脉络的对应特性即可。
在一些实施例中,脉络合理因子可设置为:
在公式(2)中,Ssmooth表示脉络对应的脉络合理因子的取值,vi表示脉络中的第i个事件节点的事件特征,同公式(1)中含义相同,p(vi+1|vi)为预先训练得到的事件节点顺延概率函数,表示由当前事件节点vi顺延至下一事件节点vi+1的概率,该顺延概率函数可基于神经网络二分模型对预先准备的语料库进行训练获得,该训练过程属于本领域的现有技术,此处不再赘述;公式(2)中sigmoid()函数采用下述函数:
在一些实施例中,脉络长度因子可设置为:
在公式(3)中,Slength表示脉络所对应的脉络长度因子的取值,l表示脉络中事件节点的数量;该脉络长度因子表示,当脉络中的事件节点的数量在4-11范围内时,该因子的取值为1,当事件节点数量不在该范围内,该因子的取值为0。
在一些实施例中,脉络新颖度因子可设置为:
Snew=1-sigmoid(Tnew-tv) (4)
在公式(4)中,Snew为脉络所对应的脉络新颖度因子的取值,Tnew为全部事件节点中最新的节点日期;tv为当前脉络中的所有事件节点中最新一个节点的日期;sigmoid()函数采用下述函数:
在一些实施中,当评价函数与上述所描述的用户需求因子、脉络合理因子、脉络长度因子以及脉络新颖度因子均相关时,评价函数可构造为:
S=a*Sintent+b*Ssmooth+c*Slenth+d*Snew (5)
在公式(5)中,S为脉络所对应的价值分值,Sintent为用户需求因子的取值,Ssmooth为脉络合理因子的取值,Slength为脉络长度因子的取值,Snew为脉络新颖度因子的取值;参数a、b、c和d为评价函数中各因子的调节权重,各因子的调节权重可根据实际情况而进行调配,由本领域技术人员根据实际经验进行设置。
本公开实施例还提供一种电子设备/客户端/终端/服务器,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当该一个或多个程序被该一个或多个处理器执行,使得该一个或多个处理器实现本公开实施例所提供的事件脉络生成方法。
本公开实施例还提供一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现本公开实施例所提供的事件脉络生成方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。
Claims (16)
1.一种事件脉络生成方法,其特征在于,包括:
获取用户的需求特征;
将预定话题下的全部事件节点按时间先后顺序进行排序;
基于设定的算法要素和全部所述事件节点,根据增强学习算法训练得出决策模型;其中,所述算法要素包括:状态描述、动作集合以及评价函数;所述状态描述包括:当前脉络、当前待判断事件节点和后续可选事件节点三个元素;所述动作集合包括:选择当前判断节点、跳过当前判断节点和结束生成;所述评价函数与用户需求因子相关,用于计算一条脉络的价值分值,所述用户需求因子基于所获取的用户的需求特征构建;
利用所述决策模型遍历全部所述事件节点,以生成所述预定话题的事件脉络,所述事件脉络包括多个事件节点。
2.根据权利要求1所述的方法,其中,所述用户需求因子为:
其中,Sintent表示脉络所对应的用户需求因子的取值,q表示用户的需求特征,vi表示当前脉络中的第i个事件节点的事件特征,n表示脉络中事件节点的数量,sim(q,vi)表示用户的需求特征q与事件特征vi的相似度。
3.根据权利要求1所述的方法,其中,所述评价函数中还与脉络合理因子、脉络长度因子和脉络新颖度因子中的一个或多个相关。
4.根据权利要求3所述的方法,其中,
所述脉络合理因子为:
其中,Ssmooth表示脉络对应的脉络合理因子的取值,vi表示脉络中的第i个事件节点的事件特征,p(vi+1|vi)为预先训练得到的事件节点顺延概率函数,表示由当前事件节点vi顺延至下一事件节点vi+1的概率,sigmoid()函数为下述函数:
5.根据权利要求3所述的方法,其中,所述脉络长度因子为:
其中,Slength表示脉络所对应的脉络长度因子的取值,l表示脉络中事件节点的数量。
6.根据权利要求3所述的方法,其中,所述脉络新颖度因子为:
Snew=1-sigmoid(Tnew-tv)
其中,Snew为脉络所对应的脉络新颖度因子的取值,Tnew为所有所述事件节点中最新的节点日期;tv为脉络中的所有事件节点中最新一个节点的日期;sigmoid()函数为下述函数:
7.根据权利要求3-6任一项所述的方法,其中,所述评价函数与所述用户需求因子、所述脉络合理因子、所述脉络长度因子以及所述脉络新颖度因子均相关,所述评价函数为:
S=a*Sintent+b*Ssmooth+c*Slenth+d*Snew
其中,S为脉络所对应的价值分值,所述Sintent为所述用户需求因子的取值,所述Ssmooth为所述脉络合理因子的取值,所述Slength为所述脉络长度因子的取值,所述Snew为所述脉络新颖度因子的取值;参数a、b、c和d为评价函数中各因子的调节权重。
8.一种事件脉络生成装置,其特征在于,包括:
获取模块,用于获取用户的需求特征;
排序模块,用于将预定话题下的全部事件节点按时间先后顺序进行排序;
训练模块,用于基于设定的算法要素和全部所述事件节点,根据增强学习算法训练得出决策模型;其中,所述算法要素包括:状态表示、动作集合以及评价函数;其中,所述算法要素包括:状态描述、动作集合以及评价函数;所述状态描述包括:当前脉络、当前待判断事件节点和后续可选事件节点三个元素;所述动作集合包括:选择当前判断节点、跳过当前判断节点和结束生成;所述评价函数与用户需求因子相关,用于计算一条脉络的价值分值,所述用户需求因子基于所获取的用户的需求特征构建;
生成模块,用于利用所述训练模块所训练出的决策模型遍历全部所述事件节点,以生成所述预定话题的事件脉络,所述事件脉络包括多个事件节点。
9.根据权利要求8所述的装置,其中,所述用户需求因子为:
其中,Sintent表示脉络所对应的用户需求因子的取值,q表示用户的需求特征,vi表示当前脉络中的第i个事件节点的事件特征,n表示脉络中事件节点的数量,sim(q,vi)表示用户的需求特征q与节点事件vi的事件特征的相似度。
10.根据权利要求8所述的装置,其中,所述评价函数中还与脉络合理因子、脉络长度因子和脉络新颖度因子中的一个或多个相关。
11.根据权利要求10所述的装置,其中,所述脉络合理因子为:
其中,Ssmooth表示脉络对应的脉络合理因子的取值,vi表示脉络中的第i个事件节点的事件特征,p(vi+1|vi)为预先训练得到的事件节点顺延概率函数,表示由当前事件节点vi顺延至下一事件节点vi+1的概率,sigmoid()函数为下述函数:
12.根据权利要求10所述的装置,其中,所述脉络长度因子为:
其中,Slength表示脉络所对应的脉络长度因子的取值,l表示脉络中事件节点的数量。
13.根据权利要求10所述的装置,其中,所述脉络新颖度因子为:
Snew=1-sigmoid(Tnew-tv)
其中,Snew为脉络所对应的脉络新颖度因子的取值,Tnew为所有所述事件节点中最新的节点日期;tv为脉络中的所有事件节点中最新一个节点的日期;sigmoid()函数为下述函数:
14.根据权利要求10-13任一项所述的装置,其中,所述评价函数与所述用户需求因子、所述脉络合理因子、所述脉络长度因子以及所述脉络新颖度因子均相关,所述评价函数为:
S=a*Sintent+b*Ssmooth+c*Slenth+d*Snew
其中,S为脉络所对应的价值分值,所述Sintent为所述用户需求因子的取值,所述Ssmooth为所述脉络合理因子的取值,所述Slength为所述脉络长度因子的取值,所述Snew为所述脉络新颖度因子的取值;参数a、b、c和d为评价函数中各因子的调节权重。
15.一种服务器,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7任一所述的方法。
16.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910532944.6A CN110232077B (zh) | 2019-06-19 | 2019-06-19 | 事件脉络生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910532944.6A CN110232077B (zh) | 2019-06-19 | 2019-06-19 | 事件脉络生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110232077A true CN110232077A (zh) | 2019-09-13 |
CN110232077B CN110232077B (zh) | 2021-05-14 |
Family
ID=67856253
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910532944.6A Active CN110232077B (zh) | 2019-06-19 | 2019-06-19 | 事件脉络生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110232077B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112307278A (zh) * | 2020-10-26 | 2021-02-02 | 中国科学院计算技术研究所 | 一种任意尺度的话题脉络实时生成方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102012917A (zh) * | 2010-11-26 | 2011-04-13 | 百度在线网络技术(北京)有限公司 | 信息处理装置以及处理方法 |
US8577671B1 (en) * | 2012-07-20 | 2013-11-05 | Veveo, Inc. | Method of and system for using conversation state information in a conversational interaction system |
CN104933129A (zh) * | 2015-06-12 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 基于微博的事件脉络获取方法和系统 |
US20160313868A1 (en) * | 2013-12-20 | 2016-10-27 | Fuliang Weng | System and Method for Dialog-Enabled Context-Dependent and User-Centric Content Presentation |
CN106407473A (zh) * | 2016-10-27 | 2017-02-15 | 西南石油大学 | 一种基于事件相似性建模的获取事件脉络的方法及其系统 |
CN106844466A (zh) * | 2016-12-21 | 2017-06-13 | 百度在线网络技术(北京)有限公司 | 事件脉络生成方法和装置 |
CN107229645A (zh) * | 2016-03-24 | 2017-10-03 | 腾讯科技(深圳)有限公司 | 信息处理方法、服务平台及客户端 |
US20170300859A1 (en) * | 2009-12-28 | 2017-10-19 | Cognizant Trizetto Software Group, Inc. | Processor-Implemented Method For Establishing an Event Sequence For Deliverables |
CN109614500A (zh) * | 2018-11-15 | 2019-04-12 | 陈包容 | 一种自动创建多层次事件和场景图谱特征的方法、装置及其应用 |
-
2019
- 2019-06-19 CN CN201910532944.6A patent/CN110232077B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170300859A1 (en) * | 2009-12-28 | 2017-10-19 | Cognizant Trizetto Software Group, Inc. | Processor-Implemented Method For Establishing an Event Sequence For Deliverables |
CN102012917A (zh) * | 2010-11-26 | 2011-04-13 | 百度在线网络技术(北京)有限公司 | 信息处理装置以及处理方法 |
US8577671B1 (en) * | 2012-07-20 | 2013-11-05 | Veveo, Inc. | Method of and system for using conversation state information in a conversational interaction system |
US20160313868A1 (en) * | 2013-12-20 | 2016-10-27 | Fuliang Weng | System and Method for Dialog-Enabled Context-Dependent and User-Centric Content Presentation |
CN104933129A (zh) * | 2015-06-12 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 基于微博的事件脉络获取方法和系统 |
CN107229645A (zh) * | 2016-03-24 | 2017-10-03 | 腾讯科技(深圳)有限公司 | 信息处理方法、服务平台及客户端 |
CN106407473A (zh) * | 2016-10-27 | 2017-02-15 | 西南石油大学 | 一种基于事件相似性建模的获取事件脉络的方法及其系统 |
CN106844466A (zh) * | 2016-12-21 | 2017-06-13 | 百度在线网络技术(北京)有限公司 | 事件脉络生成方法和装置 |
CN109614500A (zh) * | 2018-11-15 | 2019-04-12 | 陈包容 | 一种自动创建多层次事件和场景图谱特征的方法、装置及其应用 |
Non-Patent Citations (4)
Title |
---|
DONGSHENG ZHAI ET AL: "Design and implementation of a topic-focused search engine based on Multi-Agent System", 《2008 IEEE INTERNATIONAL CONFERENCE ON SERVICE OPERATIONS AND LOGISTICS, AND INFORMATICS》 * |
MAXIMILIAN VIERMETZ ET AL: "Tracking Topic Evolution in News Environments", 《2008 10TH IEEE CONFERENCE ON E-COMMERCE TECHNOLOGY AND THE FIFTH IEEE CONFERENCE ON ENTERPRISE COMPUTING, E-COMMERCE AND E-SERVICES》 * |
张龙飞: "网络热点事件时序可视化技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
马朋委: "Q_learning强化学习算法的改进及应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112307278A (zh) * | 2020-10-26 | 2021-02-02 | 中国科学院计算技术研究所 | 一种任意尺度的话题脉络实时生成方法及系统 |
CN112307278B (zh) * | 2020-10-26 | 2024-02-23 | 中国科学院计算技术研究所 | 一种任意尺度的话题脉络实时生成方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110232077B (zh) | 2021-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zellers et al. | From recognition to cognition: Visual commonsense reasoning | |
Niu et al. | Recursive visual attention in visual dialog | |
Reason | Human error | |
CN109376844A (zh) | 基于云平台和模型推荐的神经网络自动训练方法和装置 | |
CN109086439A (zh) | 信息推荐方法及装置 | |
CN109478204A (zh) | 非结构化文本的机器理解 | |
Sherry | The complexity paradigm for studying human communication: A summary and integration of two fields | |
WO2013119438A1 (en) | Apparatus, systems and methods for interactive dissemination of knowledge | |
CN109002492A (zh) | 一种基于LightGBM的绩点预测方法 | |
CN109902187A (zh) | 一种特征知识图谱的构建方法及装置、终端设备 | |
CN111506755A (zh) | 图片集的分类方法和装置 | |
US9058328B2 (en) | Search device, search method, search program, and computer-readable memory medium for recording search program | |
CN114154839B (zh) | 一种基于在线教育平台数据的课程推荐方法 | |
CN110148393A (zh) | 音乐生成方法、装置和系统以及数据处理方法 | |
CN105138684B (zh) | 一种信息处理方法和信息处理装置 | |
CN110414001A (zh) | 语句生成方法和装置、存储介质及电子装置 | |
CN110232077A (zh) | 事件脉络生成方法及装置 | |
Hagedoorn et al. | Massive open online courses temporal profiling for dropout prediction | |
Erwianda et al. | Improving confusion-state classifier model using xgboost and tree-structured parzen estimator | |
US20170371970A1 (en) | Automated storyline content selection and qualitative linking based on context | |
CN109657133A (zh) | 交友对象推荐方法、装置、设备和存储介质 | |
CN112507185B (zh) | 用户肖像的确定方法和装置 | |
CN115423031A (zh) | 一种模型训练的方法以及相关装置 | |
Silverman et al. | What is a good pattern of life model? Guidance for simulations | |
Wang et al. | [Retracted] Application of Improved Machine Learning and Fuzzy Algorithm in Educational Information Technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |