CN107977367B - 一种文本展示方法及服务器 - Google Patents

一种文本展示方法及服务器 Download PDF

Info

Publication number
CN107977367B
CN107977367B CN201610920326.5A CN201610920326A CN107977367B CN 107977367 B CN107977367 B CN 107977367B CN 201610920326 A CN201610920326 A CN 201610920326A CN 107977367 B CN107977367 B CN 107977367B
Authority
CN
China
Prior art keywords
data
behavior
pushed
performance
content item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610920326.5A
Other languages
English (en)
Other versions
CN107977367A (zh
Inventor
刘康
石卫国
蔡静
张雪娇
窦晓妍
张秋明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Beijing Co Ltd
Original Assignee
Tencent Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Beijing Co Ltd filed Critical Tencent Technology Beijing Co Ltd
Priority to CN201610920326.5A priority Critical patent/CN107977367B/zh
Priority to PCT/CN2017/101852 priority patent/WO2018072577A1/zh
Publication of CN107977367A publication Critical patent/CN107977367A/zh
Application granted granted Critical
Publication of CN107977367B publication Critical patent/CN107977367B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Abstract

本申请公开了一种文本展示方法及服务器。该方法包括:获取针对一主题的至少一个对象的行为表现数据;根据至少一个对象的行为表现数据以及每个对象的历史表现数据和/或表现期望数据,确定该主题下的至少一个待推送内容项,并生成每个待推送内容项的文本;及,对于每个待推送内容项,根据该主题的至少一项预设的推送热度确定展示该待推送内容项所对应文本的优先级,并将所确定的优先级和该待推送内容项所对应的文本发送给客户端,以使客户端根据优先级展示该文本。利用这些技术方案,能够提高文本展示的效率以及服务器的资源利用率。

Description

一种文本展示方法及服务器
技术领域
本申请涉及数据处理技术领域,尤其涉及一种文本展示方法及服务器。
背景技术
目前,媒体机构在日常编辑稿件、发布各类报道时,可以通过某些软件自动生成文本。通常采用的方式是对数据库的数据进行调用,组合成用于直播的文字或者篇幅稍大的报道。例如,对于体育赛事,在比赛过程中和结束时生成不同阶段的报道,最终推送到一个固定的展示页面集中展示。
考虑到体育赛事众多,例如在奥运期间,同一时间段内多项比赛同时进行,上述方式生成的文本无法覆盖到所有可能的新闻点。例如,对于冷门赛事爆热或者热门赛事遇冷等情况,会出现漏稿的情况。由于缺乏对新闻点的深度挖掘,所生成的文本不够全面。因此,降低了所推送文本的新闻效果,无法满足用户对各类赛事信息的了解需求,也降低了文本展示设备的资源利用率。
发明内容
有鉴于此,本发明提供了一种文本展示方法及服务器,能够提高文本展示的效率以及服务器的资源利用率。
本发明的技术方案是这样实现的:
本发明提供了一种文本展示方法,所述方法包括:
获取针对一主题的至少一个对象的行为表现数据;
根据所述至少一个对象的行为表现数据以及每个对象的历史表现数据和/或表现期望数据,确定该主题下的至少一个待推送内容项,并生成每个待推送内容项的文本;及,
对于每个待推送内容项,根据该主题的至少一项预设的推送热度确定展示该待推送内容项所对应文本的优先级,并将所确定的优先级和该待推送内容项所对应的文本发送给客户端,以使所述客户端根据所述优先级展示该文本。
本发明还提供了一种服务器,包括:
获取模块,用于获取针对一主题的至少一个对象的行为表现数据;
第一确定模块,用于根据所述获取模块获取到的至少一个对象的行为表现数据以及每个对象的历史表现数据和/或表现期望数据,确定该主题下的至少一个待推送内容项;
生成模块,用于生成所述第一确定模块确定的每个待推送内容项的文本;
第二确定模块,用于对于所述第一确定模块确定的每个待推送内容项,根据该主题的至少一项预设的推送热度确定展示该待推送内容项所对应文本的优先级;及,
发送模块,用于将所述第二确定模块确定的优先级和所述生成模块生成的该待推送内容项所对应的文本发送给客户端,以使所述客户端根据所述优先级展示该文本。
与现有技术相比,本发明提供了一种基于数据异动发掘新闻点的方法,能够从新闻的角度区别出不同内容项的重要性差异,真正实现机器人代替人工挖掘并报道爆冷、爆热的新闻点,出稿速度快,并且可以批量生产稿件,做到爆冷、爆热的赛事内容也无漏稿,节省了大量人力。最终向用户展示时,可以按照不同优先级推送已经过梳理、有侧重的各类报道。因此,真正实现了机器报道的类人化,提高了文本推送的新闻效果,满足了用户对各类赛事信息的了解需求,提高了文本展示的用户接受率,也提高了服务器的资源利用率。
附图说明
为了更清楚的说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。其中,
图1为本发明一实施例所涉及的实施环境的结构示意图;
图2为依据本发明一实施例的文本展示方法的示例性流程图;
图3为依据本发明一实施例的计算热度因子的示例性流程图;
图4为依据本发明一实施例的所生成文本的示意图;
图5为依据本发明另一实施例的文本展示方法的示例性流程图;
图6为依据本发明一实施例的展示文本的示意图;
图7为依据本发明另一实施例的展示文本的示意图;
图8依据本发明一实施例的服务器的结构示意图;
图9为依据本发明另一实施例的服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例所涉及的实施环境的结构示意图。如图1所示,文本展示系统100包括服务器110和客户端120。其中,服务器110又包括源行为数据库111、文本素材数据库112和文本展示处理单元113。源行为数据库111中存储有针对各个主题的至少一个对象的行为表现数据,并实时更新;文本素材数据库112中存储有生成文本时所使用到的词组、短语等语料或者预设的文本模板等。
在本发明的实施例中,文本展示处理单元113用于读取源行为数据库111中至少一个对象的行为表现数据,计算该主题下的至少一个热度因子,并结合文本素材数据库112生成文本,进而确定展示每个热度因子所对应文本的优先级。
然后,服务器110将所确定的优先级和生成的文本发送给客户端120,客户端120作为媒体推广方的应用程序,根据优先级确定的渠道和内容等级向用户推荐展示文本,并提供社交平台供用户进行交互。其中,服务器110和客户端120之间可以进行有线或者无线连接。
图2为依据本发明一实施例的文本展示方法的示例性流程图。该方法应用于服务器。如图2所示,该方法可包括如下步骤:
步骤201,获取针对一主题的至少一个对象的行为表现数据。
本申请中,主题可以为具备比赛性质的各类事件,例如,体育比赛、歌唱比赛、遥控机器人大赛等。主题下的对象即该主题的参与主体,包括人物、动物或者物体。对于每个对象,其行为表现数据包括一个或多个行为以及与每个行为相对应的当前表现评判数据。
在一实施例中,服务器中的源行为数据库(如图1所示)获取并存储针对一主题的实时代码数据。这些代码数据由开发人员按照机器语言编写,并携带有该主题下的内容数据。根据代码的编写规则设置实时代码数据与对象、行为、表现评判数据之间的映射关系,然后根据该映射关系从实时代码数据中识别出每个对象的行为以及当前表现评判数据。
例如,以java作为机器语言为例,根据java的语法规则,将实时代码数据中的多种字段映射为对象、行为、表现评判数据。例如,字段“object”映射到“对象”,字段“action”映射到“行为”,字段“score”映射到“当前表现评判数据”。
在另一实施例中,服务器中的源行为数据库获取并存储针对一主题的多维行为数据,其中包含了每个主题下至少一个对象的行为表现数据。多维行为数据的结构可以表示为:{主题、对象、行为、当前表现评判数据}。
表1列出了根据本发明一实施例的多维行为数据示例。其中,主题对应为体育赛事,对象对应为运动员,行为对应为具体的动作,当前表现评判数据对应为具体的得分。例如,在里约奥运会男子双杠决赛中,运动员邓书弟选择了难度7.2的动作,E分8.566,总分15.766。
Figure BDA0001135566450000041
表1多维行为数据示例
步骤202,根据至少一个对象的行为表现数据以及每个对象的历史表现数据和/或表现期望数据,确定该主题下的至少一个待推送内容项,并生成每个待推送内容项的文本。
本步骤中,服务器获取每个对象的历史表现数据,并设置每个对象的表现期望数据。待推送内容项是指可能被推送的一项内容,例如,具有新闻价值的新闻点或者事件。
在确定至少一个待推送内容项时,具体包括:针对每个对象,根据该对象的行为表现数据以及历史表现数据和/或表现期望数据,进行多项数据的交叉对比,确定该对象对应的内容项是否满足预设的推送条件;若满足该推送条件,则确定该对象对应的内容项为待推送的,并计算得到该对象对应的待推送内容项的热度因子。
以奥运会跆拳道比赛为例,男子58公斤级跆拳道比赛中,中国选手赵帅在并不被看好的情况下获得金牌,并且实现了中国男子选手在奥运会跆拳道金牌零的突破。可见,根据行为表现数据和历史表现数据之间的对比,确定赵帅在此次比赛中的当前成绩有了明显的提升;和表现期望数据相比,获得的金牌成绩显然远远超出媒体、公众或专业人士的预期。因此,服务器确定该内容项满足推送条件,被判定为冷门爆热的新闻点,并量化得到推送该内容项时的热度因子。
在生成每个待推送内容项的文本时,根据本发明的一个实施例,首先,在预设的文本素材数据库中(见图1)选择出与该待推送内容项相匹配的至少一个描述词组,然后,将该待推送内容项所涉及至少一个对象的行为表现数据、历史表现数据和/或表现期望数据以及至少一个描述词组,组合成至少一个段落,连接至少一个段落得到文本。
或者,根据本发明的另一个实施例,预先设置每个热度因子所对应的文本模板。在确定了待推送内容项的热度因子后,将每个待推送内容项所涉及至少一个对象的行为表现数据、历史表现数据和/或表现期望数据以及其他对象的行为表现数据嵌入到该待推送内容项所对应的文本模板中,从而生成文本。
步骤203,对于每个待推送内容项,根据该主题的至少一项预设的推送热度确定展示该待推送内容项所对应文本的优先级,并将所确定的优先级和该待推送内容项所对应的文本发送给客户端,以使客户端根据优先级展示该文本。
由步骤202可知,确定待推送内容项是根据每个对象的行为表现数据、历史表现数据和表现期望数据进行交叉对比得到,即针对的是每个对象。而在展示文本时,还需进一步考虑推送内容项时,该主题是否具备足够的热度。具体地,推送热度可以包括该主题的热门度、该主题下至少一个对象的热门度、该主题所涉及设备/技术的成熟度、该主题所涉及环境/场地的变化程度中的任一项或任意几项。
例如,该主题为奥运会众多赛事中的一项赛事,该主题的热门度是指该赛事是否具备足够的关注度,如男子400米自由泳决赛是关注的热门比赛;在该赛事中对象有运动员孙杨,那么对象的热门度是指孙杨为热门夺冠选手;该主题所涉及设备/物体的成熟度是指赛事所使用设备的技术水平或者物体的水准,例如,游泳比赛中使用的泳衣的功能性是否增强,马术比赛中所使用的赛马的质量如何;该主题所涉及环境/场地的变化程度是指赛事进行时所处的环境或者场地可能的突发情况,例如,马术比赛中突然下大雨,场地变得泥泞,影响到赛马的动作和运动员的成绩;或者,马拉松比赛时突然下大雨,路面湿滑,影响到了运动员的动作和成绩。
本步骤中,所确定的优先级对应了不同的文本展示风格,不同的优先级将对应不同的推送渠道和内容等级。在确定优先级时,服务器将根据所确定的优先级设置展示该文本的推送渠道和内容等级。例如,推送渠道包括实时推送、移动展示、网站展示等,内容等级分为头条级、要闻级、普通级等。这样,客户端根据接收到的优先级指示,通过相应的推送渠道按照所设置的内容等级展示接收到的文本。
通过上述实施例,根据至少一个对象的行为表现数据以及每个对象的历史表现数据和/或表现期望数据,确定该主题下的至少一个待推送内容项,并生成每个待推送内容项的文本,然后,对于每个待推送内容项,根据该主题的至少一项预设的推送热度确定展示该待推送内容项所对应文本的优先级,并将所确定的优先级和该待推送内容项所对应的文本发送给客户端,以使客户端根据优先级展示该文本,提供了一种基于数据异动发掘新闻点的方法,能够区别出不同内容项在新闻角度上的重要性差异,真正实现机器人代替人工挖掘并报道新闻热点,出稿速度快,并且可以做到同时监测多场赛事,批量生产稿件,做到爆冷、爆热的赛事内容也无漏稿,节省了大量人力。最终向用户展示时,按照不同推送渠道推送梳理完毕、有侧重的多个报道。因此,提高了文本展示的效率,真正实现了机器报道的类人化,也提高了服务器的资源利用率。
在步骤202中,确定至少一个待推送内容项时,将根据对象的行为表现数据、历史表现数据、表现期望数据进行多维的交叉对比,判断是否满足预设的推送条件,计算得到该对象对应的待推送内容项的热度因子。所计算出的热度因子,其数值可正可负。若热度因子取值为正值,表示该热度因子所对应的是爆热新闻点;若热度因子取值为负值,表示该热度因子所对应的是爆冷新闻点。
其中,行为表现数据包括一个或多个行为以及与每个行为相对应的当前表现评判数据,历史表现数据包括与每个行为相对应的历史表现评判数据,表现期望数据包括与每个行为相对应的期望表现评判数据。若一主题包括I个对象,第i个对象对应了Ji个行为,j=1…Ji,第j个行为对应的当前表现评判数据表示为si,j。在该对象的历史表现数据中第j个行为对应的历史表现评判数据表示为s′i,j,在表现期望数据中第j个行为对应的期望表现评判数据表示为s″i,j
在本发明的一实施例中,将至少一个对象的行为表现数据以及每个对象的历史表现数据进行比较,计算出一个或多个对象的热度因子。
具体地,针对历史表现数据,预先设置每个行为的第一热度门限,令s′th,j为针对历史表现数据预设的第j个行为的第一热度门限。
对于每个行为,将与该行为相对应的当前表现评判数据和期望表现评判数据进行比较,计算si,j-s′i,j,j=1…Ji,并判断是否满足如下推送条件,即比较结果的绝对值大于该行为的第一热度门限:
|si,j-s′i,j|>s′th,j (1)
若满足上述条件,则令第i个对象的第j个行为的第一备选热度因子为:
h′i,j=si,j-s′i,j (2)
进一步,预先设置在计算热度因子时每个行为的权重,令αi,j代表第i个对象的第j个行为的权重,用于从新闻热点的角度表征第i个对象的第j个行为的重要程度。例如,游泳比赛中,夺冠热门选手的权重较高,最后一个赛程的权重较高。
这样,计算得到第i个对象的第一热度因子为:
Figure BDA0001135566450000081
其中,第一热度因子的总数小于等于I。
在本发明的另一实施例中,将至少一个对象的行为表现数据以及每个对象的表现期望数据进行比较,计算出一个或多个对象的热度因子。
具体地,针对表现期望数据,预先设置每个行为的第二热度门限,令s″th,j为针对表现期望数据预设的第j个行为的第二热度门限。;
对于每个行为,将与该行为相对应的当前表现评判数据和期望表现评判数据进行比较,计算si,j-s″i,j,j=1…Ji,并判断是否满足如下推送条件,即比较结果的绝对值大于该行为的第二热度门限:
|si,j-s″i,j|>s″th,j (4)
其中,若满足上述条件,则令第i个对象的第j个行为的第二备选热度因子为:
h″i,j=si,j-s″i,j (5)
进一步,预先设置在计算该热度因子时每个行为的权重,同上,令αi,j代表第i个对象的第j个行为的权重。这样,计算得到第i个对象的第二热度因子为:
Figure BDA0001135566450000082
其中,第二热度因子的总数小于等于I。
在本发明的又一实施例中,将至少一个对象的行为表现数据以及每个对象的历史表现数据和表现期望数据进行比较,计算出一个或多个对象的热度因子。
图3为依据本发明一实施例的计算热度因子的示例性流程图。如图3所示,包括如下步骤:
步骤301,预先设置在计算热度因子时历史表现数据和表现期望数据各自的第一权重,并预先设置在计算一对象的热度因子时每个行为的第二权重。
令β′和β″分别表示历史表现数据和表现期望数据在计算热度因子时各自的权重。令αi,j代表第i个对象的第j个行为的权重。
步骤302,针对历史表现数据,预先设置每个行为的第一热度门限s′th,j,j=1…Ji
步骤303,针对表现期望数据,预先设置每个行为的第二热度门限s″th,j,j=1…Ji
步骤304,针对该对象的每个行为,将与该行为相对应的当前表现评判数据和历史表现评判数据进行比较,即计算si,j-s′i,j
步骤305,针对该对象的每个行为,将与该行为相对应的当前表现评判数据和期望表现评判数据进行比较,即计算si,j-s″i,j
步骤306,判断比较结果的绝对值大于该行为的第一热度门限,参见上述公式(1)。若是,执行步骤308;否则,返回步骤304针对下一个行为进行比较,即令j=j+1。
步骤307,判断比较结果的绝对值大于该行为的第二热度门限,参见上述公式(4)。若是,执行步骤309;否则,返回步骤305针对下一个行为进行比较,即令j=j+1。
步骤308,将该比较结果作为第一备选热度因子h′i,j
步骤309,将该比较结果作为第二备选热度因子h′i,j
步骤310,根据第一权重和第二权重将该对象的所有第一备选热度因子和第二备选热度因子进行加权求和,得到该对象的热度因子。
在分别得到第一备选热度因子和第二备选热度因子后,进一步,计算得到第i个对象的总热度因子为:
Figure BDA0001135566450000091
此外,在上述步骤203中,根据该主题的至少一项预设的推送热度确定展示该待推送内容项所对应文本的优先级,具体包括如下处理:
(1)确定每项推送热度所对应的数值。
若该主题包括K项推送热度,确定每项推送热度θk(k=1,…K)所对应的数值
Figure BDA0001135566450000092
(2)将该待推送内容项的热度因子与数值中的最大值相乘,确定出该热门因子的优先级评分。
若该主题下热度因子的总数为M,将热度因子hm(m=1,…M)与数值中的最大值相乘,确定出该热度因子的优先级评分为:
Figure BDA0001135566450000101
例如,推送热度包括以下四项内容:该主题的热门度、该主题下至少一个对象的热门度、该主题所涉及设备/技术的成熟度、该主题所涉及环境/场地。服务器预先确定该主题下每项推送热度所对应的数值,然后取出最大值,即确定出最热的推送热度项对热度因子进行修正,从而得到优先级评分。这样,即使热度因子很高,但是推送热度项的最大值比较低,那么该待推送内容项的优先级也许并不高。例如,对于冷门的飞碟比赛,即使某个运动拿到了奖牌,实现了奖牌零的突破,由于该赛事具备比较低的关注度,那么推送该内容项时的优先级仍比较低。
表2示出了根据本发明一实施例的推送热度数值示例。可见,针对男子400米自由泳决赛这一赛事,最大值25对应了孙杨的热门度。
Figure BDA0001135566450000102
表2推送热度数值示例
(3)根据优先级评分和预设的多个取值区间进行对比,确定该所待推送内容项所对应文本的优先级。
表3为根据本发明一实施例的优先级取值区间示例。其中,优先级共分为三个区间,通过设置数值Pmax实现区间之间的划分。每个优先级对应了某个推送渠道和内容等级。例如,优先级为1的待推送内容项,可以使用实时推送的渠道,并按照头条级进行展示。
Figure BDA0001135566450000103
Figure BDA0001135566450000111
表3优先级取值区间示例
图4为依据本发明一实施例的所生成文本的示意图。通过优先级判定,确认该文本属于“冷门爆热”的新闻点,如图4所示,在方框410所示的题目“跆拳道男子58公斤级决赛赵帅创历史夺冠”中加入“#冷门爆热#”的标识,并且在方框460中显示优先级判定的结果,“#优先级判定#实时推送,头条级”。此外,在方框420~450中分别显示该文本的生成时间、摘要、赛事焦点和精彩回放的段落。
图5为依据本发明另一实施例的文本展示方法的示例性流程图。该方法应用于服务器。如图5所示,该方法可包括如下步骤:
步骤501,获取针对一主题的至少一个对象的行为表现数据。
步骤502,根据至少一个对象的行为表现数据以及每个对象的历史表现数据和表现期望数据,确定该主题下的至少一个待推送内容项,并生成每个待推送内容项的文本。
例如,以举重比赛意外丢金报道为例,在里约奥运男子举重77公斤级比赛中,中国选手吕小军虽然抓举成绩打破世界纪录,但哈萨克斯坦选手阿西莫夫最后一把挺举成功,逆转夺金,吕小军卫冕失败。可见,通过两个运动员的行为表现数据以及其中一个运动员的表现期望数据,确定出该赛事中中国选手吕小军的表现为热门爆冷的新闻点。
步骤503,对于每个待推送内容项,根据该主题的至少一项预设的推送热度确定展示该待推送内容项所对应文本的优先级。
在确定优先级时,服务器还可以根据不同用户人群对赛事战果资讯需求的强烈程度,为用户设置不同的优先级与推送渠道和内容等级之间的对应关系。此时,客户端将向服务器上报用户所指定的分配方式。例如,某个用户为体育迷,对于上述表3中所示的优先级1-3,其推送渠道都被设置为实时推送。
步骤504,对生成的文本进行关键词审核,并将所确定的优先级和审核后的文本发送给客户端,以使客户端根据优先级展示该文本。
此处的审核包括排查关键词,对风险加权级别较高的稿件还可以提交到人工审核窗口进行审核。
客户端根据接收到的优先级指示,通过相应的推送渠道按照所设置的内容等级展示接收到的文本。对于不同的内容等级,客户端将设置相应的展示位。例如,当内容等级为头条级时,客户端将在推荐展示界面的头条位置设置一展示位,该展示位可以以链接的方式仅显示文本的部分内容,完整的文本可以在用户点击链接后在另一页面中展示。
图6为依据本发明一实施例的展示文本的示意图。客户端按照头条级向用户实时推送了一篇“热门爆冷”的体育赛事报道,在推荐展示页面600中,方框610显示有“头条要闻”的界面标识,在方框620中给出题目为“双杠尤浩重大失误仅第8邓书弟第四无缘奖牌”,并且题目之前加入“#热门爆冷#”的提醒字样,在方框630中显示推广方为“腾讯体育”,日期“2016-08-17”,报道的实时推送时间为“01:28”,并且在方框640中给出正文的部分内容和浏览全文的链接“更多>”。
图7为依据本发明另一实施例的展示文本的示意图。对应于图6所示的头条要闻,在显示界面700中展示了该报道的全文。在方框720中还提供“评论”选项(见721)和“分享”选项(见722)以供用户在社交平台上进行互动。在方框730中示出了该爆冷新闻的图片,并在方框740中给出了图片的标题以突出该爆冷新闻的主题。此外,在方框750中给出了该报道的详细正文,并且在方框760中给出了报道的附录“选手资料”。
根据本发明实施例提供的文本展示方法,使得机器人能够挖掘出爆冷或者爆热的新闻热点,并且出稿速度快。例如,对于奥运比赛的报道,每个比赛从结束到数据获取和文本生成,再到战报稿件链接发出,比人工快讯平均快30秒,比详细报道至少快5-10分钟。
其次,应用上述方法给出的技术方案,可批量生产稿件,同时监测百场赛事,做到冷门赛事也无漏稿。尤其是体育赛事,往往电视直播因播放频道有限,收视率因赛事有明显差距,只能截取个别赛事转播,并且许多赛事并没有本国选手参加,或者是本国选手没有实力进入决赛,并不会报道。但实际上,这种的赛事还是会有用户关注。由于人工编辑的精力和条件有限,无法及时报道,而机器人只要获取到赛事的数据就可以进行实时、快速的报道。
此外,还可以节省大量的人力,可持续性强。例如,奥运会一共有28个大项目,306个小项目。机器人可以替代各个环节的所有工作,从数据库里精准获取核心数据、自动写稿发文、生成链接前端展示、推送一步到位,仅需要很少的管理人员即可。
图8依据本发明一实施例的服务器的结构示意图。如图8所示,服务器800包括:
获取模块810,用于获取针对一主题的至少一个对象的行为表现数据;
第一确定模块820,用于根据获取模块810获取到的至少一个对象的行为表现数据以及每个对象的历史表现数据和/或表现期望数据,确定该主题下的至少一个待推送内容项;
生成模块830,用于生成第一确定模块820确定的每个待推送内容项的文本;
第二确定模块840,用于对于第一确定模块820确定的每个待推送内容项,根据该主题的至少一项预设的推送热度确定展示该待推送内容项所对应文本的优先级;及,
发送模块850,用于将第二确定模块840确定的优先级和生成模块830生成的该待推送内容项所对应的文本发送给客户端,以使客户端根据优先级展示该文本。
在一实施例中,第一确定模块820包括:
判定单元821,用于针对至少一个对象中的每个对象,根据该对象的行为表现数据以及历史表现数据和/或表现期望数据,确定该对象对应的内容项是否满足推送条件;
计算单元822,用于若判定单元821确定出满足推送条件,则确定该对象对应的内容项为待推送的,并计算得到该对象对应的待推送内容项的热度因子。
在一实施例中,行为表现数据包括一个或多个行为以及与每个行为相对应的当前表现评判数据,历史表现数据包括与每个行为相对应的历史表现评判数据,
判定单元821用于,针对历史表现数据,预先设置每个行为的第一热度门限;针对该对象的每个行为,将与该行为相对应的当前表现评判数据和历史表现评判数据进行比较,若比较结果的绝对值大于该行为的第一热度门限,则将该比较结果作为第一备选热度因子;
计算单元822用于,预先设置在计算该热度因子时每个行为的权重;根据权重将该对象的所有第一备选热度因子进行加权求和,得到该热度因子。
在一实施例中,行为表现数据包括一个或多个行为以及与每个行为相对应的当前表现评判数据,表现期望数据包括与每个行为相对应的期望表现评判数据,
判定单元821用于,针对表现期望数据,预先设置每个行为的第二热度门限;针对该对象的每个行为,将与该行为相对应的当前表现评判数据和期望表现评判数据进行比较,若比较结果的绝对值大于该行为的第二热度门限,则将该比较结果作为第二备选热度因子;
计算单元822用于,预先设置在计算该热度因子时每个行为的权重;根据权重将该对象的所有第二备选热度因子进行加权求和,得到该热度因子。
在一实施例中,行为表现数据包括一个或多个行为以及与每个行为相对应的当前表现评判数据,历史表现数据包括与每个行为相对应的历史表现评判数据,表现期望数据包括与每个行为相对应的期望表现评判数据,
判定单元821用于,针对历史表现数据,预先设置每个行为的第一热度门限;针对表现期望数据,预先设置每个行为的第二热度门限;针对该对象的每个行为,执行以下处理:将该行为相对应的当前表现评判数据和历史表现评判数据进行比较,若比较结果的绝对值大于该行为的第一热度门限,则将该比较结果作为第一备选热度因子;将与该行为相对应的当前表现评判数据和期望表现评判数据进行比较,若比较结果的绝对值大于该行为的第二热度门限,则将该比较结果作为第二备选热度因子;
计算单元822用于,预先设置在计算热度因子时历史表现数据和表现期望数据各自的第一权重,并预先设置在计算该对象的热度因子时每个行为的第二权重;根据第一权重和第二权重将该对象的所有第一备选热度因子和第二备选热度因子进行加权求和,得到该对象的热度因子。
在一实施例中,推送热度包括该主题的热门度、该主题下至少一个对象的热门度、该主题所涉及设备/物体的成熟度、该主题所涉及环境/场地的变化程度中的任一项或任意几项,
第二确定模块840用于,确定每项推送热度所对应的数值;将该待推送内容项的热度因子与数值中的最大值相乘,确定出该热门因子的优先级评分;根据优先级评分和预设的多个取值区间进行对比,确定该所待推送内容项所对应文本的优先级。
在一实施例中,第二确定模块840用于,根据所确定的优先级设置展示该文本的推送渠道和内容等级,以使客户端通过推送渠道按照所设置的内容等级展示该文本。
图9为依据本发明另一实施例的服务器的结构示意图。该服务器900可包括:处理器910、存储器920、端口930以及总线940。处理器910和存储器920通过总线940互联。处理器910可通过端口930接收和发送数据。其中,
处理器910用于执行存储器920存储的机器可读指令模块。
存储器920存储有处理器910可执行的机器可读指令模块。处理器910可执行的指令模块包括:获取模块921、第一确定模块922、生成模块923、第二确定模块924和发送模块925。其中,
获取模块921被处理器910执行时可以为:获取针对一主题的至少一个对象的行为表现数据;
第一确定模块922被处理器910执行时可以为:根据获取模块921获取到的至少一个对象的行为表现数据以及每个对象的历史表现数据和/或表现期望数据,确定该主题下的至少一个待推送内容项;
生成模块923被处理器910执行时可以为:生成第一确定模块922确定的每个待推送内容项的文本;
第二确定模块924被处理器910执行时可以为:对于第一确定模块922确定的每个待推送内容项,根据该主题的至少一项预设的推送热度确定展示该待推送内容项所对应文本的优先级;
发送模块925被处理器910执行时可以为:将第二确定模块924确定的优先级和生成模块923生成的该待推送内容项所对应的文本发送给客户端,以使客户端根据优先级展示该文本。
由此可以看出,当存储在存储器920中的指令模块被处理器910执行时,可实现前述各个实施例中获取模块、第一确定模块、生成模块、第二确定模块和发送模块的各种功能。
上述装置和系统实施例中,各个模块及单元实现自身功能的具体方法在方法实施例中均有描述,这里不再赘述。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
另外,本发明的每一个实施例可以通过由数据处理设备如计算机执行的数据处理程序来实现。显然,数据处理程序构成了本发明。此外,通常存储在一个存储介质中的数据处理程序通过直接将程序读取出存储介质或者通过将程序安装或复制到数据处理设备的存储设备(如硬盘和或内存)中执行。因此,这样的存储介质也构成了本发明。存储介质可以使用任何类型的记录方式,例如纸张存储介质(如纸带等)、磁存储介质(如软盘、硬盘、闪存等)、光存储介质(如CD-ROM等)、磁光存储介质(如MO等)等。
因此,本发明还公开了一种存储介质,其中存储有数据处理程序,该数据处理程序用于执行本发明上述方法的任何一种实施例。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (18)

1.一种文本展示方法,其特征在于,包括:
获取针对一主题的至少一个对象的行为表现数据;
根据所述至少一个对象的行为表现数据以及每个对象的历史表现数据和表现期望数据,确定该主题下的至少一个待推送内容项,并且针对每个对象,将该对象的各个行为在新闻热点上的重要程度预先设置为第二权重,根据所述历史表现数据的第一权重、所述表现期望数据的第一权重以及所述第二权重,计算得到该对象对应的待推送内容项的热度因子,生成该待推送内容项的文本;及,
预先设置该主题的推送热度,所述推送热度包括该主题所涉及设备/物体的成熟度、该主题所涉及环境/场地的变化程度;
对于每个待推送内容项,根据该待推送内容项的热度因子以及所述推送热度,确定展示该待推送内容项所对应文本的优先级,并将所确定的优先级和该待推送内容项所对应的文本发送给客户端,以使所述客户端根据所述优先级展示该文本。
2.根据权利要求1所述的方法,其中,所述行为表现数据包括一个或多个行为以及与每个行为相对应的当前表现评判数据,所述获取针对一主题的至少一个对象的行为表现数据包括:
获取该主题的实时代码数据,所述实时代码数据按照机器语言编写、携带有该主题下的内容数据;
根据代码的编写规则设置所述内容数据与对象、行为、当前表现评判数据之间的映射关系;
根据所述映射关系,从所述内容数据中识别出每个对象的行为以及当前表现评判数据。
3.根据权利要求1所述的方法,其中,所述根据所述至少一个对象的行为表现数据以及每个对象的历史表现数据和表现期望数据,确定该主题下的至少一个待推送内容项包括:
针对每个对象,根据该对象的所述行为表现数据以及所述历史表现数据和所述表现期望数据,确定该对象对应的内容项是否满足推送条件;
若满足所述推送条件,则确定该对象对应的内容项为所述待推送内容项。
4.根据权利要求1所述的方法,其中,所述行为表现数据包括一个或多个行为以及与每个行为相对应的当前表现评判数据,所述历史表现数据包括与每个行为相对应的历史表现评判数据。
5.根据权利要求1所述的方法,其中,所述表现期望数据包括与每个行为相对应的期望表现评判数据。
6.根据权利要求3所述的方法,其中,所述行为表现数据包括一个或多个行为以及与每个行为相对应的当前表现评判数据,所述历史表现数据包括与每个行为相对应的历史表现评判数据,所述表现期望数据包括与每个行为相对应的期望表现评判数据,
所述根据该对象的所述行为表现数据以及所述历史表现数据和所述表现期望数据,确定该对象对应的内容项是否满足推送条件包括:
针对所述历史表现数据,预先设置每个行为的第一热度门限;
针对所述表现期望数据,预先设置每个行为的第二热度门限;
针对该对象的每个行为,执行以下处理:
将与该行为相对应的所述当前表现评判数据和所述历史表现评判数据进行比较,若比较结果的绝对值大于该行为的所述第一热度门限,则将该比较结果作为第一备选热度因子;
将与该行为相对应的所述当前表现评判数据和所述期望表现评判数据进行比较,若比较结果的绝对值大于该行为的所述第二热度门限,则将该比较结果作为第二备选热度因子;
所述根据所述历史表现数据的第一权重、所述表现期望数据的第一权重以及所述第二权重,计算得到该对象对应的待推送内容项的热度因子包括:
根据所述第一权重和所述第二权重,将该对象的所有第一备选热度因子和第二备选热度因子进行加权求和,得到该对象的所述热度因子。
7.根据权利要求1所述的方法,其中,所述生成该待推送内容项的文本包括:
在预设的文本素材数据库中选择出与该待推送内容项相匹配的至少一个描述词组;
将该待推送内容项所涉及的至少一个对象的所述行为表现数据、所述历史表现数据、所述表现期望数据,以及所述至少一个描述词组,组合成至少一个段落,连接所述至少一个段落,得到所述文本。
8.根据权利要求1所述的方法,其中,所述推送热度还包括该主题的热门度、该主题下至少一个对象的热门度,
所述根据该待推送内容项的热度因子以及所述推送热度,确定展示该待推送内容项所对应文本的优先级包括:
确定每项推送热度所对应的数值;
将该待推送内容项的热度因子与所述数值中的最大值相乘,确定出该热门因子的优先级评分;
根据所述优先级评分和预设的多个取值区间进行对比,确定该待推送内容项所对应文本的优先级。
9.根据权利要求1至8中任一项所述的方法,其中,在确定展示该待推送内容项所对应文本的优先级之后,所述方法还包括:
根据所确定的优先级,设置展示该文本的推送渠道和内容等级,以使所述客户端通过所述推送渠道,按照所述内容等级,展示该文本。
10.一种服务器,其特征在于,包括:
获取模块,用于获取针对一主题的至少一个对象的行为表现数据;
第一确定模块,用于根据所述至少一个对象的行为表现数据以及每个对象的历史表现数据和表现期望数据,确定该主题下的至少一个待推送内容项,并且针对每个对象,将该对象的各个行为在新闻热点上的重要程度预先设置为第二权重,根据所述历史表现数据的第一权重、所述表现期望数据的第一权重以及所述第二权重,计算得到该对象对应的待推送内容项的热度因子;
生成模块,用于生成所述第一确定模块确定的每个待推送内容项的文本;
第二确定模块,用于预先设置该主题的推送热度,所述推送热度包括该主题所涉及设备/物体的成熟度、该主题所涉及环境/场地的变化程度;对于所述第一确定模块确定的每个待推送内容项,根据该待推送内容项的热度因子以及所述推送热度,确定展示该待推送内容项所对应文本的优先级;及,
发送模块,用于将所述第二确定模块确定的优先级和所述生成模块生成的该待推送内容项所对应的文本发送给客户端,以使所述客户端根据所述优先级展示该文本。
11.根据权利要求10所述的服务器,其中,所述第一确定模块包括:
判定单元,用于针对每个对象,根据该对象的所述行为表现数据以及所述历史表现数据和所述表现期望数据,确定该对象对应的内容项是否满足推送条件;
计算单元,用于若所述判定单元确定出满足所述推送条件,则确定该对象对应的内容项为所述待推送内容项。
12.根据权利要求10所述的服务器,其中,所述行为表现数据包括一个或多个行为以及与每个行为相对应的当前表现评判数据,所述历史表现数据包括与每个行为相对应的历史表现评判数据。
13.根据权利要求10所述的服务器,其中,所述表现期望数据包括与每个行为相对应的期望表现评判数据。
14.根据权利要求11所述的服务器,其中,所述行为表现数据包括一个或多个行为以及与每个行为相对应的当前表现评判数据,所述历史表现数据包括与每个行为相对应的历史表现评判数据,所述表现期望数据包括与每个行为相对应的期望表现评判数据,
所述判定单元用于,针对所述历史表现数据,预先设置每个行为的第一热度门限;针对所述表现期望数据,预先设置每个行为的第二热度门限;针对该对象的每个行为,执行以下处理:将与该行为相对应的所述当前表现评判数据和所述历史表现评判数据进行比较,若比较结果的绝对值大于该行为的所述第一热度门限,则将该比较结果作为第一备选热度因子;将与该行为相对应的所述当前表现评判数据和所述期望表现评判数据进行比较,若比较结果的绝对值大于该行为的所述第二热度门限,则将该比较结果作为第二备选热度因子;
所述计算单元还用于,根据所述第一权重和所述第二权重,将该对象的所有第一备选热度因子和第二备选热度因子进行加权求和,得到该对象的所述热度因子。
15.根据权利要求10所述的服务器,其中,所述推送热度还包括该主题的热门度、该主题下至少一个对象的热门度,
所述第二确定模块用于,确定每项推送热度所对应的数值;将该待推送内容项的热度因子与所述数值中的最大值相乘,确定出该热门因子的优先级评分;根据所述优先级评分和预设的多个取值区间进行对比,确定该待推送内容项所对应文本的优先级。
16.根据权利要求10至15中任一项所述的服务器,其中,所述第二确定模块还用于,在确定展示该待推送内容项所对应文本的优先级之后,根据所确定的优先级,设置展示该文本的推送渠道和内容等级,以使所述客户端通过所述推送渠道,按照所述内容等级,展示该文本。
17.一种服务器,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1至9中任一项所述的方法。
18.一种计算机可读存储介质,其特征在于,存储有计算机可读指令,所述计算机可读指令被至少一个处理器执行时,实现如权利要求1至9中任一项所述的方法。
CN201610920326.5A 2016-10-21 2016-10-21 一种文本展示方法及服务器 Active CN107977367B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610920326.5A CN107977367B (zh) 2016-10-21 2016-10-21 一种文本展示方法及服务器
PCT/CN2017/101852 WO2018072577A1 (zh) 2016-10-21 2017-09-15 一种文本生成方法及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610920326.5A CN107977367B (zh) 2016-10-21 2016-10-21 一种文本展示方法及服务器

Publications (2)

Publication Number Publication Date
CN107977367A CN107977367A (zh) 2018-05-01
CN107977367B true CN107977367B (zh) 2021-12-17

Family

ID=62003898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610920326.5A Active CN107977367B (zh) 2016-10-21 2016-10-21 一种文本展示方法及服务器

Country Status (1)

Country Link
CN (1) CN107977367B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457570A (zh) * 2019-06-20 2019-11-15 拉扎斯网络科技(上海)有限公司 文本推送方法、装置、服务器和存储介质
CN110609981A (zh) * 2019-08-30 2019-12-24 北京金堤科技有限公司 文本处理方法以及装置、电子设备以及计算机可读存储介质
CN112163399A (zh) * 2020-10-12 2021-01-01 北京字跳网络技术有限公司 在线文档推送方法、装置、电子设备及计算机可读介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657496A (zh) * 2015-03-09 2015-05-27 杭州朗和科技有限公司 一种计算信息热度值的方法和设备
CN104899273A (zh) * 2015-05-27 2015-09-09 东南大学 一种基于话题和相对熵的网页个性化推荐方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150186419A1 (en) * 2013-12-31 2015-07-02 Vandana Agrawal Style recommendation engine and method
US20160188734A1 (en) * 2014-12-30 2016-06-30 Socialtopias, Llc Method and apparatus for programmatically synthesizing multiple sources of data for providing a recommendation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657496A (zh) * 2015-03-09 2015-05-27 杭州朗和科技有限公司 一种计算信息热度值的方法和设备
CN104899273A (zh) * 2015-05-27 2015-09-09 东南大学 一种基于话题和相对熵的网页个性化推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
今日头条推出国内首个写稿机器人;李凤;《齐鲁周刊》;20160829;第1页 *

Also Published As

Publication number Publication date
CN107977367A (zh) 2018-05-01

Similar Documents

Publication Publication Date Title
US11157956B2 (en) Application recommendation method and server
US20230222139A1 (en) Systems and methods for categorizing and presenting performance assessment data
Bentivogli et al. The Seventh PASCAL Recognizing Textual Entailment Challenge.
Yagcioglu et al. A distributed representation based query expansion approach for image captioning
CN112533051B (zh) 弹幕信息显示方法、装置、计算机设备和存储介质
CN107977367B (zh) 一种文本展示方法及服务器
WO2013107345A1 (zh) 一种处理用户提问的方法和系统
Ahmed et al. Discovering diverse, high quality design ideas from a large corpus
CN109241319A (zh) 一种图片检索方法、装置、服务器和存储介质
Godin et al. Beating the bookmakers: leveraging statistics and Twitter microposts for predicting soccer results
CN103942328B (zh) 一种视频检索方法及视频装置
CN107545444A (zh) 一种业务广告数据推荐方法以及装置
CN104281641A (zh) 丰富多媒体内容的方法和对应设备
House et al. Representation matters: Progressing research in plurisexuality and bisexuality in sport
US20100082612A1 (en) Determining relevance between an image and its location
US9032044B2 (en) Information processing system, information processing method, program, and non-transitory information storage medium
WO2019056502A1 (zh) 综艺比赛结果预测方法、装置及存储介质
Naraine et al. The evolution of Twitter communication by Youth Olympic Games organising committees
CN117256002A (zh) 用于生成人工智能驱动的见解的系统和方法
Patil et al. Cricket team prediction using machine learning techniques
CN114610979A (zh) 一种社区平台内容排序方法、系统、终端及存储介质
Lewis Extending the range of player-performance measures in one-day cricket
Casimiro-Artés et al. Applying Unsupervised Machine Learning Models to Identify Serve Performance Related Indicators in Women’s Volleyball
JP4921523B2 (ja) 記事の価値を評価する装置、方法、およびプログラム
US20190304040A1 (en) System and Method for Vetting Potential Jurors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant