CN110309415B - 新闻信息生成方法、装置及电子设备可读存储介质 - Google Patents

新闻信息生成方法、装置及电子设备可读存储介质 Download PDF

Info

Publication number
CN110309415B
CN110309415B CN201810218234.1A CN201810218234A CN110309415B CN 110309415 B CN110309415 B CN 110309415B CN 201810218234 A CN201810218234 A CN 201810218234A CN 110309415 B CN110309415 B CN 110309415B
Authority
CN
China
Prior art keywords
news
user
information
point
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810218234.1A
Other languages
English (en)
Other versions
CN110309415A (zh
Inventor
杨振
方宽
蒋冠军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN201810218234.1A priority Critical patent/CN110309415B/zh
Publication of CN110309415A publication Critical patent/CN110309415A/zh
Application granted granted Critical
Publication of CN110309415B publication Critical patent/CN110309415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种新闻信息生成方法、装置及电子设备可读存储介质,通过获取第一新闻事实点,根据用户的个性化特征对第一新闻事实点进行解析,确定第一新闻事实点的属性信息;根据情感属性的权重值,选取单句模板,并将解析得到的第一新闻事实点填入所选取的单句模板中,形成各个单句信息;根据预设新闻结构模板,组合各个单句信息,生成新闻信息。实现不同用户对同一新闻事实看到不同的新闻呈现,使得新闻信息呈现出用户的个性化特征,使其更贴近于用户的喜好,提升用户阅读新闻信息的效率,从而可以更加快速地获取更加有意义、有价值的新闻信息。

Description

新闻信息生成方法、装置及电子设备可读存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种新闻信息生成方法、装置及电子设备可读存储介质。
背景技术
随着人工智能技术的不断发展,其应用领域越来越广泛,逐渐渗透到人们生活中的方方面面。
以新闻编辑行业来说,融合了智能撰文技术、内容抽取技术、要闻萃取技术的写稿机器人已经可以达到每日几千篇稿件的撰写速度。写稿机器人可以根据结构化的数值数据生成相关的可阅读的文本。例如,从证券交易所获取的大盘交易数据生成财经报道,根据气象数据生成天气预报,从地震局获取的地震数据即时生成地震报道。
然而,目前的基于人工智能的新闻信息生成技术,其主要实现了批量化、快速化的新闻信息产出,这就导致用户看到的新闻信息,在内容、视角、所表达的情感等各个方面都很格式化,给人千篇一律的感觉;同时,过量的新闻信息还导致人们很难快速关注到自己感兴趣的内容,使得有效信息的获取效率降低。
发明内容
本发明提供一种新闻信息生成方法、装置及电子设备可读存储介质,用于解决现有技术中新闻信息所存在的内容千篇一律,仅有量缺乏质,使用户获取有效信息效率不高的技术问题。
本发明第一个方面提供一种新闻信息生成方法,包括:
获取第一新闻事实点,根据用户的个性化特征对所述第一新闻事实点进行解析,确定所述第一新闻事实点的属性信息;其中,所述属性信息包括:所述第一新闻事实点的重要程度权重值、用户对所述第一新闻事实点的情感属性、所述情感属性的权重值;
根据所述情感属性的权重值,选取单句模板,并将解析得到的第一新闻事实点填入所选取的单句模板中,形成各个单句信息;
根据预设新闻结构模板,组合所述各个单句信息,生成新闻信息。
可选的,所述方法还包括:
对所述第一新闻事实点进行监听,根据时间先后的顺序和/或根据所述第一新闻事实点的领域属性,确定监听到的第二新闻事实点与所述第一新闻事实点之间是否具有关联关系;
若具有关联关系,则将所述第一新闻事实点更新为所述第二新闻事实点,并执行所述根据用户的个性化特征对所述第一新闻事实点进行解析,确定所述第一新闻事实点的属性信息;其中,所述属性信息包括:所述第一新闻事实点的重要程度权重值、用户对所述第一新闻事实点的情感属性、所述情感属性的权重值;根据所述情感属性的权重值,选取单句模板,并将解析得到的第一新闻事实点填入所选取的单句模板中,形成各个单句信息;根据预设新闻结构模板,组合所述各个单句信息,生成新闻信息的步骤。
可选的,所述用户的个性化特征包括以下特征中的至少一种:用户的属性信息、用户感兴趣的关键词、用户对所述关键词的喜好程度;相应的,所述方法,还包括:
统计用户对新闻信息的浏览记录,确定得到所述关键词;或者,
统计所述关键词出现的频次,确定用户对所述关键词的喜好程度;或者,
解析用户对新闻信息的评论,确定得到所述关键词和/或对所述关键词的喜好程度;或者
根据用户收藏或关注的新闻信息,确定得到所述关键词。
可选的,所述获取第一新闻事实点,根据用户的个性化特征对所述第一新闻事实点进行解析,确定所述第一新闻事实点的属性信息,包括:
根据用户的个性化特征中的所述关键词和/或对所述关键词的喜好程度,确定所述第一新闻事实点的重要程度权重值;
根据用户的个性化特征中的对所述关键词的喜好程度,确定用户对所述第一新闻事实点的情感属性及所述情感属性的权重值。
可选的,所述根据预设新闻结构模板,组合所述各个单句信息之后,还包括:
根据语法规则,确定单句与单句之间的冗余信息;
确定去除所述冗余信息后的各个单句之间的描述主体;
对同一描述主体的单句进行以下至少一种操作:单句与单句进行合并、调整单句与单句之间的顺序、将包含同一主语的单句中的第一个单句中的主语保留,所述第一个单句后续的单句中的主语去除。
可选的,所述预设新闻结构模板包括:基于同一场景的单句不同排列顺序的不同模板类型;
相应的,所述方法还包括:
获取用户浏览新闻信息的浏览记录,统计用户在新闻信息的显示页面上的停留时长,确定所述停留时间超出预设停留时长阈值的新闻结构模板的类型为用户喜好的预设新闻结构模板;或者,
统计用户对不同的预设新闻结构模板的浏览频次,确定所述浏览频次超出预设浏览频次阈值的新闻结构模板类型为用户喜好的预设新闻结构模板。
本发明第二个方面提供一种新闻信息生成装置,包括:
获取模块,用于获取第一新闻事实点;
确定模块,用于根据用户的个性化特征对所述第一新闻事实点进行解析,确定所述第一新闻事实点的属性信息;其中,所述属性信息包括:所述第一新闻事实点的重要程度权重值、用户对所述第一新闻事实点的情感属性、所述情感属性的权重值;
单句形成模块,用于根据所述情感属性的权重值,选取单句模板,并将解析得到的第一新闻事实点填入所选取的单句模板中,形成各个单句信息;
新闻信息形成模块,用于根据预设新闻结构模板,组合所述各个单句信息,生成新闻信息。
可选的,还包括:
监听模块,用于对所述第一新闻事实点进行监听;
所述确定模块,还用于根据时间先后的顺序和/或根据所述第一新闻事实点的领域属性,确定监听到的第二新闻事实点与所述第一新闻事实点之间是否具有关联关系;
更新模块,用于当所述第二新闻事实点与所述第一新闻事实点之间具有关联关系时,将所述第一新闻事实点更新为所述第二新闻事实点,并返回所述确定模块执行相应步骤。
可选的,所述用户的个性化特征包括以下特征中的至少一种:用户的属性信息、用户感兴趣的关键词、用户对所述关键词的喜好程度;相应的,所述确定模块,还用于统计用户对新闻信息的浏览记录,确定得到所述关键词;或者,还用于统计所述关键词出现的频次,确定用户对所述关键词的喜好程度;或者,还用于解析用户对新闻信息的评论,确定得到所述关键词和/或对所述关键词的喜好程度;或者,还用于根据用户收藏或关注的新闻信息,确定得到所述关键词。
可选的,所述确定模块,包括:
重要程度确定子模块,用于根据用户的个性化特征中的所述关键词和/或对所述关键词的喜好程度,确定所述第一新闻事实点的重要程度权重值;
情感属性确定子模块,用于根据用户的个性化特征中的对所述关键词的喜好程度,确定用户对所述第一新闻事实点的情感属性及所述情感属性的权重值。
可选的,所述装置还包括:
调整模块,用于根据语法规则,确定单句与单句之间的冗余信息;确定去除所述冗余信息后的各个单句之间的描述主体;对同一描述主体的单句进行以下至少一种操作:单句与单句进行合并、调整单句与单句之间的顺序、将包含同一主语的单句中的第一个单句中的主语保留,所述第一个单句后续的单句中的主语去除。
可选的,所述预设新闻结构模板包括:基于同一场景的单句不同排列顺序的描述模板;相应的,所述装置还包括:
模板确定模块,用于获取用户浏览新闻信息的浏览记录,统计用户在新闻信息的显示页面上的停留时长,确定所述停留时间超出预设停留时长阈值的新闻结构模板的类型为用户喜好的预设新闻结构模板;或者,统计用户对不同的预设新闻结构模板的浏览频次,确定所述浏览频次超出预设浏览频次阈值的新闻结构模板类型为用户喜好的预设新闻结构模板。
本发明第三个方面提供一种电子设备可读存储介质,包括:程序,当其在电子设备上运行时,使得电子设备执行前述任一项所述的新闻信息生成方法。
本发明提供的新闻信息生成方法及装置,通过获取第一新闻事实点,根据用户的个性化特征对第一新闻事实点进行解析,确定第一新闻事实点的属性信息;其中,属性信息包括:第一新闻事实点的重要程度权重值、用户对第一新闻事实点的情感属性、情感属性的权重值;根据情感属性的权重值,选取单句模板,并将解析得到的第一新闻事实点填入所选取的单句模板中,形成各个单句信息;根据预设新闻结构模板,组合各个单句信息,生成新闻信息。实现不同用户对同一新闻事实看到不同的新闻呈现,使得新闻信息呈现出用户的个性化特征,使其更贴近于用户的喜好,提升用户阅读新闻信息的效率,从而可以更加快速地获取更加有意义、有价值的新闻信息。进一步的,通过对第一新闻事实点进行监听,根据时间先后的顺序和/或根据第一新闻事实点的领域属性,确定新获取的第二新闻事实点与原有的第一新闻事实点之间是否具有关联关系;若具有关联关系,则基于新获取的第二新闻事实点生成新闻信息。实现了对新闻信息进行及时有效地追踪报道,使得用户所获取到的新闻信息具有连贯性,提升用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一示例性实施例提供的新闻信息生成方法的流程图;
图2为本发明另一示例性实施例提供的新闻信息生成方法的流程图;
图3为本发明一示例性实施例提供的新闻信息生成装置的结构示意图;
图4为本发明另一示例性实施例提供的新闻信息生成装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一示例性实施例提供的新闻信息生成方法的流程图,如图1所示,本实施例以该新闻信息生成方法应用于新闻信息生成装置中来举例说明,实际应用中,新闻信息生成装置可以独立设置,如其可以为与用户的客户端进行交互的应用服务器;也可以集成设置在用户的客户端所依托的设备中,例如,智能手机、平板电脑PAD(portableandroid device,简称“PAD”)或各种移动电子设备中,以上这些电子设备可以统称为“终端”。以下实施例中以该新闻信息生成装置为应用服务器为例进行说明。需要说明的是,下面几个具体实施例可以相互结合,对于相同或相似的内容,在不同的实施例中不再进行重复说明。该新闻信息生成方法具体包括:
步骤101、获取第一新闻事实点,根据用户的个性化特征对第一新闻事实点进行解析,确定第一新闻事实点的属性信息。
在本步骤中,所谓新闻事实点为基于数据驱动的文本生成技术从各种数据来源渠道获取的数据资源,例如,从体育赛事播报媒体中获取比赛的实时比分、实时战况等数据信息;从股票大盘中读取各类股票的走势数据;从气象局官方播报中获取天气的实时数据等;从地震局网站获取到地震发生地点、发生时间、地震震级等数据信息;以上这些数据资源均可以作为新闻事实点。可见,新闻事实点是一些构成新闻信息的零散数据信息,通过编辑人员的编辑后,将零散的新闻事实点编辑为一篇完整的、具有可阅读性的新闻信息。也就是说,新闻事实点为构成一件新闻事件报道的各个信息要素,例如,一场足球比赛中,可以获取到的新闻事实点可能包括:进球/黄牌/铲倒/上场球员信息等,通过以上各个新闻事实点,构成一篇关于该足球比赛报道的新闻稿件。
需要说明的是,在本实施例及后续各个实施例中所涉及到的第一新闻事实点、第二新闻事实点,其本质都是上述所述的新闻事实点,“第一”、“第二”仅为了区分不同的新闻事实点其之间的关联关系,包括但不限于以下的情况,先获取到的事实点为第一新闻事实点,后获取到的与该第一新闻事实点具有关联关系的事实点为第二新闻事实点;或者,获取到第一新闻事实点后,又获取到了与该第一新闻事实点具有关系内容的事实点,该事实点为第二新闻事实点;因此,第一新闻事实点与第二新闻事实点在不同场景下具有不同的含义,不局限于用于区分新闻事件发生时间先后获取到的新闻事实点的情况。
其中,用户的个性化特征是指各个用户个体自身的特点,其可以包括但不限于,用户的属性信息,如年龄、职业、性别、居住地等基础的个人信息;还可以包括,用户感兴趣的关键词(即用户的兴趣爱好),如,其所关注的新闻类型(如,体育、娱乐、财经等);还可以包括,用户的情感倾向,如,其喜欢A明星,不喜欢B明星;还可以包括,用户对关键词的喜好程度,如,其喜欢篮球比赛,其中,对C球队狂热喜欢,对D球队比较喜欢,对E球队的喜爱程度一般。通过上述的用户个性化特征可以对用户进行角色描述,从而将与该用户匹配性较好的新闻推送给该用户,也就是说,新闻内容不再千篇一律,可以有的放矢的对同样的新闻事实点加以不同的文字渲染效果,即根据用户的喜好及喜好强度以不同的感情色彩编辑该相同的新闻事实点,再传递给不同的用户,提升用户的阅读体验。
所谓根据用户的个性化特征对第一新闻事实点进行解析,确定第一新闻事实点的属性信息,就是根据获取到的新闻事实点,确定其与用户之间的关联性,例如,若用户的个性特征中包含关键词“体育”,则可以对体育类的新闻事实点进行标注,若用户的情感倾向为非常喜欢A明星的比赛,则可以对涉及到A明星的比赛进行重要性权重值的标注。也就是说,根据用户的个性化特征对新闻事实点进行分析,并对该新闻事实点打标签,确定其属性信息,该属性信息可以包括但不限于,第一新闻事实点的重要程度权重值(如该新闻事实点是否为用户感兴趣的内容,例如,足球比赛中,获取到了进球/黄牌/铲倒等不同的新闻事实点,则用户对是否进球得分较为关注,对比赛过程兴趣度一般,则在生成新闻信息的时候要考虑上述新闻事实点的重要程度,如,进球的重要程度权重值大于黄牌/铲倒的重要程度权重值,则权重值大小可以作为在该新闻信息报道中描述进球/黄牌/铲倒等三个新闻事实点的先后顺序的依据,也可以作为选取依据,如将进球写入该新闻信息中,而将黄牌/铲倒的新闻事实点舍弃)、用户对第一新闻事实点的情感属性(如该用户喜欢或一般喜欢或不喜欢该事实点的情感倾向,例如,上述例子中,若铲倒的新闻事实点为A球员被铲倒,而用户的情感倾向为其喜欢A球员,则此时虽然从重要程度权重值角度来说,铲倒的权重值不及进球,但是由于用户喜欢的球员被铲倒,则有可能进球与铲倒两个新闻事实点在针对该用户的新闻信息报道中描述的侧重点会发生变化)、情感属性的权重值(如该用户对该事实点关注或喜爱的程度描述)。
可选的,在对获取到的各个第一新闻事实点根据用户的个性化特征标注了属性信息后,可以对各个第一新闻事实点进行分组,将具有共通性的事实点归为一组,则后续在新闻信息编辑的过程中可以将同组内容编辑到一起,或者将同组的新闻信息集中向用户推送等;还可以对属性信息标注后的第一新闻事实点进行排序,将用户更加感兴趣的新闻事实点排在前面或页面的显著位置进行推送。此外,排序的先后顺序还可以基于算法对各个新闻事实点的重要性(该重要性除了考虑用户的喜好进行确定,还可以结合新闻事实本身的重要性进行综合确定)进行权重值的计算,从而将重要性权重值大的事实点排在前面进行推送。
步骤102、根据情感属性的权重值,选取单句模板,并将解析得到的第一新闻事实点填入所选取的单句模板中,形成各个单句信息。
在本步骤中,根据情感属性的权重值,即根据用户对该事实点关注或喜爱的程度描述可以预先设置不同类型的单句模板,例如,新闻事实点为A队与B队的篮球比赛结果为A队战胜B队,通过用户的个性化特征获知用户喜欢篮球比赛,且用户是A队的狂热粉丝,则在对该新闻事实点进行描述时,可以尽可能多采用夸赞A队战绩的语言,例如,A队以绝对性的优势战胜了B队;但若通过用户的个性化特征获知用户喜欢B队,但B队输了比赛,则在对该新闻事实点进行描述时,可以采用委婉的语言,例如,A队在本场比赛中取得了暂时性的胜利。因此,对同一新闻事实点,可以设置表达不同情感语气的单句模板,从而根据第一新闻事实点所对应的属性信息,尤其指根据属性信息中的情感属性的权重值,选择与该情感属性相匹配的单句模板,再将该第一新闻事实点填充到该单句模板中,形成对该新闻事实点描述的单句。
步骤103、根据预设新闻结构模板,组合各个单句信息,生成新闻信息。
在本步骤中,所谓预设新闻结构模板,指将前述生成的各个单句如何编排为段落的模板,该结构模板,可以基于新闻事件通常的描述顺序编排,如时间、地点、人物、事件内容等基本的逻辑顺序编排,也可以基于用户喜好的编排顺序,例如,以一幅图片搭配一段文字的穿插方式作为结构模板;或者针对某具体场景具有不同描述先后顺序的结构模板,例如,对一场篮球比赛的描述模板,可以先描述比赛结果、再描述球员、再描述比赛过程;或者,先描述比赛过程、再描述上场球员、再描述比赛比分结果。因此,根据触发条件,选择适合的预设新闻结构模板,再根据该新闻结构模板的布局,将之前的各个单句填入该模板中,生成新闻信息。该触发条件可以基于用户所喜好的模板类型触发选择对应的模板,也可以基于其他触发条件,如新闻事实点所适合的类型,或群体用户的喜好等各种条件,本实施例对此不作具体限定。
本发明实施例提供的新闻信息生成方法,通过获取第一新闻事实点,根据用户的个性化特征对第一新闻事实点进行解析,确定第一新闻事实点的属性信息;其中,属性信息包括:第一新闻事实点的重要程度权重值、用户对第一新闻事实点的情感属性、情感属性的权重值;根据情感属性的权重值,选取单句模板,并将解析得到的第一新闻事实点填入所选取的单句模板中,形成各个单句信息;根据预设新闻结构模板,组合各个单句信息,生成新闻信息。实现不同用户对同一新闻事实看到不同的新闻呈现,使得新闻信息呈现出用户的个性化特征,使其更贴近于用户的喜好,提升用户阅读新闻信息的效率,从而可以更加快速地获取更加有意义、有价值的新闻信息。
图2为本发明另一示例性实施例提供的新闻信息生成方法的流程图,如图2所示,在上一实施例的基础上,该新闻信息生成方法具体包括:
步骤201、基于第一新闻事实点,生成新闻信息。
步骤202、对第一新闻事实点进行监听,根据时间先后的顺序和/或根据第一新闻事实点的领域属性,确定监听到的第二新闻事实点与第一新闻事实点之间是否具有关联关系。若具有关联关系,则将第一新闻事实点更新为第二新闻事实点,对第二新闻事实点执行前一实施例中的步骤101~步骤103的方法。还可以对该第二新闻事实点或第一新闻事实点执行下述的各个步骤。
在本步骤中,所谓对第一新闻事实点进行监听指持续关注与该新闻事实点有关的数据,并可以及时获取该数据,作为第二新闻事实点。第一新闻事实点与第二事实点可以是在时间上先后发生的事实点;例如,一场足球比赛的新闻报道中,在t1时刻出现了进球,则将t1时刻进球作为第一新闻事实点进行报道;之后又监听到t2时刻再次进球,则将t2时刻进球作为与第一新闻事实点相关联的第二新闻事实点进行报道;使得用户可以实时地跟进新闻事件的发展动态,第一时间获知比赛的赛况。此外,也可以是根据该第一新闻事实点的领域属性,也就是其所属领域的特定特点,来确定与第一新闻事实点具有关联性的第二新闻事实点。例如,对于体育或其他领域的比赛来说,各种比赛其所属领域的赛制可能不同,则根据各个比赛其各自的领域属性,确定赛制安排,作为将各个事实点进行关联的线索,如获取到的第一新闻事实点为该比赛的半决赛阶段,则监听该比赛的决赛阶段的新闻事实点作为第二新闻事实点。若获取到了具有关联关系的第二新闻事实点,则对该第二新闻事实点执行前一实施例中对第一新闻事实点所执行的各个步骤(步骤101~步骤103),生成针对该第二新闻事实点的新闻信息。还可以在获取到该第二新闻事实点后,执行以下步骤,实现了对新闻信息进行及时有效地追踪报道,实时地更新该新闻信息的动态,使得用户所获取到的新闻信息具有连贯性,提升用户体验。
步骤203、根据用户的个性化特征中的关键词和/或对关键词的喜好程度,确定第二新闻事实点的重要程度权重值。
在本步骤中,重要程度权重值可以基于用户的个性化特征中的关键词和/或对关键词的喜好程度进行确定,还可以结合该新闻事实点自身的重要性综合确定,例如,对于与比赛事件有关的新闻报道中,比赛的比分/胜负的新闻事实点通常为自身具有较高重要程度权重值的事实点,则根据综合后的重要程度权重值,向用户推送包含该新闻事实点的新闻信息。
步骤204、根据用户的个性化特征中的对关键词的喜好程度,确定用户对第二新闻事实点的情感属性及情感属性的权重值。
在本步骤中,对于用户的个性化特征中所包含的用户感兴趣的关键词,以及用户对该关键词的喜好程度可以通过以下各种方式得到,
统计用户对新闻信息的浏览记录,确定得到关键词;具体的,统计用户经常浏览的网页页面,从中提取出共性的标签,以此作为用户关注的关键词。
或者,统计关键词出现的频次,确定用户对关键词的喜好程度;具体的,在得到关键词后,还可以统计用户对A关键词和B关键词的关注程度,基于对提取出的关键词的出现频次的统计,确定用户对不同关键词的喜好程度。
或者,解析用户对新闻信息的评论,确定得到关键词和/或对关键词的喜好程度;具体的,分析用户对某新闻信息的评论内容,从中获取用户的兴趣点,及情感倾向等信息,形成关键词和/或对关键词的喜好程度等信息。
或者,根据用户收藏或关注的新闻信息,确定得到关键词;具体的,可以通过分析用户收藏的新闻的类别,确定用户是喜欢体育类或某个明星的新闻,从而确定关键词为“体育”、“某明星”。
相应的,与步骤101类似,通过将该第二新闻事实点与用户的个性特征进行比对后,可以根据用户的对某关键词的喜好程度,确定出用户对该第二新闻事实点的情感属性,进行确定对该第二新闻事实点的情感属性的权重值,根据步骤203和步骤204确定得到该第二新闻事实点的属性信息中的重要程度权重值、用户对该第二新闻事实点的情感属性,及情感属性的权重值。
需要说明的是,步骤203与步骤204没有执行顺序的先后区分,其可以同步执行,或以任意的顺序执行,本实施例对此不作限定。
步骤205、根据情感属性的权重值,选取单句模板,并将解析得到的第二新闻事实点填入所选取的单句模板中,形成各个单句信息。
该步骤的实现方法与步骤102类似,在此不再赘述。
步骤206、根据预设新闻结构模板,组合各个单句信息。
在本步骤中,预设新闻结构模板可以包括:基于同一场景的单句不同排列顺序的不同模板类型;相应的,可以根据如下的方式确定使用哪种预设新闻结构模板,例如,
获取用户浏览新闻信息的浏览记录,统计用户在新闻信息的显示页面上的停留时长,确定停留时间超出预设停留时长阈值的新闻结构模板的类型为用户喜好的预设新闻结构模板;或者,
统计用户对不同的预设新闻结构模板的浏览频次,确定浏览频次超出预设浏览频次阈值的新闻结构模板类型为用户喜好的预设新闻结构模板。
步骤207、根据语法规则,确定单句与单句之间的冗余信息。
步骤208、确定去除冗余信息后的各个单句之间的描述主体,对同一描述主体的单句进行以下至少一种操作:单句与单句进行合并、调整单句与单句之间的顺序、将包含同一主语的单句中的第一个单句中的主语保留,第一个单句后续的单句中的主语去除。
具体的,所谓语法规则,包括了不同语言构成的逻辑规律,例如,中文句子构成中的主谓宾的文法表达方式,因此,根据各种语言各自的语法规则,确定各个单句之间是否存在语法构成问题,例如,主语重复,形容词间语义重复等,在保证连贯、通顺的前提下,可以将某些单句中冗余出现的词语删除,实现单句的简洁及易读性。去除了冗余信息后,确定各个单句所描述的主体内容,并将描述同一主体内容的各个单句合并,例如,对同一进球场景,同时使用了多个单句进行描述,则可以对这些单句进行合并处理;同理,对该进球场景进行描述中,根据进球动作的逻辑顺序,如运动员接球、跨越障碍、跳起投篮等的顺序,对单句与单句间的顺序进行调整;还可以将包含同一主语的单句中的第一个单句中的主语保留,第一个单句后续的单句中的主语去除等。
步骤209、基于步骤207和步骤208对组合后的单句进行调整后,生成新闻信息。
在本步骤中,可以基于人工智能等技术对组合后的各单句所构成的各段落的语言进行调整,以保证语法通顺。
基于上述各个步骤实现结合用户关注、用户喜好,生成带有个性化和情感的新闻。例如,篮球比赛中,用户喜欢某一个球队/球星,新闻稿件中会在报道次序/篇幅上倾向于喜欢的球队/球星,达到同一件事情,每个用户看到的新闻都不一样的技术效果。同时,通过监听数据,实时捕捉赛事变化,结合用户关注的比赛主体,生成带有个性化和情感的新闻。
图3为本发明一示例性实施例提供的新闻信息生成装置的结构示意图,如图3所示,本实施例的新闻信息生成装置,包括:
获取模块31,用于获取第一新闻事实点。
确定模块32,用于根据用户的个性化特征对第一新闻事实点进行解析,确定第一新闻事实点的属性信息;其中,属性信息包括:第一新闻事实点的重要程度权重值、用户对第一新闻事实点的情感属性、情感属性的权重值。
单句形成模块33,用于根据情感属性的权重值,选取单句模板,并将解析得到的第一新闻事实点填入所选取的单句模板中,形成各个单句信息。
新闻信息形成模块34,用于根据预设新闻结构模板,组合各个单句信息,生成新闻信息。
本发明实施例的新闻信息生成装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
图4为本发明另一示例性实施例提供的新闻信息生成装置的结构示意图,如图4,在上述实施例的基础上,本实施例的新闻信息生成装置,还包括:
监听模块35,用于对第一新闻事实点进行监听。
确定模块32,还用于根据时间先后的顺序和/或根据第一新闻事实点的领域属性,确定监听到的第二新闻事实点与第一新闻事实点之间是否具有关联关系。
更新模块36,用于当第二新闻事实点与第一新闻事实点之间具有关联关系时,将第一新闻事实点更新为第二新闻事实点,并返回确定模块32执行相应步骤。
可选的,用户的个性化特征包括以下特征中的至少一种:用户的属性信息、用户感兴趣的关键词、用户对关键词的喜好程度;相应的,
确定模块32,还用于统计用户对新闻信息的浏览记录,确定得到关键词;或者,还用于统计关键词出现的频次,确定用户对关键词的喜好程度;或者,还用于解析用户对新闻信息的评论,确定得到关键词和/或对关键词的喜好程度;或者,还用于根据用户收藏或关注的新闻信息,确定得到关键词。
可选的,确定模块32,包括:
重要程度确定子模块321,用于根据用户的个性化特征中的关键词和/或对关键词的喜好程度,确定第一新闻事实点的重要程度权重值。
情感属性确定子模块322,用于根据用户的个性化特征中的对关键词的喜好程度,确定用户对第一新闻事实点的情感属性及情感属性的权重值。
可选的,该新闻信息生成装置还包括:
调整模块37,用于根据语法规则,确定单句与单句之间的冗余信息;确定去除冗余信息后的各个单句之间的描述主体;对同一描述主体的单句进行以下至少一种操作:单句与单句进行合并、调整单句与单句之间的顺序、将包含同一主语的单句中的第一个单句中的主语保留,第一个单句后续的单句中的主语去除。
可选的,预设新闻结构模板包括:基于同一场景的单句不同排列顺序的描述模板;相应的,该新闻信息生成装置还包括:
模板确定模块38,用于获取用户浏览新闻信息的浏览记录,统计用户在新闻信息的显示页面上的停留时长,确定停留时间超出预设停留时长阈值的新闻结构模板的类型为用户喜好的预设新闻结构模板;或者,统计用户对不同的预设新闻结构模板的浏览频次,确定浏览频次超出预设浏览频次阈值的新闻结构模板类型为用户喜好的预设新闻结构模板。
本发明实施例的数据传输装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
本发明还提供一种电子设备可读存储介质,包括程序,当其在电子设备上运行时,使得电子设备执行上述任一实施例所述的方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例方案的范围。

Claims (13)

1.一种新闻信息生成方法,其特征在于,包括:
获取第一新闻事实点,所述第一新闻事实点为构成一件新闻事件报道的各个信息要素;根据用户的个性化特征对所述第一新闻事实点进行解析,确定所述新闻事实点的属性信息,以确定所述新闻事实点与用户之间的关联性;其中,所述属性信息包括:所述第一新闻事实点的重要程度权重值、用户对所述第一新闻事实点的情感属性、所述情感属性的权重值;
根据所述情感属性的权重值,选取单句模板,并将解析得到的第一新闻事实点填入所选取的单句模板中,形成各个单句信息;
根据预设新闻结构模板,组合所述各个单句信息,生成新闻信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述第一新闻事实点进行监听,根据时间先后的顺序和/或根据所述第一新闻事实点的领域属性,确定监听到的第二新闻事实点与所述第一新闻事实点之间是否具有关联关系;
若具有关联关系,则将所述第一新闻事实点更新为所述第二新闻事实点,并执行所述根据用户的个性化特征对所述第一新闻事实点进行解析,确定所述第一新闻事实点的属性信息;其中,所述属性信息包括:所述第一新闻事实点的重要程度权重值、用户对所述第一新闻事实点的情感属性、所述情感属性的权重值;根据所述情感属性的权重值,选取单句模板,并将解析得到的第一新闻事实点填入所选取的单句模板中,形成各个单句信息;根据预设新闻结构模板,组合所述各个单句信息,生成新闻信息的步骤。
3.根据权利要求1所述的方法,其特征在于,所述用户的个性化特征包括以下特征中的至少一种:用户的属性信息、用户感兴趣的关键词、用户对所述关键词的喜好程度;相应的,所述方法,还包括:
统计用户对新闻信息的浏览记录,确定得到所述关键词;或者,
统计所述关键词出现的频次,确定用户对所述关键词的喜好程度;或者,解析用户对新闻信息的评论,确定得到所述关键词和/或对所述关键词的喜好程度;或者
根据用户收藏或关注的新闻信息,确定得到所述关键词。
4.根据权利要求3所述的方法,其特征在于,所述获取第一新闻事实点,根据用户的个性化特征对所述第一新闻事实点进行解析,确定所述第一新闻事实点的属性信息,包括:
根据用户的个性化特征中的所述关键词和/或对所述关键词的喜好程度,确定所述第一新闻事实点的重要程度权重值;
根据用户的个性化特征中的对所述关键词的喜好程度,确定用户对所述第一新闻事实点的情感属性及所述情感属性的权重值。
5.根据权利要求1所述的方法,其特征在于,所述根据预设新闻结构模板,组合所述各个单句信息之后,还包括:
根据语法规则,确定单句与单句之间的冗余信息;
确定去除所述冗余信息后的各个单句之间的描述主体;
对同一描述主体的单句进行以下至少一种操作:单句与单句进行合并、调整单句与单句之间的顺序、将包含同一主语的单句中的第一个单句中的主语保留,所述第一个单句后续的单句中的主语去除。
6.根据权利要求5所述的方法,其特征在于,
所述预设新闻结构模板包括:基于同一场景的单句不同排列顺序的不同模板类型;
相应的,所述方法还包括:
获取用户浏览新闻信息的浏览记录,统计用户在新闻信息的显示页面上的停留时长,确定所述停留时长超出预设停留时长阈值的新闻结构模板的类型为用户喜好的预设新闻结构模板;或者,
统计用户对不同的预设新闻结构模板的浏览频次,确定所述浏览频次超出预设浏览频次阈值的新闻结构模板类型为用户喜好的预设新闻结构模板。
7.一种新闻信息生成装置,其特征在于,包括:
获取模块,用于获取第一新闻事实点,所述第一新闻事实点为构成一件新闻事件报道的各个信息要素;
确定模块,用于根据用户的个性化特征对所述第一新闻事实点进行解析,确定所述第一新闻事实点的属性信息,以确定所述新闻事实点与用户之间的关联性;其中,所述属性信息包括:所述第一新闻事实点的重要程度权重值、用户对所述第一新闻事实点的情感属性、所述情感属性的权重值;
单句形成模块,用于根据所述情感属性的权重值,选取单句模板,并将解析得到的第一新闻事实点填入所选取的单句模板中,形成各个单句信息;
新闻信息形成模块,用于根据预设新闻结构模板,组合所述各个单句信息,形成新闻信息。
8.根据权利要求7所述的装置,其特征在于,还包括:
监听模块,用于对所述第一新闻事实点进行监听;
所述确定模块,还用于根据时间先后的顺序和/或根据所述第一新闻事实点的领域属性,确定监听到的第二新闻事实点与所述第一新闻事实点之间是否具有关联关系;
更新模块,用于当所述第二新闻事实点与所述第一新闻事实点之间具有关联关系时,将所述第一新闻事实点更新为所述第二新闻事实点,并返回所述确定模块执行相应步骤。
9.根据权利要求7所述的装置,其特征在于,所述用户的个性化特征包括以下特征中的至少一种:用户的属性信息、用户感兴趣的关键词、用户对所述关键词的喜好程度;相应的,所述确定模块,还用于统计用户对新闻信息的浏览记录,确定得到所述关键词;或者,还用于统计所述关键词出现的频次,确定用户对所述关键词的喜好程度;或者,还用于解析用户对新闻信息的评论,确定得到所述关键词和/或对所述关键词的喜好程度;或者,还用于根据用户收藏或关注的新闻信息,确定得到所述关键词。
10.根据权利要求9所述的装置,其特征在于,所述确定模块,包括:
重要程度确定子模块,用于根据用户的个性化特征中的所述关键词和/或对所述关键词的喜好程度,确定所述第一新闻事实点的重要程度权重值;
情感属性确定子模块,用于根据用户的个性化特征中的对所述关键词的喜好程度,确定用户对所述第一新闻事实点的情感属性及所述情感属性的权重值。
11.根据权利要求7所述的装置,其特征在于,所述装置还包括:
调整模块,用于根据语法规则,确定单句与单句之间的冗余信息;确定去除所述冗余信息后的各个单句之间的描述主体;对同一描述主体的单句进行以下至少一种操作:单句与单句进行合并、调整单句与单句之间的顺序、将包含同一主语的单句中的第一个单句中的主语保留,所述第一个单句后续的单句中的主语去除。
12.根据权利要求11所述的装置,其特征在于,所述预设新闻结构模板包括:基于同一场景的单句不同排列顺序的描述模板;相应的,所述装置还包括:
模板确定模块,用于获取用户浏览新闻信息的浏览记录,统计用户在新闻信息的显示页面上的停留时长,确定所述停留时长超出预设停留时长阈值的新闻结构模板的类型为用户喜好的预设新闻结构模板;或者,统计用户对不同的预设新闻结构模板的浏览频次,确定所述浏览频次超出预设浏览频次阈值的新闻结构模板类型为用户喜好的预设新闻结构模板。
13.一种电子设备可读存储介质,其特征在于,包括:程序,当其在电子设备上运行时,使得电子设备执行权利要求1~6任一项所述的方法。
CN201810218234.1A 2018-03-16 2018-03-16 新闻信息生成方法、装置及电子设备可读存储介质 Active CN110309415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810218234.1A CN110309415B (zh) 2018-03-16 2018-03-16 新闻信息生成方法、装置及电子设备可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810218234.1A CN110309415B (zh) 2018-03-16 2018-03-16 新闻信息生成方法、装置及电子设备可读存储介质

Publications (2)

Publication Number Publication Date
CN110309415A CN110309415A (zh) 2019-10-08
CN110309415B true CN110309415B (zh) 2022-05-20

Family

ID=68073757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810218234.1A Active CN110309415B (zh) 2018-03-16 2018-03-16 新闻信息生成方法、装置及电子设备可读存储介质

Country Status (1)

Country Link
CN (1) CN110309415B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583363B (zh) * 2020-05-11 2024-05-03 中国传媒大学 一种图文新闻的视觉自动生成方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004118636A (ja) * 2002-09-27 2004-04-15 Bank Of Tokyo-Mitsubishi Ltd 個別化表示情報作成装置、方法、プログラム、記録媒体
US9535892B1 (en) * 2013-04-30 2017-01-03 Intuit Inc. Method and system for generating unique content based on business entity information received from a user

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8903910B2 (en) * 2011-11-16 2014-12-02 Google Inc. Creating a customized news collection based on social networking information
US9978362B2 (en) * 2014-09-02 2018-05-22 Microsoft Technology Licensing, Llc Facet recommendations from sentiment-bearing content
CN107079199A (zh) * 2014-10-17 2017-08-18 汤森路透全球资源公司 点播视频新闻节目
CN104731874B (zh) * 2015-03-05 2018-12-18 北京汇行科技有限公司 一种评价信息生成方法和装置
CN105975466A (zh) * 2015-11-04 2016-09-28 新华通讯社 一种面向短新闻的机器写稿方法及装置
CN105787095B (zh) * 2016-03-16 2019-09-27 广州索答信息科技有限公司 互联网新闻的自动生成方法和装置
CN106028078A (zh) * 2016-08-18 2016-10-12 深圳看到科技有限公司 个性化内容制作方法、装置以及播放方法、装置
CN106776523B (zh) * 2017-01-22 2020-04-07 百度在线网络技术(北京)有限公司 基于人工智能的新闻速报生成方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004118636A (ja) * 2002-09-27 2004-04-15 Bank Of Tokyo-Mitsubishi Ltd 個別化表示情報作成装置、方法、プログラム、記録媒体
US9535892B1 (en) * 2013-04-30 2017-01-03 Intuit Inc. Method and system for generating unique content based on business entity information received from a user

Also Published As

Publication number Publication date
CN110309415A (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
CN111143610B (zh) 一种内容推荐方法、装置、电子设备和存储介质
US9948595B2 (en) Methods and apparatus for inserting content into conversations in on-line and digital environments
US8725717B2 (en) System and method for identifying topics for short text communications
CN110348907B (zh) 一种广告人群的定向方法及装置
US10482142B2 (en) Information processing device, information processing method, and program
Eraslan et al. Identifying patterns in eyetracking scanpaths in terms of visual elements of web pages
CN112015852A (zh) 在关于事件的会话中提供响应
KR20170058785A (ko) 자동 기사 생성을 위한 로봇 저널리즘 시스템 및 방법
CN113779381B (zh) 资源推荐方法、装置、电子设备和存储介质
Sun et al. Movie summarization using bullet screen comments
Choi et al. Finding informative comments for video viewing
US10600017B2 (en) Co-opetition index based on rival behavior in social networks
CN111597446A (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN109284389A (zh) 一种文本数据的信息处理方法、装置
US20170262448A1 (en) Topic and term search analytics
US20220309055A1 (en) Intelligent assistant for a browser using content and structured data
CN113573128B (zh) 一种音频处理方法、装置、终端以及存储介质
Ashraf et al. Personalized news recommendation based on multi-agent framework using social media preferences
CN110309415B (zh) 新闻信息生成方法、装置及电子设备可读存储介质
US20240169004A1 (en) Methods and systems for self-tuning personalization engines in near real-time
US20220365951A1 (en) Clustering approach for auto generation and classification of regional sports
Hopfgartner et al. Semantic user modelling for personal news video retrieval
Chmiel et al. Collective emotions online
CN113177170A (zh) 评论展示方法、装置及电子设备
KR20220077790A (ko) A.i 및 빅데이터에 기반한 비대면 온라인 멘토, 멘티 매칭 플랫폼 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200421

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 13 layer self unit 01

Applicant before: GUANGZHOU SHENMA MOBILE INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
CB02 Change of applicant information

Address after: Room 554, 5 / F, building 3, 969 Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 310052 room 508, 5th floor, building 4, No. 699 Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant before: Alibaba (China) Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant