CN107241260B - 基于人工智能的新闻推送的方法和装置 - Google Patents

基于人工智能的新闻推送的方法和装置 Download PDF

Info

Publication number
CN107241260B
CN107241260B CN201710408305.XA CN201710408305A CN107241260B CN 107241260 B CN107241260 B CN 107241260B CN 201710408305 A CN201710408305 A CN 201710408305A CN 107241260 B CN107241260 B CN 107241260B
Authority
CN
China
Prior art keywords
news
main body
text
subject
pushing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710408305.XA
Other languages
English (en)
Other versions
CN107241260A (zh
Inventor
刘昊
刘凯
吕雅娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710408305.XA priority Critical patent/CN107241260B/zh
Publication of CN107241260A publication Critical patent/CN107241260A/zh
Priority to US15/942,276 priority patent/US10630798B2/en
Application granted granted Critical
Publication of CN107241260B publication Critical patent/CN107241260B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/214Monitoring or handling of messages using selective forwarding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles

Abstract

本申请公开了基于人工智能的新闻推送的方法和装置。该方法的一具体实施方式包括:从待推送新闻的新闻文本中确定至少一个新闻主体;提取上述新闻文本中分别与各个新闻主体相关联的文本片段;对每个新闻主体,根据所提取的文本片段通过深度学习方法生成主体标签;基于上述至少一个新闻主体和所生成的主体标签推送上述待推送新闻。该实施方式可以提高新闻推送的有效性。

Description

基于人工智能的新闻推送的方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及基于人工智能的新闻推送的方法和装置。
背景技术
推送,是通过一定的技术标准或协议,在互联网上提供用户需要的信息来减少信息过载的一项技术。其中,信息推送技术通过主动推送信息给用户,可以减少用户在网络上搜索所花的时间。现有的新闻推送过程中,仅仅推送新闻内容给用户,对于新闻内容中涉及的新闻主体,例如实体(如人物、物品、建筑、景点等)、事件、话题等,需要读者仔细阅读新闻后对其进行感情倾向的判断。当读者不了解真相,或者对真相了解不全面时,容易被作者的感情色彩同化,或者需要花较多时间去弄清楚新闻真相。因此,新闻推送的有效性有待提高。
人工智能(Artificial Intelligence,英文缩写为AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。因此,可以将人工智能应用于新闻推送中的感情倾向分析,提高信息推送的有效性。
发明内容
本申请的目的在于提出一种改进的基于人工智能的新闻推送的方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请提供了一种基于人工智能的新闻推送的方法,该方法包括:从待推送新闻的新闻文本中确定至少一个新闻主体;提取上述新闻文本中分别与各个新闻主体相关联的文本片段;对每个新闻主体,根据所提取的文本片段通过深度学习方法生成主体标签;基于上述至少一个新闻主体和所生成的主体标签推送上述待推送新闻。
在一些实施例中,上述从待推送新闻的新闻文本中确定至少一个新闻主体包括:将新闻文本与预设的主体关键词进行匹配;根据匹配到的主体关键词确定至少一个新闻主体。
在一些实施例中,上述提取上述新闻文本中分别与各个新闻主体相关联的文本片段包括:对每个新闻主体:将上述新闻文本中的各个分句分别与该新闻主体进行匹配;提取匹配到的分句作为与该新闻主体相关联的文本片段。
在一些实施例中,上述提取上述新闻文本中分别与各个新闻主体相关联的文本片段还包括:对于上述新闻文本中没有匹配到新闻主体的分句,判断其中是否包含代词;若有,通过指代消解确定代词所对应的新闻主体,并将该分句提取为与所包含的代词相对应的新闻主体相关联的文本片段。
在一些实施例中,上述基于上述至少一个新闻主体和所生成的主体标签推送上述待推送新闻包括:将上述至少一个新闻主体的主体标签与上述待推送新闻的新闻文本一起生成页面进行新闻推送。
在一些实施例中,上述基于上述至少一个新闻主体和所生成的主体标签推送上述待推送新闻包括:将用户的个性化标签与上述至少一个新闻主体进行匹配;响应于从用户的个性化标签中匹配到上述至少一个新闻主体中的至少一个,将上述待推送新闻推送给该用户;其中,上述个性化标签通过以下方法生成:获取用户发布的文章;从用户发布的文章中确定文章主体作为个性化标签。
第二方面,本申请还提供了一种基于人工智能的新闻推送的装置,该装置包括:确定模块,配置用于从待推送新闻的新闻文本中确定至少一个新闻主体;提取模块,配置用于提取上述新闻文本中分别与各个新闻主体相关联的文本片段;生成模块,配置用于对每个新闻主体,根据所提取的文本片段通过深度学习方法生成主体标签;推送模块,配置用于基于上述至少一个新闻主体和所生成的主体标签推送上述待推送新闻。
在一些实施例中,上述确定模块包括:匹配单元,配置用于将新闻文本与预设的主体关键词进行匹配;确定单元,配置用于根据匹配到的主体关键词确定至少一个新闻主体。
在一些实施例中,上述提取模块进一步配置用于:对每个新闻主体:将上述新闻文本中的各个分句分别与该新闻主体进行匹配;提取匹配到的分句作为与该新闻主体相关联的文本片段。
在一些实施例中,上述提取模块还配置用于:对于上述新闻文本中没有匹配到新闻主体的分句,判断其中是否包含代词;若有,通过指代消解确定代词所对应的新闻主体,并将该分句提取为与所包含的代词相对应的新闻主体相关联的文本片段。
在一些实施例中,上述推送模块还配置用于:将上述至少一个新闻主体的主体标签与上述待推送新闻的新闻文本一起生成页面进行新闻推送。
在一些实施例中,上述推送模块进一步配置用于:将用户的个性化标签与上述至少一个新闻主体进行匹配;响应于从用户的个性化标签中匹配到上述至少一个新闻主体中的至少一个,将上述待推送新闻推送给该用户;其中,上述个性化标签通过以下方法生成:获取用户发布的文章;从用户发布的文章中确定文章主体作为个性化标签。
第三方面,本申请还提供了一种计算设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当该一个或多个程序被上述一个或多个处理器执行,使得该一个或多个处理器实现上述的方法。
本申请提供的基于人工智能的新闻推送的方法和装置,通过从待推送新闻的新闻文本中确定至少一个新闻主体,然后提取上述新闻文本中分别与各个新闻主体相关联的文本片段,接着对每个新闻主体,根据所提取的文本片段通过深度学习方法生成主体标签,然后基于上述至少一个新闻主体和所生成的主体标签推送上述待推送新闻。由于基于从新闻文本中确定的新闻主体和主体标签进行新闻推送,可以直观表达新闻主体的描述特征,或是作者或读者对新闻主体的感情倾向,从而提高新闻推送的有效性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的基于人工智能的新闻推送的方法的一个实施例的流程图;
图3a、图3b是根据本申请的基于人工智能的新闻推送的方法的实施例的应用场景示意图;
图4是根据本申请的基于人工智能的新闻推送的方法的另一个实施例的流程图;
图5是根据本申请的基于人工智能的新闻推送装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的基于人工智能的新闻推送的方法或基于人工智能的新闻推送装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如浏览器应用、搜索类应用、新闻推送类应用、购物类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio LayerIII,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group AudioLayer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上浏览器应用、搜索类应用、新闻推送类应用等提供支持的后台服务器等。服务器105可以对接收到的数据进行分析等处理,并将处理结果(例如推送的新闻)反馈给终端设备。
需要说明的是,本申请所提供的基于人工智能的新闻推送的方法一般由服务器105执行,但不排除由终端设备101、102、103执行的可能。相应地,基于人工智能的新闻推送装置一般设置在服务器105中,但不排除设置在终端设备101、102、103中的可能。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的基于人工智能的新闻推送的方法的一个实施例的流程200。该基于人工智能的新闻推送的方法,包括以下步骤:
步骤201,从待推送新闻的新闻文本中确定至少一个新闻主体。
在本实施例中,运行有基于人工智能的新闻推送的方法的电子设备(例如图1所示的服务器105)首先可以从待推送新闻的新闻文本中确定出新闻中所包含的主体。其中,这里新闻中所包含的主体例如可以是实体(如人物、物品、建筑、景点等)、事件、话题等。可以理解,一条待推送新闻中的新闻主体可以有一个,也可以有多个。例如,在体育比赛新闻中,新闻主体至少涉及参加比赛的两方。
通常,待推送新闻中至少可以包括新闻文本,还可以包括但不限于以下至少一种:图片、音频、视频等等。当待推送新闻中包括图片、音频、视频等等中的至少一种时,可以对应包含相应的描述文本,上述电子设备可以将该描述文本作为新闻文本的一部分。实践中,上述电子设备可以根据任一合理的方法确定新闻主体,例如从新闻标题中确定新闻主体,通过统计新闻文本中的段首句或段尾句的主语等确定新闻主体,等等。举例而言,新闻标题为“NBA直播:马刺VS火箭”,则上述电子设备可以获取其中的名词“NBA”、“马刺”、“火箭”作为新闻主体。在一些实现中,上述电子设备还可以预设有主体关键词集合,将新闻文本与预设的主体关键词进行匹配,根据匹配到的主体关键词确定新闻主体。例如,上述电子设备可以将所有匹配到的主题关键词分别确定为新闻主体,还可以选择出匹配到的次数最多的主体关键词确定为新闻主体。这里,主体关键词与新闻文本的匹配可以是精确匹配,也可以是扩展匹配,例如主体关键词的同义词、近义词与新闻文本的匹配。如主体关键词包括人名“××刚”,该人名对应的人物还有别称“刚子”等,该别称“刚子”与新闻文本的匹配即可以作为主体关键词“××刚”与新闻文本的扩展匹配,上述电子设备在新闻文本中匹配到“刚子”时即认为匹配到了主体关键词“××刚”。
步骤202,提取上述新闻文本中分别与各个新闻主体相关联的文本片段。
在本实施例中,运行有基于人工智能的新闻推送的方法的电子设备(例如图1所示的服务器105)接着可以根据所确定的新闻主体,分别从新闻文本中提取出与各个新闻主体相关联的文本片段。这里,文本片段可以是一个段落、一个句子、长句中的一个分句、句子中的词汇等等,或者以上任意组合,本申请对此不作限定。可以理解,新闻文本中与新闻主体有关的描述,都可以作为与新闻主体相关联的文本片段。
实践中,在一些实现中,上述电子设备可以按“段落—句子—分句”的优先顺序将新闻主体与新闻文本进行匹配。例如,判断段落中出现的新闻主体个数,如果新闻主体仅有一个,则将整个段落作为与该新闻主体相关联的文本片段,如果新闻主体有多个,则逐句判断该段落中的每个句子包含的新闻主体个数。同理,如果句子中新闻主体仅有一个,则将整个句子作为与该新闻主体相关联的文本片段,如果句子中新闻主体有多个,则判断该句子中的每个分句包含的新闻主体。在另一些实现中,上述电子设备还可以直接将新闻文本中的各个分句作为文本片段,分别与所确定的新闻主体进行匹配,提取匹配到的分句作为与新闻主体相关联的文本片段。本申请对此不做限定。
可以理解,新闻文本中并非所有分句都包含主语或新闻主体,例如“她站起来,走到窗户前,望向那一片高楼”。对于没有匹配到新闻主体的分句,上述电子设备可以判断其中是否包含代词(如他、她、其、它等);若有,则可以通过指代消解的方法确定代词所对应的新闻主体,并将该分句作为与所包含的代词相对应的新闻主体相关联的文本片段。否则,可以根据向前文追溯等方法确定文本片段所对应的新闻主体,如“走到窗户前”、“望向那一片高楼”对应的主语“她”所关联的新闻主体。其中,指代消解是用在自然语言处理的信息抽取过程中的一项技术,可以用于解决在篇章中确定代词指向哪个名词短语的问题,在此不再赘述。
步骤203,对每个新闻主体,根据所提取的文本片段通过深度学习方法生成主体标签。
在本实施例中,运行有基于人工智能的新闻推送的方法的电子设备(例如图1所示的服务器105)进一步可以针对每个新闻主体,根据所提取的文本片段通过深度学习方法生成该新闻主体的主体标签。其中,主体标签可以是词或短语,其可以用于描述新闻主体的特征,如篮球、音乐等,也可以是表达作者或读者对新闻主体的感情色彩,例如喜欢、厌恶等。
在本实施例中,上述电子设备可以预先通过一定数量的自然语言样本训练有深度学习模型,用于对文本片段进行分类,其中所分类别即为主体标签。这里的深度学习模型例如可以是多层反馈神经网络RNN(Recurrent neural Network)、时间递归网络LSTM(LongShort-Term Memory)等等,在此不再赘述。可以理解,主体标签可以有一个,也可以有多个,本申请对此不做限定。实践中,上述电子设备可以根据通过深度学习模型进行分类后在每个类别上的概率来确定主体标签。例如上述电子设备可以将在每个类别上的概率有高到期进行排列,选择排列靠前的预设个数的类别作为主体标签,也可以选择概率大于预设概率阈值的一个或多个类别作为主体标签。
步骤204,基于上述新闻主体和上述主体标签进行新闻推送。
在本实施例中,运行有基于人工智能的新闻推送的方法的电子设备(例如图1所示的服务器105)进一步可以基于上述确定的新闻主体,以及新闻主体对应的主体标签进行新闻推送。
在本实施例的一些可选实现方式中,上述电子设备可以将主体标签与新闻文本一起生成页面推送给用户。实践中,上述电子设备可以根据新闻主体数量的不同,选择不同的推送方式。例如,当新闻文本中只有一个新闻主体时,上述电子设备可以将一个或多个主体标签排列在新闻页面的预定位置进行推送,当新闻文本中只有一个新闻主体时,上述电子设备可以采取分别在预定位置进行标注主体标签的形式进行推送。
作为一个应用场景,本申请提供的基于人工智能的新闻推送的方法可以应用于为新闻推送类应用提供支持的后台服务器。每获取一条待推送新闻时,上述后台服务器可以:获取该待推送新闻的新闻文本,然后按照预设的主题关键词从新闻文本中确定新闻主体;接着,提取新闻文本中与所确定的新闻主体相关联的文本片段;然后,对所提取的文本片段通过深度学习方法生成主体标签;接着,如图3a和图3b所示,基于所确定的新闻主体和主体标签向运行有上述新闻推送类应用的终端300进行新闻推送。为了更直观地说明本申请所达到的效果,请参考图3a和图3b。图3a和图3b给出了两种不同的推送场景。如图3a所示,在推送的新闻301中,新闻主体包括“赵××”,后台服务器对该新闻主体生成的主体标签302包括伸大拇指的图案、文字“英雄,赞”,后台服务器将主体标签302与新闻301的内容一起生成页面推送至终端300。如图3b所示,在搜索“赵××”的页面上,包括后台服务器根据新闻文本生成的关于新闻主体“赵××”的主体标签302′和推送的新闻301′。
因此,本实施例的基于人工智能的新闻推送的方法,由于基于从新闻文本中确定的新闻主体和主体标签进行新闻推送,可以直观表达新闻主体的描述特征,或是作者或读者对新闻主体的感情倾向,从而提高新闻推送的有效性。
继续参考图4,示出了根据本申请的基于人工智能的新闻推送的方法的另一个实施例的流程400。该基于人工智能的新闻推送的方法,包括以下步骤:
步骤401,从待推送新闻的新闻文本中确定至少一个新闻主体。
在本实施例中,运行有基于人工智能的新闻推送的方法的电子设备(例如图1所示的服务器105)首先可以从待推送新闻的新闻文本中确定出新闻中所包含的主体。其中,这里新闻中所包含的主体例如可以是实体(如人物、物品、建筑、景点等)、事件、话题等。可以理解,一条待推送新闻中的新闻主体可以有一个,也可以有多个。在一些实现中,上述电子设备还可以预设有主体关键词集合,将新闻文本与预设的主体关键词进行匹配,根据匹配到的主体关键词确定新闻主体。
步骤402,提取上述新闻文本中分别与各个新闻主体相关联的文本片段。
在本实施例中,运行有基于人工智能的新闻推送的方法的电子设备(例如图1所示的服务器105)接着可以根据所确定的新闻主体,分别从新闻文本中提取出与各个新闻主体相关联的文本片段。这里,文本片段可以是一个段落、一个句子、长句中的一个分句、句子中的词汇等等,或者以上任意组合,本申请对此不作限定。可以理解,新闻文本中与新闻主体有关的描述,都可以作为与新闻主体相关联的文本片段。
步骤403,对每个新闻主体,根据所提取的文本片段通过深度学习方法生成主体标签。
在本实施例中,运行有基于人工智能的新闻推送的方法的电子设备(例如图1所示的服务器105)进一步可以针对每个新闻主体,根据所提取的文本片段通过诸如RNN、LSTM之类的深度学习方法生成该新闻主体的主体标签。其中,主体标签可以是词或短语,其可以用于描述新闻主体的特征,如篮球、音乐等,也可以是表达作者或读者对新闻主体的感情色彩,例如喜欢、厌恶等。
步骤404,将用户的个性化标签与上述至少一个新闻主体进行匹配。
在本实施例中,运行有基于人工智能的新闻推送的方法的电子设备(例如图1所示的服务器105)进一步可以获取至少一个用户的个性化标签,并将所获取的每个用户的个性化标签分别与所确定的至少一个新闻主体进行匹配。
其中,用户的个性化标签可以用于表示用户的偏好及所关注的事物。用户的个性化标签可以预先存储在上述电子设备上,也可以有上述电子设备实时生成,还可以由上述电子设备从用于生成用户个性化标签的其他电子设备(如用户所持有的的终端设备)获取,本申请对此不做限定。用户的而个性化标签可以通过用户手动设置,也可以根据的历史行为记录(如历史访问记录、历史搜索记录等)提取。在一些实现中,用户的个性化标签可以通过以下方法生成:获取用户发布的文章;从用户发布的文章中确定文章主体作为个性化标签。这里,用户发布的文章可以是用户通过包括但不限于以下至少一个网站发布的文章:微博、期刊、论坛等等。文章主体的确定方法和新闻主体的确定方法类似,在此不再赘述。
用户的个性化标签与待推送新闻的至少一个新闻主体进行匹配过程中,由于个性化标签包括的主体和新闻主体的描述可以不同,因此在匹配过程中可以将个性化标签和新闻主体分别扩展到同义词、近义词的匹配。当个性化标签及其同义词、近义词中的一个与新闻主体及其同义词、近义词中的一个相匹配时,可以确定用户的个性化标签与这一个新闻主体相匹配。
步骤405,响应于从用户的个性化标签中匹配到上述至少一个新闻主体中的至少一个,将上述待推送新闻推送给该用户。
在本实施例中,响应于从用户的个性化标签中匹配到上述至少一个新闻主体中的至少一个,运行有基于人工智能的新闻推送的方法的电子设备(例如图1所示的服务器105)就可以将上述待推送新闻推送给该个性化标签所对应的用户。
从图4中可以看出,与图2对应的实施例相比,本实施例中的基于人工智能的新闻推送的方法的流程400突出了根据用户的个性化标签进行新闻推送的步骤。由此,本实施例描述的方案可以结合用户的个性化特征,实现富于针对性的基于人工智能的新闻推送。
进一步参考图5,作为对上述基于人工智能的新闻推送的方法的实现,本申请提供了一种基于人工智能的新闻推送装置的一个实施例,该装置实施例与图2所示的方法实施例相对应。
如图5所示,本实施例的基于人工智能的新闻推送装置500包括:确定模块501、提取模块502、生成模块503和推送模块504。其中,确定模块501可以配置用于从待推送新闻的新闻文本中确定至少一个新闻主体;提取模块502可以配置用于提取上述新闻文本中分别与各个新闻主体相关联的文本片段;生成模块503可以配置用于对每个新闻主体,根据所提取的文本片段通过深度学习方法生成主体标签;推送模块504可以配置用于基于上述至少一个新闻主体和所生成的主体标签推送上述待推送新闻。
在本实施例的一些可选实现方式中,上述确定模块501可以包括:匹配单元(未示出),可以配置用于将新闻文本与预设的主体关键词进行匹配;确定单元(未示出),可以配置用于根据匹配到的主体关键词确定至少一个新闻主体。
在本实施例的一些可选实现方式中,上述提取模块502进一步可以配置用于:对每个新闻主体:将上述新闻文本中的各个分句分别与该新闻主体进行匹配;提取匹配到的分句作为与该新闻主体相关联的文本片段。
在本实施例的另一些可选实现方式中,上述提取模块502还可以配置用于:对于上述新闻文本中没有匹配到新闻主体的分句,判断其中是否包含代词;若有,通过指代消解确定代词所对应的新闻主体,并将该分句提取为与所包含的代词相对应的新闻主体相关联的文本片段。
在本实施例的一些可选实现方式中,上述推送模块504还可以配置用于:将上述至少一个新闻主体的主体标签与上述待推送新闻的新闻文本一起生成页面进行新闻推送。
在本实施例的另一些可选实现方式中,上述推送模块504进一步还可以配置用于:将用户的个性化标签与上述至少一个新闻主体进行匹配;响应于从用户的个性化标签中匹配到上述至少一个新闻主体中的至少一个,将上述待推送新闻推送给该用户;其中,上述个性化标签通过以下方法生成:获取用户发布的文章;从用户发布的文章中确定文章主体作为个性化标签。
值得说明的是,基于人工智能的新闻推送的装置500中记载的诸模块与参考图2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于装置500及其中包含的模块或单元,在此不再赘述。
本领域技术人员可以理解,上述基于人工智能的新闻推送的装置500还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图5中未示出。
下面参考图6,其示出了适于用来实现本申请实施例的终端设备/服务器的计算机系统600的结构示意图。图6示出的终端设备/服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘或触摸屏等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所涉及的非易失性计算机可读介质可以是非易失性计算机可读信号介质或者非易失性计算机可读存储介质或者是上述两者的任意组合。非易失性计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。非易失性计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,非易失性计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括确定模块、提取模块、生成模块和推送模块。其中,这些模块的名称在某种情况下并不构成对该单元本身的限定,例如,确定模块还可以被描述为“配置用于从待推送新闻的新闻文本中确定至少一个新闻主体的模块”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:从待推送新闻的新闻文本中确定至少一个新闻主体;提取上述新闻文本中分别与各个新闻主体相关联的文本片段;对每个新闻主体,根据所提取的文本片段通过深度学习方法生成主体标签;基于上述至少一个新闻主体和所生成的主体标签推送上述待推送新闻。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种基于人工智能的新闻推送的方法,所述方法包括:
从待推送新闻的新闻文本中确定至少一个新闻主体;
提取所述新闻文本中分别与各个新闻主体相关联的文本片段;
对每个新闻主体,根据所提取的文本片段通过深度学习方法生成主体标签;
基于所述至少一个新闻主体和所生成的主体标签推送所述待推送新闻;
其中,所述基于所述至少一个新闻主体和所生成的主体标签推送所述待推送新闻包括:将所述至少一个新闻主体的主体标签与所述待推送新闻的新闻文本一起生成页面进行新闻推送。
2.根据权利要求1所述的方法,其特征在于,所述从待推送新闻的新闻文本中确定至少一个新闻主体包括:
将新闻文本与预设的主体关键词进行匹配;
根据匹配到的主体关键词确定至少一个新闻主体。
3.根据权利要求1所述的方法,其特征在于,所述提取所述新闻文本中分别与各个新闻主体相关联的文本片段包括:
对每个新闻主体,
将所述新闻文本中的各个分句分别与该新闻主体进行匹配;
提取匹配到的分句作为与该新闻主体相关联的文本片段。
4.根据权利要求3所述的方法,其特征在于,所述提取所述新闻文本中分别与各个新闻主体相关联的文本片段还包括:
对于所述新闻文本中没有匹配到新闻主体的分句,判断其中是否包含代词;
若有,通过指代消解确定代词所对应的新闻主体,并将该分句提取为与所包含的代词相对应的新闻主体相关联的文本片段。
5.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个新闻主体和所生成的主体标签推送所述待推送新闻包括:
将用户的个性化标签与所述至少一个新闻主体进行匹配;
响应于从用户的个性化标签中匹配到所述至少一个新闻主体中的至少一个,将所述待推送新闻推送给该用户;
其中,所述个性化标签通过以下方法生成:获取用户发布的文章;从用户发布的文章中确定文章主体作为个性化标签。
6.一种基于人工智能的新闻推送的装置,所述装置包括:
确定模块,配置用于从待推送新闻的新闻文本中确定至少一个新闻主体;
提取模块,配置用于提取所述新闻文本中分别与各个新闻主体相关联的文本片段;
生成模块,配置用于对每个新闻主体,根据所提取的文本片段通过深度学习方法生成主体标签;
推送模块,配置用于基于所述至少一个新闻主体和所生成的主体标签推送所述待推送新闻;
所述推送模块还配置用于:将所述至少一个新闻主体的主体标签与所述待推送新闻的新闻文本一起生成页面进行新闻推送。
7.根据权利要求6所述的装置,其特征在于,所述确定模块包括:
匹配单元,配置用于将新闻文本与预设的主体关键词进行匹配;
确定单元,配置用于根据匹配到的主体关键词确定至少一个新闻主体。
8.根据权利要求6所述的装置,其特征在于,所述提取模块进一步配置用于:
对每个新闻主体,
将所述新闻文本中的各个分句分别与该新闻主体进行匹配;
提取匹配到的分句作为与该新闻主体相关联的文本片段。
9.根据权利要求8所述的装置,其特征在于,所述提取模块还配置用于:
对于所述新闻文本中没有匹配到新闻主体的分句,判断其中是否包含代词;
若有,通过指代消解确定代词所对应的新闻主体,并将该分句提取为与所包含的代词相对应的新闻主体相关联的文本片段。
10.根据权利要求7所述的装置,其特征在于,所述推送模块进一步配置用于:
将用户的个性化标签与所述至少一个新闻主体进行匹配;
响应于从用户的个性化标签中匹配到所述至少一个新闻主体中的至少一个,将所述待推送新闻推送给该用户;
其中,所述个性化标签通过以下方法生成:获取用户发布的文章;从用户发布的文章中确定文章主体作为个性化标签。
11.一种计算设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种非易失性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201710408305.XA 2017-06-02 2017-06-02 基于人工智能的新闻推送的方法和装置 Active CN107241260B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710408305.XA CN107241260B (zh) 2017-06-02 2017-06-02 基于人工智能的新闻推送的方法和装置
US15/942,276 US10630798B2 (en) 2017-06-02 2018-03-30 Artificial intelligence based method and apparatus for pushing news

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710408305.XA CN107241260B (zh) 2017-06-02 2017-06-02 基于人工智能的新闻推送的方法和装置

Publications (2)

Publication Number Publication Date
CN107241260A CN107241260A (zh) 2017-10-10
CN107241260B true CN107241260B (zh) 2020-05-05

Family

ID=59985418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710408305.XA Active CN107241260B (zh) 2017-06-02 2017-06-02 基于人工智能的新闻推送的方法和装置

Country Status (2)

Country Link
US (1) US10630798B2 (zh)
CN (1) CN107241260B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633406B (zh) * 2018-06-06 2023-08-01 北京百度网讯科技有限公司 事件专题的生成方法、装置、存储介质和终端设备
RU2731654C1 (ru) 2018-09-17 2020-09-07 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для создания пуш-уведомлений, связанных с цифровыми новостями
CN109408706B (zh) * 2018-09-20 2022-05-03 上海掌门科技有限公司 一种图像过滤方法
CN110162701B (zh) * 2019-05-10 2023-12-19 深圳市雅阅科技有限公司 内容推送方法、装置、计算机设备和存储介质
CN110705206B (zh) * 2019-09-23 2021-08-20 腾讯科技(深圳)有限公司 一种文本信息的处理方法及相关装置
CN111931022A (zh) * 2020-06-10 2020-11-13 北京雅邦网络技术发展有限公司 Ai热点内容智能编辑系统
CN112015989A (zh) * 2020-08-31 2020-12-01 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN112153424B (zh) * 2020-09-23 2024-01-26 腾讯科技(深圳)有限公司 内容推送方法、装置、电子设备和存储介质
US20220309588A1 (en) * 2021-03-26 2022-09-29 International Business Machines Corporation Identifying and leveraging close associates from unstructured data to improvise risk scoring
CN113449078A (zh) * 2021-06-25 2021-09-28 完美世界控股集团有限公司 相似新闻识别方法、设备、系统及存储介质
CN114841155A (zh) * 2022-04-21 2022-08-02 科技日报社 主题内容智能聚合方法、装置、电子设备及存储介质
CN116069914B (zh) * 2023-02-13 2024-04-12 北京百度网讯科技有限公司 训练数据的生成方法、模型训练方法以及装置
CN116501972B (zh) * 2023-05-06 2024-01-05 广州市巨应信息科技有限公司 基于大数据在线服务的内容推送方法及ai智能推送系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105005616A (zh) * 2015-07-20 2015-10-28 清华大学 基于文本图片特征交互扩充的文本图解方法及系统
CN105939364A (zh) * 2016-07-12 2016-09-14 搜油郎成都科技有限公司 一种智能的消息推送方法和系统
US9503680B1 (en) * 2015-12-23 2016-11-22 Avaya Inc. System for optimizing the monetization of outgoing video sessions of a contact center
CN106599209A (zh) * 2016-12-15 2017-04-26 天脉聚源(北京)传媒科技有限公司 一种新闻推送方法及装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6353824B1 (en) * 1997-11-18 2002-03-05 Apple Computer, Inc. Method for dynamic presentation of the contents topically rich capsule overviews corresponding to the plurality of documents, resolving co-referentiality in document segments
US20060150087A1 (en) * 2006-01-20 2006-07-06 Daniel Cronenberger Ultralink text analysis tool
US8077837B1 (en) * 2007-07-03 2011-12-13 At&T Mobility Ii Llc Systems and methods for providing context-based voicemail
US10083248B2 (en) * 2010-04-07 2018-09-25 Excalibur Ip, Llc Method and system for topic-based browsing
JP2012093991A (ja) * 2010-10-27 2012-05-17 Buffalo Inc タグ情報管理装置、タグ情報管理システム、タグ情報管理プログラム、タグ情報管理方法
US20130294746A1 (en) * 2012-05-01 2013-11-07 Wochit, Inc. System and method of generating multimedia content
CN103678304B (zh) * 2012-08-31 2017-04-12 国际商业机器公司 为预定网页推送特定内容的方法、装置
US9440152B2 (en) * 2013-05-22 2016-09-13 Clip Engine LLC Fantasy sports integration with video content
US20170072321A1 (en) * 2013-05-22 2017-03-16 David S. Thompson Highly interactive fantasy sports interleaver
US9811866B1 (en) * 2013-07-20 2017-11-07 Relationship Science LLC News alerts based on user analytics
US9842586B2 (en) * 2014-07-09 2017-12-12 Genesys Telecommunications Laboratories, Inc. System and method for semantically exploring concepts
US9817908B2 (en) * 2014-12-29 2017-11-14 Raytheon Company Systems and methods for news event organization
US10484329B2 (en) * 2015-06-03 2019-11-19 Oath Inc. Computerized notification system and method for delivering breaking news content
US10187677B1 (en) * 2017-09-20 2019-01-22 Rovi Guides, Inc. Systems and methods for generating aggregated media assets on related content from different sources

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105005616A (zh) * 2015-07-20 2015-10-28 清华大学 基于文本图片特征交互扩充的文本图解方法及系统
US9503680B1 (en) * 2015-12-23 2016-11-22 Avaya Inc. System for optimizing the monetization of outgoing video sessions of a contact center
CN105939364A (zh) * 2016-07-12 2016-09-14 搜油郎成都科技有限公司 一种智能的消息推送方法和系统
CN106599209A (zh) * 2016-12-15 2017-04-26 天脉聚源(北京)传媒科技有限公司 一种新闻推送方法及装置

Also Published As

Publication number Publication date
US20180352043A1 (en) 2018-12-06
US10630798B2 (en) 2020-04-21
CN107241260A (zh) 2017-10-10

Similar Documents

Publication Publication Date Title
CN107241260B (zh) 基于人工智能的新闻推送的方法和装置
CN108153901B (zh) 基于知识图谱的信息推送方法和装置
CN107256267B (zh) 查询方法和装置
CN107346336B (zh) 基于人工智能的信息处理方法和装置
CN107679039B (zh) 用于确定语句意图的方法和装置
CN107491547B (zh) 基于人工智能的搜索方法和装置
CN107066449B (zh) 信息推送方法和装置
CN107220386B (zh) 信息推送方法和装置
CN110582025B (zh) 用于处理视频的方法和装置
CN106874467B (zh) 用于提供搜索结果的方法和装置
CN107832433B (zh) 基于对话交互的信息推荐方法、装置、服务器和存储介质
CN106960030B (zh) 基于人工智能的推送信息方法及装置
CN107193792B (zh) 基于人工智能的生成文章的方法和装置
CN107577807B (zh) 用于推送信息的方法和装置
CN109543058B (zh) 用于检测图像的方法、电子设备和计算机可读介质
CN109697239B (zh) 用于生成图文信息的方法
CN111428010B (zh) 人机智能问答的方法和装置
CN109635094B (zh) 用于生成答案的方法和装置
CN110069698B (zh) 信息推送方法和装置
CN108268450B (zh) 用于生成信息的方法和装置
CN107526718B (zh) 用于生成文本的方法和装置
CN111753551B (zh) 基于词向量生成模型的信息生成方法和装置
CN109582825B (zh) 用于生成信息的方法和装置
CN106919711B (zh) 基于人工智能的标注信息的方法和装置
CN107944032B (zh) 用于生成信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant