CN111400456A - 资讯推荐方法及装置 - Google Patents

资讯推荐方法及装置 Download PDF

Info

Publication number
CN111400456A
CN111400456A CN202010199799.7A CN202010199799A CN111400456A CN 111400456 A CN111400456 A CN 111400456A CN 202010199799 A CN202010199799 A CN 202010199799A CN 111400456 A CN111400456 A CN 111400456A
Authority
CN
China
Prior art keywords
event
features
events
entity
parent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010199799.7A
Other languages
English (en)
Other versions
CN111400456B (zh
Inventor
韩翠云
陈玉光
黄佳艳
李法远
刘远圳
潘禄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010199799.7A priority Critical patent/CN111400456B/zh
Publication of CN111400456A publication Critical patent/CN111400456A/zh
Application granted granted Critical
Publication of CN111400456B publication Critical patent/CN111400456B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种资讯推荐方法及装置,涉及人工智能领域。具体实现方案为:服务器预先利用样本资讯训练分类模型,利用分类模型挖掘事件数据库中事件之间的从属关系得到事件图谱并保存,该事件图谱中的节点为事件,事件之间具有边,则表示该两个事件为从属关系。每次接收到用户通过终端设备发送的推荐请求后,根据用户的历史浏览记录等确定出用户感兴趣的第一事件,基于该第一事件和事件图谱,确定出与第一事件为从属事件的第二事件,并向终端设备发送包含该第二事件的目标资讯。采用该种方案,通过利用事件的特征训练出的分类模型确定两个事件是否为从属事件,实现挖掘事件之间的从属关系的目的,进而实现精准推荐。

Description

资讯推荐方法及装置
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种资讯推荐方法及装置。
背景技术
随着移动互联网技术的飞速发展,各大新闻资讯类应用程序(application,APP)也随之迅速发展。如何向用户精准推荐,成为各大APP关注的问题。
通常情况下,一篇新闻资讯主要报道一个事件,而热门事件通常不止一篇新闻资讯,将讲述同一个事件的新闻资讯可以聚簇得到资讯簇事件。不同事件并不是孤立的,而是存在一定的关系。事件之间的关系包括共指关系、从属关系、时序关系以及因果关系。如果某几个事件具有相同的主题,则该几个事件为从属事件,因为他们从属于同一个主题。例如,假设张三和李四为著名演员,事件A为张三与经纪公司甲解约,事件B为李四主动与经纪公司乙解约,该两个事件的主题同为品牌代言,因此该两个事件为从属事件。挖掘事件之间的从属关系,向用户推荐同一个主题的多篇资讯,是实现精准推荐的一部分。
但是,现有的关系挖掘方案主要用于挖掘事件之间的因果关系。挖掘方案为:基于句子内词语级别的关系或篇章内句子级别的关系,挖掘事件之间的因果关系。该挖掘方案中,事件表述为一个短语或动词,若一个句子或一篇篇章内具有两个事件,两个事件之间具有特定的连接词,如“导致”、“因此”等,则认为该两个事件为因果关系。然而,属于同一个主题的两个事件之间可能并不存在连接词,或者,属于同一个主题的两个事件根本就不在同一个篇章(新闻资讯)内。因此,上述用于挖掘因果关系的方案,并不适用于挖掘事件之间的从属关系。
发明内容
本申请实施例提供一种资讯推荐方法及装置,通过利用事件的特征训练出的分类模型确定两个事件是否为从属事件,实现挖掘事件之间的从属关系的目的,进而实现精准推荐。
第一方面,本申请实施例提供一种资讯推荐方法,包括:
接收来自终端设备的推荐请求,所述推荐请求用于请求向用户推荐资讯;利用所述用户感兴趣的第一事件和事件图谱确定第二事件,所述第一事件和所述第二事件具有从属关系,所述事件图谱是预先利用分类模型挖掘事件数据库中不同事件之间的从属关系得到的,所述分类模型为所述服务器预先利用样本事件集包含的事件的特征训练得到的;向所述终端设备发送所述目标资讯,所述目标资讯为包含所述第二事件的资讯。采用该种方案,通过利用事件的特征训练出的分类模型确定两个事件是否为从属事件,实现挖掘事件之间的从属关系的目的,进而实现精准推荐。
一种可行的设计中,从所述样本事件集包含的各事件中提取出特征,所述特征包括下述特征中的至少一个:语义特征、隐式特征、显式特征,其中,所述语义特征用于指示利用事件包含的关键词学习到的特征,所述隐式特征用于指示利用所述事件包含的不同实体的共现次数学习到的知识,所述显式特征用于指示利用所述事件包含的实体和知识图谱学习到的知识,利用所述特征,训练所述分类模型。采用该种方案,实现服务器利用事件的特征训练出分类模型的目的。
一种可行的设计中,所述事件的特征包括语义特征,所述语义特征通过语义向量表示,所述从所述样本事件集包含的各事件中提取出特征,包括:从所述样本事件集包含的每个事件中抽取出多个关键词;利用每个所述事件中的各关键词在所述样本事件集中出现的次数,确定每个所述事件的语义向量。采用该种方案,实现提取出事件的语义特征的目的。
一种可行的设计中,所述事件的特征包括隐式特征,所述隐式特征通过隐式向量表示,所述从所述样本事件集包含的各事件中提取出特征,包括:从所述样本事件集包含的各事件中抽取出K个实体,K≥1且为整数;利用所述K个实体,确定K×K的共现矩阵,所述共现矩阵的一个元素为一个实体对,所述元素的值表示同时出现该实体对中的两个实体的样本事件的数量,所述共现矩阵的每一行表示K个实体中一个实体的隐式向量;利用每个所述事件包含的各实体的隐式向量,确定每个所述事件的隐式向量。采用该种方案,实现提取出事件的隐式特征的目的。
一种可行的设计中,所述特征包括显式特征,所述显式特征通过显式向量表示,所述从所述样本事件集包含的各事件中提取出特征,包括:从所述样本事件集包含的各事件中抽取出K个实体,所述K≥1且为整数;对于所述K个实体中的任意两个实体形成的实体对,利用知识图谱确定与第一实体连接的实体,以及与第二实体连接的实体,所述第一实体和所述第二实体为所述实体对包含的两个实体;利用与所述与第一实体连接的实体,以及与所述第二实体连接的实体,确定所述第一实体的显式向量和所述第二实体的显式向量;利用每个所述事件包含的各实体的显式向量,确定每个所述事件的显式向量。
一种可行的设计中,所述利用所述特征,训练所述分类模型之前,还包括:当所述样本事件集中事件的特征包含所述语义特征、所述隐式特征、所述显式特征中的至少两个时,将所述语义特征、所述隐式特征、所述显式特征中的至少两个特征各自对应的向量拼接,得到所述事件的特征向量。采用该种方案,实现整合事件的语义特征、隐式特征和显式特征的目的。
一种可行的设计中,所述事件图谱包含至少一个父事件,所述至少一个父事件下属的各子事件互为从属关系,所述利用所述用户感兴趣的第一事件和事件图谱确定出第二事件之前,还包括:从所述事件数据库中获取第三事件,所述第三事件是所述事件数据库中的最新事件,利用所述分类模型确定所述至少一个父事件中是否存在目标父事件,所述目标父事件下属的子事件与所述第三事件为从属事件,若所述至少一个父事件中存在所述目标父事件,则将所述第三事件添加至所述目标父事件的子事件中。采用该种方案,实现更新事件图谱的目的。
一种可行的设计中,若所述至少一个父事件中不存在所述目标父事件,则利用所述分类模型判断所述事件数据库中是否存在第四事件,所述第四事件与所述第三事件互为从属事件,若所述事件数据库中存在所述第四事件,则根据所述第三事件和所述第四事件生成所述目标父事件,将所述目标父事件、所述第三事件和所述第四事件添加至所述事件图谱。采用该种方案,实现更新事件图谱的目的。
一种可行的设计中,若所述至少一个父事件中不存在所述目标父事件,则利用所述分类模型判断所述事件数据库中是否存在第四事件包括:若所述至少一个父事件中不存在所述目标父事件,则确定所述第三事件的特征向量与候选事件的特征向量之间的距离,所述候选事件是所述事件数据库中不属于任意一个父事件的事件,若所述第三事件的特征向量和所述候选事件的特征向量之间的距离小于预设阈值,则确定所述候选事件是所述第四事件。
一种可行的设计中,所述利用所述用户感兴趣的第一事件和事件图谱确定出第二事件,包括:从所述事件图谱中确定出所述第一事件的父事件,将所述第一事件的父事件的其他子事件作为所述第二事件。采用该种方案,实现确定出与第一事件具有从属关系的第二事件的目的。
第二方面,本申请实施例提供一种资讯推荐装置,包括:
接收单元,用于接收来自终端设备的推荐请求,所述推荐请求用于请求向用户推荐资讯;处理单元,用于利用所述用户感兴趣的第一事件和事件图谱确定第二事件,所述第一事件和所述第二事件具有从属关系,所述事件图谱是预先利用分类模型挖掘事件数据库中不同事件之间的从属关系得到的,所述分类模型为所述服务器预先利用样本事件集包含的事件的特征训练得到的;发送单元,用于向所述终端设备发送所述目标资讯,所述目标资讯为包含所述第二事件的资讯。
一种可行的设计中,所述处理单元,在利用所述用户感兴趣的第一事件和事件图谱确定出第二事件之前,还用于从所述样本事件集包含的各事件中提取出特征,所述特征包括下述特征中的至少一个:语义特征、隐式特征、显式特征,其中,所述语义特征用于指示利用事件包含的关键词学习到的特征,所述隐式特征用于指示利用所述事件包含的不同实体的共现次数学习到的知识,所述显式特征用于指示利用所述事件包含的实体和知识图谱学习到的知识,利用所述特征,训练所述分类模型。
一种可行的设计中,所述事件的特征包括语义特征,所述语义特征通过语义向量表示,所述处理单元在从所述样本事件集包含的各事件中提取出特征时,用于从所述样本事件集包含的每个事件中抽取出多个关键词,利用每个所述事件中的各关键词在所述样本事件集中出现的次数,确定每个所述事件的语义向量。
一种可行的设计中,所述事件的特征包括隐式特征,所述隐式特征通过隐式向量表示,所述处理单元在从所述样本事件集包含的各事件中提取出特征时,用于从所述样本事件集包含的各事件中抽取出K个实体,K≥1且为整数;利用所述K个实体,确定K×K的共现矩阵,所述共现矩阵的一个元素为一个实体对,所述元素的值表示同时出现该实体对中的两个实体的样本事件的数量,所述共现矩阵的每一行表示K个实体中一个实体的隐式向量,利用每个所述事件包含的各实体的隐式向量,确定每个所述事件的隐式向量。
一种可行的设计中,所述特征包括显式特征,所述显式特征通过显式向量表示,所述处理单元在从所述样本事件集包含的各事件中提取出特征时,用于从所述样本事件集包含的各事件中抽取出K个实体,所述K≥1且为整数,对于所述K个实体中的任意两个实体形成的实体对,利用知识图谱确定与第一实体连接的实体,以及与第二实体连接的实体,所述第一实体和所述第二实体为所述实体对包含的两个实体,利用与所述与第一实体连接的实体,以及与所述第二实体连接的实体,确定所述第一实体的显式向量和所述第二实体的显式向量,利用每个所述事件包含的各实体的显式向量,确定每个所述事件的显式向量。
一种可行的设计中,所述处理单元,在利用所述特征,训练所述分类模型之前,还用于当所述样本事件集中事件的特征包含所述语义特征、所述隐式特征、所述显式特征中的至少两个时,将所述语义特征、所述隐式特征、所述显式特征中的至少两个特征各自对应的向量拼接,得到所述事件的特征向量。
一种可行的设计中,所述事件图谱包含至少一个父事件,所述至少一个父事件下属的各子事件互为从属关系,所述处理单元,在利用所述用户感兴趣的第一事件和事件图谱确定出第二事件之前,还用于从所述事件数据库中获取第三事件,所述第三事件是所述事件数据库中的最新事件,利用所述分类模型确定所述至少一个父事件中是否存在目标父事件,所述目标父事件下属的子事件与所述第三事件为从属事件,若所述至少一个父事件中存在所述目标父事件,则将所述第三事件添加至所述目标父事件的子事件中。
一种可行的设计中,所述处理单元,还用于若所述至少一个父事件中不存在所述目标父事件,则利用所述分类模型判断所述事件数据库中是否存在第四事件,所述第四事件与所述第三事件互为从属事件,若所述事件数据库中存在所述第四事件,则根据所述第三事件和所述第四事件生成所述目标父事件,将所述目标父事件、所述第三事件和所述第四事件添加至所述事件图谱。
一种可行的设计中,若所述至少一个父事件中不存在所述目标父事件,则所述处理单元利用所述分类模型判断所述事件数据库中是否存在第四事件时,具体用于若所述至少一个父事件中不存在所述目标父事件,则确定所述第三事件的特征向量与候选事件的特征向量之间的距离,所述候选事件是所述事件数据库中不属于任意一个父事件的事件,若所述第三事件的特征向量和所述候选事件的特征向量之间的距离小于预设阈值,则确定所述候选事件是所述第四事件。
一种可行的设计中,所述处理单元,所述处理单元,在利用所述用户感兴趣的第一事件和事件图谱确定出第二事件时,用于从所述事件图谱中确定出所述第一事件的父事件,将所述第一事件的父事件的其他子事件作为所述第二事件。
第三方面、本申请实施例提供一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面或第一方面任意可能实现的方法。
第四方面,本申请实施例提供一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备计算机执行上述第一方面或第一方面的各种可能的实现方式中的方法。
第五方面,本申请实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述电子设备执行上述第一方面或第一方面的各种可能的实现方式中的方法。
第六方面,本申请实施例提供一种分类模型训练方法,包括:挖掘样本资讯集包含的资讯中每个事件的事件特征,利用所述事件特征,训练分类模型,所述分类模型用于判断事件数据库中的任意两个事件是否为从属事件。
上述申请中的一个实施例具有如下优点或有益效果:通过利用事件的特征训练出的分类模型确定两个事件是否为从属事件,实现挖掘事件之间的从属关系的目的,进而实现精准推荐。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例提供的资讯推荐方法的网络架构示意图;
图2是本申请实施例提供的资讯推荐方法的流程图;
图3是本申请实施例提供的资讯推荐方法中提取事件的语义特征的流程图;
图4是本申请实施例提供的资讯推荐方法中提取事件的隐式特征的流程图;
图5本申请实施例提供的资讯推荐方法中的矩阵示意图;
图6是本申请实施例提供的资讯推荐方法中提取事件的显式特征的流程图;
图7本申请实施例提供的资讯推荐方法中知识图谱的示意图;
图8是本申请实施例提供的资讯推荐方法中事件特征的提取过程示意图;
图9是本申请实施例提供的资讯推荐方法中事件从属关系判别过程示意图;
图10是本申请实施例提供的资讯推荐方法中更新事件图谱的过程示意图;
图11为本公开实施例提供的资讯推荐装置的结构示意图;
图12是用来实现本公开实施例的资讯推荐方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
学术上,事件是由特定的人、物、事在特定时间、特定地点相互作用的客观事实,事件的发生具有客观性、真实性等特点。事件图谱是知识图谱的一部分,其以事件作为节点,以事件之间的关系作为边。利用事件图谱,可以发现客观世界存在的形形色色的事件之间的关系。事件关系包括共指关系、从属关系、时序关系、因果关系等。挖掘事件之间的关系,可以丰富事件图谱的边的关系,也可以用于事件专题的自动化产出。
目前,学术界研究较多的是因果关系,且多是基于句子内词语级别的关系以及篇章内句子级别的关系。该种挖掘方式中,事件表述为一个短语或一个动词。若两个事件之间具有特定的连接词,如“导致”、“因此”等,则认为该两个事件具有从属关系。然而,事件的从属关系是指两个或两个以上的事件具有相同的主题,该些事件之间可能并不存在连接词,或者,属于同一个主题的两个事件根本就不在同一个篇章(资讯)内。例如,一篇资讯中的一句话为“全国房价下跌,其中,北京房价持续2个月下跌”,该句话中,“全国房价下跌”和“北京房价持续2个月下跌”的主题均为房价下跌,他们属于从属事件,但是他们之间并没有特定的连接词。再如,一篇资讯中,第一段报道“全国房价下跌”事件,第三段报道“北京房价下跌”,“全国房价下跌”和“北京房价持续2个月下跌”的主题均为房价下跌,他们属于从属事件,但是他们之间并没有特定的连接词。又如,有两篇资讯,其中一篇为“全国房价下跌”,另一篇资讯为“北京房价持续2个月下跌”,由于这两个事件出现在不同的篇章(资讯)中,不可能存在连接词。显然,上述用于挖掘因果关系的方案,并不适用于挖掘事件之间的从属关系。
由于具有相同主题的事件,即从属关系事件很有可能是用户感兴趣的事件,因此,当用户利用APP浏览资讯时,服务器通过根据用户感兴趣的事件A,确定出事件A的从属事件B,并向用户推荐事件B。显然,如何挖掘出事件之间的从属关系,以实现精准推荐,视为业界亟待解决的问题。
有鉴于此,本申请实施例提供一种资讯推荐方法及装置,通过利用事件的特征训练出的分类模型确定两个事件是否为从属事件,实现挖掘事件之间的从属关系的目的,进而实现精准推荐。
图1是本申请实施例提供的资讯推荐方法的网络架构示意图。该网络架构包括终端设备1和服务器2,终端设备1和服务器2建立网络连接。其中,服务器2预先利用样本事件集中的事件提取特征训练分类模型,利用分类模型挖掘事件数据库中事件之间的从属关系得到事件图谱并保存,该事件图谱中的节点为事件,事件之间具有边,则表示该两个事件为从属关系,事件图谱包括至少一个父事件,至少一个父事件下属的各子事件互为从属关系,也就是说,一个父事件代表一个主题,不同父事件的主题不同。服务器2每次接收到用户通过终端设备发送的推荐请求后,根据用户的历史浏览记录等确定出用户感兴趣的第一事件,基于该第一事件和事件图谱,确定出第一事件隶属的父事件,进而将隶属与该父事件的、除第一事件外的其他子事件作为第二事件。其中,当第二事件为多个时,服务器可以基于该些第二事件生成事件专题,将该事件专题发送给终端设备。
图1中,终端设备1可以为台式终端或移动终端,台式终端可以为电脑等,移动终端可以为手机、平板电脑、笔记本电脑等,服务器2可以是独立的服务器或者多个服务器组成的服务器集群等。
图2是本申请实施例提供的资讯推荐方法的流程图,本实施例是从服务器的角度进行说明的,本实施例包括:
101、接收来自终端设备的推荐请求。
其中,所述推荐请求用于请求向用户推荐资讯。
示例性的,终端设备上安装有各种资讯类APP。用户使用APP的过程中,终端设备的用户界面上显示搜索框,用户通过触摸输入、语音输入等方式向搜索框中输入感兴趣的事件或实体等,终端设备利用用户感兴趣的事件或实体等生成推荐请求并发送给服务器。或者,终端设备的用户界面上显示一些最新最热的资讯的标题,用点点击某个标题,则终端设备根据用户的点击行为生成推荐请求并向服务器发送。
102、利用所述用户感兴趣的第一事件和事件图谱确定第二事件。
其中,所述第一事件和所述第二事件具有从属关系,所述事件图谱是预先利用分类模型挖掘事件数据库中不同事件之间的从属关系得到的,所述分类模型为所述服务器预先利用样本事件集包含的事件的特征训练得到的。
本申请实施例中,服务器上预先保存事件数据库和事件图谱,事件数据库中包含多个事件,该事件数据库是服务器利用实时收集的资讯构建出的,资讯可以是网络新闻、报道、博客、微博等资讯。事件图谱是服务器预先利用样本资讯训练分类模型,利用分类模型挖掘事件数据库中事件之间的从属关系得到的,该事件图谱包括至少一个父事件,至少一个父事件下属的各子事件互为从属关系。
样本事件集包含事件,是指样本事件集包含事件的标题和事件的详细内容,如果一篇资讯用于报道一个事件,则样本事件集也可以理解为资讯集。服务器利用样本事件集训练分类模型时,提取事件的特征,利用事件的特征进行分类模型的训练。由于事件是某些实体在特定时间、特定地点相互作用的客观事实。因此,可以从事件中提取出实体,利用实体的特征得到事件的特征。另外,事件的特征还可以包括利用事件中的关键词得到的语义特征。事件中的实体、关键词是通过将事件的标题、事件的详细内容进行切词得到的,实体可能是一个关键词,但是关键词不一定是实体。例如,李四和经纪公司乙解约,经过分词得到“李四”、“经纪公司乙”、“解约”三个关键词,其中,“李四”、“经纪公司乙”为实体,其中,李四表示某著名演员。根据事件中关键词得到事件的语义特征、根据事件中的实体得到事件的其他特征,将该些特征整合,得到事件的特征。利用该些特征训练出分类模型,并利用分类模型挖掘事件数据库中的任意两个事件之间的从属关系,进而利用挖掘出的从属关系,构建事件图谱。
服务器每次接收到终端设备发送的推荐请求后,服务器确定用户感兴趣的第一事件,之后利用该第一事件和事件图谱,从事件数据库中确定出第二事件。
例如,终端设备发送的推荐请求携带用户感兴趣事件的事件标题,则服务器从事件图谱中查找出该事件标题对应的事件节点,再查找该事件节点的父事件,将该父事件的其他子事件作为第二事件。
再如,服务器发送的推荐请求携带用户感兴趣的实体,该实体可以是某一个人、某一个城市、某一种植物、某一种商品等,也可以是一类事物,如动物、植物或其他抽象概念。服务器确定该实体相关的第一事件,从事件图谱中查找出该第一事件隶属的父事件,将该父事件的其他子事件作为第二事件。
103、向所述终端设备发送所述目标资讯,所述目标资讯为包含所述第二事件的资讯。
相应的,终端设备接收该包含第二事件的目标资讯。
示例性的,当第二事件为多个时,服务器也可以基于该些第二事件生成事件专题并发送给终端设备。
本申请实施例提供的资讯推荐方法,服务器预先利用样本资讯训练分类模型,利用分类模型挖掘事件数据库中事件之间的从属关系得到事件图谱并保存,该事件图谱包括至少一个父事件,至少一个父事件下属的各子事件互为从属关系。每次接收到用户通过终端设备发送的推荐请求后,根据用户的历史浏览记录等确定出用户感兴趣的第一事件,基于该第一事件和事件图谱,确定出与第一事件为从属事件的第二事件,并向终端设备发送包含该第二事件的目标资讯。采用该种方案,通过利用事件的特征训练出的分类模型确定两个事件是否为从属事件,实现挖掘事件之间的从属关系的目的,进而实现精准推荐。
上述实施例中,服务器在利用所述用户感兴趣的第一事件和事件图谱,确定第二事件之前,还训练分类模型,利用分类模型挖掘事件数据库中事件之间的从属关系,并构建事件图谱。训练过程中,服务器从所述样本事件集包含的各事件中提取出特征,样本事件集为一段时间内的资讯流包含的事件。提取出的特征包括下述特征中的至少一个:语义特征、隐式特征、显式特征,其中,所述语义特征用于指示利用事件包含的关键词学习到的特征。隐式特征和显式特征可以理解为融合了背景知识的特征,背景知识是一个抽象的概念,其表示样本事件集作为整体,对事件产生的知识,隐式特征用于指示利用所述事件包含的不同实体的共现次数学习到的知识,表现为大批量文档的词语共现;显式特征也称之为知识图谱特征,表现为知识图谱的三元组数据,用于指示利用所述事件包含的实体和知识图谱学习到的知识;之后,服务器利用所述特征,训练所述分类模型。
采用该种方案,实现服务器利用事件的特征训练出分类模型的目的。
下面,对服务器如何提取出语义特征、隐式特征和显式特征分别进行详细说明。
首先,语义特征,该语义特征通过语义向量表示。
示例性的,可参见图3,图3是本申请实施例提供的资讯推荐方法中提取事件的语义特征的流程图。
请参照图3,服务器对样本事件集包含的事件提取语义特征时,从所述样本事件集包含的每个事件中抽取出多个关键词,如图3中的关键词1~关键词N。提取出关键词后,对于所述多个关键词中的每个关键词,确定出现所述关键词的样本事件的数量,将所述数量作为所述关键词出现的次数。例如,样本事件集包含500个事件,一个样本包括一个事件的标题以及该事件的详细内容,从该500个事件中提取出N个关键词,假设关键词1在500个事件中的200个事件的标题或详细内容中出现过,则关键词1的次数为200;同理,可以统计出其他关键词的出现次数。
在统计得到每个关键词的出现次数后,利用每个所述事件中的各关键词在所述样本事件集中出现的次数,确定每个所述事件的语义向量。例如,目标事件为李四和经纪公司乙解约,从该事件的标题和详细内容中提取出的关键词包括“李四”、“经纪公司乙”、“解约”,分别出现的次数为2、4、1,得到一个字典{李四:2,经纪公司乙:4;解约:1},从而得到一个语义向量(2,4,1)。
采用该种方案,实现提取出事件的语义特征的目的。
其次,隐式特征,隐式特征通过隐式向量表示。
示例性的,可参见图4,图4是本申请实施例提供的资讯推荐方法中提取事件的隐式特征的流程图。
请参照图4,服务器对样本事件集包含的事件提取隐式特征时,从所述样本事件集包含的各事件中抽取出K个实体,K≥1且为整数,如图中的实体1~实体K。之后,利用所述K个实体,确定K×K的共现矩阵,所述共现矩阵的一个元素为一个实体对,所述元素的值表示同时出现该实体对中的两个实体的样本事件的数量,所述共现矩阵的每一行表示K个实体中一个实体的隐式向量。
示例性的,样本事件集是一段时间内的多篇资讯,一篇资讯也可以称之为一篇报道或一个篇章,样本资讯集实际上是一段时间内的资讯流,其包括成千上万,甚至更多的事件。每一个事件包括标题和详细内容,服务器对样本事件集中的每一事件的标题和详细内容通过切词等,提取出实体,如K个实体,该K个实体中任意两个实体形成一个实体对,同时每个实体和自身也可以视为一个实体对,从而得到一个K×K的向量。例如,样本事件集包含1200个事件,服务器对该1200个事件进行聚类,以滤除相同内容的事件,比如,事件A和事件B都是关于北京市房价下跌的报道,虽然文字描述不同,但是主要内容基本一致,因此,过滤掉事件A仅保留事件B,或者过滤掉事件B仅保留事件A。假设聚类后,还剩1000事件,则服务器对该1000事件的标题和详细内容均提取实体,得到800个不同的实体,从而得到一个800×800矩阵。下面,对如何确定矩阵中的元素的值进行说明。
由于800×1000的矩阵较大,此处用一个小矩阵举例,示例性的,可参见图5,图5本申请实施例提供的资讯推荐方法中的矩阵示意图。请参照图5,假设样本资讯集为100,实体的数量为5个,分别为a1、a2、a3,a4,a5,该5个实体形成一个5×5的矩阵,矩阵中每个元素的值表示实体和共现词一起出现的次数,由此,每一行表示一个向量。假设实体a1在100篇资讯中的5篇资讯中出现过,实体a1与实体a2在100篇资讯中的0篇资讯中一起出现过,即实体a1与实体a2没有在同一篇资讯中出现过,实体a1与实体a3在100篇资讯中的3篇资讯中一起出现过,实体a1与实体a4在100篇资讯中的7篇资讯中一起出现过,实体a1与实体a5在100篇资讯中的0篇资讯中一起出现过,则实体a1的隐式向量为(5,0,3,7,0);根据同样的方式,可以得到实体a2的隐式向量为(0,2,1,5,6)。该种方式中,不同实体的向量的维数是固定的,维数等于抽取出的实体的个数,例如,上述抽取出的实体为5个时,实体a1的隐式向量和实体a2的隐式向量均为5维的向量;再如,若上述抽取出的实体为1000个,则隐式向量为1000维的向量。
根据上述可知:隐式知识构建过程中,利用一段时间的新闻资讯动态构建实体对的共现词典,假设过去一段时间M内共有N篇资讯,从中抽取出实体K个,则得到K×K的一个实体共现矩阵,其中i行j列的元素表示实体i和实体j共同出现在同一篇新闻资讯的次数。
需要说明的是,虽然上述是以矩阵的行和列的维数,均为实体的个数为例对本申请实施例进行详细说明的,然而,本申请实施例并不以此为限制,其他可行的实现方式中,也可以利用抽取出的K个实体中的部分实体构建一个共现词典,利用实体与该写共现词典中的每个词共同出现的次数确定实体的隐式向量。
在得到每个实体的隐式向量之后,利用每个所述事件包含的各实体的隐式向量,确定每个所述事件的隐式向量。也就是说,对于任意一个事件,获取该事件的隐式特征的过程,分为获取事件包含的各实体的隐式向量、将各实体的隐式向量相加得到目标事件的隐式向量两步。以目标事件为李四和经纪公司乙解约为例,该目标事件包含两个实体:李四和经纪公司乙,假设共现词典中有5个词,分别为A、B、C、D、E。则李四的向量为(NA,NB,NC,ND,NE),每个元素表示李四与对应共现词共现的次数;同理,可以得到经纪公司乙的隐式向量,最终将李四的隐式向量和经纪公司乙的隐式向量的向量和,作为李四和经纪公司乙解约这一事件的隐式向量。
采用该种方案,实现提取出事件的隐式特征的目的。
最后,显式特征,也称之为知识图谱特征,显式特征通过显式向量表示。
示例性的,可参见图6,图6是本申请实施例提供的资讯推荐方法中提取事件的显式特征的流程图。
请参照图6,服务器对样本事件集包含的事件提取显式特征时,从所述样本事件集包含的各事件中抽取出K个实体,所述K≥1且为整数,如图中国的实体1~实体K。之后,对于所述K个实体中的任意两个实体形成的实体对,利用知识图谱确定与第一实体连接的实体,以及与第二实体连接的实体,所述第一实体和所述第二实体为所述实体对包含的两个实体,利用与所述与第一实体连接的实体,以及与所述第二实体连接的实体,确定所述第一实体的显式向量和所述第二实体的显式向量。
本申请实施例中,服务器上预先存储一个知识图谱,知识图谱有实体和实体之间的边组成,实体指具有可区别性且独立存在的某种事物,例如某一个人、某一个城市、某一种植物、某一种商品等,也可以是一类事物,如动物、植物或其他抽象概念。服务器利用K个实体得到实体对后,对于任意一个实体对中的第一实体和第二实体,分别在知识图谱中找到对于的节点,例如,第一实体为李四,第二实体为张三,则服务器在知识图谱中找到李四(第一实体)和张三(第二实体)。找到对应实体后,服务器确定与第一实体连接的实体,以及与第二实体连接的实体。示例性的,可参见图7,图7本申请实施例提供的资讯推荐方法中知识图谱的示意图。
请参照图7,与第一实体李四连接的实体包括实体a、实体b和实体c,与第二实体张三连接的实体包括实体c和实体d,去除重复实体,则与第一实体李四连接的实体的数量、与第二实体张三连接的实体的数量的总和为4,由此,第一实体李四的显式向量为(1,1,1,0),该向量中的元素分别表示第一实体与实体a、实体b、实体c、实体d之间是否有边,有边则用1表示,无边则用0表示;同理,可以得到二实体张三的显式向量为(0,0,1,1)。
由于知识图谱中,每个实体分别连接的实体的数量可能不同,因此,对于实体对集合中的不同实体对,利用知识图谱得到的向量的维数可能不同。例如,实体对集合中的某一个实体对,该实体对包括第三实体和第四实体,与第三实体连接的实体为实体e、实体f、实体g、实体h,与第四实体连接的实体为实体i,第三实体的实体向量为(1,1,1,1,0),第四实体的实体向量为(0,0,0,0,1)。显然,该两个实体的向量的维数与李四或张三的向量的维数不同。
根据上述可知:相较于隐式背景知识,利用显式背景知识得到的实体的向量的维数不固定,实体对之间的向量维数可能不同。而且,实体的向量中的元素只能为1或0。
在得到每个实体的显式向量之后,利用每个所述事件包含的各实体的显式向量,确定每个所述事件的显式向量。仍以目标事件为李四和经纪公司乙解约为例,该目标事件包含两个实体:李四和经纪公司乙。查询知识图谱发现:与李四实体连接的实体包括实体a、实体b、实体c;与经纪公司乙实体连接的实体包括实体d和实体e,则李四实体的显式向量为(1,1,1,0,0),经纪公司乙实体的显式向量为(0,0,0,1,1),李四与经纪公司乙解约这个事件的显式向量为该两个显式向量的和。
采用该种方案,实现提取出事件的显式特征的目的。
图8是本申请实施例提供的资讯推荐方法中事件特征的提取过程示意图。请参照图8,分别提取出事件的语义特征、隐式特征和显式特征后,将该三个特征各自对应的向量表示进行拼接,将拼接后得到的特征作为事件的特征向量。这是因为当一个事件的特征包含语义特征、隐式特征、显式特征中的至少两个时,不同的特征的维数可能不一样,例如,语义特征是一个100维的向量,而隐式特征为一个80维的向量。
采用该种方案,实现整合事件的语义特征、隐式特征和显式特征的目的。
上述实施例中,在得出样本事件集中各个事件的特征向量后,训练分类模型的过程中,将样本事件集中的每两个样本事件的特征向量输入至分类模型,不断优化分类模型的参数,直到分类模型达到最优状态。
训练好分类模型后,构建事件图谱时,将事件数据库中的任意两个事件输入至分类模型,以判断该两个事件是否具有从属关系。示例性的,可参见图9,图9是本申请实施例提供的资讯推荐方法中事件从属关系判别过程示意图。
请参照图9,假设第一事件和第二事件是事件数据库中的任意两个事件,该第一事件和第二事件被输入至训练好的分类模型后,分类模型对该两个事件分别提取特征,得到第一事件的特征向量和第二事件的特征向量。之后,利用中文梯度提升决策树(GradientBoost Decision Tree)、回归分析(Logistic Regression)、深度学习等分类器对该两个特征进行机器学习,得到第一事件的特征向量和第二事件的特征向量的距离等,利用距离,确定第一事件和第二事件是否是从属事件。例如,利用距离得到该两个事件的从属关系得分,若分数超过预设阈值,则认为该两个事件是从属关系事件,否则,认为该两个事件不是从属关系。
由于资讯是海量的,构建出事件图谱后,还会有源源不断的事件流入事件数据库,此时,需要不断的更新事件图谱。比如,初始时,事件数据库中包含1000个事件,服务器将该1000个事件的每两个事件输入至分类模型,从而判别出该1000个事件中的任意两个事件是否为从属事件,之后,根据判别结果生成事件图谱。之后,又有资讯流流入该事件库,因此,需要对事件图谱进行更新。下面,对如何更新事件图谱进行详细说明,示例性的,可参见图10,图10是本申请实施例提供的资讯推荐方法中更新事件图谱的过程示意图。
请参照图10,事件数据库中的每个圆圈表示一个事件,该些事件以资讯流的方式流入事件数据库,每个事件都有一个进入事件数据库的时间。更新事件谱图时,首先,服务器从事件数据库中确定出最新事件,如图中黑色填充圆圈所示,以下称之为第三事件。
然后,服务器利用所述分类模型确定所述至少一个父事件中是否存在目标父事件,所述目标父事件下属的子事件与所述第三事件为从属事件。
请参照图10,父事件空间中存储多个父事件,隶属于同一个父事件的子事件位于同一个实线框中。确定是否存在目标父事件时,将每个候选父事件的主题与第三事件的主题做对比,若候选父事件的主题与第三事件的主题一致,则将该候选父事件作为目标父事件。
可以理解的是,父事件空间中存储多个父事件,是指父事件空间中存储每个父事件对应的主题、各父事件的子事件的标题等。
接着,若至少一个父事件中存在所述目标父事件,则将所述第三事件添加至所述目标父事件的子事件中。请参照图10,假设目标事件是黑色粗黑框所在的父事件,原本隶属于该父事件的子事件如图中未填充圆圈所示,新加入的第三事件如黑色填充圆圈所示。
若至少一个父事件中不存在目标父事件,则利用分类模型判断事件数据库中是否存在第四事件,第四事件与第三事件互为从属事件。
示例性的,服务器从事件数据库中选择出一些候选事件(如图中灰色填充圆圈所示),该些候选事件是事件数据库中不属于任意一个父事件的事件。服务器确定第三事件的特征向量与候选事件的特征向量之间的距离,候选事件是事件数据库中不属于任意一个父事件的事件。若第三事件的特征向量和候选事件的特征向量之间的距离小于预设阈值,则确定候选事件是第四事件,即第三事件和候选事件是从属事件。
之后,服务器根据第三事件和第四事件生成目标父事件,并将目标父事件、第三事件和第四事件添加至事件图谱。同时,服务器在父事件空间中增加该新的父事件(如父事件空间中包含灰色圆圈和黑色圆圈的反馈所示),即服务器将根据第三事件和第四事件生成目标父事件添加至父事件空间。
若候选事件中不存在第四事件,则结束。此时,服务器将最新事件,即第三事件继续保存在事件数据库中,等待候选新的事件流到来之后,再判断是否能够从新的事件流中找到第三事件的从属事件。
另外,对于父事件空间中的每个服事件,服务器还生成该父事件的父事件名,该父事件名可以是父事件对应的主题等。
另外,虽然上述判断父事件的目的是为了更新事件图谱。然而,本申请实施例并不以此为限制,在其他可行的实现方式中,最初始构建事件图谱时,利用分类模型判别出从属事件后,确定从属事件的父事件。之后,对于事件数据库中的其他事件,先判断该事件是否隶属某个父事件,若找不到父事件,则再利用该事件的特征向量与其他事件的特征向量进行从属关系判别。
上述介绍了本公开实施例提到的资讯推荐方法的具体实现,下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图11为本公开实施例提供的资讯推荐装置的结构示意图。该装置可以集成在服务器中或通过服务器实现。如图11所示,在本实施例中,该资讯推荐装置100可以包括:
接收单元11,用于接收来自终端设备的推荐请求,所述推荐请求用于请求向用户推荐资讯;
处理单元12,用于利用所述用户感兴趣的第一事件和事件图谱确定第二事件,所述第一事件和所述第二事件具有从属关系,所述事件图谱是预先利用分类模型挖掘事件数据库中不同事件之间的从属关系得到的,所述分类模型为所述服务器预先利用样本事件集包含的事件的特征训练得到的;
发送单元13,用于向所述终端设备发送所述目标资讯,所述目标资讯为包含所述第二事件的资讯。
一种可行的设计中,所述处理单元12,在利用所述用户感兴趣的第一事件和事件图谱确定出第二事件之前,还用于从所述样本事件集包含的各事件中提取出特征,所述特征包括下述特征中的至少一个:语义特征、隐式特征、显式特征,其中,所述语义特征用于指示利用事件包含的关键词学习到的特征,所述隐式特征用于指示利用所述事件包含的不同实体的共现次数学习到的知识,所述显式特征用于指示利用所述事件包含的实体和知识图谱学习到的知识,利用所述特征,训练所述分类模型。
一种可行的设计中,所述事件的特征包括语义特征,所述语义特征通过语义向量表示,所述处理单元12在从所述样本事件集包含的各事件中提取出特征时,用于从所述样本事件集包含的每个事件中抽取出多个关键词,利用每个所述事件中的各关键词在所述样本事件集中出现的次数,确定每个所述事件的语义向量。
一种可行的设计中,所述事件的特征包括隐式特征,所述隐式特征通过隐式向量表示,所述处理单元12在从所述样本事件集包含的各事件中提取出特征时,用于从所述样本事件集包含的各事件中抽取出K个实体,K≥1且为整数;利用所述K个实体,确定K×K的共现矩阵,所述共现矩阵的一个元素为一个实体对,所述元素的值表示同时出现该实体对中的两个实体的样本事件的数量,所述共现矩阵的每一行表示K个实体中一个实体的隐式向量,利用每个所述事件包含的各实体的隐式向量,确定每个所述事件的隐式向量。
一种可行的设计中,所述特征包括显式特征,所述显式特征通过显式向量表示,所述处理单元12在从所述样本事件集包含的各事件中提取出特征时,用于从所述样本事件集包含的各事件中抽取出K个实体,所述K≥1且为整数,对于所述K个实体中的任意两个实体形成的实体对,利用知识图谱确定与第一实体连接的实体,以及与第二实体连接的实体,所述第一实体和所述第二实体为所述实体对包含的两个实体,利用与所述与第一实体连接的实体,以及与所述第二实体连接的实体,确定所述第一实体的显式向量和所述第二实体的显式向量,利用每个所述事件包含的各实体的显式向量,确定每个所述事件的显式向量。
一种可行的设计中,所述处理单元12,在利用所述特征,训练所述分类模型之前,还用于当所述样本事件集中事件的特征包含所述语义特征、所述隐式特征、所述显式特征中的至少两个时,将所述语义特征、所述隐式特征、所述显式特征中的至少两个特征各自对应的向量拼接,得到所述事件的特征向量。
一种可行的设计中,所述事件图谱包含至少一个父事件,所述至少一个父事件下属的各子事件互为从属关系,所述处理单元12,在利用所述用户感兴趣的第一事件和事件图谱确定出第二事件之前,还用于从所述事件数据库中获取第三事件,所述第三事件是所述事件数据库中的最新事件,利用所述分类模型确定所述至少一个父事件中是否存在目标父事件,所述目标父事件下属的子事件与所述第三事件为从属事件,若所述至少一个父事件中存在所述目标父事件,则将所述第三事件添加至所述目标父事件的子事件中。
一种可行的设计中,所述处理单元12,还用于若所述至少一个父事件中不存在所述目标父事件,则利用所述分类模型判断所述事件数据库中是否存在第四事件,所述第四事件与所述第三事件互为从属事件,若所述事件数据库中存在所述第四事件,则根据所述第三事件和所述第四事件生成所述目标父事件,将所述目标父事件、所述第三事件和所述第四事件添加至所述事件图谱。
一种可行的设计中,若所述至少一个父事件中不存在所述目标父事件,则所述处理单元12利用所述分类模型判断所述事件数据库中是否存在第四事件时,具体用于若所述至少一个父事件中不存在所述目标父事件,则确定所述第三事件的特征向量与候选事件的特征向量之间的距离,所述候选事件是所述事件数据库中不属于任意一个父事件的事件,若所述第三事件的特征向量和所述候选事件的特征向量之间的距离小于预设阈值,则确定所述候选事件是所述第四事件。
一种可行的设计中,所述处理单元12,在利用所述用户感兴趣的第一事件和事件图谱确定出第二事件时,用于从所述事件图谱中确定出所述第一事件的父事件,将所述第一事件的父事件的其他子事件作为所述第二事件。
本公开实施例提供的资讯推荐装置,可用于如上实施例中服务器执行的方法,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上装置的各个单元的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分单元通过处理元件调用软件的形式实现,部分单元通过硬件的形式实现。例如,处理单元可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个单元可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些单元可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(application specific integrated circuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA)等。再如,当以上某个单元通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(centralprocessing unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本公开实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。
进一步的,根据本公开的实施例,本公开还提供了一种电子设备和一种可读存储介质。
图12是用来实现本公开实施例的资讯推荐方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图12所示,该电子设备包括:一个或多个处理器21、存储器22,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图12中以一个处理器21为例。
存储器22即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的资讯推荐方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的资讯推荐方法。
存储器22作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的资讯推荐方法对应的程序指令/模块(例如,附图11所示的接收单元11、处理单元12和发送单元13)。处理器21通过运行存储在存储器22中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的资讯推荐方法。
存储器22可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据资讯推荐电子设备的使用所创建的数据等。此外,存储器22可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器22可选包括相对于处理器21远程设置的存储器,这些远程存储器可以通过网络连接至资讯推荐电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
资讯推荐方法的电子设备还可以包括:输入装置23和输出装置24。处理器21、存储器22、输入装置23和输出装置24可以通过总线或者其他方式连接,图12中以通过总线连接为例。
输入装置23可接收输入的数字或字符信息,以及产生与资讯推荐电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置24可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
本申请实施例还提供一种分类模型训练方法,包括:挖掘样本资讯集包含的资讯中每个事件的事件特征;利用所述事件特征,训练分类模型,所述分类模型用于判断事件数据库中的任意两个事件是否为从属事件。
该实施例的具体实现原理可以参见上述实施例的记载,此处不再赘述。
根据本申请实施例的技术方案,服务器预先利用样本资讯训练分类模型,利用分类模型挖掘事件数据库中事件之间的从属关系得到事件图谱并保存,该事件图谱中的节点为事件,事件之间具有边,则表示该两个事件为从属关系。每次接收到用户通过终端设备发送的推荐请求后,根据用户的历史浏览记录等确定出用户感兴趣的第一事件,基于该第一事件和事件图谱,确定出与第一事件为从属事件的第二事件,并向终端设备发送包含该第二事件的目标资讯。采用该种方案,通过利用事件的特征训练出的分类模型确定两个事件是否为从属事件,实现挖掘事件之间的从属关系的目的,进而实现精准推荐。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (23)

1.一种资讯推荐方法,其特征在于,包括:
接收来自终端设备的推荐请求,所述推荐请求用于请求向用户推荐资讯;
利用所述用户感兴趣的第一事件和事件图谱确定第二事件,所述第一事件和所述第二事件具有从属关系,所述事件图谱是预先利用分类模型挖掘事件数据库中不同事件之间的从属关系得到的,所述分类模型为服务器预先利用样本事件集包含的事件的特征训练得到的;
向所述终端设备发送目标资讯,所述目标资讯为包含所述第二事件的资讯。
2.根据权利要求1所述的方法,其特征在于,所述利用所述用户感兴趣的第一事件和事件图谱确定出第二事件之前,还包括:
从所述样本事件集包含的各事件中提取出特征,所述特征包括下述特征中的至少一个:语义特征、隐式特征、显式特征,其中,所述语义特征用于指示利用事件包含的关键词学习到的特征,所述隐式特征用于指示利用所述事件包含的不同实体的共现次数学习到的知识,所述显式特征用于指示利用所述事件包含的实体和知识图谱学习到的知识;
利用所述特征,训练所述分类模型。
3.根据权利要求2所述的方法,其特征在于,所述事件的特征包括语义特征,所述语义特征通过语义向量表示,所述从所述样本事件集包含的各事件中提取出特征,包括:
从所述样本事件集包含的每个事件中抽取出多个关键词;
利用每个所述事件中的各关键词在所述样本事件集中出现的次数,确定每个所述事件的语义向量。
4.根据权利要求2所述的方法,其特征在于,所述事件的特征包括隐式特征,所述隐式特征通过隐式向量表示,所述从所述样本事件集包含的各事件中提取出特征,包括:
从所述样本事件集包含的各事件中抽取出K个实体,K≥1且为整数;
利用所述K个实体,确定K×K的共现矩阵,所述共现矩阵的一个元素为一个实体对,所述元素的值表示同时出现该实体对中的两个实体的样本事件的数量,所述共现矩阵的每一行表示K个实体中一个实体的隐式向量;
利用每个所述事件包含的各实体的隐式向量,确定每个所述事件的隐式向量。
5.根据权利要求2所述的方法,其特征在于,所述特征包括显式特征,所述显式特征通过显式向量表示,所述从所述样本事件集包含的各事件中提取出特征,包括:
从所述样本事件集包含的各事件中抽取出K个实体,所述K≥1且为整数;
对于所述K个实体中的任意两个实体形成的实体对,利用知识图谱确定与第一实体连接的实体,以及与第二实体连接的实体,所述第一实体和所述第二实体为所述实体对包含的两个实体;
利用与所述与第一实体连接的实体,以及与所述第二实体连接的实体,确定所述第一实体的显式向量和所述第二实体的显式向量;
利用每个所述事件包含的各实体的显式向量,确定每个所述事件的显式向量。
6.根据权利要求2~5任一项所述的方法,其特征在于,所述利用所述特征,训练所述分类模型之前,还包括:
当所述样本事件集中事件的特征包含所述语义特征、所述隐式特征、所述显式特征中的至少两个时,将所述语义特征、所述隐式特征、所述显式特征中的至少两个特征各自对应的向量拼接,得到所述事件的特征向量。
7.根据权利要求1~5任一项所述的方法,其特征在于,所述事件图谱包含至少一个父事件,所述至少一个父事件下属的各子事件互为从属关系,所述利用所述用户感兴趣的第一事件和事件图谱确定出第二事件之前,还包括:
从所述事件数据库中获取第三事件,所述第三事件是所述事件数据库中的最新事件;
利用所述分类模型确定所述至少一个父事件中是否存在目标父事件,所述目标父事件下属的子事件与所述第三事件为从属事件;
若所述至少一个父事件中存在所述目标父事件,则将所述第三事件添加至所述目标父事件的子事件中。
8.根据权利要求7所述的方法,其特征在于,还包括:
若所述至少一个父事件中不存在所述目标父事件,则利用所述分类模型判断所述事件数据库中是否存在第四事件,所述第四事件与所述第三事件互为从属事件;
若所述事件数据库中存在所述第四事件,则根据所述第三事件和所述第四事件生成所述目标父事件;
将所述目标父事件、所述第三事件和所述第四事件添加至所述事件图谱。
9.根据权利要求8所述的方法,其特征在于,若所述至少一个父事件中不存在所述目标父事件,则利用所述分类模型判断所述事件数据库中是否存在第四事件,包括:
若所述至少一个父事件中不存在所述目标父事件,则确定所述第三事件的特征向量与候选事件的特征向量之间的距离,所述候选事件是所述事件数据库中不属于任意一个父事件的事件;
若所述第三事件的特征向量和所述候选事件的特征向量之间的距离小于预设阈值,则确定所述候选事件是所述第四事件。
10.根据权利要求1~5任一项所述的方法,其特征在于,所述利用所述用户感兴趣的第一事件和事件图谱确定出第二事件,包括:
从所述事件图谱中确定出所述第一事件的父事件,将所述第一事件的父事件的其他子事件作为所述第二事件。
11.一种资讯推荐装置,其特征在于,包括:
接收单元,用于接收来自终端设备的推荐请求,所述推荐请求用于请求向用户推荐资讯;
处理单元,用于利用所述用户感兴趣的第一事件和事件图谱确定第二事件,所述第一事件和所述第二事件具有从属关系,所述事件图谱是预先利用分类模型挖掘事件数据库中不同事件之间的从属关系得到的,所述分类模型为服务器预先利用样本事件集包含的事件的特征训练得到的;
发送单元,用于向所述终端设备发送目标资讯,所述目标资讯为包含所述第二事件的资讯。
12.根据权利要求11所述的装置,其特征在于,
所述处理单元,在利用所述用户感兴趣的第一事件和事件图谱确定出第二事件之前,还用于从所述样本事件集包含的各事件中提取出特征,所述特征包括下述特征中的至少一个:语义特征、隐式特征、显式特征,其中,所述语义特征用于指示利用事件包含的关键词学习到的特征,所述隐式特征用于指示利用所述事件包含的不同实体的共现次数学习到的知识,所述显式特征用于指示利用所述事件包含的实体和知识图谱学习到的知识,利用所述特征,训练所述分类模型。
13.根据权利要求12所述的装置,其特征在于,所述事件的特征包括语义特征,所述语义特征通过语义向量表示,所述处理单元在从所述样本事件集包含的各事件中提取出特征时,用于从所述样本事件集包含的每个事件中抽取出多个关键词,利用每个所述事件中的各关键词在所述样本事件集中出现的次数,确定每个所述事件的语义向量。
14.根据权利要求12所述的装置,其特征在于,所述事件的特征包括隐式特征,所述隐式特征通过隐式向量表示,所述处理单元在从所述样本事件集包含的各事件中提取出特征时,用于从所述样本事件集包含的各事件中抽取出K个实体,K≥1且为整数;利用所述K个实体,确定K×K的共现矩阵,所述共现矩阵的一个元素为一个实体对,所述元素的值表示同时出现该实体对中的两个实体的样本事件的数量,所述共现矩阵的每一行表示K个实体中一个实体的隐式向量,利用每个所述事件包含的各实体的隐式向量,确定每个所述事件的隐式向量。
15.根据权利要求12所述的装置,其特征在于,所述特征包括显式特征,所述显式特征通过显式向量表示,所述处理单元在从所述样本事件集包含的各事件中提取出特征时,用于从所述样本事件集包含的各事件中抽取出K个实体,所述K≥1且为整数,对于所述K个实体中的任意两个实体形成的实体对,利用知识图谱确定与第一实体连接的实体,以及与第二实体连接的实体,所述第一实体和所述第二实体为所述实体对包含的两个实体,利用与所述与第一实体连接的实体,以及与所述第二实体连接的实体,确定所述第一实体的显式向量和所述第二实体的显式向量,利用每个所述事件包含的各实体的显式向量,确定每个所述事件的显式向量。
16.根据权利要求12-15任一项所述的装置,其特征在于,
所述处理单元,在利用所述特征,训练所述分类模型之前,还用于当所述样本事件集中事件的特征包含所述语义特征、所述隐式特征、所述显式特征中的至少两个时,将所述语义特征、所述隐式特征、所述显式特征中的至少两个特征各自对应的向量拼接,得到所述事件的特征向量。
17.根据权利要求11~15任一项所述的装置,其特征在于,所述事件图谱包含至少一个父事件,所述至少一个父事件下属的各子事件互为从属关系,所述处理单元,在利用所述用户感兴趣的第一事件和事件图谱确定出第二事件之前,还用于从所述事件数据库中获取第三事件,所述第三事件是所述事件数据库中的最新事件,利用所述分类模型确定所述至少一个父事件中是否存在目标父事件,所述目标父事件下属的子事件与所述第三事件为从属事件,若所述至少一个父事件中存在所述目标父事件,则将所述第三事件添加至所述目标父事件的子事件中。
18.根据权利要求17所述的装置,其特征在于,所述处理单元,还用于若所述至少一个父事件中不存在所述目标父事件,则利用所述分类模型判断所述事件数据库中是否存在第四事件,所述第四事件与所述第三事件互为从属事件,若所述事件数据库中存在所述第四事件,则根据所述第三事件和所述第四事件生成所述目标父事件,将所述目标父事件、所述第三事件和所述第四事件添加至所述事件图谱。
19.根据权利要求18所述的装置,其特征在于,若所述至少一个父事件中不存在所述目标父事件,则所述处理单元利用所述分类模型判断所述事件数据库中是否存在第四事件时,具体用于若所述至少一个父事件中不存在所述目标父事件,则确定所述第三事件的特征向量与候选事件的特征向量之间的距离,所述候选事件是所述事件数据库中不属于任意一个父事件的事件,若所述第三事件的特征向量和所述候选事件的特征向量之间的距离小于预设阈值,则确定所述候选事件是所述第四事件。
20.根据权利要求11~15任一项所述的装置,其特征在于,所述处理单元,在利用所述用户感兴趣的第一事件和事件图谱确定出第二事件时,用于从所述事件图谱中确定出所述第一事件的父事件,将所述第一事件的父事件的其他子事件作为所述第二事件。
21.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的方法。
23.一种分类模型训练方法,其特征在于,包括:
挖掘样本资讯集包含的资讯中每个事件的事件特征;
利用所述事件特征,训练分类模型,所述分类模型用于判断事件数据库中的任意两个事件是否为从属事件。
CN202010199799.7A 2020-03-20 2020-03-20 资讯推荐方法及装置 Active CN111400456B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010199799.7A CN111400456B (zh) 2020-03-20 2020-03-20 资讯推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010199799.7A CN111400456B (zh) 2020-03-20 2020-03-20 资讯推荐方法及装置

Publications (2)

Publication Number Publication Date
CN111400456A true CN111400456A (zh) 2020-07-10
CN111400456B CN111400456B (zh) 2023-09-26

Family

ID=71434395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010199799.7A Active CN111400456B (zh) 2020-03-20 2020-03-20 资讯推荐方法及装置

Country Status (1)

Country Link
CN (1) CN111400456B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449116A (zh) * 2021-06-22 2021-09-28 青岛海信网络科技股份有限公司 一种图谱构建、预警方法、设备及介质
CN113660225A (zh) * 2021-07-29 2021-11-16 广州大学 基于时序点的网络攻击事件预测方法、系统、装置及介质
CN114139052A (zh) * 2021-11-19 2022-03-04 北京百度网讯科技有限公司 用于智能推荐的排序模型训练方法、智能推荐方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050262081A1 (en) * 2004-05-19 2005-11-24 Newman Ronald L System, method and computer program product for organization and annotation of related information
US20130097463A1 (en) * 2011-10-12 2013-04-18 Vmware, Inc. Method and apparatus for root cause and critical pattern prediction using virtual directed graphs
CN106855853A (zh) * 2016-12-28 2017-06-16 成都数联铭品科技有限公司 基于深度神经网络的实体关系抽取系统
CN108052576A (zh) * 2017-12-08 2018-05-18 国家计算机网络与信息安全管理中心 一种事理知识图谱构建方法及系统
CN109800413A (zh) * 2018-12-11 2019-05-24 北京百度网讯科技有限公司 新闻事件的识别方法、装置、设备及可读存储介质
CN109829059A (zh) * 2019-01-18 2019-05-31 平安科技(深圳)有限公司 推荐知识点的方法、装置、设备及存储介质
CN110175226A (zh) * 2019-05-09 2019-08-27 厦门邑通软件科技有限公司 一种基于多维度场景分析的对话决策方法
CN110377759A (zh) * 2019-07-22 2019-10-25 中国工商银行股份有限公司 事件关系图谱构建方法及装置
CN110489520A (zh) * 2019-07-08 2019-11-22 平安科技(深圳)有限公司 基于知识图谱的事件处理方法、装置、设备和存储介质
CN110781317A (zh) * 2019-10-29 2020-02-11 北京明略软件系统有限公司 事件图谱的构建方法、装置及电子设备
CN110888990A (zh) * 2019-11-22 2020-03-17 深圳前海微众银行股份有限公司 文本推荐方法、装置、设备及介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050262081A1 (en) * 2004-05-19 2005-11-24 Newman Ronald L System, method and computer program product for organization and annotation of related information
US20130097463A1 (en) * 2011-10-12 2013-04-18 Vmware, Inc. Method and apparatus for root cause and critical pattern prediction using virtual directed graphs
CN106855853A (zh) * 2016-12-28 2017-06-16 成都数联铭品科技有限公司 基于深度神经网络的实体关系抽取系统
CN108052576A (zh) * 2017-12-08 2018-05-18 国家计算机网络与信息安全管理中心 一种事理知识图谱构建方法及系统
CN109800413A (zh) * 2018-12-11 2019-05-24 北京百度网讯科技有限公司 新闻事件的识别方法、装置、设备及可读存储介质
CN109829059A (zh) * 2019-01-18 2019-05-31 平安科技(深圳)有限公司 推荐知识点的方法、装置、设备及存储介质
CN110175226A (zh) * 2019-05-09 2019-08-27 厦门邑通软件科技有限公司 一种基于多维度场景分析的对话决策方法
CN110489520A (zh) * 2019-07-08 2019-11-22 平安科技(深圳)有限公司 基于知识图谱的事件处理方法、装置、设备和存储介质
CN110377759A (zh) * 2019-07-22 2019-10-25 中国工商银行股份有限公司 事件关系图谱构建方法及装置
CN110781317A (zh) * 2019-10-29 2020-02-11 北京明略软件系统有限公司 事件图谱的构建方法、装置及电子设备
CN110888990A (zh) * 2019-11-22 2020-03-17 深圳前海微众银行股份有限公司 文本推荐方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
项威;: "事件知识图谱构建技术与应用综述", 计算机与现代化, no. 01 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449116A (zh) * 2021-06-22 2021-09-28 青岛海信网络科技股份有限公司 一种图谱构建、预警方法、设备及介质
CN113449116B (zh) * 2021-06-22 2022-12-20 青岛海信网络科技股份有限公司 一种图谱构建、预警方法、设备及介质
CN113660225A (zh) * 2021-07-29 2021-11-16 广州大学 基于时序点的网络攻击事件预测方法、系统、装置及介质
CN114139052A (zh) * 2021-11-19 2022-03-04 北京百度网讯科技有限公司 用于智能推荐的排序模型训练方法、智能推荐方法及装置

Also Published As

Publication number Publication date
CN111400456B (zh) 2023-09-26

Similar Documents

Publication Publication Date Title
US11714816B2 (en) Information search method and apparatus, device and storage medium
CN111782965B (zh) 意图推荐方法、装置、设备及存储介质
CN112507715B (zh) 确定实体之间关联关系的方法、装置、设备和存储介质
US10558754B2 (en) Method and system for automating training of named entity recognition in natural language processing
CN112840336A (zh) 用于对内容项推荐进行排名的技术
CN109241403B (zh) 项目推荐方法、装置、机器设备和计算机可读存储介质
US10713291B2 (en) Electronic document generation using data from disparate sources
US10789066B1 (en) Automatically upgrading and finding components similar to legacy versions
Jiang et al. Recommending new features from mobile app descriptions
CN112650907A (zh) 搜索词的推荐方法、目标模型的训练方法、装置及设备
CN111400456A (zh) 资讯推荐方法及装置
CN111353303B (zh) 词向量构建方法、装置、电子设备及存储介质
CN110275962B (zh) 用于输出信息的方法和装置
CN105824872B (zh) 基于搜索的数据的检测、链接和获取的方法和系统
CN111339406B (zh) 个性化推荐方法、装置、设备及存储介质
CN111460296B (zh) 用于更新事件集合的方法和装置
CN114861889A (zh) 深度学习模型的训练方法、目标对象检测方法和装置
CN112818111A (zh) 文档推荐方法、装置、电子设备和介质
JP2023545945A (ja) コンテンツ管理システムにおけるコンテンツのスマートなカテゴリ化のためのシステムおよび方法
WO2015084757A1 (en) Systems and methods for processing data stored in a database
Wei et al. Online education recommendation model based on user behavior data analysis
WO2021253238A1 (en) Learning interpretable relationships between entities, relations, and concepts via bayesian structure learning on open domain facts
US20210271637A1 (en) Creating descriptors for business analytics applications
CN116127047B (zh) 企业信息库的建立方法与装置
CN112148979B (zh) 事件关联用户的识别方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant