CN115237971B - 一种基于实体融合的信息推荐方法、系统、装置及介质 - Google Patents

一种基于实体融合的信息推荐方法、系统、装置及介质 Download PDF

Info

Publication number
CN115237971B
CN115237971B CN202211154666.3A CN202211154666A CN115237971B CN 115237971 B CN115237971 B CN 115237971B CN 202211154666 A CN202211154666 A CN 202211154666A CN 115237971 B CN115237971 B CN 115237971B
Authority
CN
China
Prior art keywords
information
entity
time
fusion
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211154666.3A
Other languages
English (en)
Other versions
CN115237971A (zh
Inventor
李利明
李钊
翁翔羽
张兴明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhiyuan Artificial Intelligence Research Institute
Original Assignee
Beijing Zhiyuan Artificial Intelligence Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhiyuan Artificial Intelligence Research Institute filed Critical Beijing Zhiyuan Artificial Intelligence Research Institute
Priority to CN202211154666.3A priority Critical patent/CN115237971B/zh
Publication of CN115237971A publication Critical patent/CN115237971A/zh
Application granted granted Critical
Publication of CN115237971B publication Critical patent/CN115237971B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及用于预测目的的数据处理技术领域,公开了一种基于实体融合的信息推荐方法、系统、装置及介质,实体库中预先的存储有若干个实体,不论实体库中的实体具体为何,在接收到信息获取请求的条件下,从实体库中匹配出与信息获取请求匹配的实体,而此时尚未构建关系图谱。本发明能够在信息获取请求的触发下筛选出与之匹配的待定实体、生成与信息获取请求匹配的关系图谱,从而使得信息推荐与信息获取请求更为匹配,向用户推荐的信息的质量得到提高。

Description

一种基于实体融合的信息推荐方法、系统、装置及介质
技术领域
本发明涉及用于预测目的的数据处理技术领域,尤其涉及一种基于实体融合的信息推荐方法、系统、装置及介质。
背景技术
随着科技技术的发展,人工智能在各行各业的应用逐渐引起人们的重视,人工智能能够一定程度的使得原本由人类执行的工作改为由计算机执行。
信息时代的到来,伴随着信息量的爆发式增长。人们对信息质量的要求也不断提高,信息推荐的质量较大程度的直接影响到用户体验。信息推荐的方法常见的有通过特征提取的方式进行,例如公开号为CN114756768B的中国专利,提出一种基于人工智能的数据处理方法,对包括目标对象以及目标物品的二分异质图进行特征提取处理,得到目标对象的对象图嵌入特征及目标物品的物品图嵌入特征并进行指标预测处理。
而伴随信息量增大,信息来源的复杂,人们对信息质量的需求进一步提高,如何高质量的向用户推荐信息,成为亟待解决的问题。
发明内容
本发明提供了一种基于实体融合的信息推荐方法,以至少部分的解决上述技术问题。
本发明采用下述技术方案:
第一方面,本发明提供一种基于实体融合的信息推荐方法,该方法包括:
在接收到信息展示端针对待展示信息基于实体融合的信息推荐方法的信息获取请求时,识别出信息获取请求的请求时刻和待展示信息的语义表示出的事件对应的事件时刻;
将从实体库中获取到与事件匹配的若干个实体,确定为待定实体;
根据从预设信息库中筛选出与待定实体匹配、生成时刻距请求时刻不超过第一时长阈值、且语义中表示出事件时刻的各个信息,作为第一信息;
对上述第一信息进行特征提取,得到第一特征;
将预设信息库中特征与第一特征匹配、且生成时刻距请求时刻不超过第二时长阈值的各个信息,作为第二信息;
将第一信息和第二信息,作为待定实体的实体信息;
根据待定实体的实体信息,对待定实体进行融合,得到可用实体;
根据基于可用实体确定出的关系图谱,生成待展示信息。
进一步的,确定第一信息之前,还包括:
确定请求时刻与事件时刻之间的时长,作为参照时长;
根据参照时长确定第一时长阈值,使得第一时长阈值与参照时长负相关。
进一步的,确定第二信息之前,还包括:
确定第一信息的信息量;
根据第一信息的信息量确定第二时长阈值,使得第二时长阈值与第一信息的信息量正相关。
进一步的,根据待定实体的实体信息,对待定实体进行融合,得到可用实体,包括:
将若干个待定实体中的一个作为第一实体,将除该第一实体以外的若干个待定实体中的一个作为第二实体;
针对第一实体的实体信息中的每个信息,生成对应的第一信息子图谱;并针对第二实体的实体信息中的每个信息,生成对应的第二信息子图谱;第一信息子图谱表示出:在生成该第一信息子图谱时采用的第一实体信息中携带的时间标识对应的时刻中,第一实体表示出的属性;第二信息子图谱表示出:在生成该第二信息子图谱时采用的第二实体信息中携带的时间标识对应的时刻中,第二实体表示出的属性;
根据时间标识对生成的第一信息子图谱进行排序,得到第一序列;并且,根据时间标识对生成的第二信息子图谱进行排序,得到第二序列;
若第一序列与第二序列的相似度大于相似度阈值,则将第一实体和第二实体之一,确定为可用实体,并将第一实体的实体信息和第二实体的实体信息进行融合,得到可用实体的实体信息。
进一步的,若第一序列与第二序列的相似度小于等于相似度阈值,则将第一实体和第二实体均作为可用实体。
进一步的,确定若干个第一实体信息各自的时间标识分别对应的时刻距当前时刻的平均时长;
根据上述平均时长确定相似度阈值,使得相似度阈值与平均时长负相关。
进一步的,确定第一实体信息的信息量;根据信息量确定相似度阈值,使得相似度阈值与信息量正相关;
根据基于可用实体确定出的关系图谱,生成待展示信息之后,将待展示信息发送至信息展示端。
第二方面,本发明提供一种基于实体融合的信息推荐装置,该装置用于实现第一方面所描述的基于实体融合的信息推荐方法。
第三方面,本发明还提供一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行第一方面所描述的基于实体融合的信息推荐方法。
第四方面,本发明还提供一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,一个或多个程序当被包括多个应用程序的电子设备执行时,使得电子设备执行第一方面所描述的基于实体融合的信息推荐方法。
第五方面,本发明还提供一种信息推荐系统,包括:
信息推荐服务端,配置为:实现第一方面所描述的基于实体融合的信息推荐方法;
信息展示端,配置为:向信息推荐服务端发送信息获取请求。
本发明采用的上述至少一个技术方案能够达到以下有益效果:
实体库中预先的存储有若干个实体,不论实体库中的实体具体为何,在接收到信息获取请求的条件下,从实体库中匹配出与信息获取请求匹配的实体,而此时尚未构建关系图谱。本发明能够在信息获取请求的触发下筛选出与之匹配的待定实体、生成与信息获取请求匹配的关系图谱,以实现信息推荐与信息获取请求更为匹配,提高向用户推荐的信息的质量(质量可以通过向用户推荐的信息与信息获取请求之间的匹配度衡量)。在确定待定实体的实体信息的过程中,一方面采用了与信息获取请求匹配的第一信息,另一方面还采用了与第一信息匹配的第二信息。通过本发明实现的信息推荐方法,除了能够较为高质量的向用户推荐信息,还能够在满足用户基本需求的基础上进行延伸,使得用户一方面能够得到其所需的信息,另一方面能够得到“额外”的信息。本发明的信息推荐方法适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例提供的一种基于实体融合的信息推荐方法过程示意图;
图2为本发明实施例提供的一种基于实体融合的信息推荐方法对待定实体进行融合的过程示意图;
图3为本发明实施例中一种基于实体融合的信息推荐装置的结构示意图;
图4为本发明实施例中一种电子设备的结构示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其它元件、材料、方法所替代。在某些情况下,本发明相关的一些操作并没有在说明书中显示或者描述,这是为了避免本发明的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本发明所说“连接”“联接”,如无特别说明,均包括直接和间接连接(联接)。
以下结合附图,详细说明本发明各实施例提供的技术方案。
图谱,亦称关系图谱,是相互连接事物及其关系的一种结构化表达,是最接近真实世界的数据组织结构。通过关系图谱将所有的数据连接起来,即时的传达信息,易于揭示复杂的关系模式。
关系图谱由节点和边构成,关系图谱将现实生活中可触摸的能看得见的实体(如某个人、某台电脑、某张银行卡等),或无法触摸肉眼也不可见的某个事故、某个案件、某次意外等,都抽象成图中的节点。而任意两节点与节点间的关系,则抽象成边。
关系图谱就是由一组一组的节点和边构成的,节点可以有多个属性,边也可以有多个属性,节点可以有多个标签,代表着不同的身份。如某个人在生活中即是一个孩子的爸爸,也是一位丈夫,也是某个金融科技公司的CPO。
关系图谱可以包含非常丰富的关联信息,比如:电话与电话间的呼叫关系、邮件往来关系、亲属关系、拥有关系等,在社交网络、交通网络、通讯网络、资金网络等各个领域的各种场景下,关系图谱都能最直观的展现实体间的关系链路,传达关系路径。若能够合理的构建关系图谱,将有利于后续针对关系图谱的使用。
也就是说,构建关系图谱是向用户推荐信息的基础。本说明书中的过程在构建关系图谱的基础上,实现向用户推荐信息。
如图1所示,本说明书中的基于实体融合的信息推荐方法包括以下步骤:
S100:在接收到信息展示端针对待展示信息基于实体融合的信息推荐方法的信息获取请求时,识别出信息获取请求的请求时刻和待展示信息的语义表示出的事件对应的事件时刻。
本实施例中的基于实体融合的信息推荐可以由信息推荐服务端执行,具体的,可以由信息推荐服务端中的基于实体融合的信息推荐装置(该装置如图3所示)执行。
本实施例中的信息展示端可以是,例如,手机、平板电脑、个人电脑、笔记本电脑、掌上电脑(PAD)、可穿戴设备(如智能眼镜、智能手表)等等。
信息展示端和信息推荐服务端共同构成信息推荐系统。本实施例对信息推荐系统中包含的信息展示端的数量不做具体限制。无论信息展示系统中的信息展示端的数量具体为何,本实施例以各个信息展示端中的某一个信息展示端为例进行说明。
信息展示端和信息推荐服务端通过通信链路连接,信息展示端通过该通信链路将信息获取请求发送至信息推荐服务端。
在一个可选的实施例中,请求时刻是信息展示端生成信息获取请求的时刻,信息展示端在生成信息获取请求时,可以将此时的时刻信息(表示出请求时刻)添加至信息获取请求中。在另一个可选的实施例中,请求时刻是信息推荐服务端接收到信息获取请求的时刻。
在一个可选的实施例中,信息推荐服务端包含语义识别模块(现有技术中具有语义识别功能的模块均可以作为本发明实施例的语义识别模块)。对信息获取请求进行识别的结果示例性的为:“歌手张三”在“3月28日”于“C地”举办“演唱会”。其中,“3月28日”即为事件时刻。事件可以通过以下几个维度的属性进行表征:“歌手”“张三”于“C地”举办“演唱会”。
S102:将从实体库中获取到与事件匹配的若干个实体,确定为待定实体。
本实施例中的实体对应于关系图谱中的节点。待定实体是实体库中未经分辨的实体,有可能存在至少两个待定实体是同一实体可能性。实体库可以是通过人工构建的方式生成的数据库;也可以是基于爬虫等技术手段生成的数据库。
本实施例的待定实体通过其自身的固有信息进行表征,将待定实体的固有信息按照预设的信息存储方式(信息存储方式可以用于规范实体不同维度的属性的键和值之间的对应关系)进行存储,即得到实体库。
在一个可选的实施例中,可以识别出信息获取请求的事件时刻和待展示信息的语义表示出的事件对应的事件时刻。将从实体库中获取到与事件匹配的若干个实体,确定为待定实体。也就是说,在该实施例中,本发明中涉及的各个待定实体均是与信息获取请求对应的事件相关联的。
在一个可选的实施例中,实体库中的待定实体按照预设的实体生成规则进行更新。示例性的,可以周期性的更新实体库中的待定实体。
S104:根据从预设信息库中筛选出与待定实体匹配、生成时刻距请求时刻不超过第一时长阈值、且语义中表示出事件时刻的各个信息,作为第一信息。
本实施例中的预设信息库是存储有大量的信息的数据库,在一个可选的实施例中,互联网中可以被获取的信息的集合,可以作为本发明中的预设信息库。由于互联网的特性,预设信息库中存储的信息可能不是一成不变的。
从预设信息库中筛选第一信息的过程可以是:确定出待定实体的固有信息。针对预设信息库中的每个待筛选信息,确定该待筛选信息与固有信息的匹配度(例如,固有信息用于表征待定实体不同维度的属性,针对固有信息的每个维度,确定该待筛选信息与该维度的子匹配度,例如,待筛选信息包含该维度的属性,则记为该维度的子匹配为1,若不包含,则记为该维度的子匹配度为0,将各个子匹配度之和,作为匹配度)。将匹配度最高的第一数量(可以是预设值,可以通过人工的方式设定)个待筛选信息,作为第一待定信息。
若该第一待定信息的生成时刻距请求时刻不超过第一时长阈值、且该第一待定信息的语义中表示出事件时刻,则该第一待定信息是第一信息,否则,该第一待定信息不是第一信息。
可见,通过本步骤确定出的第一信息可能不唯一。
在一个可选的实施例中,第一时长阈值的确定过程可以是:确定请求时刻与事件时刻之间的时长,作为参照时长。根据参照时长确定第一时长阈值,使得第一时长阈值与参照时长负相关。参照时长越长,表明该事件距当前时刻越久远,该待筛选信息存在变数的可能性越低。降低第一时长阈值,有利于提高筛选出的第一信息的全面性。
在实际的应用场景中,也可能存在无法确定出事件时刻的情况,此时,可以确定距当前时刻的指定历史时间段内,针对该事件的信息获取请求的接收频率。若频率大于频率阈值,则将预设的第一时刻作为事件时刻;若反之,则将第二时刻作为事件时刻。第一时刻距当前时刻的时长小于第二时刻距当前时刻的时长。
S106:对第一信息进行特征提取,得到第一特征。
现有的对信息进行特征提取的技术手段均适用于本实施例。第一特征是能够用于对第一信息从不同维度进行表征的特征。用于构成第一特征的维度可以包括:时间、地点、事件、语义极性等。
S108:将预设信息库中特征与第一特征匹配、且生成时刻距请求时刻不超过第二时长阈值的各个信息,作为第二信息。
在一个可选的实施例中,确定第二信息的过程可以是:确定出第一特征。针对信息库中的每个待筛选信息,确定该待筛选信息与第一特征的匹配度(例如,第一特征用于表征第一信息不同维度的属性,针对第一信息的每个维度,确定该待筛选信息与该维度的子匹配度,例如,待筛选信息包含该维度的属性,则记为该维度的子匹配为1,若不包含,则记为该维度的子匹配度为0,将各个子匹配度之和,作为匹配度)。将匹配度最高的第二数量(可以是预设值,可以通过人工的方式设定)个待筛选信息,作为第二待定信息。
若该第二待定信息的生成时刻距请求时刻不超过第二时长阈值,则该第二待定信息是第二信息,否则,该第二待定信息不是第二信息。
在一个可选的实施例中,第二时长阈值的确定过程可以是:确定第一信息的信息量。根据第一信息的信息量确定第二时长阈值,使得第二时长阈值与第一信息的信息量正相关。第一信息的量越少,存在信息推荐可供采用的信息不足的隐患,则降低第二时长阈值,有利于避免出现第二信息不足的情况。
S110:将第一信息和第二信息,作为待定实体的实体信息。
S112:根据待定实体的实体信息,对待定实体进行融合,得到可用实体。
本实施例的方法截止本步骤,对实体库中的实体具体为何并不做限制。而且,实体具体为何是与信息获取请求相关的,在不同的时刻,针对不同的信息获取请求,即便是从实体库中确定出了同一个待定实体,也有可能存在该确定出的待定实体在不同次的信息获取过程中表达的含义不同的情况。
在实际的应用场景中,有可能存在确定出的两个或两个以上的待定实体是同一个实体的情况,则有必要进行实体对齐,对相同的实体进行融合。现有技术中能够实现实体对齐的技术手段均适用于本发明。此外,本实施例后续步骤还会对实体融合的步骤进行说明。
S114:根据基于可用实体确定出的关系图谱,生成待展示信息。
截止本步骤,本实施例对实体库和关系图谱中的实体具体为何不做限制。
待展示信息是可以用于展示的信息,在一个可选的实施例中,可以直接将构建的关系图谱作为待展示信息。在另一个可选的实施例中,可以基于构建的关系图谱和信息库中的数据,生成待展示信息。
本实施例中的实体库中预先的存储有若干个实体,不论实体库中的实体具体为何,在接收到信息获取请求的条件下,从实体库中匹配出与信息获取请求匹配的实体,而此时尚未构建关系图谱。可见,本实施例能够在信息获取请求的触发下筛选出与之匹配的待定实体、生成与信息获取请求匹配的关系图谱,以实现信息推荐与信息获取请求更为匹配,提高向用户推荐的信息的质量(质量可以通过向用户推荐的信息与信息获取请求之间的匹配度衡量)。在确定待定实体的实体信息的过程中,一方面采用了与信息获取请求匹配的第一信息,另一方面还采用了与第一信息匹配的第二信息。可见通过本实施例的信息推荐方法,除了能够较为高质量的向用户推荐信息,还能够在满足用户基本需求的基础上进行延伸,使得用户一方面能够得到其所需的信息,另一方面能够得到“额外”的信息。
在一个可选的实施例中,可以基于所述关系图谱,生成待展示信息;将待展示信息发送至信息展示端,删除关系图谱。在该实施例中,关系图谱是针对信息获取请求生成的,则构建的关系图谱未必适用于其他请求,使得该关系图谱具有“一次性”的性质。
具体的,构建的关系图谱包含了若干个节点(各节点与前述的可用实体对应,有可能存在某一可用实体没有被记录在关系图谱中的现象)。在构建关系图谱的过程中,将可用实体中与事件的匹配度最高的实体对应的节点,作为父节点。针对除对应于父节点的可用实体以外的各可用实体,基于预设信息库中的信息,确定其对应的可用时刻。可用时刻是预设信息库中的各信息中,时间标识对应的时刻距离当前时刻最早的信息携带的时间标识表示出的时刻。将可用时刻距离当前时刻最早可用实体,作为父节点对应的子节点。根据父节点和子节点之间的相似度,确定父节点和子节点在关系图谱中连接的边的权重,使得该边的权重与相似度正相关。
之后,基于信息获取请求对应的时间,从关系图谱中查询到与信息获取请求相对应的信息,作为待展示信息。
由前述内容可知,在实现实体对齐的过程中,可以通过相似度阈值衡量第一序列和第二序列之间的差异,以对第一实体、第二实体进行辨别。现就如何确定相似度阈值进行说明。
在一个可选的实施例中,针对第一实体确定出的第一实体信息可能不唯一,则确定若干个第一实体信息各自的时间标识分别对应的时刻距当前时刻的平均时长。根据平均时长确定相似度阈值,使得相似度阈值与平均时长负相关。若平均时长较长,表明第一实体对应的事件较为不活跃,即“非热点”事件,则该事件对应的信息被篡改、滥用的可能性较低,即便是针对该事件的新的篡改、滥用的现象,也较大可能的会在时间上在后信息纠正,该用于纠正的信息更易于被从信息库中查询到,作为实体信息,则无需较高的相似度阈值。
在进一步可选的实施例中,可以确定第一实体信息的信息量。根据信息量确定相似度阈值,使得相似度阈值与信息量正相关。在该实施例中,若第一实体信息的量较大,则表明有充分的信息对第一实体进行表征,对第一实体和第二实体的辨别应以准确率优先。
在一个可选的实施例中,参考图2,对待定实体进行融合的过程可以是:
S200:将若干个待定实体中的一个作为第一实体,将除该第一实体以外的若干个待定实体中的一个作为第二实体。
通过本步骤针对第一实体确定出的第二实体的可以为多个,为便于说明,本实施例仅以各第二实体中的任意一个为例进行说明。
S202:针对第一实体的实体信息中的每个信息,生成该信息对应的第一信息子图谱;并针对第二实体的实体信息中的每个信息,生成该信息对应的第二信息子图谱;第一信息子图谱表示出:在生成该第一信息子图谱时采用的第一实体信息中携带的时间标识对应的时刻中,第一实体表示出的属性;第二信息子图谱表示出:在生成该第二信息子图谱时采用的第二实体信息中携带的时间标识对应的时刻中,第二实体表示出的属性。
在一个可选的实施例中,第一实体信息的时间标识可以是在预设信息库中生成该第一实体信息对应的待筛选信息的时刻。在另一个可选的实施中,第一实体信息的时间标识可以是第一实体信息的语义表示出的事件对应的事件时刻。
示例性的,针对第一实体A,从预设信息库中筛选出第一实体信息a1、第一实体信息a2。第一实体信息a1的时间标识对应的时刻是4月1日、第一实体信息a2的时间标识对应的时刻是4月9日。第一实体信息a1表示出第一实体在4月1日对应的事件的信息,第一实体信息a2表示出第一实体在4月9日对应的事件的信息。
事件的信息可以对应于若干个维度的属性,例如,时间、地点、人物以及事件所属的领域等。可以基于事件的信息的若干个维度的属性,构建第一信息子图谱。针对第一实体信息a1,构建第一信息子图谱a1;针对第一实体信息a2,构建第一信息子图谱a2。第一信息子图谱中,可以以事件的信息维度作为节点,以节点之间的关系强度作为节点之间的边的权重。关系强度可以根据业务规则制定。
以从信息获取请求的语义中识别出的关键词所属的维度的属性(例如,时间、地点、人物以及事件所属的领域等),作为目标属性。将事件的信息中对应于目标属性与目标属性之间关系的关系强度确定为一级强度,将事件的信息中对应于目标属性与非目标属性之间关系的关系强度确定为二级强度,将事件的信息中对应于非目标属性与非目标属性之间关系的关系强度确定为三级强度。按照由大到小的顺序,一级强度大于二级强度大于三级强度。
确定第二信息子图谱的过程与确定第一信息子图谱的过程相类似,在此不做赘述。
S204:根据时间标识对生成的第一信息子图谱进行排序,得到第一序列;并且,根据时间标识对生成的第二信息子图谱进行排序,得到第二序列。
S206:若第一序列与第二序列的相似度大于相似度阈值,则将第一实体和第二实体之一,确定为可用实体,并将第一实体的实体信息和第二实体的实体信息进行融合,得到可用实体的实体信息。
在一个可选的实施例中,确定第一序列与第二序列的相似度的过程可以是:将第一序列输入预先训练的非局部神经网络,得到第一输出。第一输出表达的是第一序列中各个维度的属性和属性之间的权重随时间变化的规律。并且,将第二序列输入非局部神经网络,得到第二输出。将第一输出和第二输出的相似度,确定为第一序列和第二序列的相似度。
若第一序列与第二序列的相似度大于相似度阈值,表明第一实体与第二实体是同一实体的可能性较大。
现有技术中的对两个信息进行融合的方式均可以在条件允许的情况下适用于本发明的方法。示例性的,可以通过对信息进行叠加的方式实现融合。
S208:若第一序列与第二序列的相似度不大于相似度阈值,则将第一实体和第二实体均作为可用实体。
为获得本实施例中的非局部神经网络,在本说明书一个可选的实施例中,
S300:获取若干个实体信息。
本方法至少用于实体对齐。实体信息用于对实体进行表征的信息。本实施例中的过程至少针对实体对齐,则涉及的实体不止一个。而针对某一个实体,针对其获取到的实体信息可能不止一个。
S302:针对若干个实体信息中的每一个,确定其携带的时间标识对应的时刻中,其所属的实体表示出的属性。
实体的属性至少包含事件的属性的几个维度。
S304:根据所属于第一实体的各个实体信息表示出的属性,分别生成各个实体信息各自对应的第一信息子图谱;并且,根据所属于第二实体的各个实体信息表示出的属性,分别生成各个实体信息各自对应的第二信息子图谱。
在一个可选的实施例中,可以以不同的图形(例如,方形、圆形等)对不同维度的属性加以区分,或者,以不用的颜色值对不同维度的属性加以区分。图中相连的节点之间的权重,可以通过节点在图上的距离进行表征。
在一个可选的实施例中,对收敛条件进行了设计。首先,确定第一收敛条件。可选的,第一收敛条件可以是,训练时长达到了预设时长、预设的目标数量个样本均已在训练过程中得到了相应的输出等。
在满足第一收敛条件之后,将第一信息子图谱中的部分节点删除,得到更新后的第一信息子图谱,和/或,将第二信息子图谱中的部分节点删除,得到更新后的第二信息子图谱。采用更新后的第一信息子图谱,和/或,更新后的第二信息子图谱继续对非局部神经网络进行训练,直至再次满足第一收敛条件。
非局部神经网络多应用于视频的处理,相关技术中鲜有采用非局部神经网络对关系图谱进行处理的研究。有鉴于此,本发明提供一种用于处理关系图谱的神经网络训练方法,将非局部神经网络技术应用到关系图谱的处理中,一方面,为非局部神经网络的应用开辟新的领域,另一方面,提高关系图谱的处理效率。
基于同样的思路,本实施例还提供了对应于图1所示部分过程的一种基于实体融合的信息推荐装置。
如图3所示,该基于实体融合的信息推荐装置,可以包括以下模块中的一个或多个:
接收模块300,配置为:在接收到信息展示端针对待展示信息基于实体融合的信息推荐方法的信息获取请求时,识别出信息获取请求的请求时刻和待展示信息的语义表示出的事件对应的事件时刻。
待定实体确定模块302,配置为:将从实体库中获取到与事件匹配的若干个实体,确定为待定实体。
第一信息确定模块304,配置为:根据从预设信息库中筛选出与待定实体匹配、生成时刻距请求时刻不超过第一时长阈值、且语义中表示出事件时刻的各个信息,作为第一信息。
第一特征提取模块306,配置为:对第一信息进行特征提取,得到第一特征。
第二信息确定模块308,配置为:将预设信息库中特征与第一特征匹配、且生成时刻距请求时刻不超过第二时长阈值的各个信息,作为第二信息。
实体信息确定模块310,配置为:将第一信息和第二信息,作为待定实体的实体信息。
可用实体确定模块312,配置为:根据待定实体的实体信息,对待定实体进行融合,得到可用实体。
待展示信息确定模块314,配置为:根据基于可用实体确定出的关系图谱,生成待展示信息。
在一个可选的实施例中,上述装置还包括阈值确定模块,配置为:确定请求时刻与事件时刻之间的时长,作为参照时长;根据参照时长确定第一时长阈值,使得第一时长阈值与参照时长负相关。
在另一个可选的实施例中,上述阈值确定模块,还可配置为:确定第一信息的信息量;根据第一信息的信息量确定第二时长阈值,使得第二时长阈值与第一信息的信息量正相关。
在一个可选的实施例中,可用实体确定模块312进一步具体配置为:将若干个待定实体中的一个作为第一实体,将除该第一实体以外的若干个待定实体中的一个作为第二实体;针对第一实体的实体信息中的每个信息,生成该信息对应的第一信息子图谱;并针对第二实体的实体信息中的每个信息,生成该信息对应的第二信息子图谱;第一信息子图谱表示出:在生成该第一信息子图谱时采用的第一实体信息中携带的时间标识对应的时刻中,第一实体表示出的属性;第二信息子图谱表示出:在生成该第二信息子图谱时采用的第二实体信息中携带的时间标识对应的时刻中,第二实体表示出的属性;根据时间标识对生成的第一信息子图谱进行排序,得到第一序列;并且,根据时间标识对生成的第二信息子图谱进行排序,得到第二序列;若第一序列与第二序列的相似度大于相似度阈值,则将第一实体和第二实体之一,确定为可用实体,并将第一实体的实体信息和第二实体的实体信息进行融合,得到可用实体的实体信息。
在一个可选的实施例中,可用实体确定模块312进一步具体配置为:若第一序列与第二序列的相似度小于等于相似度阈值,则将第一实体和第二实体均作为可用实体。
进一步的,阈值确定模块,配置为:确定若干个第一实体信息各自的时间标识分别对应的时刻距当前时刻的平均时长;根据平均时长确定相似度阈值,使得相似度阈值与平均时长负相关。
进一步的,阈值确定模块,配置为:确定第一实体信息的信息量;根据信息量确定相似度阈值,使得相似度阈值与信息量正相关。
能够理解,上述基于实体融合的信息推荐装置,能够实现前述实施例中提供的基于实体融合的信息推荐方法的各个步骤,关于基于实体融合的信息推荐装置,此处不再赘述。
图4是本发明的一个实施例电子设备的结构示意图。请参考图4,在硬件层面,该电子设备包括处理器,可选的还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。上述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体的,程序可以包括程序代码,程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成一种基于实体融合的信息推荐装置。处理器,执行存储器所存放的程序,并具体用于执行前述任意一种基于实体融合的信息推荐方法。
上述如图1所示实施例揭示的一种基于实体融合的信息推荐方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1中一种基于实体融合的信息推荐方法,并实现图1所示实施例的功能,相关实施例在此不再赘述。
本发明实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行图1所示实施例中一种基于实体融合的信息推荐装置执行的方法,并具体用于执行前述的任意一种基于实体融合的信息推荐方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM) 和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所做出的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (8)

1.一种基于实体融合的信息推荐方法,所述信息推荐方法包括:
在接收到信息展示端针对待展示信息基于实体融合的信息推荐方法的信息获取请求时,识别出所述信息获取请求的请求时刻和所述待展示信息的语义表示出的事件对应的事件时刻;
将从实体库中获取到与所述事件匹配的若干个实体,确定为待定实体;
根据从预设信息库中筛选出与所述待定实体匹配、生成时刻距所述请求时刻不超过第一时长阈值、且语义中表示出所述事件时刻的各个信息,作为第一信息;所述第一时长阈值的确定过程是:确定请求时刻与事件时刻之间的时长,作为参照时长;根据所述参照时长确定所述第一时长阈值,使得所述第一时长阈值与所述参照时长负相关;
对所述第一信息进行特征提取,得到第一特征;
将所述预设信息库中特征与所述第一特征匹配、且生成时刻距所述请求时刻不超过第二时长阈值的各个信息,作为第二信息;所述第二时长阈值的确定过程是:确定所述第一信息的信息量;根据第一信息的信息量确定第二时长阈值,使得第二时长阈值与第一信息的信息量正相关;
将所述第一信息和所述第二信息,作为所述待定实体的实体信息;
根据所述待定实体的实体信息,对所述待定实体进行融合,得到可用实体;
根据基于所述可用实体确定出的关系图谱,生成待展示信息。
2.如权利要求1所述的基于实体融合的信息推荐方法,其特征在于,根据所述待定实体的实体信息,对所述待定实体进行融合,得到可用实体,包括:
将若干个所述待定实体中的一个作为第一实体,将除所述第一实体以外的若干个待定实体中的一个作为第二实体;
针对第一实体的实体信息中的每个信息,生成对应的第一信息子图谱;并针对第二实体的实体信息中的每个信息,生成对应的第二信息子图谱;第一信息子图谱表示出:在生成该第一信息子图谱时采用的第一实体信息中携带的时间标识对应的时刻中,所述第一实体表示出的属性;第二信息子图谱表示出:在生成该第二信息子图谱时采用的第二实体信息中携带的时间标识对应的时刻中,所述第二实体表示出的属性;
根据时间标识对生成的第一信息子图谱进行排序,得到第一序列;并且,根据时间标识对生成的第二信息子图谱进行排序,得到第二序列;
若所述第一序列与所述第二序列的相似度大于相似度阈值,则将所述第一实体和所述第二实体之一,确定为可用实体,并将所述第一实体的实体信息和所述第二实体的实体信息进行融合,得到所述可用实体的实体信息。
3.如权利要求2所述的基于实体融合的信息推荐方法,其特征在于:
若所述第一序列与所述第二序列的相似度小于等于相似度阈值,则将所述第一实体和所述第二实体均作为可用实体。
4.如权利要求2所述的基于实体融合的信息推荐方法,其特征在于:
确定所述第一实体信息的信息量;根据所述信息量确定所述相似度阈值,使得所述相似度阈值与所述信息量正相关。
5.一种基于实体融合的信息推荐系统,其特征在于,包括:
信息推荐服务端,配置为:实现权利要求1-4任意一项所述的基于实体融合的信息推荐方法;
信息展示端,配置为:向所述信息推荐服务端发送信息获取请求。
6.一种基于实体融合的信息推荐装置,其特征在于,所述信息推荐装置用于实现权利要求1-4任意一项所述的基于实体融合的信息推荐方法。
7.一种电子设备,其特征在于,包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行权利要求1-4任意一项所述的基于实体融合的信息推荐方法。
8.一种计算机可读存储介质,其特征在于:
所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行权利要求1-4任意一项所述的基于实体融合的信息推荐方法。
CN202211154666.3A 2022-09-22 2022-09-22 一种基于实体融合的信息推荐方法、系统、装置及介质 Active CN115237971B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211154666.3A CN115237971B (zh) 2022-09-22 2022-09-22 一种基于实体融合的信息推荐方法、系统、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211154666.3A CN115237971B (zh) 2022-09-22 2022-09-22 一种基于实体融合的信息推荐方法、系统、装置及介质

Publications (2)

Publication Number Publication Date
CN115237971A CN115237971A (zh) 2022-10-25
CN115237971B true CN115237971B (zh) 2022-12-20

Family

ID=83667272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211154666.3A Active CN115237971B (zh) 2022-09-22 2022-09-22 一种基于实体融合的信息推荐方法、系统、装置及介质

Country Status (1)

Country Link
CN (1) CN115237971B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990637A (zh) * 2019-10-14 2020-04-10 平安银行股份有限公司 网络图谱的构建方法及其装置
CN111753027A (zh) * 2020-06-29 2020-10-09 中国科学院文献情报中心 一种面向多实体的隐式知识图谱表示的方法及装置
CN112199957A (zh) * 2020-11-03 2021-01-08 中国人民解放军战略支援部队信息工程大学 基于属性和关系信息联合嵌入的人物实体对齐方法及系统
CN112650482A (zh) * 2020-12-25 2021-04-13 浙江蓝卓工业互联网信息技术有限公司 一种逻辑组件的推荐方法及相关装置
CN114897167A (zh) * 2022-05-13 2022-08-12 内蒙古大学 生物领域知识图谱构建方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763445B (zh) * 2018-05-25 2019-09-17 厦门智融合科技有限公司 专利知识库的构建方法、装置、计算机设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990637A (zh) * 2019-10-14 2020-04-10 平安银行股份有限公司 网络图谱的构建方法及其装置
CN111753027A (zh) * 2020-06-29 2020-10-09 中国科学院文献情报中心 一种面向多实体的隐式知识图谱表示的方法及装置
CN112199957A (zh) * 2020-11-03 2021-01-08 中国人民解放军战略支援部队信息工程大学 基于属性和关系信息联合嵌入的人物实体对齐方法及系统
CN112650482A (zh) * 2020-12-25 2021-04-13 浙江蓝卓工业互联网信息技术有限公司 一种逻辑组件的推荐方法及相关装置
CN114897167A (zh) * 2022-05-13 2022-08-12 内蒙古大学 生物领域知识图谱构建方法及装置

Also Published As

Publication number Publication date
CN115237971A (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
CN113254777B (zh) 信息推荐方法、装置、电子设备及存储介质
CN111143665A (zh) 一种欺诈的定性方法、装置及设备
CN111582872A (zh) 异常账号检测模型训练、异常账号检测方法、装置及设备
CN110602215B (zh) 基于联盟区块链的资源处理方法及联盟区块链系统
CN110827036A (zh) 一种欺诈交易的检测方法、装置、设备及存储介质
CN106469182B (zh) 一种基于映射关系的信息推荐方法及装置
CN111275071B (zh) 预测模型训练、预测方法、装置及电子设备
CN115237971B (zh) 一种基于实体融合的信息推荐方法、系统、装置及介质
CN113297462A (zh) 数据处理方法、装置、设备和存储介质
CN112286968A (zh) 一种业务识别方法、设备、介质及电子设备
CN111639269A (zh) 一种地点推荐方法及装置
CN108830298B (zh) 一种确定用户特征标签的方法及装置
CN111177093A (zh) 一种科技资源的共享方法及设备、介质
CN112967044B (zh) 一种支付业务的处理方法及装置
CN111461892B (zh) 用于风险识别模型的衍生变量选择方法和装置
CN114840762A (zh) 推荐内容确定方法、装置和电子设备
CN113254800A (zh) 信息推荐方法、装置、电子设备及存储介质
CN111597454A (zh) 一种账号推荐方法及装置
CN111242596A (zh) 一种电子账户、管理方法及建立方法
Ma [Retracted] Algorithmic Application of Evidence Theory in Recommender Systems
CN106708872B (zh) 一种关联对象的识别方法及装置
CN109561166B (zh) 定位目标对象的方法、装置和电子设备
CN117993910A (zh) 异常交易应对策略的验证方法及相关装置
CN116070921A (zh) 一种业务策略生成方法、装置及设备
Ramesh et al. Realtime News Analysis using Natural Language Processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant