CN114065063A - 信息处理方法、信息处理装置、存储介质与电子设备 - Google Patents

信息处理方法、信息处理装置、存储介质与电子设备 Download PDF

Info

Publication number
CN114065063A
CN114065063A CN202111342193.5A CN202111342193A CN114065063A CN 114065063 A CN114065063 A CN 114065063A CN 202111342193 A CN202111342193 A CN 202111342193A CN 114065063 A CN114065063 A CN 114065063A
Authority
CN
China
Prior art keywords
user
historical
users
recommended
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111342193.5A
Other languages
English (en)
Inventor
齐洁
贾炎
杨心智
李翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202111342193.5A priority Critical patent/CN114065063A/zh
Publication of CN114065063A publication Critical patent/CN114065063A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种信息处理方法、信息处理装置、计算机可读存储介质与电子设备,属于信息处理技术领域。方法包括:根据历史用户数据确定历史用户中各用户与各实体特征之间的关联关系,按照关联关系建立历史用户的异质信息网络;通过异质信息网络确定各用户的相似用户,并根据相似用户的历史用户数据生成相似用户的用户向量;基于待推荐用户与各实体特征之间的关联关系,从用户向量中筛选出待推荐用户的目标用户向量,将与目标用户向量中各目标用户匹配的推送对象确定为候选推送对象;采用预先训练的信息推送模型预测待推荐用户对候选推送对象的兴趣度,并根据兴趣度确定待推荐用户的目标推送对象。本公开可以提高信息推送的准确率。

Description

信息处理方法、信息处理装置、存储介质与电子设备
技术领域
本公开涉及信息处理技术领域,尤其涉及一种信息处理方法、信息处理装置、计算机可读存储介质与电子设备。
背景技术
为了提高企业的服务质量、满足用户多样化的需求,企业都试图向用户推送其可能感兴趣的内容,使得用户可以根据推送信息选择相应的业务。
现有的信息推送方法主要是通过分析用户的历史行为数据,来确定用户可能感兴趣的内容的。然而,对于新用户而言,其并没有历史行为数据可供分析,同时随着信息内容的不断丰富,对一些用户而言,其产生交互行为的内容数量往往是极少的,因此,信息推送存在冷启动和数据稀疏的问题,而由于这些问题的存在使得信息推送的准确率较低,用户难以获得较好的业务体验。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开提供了一种信息处理方法、信息处理装置、计算机可读存储介质与电子设备,进而至少在一定程度上改善现有技术信息推送准确率不高的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种信息处理方法,所述方法包括:根据历史用户数据确定历史用户中各用户与各实体特征之间的关联关系,按照所述关联关系建立所述历史用户的异质信息网络;通过所述异质信息网络确定各所述用户的相似用户,并根据所述相似用户的历史用户数据生成所述相似用户的用户向量;基于待推荐用户与各所述实体特征之间的关联关系,从所述用户向量中筛选出所述待推荐用户的目标用户向量,将与所述目标用户向量中各目标用户匹配的推送对象确定为候选推送对象;采用预先训练的信息推送模型预测所述待推荐用户对所述候选推送对象的兴趣度,并根据所述兴趣度确定所述待推荐用户的目标推送对象。
在本公开的一种示例性实施方式中,所述实体特征包括所述历史用户中各用户的属性特征和所述历史用户中各用户具有交互行为的交互对象的对象特征。
在本公开的一种示例性实施方式中,所述历史用户数据包括所述历史用户的用户属性数据和历史行为数据,所述根据历史用户数据确定所述历史用户中各用户与各实体特征之间的关联关系,按照所述关联关系建立所述历史用户的异质信息网络,包括:根据所述用户属性数据确定与所述历史用户中各用户具有关联关系的属性特征,以及根据所述历史行为数据确定与所述历史用户中各用户具有关联关系的交互对象的对象特征;以所述历史用户中的每个用户为用户节点,在具有关联关系的用户节点与属性特征对应的属性节点之间建立边,并在具有关联关系的用户节点与对象特征对应的对象节点之间建立边,得到所述异质信息网络。
在本公开的一种示例性实施方式中,所述通过所述异质信息网络确定各所述用户的相似用户,并根据所述相似用户的历史用户数据生成所述相似用户的用户向量,包括:通过所述异质信息网络确定所述历史用户中每个用户的用户节点与各所述实体特征对应的实体节点之间的连接关系;根据所述连接关系确定所述每个用户的相似用户,并根据所述相似用户的历史用户数据生成所述相似用户的用户序列;通过预先训练的向量嵌入模型对所述用户序列进行转换处理,得到所述每个用户的用户向量。
在本公开的一种示例性实施方式中,所述方法还包括:通过所述异质信息网络确定所述历史用户中各用户对应的用户节点与各对象特征对应的对象节点之间是否存在交互关系;当所述历史用户中任一用户对应的用户节点与至少一个对象特征对应的对象节点之间存在交互关系时,将与所述至少一个对象特征对应的对象节点连接的其他用户节点的用户作为所述任一用户的相似用户;当所述历史用户中任一用户对应的用户节点与各所述对象特征对应的对象节点之间均不存在交互关系时,将与所述任一用户对应的用户节点连接的属性节点连接的其他用户节点的用户作为所述任一用户的相似用户。
在本公开的一种示例性实施方式中,所述相似用户的历史用户数据包括文本数据,所述通过预先训练的向量嵌入模型对所述用户序列进行转换处理,得到所述每个用户的用户向量,包括:对所述用户序列中的所述文本数据进行分词处理,得到多个关键词;利用预先训练的词向量模型将所述多个关键词转换为语义向量,并根据所述语义向量生成所述每个用户的用户向量,所述词向量模型包括Skip-Gram模型。
在本公开的一种示例性实施方式中,所述基于待推荐用户与各所述实体特征之间的关联关系,从所述用户向量中筛选出所述待推荐用户的目标用户向量,包括:根据所述待推荐用户与各所述实体特征中的对象特征或属性特征之间的关联关系,将具有关联关系的对象特征或属性特征所对应的历史用户的用户向量确定为所述目标用户向量。
在本公开的一种示例性实施方式中,所述方法还包括:计算所述待推荐用户的用户向量与所述目标用户向量中各向量之间的相似度,所述待推荐用户的用户向量依据所述待推荐用户的用户数据生成;按照所述相似度筛选所述目标用户向量中的用户,并将与所述筛选出的用户匹配的推送对象确定为所述候选推送对象。
在本公开的一种示例性实施方式中,所述将与所述目标用户向量中各目标用户匹配的推送对象确定为候选推送对象,包括:将各所述目标用户的历史推送对象和/或具有交互行为的交互对象确定为所述候选推送对象。
在本公开的一种示例性实施方式中,所述采用预先训练的信息推送模型预测所述待推荐用户对所述候选推送对象的兴趣度,并根据所述兴趣度确定所述待推荐用户的目标推送对象,包括:利用协同过滤算法模型计算所述待推荐用户对所述候选推送对象的兴趣度;将所述兴趣度大于兴趣度阈值的候选推送对象确定为所述待推荐用户的目标推送对象。
根据本公开的第二方面,提供一种信息处理装置,所述装置包括:建立模块,用于根据历史用户数据确定历史用户中各用户与各实体特征之间的关联关系,按照所述关联关系建立所述历史用户的异质信息网络;生成模块,用于通过所述异质信息网络确定各所述用户的相似用户,并根据所述相似用户的历史用户数据生成所述相似用户的用户向量;第一确定模块,用于基于待推荐用户与各所述实体特征之间的关联关系,从所述用户向量中筛选出所述待推荐用户的目标用户向量,将与所述目标用户向量中各目标用户匹配的推送对象确定为候选推送对象;第二确定模块,用于采用预先训练的信息推送模型预测所述待推荐用户对所述候选推送对象的兴趣度,并根据所述兴趣度确定所述待推荐用户的目标推送对象。
在本公开的一种示例性实施方式中,所述实体特征包括所述历史用户中各用户的属性特征和所述历史用户中各用户具有交互行为的交互对象的对象特征。
在本公开的一种示例性实施方式中,所述历史用户数据包括所述历史用户的用户属性数据和历史行为数据,所述建立模块用于根据所述用户属性数据确定与所述历史用户中各用户具有关联关系的属性特征,以及根据所述历史行为数据确定与所述历史用户中各用户具有关联关系的交互对象的对象特征,以所述历史用户中的每个用户为用户节点,在具有关联关系的用户节点与属性特征对应的属性节点之间建立边,并在具有关联关系的用户节点与对象特征对应的对象节点之间建立边,得到所述异质信息网络。
在本公开的一种示例性实施方式中,所述生成模块用于通过所述异质信息网络确定所述历史用户中每个用户的用户节点与各所述实体特征对应的实体节点之间的连接关系,根据所述连接关系确定所述每个用户的相似用户,并根据所述相似用户的历史用户数据生成所述相似用户的用户序列,通过预先训练的向量嵌入模型对所述用户序列进行转换处理,得到所述每个用户的用户向量。
在本公开的一种示例性实施方式中,所述生成模块还用于通过所述异质信息网络确定所述历史用户中各用户对应的用户节点与各对象特征对应的对象节点之间是否存在交互关系,当所述历史用户中任一用户对应的用户节点与至少一个对象特征对应的对象节点之间存在交互关系时,将与所述至少一个对象特征对应的对象节点连接的其他用户节点的用户作为所述任一用户的相似用户,当所述历史用户中任一用户对应的用户节点与各所述对象特征对应的对象节点之间均不存在交互关系时,将与所述任一用户对应的用户节点连接的属性节点连接的其他用户节点的用户作为所述任一用户的相似用户。
在本公开的一种示例性实施方式中,所述相似用户的历史用户数据包括文本数据,所述生成模块还用于对所述用户序列中的所述文本数据进行分词处理,得到多个关键词,利用预先训练的词向量模型将所述多个关键词转换为语义向量,并根据所述语义向量生成所述每个用户的用户向量,所述词向量模型包括Skip-Gram模型。
在本公开的一种示例性实施方式中,所述第一确定模块用于根据所述待推荐用户与各所述实体特征中的对象特征或属性特征之间的关联关系,将具有关联关系的对象特征或属性特征所对应的历史用户的用户向量确定为所述目标用户向量。
在本公开的一种示例性实施方式中,所述第一确定模块还用于计算所述待推荐用户的用户向量与所述目标用户向量中各向量之间的相似度,所述待推荐用户的用户向量依据所述待推荐用户的用户数据生成,按照所述相似度筛选所述目标用户向量中的用户,并将与所述筛选出的用户匹配的推送对象确定为所述候选推送对象。
在本公开的一种示例性实施方式中,所述第一确定模块还用于将各所述目标用户的历史推送对象和/或具有交互行为的交互对象确定为所述候选推送对象。
在本公开的一种示例性实施方式中,所述第二确定模块用于利用协同过滤算法模型计算所述待推荐用户对所述候选推送对象的兴趣度,将所述兴趣度大于兴趣度阈值的候选推送对象确定为所述待推荐用户的目标推送对象。
根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种信息处理方法。
根据本公开的第四方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一种信息处理方法。
本公开具有以下有益效果:
综上,根据本示例性实施方式中的信息处理方法、信息处理装置、计算机可读存储介质和电子设备,可以根据历史用户数据确定历史用户中各用户与各实体特征之间的关联关系,建立历史用户的异质信息网络,通过异质信息网络确定各用户的相似用户,并根据相似用户的历史用户数据生成相似用户的用户向量,然后基于待推荐用户与各实体特征之间的关联关系,从用户向量中筛选出待推荐用户的目标用户向量,将与目标用户向量中各目标用户匹配的推送对象确定为候选推送对象,采用预先训练的信息推送模型预测待推荐用户对候选推送对象的兴趣度,并根据兴趣度确定待推荐用户的目标推送对象。一方面,通过建立异质信息网络,通过异质信息网络确定各用户的相似用户,可以利用异质信息网络中包含的丰富的语义信息,衡量各用户在不同实体特征维度上的相似性,且实体特征可以依据业务场景内容进行选择和设置,可以充分挖掘用户兴趣度与业务内容之间的联系,提高确定相似用户和用户兴趣的准确性;另一方面,通过从用户向量中筛选出待推荐用户的目标用户向量,并根据目标用户向量确定候选推送对象,以及采用预先训练的信息推送模型预测待推荐用户对候选推送对象的兴趣度,确定目标推送对象,可以基于相似用户的兴趣分析确定候选推送对象,并按照兴趣度筛选出待推荐用户感兴趣的目标推送对象,可以提高确定推送对象的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施方式,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本示例性实施方式中一种信息处理方法的流程图;
图2示出本示例性实施方式中一种生成异质信息网络的流程图;
图3示出本示例性实施方式中一种异质信息网络的示意图;
图4示出本示例性实施方式中一种生成用户向量的流程图;
图5示出本示例性实施方式中一种确定相似用户的流程图;
图6示出本示例性实施方式中一种相似用户的示意图;
图7示出本示例性实施方式中另一种信息处理方法的流程图;
图8示出本示例性实施方式中一种信息处理装置的结构框图;
图9示出本示例性实施方式中一种用于实现上述方法的计算机可读存储介质;
图10示出本示例性实施方式中一种用于实现上述方法的电子设备。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
本公开的示例性实施方式首先提供了一种信息处理方法,该方法可以为每个用户确定其感兴趣的目标推送对象,例如,在电信业务类应用中,可以确定用户兴趣度较高的套餐业务等,在购物类应用中,可以确定用户想要购买的商品信息等。
图1示出了本示例性实施方式的一种流程,可以包括以下步骤S110~S140:
步骤S110.根据历史用户数据确定历史用户中各用户与各实体特征之间的关联关系,按照该关联关系建立历史用户的异质信息网络。
历史用户是指在历史时刻使用过应用程序的用户,历史用户数据是指历史用户使用应用程序时记录或产生的数据,可以包括历史用户的用户属性数据,如历史用户的性别、年龄、所在地、职业、个人喜好等,也可以包括历史用户的历史行为数据,如可以是历史用户浏览、关注、收藏、购买交互对象时生成的日志数据等。实体特征是指历史用户数据中的原子信息元素,可以是由一种信息元素构成的单一特征,也可以是由多种信息元素构成的组合特征。具体的,实体特征可以包括历史用户中各用户的属性特征,如性别、年龄、所在地、职业等,也可以包括历史用户中各用户具有交互行为的交互对象的对象特征,如收藏的物品标识、购买的物品标识等。异质信息网络是一种信息网络,由节点和节点之间的边构成,并且节点和边可以具有一种或多种类型,例如,节点1、节点2和节点3可以分别表示用户A、物品X和物品Y,节点1和节点2之间的边可以表示用户A曾购买过物品X,节点2和节点3之间的边可以表示物品X和物品Y属于关联物品,如可以是牙刷和牙膏等。
本示例性实施方式中,历史用户数据可以是在用户注册或使用应用程序进行业务办理时获取的用户数据,例如,历史用户数据中的用户属性数据可以是由用户在注册应用程序时主动录入或选择的个人信息,历史行为数据可以是由应用程序后台的服务器监测和收集到的操作记录数据。历史用户数据可以按照三元组,如“用户-交互关系-对象特征”或“用户-属性数据-属性特征”的形式存储在特定的数据库或数据平台中,操作人员可以按照用户名称、数据类型、时间等索引数据从数据库或数据平台中获取历史用户数据。在获得历史用户数据后,可以按照一定的规则从历史用户数据中提取实体特征,如可以对实体特征进行重要性排序,来筛选出历史用户数据中的重要特征,并确定历史用户中各用户与各实体特征之间是否存在关联关系,以及存在何种关联关系,按照历史用户与各实体特征之间的关联关系建立异质信息网络。例如,可以按照预先根据业务场景配置的实体数据库对历史用户数据进行匹配处理,提取出历史用户数据中的每个实体特征,进而按照用户与实体特征之间的关联关系,比如用户A“购买”过物品X,用户E与用户F的年龄特征相同,建立用户与实体特征之间的连接关系,生成异质信息网络。
由于异质信息网络可以包括多种节点类型和边类型,因此,通过建立异质信息网络,可以将用户数据转化为包括丰富的语义信息的网络结构,能够为分析用户兴趣提供相当大的便利。
具体的,由于历史用户数据可以包括历史用户的用户属性数据和历史行为数据,基于此,在一种可选的实施方式中,参考图2所示,步骤S110可以通过以下步骤S210~S220实现:
步骤S210,根据用户属性数据确定与历史用户中各用户具有关联关系的属性特征,以及根据历史行为数据确定与历史用户中各用户具有关联关系的交互对象的对象特征。
其中,属性特征可以是用户属性数据中的一个或多个特征,如可以是用户属性数据中的年龄、性别等特征,特别的,对于属性特征中的数值特征,可以是一个数值范围,也可以是一个具体的数值。对象特征是指用户产生过交互行为的交互对象的特征,可以包括交互对象所属的品类、对象的标识、对象的名称和价格等。
对于用户属性数据,可以分别确定历史用户中每个用户关于各属性特征的属性数据,如年龄、性别、所在地区、个人爱好等数据,判断各个用户与对应的属性特征之间是否具有关联关系,如当用户A的年龄为22岁时,则可以认为用户A与属性特征“20~25岁”具有关联关系;对于历史行为数据,可以确定历史用户中每个用户产生过交互行为,如关注、收藏、购买过的交互对象,确定交互对象的对象特征,如交互对象的对象品类、对象标识等。
步骤S220,以历史用户中的每个用户为用户节点,在具有关联关系的用户节点与属性特征对应的属性节点之间建立边,并在具有关联关系的用户节点与对象特征对应的对象节点之间建立边,得到异质信息网络。
具体的,可以依据历史用户中每个用户与交互对象的关联关系、每个用户与属性特征之间的关联关系,以无向图的形式连接具有关联关系的用户与对象特征和具有关联关系的用户与属性特征,来生成异质信息网络。例如,参考图3所示,对于用户1、2、3而言,用户1与对象特征1、2和3均具有关联关系,用户2与对象特征1、对象特征2和属性特征1具有关联关系,用户3与对象特征3和属性特征2具有关联关系,则可以在用户节点1与对象节点1、对象节点2和对象节点3之间建立边,在用户节点2与对象节点1、对象节点2和属性节点1之间建立边,在用户节点3与属性节点2之间建立边,生成用户1、2、3的异质信息网络。
通过上述方法,可以将复杂的用户与实体特征的关系转化为网络结构,可以更为系统和直观的了解各用户与各实体特征的关联性,为分析用户之间的相似性和用户对各对象的兴趣度提供分析基础。
在一种可选的实施方式中,在获取历史用户数据后,还可以对历史用户数据中无效信息进行过滤。例如,对于数据类型中的空值、异常数据等进行删除,也可以对文本类型的数据进行切词处理,并去掉无效词语,如对于“我每月的流量消耗量大约在:200MB”分词处理后会得到“我”“每月”“的”“消耗量”这些无效信息,此时只需要获取“流量”这一关键字以及“200MB”这一数值数据作为实体特征和相应的特征数据即可。
此外,在一种可选的实施方式中,历史用户数据可以由结构化数据和非结构化数据构成,在生成异质信息网络之前,可以对历史用户数据中的结构化数据进行特征提取、特征挑选处理,得到结构化数据中的实体特征,同时对历史用户数据中的非结构化数据进行实体抽取和合并等处理,得到非结构化数据中的实体特征。通过这种方式,可以完成对历史用户数据中的结构化数据和非结构化数据的实体特征的提取,并且对于结构化数据而言,可以充分挖掘数据中的数据特征,形成体现用户交互兴趣的实体特征。
步骤S120.通过异质信息网络确定各用户的相似用户,并根据该相似用户的历史用户数据生成相似用户的用户向量。
相似用户是指与历史用户中的用户具有相似的交互行为的用户,比如相似用户与对应的历史用户中的用户可能会对相同的对象产生交互行为,该交互行为可以相同,也可以不同。相似用户的用户向量是指相似用户的历史用户数据的向量化表示,用户向量中的每个用户元素可以表示一个用户,而每个用户元素可以由一组数据向量表示。在一个用户向量中,每个用户元素对应的用户有可能表现出相似的交互行为,例如,在电信业务类应用中,同一个用户向量中的用户可能会对相同种类和价格的电信业务套餐感兴趣。
为了便于确定每个用户的兴趣对象,在得到异质信息网络后,可以根据异质信息网络确定历史用户中各用户的用户节点与其他节点之间的连接关系,如用户节点与某个对象节点或属性节点是否直接连接或间接连接等,确定各用户在对象特征或属性特征上是否存在相似性,来确定每个用户的相似用户,并将相似用户的历史用户数据转换为用户向量。
具体的,在一种可选的实施方式中,参考图4所示,可以通过以下方法生成相似用户的用户向量:
步骤S410,通过异质信息网络确定历史用户中每个用户的用户节点与各实体特征对应的实体节点之间的连接关系。
在异质信息网络中,节点可以表示用户和实体特征,节点之间的边可以表示用户与实体特征之间的关系。
步骤S420,根据上述连接关系确定每个用户的相似用户,并根据相似用户的历史用户数据生成相似用户的用户序列。
根据用户节点与实体特征之间的连接关系,可以确定用户在同种实体特征上的相似性,进而可以确定每个用户的相似用户,并生成由相似用户的历史用户数据构成的用户序列。
在一种可选的实施方式中,参考图5所示,可以通过执行以下方法确定相似用户:
步骤S510,通过异质信息网络确定历史用户中各用户对应的用户节点与各对象特征对应的对象节点之间是否存在交互关系。
实际上,在异质信息网络中,用户节点与对象节点之间的关联性可以体现用户是否存在历史交互行为或是否可能产生交互行为,而对于存在历史交互行为或可能产生交互行为的用户、不存在历史交互行为的用户或不可能产生交互行为的用户,可以分别采用不同的分析策略进行分析。因此,在生成异质信息网络后,可以通过异质信息网络中每个用户节点与对象节点之间是否直接连接或间接连接,以及间接连接的层级等,确定历史用户中每个用户是否存在历史交互行为和是否可能产生交互行为。
步骤S520,当历史用户中任一用户对应的用户节点与至少一个对象特征对应的对象节点之间存在交互关系时,将与至少一个对象特征对应的对象节点连接的其他用户节点的用户作为上述任一用户的相似用户。
步骤S530,当历史用户中任一用户对应的用户节点与各对象特征对应的对象节点之间均不存在交互关系时,将与任一用户对应的用户节点连接的属性节点连接的其他用户节点的用户作为上述任一用户的相似用户。
当历史用户中任一用户对应的用户节点与至少一个对象特征对应的对象节点之间存在连接关系时,说明上述任一用户对上述对象特征对应的交互对象产生过交互行为,则可以计算上述任一用户对应的用户节点连接的对象节点所连接的其他用户节点,确定上述任一用户的相似用户。当历史用户中任一用户对应的用户节点与各对象特征对应的对象节点之间均不存在交互关系时,说明上述任一用户可能是新用户,则可以依据同一属性节点连接的各个用户节点,将上述任一用户的用户节点连接的属性节点连接的其他用户节点的用户作为上述任一用户的相似用户。例如,可以在异质信息网络中,遍历所有存在“购买”关系的用户节点,将每个对象节点的所有二阶邻居用户节点作为关联的相似用户,或者也可以在异质信息网络中,遍历所有没有“购买”关系的用户节点,将每个属性节点的所有二阶邻居用户节点作为关联的相似用户。
就计算方式而言,可以通过下式(1)计算异质信息网络上对象节点或属性节点x与y连接的用户的相似用户:
CIxy=|NIr(x)∩NIr(y)|>λr (1)
其中,x,y均是异质信息网络中的对象节点或属性节点,NIr(x)表示对象节点x的关于关系r的一阶近邻集合,NIr(y)表示对象节点y的关于关系r的一阶近邻集合,λr为相似用户的过滤阈值。例如,在如图3所示的异质信息网络中,假设λr=2,则对于用户节点1和用户节点2而言,由于用户节点1所连接的对象节点1与用户节点2连接,则可以认为用户节点1和用户节点2对应的两个用户为相似用户。
通过上述方法,可以依据用户节点与对象节点或属性节点的连接关系,确定与每个用户具有最近相关性的相似用户。在实际应用中,也可以根据需求设置过滤阈值,来按照相应的节点距离筛选每个用户的相似用户。
步骤S430,通过预先训练的向量嵌入模型对用户序列进行转换处理,得到每个用户的用户向量。
在生成用户序列后,可以通过预先训练的向量嵌入模型将用户序列转换为用户向量。例如,可以首先采用one-hot(one-hot code,独热编码)方式将用户序列中每个相似用户的用户数据转换为0和1构成的编码数据,然后采用RNN(Recurrent Neural Network,循环神经网络)模型将编码数据转换为低维向量,实现用户序列向用户向量的转换。
通过上述步骤S410~S430,可以确定每个用户的相似用户,并根据相似用户的历史用户数据生成相似用户构成的用户序列的用户向量,实现相似用户的历史用户数据的低维向量表示。对于每个用户向量而言,其可以表示一组具有相似性的用户的用户数据,例如,参考图6所示,在经过相似用户的用户向量映射后,对于一个用户向量中的任一用户,如用户1而言,其对应的相似用户可以包括用户1、用户3、用户4和用户n等。
在一种可选的实施方式中,相似用户的历史用户数据可以包括文本数据,如在搜索应用程序中,文本数据可以是相似用户在历史时刻输入的查询语句,由此,在生成每个用户的用户向量时,还可以执行以下方法:
对用户序列中的文本数据进行分词处理,得到多个关键词;
利用预先训练的词向量模型将上述多个关键词转换为语义向量,并根据语义向量生成每个用户的用户向量。
其中,词向量模型可以是Skip-Gram模型。在生成用户序列后,可以采用jieba(一种分词工具)等分词工具对用户序列中的文本数据进行分词处理,得到文本数据对应的多个关键词,然后将每个关键词用one-hot编码表示,即也就是设置1位为“1”,其余均为“0”的向量表示一个特定的关键词,将编码后得到的关键词向量作为输入层的输入向量;在隐藏层,通过Skip-Gram模型得到的权重矩阵对输入向量进行线性变换,得到关键词向量对应的低维向量,最后将关键词向量对应的低维向量和用户序列中的其他数据向量进行组合,生成每个用户的用户向量。其中,Skip-Gram模型可以通过使用业务场景下的语料数据训练得到,且该模型可以包括多个参数,如隐藏层的权重矩阵,各层神经元的数量、模型学习率、过滤阈值、训练序列窗口等,Skip-Gram模型的各个参数构成了一个确定的向量模型。由此,可以实现对相似用户的历史用户数据中的文本数据的向量化处理。
此外,为了提高确定相似用户的效率,在生成异质信息网络后,可以将生成的异质信息网络存储在数据库或数据平台,如Neo4j图数据库中,从而在每次计算相似用户时,可以直接从Neo4j图数据库中读取相应的异质信息网络。
步骤S130.基于待推荐用户与各实体特征之间的关联关系,从用户向量中筛选出待推荐用户的目标用户向量,将与目标用户向量中各目标用户匹配的推送对象确定为候选推送对象。
待推荐用户是指需要为其推送信息内容的用户,可以是历史用户中的用户,也可以是新用户。目标用户向量是指由待推荐用户在历史用户中的相似用户的历史用户数据构成的用户向量。候选推送对象是指向待推荐用户推送的候选对象,可以是与待推荐用户相似的用户匹配的推送对象。
考虑到具有相同的实体特征的用户之间可能存在类似的业务行为,为了确定待推荐用户的推送对象,可以依据待推荐用户与各实体特征之间的关联关系,确定待推荐用户关联的实体特征对应的用户,并从用户向量中筛选该用户的用户向量,作为待推荐用户的目标用户向量。由此,目标用户向量中各目标用户对应的推送对象便可以作为待推荐用户的候选推送对象。通过这种方式,可以通过历史用户的用户向量确定待推荐用户所对应的相似用户的推送对象,得到待推荐用户的候选推送对象。
本示例性实施方式中,实体特征既可以表示用户自身的属性特征,也可以表示用户与交互对象进行交互的对象特征,基于此,不管待推荐用户是新用户还是老用户,都可以依据其与实体特征之间的关联关系,确定与待推荐用户相似的用户,通过相似用户的用户向量确定待推荐用户的候选推送对象。
具体的,在一种可选的实施方式中,可以根据待推荐用户与各实体特征中的对象特征或属性特征之间的关联关系,将具有关联关系的对象特征或属性特征对应的历史用户对应的用户向量确定为目标用户向量。
待推荐用户与实体特征之间的关联关系可以表示待推荐用户的用户特征,而具有相同的用户特征可能会对同样的对象感兴趣。因此,当待推荐用户是新用户时,可以依据待推荐用户与属性特征之间的关联关系,将属性特征所关联的历史用户的用户向量确定为目标用户向量,当待推荐用户是老用户时,可以依据待推荐用户的历史行为数据确定待推荐用户与对象特征之间的关联关系,来将对象特征所关联的历史用户的用户向量确定为目标用户向量。
进一步的,在一种可选的实施方式中,还可以执行以下方法,来确定待推荐用户的候选推送对象:
计算待推荐用户的用户向量与目标用户向量中各向量之间的相似度;
按照相似度筛选目标用户向量中的用户,并将与筛选出的用户匹配的推送对象确定为候选推送对象。
待推荐用户的用户向量可以是依据待推荐用户的用户数据生成的向量,其中,待推荐用户的用户数据也可以包括待推荐用户的用户属性数据和历史行为数据。
本示例性实施方式中,目标用户向量中的各个向量可以表示各目标用户的向量数据,通过计算待推荐用户的用户向量与目标用户向量中各向量之间的相似度,可以确定历史用户中与待推荐用户相似的用户,例如,可以计算待推荐用户的用户向量和目标用户向量中各向量之间的相关系数、余弦相似度等来衡量两个向量的相关性。下式(2)示出了计算待推荐用户的用户向量与目标用户向量中各向量之间的余弦相似度的方法:
Figure BDA0003352569810000151
其中,wx和wy分别表示待推荐用户的用户向量和目标用户向量中其中一个用户的向量数据。
在确定待推荐用户的用户向量和目标用户向量之间的相似度后,可以依据计算得到的相似度筛选出目标用户向量中与待推荐用户相似的用户,进而将相似用户所匹配的推送对象确定为待推荐用户的候选推送对象。
本示例性实施方式中,各目标用户匹配的推送对象可以包括各目标用户的历史推送对象和具有交互行为的交互对象,因此,在一种可选的实施方式中,在确定候选推送对象时,也可以将各目标用户的历史推送对象和具有交互行为的交互对象作为待推荐用户的候选推送对象。
步骤S140.采用预先训练的信息推送模型预测待推荐用户对候选推送对象的兴趣度,并按照该兴趣度确定待推荐用户的目标推送对象。
兴趣度可以表示待推荐用户对候选推送对象的感兴趣程度,兴趣度越高,待推荐用户选择候选推送对象的可能性就越高。因此,在确定候选推送对象后,可以利用信息推送模型预测待推荐用户对每个候选推送对象的兴趣度,筛选出候选推送对象中的目标推送对象,能够提高确定推送对象的准确率。
在一种可选的实施方式中,可以通过以下方法计算待推荐用户对候选推送对象的兴趣度:
利用协同过滤算法模型计算待推荐用户对候选推送对象的兴趣度;
将兴趣度大于兴趣度阈值的候选推送对象确定为待推荐用户的目标推送对象。
例如,可以利用协同过滤算法计算与待推荐用户相似的用户对候选推送对象的兴趣度,得到待推荐用户对候选推送对象的兴趣度。下式(3)列出了一种计算待推荐用户对候选推送对象的兴趣度的方式:
Figure BDA0003352569810000161
其中,ui表示待推荐用户的第i个相似用户,pj表示第j个候选推送对象,N(u,k)表示与第i个相似用户最相似的k个用户集合,
Figure BDA0003352569810000162
表示第i个相似用户与第k个相似用户的相似度,
Figure BDA0003352569810000163
表示用户第k个相似用户对第j个候选推送对象的兴趣度。
在确定待推荐用户对每个候选推送对象的兴趣度后,可以将兴趣度大于兴趣度阈值的候选推送对象确定为目标推送对象,或者也可以按照兴趣度大小进行排序,将前N个兴趣度对应的候选推送对象确定为目标推送对象。其中,N为大于0的正整数。
图7示出了本示例性实施方式中的信息处理方法的另一种流程,如图所示,可以包括以下步骤S701~S711:
步骤S701,获取历史用户数据。其中,历史用户数据可以包括历史用户的用户属性数据和历史行为数据。
步骤S702,提取历史用户数据中的结构化数据和非结构化数据。
结构化数据一般可以从存储历史用户数据的关系数据库中提取,而除结构化数据外的非结构化数据可以从其他数据库中提取。
步骤S703,对结构化数据和非结构化数据分别进行实体特征的数据提取。
例如,可以采用知识图谱、语义分析等方法提取结构化数据中的结构化数据,按照预先配置的实体特征表遍历查询非结构化数据中的实体特征。
步骤S704,根据历史用户中各用户与各实体特征之间的关联关系建立异质信息网络。
按照历史用户中每个用户与各个实体特征,如对象特征和属性特征之间的关联关系,在每个用户对应的用户节点与对应的对象节点、每个用户对应的用户节点与对应的属性节点之间建立边,得到异质信息网络。
步骤S705,通过异质信息网络确定相似用户,并生成相似用户的历史用户数据的用户序列。
根据异质信息网络确定历史用户中各用户的用户节点与其他节点之间的连接关系,可以确定各用户在对象特征或属性特征上是否存在相似性,来得到每个用户的相似用户。
步骤S706,采用Skip-Gram模型将用户序列转换为用户向量。
例如,可以采用Skip-Gram模型对用户序列中的文本数据进行向量化处理,并按照顺序将得到的文本数据对应的向量与其他数据对应的向量进行组合,得到用户向量。
步骤S707,获取待推荐用户的用户数据。相应的,待推荐用户的用户数据也可以包括用户属性数据和历史行为数据。当待推荐用户没有历史行为数据时,说明待推荐用户可能是新用户。
步骤S708,通过待推荐用户的用户数据确定待推荐用户与各实体特征之间的关联关系。
具体的,可以利用待推荐用户的用户数据中的用户属性数据确定待推荐用户与实体特征中的属性特征之间的关联关系,利用待推荐用户的用户数据中的历史行为数据确定待推荐用户与实体特征中的对象特征之间的关联关系。
步骤S709,根据待推荐用户与各实体特征之间的关联关系,从用户向量中筛选出待推荐用户的目标用户向量。
当待推荐用户与实体特征中的属性特征或对象特征存在关联关系时,可以依据该属性特征或对象特征所关联的历史用户,如历史用户中与上述属性特征或对象特征具有关联关系的用户,将历史用户中对应的用户的用户向量确定为待推荐用户的目标用户向量。
步骤S710,将与目标用户向量中各目标用户匹配的推送对象确定为候选推送对象。
其中,各目标用户匹配的推送对象可以是各目标用户的历史推送对象,也可以是各目标用户在历史时刻产生过交互行为的交互对象。
步骤S711,利用协同过滤算法计算待推荐用户对候选推送对象的兴趣度,并对兴趣度进行降序排序,将前N个兴趣度对应的候选推送对象确定为目标推送对象。
综上,根据本示例性实施方式中的信息处理方法,可以根据历史用户数据确定历史用户中各用户与各实体特征之间的关联关系,建立历史用户的异质信息网络,通过异质信息网络确定各用户的相似用户,并根据相似用户的历史用户数据生成相似用户的用户向量,然后基于待推荐用户与各实体特征之间的关联关系,从用户向量中筛选出待推荐用户的目标用户向量,将与目标用户向量中各目标用户匹配的推送对象确定为候选推送对象,采用预先训练的信息推送模型预测待推荐用户对候选推送对象的兴趣度,并根据兴趣度确定待推荐用户的目标推送对象。一方面,通过建立异质信息网络,通过异质信息网络确定各用户的相似用户,可以利用异质信息网络中包含的丰富的语义信息,衡量各用户在不同实体特征维度上的相似性,且实体特征可以依据业务场景内容进行选择和设置,可以充分挖掘用户兴趣度与业务内容之间的联系,提高确定相似用户和用户兴趣的准确性;另一方面,通过从用户向量中筛选出待推荐用户的目标用户向量,并根据目标用户向量确定候选推送对象,以及采用预先训练的信息推送模型预测待推荐用户对候选推送对象的兴趣度,确定目标推送对象,可以基于相似用户的兴趣分析确定候选推送对象,并按照兴趣度筛选出待推荐用户感兴趣的目标推送对象,可以提高确定推送对象的准确率。
本示例性实施方式还提出了一种信息处理装置,参考图8所示,信息处理装置800可以包括:建立模块810,可以用于根据历史用户数据确定历史用户中各用户与各实体特征之间的关联关系,按照关联关系建立历史用户的异质信息网络;生成模块820,可以用于通过异质信息网络确定各用户的相似用户,并根据相似用户的历史用户数据生成相似用户的用户向量;第一确定模块830,可以用于基于待推荐用户与各实体特征之间的关联关系,从用户向量中筛选出待推荐用户的目标用户向量,将与目标用户向量中各目标用户匹配的推送对象确定为候选推送对象;第二确定模块840,可以用于采用预先训练的信息推送模型预测待推荐用户对候选推送对象的兴趣度,并根据兴趣度确定待推荐用户的目标推送对象。
在本公开的一种示例性实施方式中,实体特征可以包括历史用户中各用户的属性特征和历史用户中各用户具有交互行为的交互对象的对象特征。
在本公开的一种示例性实施方式中,历史用户数据可以包括历史用户的用户属性数据和历史行为数据,建立模块810可以用于根据用户属性数据确定与历史用户中各用户具有关联关系的属性特征,以及根据历史行为数据确定与历史用户中各用户具有关联关系的交互对象的对象特征,以历史用户中的每个用户为用户节点,在具有关联关系的用户节点与属性特征对应的属性节点之间建立边,并在具有关联关系的用户节点与对象特征对应的对象节点之间建立边,得到异质信息网络。
在本公开的一种示例性实施方式中,生成模块820可以用于通过异质信息网络确定历史用户中每个用户的用户节点与各实体特征对应的实体节点之间的连接关系,根据连接关系确定每个用户的相似用户,并根据相似用户的历史用户数据生成相似用户的用户序列,通过预先训练的向量嵌入模型对用户序列进行转换处理,得到每个用户的用户向量。
在本公开的一种示例性实施方式中,生成模块820还可以用于通过异质信息网络确定历史用户中各用户对应的用户节点与各对象特征对应的对象节点之间是否存在交互关系,当历史用户中任一用户对应的用户节点与至少一个对象特征对应的对象节点之间存在交互关系时,将与至少一个对象特征对应的对象节点连接的其他用户节点的用户作为任一用户的相似用户,当历史用户中任一用户对应的用户节点与各对象特征对应的对象节点之间均不存在交互关系时,将与任一用户对应的用户节点连接的属性节点连接的其他用户节点的用户作为任一用户的相似用户。
在本公开的一种示例性实施方式中,相似用户的历史用户数据可以包括文本数据,生成模块820还可以用于对用户序列中的文本数据进行分词处理,得到多个关键词,利用预先训练的词向量模型将多个关键词转换为语义向量,并根据语义向量生成每个用户的用户向量,词向量模型可以包括Skip-Gram模型。
在本公开的一种示例性实施方式中,第一确定模块830可以用于根据待推荐用户与各实体特征中的对象特征或属性特征之间的关联关系,将具有关联关系的对象特征或属性特征所对应的历史用户的用户向量确定为目标用户向量。
在本公开的一种示例性实施方式中,第一确定模块830还可以用于计算待推荐用户的用户向量与目标用户向量中各向量之间的相似度,待推荐用户的用户向量依据待推荐用户的用户数据生成,按照相似度筛选目标用户向量中的用户,并将与筛选出的用户匹配的推送对象确定为候选推送对象。
在本公开的一种示例性实施方式中,第一确定模块830还可以用于将各目标用户的历史推送对象和/或具有交互行为的交互对象确定为候选推送对象。
在本公开的一种示例性实施方式中,第二确定模块840可以用于利用协同过滤算法模型计算待推荐用户对候选推送对象的兴趣度,将兴趣度大于兴趣度阈值的候选推送对象确定为待推荐用户的目标推送对象。
上述装置中各模块的具体细节在方法部分实施方式中已经详细说明,未披露的方案细节内容可以参见方法部分的实施方式内容,因而不再赘述。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
本公开的示例性实施方式还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
参考图9所示,描述了根据本公开的示例性实施方式的用于实现上述方法的程序产品900,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品900可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本公开的示例性实施方式还提供了一种能够实现上述方法的电子设备。下面参照图10来描述根据本公开的这种示例性实施方式的电子设备1000。图10显示的电子设备1000仅仅是一个示例,不应对本公开实施方式的功能和使用范围带来任何限制。
如图10所示,电子设备1000可以以通用计算设备的形式表现。电子设备1000的组件可以包括但不限于:上述至少一个处理单元1010、上述至少一个存储单元1020、连接不同系统组件(包括存储单元1020和处理单元1010)的总线1030和显示单元1040。
其中,存储单元1020存储有程序代码,程序代码可以被处理单元1010执行,使得处理单元1010执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,处理单元1010可以执行图1至图2、图4至图5和图7所示的方法步骤等。
存储单元1020可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)1021和/或高速缓存存储单元1022,还可以进一步包括只读存储单元(ROM)1023。
存储单元1020还可以包括具有一组(至少一个)程序模块1025的程序/实用工具1024,这样的程序模块1025包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1030可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1000也可以与一个或多个外部设备1100(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1000交互的设备通信,和/或与使得该电子设备1000能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1050进行。并且,电子设备1000还可以通过网络适配器1060与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1060通过总线1030与电子设备1000的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1000使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的示例性实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,上述附图仅是根据本公开示例性实施方式的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例性实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开示例性实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开示例性实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方式。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

Claims (13)

1.一种信息处理方法,其特征在于,所述方法包括:
根据历史用户数据确定历史用户中各用户与各实体特征之间的关联关系,按照所述关联关系建立所述历史用户的异质信息网络;
通过所述异质信息网络确定各所述用户的相似用户,并根据所述相似用户的历史用户数据生成所述相似用户的用户向量;
基于待推荐用户与各所述实体特征之间的关联关系,从所述用户向量中筛选出所述待推荐用户的目标用户向量,将与所述目标用户向量中各目标用户匹配的推送对象确定为候选推送对象;
采用预先训练的信息推送模型预测所述待推荐用户对所述候选推送对象的兴趣度,并根据所述兴趣度确定所述待推荐用户的目标推送对象。
2.根据权利要求1所述的方法,其特征在于,所述实体特征包括所述历史用户中各用户的属性特征和所述历史用户中各用户具有交互行为的交互对象的对象特征。
3.根据权利要求2所述的方法,其特征在于,所述历史用户数据包括所述历史用户的用户属性数据和历史行为数据,所述根据历史用户数据确定所述历史用户中各用户与各实体特征之间的关联关系,按照所述关联关系建立所述历史用户的异质信息网络,包括:
根据所述用户属性数据确定与所述历史用户中各用户具有关联关系的属性特征,以及根据所述历史行为数据确定与所述历史用户中各用户具有关联关系的交互对象的对象特征;
以所述历史用户中的每个用户为用户节点,在具有关联关系的用户节点与属性特征对应的属性节点之间建立边,并在具有关联关系的用户节点与对象特征对应的对象节点之间建立边,得到所述异质信息网络。
4.根据权利要求2所述的方法,其特征在于,所述通过所述异质信息网络确定各所述用户的相似用户,并根据所述相似用户的历史用户数据生成所述相似用户的用户向量,包括:
通过所述异质信息网络确定所述历史用户中每个用户的用户节点与各所述实体特征对应的实体节点之间的连接关系;
根据所述连接关系确定所述每个用户的相似用户,并根据所述相似用户的历史用户数据生成所述相似用户的用户序列;
通过预先训练的向量嵌入模型对所述用户序列进行转换处理,得到所述每个用户的用户向量。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
通过所述异质信息网络确定所述历史用户中各用户对应的用户节点与各对象特征对应的对象节点之间是否存在交互关系;
当所述历史用户中任一用户对应的用户节点与至少一个对象特征对应的对象节点之间存在交互关系时,将与所述至少一个对象特征对应的对象节点连接的其他用户节点的用户作为所述任一用户的相似用户;
当所述历史用户中任一用户对应的用户节点与各所述对象特征对应的对象节点之间均不存在交互关系时,将与所述任一用户对应的用户节点连接的属性节点连接的其他用户节点的用户作为所述任一用户的相似用户。
6.根据权利要求4所述的方法,其特征在于,所述相似用户的历史用户数据包括文本数据,所述通过预先训练的向量嵌入模型对所述用户序列进行转换处理,得到所述每个用户的用户向量,包括:
对所述用户序列中的所述文本数据进行分词处理,得到多个关键词;
利用预先训练的词向量模型将所述多个关键词转换为语义向量,并根据所述语义向量生成所述每个用户的用户向量,所述词向量模型包括Skip-Gram模型。
7.根据权利要求2所述的方法,其特征在于,所述基于待推荐用户与各所述实体特征之间的关联关系,从所述用户向量中筛选出所述待推荐用户的目标用户向量,包括:
根据所述待推荐用户与各所述实体特征中的对象特征或属性特征之间的关联关系,将具有关联关系的对象特征或属性特征所对应的历史用户的用户向量确定为所述目标用户向量。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
计算所述待推荐用户的用户向量与所述目标用户向量中各向量之间的相似度,所述待推荐用户的用户向量依据所述待推荐用户的用户数据生成;
按照所述相似度筛选所述目标用户向量中的用户,并将与所述筛选出的用户匹配的推送对象确定为所述候选推送对象。
9.根据权利要求1所述的方法,其特征在于,所述将与所述目标用户向量中各目标用户匹配的推送对象确定为候选推送对象,包括:
将各所述目标用户的历史推送对象和/或具有交互行为的交互对象确定为所述候选推送对象。
10.根据权利要求1所述的方法,其特征在于,所述采用预先训练的信息推送模型预测所述待推荐用户对所述候选推送对象的兴趣度,并根据所述兴趣度确定所述待推荐用户的目标推送对象,包括:
利用协同过滤算法模型计算所述待推荐用户对所述候选推送对象的兴趣度;
将所述兴趣度大于兴趣度阈值的候选推送对象确定为所述待推荐用户的目标推送对象。
11.一种信息处理装置,其特征在于,所述装置包括:
建立模块,用于根据历史用户数据确定历史用户中各用户与各实体特征之间的关联关系,按照所述关联关系建立所述历史用户的异质信息网络;
生成模块,用于通过所述异质信息网络确定各所述用户的相似用户,并根据所述相似用户的历史用户数据生成所述相似用户的用户向量;
第一确定模块,用于基于待推荐用户与各所述实体特征之间的关联关系,从所述用户向量中筛选出所述待推荐用户的目标用户向量,将与所述目标用户向量中各目标用户匹配的推送对象确定为候选推送对象;
第二确定模块,用于采用预先训练的信息推送模型预测所述待推荐用户对所述候选推送对象的兴趣度,并根据所述兴趣度确定所述待推荐用户的目标推送对象。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-11任一项所述的方法。
13.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-11任一项所述的方法。
CN202111342193.5A 2021-11-12 2021-11-12 信息处理方法、信息处理装置、存储介质与电子设备 Pending CN114065063A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111342193.5A CN114065063A (zh) 2021-11-12 2021-11-12 信息处理方法、信息处理装置、存储介质与电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111342193.5A CN114065063A (zh) 2021-11-12 2021-11-12 信息处理方法、信息处理装置、存储介质与电子设备

Publications (1)

Publication Number Publication Date
CN114065063A true CN114065063A (zh) 2022-02-18

Family

ID=80271987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111342193.5A Pending CN114065063A (zh) 2021-11-12 2021-11-12 信息处理方法、信息处理装置、存储介质与电子设备

Country Status (1)

Country Link
CN (1) CN114065063A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114926234A (zh) * 2022-05-10 2022-08-19 南京数睿数据科技有限公司 物品信息推送方法、装置、电子设备和计算机可读介质
CN115220922A (zh) * 2022-02-24 2022-10-21 广州汽车集团股份有限公司 车辆应用程序运行方法、装置以及车辆

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115220922A (zh) * 2022-02-24 2022-10-21 广州汽车集团股份有限公司 车辆应用程序运行方法、装置以及车辆
CN114926234A (zh) * 2022-05-10 2022-08-19 南京数睿数据科技有限公司 物品信息推送方法、装置、电子设备和计算机可读介质

Similar Documents

Publication Publication Date Title
US20210027146A1 (en) Method and apparatus for determining interest of user for information item
US20180158078A1 (en) Computer device and method for predicting market demand of commodities
US8990241B2 (en) System and method for recommending queries related to trending topics based on a received query
WO2018151856A1 (en) Intelligent matching system with ontology-aided relation extraction
CN109446341A (zh) 知识图谱的构建方法及装置
CN102243647A (zh) 从结构化数据中提取高阶知识
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN110069713B (zh) 一种基于用户上下文感知的个性化推荐方法
CN110264277B (zh) 由计算设备执行的数据处理方法及装置、介质和计算设备
CN114065063A (zh) 信息处理方法、信息处理装置、存储介质与电子设备
CN111209351B (zh) 对象关系预测、对象推荐方法及装置、电子设备、介质
WO2020034880A1 (zh) 物流对象信息处理方法、装置及计算机系统
CN111753082A (zh) 基于评论数据的文本分类方法及装置、设备和介质
CN114254201A (zh) 一种科技项目评审专家的推荐方法
CA2956627A1 (en) System and engine for seeded clustering of news events
CN111754278A (zh) 物品推荐方法、装置、计算机存储介质和电子设备
CN112084448B (zh) 相似信息处理方法以及装置
Gheisari et al. Data mining techniques for web mining: a survey
Huang et al. Feature extraction of search product based on multi-feature fusion-oriented to Chinese online reviews
Iwata et al. Sequential modeling of topic dynamics with multiple timescales
CN111241273A (zh) 文本数据分类方法、装置、电子设备及计算机可读介质
CN117237038A (zh) 一种基于流量引擎的商品精准曝光处理系统
Wu et al. How Airbnb tells you will enjoy sunset sailing in Barcelona? Recommendation in a two-sided travel marketplace
CN116861060A (zh) 一种私域电商数据搜索方法、装置、设备及存储介质
CN112328899B (zh) 信息处理方法、信息处理装置、存储介质与电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination