CN113868536A - 一种信息推荐方法、装置、设备和存储介质 - Google Patents
一种信息推荐方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN113868536A CN113868536A CN202111197111.2A CN202111197111A CN113868536A CN 113868536 A CN113868536 A CN 113868536A CN 202111197111 A CN202111197111 A CN 202111197111A CN 113868536 A CN113868536 A CN 113868536A
- Authority
- CN
- China
- Prior art keywords
- user
- behavior
- information
- similarity
- theme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种信息推荐方法、装置、设备和存储介质,应用于人工智能技术领域。该方法可以包括:利用行为主题模型对第一用户在目标系统的第一信息进行分类,得到第一用户的行为主题的分类结果;采用预设的衰减因子对多个行为主题中每个行为主题下的第一用户的第一信息进行衰减处理,得到每个行为主题下第一用户的第二信息;在多个行为主题下分别基于相似度分析模型对第一用户的第二信息和第二用户的行为信息进行相似度分析,得到每个行为主题下第一用户和第二用户的行为相似度,以确定第一用户和第二用户的用户相似度;根据用户相似度向第一用户进行信息推荐。采用本申请实施例,有助于提高信息推荐的可靠性。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种信息推荐方法、装置、设备和存储介质。
背景技术
在当今数字经济时代背景下,随着各行各业向数字化方向发展,传统的线下业务逐渐向数字化的线上系统中迁移。而线上系统在运行过程中会产生大量的数据,若能有效地利用这些数据对用户进行分析,并根据分析的结果向用户进行信息推荐,可以达到挖掘用户潜在价值的目的。因此,如何提高信息推荐的可靠性是值得探索的问题。
目前采取的信息推荐方法一般是针对不同用户进行无差别信息推荐,或者,按照用户点击过的信息的相似信息进行推荐,均无法满足用户日益增长的信息获取需求,信息推荐的可靠性较低。
发明内容
本申请实施例提供了一种信息推荐方法、装置、设备和存储介质,有助于提高信息推荐的可靠性。
第一方面,本申请实施例提供了一种信息推荐方法,包括:
获取第一用户在目标系统的第一信息,所述第一信息包括所述第一用户的行为信息;
利用行为主题模型对所述第一信息进行分类,得到所述第一用户在所述目标系统的行为主题的分类结果,所述分类结果包括多个行为主题中每个行为主题下所述第一用户的行为信息;
采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息;
在所述多个行为主题下分别基于相似度分析模型对所述第一用户的第二信息和第二用户的行为信息进行相似度分析,得到所述每个行为主题下所述第一用户和所述第二用户的行为相似度,所述第二用户为所述目标系统中除所述第一用户以外的任一用户;
根据所述第一用户和所述第二用户在所述每个行为主题下的行为相似度,确定所述第一用户和所述第二用户的用户相似度;
根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐。
第二方面,本申请实施例提供了一种信息推荐装置,包括:
获取单元,用于获取第一用户在目标系统的第一信息,其中,所述第一信息包括所述第一用户的行为信息;
分类单元,用于利用行为主题模型对所述第一信息进行分类,得到所述第一用户在所述目标系统的行为主题的分类结果,所述分类结果包括多个行为主题中每个行为主题下所述第一用户的行为信息;
处理单元,用于采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息;
所述处理单元,还用于在所述多个行为主题下分别基于相似度分析模型对所述第一用户的第二信息和第二用户的行为信息进行相似度分析,得到所述每个行为主题下所述第一用户和所述第二用户的行为相似度,所述第二用户为所述目标系统中除所述第一用户以外的任一用户;根据所述第一用户和所述第二用户在所述每个行为主题下的行为相似度,确定所述第一用户和所述第二用户的用户相似度;
推荐单元,用于根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐。
第三方面,本申请实施例提供了一种信息推荐设备,信息推荐设备包括处理器、存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于执行如下步骤:
获取第一用户在目标系统的第一信息,所述第一信息包括所述第一用户的行为信息;
利用行为主题模型对所述第一信息进行分类,得到所述第一用户在所述目标系统的行为主题的分类结果,所述分类结果包括多个行为主题中每个行为主题下所述第一用户的行为信息;
采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息;
在所述多个行为主题下分别基于相似度分析模型对所述第一用户的第二信息和第二用户的行为信息进行相似度分析,得到所述每个行为主题下所述第一用户和所述第二用户的行为相似度,所述第二用户为所述目标系统中除所述第一用户以外的任一用户;
根据所述第一用户和所述第二用户在所述每个行为主题下的行为相似度,确定所述第一用户和所述第二用户的用户相似度;
根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序指令,计算机程序指令被处理器执行时,用于执行如下步骤:
获取第一用户在目标系统的第一信息,所述第一信息包括所述第一用户的行为信息;
利用行为主题模型对所述第一信息进行分类,得到所述第一用户在所述目标系统的行为主题的分类结果,所述分类结果包括多个行为主题中每个行为主题下所述第一用户的行为信息;
采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息;
在所述多个行为主题下分别基于相似度分析模型对所述第一用户的第二信息和第二用户的行为信息进行相似度分析,得到所述每个行为主题下所述第一用户和所述第二用户的行为相似度,所述第二用户为所述目标系统中除所述第一用户以外的任一用户;
根据所述第一用户和所述第二用户在所述每个行为主题下的行为相似度,确定所述第一用户和所述第二用户的用户相似度;
根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐。
本申请实施例中,可以利用行为主题模型对第一用户在目标系统的第一信息进行分类,得到第一用户的行为主题的分类结果,并采用预设的衰减因子对多个行为主题中每个行为主题下的第一用户的第一信息进行衰减处理,得到每个行为主题下第一用户的第二信息,进而在多个行为主题下分别基于相似度分析模型对第一用户的第二信息和第二用户的行为信息进行相似度分析,得到每个行为主题下第一用户和第二用户的行为相似度,从而确定第一用户和第二用户的用户相似度,继而根据用户相似度向第一用户进行信息推荐。采用本申请的方法,可以结合行为主题的分类结果,在多个行为主题下分别对第一用户的第二信息和第二用户的行为信息进行相似度分析,这样可以提高确定出的第一用户和第二用户的用户相似度的可靠性,有助于进一步提高信息推荐的可靠性。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的一种信息推荐方法的应用场景示意图;
图1b是本申请实施例提供的另一种信息推荐方法的应用场景示意图;
图2是本申请实施例提供的一种信息推荐方法的流程示意图;
图3是本申请实施例提供的一种信息推荐装置的结构示意图;
图4是本申请实施例提供的一种信息推荐设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的技术方案可应用于信息推荐设备(信息推荐装置)中,用于实现智能化信息推荐,从而推动智慧城市的建设。可选的,该信息推荐设备可以是终端,也可以是服务器。该终端可以包括手机、平板电脑、计算机等等,本申请不做限定。可以理解,在其他实施例中,该终端还可叫做其他名称,比如终端设备、智能终端、用户设备、用户终端等等,此处不一一列举。
本申请的技术方案可应用于人工智能和/或大数据技术领域,如可以基于人工智能技术对用户行为信息进行处理以确定用户之间的用户相似度。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。可选的,本申请涉及的数据如行为信息等可通过区块链节点存储,或者可存储于数据库,或者可存储于服务器,本申请不做限定。
目前,信息推荐方法广泛应用于各行各业,如以银行为代表的金融领域、以健康管理为代表的医疗领域、以文本匹配为代表的搜索领域等等,推荐信息的可靠性不仅直接影响用户的体验感,还进一步影响用户潜在价值的挖掘程度。然而,发明人发现目前的信息推荐方法存在可靠性较低的问题。而本申请能够通过对用户的第一信息进行分类,得到多个行为主题中每个行为主题下用户的行为信息,根据各行为主题下的行为信息确定用户之间的行为相似度,并根据各行为主题下的行为相似度确定用户之间的用户相似度,进而基于用户相似度向用户进行信息推荐,由此可结合不同行为主题提升用户相似度分析的可靠性,进而提升信息推荐的可靠性。可选的,还可结合衰减因子对多个行为主题中每个行为主题下用户的行为信息进行衰减处理,基于衰减处理后的行为信息确定各行为主题下用户之间的行为相似度,进而基于各行为主题下用户之间的行为相似度确定用户之间的用户相似度后,向用户进行信息推荐,由此可进一步提升信息推荐的可靠性。
其中,该多个行为主题可以预先设置得到。比如行为主题可以与系统标识或系统类型关联,也即,不同系统对应的行为主题可以不同,或者,不同系统类型的系统对应的行为主题可以不同。
例如,请参见图1a,图1a是本申请实施例提供的一种信息推荐方法的应用场景示意图。如图1a所示,在金融领域的数据消费系统中,第一用户可以是指待推荐信息的用户,第二用户可以是指该系统中除第一用户外的任一用户。该技术方案可以包括以下步骤:将获取的第一用户的第一信息分类到多个行为主题如消费行为主题、访问行为主题、忠诚行为主题等行为主题中,每个行为主题下包括第一用户对应的行为信息,这样可以简便地筛选出该第一信息中跟每个行为主题相关的行为信息,可以将这部分行为信息称之为有效行为信息;并根据第一用户在各行为主题下的行为信息和第二用户在对应行为主题下的行为信息进行相似度分析,得到第一用户和第二用户在各行为主题下的行为相似度,从而确定第一用户和第二用户的用户相似度,进而向第一用户进行信息推荐,这样可以结合行为主题的分类结果来确定各用户之间的用户相似度,进而提高信息推荐的可靠性。
再例如,请参见图1b,图1b是本申请实施例提供的另一种信息推荐方法的应用场景示意图。如图1b所示,在医疗领域的健康管理系统中,第一用户可以是指待推荐信息的用户,第二用户可以是指该系统中除第一用户外的任一用户。该技术方案可以包括以下步骤:将获取的第一用户的第一信息分类到多个行为主题如健康行为主题、访问行为主题、销户行为主题等行为主题中,每个行为主题下包括第一用户对应的行为信息,这样可以简便地筛选出该第一信息中跟每个行为主题相关的行为信息,可以将这部分行为信息称之为有效行为信息;并根据第一用户在各行为主题下的行为信息和第二用户在对应行为主题下的行为信息进行相似度分析,得到第一用户和第二用户在各行为主题下的行为相似度,从而确定第一用户和第二用户的用户相似度,进而向第一用户进行信息推荐,这样可以结合行为主题的分类结果来确定各用户之间的用户相似度,进而提高信息推荐的可靠性。
本申请实施例提供了一种信息推荐方法、装置、设备和存储介质等,使得有助于提高信息推荐的可靠性。本申请获取的数据均经过用户授权。下面将进行详细说明。
参见图2,图2是本申请实施例提供的一种信息推荐方法的流程示意图。该方法可以由上述信息推荐设备执行,如图2所示,该信息推荐方法可以包括以下步骤:
201、获取第一用户在目标系统的第一信息。
其中,该第一用户可以是指该目标系统中的待推荐信息的用户,也可以是任一用户,比如登录账号的用户,又如输入搜索信息的用户,又如浏览系统页面时长超过时间阈值的用户,又如点击特定控件或区域的用户,等等,此处不一一列举。
其中,该目标系统可以是金融领域的数据消费系统、投资理财系统,也可以是医疗领域的健康管理系统、康复管理系统,还可以是搜索领域的语义搜索引擎系统、文件查询系统等等,本申请不做限定。
其中,可以通过确定第一用户的身份,从而将获取的第一信息与第一用户的身份进行绑定,继而得到第一用户的第一信息。例如,在一些实施例中,确定第一用户的身份的方式可以包括以下任一种:一种是在信息推荐设备中未进行账号登录的情况下,可以基于该设备的身份标识确定第一用户的身份,即第一用户的身份为该设备的身份标识,其中,该设备的身份标识可以包括以下一项或多项:设备的互联网协议地址、设备的序列号等等。另一种是在信息推荐设备中进行账号登录的情况下,可以基于该登录账号确定第一用户的身份,即第一用户的身份为该登录账号,从而将获取的第一信息和该登录账号进行绑定。可选的,还可以通过其他方式来确定第一用户的身份,从而将获取第一信息与第一用户的身份进行绑定。继而可以得到第一用户的第一信息。
可选的,还可以通过其他方式获取第一用户的第一信息,本申请不做限定。
其中,该第一信息可以包括第一用户的行为信息。可选的,该第一信息还可以包括以下一项或多项信息:特征属性信息如个人信息、兴趣爱好等,职业属性信息如职业分类、工作时间等,消费属性信息如消费场景、消费习惯等,销户原因信息如岗位变动、广告太多等。例如,在金融领域的数据消费系统中,该第一信息可以包括第一用户的行为信息,该行为信息可以包括访问该系统的时间信息、访问该系统的浏览内容等,该第一信息还可以包括第一用户的特征属性信息如年龄和性别、内容偏好等,还可以包括第一用户的职业属性信息如岗位类别、工作地点等,还可以包括第一用户的消费属性信息如消费意向、消费时间等。
在一些实施例中,可以通过在目标系统中设置埋点来获取该第一信息,也即,可以在目标系统中确定埋点对象,通过埋点对象采集该第一信息。其中,埋点对象可以包括以下一项或多项:按钮级对象、页面级对象、区域级对象,其中,该按钮级对象为目标系统页面的部分或全部按钮,该页面级对象为目标系统页面的部分或全部页面,该区域级对象为目标系统页面的部分或全部区域。例如,在医疗领域的健康管理系统中,该按钮级对象采集的信息可以包括部分或全部按钮的点击行为信息等,该页面级对象采集的信息可以包括部分或全部页面的进入时间、跳出时间等,该区域级对象采集的信息可以包括部分或全部区域的浏览时间、浏览内容等。可选的,该按钮级对象、该页面级对象、该区域级对象可以基于目标系统的类型确定出,或者可以基于目标系统的系统标识确定出,也即,不同系统类型和/或不同系统标识对应的埋点对象可以不同。由此可以通过埋点对象快速采集到该第一信息,提升获取的第一信息的可靠性。
可选的,在一些实施例中,可以对获取的第一用户的初始信息进行数据预处理,该数据预处理方式可以包括:缺失值数据的插补、离群点数据的删除、错误数据的替换等,进而得到第一用户的第一信息。
可选的,数据预处理方式还可以包括数据归约处理。对于得到的上述数据预处理后的第一用户的初始信息,可以对该初始信息进行数据归约处理,进而得到第一用户的第一信息。数据归约的处理方式不仅可以减少数据规模,还能得到和全体数据几乎相同的分析结果。
进一步可选的,可以将该第一用户的第一信息传输到服务器进行存储,使得需要第一信息时可以直接从服务器获取,由此有助于提升数据获取效率。该第一信息可存储于区块链中,比如该服务器可以为区块链中的节点,从而可提升数据可靠性。
202、利用行为主题模型对第一信息进行分类,得到第一用户在目标系统的行为主题的分类结果。
其中,该分类结果包括多个行为主题中每个行为主题下第一用户的行为信息。可选的,该第一信息可以是上述通过埋点对象获取的第一信息,也可以是上述初始信息经数据预处理后的第一信息。
在一些实施例中,可以预先对行为主题模型进行训练,训练方式可以如下:获取多个用户在指定系统的第一样本信息,该第一样本信息包括用户在指定系统的行为信息;获取该第一样本信息在指定系统的行为主题的样本分类结果,该样本分类结果包括多个行为主题中每个行为主题下该用户的行为信息,也即每个行为主题下对应着多个用户中每个用户在对应行为主题下的行为信息;进而根据该第一样本信息和该样本分类结果,训练得到行为主题模型。比如一组训练样本可以包括:某个用户对应的包括行为信息的第一样本信息、及该包括行为信息的第一样本信息对应的样本分类结果,根据多个用户对应的多组训练样本进行模型训练。由此可基于该指定系统的大量历史用户数据进行模型训练,以便于基于该模型实现对用户行为信息的快速分类。可选的,该指定系统可以为目标系统,即可以通过获取目标系统的历史用户数据进行模型训练。此外,该指定系统还可以为目标系统以外的其他系统,比如与该目标系统类型相同的系统。例如,如果该目标系统的历史用户数据较少,比如历史用户的数量低于数量阈值,或者历史用户的数据量小于数据量阈值,那么可以获取与该目标系统类型相同的其他系统的历史用户数据进行模型训练。
在一些实施例中,用户的行为信息可以分类到以下一项或多项行为主题:一是登录行为主题,例如,登录行为主题下的行为信息可以包括登录频率、登录时长、登录时段等等;二是访问行为主题,例如,访问行为主题下的行为信息可以包括页面访问次数(pageview,PV)、独立用户数(unique vistor,UV)、浏览时长、停留时长、浏览偏好、访问方式、月活跃度、跳出率(如访问页面的跳出率、搜索关键词的跳出率)等等;三是忠诚行为主题,例如,忠诚行为主题下的行为信息可以包括留存率、访问深度、用户转化率等等;四是销户行为主题,例如,销户行为主题下的行为信息可以包括用户卸载系统的原因、用户注销账号信息等等。可选的,用户的行为信息分类到的行为主题还可以包括其他行为主题,本申请不做限定。可以理解,行为主题的分类可以根据目标系统的需求进行确定,不同目标系统对应的行为主题可以存在不同。
可选的,不同目标系统所侧重的行为主题可以不同,由此可通过目标系统所侧重的行为主题,针对该侧重的行为主题(假设记为目标行为主题)下的信息进行区别处理。比如可以针对该目标行为主题设置埋点对象,该目标行为主题对应的埋点对象的数量多于该目标系统的其他行为主题,以便于获取更为丰富的目标行为主题数据;又如,该目标行为主题下的行为相似度对应的权重设置为高于该目标系统的其他行为主题的权重;又如,可以仅针对该目标行为主题下的行为信息进行衰减处理,等等,此处不一一列举。
例如,在金融领域的数据消费系统中,可以将用户的行为信息分类到以下行为主题:登录行为主题、访问行为主题、消费行为主题、忠诚行为主题、销户行为主题。其中,消费行为主题下的行为信息可以包括消费偏好、消费心理等等。可选的,对于获取的第一用户的第一信息,可以进一步对该第一信息进行筛选,筛选的第一信息可以侧重于消费行为主题所关联的信息,比如消费产品的购买时间、消费的习惯等等,可以仅针对该消费行为主题下的行为信息进行衰减处理,这样可以紧跟该系统的侧重方向,有利于提高该系统的用户体验感。可以理解的,行为主题的侧重方向可以根据金融领域中各个系统的侧重方向进行调整。例如在金融领域的投资理财系统中,可以将用户的行为信息分类到以下行为主题:登录行为主题、访问行为主题、投资行为主题、忠诚行为主题、销户行为主题。其中,该系统的侧重行为主题可以是投资行为主题,筛选的第一信息可以侧重于投资行为主题所关联的信息,比如投资的金额、投资的产品类型等等,投资行为主题对应的埋点对象的数量可以多于该数据消费系统的其他行为主题对应的埋点对象的数量。
又如,在医疗领域的健康管理系统中,可以将用户的行为信息分类到以下行为主题:登录行为主题、访问行为主题、健康行为主题、忠诚行为主题、销户行为主题。其中,健康行为主题可以包括健康档案、检查报告等等。可选的,健康行为主题下的行为信息可以包括用户手动录入的健康信息,也可以包括从医疗电子记录中自动提取的健康信息,等等。可选的,对于获取的第一用户的第一信息,可以进一步对该第一信息进行筛选,筛选的第一信息可以侧重于健康行为主题和访问行为主题所关联的信息,可以仅针对该健康行为主题和访问行为主题下的行为信息进行衰减处理,这样可以根据用户的健康信息以及用户的访问偏好进行信息推荐,有利于提高信息推荐的可靠性。可以理解的,行为主题的侧重方向可以根据医疗领域中各个系统的侧重方向进行调整。例如在医疗领域的康复管理系统中,可以将用户的行为信息分类到以下行为主题:登录行为主题、康复行为主题、访问行为主题、忠诚行为主题、销户行为主题。其中,该系统的侧重行为主题可以是康复行为主题和忠诚行为主题,筛选的第一信息可以侧重于康复行为主题和忠诚行为主题所关联的信息。可选的,该康复行为主题和忠诚行为主题下的行为相似度对应的权重高于该健康管理系统中的其他行为主题的权重。例如,康复行为主题和忠诚行为主题下的行为相似度的权重可以是[1,2)中的数值,其他行为主题下的行为相似度的权重可以是(0,1)中的数值。
可以理解,本申请涉及的信息如行为信息可以为向量的形式。
203、采用预设的衰减因子对多个行为主题中每个行为主题下第一用户的行为信息进行衰减处理,得到每个行为主题下第一用户的第二信息。
采用预设的衰减因子对行为信息进行衰减时,可以是对该衰减因子对应的行为主题下的所有行为信息进行衰减。该场景下,一个行为主题对应一个衰减因子,或者多个行为主题对应一个衰减因子,或者一个行为主题对应多个衰减因子(如不同衰减因子可以针对该行为主题下的不同行为信息进行衰减处理),本申请不做限定。或者,采用预设的衰减因子对行为信息进行衰减时,可以是对该衰减因子对应的行为主题下的特定行为信息进行衰减处理,可以理解,该特定行为信息可以根据目标系统的需求进行确定,每个行为主题下除特定行为信息外的其他行为信息的衰减因子可以设置为1(即为不进行衰减)。可选的,衰减因子可以包括以下一项或多项:时间衰减因子、行为衰减因子。
在一些实施例中,衰减因子可以包括时间衰减因子。其中,时间衰减因子可以根据用户的第一信息中的第一行为信息的第一属性信息进行确定,该第一行为信息为关联时间的行为信息,该第一属性信息用于指示该第一行为信息的时间特征。例如在金融领域的数据消费系统的登录行为主题中,该第一属性信息可以指示工作时间或非工作时间,该第一行为信息可以是工作时间登录该系统的行为信息或非工作时间登录该系统的行为信息;该第一属性信息还可以指示工作日或周末,该第一行为信息还可以是工作日登录该系统的行为信息或周末登录该系统的行为信息。进而可以根据第一属性信息确定各行为主题下第一用户的行为信息的时间衰减因子,并可根据每个行为主题下用户的行为信息和对应的时间衰减因子,得到每个行为主题下用户的第二信息。
例如在金融领域的数据消费系统中,该系统包括:登录行为主题、访问行为主题、消费行为主题、忠诚行为主题、销户行为主题。如对消费行为主题来说,可以基于时间衰减因子对关联时间的行为信息如特定消费产品的购买行为信息进行衰减,即第一行为信息可以为特定消费产品的购买行为信息,第一行为信息的第一属性信息为该特定消费产品的购买时间特征。例如,该特定消费产品的购买时间特征可以是时间阈值,当该时间阈值为半年时,可以将半年内的特定消费产品的购买行为信息的时间衰减因子设置为1.5,然后将半年内的特定消费产品的购买次数与时间衰减因子1.5进行相乘,可以将得到的数值称之为购买行为信息的第一衰减值;可以将半年前的特定消费产品的购买行为信息的时间衰减因子设置为0.75,然后将半年前的特定消费产品的购买次数与时间衰减因子0.75进行相乘,可以将得到的数值称之为购买行为信息的第二衰减值。再将该第一衰减值和该第二衰减值进行相加,可以将相加后的数值称之为购买行为信息的衰减值,该购买行为信息的衰减值即为消费行为主题下针对特定消费产品的第二信息,也即第一用户的第二信息。可选的,该消费行为主题下除特定消费产品的购买行为信息之外的其他信息(如购买金额等信息),可以将该其他信息的衰减因子设置为1(即为不进行衰减)。类似的,可以得到在登录行为主题、访问行为主题、忠诚行为主题、销户行为主题下第一用户的第二信息。
在一些实施例中,衰减因子可以包括行为衰减因子。其中,行为衰减因子可以根据用户的第一信息中的第二行为信息的第二属性信息进行确定,该第二行为信息包括波动行为的行为信息,该第二属性信息用于指示该第二行为信息的行为波动特征。例如在医疗领域的康复管理系统的销户行为主题中,第二属性信息可以包括以下任一种或多种:波动的特征属性信息如兴趣爱好变动信息、职业属性信息如岗位变动信息或职业变动信息或工作地点变动信息。进而可以根据第二属性信息确定各行为主题下第一用户的行为信息的行为衰减因子,并可根据每个行为主题下用户的行为信息和对应的行为衰减因子,得到每个行为主题下用户的第二信息。
例如在康复管理系统中,该系统包括:登录行为主题、康复行为主题、访问行为主题、忠诚行为主题、销户行为主题。如对忠诚行为主题来说,可以基于行为衰减因子对包括波动行为的行为信息如访问深度的行为信息进行衰减,其中,访问深度为用户在一次浏览过程中浏览的网页数量,即第二行为信息可以为访问深度的行为信息,第二行为信息的第二属性信息为该访问深度的波动特征。例如,该访问深度的波动特征可以是深度阈值,深度阈值为针对一次浏览过程中浏览的网页数量而预设的阈值,可以将访问深度超过深度阈值的访问深度的行为信息的行为衰减因子设置为1.2,然后将超过深度阈值的访问次数与行为衰减因子1.2进行相乘,可以将得到的数值称之为访问深度的行为信息的第三衰减值;可以将访问深度未超过深度阈值的访问深度的行为信息的行为衰减因子设置为0.6,然后将未超过深度阈值的访问次数与行为衰减因子0.6进行相乘,可以将得到的数值称之为访问深度的行为信息的第四衰减值。再将该第三衰减值和该第四衰减值进行相加,可以将相加后的数值称之为访问深度的行为信息的衰减值,该访问深度的行为信息的衰减值即为忠诚行为主题下针对访问深度的第二信息,也即第一用户的第二信息。可选的,该忠诚行为主题下除访问深度的行为信息之外的其他信息(如用户留存率等信息),可以将该其他信息的衰减因子设置为1(即为不进行衰减)。类似的,可以得到在登录行为主题、康复行为主题、访问行为主题、销户行为主题下第一用户的第二信息。
在一些实施例中,衰减因子可以包括时间衰减因子和行为衰减因子。例如在金融领域的数据消费系统的访问行为主题中,该访问行为主题下的行为信息可以包括以下一项或多项:浏览时长、访问方式、浏览偏好等。比如,第一属性信息可以指示浏览时长是否超过时间阈值,也即超过时间阈值的浏览时长可以称之为有效的访问行为信息、未超过时间阈值的浏览时长可以称之为无效的访问行为信息;第二属性信息可以指示用户的访问方式;第一属性信息还可以指示用户在预设时间前的浏览偏好和预设时间后的浏览偏好。进而可以根据第一属性信息和第二属性信息确定各行为主题下第一用户的行为信息的衰减因子,并可根据每个行为主题下用户的行为信息和对应的衰减因子,得到每个行为主题下用户的第二信息。
例如在金融领域的数据消费系统中,该系统包括:登录行为主题、访问行为主题、消费行为主题、忠诚行为主题、销户行为主题。如对一名使用该系统的普通用户,该用户在访问行为主题下的行为信息可以包括:浏览时长的行为信息、访问方式的行为信息等。
其中,可以基于时间衰减因子对浏览时长的行为信息进行衰减,即第一行为信息可以为浏览时长的行为信息,第一行为信息的第一属性信息为浏览时长的时间特征。例如,该浏览时长的时间特征可以是时间阈值,可以将浏览时长超过时间阈值的行为信息的时间衰减因子设置为2.5,然后将超过时间阈值的访问次数与时间衰减因子2.5进行相乘,可以将得到的数值称之为浏览时长的行为信息的第五衰减值;可以将浏览时长未超过时间阈值的行为信息的时间衰减因子设置为1.5,然后将未超过时间阈值的访问次数与时间衰减因子1.5进行相乘,可以将得到的数值称之为浏览时长的行为信息的第六衰减值。再将该第五衰减值和该第六衰减值进行相加,可以将相加后的数值称之为浏览时长的行为信息的衰减值,该浏览时长的行为信息的衰减值即为访问行为主题下针对浏览时长的第二信息,也即第一用户的第二信息。
其中,可以基于行为衰减因子对访问方式的行为信息进行衰减,即第二行为信息可以为访问方式的行为信息,该访问方式可以包括自主访问系统、通过分享链接访问系统等,第二行为信息的第二属性信息为访问方式的波动特征。例如,该访问方式的波动特征可以是不同的访问方式,可以将自主访问系统的行为衰减因子设置为1.2,然后将自主访问系统的访问次数与行为衰减因子1.2进行相乘,可以将得到的数值称之为访问方式的行为信息的第七衰减值;可以将通过分享链接访问系统的行为衰减因子设置为0.6,然后将通过分享链接访问系统的访问次数与行为衰减因子0.6进行相乘,可以将得到的数值称之为访问方式的行为信息的第八衰减值。再将该第七衰减值和该第八衰减值进行相加,可以将相加后的数值称之为访问方式的行为信息的衰减值,该访问方式的行为信息的衰减值即为访问行为主题下针对访问方式的第二信息,也即第一用户的第二信息。
由此,可以得到在访问行为主题下第一用户的第二信息。类似的,可以得到在登录行为主题、忠诚行为主题、销户行为主题下第一用户的第二信息。
可以理解,在一些实施例中,还可以是在对第一信息进行分类之前,即执行步骤202之前,采用预设的衰减因子对第一信息进行衰减处理,得到每个行为主题下第一用户的第二信息之后,对第二信息进行分类,得到第二信息的分类结果,以便于基于分类结果进行相似度分析。
204、在多个行为主题下分别基于相似度分析模型对第一用户的第二信息和第二用户的行为信息进行相似度分析,得到在每个行为主题下第一用户和第二用户的行为相似度。
其中,该第二用户是指该目标系统中除第一用户以外的任一用户。可选的,在一些实施例中,各个行为主题下的相似度分析可以并行进行分析,这样可以提高数据处理的效率。可选的,该第二用户的行为信息可以是经过衰减因子进行衰减处理后的行为信息。
在一些实施例中,可以利用邻域的算法来对多个行为主题下第一用户的第二信息和第二用户的行为信息进行相似度分析,得到每个行为主题下第一用户和第二用户的行为相似度。可选的,可以通过Jaccard公式来计算第一用户的第二信息和第二用户的行为信息的相似度,也可以通过余弦相似度公式来计算第一用户的第二信息和第二用户的行为信息的相似度。可选的,还可以通过其他算法或公式来计算第一用户的第二信息和第二用户的行为信息的相似度,本申请不做限定。
在一些可能的实施例中,例如在金融领域的数据消费系统的访问行为主题中,给定用户u和用户v,令N(u)表示第一用户u在访问行为主题下的行为信息,令N(v)表示多个第二用户中的某个第二用户v在访问行为主题下的行为信息。当采用余弦相似度公式对用户u和用户v的行为信息进行行为相似度分析时,在访问行为主题下用户u和用户v的行为相似度可以定义如下:
在数据消费系统中,同理可以得到用户u和用户v在登录行为主题下的行为相似度Luv、在消费行为主题下的行为相似度Cuv、在忠诚行为主题下的行为相似度Fuv和在销户行为主题下的行为相似度Nuv。
在一些实施例中,可以参照上述在数据消费系统中得到第一用户和从属于第二用户的某个用户在每个行为主题下的行为相似度的相关描述,可以类似得到该系统中第一用户和第二用户在每个行为主题下的行为相似度。可以理解的,其他领域的系统中的第一用户和第二用户在每个行为主题下的行为相似度可以参照上述描述。
205、根据第一用户和第二用户在每个行为主题下的行为相似度,确定第一用户和第二用户的用户相似度。
其中,可以根据预设规则对第一用户和第二用户在每个行为主题下的行为相似度进行处理,进一步得到第一用户和第二用户的用户相似度。可选的,该预设规则可以是加法规则,即将第一用户和第二用户在各行为主题下的行为相似度相加,得到第一用户和第二用户之间的用户相似度;或者,该预设规则也可以是平均值规则,即将第一用户和第二用户在各行为主题下的行为相似度的平均值作为第一用户和第二用户之间的用户相似度;或者,该预设规则也可以是每个行为主题下的行为相似度和对应行为主题的权重相乘后的求和规则。可选的,每个行为主题下的行为相似度的权重可以根据目标系统的需求进行确定,比如可以根据目标系统的侧重方向将相关联的行为主题下的行为相似度的权重设置为大于其他行为主题下的行为相似度的权重,又如可根据目标系统的系统标识确定各行为主题对应的行为相似度的权重,又如可根据目标系统的系统类型确定各行为主题对应的行为相似度的权重。其中,各行为主题对应的权重可预先设置得到。可选的,不同系统标识或系统类型对应的各行为主题可以不同,不同系统标识或系统类型对应的各行为主题对应的行为相似度的权重也可以不同。
在一些实施例中,例如在金融领域的数据消费系统中,该预设规则可以是每个行为主题下的行为相似度和对应行为主题的权重相乘后的求和规则。可选的,该系统中所有行为主题下的行为相似度的权重和为1。可选的,该系统中的消费行为主题的权重大于其他行为主题的权重。在一些可能的实施例中,给定数据消费系统中的用户u和用户v,用户u和用户v在登录行为主题下的行为相似度为Luv、在访问行为主题下的行为相似度为Wuv、在消费行为主题下的行为相似度为Cuv、在忠诚行为主题下的行为相似度为Fuv和在销户行为主题下的行为相似度为Nuv。当将数据消费系统中的登录行为主题的权重设为λL、访问行为主题的权重设为λW、消费行为主题的权重设为λC、忠诚行为主题的权重设为λF、销户行为主题的权重设为λN时,用户u和用户v的用户相似度Suv可以定义为:
Suv=λLLuv+λWWuv+λCCuv+λFFuv+λNNuv
可选的,λL+λW+λC+λF+λN=1。可选的,λC是λL、λW、λC、λF、λN中取值最大的一个。
206、根据第一用户和目标系统中各个第二用户之间的用户相似度,向第一用户进行信息推荐。
其中,在进行信息推荐时,可以基于第一用户和目标系统中各个第二用户之间的用户相似度确定推荐信息,以向第一用户进行信息推荐。
可选的,可以根据第一用户和该目标系统中各个第二用户之间的用户相似度对用户进行分群,得到分群的结果。可以理解的,在每个分群中的用户具有相同的用户标签。进而可以根据第一用户所属的分群,确定第一用户的用户标签。
可选的,可以根据第一用户和该目标系统中各个第二用户之间的用户相似度,从第二用户中筛选出满足预设条件的用户,得到第三用户,进而根据第三用户的用户标签,确定第一用户的用户标签。可选的,该预设条件可以是预设的用户数量,即根据用户相似度的值由大到小从第二用户中筛选出预设的用户数量的用户,得到至少一个(一个或多个)第三用户,其中,预设的用户数量为大于一的正整数;该预设条件也可以是预设的相似度阈值,即根据用户相似度的值从第二用户中筛选出大于预设的相似度阈值的用户,得到至少一个第三用户。可选的,该根据至少一个第三用户的用户标签来确定第一用户的用户标签,该第一用户的用户标签可以是至少一个第三用户的用户标签的交集,也可以是该至少一个第三用户的用户标签的并集,也可以是至少一个第三用户中用户相似度的值最大的一个用户所对应的标签。可以理解的,第一用户的用户标签可以包括一个,也可以包括多个。可选的,可以根据用户标签所关联的内容向第一用户进行信息推荐。
可选的,在第一用户退出目标系统之后,还可以利用TABLEAU软件对第一用户进行用户画像分析、用户行为路径分析、RARRA漏斗分析等。例如,在金融领域的投资理财系统中,可以利用TABLEAU软件对第一用户进行用户画像分析,这样可以直观地察觉出该第一用户的用户特征。可选的,可以从第一信息中提取相关信息来刻画该用户的用户画像。
本申请实施例中,可以利用行为主题模型对第一用户在目标系统的第一信息进行分类,得到第一用户的行为主题的分类结果,并采用预设的衰减因子对多个行为主题中每个行为主题下的第一用户的第一信息进行衰减处理,得到每个行为主题下第一用户的第二信息,进而在多个行为主题下分别基于相似度分析模型对第一用户的第二信息和第二用户的行为信息进行相似度分析,得到每个行为主题下第一用户和第二用户的行为相似度,从而确定第一用户和第二用户的用户相似度,继而根据用户相似度向第一用户进行信息推荐。采用本申请的方法,可以结合行为主题的分类结果,在多个行为主题下分别基于相似度分析模型对第一用户的第二信息和第二用户的行为信息进行相似度分析,这样可以提高第一用户和第二用户的用户相似度的可靠性,有助于进一步提高信息推荐的可靠性。
本申请实施例还提供了一种信息推荐装置。该装置可以包括用于执行前述图2所述的方法的单元。请参见图3,是本申请实施例提供的一种信息推荐装置的结构示意图。本实施例中所描述的信息推荐装置,可配置于信息推荐设备中,如图3所示,本实施例的信息推荐装置300可以包括:获取单元301、分类单元302、处理单元303和推荐单元304。其中,
获取单元301,用于获取第一用户在目标系统的第一信息,其中,所述第一信息包括所述第一用户的行为信息;
分类单元302,用于利用行为主题模型对所述第一信息进行分类,得到所述第一用户在所述目标系统的行为主题的分类结果,所述分类结果包括多个行为主题中每个行为主题下所述第一用户的行为信息;
处理单元303,用于采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息;
所述处理单元303,还用于在所述多个行为主题下分别基于相似度分析模型对所述第一用户的第二信息和第二用户的行为信息进行相似度分析,得到所述每个行为主题下所述第一用户和所述第二用户的行为相似度,所述第二用户为所述目标系统中除所述第一用户以外的任一用户;还用于根据所述第一用户和所述第二用户在所述每个行为主题下的行为相似度,确定所述第一用户和所述第二用户的用户相似度;
推荐单元304,用于根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐。
在一些实施例中,所述获取单元301获取第一用户在目标系统的第一信息,包括:
在所述目标系统中确定埋点对象,所述埋点对象包括以下一项或多项:按钮级对象、页面级对象、区域级对象,其中,所述按钮级对象为目标系统页面的部分或全部按钮,所述页面级对象为所述目标系统页面的部分或全部页面,所述区域级对象为所述目标系统页面的部分或全部区域;
根据所述埋点对象采集所述第一用户在目标系统的第一信息。
在一些实施例中,
所述获取单元301,还用于获取多个用户在所述目标系统的第一样本信息,所述第一样本信息包括所述多个用户在所述目标系统的行为信息;
所述获取单元301,还用于获取所述第一样本信息在所述目标系统的行为主题的样本分类结果,所述样本分类结果包括多个行为主题中每个行为主题下所述多个用户的行为信息;
所述处理单元303,还用于根据所述第一样本信息和所述样本分类结果,训练得到所述行为主题模型。
在一些实施例中,当所述衰减因子包括时间衰减因子时,所述处理单元303根据所述采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息,包括:
确定所述第一信息中的第一行为信息的第一属性信息,所述第一行为信息为关联时间的行为信息,所述第一属性信息用于指示所述第一行为信息的时间特征;
根据所述第一属性信息,分别确定在所述多个行为主题下所述第一用户的行为信息的时间衰减因子;
分别根据每个行为主题下所述第一用户的行为信息和对应的时间衰减因子,得到所述每个行为主题下所述第一用户的第二信息。
在一些实施例中,当所述衰减因子包括行为衰减因子时,所述处理单元303根据所述采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息,包括:
确定所述第一信息中的第二行为信息的第二属性信息,所述第二行为信息包括波动行为的行为信息,所述第二属性信息用于指示所述第二行为信息的行为波动特征;
根据所述第二属性信息,分别确定在所述多个行为主题下所述第一用户的行为信息的行为衰减因子;
分别根据每个行为主题下所述第一用户的行为信息和对应的行为衰减因子,得到所述每个行为主题下所述第一用户的第二信息。
在一些实施例中,推荐单元304根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐,包括:
根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度对用户进行分群,得到分群的结果,每个分群中的用户具有相同的用户标签;
根据所述第一用户所属的分群,确定所述第一用户的用户标签,所述第一用户的用户标签包括一个或多个;
根据所述第一用户的用户标签进行信息推荐。
在一些实施例中,推荐单元304根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐,包括:
根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,从第二用户中筛选出满足预设条件的用户,得到第三用户;
根据所述第三用户的用户标签,确定所述第一用户的用户标签;
根据所述第一用户的用户标签进行信息推荐。
可以理解的是,本实施例的信息推荐装置的各功能单元可根据上述方法实施例如图2中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
请参见图4,图4是本申请实施例提供的一种信息推荐设备的结构示意图。如图4所示,该信息推荐设备可包括:处理器401和存储器402。可选的,该信息推荐设备还可包括通信接口403。上述处理器401、存储器402和通信接口403可通过总线或其他方式连接,在本申请实施例所示图4中以通过总线连接为例。其中,通信接口403可受所述处理器的控制用于收发消息,存储器402可用于存储计算机程序,所述计算机程序包括程序指令,处理器401用于执行存储器402存储的程序指令。
上述处理器401可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
上述通信接口403可以包括输入设备和/或输出设备,例如该输入设备是可以是控制面板、麦克风、接收器等,输出设备可以是显示屏、发送器等,此处不一一列举。
上述存储器402可以包括只读存储器和随机存取存储器,并向处理器401提供程序指令和数据。存储器402的一部分还可以包括非易失性随机存取存储器。其中,处理器401被配置用于调用所述程序指令执行以下步骤:
获取第一用户在目标系统的第一信息,所述第一信息包括所述第一用户的行为信息;
利用行为主题模型对所述第一信息进行分类,得到所述第一用户在所述目标系统的行为主题的分类结果,所述分类结果包括多个行为主题中每个行为主题下所述第一用户的行为信息;
采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息;
在所述多个行为主题下分别基于相似度分析模型对所述第一用户的第二信息和第二用户的行为信息进行相似度分析,得到所述每个行为主题下所述第一用户和所述第二用户的行为相似度,所述第二用户为所述目标系统中除所述第一用户以外的任一用户;
根据所述第一用户和所述第二用户在所述每个行为主题下的行为相似度,确定所述第一用户和所述第二用户的用户相似度;
根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐。
在一些实施例中,所述处理器401在获取第一用户在目标系统的第一信息时,具体可以执行如下步骤:
在所述目标系统中确定埋点对象,所述埋点对象包括以下一项或多项:按钮级对象、页面级对象、区域级对象,其中,所述按钮级对象为目标系统页面的部分或全部按钮,所述页面级对象为所述目标系统页面的部分或全部页面,所述区域级对象为所述目标系统页面的部分或全部区域;
根据所述埋点对象采集所述第一用户在目标系统的第一信息。
在一些实施例中,所述处理器401还可以执行如下步骤:
获取多个用户在所述目标系统的第一样本信息,所述第一样本信息包括所述多个用户在所述目标系统的行为信息;
获取所述第一样本信息在所述目标系统的行为主题的样本分类结果,所述样本分类结果包括多个行为主题中每个行为主题下所述多个用户的行为信息;
根据所述第一样本信息和所述样本分类结果,训练得到所述行为主题模型。
在一些实施例中,当所述衰减因子包括时间衰减因子时,所述处理器401在采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息时,具体可以执行如下步骤:
确定所述第一信息中的第一行为信息的第一属性信息,所述第一行为信息为关联时间的行为信息,所述第一属性信息用于指示所述第一行为信息的时间特征;
根据所述第一属性信息,分别确定在所述多个行为主题下所述第一用户的行为信息的时间衰减因子;
分别根据每个行为主题下所述第一用户的行为信息和对应的时间衰减因子,得到所述每个行为主题下所述第一用户的第二信息。
在一些实施例中,当所述衰减因子包括行为衰减因子时,所述处理器401在采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息时,具体可以执行如下步骤:
确定所述第一信息中的第二行为信息的第二属性信息,所述第二行为信息包括波动行为的行为信息,所述第二属性信息用于指示所述第二行为信息的行为波动特征;
根据所述第二属性信息,分别确定在所述多个行为主题下所述第一用户的行为信息的行为衰减因子;
分别根据每个行为主题下所述第一用户的行为信息和对应的行为衰减因子,得到所述每个行为主题下所述第一用户的第二信息。
在一些实施例中,所述处理器401在根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐时,具体可以执行如下步骤:
根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度对用户进行分群,得到分群的结果,每个分群中的用户具有相同的用户标签;
根据所述第一用户所属的分群,确定所述第一用户的用户标签,所述第一用户的用户标签包括一个或多个;
根据所述第一用户的用户标签进行信息推荐。
在一些实施例中,所述处理器401在根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐时,具体可以执行如下步骤:
根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,从第二用户中筛选出满足预设条件的用户,得到第三用户;
根据所述第三用户的用户标签,确定所述第一用户的用户标签;
根据所述第一用户的用户标签进行信息推荐。
具体实现中,本申请实施例中所描述的处理器401、存储器402和通信接口403可执行本申请实施例提供图2所述的方法实施例所描述的实现方式,也可执行本申请实施例所描述的信息推荐装置的实现方式,在此不再赘述。
本申请实施例还提供了一种信息推荐系统,该信息推荐系统可包括信息推荐设备和存储设备。其中,该存储设备可用于存储信息推荐过程中涉及的数据,比如第一信息、行为主题分类后的行为信息、第二信息、行为相似度、用户相似度等等,本申请不做限定。该信息推荐设备可从存储设备获取数据或者将数据存储于该存储设备,该信息推荐设备可用于执行上述方法中的部分或全部步骤,或者实现上述装置或信息推荐设备的功能,此处不赘述。
本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述方法,比如执行上述信息推荐设备执行的方法,此处不赘述。
可选的,本申请涉及的存储介质如计算机可读存储介质可以是非易失性的,也可以是易失性的。
可选的,该计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包括了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和单元并不一定是本申请所必须的。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random AccessMemory,RAM)、磁盘或光盘等。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法的实施例中所执行的步骤。例如,该计算机设备可以为上述的信息推荐设备,比如可以为终端,或者可以为服务器。
以上对本申请实施例所提供的一种信息推荐方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种信息推荐方法,其特征在于,包括:
获取第一用户在目标系统的第一信息,所述第一信息包括所述第一用户的行为信息;
利用行为主题模型对所述第一信息进行分类,得到所述第一用户在所述目标系统的行为主题的分类结果,所述分类结果包括多个行为主题中每个行为主题下所述第一用户的行为信息;
采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息;
在所述多个行为主题下分别基于相似度分析模型对所述第一用户的第二信息和第二用户的行为信息进行相似度分析,得到所述每个行为主题下所述第一用户和所述第二用户的行为相似度,所述第二用户为所述目标系统中除所述第一用户以外的任一用户;
根据所述第一用户和所述第二用户在所述每个行为主题下的行为相似度,确定所述第一用户和所述第二用户的用户相似度;
根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐。
2.根据权利要求1所述的方法,其特征在于,所述获取第一用户在目标系统的第一信息,包括:
在所述目标系统中确定埋点对象,所述埋点对象包括以下一项或多项:按钮级对象、页面级对象、区域级对象,其中,所述按钮级对象为目标系统页面的部分或全部按钮,所述页面级对象为所述目标系统页面的部分或全部页面,所述区域级对象为所述目标系统页面的部分或全部区域;
根据所述埋点对象采集所述第一用户在所述目标系统的第一信息。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个用户在所述目标系统的第一样本信息,所述第一样本信息包括所述多个用户在所述目标系统的行为信息;
获取所述第一样本信息在所述目标系统的行为主题的样本分类结果,所述样本分类结果包括多个行为主题中每个行为主题下所述多个用户的行为信息;
根据所述第一样本信息和所述样本分类结果,训练得到所述行为主题模型。
4.根据权利要求1所述的方法,其特征在于,所述衰减因子包括时间衰减因子,所述采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息,包括:
确定所述第一信息中的第一行为信息的第一属性信息,所述第一行为信息为关联时间的行为信息,所述第一属性信息用于指示所述第一行为信息的时间特征;
根据所述第一属性信息,分别确定在所述多个行为主题下所述第一用户的行为信息的时间衰减因子;
分别根据每个行为主题下所述第一用户的行为信息和对应的时间衰减因子,得到所述每个行为主题下所述第一用户的第二信息。
5.根据权利要求1所述的方法,其特征在于,所述衰减因子包括行为衰减因子,所述采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息,包括:
确定所述第一信息中的第二行为信息的第二属性信息,所述第二行为信息包括波动行为的行为信息,所述第二属性信息用于指示所述第二行为信息的行为波动特征;
根据所述第二属性信息,分别确定在所述多个行为主题下所述第一用户的行为信息的行为衰减因子;
分别根据每个行为主题下所述第一用户的行为信息和对应的行为衰减因子,得到所述每个行为主题下所述第一用户的第二信息。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐,包括:
根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度对用户进行分群,得到分群的结果,每个分群中的用户具有相同的用户标签;
根据所述第一用户所属的分群,确定所述第一用户的用户标签,所述第一用户的用户标签包括一个或多个;
根据所述第一用户的用户标签确定针对所述第一用户的推荐信息,并向所述第一用户推送所述推荐信息。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐,包括:
根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,从所述目标系统的所述第二用户中筛选出满足预设条件的至少一个第三用户;
根据所述至少一个第三用户的用户标签,确定所述第一用户的用户标签;
根据所述第一用户的用户标签确定针对所述第一用户的推荐信息,并向所述第一用户推送所述推荐信息。
8.一种信息推荐装置,其特征在于,包括:
获取单元,用于获取第一用户在目标系统的第一信息,其中,所述第一信息包括所述第一用户的行为信息;
分类单元,用于利用行为主题模型对所述第一信息进行分类,得到所述第一用户在所述目标系统的行为主题的分类结果,所述分类结果包括多个行为主题中每个行为主题下所述第一用户的行为信息;
处理单元,用于采用预设的衰减因子对所述多个行为主题中每个行为主题下所述第一用户的行为信息进行衰减处理,得到所述每个行为主题下所述第一用户的第二信息;
所述处理单元,还用于在所述多个行为主题下分别基于相似度分析模型对所述第一用户的第二信息和第二用户的行为信息进行相似度分析,得到所述每个行为主题下所述第一用户和所述第二用户的行为相似度,所述第二用户为所述目标系统中除所述第一用户以外的任一用户;根据所述第一用户和所述第二用户在所述每个行为主题下的行为相似度,确定所述第一用户和所述第二用户的用户相似度;
推荐单元,用于根据所述第一用户和所述目标系统中各个第二用户之间的用户相似度,向所述第一用户进行信息推荐。
9.一种信息推荐设备,其特征在于,包括处理器、存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111197111.2A CN113868536A (zh) | 2021-10-13 | 2021-10-13 | 一种信息推荐方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111197111.2A CN113868536A (zh) | 2021-10-13 | 2021-10-13 | 一种信息推荐方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113868536A true CN113868536A (zh) | 2021-12-31 |
Family
ID=78999676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111197111.2A Pending CN113868536A (zh) | 2021-10-13 | 2021-10-13 | 一种信息推荐方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113868536A (zh) |
-
2021
- 2021-10-13 CN CN202111197111.2A patent/CN113868536A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shu et al. | Beyond news contents: The role of social context for fake news detection | |
Lu et al. | BizSeeker: a hybrid semantic recommendation system for personalized government‐to‐business e‐services | |
EP3079116A1 (en) | System and method for generating recommendations | |
US9785888B2 (en) | Information processing apparatus, information processing method, and program for prediction model generated based on evaluation information | |
US7421429B2 (en) | Generate blog context ranking using track-back weight, context weight and, cumulative comment weight | |
US10218599B2 (en) | Identifying referral pages based on recorded URL requests | |
US11275748B2 (en) | Influence score of a social media domain | |
JP7160980B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
EP3189449A2 (en) | Sentiment rating system and method | |
CN108021651B (zh) | 一种网络舆情风险评估方法及装置 | |
CN109325179A (zh) | 一种内容推广的方法及装置 | |
CN111723292A (zh) | 基于图神经网络的推荐方法、系统、电子设备及存储介质 | |
CN110019785B (zh) | 一种文本分类方法及装置 | |
CN110825868A (zh) | 一种基于话题热度的文本推送方法、终端设备及存储介质 | |
CN116109373A (zh) | 金融产品的推荐方法、装置、电子设备和介质 | |
Sajeev et al. | Effective web personalization system based on time and semantic relatedness | |
Permana et al. | Perception analysis of the Indonesian society on twitter social media on the increase in BPJS kesehatan contribution in the Covid 19 pandemic era | |
US20200311761A1 (en) | System and method for analyzing the effectiveness and influence of digital online content | |
CN110069691A (zh) | 用于处理点击行为数据的方法和装置 | |
CN113868536A (zh) | 一种信息推荐方法、装置、设备和存储介质 | |
CN109242690A (zh) | 理财产品推荐方法、装置、计算机设备及可读存储介质 | |
Hinze et al. | Advanced recommendation models for mobile tourist information | |
CN113961811A (zh) | 基于事件图谱的话术推荐方法、装置、设备及介质 | |
Yu et al. | Sockpuppet detection in social network based on adaptive multi-source features | |
Golian et al. | News Recommender System based on Association Rules@ CLEF NewsREEL 2017. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |