CN109903067A - 信息处理方法和装置 - Google Patents

信息处理方法和装置 Download PDF

Info

Publication number
CN109903067A
CN109903067A CN201711298201.4A CN201711298201A CN109903067A CN 109903067 A CN109903067 A CN 109903067A CN 201711298201 A CN201711298201 A CN 201711298201A CN 109903067 A CN109903067 A CN 109903067A
Authority
CN
China
Prior art keywords
feature
article
session
value
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711298201.4A
Other languages
English (en)
Other versions
CN109903067B (zh
Inventor
杨泽宇
齐洪军
赵彦
陈见成
侯亚帆
李振洋
许磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201711298201.4A priority Critical patent/CN109903067B/zh
Publication of CN109903067A publication Critical patent/CN109903067A/zh
Application granted granted Critical
Publication of CN109903067B publication Critical patent/CN109903067B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本申请实施例公开了信息处理方法和装置。该方法的一具体实施方式包括:获取用户浏览预设类物品的信息的浏览记录,其中,浏览记录包括会话信息和已浏览的物品的特征信息;对于会话信息所指示的每次会话,根据浏览记录,统计预设类物品的各特征中的各特征值,在该次会话中出现的最大次数,根据统计的各特征值的最大次数,确定各特征在该次会话中的初始值;对于各特征中的每一特征,根据该特征在各会话中的初始值以及各会话的预设权值,确定该特征的特征分值,其中,预设权值与会话的发生时间相关;根据各特征的特征分值,生成特征数据集合,其中,特征数据集合中包括预设类物品的特征数据。该实施方式有助于提高信息处理结果的准确度。

Description

信息处理方法和装置
技术领域
本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及信息处理方法和装置。
背景技术
信息处理一般是对信息的接收、存储、转化、传送和发布等。由于信息通常被承载在一定的信号上,对信息的处理总是通过对信号的处理来实现。所以,信息处理往往和信号处理具有类同的含义。
信息处理的目的主要是:提高有效性;提高抗干扰性;改善主观感觉的效果;对信息进行识别和分类;分离和选择信息。总的来说是为了更好地与信宿的性质相匹配,舍弃那些对信宿无关的部分,突出信宿需要的有用部分。
发明内容
本申请实施例提出了信息处理方法和装置。
第一方面,本申请实施例提供了一种信息处理方法,包括:获取用户浏览预设类物品的信息的浏览记录,其中,浏览记录包括会话信息和已浏览的物品的特征信息;对于会话信息所指示的每次会话,根据浏览记录,统计预设类物品的各特征中的各特征值,在该次会话中出现的最大次数,根据统计的各特征值的最大次数,确定各特征在该次会话中的初始值;对于各特征中的每一特征,根据该特征在各会话中的初始值以及各会话的预设权值,确定该特征的特征分值,其中,预设权值与会话的发生时间相关;根据各特征的特征分值,生成特征数据集合,其中,特征数据集合中包括预设类物品的特征数据。
在一些实施例中,根据统计的各特征值的最大次数,确定各特征在该次会话中的初始值,包括:对于各特征中的每一特征,根据属于该特征的各特征值的最大次数,将最大次数中的最大值作为该特征在该次会话中的候选值;根据各特征在该次会话中的候选值,确定各特征在该次会话中的初始值。
在一些实施例中,根据各特征在该次会话中的候选值,确定各特征在该次会话中的初始值,包括:计算各特征在该次会话中的候选值的总和,并将各特征在该次会话中的候选值与计算的总和的比值,分别作为各特征在该次会话中的初始值。
在一些实施例中,浏览记录还包括用户信息;以及该方法还包括:对于预设类物品的各特征中的每一特征,根据各用户的浏览记录,分别得到该特征的特征分值,根据该特征对应各用户的特征分值,确定该特征的综合特征分值;将各特征的综合特征分值存储至特征数据集合中。
在一些实施例中,根据该特征对应各用户的特征分值,确定该特征的综合特征分值,包括:对该特征对应各用户的特征分值进行归一化处理,并将归一化处理后的各特征分值的总和作为该特征的综合特征分值。
在一些实施例中,将各特征的综合特征分值存储至特征数据集合中,包括:对各特征的综合特征分值进行归一化处理,并将归一化处理后的各特征的综合特征分值存储至特征数据集合中。
在一些实施例中,该方法还包括:接收用户发送的浏览请求,其中,浏览请求包括待浏览物品的信息;获取用于描述待浏览物品的特征信息的网页;根据特征数据集合,计算与待浏览物品属于同类的各物品与待浏览物品之间的相似度;根据计算结果,生成推送信息,并将推送信息反馈给发送浏览请求的用户。
在一些实施例中,根据特征数据集合,计算与待浏览物品属于同类的各物品与待浏览物品之间的相似度,包括:对于各特征中的每一特征,根据待浏览物品的该特征的特征值、同类各物品的该特征的特征值以及特征数据集合中该特征的特征数据,计算待浏览物品的该特征与同类各物品的该特征的相似度;根据待浏览物品的各特征与同类各物品的各特征的相似度,计算待浏览物品与同类各物品之间的相似度。
第二方面,本申请实施例提供了一种信息处理装置,包括:第一获取单元,配置用于获取用户浏览预设类物品的信息的浏览记录,其中,浏览记录包括物品的特征和会话信息;第一确定单元,配置用于对于会话信息所指示的每次会话,根据浏览记录,统计预设类物品的各特征中的各特征值,在该次会话中出现的最大次数,根据统计的各特征值的最大次数,确定各特征在该次会话中的初始值;第二确定单元,配置用于对于各特征中的每一特征,根据该特征在各会话中的初始值以及各会话的预设权值,确定该特征的特征分值,其中,预设权值与会话的发生时间相关;生成单元,配置用于根据各特征的特征分值,生成特征数据集合,其中,特征数据集合包括预设类物品的特征数据。
在一些实施例中,第一确定单元包括:作为子单元,配置用于对于各特征中的每一特征,根据属于该特征的各特征值的最大次数,将最大次数中的最大值作为该特征在该次会话中的候选值;确定子单元,配置用于根据各特征在该次会话中的候选值,确定各特征在该次会话中的初始值。
在一些实施例中,确定子单元进一步配置用于:计算各特征在该次会话中的候选值的总和,并将各特征在该次会话中的候选值与计算的总和的比值,分别作为各特征在该次会话中的初始值。
在一些实施例中,浏览记录还包括用户信息;以及该装置还包括:第三确定单元,配置用于对于预设类物品的各特征中的每一特征,根据各用户的浏览记录,分别得到该特征的特征分值,根据该特征对应各用户的特征分值,确定该特征的综合特征分值;存储单元,配置用于将各特征的综合特征分值存储至特征数据集合中。
在一些实施例中,第三确定单元进一步配置用于:对该特征对应各用户的特征分值进行归一化处理,并将归一化处理后的各特征分值的总和作为该特征的综合特征分值。
在一些实施例中,存储单元进一步配置用于:对各特征的综合特征分值进行归一化处理,并将归一化处理后的各特征的综合特征分值存储至特征数据集合中。
在一些实施例中,该装置还包括:接收单元,配置用于接收用户发送的浏览请求,其中,浏览请求包括待浏览物品的信息;第二获取单元,配置用于获取用于描述待浏览物品的特征信息的网页;计算单元,配置用于根据特征数据集合,计算与待浏览物品属于同类的各物品与待浏览物品之间的相似度;反馈单元,配置用于根据计算结果,生成推送信息,并将推送信息反馈给发送浏览请求的用户。
在一些实施例中,计算单元包括:第一计算子单元,配置用于对于各特征中的每一特征,根据待浏览物品的该特征的特征值、同类各物品的该特征的特征值以及特征数据集合中该特征的特征数据,计算待浏览物品的该特征与同类各物品的该特征的相似度;第二计算子单元,配置用于根据待浏览物品的各特征与同类各物品的各特征的相似度,计算待浏览物品与同类各物品之间的相似度。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上述第一方面中任一实施例所描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一实施例所描述的方法。
本申请实施例提供的信息处理方法和装置,通过获取用户浏览预设类物品的信息的浏览记录,其中,浏览记录包括会话信息和已浏览的物品的特征信息,可以统计预设类物品的各特征中的各特征值,在各次会话中出现的最大次数;接着,根据统计的各特征值的最大次数,可以确定各特征在各次会话中的初始值;之后,再根据各特征在各会话中的初始值以及各会话的预设权值,可以确定各特征的特征分值,从而生成特征数据集合。其中,特征数据集合中包括预设类物品的特征数据。即根据用户的浏览记录来确定物品的各特征的特征分值,可以提高其准确度。同时,利用该特征数据集合进行其它数据处理时,也有助于提高处理结果的准确度。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的信息处理方法的一个实施例的流程图;
图3是根据本申请的信息处理方法的又一个实施例的流程图;
图4是根据本申请的信息处理装置的一个实施例的结构示意图;
图5是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的信息处理方法或信息处理装置的示例性系统架构100。
如图1所示,系统架构100可以包括终端101、102、103,网络104,服务器105和数据库服务器106。网络104用以在终端101、102、103,服务器105和数据库服务器106之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端101、102、103可以通过网络104与服务器105、数据库服务器106进行交互,以接收或发送消息等。终端101、102、103上可以安装有各种客户端应用,例如购物类应用、网页浏览器应用和即时通讯工具等。
终端101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。
数据库服务器106可以是提供各种服务的服务器,例如数据库服务器106上可以存储有用户浏览预设类物品的信息的浏览记录。其中,浏览记录中可以包括会话信息和已浏览的物品的特征信息。
服务器105也可以是提供各种服务的服务器,例如对终端101、102、103上显示的各种应用提供支持的后台服务器。后台服务器可以对从数据库服务器106获取的浏览记录进行分析等处理,并且可以将处理结果(例如生成的特征数据集合)发送给终端101、102、103。这样,用户可以利用终端101、102、103显示的信息,对其他数据做进一步地分析,从而提高分析结果的准确度。
需要说明的是,本申请实施例所提供的信息处理方法一般由服务器105执行,相应地,信息处理装置一般设置于服务器105中。
需要指出的是,当服务器105具有数据库服务器106的功能时,系统架构100可以不设置数据库服务器106。
应该理解,图1中的终端、网络、服务器和数据库服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端、网络、服务器和数据库服务器。
继续参考图2,其示出了根据本申请的信息处理方法的一个实施例的流程200。该信息处理方法可以包括以下步骤:
步骤201,获取用户浏览预设类物品的信息的浏览记录。
在本实施例中,信息处理方法运行于其上的电子设备(例如图1所示的服务器105)可以通过多种方式来获取用户浏览预设类物品的信息的浏览记录。其中,浏览记录中可以包括会话信息和已浏览的物品的特征信息。
例如,电子设备可以通过有线连接方式或无线连接方式,从数据库服务器(例如图1所示的数据库服务器106)中获取浏览记录。或者电子设备可以从本地获取浏览记录。此外,电子设备在获取到浏览记录后,可以对其中的内容进行筛选,从而得到记载有预设类物品的信息的浏览记录。再例如,数据库服务器在存储浏览记录之前,可以对其内容进行筛选,从而对记载有预设类物品的信息的浏览记录进行存储。
在这里,预设类物品可以是任意类商品。预设类可以是公认的商品类型,也可以是自定义的商品类型。物品的特征信息通常是用来描述物品的属性的信息,该信息中可以包括物品的属性以及对应的属性值。另外,这里的会话是指互联网语言中的会话(session),即一个用户与服务器之间的不中断的请求响应序列。对用户的每个请求,服务器能够识别出请求来自于同一个用户。通常情况下,从打开某一网站,到关闭该网站,可以称为一次会话。
步骤202,对于会话信息所指示的每次会话,根据浏览记录,统计预设类物品的各特征中的各特征值,在该次会话中出现的最大次数。
在本实施例中,对于会话信息所指示的每次会话,电子设备可以根据步骤201中获取的浏览记录,统计预设类物品的各特征中的各特征值,在该次会话中出现的最大次数。其中,特征可以为物品的属性,而特征值即为对应的属性值。
可以理解的是,某一物品通常会包括多个特征,且每个特征具有固定的特征值。而上述浏览记录中,通常会包含多个物品的信息,这些物品均属于同一类。因此,对于同一特征,不同的物品可以会有不同的特征值。作为示例,如下表1和表2所示:
表1
商品编号 品牌 容量 产地 口味
133 品牌1 小于0.5L 产地1 原味
134 品牌1 1-1.5L 产地2 拿铁
135 品牌2 0.5-1L 产地3 原味
136 品牌3 小于0.5L 产地4 摩卡
137 品牌3 0.5-1L 产地4 原味
表2
根据表1所示的浏览记录和表2所示的商品特征表,此时,电子设备可以统计咖啡类商品的各特征中的各特征值,在各会话中出现的最大次数。如对于用户1在会话1中,品牌特征中的各特征值(品牌1、品牌2、品牌3)出现的最大次数分别为3、1、1;容量特征中的小于0.5L、0.5-1L、1-1.5L出现的最大次数分别为3、1、1;产地特征中的产地1、产地2、产地3、产地4出现的最大次数分别为2、1、1、1;口味特征中的原味、拿铁、摩卡出现的最大次数分别为3、1、1。另外,对于用户1在会话2、会话3中以及用户2在会话1中,各特征中的各特征值出现的最大次数的统计方法与上述统计过程相同,此处不再赘述。
步骤203,根据统计的各特征值的最大次数,确定各特征在该次会话中的初始值。
在本实施例中,根据步骤202中统计的各特征值的最大次数,电子设备可以通过多种方法来确定各特征在各会话中的初始值。
在本实施例的一些可选地实现方式中,对于各特征中的每一特征,根据属于该特征的各特征值的最大次数,电子设备可以将最大次数中的最大值作为该特征在该次会话中的候选值。如下公式:
其中,i表示第i个会话;c表示用户c;tj表示物品的第j个特征;k表示第k个特征值;i和j均为正整数;fjk表示第j个特征的第k个特征值在第i个会话中出现的最大次数;表示某类别物品的第j个特征在用户c的第i个会话中的候选值。
接着,根据各特征在该次会话中的候选值,电子设备可以确定各特征在该次会话中的初始值。例如,电子设备可以计算各特征在该次会话中的候选值的总和,并将各特征在该次会话中的候选值与计算的总和的比值,分别作为各特征在该次会话中的初始值。如下公式:
其中,表示某类别物品的第j个特征在用户c的第i个会话中的初始值;表示某类别物品的各个特征在用户c的第i个会话中的候选值的总和。
例如对于上述表1和表2中的数据,在用户1的会话1中,品牌特征的候选值为容量特征的候选值为产地特征的候选值为口味特征的候选值为进而得到品牌、容量、产地、口味四个特征在用户1的会话1中的初始值分别为根据上述方法得到四个特征在用户1的会话2中的初始值分别为 在用户1的会话3中的初始值分别为
再例如,电子设备还可以将各特征在该次会话中的候选值分别作为各特征在该次会话中的初始值。
可选地,对于各特征中的每一特征,根据属于该特征的各特征值的最大次数,电子设备可以将最大次数的平均值作为该特征在该次会话中的初始值。
步骤204,对于各特征中的每一特征,根据该特征在各会话中的初始值以及各会话的预设权值,确定该特征的特征分值。
在本实施例中,对于预设类物品的各特征中的每一特征,根据各会话的预设权值以及步骤203中得到的该特征在各会话中的初始值,电子设备可以确定该特征的特征分值。其中,预设权值与会话的发生时间相关,可以根据实际情况来设置预设权值。
在本实施例的一些可选地实现方式中,电子设备可以通过如下公式来确定预设类物品的各特征的特征分值:
其中,表示某类别物品的第j个特征在用户c的所有会话中的特征分值;表示第i个会话的预设权值;imax表示用户c的会话总数。
例如对于上述表1和表2中的数据,预设类物品(咖啡)的四个特征在用户1的3个会话中的特征分值分别为
可以理解的是,对于同一用户的各个会话,其会话编号通常是根据会话发生时间的先后顺序而排列设置的。会话发生的越早,上述会话的预设权值越小。在确定各特征的特征分值的过程中,考虑了用户的会话信息。而会话信息往往可以描述用户随时间对不同特征的关注的变化。这样可以体现不同特征之间的重要性差异,从而使得到的各特征的特征分值更加准确。
可选地,对于各特征中的每一特征,电子设备还可以根据会话总数,对上述公式计算得到的结果取平均值,从而将平均值作为该特征的特征分值。
步骤205,根据各特征的特征分值,生成特征数据集合。
在本实施例中,根据步骤204中得到的各特征的特征分值,电子设备可以生成特征数据集合。其中,特征数据集合中可以包括预设类物品的特征数据。例如,电子设备可以对步骤204中得到的预设类物品的各特征的特征分值进行存储,从而生成特征数据集合。此时,特征数据集合中可以包含预设类物品的标识、特征以及对应的特征分值。在这里,标识可以用于唯一确定预设类物品。
在本实施例的一些可选地实现方式中,电子设备还可以先对步骤204中得到的各特征的特征分值进行归一化处理;然后可以根据归一化处理后的各特征的特征分值,生成特征数据集合。归一化处理可以采用如下公式:
其中,表示某类别物品的第j个特征在用户c中的特征分值的归一化值。
例如对于上述表1和表2中的数据,预设类物品的四个特征在用户1中的特征分值进行归一化后,分别得到
此外,可选地,步骤201中获取的浏览记录中还可以包括用户信息。此时,对于预设类物品的各特征中的每一特征,首先,电子设备可以根据各用户的浏览记录,分别得到该特征的特征分值;然后,可以根据该特征对应各用户的特征分值,确定该特征的综合特征分值;之后,可以将各特征的综合特征分值存储至上述特征数据集合中。其中,用户信息可以是用于区分用户的信息,如用户信息可以(但不限于)包括以下至少一项:用户账号、手机号、网络地址等。
作为示例,对于预设类物品的各特征中的每一特征,电子设备可以将该特征在各个用户中的特征分值进行求和,或者可以对该特征在各个用户中的特征分值取平均值,从而作为该特征的综合特征分值。
进一步地,电子设备还可以对该特征对应各用户的特征分值进行归一化处理,并将归一化处理后的各特征分值的总和作为该特征的综合特征分值。如下公式:
其中,w(tj)表示某类别物品的第j个特征在所有用户中的综合特征值。
例如对于上述表1和表2中的数据,预设类物品的四个特征在用户2中的特征分值进行归一化后,可以分别得到 此时,预设类物品的四个特征在所有用户(用户1和用户2)中的综合特征分值分别为w(t1)=0.4、w(t2)=0.559、w(t3)=0.339、w(t4)=0.702。
可选地,在将各特征的综合特征分值存储至特征数据集合之前,电子设备还可以对各特征的综合特征分值进行归一化处理,并将归一化处理后的各特征的综合特征分值存储至上述特征数据集合中。此时,特征数据集合中可以包括预设类物品的标识、特征以及对应的综合特征分值。这里的归一化处理可以采用如下公式:
其中,表示某类别物品的第j个特征的综合特征分值的归一化值。
例如对于上述表1和表2中的数据,预设类物品的四个特征的综合特征分值进行归一化后,可以分别得到
此外,在一些应用场景中,本申请实施例中的信息处理方法还可以包括利用上述生成的特征数据集合确定同类物品间相似度的方法,具体可以参见图3所示实施例中的相关描述,此处不再赘述。
本实施例提供的信息处理方法,通过获取用户浏览预设类物品的信息的浏览记录,其中,浏览记录包括会话信息和已浏览的物品的特征信息,可以统计预设类物品的各特征中的各特征值,在各次会话中出现的最大次数;接着,根据统计的各特征值的最大次数,可以确定各特征在各次会话中的初始值;之后,再根据各特征在各会话中的初始值以及各会话的预设权值,可以确定各特征的特征分值,从而生成特征数据集合。其中,特征数据集合中包括预设类物品的特征数据。即根据用户的浏览记录来确定物品的各特征的特征分值,可以提高其准确度。同时,利用该特征数据集合进行其它数据处理时,也有助于提高处理结果的准确度。
进一步参见图3,其示出了本申请提供的信息处理方法的又一个实施例的流程300。该流程300除了可以包括流程200中的步骤外,还可以包括以下步骤:
步骤301,接收用户发送的浏览请求。
在本实施例,信息处理方法运行于其上的电子设备(例如图1所示的服务器105)可以通过有线连接方式或无线连接方式,从用户所使用的终端(例如图1所示的终端101、102、103)来接收用户发送的浏览请求。其中,浏览请求中可以包括待浏览物品的信息。在这里,待浏览物品的信息可以是用于描述待浏览物品的信息,如待浏览物品的名称、型号、功能用途等。
步骤302,获取用于描述待浏览物品的特征信息的网页。
在本实施例中,根据步骤301中所接收的浏览请求,电子设备可以获取用于描述待浏览物品的特征信息的网页。其中,网页的格式在本申请中并不限制,只要能被电子设备识别读取即可。例如该网页可以是某购物网站上用于销售该待浏览物品的网页,网页中有该待浏览物品的属性的详细介绍。
步骤303,根据特征数据集合,计算与待浏览物品属于同类的各物品与待浏览物品之间的相似度。
在本实施例中,电子设备可以根据上述实施例中生成的特征数据集合,通过多种方法来计算与待浏览物品属于同类的各物品与待浏览物品之间的相似度。
在本实施例的一些可选地实现方式中,对于待浏览物品所属类别的物品的各特征中的每一特征,根据待浏览物品的该特征的特征值、同类各物品的该特征的特征值以及特征数据集合中该特征的特征数据,计算待浏览物品的该特征与同类各物品的该特征的相似度;根据待浏览物品的各特征与同类各物品的各特征的相似度,计算待浏览物品与同类各物品之间的相似度。如下公式:
其中,sim(p,q)表示属于同类的商品p与商品q的相似度;vj(p)表示商品p的第j个特征的特征值;vj(q)表示商品q的第j个特征的特征值;{vj(p),vj(q)}可以定义如下:
例如对于上述表1和表2中的数据,电子设备可以计算商品编号133、134所对应的两种咖啡的相似度为:
sim(133,134)=0.2·1+0.28·0+0.17·0+0.35·0=0.2。
可选地,电子设备还可以计算vj(p)与vj(q)之间的相似度,从而代替上式中的{vj(p),vj(q)},从而有助于提高计算结果的准确度。
进一步地,特征数据集合中还可以包括用户信息。此时的特征数据集合中,存储有对应不同的用户的预设类物品的特征数据。也就是说,对于不同的用户,同一预存类物品的特征数据可能是不同的。同时,步骤301中的浏览请求中还可以包括用户信息。这样,对于同类的两种物品,电子设备可以根据用户的不同,从而计算得到两种物品之间不同的相似度。因此,计算结果可以更加符合不同用户间的差异。
步骤304,根据计算结果,生成推送信息,并将推送信息反馈给发送浏览请求的用户。
在本实施例中,电子设备可以根据步骤303中相似度的计算结果,生成推送信息。并可以将推送信息反馈给发送浏览请求的用户。其中,推送信息中至少可以包括待浏览物品的特征信息,如可以包括步骤302中获取的网页。
在本实施例的一些可选地实现方式中,电子设备可以从计算结果中选取与待浏览物品的相似度最大的物品,进而获取该物品的相关信息。其中,相关信息可以包括但不限于以下至少一项:物品的特征信息、图片、视频或链接地址等。然后,电子设备可以根据该物品的相关信息和待浏览物品的特征信息(或步骤302中获取的网页),生成推送信息。
可选地,电子设备还可以根据计算结果,按照相似度由大到小的顺序,从相似度大的一端选取预设数目个(如至少两个)物品,从而获取这预设数目个物品的相关信息。然后,电子设备可以生成推荐信息。在这里,选取方式可以是随机选取,也可以是按预设要求(如依次或间隔选取)进行选取。
本实施例提供的信息处理方法,与图2对应的实施例相比,除了可以生成特征数据集合外,还可以利用特征数据集合进行同类物品间的相似度计算,从而可以提高相似度计算结果的准确度。同时,根据相似度计算结果,可以生成推荐信息,以反馈给用户。这样有助于丰富推荐信息的内容,并可以提高内容的关联度,从而提升用户体验。
进一步参见图4,作为对上述各图所示方法的实现,本申请提供了一种信息处理装置的一个实施例。该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例的信息处理装置400可以包括:第一获取单元401,配置用于获取用户浏览预设类物品的信息的浏览记录,其中,浏览记录包括物品的特征和会话信息;第一确定单元402,配置用于对于会话信息所指示的每次会话,根据浏览记录,统计预设类物品的各特征中的各特征值,在该次会话中出现的最大次数,根据统计的各特征值的最大次数,确定各特征在该次会话中的初始值;第二确定单元403,配置用于对于各特征中的每一特征,根据该特征在各会话中的初始值以及各会话的预设权值,确定该特征的特征分值,其中,预设权值与会话的发生时间相关;生成单元404,配置用于根据各特征的特征分值,生成特征数据集合,其中,特征数据集合包括预设类物品的特征数据。
在本实施例中,第一获取单元401、第一确定单元402、第二确定单元403和生成单元404的具体实现方式及产生的有益效果,可以分别参见图2所示实施例中的步骤201、步骤202-步骤203、步骤204和步骤205的相关描述,此处不再赘述。
在本实施例的一些可选的实现方式中,第一确定单元402可以包括:作为子单元(图中未示出),配置用于对于各特征中的每一特征,根据属于该特征的各特征值的最大次数,将最大次数中的最大值作为该特征在该次会话中的候选值;确定子单元(图中未示出),配置用于根据各特征在该次会话中的候选值,确定各特征在该次会话中的初始值。
进一步地,确定子单元可以进一步配置用于:计算各特征在该次会话中的候选值的总和,并将各特征在该次会话中的候选值与计算的总和的比值,分别作为各特征在该次会话中的初始值。
可选地,浏览记录还可以包括用户信息;以及该装置400还可以包括:第三确定单元(图中未示出),配置用于对于预设类物品的各特征中的每一特征,根据各用户的浏览记录,分别得到该特征的特征分值,根据该特征对应各用户的特征分值,确定该特征的综合特征分值;存储单元(图中未示出),配置用于将各特征的综合特征分值存储至特征数据集合中。
进一步地,第三确定单元可以进一步配置用于:对该特征对应各用户的特征分值进行归一化处理,并将归一化处理后的各特征分值的总和作为该特征的综合特征分值。
进一步地,存储单元可以进一步配置用于:对各特征的综合特征分值进行归一化处理,并将归一化处理后的各特征的综合特征分值存储至特征数据集合中。
在一些实施例中,该装置400还可以包括:接收单元(图中未示出),配置用于接收用户发送的浏览请求,其中,浏览请求包括待浏览物品的信息;第二获取单元(图中未示出),配置用于获取用于描述待浏览物品的特征信息的网页;计算单元(图中未示出),配置用于根据特征数据集合,计算与待浏览物品属于同类的各物品与待浏览物品之间的相似度;反馈单元(图中未示出),配置用于根据计算结果,生成推送信息,并将推送信息反馈给发送浏览请求的用户。
可选地,计算单元可以包括:第一计算子单元(图中未示出),配置用于对于各特征中的每一特征,根据待浏览物品的该特征的特征值、同类各物品的该特征的特征值以及特征数据集合中该特征的特征数据,计算待浏览物品的该特征与同类各物品的该特征的相似度;第二计算子单元(图中未示出),配置用于根据待浏览物品的各特征与同类各物品的各特征的相似度,计算待浏览物品与同类各物品之间的相似度。
下面参考图5,其示出了适于用来实现本申请实施例的电子设备的计算机系统500的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括触摸屏、键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一获取单元、第一确定单元、第二确定单元和生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取用户浏览预设类物品的信息的浏览记录的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取用户浏览预设类物品的信息的浏览记录,其中,浏览记录包括会话信息和已浏览的物品的特征信息;对于会话信息所指示的每次会话,根据浏览记录,统计预设类物品的各特征中的各特征值,在该次会话中出现的最大次数,根据统计的各特征值的最大次数,确定各特征在该次会话中的初始值;对于各特征中的每一特征,根据该特征在各会话中的初始值以及各会话的预设权值,确定该特征的特征分值,其中,预设权值与会话的发生时间相关;根据各特征的特征分值,生成特征数据集合,其中,特征数据集合中包括预设类物品的特征数据。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (13)

1.一种信息处理方法,包括:
获取用户浏览预设类物品的信息的浏览记录,其中,所述浏览记录包括会话信息和已浏览的物品的特征信息;
对于会话信息所指示的每次会话,根据所述浏览记录,统计所述预设类物品的各特征中的各特征值,在该次会话中出现的最大次数,根据统计的各特征值的最大次数,确定各特征在该次会话中的初始值;
对于各特征中的每一特征,根据该特征在各会话中的初始值以及各会话的预设权值,确定该特征的特征分值,其中,所述预设权值与会话的发生时间相关;
根据各特征的特征分值,生成特征数据集合,其中,所述特征数据集合中包括所述预设类物品的特征数据。
2.根据权利要求1所述的方法,其中,所述根据统计的各特征值的最大次数,确定各特征在该次会话中的初始值,包括:
对于各特征中的每一特征,根据属于该特征的各特征值的最大次数,将最大次数中的最大值作为该特征在该次会话中的候选值;
根据各特征在该次会话中的候选值,确定各特征在该次会话中的初始值。
3.根据权利要求2所述的方法,其中,所述根据各特征在该次会话中的候选值,确定各特征在该次会话中的初始值,包括:
计算各特征在该次会话中的候选值的总和,并将各特征在该次会话中的候选值与计算的总和的比值,分别作为各特征在该次会话中的初始值。
4.根据权利要求1所述的方法,其中,所述浏览记录还包括用户信息;以及
所述方法还包括:
对于所述预设类物品的各特征中的每一特征,根据各用户的浏览记录,分别得到该特征的特征分值,根据该特征对应各用户的特征分值,确定该特征的综合特征分值;
将各特征的综合特征分值存储至所述特征数据集合中。
5.根据权利要求4所述的方法,其中,所述根据该特征对应各用户的特征分值,确定该特征的综合特征分值,包括:
对该特征对应各用户的特征分值进行归一化处理,并将归一化处理后的各特征分值的总和作为该特征的综合特征分值。
6.根据权利要求4所述的方法,其中,所述将各特征的综合特征分值存储至所述特征数据集合中,包括:
对各特征的综合特征分值进行归一化处理,并将归一化处理后的各特征的综合特征分值存储至所述特征数据集合中。
7.根据权利要求1-6之一所述的方法,其中,所述方法还包括:
接收用户发送的浏览请求,其中,所述浏览请求包括待浏览物品的信息;
获取用于描述所述待浏览物品的特征信息的网页;
根据所述特征数据集合,计算与所述待浏览物品属于同类的各物品与所述待浏览物品之间的相似度;
根据计算结果,生成推送信息,并将所述推送信息反馈给发送所述浏览请求的用户。
8.根据权利要求7所述的方法,其中,所述根据所述特征数据集合,计算与所述待浏览物品属于同类的各物品与所述待浏览物品之间的相似度,包括:
对于各特征中的每一特征,根据所述待浏览物品的该特征的特征值、同类各物品的该特征的特征值以及所述特征数据集合中该特征的特征数据,计算所述待浏览物品的该特征与同类各物品的该特征的相似度;
根据所述待浏览物品的各特征与同类各物品的各特征的相似度,计算所述待浏览物品与同类各物品之间的相似度。
9.一种信息处理装置,包括:
第一获取单元,配置用于获取用户浏览预设类物品的信息的浏览记录,其中,所述浏览记录包括物品的特征和会话信息;
第一确定单元,配置用于对于会话信息所指示的每次会话,根据所述浏览记录,统计所述预设类物品的各特征中的各特征值,在该次会话中出现的最大次数,根据统计的各特征值的最大次数,确定各特征在该次会话中的初始值;
第二确定单元,配置用于对于各特征中的每一特征,根据该特征在各会话中的初始值以及各会话的预设权值,确定该特征的特征分值,其中,所述预设权值与会话的发生时间相关;
生成单元,配置用于根据各特征的特征分值,生成特征数据集合,其中,所述特征数据集合包括所述预设类物品的特征数据。
10.根据权利要求9所述的装置,其中,所述浏览记录还包括用户信息;以及
所述装置还包括:
第三确定单元,配置用于对于所述预设类物品的各特征中的每一特征,根据各用户的浏览记录,分别得到该特征的特征分值,根据该特征对应各用户的特征分值,确定该特征的综合特征分值;
存储单元,配置用于将各特征的综合特征分值存储至所述特征数据集合中。
11.根据权利要求9或10所述的装置,其中,所述装置还包括:
接收单元,配置用于接收用户发送的浏览请求,其中,所述浏览请求包括待浏览物品的信息;
第二获取单元,配置用于获取用于描述所述待浏览物品的特征信息的网页;
计算单元,配置用于根据所述特征数据集合,计算与所述待浏览物品属于同类的各物品与所述待浏览物品之间的相似度;
反馈单元,配置用于根据计算结果,生成推送信息,并将所述推送信息反馈给发送所述浏览请求的用户。
12.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-8中任一所述的方法。
CN201711298201.4A 2017-12-08 2017-12-08 信息处理方法和装置 Active CN109903067B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711298201.4A CN109903067B (zh) 2017-12-08 2017-12-08 信息处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711298201.4A CN109903067B (zh) 2017-12-08 2017-12-08 信息处理方法和装置

Publications (2)

Publication Number Publication Date
CN109903067A true CN109903067A (zh) 2019-06-18
CN109903067B CN109903067B (zh) 2021-07-16

Family

ID=66940752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711298201.4A Active CN109903067B (zh) 2017-12-08 2017-12-08 信息处理方法和装置

Country Status (1)

Country Link
CN (1) CN109903067B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208896A (ja) * 2004-01-22 2005-08-04 Nippon Telegr & Teleph Corp <Ntt> 利用者特徴抽出方法と情報レコメンド方法及びこれらのシステム
EP1860579A1 (en) * 2002-08-30 2007-11-28 Sony Deutschland Gmbh Method to split a multiuser profile
CN102999634A (zh) * 2012-12-18 2013-03-27 百度在线网络技术(北京)有限公司 基于浏览器数据的用户导航推荐方法、系统及云端服务器
CN103617540A (zh) * 2013-10-17 2014-03-05 浙江大学 一种追踪用户兴趣变化的电子商务推荐方法
CN105337987A (zh) * 2015-11-20 2016-02-17 同济大学 一种网络用户身份认证方法及系统
CN106651530A (zh) * 2016-12-29 2017-05-10 江西博瑞彤芸科技有限公司 网络购物平台的页面展示方法
CN107360222A (zh) * 2017-06-30 2017-11-17 广东欧珀移动通信有限公司 商品信息推送方法、装置、存储介质以及服务器

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1860579A1 (en) * 2002-08-30 2007-11-28 Sony Deutschland Gmbh Method to split a multiuser profile
JP2005208896A (ja) * 2004-01-22 2005-08-04 Nippon Telegr & Teleph Corp <Ntt> 利用者特徴抽出方法と情報レコメンド方法及びこれらのシステム
CN102999634A (zh) * 2012-12-18 2013-03-27 百度在线网络技术(北京)有限公司 基于浏览器数据的用户导航推荐方法、系统及云端服务器
CN103617540A (zh) * 2013-10-17 2014-03-05 浙江大学 一种追踪用户兴趣变化的电子商务推荐方法
CN105337987A (zh) * 2015-11-20 2016-02-17 同济大学 一种网络用户身份认证方法及系统
CN106651530A (zh) * 2016-12-29 2017-05-10 江西博瑞彤芸科技有限公司 网络购物平台的页面展示方法
CN107360222A (zh) * 2017-06-30 2017-11-17 广东欧珀移动通信有限公司 商品信息推送方法、装置、存储介质以及服务器

Also Published As

Publication number Publication date
CN109903067B (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
WO2018192491A1 (zh) 信息推送方法和装置
CN108664513B (zh) 用于推送关键词的方法、装置以及设备
CN103377287B (zh) 一种投放物品信息的方法和装置
CN106911697B (zh) 访问权限设置方法、装置、服务器及存储介质
CN107172151A (zh) 用于推送信息的方法和装置
CN111079022A (zh) 基于联邦学习的个性化推荐方法、装置、设备及介质
CN109242612B (zh) 一种产品推荐的方法及设备
CN107633021A (zh) 一种图文信息的投放、生成方法及装置
CN107908666A (zh) 一种识别设备标识的方法和装置
CN106354856B (zh) 基于人工智能的深度神经网络强化搜索方法和装置
CN110363604A (zh) 页面生成方法和装置
CN110298716A (zh) 信息推送方法和装置
CN107944956A (zh) 用于生成信息的方法和装置
CN107426328A (zh) 信息推送方法和装置
JP6976207B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN105721629A (zh) 用户标识匹配方法和装置
US20130212105A1 (en) Information processing apparatus, information processing method, and program
CN108776692A (zh) 用于处理信息的方法和装置
CN109727047A (zh) 一种确定数据关联度的方法和装置、数据推荐方法和装置
CN108595448A (zh) 信息推送方法和装置
CN107305677A (zh) 产品信息推送方法和装置
CN108540508A (zh) 用于推送信息的方法、装置和设备
CN112182370A (zh) 物品类目信息推送方法、装置、电子设备和介质
CN111144949A (zh) 奖励数据发放方法、装置、计算机设备及存储介质
US20200034917A1 (en) Communication via simulated user

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant