CN111290713B - 一种数据存储方法、装置、电子设备及存储介质 - Google Patents

一种数据存储方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111290713B
CN111290713B CN202010074361.6A CN202010074361A CN111290713B CN 111290713 B CN111290713 B CN 111290713B CN 202010074361 A CN202010074361 A CN 202010074361A CN 111290713 B CN111290713 B CN 111290713B
Authority
CN
China
Prior art keywords
user
user identifier
characteristic information
access
access characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010074361.6A
Other languages
English (en)
Other versions
CN111290713A (zh
Inventor
林东
谢恺龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Enyike Beijing Data Technology Co ltd
Original Assignee
Enyike Beijing Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enyike Beijing Data Technology Co ltd filed Critical Enyike Beijing Data Technology Co ltd
Priority to CN202010074361.6A priority Critical patent/CN111290713B/zh
Publication of CN111290713A publication Critical patent/CN111290713A/zh
Application granted granted Critical
Publication of CN111290713B publication Critical patent/CN111290713B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种数据存储方法、装置、电子设备及存储介质,其中,该数据存储方法包括:获取不同的目标对象对应的多个历史访问数据;其中,每个历史访问数据包括:第一用户标识、请求参数和访问特征信息;根据每个第一用户标识对应的请求参数,从多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识;根据对应于同一用户的第一用户标识,生成该用户对应的第二用户标识;针对每个第二用户标识,根据该第二用户标识下的每个第一用户标识对应的访问特征信息,生成该第二用户标识对应的融合访问特征信息;将第二用户标识以及第二用户标识对应的融合访问特征信息进行存储。本申请可以减少存储空间的使用,提高存储空间利用率。

Description

一种数据存储方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种数据存储方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的快速发展,用户可以基于互联网登录不同的网站和应用程序,进而访问不同的对象。用户在访问不同的对象时,会生成多种类型的访问数据,访问数据中携带有用户的访问特征信息,比如,用户的浏览记录和浏览时长。
现阶段,访问数据的存储方式为:对用户的访问数据实时监控,将监控到的访问数据存储在指定存储空间。但是,同一用户生成的多条访问数据中存在相同的访问特征信息,将相同的信息进行重复存储,占用了较大的存储空间,会造成存储空间的浪费。
发明内容
有鉴于此,本申请实施例的目的在于提供一种数据存储方法、装置、电子设备及存储介质,将同一用户的访问特征信息进行融合,并将融合后的访问特征信息进行存储,减少数据存储空间的使用,提高存储空间的利用率。
第一方面,本申请实施例提供了一种数据存储方法,所述方法包括:
获取不同的目标对象对应的多个历史访问数据;其中,每个所述历史访问数据包括:第一用户标识、请求参数和访问特征信息;
根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识;
根据所述对应于同一用户的第一用户标识,生成该用户对应的第二用户标识;
针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息;
将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储。
在一种可能的实施方式中,所述根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识,包括:
根据每个所述第一用户标识对应的请求参数,选取对应于相同请求参数的所述第一用户标识,将所述对应于相同请求参数的所述第一用户标识确定为所述对应于同一用户的第一用户标识;或,
根据每个所述第一用户标识对应的请求参数,计算每个所述第一用户标识对应的特征值,根据所述特征值选取所述对应于同一用户的第一用户标识;或,
根据每个所述第一用户标识对应的请求参数,计算多个所述第一用户标识之间的相似度,根据所述相似度选取所述对应于同一用户的第一用户标识。
在一种可能的实施方式中,所述根据所述对应于同一用户的第一用户标识,生成该用户对应的第二用户标识,包括:
将所述对应于同一用户的第一用户标识进行加密处理,生成该用户对应的所述第二用户标识。
在一种可能的实施方式中,所述访问特征信息对应有访问时间,所述针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息,包括:
将所述第二用户标识下的每个所述第一用户标识对应的访问特征信息中所述访问时间最大的所述访问特征信息,确定为所述第二用户标识对应的融合访问特征信息。
在一种可能的实施方式中,所述针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息,包括:
针对每个所述第二用户标识,查找该第二用户标识下的每类访问特征信息对应的融合方式,采用该融合方式对该第二用户标识下的每个所述第一用户标识对应的该类访问特征信息进行融合处理,得到该第二用户标识对应的融合访问特征信息。
在一种可能的实施方式中,在所述将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储之后,还包括:
若接收到终端设备发送的携带有第一用户标识的访问特征信息请求,查找该第一用户标识对应的第二用户标识,并将所述第二用户标识对应的所述融合访问特征信息发送给所述终端设备。
在一种可能的实施方式中,在所述将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储之后,还包括:
根据所述第二用户标识对应的融合访问特征信息,确定所述第二用户标识对应的待推荐信息,并将所述待推荐信息发送给所述第二用户标识对应的用户。
第二方面,本申请实施例提供了一种数据存储装置,所述装置包括:
获取模块,用于获取不同的目标对象对应的多个历史访问数据;其中,每个所述历史访问数据包括:第一用户标识、请求参数和访问特征信息;
选取模块,用于根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识;
第一生成模块,用于根据所述对应于同一用户的第一用户标识,生成该用户对应的第二用户标识;
第二生成模块,用于针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息;
存储模块,用于将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行第一方面任一项所述的数据存储方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行第一方面任一项所述的数据存储方法的步骤。
本申请实施例提供的数据存储方法、装置、电子设备及存储介质,根据请求参数确定对应于同一用户的第一用户标识,并根据对应于同一用户的第一用户标识,生成该用户对应的第二用户标识,将第二用户标识下的每个第一用户标识对应的访问特征信息进行融合,生成第二用户标识对应的融合访问特征信息,将第二用户标识和该第二用户标识对应的融合访问特征信息进行存储,与现有技术中不对访问特征信息进行融合处理,将监控到的所有访问特征信息直接进行存储相比,能够减少存储空间的使用,提高存储空间的利用率。
进一步,本申请实施例提供的数据存储方法、装置、电子设备及存储介质,还可以基于第一用户标识和第二用户标识的映射关系,在接收到携带有第一用户标识的访问特征信息请求后,查找第一用户标识对应的第二用户标识,并将第二用户标识对应的融合访问特征信息发送给终端设备,提高查询融合访问特征信息的速度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种数据存储方法的流程图;
图2示出了本申请实施例提供的数据存储方法中,发送待推荐信息的方法的流程图;
图3示出了本申请实施例提供的一种数据存储装置的结构示意图;
图4示出了本申请实施例提供的一种电子设备的示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
现阶段,实时监控用户针对不同目标对象的访问数据,并将监控到的访问数据按照时间顺序存储在指定的存储空间内,但是,同一用户的多个访问数据中存在相同的信息,将相同的信息进行多次存储,占用了较大的存储空间,会造成存储空间的浪费。
基于上述问题,本申请实施例提供了一种数据存储方法、装置、电子设备及存储介质,根据请求参数确定对应于同一用户的第一用户标识,并根据对应于同一用户的第一用户标识,生成该用户对应的第二用户标识,将第二用户标识下的每个第一用户标识对应的访问特征信息进行融合,生成第二用户标识对应的融合访问特征信息,将第二用户标识和该第二用户标识对应的融合访问特征信息进行存储,减少存储空间的使用,提高存储空间的利用率,并且,每个第二用户标识对应唯一的用户,基于第二用户标识从存储空间中查找融合访问特征信息,可以提高信息的查找效率。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本申请针对上述问题所提出的解决方案,都应该是发明人在本申请过程中对本申请做出的贡献。
下面将结合本申请中附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种数据存储方法进行详细介绍。
参见图1所示,图1为本申请实施例提供的数据存储方法的流程图,该数据存储方法包括以下步骤:
S101、获取不同的目标对象对应的多个历史访问数据;其中,每个所述历史访问数据包括:第一用户标识、请求参数和访问特征信息。
本申请实施例中,用户访问目标对象会生成访问数据,多个用户访问同一目标对象会生成多个访问数据,同一用户访问不同的目标对象会生成不同的访问数据。访问数据包括第一用户标识、请求参数和访问特征信息,其中,请求参数至少包括IP地址、cookie、时间戳,访问特征信息至少包括:性别、兴趣爱好、特定项目曝光的次数。
在一种可能的实施方式中,每个目标对象对应一个数据源,该数据源中包括该目标对象对应的多个历史访问数据,不同的目标对象对应不同的数据源,从多个数据源中获取历史访问数据。在获取历史访问数据时,可以一次性获取足够多的历史访问数据,也可以周期性地从数据源中获取历史访问数据,并对已获取的历史访问数据进行相关处理。
S102、根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识。
本申请实施例中,同一用户可以对应多个第一用户标识,不同的第一用户标识对应的请求参数会存在一定的差异性,对应于同一用户的第一用户标识对应的请求参数会存在关联性,在服务器中预存请求参数的这种关联关系,以使服务器在多个历史访问数据的请求参数中查找存在关联关系的请求参数,并将这些存在关联关系的请求参数对应的第一用户标识,确定为对应于同一用户的第一用户标识。
S103、根据所述对应于同一用户的第一用户标识,生成该用户对应的第二用户标识。
本申请实施例中,同一用户可以对应多个互不相同的第一用户标识,在生成融合访问特征信息之后,每个用户的融合访问特征信息对应多个第一用户标识,为了更加方便快捷地从存储空间中查找对应于同一用户的融合访问特征信息,这里,为每个用户分配一个唯一的第二用户标识,并且,每个用户的第二用户标识与该用户的多个第一用户标识存在对应关系,根据每个用户的任一第一用户标识,可以查找该用户的第二用户标识,进而查找该用户对应的融合访问特征信息。
S104、针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息。
本申请实施例中,将对应于同一用户的多个第一用户标识分别对应的多个访问特征信息进行融合,生成该用户对应的融合访问特征信息,即该用户的第二用户标识对应的融合访问特征信息。
具体的,在对访问特征信息进行融合时,可以通过预设的判断机制从多个访问特征信息中筛选出融合访问特征信息;可以将同一维度的访问特征信息进行汇总,得到融合访问特征信息;可以将重复出现的访问特征信息删除,将保留下的唯一的访问特征信息确定为融合访问特征信息,以减小存储空间的使用,提高存储空间的利用率。
S105、将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储。
本申请实施例中,将第二用户标识以及该第二用户标识对应的融合访问特征信息存储在指定存储空间中。
这里,还可以将第二用户标识与第一用户标识的映射关系进行存储,以基于第一用户标识查找第二用户标识,进而查找第二用户标识对应的融合访问特征信息。
本申请实施例提供的数据存储方法,根据请求参数确定对应于同一用户的第一用户标识,并根据对应于同一用户的第一用户标识,生成该用户对应的第二用户标识,将第二用户标识下的每个第一用户标识对应的访问特征信息进行融合,生成第二用户标识对应的融合访问特征信息,将第二用户标识和该第二用户标识对应的融合访问特征信息进行存储,减少存储空间的使用,提高存储空间的利用率,并且,每个第二用户标识对应唯一的用户,基于第二用户标识从存储空间中查找融合访问特征信息,可以提高信息的查找效率。
进一步的,本申请实施例提供的数据存储方法中,所述根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识,包括:
根据每个所述第一用户标识对应的请求参数,选取对应于相同请求参数的所述第一用户标识,将所述对应于相同请求参数的所述第一用户标识确定为所述对应于同一用户的第一用户标识。
本申请实施例中,每个历史访问数据中包括多个请求参数,指定目标请求参数,如果多个历史访问数据中包括的目标请求参数相同,那么该多个历史访问数据中包括的第一用户标识对应于同一用户。
在一种可能的实施方式中,来自不同数据源的历史访问数据对应的请求参数种类不同,比如,来自数据源一的历史访问数据A包括请求参数1、请求参数2、请求参数3,来自数据源二的历史访问数据B包括请求参数1、请求参数4,将请求参数3确定为来自数据源一的历史访问数据的目标请求参数,将请求参数4确定为来自数据源二的历史访问数据的目标请求参数,如果历史访问数据A的请求参数3与历史访问数据B的请求参数4相同,则历史访问数据A中包括的第一用户标识与历史访问数据B中包括的第一用户标识对应于同一用户。
进一步的,本申请实施例提供的数据存储方法中,所述根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识,包括:
根据每个所述第一用户标识对应的请求参数,计算每个所述第一用户标识对应的特征值,根据所述特征值选取所述对应于同一用户的第一用户标识。
本申请实施例中,每个历史访问数据中包括多个请求参数,请求参数包括字符型请求参数和数值型请求参数,将指定的若干个字符型请求参数的字符串进行拼接,将拼接后的字符串进行哈希处理,得到一段数字,将该段数字与指定的数值型请求参数的和值,确定为该历史访问数据中的第一用户标识对应的特征值。
在一种可能的实施方式中,预设有多个数值范围,比如,预设有第一数值范围、第二数值范围、第三数值范围,如果第一用户标识1对应的特征值在第一数值范围内,并且第一用户标识2对应的特征值在第一数值范围内,则第一用户标识1和第一用户标识2对应于同一用户。
在另一种可能的实施方式中,计算每两个第一用户标识对应的特征值的差值,如果计算得到的差值小于预设阈值,则确定该两个第一用户标识对应于同一用户。这里,计算已知对应于同一用户的多个第一用户标识中两两第一用户标识的特征值的差值,根据计算得到的差值确定上述预设阈值,比如,将多个差值的平均值确定为上述预设阈值。
进一步的,本申请实施例提供的数据存储方法中,所述根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识,包括:
根据每个所述第一用户标识对应的请求参数,计算多个所述第一用户标识之间的相似度,根据所述相似度选取所述对应于同一用户的第一用户标识。
本申请实施例中,每个历史访问数据中包括多个请求参数,根据每个第一用户标识对应的请求参数,计算多个第一用户标识中每两个第一用户标识之间的相似度,如果计算得到的相似度大于预设阈值,则该两个第一用户标识对应于同一用户。
在一种可能的实施方式中,将每个第一用户标识对应的请求参数输入到预先训练好的聚类模型中,得到多簇第一用户标识,每一簇内的第一用户标识对应于同一用户。
进一步的,本申请实施例提供的数据存储方法中,所述根据所述对应于同一用户的第一用户标识,生成该用户对应的第二用户标识,包括:
将所述对应于同一用户的第一用户标识进行加密处理,生成该用户对应的所述第二用户标识。
本申请实施例中,将对应于同一用户的第一用户标识进行拼接,对拼接后的结果进行加密处理,生成该用户对应的所述第二用户标识。
比如,nameabc(第一用户标识)、namexyz(第一用户标识)对应于同一用户,将nameabc和namexyz进行拼接,得到nameabcnamexyz,对nameabcnamexyz进行加密处理,得到该用户对应的所述第二用户标识。
进一步的,本申请实施例提供的数据存储方法中,所述访问特征信息对应有访问时间,所述针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息,包括:
将所述第二用户标识下的每个所述第一用户标识对应的访问特征信息中所述访问时间最大的所述访问特征信息,确定为所述第二用户标识对应的融合访问特征信息。
本申请实施例中,从数据源获取的历史访问数据中包括多个特征维度的访问特征信息,不同的数据源可以对应不同的特征维度,也可以对应相同的特征维度,比如,从数据源一获取的历史访问数据中包括特征维度1、特征维度2和特征维度3的访问特征信息,从数据源二获取的历史访问数据中包括特征维度1、特征维度4和特征维度5的访问特征信息,从数据源三获取的历史访问数据中包括特征维度1、特征维度2和特征维度3的访问特征信息。
其中,如果特定特征维度的访问特征信息是布尔型访问特征信息,或者互斥的字符型访问特征信息,根据第二用户标识下的每个第一用户标识在特定特征维度的访问特征信息对应的访问时间,确定该第二用户标识对应的融合访问特征信息,在一种可能的实施方式中,将最大的访问时间对应的访问特征信息确定为该第二用户标识对应的融合访问特征信息,即将最新的访问特征信息确定为融合访问特征信息。
这里,布尔型访问特征信息是指访问特征信息只有两个值,分别为文字true和false,布尔型访问特征信息是一个真值,表示一个状态的真或假;互斥的字符型访问特征信息,举例来讲,性别特征维度的访问特征信息只能是“男”和“女”,并且同一个用户在性别特征维度的访问特征信息只能是“男”或“女”,不能同时对应“男”和“女”。
进一步的,本申请实施例提供的数据存储方法中,所述针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息,包括:
针对每个所述第二用户标识,查找该第二用户标识下的每类访问特征信息对应的融合方式,采用该融合方式对该第二用户标识下的每个所述第一用户标识对应的该类访问特征信息进行融合处理,得到该第二用户标识对应的融合访问特征信息。
本申请实施例中,第一用户标识对应多个特征维度的访问特征信息,不同特征维度的访问特征信息可以对应不同的融合方式,查找与每个特征维度的访问特征信息相匹配的融合方式,采用该融合方式对第二用户标识下的每个第一用户标识对应的该特征维度的访问特征信息进行融合处理,生成第二用户标识对应的融合访问特征信息。
如果特定特征维度的访问特征信息是数组型、标记型、日期型、字符型等可以合并的访问特征信息,将第二用户标识下的每个第一用户标识对应的访问特征信息进行合并处理,得到第二用户标识对应的融合访问特征信息;如果特定特征维度的访问特征信息是数值型等可以进行加和处理的访问特征信息,将第二用户标识下的每个第一用户标识对应的访问特征信息进行求和处理,得到第二用户标识对应的融合访问特征信息。
比如,第二用户标识下的第一用户标识包括第一用户标识1、第一用户标识2,第一用户标识1和第一用户标识2在兴趣爱好特征维度的访问特征信息分别为:“音乐、体育、影视剧”、“旅行、摄影”,从本地查找兴趣爱好特征维度的访问特征信息对应的融合方式为合并,则第二用户标识对应的融合访问特征信息为“音乐、体育、影视剧、旅行、摄影”。
比如,第二用户标识下的第一用户标识包括第一用户标识1、第一用户标识2,第一用户标识1和第一用户标识2在X项目曝光频次特征维度的访问特征信息分别为:“30”、“40”,从本地查找X项目曝光频次特征维度的访问特征信息对应的融合方式为加和,则第二用户标识对应的融合访问特征信息为“70”。
比如,第二用户标识下的第一用户标识包括第一用户标识1、第一用户标识2,第一用户标识1和第一用户标识2在购买书籍数目特征维度的访问特征信息分别为:“历史:10、哲学:5”、“历史:2、小说:3”,从本地查找购买书籍数目特征维度的访问特征信息对应的融合方式为合并与加和,则第二用户标识对应的融合访问特征信息为“历史:12、哲学:5、小说:3”。
进一步的,本申请实施例提供的数据存储方法中,在所述将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储之后,还包括:
若接收到终端设备发送的携带有第一用户标识的访问特征信息请求,查找该第一用户标识对应的第二用户标识,并将所述第二用户标识对应的所述融合访问特征信息发送给所述终端设备。
本申请实施例中,对融合访问特征信息有需求的用户通过终端设备向服务器发送访问特征信息请求,访问特征信息请求中携带有第一用户标识,服务器根据本地预存的第二用户标识与第一用户标识的映射关系,查找第一用户标识对应的第二用户标识,并将第二用户标识对应的融合访问特征信息发送给终端设备。
在一种可能的实施方式中,用户通过终端设备向服务器发送访问特征信息请求中携带有第二用户标识,服务器将第二用户标识对应的融合访问特征信息发送给终端设备。
进一步的,参照图2所示,本申请实施例提供的数据存储方法中,在所述将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储之后,还包括:
S201、根据所述第二用户标识对应的融合访问特征信息,确定所述第二用户标识对应的待推荐信息。
S202、将所述待推荐信息发送给所述第二用户标识对应的用户。
综合步骤201和步骤202,融合访问特征信息包括用户的年龄段、性别、收入情况、工作、居住地、感兴趣的活动、喜欢的商品,根据融合访问特征信息确定与用户相匹配的待推荐信息,并将待推荐信息发送给该用户,比如,将待推荐信息以短信、微信等方式发送给用户的终端设备。
基于同一发明构思,本申请实施例中还提供了与数据存储方法对应的数据存储装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述数据存储方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图3所示,为本申请实施例提供的一种数据存储装置的示意图,该数据存储装置300包括:
获取模块301,用于获取不同的目标对象对应的多个历史访问数据;其中,每个所述历史访问数据包括:第一用户标识、请求参数和访问特征信息;
选取模块302,用于根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识;
第一生成模块303,用于根据所述对应于同一用户的第一用户标识,生成该用户对应的第二用户标识;
第二生成模块304,用于针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息;
存储模块305,用于将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储。
在一种可能的实施方式中,选取模块302,在根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识时,包括:
根据每个所述第一用户标识对应的请求参数,选取对应于相同请求参数的所述第一用户标识,将所述对应于相同请求参数的所述第一用户标识确定为所述对应于同一用户的第一用户标识;或,
根据每个所述第一用户标识对应的请求参数,计算每个所述第一用户标识对应的特征值,根据所述特征值选取所述对应于同一用户的第一用户标识;或,
根据每个所述第一用户标识对应的请求参数,计算多个所述第一用户标识之间的相似度,根据所述相似度选取所述对应于同一用户的第一用户标识。
在一种可能的实施方式中,第一生成模块303,在根据所述对应于同一用户的第一用户标识,生成该用户对应的第二用户标识时,包括:
将所述对应于同一用户的第一用户标识进行加密处理,生成该用户对应的所述第二用户标识。
在一种可能的实施方式中,所述访问特征信息对应有访问时间,第二生成模块304,在针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息时,包括:
将所述第二用户标识下的每个所述第一用户标识对应的访问特征信息中所述访问时间最大的所述访问特征信息,确定为所述第二用户标识对应的融合访问特征信息。
在一种可能的实施方式中,第二生成模块304,在针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息时,包括:
针对每个所述第二用户标识,查找该第二用户标识下的每类访问特征信息对应的融合方式,采用该融合方式对该第二用户标识下的每个所述第一用户标识对应的该类访问特征信息进行融合处理,得到该第二用户标识对应的融合访问特征信息。
在一种可能的实施方式中,上述数据存储装置300,在存储模块305将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储之后,还包括:
查找模块,用于若接收到终端设备发送的携带有第一用户标识的访问特征信息请求,查找该第一用户标识对应的第二用户标识;
第一发送模块,用于将所述第二用户标识对应的所述融合访问特征信息发送给所述终端设备。
在一种可能的实施方式中,上述数据存储装置300,在存储模块305将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储之后,还包括:
确定模块,用于根据所述第二用户标识对应的融合访问特征信息,确定所述第二用户标识对应的待推荐信息;
第二发送模块,用于将所述待推荐信息发送给所述第二用户标识对应的用户。
本申请实施例提供的数据存储装置,根据请求参数确定对应于同一用户的第一用户标识,并根据对应于同一用户的第一用户标识,生成该用户对应的第二用户标识,将第二用户标识下的每个第一用户标识对应的访问特征信息进行融合,生成第二用户标识对应的融合访问特征信息,将第二用户标识和该第二用户标识对应的融合访问特征信息进行存储,减少存储空间的使用,提高存储空间的利用率,并且,每个第二用户标识对应唯一的用户,基于第二用户标识从存储空间中查找融合访问特征信息,可以提高信息的查找效率。
如图4所示,为本申请实施例提供的一种电子设备400,包括:处理器401、存储器402和总线,所述存储器402存储有所述处理器401可执行的机器可读指令,当电子设备运行时,所述处理器401与所述存储器402之间通过总线通信,所述处理器401执行所述机器可读指令,以执行如上述数据存储方法的步骤。
具体地,上述存储器402和处理器401能够为通用的存储器和处理器,这里不做具体限定,当处理器401运行存储器402存储的计算机程序时,能够执行上述数据存储方法。
对应于上述数据存储方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述数据存储方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (8)

1.一种数据存储方法,其特征在于,所述方法包括:
获取不同的目标对象对应的多个历史访问数据;其中,每个所述历史访问数据包括:第一用户标识、请求参数和访问特征信息;
根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识;
根据所述对应于同一用户的第一用户标识,生成该用户对应的第二用户标识;
针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息;
将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储;
其中,所述根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识,包括:
根据每个所述第一用户标识对应的请求参数,选取对应于相同请求参数的所述第一用户标识,将所述对应于相同请求参数的所述第一用户标识确定为所述对应于同一用户的第一用户标识;或,
根据每个所述第一用户标识对应的请求参数,计算每个所述第一用户标识对应的特征值,根据所述特征值选取所述对应于同一用户的第一用户标识;或,
根据每个所述第一用户标识对应的请求参数,计算多个所述第一用户标识之间的相似度,根据所述相似度选取所述对应于同一用户的第一用户标识,
其中,所述根据所述对应于同一用户的第一用户标识,生成该用户对应的第二用户标识,包括:
将所述对应于同一用户的第一用户标识进行加密处理,生成该用户对应的所述第二用户标识。
2.根据权利要求1所述的数据存储方法,其特征在于,所述访问特征信息对应有访问时间,所述针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息,包括:
将所述第二用户标识下的每个所述第一用户标识对应的访问特征信息中所述访问时间最大的所述访问特征信息,确定为所述第二用户标识对应的融合访问特征信息。
3.根据权利要求1所述的数据存储方法,其特征在于,所述针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息,包括:
针对每个所述第二用户标识,查找该第二用户标识下的每类访问特征信息对应的融合方式,采用该融合方式对该第二用户标识下的每个所述第一用户标识对应的该类访问特征信息进行融合处理,得到该第二用户标识对应的融合访问特征信息。
4.根据权利要求1所述的数据存储方法,其特征在于,在所述将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储之后,还包括:
若接收到终端设备发送的携带有第一用户标识的访问特征信息请求,查找该第一用户标识对应的第二用户标识,并将所述第二用户标识对应的所述融合访问特征信息发送给所述终端设备。
5.根据权利要求1所述的数据存储方法,其特征在于,在所述将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储之后,还包括:
根据所述第二用户标识对应的融合访问特征信息,确定所述第二用户标识对应的待推荐信息,并将所述待推荐信息发送给所述第二用户标识对应的用户。
6.一种数据存储装置,其特征在于,所述装置包括:
获取模块,用于获取不同的目标对象对应的多个历史访问数据;其中,每个所述历史访问数据包括:第一用户标识、请求参数和访问特征信息;
选取模块,用于根据每个所述第一用户标识对应的请求参数,从所述多个历史访问数据对应的多个第一用户标识中选取对应于同一用户的第一用户标识;
第一生成模块,用于根据所述对应于同一用户的第一用户标识,生成该用户对应的第二用户标识;
第二生成模块,用于针对每个所述第二用户标识,根据该第二用户标识下的每个所述第一用户标识对应的所述访问特征信息,生成该第二用户标识对应的融合访问特征信息;
存储模块,用于将所述第二用户标识以及所述第二用户标识对应的融合访问特征信息进行存储,
其中,选取模块,还用于根据每个所述第一用户标识对应的请求参数,选取对应于相同请求参数的所述第一用户标识,将所述对应于相同请求参数的所述第一用户标识确定为所述对应于同一用户的第一用户标识;或,根据每个所述第一用户标识对应的请求参数,计算每个所述第一用户标识对应的特征值,根据所述特征值选取所述对应于同一用户的第一用户标识;或,根据每个所述第一用户标识对应的请求参数,计算多个所述第一用户标识之间的相似度,根据所述相似度选取所述对应于同一用户的第一用户标识,
其中,第一生成模块,还用于将所述对应于同一用户的第一用户标识进行加密处理,生成该用户对应的所述第二用户标识。
7.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至5任一项所述的数据存储方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至5任一项所述的数据存储方法的步骤。
CN202010074361.6A 2020-01-22 2020-01-22 一种数据存储方法、装置、电子设备及存储介质 Active CN111290713B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010074361.6A CN111290713B (zh) 2020-01-22 2020-01-22 一种数据存储方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010074361.6A CN111290713B (zh) 2020-01-22 2020-01-22 一种数据存储方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111290713A CN111290713A (zh) 2020-06-16
CN111290713B true CN111290713B (zh) 2023-11-03

Family

ID=71021310

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010074361.6A Active CN111290713B (zh) 2020-01-22 2020-01-22 一种数据存储方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111290713B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114187037A (zh) * 2021-11-30 2022-03-15 北京深演智能科技股份有限公司 信息推送方法、装置及非易失性存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009265754A (ja) * 2008-04-22 2009-11-12 Ntt Docomo Inc 情報提供装置、情報提供方法及び情報提供プログラム
CN102916811A (zh) * 2012-10-18 2013-02-06 中国科学院信息工程研究所 一种多元实体身份凭证信息存储方法
CN103294800A (zh) * 2013-05-27 2013-09-11 华为技术有限公司 一种信息推送方法及装置
CN106547784A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 一种数据拆分存储方法及装置
WO2019062574A1 (zh) * 2017-09-27 2019-04-04 华为技术有限公司 一种元数据查询方法及装置
CN110188276A (zh) * 2019-05-31 2019-08-30 秒针信息技术有限公司 数据发送装置、方法、电子设备及计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5913722B1 (ja) * 2015-11-26 2016-04-27 株式会社博報堂 情報処理システム及びプログラム
US10481823B2 (en) * 2018-02-21 2019-11-19 International Business Machines Corporation Data storage system performing data relocation based on temporal proximity of accesses

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009265754A (ja) * 2008-04-22 2009-11-12 Ntt Docomo Inc 情報提供装置、情報提供方法及び情報提供プログラム
CN102916811A (zh) * 2012-10-18 2013-02-06 中国科学院信息工程研究所 一种多元实体身份凭证信息存储方法
CN103294800A (zh) * 2013-05-27 2013-09-11 华为技术有限公司 一种信息推送方法及装置
CN106547784A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 一种数据拆分存储方法及装置
WO2019062574A1 (zh) * 2017-09-27 2019-04-04 华为技术有限公司 一种元数据查询方法及装置
CN110188276A (zh) * 2019-05-31 2019-08-30 秒针信息技术有限公司 数据发送装置、方法、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN111290713A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
EP2688264B1 (en) Method and apparatus for privacy protected clustering of user interest profiles
US20100228625A1 (en) Wireless network user tracking
KR20140006063A (ko) 추천 서비스들에서 사생활 보호
Mazeh et al. A personal data store approach for recommender systems: enhancing privacy without sacrificing accuracy
Novak et al. A survey of security and privacy in online social networks
Tiwari et al. Implicit preferences discovery for biography recommender system using twitter
CN108154024B (zh) 一种数据检索方法、装置及电子设备
El-Ansari et al. PAPIR: privacy-aware personalized information retrieval
Yuan et al. Towards privacy-preserving and practical image-centric social discovery
CN111290713B (zh) 一种数据存储方法、装置、电子设备及存储介质
US20170272362A1 (en) Data communication systems and methods of operating data communication systems
EP2725538A1 (en) Privacy protected dynamic clustering of end users
WO2016149237A1 (en) Method and system for obfuscating the properties of a web browser
US20230053590A1 (en) Blockchain data search method
JP6233846B2 (ja) 可変長ノンスの生成
Shen et al. Preferred search over encrypted data
CN110555020A (zh) 一种映射关系建立、数据查询方法、装置及设备
CN113420241A (zh) 页面访问方法及装置、电子设备、存储介质
KR20200036173A (ko) 사용자 그루핑 및 그룹별 선호 기계학습 분석 알고리즘을 추천하는 방법 및 장치
CN113377831B (zh) 资源数据查询方法、装置、电子设备以及存储介质
US20210377227A1 (en) Private web systems and uses thereof
Furukawa et al. Behavioral tendency obfuscation framework for personalization services
Al-Anazi et al. An Improved Similarity Metric for Recommender Systems
Karpischek et al. Usage Analysis of a Mobile Bargain Finder Application
Yuan et al. A Privacy-Preserved Probabilistic Routing Index Model for Decentralised Online Social Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant