CN114637916A - 一种基于用户习惯的大数据画像及模型构建方法和系统 - Google Patents
一种基于用户习惯的大数据画像及模型构建方法和系统 Download PDFInfo
- Publication number
- CN114637916A CN114637916A CN202210294082.XA CN202210294082A CN114637916A CN 114637916 A CN114637916 A CN 114637916A CN 202210294082 A CN202210294082 A CN 202210294082A CN 114637916 A CN114637916 A CN 114637916A
- Authority
- CN
- China
- Prior art keywords
- user
- behavior
- user behavior
- label
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Computer Graphics (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Geometry (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明适用于大数据技术领域,尤其涉及一种基于用户习惯的大数据画像及模型构建方法和系统,所述方法包括:构建用户虚拟模型,生成用户行为标签;实时记录用户行为数据,判断是否进行用户行为预测;根据当前用户行为标签查询大数据,生成用户行为预测结果;调取用户行为数据,核验用户行为预测结果,生成主动预测行为标签,对用户虚拟模型进行更新。本发明通过对用户的行为进行收集,形成不同的标签,通过标签对每一个用户模型进行定义,进而根据用户模型对用户的行为进行预测,提高根据用户模型预测用户行为的成功率,随着使用时间的增加,预测成功率也就越高,能够在用户行为尚未发生时即生成预测内容,能够提供更为及时的服务。
Description
技术领域
本发明属于大数据技术领域,尤其涉及一种基于用户习惯的大数据画像及模型构建方法和系统。
背景技术
大数据画像,即用户画像,最初是在电商领域得到应用的,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。
在当前的大数据处理过程中,利用设置标签的方式,为每一个用户构建一个虚拟模型,从而利用标签赋予每一个虚拟模型以特点,在进行产品或者服务推荐时,则根据已有的标签进行推送。
但是,现有的这种服务或者产品推荐,都是根据现有的标签直接生成推荐结果,无法起到前瞻性的预测,无法预测用户的需求,因此产品推荐的最佳时机容易丧失。
发明内容
本发明实施例的目的在于提供一种基于用户习惯的大数据画像及模型构建方法,旨在解决背景技术第三部分中提出的问题。
本发明实施例是这样实现的,一种基于用户习惯的大数据画像及模型构建方法,所述方法包括:
记录用户行为习惯数据,构建用户虚拟模型,根据用户行为习惯数据生成用户行为标签;
实时记录用户行为数据,通过将其与预设的触发行为进行比对,判断是否进行用户行为预测;
根据当前用户行为标签查询大数据,从中调取所有与当前触发行为相关的调用标签,并根据用户行为标签和调用标签生成用户行为预测结果,所述大数据中包含所有已入库用户的虚拟模型,每个虚拟模型上均对应有该用户的标签;
调取用户行为数据,核验用户行为预测结果,从而确定调用标签与当前用户行为的相关性,生成主动预测行为标签,对用户虚拟模型进行更新。
优选的,所述实时记录用户行为数据,通过将其与预设的触发行为进行比对,判断是否进行用户行为预测的步骤,具体包括:
建立单日事件数据库,记录每日发生的所有用户数据,所述用户行为至少包括用户行为数据和行为发生时间;
每次检测到用户行为时,将该用户行为与预设的触发行为数据库中的触发行为进行比对,判断两者是否相同;
若两者相同,则判定立即对用户行为进行预测,并存储该用户行为至单日事件数据库,若不相同则仅对该用户行为进行存储。
优选的,所述根据当前用户行为标签查询大数据,从中调取所有与当前触发行为相关的调用标签,并根据用户行为标签和调用标签生成用户行为预测结果的步骤,具体包括:
统计当前用户的用户行为标签,以此作为检索条件,查询大数据中包含上述用户行为标签的已入库用户;
对触发行为和已入库用户的标签进行类型划分,调取与触发行为属于同一类型的标签,得到调用标签;
根据用户行为标签和调用标签生成用户行为预测结果。
优选的,所述调取用户行为数据,核验用户行为预测结果,从而确定调用标签与当前用户行为的相关性,生成主动预测行为标签,对用户虚拟模型进行更新的步骤,具体包括:
调取用户行为数据,根据触发行为确定对应的用户行为;
根据该用户行为核验用户行为预测结果,从而确定相应的已入库用户;
计算调用标签与当前用户行为的相关性,取其中相关性超过预设值的调用标签作为主动预测行为标签,并更新用户虚拟模型。
优选的,单日事件数据库中按照预设的时间分段方式对所有用户行为进行存储。
优选的,所述用户虚拟模型包括模拟人物、模拟服饰和模拟物品,所述用户行为标签与模拟人物、模拟服饰和模拟物品的各部分建立链接关系。
本发明实施例的另一目的在于提供一种基于用户习惯的大数据画像及模型构建系统,所述系统包括:
信息记录模块,用于记录用户行为习惯数据,构建用户虚拟模型,根据用户行为习惯数据生成用户行为标签;
行为触发模块,用于实时记录用户行为数据,通过将其与预设的触发行为进行比对,判断是否进行用户行为预测;
行为预测模块,用于根据当前用户行为标签查询大数据,从中调取所有与当前触发行为相关的调用标签,并根据用户行为标签和调用标签生成用户行为预测结果,所述大数据中包含所有已入库用户的虚拟模型,每个虚拟模型上均对应有该用户的标签;
结果核验模块,用于调取用户行为数据,核验用户行为预测结果,从而确定调用标签与当前用户行为的相关性,生成主动预测行为标签,对用户虚拟模型进行更新。
优选的,所述行为触发模块包括:
时间记录单元,用于建立单日事件数据库,记录每日发生的所有用户数据,所述用户行为至少包括用户行为数据和行为发生时间;
触发判定单元,用于在检测到用户行为时,将该用户行为与预设的触发行为数据库中的触发行为进行比对,判断两者是否相同;
结果确定单元,用于在用户行为与触发行为相同时,则判定立即对用户行为进行预测,并存储该用户行为至单日事件数据库,若不相同则仅对该用户行为进行存储。
优选的,所述行为预测模块包括:
标签统计单元,用于统计当前用户的用户行为标签,以此作为检索条件,查询大数据中包含上述用户行为标签的已入库用户;
类型划分单元,用于对触发行为和已入库用户的标签进行类型划分,调取与触发行为属于同一类型的标签,得到调用标签;
结果生成单元,用于根据用户行为标签和调用标签生成用户行为预测结果。
优选的,所述结果核验模块包括:
数据调取单元,用于调取用户行为数据,根据触发行为确定对应的用户行为;
用户确定单元,用于根据该用户行为核验用户行为预测结果,从而确定相应的已入库用户;
标签确定单元,用于计算调用标签与当前用户行为的相关性,取其中相关性超过预设值的调用标签作为主动预测行为标签,并更新用户虚拟模型。
本发明实施例提供的一种基于用户习惯的大数据画像及模型构建方法,通过对用户的行为进行收集,从而形成不同的标签,通过标签对每一个用户模型进行定义,进而根据用户模型对用户的行为进行预测,并通过用户的实际行为进行验证,从而对用户模型进行修正,提高根据用户模型预测用户行为的成功率,随着使用时间的增加,预测成功率也就越高,用户画像也就越清晰,能够在用户行为尚未发生时即生成预测内容,能够提供更为及时的服务。
附图说明
图1为本发明实施例提供的一种基于用户习惯的大数据画像及模型构建方法的流程图;
图2为本发明实施例提供的实时记录用户行为数据,通过将其与预设的触发行为进行比对,判断是否进行用户行为预测的步骤的流程图;
图3为本发明实施例提供的根据当前用户行为标签查询大数据,从中调取所有与当前触发行为相关的调用标签,并根据用户行为标签和调用标签生成用户行为预测结果的步骤的流程图;
图4为本发明实施例提供的调取用户行为数据,核验用户行为预测结果,从而确定调用标签与当前用户行为的相关性,生成主动预测行为标签,对用户虚拟模型进行更新的步骤的流程图;
图5为本发明实施例提供的一种基于用户习惯的大数据画像及模型构建系统的架构图;
图6为本发明实施例提供的一种行为触发模块的架构图;
图7为本发明实施例提供的一种行为预测模块的架构图;
图8为本发明实施例提供的一种结果核验模块的架构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。
在当前的大数据处理过程中,利用设置标签的方式,为每一个用户构建一个虚拟模型,从而利用标签赋予每一个虚拟模型以特点,在进行产品或者服务推荐时,则根据已有的标签进行推送。但是,现有的这种服务或者产品推荐,都是根据现有的标签直接生成推荐结果,无法起到前瞻性的预测,无法预测用户的需求,因此产品推荐的最佳时机容易丧失。
在本发明中,通过对用户的行为进行收集,从而形成不同的标签,通过标签对每一个用户模型进行定义,进而根据用户模型对用户的行为进行预测,并通过用户的实际行为进行验证,从而对用户模型进行修正,提高根据用户模型预测用户行为的成功率,随着使用时间的增加,预测成功率也就越高,用户画像也就越清晰,能够在用户行为尚未发生时即生成预测内容,能够提供更为及时的服务。
如图1所示,为本发明实施例提供的一种基于用户习惯的大数据画像及模型构建方法的流程图,所述方法包括:
S100,记录用户行为习惯数据,构建用户虚拟模型,根据用户行为习惯数据生成用户行为标签。
在本步骤中,记录用户行为习惯数据,根据所有当前用户产生的行为习惯进行记录,从而为当前用户确定相应的标签,这些标签是根据当前用户自身行为产生的,因此可靠性更强,建立用户虚拟模型,用户虚拟模型包括模拟人物、模拟服饰和模拟物品,所述用户行为标签与模拟人物、模拟服饰和模拟物品的各部分建立链接关系,模拟物品可以包括汽车、电脑等与用户相关的数据,当然可以在不同用户之间建立映射关系,如对夫妻二人分别建立各自的虚拟模型,两人各自有各自的爱好标签,其中妻子喜欢红色玫瑰花,以此作为一个标签,而其丈夫经常给妻子送红色玫瑰,则可以根据妻子的喜好为丈夫设置相应的标签,如情人节送红色玫瑰这样的具体标签,其他的,对用户行为标签进行分类,从而为用户虚拟模型生成相应的物品,并将标签附上,这是生成三维模型供查看。
S200,实时记录用户行为数据,通过将其与预设的触发行为进行比对,判断是否进行用户行为预测。
在本步骤中,实时记录用户行为数据,具体的,可以根据用户使用到实际设备进行记录,也可以直接通过调用数据进行获取,当然,触发行为是即时产生的,而不能是获取的,这样才能保证时效性,如,用户开启了手机上的购物软件,那么则查询开启该软件是否为触发行为,若是触发行为,则需要根据当前用户的行为对用户需要的内容进行预测,若不是触发行为则记录当前行为即可。
S300,根据当前用户行为标签查询大数据,从中调取所有与当前触发行为相关的调用标签,并根据用户行为标签和调用标签生成用户行为预测结果,所述大数据中包含所有已入库用户的虚拟模型,每个虚拟模型上均对应有该用户的标签。
在本步骤中,根据当前用户行为标签查询大数据,所述大数据存储于大数据库当中,其中包含了所有用户的虚拟模型以及相应的标签,该用户即为已入库用户,通过查询,对已入库用户进行筛选,筛选出一部分已入库用户,以下用特定用户表示,调取特定用户中与当前触发行为相关的标签,即为调用标签,根据当前用户的,结合用户行为标签和调用标签生成多种用户行为预测结果,具体的,将每一个特定用户对应的调用标签结合用户行为标签生成一种用户行为预测结果,因此将会产生多个用户行为预测结果。
S400,调取用户行为数据,核验用户行为预测结果,从而确定调用标签与当前用户行为的相关性,生成主动预测行为标签,对用户虚拟模型进行更新。
在本步骤中,调取用户行为数据,即在用户产生行为数据时,均进行记录,那么用户产生的触发行为以及该触发行为对应的后续行为均记录在其中,后续行为是实际发生的行为,而用户行为预测结果中则记录着预测的用户行为,那么通过判断,确定本次预测结果中预测成功的一个,并确定相应的特定用户,将该特定用户对应的与该触发行为相关的标签作为主动预测行为标签,然后对对用户虚拟模型进行更新。
如图2所示,作为本发明的一个优选实施例,所述实时记录用户行为数据,通过将其与预设的触发行为进行比对,判断是否进行用户行为预测的步骤,具体包括:
S201,建立单日事件数据库,记录每日发生的所有用户数据,所述用户行为至少包括用户行为数据和行为发生时间。
在本步骤中,建立单日事件数据库,对用户产生的行为进行记录,在记录时,其行为可以是通过多方数据确定的,如基于用户的移动设备获取用户的运动状态,基于用户的穿戴设备获取相应的身体状态等,在得到用户行为之后,进行连续记录即可,按照行为发生时间进行记录;单日事件数据库中按照预设的时间分段方式对所有用户行为进行存储具体的,可以按照小时进行划分。
S202,每次检测到用户行为时,将该用户行为与预设的触发行为数据库中的触发行为进行比对,判断两者是否相同。
S203,若两者相同,则判定立即对用户行为进行预测,并存储该用户行为至单日事件数据库,若不相同则仅对该用户行为进行存储。
在本步骤中,将该用户行为与预设的触发行为数据库中的触发行为进行比对,对用户行为习惯进行统计和分析最终目的在于为用户提供更加符合用户需求的产品或者服务,而很多行为则是与用户的需求相关性不强的,如用户在进行运动时,其并不需要进行服务,而是在用户在查询或者使用某些软件时,这时才是用户有需求的时候,那么开启app等行为即可视为触发行为,若检测到用户具有上述触发行为,判定立即对用户行为进行预测,并存储该用户行为至单日事件数据库。
如图3所示,作为本发明的一个优选实施例,所述根据当前用户行为标签查询大数据,从中调取所有与当前触发行为相关的调用标签,并根据用户行为标签和调用标签生成用户行为预测结果的步骤,具体包括:
S301,统计当前用户的用户行为标签,以此作为检索条件,查询大数据中包含上述用户行为标签的已入库用户。
在本步骤中,统计当前用户的用户行为标签,即按照上述用户行为标签对大数据中的所有已入库用户进行筛选,在筛选时,可以采用逐次筛选的方法,每次调取一个用户行为标签,且不重复,完成一轮检索后,将检索结果作为下一次检索的用户池,从而逐次缩小检索范围,直到所有的用户行为标签均被使用一次。
S302,对触发行为和已入库用户的标签进行类型划分,调取与触发行为属于同一类型的标签,得到调用标签。
在本步骤中,对触发行为和已入库用户的标签进行类型划分,如购物分类下包含服装、食品、工具等众多详细分类,而根据用户的标签则确定其所述的上位分类,完成对标签的分类,然后调取与触发行为属于同一类型的标签,得到调用标签。
S303,根据用户行为标签和调用标签生成用户行为预测结果。
在本步骤中,根据用户行为标签和调用标签进行预测,由于对于当前用户而言,其标签是基于已经发生的行为产生的,因此对于新的行为是无法进行预测的,而通过将调用标签与用户行为标签进行结合,那么就以其他用户的标签对其进行补充,从而完成对未出现过的触发行为进行行为预测,以确定与当前用户的习惯相似的用户,基于该用户的标签进行行为预测,从而实现提高预测的准确性;即匹配相似用户,当前用户没有该触发行为对应的标签,则使用该相似用户的标签进行用户的行为预测,并推荐相应的产品或者服务。
如图4所示,作为本发明的一个优选实施例,所述调取用户行为数据,核验用户行为预测结果,从而确定调用标签与当前用户行为的相关性,生成主动预测行为标签,对用户虚拟模型进行更新的步骤,具体包括:
S401,调取用户行为数据,根据触发行为确定对应的用户行为。
在本步骤中,调取用户行为数据,根据时间顺序,确定用户最终产生的行为,如开启app之后购买了某一类的商品,那么购买商品的行为即为触发行为确定对应的用户行为。
S402,根据该用户行为核验用户行为预测结果,从而确定相应的已入库用户。
S403,计算调用标签与当前用户行为的相关性,取其中相关性超过预设值的调用标签作为主动预测行为标签,并更新用户虚拟模型。
在本步骤中,根据该用户行为核验用户行为预测结果,调取与该触发行为确定对应的用户行为的已入库用户,两用户的行为相关性最接近,经过多次预测之后,即可确定用户相关性最为接近的已入库用户,从而在两者之间形成链接关系,在后续的产品服务推荐过程中,当前用户没有该触发行为对应的标签,则使用该相似用户的标签进行用户的行为预测,并推荐相应的产品或者服务。
如图5所示,为本发明实施例提供的一种基于用户习惯的大数据画像及模型构建系统,所述系统包括:
信息记录模块100,用于记录用户行为习惯数据,构建用户虚拟模型,根据用户行为习惯数据生成用户行为标签。
在本系统中,信息记录模块100记录用户行为习惯数据,根据所有当前用户产生的行为习惯进行记录,从而为当前用户确定相应的标签,这些标签是根据当前用户自身行为产生的,因此可靠性更强,建立用户虚拟模型,用户虚拟模型包括模拟人物、模拟服饰和模拟物品,所述用户行为标签与模拟人物、模拟服饰和模拟物品的各部分建立链接关系,模拟物品可以包括汽车、电脑等与用户相关的数据,当然可以在不同用户之间建立映射关系,如对夫妻二人分别建立各自的虚拟模型,两人各自有各自的爱好标签,其中妻子喜欢红色玫瑰花,以此作为一个标签,而其丈夫经常给妻子送红色玫瑰,则可以根据妻子的喜好为丈夫设置相应的标签,如情人节送红色玫瑰这样的具体标签,其他的,对用户行为标签进行分类,从而为用户虚拟模型生成相应的物品,并将标签附上,这是生成三维模型供查看。
行为触发模块200,用于实时记录用户行为数据,通过将其与预设的触发行为进行比对,判断是否进行用户行为预测。
在本系统中,行为触发模块200实时记录用户行为数据,具体的,可以根据用户使用到实际设备进行记录,也可以直接通过调用数据进行获取,当然,触发行为是即时产生的,而不能是获取的,这样才能保证时效性,如,用户开启了手机上的购物软件,那么则查询开启该软件是否为触发行为,若是触发行为,则需要根据当前用户的行为对用户需要的内容进行预测,若不是触发行为则记录当前行为即可。
行为预测模块300,用于根据当前用户行为标签查询大数据,从中调取所有与当前触发行为相关的调用标签,并根据用户行为标签和调用标签生成用户行为预测结果,所述大数据中包含所有已入库用户的虚拟模型,每个虚拟模型上均对应有该用户的标签。
在本系统中,行为预测模块300根据当前用户行为标签查询大数据,所述大数据存储于大数据库当中,其中包含了所有用户的虚拟模型以及相应的标签,该用户即为已入库用户,通过查询,对已入库用户进行筛选,筛选出一部分已入库用户,以下用特定用户表示,调取特定用户中与当前触发行为相关的标签,即为调用标签,根据当前用户的,结合用户行为标签和调用标签生成多种用户行为预测结果,具体的,将每一个特定用户对应的调用标签结合用户行为标签生成一种用户行为预测结果,因此将会产生多个用户行为预测结果。
结果核验模块400,用于调取用户行为数据,核验用户行为预测结果,从而确定调用标签与当前用户行为的相关性,生成主动预测行为标签,对用户虚拟模型进行更新。
在本系统中,结果核验模块400调取用户行为数据,即在用户产生行为数据时,均进行记录,那么用户产生的触发行为以及该触发行为对应的后续行为均记录在其中,后续行为是实际发生的行为,而用户行为预测结果中则记录着预测的用户行为,那么通过判断,确定本次预测结果中预测成功的一个,并确定相应的特定用户,将该特定用户对应的与该触发行为相关的标签作为主动预测行为标签,然后对对用户虚拟模型进行更新。
如图6所示,作为本发明的一个优选实施例,所述行为触发模块200包括:
时间记录单元201,用于建立单日事件数据库,记录每日发生的所有用户数据,所述用户行为至少包括用户行为数据和行为发生时间。
在本模块中,时间记录单元201建立单日事件数据库,对用户产生的行为进行记录,在记录时,其行为可以是通过多方数据确定的,如基于用户的移动设备获取用户的运动状态,基于用户的穿戴设备获取相应的身体状态等,在得到用户行为之后,进行连续记录即可,按照行为发生时间进行记录;单日事件数据库中按照预设的时间分段方式对所有用户行为进行存储具体的,可以按照小时进行划分。
触发判定单元202,用于在检测到用户行为时,将该用户行为与预设的触发行为数据库中的触发行为进行比对,判断两者是否相同。
结果确定单元203,用于在用户行为与触发行为相同时,则判定立即对用户行为进行预测,并存储该用户行为至单日事件数据库,若不相同则仅对该用户行为进行存储。
在本模块中,将该用户行为与预设的触发行为数据库中的触发行为进行比对,对用户行为习惯进行统计和分析最终目的在于为用户提供更加符合用户需求的产品或者服务,而很多行为则是与用户的需求相关性不强的,如用户在进行运动时,其并不需要进行服务,而是在用户在查询或者使用某些软件时,这时才是用户有需求的时候,那么开启app等行为即可视为触发行为,若检测到用户具有上述触发行为,判定立即对用户行为进行预测,并存储该用户行为至单日事件数据库。
如图7所示,作为本发明的一个优选实施例,所述行为预测模块300包括:
标签统计单元301,用于统计当前用户的用户行为标签,以此作为检索条件,查询大数据中包含上述用户行为标签的已入库用户。
在本模块中,标签统计单元301统计当前用户的用户行为标签,即按照上述用户行为标签对大数据中的所有已入库用户进行筛选,在筛选时,可以采用逐次筛选的方法,每次调取一个用户行为标签,且不重复,完成一轮检索后,将检索结果作为下一次检索的用户池,从而逐次缩小检索范围,直到所有的用户行为标签均被使用一次。
类型划分单元302,用于对触发行为和已入库用户的标签进行类型划分,调取与触发行为属于同一类型的标签,得到调用标签。
在本模块中,类型划分单元302对触发行为和已入库用户的标签进行类型划分,如购物分类下包含服装、食品、工具等众多详细分类,而根据用户的标签则确定其所述的上位分类,完成对标签的分类,然后调取与触发行为属于同一类型的标签,得到调用标签。
结果生成单元303,用于根据用户行为标签和调用标签生成用户行为预测结果。
在本模块中,结果生成单元303根据用户行为标签和调用标签进行预测,由于对于当前用户而言,其标签是基于已经发生的行为产生的,因此对于新的行为是无法进行预测的,而通过将调用标签与用户行为标签进行结合,那么就以其他用户的标签对其进行补充,从而完成对未出现过的触发行为进行行为预测,以确定与当前用户的习惯相似的用户,基于该用户的标签进行行为预测,从而实现提高预测的准确性;即匹配相似用户,当前用户没有该触发行为对应的标签,则使用该相似用户的标签进行用户的行为预测,并推荐相应的产品或者服务。
如图8所示,作为本发明的一个优选实施例,所述结果核验模块400包括:
数据调取单元401,用于调取用户行为数据,根据触发行为确定对应的用户行为。
在本模块中,数据调取单元401调取用户行为数据,根据时间顺序,确定用户最终产生的行为,如开启app之后购买了某一类的商品,那么购买商品的行为即为触发行为确定对应的用户行为。
用户确定单元402,用于根据该用户行为核验用户行为预测结果,从而确定相应的已入库用户。
标签确定单元403,用于计算调用标签与当前用户行为的相关性,取其中相关性超过预设值的调用标签作为主动预测行为标签,并更新用户虚拟模型。
在本模块中,根据该用户行为核验用户行为预测结果,调取与该触发行为确定对应的用户行为的已入库用户,两用户的行为相关性最接近,经过多次预测之后,即可确定用户相关性最为接近的已入库用户,从而在两者之间形成链接关系,在后续的产品服务推荐过程中,当前用户没有该触发行为对应的标签,则使用该相似用户的标签进行用户的行为预测,并推荐相应的产品或者服务。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于用户习惯的大数据画像及模型构建方法,其特征在于,所述方法包括:
记录用户行为习惯数据,构建用户虚拟模型,根据用户行为习惯数据生成用户行为标签;
实时记录用户行为数据,通过将其与预设的触发行为进行比对,判断是否进行用户行为预测;
根据当前用户行为标签查询大数据,从中调取所有与当前触发行为相关的调用标签,并根据用户行为标签和调用标签生成用户行为预测结果,所述大数据中包含所有已入库用户的虚拟模型,每个虚拟模型上均对应有该用户的标签;
调取用户行为数据,核验用户行为预测结果,从而确定调用标签与当前用户行为的相关性,生成主动预测行为标签,对用户虚拟模型进行更新。
2.根据权利要求1所述的基于用户习惯的大数据画像及模型构建方法,其特征在于,所述实时记录用户行为数据,通过将其与预设的触发行为进行比对,判断是否进行用户行为预测的步骤,具体包括:
建立单日事件数据库,记录每日发生的所有用户数据,所述用户行为至少包括用户行为数据和行为发生时间;
每次检测到用户行为时,将该用户行为与预设的触发行为数据库中的触发行为进行比对,判断两者是否相同;
若两者相同,则判定立即对用户行为进行预测,并存储该用户行为至单日事件数据库,若不相同则仅对该用户行为进行存储。
3.根据权利要求1所述的基于用户习惯的大数据画像及模型构建方法,其特征在于,所述根据当前用户行为标签查询大数据,从中调取所有与当前触发行为相关的调用标签,并根据用户行为标签和调用标签生成用户行为预测结果的步骤,具体包括:
统计当前用户的用户行为标签,以此作为检索条件,查询大数据中包含上述用户行为标签的已入库用户;
对触发行为和已入库用户的标签进行类型划分,调取与触发行为属于同一类型的标签,得到调用标签;
根据用户行为标签和调用标签生成用户行为预测结果。
4.根据权利要求1所述的基于用户习惯的大数据画像及模型构建方法,其特征在于,所述调取用户行为数据,核验用户行为预测结果,从而确定调用标签与当前用户行为的相关性,生成主动预测行为标签,对用户虚拟模型进行更新的步骤,具体包括:
调取用户行为数据,根据触发行为确定对应的用户行为;
根据该用户行为核验用户行为预测结果,从而确定相应的已入库用户;
计算调用标签与当前用户行为的相关性,取其中相关性超过预设值的调用标签作为主动预测行为标签,并更新用户虚拟模型。
5.根据权利要求2所述的基于用户习惯的大数据画像及模型构建方法,其特征在于,单日事件数据库中按照预设的时间分段方式对所有用户行为进行存储。
6.根据权利要求1所述的基于用户习惯的大数据画像及模型构建方法,其特征在于,所述用户虚拟模型包括模拟人物、模拟服饰和模拟物品,所述用户行为标签与模拟人物、模拟服饰和模拟物品的各部分建立链接关系。
7.一种基于用户习惯的大数据画像及模型构建系统,其特征在于,所述系统包括:
信息记录模块,用于记录用户行为习惯数据,构建用户虚拟模型,根据用户行为习惯数据生成用户行为标签;
行为触发模块,用于实时记录用户行为数据,通过将其与预设的触发行为进行比对,判断是否进行用户行为预测;
行为预测模块,用于根据当前用户行为标签查询大数据,从中调取所有与当前触发行为相关的调用标签,并根据用户行为标签和调用标签生成用户行为预测结果,所述大数据中包含所有已入库用户的虚拟模型,每个虚拟模型上均对应有该用户的标签;
结果核验模块,用于调取用户行为数据,核验用户行为预测结果,从而确定调用标签与当前用户行为的相关性,生成主动预测行为标签,对用户虚拟模型进行更新。
8.根据权利要求7所述的基于用户习惯的大数据画像及模型构建系统,其特征在于,所述行为触发模块包括:
时间记录单元,用于建立单日事件数据库,记录每日发生的所有用户数据,所述用户行为至少包括用户行为数据和行为发生时间;
触发判定单元,用于在检测到用户行为时,将该用户行为与预设的触发行为数据库中的触发行为进行比对,判断两者是否相同;
结果确定单元,用于在用户行为与触发行为相同时,则判定立即对用户行为进行预测,并存储该用户行为至单日事件数据库,若不相同则仅对该用户行为进行存储。
9.根据权利要求7所述的基于用户习惯的大数据画像及模型构建系统,其特征在于,所述行为预测模块包括:
标签统计单元,用于统计当前用户的用户行为标签,以此作为检索条件,查询大数据中包含上述用户行为标签的已入库用户;
类型划分单元,用于对触发行为和已入库用户的标签进行类型划分,调取与触发行为属于同一类型的标签,得到调用标签;
结果生成单元,用于根据用户行为标签和调用标签生成用户行为预测结果。
10.根据权利要求7所述的基于用户习惯的大数据画像及模型构建系统,其特征在于,所述结果核验模块包括:
数据调取单元,用于调取用户行为数据,根据触发行为确定对应的用户行为;
用户确定单元,用于根据该用户行为核验用户行为预测结果,从而确定相应的已入库用户;
标签确定单元,用于计算调用标签与当前用户行为的相关性,取其中相关性超过预设值的调用标签作为主动预测行为标签,并更新用户虚拟模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210294082.XA CN114637916A (zh) | 2022-03-23 | 2022-03-23 | 一种基于用户习惯的大数据画像及模型构建方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210294082.XA CN114637916A (zh) | 2022-03-23 | 2022-03-23 | 一种基于用户习惯的大数据画像及模型构建方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114637916A true CN114637916A (zh) | 2022-06-17 |
Family
ID=81950559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210294082.XA Withdrawn CN114637916A (zh) | 2022-03-23 | 2022-03-23 | 一种基于用户习惯的大数据画像及模型构建方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114637916A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115617745A (zh) * | 2022-10-13 | 2023-01-17 | 自然资源部国土卫星遥感应用中心 | 一种卫星图像数据存储介质的管理方法、管理装置及介质 |
-
2022
- 2022-03-23 CN CN202210294082.XA patent/CN114637916A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115617745A (zh) * | 2022-10-13 | 2023-01-17 | 自然资源部国土卫星遥感应用中心 | 一种卫星图像数据存储介质的管理方法、管理装置及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109684554B (zh) | 新闻的潜在用户的确定方法及新闻推送方法 | |
CN111080398B (zh) | 商品推荐方法、装置、计算机设备和存储介质 | |
CN110598847B (zh) | 处理交互序列数据的方法及装置 | |
US10484413B2 (en) | System and a method for detecting anomalous activities in a blockchain network | |
CN107563757B (zh) | 数据风险识别的方法及装置 | |
CN109634698B (zh) | 菜单显示方法、装置、计算机设备及存储介质 | |
CN108711110A (zh) | 保险产品推荐方法、装置、计算机设备和存储介质 | |
CN110223133B (zh) | 产品展示方法、装置、计算机设备和存储介质 | |
CN112381154A (zh) | 预测用户概率的方法、装置和计算机设备 | |
CN113095408A (zh) | 风险的确定方法、装置和服务器 | |
CN108182633A (zh) | 贷款数据处理方法、装置、计算机设备和存储介质 | |
CN110728301A (zh) | 一种个人用户的信用评分方法、装置、终端及存储介质 | |
CN114637916A (zh) | 一种基于用户习惯的大数据画像及模型构建方法和系统 | |
CN111209929A (zh) | 访问数据处理方法、装置、计算机设备及存储介质 | |
CN115082153A (zh) | 一种商家质量评价方法、装置、电子设备及存储介质 | |
US20230099627A1 (en) | Machine learning model for predicting an action | |
CN115292612A (zh) | 基于隐私保护的信息和金融信息推荐方法及装置 | |
CN117437001A (zh) | 目标对象的指标数据处理方法、装置及计算机设备 | |
CN116402581A (zh) | 基于人工智能的电商数据管理方法及系统 | |
CN111932338A (zh) | 一种商品推荐方法、装置、设备及存储介质 | |
CN111047336A (zh) | 用户标签推送、用户标签展示方法、装置和计算机设备 | |
CN114186903A (zh) | 仓库选品方法、装置、计算机设备和存储介质 | |
CN117151855A (zh) | 欺诈风险预测方法、装置、计算机设备和可读存储介质 | |
KR102094595B1 (ko) | 신뢰 지수의 시간 의존 특징을 이용한 신뢰지수 예측 방법 및 시스템 | |
Román et al. | New trends in web user behaviour analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220617 |