CN113656649A - 标签画像数据的生成存储算法及系统 - Google Patents
标签画像数据的生成存储算法及系统 Download PDFInfo
- Publication number
- CN113656649A CN113656649A CN202110931354.8A CN202110931354A CN113656649A CN 113656649 A CN113656649 A CN 113656649A CN 202110931354 A CN202110931354 A CN 202110931354A CN 113656649 A CN113656649 A CN 113656649A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- portrait data
- tag
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种标签画像数据的生成存储算法及系统,通过接收并响应用户发送的数字标签生成请求;从数字标签生成请求中获取用户画像数据,并对用户画像数据进行降维处理,以得到目标用户画像数据;根据目标用户画像数据生成标签画像数据,并将标签画像数据进行存储。优点:标签构建周期短、能灵活快速地满足不同人员的标签需求,成本低,门槛低,容易理解、接受度高。
Description
技术领域
本发明涉及计算机数据处理技术领域,尤其涉及一种标签画像数据的生成存储算法及系统。
背景技术
用户画像是真实用户的虚拟代表,是建立在一系列真实数据之上的目标用户模型。通过用户调研去了解用户,根据他们的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,就形成了一个人物原型。或者说,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。
构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。用户画像标签是用来描述用户个体的人口属性、社会属性、消费特征、业务价值、人生阶段等方面的维度数据,如性别、年龄、所在城市、品牌偏好、母婴用户等。这些画像标签被越来越多的企业应用于理解细分市场、产品设计及精准营销等业务领域提供量化决策支持。尤其是在精准营销投放领域,画像标签质量直接决定了目标定向人群的投放精准性,对提升广告点击率、转化率和销售收入有重要影响。
用户画像标签和业务需求密切相关,不同行业、不同品牌、不同用户、不同应用场景对标签的需求都不太一样。如何能灵活设计并及时生成出用户画像标签,是企业进行用户画像管理的重要技术课题。当前构建用户画像标签的主要方法是基于机器学习的模型预测,研发工程师通过收集处理大量的用户行为日志数据,并训练合适的机器学习模型,用来对用户的未知标签进行预测。
现有技术主要的缺点是:标签构建周期长、成本高不能灵活快速地满足业务人员的标签需求,技术开发门槛高,标签结果较难解释,营销业务人员对画像标签值理解困难、接受度较低。
针对上述这种情况,本发明提出了一种标签画像数据的生成存储算法及系统,能够有效地对现有技术进行改进,以克服其不足。
发明内容
本发明针对现有技术的不足,本发明提供了一种标签画像数据的生成存储算法及系统,以解决现有技术的上述问题,其具体方案如下:
第一方面,本发明提供了一种标签画像数据的生成存储算法,所述算法包括:
接收用户发送的数字标签生成请求;其中,所述数字标签生成请求至少携带一个用于标识用户身份的用户画像数据;
响应所述数字标签生成请求,获取所述用户画像数据,并对所述用户画像数据进行降维处理,以得到目标用户画像数据;
根据所述目标用户画像数据生成标签画像数据,并将所述标签画像数据进行存储。
优选地,所述对所述用户画像数据进行降维处理,以得到目标用户画像数据,所述方法包括:
对所述用户画像数据进行下采样抽取,获得一个稀疏的、等间隔的欠采样图像数据作为所述目标用户画像数据。
优选地,所述根据所述目标用户画像数据生成标签画像数据,所述方法包括:
对所述目标用户画像数据进行独位编码处理,以得到以数字化表示的所述目标用户画像数据的原始特征向量集;
从所述原始特征向量集中提取特征数据,并根据所述特征数据确定为所述用户的标签画像数据。
优选地,所述从所述目标用户画像数据的原始特征向量中提取特征数据,所述方法包括:
使用主成分特征矩阵对所述原始特征向量集进行特征提取,获得与多个主成分特征值相应的多个目标特征向量;
对所有所述目标特征向量进行加权运算处理,并将多个加权的所述目标特征向量级联为所述特征数据。
优选地,所述根据所述特征数据确定为所述用户的标签画像数据,所述方法包括:
将所述原始特征向量输入预设卷积神经网络模型,根据所述预设卷积神经网络模型的输出用户画像数据与预存的标签画像数据的关联度的概率预测结果确定为所述用户的标签画像数据。
第二方面,本发明提供了一种标签画像数据的生成存储系统,所述系统包括:
获取请求模块,用于接收用户发送的数字标签生成请求;其中,所述数字标签生成请求至少携带一个用于标识用户身份的用户画像数据;
响应提取模块,用于响应所述数字标签生成请求,获取所述用户画像数据,并对所述用户画像数据进行降维处理,以得到目标用户画像数据;
设定存储模块,用于根据所述目标用户画像数据生成标签画像数据,并将所述标签画像数据进行存储。
第三方面,本发明提供了一种标签画像数据的生成存储设备,所述设备包括:
通信总线,用于实现处理器与存储器间的连接通信;
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如下步骤:
接收用户发送的数字标签生成请求;其中,所述数字标签生成请求至少携带一个用于标识用户身份的用户画像数据;
响应所述数字标签生成请求,获取所述用户画像数据,并对所述用户画像数据进行降维处理,以得到目标用户画像数据;
根据所述目标用户画像数据生成标签画像数据,并将所述标签画像数据进行存储。
第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法。
本发明的有益效果:本发明的标签画像数据的生成存储算法及系统,通过接收并响应用户发送的数字标签生成请求;从数字标签生成请求中获取用户画像数据,并对用户画像数据进行降维处理,以得到目标用户画像数据;根据目标用户画像数据生成标签画像数据,并将标签画像数据进行存储。优点:标签构建周期短、能灵活快速地满足不同人员的标签需求,成本低,门槛低,容易理解、接受度高。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,附图中的实施例不构成对本发明的任何限制,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明标签画像数据的生成存储方法一实施例流程示意图。
图2是本发明标签画像数据的生成存储系统一实施例结构示意图。
图3是本发明标签画像数据的生成存储设备一实施例结构示意图。
具体实施方式
下面结合附图与实施例对本发明技术方案作进一步详细的说明,这是本发明的较佳实施例。应当理解,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例技术方案的主要思想:获取用户数据;从所述用户数据中提取特征数据;根据所述特征数据设定为所述用户的标签画像。
为了更好的理解上述的技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例一
本发明一实施例提供了一种标签画像数据的生成存储方法,该标签画像数据的生成存储方法,如图1所示,具体可以包括如下步骤:
S101,接收用户发送的数字标签生成请求。
本发明实施例中,具体地是标签画像数据的生成存储系统接收用户发送的数字标签生成请求。需要说明的是,该数字标签生成请求至少携带一个用于标识用户身份的用户画像数据,所述标签用于描述用户的某一属性。
需要说明的是,如果是由多个标签组成用户的用户画像,就以多角度描述用户的不同属性。例如,年龄、性别、居住城市等可以体现用户的某一方面属性但又不会涉及用户个人隐私的信息均可以作为标签。
S102,响应所述数字标签生成请求,获取所述用户画像数据,并对所述用户画像数据进行降维处理,以得到目标用户画像数据;
本发明实施例中,所述对所述用户画像数据进行降维处理,以得到目标用户画像数据,所述方法具体可以包括:对所述用户画像数据进行下采样抽取,获得一个稀疏的、等间隔的欠采样图像数据作为所述目标用户画像数据。
具体地是,标签画像数据的生成存储系统响应所述数字标签生成请求,对所述用户画像数据进行下采样抽取,获得一个稀疏的、等间隔的欠采样的数据降维图像数据作为所述目标用户画像数据。
值得指出的是,所述用户画像可以包括至少一个行为,如消费行为、互联网浏览行为等等。基于这些行为可以抽象、总结得到一个或多个标签。行为包含的用户信息可以广于标签所体现的用户信息,因此,用户画像可以同时包含行为以及基于所述行为抽象得到的标签,以便后续进行标签扩充。
S103,根据所述目标用户画像数据生成标签画像数据,并将所述标签画像数据进行存储。
本发明实施例中,具体是标签画像数据的生成存储系统首先对所述目标用户画像数据进行独位编码处理,以得到以数字化表示的所述目标用户画像数据的原始特征向量集;然后从所述原始特征向量集中提取特征数据,并根据所述特征数据确定为所述用户的标签画像数据。
更具体地,所述从所述目标用户画像数据的原始特征向量中提取特征数据,所述方法具体可以包括:使用主成分特征矩阵对所述原始特征向量集进行特征提取,获得与多个主成分特征值相应的多个目标特征向量;对所有所述目标特征向量进行加权运算处理,并将多个加权的所述目标特征向量级联为所述特征数据。
进一步地,所述根据所述特征数据确定为所述用户的标签画像数据,所述方法具体可以包括:将所述原始特征向量输入预设卷积神经网络模型,根据所述预设卷积神经网络模型的输出用户画像数据与预存的标签画像数据的关联度的概率预测结果确定为所述用户的标签画像数据。
实施例二
本发明一实施例提供了一种标签画像数据的生成存储系统,如图2所示,该标签画像数据的生成存储系统具体可以包括如下模块:
获取请求模块,用于接收用户发送的数字标签生成请求。
本发明实施例中,具体地是标签画像数据的生成存储系统接收用户发送的数字标签生成请求。需要说明的是,该数字标签生成请求至少携带一个用于标识用户身份的用户画像数据,所述标签用于描述用户的某一属性。
需要说明的是,如果是由多个标签组成用户的用户画像,就以多角度描述用户的不同属性。例如,年龄、性别、居住城市等可以体现用户的某一方面属性但又不会涉及用户个人隐私的信息均可以作为标签。
响应提取模块,用于响应所述数字标签生成请求,获取所述用户画像数据,并对所述用户画像数据进行降维处理,以得到目标用户画像数据;
本发明实施例中,所述对所述用户画像数据进行降维处理,以得到目标用户画像数据,所述方法具体可以包括:对所述用户画像数据进行下采样抽取,获得一个稀疏的、等间隔的欠采样图像数据作为所述目标用户画像数据。
具体地是,标签画像数据的生成存储系统响应所述数字标签生成请求,对所述用户画像数据进行下采样抽取,获得一个稀疏的、等间隔的欠采样的数据降维图像数据作为所述目标用户画像数据。
值得指出的是,所述用户画像可以包括至少一个行为,如消费行为、互联网浏览行为等等。基于这些行为可以抽象、总结得到一个或多个标签。行为包含的用户信息可以广于标签所体现的用户信息,因此,用户画像可以同时包含行为以及基于所述行为抽象得到的标签,以便后续进行标签扩充。
设定存储模块,用于根据所述目标用户画像数据生成标签画像数据,并将所述标签画像数据进行存储。
本发明实施例中,具体是标签画像数据的生成存储系统首先对所述目标用户画像数据进行独位编码处理,以得到以数字化表示的所述目标用户画像数据的原始特征向量集;然后从所述原始特征向量集中提取特征数据,并根据所述特征数据确定为所述用户的标签画像数据。
更具体地,所述从所述目标用户画像数据的原始特征向量中提取特征数据,所述方法具体可以包括:使用主成分特征矩阵对所述原始特征向量集进行特征提取,获得与多个主成分特征值相应的多个目标特征向量;对所有所述目标特征向量进行加权运算处理,并将多个加权的所述目标特征向量级联为所述特征数据。
进一步地,所述根据所述特征数据确定为所述用户的标签画像数据,所述方法具体可以包括:将所述原始特征向量输入预设卷积神经网络模型,根据所述预设卷积神经网络模型的输出用户画像数据与预存的标签画像数据的关联度的概率预测结果确定为所述用户的标签画像数据。
实施例三
本发明一实施例提供了一种标签画像数据的生成存储设备,如图3所示,该标签画像数据的生成存储设备具体可以包括如下模块:
通信总线,用于实现处理器与存储器间的连接通信;
存储器,用于存储计算机程序;存储器可能包含高速RAM存储器,也可能还包含非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器可选的可以包含至少一个存储装置。
处理器,用于执行上述计算机程序以实现如下步骤:
首先,接收用户发送的数字标签生成请求。
本发明实施例中,具体地是标签画像数据的生成存储系统接收用户发送的数字标签生成请求。需要说明的是,该数字标签生成请求至少携带一个用于标识用户身份的用户画像数据,所述标签用于描述用户的某一属性。
需要说明的是,如果是由多个标签组成用户的用户画像,就以多角度描述用户的不同属性。例如,年龄、性别、居住城市等可以体现用户的某一方面属性但又不会涉及用户个人隐私的信息均可以作为标签。
然后,响应所述数字标签生成请求,获取所述用户画像数据,并对所述用户画像数据进行降维处理,以得到目标用户画像数据;
本发明实施例中,所述对所述用户画像数据进行降维处理,以得到目标用户画像数据,所述方法具体可以包括:对所述用户画像数据进行下采样抽取,获得一个稀疏的、等间隔的欠采样图像数据作为所述目标用户画像数据。
具体地是,标签画像数据的生成存储系统响应所述数字标签生成请求,对所述用户画像数据进行下采样抽取,获得一个稀疏的、等间隔的欠采样的数据降维图像数据作为所述目标用户画像数据。
值得指出的是,所述用户画像可以包括至少一个行为,如消费行为、互联网浏览行为等等。基于这些行为可以抽象、总结得到一个或多个标签。行为包含的用户信息可以广于标签所体现的用户信息,因此,用户画像可以同时包含行为以及基于所述行为抽象得到的标签,以便后续进行标签扩充。
最后,根据所述目标用户画像数据生成标签画像数据,并将所述标签画像数据进行存储。
本发明实施例中,具体是标签画像数据的生成存储系统首先对所述目标用户画像数据进行独位编码处理,以得到以数字化表示的所述目标用户画像数据的原始特征向量集;然后从所述原始特征向量集中提取特征数据,并根据所述特征数据确定为所述用户的标签画像数据。
更具体地,所述从所述目标用户画像数据的原始特征向量中提取特征数据,所述方法具体可以包括:使用主成分特征矩阵对所述原始特征向量集进行特征提取,获得与多个主成分特征值相应的多个目标特征向量;对所有所述目标特征向量进行加权运算处理,并将多个加权的所述目标特征向量级联为所述特征数据。
进一步地,所述根据所述特征数据确定为所述用户的标签画像数据,所述方法具体可以包括:将所述原始特征向量输入预设卷积神经网络模型,根据所述预设卷积神经网络模型的输出用户画像数据与预存的标签画像数据的关联度的概率预测结果确定为所述用户的标签画像数据。
本实施例中的处理器可能是一种集成电路芯片,具有信号处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。上述处理器可以是微处理器或者上述处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
实施例四
本发明一实施例提供了一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现上述的标签画像数据的生成存储方法。
综上所述,本发明实施例提供的一种标签画像数据的生成存储算法及系统,通过接收并响应用户发送的数字标签生成请求;从数字标签生成请求中获取用户画像数据,并对用户画像数据进行降维处理,以得到目标用户画像数据;根据目标用户画像数据生成标签画像数据,并将标签画像数据进行存储。优点:标签构建周期短、能灵活快速地满足不同人员的标签需求,成本低,门槛低,容易理解、接受度高。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行该计算机程序指令时,全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明是参照本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (8)
1.一种标签画像数据的生成存储算法,其特征在于,所述算法包括:
接收用户发送的数字标签生成请求;其中,所述数字标签生成请求至少携带一个用于标识用户身份的用户画像数据;
响应所述数字标签生成请求,获取所述用户画像数据,并对所述用户画像数据进行降维处理,以得到目标用户画像数据;
根据所述目标用户画像数据生成标签画像数据,并将所述标签画像数据进行存储。
2.根据权利要求1所述的标签画像数据的生成存储算法,其特征在于,所述对所述用户画像数据进行降维处理,以得到目标用户画像数据,所述方法包括:
对所述用户画像数据进行下采样抽取,获得一个稀疏的、等间隔的欠采样图像数据作为所述目标用户画像数据。
3.根据权利要求1或2任一项所述的标签画像数据的生成存储算法,其特征在于,所述根据所述目标用户画像数据生成标签画像数据,所述方法包括:
对所述目标用户画像数据进行独位编码处理,以得到以数字化表示的所述目标用户画像数据的原始特征向量集;
从所述原始特征向量集中提取特征数据,并根据所述特征数据确定为所述用户的标签画像数据。
4.根据权利要求3所述的标签画像数据的生成存储算法,其特征在于,所述从所述目标用户画像数据的原始特征向量中提取特征数据,所述方法包括:
使用主成分特征矩阵对所述原始特征向量集进行特征提取,获得与多个主成分特征值相应的多个目标特征向量;
对所有所述目标特征向量进行加权运算处理,并将多个加权的所述目标特征向量级联为所述特征数据。
5.根据权利要求3所述的标签画像数据的生成存储算法,其特征在于,所述根据所述特征数据确定为所述用户的标签画像数据,所述方法包括:
将所述原始特征向量输入预设卷积神经网络模型,根据所述预设卷积神经网络模型的输出用户画像数据与预存的标签画像数据的关联度的概率预测结果确定为所述用户的标签画像数据。
6.一种标签画像数据的生成存储系统,其特征在于,所述系统包括:
获取请求模块,用于接收用户发送的数字标签生成请求;其中,所述数字标签生成请求至少携带一个用于标识用户身份的用户画像数据;
响应提取模块,用于响应所述数字标签生成请求,获取所述用户画像数据,并对所述用户画像数据进行降维处理,以得到目标用户画像数据;
设定存储模块,用于根据所述目标用户画像数据生成标签画像数据,并将所述标签画像数据进行存储。
7.一种标签画像数据的生成存储设备,其特征在于,所述设备包括:
通信总线,用于实现处理器与存储器间的连接通信;
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如下步骤:
接收用户发送的数字标签生成请求;其中,所述数字标签生成请求至少携带一个用于标识用户身份的用户画像数据;
响应所述数字标签生成请求,获取所述用户画像数据,并对所述用户画像数据进行降维处理,以得到目标用户画像数据;
根据所述目标用户画像数据生成标签画像数据,并将所述标签画像数据进行存储。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5任一项所述的算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110931354.8A CN113656649A (zh) | 2021-08-13 | 2021-08-13 | 标签画像数据的生成存储算法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110931354.8A CN113656649A (zh) | 2021-08-13 | 2021-08-13 | 标签画像数据的生成存储算法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113656649A true CN113656649A (zh) | 2021-11-16 |
Family
ID=78479806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110931354.8A Pending CN113656649A (zh) | 2021-08-13 | 2021-08-13 | 标签画像数据的生成存储算法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113656649A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115905698A (zh) * | 2022-11-29 | 2023-04-04 | 刘赫 | 基于人工智能的用户画像分析方法及系统 |
-
2021
- 2021-08-13 CN CN202110931354.8A patent/CN113656649A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115905698A (zh) * | 2022-11-29 | 2023-04-04 | 刘赫 | 基于人工智能的用户画像分析方法及系统 |
CN115905698B (zh) * | 2022-11-29 | 2023-12-26 | 贵州优特数联科技有限公司 | 基于人工智能的用户画像分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110363213B (zh) | 服装图像的认知分析和分类的方法和系统 | |
CN111966914A (zh) | 基于人工智能的内容推荐方法、装置和计算机设备 | |
CN110674188A (zh) | 一种特征提取方法、装置及设备 | |
CN112613938B (zh) | 模型训练方法、装置及计算机设备 | |
CN113505272B (zh) | 基于行为习惯的控制方法和装置、电子设备和存储介质 | |
CN111090807A (zh) | 一种基于知识图谱的用户识别方法及装置 | |
CN111311328B (zh) | 用于确定在广告渠道下的产品的广告点击率的方法及装置 | |
CN111582932A (zh) | 场景间信息推送方法、装置、计算机设备及存储介质 | |
CN114896454A (zh) | 一种基于标签分析的短视频数据推荐方法及系统 | |
CN113592605A (zh) | 基于相似产品的产品推荐方法、装置、设备及存储介质 | |
CN113656649A (zh) | 标签画像数据的生成存储算法及系统 | |
CN113656699A (zh) | 用户特征向量确定方法、相关设备及介质 | |
WO2021081914A1 (zh) | 推送对象确定方法、装置、终端设备及存储介质 | |
CN113010785A (zh) | 用户推荐方法及设备 | |
WO2019047350A1 (zh) | 一种潜在客户的识别方法、装置、电子设备及介质 | |
CN115730217A (zh) | 模型的训练方法、物料的召回方法及装置 | |
CN112084408B (zh) | 名单数据筛选方法、装置、计算机设备及存储介质 | |
CN113591881A (zh) | 基于模型融合的意图识别方法、装置、电子设备及介质 | |
CN113837836A (zh) | 模型推荐方法、装置、设备及存储介质 | |
CN113688206A (zh) | 基于文本识别的趋势分析方法、装置、设备及介质 | |
CN108632092B (zh) | 信息管理方法及装置 | |
CN113780318A (zh) | 用于生成提示信息的方法、装置、服务器和介质 | |
CN114493646A (zh) | 准实时标签画像的构建方法及系统 | |
CN113254787B (zh) | 事件分析方法、装置、计算机设备及存储介质 | |
CN113095592A (zh) | 基于gnn执行预测的方法和系统以及训练方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |