CN112416999B - 基于人工智能和大数据定位的数据分析方法及云端服务器 - Google Patents
基于人工智能和大数据定位的数据分析方法及云端服务器 Download PDFInfo
- Publication number
- CN112416999B CN112416999B CN202011288754.3A CN202011288754A CN112416999B CN 112416999 B CN112416999 B CN 112416999B CN 202011288754 A CN202011288754 A CN 202011288754A CN 112416999 B CN112416999 B CN 112416999B
- Authority
- CN
- China
- Prior art keywords
- analyzed
- data
- data set
- user
- user portrait
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明是关于基于人工智能和大数据定位的数据分析方法及云端服务器,在应用该方法时,获取多个待分析数据集内每个待分析数据集所对应的用户画像数据,生成对应的特征提取列表,对用户画像数据进行处理得到用户画像定位结果,生成用户画像定位轨迹,确定目标用户的画像分析结果并进行加密存储。如此,能够基于用户画像数据生成针对用户终端的具有全局性和时序连续性的用户画像定位轨迹,从而使得确定出的画像分析结果能够全面地反映用户终端的用户画像的相关信息和数据,画像分析结果是根据用户终端的实时用户行为数据进行更新的,能够完整、持续地定位出用户画像,能够改善难以从全局性出发且存在间断性的大数据定位缺陷。
Description
技术领域
本申请涉及人工智能和大数据定位技术领域,具体而言,涉及一种基于人工智能和大数据定位的数据分析方法及云端服务器。
背景技术
随着科技的发展,大数据对社会生产和人们生活的影响日益增加。通过大数据分析,能够挖掘出更加具有社会价值的深层次信息,从而更好地使数据服务于人们的生产生活。
大数据定位是值对杂乱无章的数据进行多维度的分析、识别和挖掘,从而实现数据的筛分和归类,从而便于后期的数据调用,还可以作为后续业务的决策依据。以用户数据分析为例,通过对用户数据进行定位,能够为后续的信息推送提供依据。然而,常见的对用户数据进行分析和定位的技术难以从全局性出发且存在间断性。
发明内容
有鉴于此,本申请提供了基于人工智能和大数据定位的数据分析方法及云端服务器。
本申请的第一个方面公开了一种基于人工智能和大数据定位的数据分析方法,包括:
获取多个待分析数据集内每个待分析数据集所对应的用户画像数据;
通过所述每个待分析数据集所对应的用户画像数据,生成所述每个待分析数据集所对应的特征提取列表,其中,所述特征提取列表用于对用户画像数据进行画像标签分类或画像标签整合,所述特征提取列表与所述待分析数据集具有一一对应的关系;
采用所述每个待分析数据集所对应的特征提取列表,对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果,其中,所述特征提取列表、所述用户画像数据以及所述用户画像定位结果具有一一对应的关系;
通过所述每个待分析数据集所对应的用户画像定位结果,生成用户画像定位轨迹;
基于所述用户画像定位轨迹,确定与所述多个待分析数据集对应的目标用户的画像分析结果并进行加密存储。
可选的,所述获取多个待分析数据集内每个待分析数据集所对应的用户画像数据,包括:
对所述多个待分析数据集内的所述每个待分析数据集进行数据字段检测,得到所述每个待分析数据集所对应的数据字段分类结果;
通过所述每个待分析数据集所对应的数据字段分类结果确定所述每个待分析数据集所对应的用户交互数据;
通过所述每个待分析数据集所对应的数据字段分类结果确定所述每个待分析数据集所对应的数据更新记录;
获取所述每个待分析数据集所对应的用户偏好数据以及所述每个待分析数据集所对应的用户需求数据;
通过所述每个待分析数据集所对应的用户交互数据、所述每个待分析数据集所对应的数据更新记录、所述每个待分析数据集所对应的用户偏好数据以及所述每个待分析数据集所对应的用户需求数据,生成所述每个待分析数据集所对应的用户画像数据。
可选的,所述通过所述每个待分析数据集所对应的数据字段分类结果确定所述每个待分析数据集所对应的用户交互数据,包括:
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内存在可叠加数据,则将第一目标数据字段确定为用户交互数据;其中,所述第一目标数据字段对应的用户交互频率大于第一设定频率;
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内不存在可叠加数据,则将第二目标数据字段确定为用户交互数据;其中,所述第二目标数据字段对应的用户交互频率大于第二设定频率且小于等于第一设定频率;
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内存在非叠加数据,则将第三目标数据字段确定为用户交互数据;其中,所述第三目标数据字段对应的用户交互频率小于等于第二设定频率;
所述通过所述每个待分析数据集所对应的数据字段分类结果确定所述每个待分析数据集所对应的数据更新记录,包括:
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内存在具有动态分类标签的可更新字段,则将所述第一目标更新记录确定为数据更新记录;其中,所述第一目标更新记录的更新频率位于第一频率区间;
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内存在可更新字段,且所述可更新字段不具有动态分类标签,则将所述第二目标更新记录确定为数据更新记录;其中,所述第二目标更新记录的更新频率位于第二频率区间;
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内不存在可叠加数据,则将所述第三目标更新记录确定为数据更新记录其中,所述第三目标更新记录的更新频率位于第三频率区间;
其中,所述第一频率区间、所述第二频率区间和所述第三频率区间首尾相连。
可选的,所述通过所述每个待分析数据集所对应的用户画像数据,生成所述每个待分析数据集所对应的特征提取列表,包括:
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内不存在可叠加数据,则生成第一特征提取列表,其中,所述第一特征提取列表属于所述特征提取列表,所述第一特征提取列表用于对用户画像数据进行画像标签分类;
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内存在用户,则生成第二特征提取列表,其中,所述第二特征提取列表属于所述特征提取列表,所述第二特征提取列表用于对用户画像数据进行画像标签整合。
可选的,所述通过所述每个待分析数据集所对应的用户画像数据,生成所述每个待分析数据集所对应的特征提取列表,包括:
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内不存在可叠加数据,则生成第一特征提取列表,其中,所述第一特征提取列表属于所述特征提取列表,所述第一特征提取列表用于对用户画像数据进行画像标签分类;
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内存在可更新字段,且所述可更新字段不具有动态分类标签,则生成所述第一特征提取列表;
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内存在可更新字段,且所述可更新字段具有动态分类标签,则生成第二特征提取列表,其中,所述第二特征提取列表属于所述特征提取列表,所述第二特征提取列表用于对用户画像数据进行画像标签整合;
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内存在可更新字段,且所述用户的存在静态分类标签,则通过所述待分析数据集对应的历史数据定位记录生成所述第一特征提取列表或所述第二特征提取列表。
可选的,所述通过所述每个待分析数据集所对应的用户画像数据,生成所述每个待分析数据集所对应的特征提取列表,包括:
通过所述每个待分析数据集所对应的用户画像数据,采用用户画像分类模型生成所述每个待分析数据集所对应的特征提取列表,其中,所述用户画像分类模型为行为画像分类模型、偏好画像分类模型或基于信息传递的关联画像分类模型;
所述采用所述每个待分析数据集所对应的特征提取列表,对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果,包括:
若所述用户画像分类模型为所述行为画像分类模型,则通过所述每个待分析数据集所对应的特征提取列表,采用所述行为画像分类模型对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果;
若所述用户画像分类模型为所述偏好画像分类模型,则通过所述每个待分析数据集所对应的特征提取列表,采用所述偏好画像分类模型对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果;
若所述用户画像分类模型为所述基于信息传递的关联画像分类模型,则通过所述每个待分析数据集所对应的特征提取列表,采用所述基于信息传递的关联画像分类模型对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果。
可选的,所述通过所述每个待分析数据集所对应的用户画像定位结果,生成用户画像定位轨迹,包括:
通过所述每个待分析数据集所对应的用户画像定位结果,确定所述每个待分析数据集所对应的用户画像集中度,其中,所述用户画像集中度为所述用户画像定位结果在时序上的用户画像集中度;
通过所述每个待分析数据集所对应的用户画像集中度,确定所述每个待分析数据集所对应的用户画像变化率;
通过所述每个待分析数据集所对应的用户画像变化率,确定所述每个待分析数据集所对应的定位轨迹拟合系数,其中,所述定位轨迹拟合系数为所述用户画像定位结果在时序上的拟合系数;
通过所述每个待分析数据集所对应的定位轨迹拟合系数以及所述每个待分析数据集所对应的用户画像定位结果,确定所述每个待分析数据集所对应的目标用户画像定位结果;
通过所述每个待分析数据集所对应的目标用户画像定位结果,确定所述每个待分析数据集所对应的用户画像定位轨迹;
其中,所述通过所述每个待分析数据集所对应的定位轨迹拟合系数以及所述每个待分析数据集所对应的用户画像定位结果,确定所述每个待分析数据集所对应的目标用户画像定位结果,包括:
通过所述每个待分析数据集所对应的定位轨迹拟合系数以及所述每个待分析数据集所对应的用户画像定位结果,确定所述每个待分析数据集所对应的待处理用户画像定位结果;
对所述每个待分析数据集所对应的待处理用户画像定位结果进行画像定位偏移校正,得到所述每个待分析数据集所对应的目标用户画像定位结果;
其中,所述通过所述每个待分析数据集所对应的用户画像定位结果,生成用户画像定位轨迹,包括:
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述目标用户画像定位结果满足用户画像定位指标,则生成第一用户画像定位轨迹,其中,所述第一用户画像定位轨迹属于所述用户画像定位轨迹,所述第一用户画像定位轨迹表示所述目标用户画像定位结果为持续性定位结果;
针对于所述多个待分析数据集中的任意一个待分析数据集,若所述目标用户画像定位结果不满足用户画像定位指标,则生成第二用户画像定位轨迹,其中,所述第二用户画像定位轨迹属于所述用户画像定位轨迹,所述第二用户画像定位轨迹表示所述目标用户画像定位结果为间断性定位结果。
可选的,基于所述用户画像定位轨迹,确定与所述多个待分析数据集对应的目标用户的画像分析结果并进行加密存储,包括:
统计第一定位轨迹节点参数的第一参数更新数据和第二定位轨迹节点参数的第二参数更新数据,其中,所述第一定位轨迹节点参数和所述第二定位轨迹节点参数是对所述用户画像定位轨迹对应的节点拟合记录以及节点拟合记录的修正标识进行遍历匹配得到;
基于所述第一参数更新数据和所述第二参数更新数据,确定所述节点拟合记录的修正标识的目标用户类别信息;
基于所述目标用户类别信息确定对所述用户画像定位轨迹进行后续遍历匹配的遍历时间步长,并按照所述遍历时间步长调整所述用户画像定位轨迹的轨迹特征标识;其中,所述目标用户类别信息和/或所述遍历时间步长的确定还基于所述节点拟合记录的修正标识的标识热度值;
根据调整之后的轨迹特征标识从所述目标用户类别信息中提取当前类别,并基于所述当前类别确定所述目标用户的多维画像分析结果,按照约定权限访问密钥对所述多维画像分析结果进行加密存储;
其中,所述基于所述第一参数更新数据和所述第二参数更新数据,确定所述节点拟合记录的修正标识的目标用户类别信息,包括:
利用所述第一参数更新数据获得第一动态目标用户类别信息;
根据所述第二定位轨迹节点参数的节点识别度获得所述第一定位轨迹节点参数中不同参数序列的权重,并利用所述不同参数序列的权重对所述不同参数序列的序列活跃度进行动态时序校正,得到第二动态目标用户类别信息;其中,当所述第二定位轨迹节点参数为可追溯性的定位轨迹节点参数时,所述节点识别度为第一目标识别度,当所述第二定位轨迹节点参数为不可追溯性的定位轨迹节点参数时,所述节点识别度为第二目标识别度;
对所述第一动态目标用户类别信息和所述第二动态目标用户类别信息进行冗余信息筛分,得到所述节点拟合记录的修正标识的目标用户类别信息;
其中,所述目标用户类别信息的确定还基于所述节点拟合记录的修正标识的标识热度值;所述对所述第一动态目标用户类别信息和所述第二动态目标用户类别信息进行冗余信息筛分,得到所述节点拟合记录的修正标识的目标用户类别信息,包括:
由所述节点拟合记录的修正标识的标识热度值分别确定所述第一动态目标用户类别信息和所述第二动态目标用户类别信息的分类权重;
基于所述确定的分类权重,对所述第一动态目标用户类别信息和所述第二动态目标用户类别信息进行冗余信息筛分,得到所述节点拟合记录的修正标识的目标用户类别信息;
其中,利用所述第一参数更新数据获得第一动态目标用户类别信息,包括:
将所述第一定位轨迹节点参数中每个参数字段按照序列活跃度进行排序,并按照排序结果将所述第一定位轨迹节点参数中的参数字段划分为多个参数序列;基于所述第一参数更新数据对所述多个参数序列的序列活跃度进行用户类别挖掘,得到所述第一动态目标用户类别信息;
其中,根据所述第二定位轨迹节点参数的节点识别度获得所述第一定位轨迹节点参数中不同参数序列的权重,包括:
利用对应所述参数序列的第一动态映射路径,获得与所述第二定位轨迹节点参数的节点识别度的映射权重;
对与所述第二定位轨迹节点参数的节点识别的映射权重与所述参数序列在所述第一定位轨迹节点参数所占的百分比进行加权,得到所述参数序列的权重。
本申请的第二个方面,提供了一种云端服务器,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行第一个方面所述的方法。
本申请的第三个方面,提供了一种计算机可读信号介质,其上存储有计算机程序,所述计算机程序在运行是实现第二个方面所述的方法。
相较于现有技术,本发明实施例提供的基于人工智能和大数据定位的数据分析方法及云端服务器具有以下技术效果:
首先获取多个待分析数据集内每个待分析数据集所对应的用户画像数据,其次生成每个待分析数据集所对应的特征提取列表,然后对用户画像数据进行处理得到每个待分析数据集所对应的用户画像定位结果,进而生成用户画像定位轨迹,最后确定目标用户的画像分析结果并进行加密存储。如此,能够基于用户画像数据生成针对用户终端的具有全局性和时序连续性的用户画像定位轨迹,从而使得确定出的画像分析结果能够全面地反映用户终端的用户画像的相关信息和数据,并且画像分析结果是根据用户终端的实时用户行为数据进行更新的,因此能够完整、持续地定位出用户画像。这样能够改善难以从全局性出发且存在间断性的大数据定位缺陷。
在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
附图中的方法、系统和/或程序将根据示例性实施例进一步描述。这些示例性实施例将参照图纸进行详细描述。这些示例性实施例是非限制的示例性实施例,其中参考数字在附图的各个视图中代表相似的机构。
图1是根据本发明的一些实施例所示的一种示例性基于人工智能和大数据定位的数据分析系统的框图。
图2是根据本发明的一些实施例所示的一种示例性云端服务器中硬件和软件组成的示意图。
图3是根据本发明的一些实施例所示的一种示例性基于人工智能和大数据定位的数据分析方法和/或过程的流程图。
图4是根据本发明的一些实施例所示的一种示例性基于人工智能和大数据定位的数据分析装置的框图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
在下面的详细描述中,通过实例阐述了许多具体细节,以便提供对相关指导的全面了解。然而,对于本领域的技术人员来说,显然可以在没有这些细节的情况下实施本发明。在其他情况下,公知的方法、程序、系统、组成和/或电路已经在一个相对较高水平上被描述,没有细节,以避免不必要的模糊本发明的方面。
这些和其他特性、当前申请披露的功能、执行的方法、结构中相关元素的功能和部件的组合和生产经济性,在参照附图进行以下描述的考虑中可能会变得更加明显,所有这些形成本申请的一部分。然而,需要理解清楚的是,附图仅仅是为了说明和描述的目的,并不旨在限制本申请的范围。应当了解的是,这些图纸不是按比例绘制的。然而,应当明确理解的是,附图仅用于说明和描述的目的,并不意图限制本发明的范围。应当知晓的是,这些附图并不依照比例。
本申请中使用流程图说明根据本申请的实施例的系统所执行的执行过程。应当明确理解的是,流程图的执行过程可以不按顺序执行。相反,这些执行过程可以以相反的顺序或同时执行。另外,可以将至少一个其他执行过程添加到流程图。一个或多个执行过程可以从流程图中删除。
图1是根据本发明的一些实施例所示的一种示例性基于人工智能和大数据定位的数据分析系统300的框图,基于人工智能和大数据定位的数据分析系统300可以包括云端服务器100和用户终端200。其中,用户终端200可以是手机、平板电脑和笔记本电脑等。
在一些实施例中,如图2所示,云端服务器100可以包括处理引擎110、网络模块120和存储器130,处理引擎110和存储器130通过网络模块120通信。
处理引擎110可以处理相关的信息和/或数据以执行本申请中描述的一个或多个功能。例如,在一些实施例中,处理引擎110可以包括至少一个处理引擎(例如,单核处理引擎或多核处理器)。仅作为示例,处理引擎110可以包括中央处理单元(Central ProcessingUnit,CPU)、专用集成电路(Application-Specific Integrated Circuit,ASIC)、专用指令集处理器(Application-Specific Instruction-set Processor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field ProgrammableGate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、精简指令集计算机(Reduced Instruction-Set Computer,RISC)、微处理器等或其任意组合。
网络模块120可以促进信息和/或数据的交换。在一些实施例中,网络模块120可以是任何类型的有线或无线网络或其组合。仅作为示例,网络模块120可以包括缆线网络、有线网络、光纤网络、电信网络、内部网络、互联网、局域网络(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网络(Wireless Local Area Network,WLAN)、城域网(Metropolitan Area Network,MAN)、公用电话交换网(Public Telephone SwitchedNetwork,PSTN)、蓝牙网络、无线个域网络、近场通讯(Near Field Communication,NFC)网络等或上述举例的任意组合。在一些实施例中,网络模块120可以包括至少一个网络接入点。例如,网路120可以包括有线或无线网路接入点,如基站和/或网路接入点。
存储器130可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器130用于存储程序,所述处理引擎110在接收到执行指令后,执行所述程序。
可以理解,图2所示的结构仅为示意,云端服务器100还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。
图3是根据本发明的一些实施例所示的一种示例性A方法和/或过程的流程图,基于人工智能和大数据定位的数据分析方法应用于图1中的云端服务器100,具体可以包括以下步骤S11-S15所描述的内容。
步骤S11,获取多个待分析数据集内每个待分析数据集所对应的用户画像数据。
例如,所述待分析数据集从用户终端中采集,所述用户画像数据包括用户偏好数据、用户需求数据以及用户交互数据,所述用户偏好数据用于标识待分析数据集,所述用户需求数据用于指示所述待分析数据集的数据定位标签,所述用户交互数据用于指示所述待分析数据集内的交互型数据记录。
步骤S12,通过所述每个待分析数据集所对应的用户画像数据,生成所述每个待分析数据集所对应的特征提取列表。
例如,所述特征提取列表用于对用户画像数据进行画像标签分类或画像标签整合,所述特征提取列表与所述待分析数据集具有一一对应的关系。
步骤S13,采用所述每个待分析数据集所对应的特征提取列表,对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果。
例如,用户画像定位结果用于表征用户终端对应的用户画像定位情况,所述特征提取列表、所述用户画像数据以及所述用户画像定位结果具有一一对应的关系。
步骤S14,通过所述每个待分析数据集所对应的用户画像定位结果,生成用户画像定位轨迹。
例如,用户画像定位轨迹是针对用户终端而生成的全局性且具有时序连续性的定位轨迹,用户画像定位轨迹是实时更新和迭代的。
步骤S15,基于所述用户画像定位轨迹,确定与所述多个待分析数据集对应的目标用户的画像分析结果并进行加密存储。
例如,画像分析结果全面地反映了用户终端的用户画像的相关信息和数据,并且画像分析结果是根据用户终端的实时用户行为数据进行更新的,因此能够完整、持续地定位出用户画像。
可以理解,通过执行上述步骤S11-步骤S15所描述的内容,首先获取多个待分析数据集内每个待分析数据集所对应的用户画像数据,其次生成每个待分析数据集所对应的特征提取列表,然后对用户画像数据进行处理得到每个待分析数据集所对应的用户画像定位结果,进而生成用户画像定位轨迹,最后确定目标用户的画像分析结果并进行加密存储。如此,能够基于用户画像数据生成针对用户终端的具有全局性和时序连续性的用户画像定位轨迹,从而使得确定出的画像分析结果能够全面地反映用户终端的用户画像的相关信息和数据,并且画像分析结果是根据用户终端的实时用户行为数据进行更新的,因此能够完整、持续地定位出用户画像。这样能够改善难以从全局性出发且存在间断性的大数据定位缺陷。
在一些示例中,为了完整、全面地获取待分析数据集所对应的用户画像数据,步骤S11所描述的获取多个待分析数据集内每个待分析数据集所对应的用户画像数据,可以通过以下步骤S111-步骤S115所描述的内容实现。
步骤S111,对所述多个待分析数据集内的所述每个待分析数据集进行数据字段检测,得到所述每个待分析数据集所对应的数据字段分类结果。
步骤S112,通过所述每个待分析数据集所对应的数据字段分类结果确定所述每个待分析数据集所对应的用户交互数据。
步骤S113,通过所述每个待分析数据集所对应的数据字段分类结果确定所述每个待分析数据集所对应的数据更新记录。
步骤S114,获取所述每个待分析数据集所对应的用户偏好数据以及所述每个待分析数据集所对应的用户需求数据。
步骤S115,通过所述每个待分析数据集所对应的用户交互数据、所述每个待分析数据集所对应的数据更新记录、所述每个待分析数据集所对应的用户偏好数据以及所述每个待分析数据集所对应的用户需求数据,生成所述每个待分析数据集所对应的用户画像数据。
可以理解,通过执行上述步骤S111-步骤S115所描述的内容,能够对每个待分析数据集进行数据字段检测从而得到数据字段分类结果,进而确定出用户交互数据和数据更新记录,并获取用户偏好数据和用户需求数据,这样能够通过每个待分析数据集所对应的用户交互数据、每个待分析数据集所对应的数据更新记录、每个待分析数据集所对应的用户偏好数据以及每个待分析数据集所对应的用户需求数据完整、全面地确定用户画像数据。
进一步地,步骤S112所描述的通过所述每个待分析数据集所对应的数据字段分类结果确定所述每个待分析数据集所对应的用户交互数据,进一步包括以下步骤S1121-步骤S1123所描述的内容。
步骤S1121,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内存在可叠加数据,则将第一目标数据字段确定为用户交互数据;其中,所述第一目标数据字段对应的用户交互频率大于第一设定频率。
步骤S1122,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内不存在可叠加数据,则将第二目标数据字段确定为用户交互数据;其中,所述第二目标数据字段对应的用户交互频率大于第二设定频率且小于等于第一设定频率。
步骤S1123,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内存在非叠加数据,则将第三目标数据字段确定为用户交互数据;其中,所述第三目标数据字段对应的用户交互频率小于等于第二设定频率。
进一步地,步骤S113所描述的通过所述每个待分析数据集所对应的数据字段分类结果确定所述每个待分析数据集所对应的数据更新记录,可以包括以下步骤S1131-步骤S1133所描述的内容。
步骤S1131,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内存在具有动态分类标签的可更新字段,则将所述第一目标更新记录确定为数据更新记录;其中,所述第一目标更新记录的更新频率位于第一频率区间。
步骤S1132,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内存在可更新字段,且所述可更新字段不具有动态分类标签,则将所述第二目标更新记录确定为数据更新记录;其中,所述第二目标更新记录的更新频率位于第二频率区间。
步骤S1133,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述数据字段分类结果为待分析数据集内不存在可叠加数据,则将所述第三目标更新记录确定为数据更新记录其中,所述第三目标更新记录的更新频率位于第三频率区间。
在上述步骤S1131-步骤S1133所描述的内容,所述第一频率区间、所述第二频率区间和所述第三频率区间首尾相连。
在一些示例中,为了确保基于特征提取列表能够精准地实现画像标签分类和画像标签整合,在步骤S12中,通过所述每个待分析数据集所对应的用户画像数据,生成所述每个待分析数据集所对应的特征提取列表,可以通过以下步骤S121和步骤S122所描述的内容实现。
步骤S121,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内不存在可叠加数据,则生成第一特征提取列表,其中,所述第一特征提取列表属于所述特征提取列表,所述第一特征提取列表用于对用户画像数据进行画像标签分类。
步骤S122,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内存在用户,则生成第二特征提取列表,其中,所述第二特征提取列表属于所述特征提取列表,所述第二特征提取列表用于对用户画像数据进行画像标签整合。
在应用上述步骤S121和步骤S122所描述的内容的基础上,能够基于不同的情况生成不同的特征提取列表,从而确保基于特征提取列表能够精准地实现画像标签分类和画像标签整合。
在一个可选的实施方式中,步骤S12所描述的通过所述每个待分析数据集所对应的用户画像数据,生成所述每个待分析数据集所对应的特征提取列表还可以通过以下步骤a-步骤d所描述的内容实现。
步骤a,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内不存在可叠加数据,则生成第一特征提取列表,其中,所述第一特征提取列表属于所述特征提取列表,所述第一特征提取列表用于对用户画像数据进行画像标签分类。
步骤b,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内存在可更新字段,且所述可更新字段不具有动态分类标签,则生成所述第一特征提取列表。
步骤c,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内存在可更新字段,且所述可更新字段具有动态分类标签,则生成第二特征提取列表,其中,所述第二特征提取列表属于所述特征提取列表,所述第二特征提取列表用于对用户画像数据进行画像标签整合。
步骤d,针对于所述多个待分析数据集中的任意一个待分析数据集,若所述用户交互数据用于指示待分析数据集内存在可更新字段,且所述用户的存在静态分类标签,则通过所述待分析数据集对应的历史数据定位记录生成所述第一特征提取列表或所述第二特征提取列表。
在另一个可选的实施方式中,步骤S12所描述的通过所述每个待分析数据集所对应的用户画像数据,生成所述每个待分析数据集所对应的特征提取列表,还可以通过以下步骤120所描述的内容实现:步骤S120,通过所述每个待分析数据集所对应的用户画像数据,采用用户画像分类模型生成所述每个待分析数据集所对应的特征提取列表,其中,所述用户画像分类模型为行为画像分类模型、偏好画像分类模型或基于信息传递的关联画像分类模型。
在上述步骤S120的基础上,步骤S13所描述的采用所述每个待分析数据集所对应的特征提取列表,对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果,可以通过以下步骤S131-步骤S133所描述的内容实现。
步骤S131,若所述用户画像分类模型为所述行为画像分类模型,则通过所述每个待分析数据集所对应的特征提取列表,采用所述行为画像分类模型对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果。
步骤S132,若所述用户画像分类模型为所述偏好画像分类模型,则通过所述每个待分析数据集所对应的特征提取列表,采用所述偏好画像分类模型对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果。
步骤S133,若所述用户画像分类模型为所述基于信息传递的关联画像分类模型,则通过所述每个待分析数据集所对应的特征提取列表,采用所述基于信息传递的关联画像分类模型对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果。
可以理解,通过执行上述步骤S131-步骤S133,能够基于行为画像分类模型、偏好画像分类模型或基于信息传递的关联画像分类模型灵活地实现对用户画像数据的处理,从而确保在不同的应用场景下能够准确完整地得到待分析数据集所对应的用户画像定位结果,进而为后续的用户画像定位轨迹的生成提供足够的数据基础。
在一个可能的实施例中,发明人发现,为了确保用户画像定位轨迹的全局性和时序连续性,需要考虑用户画像集中度以及用户画像变化率,为实现这一目的,步骤S14所描述的通过所述每个待分析数据集所对应的用户画像定位结果,生成用户画像定位轨迹,进一步可以包括以下步骤S141-步骤S145所描述的内容。
步骤S141,通过所述每个待分析数据集所对应的用户画像定位结果,确定所述每个待分析数据集所对应的用户画像集中度,其中,所述用户画像集中度为所述用户画像定位结果在时序上的用户画像集中度。
步骤S142,通过所述每个待分析数据集所对应的用户画像集中度,确定所述每个待分析数据集所对应的用户画像变化率。
步骤S143,通过所述每个待分析数据集所对应的用户画像变化率,确定所述每个待分析数据集所对应的定位轨迹拟合系数,其中,所述定位轨迹拟合系数为所述用户画像定位结果在时序上的拟合系数。
步骤S144,通过所述每个待分析数据集所对应的定位轨迹拟合系数以及所述每个待分析数据集所对应的用户画像定位结果,确定所述每个待分析数据集所对应的目标用户画像定位结果。
步骤S145,通过所述每个待分析数据集所对应的目标用户画像定位结果,确定所述每个待分析数据集所对应的用户画像定位轨迹。
如此,通过执行上述步骤S141-步骤S145,能够将用户画像集中度以及用户画像变化率考虑在内,从而确保用户画像定位轨迹的全局性和时序连续性,还可以确保用户画像定位轨迹是实时更新的。
进一步地,步骤S144所描述的通过所述每个待分析数据集所对应的定位轨迹拟合系数以及所述每个待分析数据集所对应的用户画像定位结果,确定所述每个待分析数据集所对应的目标用户画像定位结果,包括:通过所述每个待分析数据集所对应的定位轨迹拟合系数以及所述每个待分析数据集所对应的用户画像定位结果,确定所述每个待分析数据集所对应的待处理用户画像定位结果;对所述每个待分析数据集所对应的待处理用户画像定位结果进行画像定位偏移校正,得到所述每个待分析数据集所对应的目标用户画像定位结果。
在一个可选的实施例中,步骤S14所描述的通过所述每个待分析数据集所对应的用户画像定位结果,生成用户画像定位轨迹,还可以通过以下方式实现:针对于所述多个待分析数据集中的任意一个待分析数据集,若所述目标用户画像定位结果满足用户画像定位指标,则生成第一用户画像定位轨迹,其中,所述第一用户画像定位轨迹属于所述用户画像定位轨迹,所述第一用户画像定位轨迹表示所述目标用户画像定位结果为持续性定位结果;针对于所述多个待分析数据集中的任意一个待分析数据集,若所述目标用户画像定位结果不满足用户画像定位指标,则生成第二用户画像定位轨迹,其中,所述第二用户画像定位轨迹属于所述用户画像定位轨迹,所述第二用户画像定位轨迹表示所述目标用户画像定位结果为间断性定位结果。
在实际应用时发明人发现,在确定画像分析结果时,需要考虑用户画像定位轨迹与画像分析结果的兼容性,从而确保画像分析结果能够及时地跟随用户画像定位轨迹进行更新。为实现这一目的,步骤S15所描述的基于所述用户画像定位轨迹,确定与所述多个待分析数据集对应的目标用户的画像分析结果并进行加密存储,示例性地可以包括以下步骤S151-步骤S154所描述的内容。
步骤S151,统计第一定位轨迹节点参数的第一参数更新数据和第二定位轨迹节点参数的第二参数更新数据,其中,所述第一定位轨迹节点参数和所述第二定位轨迹节点参数是对所述用户画像定位轨迹对应的节点拟合记录以及节点拟合记录的修正标识进行遍历匹配得到。
步骤S152,基于所述第一参数更新数据和所述第二参数更新数据,确定所述节点拟合记录的修正标识的目标用户类别信息。
步骤S153,基于所述目标用户类别信息确定对所述用户画像定位轨迹进行后续遍历匹配的遍历时间步长,并按照所述遍历时间步长调整所述用户画像定位轨迹的轨迹特征标识;其中,所述目标用户类别信息和/或所述遍历时间步长的确定还基于所述节点拟合记录的修正标识的标识热度值。
步骤S154,根据调整之后的轨迹特征标识从所述目标用户类别信息中提取当前类别,并基于所述当前类别确定所述目标用户的多维画像分析结果,按照约定权限访问密钥对所述多维画像分析结果进行加密存储。
如此,基于上述步骤S151-步骤S154,能够对第一定位轨迹节点参数的第一参数更新数据和第二定位轨迹节点参数的第二参数更新数据进行分析从而确定目标用户类别信息,然后结合节点拟合记录确定出当前类别,这样能够确保用户画像定位轨迹与画像分析结果的兼容性。进一步地,通过当前类别确定出的多维画像分析结果能够及时地跟随用户画像定位轨迹进行更新。此外,通过约定权限访问密钥对多维画像分析结果进行加密存储,能够确保多维画像分析结果在更新时不会被第三方窃取,进而确保多维画像分析结果的数据安全性。
进一步地,步骤S152所描述的基于所述第一参数更新数据和所述第二参数更新数据,确定所述节点拟合记录的修正标识的目标用户类别信息,可以包括以下步骤S1521-步骤S1523所描述的内容。
步骤S1521,利用所述第一参数更新数据获得第一动态目标用户类别信息。
步骤S1522,根据所述第二定位轨迹节点参数的节点识别度获得所述第一定位轨迹节点参数中不同参数序列的权重,并利用所述不同参数序列的权重对所述不同参数序列的序列活跃度进行动态时序校正,得到第二动态目标用户类别信息;其中,当所述第二定位轨迹节点参数为可追溯性的定位轨迹节点参数时,所述节点识别度为第一目标识别度,当所述第二定位轨迹节点参数为不可追溯性的定位轨迹节点参数时,所述节点识别度为第二目标识别度。
步骤S1523,对所述第一动态目标用户类别信息和所述第二动态目标用户类别信息进行冗余信息筛分,得到所述节点拟合记录的修正标识的目标用户类别信息。
可以理解,通过执行上述步骤S1521-步骤S1523,能够对用户类别信息进行精细化筛分,从而确保目标用户类别信息能够尽可能地区分出不同用户。
此外,所述目标用户类别信息的确定还基于所述节点拟合记录的修正标识的标识热度值;步骤S1523所描述的对所述第一动态目标用户类别信息和所述第二动态目标用户类别信息进行冗余信息筛分,得到所述节点拟合记录的修正标识的目标用户类别信息,包括:步骤S1523a,由所述节点拟合记录的修正标识的标识热度值分别确定所述第一动态目标用户类别信息和所述第二动态目标用户类别信息的分类权重;步骤S1523b,基于所述确定的分类权重,对所述第一动态目标用户类别信息和所述第二动态目标用户类别信息进行冗余信息筛分,得到所述节点拟合记录的修正标识的目标用户类别信息。
进一步地,步骤S1521所描述的利用所述第一参数更新数据获得第一动态目标用户类别信息,包括:将所述第一定位轨迹节点参数中每个参数字段按照序列活跃度进行排序,并按照排序结果将所述第一定位轨迹节点参数中的参数字段划分为多个参数序列;基于所述第一参数更新数据对所述多个参数序列的序列活跃度进行用户类别挖掘,得到所述第一动态目标用户类别信息。
进一步地,步骤S1522所描述的根据所述第二定位轨迹节点参数的节点识别度获得所述第一定位轨迹节点参数中不同参数序列的权重,包括:利用对应所述参数序列的第一动态映射路径,获得与所述第二定位轨迹节点参数的节点识别度的映射权重;对与所述第二定位轨迹节点参数的节点识别的映射权重与所述参数序列在所述第一定位轨迹节点参数所占的百分比进行加权,得到所述参数序列的权重。
在一个可替换的实施方式中,在步骤S14之后,还可以实时以下步骤S161、步骤S162和步骤S163中的至少一个步骤。
步骤S161,若存在目标数量个待分析数据集所对应的用户画像定位轨迹均为第一用户画像定位轨迹,则通过所述目标数量个待分析数据集中每个待分析数据集所对应的用户画像定位结果,从所述目标数量个待分析数据集中确定至少一个目标待分析数据集,其中,所述第一用户画像定位轨迹表示所述用户画像定位结果为持续性定位结果,所述目标数量个待分析数据集属于所述多个待分析数据集,所述目标数量小于或等于所述待分析数据集的数量;将所述至少一个目标待分析数据集所对应的用户画像定位结果进行画像定位解析,并将解析结果进行存储。如此,通过存储解析结果,能够便于下次快速对解析结果进行调用以实现数据定位的相关线程的更新。
步骤S162,若存在目标数量个待分析数据集所对应的用户画像定位轨迹均为第一用户画像定位轨迹,则通过所述目标数量个待分析数据集中每个待分析数据集所对应的用户画像定位结果,从所述目标数量个待分析数据集中确定至少一个目标待分析数据集,其中,所述第一用户画像定位轨迹表示所述用户画像定位结果为持续性定位结果,所述目标数量个待分析数据集属于所述多个待分析数据集,所述目标数量小于或等于所述待分析数据集的数量;针对于所述每个目标待分析数据集,对所述目标待分析数据集所对应的用户画像定位结果进行用户需求挖掘,得到用户需求挖掘结果;通过所述每个目标待分析数据集所对应的用户需求挖掘结果,生成目标推送信息。如此,可以将目标推送信息进行推送,并且确保目标推送信息与用户需求是高度匹配的。
步骤S163,若存在目标数量个待分析数据集所对应的用户画像定位轨迹均为第一用户画像定位轨迹,则通过所述目标数量个待分析数据集中每个待分析数据集所对应的用户画像定位结果,从所述目标数量个待分析数据集中确定至少一个目标待分析数据集,其中,所述第一用户画像定位轨迹表示所述用户画像定位结果为持续性定位结果,所述目标数量个待分析数据集属于所述多个待分析数据集,所述目标数量小于或等于所述待分析数据集的数量;针对于所述每个目标待分析数据集,对所述目标待分析数据集所对应的用户画像定位结果进行时序特征提取,得到时序特征分布;针对于所述每个目标待分析数据集,对所述目标待分析数据集所对应的时序特征分布进行需求特征挖掘,得到需求特征挖掘结果;通过所述每个目标待分析数据集所对应的需求特征挖掘结果,生成用户需求评估信息,其中,所述用户需求评估信息包括当前需求评估信息以及潜在需求评估信息中的至少一种。如此,能够精准地挖掘出用户需求评估信息,从而为后续的信息推送、广告推送提供决策依据。
图4是根据本发明的一些实施例所示的一种示例性基于人工智能和大数据定位的数据分析装置140的框图,所述基于人工智能和大数据定位的数据分析装置140包括以下功能模块。
数据获取模块141,用于获取多个待分析数据集内每个待分析数据集所对应的用户画像数据。
列表生成模块142,用于通过所述每个待分析数据集所对应的用户画像数据,生成所述每个待分析数据集所对应的特征提取列表,其中,所述特征提取列表用于对用户画像数据进行画像标签分类或画像标签整合,所述特征提取列表与所述待分析数据集具有一一对应的关系。
画像定位模块143,用于采用所述每个待分析数据集所对应的特征提取列表,对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果,其中,所述特征提取列表、所述用户画像数据以及所述用户画像定位结果具有一一对应的关系。
轨迹生成模块144,用于通过所述每个待分析数据集所对应的用户画像定位结果,生成用户画像定位轨迹。
画像确定模块145,用于基于所述用户画像定位轨迹,确定与所述多个待分析数据集对应的目标用户的画像分析结果并进行加密存储。
可以理解,上述装置的进一步描述请参阅对图3所示的方法实施例的描述。
基于上述同样的发明构思,还提供了一种基于人工智能和大数据定位的数据分析系统,关于该系统的描述如下。
A1.一种基于人工智能和大数据定位的数据分析系统,包括互相之间通信的云端服务器和用户终端;其中,所述云端服务器用于:
获取多个待分析数据集内每个待分析数据集所对应的用户画像数据;
通过所述每个待分析数据集所对应的用户画像数据,生成所述每个待分析数据集所对应的特征提取列表,其中,所述特征提取列表用于对用户画像数据进行画像标签分类或画像标签整合,所述特征提取列表与所述待分析数据集具有一一对应的关系;
采用所述每个待分析数据集所对应的特征提取列表,对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果,其中,所述特征提取列表、所述用户画像数据以及所述用户画像定位结果具有一一对应的关系;
通过所述每个待分析数据集所对应的用户画像定位结果,生成用户画像定位轨迹;
基于所述用户画像定位轨迹,确定与所述多个待分析数据集对应的目标用户的画像分析结果并进行加密存储。
关于上述系统实施例的描述请参阅对图3所示的方法实施例的描述。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可以对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定术语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同部分两次或多次提到的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的至少一个实施例中的某些特征、结构或特点可以进行适当的组合。
另外,本领域普通技术人员可以理解的是,本申请的各个方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可以被称为“单元”、“组件”或“系统”。此外,本申请的各方面可以表现为位于至少一个计算机可读介质中的计算机产品,所述产品包括计算机可读程序编码。
计算机可读信号介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等等、或合适的组合形式。计算机可读信号介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤缆线、RF、或类似介质、或任何上述介质的组合。
本申请各方面执行所需的计算机程序码可以用一种或多种程序语言的任意组合编写,包括面向对象程序设计,如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET,Python等,或类似的常规程序编程语言,如"C"编程语言,Visual Basic,Fortran2003,Perl,COBOL 2002,PHP,ABAP,动态编程语言如Python,Ruby和Groovy或其它编程语言。所述程式设计编码可以完全在用户计算机上执行、或作为独立的软体包在用户计算机上执行、或部分在用户计算机上执行部分在远程计算机执行、或完全在远程计算机或服务器上执行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网络(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非申请专利范围中明确说明,本申请所述处理元件和序列的顺序、数位字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的申请专利范围并不仅限于披露的实施例,相反,申请专利范围旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件装置实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或行动装置上安装所描述的系统。
同样应当理解的是,为了简化本申请揭示的表述,从而帮助对至少一个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法幷不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
Claims (4)
1.一种基于人工智能和大数据定位的数据分析方法,其特征在于,包括:
获取多个待分析数据集内每个待分析数据集所对应的用户画像数据;
通过所述每个待分析数据集所对应的用户画像数据,生成所述每个待分析数据集所对应的特征提取列表,其中,所述特征提取列表用于对用户画像数据进行画像标签分类或画像标签整合,所述特征提取列表与所述待分析数据集具有一一对应的关系;
采用所述每个待分析数据集所对应的特征提取列表,对所述每个待分析数据集所对应的用户画像数据进行处理,得到所述每个待分析数据集所对应的用户画像定位结果,其中,所述特征提取列表、所述用户画像数据以及所述用户画像定位结果具有一一对应的关系;
通过所述每个待分析数据集所对应的用户画像定位结果,生成用户画像定位轨迹;
基于所述用户画像定位轨迹,确定与所述多个待分析数据集对应的目标用户的画像分析结果并进行加密存储;
其中,通过所述每个待分析数据集所对应的用户画像定位结果,生成用户画像定位轨迹,包括:
通过所述每个待分析数据集所对应的用户画像定位结果,确定所述每个待分析数据集所对应的用户画像集中度,其中,所述用户画像集中度为所述用户画像定位结果在时序上的用户画像集中度;
通过所述每个待分析数据集所对应的用户画像集中度,确定所述每个待分析数据集所对应的用户画像变化率;
通过所述每个待分析数据集所对应的用户画像变化率,确定所述每个待分析数据集所对应的定位轨迹拟合系数,其中,所述定位轨迹拟合系数为所述用户画像定位结果在时序上的拟合系数;
通过所述每个待分析数据集所对应的定位轨迹拟合系数以及所述每个待分析数据集所对应的用户画像定位结果,确定所述每个待分析数据集所对应的目标用户画像定位结果;
通过所述每个待分析数据集所对应的目标用户画像定位结果,确定所述每个待分析数据集所对应的用户画像定位轨迹。
2.根据权利要求1所述的方法,其特征在于,所述获取多个待分析数据集内每个待分析数据集所对应的用户画像数据,包括:
对所述多个待分析数据集内的所述每个待分析数据集进行数据字段检测,得到所述每个待分析数据集所对应的数据字段分类结果;
通过所述每个待分析数据集所对应的数据字段分类结果确定所述每个待分析数据集所对应的用户交互数据;
通过所述每个待分析数据集所对应的数据字段分类结果确定所述每个待分析数据集所对应的数据更新记录;
获取所述每个待分析数据集所对应的用户偏好数据以及所述每个待分析数据集所对应的用户需求数据;
通过所述每个待分析数据集所对应的用户交互数据、所述每个待分析数据集所对应的数据更新记录、所述每个待分析数据集所对应的用户偏好数据以及所述每个待分析数据集所对应的用户需求数据,生成所述每个待分析数据集所对应的用户画像数据;
其中,所述用户偏好数据用于标识待分析数据集,所述用户需求数据用于指示所述待分析数据集的数据定位标签,所述用户交互数据用于指示所述待分析数据集内的交互型数据记录。
3.一种云端服务器,其特征在于,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行权利要求1-2任一项所述的方法。
4.一种计算机可读信号介质,其特征在于,其上存储有计算机程序,所述计算机程序在运行是实现权利要求1-2任一项所述的方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110487194.2A CN113326298A (zh) | 2020-11-17 | 2020-11-17 | 基于大数据定位的数据分析方法及云端服务器 |
CN202110487193.8A CN113326297A (zh) | 2020-11-17 | 2020-11-17 | 应用于大数据定位的数据分析方法及云端服务器 |
CN202011288754.3A CN112416999B (zh) | 2020-11-17 | 2020-11-17 | 基于人工智能和大数据定位的数据分析方法及云端服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011288754.3A CN112416999B (zh) | 2020-11-17 | 2020-11-17 | 基于人工智能和大数据定位的数据分析方法及云端服务器 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110487194.2A Division CN113326298A (zh) | 2020-11-17 | 2020-11-17 | 基于大数据定位的数据分析方法及云端服务器 |
CN202110487193.8A Division CN113326297A (zh) | 2020-11-17 | 2020-11-17 | 应用于大数据定位的数据分析方法及云端服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112416999A CN112416999A (zh) | 2021-02-26 |
CN112416999B true CN112416999B (zh) | 2021-07-06 |
Family
ID=74831644
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110487193.8A Withdrawn CN113326297A (zh) | 2020-11-17 | 2020-11-17 | 应用于大数据定位的数据分析方法及云端服务器 |
CN202011288754.3A Active CN112416999B (zh) | 2020-11-17 | 2020-11-17 | 基于人工智能和大数据定位的数据分析方法及云端服务器 |
CN202110487194.2A Withdrawn CN113326298A (zh) | 2020-11-17 | 2020-11-17 | 基于大数据定位的数据分析方法及云端服务器 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110487193.8A Withdrawn CN113326297A (zh) | 2020-11-17 | 2020-11-17 | 应用于大数据定位的数据分析方法及云端服务器 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110487194.2A Withdrawn CN113326298A (zh) | 2020-11-17 | 2020-11-17 | 基于大数据定位的数据分析方法及云端服务器 |
Country Status (1)
Country | Link |
---|---|
CN (3) | CN113326297A (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114329209B (zh) * | 2021-12-30 | 2024-10-01 | 广州博士信息技术研究院有限公司 | 结合创新资源数据的画像分析方法及系统 |
CN115292272B (zh) * | 2021-12-31 | 2023-07-07 | 美云智数科技有限公司 | 企业级权限管理的方法、系统、电子设备以及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7613692B2 (en) * | 2006-07-25 | 2009-11-03 | Microsoft Corporation | Persona-based application personalization |
CN104090886B (zh) * | 2013-12-09 | 2015-09-09 | 深圳市腾讯计算机系统有限公司 | 构建用户实时画像的方法及装置 |
CN108073716A (zh) * | 2017-12-27 | 2018-05-25 | 北京诸葛找房信息技术有限公司 | 在线实时用户画像生成方法 |
CN109213771A (zh) * | 2018-06-28 | 2019-01-15 | 深圳市彬讯科技有限公司 | 更新画像标签的方法和装置 |
CN111552734A (zh) * | 2020-03-30 | 2020-08-18 | 平安医疗健康管理股份有限公司 | 用户画像的生成方法及装置、计算机设备、存储介质 |
-
2020
- 2020-11-17 CN CN202110487193.8A patent/CN113326297A/zh not_active Withdrawn
- 2020-11-17 CN CN202011288754.3A patent/CN112416999B/zh active Active
- 2020-11-17 CN CN202110487194.2A patent/CN113326298A/zh not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
CN113326298A (zh) | 2021-08-31 |
CN112416999A (zh) | 2021-02-26 |
CN113326297A (zh) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860872B (zh) | 用于异常检测的系统和方法 | |
US11194860B2 (en) | Question generation systems and methods for automating diagnosis | |
CN112416999B (zh) | 基于人工智能和大数据定位的数据分析方法及云端服务器 | |
Silva et al. | Road anomalies detection system evaluation | |
US20180025286A1 (en) | Detecting trends in evolving analytics models | |
US9995588B2 (en) | Quantifying anomalous behavior by identifying anomalies at subtrajectories | |
CN112005532B (zh) | 用于对可执行文件进行分类的方法、系统和存储介质 | |
CN108121795A (zh) | 用户行为预测方法及装置 | |
CN107430631B (zh) | 从位置报告确定语义地点名称 | |
CN113641994B (zh) | 基于图数据的数据处理方法及系统 | |
Abdulgader et al. | Enhancement of AES algorithm based on chaotic maps and shift operation for image encryption | |
CN115238828A (zh) | 一种色谱仪故障监测方法及装置 | |
CN113378554B (zh) | 一种医疗信息智能交互的方法及系统 | |
Amin et al. | A comparison of two oversampling techniques (smote vs mtdf) for handling class imbalance problem: A case study of customer churn prediction | |
CN112749181B (zh) | 针对真实性验证和可信溯源的大数据处理方法及云服务器 | |
US11523248B2 (en) | Inference of logistical relationships from device location data | |
CN112308627A (zh) | 基于区块链和人工智能的广告数据接入方法及大数据中心 | |
CN114661994A (zh) | 基于人工智能的用户兴趣数据处理方法、系统及云平台 | |
CN113313464A (zh) | 结合人工智能的云办公大数据处理方法及云办公服务器 | |
CN112685799A (zh) | 设备指纹生成方法、装置、电子设备和计算机可读介质 | |
CN110895587B (zh) | 用于确定目标用户的方法和装置 | |
CN113761210A (zh) | 基于报告文本信息识别的信息处理方法及系统 | |
CN113468247A (zh) | 一种鱼类种类识别方法、装置及存储介质 | |
CN112528306A (zh) | 基于大数据和人工智能的数据访问方法及云计算服务器 | |
CN112330312B (zh) | 基于区块链支付和面部识别的数据处理方法及大数据平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210616 Address after: 4 / F, 136 Meiliang Road, Mashan street, Binhu District, Wuxi City, Jiangsu Province Applicant after: JIANGSU SKYRAY PRECISION MEDICAL TECHNOLOGY Co.,Ltd. Address before: Room 1905, block B, Lingdong international, 50 Chengxin Road, Panlong District, Kunming City, Yunnan Province, 650051 Applicant before: Shan Gaofeng |
|
GR01 | Patent grant | ||
GR01 | Patent grant |