CN117421459B - 应用于数字城市的数据挖掘方法及系统 - Google Patents
应用于数字城市的数据挖掘方法及系统 Download PDFInfo
- Publication number
- CN117421459B CN117421459B CN202311714591.4A CN202311714591A CN117421459B CN 117421459 B CN117421459 B CN 117421459B CN 202311714591 A CN202311714591 A CN 202311714591A CN 117421459 B CN117421459 B CN 117421459B
- Authority
- CN
- China
- Prior art keywords
- group behavior
- data
- group
- behavior
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007418 data mining Methods 0.000 title claims abstract description 116
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000013598 vector Substances 0.000 claims abstract description 401
- 238000005065 mining Methods 0.000 claims abstract description 43
- 230000004931 aggregating effect Effects 0.000 claims abstract description 37
- 238000012216 screening Methods 0.000 claims abstract description 13
- 230000006399 behavior Effects 0.000 claims description 845
- 238000012549 training Methods 0.000 claims description 183
- 238000009826 distribution Methods 0.000 claims description 155
- 238000004458 analytical method Methods 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 27
- 238000005457 optimization Methods 0.000 claims description 22
- 230000002776 aggregation Effects 0.000 claims description 21
- 238000004220 aggregation Methods 0.000 claims description 21
- 238000012795 verification Methods 0.000 claims description 18
- 238000012544 monitoring process Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 238000012512 characterization method Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 177
- 239000011159 matrix material Substances 0.000 description 15
- 230000008569 process Effects 0.000 description 10
- 238000000605 extraction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 238000009412 basement excavation Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供的应用于数字城市的数据挖掘方法及系统,涉及人工智能技术领域。在本发明中,提取到第一群体行为数据和第二群体行为数据,将第一群体行为数据和第二群体行为数据分别进行挖掘,输出第一群体行为向量和第二群体行为向量;将第一群体行为向量和第二群体行为向量进行聚合,形成初始多维度行为向量;提取到行为需求关系向量;分别将行为需求关系向量中的各群体行为需求向量和初始多维度行为向量进行聚合,输出目标多维度行为向量;基于每一个群体行为需求信息对应的目标多维度行为向量,在多个群体行为需求信息中,筛选出目标群体行为需求信息。基于上述内容,可以改善需求挖掘的可靠度相对不高的问题。
Description
技术领域
本发明涉及人工智能技术领域,具体而言,涉及一种应用于数字城市的数据挖掘方法及系统。
背景技术
数字城市(Smart City)是指利用信息技术、物联网和大数据等先进技术手段,以提升城市管理效率、改善居民生活品质为目标的城市发展模式。数字城市通过收集、整合和分析城市各个领域的数据,实现智能化的城市规划、运营和服务。通过数字化和智能化的手段,数字城市可以实现资源的高效利用、环境的可持续发展和社会的智慧化运作。例如,通过对用户群体的群体行为进行挖掘,可以得到用户群体的群体需求,使得可以基于群体需求对用户群体进行资源推送和管控等。但是,在现有技术中,在挖掘用群体需求的过程中,存在着挖掘的可靠度相对不高的问题。
发明内容
有鉴于此,本发明的目的在于提供一种应用于数字城市的数据挖掘方法及系统,以改善需求挖掘的可靠度相对不高的问题。
为实现上述目的,本发明实施例采用如下技术方案:
一种应用于数字城市的数据挖掘方法,提取到待挖掘群体的第一群体行为数据和第二群体行为数据,以及,将所述第一群体行为数据和所述第二群体行为数据分别进行挖掘,输出对应的第一群体行为向量和第二群体行为向量,所述第一群体行为数据和所述第二群体行为数据用于从两个维度对所述待挖掘群体的城市行为进行描述,所述第一群体行为向量和所述第二群体行为向量用于从两个维度对所述待挖掘群体的城市行为语义进行表征;
将所述第一群体行为向量和所述第二群体行为向量进行聚合,形成对应的初始多维度行为向量;
提取到行为需求关系向量,所述行为需求关系向量包括预先确定的行为需求关系图谱中多个群体行为需求信息各自对应的群体行为需求向量,对于每一个所述群体行为需求信息,该群体行为需求信息对应的群体行为需求向量包括该群体行为需求信息的语义向量和所述行为需求关系图谱中与该群体行为需求信息相关联的群体行为需求信息的语义向量;
分别将所述行为需求关系向量中的各群体行为需求向量和所述初始多维度行为向量进行聚合,输出每一个所述群体行为需求信息对应的目标多维度行为向量;
基于每一个所述群体行为需求信息对应的目标多维度行为向量,在所述多个群体行为需求信息中,筛选出与所述待挖掘群体适配的目标群体行为需求信息,所述目标群体行为需求信息用于反映所述待挖掘群体的需求。
在一些优选的实施例中,在上述应用于数字城市的数据挖掘方法中,所述提取到待挖掘群体的第一群体行为数据和第二群体行为数据,以及,将所述第一群体行为数据和所述第二群体行为数据分别进行挖掘,输出对应的第一群体行为向量和第二群体行为向量的步骤,包括:
提取到待挖掘群体的第一群体行为数据和第二群体行为数据;
获得第一数据挖掘网络,所述第一数据挖掘网络包括多个先后连接的梯度优化单元;
利用所述第一数据挖掘网络中的第一个梯度优化单元,将所述第一群体行为数据进行挖掘,输出对应的原始第一群体行为向量;
对于第一个迭代阶段以后的每一个迭代阶段,将该迭代阶段作为目前迭代阶段,并在所述第一数据挖掘网络中,确定出与所述目前迭代阶段相对应的目前梯度优化单元;
利用所述目前梯度优化单元,将前一个梯度优化单元对应的原始第一群体行为向量进行挖掘,输出对应的候选第一群体行为向量;
对所述前一个梯度优化单元对应的原始第一群体行为向量与所述候选第一群体行为向量进行相加运算,实现梯度优化,以形成所述目前梯度优化单元对应的原始第一群体行为向量;
基于最后一个迭代阶段形成的原始第一群体行为向量,得到所述第一群体行为数据对应的第一群体行为向量;
将所述第二群体行为数据进行挖掘,输出对应的第二群体行为向量。
在一些优选的实施例中,在上述应用于数字城市的数据挖掘方法中,所述将所述第二群体行为数据进行挖掘,输出对应的第二群体行为向量的步骤,包括:
针对所述第二群体行为数据中的每一个群体行为监控图像,将该群体行为监控图像作为待处理图像,以及,将该待处理图像的帧序号进行向量化处理,形成与所述待处理图像对应的图像帧序号向量,所述第二群体行为数据属于通过图像监控设备采集形成的图像数据;
针对所述待处理图像中的每一个图像块,将该图像块作为待处理图像块,并确定所述待处理图像块在所述待处理图像中的分布坐标,以及,将所述分布坐标进行向量化处理,形成与所述待处理图像块对应的分布坐标向量;
将所述待处理图像块进行向量化处理,形成与所述待处理图像块对应的图像块向量,以及,基于与所述待处理图像对应的图像帧序号向量、与所述待处理图像块对应的分布坐标向量、与所述待处理图像块对应的图像块向量,确定出与所述待处理图像块对应的图像块挖掘向量;
基于所述第二群体行为数据中各图像块分别对应的图像块挖掘向量,得到所述第二群体行为数据的第二群体行为向量。
在一些优选的实施例中,在上述应用于数字城市的数据挖掘方法中,所述基于每一个所述群体行为需求信息对应的目标多维度行为向量,在所述多个群体行为需求信息中,筛选出与所述待挖掘群体适配的目标群体行为需求信息的步骤,是利用群体行为需求分析网络执行的;所述应用于数字城市的数据挖掘方法还包括所述群体行为需求分析网络的网络更新步骤,该网络更新步骤包括:
提取到样本群体行为数据簇,所述样本群体行为数据簇包括多个训练第一群体行为数据、所述多个训练第一群体行为数据分别对应的训练第二群体行为数据和实际群体行为需求信息;
对于所述多个训练第一群体行为数据中的每一个训练第一群体行为数据,将该训练第一群体行为数据和相应的训练第二群体行为数据分别进行挖掘,输出对应的训练第一群体行为向量和训练第二群体行为向量;
将所述训练第一群体行为向量和训练第二群体行为向量进行聚合,形成对应的训练初始多维度行为向量;
提取到训练行为需求关系向量,所述训练行为需求关系向量包括训练行为需求关系图谱中多个训练群体行为需求信息分别对应的训练群体行为需求向量,对于每一个所述训练群体行为需求信息,该训练群体行为需求信息对应的训练群体行为需求向量包括该训练群体行为需求信息的语义向量和所述训练行为需求关系图谱中与该训练群体行为需求信息相关联的训练群体行为需求信息的语义向量;
分别将所述训练行为需求关系向量中各训练群体行为需求向量与所述训练初始多维度行为向量进行聚合,输出每一个所述训练群体行为需求信息对应的训练目标多维度行为向量;
基于每一个所述训练群体行为需求信息对应的训练目标多维度行为向量,在所述多个训练群体行为需求信息中,筛选出与所述训练第一群体行为数据相适配的估计群体行为需求信息;
基于所述估计群体行为需求信息和所述训练第一群体行为数据相对应的实际群体行为需求信息之间的区别,对所述群体行为需求分析网络的网络参数进行更新,形成更新后的群体行为需求分析网络。
在一些优选的实施例中,在上述应用于数字城市的数据挖掘方法中,所述群体行为需求分析网络包括第一数据挖掘网络,在所述对于所述多个训练第一群体行为数据中的每一个训练第一群体行为数据,将该训练第一群体行为数据和相应的训练第二群体行为数据分别进行挖掘,输出对应的训练第一群体行为向量和训练第二群体行为向量的步骤以前,所述应用于数字城市的数据挖掘方法还包括:
统计出所述样本群体行为数据簇的簇数据量和所述多个训练群体行为需求信息的信息数量;
基于所述多个训练群体行为需求信息的信息数量,分析出网络学习复杂度;
得到候选第一数据挖掘网络,并基于所述样本群体行为数据簇的簇数据量和所述网络学习复杂度,选择出所述候选第一数据挖掘网络中的非失活部分;
利用所述样本群体行为数据簇,将所述候选第一数据挖掘网络进行网络学习和更新,使得所述候选第一数据挖掘网络中非失活部分的网络参数得以更新,形成更新后的第一数据挖掘网络。
在一些优选的实施例中,在上述应用于数字城市的数据挖掘方法中,所述利用所述样本群体行为数据簇,将所述候选第一数据挖掘网络进行网络学习和更新,使得所述候选第一数据挖掘网络中非失活部分的网络参数得以更新,形成更新后的第一数据挖掘网络的步骤,包括:
对于所述样本群体行为数据簇中的每一个训练第一群体行为数据,确定该训练第一群体行为数据的实际群体行为需求信息,该实际群体行为需求信息为概率分布,所述概率分布中的每一个概率参数分别对应于一个训练群体行为需求信息,且用于反映该训练第一群体行为数据是否与对应的训练群体行为需求信息相适配;
基于所述概率分布中每一个概率参数的大小,得到每一个概率参数对应的概率参数更新规则;
基于每一个概率参数对应的概率参数更新规则,将所述概率分布中每一个概率参数进行更新,形成更新后的实际群体行为需求信息;
依据所述样本群体行为数据簇中每一个训练第一群体行为数据对应的更新后的实际群体行为需求信息,将所述候选第一数据挖掘网络进行网络学习和更新,使得所述候选第一数据挖掘网络中非失活部分的网络参数得以更新,形成更新后的第一数据挖掘网络。
在一些优选的实施例中,在上述应用于数字城市的数据挖掘方法中,在所述基于所述估计群体行为需求信息和所述训练第一群体行为数据相对应的实际群体行为需求信息之间的区别,对所述群体行为需求分析网络的网络参数进行更新,形成更新后的群体行为需求分析网络的步骤以后,所述应用于数字城市的数据挖掘方法还包括:
提取到验证群体行为数据簇,以及,利用更新后的群体行为需求分析网络,将所述验证群体行为数据簇中的验证群体行为数据进行群体行为需求信息的估计,形成对应的群体行为需求估计数据,所述验证群体行为数据包括验证第一群体行为数据和验证第二群体行为数据;
在所述群体行为需求估计数据的估计匹配程度小于预先确定的参考匹配程度的时候,对所述样本群体行为数据簇中的训练第二群体行为数据和所述验证群体行为数据簇中的测试第二群体行为数据进行图像块分析,输出多个普遍性图像块,每一个所述普遍性图像块,属于在所述样本群体行为数据簇和所述验证群体行为数据簇中出现次数大于预先确定的参考次数的图像块;
在配置的多个行为数据库中,提取到所述多个普遍性图像块各自适配的相关群体行为数据,并作为扩展的训练第一群体行为数据,所述相关群体行为数据与所述训练第一群体行为数据的数据维度一致,在所述训练第二群体行为数据属于图像数据的时候,所述训练第一群体行为数据的数据维度包括文本;
依据所述样本群体行为数据簇和所述扩展的训练第一群体行为数据,将所述更新后的群体行为需求分析网络进行更新。
在一些优选的实施例中,在上述应用于数字城市的数据挖掘方法中,在所述提取到行为需求关系向量的步骤以前,所述应用于数字城市的数据挖掘方法还包括:
提取到行为需求关系图谱,所述行为需求关系图谱包括多个群体行为需求信息,且具有相关关系的群体行为需求信息之间配置有连接边;
基于所述行为需求关系图谱,确定出对应的需求信息参数分布和相关性参数分布,所述需求信息参数分布包括所述多个群体行为需求信息各自对应的需求信息表征向量,所述相关性参数分布用于反映所述多个群体行为需求信息之间的相关关系信息;
对所述相关性参数分布和所述需求信息参数分布进行聚合,形成对应的第一个迭代阶段的聚合参数分布;
对于第一个迭代阶段以后的每一个迭代阶段,将前一个迭代阶段形成的聚合参数分布和所述相关性参数分布进行聚合,形成目前迭代阶段对应的聚合参数分布;
基于最后一个迭代阶段形成的聚合参数分布,得到行为需求关系向量。
在一些优选的实施例中,在上述应用于数字城市的数据挖掘方法中,所述需求信息参数分布中的行分布参数与所述群体行为需求信息之间具有一一对应的关系,所述相关性参数分布中的行分布参数与所述群体行为需求信息之间具有一一对应的关系,在所述需求信息参数分布和所述相关性参数分布中,同一行数目的行分布参数对应的群体行为需求信息一样;
所述对所述相关性参数分布和所述需求信息参数分布进行聚合,形成对应的第一个迭代阶段的聚合参数分布的步骤,包括:
对所述相关性参数分布和所述需求信息参数分布进行相乘运算,输出对应的第一参数分布;
对所述第一参数分布和所述需求信息参数分布相加运算,输出对应的第二参数分布;
将所述第二参数分布进行参数映射处理,形成第一个迭代阶段的聚合参数分布。
本发明实施例还提供一种应用于数字城市的数据挖掘系统,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以实现上述的应用于数字城市的数据挖掘方法。
本发明实施例提供的应用于数字城市的数据挖掘方法及系统,提取到第一群体行为数据和第二群体行为数据,将第一群体行为数据和第二群体行为数据分别进行挖掘,输出第一群体行为向量和第二群体行为向量;将第一群体行为向量和第二群体行为向量进行聚合,形成初始多维度行为向量;提取到行为需求关系向量;分别将行为需求关系向量中的各群体行为需求向量和初始多维度行为向量进行聚合,输出目标多维度行为向量;基于每一个群体行为需求信息对应的目标多维度行为向量,在多个群体行为需求信息中,筛选出目标群体行为需求信息。基于前述的内容,由于群体行为需求信息对应的群体行为需求向量包括该群体行为需求信息的语义向量和行为需求关系图谱中与该群体行为需求信息相关联的群体行为需求信息的语义向量,使得群体行为需求向量的语义表征能力能够加强,即需要挖掘的依据语义更丰富,使得可以改善需求挖掘的可靠度相对不高的问题。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
图1为本发明实施例提供的应用于数字城市的数据挖掘系统的结构框图。
图2为本发明实施例提供的应用于数字城市的数据挖掘方法包括的各步骤的流程示意图。
图3为本发明实施例提供的应用于数字城市的数据挖掘装置包括的各模块的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种应用于数字城市的数据挖掘系统。其中,所述应用于数字城市的数据挖掘系统可以包括存储器和处理器。
可选地,在一些实施方式中,所述存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述存储器中可以存储有至少一个可以以软件或固件(firmware)的形式,存在的软件功能模块(计算机程序)。所述处理器可以用于执行所述存储器中存储的可执行的计算机程序,从而实现本发明实施例提供的应用于数字城市的数据挖掘方法。
可选地,在一些实施方式中,所述存储器可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable ProgrammableRead-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable ProgrammableRead-Only Memory,EEPROM)等。所述处理器可以是一种通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)、片上系统(System on Chip,SoC)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选地,在一些实施方式中,所述应用于数字城市的数据挖掘系统可以是一种具备数据处理能力的服务器。
结合图2,本发明实施例还提供一种应用于数字城市的数据挖掘方法,可应用于上述应用于数字城市的数据挖掘系统。其中,所述应用于数字城市的数据挖掘方法有关的流程所定义的方法步骤,可以由所述应用于数字城市的数据挖掘系统实现。下面将对图2所示的具体流程,进行详细阐述。
步骤S110,提取到待挖掘群体的第一群体行为数据和第二群体行为数据,以及,将所述第一群体行为数据和所述第二群体行为数据分别进行挖掘,输出对应的第一群体行为向量和第二群体行为向量。
在本发明实施例中,所述应用于数字城市的数据挖掘系统可以提取到待挖掘群体的第一群体行为数据和第二群体行为数据,以及,将所述第一群体行为数据和所述第二群体行为数据分别进行挖掘,输出对应的第一群体行为向量和第二群体行为向量。所述第一群体行为数据和所述第二群体行为数据用于从两个维度对所述待挖掘群体的城市行为进行描述,所述第一群体行为向量和所述第二群体行为向量用于从两个维度对所述待挖掘群体的城市行为语义进行表征。示例性地,可以对所述第一群体行为数据进行向量化处理,得到第一群体行为向量,并对所述第二群体行为数据进行向量化处理,得到第二群体行为向量,向量化可以使得后续的处理更为方便。所述第一群体行为数据和所述第二群体行为数据可以是两个不同的维度,例如,所述第一群体行为数据属于文本数据,用于记录和描述所述待挖掘群体的行为,如待挖掘群体的消费记录文本,所述第二群体行为数据属于图像数据,用于反映所述待挖掘群体的行为,如待挖掘群体的消费过程监控图像,从而观看商品到付款整个过程。所述待挖掘群体的具体数量不受限制,例如,可以是一个人,也可以是多个人,或者说,可以是在目标区域进行消费的目标性别、目标年龄的群体。
步骤S120,将所述第一群体行为向量和所述第二群体行为向量进行聚合,形成对应的初始多维度行为向量。
在本发明实施例中,所述应用于数字城市的数据挖掘系统可以将所述第一群体行为向量和所述第二群体行为向量进行聚合,形成对应的初始多维度行为向量。也就是说,所述初始多维度行为向量可以具有所述第一群体行为向量和所述第二群体行为向量对应的两个维度的行为语义特征,例如,所述第一群体行为数据属于文本数据,如消费记录文本,所述第二群体行为数据属于图像数据,如消费过程监控图像,如此,可以使得所述初始多维度行为向量中不仅包括消费的具体内容的语义,还包括消费的过程的语义,如购买物品比较干脆(如图像中显示持续时间短)、购买物品比较犹豫(如图像中显示需要进行多番对比),这些语义,对于行为需求的挖掘都具有重要的参考作用,因此,可以将两个维度的语义向量聚合。
步骤S130,提取到行为需求关系向量。
在本发明实施例中,所述应用于数字城市的数据挖掘系统可以提取到行为需求关系向量。所述行为需求关系向量包括预先确定的行为需求关系图谱中多个群体行为需求信息各自对应的群体行为需求向量,对于每一个所述群体行为需求信息,该群体行为需求信息对应的群体行为需求向量包括该群体行为需求信息的语义向量和所述行为需求关系图谱中与该群体行为需求信息相关联的群体行为需求信息的语义向量,也就是说,所述群体行为需求向量既包括自身的群体行为需求信息的语义特征,也包括相关的群体行为需求信息的语义特征。所述多个群体行为需求信息可以配置的。
步骤S140,分别将所述行为需求关系向量中的各群体行为需求向量和所述初始多维度行为向量进行聚合,输出每一个所述群体行为需求信息对应的目标多维度行为向量。
在本发明实施例中,所述应用于数字城市的数据挖掘系统可以分别将所述行为需求关系向量中的各群体行为需求向量和所述初始多维度行为向量进行聚合,输出每一个所述群体行为需求信息对应的目标多维度行为向量。示例性地,可以将所述行为需求关系向量中的第一个群体行为需求向量和所述初始多维度行为向量进行聚合,输出第一个目标多维度行为向量;将所述行为需求关系向量中的第二个群体行为需求向量和所述初始多维度行为向量进行聚合,输出第二个目标多维度行为向量。基于此,所述目标多维度行为向量携带了行为语义特征和需求语义特征。示例性地,可以将所述群体行为需求向量和所述初始多维度行为向量进行相乘运算或拼接处理,得到对应的目标多维度行为向量。
步骤S150,基于每一个所述群体行为需求信息对应的目标多维度行为向量,在所述多个群体行为需求信息中,筛选出与所述待挖掘群体适配的目标群体行为需求信息。
在本发明实施例中,所述应用于数字城市的数据挖掘系统可以基于每一个所述群体行为需求信息对应的目标多维度行为向量,在所述多个群体行为需求信息中,筛选出与所述待挖掘群体适配的目标群体行为需求信息。所述目标群体行为需求信息用于反映所述待挖掘群体的需求,如所述待挖掘群体的兴趣点或倾向,如消费习惯等。
基于前述的内容,由于群体行为需求信息对应的群体行为需求向量包括该群体行为需求信息的语义向量和行为需求关系图谱中与该群体行为需求信息相关联的群体行为需求信息的语义向量,使得群体行为需求向量的语义表征能力能够加强(充分考虑了不同群体行为需求信息之间的相关性),即需求挖掘的依据语义更丰富,使得可以改善现有技术中存在的需求挖掘的可靠度相对不高的问题(如直接将行为向量和需求向量进行对比分析)。
举例来说,假设在数字城市中有一个购物中心,需要挖掘目标年龄段顾客的消费需求以进行更精准的市场推广,如中青年。收集到了两种类型的数据:第一群体行为数据是购买记录文本,包括商品名称、购买时间和购买金额等信息,可以利用文本挖掘技术将购买记录文本转化为第一群体行为向量;第二群体行为数据是从监控摄像头中获取的顾客行为图像,用于观察顾客在购物过程中的活动和偏,可以利用图像处理技术将这些图像数据转化为第二群体行为向量。接下来,提取行为需求关系向量,其中包括了预先确定的行为需求关系图谱中的多个群体行为需求信息以及相应的群体行为需求向量。多个群体行为需求信息可以是,倾向于购买高端时尚服饰、倾向于购买低端时尚服饰、倾向于购买高端电子产品、倾向于购买低端电子产品、倾向于购买高端家具生活物品、倾向于购买低端家具生活物品等。群体行为需求向量1包含了“倾向于购买高端时尚服饰”的语义特征以及与之相关联的其他需求信息的语义特征,如其它高端倾向;群体行为需求向量2包含了“倾向于购买低端时尚服饰”的语义特征以及与之相关联的其他需求信息的语义特征,如其它低端倾向;群体行为需求向量3包含了“倾向于购买高端电子产品”的语义特征以及与之相关联的其他需求信息的语义特征,如其它高端倾向;群体行为需求向量4包含了“倾向于购买低端电子产品”的语义特征以及与之相关联的其他需求信息的语义特征,如其它低端倾向;群体行为需求向量5包含了“倾向于购买高端家具生活物品”的语义特征以及与之相关联的其他需求信息的语义特征,如其它高端倾向;群体行为需求向量6包含了“倾向于购买低端家具生活物品”的语义特征以及与之相关联的其他需求信息的语义特征,如其它低端倾向,相关的方式也可以是其它方式,如产品是否关系,都属于时尚服饰。
根据这些群体行为需求信息和对应的群体行为需求向量,将其分别与初始多维度行为向量进行聚合,得到每个群体行为需求信息对应的目标多维度行为向量。例如,将群体行为需求向量1和初始多维度行为向量进行聚合,得到目标多维度行为向量1;将群体行为需求向量2和初始多维度行为向量进行聚合,得到目标多维度行为向量2;将群体行为需求向量3和初始多维度行为向量进行聚合,得到目标多维度行为向量3;将群体行为需求向量4和初始多维度行为向量进行聚合,得到目标多维度行为向量4;将群体行为需求向量5和初始多维度行为向量进行聚合,得到目标多维度行为向量5;将群体行为需求向量6和初始多维度行为向量进行聚合,得到目标多维度行为向量6。最后,在多个群体行为需求信息中,筛选出与目标顾客群体适配的目标群体行为需求信息。
其中,所述第一群体行为数据在一种示例中,可以包括:
高端时尚服饰店:商品名称:AAA手提包,购买时间:2023-09-30 14:00:10,购买金额:¥15,000.00;商品名称:BBB男士西装,购买时间:2023-09-30 14:15:30,购买金额:¥10,500.00;商品名称:CCC女士高跟鞋,购买时间:2023-09-30 14:30:45,购买金额:¥8,800.00;
低端时尚服饰店:商品名称:aaa牛仔裤,购买时间:2023-09-30 14:05:20,购买金额:¥299.00;商品名称:bbb T恤,购买时间:2023-09-30 14:20:40,购买金额:¥99.90;商品名称:ccc运动鞋,购买时间:2023-09-30 14:35:55,购买金额:¥199.00;
高端电子产品店:商品名称:DDD Pro,购买时间:2023-09-30 14:10:15,购买金额:¥12,999.00;商品名称:EEE 65英寸智能电视,购买时间:2023-09-30 14:25:35,购买金额:¥9,999.00;商品名称:FFF无线耳机,购买时间:2023-09-30 14:40:50,购买金额:¥1,499.00;
低端电子产品店:商品名称:ddd手机,购买时间:2023-09-30 14:15:25,购买金额:¥1,199.00;商品名称:eee 40英寸液晶电视,购买时间:2023-09-30 14:30:40,购买金额:¥799.00;商品名称:fff蓝牙音箱,购买时间:2023-09-30 14:45:55,购买金额:¥199.00;
高端家具生活物品店:商品名称:XXX办公椅,购买时间:2023-09-30 14:20:10,购买金额:¥8,500.00;商品名称:YYY落地灯,购买时间:2023-09-30 14:35:25,购买金额:¥6,999.00;商品名称:ZZZ便携式餐桌,购买时间:2023-09-30 14:50:40,购买金额:¥5,200.00;
低端家具生活物品店:商品名称:xxx床架,购买时间:2023-09-30 14:25:15,购买金额:¥1,199.00;商品名称:yyy衣柜,购买时间:2023-09-30 14:40:30,购买金额:¥399.00;商品名称:zzz卫浴用品,购买时间:2023-09-30 14:55:45,购买金额:¥99.90。
可选地,在一些实施方式中,步骤S110,可以包括:
提取到待挖掘群体的第一群体行为数据和第二群体行为数据,示例性地,可以从相应的数据库中提取,如消费后台和监控后台等;
获得第一数据挖掘网络,所述第一数据挖掘网络包括多个先后连接的梯度优化单元,即第一个梯度优化单元的输出与第二个梯度单元的输入连接,第二个梯度优化单元的输出与第三个梯度单元的输入连接,以此类推;另外,所述梯度优化单元可以依次包括卷积部分(一种卷积神经网络)、激励部分(如Sigmoid函数等非线性函数)和聚合部分(用于相加运算);
利用所述第一数据挖掘网络中的第一个梯度优化单元,将所述第一群体行为数据进行挖掘,输出对应的原始第一群体行为向量,对于一个梯度优化单元,可以先利用卷积部分对所述第一群体行为数据进行卷积运算(可以先将所述第一群体行为数据进行词嵌入处理,得到词向量序列,再将词向量序列进行卷积运算),再利用激励部分对卷积运算的结果进行处理,即可得到对应的原始第一群体行为向量,聚合部分无用,可以失活处理;
对于第一个迭代阶段以后的每一个迭代阶段,将该迭代阶段作为目前迭代阶段,并在所述第一数据挖掘网络中,确定出与所述目前迭代阶段相对应的目前梯度优化单元,如第二个迭代阶段对应于第二个梯度优化单元,第三个迭代阶段对应于第三个梯度优化单元,以此类推;
利用所述目前梯度优化单元,将前一个梯度优化单元对应的原始第一群体行为向量进行挖掘,输出对应的候选第一群体行为向量,例如,利用第二个梯度优化单元,将第一个梯度优化单元对应的原始第一群体行为向量进行挖掘,输出对应的候选第一群体行为向量,具体可以通过第二个梯度优化单元包括的卷积部分和激励部分实现;
对所述前一个梯度优化单元对应的原始第一群体行为向量与所述候选第一群体行为向量进行相加运算,实现梯度优化,以形成所述目前梯度优化单元对应的原始第一群体行为向量,例如,利用第二个梯度优化单元包括的聚合部分,对第二个梯度优化单元对应的候选第一群体行为向量和第一个梯度优化单元对应的原始第一群体行为向量进行相加运算,得到第二个梯度优化单元对应的原始第一群体行为向量;
基于最后一个迭代阶段形成的原始第一群体行为向量,得到所述第一群体行为数据对应的第一群体行为向量;示例性地,可以直接将最后一个迭代阶段形成的原始第一群体行为向量,作为所述第一群体行为数据对应的第一群体行为向量;
将所述第二群体行为数据进行挖掘,输出对应的第二群体行为向量,挖掘的过程中与第一群体行为向量的挖掘过程相似,也可以不同。
其中,对于以第一群体行为数据为“商品名称:AAA手提包,购买时间:2023-09-3014:00:10,购买金额:¥15,000.00”,对词嵌入处理进行举例说,假设使用Word2Vec模型,并已经训练好了一个包含许多单词的词汇表:
商品名称:AAA手提包,购买时间:2023-09-30 14:00:10,购买金额:¥15,000.00;
分割后的单词序列:["商品名称", "AAA手提包", "购买时间", "2023-09-30","14:00:10", "购买金额", "¥15,000.00"]
获取词嵌入向量:对于每个单词,通过查询词嵌入模型的词汇表,获取其对应的词嵌入向量,这个向量通常是一个固定长度的实数向量,例如200维;
单词"商品名称"的词嵌入向量是[0.1, -0.5, 0.1, ...];
单词"AAA手提包"的词嵌入向量是[0.2, -0.3, 0.1, ...];
单词:"购买时间"的词嵌入向量:[0.3, -0.1, 0.2, ...];
单词:"2023-09-30"的词嵌入向量:[-0.2, 0.4, -0.3, ...];
单词:"14:00:10"的词嵌入向量:[0.1, 0.3, -0.4, ...];
单词:"购买金额"的词嵌入向量:[0.2, 0.1, 0.4, ...];
单词:"¥15,000.00"的词嵌入向量:[0.2, 0.3, 0.2, ...];
得到词向量序列:将每个单词的词嵌入向量按顺序组成一个向量序列,如下所示:
[[0.1, -0.5, 0.1, ...],[0.2, -0.3, 0.1, ...], [0.3, -0.1, 0.2, ...],[-0.2, 0.4, -0.3, ...],[0.1, 0.3, -0.4, ...],[0.2, 0.1, 0.4, ...],[0.2, 0.3,0.2, ...]]
可选地,在一些实施方式中,所述将所述第二群体行为数据进行挖掘,输出对应的第二群体行为向量的步骤,可以包括:
针对所述第二群体行为数据中的每一个群体行为监控图像,将该群体行为监控图像作为待处理图像,以及,将该待处理图像的帧序号进行向量化处理,形成与所述待处理图像对应的图像帧序号向量,所述第二群体行为数据属于通过图像监控设备采集形成的图像数据,如第一帧待处理图像的帧序号可以为“0”、第二帧待处理图像的帧序号可以为“1”等,对帧序号进行向量化处理,可以是词嵌入处理;
针对所述待处理图像中的每一个图像块,将该图像块作为待处理图像块,并确定所述待处理图像块在所述待处理图像中的分布坐标,以及,将所述分布坐标进行向量化处理,形成与所述待处理图像块对应的分布坐标向量;所述图像块可以是按照预设的尺寸对待处理图像进行分割形成的,如一个像素对应一个图像块,或相邻的两个像素对应一个图像块,具体的分割粒度不受限制,可以根据实际需求进行配置;另外,所述待处理图像块在所述待处理图像中的分布坐标可以是指包括的像素的分布坐标,如第一行第一列的像素的分布坐标为(0,0),所述分布坐标进行向量化处理也可以是词嵌入处理;
将所述待处理图像块进行向量化处理,形成与所述待处理图像块对应的图像块向量,以及,基于与所述待处理图像对应的图像帧序号向量、与所述待处理图像块对应的分布坐标向量、与所述待处理图像块对应的图像块向量,确定出与所述待处理图像块对应的图像块挖掘向量;示例性地,所述待处理图像块的向量化处理可以为,将待处理图像块的每个像素值按顺序展开,形成一个长向量,然后,可以将该长向量作为图像块向量,或者,可以将该长向量进行卷积运算,得到图像块向量;另外,可以将与所述待处理图像对应的图像帧序号向量、与所述待处理图像块对应的分布坐标向量、与所述待处理图像块对应的图像块向量进行相加,得到所述待处理图像块对应的图像块挖掘向量;
基于所述第二群体行为数据中各图像块分别对应的图像块挖掘向量,得到所述第二群体行为数据的第二群体行为向量;示例性地,可以将所述第二群体行为数据中各图像块分别对应的图像块挖掘向量进行拼接,形成所述第二群体行为数据的第二群体行为向量,如[第一个图像块对应的图像块挖掘向量1,第二个图像块对应的图像块挖掘向量2,第三个图像块对应的图像块挖掘向量3,第四个图像块对应的图像块挖掘向量4...];基于此可以使得生成的第二群体行为向量不仅可以包含每一个图像块的信息,还可包含图像块之间的上下文语义关系,进而后续可基于包含各图像块信息和各图像块之间的上下文语义关系的第二群体行为向量得到更为准确目标群体行为需求信息;前述的向量化过程可以基于第二数据挖掘网络实现。
其中,可选地,在一些实施方式中,步骤S120,可以包括:
得到所述第一群体行为向量对应的加权系数簇和所述第二群体行为向量对应的加权系数簇,每一个所述加权系数簇包括对相应的配置加权参数分布进行降维拆分处理形成的各降维加权参数分布,参数分布可以为矩阵;
分别聚合所述第一群体行为向量对应的加权系数簇中的每一个降维加权参数分布与所述第一群体行为向量,形成多个聚合第一群体行为向量;示例性地,可以将所述第一群体行为向量,分别与每一个所述降维加权参数分布进行相乘,得到对应的聚合第一群体行为向量;
分别聚合所述第二群体行为向量对应的加权系数簇中的每一个降维加权参数分布与所述第二群体行为向量,形成多个聚合第二群体行为向量;示例性地,可以将所述第二群体行为向量,分别与每一个所述降维加权参数分布进行相乘,得到对应的聚合第二群体行为向量;
聚合所述多个聚合第一群体行为向量和所述多个聚合第二群体行为向量,形成对应的初始多维度行为向量,如此,可以使得所述初始多维度行为向量包括所述多个聚合第一群体行为向量和所述多个聚合第二群体行为向量分别具有的语义信息。
其中,可选地,在一些实施方式中,所述得到所述第一群体行为向量对应的加权系数簇和所述第二群体行为向量对应的加权系数簇的步骤,可以包括:
提取到所述第一群体行为向量对应的配置加权参数分布,如第一配置加权参数分布,所述第一配置加权参数分布可以是相应的神经网络中网络参数,如后所述的群体行为需求分析网络中的网络参数,可以在网络更新的过程中形成,同样的,所述群体行为需求分析网络中还包括第二配置加权参数分布,用于形成所述第二群体行为向量对应的加权系数簇;
统计出所述第一群体行为向量对应的配置加权参数分布的参数分布维度,即得到对应的维度数量,如2、3、4、5等数值;
对所述第一群体行为向量对应的配置加权参数分布拆分为多个参数分布维度等于目标维度的降维加权参数分布,拆分形成的降维加权参数分布的数目等于所述第一群体行为向量对应的配置加权参数分布的参数分布维度,所述配置加权参数分布的参数分布维度等于降维加权参数分布的数量;
得到所述第二群体行为向量对应的加权系数簇,如前相似处理过程。
对于上述的降维拆分,举例如下:假设有一个3维的配置加权参数分布:
T = [[[1, 2, 3, 4],
[5, 6, 7, 8],
[9, 10, 11, 12]],
[[13, 14, 15, 16],
[17, 18, 19, 20],
[21, 22, 23, 24]]]
对该配置加权参数分布进行PARAFAC2(Parallel Factor Analysis 2)分解,将该配置加权参数分布表示为三个非负分量矩阵A、B和C的和:
T ≈ A ⊗ B ⊗ C
其中,⊗表示矩阵的外积操作,A是一个2xR的非负矩阵,B是一个3xR的非负矩阵,C是一个4xR的非负矩阵,R是选择的目标维度,如2;通过执行PARAFAC2分解,可以得到分量矩阵A、B和C的估计值:
A = [[0.2, 0.7],
[0.8, 0.3]];
B = [[0.4, 0.9],
[0.6, 0.8],
[0.3, 0.6]];
C = [[0.1, 0.4],
[0.5, 0.2],
[0.3, 0.9],
[0.7, 0.6]];
通过将分量矩阵A、B和C相乘,可以重构配置加权参数分布的近似值。
其中,可选地,在一些实施方式中,所述聚合所述多个聚合第一群体行为向量和所述多个聚合第二群体行为向量,形成对应的初始多维度行为向量的步骤,可以包括:
基于所述多个聚合第一群体行为向量构建出对应的第一参数矩阵,在所述第一参数矩阵中,每一个矩阵位置对应一个聚合第一群体行为向量;
基于所述多个聚合第二群体行为向量构建出对应的第二参数矩阵,在所述第二参数矩阵中,每一个矩阵位置对应一个聚合第二群体行为向量;
对所述第一参数矩阵和所述第二参数矩阵进行相乘,得到对应的相乘参数矩阵,并将所述相乘参数矩阵作为对应的初始多维度行为向量。
可选地,在一些实施方式中,在步骤S130以前,所述应用于数字城市的数据挖掘方法还可以包括:
提取到行为需求关系图谱,所述行为需求关系图谱包括多个群体行为需求信息,且具有相关关系的群体行为需求信息之间配置有连接边,相关关系可以根据实际需求进行配置,如前相关描述;其中,通过构建行为需求关系图谱,可基于行为需求关系图谱得到行为需求关系向量,从而基于行为需求关系向量表征各群体行为需求信息之间的复杂内在关系,进而使得后续可基于能够表达各群体行为需求信息之间的复杂内在关系的行为需求关系向量可靠确定与第一群体行为数据相匹配的目标群体行为需求信息;
基于所述行为需求关系图谱,确定出对应的需求信息参数分布和相关性参数分布,所述需求信息参数分布包括所述多个群体行为需求信息各自对应的需求信息表征向量(即群体行为需求信息的向量化结果),所述相关性参数分布用于反映所述多个群体行为需求信息之间的相关关系信息,例如,在所述相关性参数分布中,参数“1”表示两个群体行为需求信息之间具有相关关系,在所述行为需求关系图谱中具有连接边;参数“0”表示两个群体行为需求信息之间不具有相关关系,在所述行为需求关系图谱中不具有连接边,如倾向于购买低端时尚服饰和倾向于购买低端电子产品,都具有低端倾向,可以认为具有相关关系,通过参数“1”表示;
对所述相关性参数分布和所述需求信息参数分布进行聚合,形成对应的第一个迭代阶段的聚合参数分布,如相乘;
对于第一个迭代阶段以后的每一个迭代阶段,将前一个迭代阶段形成的聚合参数分布和所述相关性参数分布进行聚合,如相加,形成目前迭代阶段对应的聚合参数分布;
基于最后一个迭代阶段形成的聚合参数分布,得到行为需求关系向量;示例性地,可以将最后一个迭代阶段形成的聚合参数分布,作为对应的行为需求关系向量,另外,迭代阶段的数量不受限制,如2、3、4等数值。
可选地,在一些实施方式中,所述需求信息参数分布中的行分布参数与所述群体行为需求信息之间具有一一对应的关系(即所述需求信息参数分布中的一行,对应于一个群体行为需求信息),所述相关性参数分布中的行分布参数与所述群体行为需求信息之间具有一一对应的关系(即所述相关性参数分布中的一行,对应于一个群体行为需求信息),在所述需求信息参数分布和所述相关性参数分布中,同一行数目的行分布参数对应的群体行为需求信息一样,即所述需求信息参数分布中第一行对应的群体行为需求信息与所述相关性参数分布中第一行对应的群体行为需求信息一样,所述需求信息参数分布中第二行对应的群体行为需求信息与所述相关性参数分布中第二行对应的群体行为需求信息一样。基于此,所述对所述相关性参数分布和所述需求信息参数分布进行聚合,形成对应的第一个迭代阶段的聚合参数分布的步骤,可以包括:
对所述相关性参数分布和所述需求信息参数分布进行相乘运算,输出对应的第一参数分布;对所述第一参数分布和所述需求信息参数分布相加运算,输出对应的第二参数分布;将所述第二参数分布进行参数映射处理,如映射到区间0-1,具体的映射函数不受限制,形成第一个迭代阶段的聚合参数分布;也就是说,可按照矩阵相乘,将相关性参数分布和需求信息参数分布相乘,得到第一参数分布;对于第一参数分布中的每一行来说,在获取得到相关联的群体行为需求信息的信息后,自身的信息会丢失,因此,需要将第一参数分布与需求信息参数分布(即群体行为需求信息的向量化结果)进行叠加,以得到不仅包括自身群体行为需求信息的信息,还包括相关联的群体行为需求信息的信息的第二参数分布。
可选地,在一些实施方式中,步骤S150是利用群体行为需求分析网络执行的,所述群体行为需求分析网络还可以包括上述的第一数据挖掘网络、上述的第二数据挖掘网络、用于执行步骤S120的向量聚合网络、用于执行步骤S130的关系向量提取网络和用于执行步骤S150的需求信息估计网络;其中,所述应用于数字城市的数据挖掘方法还包括所述群体行为需求分析网络的网络更新步骤,该网络更新步骤可以包括:
提取到样本群体行为数据簇,所述样本群体行为数据簇包括多个训练第一群体行为数据、所述多个训练第一群体行为数据分别对应的训练第二群体行为数据和实际群体行为需求信息;
对于所述多个训练第一群体行为数据中的每一个训练第一群体行为数据,将该训练第一群体行为数据和相应的训练第二群体行为数据分别进行挖掘,输出对应的训练第一群体行为向量和训练第二群体行为向量,可以利用上述的第一数据挖掘网络和上述的第二数据挖掘网络实现;
将所述训练第一群体行为向量和训练第二群体行为向量进行聚合,形成对应的训练初始多维度行为向量,可以利用所述向量聚合网络实现;
提取到训练行为需求关系向量,所述训练行为需求关系向量包括训练行为需求关系图谱中多个训练群体行为需求信息分别对应的训练群体行为需求向量,对于每一个所述训练群体行为需求信息,该训练群体行为需求信息对应的训练群体行为需求向量包括该训练群体行为需求信息的语义向量和所述训练行为需求关系图谱中与该训练群体行为需求信息相关联的训练群体行为需求信息的语义向量,可以利用所述关系向量提取网络实现;
分别将所述训练行为需求关系向量中各训练群体行为需求向量与所述训练初始多维度行为向量进行聚合,如相乘,输出每一个所述训练群体行为需求信息对应的训练目标多维度行为向量;
基于每一个所述训练群体行为需求信息对应的训练目标多维度行为向量,在所述多个训练群体行为需求信息中,筛选出与所述训练第一群体行为数据相适配的估计群体行为需求信息,可以利用所述需求信息估计网络实现;示例性地,可以利用所述需求信息估计网络,分别对每一个所述训练目标多维度行为向量进行分析,得到对应的一个概率参数,该概率参数用于反映对应的训练群体行为需求信息属于真实的群体行为需求信息的概率(或者与所述训练第一群体行为数据(和所述训练第二群体行为数据)的适配程度),然后,可以将概率参数最大的训练群体行为需求信息,作为与所述训练第一群体行为数据(和所述训练第二群体行为数据)相适配的估计群体行为需求信息;示例性地,所述需求信息估计网络可以是多层感知器(Multilayer Perceptron, MLP),MLP 是一种前馈神经网络,它由多个全连接层组成,通过多层感知器处理之后,可以通过softmax等函数对多层感知器处理的结果进行处理,得到对应的概率参数;
基于所述估计群体行为需求信息和所述训练第一群体行为数据相对应的实际群体行为需求信息之间的区别,对所述群体行为需求分析网络的网络参数进行更新,形成更新后的群体行为需求分析网络;也就是说,可以基于所述估计群体行为需求信息和所述训练第一群体行为数据相对应的实际群体行为需求信息计算出相应的误差,然后,可以沿着降低该误差的方向,对所述群体行为需求分析网络的网络参数进行更新,即沿着使得所述估计群体行为需求信息与所述实际群体行为需求信息接近的方向,对所述群体行为需求分析网络的网络参数进行更新。
可选地,在一些实施方式中,在所述对于所述多个训练第一群体行为数据中的每一个训练第一群体行为数据,将该训练第一群体行为数据和相应的训练第二群体行为数据分别进行挖掘,输出对应的训练第一群体行为向量和训练第二群体行为向量的步骤以前,所述应用于数字城市的数据挖掘方法还可以包括:
统计出所述样本群体行为数据簇的簇数据量(包括的样本群体行为数据的数量)和所述多个训练群体行为需求信息的信息数量;
基于所述多个训练群体行为需求信息的信息数量,分析出网络学习复杂度;示例性地,所述网络学习复杂度可以与所述信息数量正相关;
得到候选第一数据挖掘网络(可以是历史上使用过的网络,如此,对候选第一数据挖掘网络进行迁移更新,相比于重新更新形成一个第一数据挖掘网络,可以减少更新的复杂度和减少更新时所耗费的资源),并基于所述样本群体行为数据簇的簇数据量和所述网络学习复杂度,选择出所述候选第一数据挖掘网络中的非失活部分,例如,所述簇数据量越大、所述网络学习复杂度越高,非失活部分可以越多,示例性地,所述候选第一数据挖掘网络可以包括多个先后连接的梯度优化单元和全连接单元;
利用所述样本群体行为数据簇,将所述候选第一数据挖掘网络进行网络学习和更新,使得所述候选第一数据挖掘网络中非失活部分的网络参数得以更新,形成更新后的第一数据挖掘网络,使得更新的效率提高、资源消耗降低;例如,可以仅对包括的全连接单元的网络参数进行更新,其它网络参数可以维持。
可选地,在一些实施方式中,所述利用所述样本群体行为数据簇,将所述候选第一数据挖掘网络进行网络学习和更新,使得所述候选第一数据挖掘网络中非失活部分的网络参数得以更新,形成更新后的第一数据挖掘网络的步骤,可以包括:
对于所述样本群体行为数据簇中的每一个训练第一群体行为数据,确定该训练第一群体行为数据的实际群体行为需求信息,该实际群体行为需求信息为概率分布,所述概率分布中的每一个概率参数分别对应于一个训练群体行为需求信息,且用于反映该训练第一群体行为数据是否与对应的训练群体行为需求信息相适配(如[0,1,0,0,0,0]);
基于所述概率分布中每一个概率参数的大小,得到每一个概率参数对应的概率参数更新规则,以及,基于每一个概率参数对应的概率参数更新规则,将所述概率分布中每一个概率参数进行更新,形成更新后的实际群体行为需求信息;也就是说,为了避免过拟合,提高网络的泛化能力,可在实际群体行为需求信息中施加一些噪声,得到[0.09,0.91,0.09,0.09,0.09,0.09];也就是说,在概率参数等于1的时候,对应的概率参数更新规则可以为1-x,x可以是一个配置的参数,如0.09等数值;在概率参数等于0的时候,对应的概率参数更新规则可以为0+x;
依据所述样本群体行为数据簇中每一个训练第一群体行为数据对应的更新后的实际群体行为需求信息,将所述候选第一数据挖掘网络进行网络学习和更新,使得所述候选第一数据挖掘网络中非失活部分的网络参数得以更新,形成更新后的第一数据挖掘网络,即计算更新后的实际群体行为需求信息和估计出的群体行为需求信息之间的误差,然后,沿着降低该误差的方向将所述候选第一数据挖掘网络进行网络学习和更新,其中,估计出的群体行为需求信息可以仅针对训练第一群体行为数据对应的向量进行估计得到,不用聚合训练第二群体行为数据对应的向量;相应的,对于所述第二数据挖掘网络,也可以单独依据训练第二群体行为数据进行更新。
可选地,在一些实施方式中,在所述基于所述估计群体行为需求信息和所述训练第一群体行为数据相对应的实际群体行为需求信息之间的区别,对所述群体行为需求分析网络的网络参数进行更新,形成更新后的群体行为需求分析网络的步骤以后,所述应用于数字城市的数据挖掘方法还可以进一步包括以下的步骤:
提取到验证群体行为数据簇,以及,利用更新后的群体行为需求分析网络,将所述验证群体行为数据簇中的验证群体行为数据进行群体行为需求信息的估计,形成对应的群体行为需求估计数据,所述验证群体行为数据包括验证第一群体行为数据和验证第二群体行为数据;
在所述群体行为需求估计数据的估计匹配程度小于预先确定的参考匹配程度(即估计的准确度、可靠度,所述参考匹配程度可以为0.9等数值)的时候,对所述样本群体行为数据簇中的训练第二群体行为数据和所述验证群体行为数据簇中的测试第二群体行为数据进行图像块分析,输出多个普遍性图像块,每一个所述普遍性图像块,属于在所述样本群体行为数据簇和所述验证群体行为数据簇中出现次数大于预先确定的参考次数的图像块,参考次数的具体数值不受限制,如5、7、10等数值;
在配置的多个行为数据库中,提取到所述多个普遍性图像块各自适配的相关群体行为数据,并作为扩展的训练第一群体行为数据,所述相关群体行为数据与所述训练第一群体行为数据的数据维度一致,在所述训练第二群体行为数据属于图像数据的时候,所述训练第一群体行为数据的数据维度包括文本,如所述相关群体行为数据和所述普遍性图像块对应的训练第二群体行为数据属于对同一个群体的行为描述;
依据所述样本群体行为数据簇和所述扩展的训练第一群体行为数据,将所述更新后的群体行为需求分析网络进行更新,也就是说,在当前更新后的群体行为需求分析网络估计可靠度不高的时候,重新进行更新,而且,为了保障重新更新的可靠度,扩展了训练第一群体行为数据;其中,还需要对各补充训练第一群体行为数据进行标注处理,得到各补充训练第一群体行为数据对应的实际群体行为需求信息,并获取各补充训练第一群体行为数据各自对应的训练第二群体行为数据。
结合图3,本发明实施例还提供一种应用于数字城市的数据挖掘装置,可应用于上述应用于数字城市的数据挖掘系统。其中,所述应用于数字城市的数据挖掘装置可以包括:
群体行为挖掘模块,用于提取到待挖掘群体的第一群体行为数据和第二群体行为数据,以及,将所述第一群体行为数据和所述第二群体行为数据分别进行挖掘,输出对应的第一群体行为向量和第二群体行为向量,所述第一群体行为数据和所述第二群体行为数据用于从两个维度对所述待挖掘群体的城市行为进行描述,所述第一群体行为向量和所述第二群体行为向量用于从两个维度对所述待挖掘群体的城市行为语义进行表征;
第一向量聚合模块,用于将所述第一群体行为向量和所述第二群体行为向量进行聚合,形成对应的初始多维度行为向量;
需求关系向量提取模块,用于提取到行为需求关系向量,所述行为需求关系向量包括预先确定的行为需求关系图谱中多个群体行为需求信息各自对应的群体行为需求向量,对于每一个所述群体行为需求信息,该群体行为需求信息对应的群体行为需求向量包括该群体行为需求信息的语义向量和所述行为需求关系图谱中与该群体行为需求信息相关联的群体行为需求信息的语义向量;
第二向量聚合模块,用于分别将所述行为需求关系向量中的各群体行为需求向量和所述初始多维度行为向量进行聚合,输出每一个所述群体行为需求信息对应的目标多维度行为向量;
需求信息确定模块,用于基于每一个所述群体行为需求信息对应的目标多维度行为向量,在所述多个群体行为需求信息中,筛选出与所述待挖掘群体适配的目标群体行为需求信息,所述目标群体行为需求信息用于反映所述待挖掘群体的需求。
综上所述,本发明提供的应用于数字城市的数据挖掘方法及系统,提取到第一群体行为数据和第二群体行为数据,将第一群体行为数据和第二群体行为数据分别进行挖掘,输出第一群体行为向量和第二群体行为向量;将第一群体行为向量和第二群体行为向量进行聚合,形成初始多维度行为向量;提取到行为需求关系向量;分别将行为需求关系向量中的各群体行为需求向量和初始多维度行为向量进行聚合,输出目标多维度行为向量;基于每一个群体行为需求信息对应的目标多维度行为向量,在多个群体行为需求信息中,筛选出目标群体行为需求信息。基于前述的内容,由于群体行为需求信息对应的群体行为需求向量包括该群体行为需求信息的语义向量和行为需求关系图谱中与该群体行为需求信息相关联的群体行为需求信息的语义向量,使得群体行为需求向量的语义表征能力能够加强,即挖掘的依据语义更丰富,使得可以改善需求挖掘的可靠度相对不高的问题。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种应用于数字城市的数据挖掘方法,其特征在于,包括:
提取到待挖掘群体的第一群体行为数据和第二群体行为数据,以及,将所述第一群体行为数据和所述第二群体行为数据分别进行挖掘,输出对应的第一群体行为向量和第二群体行为向量,所述第一群体行为数据和所述第二群体行为数据用于从两个维度对所述待挖掘群体的城市行为进行描述,所述第一群体行为向量和所述第二群体行为向量用于从两个维度对所述待挖掘群体的城市行为语义进行表征;
将所述第一群体行为向量和所述第二群体行为向量进行聚合,形成对应的初始多维度行为向量;
提取到行为需求关系向量,所述行为需求关系向量包括预先确定的行为需求关系图谱中多个群体行为需求信息各自对应的群体行为需求向量,对于每一个所述群体行为需求信息,该群体行为需求信息对应的群体行为需求向量包括该群体行为需求信息的语义向量和所述行为需求关系图谱中与该群体行为需求信息相关联的群体行为需求信息的语义向量;
分别将所述行为需求关系向量中的各群体行为需求向量和所述初始多维度行为向量进行聚合,输出每一个所述群体行为需求信息对应的目标多维度行为向量;
基于每一个所述群体行为需求信息对应的目标多维度行为向量,在所述多个群体行为需求信息中,筛选出与所述待挖掘群体适配的目标群体行为需求信息,所述目标群体行为需求信息用于反映所述待挖掘群体的需求。
2.如权利要求1所述的应用于数字城市的数据挖掘方法,其特征在于,所述提取到待挖掘群体的第一群体行为数据和第二群体行为数据,以及,将所述第一群体行为数据和所述第二群体行为数据分别进行挖掘,输出对应的第一群体行为向量和第二群体行为向量的步骤,包括:
提取到待挖掘群体的第一群体行为数据和第二群体行为数据;
获得第一数据挖掘网络,所述第一数据挖掘网络包括多个先后连接的梯度优化单元;
利用所述第一数据挖掘网络中的第一个梯度优化单元,将所述第一群体行为数据进行挖掘,输出对应的原始第一群体行为向量;
对于第一个迭代阶段以后的每一个迭代阶段,将该迭代阶段作为目前迭代阶段,并在所述第一数据挖掘网络中,确定出与所述目前迭代阶段相对应的目前梯度优化单元;
利用所述目前梯度优化单元,将前一个梯度优化单元对应的原始第一群体行为向量进行挖掘,输出对应的候选第一群体行为向量;
对所述前一个梯度优化单元对应的原始第一群体行为向量与所述候选第一群体行为向量进行相加运算,实现梯度优化,以形成所述目前梯度优化单元对应的原始第一群体行为向量;
基于最后一个迭代阶段形成的原始第一群体行为向量,得到所述第一群体行为数据对应的第一群体行为向量;
将所述第二群体行为数据进行挖掘,输出对应的第二群体行为向量。
3.如权利要求2所述的应用于数字城市的数据挖掘方法,其特征在于,所述将所述第二群体行为数据进行挖掘,输出对应的第二群体行为向量的步骤,包括:
针对所述第二群体行为数据中的每一个群体行为监控图像,将该群体行为监控图像作为待处理图像,以及,将该待处理图像的帧序号进行向量化处理,形成与所述待处理图像对应的图像帧序号向量,所述第二群体行为数据属于通过图像监控设备采集形成的图像数据;
针对所述待处理图像中的每一个图像块,将该图像块作为待处理图像块,并确定所述待处理图像块在所述待处理图像中的分布坐标,以及,将所述分布坐标进行向量化处理,形成与所述待处理图像块对应的分布坐标向量;
将所述待处理图像块进行向量化处理,形成与所述待处理图像块对应的图像块向量,以及,基于与所述待处理图像对应的图像帧序号向量、与所述待处理图像块对应的分布坐标向量、与所述待处理图像块对应的图像块向量,确定出与所述待处理图像块对应的图像块挖掘向量;
基于所述第二群体行为数据中各图像块分别对应的图像块挖掘向量,得到所述第二群体行为数据的第二群体行为向量。
4.如权利要求1所述的应用于数字城市的数据挖掘方法,其特征在于,所述基于每一个所述群体行为需求信息对应的目标多维度行为向量,在所述多个群体行为需求信息中,筛选出与所述待挖掘群体适配的目标群体行为需求信息的步骤,是利用群体行为需求分析网络执行的;所述应用于数字城市的数据挖掘方法还包括所述群体行为需求分析网络的网络更新步骤,该网络更新步骤包括:
提取到样本群体行为数据簇,所述样本群体行为数据簇包括多个训练第一群体行为数据、所述多个训练第一群体行为数据分别对应的训练第二群体行为数据和实际群体行为需求信息;
对于所述多个训练第一群体行为数据中的每一个训练第一群体行为数据,将该训练第一群体行为数据和相应的训练第二群体行为数据分别进行挖掘,输出对应的训练第一群体行为向量和训练第二群体行为向量;
将所述训练第一群体行为向量和训练第二群体行为向量进行聚合,形成对应的训练初始多维度行为向量;
提取到训练行为需求关系向量,所述训练行为需求关系向量包括训练行为需求关系图谱中多个训练群体行为需求信息分别对应的训练群体行为需求向量,对于每一个所述训练群体行为需求信息,该训练群体行为需求信息对应的训练群体行为需求向量包括该训练群体行为需求信息的语义向量和所述训练行为需求关系图谱中与该训练群体行为需求信息相关联的训练群体行为需求信息的语义向量;
分别将所述训练行为需求关系向量中各训练群体行为需求向量与所述训练初始多维度行为向量进行聚合,输出每一个所述训练群体行为需求信息对应的训练目标多维度行为向量;
基于每一个所述训练群体行为需求信息对应的训练目标多维度行为向量,在所述多个训练群体行为需求信息中,筛选出与所述训练第一群体行为数据相适配的估计群体行为需求信息;
基于所述估计群体行为需求信息和所述训练第一群体行为数据相对应的实际群体行为需求信息之间的区别,对所述群体行为需求分析网络的网络参数进行更新,形成更新后的群体行为需求分析网络。
5.如权利要求4所述的应用于数字城市的数据挖掘方法,其特征在于,所述群体行为需求分析网络包括第一数据挖掘网络,在所述对于所述多个训练第一群体行为数据中的每一个训练第一群体行为数据,将该训练第一群体行为数据和相应的训练第二群体行为数据分别进行挖掘,输出对应的训练第一群体行为向量和训练第二群体行为向量的步骤以前,所述应用于数字城市的数据挖掘方法还包括:
统计出所述样本群体行为数据簇的簇数据量和所述多个训练群体行为需求信息的信息数量;
基于所述多个训练群体行为需求信息的信息数量,分析出网络学习复杂度;
得到候选第一数据挖掘网络,并基于所述样本群体行为数据簇的簇数据量和所述网络学习复杂度,选择出所述候选第一数据挖掘网络中的非失活部分;
利用所述样本群体行为数据簇,将所述候选第一数据挖掘网络进行网络学习和更新,使得所述候选第一数据挖掘网络中非失活部分的网络参数得以更新,形成更新后的第一数据挖掘网络。
6.如权利要求5所述的应用于数字城市的数据挖掘方法,其特征在于,所述利用所述样本群体行为数据簇,将所述候选第一数据挖掘网络进行网络学习和更新,使得所述候选第一数据挖掘网络中非失活部分的网络参数得以更新,形成更新后的第一数据挖掘网络的步骤,包括:
对于所述样本群体行为数据簇中的每一个训练第一群体行为数据,确定该训练第一群体行为数据的实际群体行为需求信息,该实际群体行为需求信息为概率分布,所述概率分布中的每一个概率参数分别对应于一个训练群体行为需求信息,且用于反映该训练第一群体行为数据是否与对应的训练群体行为需求信息相适配;
基于所述概率分布中每一个概率参数的大小,得到每一个概率参数对应的概率参数更新规则;
基于每一个概率参数对应的概率参数更新规则,将所述概率分布中每一个概率参数进行更新,形成更新后的实际群体行为需求信息;
依据所述样本群体行为数据簇中每一个训练第一群体行为数据对应的更新后的实际群体行为需求信息,将所述候选第一数据挖掘网络进行网络学习和更新,使得所述候选第一数据挖掘网络中非失活部分的网络参数得以更新,形成更新后的第一数据挖掘网络。
7.如权利要求4所述的应用于数字城市的数据挖掘方法,其特征在于,在所述基于所述估计群体行为需求信息和所述训练第一群体行为数据相对应的实际群体行为需求信息之间的区别,对所述群体行为需求分析网络的网络参数进行更新,形成更新后的群体行为需求分析网络的步骤以后,所述应用于数字城市的数据挖掘方法还包括:
提取到验证群体行为数据簇,以及,利用更新后的群体行为需求分析网络,将所述验证群体行为数据簇中的验证群体行为数据进行群体行为需求信息的估计,形成对应的群体行为需求估计数据,所述验证群体行为数据包括验证第一群体行为数据和验证第二群体行为数据;
在所述群体行为需求估计数据的估计匹配程度小于预先确定的参考匹配程度的时候,对所述样本群体行为数据簇中的训练第二群体行为数据和所述验证群体行为数据簇中的测试第二群体行为数据进行图像块分析,输出多个普遍性图像块,每一个所述普遍性图像块,属于在所述样本群体行为数据簇和所述验证群体行为数据簇中出现次数大于预先确定的参考次数的图像块;
在配置的多个行为数据库中,提取到所述多个普遍性图像块各自适配的相关群体行为数据,并作为扩展的训练第一群体行为数据,所述相关群体行为数据与所述训练第一群体行为数据的数据维度一致,在所述训练第二群体行为数据属于图像数据的时候,所述训练第一群体行为数据的数据维度包括文本;
依据所述样本群体行为数据簇和所述扩展的训练第一群体行为数据,将所述更新后的群体行为需求分析网络进行更新。
8.如权利要求1-7任意一项所述的应用于数字城市的数据挖掘方法,其特征在于,在所述提取到行为需求关系向量的步骤以前,所述应用于数字城市的数据挖掘方法还包括:
提取到行为需求关系图谱,所述行为需求关系图谱包括多个群体行为需求信息,且具有相关关系的群体行为需求信息之间配置有连接边;
基于所述行为需求关系图谱,确定出对应的需求信息参数分布和相关性参数分布,所述需求信息参数分布包括所述多个群体行为需求信息各自对应的需求信息表征向量,所述相关性参数分布用于反映所述多个群体行为需求信息之间的相关关系信息;
对所述相关性参数分布和所述需求信息参数分布进行聚合,形成对应的第一个迭代阶段的聚合参数分布;
对于第一个迭代阶段以后的每一个迭代阶段,将前一个迭代阶段形成的聚合参数分布和所述相关性参数分布进行聚合,形成目前迭代阶段对应的聚合参数分布;
基于最后一个迭代阶段形成的聚合参数分布,得到行为需求关系向量。
9.如权利要求8所述的应用于数字城市的数据挖掘方法,其特征在于,所述需求信息参数分布中的行分布参数与所述群体行为需求信息之间具有一一对应的关系,所述相关性参数分布中的行分布参数与所述群体行为需求信息之间具有一一对应的关系,在所述需求信息参数分布和所述相关性参数分布中,同一行数目的行分布参数对应的群体行为需求信息一样;
所述对所述相关性参数分布和所述需求信息参数分布进行聚合,形成对应的第一个迭代阶段的聚合参数分布的步骤,包括:
对所述相关性参数分布和所述需求信息参数分布进行相乘运算,输出对应的第一参数分布;
对所述第一参数分布和所述需求信息参数分布相加运算,输出对应的第二参数分布;
将所述第二参数分布进行参数映射处理,形成第一个迭代阶段的聚合参数分布。
10.一种应用于数字城市的数据挖掘系统,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以实现权利要求1-9任意一项所述的应用于数字城市的数据挖掘方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311714591.4A CN117421459B (zh) | 2023-12-14 | 2023-12-14 | 应用于数字城市的数据挖掘方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311714591.4A CN117421459B (zh) | 2023-12-14 | 2023-12-14 | 应用于数字城市的数据挖掘方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117421459A CN117421459A (zh) | 2024-01-19 |
CN117421459B true CN117421459B (zh) | 2024-02-23 |
Family
ID=89523315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311714591.4A Active CN117421459B (zh) | 2023-12-14 | 2023-12-14 | 应用于数字城市的数据挖掘方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117421459B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102812486A (zh) * | 2010-03-25 | 2012-12-05 | 诺基亚公司 | 根据群体行为提供个性化信息资源推荐的方法和设备 |
CN112328801A (zh) * | 2020-09-28 | 2021-02-05 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 事件知识图谱预测群体性事件的方法 |
CN115221396A (zh) * | 2021-04-21 | 2022-10-21 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置及电子设备 |
CN116109121A (zh) * | 2023-04-17 | 2023-05-12 | 西昌学院 | 基于大数据分析的用户需求挖掘方法及系统 |
CN116304289A (zh) * | 2022-11-21 | 2023-06-23 | 北京邮电大学 | 基于图神经网络的供应链的信息链推荐方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120137367A1 (en) * | 2009-11-06 | 2012-05-31 | Cataphora, Inc. | Continuous anomaly detection based on behavior modeling and heterogeneous information analysis |
-
2023
- 2023-12-14 CN CN202311714591.4A patent/CN117421459B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102812486A (zh) * | 2010-03-25 | 2012-12-05 | 诺基亚公司 | 根据群体行为提供个性化信息资源推荐的方法和设备 |
CN112328801A (zh) * | 2020-09-28 | 2021-02-05 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 事件知识图谱预测群体性事件的方法 |
CN115221396A (zh) * | 2021-04-21 | 2022-10-21 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置及电子设备 |
CN116304289A (zh) * | 2022-11-21 | 2023-06-23 | 北京邮电大学 | 基于图神经网络的供应链的信息链推荐方法及装置 |
CN116109121A (zh) * | 2023-04-17 | 2023-05-12 | 西昌学院 | 基于大数据分析的用户需求挖掘方法及系统 |
Non-Patent Citations (3)
Title |
---|
A novel Sequence-Aware personalized recommendation system based on multidimensional information;A. Noorian et al.;《Expert Systems with Applications》;20220915;1-17 * |
基于跨平台移动用户数据的行为预测;王英子;《中国博士学位论文全文数据库 信息科技辑》;20190115;I138-72 * |
面向群体行为识别的注意力池化机制;李定 等;《中国科学:信息科学》;20210225;399-412 * |
Also Published As
Publication number | Publication date |
---|---|
CN117421459A (zh) | 2024-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11574139B2 (en) | Information pushing method, storage medium and server | |
CN108629224B (zh) | 信息呈现方法和装置 | |
CN110363213B (zh) | 服装图像的认知分析和分类的方法和系统 | |
CN111784455A (zh) | 一种物品推荐方法及推荐设备 | |
CN109345302A (zh) | 机器学习模型训练方法、装置、存储介质和计算机设备 | |
CN112380449B (zh) | 信息推荐方法、模型训练方法及相关装置 | |
CN111225009B (zh) | 用于生成信息的方法和装置 | |
CN110264277B (zh) | 由计算设备执行的数据处理方法及装置、介质和计算设备 | |
CN112487199A (zh) | 一种基于用户购买行为的用户特征预测方法 | |
CN113761359B (zh) | 数据包推荐方法、装置、电子设备和存储介质 | |
CN112036987B (zh) | 确定推荐商品的方法和装置 | |
CN117421459B (zh) | 应用于数字城市的数据挖掘方法及系统 | |
CN113793160B (zh) | 投放数据处理方法、装置、设备及存储介质 | |
CN113298145A (zh) | 标签填充方法及装置 | |
CN111291795A (zh) | 人群特征分析方法、装置、存储介质和计算机设备 | |
CN116910357A (zh) | 一种数据处理方法及相关装置 | |
CN113516524B (zh) | 用于推送信息的方法和装置 | |
CN109710853A (zh) | 一种人工智能分类匹配方法及系统 | |
CN110457572B (zh) | 基于图网络的商品信息推荐方法及电子设备 | |
CN114969550A (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN113822691A (zh) | 用户账号的识别方法、装置、系统和介质 | |
CN116664240B (zh) | 基于图神经网络的购物行为预测方法、系统、存储介质及终端 | |
Liu et al. | An improved matrix factorization model under multidimensional context situation | |
CN116523587A (zh) | 一种数据处理方法及相关装置 | |
CN116910604A (zh) | 用户分类方法、装置、计算机设备、存储介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |