CN117149986A - 基于多级数据通道的实时大数据处理方法及系统 - Google Patents
基于多级数据通道的实时大数据处理方法及系统 Download PDFInfo
- Publication number
- CN117149986A CN117149986A CN202311425414.4A CN202311425414A CN117149986A CN 117149986 A CN117149986 A CN 117149986A CN 202311425414 A CN202311425414 A CN 202311425414A CN 117149986 A CN117149986 A CN 117149986A
- Authority
- CN
- China
- Prior art keywords
- session
- interaction description
- knowledge
- vector
- description knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 383
- 230000003993 interaction Effects 0.000 claims abstract description 381
- 230000000694 effects Effects 0.000 claims abstract description 50
- 230000006399 behavior Effects 0.000 claims description 170
- 238000000034 method Methods 0.000 claims description 89
- 238000012545 processing Methods 0.000 claims description 85
- 238000009826 distribution Methods 0.000 claims description 43
- 238000005065 mining Methods 0.000 claims description 42
- 230000002441 reversible effect Effects 0.000 claims description 23
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000012512 characterization method Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 7
- 230000010354 integration Effects 0.000 claims description 5
- 238000013139 quantization Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 33
- 238000004458 analytical method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000003860 storage Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例涉及大数据技术领域,提供一种基于多级数据通道的实时大数据处理方法及系统。应用本发明实施例,将涵盖目标用户活动事件的实时业务会话数据流拆解成若干个通道阶段数据集,鉴于若干个通道阶段数据集对目标用户活动事件的业务需求决策观点的协作贡献,对于每个通道阶段数据集的多模态局部会话交互描述知识,都将若干个多模态局部会话交互描述知识叠加到该多模态局部会话交互描述知识中,可以确保多模态局部会话交互描述知识的全面嵌入,以保障会话行为嵌入向量的内容表达丰富程度和准确度,这样可以基于特征质量更佳的会话行为嵌入向量来确定业务需求决策观点,以确保针对目标用户活动事件的业务需求决策精度和可解释性。
Description
技术领域
本发明涉及大数据技术领域,特别涉及一种基于多级数据通道的实时大数据处理方法及系统。
背景技术
多级数据通道(Multi-tier Data Channels)是一种处理和管理数据流的方法,其中数据在从源头到目标的过程中通过多个处理和传输阶段。这些阶段可能包括数据的采集、预处理、存储、分析等步骤,每个阶段都可以被看作是一个独立的“通道”。
在多级数据通道模型中,每一级都具有特定的功能和责任。例如:数据采集:负责从各种源(如数据库、应用程序、网络、传感器等)收集原始数据;数据预处理:对收集到的数据进行清洗、格式化、验证等操作,以确保其质量和可用性;数据存储:将预处理后的数据保存在适当的存储系统(如数据库或数据仓库)中,以便后续处理和分析;数据分析:使用各种工具和技术(如SQL查询、数据挖掘、机器学习等)对存储的数据进行分析,提取有价值的信息和洞见;数据展示:将分析结果以易于理解的方式(如报表、图表、仪表板等)呈现给用户。
通过将整个数据处理流程划分为多个阶段,多级数据通道不仅可以使数据处理更加有序和高效,而且还可以方便地对每个阶段进行单独的优化和调整。在实际应用过程中,多级数据通道可以应用在业务需求挖掘任务下,但是传统技术在进行业务需求挖掘时存在精度不高的问题。
发明内容
为改善相关技术中存在的技术问题,本发明提供了一种基于多级数据通道的实时大数据处理方法及系统。
第一方面,本发明实施例提供了一种基于多级数据通道的实时大数据处理方法,应用于大数据处理系统,所述方法包括:
将涵盖目标用户活动事件的实时业务会话数据流拆解成若干个通道阶段数据集,分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识;
依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,所述第一多模态局部会话交互描述知识为所述若干个多模态局部会话交互描述知识中的任一个,所述若干个第二多模态局部会话交互描述知识包括所述第一多模态局部会话交互描述知识以及最少一个除所述第一多模态局部会话交互描述知识以外的剩余多模态局部会话交互描述知识;
依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点。
在一些方案中,所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:
对所述第一多模态局部会话交互描述知识的会话索引向量以及每个第二多模态局部会话交互描述知识的会话标识向量和会话属性向量进行特征混淆,得到所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
在一些方案中,所述对所述第一多模态局部会话交互描述知识的会话索引向量以及每个第二多模态局部会话交互描述知识的会话标识向量和会话属性向量进行特征混淆,得到所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:
依据所述第一多模态局部会话交互描述知识的会话索引向量和每个第二多模态局部会话交互描述知识的会话标识向量,确定所述第一多模态局部会话交互描述知识与每个所述第二多模态局部会话交互描述知识之间的特征牵涉分值;
基于所述若干个第二多模态局部会话交互描述知识分别对应的若干个特征牵涉分值,对所述若干个第二多模态局部会话交互描述知识的会话属性向量进行量化集成,得到所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
在一些方案中,所述多模态局部会话交互描述知识的会话索引向量、会话标识向量和会话属性向量依据第一变量关系列表得到,所述方法还包括:
在存在若干个第一变量关系列表的基础上,将依据所述若干个第一变量关系列表分别所得的、所述第一多模态局部会话交互描述知识对应的若干个会话行为嵌入向量进行特征组合和特征下采样,得到所述第一多模态局部会话交互描述知识对应的已优化会话行为嵌入向量。
在一些方案中,所述若干个第二多模态局部会话交互描述知识包括所述第一多模态局部会话交互描述知识以及所述第一多模态局部会话交互描述知识的多模态关联会话交互描述知识,所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括:
依据第一通道阶段数据集在所述实时业务会话数据流中的第一分布标签,确定与所述第一分布标签关联的第二分布标签,其中,所述第一多模态局部会话交互描述知识是对所述第一通道阶段数据集进行会话交互描述挖掘所得的;
将对应于所述第二分布标签的第二通道阶段数据集对应的多模态局部会话交互描述知识,确定为所述多模态关联会话交互描述知识。
在一些方案中,所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括:
针对所述若干个通道阶段数据集中的每个通道阶段数据集,对所述通道阶段数据集的分布标签信息进行特征映射,得到分布表征变量,将所述分布表征变量叠加到所述通道阶段数据集的多模态局部会话交互描述知识,所述分布标签信息用于反映所述通道阶段数据集在所述实时业务会话数据流中的分布标签。
在一些方案中,所述依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点,包括:
依据原始分类判别向量,确定第一基础会话索引向量,对所述第一基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到会话向量混淆结果,所述原始分类判别向量用于指示启动特征混淆处理;
依据所述原始分类判别向量和既有会话向量混淆结果,确定第二基础会话索引向量,对所述第二基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到后一个会话向量混淆结果,直到所得的会话向量混淆结果提示完成特征混淆;
依据既有若干个会话向量混淆结果,确定所述目标用户活动事件的业务需求决策观点。
在一些方案中,所述依据所述原始分类判别向量和既有会话向量混淆结果,确定第二基础会话索引向量,包括:
依据最新的既有会话向量混淆结果的会话索引向量和所述原始分类判别向量的会话标识向量,确定所述原始分类判别向量对应的特征牵涉分值,以及,依据所述最新的既有会话向量混淆结果的会话索引向量和每个既有会话向量混淆结果的会话标识向量,确定每个既有会话向量混淆结果对应的特征牵涉分值;
基于所述原始分类判别向量对应的特征牵涉分值和每个既有会话向量混淆结果对应的特征牵涉分值,对所述原始分类判别向量的会话属性向量和每个既有会话向量混淆结果的会话属性向量进行量化集成,得到所述第二基础会话索引向量。
在一些方案中,所述分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识,包括:
调整每个所述通道阶段数据集的原始会话交互描述知识关系网的特征规模,直到得到目标特征规模的会话交互描述知识关系网;
将所述目标特征规模的会话交互描述知识关系网调整为特征规模为1维的多模态局部会话交互描述知识。
在一些方案中,每个所述多模态局部会话交互描述知识的描述层面数为第一个数,所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括:
对每个所述多模态局部会话交互描述知识进行滑窗可逆处理,得到滑窗可逆处理后的多模态局部会话交互描述知识,所述滑窗可逆处理后的多模态局部会话交互描述知识的描述层面数为第二个数,所述第二个数小于所述第一个数;
所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:
依据滑窗可逆处理后的第一多模态局部会话交互描述知识和若干个滑窗可逆处理后的第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
在一些方案中,所述若干个多模态局部会话交互描述知识基于每个所述多模态局部会话交互描述知识对应的通道阶段数据集在所述实时业务会话数据流中的分布标签排列,形成所述实时业务会话数据流的会话交互描述知识关系网,所述会话交互描述知识关系网的描述层面数为第一个数;
所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括:
对所述实时业务会话数据流的会话交互描述知识关系网进行滑窗可逆处理,得到滑窗可逆处理后的会话交互描述知识关系网,所述滑窗可逆处理后的会话交互描述知识关系网的描述层面数为第二个数,所述第二个数小于所述第一个数;
所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:
依据所述滑窗可逆处理后的会话交互描述知识关系网中的第一多模态局部会话交互描述知识和所述滑窗可逆处理后的会话交互描述知识关系网中的若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
在一些方案中,业务需求决策算法包括会话交互描述挖掘分支和专家知识处理分支,所述专家知识处理分支包括特征挖掘组件和观点决策组件;
所述分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识,包括:根据所述会话交互描述挖掘分支,分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识;
所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:根据所述特征挖掘组件,依据所述第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量;
所述依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点,包括:根据所述观点决策组件,依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点。
在一些方案中,所述专家知识处理分支还包括知识译码组件,所述知识译码组件包括焦点化处理节点和特征混淆节点;
所述依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点,包括:
根据所述焦点化处理节点,依据原始分类判别向量,确定第一基础会话索引向量;
根据所述特征混淆节点,对所述第一基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到会话向量混淆结果,所述原始分类判别向量用于指示启动特征混淆处理;
根据所述焦点化处理节点,依据所述原始分类判别向量和既有会话向量混淆结果,确定第二基础会话索引向量;
根据所述特征混淆节点,对所述第二基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到后一个会话向量混淆结果;直到所得的会话向量混淆结果提示完成特征混淆;
根据所述观点决策组件,依据既有若干个会话向量混淆结果,确定所述目标用户活动事件的业务需求决策观点。
在一些方案中,所述专家知识处理分支的调试步骤包括:
获取过往实时业务会话数据流的若干个多模态局部会话交互描述知识以及所述过往实时业务会话数据流对应的调试学习依据,所述调试学习依据用于反映所述目标用户活动事件的已认证需求决策观点;
根据所述专家知识处理分支,对所述过往实时业务会话数据流的若干个多模态局部会话交互描述知识进行处理,得到过往需求预测观点;
依据所述过往需求预测观点和所述调试学习依据,调试所述专家知识处理分支。
第二方面,本发明还提供了一种大数据处理系统,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
第三方面,本发明还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
本发明实施例提供的设计思路将涵盖目标用户活动事件的实时业务会话数据流拆解成若干个通道阶段数据集,鉴于若干个通道阶段数据集对目标用户活动事件的业务需求决策观点的协作贡献,对于每个通道阶段数据集的多模态局部会话交互描述知识,都将若干个多模态局部会话交互描述知识叠加到该多模态局部会话交互描述知识中,可以确保多模态局部会话交互描述知识的全面嵌入,以保障会话行为嵌入向量的内容表达丰富程度和准确度,这样可以基于特征质量更佳的会话行为嵌入向量来确定业务需求决策观点,以确保针对目标用户活动事件的业务需求决策精度和可解释性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是本发明实施例提供的一种基于多级数据通道的实时大数据处理方法的流程示意图。
图2是本发明实施例提供的一种基于多级数据通道的实时大数据处理方法在电力电子商品平台环境下的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与本发明的一些方面相一致的装置和方法的例子。
需要说明的是,本发明的说明书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本发明实施例所提供的方法实施例可以在大数据处理系统、计算机设备或者类似的运算装置中执行。以运行在大数据处理系统上为例,大数据处理系统可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器,可选地,上述大数据处理系统还可以包括用于通信功能的传输装置。本领域普通技术人员可以理解,上述结构仅为示意,其并不对上述大数据处理系统的结构造成限定。例如,大数据处理系统还可包括比上述所示更多或者更少的组件,或者具有与上述所示不同的配置。
存储器可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种基于多级数据通道的实时大数据处理方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至大数据处理系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括大数据处理系统的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
基于此,请参阅图1,图1是本发明实施例所提供的一种基于多级数据通道的实时大数据处理方法的流程示意图,该方法应用于大数据处理系统,进一步可以包括步骤110-步骤130。
步骤110、将涵盖目标用户活动事件的实时业务会话数据流拆解成若干个通道阶段数据集,分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识。
步骤110的主要目标是通过实时业务会话数据流的拆解和挖掘,获取对应用户行为和互动的知识。这涉及到以下几个概念:目标用户活动事件、实时业务会话数据流、通道阶段数据集、会话交互描述挖掘和多模态局部会话交互描述知识。
目标用户活动事件是指关注的用户在某一特定场景下的行为或活动。例如,在电力电子商品平台场景下,可以是用户浏览商品、添加购物车、完成支付等。
实时业务会话数据流指的是这些用户活动产生的连续数据流。如在电力电子商品平台环境下,用户在网站上的点击、滑动、搜索、购买等行为都会形成数据流。
通道阶段数据集是将实时业务会话数据流拆分为多个独立的阶段或环节。例如,在电力电子商品平台场景下,可以将用户从搜索商品到完成购买的整个过程拆解成搜索、浏览、加入购物车和支付等几个阶段。
会话交互描述挖掘是对每个通道阶段数据集进行深度分析,以理解其中包含的用户行为和交互模式。例如,通过分析电力电子商品平台用户在浏览阶段的行为,可以了解他们的兴趣和偏好。
多模态局部会话交互描述知识是通过以上步骤挖掘得到的关于各个阶段用户行为和交互的知识,它可以帮助理解用户在各个阶段的需求和行为模式,从而提供更好的服务。
进一步地,多模态局部会话交互描述知识是对每个通道阶段数据集的深度分析结果,它能揭示用户在不同阶段的行为和交互模式。以下是针对电力电子商品平台场景进行的进一步展开:
在电力电子商品平台场景下,在搜索阶段,多模态局部会话交互描述知识可以包括用户使用什么样的关键词进行搜索、搜索次数、搜索后点击的商品种类等信息。在浏览阶段,可以挖掘用户查看商品详情的时间、用户是否查看评论、用户对哪些商品类型感兴趣等信息。在购物车阶段,可以了解用户添加到购物车但未购买的商品、用户删除购物车中商品的频率等信息。在支付阶段,可以了解用户的支付方式、支付成功率等信息。
上述多模态局部会话交互描述知识为理解用户在各个阶段的需求和行为提供了有力的支持,从而可以优化业务流程。
在上述应用场景中,多模态局部会话交互描述知识可以被进一步转化为特征向量,
在电力电子商品平台场景中,对于用户在搜索阶段的行为,可以把关键词频率、搜索次数、点击商品种类数量等因素转化为特征向量。例如,一个用户搜索了10次,使用了3个关键词,点击了5种商品,那么这个阶段的特征向量可以就是[10,3,5]。
通过这种方式,可以将多模态局部会话交互描述知识转化为可量化的特征向量,这有助于进一步分析用户行为和优化业务流程。
步骤120、依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,所述第一多模态局部会话交互描述知识为所述若干个多模态局部会话交互描述知识中的任一个,所述若干个第二多模态局部会话交互描述知识包括所述第一多模态局部会话交互描述知识以及最少一个除所述第一多模态局部会话交互描述知识以外的剩余多模态局部会话交互描述知识。
步骤120中,第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识是针对同一业务流程的不同阶段得到的会话交互描述。这些描述可以帮助理解用户在每个阶段的行为模式。而会话行为嵌入向量则是将这些描述转化为可以进行数学运算的形式。
在电力电子商品平台场景中,例如,在商品搜索阶段,第一多模态局部会话交互描述知识可以包含用户的搜索关键词、搜索频率等信息,其对应的会话行为嵌入向量可以是[5,20](假设用户使用了5个关键词,搜索了20次)。然后,在浏览阶段,第二多模态局部会话交互描述知识可以包含用户查看商品详情的时间、是否查看评论等信息,其对应的会话行为嵌入向量可以是[30,1](假设用户查看每个商品的平均时间是30秒,查看了1次评论)。
步骤120的目标是通过对这些会话行为嵌入向量的分析,找出用户行为的模式和规律,以此来优化业务流程并提供更好的用户体验。
步骤130、依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点。
步骤130中的业务需求决策观点是根据上述会话行为嵌入向量确定的,它可以帮助理解用户的需求,并作出相应的决策。
步骤130的主要目标就是通过这样的方式,将用户行为和需求转化为具体可执行的业务决策,以提高服务质量和用户满意度。
请结合参阅图2,给出了在电力电子商品平台场景下所涉示例的框图说明。首先,实时业务会话数据流DATA包括用户在网站上的点击、滑动、搜索、购买等行为形成的,进一步地,可以用户从搜索商品到完成购买的整个过程拆解得到的阶段为搜索S1、浏览S2、加入购物车S3和支付S4(也即4个通道阶段数据集),然后在此基础上引入业务需求决策算法M来进行业务需求决策观点VIEW确定。
应用步骤110-步骤130,将涵盖目标用户活动事件的实时业务会话数据流拆解成若干个通道阶段数据集,鉴于若干个通道阶段数据集对目标用户活动事件的业务需求决策观点的协作贡献,对于每个通道阶段数据集的多模态局部会话交互描述知识,都将若干个多模态局部会话交互描述知识叠加到该多模态局部会话交互描述知识中,可以确保多模态局部会话交互描述知识的全面嵌入,以保障会话行为嵌入向量的内容表达丰富程度和准确度,这样可以基于特征质量更佳的会话行为嵌入向量来确定业务需求决策观点,以确保针对目标用户活动事件的业务需求决策精度和可解释性。
可见,应用上述技术方案,可以从大量的实时业务会话数据流中挖掘出有价值的信息,以便理解用户的需求、优化数字化业务流程、提升服务质量并促进数字化业务发展。
在一些可选的实施例中,步骤120中的所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括步骤1200。
步骤1200、对所述第一多模态局部会话交互描述知识的会话索引向量以及每个第二多模态局部会话交互描述知识的会话标识向量和会话属性向量进行特征混淆,得到所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
在步骤1200中,第一多模态局部会话交互描述知识的会话索引向量、每个第二多模态局部会话交互描述知识的会话标识向量和会话属性向量进行特征混淆,以得到会话行为嵌入向量。这里,会话索引向量可以指示了会话发生的时间序列或位置,会话标识向量可以描述了会话的类型或类别,而会话属性向量可以包含了会话的其他重要信息,如用户行为、反馈等。
在电力电子商品平台场景中,假设在搜索阶段,第一多模态局部会话交互描述知识的会话索引向量可以是[1](代表第一个阶段),会话标识向量可以是[0,1,0](表示这是一个搜索阶段,而非浏览或支付阶段),会话属性向量可以是[5,20](代表用户使用了5个关键词,搜索了20次)。通过特征混淆,可以得到一个综合了所有这些信息的会话行为嵌入向量。
步骤1200的主要目标就是将各个阶段的会话交互描述知识以更丰富、更细致的方式进行表达和利用,从而能够更好地理解用户行为,优化业务流程,提高服务质量。
在一些可以的设计思路下,步骤1200中的所述对所述第一多模态局部会话交互描述知识的会话索引向量以及每个第二多模态局部会话交互描述知识的会话标识向量和会话属性向量进行特征混淆,得到所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括步骤1201-步骤1202。
步骤1201、依据所述第一多模态局部会话交互描述知识的会话索引向量和每个第二多模态局部会话交互描述知识的会话标识向量,确定所述第一多模态局部会话交互描述知识与每个所述第二多模态局部会话交互描述知识之间的特征牵涉分值。
步骤1202、基于所述若干个第二多模态局部会话交互描述知识分别对应的若干个特征牵涉分值,对所述若干个第二多模态局部会话交互描述知识的会话属性向量进行量化集成,得到所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
在电力电子商品平台的应用场景中,我们可以运用该技术来处理多个第二多模态局部会话交互描述知识,并为其赋予特征牵涉分值。然后,我们将这些知识的会话属性向量进行量化集成,以生成第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
举例来说,在电力电子商品平台中,用户可能通过文本、语音、图像等多种方式与平台进行交互。每种交互方式都包含着一定的信息和特征。我们可以将每个局部会话交互描述知识的会话属性向量表示为多维特征空间中的一个点,并根据特征牵涉分值对这些点进行加权处理。然后,通过量化集成这些加权后的向量,我们可以得到第一多模态局部会话交互描述知识的会话行为嵌入向量。
这样的会话行为嵌入向量可以用于分析用户行为模式、推荐个性化商品、检测异常交互等任务。通过对多个局部会话交互描述知识进行综合分析,我们可以更全面地理解用户行为,提升电力电子商品平台的用户体验和商业价值。
在一些示例下,所述多模态局部会话交互描述知识的会话索引向量、会话标识向量和会话属性向量依据第一变量关系列表得到。基于此,所述方法还包括步骤210。
步骤210、在存在若干个第一变量关系列表的基础上,将依据所述若干个第一变量关系列表分别所得的、所述第一多模态局部会话交互描述知识对应的若干个会话行为嵌入向量进行特征组合和特征下采样,得到所述第一多模态局部会话交互描述知识对应的已优化会话行为嵌入向量。
在电力电子商品平台的应用场景中,我们可以利用多个第一变量关系列表来优化第一多模态局部会话交互描述知识对应的会话行为嵌入向量。通过这些关系列表,我们可以进行特征组合和特征下采样,以得到已优化的会话行为嵌入向量。
具体而言,在电力电子商品平台中,我们可能收集到了多种与用户行为相关的变量信息,如用户的购买记录、浏览历史、点击行为等。基于这些变量信息,我们可以建立多个第一变量关系列表,分别描述不同变量之间的关联性和重要性。
然后,根据这些关系列表,我们可以对第一多模态局部会话交互描述知识对应的会话行为嵌入向量进行特征组合。通过整合相关的特征,我们可以获得更丰富和准确的特征表示,提升对用户行为的理解和预测能力。
同时,我们还可以进行特征下采样,即从大量的特征中选择最相关和最具代表性的特征。这有助于减少特征空间的维度,并去除冗余信息,提高模型的效率和泛化能力。
通过特征组合和特征下采样,我们可以得到已优化的会话行为嵌入向量,更准确地描述和分析用户行为,为电力电子商品平台提供个性化推荐、用户分类等功能的支持。
在电力电子商品平台的应用场景中,我们可以利用多个第一变量关系列表来优化第一多模态局部会话交互描述知识对应的会话行为嵌入向量。通过这些关系列表,我们可以进行特征组合和特征下采样,以得到已优化的会话行为嵌入向量。
具体而言,在电力电子商品平台中,我们可能收集到了多种与用户行为相关的变量信息,如用户的购买记录、浏览历史、点击行为等。基于这些变量信息,我们可以建立多个第一变量关系列表,分别描述不同变量之间的关联性和重要性。
然后,根据这些关系列表,我们可以对第一多模态局部会话交互描述知识对应的会话行为嵌入向量进行特征组合。通过整合相关的特征,我们可以获得更丰富和准确的特征表示,提升对用户行为的理解和预测能力。
同时,我们还可以进行特征下采样,即从大量的特征中选择最相关和最具代表性的特征。这有助于减少特征空间的维度,并去除冗余信息,提高模型的效率和泛化能力。
通过特征组合和特征下采样,我们可以得到已优化的会话行为嵌入向量,更准确地描述和分析用户行为,为电力电子商品平台提供个性化推荐、用户分类等功能的支持。
假设我们有一个电力电子商品平台,想要通过特征组合和特征下采样来优化会话行为嵌入向量。以下是具体的应用场景说明:
1. 特征组合:
假设我们有用户的购买历史、浏览记录和点击行为作为特征。
我们可以使用加法操作将购买历史和浏览记录进行组合,得到一个表示用户对某个商品的兴趣程度的新特征。
另外,我们可以将购买历史与点击行为进行乘法操作,以获取用户在购买前是否有点击相关商品的行为。
2. 特征下采样:
在特征下采样过程中,我们需要评估特征的重要性。
可以使用随机森林算法进行特征重要性评估,得到每个特征的相对重要性分数。
根据重要性分数,选择最相关和最具代表性的特征进行保留,删除不相关或冗余的特征。
3. 组合和下采样后的特征集成:
将经过特征组合和特征下采样处理后的特征进行集成。
可以通过加权平均的方式将特征进行整合,其中权重可以根据特征的重要性分数来确定。
最终得到已优化的会话行为嵌入向量,该向量包含了经过组合和下采样处理后的关键特征信息。
例如,在电力电子商品平台中,我们可能发现用户的购买历史和浏览记录对于预测用户是否会点击某个广告是非常重要的。因此,我们可以通过将购买历史和浏览记录进行加法操作,得到一个表示用户兴趣程度的新特征。同时,我们也可能发现用户的点击行为与其购买行为之间存在一定的关联性。因此,我们可以使用乘法操作将购买历史与点击行为相结合,以获取用户在购买前是否有点击相关商品的行为。
接着,我们使用随机森林算法评估各个特征的重要性,并根据重要性分数选择最相关和最具代表性的特征进行保留。最后,将经过组合和下采样处理后的特征进行加权平均,得到已优化的会话行为嵌入向量,该向量能更好地反映用户的行为模式和偏好。
通过特征组合和特征下采样的优化过程,我们可以提高会话行为嵌入向量的表达能力和预测效果,从而为电力电子商品平台提供更精准的个性化推荐、用户分类等功能支持。
在步骤1201和1202中,首先根据会话索引向量和会话标识向量计算特征牵涉分值(特征关联度),然后基于这些分值对会话属性向量进行量化集成。
在电力电子商品平台场景中,假设在搜索阶段,第一多模态局部会话交互描述知识的会话索引向量和会话标识向量是[1,0,1,0],而在浏览阶段,第二多模态局部会话交互描述知识的会话索引向量和会话标识向量是[2,0,0,1]。可以使用某种方法(如余弦相似度)计算两者之间的特征牵涉分值。然后,基于这个分值,可以对浏览阶段的会话属性向量(例如[30,1])进行量化集成,得到搜索阶段的会话行为嵌入向量。
步骤1201-步骤1202的主要目标是将各个阶段的会话交互描述知识以更精细的方式进行融合,从而能够更好地理解用户行为,优化业务流程,提高服务质量。
在一些可以的实施例中,所述若干个第二多模态局部会话交互描述知识包括所述第一多模态局部会话交互描述知识以及所述第一多模态局部会话交互描述知识的多模态关联会话交互描述知识。基于此,步骤120所描述的所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括步骤311-步骤312。
步骤311、依据第一通道阶段数据集在所述实时业务会话数据流中的第一分布标签,确定与所述第一分布标签关联的第二分布标签,其中,所述第一多模态局部会话交互描述知识是对所述第一通道阶段数据集进行会话交互描述挖掘所得的。
步骤312、将对应于所述第二分布标签的第二通道阶段数据集对应的多模态局部会话交互描述知识,确定为所述多模态关联会话交互描述知识。
在此背景下,第一分布标签和第二分布标签可以被理解为用于标识实时业务会话数据流中的不同阶段或者会话的标签。例如,在电力电子商品平台场景中,第一分布标签可以对应搜索阶段,而第二分布标签可以对应浏览阶段。
在电力电子商品平台场景中,步骤311可以首先根据搜索阶段(第一通道阶段数据集)在实时业务会话数据流中的分布标签(第一分布标签),确定与其关联的分布标签(第二分布标签),这个关联的标签可以就是浏览阶段。接着,在步骤312中,对应于浏览阶段(第二通道阶段数据集)的多模态局部会话交互描述知识就被确定为多模态关联会话交互描述知识。
通过执行步骤311和步骤312,可以得到一个更完整、更全面的视图,揭示用户在业务流程中的行为模式,从而帮助优化服务和提高用户体验。
在步骤120所描述的所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括步骤410。
步骤410、针对所述若干个通道阶段数据集中的每个通道阶段数据集,对所述通道阶段数据集的分布标签信息进行特征映射,得到分布表征变量,将所述分布表征变量叠加到所述通道阶段数据集的多模态局部会话交互描述知识,所述分布标签信息用于反映所述通道阶段数据集在所述实时业务会话数据流中的分布标签。
其中,特征映射可以理解为一种将原始数据映射到新的特征空间的方法,以便于更好地提取信息和进行分析。分布表征变量则是通过特征映射得到的新的特征向量,它包含了原始数据的重要信息。叠加是指将这些新的特征向量添加到原始的多模态局部会话交互描述知识中,以丰富其表达能力。
在电力电子商品平台场景中,步骤410可以首先对搜索阶段(第一通道阶段数据集)的分布标签信息进行特征映射,得到一个新的分布表征变量。这个变量可以包含了搜索阶段在整个业务流程中的相对位置、频率等信息。然后,将这个分布表征变量叠加到搜索阶段的多模态局部会话交互描述知识中,以增强其对用户行为的表达能力。
通过执行步骤410,可以获得更丰富、更全面的会话交互描述知识,从而能够更好地理解用户在各个阶段的行为,优化业务流程,提高服务质量。
在一些优选的实施例中,步骤130中的所述依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点,包括步骤131-步骤133。
步骤131、依据原始分类判别向量,确定第一基础会话索引向量,对所述第一基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到会话向量混淆结果,所述原始分类判别向量用于指示启动特征混淆处理;
步骤132、依据所述原始分类判别向量和既有会话向量混淆结果,确定第二基础会话索引向量,对所述第二基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到后一个会话向量混淆结果,直到所得的会话向量混淆结果提示完成特征混淆。
步骤133、依据既有若干个会话向量混淆结果,确定所述目标用户活动事件的业务需求决策观点。
其中,原始分类判别向量可以理解为一个用于指示启动特征混淆处理的标签。基础会话索引向量可以是表示特定会话阶段或类型的向量。会话向量混淆结果是通过将基础会话索引向量与会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆得到的。既有会话向量混淆结果则是在多次特征混淆过程中已经获得的结果。
在电力电子商品平台场景中,步骤131可以首先依据原始分类判别向量确定搜索阶段(第一基础会话索引向量),然后对其以及搜索阶段的会话行为嵌入向量进行特征混淆,得到一个会话向量混淆结果。接着,在步骤132中,可以会根据原始分类判别向量和既有会话向量混淆结果确定浏览阶段(第二基础会话索引向量),并对其以及浏览阶段的会话行为嵌入向量进行特征混淆,得到另一个会话向量混淆结果。最后,在步骤133中,可以依据这些会话向量混淆结果来确定目标用户活动事件(例如购买行为)的业务需求决策观点。
通过执行步骤131-133,可以更精确地理解用户在各个阶段的行为,从而能够提出更准确、更有效的业务需求决策观点,进一步优化业务流程,提高服务质量。
在一些示例性设计思路中,步骤132中的所述依据所述原始分类判别向量和既有会话向量混淆结果,确定第二基础会话索引向量,包括步骤1321-步骤1322。
步骤1321、依据最新的既有会话向量混淆结果的会话索引向量和所述原始分类判别向量的会话标识向量,确定所述原始分类判别向量对应的特征牵涉分值,以及,依据所述最新的既有会话向量混淆结果的会话索引向量和每个既有会话向量混淆结果的会话标识向量,确定每个既有会话向量混淆结果对应的特征牵涉分值。
步骤1322、基于所述原始分类判别向量对应的特征牵涉分值和每个既有会话向量混淆结果对应的特征牵涉分值,对所述原始分类判别向量的会话属性向量和每个既有会话向量混淆结果的会话属性向量进行量化集成,得到所述第二基础会话索引向量。
在电力电子商品平台场景中,步骤1321可以首先依据最新的既有会话向量混淆结果(例如搜索阶段的会话向量混淆结果)的会话索引向量和原始分类判别向量(例如表示为浏览阶段的向量)的会话标识向量,确定原始分类判别向量对应的特征牵涉分值。同时,也可以依据最新的既有会话向量混淆结果的会话索引向量和每个既有会话向量混淆结果(例如搜索阶段、选择阶段等)的会话标识向量,确定每个既有会话向量混淆结果对应的特征牵涉分值。然后,在步骤1322中,基于这些特征牵涉分值,可以对原始分类判别向量的会话属性向量和每个既有会话向量混淆结果的会话属性向量进行量化集成,从而得到第二基础会话索引向量(可以是表示浏览阶段的新向量)。
在一些可以的实施例中,步骤110中的所述分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识,包括步骤111-步骤112。
步骤111、调整每个所述通道阶段数据集的原始会话交互描述知识关系网的特征规模,直到得到目标特征规模的会话交互描述知识关系网。
步骤112、将所述目标特征规模的会话交互描述知识关系网调整为特征规模为1维的多模态局部会话交互描述知识。
其中,原始会话交互描述知识关系网可以理解为描述用户在特定通道阶段中行为模式的知识网络,特征规模则表示这个知识网络的维度或复杂程度。
在电力电子商品平台场景中,步骤111可以首先调整搜索阶段(第一通道阶段数据集)的原始会话交互描述知识关系网的特征规模,这可以包括降维或增维操作,以便将知识关系网调整到目标特征规模。然后,在步骤112中,将目标特征规模的会话交互描述知识关系网进一步调整为特征规模为1维的多模态局部会话交互描述知识,即简化和抽象用户在搜索阶段的行为模式。
在电力电子商品平台的应用场景中,我们可以根据以下步骤来调整搜索阶段的原始会话交互描述知识关系网的特征规模:
1. 数据预处理:
首先,对于搜索阶段的原始会话交互描述知识,进行数据清洗和预处理。
可以去除缺失值、异常值等不可靠或无效的数据。
还可以对数据进行归一化或标准化,使得不同特征具有相同的尺度。
2. 降维操作:
如果目标是降低特征规模,可以使用降维技术将高维的原始特征转换为更低维的表示。
常用的降维方法包括主成分分析(PCA)、线性判别分析(LDA)等。
这些方法可以通过保留最重要的特征方向或提取最能区分类别的特征来实现降维。
3. 增维操作:
如果目标是增加特征规模,可以使用增维技术引入新的特征,丰富原始特征的表达能力。
增维可以通过特征工程方法来实现,如多项式特征、交互特征、统计特征等。
这些方法可以根据领域知识或数据的特点,构建新的特征以捕捉更多的信息和模式。
通过降维或增维操作,我们可以将搜索阶段的原始会话交互描述知识关系网调整到目标特征规模。降维可以帮助减少特征的数量,简化数据结构,并提高计算效率。而增维可以引入更多的特征,提供更丰富的信息,增强数据的表达能力。
这样的特征规模调整过程有助于优化数据的表示和分析,为电力电子商品平台提供更准确和全面的用户行为模式分析、个性化推荐等功能支持。
通过执行步骤111-112,可以得到更精确、更易于处理的会话交互描述知识,从而更好地理解用户在各个阶段的行为,优化业务流程,提高服务质量。
在一些示例下,每个所述多模态局部会话交互描述知识的描述层面数(通道数)为第一个数。基于此,步骤120所描述的所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括步骤510。
步骤510、对每个所述多模态局部会话交互描述知识进行滑窗可逆处理,得到滑窗可逆处理后的多模态局部会话交互描述知识,所述滑窗可逆处理后的多模态局部会话交互描述知识的描述层面数为第二个数,所述第二个数小于所述第一个数,滑窗可逆处理包括卷积处理。
基于此,步骤120所描述的所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:依据滑窗可逆处理后的第一多模态局部会话交互描述知识和若干个滑窗可逆处理后的第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
其中,描述层面数(通道数)可以理解为描述用户行为的特征维度或复杂程度。滑窗可逆处理是一种常见的数据预处理技术,包括卷积处理,用于从原始数据中提取有价值的特征,同时降低数据的维度。
在电力电子商品平台场景中,步骤510可以首先对搜索阶段(第一多模态局部会话交互描述知识)进行滑窗可逆处理,例如使用卷积神经网络(CNN)来提取用户搜索行为的关键特征,并减少描述层面数。然后,在步骤120中,可以依据滑窗可逆处理后的第一多模态局部会话交互描述知识(例如只包含关键搜索行为特征的描述知识),以及若干个滑窗可逆处理后的第二多模态局部会话交互描述知识(例如浏览、选择和购买阶段的描述知识),确定第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
通过上述内容,可以降低数据的复杂性,提高计算效率,同时保留有价值的信息,从而更好地理解用户在各个阶段的行为,优化业务流程,提高服务质量。
在一些示例下,所述若干个多模态局部会话交互描述知识基于每个所述多模态局部会话交互描述知识对应的通道阶段数据集在所述实时业务会话数据流中的分布标签排列,形成所述实时业务会话数据流的会话交互描述知识关系网,所述会话交互描述知识关系网的描述层面数为第一个数。基于此,步骤120所描述的所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括:对所述实时业务会话数据流的会话交互描述知识关系网进行滑窗可逆处理,得到滑窗可逆处理后的会话交互描述知识关系网,所述滑窗可逆处理后的会话交互描述知识关系网的描述层面数为第二个数,所述第二个数小于所述第一个数。进一步地,步骤120所描述的所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:依据所述滑窗可逆处理后的会话交互描述知识关系网中的第一多模态局部会话交互描述知识和所述滑窗可逆处理后的会话交互描述知识关系网中的若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
在电力电子商品平台场景中,实时业务会话数据流可以包括用户的搜索、浏览、选择和购买行为。多模态局部会话交互描述知识对应的通道阶段数据集可以是这些行为在实时业务会话数据流中的分布标签排列,例如,先搜索商品,然后浏览详情,接着选择商品,最后进行购买。会话交互描述知识关系网则可以是一个图或网络,描述了这些行为之间的关系。滑窗可逆处理可以通过卷积神经网络(CNN)等方法将描述层面数从第一个数降低到第二个数,即从较高维度的数据降至低维度,以提高计算效率并保留重要信息。之后,依据滑窗可逆处理后的会话交互描述知识关系网中的各阶段描述知识,确定第一多模态局部会话交互描述知识(例如搜索阶段的描述知识)对应的会话行为嵌入向量。
通过这种方式,可以有效地降低数据的复杂性,同时在捕获用户行为的关键特征方面仍然保持精确,进而优化业务流程,提高服务质量。
在一些示例性实施例中,还提供了一种业务需求决策算法,业务需求决策算法包括会话交互描述挖掘分支和专家知识处理分支,所述专家知识处理分支包括特征挖掘组件和观点决策组件。则步骤110中的所述分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识,包括:根据所述会话交互描述挖掘分支,分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识。则步骤120中的所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:根据所述特征挖掘组件,依据所述第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。则步骤130中的所述依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点,包括:根据所述观点决策组件,依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点。
在上述业务需求决策算法中,会话交互描述挖掘分支、专家知识处理分支、特征挖掘组件和观点决策组件都是关键的部分。他们共同协作以从大量的用户行为数据中提取有价值的信息,以此来确定业务需求决策观点。
会话交互描述挖掘分支负责对多个通道阶段数据集进行会话交互描述挖掘,从而得到多模态局部会话交互描述知识。例如,在电力电子商品平台环境中,这可以包括从用户的搜索、浏览、选择和购买行为中提取关键信息,并将这些信息转化为描述知识。
专家知识处理分支由特征挖掘组件和观点决策组件组成,主要负责从多模态局部会话交互描述知识中提取特征,并基于这些特征来做出业务需求决策。
特征挖掘组件的任务是根据第一多模态局部会话交互描述知识(例如用户在电力电子商品平台环境中的搜索行为)和若干个第二多模态局部会话交互描述知识(例如用户的浏览、选择和购买行为),确定第一多模态局部会话交互描述知识对应的会话行为嵌入向量。这个嵌入向量可以被看作是一个压缩并且包含了原始数据中所有有用信息的表示。
就观点决策组件而言,依据特征挖掘组件得到的若干个会话行为嵌入向量,该组件负责确定目标用户活动事件的业务需求决策观点。例如,在电力电子商品平台环境中,如果用户的搜索、浏览和购买行为显示出对某种商品的强烈兴趣,那么观点决策组件可以会建议将更多此类商品推荐给用户。
通过以上步骤,这种业务需求决策算法能够有效地从大量的用户行为数据中提取有价值的信息,以此来优化业务流程,提高服务质量。
在另一些可以的实施例中,所述专家知识处理分支还包括知识译码组件,所述知识译码组件包括焦点化处理节点和特征混淆节点。则步骤130中的所述依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点,包括步骤1301-步骤1305。
步骤1301、根据所述焦点化处理节点,依据原始分类判别向量,确定第一基础会话索引向量。
步骤1302、根据所述特征混淆节点,对所述第一基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到会话向量混淆结果,所述原始分类判别向量用于指示启动特征混淆处理。
步骤1303、根据所述焦点化处理节点,依据所述原始分类判别向量和既有会话向量混淆结果,确定第二基础会话索引向量。
步骤1304、根据所述特征混淆节点,对所述第二基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到后一个会话向量混淆结果;直到所得的会话向量混淆结果提示完成特征混淆。
步骤1305、根据所述观点决策组件,依据既有若干个会话向量混淆结果,确定所述目标用户活动事件的业务需求决策观点。
在上述实施例中,焦点化处理节点(也可以理解为注意力节点)负责基于原始分类判别向量(可以是一个指示用户行为类别的向量)来确定基础会话索引向量。基础会话索引向量可以代表了某一特定的会话或者行为序列。特征混淆节点负责将基础会话索引向量以及多个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆。特征混淆可以是一个操作过程,通过对各种不同来源的特征进行组合、变换等操作,生成新的特征或者特征表示。原始分类判别向量可以被用于指示何时启动特征混淆处理。
例如,在电力电子商品平台环境中,原始分类判别向量可以是根据用户的搜索、浏览、选择和购买行为生成的。焦点化处理节点可以基于这个向量来确定一个基础会话索引向量,该向量可以代表了用户在某一阶段的行为模式。然后,特征混淆节点将基础会话索引向量以及多个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,生成一个新的会话向量混淆结果。这个过程可以重复进行,直到得到的会话向量混淆结果提示完成特征混淆。最后,依据这些会话向量混淆结果,观点决策组件可以确定目标用户活动事件的业务需求决策观点,例如推荐给用户什么样的商品或者服务。
通过以上步骤,可以有效地从大量的用户行为数据中提取有价值的信息,以此来优化业务流程,提高服务质量。
在另一些示例中,所述专家知识处理分支的调试步骤包括步骤610-步骤630。
步骤610、获取过往实时业务会话数据流的若干个多模态局部会话交互描述知识以及所述过往实时业务会话数据流对应的调试学习依据,所述调试学习依据用于反映所述目标用户活动事件的已认证需求决策观点。
步骤620、根据所述专家知识处理分支,对所述过往实时业务会话数据流的若干个多模态局部会话交互描述知识进行处理,得到过往需求预测观点。
步骤630、依据所述过往需求预测观点和所述调试学习依据,调试所述专家知识处理分支。
在这个例子中,过往实时业务会话数据流、调试学习依据、已认证需求决策观点和过往需求预测观点都是专家知识处理分支的重要组成部分。过往实时业务会话数据流是指之前发生并被记录下来的用户活动事件序列。在电力电子商品平台环境中,它可以包括用户的搜索、浏览、选择和购买行为。调试学习依据是一个用于反映目标用户活动事件的已认证需求决策观点的依据。例如,如果在电力电子商品平台环境中,用户最终购买了一款商品,那么这个商品就可以作为调试学习依据。已认证需求决策观点是根据调试学习依据得出的已经确认的业务需求决策观点。在电力电子商品平台环境中,如果用户最终购买了一款商品,那么推荐这款商品就是一个已认证的需求决策观点。过往需求预测观点是专家知识处理分支对过往实时业务会话数据流的多模态局部会话交互描述知识进行处理后得到的预测结果。
对于步骤610-步骤630的调试过程,首先在步骤610中,获取过往实时业务会话数据流的多模态局部会话交互描述知识以及对应的调试学习依据。然后在步骤620中,使用专家知识处理分支对过往实时业务会话数据流的多模态局部会话交互描述知识进行处理,得到过往需求预测观点。最后,在步骤630中,根据过往需求预测观点和调试学习依据来调试专家知识处理分支,以使其更准确地预测用户的需求决策观点。这个调试过程可以通过各种机器学习方法,例如监督学习或者强化学习等进行。
进一步地,还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于多级数据通道的实时大数据处理方法,其特征在于,应用于大数据处理系统,所述方法包括:
将涵盖目标用户活动事件的实时业务会话数据流拆解成若干个通道阶段数据集,分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识;
依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,所述第一多模态局部会话交互描述知识为所述若干个多模态局部会话交互描述知识中的任一个,所述若干个第二多模态局部会话交互描述知识包括所述第一多模态局部会话交互描述知识以及最少一个除所述第一多模态局部会话交互描述知识以外的剩余多模态局部会话交互描述知识;
依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点。
2.如权利要求1所述的方法,其特征在于,所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:
对所述第一多模态局部会话交互描述知识的会话索引向量以及每个第二多模态局部会话交互描述知识的会话标识向量和会话属性向量进行特征混淆,得到所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量;
其中,所述对所述第一多模态局部会话交互描述知识的会话索引向量以及每个第二多模态局部会话交互描述知识的会话标识向量和会话属性向量进行特征混淆,得到所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:
依据所述第一多模态局部会话交互描述知识的会话索引向量和每个第二多模态局部会话交互描述知识的会话标识向量,确定所述第一多模态局部会话交互描述知识与每个所述第二多模态局部会话交互描述知识之间的特征牵涉分值;
基于所述若干个第二多模态局部会话交互描述知识分别对应的若干个特征牵涉分值,对所述若干个第二多模态局部会话交互描述知识的会话属性向量进行量化集成,得到所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
3.如权利要求1所述的方法,其特征在于,所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括:
依据第一通道阶段数据集在所述实时业务会话数据流中的第一分布标签,确定与所述第一分布标签关联的第二分布标签,其中,所述第一多模态局部会话交互描述知识是对所述第一通道阶段数据集进行会话交互描述挖掘所得的;
将对应于所述第二分布标签的第二通道阶段数据集对应的多模态局部会话交互描述知识,确定为所述多模态关联会话交互描述知识。
4.如权利要求1所述的方法,其特征在于,所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括:
针对所述若干个通道阶段数据集中的每个通道阶段数据集,对所述通道阶段数据集的分布标签信息进行特征映射,得到分布表征变量,将所述分布表征变量叠加到所述通道阶段数据集的多模态局部会话交互描述知识,所述分布标签信息用于反映所述通道阶段数据集在所述实时业务会话数据流中的分布标签。
5.如权利要求1所述的方法,其特征在于,所述依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点,包括:
依据原始分类判别向量,确定第一基础会话索引向量,对所述第一基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到会话向量混淆结果,所述原始分类判别向量用于指示启动特征混淆处理;
依据所述原始分类判别向量和既有会话向量混淆结果,确定第二基础会话索引向量,对所述第二基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到后一个会话向量混淆结果,直到所得的会话向量混淆结果提示完成特征混淆;
依据既有若干个会话向量混淆结果,确定所述目标用户活动事件的业务需求决策观点;
其中,所述依据所述原始分类判别向量和既有会话向量混淆结果,确定第二基础会话索引向量,包括:
依据最新的既有会话向量混淆结果的会话索引向量和所述原始分类判别向量的会话标识向量,确定所述原始分类判别向量对应的特征牵涉分值,以及,依据所述最新的既有会话向量混淆结果的会话索引向量和每个既有会话向量混淆结果的会话标识向量,确定每个既有会话向量混淆结果对应的特征牵涉分值;
基于所述原始分类判别向量对应的特征牵涉分值和每个既有会话向量混淆结果对应的特征牵涉分值,对所述原始分类判别向量的会话属性向量和每个既有会话向量混淆结果的会话属性向量进行量化集成,得到所述第二基础会话索引向量。
6.如权利要求1所述的方法,其特征在于,所述分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识,包括:
调整每个所述通道阶段数据集的原始会话交互描述知识关系网的特征规模,直到得到目标特征规模的会话交互描述知识关系网;
将所述目标特征规模的会话交互描述知识关系网调整为特征规模为1维的多模态局部会话交互描述知识。
7.如权利要求1所述的方法,其特征在于,每个所述多模态局部会话交互描述知识的描述层面数为第一个数,所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括:
对每个所述多模态局部会话交互描述知识进行滑窗可逆处理,得到滑窗可逆处理后的多模态局部会话交互描述知识,所述滑窗可逆处理后的多模态局部会话交互描述知识的描述层面数为第二个数,所述第二个数小于所述第一个数;
所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:
依据滑窗可逆处理后的第一多模态局部会话交互描述知识和若干个滑窗可逆处理后的第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
8.如权利要求1所述的方法,其特征在于,所述若干个多模态局部会话交互描述知识基于每个所述多模态局部会话交互描述知识对应的通道阶段数据集在所述实时业务会话数据流中的分布标签排列,形成所述实时业务会话数据流的会话交互描述知识关系网,所述会话交互描述知识关系网的描述层面数为第一个数;
所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量之前,所述方法还包括:
对所述实时业务会话数据流的会话交互描述知识关系网进行滑窗可逆处理,得到滑窗可逆处理后的会话交互描述知识关系网,所述滑窗可逆处理后的会话交互描述知识关系网的描述层面数为第二个数,所述第二个数小于所述第一个数;
所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:
依据所述滑窗可逆处理后的会话交互描述知识关系网中的第一多模态局部会话交互描述知识和所述滑窗可逆处理后的会话交互描述知识关系网中的若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量。
9.如权利要求1所述的方法,其特征在于,所述将涵盖目标用户活动事件的实时业务会话数据流拆解成若干个通道阶段数据集,分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识,包括有:将涵盖目标用户活动事件的实时业务会话数据流拆解成若干个通道阶段数据集,基于业务需求决策算法,分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识;
其中,所述业务需求决策算法包括会话交互描述挖掘分支和专家知识处理分支,所述专家知识处理分支包括特征挖掘组件和观点决策组件;
所述分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识,包括:根据所述会话交互描述挖掘分支,分别对所述若干个通道阶段数据集进行会话交互描述挖掘,得到若干个多模态局部会话交互描述知识;
所述依据第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量,包括:根据所述特征挖掘组件,依据所述第一多模态局部会话交互描述知识和若干个第二多模态局部会话交互描述知识,确定所述第一多模态局部会话交互描述知识对应的会话行为嵌入向量;
所述依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点,包括:根据所述观点决策组件,依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点;
其中,所述专家知识处理分支还包括知识译码组件,所述知识译码组件包括焦点化处理节点和特征混淆节点;
所述依据所述若干个多模态局部会话交互描述知识分别对应的若干个会话行为嵌入向量,确定所述目标用户活动事件的业务需求决策观点,包括:
根据所述焦点化处理节点,依据原始分类判别向量,确定第一基础会话索引向量;
根据所述特征混淆节点,对所述第一基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到会话向量混淆结果,所述原始分类判别向量用于指示启动特征混淆处理;
根据所述焦点化处理节点,依据所述原始分类判别向量和既有会话向量混淆结果,确定第二基础会话索引向量;
根据所述特征混淆节点,对所述第二基础会话索引向量以及所述若干个会话行为嵌入向量的会话标识向量和会话属性向量进行特征混淆,得到后一个会话向量混淆结果;直到所得的会话向量混淆结果提示完成特征混淆;
根据所述观点决策组件,依据既有若干个会话向量混淆结果,确定所述目标用户活动事件的业务需求决策观点。
10.一种大数据处理系统,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311425414.4A CN117149986B (zh) | 2023-10-31 | 2023-10-31 | 基于多级数据通道的实时大数据处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311425414.4A CN117149986B (zh) | 2023-10-31 | 2023-10-31 | 基于多级数据通道的实时大数据处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117149986A true CN117149986A (zh) | 2023-12-01 |
CN117149986B CN117149986B (zh) | 2024-02-09 |
Family
ID=88912420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311425414.4A Active CN117149986B (zh) | 2023-10-31 | 2023-10-31 | 基于多级数据通道的实时大数据处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117149986B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117350524A (zh) * | 2023-12-05 | 2024-01-05 | 广东新禾道信息科技有限公司 | 一种新型基础测绘移动采集协同作业方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190332983A1 (en) * | 2018-12-10 | 2019-10-31 | Ahe Li | Legal intelligence credit business: a business operation mode of artificial intelligence + legal affairs + business affairs |
CN115174231A (zh) * | 2022-07-08 | 2022-10-11 | 哈尔滨悦道科技开发有限公司 | 一种基于AI Knowledge Base的网络欺诈分析方法及服务器 |
CN115238168A (zh) * | 2022-06-02 | 2022-10-25 | 郑州大学 | 一种自适化远程医疗专家推荐方法 |
CN115470339A (zh) * | 2022-07-28 | 2022-12-13 | 北京万方软件有限公司 | 基于科技大数据知识图谱的技术诊断专家智能匹配算法 |
CN115470905A (zh) * | 2022-09-27 | 2022-12-13 | 高强 | 一种大数据分析处理方法及系统 |
CN115495656A (zh) * | 2022-09-27 | 2022-12-20 | 徐杰 | 应用于大数据的用户需求挖掘方法及系统 |
CN115687581A (zh) * | 2022-09-27 | 2023-02-03 | 国网新疆电力有限公司信息通信公司 | 一种基于注意力机制的电力客服交互式问答方法及装置 |
CN115712657A (zh) * | 2022-10-20 | 2023-02-24 | 高哲 | 基于元宇宙的用户需求挖掘方法及系统 |
CN115757745A (zh) * | 2022-12-01 | 2023-03-07 | 潍坊羞摆信息科技有限公司 | 基于人工智能的业务场景控制方法、系统及云平台 |
-
2023
- 2023-10-31 CN CN202311425414.4A patent/CN117149986B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190332983A1 (en) * | 2018-12-10 | 2019-10-31 | Ahe Li | Legal intelligence credit business: a business operation mode of artificial intelligence + legal affairs + business affairs |
CN115238168A (zh) * | 2022-06-02 | 2022-10-25 | 郑州大学 | 一种自适化远程医疗专家推荐方法 |
CN115174231A (zh) * | 2022-07-08 | 2022-10-11 | 哈尔滨悦道科技开发有限公司 | 一种基于AI Knowledge Base的网络欺诈分析方法及服务器 |
CN115470339A (zh) * | 2022-07-28 | 2022-12-13 | 北京万方软件有限公司 | 基于科技大数据知识图谱的技术诊断专家智能匹配算法 |
CN115470905A (zh) * | 2022-09-27 | 2022-12-13 | 高强 | 一种大数据分析处理方法及系统 |
CN115495656A (zh) * | 2022-09-27 | 2022-12-20 | 徐杰 | 应用于大数据的用户需求挖掘方法及系统 |
CN115687581A (zh) * | 2022-09-27 | 2023-02-03 | 国网新疆电力有限公司信息通信公司 | 一种基于注意力机制的电力客服交互式问答方法及装置 |
CN115712657A (zh) * | 2022-10-20 | 2023-02-24 | 高哲 | 基于元宇宙的用户需求挖掘方法及系统 |
CN115757745A (zh) * | 2022-12-01 | 2023-03-07 | 潍坊羞摆信息科技有限公司 | 基于人工智能的业务场景控制方法、系统及云平台 |
Non-Patent Citations (2)
Title |
---|
SREYASEE DAS BHATTACHARJEE等: ""Multi-view Knowledge Graph for Explainable Course Content Recommendation in Course Discussion Posts"", 《 2022 26TH INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR)》, pages 1 - 4 * |
张玉珠: ""日语基本拟声拟态词的习得现状研究——以中国人日语专业学生为例"", 《中国优秀硕士学位论文全文数据库 哲学与人文科学辑》, pages 085 - 975 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117350524A (zh) * | 2023-12-05 | 2024-01-05 | 广东新禾道信息科技有限公司 | 一种新型基础测绘移动采集协同作业方法及系统 |
CN117350524B (zh) * | 2023-12-05 | 2024-03-26 | 广东新禾道信息科技有限公司 | 一种新型基础测绘移动采集协同作业方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117149986B (zh) | 2024-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108629665B (zh) | 一种个性化商品推荐方法和系统 | |
CN111708949B (zh) | 医疗资源的推荐方法及装置、电子设备、存储介质 | |
CN106557480B (zh) | 查询改写的实现方法及装置 | |
CN105183727A (zh) | 一种图书推荐方法及其系统 | |
KR20190010173A (ko) | 사용자 의도 프로파일링 방법 및 이를 위한 장치 | |
WO2018014109A1 (en) | System and method for analyzing and searching for features associated with objects | |
CN117149986B (zh) | 基于多级数据通道的实时大数据处理方法及系统 | |
CN110348930A (zh) | 业务对象数据处理方法、业务对象信息的推荐方法和装置 | |
CN111125491A (zh) | 商品信息的搜索方法和装置、存储介质及电子装置 | |
CN113312468B (zh) | 基于对话模式的话术推荐方法、装置、设备及介质 | |
Earley | There is no AI without IA | |
CN112380457A (zh) | 一种基于采购信息的精准个性化推荐方法 | |
Lee et al. | A hybrid collaborative filtering-based product recommender system using search keywords | |
Rowlands et al. | Quality-driven industry 4.0 | |
Bansal et al. | Clickstream & behavioral analysis with context awareness for e-commercial applications | |
CN111046285B (zh) | 一种推荐排序确定方法、装置、服务器及存储介质 | |
CN113065067A (zh) | 一种物品推荐方法、装置、计算机设备及存储介质 | |
CN112182126A (zh) | 用于确定匹配度的模型训练方法、装置、电子设备及可读存储介质 | |
Duan et al. | MhSa-GRU: combining user’s dynamic preferences and items’ correlation to augment sequence recommendation | |
CN116501979A (zh) | 信息推荐方法、装置、计算机设备及计算机可读存储介质 | |
Meng et al. | Variational Bayesian representation learning for grocery recommendation | |
CN110807646A (zh) | 数据分析方法、装置和计算机可读存储介质 | |
CN112445893B (zh) | 一种信息搜索方法、装置、设备及存储介质 | |
CN110879863B (zh) | 跨领域搜索方法和跨领域搜索装置 | |
Nasir et al. | Semantics embedded sequential recommendation for E-commerce products (SEMSRec) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |