CN113468338A - 针对数字化云业务的大数据分析方法及大数据服务器 - Google Patents
针对数字化云业务的大数据分析方法及大数据服务器 Download PDFInfo
- Publication number
- CN113468338A CN113468338A CN202110668165.6A CN202110668165A CN113468338A CN 113468338 A CN113468338 A CN 113468338A CN 202110668165 A CN202110668165 A CN 202110668165A CN 113468338 A CN113468338 A CN 113468338A
- Authority
- CN
- China
- Prior art keywords
- behavior
- data
- customer
- target
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Animal Behavior & Ethology (AREA)
- Human Computer Interaction (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开的针对数字化云业务的大数据分析方法及大数据服务器,通过确定客户行为轨迹数据的关联行为更新记录,能够实现对节点化行为特征内容的获取,能有效减少行为特征的数据量规模并快速地进行消费互动意图分析以得到消费互动意图分析内容,进而结合客户行为轨迹数据、节点化行为特征内容和消费互动意图分析内容生成用于进行潜在消费需求分析的目标客户行为轨迹数据。由于节点化行为特征内容和消费互动意图分析内容具有区分度高且数据量规模小的优点,能在确保与潜在消费需求高度匹配的前提下尽可能减少目标客户行为轨迹数据的数据量规模,使得数据处理能力较弱的云业务交互设备也能够通过目标客户行为轨迹数据进行潜在消费需求分析。
Description
技术领域
本申请涉及大数据和云业务技术领域,特别涉及一种针对数字化云业务的大数据分析方法及大数据服务器。
背景技术
随着科学技术的发展,高度互联的数字化环境以逐渐趋于稳定,各类互联网技术发展愈发成熟,许多企业也相继开展数字化转型的业务更新。现目前,数字化转型通常与即时反馈、自动化服务、智能化处理、在线访问等特性相关。
数字化转型倒逼业务处理云端化,数字化云业务的基础依靠大量的、复杂的、以及高度业务关联的基础数据,各类业务大数据在数字化云业务办理过程中承载着至关重要的角色。
然而,由于大数据的数据量规模巨大,相关技术难以将数字化业务处理下沉到业务端进行处理,比如,相关技术难以在业务端实现客户行为数据的分析。因此,如何对庞大的数据进行优化处理以确保能够为业务端所用,是现目前需要改善的一个技术问题。
发明内容
本申请实施例之一提供一种针对数字化云业务的大数据分析方法,应用于大数据服务器,所述方法至少包括以下步骤:
通过不同的待处理业务互动日志中的客户行为轨迹数据,确定所述客户行为轨迹数据对应的关联行为更新记录;
基于所述客户行为轨迹数据对应的关联行为更新记录,确定所述客户行为轨迹数据对应的节点化行为特征内容,以对所述客户行为轨迹数据进行消费互动意图分析得到消费互动意图分析内容;
根据所述客户行为轨迹数据及所述客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容,生成目标客户行为轨迹数据;其中,所述目标客户行为轨迹数据用于进行潜在消费需求分析。
优选的实施例中,所述通过不同的待处理业务互动日志中的客户行为轨迹数据,确定所述客户行为轨迹数据对应的关联行为更新记录,包括:
根据第一待处理业务互动日志中的第一客户行为轨迹数据,确定与所述第一客户行为轨迹数据对应的关联行为更新记录作为初始行为记录,所述第一待处理业务互动日志包括至少一组客户行为轨迹数据;
根据第二待处理业务互动日志确定与所述第二待处理业务互动日志对应的关联行为更新记录作为目标行为记录;所述第二待处理业务互动日志用于表征目标客户行为轨迹数据的消费习惯内容和/或操作习惯内容;
相应的,所述基于所述客户行为轨迹数据对应的关联行为更新记录,确定所述客户行为轨迹数据对应的节点化行为特征内容,以对所述客户行为轨迹数据进行消费互动意图分析得到消费互动意图分析内容,包括:
根据所述初始行为记录和所述目标行为记录,确定所述第一客户行为轨迹数据对应的节点化行为特征内容,并根据所述节点化行为特征内容对所述第一客户行为轨迹数据进行消费互动意图分析得到所述第一客户行为轨迹数据对应的消费互动意图分析内容;
相应的,所述根据所述客户行为轨迹数据及所述客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容,生成目标客户行为轨迹数据,包括:
根据所述第一客户行为轨迹数据及所述第一客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容,通过客户存留意图分析网络获得所述第一客户行为轨迹数据对应的行为特征变化内容和热点业务分布内容;
根据所述第一客户行为轨迹数据及所述第一客户行为轨迹数据对应的节点化行为特征内容、行为特征变化内容和热点业务分布内容,生成所述目标客户行为轨迹数据;
相应的,所述方法还包括:
通过客户需求识别网络对所述目标客户行为轨迹数据进行消费互动需求识别,获得所述客户需求识别网络输出的消费业务需求信息。
优选的实施例中,所述根据第二待处理业务互动日志确定与所述第二待处理业务互动日志对应的关联行为更新记录作为目标行为记录,包括:
当第二待处理业务互动日志中包括目标知识图谱节点时,根据所述目标知识图谱节点确定关联行为更新记录,作为目标行为记录;
或者,当所述第二待处理业务互动日志为第二客户行为轨迹数据时,根据所述第二客户行为轨迹数据确定关联行为更新记录,作为目标行为记录;其中,所述第二客户行为轨迹数据与所述第一客户行为轨迹数据之间不完全相同;
通过以下方式确定客户行为轨迹数据对应的关联行为更新记录:
确定客户行为轨迹数据中的客户行为状态标签;根据预存的场景行为数据生成关联行为更新记录,将所述关联行为更新记录的关联标签映射至全局业务特征图得到映射标签;确定使得所述客户行为状态标签与所述映射标签之间的余弦相似度最大化的知识图谱节点,根据所述知识图谱节点确定与所述客户行为轨迹数据对应的关联行为更新记录;
或者,
确定客户行为轨迹数据中的客户行为状态标签;根据所述客户行为状态标签和所述客户行为轨迹数据,通过知识图谱构建策略获得知识图谱节点;根据所述知识图谱节点确定所述客户行为轨迹数据对应的关联行为更新记录。
优选的实施例中,所述根据所述第一客户行为轨迹数据及所述第一客户行为轨迹数据对应的节点化行为特征内容、行为特征变化内容和热点业务分布内容,生成所述目标客户行为轨迹数据,包括:
根据所述第一客户行为轨迹数据对应的行为特征变化内容对所述第一客户行为轨迹数据对应的节点化行为特征内容进行行为特征优化,得到所述第一客户行为轨迹数据对应的行为特征内容;
根据所述第一客户行为轨迹数据对应的行为特征内容对所述第一客户行为轨迹数据进行消费互动意图分析得到所述第一客户行为轨迹数据对应的目标消费互动意图分析内容;
根据所述第一客户行为轨迹数据对应的目标消费互动意图分析内容和热点业务分布内容,生成所述目标客户行为轨迹数据。
优选的实施例中,所述第二待处理业务互动日志包括多组存在时序先后关系的目标知识图谱节点或者多组存在时序先后关系的第二客户行为轨迹数据;
则所述根据第二待处理业务互动日志确定与所述第二待处理业务互动日志对应的关联行为更新记录作为目标行为记录,包括:
当所述第二待处理业务互动日志包括多组存在时序先后关系的目标知识图谱节点时,按照时序先后关系针对每组目标知识图谱节点,确定与所述目标知识图谱节点对应的关联行为更新记录,作为所述目标知识图谱节点对应的目标行为记录;
当所述第二待处理业务互动日志包括多组存在时序先后关系的第二客户行为轨迹数据时,按照时序先后关系针对每组第二客户行为轨迹数据,确定与所述第二客户行为轨迹数据对应的关联行为更新记录,作为所述第二客户行为轨迹数据对应的目标行为记录;
相应的,按照时序先后关系针对每个所述目标行为记录,执行步骤:根据所述初始行为记录和所述目标行为记录,确定所述第一客户行为轨迹数据对应的节点化行为特征内容;
相应的,所述方法还包括:根据所述目标行为记录的时序先后关系和基于每个所述目标行为记录生成的所述目标客户行为轨迹数据,生成在时序上关联的轨迹数据集;
相应的,所述方法还包括:
接收针对所述在时序上关联的轨迹数据集的调用指令;
根据所述调用指令,调用所述在时序上关联的轨迹数据集;
相应的,所述方法还包括:
向云业务交互设备发送所述目标客户行为轨迹数据,指示所述云业务交互设备根据所述目标客户行为轨迹数据确定当前客户的潜在消费需求并通过所述潜在消费需求进行云业务产品输出。
优选的实施例中,所述第一待处理业务互动日志包括属于同一客户的多组不同的第一客户行为轨迹数据;则所述确定与所述第一客户行为轨迹数据对应的关联行为更新记录作为初始行为记录,包括:
针对所述第一待处理业务互动日志中的每组第一客户行为轨迹数据,确定与所述第一客户行为轨迹数据对应的关联行为更新记录,作为与所述第一客户行为轨迹数据对应的初始行为记录。
优选的实施例中,所述客户存留意图分析网络采用卷积层和全连接层的网络层结构;所述客户存留意图分析网络通过以下方式训练生成:
确定第一样本训练集合,所述第一样本训练集合中的每个训练样本包括至少一组样本轨迹数据及其对应的分类标签信息,所述样本轨迹数据包括客户行为轨迹数据及其对应的节点化行为特征内容和基于节点化行为特征内容进行消费互动意图分析得到的消费互动意图分析内容;所述分类标签信息包括标记的行为特征变化内容和热点业务分布内容;
通过所述第一样本训练集合中的训练样本进行网络模型训练,获得所述客户存留意图分析网络。
优选的实施例中,所述客户需求识别网络通过以下方式训练生成:
确定第二样本训练集合,所述第二样本训练集合中的每个训练样本包括所述目标客户行为轨迹数据及其对应的已标记的客户行为轨迹数据;
通过所述第二样本训练集合中的训练样本训练客户需求识别网络,获得所述客户需求识别网络。
本申请实施例之二提供一种大数据服务器,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行上述的方法。
本申请实施例之三提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序在运行时实现上述的方法。
在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。
附图说明
本申请将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本发明的一些实施例所示的一种示例性针对数字化云业务的大数据分析方法和/或过程的第一流程图;
图2是根据本发明的一些实施例所示的一种示例性针对数字化云业务的大数据分析方法和/或过程的第二流程图;
图3是根据本发明的一些实施例所示的一种示例性针对数字化云业务的大数据分析装置的框图;
图4是根据本发明的一些实施例所示的一种示例性针对数字化云业务的大数据分析系统的框图,以及
图5是根据本发明的一些实施例所示的一种示例性大数据服务器中硬件和软件组成的示意图。
具体实施方式
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
为改善如背景技术所述的问题,发明人创新性地提出了针对数字化云业务的大数据分析方法及大数据服务器,通过确定不同的待处理业务互动日志中的客户行为轨迹数据的关联行为更新记录,能够实现对节点化行为特征内容的获取,从而有效减少行为特征的数据量规模,这样能够快速地实现对客户行为轨迹数据进行消费互动意图分析以得到消费互动意图分析内容,如此,可以结合客户行为轨迹数据、节点化行为特征内容和消费互动意图分析内容生成用于进行潜在消费需求分析的目标客户行为轨迹数据。由于节点化行为特征内容和消费互动意图分析内容具有区分度高且数据量规模小的优点,能够在确保与潜在消费需求高度匹配的前提下尽可能减少目标客户行为轨迹数据的数据量规模,从而使得数据处理能力较弱的云业务交互设备也能够通过目标客户行为轨迹数据进行潜在消费需求分析。
请参阅图1,是根据本发明的一些实施例所示的一种示例性针对数字化云业务的大数据分析方法和/或过程的流程图,针对数字化云业务的大数据分析方法可以包括以下步骤S110-步骤S130所描述的内容。
S110:通过不同的待处理业务互动日志中的客户行为轨迹数据,确定所述客户行为轨迹数据对应的关联行为更新记录。
S120:基于所述客户行为轨迹数据对应的关联行为更新记录,确定所述客户行为轨迹数据对应的节点化行为特征内容,以对所述客户行为轨迹数据进行消费互动意图分析得到消费互动意图分析内容。
S130:根据所述客户行为轨迹数据及所述客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容,生成目标客户行为轨迹数据;其中,所述目标客户行为轨迹数据用于进行潜在消费需求分析。
可以理解,上述步骤S110-步骤S130应用于与云业务交互设备通信的大数据服务器,云业务交互设备的数据处理能力较弱,而大数据服务器的数据处理能力较强,因此,通过大数据服务器生成用于进行潜在消费需求分析的目标客户行为轨迹数据,能够在确保与潜在消费需求高度匹配的前提下尽可能减少目标客户行为轨迹数据的数据量规模,这样在将目标客户行为轨迹数据下发给云业务交互设备时,云业务交互设备也能够通过目标客户行为轨迹数据进行精准的潜在消费需求分析。
基于此,在上述内容的基础上,还可以包括以下步骤S140所描述的内容,步骤S140:向云业务交互设备发送所述目标客户行为轨迹数据,指示所述云业务交互设备根据所述目标客户行为轨迹数据确定当前客户的潜在消费需求并通过所述潜在消费需求进行云业务产品输出。举例而言,云业务交互设备可以是数字化业务交互设备,包括但不限于手机、平板电脑、笔记本电脑、立柜式触控交互机器人。云业务产品可以是软件服务产品比如针对云办公的办公软件,也可以是在线购物商品的购买链接,还可以是针对云游戏的热门游戏推送结果。可以理解,云业务产品还可以涵盖跨境支付、政企云服务、智慧园区等产品项目,但不限于此。
一般而言,潜在消费需求可以通过对目标客户行为轨迹数据进行大数据挖掘得到,由于目标客户行为轨迹数据的数据量规模较小且数据特征识别度较高,因而通过前端的云业务交互设备也能够快速地挖掘出潜在消费需求并依据潜在消费需求进行相关的云业务产品输出。这样能够将潜在消费需求的挖掘从云端下沉到业务端,从而实现潜在消费需求的挖掘的分布式处理,提高潜在消费需求的挖掘效率。
接下来将对一些可选实施例进行说明,以下实施例应当理解为示例,不应理解为实现本方案所必不可少的技术特征。应当理解,在技术方案不冲突的前提下,以下实施例可以和上述实施例进行适应性组合以构成新的且能够完整实施的技术方案。
对于S110而言,该步骤是用于确定客户行为轨迹数据对应的关联行为更新记录,在本实施例中,大数据服务器可以基于与云业务交互设备的数据通信记录获取待处理业务互动日志,待处理业务互动日志可以是文本形式的日志,也可以是图像形式的日志。进一步地,S110中的客户行为轨迹数据用于表征客户基于云业务交互设备所执行的业务操作所对应的记录数据,比如点击、滑动等触控操作数据,或者语音输入数据。在此基础上,关联行为更新记录则可以理解为与客户行为轨迹数据在业务互动层面存在相关性的更新记录,关联行为更新记录可以按照时序先后顺序记录行为轨迹数据的变化情况。
对于S110而言,在一些可能的实施例中,步骤“通过不同的待处理业务互动日志中的客户行为轨迹数据,确定所述客户行为轨迹数据对应的关联行为更新记录”所描述的内容,可以通过以下方式实现:根据第一待处理业务互动日志中的第一客户行为轨迹数据,确定与所述第一客户行为轨迹数据对应的关联行为更新记录作为初始行为记录,所述第一待处理业务互动日志包括至少一组客户行为轨迹数据;根据第二待处理业务互动日志确定与所述第二待处理业务互动日志对应的关联行为更新记录作为目标行为记录;所述第二待处理业务互动日志用于表征目标客户行为轨迹数据的消费习惯内容和/或操作习惯内容。
在一些可能的实施例中,第一待处理业务互动日志和第二待处理业务互动日志分别表征不同的内容,第一待处理业务互动日志侧重于客户行为轨迹数据,而第二待处理业务互动日志侧重于目标客户行为轨迹数据的消费习惯内容和/或操作习惯内容。其中,消费习惯内容可以理解为客户在支付互动业务中的倾向,操作习惯内容可以理解为客户的业务操作行为倾向,比如习惯触控操作还是习惯语音操作。
如此,通过第一待处理业务互动日志和第二待处理业务互动日志,能够确定出确定与所述第一客户行为轨迹数据对应的关联行为更新记录作为初始行为记录以及与所述第二待处理业务互动日志对应的关联行为更新记录作为目标行为记录,从而实现对第一待处理业务互动日志和第二待处理业务互动日志各自对应的关联行为更新记录的分类处理,避免第一待处理业务互动日志和第二待处理业务互动日志各自对应的关联行为更新记录之间的互相干扰。
在一些示例中,所述第一待处理业务互动日志包括属于同一客户的多组不同的第一客户行为轨迹数据,基于此,上述步骤“确定与所述第一客户行为轨迹数据对应的关联行为更新记录作为初始行为记录”,可以包括以下内容:针对所述第一待处理业务互动日志中的每组第一客户行为轨迹数据,确定与所述第一客户行为轨迹数据对应的关联行为更新记录,作为与所述第一客户行为轨迹数据对应的初始行为记录。
在另一些可能的实施例中,上述步骤“根据第二待处理业务互动日志确定与所述第二待处理业务互动日志对应的关联行为更新记录作为目标行为记录”所描述的内容,可以通过以下方式实现:当第二待处理业务互动日志中包括目标知识图谱节点时,根据所述目标知识图谱节点确定关联行为更新记录,作为目标行为记录;或者,当所述第二待处理业务互动日志为第二客户行为轨迹数据时,根据所述第二客户行为轨迹数据确定关联行为更新记录,作为目标行为记录;其中,所述第二客户行为轨迹数据与所述第一客户行为轨迹数据之间不完全相同。
在另一些可能的实施例中,目标知识图谱节点用于表征较为热门的数字化业务对应的知识图谱节点,知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱节点可以理解为知识图谱中的“实体”,实体指的是现实世界中的事物,比如本实施例中的数字化业务。如此设计,通过引入知识图谱,能够结合知识图谱中的节点(实体)之间的关系完整、准确地获得关联行为更新记录。
在另一些可能的实施例中,若所述第二待处理业务互动日志为与所述第一客户行为轨迹数据之间不完全相同的第二客户行为轨迹数据时,可以根据所述第二客户行为轨迹数据确定关联行为更新记录,这样可以实现对目标行为记录以及初始行为记录的有效区分,从而便于后续的目标客户行为轨迹数据的生成。
在一些可能的实施例中,可以通过以下方式确定客户行为轨迹数据对应的关联行为更新记录:
第一种方式,确定客户行为轨迹数据中的客户行为状态标签;根据预存的场景行为数据生成关联行为更新记录,将所述关联行为更新记录的关联标签映射至全局业务特征图得到映射标签;确定使得所述客户行为状态标签与所述映射标签之间的余弦相似度最大化的知识图谱节点,根据所述知识图谱节点确定与所述客户行为轨迹数据对应的关联行为更新记录;
在第一种方式中,客户行为状态标签用于对客户行为进行区分,比如客户行为状态标签可以包括“购买意愿强烈”、“观望”、“无购买意愿”等,也可以包括“频繁更新”、“偶尔更新”、“长时间不更新”等。进一步地,场景行为数据用于描述不同的业务交互场景,而根据场景行为数据生成关联行为更新记录可以对业务交互场景进行记录,通过将关联行为更新记录的关联标签(场景标签)映射至全局业务特征图(用于表征客户行为与互动业务之间的关系的图数据)得到映射标签,能够实现对不同标签的统一处理,从而确定使得所述客户行为状态标签与所述映射标签之间的余弦相似度最大化的知识图谱节点,这样可以通过所述知识图谱节点确定与所述客户行为轨迹数据对应的关联行为更新记录,以确保客户行为轨迹数据对应的关联行为更新记录具有较高的特征识别度和较小的数据量规模。
第二种方式,确定客户行为轨迹数据中的客户行为状态标签;根据所述客户行为状态标签和所述客户行为轨迹数据,通过知识图谱构建策略获得知识图谱节点;根据所述知识图谱节点确定所述客户行为轨迹数据对应的关联行为更新记录。
在第二种方式中,知识图谱构建策略可以是预先存储的历史知识图谱的构建指示信息,通过知识图谱构建策略获得知识图谱节点,能够确保指示图谱节点的可信度,进而确保得到的客户行为轨迹数据对应的关联行为更新记录的特征识别度。
对于S120而言,节点化行为特征内容能够对客户行为轨迹数据的行为特征进行总结和归纳,从而在精准表征客户行为轨迹数据的含义的前提下减少节点化行为特征内容的数据量规模,这样一来,可以通过节点化行为特征内容对客户行为轨迹数据进行消费互动意图分析得到消费互动意图分析内容。进一步地,消费互动意图分析用于对客户行为轨迹数据进行初步画像挖掘,相应地,消费互动意图分析内容可以理解为客户行为轨迹数据的初步画像挖掘结果。由于消费互动意图分析内容是基于节点化行为特征内容得到的,因此消费互动意图分析内容同样能够在精准表征消费互动意图的前提下减少数据量规模。
对于S120而言,在一些实施例中,步骤“基于所述客户行为轨迹数据对应的关联行为更新记录,确定所述客户行为轨迹数据对应的节点化行为特征内容,以对所述客户行为轨迹数据进行消费互动意图分析得到消费互动意图分析内容”所描述的内容,可以通过以下方式实现:根据所述初始行为记录和所述目标行为记录,确定所述第一客户行为轨迹数据对应的节点化行为特征内容,并根据所述节点化行为特征内容对所述第一客户行为轨迹数据进行消费互动意图分析得到所述第一客户行为轨迹数据对应的消费互动意图分析内容。
在一些实施例中,可以分别对所述初始行为记录和所述目标行为记录进行特征提取,以得到行为记录特征,然后结合所述第一客户行为轨迹数据的时序特征,确定所述第一客户行为轨迹数据对应的节点化行为特征内容。一般而言,节点化行为特征内容可以与知识图谱节点对应,因而可以在精准表征客户行为轨迹数据的含义的前提下减少节点化行为特征内容的数据量规模,在此基础上,通过节点化行为特征内容对所述第一客户行为轨迹数据进行消费互动意图分析,能够确保消费互动意图分析内容在精准表征消费互动意图的前提下减少数据量规模。
对于S130而言,目标客户行为轨迹数据能够被云业务交互设备所使用,因此,为了确保目标客户行为轨迹数据的精简性,需要对所述客户行为轨迹数据及所述客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容进行全局性的分析和处理,为此,步骤“根据所述客户行为轨迹数据及所述客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容,生成目标客户行为轨迹数据;其中,所述目标客户行为轨迹数据用于进行潜在消费需求分析”,可以包括以下内容:根据所述第一客户行为轨迹数据及所述第一客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容,通过客户存留意图分析网络获得所述第一客户行为轨迹数据对应的行为特征变化内容和热点业务分布内容;根据所述第一客户行为轨迹数据及所述第一客户行为轨迹数据对应的节点化行为特征内容、行为特征变化内容和热点业务分布内容,生成所述目标客户行为轨迹数据。
举例而言,客户存留意图分析网络可以通过预先训练得到,用于对行为特征变化内容和热点业务分布内容进行识别和提取,而行为特征变化内容用于表征客户的存留意图,热点业务分布内容可以通过图数据的形式表达,用于记录不同的热点业务的时序分布情况、场景分布情况和客户对象分布情况,这样一来,能够结合所述第一客户行为轨迹数据及所述第一客户行为轨迹数据对应的节点化行为特征内容、行为特征变化内容和热点业务分布内容精准地生成所述目标客户行为轨迹数据,以确保目标客户行为轨迹数据的精简性,这样一来,可以保证目标客户行为轨迹数据能够被云业务交互设备所使用。
在另外的一些实施例中,上述步骤“根据所述第一客户行为轨迹数据及所述第一客户行为轨迹数据对应的节点化行为特征内容、行为特征变化内容和热点业务分布内容,生成所述目标客户行为轨迹数据”,可以包括以下内容:根据所述第一客户行为轨迹数据对应的行为特征变化内容对所述第一客户行为轨迹数据对应的节点化行为特征内容进行行为特征优化,得到所述第一客户行为轨迹数据对应的行为特征内容;根据所述第一客户行为轨迹数据对应的行为特征内容对所述第一客户行为轨迹数据进行消费互动意图分析得到所述第一客户行为轨迹数据对应的目标消费互动意图分析内容;根据所述第一客户行为轨迹数据对应的目标消费互动意图分析内容和热点业务分布内容,生成所述目标客户行为轨迹数据。
举例而言,所述第一客户行为轨迹数据对应的行为特征变化内容可以用于表征第一客户行为轨迹数据的行为特征的变化情况,比如,行为特征变化内容可以是特征向量变化矩阵,或者特征图变化曲线等。这样,能够结合行为特征变化内容实现对节点化行为特征内容的行为特征优化(更新和校正),从而准确得到所述第一客户行为轨迹数据对应的行为特征内容。在此基础上,可以通过所述第一客户行为轨迹数据对应的行为特征内容对所述第一客户行为轨迹数据进行消费互动意图分析,从而确保得到的所述第一客户行为轨迹数据对应的目标消费互动意图分析内容与最新的行为特征相匹配。然后,可以通过目标消费互动意图分析内容和热点业务分布内容生成所述目标客户行为轨迹数据以便于下发给云业务交互设备使用。
在一些示例中,在上述S110-S130的基础上,还可以包括以下内容:通过客户需求识别网络对所述目标客户行为轨迹数据进行消费互动需求识别,获得所述客户需求识别网络输出的消费业务需求信息。其中,大数据服务器可以调用预先训练完成的客户需求识别网络对目标客户行为轨迹数据进行消费互动需求识别从而得到消费业务需求信息,消费业务需求信息可以包括一般消费业务需求和潜在消费业务需求,通俗而言,在一些可能的情况下,潜在消费业务需求的挖掘可以由大数据服务器执行,而得到的消费业务需求信息可以用于进行相关在线服务的优化升级,也可以直接下发给对应的云业务交互设备。
对于上述的客户需求识别网络而言,该网格可以是基于人工智能(ArtificialIntelligence)的卷积神经网络(Convolutional Neural Networks, CNN),还可以是深度神经网络(Deep Neural Networks,DNN)。进一步地,该客户需求识别网络通过以下方式训练生成:确定第二样本训练集合,所述第二样本训练集合中的每个训练样本包括所述目标客户行为轨迹数据及其对应的已标记的客户行为轨迹数据;通过所述第二样本训练集合中的训练样本训练客户需求识别网络,获得所述客户需求识别网络。其中,在训练客户需求识别网络时,可以通过预测准确率或者损失函数(交叉熵损失)的判定标准来实现客户需求识别网络的网络模型参数的优化,从而完成对客户需求识别网络的训练。
在另外的一些实施例中,所述第二待处理业务互动日志可以包括多组存在时序先后关系的目标知识图谱节点或者多组存在时序先后关系的第二客户行为轨迹数据,时序先后关系可以理解为存在时间先后顺序。基于此,上述步骤“根据第二待处理业务互动日志确定与所述第二待处理业务互动日志对应的关联行为更新记录作为目标行为记录”所描述的内容,可以包括以下步骤:当所述第二待处理业务互动日志包括多组存在时序先后关系的目标知识图谱节点时,按照时序先后关系针对每组目标知识图谱节点,确定与所述目标知识图谱节点对应的关联行为更新记录,作为所述目标知识图谱节点对应的目标行为记录;当所述第二待处理业务互动日志包括多组存在时序先后关系的第二客户行为轨迹数据时,按照时序先后关系针对每组第二客户行为轨迹数据,确定与所述第二客户行为轨迹数据对应的关联行为更新记录,作为所述第二客户行为轨迹数据对应的目标行为记录。
可以理解,在确定第二待处理业务互动日志对应的关联行为更新记录时,可以根据多组存在时序先后关系的目标知识图谱节点或者多组存在时序先后关系的第二客户行为轨迹数据分别进行确定,这样可以保证目标知识图谱节点和第二客户行为轨迹数据各自对应的关联行为更新记录之间的区分度,便于后续针对性地进行不同的关联行为更新记录分析,避免目标知识图谱节点和第二客户行为轨迹数据各自对应的关联行为更新记录之间的互相干扰。
在上述“第二待处理业务互动日志可以包括多组存在时序先后关系的目标知识图谱节点或者多组存在时序先后关系的第二客户行为轨迹数据”的基础上,可以按照时序先后关系针对每个所述目标行为记录执行以下步骤:根据所述初始行为记录和所述目标行为记录,确定所述第一客户行为轨迹数据对应的节点化行为特征内容。可以理解,关于“根据所述初始行为记录和所述目标行为记录,确定所述第一客户行为轨迹数据对应的节点化行为特征内容”的进一步实施方式可以参阅前述的实施例,在此不再进行说明。
在上述“第二待处理业务互动日志可以包括多组存在时序先后关系的目标知识图谱节点或者多组存在时序先后关系的第二客户行为轨迹数据”的基础上,该方法还可以包括以下内容:根据所述目标行为记录的时序先后关系和基于每个所述目标行为记录生成的所述目标客户行为轨迹数据,生成在时序上关联的轨迹数据集。在时序上关联的轨迹数据集可以理解为一连串连续的客户行为轨迹数据,由于轨迹数据集具有时序特性,因而可以用于对客户的动态存留情况进行分析。基于此,大数据服务器还可以接收针对所述在时序上关联的轨迹数据集的调用指令,并根据所述调用指令调用所述在时序上关联的轨迹数据集。这样,可以基于在时序上关联的轨迹数据集进行客户的动态存留情况的分析。
在其他的一些实施例中,上述的客户存留意图分析网络可以采用卷积层和全连接层的网络层结构,基于此,所述客户存留意图分析网络可以通过以下方式训练生成:确定第一样本训练集合,所述第一样本训练集合中的每个训练样本包括至少一组样本轨迹数据及其对应的分类标签信息,所述样本轨迹数据包括客户行为轨迹数据及其对应的节点化行为特征内容和基于节点化行为特征内容进行消费互动意图分析得到的消费互动意图分析内容;所述分类标签信息包括标记的行为特征变化内容和热点业务分布内容;通过所述第一样本训练集合中的训练样本进行网络模型训练,获得所述客户存留意图分析网络。在训练客户存留意图分析网络时,可以通过预测准确率或者损失函数(交叉熵损失)的判定标准来实现客户存留意图分析网络的网络模型参数的优化,从而完成对客户存留意图分析网络的训练。
在一些选择性的实施例中,关于上述步骤“根据所述第一客户行为轨迹数据对应的目标消费互动意图分析内容和热点业务分布内容,生成所述目标客户行为轨迹数据”所描述的内容,可以通过如图2所示的步骤S210-步骤S240实现。
S210、通过所述目标消费互动意图分析内容的意图标签信息以及所述热点业务分布内容的业务标签信息,获取待识别客户行为事件的事件跳转记录以及各行为事件数据。
例如,所述目标消费互动意图分析内容的意图标签信息用于对目标消费互动意图分析内容中的内容块进行区分,不同的意图标签信息对应不同的消费互动意图倾向,所述热点业务分布内容的业务标签信息用于对热点业务分布内容中的内容块进行区分,不同的业务标签信息对应不同的业务事件类别。如此,可以将所述目标消费互动意图分析内容的意图标签信息以及所述热点业务分布内容的业务标签信息进行综合考虑,从而完整地获得待识别客户行为事件的事件跳转记录以及各行为事件数据。
另外,待识别客户行为事件可以从所述第一客户行为轨迹数据中提取,也可以从与所述第一客户行为轨迹数据关联的客户行为轨迹数据中提取。进一步地,事件跳转记录用于记录客户行为事件的变化情况,而行为事件数据则用于记录客户行为,比如实际交互行为数据(具有较大挖掘价值)或者流程性交互数据(具有较小挖掘价值)。
S220、在基于所述事件跳转记录确定出所述待识别客户行为事件中包含有动态行为标签的前提下,基于所述第一客户行为轨迹数据的客户行为事件的动态行为标签下的行为事件数据及其数据量描述信息,确定待识别客户行为事件的静态行为标签下的各行为事件数据与待识别客户行为事件的动态行为标签下的各行为事件数据之间的相关性系数;将待识别客户行为事件的静态行为标签下的行为事件数据中,与待识别客户行为事件的动态行为标签下的行为事件数据相似的目标行为事件数据,整理到相应的动态行为标签下。
例如,动态行为标签对应实际交互行为数据(具有较大挖掘价值),静态行为标签对应流程性交互数据(具有较小挖掘价值),而数据量描述信息用于表征行为事件数据的数据大小(单位可以是MB或者GB)。这样一来,通过确定待识别客户行为事件的静态行为标签下的各行为事件数据与待识别客户行为事件的动态行为标签下的各行为事件数据之间的相关性系数,能够实现对动态行为标签以及静态行为标签下的行为事件数据的优化和调整,从而改善之前误分类的情况。
在另一些选择性的实施例中,上述步骤“基于所述第一客户行为轨迹数据的客户行为事件的动态行为标签下的行为事件数据及其数据量描述信息,确定待识别客户行为事件的静态行为标签下的各行为事件数据与待识别客户行为事件的动态行为标签下的各行为事件数据之间的相关性系数;将待识别客户行为事件的静态行为标签下的行为事件数据中,与待识别客户行为事件的动态行为标签下的行为事件数据相似的目标行为事件数据,整理到相应的动态行为标签下”,可以包括以下内容:确定待识别客户行为事件的静态行为标签下的各行为事件数据与待识别客户行为事件的动态行为标签下的各行为事件数据的行为事件时空域特征之间的皮尔森相关性系数;分别判断各皮尔森相关性系数是否达到第一相关性系数阈值,并将皮尔森相关性系数达到第一相关性系数阈值的静态行为标签下的行为事件数据整理到相应的动态行为标签下;其中,所述行为事件数据的行为事件时空域特征为:基于所述第一客户行为轨迹数据的客户行为事件的动态行为标签下的行为事件数据及其数据量描述信息确定出的行为事件数据与动态行为描述值的匹配情况。
S230、在待识别客户行为事件的当前静态行为标签下包含有多个行为事件数据的前提下,基于所述第一客户行为轨迹数据的客户行为事件的动态行为标签下的行为事件数据及其数据量描述信息,确定待识别客户行为事件的当前静态行为标签下的各行为事件数据之间的相关性系数,并基于所述各行为事件数据之间的相关性系数对当前静态行为标签下的各行为事件数据进行分类;基于所述第一客户行为轨迹数据的客户行为事件的动态行为标签下的行为事件数据及其数据量描述信息为上述分类获得的每一类行为事件数据设置动态行为描述值,并将所述每一类行为事件数据整理到所述动态行为描述值所表示的动态行为标签下。
在另一些选择性的实施例中,上述步骤“基于所述第一客户行为轨迹数据的客户行为事件的动态行为标签下的行为事件数据及其数据量描述信息,确定待识别客户行为事件的当前静态行为标签下的各行为事件数据之间的相关性系数,并基于所述各行为事件数据之间的相关性系数对当前静态行为标签下的各行为事件数据进行分类”,可以包括以下内容:确定待识别客户行为事件的当前静态行为标签下的各行为事件数据的行为事件时空域特征之间的皮尔森相关性系数;针对待识别客户行为事件的当前静态行为标签下的一个行为事件数据而言,将该行为事件数据和与其行为事件时空域特征之间的皮尔森相关性系数达到第二相关性系数阈值的所有行为事件数据划分为一类;其中,所述行为事件数据的行为事件时空域特征为:基于所述第一客户行为轨迹数据的客户行为事件的动态行为标签下的行为事件数据及其数据量描述信息确定出的行为事件数据与动态行为描述值的匹配情况。
在另一些选择性的实施例中,步骤“基于所述第一客户行为轨迹数据的客户行为事件的动态行为标签下的行为事件数据及其数据量描述信息为上述分类获得的每一类行为事件数据设置动态行为描述值”,可以包括以下内容:针对分类后的一类行为事件数据而言,基于所述所述第一客户行为轨迹数据的客户行为事件的动态行为标签下的行为事件数据确定该类中的各行为事件数据所属的动态行为描述值的匹配情况,并基于所述匹配情况为该类行为事件数据设置动态行为描述值。其中,动态行为描述值用于对行为事件数据进行动态行为的评估,动态行为描述值越大,行为事件数据为动态行为(实际交互行为数据)的概率越大。
S240、根据所述动态行为标签下的行为事件数据,生成所述目标客户行为轨迹数据。
举例而言,由于动态行为标签下的行为事件数据是经过优化的,因此能够确保动态行为标签下的行为事件数据在具有较高的特征识别度和信息还原度的前提下,还具有较小的数据量规模,从而确保生成的目标客户行为轨迹数据能够适配云业务交互设备的数据处理性能。
本发明实施例还提出了一种示例性的针对数字化云业务的大数据分析装置,如图3所示,针对数字化云业务的大数据分析装置200可以包括以下的功能模块:记录确定模块210,用于通过不同的待处理业务互动日志中的客户行为轨迹数据,确定所述客户行为轨迹数据对应的关联行为更新记录;意图分析模块220,用于基于所述客户行为轨迹数据对应的关联行为更新记录,确定所述客户行为轨迹数据对应的节点化行为特征内容,以对所述客户行为轨迹数据进行消费互动意图分析得到消费互动意图分析内容;数据生成模块230,用于根据所述客户行为轨迹数据及所述客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容,生成目标客户行为轨迹数据;其中,所述目标客户行为轨迹数据用于进行潜在消费需求分析。关于上述功能模块的说明可以参阅对图1和图3所示的方法的说明。
基于上述的方法实施例和装置实施例,本发明实施例还提出了一种系统实施例,也即针对数字化云业务的大数据分析系统,请结合参阅图4,针对数字化云业务的大数据分析系统30可以包括大数据服务器10和云业务交互设备20。其中,大数据服务器10和云业务交互设备20通信用以实施上述方法,进一步地,针对数字化云业务的大数据分析系统30的功能性描述如下。大数据服务器10通过不同的待处理业务互动日志中的客户行为轨迹数据,确定所述客户行为轨迹数据对应的关联行为更新记录;基于所述客户行为轨迹数据对应的关联行为更新记录,确定所述客户行为轨迹数据对应的节点化行为特征内容,以对所述客户行为轨迹数据进行消费互动意图分析得到消费互动意图分析内容;根据所述客户行为轨迹数据及所述客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容,生成目标客户行为轨迹数据,向云业务交互设备20发送所述目标客户行为轨迹数据。云业务交互设备20根据所述目标客户行为轨迹数据确定当前客户的潜在消费需求并通过所述潜在消费需求进行云业务产品输出。关于上述系统的说明可以参阅对图1和图3所示的方法的说明
请结合参阅图5,大数据服务器10可以包括处理引擎110、网络模块120和存储器130,处理引擎110和存储器130通过网络模块120通信。
处理引擎110可以处理相关的信息和/或数据以执行本申请中描述的一个或多个功能。例如,在一些实施例中,处理引擎110可以包括至少一个处理引擎(例如,单核处理引擎或多核处理器)。仅作为示例,处理引擎110可以包括中央处理单元(Central ProcessingUnit,CPU)、专用集成电路(Application-Specific Integrated Circuit,ASIC)、专用指令集处理器(Application-Specific Instruction-set Processor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field ProgrammableGate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、精简指令集计算机(Reduced Instruction-Set Computer,RISC)、微处理器等或其任意组合。
网络模块120可以促进信息和/或数据的交换。在一些实施例中,网络模块120可以是任何类型的有线或无线网络或其组合。仅作为示例,网络模块120可以包括缆线网络、有线网络、光纤网络、电信网络、内部网络、互联网、局域网络(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网络(Wireless Local Area Network,WLAN)、城域网(Metropolitan Area Network,MAN)、公用电话交换网(Public Telephone SwitchedNetwork,PSTN)、蓝牙网络、无线个域网络、近场通讯(Near Field Communication,NFC)网络等或上述举例的任意组合。在一些实施例中,网络模块120可以包括至少一个网络接入点。例如,网络模块120可以包括有线或无线网路接入点,如基站和/或网路接入点。
存储器130可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器130用于存储程序,所述处理引擎110在接收到执行指令后,执行所述程序。
可以理解,图5所示的结构仅为示意,大数据服务器10还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件、软件或其组合实现。
需要理解的是,针对上述内容,本领域技术人员可以根据上述所公开的内容进行前后推导毫无疑义地确定相关技术术语所指代的含义,例如针对一些值、系数、权重、指数、因子等术语,本领域技术人员可以根据前后的逻辑关系进行推导和确定,这些数值的取值范围可以根据实际情况进行选取,例如0~1,又例如1~10,再例如50~100,在此均不作限定。
本领域技术人员可以根据上述已公开的内容毫无疑义对一些预设的、基准的、预定的、设定的以及目标的技术特征/技术术语进行确定,例如阈值、阈值区间、阈值范围等。对于一些未作解释的技术特征术语,本领域技术人员完全能够基于前后文的逻辑关系进行合理地、毫无疑义地推导,从而清楚、完整地实施上述技术方案。未作解释的技术特征术语的前缀,例如“第一”、“第二”、“上一个”、“下一个”、“前一个”、“后一个”、“当前”、“历史”、“最新”、“最佳”、“目标”、“指定”和“实时”等,可以根据前后文进行毫无疑义地推导和确定。未作解释的技术特征术语的后缀,例如“列表”、“特征”、“序列”、“集合”、“矩阵”、“单元”、“元素”、“轨迹”和“清单”等,也可以根据前后文进行毫无疑义地推导和确定。
本发明实施例公开的上述内容对于本领域技术人员而言是清楚完整的。应当理解,本领域技术人员基于上述公开的内容对未作解释的技术术语进行推导和分析的过程是基于本申请所记载的内容进行的,因此上述内容并不是对整体方案的创造性的评判。
应当理解,上述所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有适应性的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。
Claims (10)
1.一种针对数字化云业务的大数据分析方法,其特征在于,应用于大数据服务器,所述方法至少包括以下步骤:
通过不同的待处理业务互动日志中的客户行为轨迹数据,确定所述客户行为轨迹数据对应的关联行为更新记录;
基于所述客户行为轨迹数据对应的关联行为更新记录,确定所述客户行为轨迹数据对应的节点化行为特征内容,以对所述客户行为轨迹数据进行消费互动意图分析得到消费互动意图分析内容;
根据所述客户行为轨迹数据及所述客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容,生成目标客户行为轨迹数据;其中,所述目标客户行为轨迹数据用于进行潜在消费需求分析。
2.根据权利要求1所述的针对数字化云业务的大数据分析方法,其特征在于,所述通过不同的待处理业务互动日志中的客户行为轨迹数据,确定所述客户行为轨迹数据对应的关联行为更新记录,包括:
根据第一待处理业务互动日志中的第一客户行为轨迹数据,确定与所述第一客户行为轨迹数据对应的关联行为更新记录作为初始行为记录,所述第一待处理业务互动日志包括至少一组客户行为轨迹数据;
根据第二待处理业务互动日志确定与所述第二待处理业务互动日志对应的关联行为更新记录作为目标行为记录;所述第二待处理业务互动日志用于表征目标客户行为轨迹数据的消费习惯内容和/或操作习惯内容;
相应的,所述基于所述客户行为轨迹数据对应的关联行为更新记录,确定所述客户行为轨迹数据对应的节点化行为特征内容,以对所述客户行为轨迹数据进行消费互动意图分析得到消费互动意图分析内容,包括:
根据所述初始行为记录和所述目标行为记录,确定所述第一客户行为轨迹数据对应的节点化行为特征内容,并根据所述节点化行为特征内容对所述第一客户行为轨迹数据进行消费互动意图分析得到所述第一客户行为轨迹数据对应的消费互动意图分析内容;
相应的,所述根据所述客户行为轨迹数据及所述客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容,生成目标客户行为轨迹数据,包括:
根据所述第一客户行为轨迹数据及所述第一客户行为轨迹数据对应的节点化行为特征内容和消费互动意图分析内容,通过客户存留意图分析网络获得所述第一客户行为轨迹数据对应的行为特征变化内容和热点业务分布内容;
根据所述第一客户行为轨迹数据及所述第一客户行为轨迹数据对应的节点化行为特征内容、行为特征变化内容和热点业务分布内容,生成所述目标客户行为轨迹数据;
相应的,所述方法还包括:
通过客户需求识别网络对所述目标客户行为轨迹数据进行消费互动需求识别,获得所述客户需求识别网络输出的消费业务需求信息。
3.根据权利要求2所述的针对数字化云业务的大数据分析方法,其特征在于,所述根据第二待处理业务互动日志确定与所述第二待处理业务互动日志对应的关联行为更新记录作为目标行为记录,包括:
当第二待处理业务互动日志中包括目标知识图谱节点时,根据所述目标知识图谱节点确定关联行为更新记录,作为目标行为记录;
或者,当所述第二待处理业务互动日志为第二客户行为轨迹数据时,根据所述第二客户行为轨迹数据确定关联行为更新记录,作为目标行为记录;其中,所述第二客户行为轨迹数据与所述第一客户行为轨迹数据之间不完全相同;
通过以下方式确定客户行为轨迹数据对应的关联行为更新记录:
确定客户行为轨迹数据中的客户行为状态标签;根据预存的场景行为数据生成关联行为更新记录,将所述关联行为更新记录的关联标签映射至全局业务特征图得到映射标签;确定使得所述客户行为状态标签与所述映射标签之间的余弦相似度最大化的知识图谱节点,根据所述知识图谱节点确定与所述客户行为轨迹数据对应的关联行为更新记录;
或者,
确定客户行为轨迹数据中的客户行为状态标签;根据所述客户行为状态标签和所述客户行为轨迹数据,通过知识图谱构建策略获得知识图谱节点;根据所述知识图谱节点确定所述客户行为轨迹数据对应的关联行为更新记录。
4.根据权利要求2所述的针对数字化云业务的大数据分析方法,其特征在于,所述根据所述第一客户行为轨迹数据及所述第一客户行为轨迹数据对应的节点化行为特征内容、行为特征变化内容和热点业务分布内容,生成所述目标客户行为轨迹数据,包括:
根据所述第一客户行为轨迹数据对应的行为特征变化内容对所述第一客户行为轨迹数据对应的节点化行为特征内容进行行为特征优化,得到所述第一客户行为轨迹数据对应的行为特征内容;
根据所述第一客户行为轨迹数据对应的行为特征内容对所述第一客户行为轨迹数据进行消费互动意图分析得到所述第一客户行为轨迹数据对应的目标消费互动意图分析内容;
根据所述第一客户行为轨迹数据对应的目标消费互动意图分析内容和热点业务分布内容,生成所述目标客户行为轨迹数据。
5.根据权利要求2所述的针对数字化云业务的大数据分析方法,其特征在于,所述第二待处理业务互动日志包括多组存在时序先后关系的目标知识图谱节点或者多组存在时序先后关系的第二客户行为轨迹数据;
则所述根据第二待处理业务互动日志确定与所述第二待处理业务互动日志对应的关联行为更新记录作为目标行为记录,包括:
当所述第二待处理业务互动日志包括多组存在时序先后关系的目标知识图谱节点时,按照时序先后关系针对每组目标知识图谱节点,确定与所述目标知识图谱节点对应的关联行为更新记录,作为所述目标知识图谱节点对应的目标行为记录;
当所述第二待处理业务互动日志包括多组存在时序先后关系的第二客户行为轨迹数据时,按照时序先后关系针对每组第二客户行为轨迹数据,确定与所述第二客户行为轨迹数据对应的关联行为更新记录,作为所述第二客户行为轨迹数据对应的目标行为记录;
相应的,按照时序先后关系针对每个所述目标行为记录,执行步骤:根据所述初始行为记录和所述目标行为记录,确定所述第一客户行为轨迹数据对应的节点化行为特征内容;
相应的,所述方法还包括:根据所述目标行为记录的时序先后关系和基于每个所述目标行为记录生成的所述目标客户行为轨迹数据,生成在时序上关联的轨迹数据集;
相应的,所述方法还包括:
接收针对所述在时序上关联的轨迹数据集的调用指令;
根据所述调用指令,调用所述在时序上关联的轨迹数据集;
相应的,所述方法还包括:
向云业务交互设备发送所述目标客户行为轨迹数据,指示所述云业务交互设备根据所述目标客户行为轨迹数据确定当前客户的潜在消费需求并通过所述潜在消费需求进行云业务产品输出。
6.根据权利要求2所述的针对数字化云业务的大数据分析方法,其特征在于,所述第一待处理业务互动日志包括属于同一客户的多组不同的第一客户行为轨迹数据;则所述确定与所述第一客户行为轨迹数据对应的关联行为更新记录作为初始行为记录,包括:
针对所述第一待处理业务互动日志中的每组第一客户行为轨迹数据,确定与所述第一客户行为轨迹数据对应的关联行为更新记录,作为与所述第一客户行为轨迹数据对应的初始行为记录。
7.根据权利要求2所述的针对数字化云业务的大数据分析方法,其特征在于,所述客户存留意图分析网络采用卷积层和全连接层的网络层结构;所述客户存留意图分析网络通过以下方式训练生成:
确定第一样本训练集合,所述第一样本训练集合中的每个训练样本包括至少一组样本轨迹数据及其对应的分类标签信息,所述样本轨迹数据包括客户行为轨迹数据及其对应的节点化行为特征内容和基于节点化行为特征内容进行消费互动意图分析得到的消费互动意图分析内容;所述分类标签信息包括标记的行为特征变化内容和热点业务分布内容;
通过所述第一样本训练集合中的训练样本进行网络模型训练,获得所述客户存留意图分析网络。
8.根据权利要求2所述的针对数字化云业务的大数据分析方法,其特征在于,所述客户需求识别网络通过以下方式训练生成:
确定第二样本训练集合,所述第二样本训练集合中的每个训练样本包括所述目标客户行为轨迹数据及其对应的已标记的客户行为轨迹数据;
通过所述第二样本训练集合中的训练样本训练客户需求识别网络,获得所述客户需求识别网络。
9.一种大数据服务器,其特征在于,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行权利要求1-8任一项所述的方法。
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在运行时实现权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110668165.6A CN113468338A (zh) | 2021-06-16 | 2021-06-16 | 针对数字化云业务的大数据分析方法及大数据服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110668165.6A CN113468338A (zh) | 2021-06-16 | 2021-06-16 | 针对数字化云业务的大数据分析方法及大数据服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113468338A true CN113468338A (zh) | 2021-10-01 |
Family
ID=77870084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110668165.6A Withdrawn CN113468338A (zh) | 2021-06-16 | 2021-06-16 | 针对数字化云业务的大数据分析方法及大数据服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113468338A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779431A (zh) * | 2021-11-12 | 2021-12-10 | 杭银消费金融股份有限公司 | 基于时序特征的业务信息处理方法及服务器 |
CN114201551A (zh) * | 2021-12-07 | 2022-03-18 | 建信金融科技有限责任公司 | 数据存储方法和数据存储装置 |
CN115344880A (zh) * | 2022-09-14 | 2022-11-15 | 陈诚 | 应用于数字云的信息安全分析方法及服务器 |
CN115905624A (zh) * | 2022-10-18 | 2023-04-04 | 支付宝(杭州)信息技术有限公司 | 一种用户行为状态的确定方法、装置及设备 |
-
2021
- 2021-06-16 CN CN202110668165.6A patent/CN113468338A/zh not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779431A (zh) * | 2021-11-12 | 2021-12-10 | 杭银消费金融股份有限公司 | 基于时序特征的业务信息处理方法及服务器 |
CN113779431B (zh) * | 2021-11-12 | 2022-02-08 | 杭银消费金融股份有限公司 | 基于时序特征的业务信息处理方法及服务器 |
CN114201551A (zh) * | 2021-12-07 | 2022-03-18 | 建信金融科技有限责任公司 | 数据存储方法和数据存储装置 |
CN115344880A (zh) * | 2022-09-14 | 2022-11-15 | 陈诚 | 应用于数字云的信息安全分析方法及服务器 |
CN115905624A (zh) * | 2022-10-18 | 2023-04-04 | 支付宝(杭州)信息技术有限公司 | 一种用户行为状态的确定方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113468338A (zh) | 针对数字化云业务的大数据分析方法及大数据服务器 | |
CN110413786B (zh) | 基于网页文本分类的数据处理方法、智能终端及存储介质 | |
CN111475613A (zh) | 案件分类方法、装置、计算机设备及存储介质 | |
KR20190021189A (ko) | 모델 분석 방법, 장치 및 컴퓨터 판독 가능한 저장매체 | |
CN113705554A (zh) | 图像识别模型的训练方法、装置、设备及存储介质 | |
CN113392405B (zh) | 结合大数据分析的数字化服务漏洞检测方法及服务器 | |
CN109598566A (zh) | 下单预测方法、装置、计算机设备和计算机可读存储介质 | |
CN112818032B (zh) | 服务于大数据挖掘分析的数据筛选方法及数据分析服务器 | |
CN107797989A (zh) | 企业名称识别方法、电子设备及计算机可读存储介质 | |
CN112765462B (zh) | 针对大数据业务以及人工智能的数据处理方法及云服务器 | |
CN109492093A (zh) | 基于高斯混合模型和em算法的文本分类方法及电子装置 | |
CN114298050A (zh) | 模型的训练方法、实体关系抽取方法、装置、介质、设备 | |
CN112819024B (zh) | 模型处理方法、用户数据处理方法及装置、计算机设备 | |
CN113408897A (zh) | 应用于大数据业务的数据资源共享方法及大数据服务器 | |
CN113472860A (zh) | 大数据和数字化环境下的业务资源分配方法及服务器 | |
CN114781611A (zh) | 自然语言处理方法、语言模型训练方法及其相关设备 | |
CN114090601B (zh) | 一种数据筛选方法、装置、设备以及存储介质 | |
CN112948090B (zh) | 应用于网络业务处理的大数据分析整理方法及服务器 | |
CN112132269B (zh) | 模型处理方法、装置、设备及存储介质 | |
CN113468017A (zh) | 应用于区块链的在线业务状态检测方法及业务服务器 | |
CN113313463A (zh) | 应用于大数据云办公的数据分析方法及数据分析服务器 | |
KR102152081B1 (ko) | 딥러닝 기반의 가치 평가 방법 및 그 장치 | |
CN116862580A (zh) | 短信触达时间预测方法、装置、计算机设备及存储介质 | |
CN111274907A (zh) | 使用类别识别模型来确定用户的类别标签的方法和装置 | |
CN115905293A (zh) | 作业执行引擎的切换方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20211001 |