CN113407836A - 应用于大数据的业务互动分析方法及业务互动服务器 - Google Patents
应用于大数据的业务互动分析方法及业务互动服务器 Download PDFInfo
- Publication number
- CN113407836A CN113407836A CN202110682213.7A CN202110682213A CN113407836A CN 113407836 A CN113407836 A CN 113407836A CN 202110682213 A CN202110682213 A CN 202110682213A CN 113407836 A CN113407836 A CN 113407836A
- Authority
- CN
- China
- Prior art keywords
- subscription data
- service interaction
- cluster
- correlation coefficient
- cluster set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供的应用于大数据的业务互动分析方法及业务互动服务器,能够基于获取到的目标业务大数据的各个订阅数据目录中的关键订阅数据所对应的业务互动场景之间的相关性系数进行进行聚类获得至少两个聚类集合,然后通过对至少两个聚类集合进行场景融合获得至少一个业务互动场景聚类,这样可以在各个订阅数据目录中将业务互动场景聚类中的各个关键订阅数据所对应的业务互动场景识别为同一个设定类别订阅设备所关注的业务互动场景。从而通过多次场景聚类融合,尽可能完整无误地识别出同一个设定类别订阅设备所关注的所有业务互动场景,从而为相同设定类别订阅设备的业务画像分析提供准确可靠的分析依据。
Description
技术领域
本申请涉及大数据分析技术领域,特别涉及一种应用于大数据的业务互动分析方法及业务互动服务器。
背景技术
在数字化经济时代,互联网、物联网、5G、大数据、云计算、智慧城市等各类模式的信息技术呈爆炸式增长,使得数据以令人难以想象的速度爆发式增长,云业务互动的各个阶段都可以被记录下来。现目前,数据已成为一种重要的消费要素,经过对数据的搜集、存储、再组织和分析建模,暗藏在数据中的重要价值及法则可以被客观地发掘展现出来,成为业务优化升级及可延续展开的重要推进力量。
随着云业务的不断更新和优化,对云业务进行互动分析以挖掘出用户的业务需求或者业务画像,以提高业务互动效率和质量是各大业务服务商重点关注的问题。然而,云业务的不断更新和优化所带来的业务互动场景的变化是巨大的,相关技术在涉及到业务互动场景层面的业务互动分析时,仍然存在一些有待改进的地方。
发明内容
鉴于上述内容,本申请提供了如下方案。
本申请实施例之一的方案提供一种应用于大数据的业务互动分析方法,所述方法包括:
获取目标业务大数据的各个订阅数据目录中的关键订阅数据所对应的业务互动场景;所述关键订阅数据所对应的业务互动场景是设定类别订阅设备的订阅数据在对应的订阅数据目录中的业务互动场景;
基于所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景的相关性系数,对所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景进行聚类,获得至少两个聚类集合;所述聚类集合由不间断的订阅数据目录中的各一个关键订阅数据所对应的业务互动场景组成;
对所述至少两个聚类集合进行场景融合,获得至少一个业务互动场景聚类;
在所述各个订阅数据目录中,将所述业务互动场景聚类中的各个关键订阅数据所对应的业务互动场景识别为同一个设定类别订阅设备所关注的业务互动场景。
优选的,所述基于所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景的相关性系数,对所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景进行聚类,获得至少两个聚类集合,包括:
基于第一订阅数据目录内的第一业务互动场景,与第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的互动场景相关性系数,从所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中确定满足预设判定条件的第二业务互动场景;其中,所述第一订阅数据目录和所述第二订阅数据目录是所述各个订阅数据目录中的连续两个订阅数据目录;所述第一业务互动场景是目标聚类集合对应在所述第一订阅数据目录中的业务互动场景;
将所述第二业务互动场景调整为所述目标聚类集合在所述第二订阅数据目录中的业务互动场景。
优选的,所述基于第一订阅数据目录内的第一业务互动场景与第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的互动场景相关性系数,从所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中确定满足预设判定条件的第二业务互动场景,包括:
获取所述第一业务互动场景与所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的第一类别相关性系数,所述第一类别相关性系数是基于两个业务互动场景之间的地域相关性系数、热度相关性系数以及描述特征相关性系数获得的;
将所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中,对应的所述第一类别相关性系数满足所述预设判定条件的业务互动场景确定为所述第二业务互动场景。
优选的,所述方法还包括:
响应于所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中不存在对应的所述第一类别相关性系数满足所述预设判定条件的业务互动场景,获取所述第一业务互动场景与所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的第二类别相关性系数,所述第二类别相关性系数是基于两个业务互动场景之间的描述特征相关性系数获得的;
将所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中,对应的所述第二类别相关性系数满足所述预设判定条件的业务互动场景确定为所述第二业务互动场景。
优选的,所述方法还包括:
响应于所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中,不存在满足所述预设判定条件的第二业务互动场景,且所述目标聚类集合中不间断的关联业务互动场景的数量低于预设数量,基于所述目标聚类集合中的各个业务互动场景,检测所述目标聚类集合在所述第二订阅数据目录中的所述关联业务互动场景;
将检测得到的所述关联业务互动场景,调整为所述目标聚类集合在所述第二订阅数据目录中的业务互动场景。
优选的,所述对所述至少两个聚类集合进行场景融合,获得至少一个地域聚类,包括:
获取所述至少两个聚类集合之间的相关性系数;
基于所述至少两个聚类集合之间的相关性系数,对所述至少两个聚类集合进行场景融合,获得所述至少一个地域聚类。
优选的,所述获取所述至少两个聚类集合之间的相关性系数,包括:
获取所述至少两个聚类集合中的第一聚类集合与第二聚类集合之间的地域相关性系数;所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景所在的第一订阅数据目录,在时序顺序上位于所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景所在的第二订阅数据目录之前;
基于所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度,以及所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度,获取所述第一聚类集合与所述第二聚类集合的热度相关性系数;
基于所述第一聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,以及所述第二聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,获取所述第一聚类集合与所述第二聚类集合的描述特征相关性系数;
基于所述第一聚类集合与所述第二聚类集合之间的地域相关性系数、热度相关性系数以及描述特征相关性系数,获取所述第一聚类集合与所述第二聚类集合之间的相关性系数;
相应的,所述获取所述至少两个聚类集合中的第一聚类集合与第二聚类集合之间的地域相关性系数,包括:
基于所述第一聚类集合中的各个关键订阅数据所对应的业务互动场景的地域信息,在所述第一订阅数据目录之后的订阅数据目录中进行聚类检测,获得所述第一聚类集合传递到所述第二订阅数据目录中的检测业务互动场景;
获取所述第一聚类集合传递到所述第二订阅数据目录中的检测业务互动场景,与所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景之间的地域相关性系数,作为所述第一聚类集合与所述第二聚类集合之间的地域相关性系数;
相应的,所述基于所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度,以及所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度,获取所述第一聚类集合与所述第二聚类集合的热度相关性系数,包括:
基于所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度,以及所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度之间的初始热度相关性系数;
通过目标相关性系数优化策略对所述初始热度相关性系数进行优化,获得所述第一聚类集合与所述第二聚类集合的热度相关性系数;其中,所述目标相关性系数优化策略的优化权重与所述第一订阅数据目录和所述第二订阅数据目录之间的有效订阅时段间隔存在映射关系;
相应的,所述基于所述第一聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,以及所述第二聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,获取所述第一聚类集合与所述第二聚类集合的描述特征相关性系数,包括:
对所述第一聚类集合中,时序顺序上不连续的至少两个关键订阅数据所对应的业务互动场景的描述特征进行特征拼接,获得所述第一聚类集合的描述特征;
对所述第二聚类集合中,时序顺序上不连续的至少两个关键订阅数据所对应的业务互动场景的描述特征进行特征拼接,获得所述第二聚类集合的描述特征;
获取所述第一聚类集合的描述特征与所述第二聚类集合的描述特征之间的相关性系数,作为所述第一聚类集合与所述第二聚类集合的描述特征相关性系数。
优选的,所述基于所述至少两个聚类集合之间的相关性系数,对所述至少两个聚类集合进行场景融合,获得所述至少一个地域聚类,包括:
以所述至少两个聚类集合为图单元,以所述至少两个聚类集合之间的相关性系数为关联路径的标签,生成携带标签的可视化网络拓扑;
对所述携带标签的可视化网络拓扑进行网络拓扑拆分,获得至少一个目标关键网络拓扑;
对属于同一个所述目标关键网络拓扑的聚类集合进行场景融合,获得所述至少一个地域聚类。
优选的,所述对所述携带标签的可视化网络拓扑进行网络拓扑拆分,获得至少一个目标关键网络拓扑,包括:
通过设定算法对所述携带标签的可视化网络拓扑进行网络拓扑拆分,获得所述至少一个目标关键网络拓扑。
本申请实施例之一的方案提供一种业务互动服务器,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行上述的方法。
在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。
附图说明
本申请将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本申请的一些实施例所示的一种示例性应用于大数据的业务互动分析方法和/或过程的流程图;
图2是根据本申请的一些实施例所示的一种示例性应用于大数据的业务互动分析装置的框图;
图3是根据本申请的一些实施例所示的一种示例性应用于大数据的业务互动分析系统的框图,以及
图4是根据本申请的一些实施例所示的一种示例性业务互动服务器中硬件和软件组成的示意图。
具体实施方式
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
本申请提供的应用于大数据的业务互动分析方法及业务互动服务器的整体方案可以总结为如下:获取目标业务大数据的各个订阅数据目录中的关键订阅数据所对应的业务互动场景;基于所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景的相关性系数,对所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景进行聚类获得至少两个聚类集合;对所述至少两个聚类集合进行场景融合获得至少一个业务互动场景聚类;在所述各个订阅数据目录中将所述业务互动场景聚类中的各个关键订阅数据所对应的业务互动场景识别为同一个设定类别订阅设备所关注的业务互动场景。
这样一来,能够基于不同的业务互动场景的相关性系数实现业务互动场景的聚类,并对聚类得到的聚类集合进行场景融合得到业务互动场景聚类,如此,通过多次场景聚类和融合,可以实现尽可能完整无误地识别出同一个设定类别订阅设备所关注的业务互动场景,从而为相同设定类别订阅设备的业务画像分析提供准确可靠的分析依据。
基于上述内容,首先对应用于大数据的业务互动分析方法进行示例性的说明,请参阅图1,是根据本申请的一些实施例所示的一种示例性应用于大数据的业务互动分析方法和/或过程的流程图,应用于大数据的业务互动分析方法可以包括以下步骤100-步骤400所描述的技术方案。
步骤100、业务互动服务器获取目标业务大数据的各个订阅数据目录中的关键订阅数据所对应的业务互动场景。
例如,业务互动服务器可以与多个订阅设备通信连接,目标业务大数据可以是订阅设备与业务互动服务器在业务交互过程中生成的。进一步地,所述关键订阅数据所对应的业务互动场景是设定类别订阅设备的订阅数据在对应的订阅数据目录中的业务互动场景。
此外,订阅数据目录可以理解为订阅数据记录或者订阅数据列表,用于汇总不同类型的订阅数据,包括但不限于业务互动场景、业务互动类型、业务互动对象等。在此基础上,业务互动场景可以是一些可能的在线业务场景,比如订阅业务场景、支付业务场景、浏览业务场景、查询业务场景等。在这些场景下,业务互动服务器可以和订阅设备进行交互通信。
在一些可能的示例中,设定类别订阅设备可以根据实际情况进行选择,比如设定类别可以是所通信的对象数量达到设定数值的订阅设备,比如设定数值为10,那么设定类别订阅设备d所通信的对象数量可以为12或者15。
可以理解的是,通过获取关键订阅数据所对应的业务互动场景,能够对设定类别订阅设备(相对重要的订阅设备)进行针对性的场景分析和定位,从而完整确定出相关的场景层面的业务画像分析依据。
步骤200、业务互动服务器基于所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景的相关性系数,对所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景进行聚类,获得至少两个聚类集合。
本申请实施例中,所述聚类集合由不间断的订阅数据目录中的各一个关键订阅数据所对应的业务互动场景组成。不间断的订阅数据目录可以是在时序上连续的订阅数据目录,相关性系数可以是皮尔森相关性系数,或者余弦相似度等。
基于此,上述步骤200所描述的基于所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景的相关性系数,对所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景进行聚类,获得至少两个聚类集合,可以通过以下步骤210和步骤220所描述的内容。
步骤210、基于第一订阅数据目录内的第一业务互动场景与第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的互动场景相关性系数,从所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中确定满足预设判定条件的第二业务互动场景。
在本实施中,所述第一订阅数据目录和所述第二订阅数据目录是所述各个订阅数据目录中的连续两个订阅数据目录;所述第一业务互动场景是目标聚类集合对应在所述第一订阅数据目录中的业务互动场景。目标聚类集合可以是预先设置的基准聚类集合。
进一步地,互动场景相关性系数可以基于场景特征确定,比如基于场景特征向量之间的余弦距离确定互动场景相关性系数。
在一些可能的实施例中,步骤210所描述的基于第一订阅数据目录内的第一业务互动场景与第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的互动场景相关性系数,从所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中确定满足预设判定条件的第二业务互动场景。还可以通过以下步骤211和步骤212实现。
步骤211、获取所述第一业务互动场景与所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的第一类别相关性系数。
例如,所述第一类别相关性系数是基于两个业务互动场景之间的地域相关性系数、热度相关性系数以及描述特征相关性系数获得的。
举例而言,两个业务互动场景之间的地域相关性系数、热度相关性系数以及描述特征相关性系数可以分别为c1、c2、c3,则第一类别相关性系数c0可以根据c1、c2、c3的加权结果得到。
进一步地,地域相关性系数可以根据不同业务互动场景的经纬度数据确定,热度相关性系数可以根据业务互动热度或者业务互动频率确定,描述特征相关性系数可以根据业务互动场景的文本内容或者可视化内容确定。一般而言,地域相关性系数、热度相关性系数以及描述特征相关性系数可以根据相关的计算公式计算得到,比如地域相关性系数可以根据常见的位置区域计算公式得到,热度相关性系数可以根据常见的搜索指数计算方式得到,描述特征相关性系数可以基于常见的机器学习模型计算得到,在此不一一列举。
步骤212、将所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中,对应的所述第一类别相关性系数满足所述预设判定条件的业务互动场景确定为所述第二业务互动场景。
在本实施例中,预设判定条件可以是第一类别相关性系数达到设定相关性系数阈值,相关性系数阈值可以是cc,一般而言可以取0.8,在一些特殊情况下可以在0.8的基础上进行适当增减,在此不作限定。
如此一来,通过实施上述步骤211和步骤212,能够通过对相关性系数进行量化分析从而实现对不同业务互动场景的精准聚类,提高场景聚类的可信度。
在一些可选的实施例中,该方法还可以包括以下内容:响应于所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中不存在对应的所述第一类别相关性系数满足所述预设判定条件的业务互动场景,获取所述第一业务互动场景与所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的第二类别相关性系数,所述第二类别相关性系数是基于两个业务互动场景之间的描述特征相关性系数获得的;将所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中,对应的所述第二类别相关性系数满足所述预设判定条件的业务互动场景确定为所述第二业务互动场景。
可以理解的是,如果所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中不存在对应的所述第一类别相关性系数满足所述预设判定条件的业务互动场景,则表明基于地域相关性系数、热度相关性系数以及描述特征相关性系数确定出的第一类别相关性系数可能较为严格,从而导致相关的业务互动场景被过滤,为改善这一问题,可以选择描述特征相关性系数作为基础来确定第二类别相关性系数,从而将所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中,对应的所述第二类别相关性系数满足所述预设判定条件的业务互动场景确定为所述第二业务互动场景。
可以理解的是,第二类别相关性系数由于没有考虑地域相关性系数、热度相关性系数,因此相关性系数的绝对值相较于第一类别相关性系数的绝对值较大,这样一来,可以基于描述特征层面尽可能实现对第二类别相关性系数满足预设判定条件的业务互动场景的确定。
在另一些可能的实施例中,该方法还可以包括以下内容:响应于所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中,不存在满足所述预设判定条件的第二业务互动场景,且所述目标聚类集合中不间断的关联业务互动场景的数量低于预设数量,基于所述目标聚类集合中的各个业务互动场景,检测所述目标聚类集合在所述第二订阅数据目录中的所述关联业务互动场景;将检测得到的所述关联业务互动场景,调整为所述目标聚类集合在所述第二订阅数据目录中的业务互动场景。
可以理解的是,如果所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中,不存在满足所述预设判定条件的第二业务互动场景,那么表明所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景的相关性系数不符合要求,在此基础上,若所述目标聚类集合中不间断的关联业务互动场景的数量低于预设数量,表明目标聚类集合的聚类饱和度或者聚类要求还没有得到预期,为此,可以基于所述目标聚类集合中的各个业务互动场景,检测所述目标聚类集合在所述第二订阅数据目录中的所述关联业务互动场景,该关联业务互动场景可以不通过相关性系数检测,比如可以通过直接通信连接关系或者间接通信连接关系确定,这样可以将检测得到的所述关联业务互动场景,调整为所述目标聚类集合在所述第二订阅数据目录中的业务互动场景。
步骤220、将所述第二业务互动场景调整为所述目标聚类集合在所述第二订阅数据目录中的业务互动场景。
可以理解的是,在第二业务互动场景满足预设判定条件时,可以对第二业务互动场景进行分类处理。
如此,通过实施上述步骤210和步骤220,能够基于连续两个订阅数据目录实现业务互动场景的聚类,从而避免个别业务互动场景在聚类过程中被遗漏。
步骤300、业务互动服务器对所述至少两个聚类集合进行场景融合,获得至少一个业务互动场景聚类。
在本实施例中,获取聚类集合的方式可以理解为第一次聚类,对聚类集合进行场景融合得到业务互动场景聚类的方式可以理解为第二次聚类,如此,通过两次聚类处理,可以实现尽可能完整无误地识别出同一个设定类别订阅设备所关注的业务互动场景,从而为相同设定类别订阅设备的业务画像分析提供准确可靠的分析依据。
可以理解,由于不同业务互动场景之间存在地域相关性系数、热度相关性系数以及描述特征相关性系数,因此业务互动场景聚类也可以理解为地域聚类、热度聚类或者描述特征聚类。由此,对所述至少两个聚类集合进行场景融合,获得至少一个业务互动场景聚类可以理解为:对所述至少两个聚类集合进行场景融合,获得至少一个地域聚类。
在上述内容的基础上,步骤“对所述至少两个聚类集合进行场景融合,获得至少一个地域聚类”所描述的内容,可以通过以下步骤310和步骤320实现。
步骤310、获取所述至少两个聚类集合之间的相关性系数。
在一些可能的实施例中,为了确保至少两个聚类集合之间的相关性系数的完整性,上述步骤310所描述的获取所述至少两个聚类集合之间的相关性系数,可以通过以下步骤311-步骤314实现。
步骤311、获取所述至少两个聚类集合中的第一聚类集合与第二聚类集合之间的地域相关性系数。
可以理解的是,所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景所在的第一订阅数据目录,在时序顺序上位于所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景所在的第二订阅数据目录之前。
进一步地,第一聚类集合与第二聚类集合之间的地域相关性系数与上述计算不同业务互动场景之间的地域相关性系数的方式类似,比如可以将不同聚类集合对应的经纬度数据进行均值计算,然后再通过相关的计算公式计算得到,在此不作赘述。
在一些可能的实施例中,上述步骤311所描述的获取所述至少两个聚类集合中的第一聚类集合与第二聚类集合之间的地域相关性系数,还可以通过以下步骤3111和步骤3112实现。
步骤3111、基于所述第一聚类集合中的各个关键订阅数据所对应的业务互动场景的地域信息,在所述第一订阅数据目录之后的订阅数据目录中进行聚类检测,获得所述第一聚类集合传递到所述第二订阅数据目录中的检测业务互动场景。
例如,地域信息可以是经纬度信息或者按照相关规则定制/量化的地域标识信息,通过地域信息,可以在所述第一订阅数据目录之后的订阅数据目录中进行基于地域层面的聚类检测。
在本实施例中,所述第一聚类集合传递到所述第二订阅数据目录中的检测业务互动场景可以理解为从第一聚类集合中抽出并迁移到第二订阅数据目录中的业务互动场景可,该步骤可以基于聚类检测结果得到。比如根据聚类检测结果中的业务互动场景的目录标识确定检测业务互动场景,如果业务互动场景的目录标识为“1-2”,那么可以确定是所述第一聚类集合传递到所述第二订阅数据目录中的检测业务互动场景。
步骤3112、获取所述第一聚类集合传递到所述第二订阅数据目录中的检测业务互动场景,与所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景之间的地域相关性系数,作为所述第一聚类集合与所述第二聚类集合之间的地域相关性系数。
进一步地,通过确定所述第一聚类集合传递到所述第二订阅数据目录中的检测业务互动场景与所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景之间的地域相关性系数,能够考虑不同订阅数据目录之间的业务互动场景的传递行为,从而确保所述第一聚类集合与所述第二聚类集合之间的地域相关性系数的准确性和可信度。
步骤312、基于所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度,以及所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度,获取所述第一聚类集合与所述第二聚类集合的热度相关性系数。
本申请实施例中,通过对所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度,以及所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度进行考虑,由于所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度与所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度在时序上较为接近,因而能够尽可能确保所述第一聚类集合与所述第二聚类集合的热度相关性系数的时效性,提高热度相关性系数的可信度。
在另外的一些实施例中,步骤312所描述的基于所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度,以及所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度,获取所述第一聚类集合与所述第二聚类集合的热度相关性系数,可以包括以下步骤3121和步骤3122。
步骤3121、基于所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度,以及所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度之间的初始热度相关性系数。
可以理解的是,初始热度相关性系数是根据所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度,以及所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度初步计算得到的热度相关性系数。
步骤3122、通过目标相关性系数优化策略对所述初始热度相关性系数进行优化,获得所述第一聚类集合与所述第二聚类集合的热度相关性系数。
进一步地,所述目标相关性系数优化策略可以是预先设置的系数调整算法,所述目标相关性系数优化策略的优化权重与所述第一订阅数据目录和所述第二订阅数据目录之间的有效订阅时段间隔存在映射关系,该映射关系可以是目标相关性系数优化策略的优化权重与所述第一订阅数据目录和所述第二订阅数据目录之间的有效订阅时段间隔呈反相关。这样一来,通过目标相关性系数优化策略对所述初始热度相关性系数进行优化,能将所述第一订阅数据目录和所述第二订阅数据目录之间的有效订阅时段间隔考虑在内,从而结合有效订阅时段间隔长短对热度的影响,以便提高所述第一聚类集合与所述第二聚类集合的热度相关性系数的精确度。
步骤313、基于所述第一聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,以及所述第二聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,获取所述第一聚类集合与所述第二聚类集合的描述特征相关性系数。
可以理解,描述特征可以是针对业务互动场景的内容的描述性特征向量,所述第一聚类集合与所述第二聚类集合的描述特征相关性系数可以通过对不同的描述性特征向量进行余弦距离计算或者欧式距离计算得到。
在另外的一些实施例中,上述步骤313所描述的基于所述第一聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,以及所述第二聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,获取所述第一聚类集合与所述第二聚类集合的描述特征相关性系数,可以通过以下步骤3131-步骤3133实现。
步骤3131、对所述第一聚类集合中,时序顺序上不连续的至少两个关键订阅数据所对应的业务互动场景的描述特征进行特征拼接,获得所述第一聚类集合的描述特征。
步骤3132、对所述第二聚类集合中,时序顺序上不连续的至少两个关键订阅数据所对应的业务互动场景的描述特征进行特征拼接,获得所述第二聚类集合的描述特征。
可以理解的是,对描述特征进行特征拼接,可以基于时序先后顺序实现,比如通过设定的拼接系数对相同特征维度下的描述特征向量值进行加权,从而确保所述第一聚类集合的描述特征以及所述第二聚类集合的描述特征的完整性。
步骤3133获取所述第一聚类集合的描述特征与所述第二聚类集合的描述特征之间的相关性系数,作为所述第一聚类集合与所述第二聚类集合的描述特征相关性系数。
可以理解,通过上述步骤3131-步骤3133,在计算所述第一聚类集合与所述第二聚类集合的描述特征相关性系数之前,能够通过特征拼接确保所述第一聚类集合的描述特征以及所述第二聚类集合的描述特征的完整性,进而确保所述第一聚类集合与所述第二聚类集合的描述特征相关性系数的完整性。
步骤314、基于所述第一聚类集合与所述第二聚类集合之间的地域相关性系数、热度相关性系数以及描述特征相关性系数,获取所述第一聚类集合与所述第二聚类集合之间的相关性系数。
可以理解的是,基于所述第一聚类集合与所述第二聚类集合之间的地域相关性系数、热度相关性系数以及描述特征相关性系数获取所述第一聚类集合与所述第二聚类集合之间的相关性系数的方式,与基于不同业务互动场景的地域相关性系数、热度相关性系数以及描述特征相关性系数获取不同类别相关性系数的方式类似,在此不作更多说明。
步骤320、基于所述至少两个聚类集合之间的相关性系数,对所述至少两个聚类集合进行场景融合,获得所述至少一个地域聚类。
在一些可能的实施例中,上述步骤320所描述的基于所述至少两个聚类集合之间的相关性系数,对所述至少两个聚类集合进行场景融合,获得所述至少一个地域聚类,可以包括以下步骤321-步骤323所描述的内容。
步骤321、以所述至少两个聚类集合为图单元,以所述至少两个聚类集合之间的相关性系数为关联路径的标签,生成携带标签的可视化网络拓扑。
本申请实施例中,图单元可以理解为图数据(Graphic Data)中的图节点,关联路径可以用于连接不同的图节点,关联路径的标签可以用于对关联路径进行区分,相应地,可视化网络拓扑可以是网络拓扑图,该网络拓扑图里面包括多个互相之间至少部分连接的图节点(图单元)。
步骤322、对所述携带标签的可视化网络拓扑进行网络拓扑拆分,获得至少一个目标关键网络拓扑。
本申请实施例中,通过对可视化网络拓扑进行网络拓扑拆分,能够实现对可视化网络拓扑的区域化处理,可以理解,目标关键网络拓扑为可视化网络拓扑中的其中一个区域。相应地,对所述携带标签的可视化网络拓扑进行网络拓扑拆分,获得至少一个目标关键网络拓扑,可以是通过设定算法对所述携带标签的可视化网络拓扑进行网络拓扑拆分,获得所述至少一个目标关键网络拓扑。在本实施例中,设定算法可以是图节点中心度优先匹配算法和/或多维特征匹配算法。进一步地,图节点中心度表征图节点所连接的路径的数量,图节点中心度优先匹配算法可以理解为优先对图节点中心度较大的图节点进行分析从而实现网络拓扑拆分。而多维特征匹配算法可以借助kmeans特征聚类算法实现,在此不详细展开说明。
步骤323、对属于同一个所述目标关键网络拓扑的聚类集合进行场景融合,获得所述至少一个地域聚类。
可以理解,对可视化网络拓扑进行区域化处理之后,不仅可以提高场景融合的精度,还可以减少业务互动服务器的处理数据处理压力,提高场景聚类效率。
在另外的一些实施例中,也可以按照上述方式进行场景融合得到热度聚类或者描述特征聚类,在此不再展开说明。
步骤400、业务互动服务器在所述各个订阅数据目录中,将所述业务互动场景聚类中的各个关键订阅数据所对应的业务互动场景识别为同一个设定类别订阅设备所关注的业务互动场景。
在实际实施过程中,在对聚类集合进行场景融合得到业务互动场景聚类之后,可以根据业务互动场景聚类对各个订阅数据目录中的业务互动场景进行分类处理,比如将所述业务互动场景聚类中的各个关键订阅数据所对应的业务互动场景识别为同一个设定类别订阅设备所关注的业务互动场景,也即为相同的设定类别订阅设备匹配所关注的业务互动场景集合,这样一来,能够完整确定出设定类别订阅设备所关注的业务互动场景集合,从而在后续对设定类别订阅设备进行业务画像分析时可以依据设定类别订阅设备所关注的不同业务互动场景实现。
比如,对于同一个设定类别订阅设备d而言,可以确定出设定类别订阅设备d所关注的业务互动场景为scene1、scene2、scene3、scene4和scene5。这样一来,在后续对设定类别订阅设备d进行画像分析时,可以通过scene1、scene2、scene3、scene4和scene5这五个业务互动场景挖掘出设定类别订阅设备d的不同的业务画像,从而确保挖掘得到的业务画像的完整性和准确性。
在一些选择性的实施例中,在步骤400所描述的将所述业务互动场景聚类中的各个关键订阅数据所对应的业务互动场景识别为同一个设定类别订阅设备所关注的业务互动场景之后,该方法还可以包括以下步骤500所描述的内容:根据设定类别订阅设备所关注的业务互动场景,对所述设定类别订阅设备进行业务画像挖掘,得到所述设定类别订阅设备对应的业务画像集。
可以理解的是,可以对设定类别订阅设备所关注的业务互动场景进行业务交互层面和业务需求层面的挖掘分析,从而得到设定类别订阅设备在所关注的每个业务互动场景下的业务交互行为画像和业务需求画像,然后将设定类别订阅设备在所关注的每个业务互动场景下的业务交互行为画像和业务需求画像进行汇总,得到设定类别订阅设备对应的业务画像集,这样可以确保设定类别订阅设备对应的业务画像集的完整性。
在一些选择性的实施例中,上述步骤500所描述的根据设定类别订阅设备所关注的业务互动场景,对所述设定类别订阅设备进行业务画像挖掘,得到所述设定类别订阅设备对应的业务画像集,可以包括以下步骤510-步骤540所描述的内容。
步骤510、获取针对目标业务互动场景的互动内容集合,所述互动内容集合包括至少两条互动内容;获得所述互动内容集合中的各条互动内容与所述目标业务互动场景之间的业务关联度。
例如,目标业务互动场景可以是设定类别订阅设备所关注的业务互动场景中的其中一个业务互动场景。业务关联度用于表征各条互动内容与所述目标业务互动场景在业务层面的相关性。
步骤520、根据所述各条互动内容对应的业务关联度,以及所述各条互动内容的业务行为事件和业务需求事件,对所述各条互动内容进行整理,得到相应的互动内容队列。
例如,业务行为事件用于表征互动内容的业务互动行为数据,业务需求事件用于表征互动内容的业务互动需求数据,对所述各条互动内容进行整理可以理解为对所述各条互动内容进行排序。
在一些选择性的实施例中,根据所述各条互动内容对应的业务关联度,以及所述各条互动内容的业务行为事件和业务需求事件,对所述各条互动内容进行整理,得到相应的互动内容队列,具体包括:根据所述各条互动内容对应的业务关联度,以及所述各条互动内容的业务行为事件和业务需求事件,对所述各条互动内容进行划分,得到至少两个互动内容子集合;对各个互动内容子集合进行整理,并分别对所述各个互动内容子集合中的各条互动内容进行整理,得到所述互动内容队列。
在一些选择性的实施例中,根据所述各条互动内容对应的业务关联度,以及所述各条互动内容的业务行为事件和业务需求事件,对所述各条互动内容进行划分,得到至少两个互动内容子集合,进一步可以包括:分别根据所述各条互动内容对应的业务关联度,对所述各条互动内容的业务行为事件和业务需求事件进行加权,得到所述各条互动内容的全局业务交互事件;根据所述各条互动内容的全局业务交互事件对所述各条互动内容进行聚类,得到至少两个互动内容子集合。
在一些选择性的实施例中,对各个互动内容子集合进行整理,并分别对所述各个互动内容子集合中的各条互动内容进行整理,得到所述互动内容队列,进一步可以包括:根据各个互动内容子集合所包含的互动内容的数量,对所述各个互动内容子集合进行整理;以及,针对所述各个互动内容子集合,分别执行以下操作:根据所述互动内容子集合中各条互动内容的业务行为事件和业务需求事件与所述互动内容子集合的内容匹配情况,对所述互动内容子集合中的各条互动内容进行整理;基于所述各个互动内容子集合之间的整理结果,以及所述各个互动内容子集合中各条互动内容的整理结果,生成所述互动内容队列。
步骤530、基于所述互动内容队列生成针对所述目标业务互动场景的目标业务画像特征队列,所述目标业务画像特征队列包括至少两个目标业务画像特征信息。
例如,目标业务画像特征队列中可以包括多个目标业务画像特征信息。
步骤540、通过所述目标业务画像特征队列中包括的目标业务画像特征信息,确定所述设定类别订阅设备对应的业务画像集。
可以理解的是,可以通过对所述目标业务画像特征队列中包括的目标业务画像特征信息进行汇总、整合和分类,从而确定出设定类别订阅设备对应的业务画像集,比如业务画像集可以包括多个目标业务互动场景下的相关画像信息,比如显性业务需求信息、隐性业务需求信息等。
在另外的一些选择性的实施例中,步骤510所描述的获得所述互动内容集合中的各条互动内容与所述目标业务互动场景之间的业务关联度,具体包括:分别将所述各条互动内容输入已训练的业务画像特征生成模型中,基于所述已训练的业务画像特征生成模型中的业务层面的动态挖掘网络对所述各条互动内容进行互动内容挖掘,获得所述动态挖掘网络输出的所述各条互动内容对应的业务关联度。
基于此,步骤520所描述的根据所述各条互动内容对应的业务关联度,以及所述各条互动内容的业务行为事件和业务需求事件,对所述各条互动内容进行整理,得到相应的互动内容队列,具体包括:分别将所述各条互动内容,以及所述各条互动内容对应的业务关联度输入所述已训练的业务画像特征生成模型中的互动内容聚类整理网络,基于所述互动内容聚类整理网络对所述各条互动内容进行聚类和整理,获得所述互动内容聚类整理网络输出的信息层面的第一融合描述向量,所述第一融合描述向量中的各个互动内容信息组合形成所述互动内容队列。
进一步地,步骤530所描述的基于所述互动内容队列生成针对所述目标业务互动场景的目标业务画像特征队列,具体包括:将所述融合描述向量输入所述已训练的业务画像特征生成模型中的业务画像特征网络,基于所述业务画像特征网络进行自监督互动内容挖掘,获得所述业务画像特征网络输出的所述目标业务画像特征队列;其中,所述已训练的业务画像特征生成模型是根据样本训练数据集训练得到的,所述样本训练数据集中的样本训练数据包括已设置相关性特征的样本互动内容,所述相关性特征表示所述样本互动内容与样本业务互动场景是否相关。
这样一来,通过实施上述步骤510-步骤540,能够得到设定类别订阅设备在所关注的每个业务互动场景下的业务交互行为画像和业务需求画像,然后将设定类别订阅设备在所关注的每个业务互动场景下的业务交互行为画像和业务需求画像进行汇总,得到设定类别订阅设备对应的业务画像集,这样可以确保设定类别订阅设备对应的业务画像集的完整性。
综上,通过应用上述步骤100-步骤400,能够基于获取到的目标业务大数据的各个订阅数据目录中的关键订阅数据所对应的业务互动场景之间的相关性系数进行进行聚类获得至少两个聚类集合,然后通过对至少两个聚类集合进行场景融合获得至少一个业务互动场景聚类,这样可以在各个订阅数据目录中将业务互动场景聚类中的各个关键订阅数据所对应的业务互动场景识别为同一个设定类别订阅设备所关注的业务互动场景。从而通过多次场景聚类融合,尽可能完整无误地识别出同一个设定类别订阅设备所关注的所有业务互动场景,从而为相同设定类别订阅设备的业务画像分析提供准确可靠的分析依据。
其次,针对上述应用于大数据的业务互动分析方法,本发明实施例还提出了一种示例性的应用于大数据的业务互动分析装置,如图2所示,应用于大数据的业务互动分析装置200可以包括以下的功能模块。
场景获取模块210,用于获取目标业务大数据的各个订阅数据目录中的关键订阅数据所对应的业务互动场景;所述关键订阅数据所对应的业务互动场景是设定类别订阅设备的订阅数据在对应的订阅数据目录中的业务互动场景。
场景聚类模块220,用于基于所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景的相关性系数,对所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景进行聚类,获得至少两个聚类集合;所述聚类集合由不间断的订阅数据目录中的各一个关键订阅数据所对应的业务互动场景组成。
场景融合模块230,用于对所述至少两个聚类集合进行场景融合,获得至少一个业务互动场景聚类。
场景识别模块240,用于在所述各个订阅数据目录中,将所述业务互动场景聚类中的各个关键订阅数据所对应的业务互动场景识别为同一个设定类别订阅设备所关注的业务互动场景。
然后,基于上述的方法实施例和装置实施例,本发明实施例还提出了一种系统实施例,也即应用于大数据的业务互动分析系统,请结合参阅图3,应用于大数据的业务互动分析系统30可以包括业务互动服务器10和订阅设备20。其中,业务互动服务器10和订阅设备20通信用以实施上述方法,进一步地,业务互动服务器10获取目标业务大数据的各个订阅数据目录中的关键订阅数据所对应的业务互动场景;所述关键订阅数据所对应的业务互动场景是设定类别订阅设备20的订阅数据在对应的订阅数据目录中的业务互动场景;基于所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景的相关性系数,对所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景进行聚类,获得至少两个聚类集合;所述聚类集合由不间断的订阅数据目录中的各一个关键订阅数据所对应的业务互动场景组成;对所述至少两个聚类集合进行场景融合,获得至少一个业务互动场景聚类;在所述各个订阅数据目录中,将所述业务互动场景聚类中的各个关键订阅数据所对应的业务互动场景识别为同一个设定类别订阅设备20所关注的业务互动场景。
进一步地,请结合参阅图4,业务互动服务器10可以包括处理引擎110、网络模块120和存储器130,处理引擎110和存储器130通过网络模块120通信。
处理引擎110可以处理相关的信息和/或数据以执行本申请中描述的一个或多个功能。例如,在一些实施例中,处理引擎110可以包括至少一个处理引擎(例如,单核处理引擎或多核处理器)。仅作为示例,处理引擎110可以包括中央处理单元(Central ProcessingUnit,CPU)、专用集成电路(Application-Specific Integrated Circuit,ASIC)、专用指令集处理器(Application-Specific Instruction-set Processor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field ProgrammableGate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、精简指令集计算机(Reduced Instruction-Set Computer,RISC)、微处理器等或其任意组合。
网络模块120可以促进信息和/或数据的交换。在一些实施例中,网络模块120可以是任何类型的有线或无线网络或其组合。仅作为示例,网络模块120可以包括缆线网络、有线网络、光纤网络、电信网络、内部网络、互联网、局域网络(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网络(Wireless Local Area Network,WLAN)、城域网(Metropolitan Area Network,MAN)、公用电话交换网(Public Telephone SwitchedNetwork,PSTN)、蓝牙网络、无线个域网络、近场通讯(Near Field Communication,NFC)网络等或上述举例的任意组合。在一些实施例中,网络模块120可以包括至少一个网络接入点。例如,网络模块120可以包括有线或无线网路接入点,如基站和/或网路接入点。
存储器130可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器130用于存储程序,所述处理引擎110在接收到执行指令后,执行所述程序。
可以理解,图4所示的结构仅为示意,业务互动服务器10还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。
需要理解的是,针对上述内容,本领域技术人员可以根据上述所公开的内容进行前后推导毫无疑义地确定相关技术术语所指代的含义,例如针对一些值、系数、权重、指数、因子等术语,本领域技术人员可以根据前后的逻辑关系进行推导和确定,这些数值的取值范围可以根据实际情况进行选取,例如0~1,又例如1~10,再例如50~100,在此均不作限定。
本领域技术人员可以根据上述已公开的内容毫无疑义对一些预设的、基准的、预定的、设定的以及目标的技术特征/技术术语进行确定,例如阈值、阈值区间、阈值范围等。对于一些未作解释的技术特征术语,本领域技术人员完全能够基于前后文的逻辑关系进行合理地、毫无疑义地推导,从而清楚、完整地实施上述技术方案。未作解释的技术特征术语的前缀,例如“第一”、“第二”、“上一个”、“下一个”、“前一个”、“后一个”、“当前”、“历史”、“最新”、“最佳”、“目标”、“指定”和“实时”等,可以根据前后文进行毫无疑义地推导和确定。未作解释的技术特征术语的后缀,例如“列表”、“特征”、“序列”、“集合”、“矩阵”、“单元”、“元素”、“轨迹”和“清单”等,也可以根据前后文进行毫无疑义地推导和确定。
本发明实施例公开的上述内容对于本领域技术人员而言是清楚完整的。应当理解,本领域技术人员基于上述公开的内容对未作解释的技术术语进行推导和分析的过程是基于本申请所记载的内容进行的,因此上述内容并不是对整体方案的创造性的评判。
应当理解,上述所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有适应性的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。
Claims (10)
1.一种应用于大数据的业务互动分析方法,其特征在于,所述方法包括:
获取目标业务大数据的各个订阅数据目录中的关键订阅数据所对应的业务互动场景;所述关键订阅数据所对应的业务互动场景是设定类别订阅设备的订阅数据在对应的订阅数据目录中的业务互动场景;
基于所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景的相关性系数,对所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景进行聚类,获得至少两个聚类集合;所述聚类集合由不间断的订阅数据目录中的各一个关键订阅数据所对应的业务互动场景组成;
对所述至少两个聚类集合进行场景融合,获得至少一个业务互动场景聚类;
在所述各个订阅数据目录中,将所述业务互动场景聚类中的各个关键订阅数据所对应的业务互动场景识别为同一个设定类别订阅设备所关注的业务互动场景。
2.根据权利要求1所述的方法,其特征在于,所述基于所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景的相关性系数,对所述各个订阅数据目录中的关键订阅数据所对应的业务互动场景进行聚类,获得至少两个聚类集合,包括:
基于第一订阅数据目录内的第一业务互动场景,与第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的互动场景相关性系数,从所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中确定满足预设判定条件的第二业务互动场景;其中,所述第一订阅数据目录和所述第二订阅数据目录是所述各个订阅数据目录中的连续两个订阅数据目录;所述第一业务互动场景是目标聚类集合对应在所述第一订阅数据目录中的业务互动场景;
将所述第二业务互动场景调整为所述目标聚类集合在所述第二订阅数据目录中的业务互动场景。
3.根据权利要求2所述的方法,其特征在于,所述基于第一订阅数据目录内的第一业务互动场景与第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的互动场景相关性系数,从所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中确定满足预设判定条件的第二业务互动场景,包括:
获取所述第一业务互动场景与所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的第一类别相关性系数,所述第一类别相关性系数是基于两个业务互动场景之间的地域相关性系数、热度相关性系数以及描述特征相关性系数获得的;
将所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中,对应的所述第一类别相关性系数满足所述预设判定条件的业务互动场景确定为所述第二业务互动场景。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
响应于所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中不存在对应的所述第一类别相关性系数满足所述预设判定条件的业务互动场景,获取所述第一业务互动场景与所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景之间的第二类别相关性系数,所述第二类别相关性系数是基于两个业务互动场景之间的描述特征相关性系数获得的;
将所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中,对应的所述第二类别相关性系数满足所述预设判定条件的业务互动场景确定为所述第二业务互动场景。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
响应于所述第二订阅数据目录中的各个关键订阅数据所对应的业务互动场景中,不存在满足所述预设判定条件的第二业务互动场景,且所述目标聚类集合中不间断的关联业务互动场景的数量低于预设数量,基于所述目标聚类集合中的各个业务互动场景,检测所述目标聚类集合在所述第二订阅数据目录中的所述关联业务互动场景;
将检测得到的所述关联业务互动场景,调整为所述目标聚类集合在所述第二订阅数据目录中的业务互动场景。
6.根据权利要求1所述的方法,其特征在于,所述对所述至少两个聚类集合进行场景融合,获得至少一个地域聚类,包括:
获取所述至少两个聚类集合之间的相关性系数;
基于所述至少两个聚类集合之间的相关性系数,对所述至少两个聚类集合进行场景融合,获得所述至少一个地域聚类。
7.根据权利要求6所述的方法,其特征在于,所述获取所述至少两个聚类集合之间的相关性系数,包括:
获取所述至少两个聚类集合中的第一聚类集合与第二聚类集合之间的地域相关性系数;所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景所在的第一订阅数据目录,在时序顺序上位于所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景所在的第二订阅数据目录之前;
基于所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度,以及所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度,获取所述第一聚类集合与所述第二聚类集合的热度相关性系数;
基于所述第一聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,以及所述第二聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,获取所述第一聚类集合与所述第二聚类集合的描述特征相关性系数;
基于所述第一聚类集合与所述第二聚类集合之间的地域相关性系数、热度相关性系数以及描述特征相关性系数,获取所述第一聚类集合与所述第二聚类集合之间的相关性系数;
相应的,所述获取所述至少两个聚类集合中的第一聚类集合与第二聚类集合之间的地域相关性系数,包括:
基于所述第一聚类集合中的各个关键订阅数据所对应的业务互动场景的地域信息,在所述第一订阅数据目录之后的订阅数据目录中进行聚类检测,获得所述第一聚类集合传递到所述第二订阅数据目录中的检测业务互动场景;
获取所述第一聚类集合传递到所述第二订阅数据目录中的检测业务互动场景,与所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景之间的地域相关性系数,作为所述第一聚类集合与所述第二聚类集合之间的地域相关性系数;
相应的,所述基于所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度,以及所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度,获取所述第一聚类集合与所述第二聚类集合的热度相关性系数,包括:
基于所述第一聚类集合中的最后一个关键订阅数据所对应的业务互动场景的热度,以及所述第二聚类集合中的第一个关键订阅数据所对应的业务互动场景的热度之间的初始热度相关性系数;
通过目标相关性系数优化策略对所述初始热度相关性系数进行优化,获得所述第一聚类集合与所述第二聚类集合的热度相关性系数;其中,所述目标相关性系数优化策略的优化权重与所述第一订阅数据目录和所述第二订阅数据目录之间的有效订阅时段间隔存在映射关系;
相应的,所述基于所述第一聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,以及所述第二聚类集合中的至少一个关键订阅数据所对应的业务互动场景的描述特征,获取所述第一聚类集合与所述第二聚类集合的描述特征相关性系数,包括:
对所述第一聚类集合中,时序顺序上不连续的至少两个关键订阅数据所对应的业务互动场景的描述特征进行特征拼接,获得所述第一聚类集合的描述特征;
对所述第二聚类集合中,时序顺序上不连续的至少两个关键订阅数据所对应的业务互动场景的描述特征进行特征拼接,获得所述第二聚类集合的描述特征;
获取所述第一聚类集合的描述特征与所述第二聚类集合的描述特征之间的相关性系数,作为所述第一聚类集合与所述第二聚类集合的描述特征相关性系数。
8.根据权利要求6所述的方法,其特征在于,所述基于所述至少两个聚类集合之间的相关性系数,对所述至少两个聚类集合进行场景融合,获得所述至少一个地域聚类,包括:
以所述至少两个聚类集合为图单元,以所述至少两个聚类集合之间的相关性系数为关联路径的标签,生成携带标签的可视化网络拓扑;
对所述携带标签的可视化网络拓扑进行网络拓扑拆分,获得至少一个目标关键网络拓扑;
对属于同一个所述目标关键网络拓扑的聚类集合进行场景融合,获得所述至少一个地域聚类。
9.根据权利要求8所述的方法,其特征在于,所述对所述携带标签的可视化网络拓扑进行网络拓扑拆分,获得至少一个目标关键网络拓扑,包括:
通过设定算法对所述携带标签的可视化网络拓扑进行网络拓扑拆分,获得所述至少一个目标关键网络拓扑。
10.一种业务互动服务器,其特征在于,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行权利要求1-9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110682213.7A CN113407836A (zh) | 2021-06-20 | 2021-06-20 | 应用于大数据的业务互动分析方法及业务互动服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110682213.7A CN113407836A (zh) | 2021-06-20 | 2021-06-20 | 应用于大数据的业务互动分析方法及业务互动服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113407836A true CN113407836A (zh) | 2021-09-17 |
Family
ID=77681668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110682213.7A Withdrawn CN113407836A (zh) | 2021-06-20 | 2021-06-20 | 应用于大数据的业务互动分析方法及业务互动服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113407836A (zh) |
-
2021
- 2021-06-20 CN CN202110682213.7A patent/CN113407836A/zh not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11640563B2 (en) | Automated data processing and machine learning model generation | |
CN112464084B (zh) | 基于大数据定位和人工智能的业务优化方法及云计算中心 | |
CN109388675B (zh) | 数据分析方法、装置、计算机设备及存储介质 | |
CN112819023B (zh) | 样本集的获取方法、装置、计算机设备和存储介质 | |
CN110782123B (zh) | 决策方案的匹配方法、装置、计算机设备及存储介质 | |
CN114610773A (zh) | 基于大数据的数据应用场景识别方法及云计算服务器 | |
CN112000822B (zh) | 多媒体资源排序方法、装置、电子设备及存储介质 | |
CN112818032B (zh) | 服务于大数据挖掘分析的数据筛选方法及数据分析服务器 | |
CN111800289B (zh) | 通信网络故障分析方法和装置 | |
CN113326441A (zh) | 基于大数据业务定位的信息推送方法及系统 | |
KR20190094068A (ko) | 온라인 게임에서 게이머 행동 유형을 분류하는 분류기의 학습 방법 및 상기 분류기를 포함하는 장치 | |
CN113468338A (zh) | 针对数字化云业务的大数据分析方法及大数据服务器 | |
CN112633976A (zh) | 基于大数据和云业务的数据处理方法及云业务服务器 | |
CN114781611A (zh) | 自然语言处理方法、语言模型训练方法及其相关设备 | |
CN113408897A (zh) | 应用于大数据业务的数据资源共享方法及大数据服务器 | |
CN112308627A (zh) | 基于区块链和人工智能的广告数据接入方法及大数据中心 | |
CN111259167A (zh) | 用户请求风险识别方法及装置 | |
CN113472860A (zh) | 大数据和数字化环境下的业务资源分配方法及服务器 | |
CN114329711A (zh) | 一种基于图形算量平台的预制构件数据处理方法及系统 | |
CN113468017A (zh) | 应用于区块链的在线业务状态检测方法及业务服务器 | |
CN111597336B (zh) | 训练文本的处理方法、装置、电子设备及可读存储介质 | |
CA3179311A1 (en) | Identifying claim complexity by integrating supervised and unsupervised learning | |
CN110852082B (zh) | 同义词的确定方法及装置 | |
CN113407835A (zh) | 应用于大数据在线业务的用户画像处理方法及服务器 | |
CN113407836A (zh) | 应用于大数据的业务互动分析方法及业务互动服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210917 |
|
WW01 | Invention patent application withdrawn after publication |