CN116451139A - 一种基于人工智能的直播数据快速分析方法 - Google Patents

一种基于人工智能的直播数据快速分析方法 Download PDF

Info

Publication number
CN116451139A
CN116451139A CN202310718066.3A CN202310718066A CN116451139A CN 116451139 A CN116451139 A CN 116451139A CN 202310718066 A CN202310718066 A CN 202310718066A CN 116451139 A CN116451139 A CN 116451139A
Authority
CN
China
Prior art keywords
training
live broadcast
classification
data
input vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310718066.3A
Other languages
English (en)
Other versions
CN116451139B (zh
Inventor
潘小平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Xinhang Interactive Technology Co ltd
Original Assignee
Hangzhou Xinhang Interactive Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Xinhang Interactive Technology Co ltd filed Critical Hangzhou Xinhang Interactive Technology Co ltd
Priority to CN202310718066.3A priority Critical patent/CN116451139B/zh
Publication of CN116451139A publication Critical patent/CN116451139A/zh
Application granted granted Critical
Publication of CN116451139B publication Critical patent/CN116451139B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24317Piecewise classification, i.e. whereby each classification requires several discriminant rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于人工智能的直播数据快速分析方法。其首先将直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,接着,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量,然后,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联后通过多尺度邻域特征提取模块以得到分类特征向量,最后,将所述分类特征向量通过分类器以得到用于表示当前直播业务数据是否存在异常的分类结果。这样,可以实现对直播数据的快速分析。

Description

一种基于人工智能的直播数据快速分析方法
技术领域
本申请涉及智能化数据分析领域,且更为具体地,涉及一种基于人工智能的直播数据快速分析方法。
背景技术
随着直播越来越发达,直播复盘也成为直播运营十分重要的一环。在直播复盘时,通常会利用直播趋势图表,以帮助直播管理者快速了解直播业务数据的变化趋势和规律。
在直播趋势图表中,可能会出现异常数据点,例如在线人数在短时间内激增或骤降等情况,这些异常点对于直播运营分析过程中具有至关重要的作用,是直播管理者进行进一步分析和改善的关键时间节点。然而,目前的直播复盘过程中,异常数据点往往需要人工进行分辨检测,不仅耗时耗力,而且容易出现错误。并且,在找到异常点后,还需要进一步根据时间节点来查找相关的直播内容,较为繁琐,不适用于现今的直播复盘需求。
因此,期望一种优化的基于人工智能的直播数据快速分析方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于人工智能的直播数据快速分析方法。其首先将直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,接着,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量,然后,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联后通过多尺度邻域特征提取模块以得到分类特征向量,最后,将所述分类特征向量通过分类器以得到用于表示当前直播业务数据是否存在异常的分类结果。这样,可以实现对直播数据的快速分析。
根据本申请的一个方面,提供了一种基于人工智能的直播数据快速分析方法,其包括:
获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值;
将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量;
基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量;
将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量;
将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量;
以及将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。
在上述的基于人工智能的直播数据快速分析方法中,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量,包括:
以如下级联公式将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到所述直播业务数据输入向量;
其中,所述级联公式为:
其中,分别表示所述在线人数时序输入向量和所述在线人数变化率时序输入向量,/>表示级联函数,/>表示所述直播业务数据输入向量。
在上述的基于人工智能的直播数据快速分析方法中,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量,包括:
将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第一卷积层以得到第一尺度数据特征向量;
将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第二卷积层以得到第二尺度数据特征向量;
以及将所述第一尺度数据特征向量和所述第二尺度数据特征向量进行级联以得到所述分类特征向量。
在上述的基于人工智能的直播数据快速分析方法中,所述多尺度邻域特征提取模块包括并行的所述第一卷积层和所述第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。
在上述的基于人工智能的直播数据快速分析方法中,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常,包括:
使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;
以及将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
在上述的基于人工智能的直播数据快速分析方法中,还包括用于对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练的训练步骤。
在上述的基于人工智能的直播数据快速分析方法中,所述训练步骤,包括:
获取训练数据,所述训练数据包括当前训练直播业务数据,以及,所述当前直播业务数据是否存在异常的真实值,其中,所述训练直播业务数据包括预定时间段内多个预定时间点的训练在线人数值;
将所述训练直播业务数据中的多个预定时间点的训练在线人数值按照时间维度排列为训练在线人数时序输入向量;
基于每两个所述预定时间点之间的训练时间间隔和所述训练在线人数时序输入向量,生成训练在线人数变化率时序输入向量;
将所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量进行级联以得到训练直播业务数据输入向量;
将所述训练直播业务数据输入向量通过所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到训练分类特征向量;
将所述训练分类特征向量通过所述分类器以得到分类损失函数值;
以及基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练,其中,在所述训练的每一轮迭代中,对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代。
在上述的基于人工智能的直播数据快速分析方法中,将所述训练分类特征向量通过所述分类器以得到分类损失函数值,包括:
所述分类器以如下分类公式对所述训练分类特征向量进行处理以得到训练分类结果,所述分类公式为:,其中,/>到/>为权重矩阵,/>为偏置向量,/>为所述训练分类特征向量;
以及计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。
在上述的基于人工智能的直播数据快速分析方法中,在所述训练的每一轮迭代中,以如下优化公式对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代;
其中,所述优化公式为:
其中,是所述分类器的权重矩阵,/>是矩阵的转置矩阵,/>是矩阵/>的本征值组成的本征集合向量,/>是所述训练分类特征向量,/>和/>分别表示矩阵乘法和加法,/>表示迭代后的所述分类器的权重矩阵。
与现有技术相比,本申请提供的基于人工智能的直播数据快速分析方法,其首先将直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,接着,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量,然后,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联后通过多尺度邻域特征提取模块以得到分类特征向量,最后,将所述分类特征向量通过分类器以得到用于表示当前直播业务数据是否存在异常的分类结果。这样,可以实现对直播数据的快速分析。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员而言,在没有做出创造性劳动的前提下,还可以根据这些附图获得其他的附图。以下附图并未刻意按实际尺寸等比例缩放绘制,重点在于示出本申请的主旨。
图1为根据本申请实施例的基于人工智能的直播数据快速分析方法的应用场景图。
图2为根据本申请实施例的基于人工智能的直播数据快速分析方法的流程图。
图3为根据本申请实施例的基于人工智能的直播数据快速分析方法的架构示意图。
图4为根据本申请实施例的基于人工智能的直播数据快速分析方法的子步骤S150的流程图。
图5为根据本申请实施例的基于人工智能的直播数据快速分析方法的子步骤S160的流程图。
图6为根据本申请实施例的基于人工智能的直播数据快速分析方法进一步包括的训练步骤的流程图。
图7为根据本申请实施例的基于人工智能的直播数据快速分析系统的框图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本申请的部分实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本申请保护的范围。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
如上所述,目前的直播复盘过程中,异常数据点往往需要人工进行分辨检测,不仅耗时耗力,而且容易出现错误。并且,在找到异常点后,还需要进一步根据时间节点来查找相关的直播内容,较为繁琐,不适用于现今的直播复盘需求。因此,期望一种优化的基于人工智能的直播数据快速分析方案。
相应地,考虑到在实际进行直播复盘时,关键在于对直播业务数据进行分析来确定直播是否存在异常。在此过程中,对于直播在线人数的监测尤为重要,例如在线人数出现在短时间内激增或骤降等情况。因此,期望基于对直播在线人数值的时序变化情况进行监测分析来进行直播的异常检测,进而在检测出直播异常时对于异常点的在线人数进行进一步地分析,从而优化直播内容和管理。但是,由于在线人数值在时序上的不同时间周期下都存在波动性和不确定性,也就是说,所述在线人数值在每个时间段内都有着不同的时序变化规律特征,而且这种时序变化特征有时较为微弱,难以充分地对于在线人数的时序变化规律进行分析探究。
基于此,在本申请的技术方案中,考虑到在线人数时序变化率可以帮助快速识别那些出现了异常变化的时间段,比如在很短的时间内,直播间的在线人数急剧增加或减少等情况。因此,期望基于所述在线人数值的时序动态变化特征和所述在线人数时序变化率的动态变化特征之间的关联特征信息来综合进行直播业务数据的异常检测,进而在检测出直播异常时对于异常点的在线人数进行进一步地分析,以优化直播内容和管理。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。深度学习以及神经网络的发展为挖掘所述在线人数值的时序动态变化特征和所述在线人数时序变化率的动态变化特征之间的关联特征信息提供了新的解决思路和方案。
具体地,在本申请的技术方案中,首先,获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值。接着,考虑到由于所述在线人数值在时间维度上具有着动态性的变化规律,因此,为了能够对于所述在线人数值在时间维度上的变化特征信息进行提取,在本申请的技术方案中,需要首先将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,以此来整合所述在线人数值在时序上的分布信息。
然后,考虑到由于所述在线人数值在时序上的变化情况对于直播业务数据的异常情况监测的影响较低,难以通过所述在线人数值的时序变化特征来充分地捕捉到各个异常点的情况。因此,在本申请的技术方案中,进一步基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量。也就是,通过计算每两个所述预定时间点之间的在线人数值和时间间隔之间的除法来获取所述在线人数变化率时序输入向量,以此来更加直观的识别显示那些出现了异常变化的时间段,比如在很短的时间内,直播间的在线人数急剧增加或减少等情况。
继而,再将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量,以此来整合所述在线人数值和所述在线人数变化率在时间维度上的时序关联变化信息,进而充分利用在线人数值在时序上的变化信息来更加直观地显示所述当在线人数值的异常情况,有利于后续进行直播业务数据的异常检测。
进一步地,考虑到由于所述在线人数值在时间维度上具有着波动性和不确定性,因而所述在线人数变化率以及两者的融合信息也都具有着波动性和不确定性,导致其在不同时间周期跨度下呈现出不同的变化状态。因此,在本申请的技术方案中,进一步将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量。特别地,这里,所述第一卷积层和所述第二卷积层分别使用不同尺度的一维卷积核来进行所述直播业务数据输入向量的特征挖掘,以提取出所述直播业务数据,即在线人数值在不同时间跨度下的时序动态多尺度邻域关联特征信息。
接着,进一步再将所述分类特征向量通过分类器中进行分类处理,以得到用于表示当前直播业务数据是否存在异常的分类结果。也就是说,以所述在线人数值的时序动态多尺度变化特征来进行分类,从而进行直播业务数据的异常检测。具体地,在本申请的技术方案中,所述分类器的标签包括当前直播业务数据存在异常(第一标签),以及,当前直播业务数据不存在异常(第二标签),其中,所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。值得注意的是,这里的所述第一标签p1和所述第二标签p2并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“当前直播业务数据是否存在异常”这种概念,其只是有两种分类标签且输出特征在这两个分类标签下的概率,即p1和p2之和为一。因此,当前直播业务数据是否存在异常的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“当前直播业务数据是否存在异常”的语言文本意义。应可以理解,在本申请的技术方案中,所述分类器的分类标签为当前直播业务数据是否存在异常的检测评估标签,因此,在得到所述分类结果后,可基于所述分类结果来进行直播业务数据的异常检测,进而在检测出直播异常时对于异常点的在线人数进行进一步地分析,以优化直播内容和管理。
特别地,在本申请的技术方案中,考虑到将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联后,所述直播业务数据输入向量可以表达在线人数和在线人数变化率沿时序分布的原始信息,在通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块之后,可以提取到在线人数和在线人数变化率各自沿时序的多尺度邻域局部关联特征。但是,考虑到这两部分原始数据沿时序的分布趋势并不相同,在所述多尺度邻域特征提取模块进行多尺度邻域局部关联特征的提取过程中,可能对于所述在线人数时序输入向量和所述在线人数变化率时序输入向量产生拟合差异,例如过拟合或者欠拟合,导致所述分类特征向量分别对应于在线人数和在线人数变化率沿时序的多尺度邻域局部关联特征的特征分布相对于分类器的权重矩阵对应的部分具有不同的权重拟合方向,这样,所述分类特征向量的整体特征分布相对于分类器的权重矩阵就会具有收敛性差的问题,从而影响所述分类器的训练速度。
基于此,本申请的申请人在所述分类特征向量,例如记为的训练过程中,在每次分类器的权重矩阵,例如记为/>的迭代过程中,对权重矩阵/>进行权重本征支持的半空间结构化约束,具体表示为:
其中,是矩阵/>的本征值组成的本征集合向量。
这里,所述权重本征支持的半空间结构化约束以所述分类器的权重矩阵的结构化矩阵的本征值集合与待分类的分类特征向量/>的关联性集成作为支持,来对所述权重矩阵/>表示的用于与所述待分类的分类特征向量/>的高维流形相耦合的半空间(half-space)进行作为决策边界的超平面的结构化支持约束,以使得所述待分类的分类特征向量/>的高维流形能够在所述权重矩阵/>表示的半空间开放域内相对于超平面有效收敛,从而改进所述分类器的训练速度。这样,能够对于直播业务数据的异常点进行准确检测,进而在检测出直播异常时对于异常点的情况进行进一步地分析优化,以此来优化直播内容和管理。
图1为根据本申请实施例的基于人工智能的直播数据快速分析方法的应用场景图。如图1所示,在该应用场景中,首先,获取当前直播业务数据(例如,图1中所示意的D),其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值,然后,将所述直播业务数据输入至部署有基于人工智能的直播数据快速分析算法的服务器中(例如,图1中所示意的S),其中,所述服务器能够使用所述基于人工智能的直播数据快速分析算法对所述直播业务数据进行处理以得到用于表示当前直播业务数据是否存在异常的分类结果。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
图2为根据本申请实施例的基于人工智能的直播数据快速分析方法的流程图。如图2所示,根据本申请实施例的基于人工智能的直播数据快速分析方法,包括步骤:S110,获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值;S120,将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量;S130,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量;S140,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量;S150,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量;以及,S160,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。
图3为根据本申请实施例的基于人工智能的直播数据快速分析方法的架构示意图。如图3所示,在该网络架构中,首先,获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值;接着,将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量;然后,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量;接着,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量;然后,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量;最后,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。
更具体地,在步骤S110中,获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值。在实际进行直播复盘时,关键在于对直播业务数据进行分析来确定直播是否存在异常。在此过程中,对于直播在线人数的监测尤为重要,例如在线人数出现在短时间内激增或骤降等情况。因此,可以基于对直播在线人数值的时序变化情况进行监测分析来进行直播的异常检测,进而在检测出直播异常时对于异常点的在线人数进行进一步地分析,从而优化直播内容和管理。
更具体地,在步骤S120中,将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量。由于所述在线人数值在时间维度上具有着动态性的变化规律,因此,为了能够对于所述在线人数值在时间维度上的变化特征信息进行提取,在本申请的技术方案中,需要首先将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,以此来整合所述在线人数值在时序上的分布信息。
更具体地,在步骤S130中,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量。也就是,通过计算每两个所述预定时间点之间的在线人数值和时间间隔之间的除法来获取所述在线人数变化率时序输入向量,以此来更加直观的识别显示那些出现了异常变化的时间段,比如在很短的时间内,直播间的在线人数急剧增加或减少等情况。
更具体地,在步骤S140中,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量。以此来整合所述在线人数值和所述在线人数变化率在时间维度上的时序关联变化信息,进而充分利用在线人数值在时序上的变化信息来更加直观地显示所述当在线人数值的异常情况,有利于后续进行直播业务数据的异常检测。
相应地,在一个具体示例中,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量,包括:以如下级联公式将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到所述直播业务数据输入向量;其中,所述级联公式为:
其中,分别表示所述在线人数时序输入向量和所述在线人数变化率时序输入向量,/>表示级联函数,/>表示所述直播业务数据输入向量。
更具体地,在步骤S150中,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量。这样,可以提取出所述直播业务数据,即在线人数值在不同时间跨度下的时序动态多尺度邻域关联特征信息。
相应地,在一个具体示例中,如图4所示,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量,包括:S151,将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第一卷积层以得到第一尺度数据特征向量;S152,将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第二卷积层以得到第二尺度数据特征向量;以及,S153,将所述第一尺度数据特征向量和所述第二尺度数据特征向量进行级联以得到所述分类特征向量。
相应地,在一个具体示例中,所述多尺度邻域特征提取模块包括并行的所述第一卷积层和所述第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。
更具体地,在步骤S160中,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。在得到所述分类结果后,可基于所述分类结果来进行直播业务数据的异常检测,进而在检测出直播异常时对于异常点的在线人数进行进一步地分析,以优化直播内容和管理。
应可以理解,分类器的作用是利用给定的类别、已知的训练数据来学习分类规则和分类器,然后对未知数据进行分类(或预测)。逻辑回归(logistics)、SVM等常用于解决二分类问题,对于多分类问题(multi-class classification),同样也可以用逻辑回归或SVM,只是需要多个二分类来组成多分类,但这样容易出错且效率不高,常用的多分类方法有Softmax分类函数。
相应地,在一个具体示例中,如图5所示,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常,包括:S161,使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,S162,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
相应地,在一个具体示例中,所述的基于人工智能的直播数据快速分析方法,其还包括用于对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练的训练步骤,其中,如图6所示,所述训练步骤,包括:S210,获取训练数据,所述训练数据包括当前训练直播业务数据,以及,所述当前直播业务数据是否存在异常的真实值,其中,所述训练直播业务数据包括预定时间段内多个预定时间点的训练在线人数值;S220,将所述训练直播业务数据中的多个预定时间点的训练在线人数值按照时间维度排列为训练在线人数时序输入向量;S230,基于每两个所述预定时间点之间的训练时间间隔和所述训练在线人数时序输入向量,生成训练在线人数变化率时序输入向量;S240,将所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量进行级联以得到训练直播业务数据输入向量;S250,将所述训练直播业务数据输入向量通过所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到训练分类特征向量;S260,将所述训练分类特征向量通过所述分类器以得到分类损失函数值;以及,S270,基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练,其中,在所述训练的每一轮迭代中,对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代。
相应地,在一个具体示例中,将所述训练分类特征向量通过所述分类器以得到分类损失函数值,包括:所述分类器以如下分类公式对所述训练分类特征向量进行处理以得到训练分类结果,所述分类公式为:,其中,/>到/>为权重矩阵,/>到/>为偏置向量,/>为所述训练分类特征向量;以及,计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。
特别地,在本申请的技术方案中,考虑到将所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量进行级联后,所述训练直播业务数据输入向量可以表达在线人数和在线人数变化率沿时序分布的原始信息,在通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块之后,可以提取到在线人数和在线人数变化率各自沿时序的多尺度邻域局部关联特征。但是,考虑到这两部分原始数据沿时序的分布趋势并不相同,在所述多尺度邻域特征提取模块进行多尺度邻域局部关联特征的提取过程中,可能对于所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量产生拟合差异,例如过拟合或者欠拟合,导致所述训练分类特征向量分别对应于在线人数和在线人数变化率沿时序的多尺度邻域局部关联特征的特征分布相对于分类器的权重矩阵对应的部分具有不同的权重拟合方向,这样,所述训练分类特征向量的整体特征分布相对于分类器的权重矩阵就会具有收敛性差的问题,从而影响所述分类器的训练速度。基于此,本申请的申请人在所述训练分类特征向量的训练过程中,在每次分类器的权重矩阵的迭代过程中,对权重矩阵进行权重本征支持的半空间结构化约束。
相应地,在一个具体示例中,在所述训练的每一轮迭代中,以如下优化公式对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代;其中,所述优化公式为:
其中,是所述分类器的权重矩阵,/>是矩阵的转置矩阵,/>是矩阵/>的本征值组成的本征集合向量,/>是所述训练分类特征向量,/>和/>分别表示矩阵乘法和加法,/>表示迭代后的所述分类器的权重矩阵。
这里,所述权重本征支持的半空间结构化约束以所述分类器的权重矩阵的结构化矩阵的本征值集合与待分类的训练分类特征向量的关联性集成作为支持,来对所述权重矩阵表示的用于与所述待分类的训练分类特征向量的高维流形相耦合的半空间进行作为决策边界的超平面的结构化支持约束,以使得所述待分类的训练分类特征向量的高维流形能够在所述权重矩阵表示的半空间开放域内相对于超平面有效收敛,从而改进所述分类器的训练速度。这样,能够对于直播业务数据的异常点进行准确检测,进而在检测出直播异常时对于异常点的情况进行进一步地分析优化,以此来优化直播内容和管理。
综上,基于本申请实施例的基于人工智能的直播数据快速分析方法,其首先将直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,接着,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量,然后,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联后通过多尺度邻域特征提取模块以得到分类特征向量,最后,将所述分类特征向量通过分类器以得到用于表示当前直播业务数据是否存在异常的分类结果。这样,可以实现对直播数据的快速分析。
图7为根据本申请实施例的基于人工智能的直播数据快速分析系统100的框图。如图7所示,根据本申请实施例的基于人工智能的直播数据快速分析系统100,包括:数据采集模块110,用于获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值;在线人数时序输入向量排列模块120,用于将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量;在线人数变化率时序输入向量生成模块130,用于基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量;级联模块140,用于将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量;多尺度邻域特征编码模块150,用于将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量;以及,分类模块160,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。
在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,所述级联模块140,用于:以如下级联公式将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到所述直播业务数据输入向量;其中,所述级联公式为:
其中,分别表示所述在线人数时序输入向量和所述在线人数变化率时序输入向量,/>表示级联函数,/>表示所述直播业务数据输入向量。
在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,所述多尺度邻域特征编码模块150,用于:将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第一卷积层以得到第一尺度数据特征向量;将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第二卷积层以得到第二尺度数据特征向量;以及,将所述第一尺度数据特征向量和所述第二尺度数据特征向量进行级联以得到所述分类特征向量。
在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,所述多尺度邻域特征提取模块包括并行的所述第一卷积层和所述第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。
在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,所述分类模块160,用于:使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,还包括用于对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练的训练模块,其中,所述训练模块,用于:获取训练数据,所述训练数据包括当前训练直播业务数据,以及,所述当前直播业务数据是否存在异常的真实值,其中,所述训练直播业务数据包括预定时间段内多个预定时间点的训练在线人数值;将所述训练直播业务数据中的多个预定时间点的训练在线人数值按照时间维度排列为训练在线人数时序输入向量;基于每两个所述预定时间点之间的训练时间间隔和所述训练在线人数时序输入向量,生成训练在线人数变化率时序输入向量;将所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量进行级联以得到训练直播业务数据输入向量;将所述训练直播业务数据输入向量通过所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到训练分类特征向量;将所述训练分类特征向量通过所述分类器以得到分类损失函数值;以及,基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练,其中,在所述训练的每一轮迭代中,对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代。
在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,将所述训练分类特征向量通过所述分类器以得到分类损失函数值,包括:所述分类器以如下分类公式对所述训练分类特征向量进行处理以得到训练分类结果,所述分类公式为:,其中,/>到/>为权重矩阵,/>到/>为偏置向量,/>为所述训练分类特征向量;以及,计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。
在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,在所述训练的每一轮迭代中,以如下优化公式对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代;其中,所述优化公式为:
其中,是所述分类器的权重矩阵,/>是矩阵的转置矩阵,/>是矩阵/>的本征值组成的本征集合向量,/>是所述训练分类特征向量,/>和/>分别表示矩阵乘法和加法,/>表示迭代后的所述分类器的权重矩阵。
这里,本领域技术人员可以理解,上述基于人工智能的直播数据快速分析系统100中的各个模块的具体功能和操作已经在上面参考图1到图6的基于人工智能的直播数据快速分析方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的基于人工智能的直播数据快速分析系统100可以实现在各种无线终端中,例如具有基于人工智能的直播数据快速分析算法的服务器等。在一个示例中,根据本申请实施例的基于人工智能的直播数据快速分析系统100可以作为一个软件模块和/或硬件模块而集成到无线终端中。例如,该基于人工智能的直播数据快速分析系统100可以是该无线终端的操作系统中的一个软件模块,或者可以是针对于该无线终端所开发的一个应用程序;当然,该基于人工智能的直播数据快速分析系统100同样可以是该无线终端的众多硬件模块之一。
替换地,在另一示例中,该基于人工智能的直播数据快速分析系统100与该无线终端也可以是分立的设备,并且该基于人工智能的直播数据快速分析系统100可以通过有线和/或无线网络连接到该无线终端,并且按照约定的数据格式来传输交互信息。
根据本申请的另一方面,还提供了一种非易失性的计算机可读存储介质,其上存储有计算机可读的指令,当利用计算机执行所述指令时可以执行如前所述的方法。
技术中的程序部分可以被认为是以可执行的代码和/或相关数据的形式而存在的“产品”或“制品”,通过计算机可读的介质所参与或实现的。有形的、永久的储存介质可以包括任何计算机、处理器、或类似设备或相关的模块所用到的内存或存储器。例如,各种半导体存储器、磁带驱动器、磁盘驱动器或者类似任何能够为软件提供存储功能的设备。
所有软件或其中的一部分有时可能会通过网络进行通信,如互联网或其他通信网络。此类通信可以将软件从一个计算机设备或处理器加载到另一个。例如:从视频目标检测设备的一个服务器或主机计算机加载至一个计算机环境的硬件平台,或其他实现系统的计算机环境,或与提供目标检测所需要的信息相关的类似功能的系统。因此,另一种能够传递软件元素的介质也可以被用作局部设备之间的物理连接,例如光波、电波、电磁波等,通过电缆、光缆或者空气等实现传播。用来载波的物理介质如电缆、无线连接或光缆等类似设备,也可以被认为是承载软件的介质。在这里的用法除非限制了有形的“储存”介质,其他表示计算机或机器“可读介质”的术语都表示在处理器执行任何指令的过程中参与的介质。
本申请使用了特定词语来描述本申请的实施例。如“第一/第二实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。
相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
除非另有定义,这里使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
上面是对本发明的说明,而不应被认为是对其的限制。尽管描述了本发明的若干示例性实施例,但本领域技术人员将容易地理解,在不背离本发明的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此,所有这些修改都意图包含在权利要求书所限定的本发明范围内。应当理解,上面是对本发明的说明,而不应被认为是限于所公开的特定实施例,并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本发明由权利要求书及其等效物限定。

Claims (9)

1.一种基于人工智能的直播数据快速分析方法,其特征在于,包括:
获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值;
将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量;
基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量;
将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量;
将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量;
以及将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。
2.根据权利要求1所述的基于人工智能的直播数据快速分析方法,其特征在于,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量,包括:
以如下级联公式将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到所述直播业务数据输入向量;
其中,所述级联公式为:
其中,分别表示所述在线人数时序输入向量和所述在线人数变化率时序输入向量,/>表示级联函数,/>表示所述直播业务数据输入向量。
3.根据权利要求2所述的基于人工智能的直播数据快速分析方法,其特征在于,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量,包括:
将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第一卷积层以得到第一尺度数据特征向量;
将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第二卷积层以得到第二尺度数据特征向量;以及将所述第一尺度数据特征向量和所述第二尺度数据特征向量进行级联以得到所述分类特征向量。
4.根据权利要求3所述的基于人工智能的直播数据快速分析方法,其特征在于,所述多尺度邻域特征提取模块包括并行的所述第一卷积层和所述第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。
5.根据权利要求4所述的基于人工智能的直播数据快速分析方法,其特征在于,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常,包括:
使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;
以及将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
6.根据权利要求5所述的基于人工智能的直播数据快速分析方法,其特征在于,还包括用于对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练的训练步骤。
7.根据权利要求6所述的基于人工智能的直播数据快速分析方法,其特征在于,所述训练步骤,包括:
获取训练数据,所述训练数据包括当前训练直播业务数据,以及,所述当前直播业务数据是否存在异常的真实值,其中,所述训练直播业务数据包括预定时间段内多个预定时间点的训练在线人数值;
将所述训练直播业务数据中的多个预定时间点的训练在线人数值按照时间维度排列为训练在线人数时序输入向量;
基于每两个所述预定时间点之间的训练时间间隔和所述训练在线人数时序输入向量,生成训练在线人数变化率时序输入向量;
将所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量进行级联以得到训练直播业务数据输入向量;
将所述训练直播业务数据输入向量通过所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到训练分类特征向量;
将所述训练分类特征向量通过所述分类器以得到分类损失函数值;以及基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练,其中,在所述训练的每一轮迭代中,对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代。
8.根据权利要求7所述的基于人工智能的直播数据快速分析方法,其特征在于,将所述训练分类特征向量通过所述分类器以得到分类损失函数值,包括:
所述分类器以如下分类公式对所述训练分类特征向量进行处理以得到训练分类结果,所述分类公式为:,其中,/>到/>为权重矩阵,/>到/>为偏置向量,/>为所述训练分类特征向量;以及计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。
9.根据权利要求8所述的基于人工智能的直播数据快速分析方法,其特征在于,在所述训练的每一轮迭代中,以如下优化公式对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代;
其中,所述优化公式为:
其中,是所述分类器的权重矩阵,/>是矩阵的转置矩阵,/>是矩阵/>的本征值组成的本征集合向量,/>是所述训练分类特征向量,/>和/>分别表示矩阵乘法和加法,/>表示迭代后的所述分类器的权重矩阵。
CN202310718066.3A 2023-06-16 2023-06-16 一种基于人工智能的直播数据快速分析方法 Active CN116451139B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310718066.3A CN116451139B (zh) 2023-06-16 2023-06-16 一种基于人工智能的直播数据快速分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310718066.3A CN116451139B (zh) 2023-06-16 2023-06-16 一种基于人工智能的直播数据快速分析方法

Publications (2)

Publication Number Publication Date
CN116451139A true CN116451139A (zh) 2023-07-18
CN116451139B CN116451139B (zh) 2023-09-01

Family

ID=87127739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310718066.3A Active CN116451139B (zh) 2023-06-16 2023-06-16 一种基于人工智能的直播数据快速分析方法

Country Status (1)

Country Link
CN (1) CN116451139B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116824517A (zh) * 2023-08-31 2023-09-29 安徽博诺思信息科技有限公司 基于可视化的变电站运维安全管控系统
CN117596420A (zh) * 2024-01-18 2024-02-23 江西拓世智能科技股份有限公司 基于人工智能的融合直播方法、系统、介质及电子设备

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130151543A1 (en) * 2011-12-09 2013-06-13 Wei Fan Identifying inconsistencies in object similarities from multiple information sources
US20160378781A1 (en) * 2015-06-24 2016-12-29 International Business Machines Corporation Log File Analysis to Locate Anomalies
CN106600571A (zh) * 2016-11-07 2017-04-26 中国科学院自动化研究所 融合全卷积神经网络和条件随机场的脑肿瘤自动分割方法
US20170353477A1 (en) * 2016-06-06 2017-12-07 Netskope, Inc. Machine learning based anomaly detection
CN107886599A (zh) * 2016-09-30 2018-04-06 江汉大学 一种电影院观众人数实时统计系统
WO2021169209A1 (zh) * 2020-02-27 2021-09-02 平安科技(深圳)有限公司 一种基于语音及图像特征的异常行为识别方法、装置及设备
EP3940600A1 (en) * 2020-07-15 2022-01-19 Samsung Electronics Co., Ltd. Method and apparatus with neural network operation processing background
WO2022037299A1 (zh) * 2020-08-20 2022-02-24 腾讯科技(深圳)有限公司 异常行为检测方法、装置、电子设备及计算机可读存储介质
CN114565408A (zh) * 2022-03-01 2022-05-31 北京派瑞威行互联技术有限公司 一种广告投放的竞价预测方法及系统
WO2022111158A1 (zh) * 2020-11-26 2022-06-02 北京百度网讯科技有限公司 直播业务的故障检测方法、装置、电子设备及可读存储介质
CN114727119A (zh) * 2020-12-21 2022-07-08 北京达佳互联信息技术有限公司 直播连麦控制方法、装置及存储介质
CN114881712A (zh) * 2022-07-12 2022-08-09 杭州新航互动科技有限公司 智能广告投放方法、装置、设备及存储介质
CN115190543A (zh) * 2022-07-07 2022-10-14 东南大学 密集无线网络中的边缘侧直播视频传输调度方法
WO2022247550A1 (zh) * 2021-05-25 2022-12-01 腾讯科技(深圳)有限公司 数据重传处理方法、装置、计算机设备和存储介质
CN115762563A (zh) * 2022-11-17 2023-03-07 杭州喜予文化传播有限公司 一种用于直播信息提示的交互设备及其方法
CN116166927A (zh) * 2023-02-28 2023-05-26 华中科技大学 一种在线人数异常检测方法、装置及存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130151543A1 (en) * 2011-12-09 2013-06-13 Wei Fan Identifying inconsistencies in object similarities from multiple information sources
US20160378781A1 (en) * 2015-06-24 2016-12-29 International Business Machines Corporation Log File Analysis to Locate Anomalies
US20170353477A1 (en) * 2016-06-06 2017-12-07 Netskope, Inc. Machine learning based anomaly detection
CN107886599A (zh) * 2016-09-30 2018-04-06 江汉大学 一种电影院观众人数实时统计系统
CN106600571A (zh) * 2016-11-07 2017-04-26 中国科学院自动化研究所 融合全卷积神经网络和条件随机场的脑肿瘤自动分割方法
WO2021169209A1 (zh) * 2020-02-27 2021-09-02 平安科技(深圳)有限公司 一种基于语音及图像特征的异常行为识别方法、装置及设备
EP3940600A1 (en) * 2020-07-15 2022-01-19 Samsung Electronics Co., Ltd. Method and apparatus with neural network operation processing background
WO2022037299A1 (zh) * 2020-08-20 2022-02-24 腾讯科技(深圳)有限公司 异常行为检测方法、装置、电子设备及计算机可读存储介质
WO2022111158A1 (zh) * 2020-11-26 2022-06-02 北京百度网讯科技有限公司 直播业务的故障检测方法、装置、电子设备及可读存储介质
CN114727119A (zh) * 2020-12-21 2022-07-08 北京达佳互联信息技术有限公司 直播连麦控制方法、装置及存储介质
WO2022247550A1 (zh) * 2021-05-25 2022-12-01 腾讯科技(深圳)有限公司 数据重传处理方法、装置、计算机设备和存储介质
CN114565408A (zh) * 2022-03-01 2022-05-31 北京派瑞威行互联技术有限公司 一种广告投放的竞价预测方法及系统
CN115190543A (zh) * 2022-07-07 2022-10-14 东南大学 密集无线网络中的边缘侧直播视频传输调度方法
CN114881712A (zh) * 2022-07-12 2022-08-09 杭州新航互动科技有限公司 智能广告投放方法、装置、设备及存储介质
CN115762563A (zh) * 2022-11-17 2023-03-07 杭州喜予文化传播有限公司 一种用于直播信息提示的交互设备及其方法
CN116166927A (zh) * 2023-02-28 2023-05-26 华中科技大学 一种在线人数异常检测方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
顾纯栋;: "基于ε-SVR的用户视听在线人数预测", 上海大学学报(自然科学版), no. 01 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116824517A (zh) * 2023-08-31 2023-09-29 安徽博诺思信息科技有限公司 基于可视化的变电站运维安全管控系统
CN116824517B (zh) * 2023-08-31 2023-11-17 安徽博诺思信息科技有限公司 基于可视化的变电站运维安全管控系统
CN117596420A (zh) * 2024-01-18 2024-02-23 江西拓世智能科技股份有限公司 基于人工智能的融合直播方法、系统、介质及电子设备
CN117596420B (zh) * 2024-01-18 2024-05-31 江西拓世智能科技股份有限公司 基于人工智能的融合直播方法、系统、介质及电子设备

Also Published As

Publication number Publication date
CN116451139B (zh) 2023-09-01

Similar Documents

Publication Publication Date Title
CN116451139B (zh) 一种基于人工智能的直播数据快速分析方法
US20190354718A1 (en) Identification of sensitive data using machine learning
CN116010713A (zh) 基于云计算的创新创业平台服务数据处理方法及系统
CN112199536A (zh) 一种基于跨模态的快速多标签图像分类方法和系统
CN116577677B (zh) 退役动力电池的放电测试系统及其方法
CN117041017B (zh) 数据中心的智能运维管理方法及系统
CN112767106B (zh) 自动化审计方法、系统、计算机可读存储介质及审计设备
US20220012538A1 (en) Compact representation and time series segment retrieval through deep learning
CN117040917A (zh) 一种具有监测预警功能的智慧型交换机
CN117155706B (zh) 网络异常行为检测方法及其系统
Wankhade et al. Data stream classification: a review
Ma et al. Class-imbalanced learning on graphs: A survey
Trivedi et al. Wine quality detection through machine learning algorithms
CN116361788A (zh) 一种基于机器学习的二进制软件漏洞预测方法
CN116624903A (zh) 一种用于油烟管道的智能监测方法及系统
CN117034123A (zh) 健身器材的故障监控系统及其方法
CN114781532A (zh) 机器学习模型的评估方法、装置、计算机设备及介质
Mobtahej et al. An LSTM‐Autoencoder Architecture for Anomaly Detection Applied on Compressors Audio Data
CN116402777B (zh) 基于机器视觉的电力设备检测方法及系统
CN117134958A (zh) 用于网络技术服务的信息处理方法及系统
CN117056902A (zh) 物联网密码管理方法及系统
Jere et al. Principal component properties of adversarial samples
CN117035013A (zh) 一种采用脉冲神经网络预测动态网络链路的方法
CN114610953A (zh) 一种数据分类方法、装置、设备及存储介质
Ragab et al. Intelligent data mining For automatic face recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant