CN117197722B - 基于移动互联网视频的用户感知与分析系统 - Google Patents

基于移动互联网视频的用户感知与分析系统 Download PDF

Info

Publication number
CN117197722B
CN117197722B CN202311331150.6A CN202311331150A CN117197722B CN 117197722 B CN117197722 B CN 117197722B CN 202311331150 A CN202311331150 A CN 202311331150A CN 117197722 B CN117197722 B CN 117197722B
Authority
CN
China
Prior art keywords
context
video
feature vector
training
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311331150.6A
Other languages
English (en)
Other versions
CN117197722A (zh
Inventor
李健明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Network Core Technology Co ltd
Original Assignee
Beijing Zhongke Network Core Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Network Core Technology Co ltd filed Critical Beijing Zhongke Network Core Technology Co ltd
Priority to CN202311331150.6A priority Critical patent/CN117197722B/zh
Publication of CN117197722A publication Critical patent/CN117197722A/zh
Application granted granted Critical
Publication of CN117197722B publication Critical patent/CN117197722B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于移动互联网视频的用户感知与分析系统,其通过采用基于深度神经网络模型的机器学习算法来捕捉各个指标数据之间的关联信息,并通过使用非线性激活函数的分类器来进行分类判断以得到网络状态评估标签。

Description

基于移动互联网视频的用户感知与分析系统
技术领域
本申请涉及智能分析领域,且更为具体地,涉及一种基于移动互联网视频的用户感知与分析系统。
背景技术
视频业务发展迅速,在营销推广、教育培训、社交媒体等领域的重要性不断提升。视频业务客户感知不仅取决于网络质量,更取决于“端管云台”各环节共同发挥的作用,亟需从基于网络本身的质量管理向注重客户感知的端到端横向一体化质量保障机制转变。建立视频业务端到端质量管理机制是确保客户视频业务感知的关键。
面对现有技术中,例如,安徽移动主导的漏桶算法,无法精确地反应移动互联网视频用户的访问行为和用户感知情况等问题,期待一种优化的基于移动互联网视频的用户感知与分析方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于移动互联网视频的用户感知与分析系统,其通过采用基于深度神经网络模型的机器学习算法来捕捉各个指标数据之间的关联信息,并通过使用非线性激活函数的分类器来进行分类判断以得到网络状态评估标签。
根据本申请的一个方面,提供了一种基于移动互联网视频的用户感知与分析系统,其包括:
视频业务类型确定单元,用于判断用户通过移动互联网访问的内容是否为视频;
视频内容解析单元,用于对所述视频进行组包、拆解和分析以取出与视频感知有关的关键参数和关键包到达时间点;
感知参数修订单元,用于并对所述与视频感知有关的关键参数进行修订和调整以得到所述用户观看所述视频时的各种指标数据,其中,所述所述指标数据包括:初始缓冲成功率、初始缓冲时长、视频播放时长、视频卡顿或中断时长及次数;以及
网络分析单元,用于对所述用户观看所述视频时的各种指标数据进行分析以得到网络状态分析结果。
根据本申请的另一个方面,提供了一种基于移动互联网视频的用户感知与分析方法,其包括:
判断用户通过移动互联网访问的内容是否为视频;
对所述视频进行组包、拆解和分析以取出与视频感知有关的关键参数和关键包到达时间点;
并对所述与视频感知有关的关键参数进行修订和调整以得到所述用户观看所述视频时的各种指标数据,其中,所述所述指标数据包括:初始缓冲成功率、初始缓冲时长、视频播放时长、视频卡顿或中断时长及次数;以及
对所述用户观看所述视频时的各种指标数据进行分析以得到网络状态分析结果。
与现有技术相比,本申请提供的一种基于移动互联网视频的用户感知与分析系统,其通过采用基于深度神经网络模型的机器学习算法来捕捉各个指标数据之间的关联信息,并通过使用非线性激活函数的分类器来进行分类判断以得到网络状态评估标签。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的基于移动互联网视频的用户感知与分析系统的框图;
图2为根据本申请实施例的基于移动互联网视频的用户感知与分析系统的系统架构图;
图3为根据本申请实施例的基于移动互联网视频的用户感知与分析系统的训练阶段的框图;
图4为根据本申请实施例的基于移动互联网视频的用户感知与分析系统中网络分析单元的框图;
图5为根据本申请实施例的基于移动互联网视频的用户感知与分析系统中上下文语义关联分析子单元的框图;
图6为根据本申请实施例的基于移动互联网视频的用户感知与分析方法的流程图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
视频业务发展迅速,在营销推广、教育培训、社交媒体等领域的重要性不断提升。视频业务客户感知不仅取决于网络质量,更取决于“端管云台”各环节共同发挥的作用,亟需从基于网络本身的质量管理向注重客户感知的端到端横向一体化质量保障机制转变。建立视频业务端到端质量管理机制是确保客户视频业务感知的关键。面对现有技术中,例如,安徽移动主导的漏桶算法,无法精确地反应移动互联网视频用户的访问行为和用户感知情况等问题,期待一种优化的基于移动互联网视频的用户感知与分析方案。
在本申请的技术方案中,提出了一种基于移动互联网视频的用户感知与分析系统。图1为根据本申请实施例的基于移动互联网视频的用户感知与分析系统的框图。图2为根据本申请实施例的基于移动互联网视频的用户感知与分析系统的系统架构图。如图1和图2所示,根据本申请的实施例的基于移动互联网视频的用户感知与分析系统300,包括步骤:视频业务类型确定单元310,用于判断用户通过移动互联网访问的内容是否为视频;视频内容解析单元320,用于对所述视频进行组包、拆解和分析以取出与视频感知有关的关键参数和关键包到达时间点;感知参数修订单元330,用于并对所述与视频感知有关的关键参数进行修订和调整以得到所述用户观看所述视频时的各种指标数据,其中,所述所述指标数据包括:初始缓冲成功率、初始缓冲时长、视频播放时长、视频卡顿或中断时长及次数;以及,网络分析单元340,用于对所述用户观看所述视频时的各种指标数据进行分析以得到网络状态分析结果。
特别地,所述视频业务类型确定单元310,用于判断用户通过移动互联网访问的内容是否为视频。其中,移动互联网是指通过移动设备(如智能手机、平板电脑、手持设备等)进行互联网访问和交互的技术和应用领域。它使用户能够随时随地通过移动设备连接到互联网,获取信息、进行通信、进行在线购物、使用各种应用程序等。
相应的,在一种可能的实现方式中,可通过以下步骤判断用户通过移动互联网访问的内容是否为视频,例如:获取用户访问的内容:通过移动互联网的网络请求,获取用户请求的内容;检查内容类型:检查获取到的内容的类型,可以通过查看HTTP响应头中的Content-Type字段来获取;判断内容是否为视频:根据Content-Type字段的值进行判断,如果Content-Type为"video/*",则表示内容为视频。其中,"*"表示任意视频格式,例如"video/mp4"、"video/avi"等;处理其他类型的内容:如果内容不是视频,可以根据需要进行其他处理,例如判断是否为图片、文本等。
特别地,所述视频内容解析单元320,用于对所述视频进行组包、拆解和分析以取出与视频感知有关的关键参数和关键包到达时间点。其中,与视频感知相关的关键参数包括:分辨率、帧率、码率、压缩算法、视频质量等等。与视频感知有关的关键包到达时间点是指在视频传输或视频处理过程中,与视频感知相关的关键数据包到达接收端的时间点。
值得注意的是,对视频进行组包可以理解为将视频文件按照一定的规则和格式进行划分和管理的过程。这种组包通常是为了在网络传输或存储过程中提高效率和方便管理。在视频传输中,常见的组包方式是将视频数据划分为一系列连续的视频帧,并将这些帧按照特定的顺序打包成数据包。这些数据包可以通过网络传输到接收端,然后再解包还原成视频帧进行播放。组包的过程可以包括压缩编码、分割视频帧、添加包头信息等操作。组包的目的是实现视频数据的高效传输和存储。通过将视频数据进行组包,可以减小数据包的大小,提高传输速度和带宽利用率。同时,组包还可以提供数据包的完整性和可靠性,以确保视频数据在传输过程中不会丢失或损坏。对视频进行组包后,可以进行拆解的过程称为解包或解封装。解封装是将经过组包的视频数据包重新还原为原始的视频文件或帧的过程。在解封装过程中,首先需要读取视频数据包,并按照组包时的规则和格式进行解析。解析过程包括解析包头信息、确定数据包的类型和顺序等。然后,根据解析得到的信息,将视频数据包中的数据还原成原始的视频帧或文件。解封装的目的是将视频数据还原为可供播放或处理的格式。通过解封装,可以获取视频的原始数据,包括视频帧的图像数据和音频数据(如果有的话)。这样就可以进行后续的视频处理、编辑、播放或存储等操作。
相应的,在一种可能的实现方式中,可通过以下步骤对所述视频进行组包、拆解和分析以取出与视频感知有关的关键参数和关键包到达时间点,例如:组包和拆解:将接收到的视频数据进行组包,将连续的视频帧按照一定的规则进行打包。然后,在接收端对这些包进行拆解,将视频帧还原出来;解码和播放:对拆解后的视频帧进行解码,将视频帧还原为可识别的图像。然后,通过播放器或其他显示设备将图像进行播放;视频感知参数提取:在视频帧的基础上,可以进行一系列的图像处理和分析操作,提取与视频感知有关的关键参数。例如,可以提取视频的分辨率、帧率、码率、亮度、对比度、颜色饱和度等参数;关键包到达时间点提取:在视频传输过程中,可以通过监测视频数据包的到达时间点,提取出关键包的到达时间点。关键包通常是指视频帧的关键帧,也可以是其他重要的视频数据包,如I帧、P帧等。这些关键包的到达时间点可以用于评估视频传输的稳定性和实时性。
特别地,所述感知参数修订单元330,用于并对所述与视频感知有关的关键参数进行修订和调整以得到所述用户观看所述视频时的各种指标数据,其中,所述所述指标数据包括:初始缓冲成功率、初始缓冲时长、视频播放时长、视频卡顿或中断时长及次数。其中,初始缓冲成功率是指在视频播放或流媒体传输过程中,用户开始播放时成功完成初始缓冲的比例。初始缓冲成功率反映了系统在用户开始播放时能够及时加载足够的数据并保证流畅播放的能力。初始缓冲时长是指在开始播放媒体内容之前,需要先缓冲一定时长的数据。这样可以确保在网络条件不佳或者有延迟的情况下,仍然能够流畅地播放媒体内容,避免因为缓冲不足而导致的播放中断或卡顿现象。
相应的,在一种可能的实现方式中,可通过以下步骤对所述与视频感知有关的关键参数进行修订和调整以得到所述用户观看所述视频时的各种指标数据,其中,所述所述指标数据包括:初始缓冲成功率、初始缓冲时长、视频播放时长、视频卡顿或中断时长及次数,例如:初始缓冲成功率:定义成功的初始缓冲为缓冲时长内加载了足够的数据以支持连续播放;修订初始缓冲时长,增加或减少缓冲时长,以提高初始缓冲成功率;监测初始缓冲成功率,记录成功和失败的次数。初始缓冲时长:根据网络条件和用户需求,调整初始缓冲时长;对于网络较差或延迟较高的情况,增加初始缓冲时长以确保足够的缓冲数据;对于网络较好的情况,可以适当减少初始缓冲时长以减少等待时间。视频播放时长:监测用户观看视频的实际播放时长,记录每个用户观看的视频时长;可以根据用户观看时长的统计数据,了解用户对不同视频的喜好程度和观看习惯。视频卡顿或中断时长及次数:监测视频播放过程中出现的卡顿或中断情况;记录卡顿或中断的时长和次数;可以根据统计数据,评估视频播放的稳定性和用户体验,并采取相应的优化措施。
特别地,所述网络分析单元340,用于对所述用户观看所述视频时的各种指标数据进行分析以得到网络状态分析结果。特别地,在本申请的一个具体示例中,如图4所示,所述网络分析单元340,包括:上下文语义关联分析子单元341,用于提取所述多个指标数据的上下文语义关联信息以得到上下文局部指标间强化特征向量;以及,状态评估子单元342,用于基于所述上下文局部指标间强化特征向量,确定所述网络状态的评价等级。
相应地,所述上下文语义关联分析子单元341,用于提取所述多个指标数据的上下文语义关联信息以得到上下文局部指标间强化特征向量。特别地,在本申请的一个具体示例中,如图5所示,所述上下文语义关联分析子单元341,包括:数据编码二级子单元3411,用于对所述多个指标数据进行数据编码处理以得到多个指标独热编码向量;上下文语义理解二级子单元3412,用于对所述多个指标独热编码向量进行语义分析与理解以得到多个上下文指标数据语义特征向量;以及,局部增强二级子单元3413,用于增强所述多个上下文指标数据语义特征向量之间的语义关联特征以得到上下文局部指标间强化特征向量。
所述数据编码二级子单元3411,用于对所述多个指标数据进行数据编码处理以得到多个指标独热编码向量。特别地,在本申请的一个具体示例中,所述数据编码二级子单元3411,用于:分别将所述多个指标数据进行独热编码以得到所述多个指标独热编码向量。也就是,将所述多个指标数据进行数据结构化处理。
值得注意的是,独热编码(One-Hot Encoding)是一种常用的特征编码方法,用于将离散型特征转换为机器学习算法可以处理的数值形式。在独热编码中,如果一个特征有n个可能的取值,那么就创建一个长度为n的二进制向量,其中只有一个元素为1,其余元素都为0。这个元素的位置表示对应的特征取值。
值得一提的是,在本申请的其他具体示例中,还可以通过其他方式对所述多个指标数据进行数据编码处理以得到多个指标独热编码向量,例如:收集指标数据:首先,需要收集多个指标的数据。这些指标可以是项目管理中的各种度量,比如进度、成本、质量等;数据预处理:对收集到的指标数据进行预处理。这包括数据清洗、缺失值处理、异常值处理等。确保数据的质量和完整性;确定编码方式:确定每个指标的编码方式。常见的编码方式包括独热编码(One-Hot Encoding)、标签编码(Label Encoding)等。根据指标的性质和取值范围选择适当的编码方式;进行数据编码:对每个指标进行数据编码。如果选择独热编码方式,可以将每个指标的取值转化为一个二进制向量,其中只有一个位置为1,表示该指标的取值。如果选择标签编码方式,可以将每个指标的取值映射为一个整数;组合编码向量:将多个指标的编码向量组合在一起,形成一个多维的特征向量。每个指标的编码向量可以作为特征向量的一个维度。
所述上下文语义理解二级子单元3412,用于对所述多个指标独热编码向量进行语义分析与理解以得到多个上下文指标数据语义特征向量。特别地,在本申请的一个具体示例中,所述上下文语义理解二级子单元3412,用于:将所述多个指标独热编码向量通过基于转换器模块的上下文编码器以得到所述多个上下文指标数据语义特征向量。也就是,利用转换器模块的自注意力思想来捕捉所述各个指标独热编码向量中所蕴含的语义信息。
根据本申请的实施例,将所述多个指标独热编码向量通过基于转换器模块的上下文编码器以得到所述多个上下文指标数据语义特征向量,包括:将所述多个指标独热编码向量进行一维排列以得到指标独热编码特征向量;计算所述全局特征向量与所述多个指标独热编码向量中各个指标独热编码向量的转置向量之间的乘积以得到多个自注意力关联矩阵;分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;分别以所述多个概率值中各个概率值作为权重对所述多个指标独热编码向量中各个指标独热编码进行加权以得到所述多个上下文指标数据语义特征向量。
值得注意的是,上下文编码器是指在自然语言处理任务中,将输入的上下文信息转化为语义表示的模型或组件。它的目标是将文本序列编码成固定长度的向量表示,以便后续的任务可以使用这些向量进行进一步的处理和分析。常见的上下文编码器包括循环神经网络(RNN)、长短时记忆网络(LSTM)、门控循环单元(GRU)等。这些模型能够捕捉输入序列中的上下文信息,并将其编码为固定长度的向量表示。这些向量表示可以用于文本分类、情感分析、机器翻译等自然语言处理任务。
值得一提的是,在本申请的其他具体示例中,还可以通过其他方式对所述多个指标独热编码向量进行语义分析与理解以得到多个上下文指标数据语义特征向量,例如:准备数据:收集并准备多个指标的独热编码向量数据。每个指标的独热编码向量应包含相同的维度,其中每个维度代表一个可能的取值;语义编码:使用自然语言处理(NLP)技术将每个指标的独热编码向量转换为语义特征向量。这可以通过使用预训练的词向量模型(如Word2Vec、GloVe或BERT)或使用深度学习模型(如循环神经网络或卷积神经网络)来实现;上下文建模:考虑到指标之间的关联性和上下文信息,可以将多个语义特征向量组合成一个更全面的上下文特征向量。这可以通过简单的向量拼接、加权平均或使用更复杂的神经网络模型来实现;特征表示学习:通过训练一个深度学习模型来学习多个上下文指标数据的语义特征表示。这可以使用监督学习任务(如分类或回归)来实现,其中输入是上下文特征向量,输出是相应的标签或目标值;特征向量应用:使用学习到的语义特征向量进行各种任务,如数据分析、预测、聚类等。这些特征向量可以提供更丰富的信息,帮助我们更好地理解和利用多个上下文指标数据。
所述局部增强二级子单元3413,用于增强所述多个上下文指标数据语义特征向量之间的语义关联特征以得到上下文局部指标间强化特征向量。特别地,在本申请的一个具体示例中,所述局部增强二级子单元3413,用于:将所述多个上下文指标数据语义特征向量通过基于LSTM模型的指标间关联强化器以得到所述上下文局部指标间强化特征向量。考虑到初始缓冲成功率、初始缓冲时长、视频播放时长、视频卡顿和中断时长及次数这些指标数据之间存在关联关系。例如,初始缓冲成功率是指视频播放开始时缓冲成功的比例,而初始缓冲时长是指缓冲所花费的时间。通常情况下,初始缓冲成功率与初始缓冲时长呈负相关关系,即初始缓冲成功率越高,初始缓冲时长越短。挖掘这些指标数据之间的隐含关联关系对于网络状态的评价等级的判断有重要意义。因此,在本申请的技术方案中,将所述多个上下文指标数据语义特征向量通过基于LSTM模型的指标间关联强化器以得到上下文局部指标间强化特征向量。
值得注意的是,LSTM(长短期记忆)是一种循环神经网络(RNN)的变体,特别适用于处理序列数据,并在自然语言处理等任务中取得了很好的效果。LSTM模型通过引入门控机制,可以有效地解决传统RNN中的梯度消失和梯度爆炸问题,从而更好地捕捉序列数据中的长期依赖关系。
值得一提的是,在本申请的其他具体示例中,还可以通过其他方式增强所述多个上下文指标数据语义特征向量之间的语义关联特征以得到上下文局部指标间强化特征向量,例如:收集上下文指标数据:首先,需要收集项目管理中的上下文指标数据,例如项目进展情况、资源分配情况、风险评估等。这些数据可以来自项目管理工具、团队会议记录、报告等;进行语义编码:将收集到的文本数据进行语义编码,将其转化为语义理解特征向量。可以使用自然语言处理技术,如词嵌入模型(Word Embedding)或预训练的语言模型(如BERT)来实现;计算语义关联特征:通过计算不同指标数据之间的语义相似度或相关性,得到它们之间的语义关联特征。可以使用词向量间的余弦相似度或其他相似度度量方法来计算;强化特征向量:将语义关联特征与原始特征向量进行融合,以得到强化的特征向量。可以简单地将语义关联特征与原始特征向量进行拼接或加权相加;应用于项目管理:将得到的强化特征向量应用于项目管理中的决策和分析任务。例如,可以使用强化特征向量来预测项目进展、资源利用率或风险等级。
值得一提的是,在本申请的其他具体示例中,还可以通过其他方式提取所述多个指标数据的上下文语义关联信息以得到上下文局部指标间强化特征向量,例如:收集指标数据:首先,收集与项目相关的多个指标数据。这些指标可以是项目进展、资源利用率、风险评估等方面的数据;构建指标序列:将收集到的指标数据按照时间顺序排列,形成一个指标序列。确保指标序列中的每个指标与相应的时间戳相关联;语义编码:使用自然语言处理技术,将项目描述文本数据进行语义编码,得到每个指标对应的语义理解特征向量。这可以通过使用预训练的深度学习模型,如BERT或GPT,来实现;上下文窗口定义:定义一个上下文窗口的大小,该窗口将用于捕捉指标序列中每个指标的上下文信息。上下文窗口的大小可以根据具体需求进行调整;上下文语义关联提取:对于指标序列中的每个指标,根据上下文窗口的大小,提取其前后的指定数量的指标作为上下文信息。然后,将每个上下文指标的语义理解特征向量与当前指标的语义理解特征向量进行融合,以捕捉上下文间的语义关联信息;强化特征向量生成:将融合后的上下文语义关联信息与当前指标的语义理解特征向量进行组合,生成强化特征向量。可以使用简单的向量拼接或者其他特征融合方法来实现。
相应地,所述状态评估子单元342,用于基于所述上下文局部指标间强化特征向量,确定所述网络状态的评价等级。特别地,在本申请的一个具体示例中,所述状态评估子单元342,包括:解耦二级子单元,用于对所述上下文局部指标间强化特征向量进行希尔伯特正交空间域表示解耦以得到优化上下文局部指标间强化特征向量;分类结果生成二级子单元,用于将所述优化上下文局部指标间强化特征向量通过分类器以得到分类结果,所述分类结果用于表示网络状态的评价等级标签。
特别地,在本申请的技术方案中,所述多个上下文指标数据语义特征向量中的每个上下文指标数据语义特征向量用于表达多个指标数据之间的基于转换器结构的长距离语义关联特征,由此,将所述多个上下文指标数据语义特征向量通过基于LSTM模型的指标间关联强化器时,可以进一步捕捉所述多个上下文指标数据语义特征向量之间的短距离和中距离上下文语义关联特征,从而使得所述上下文局部指标间强化特征向量具有对应于不同语义空间尺度下的交叉维度关联特征的多样化特征表示,这样,将所述上下文局部指标间强化特征向量通过分类器时,就会影响所述上下文局部指标间强化特征向量作为整体在分类回归域内的泛化效果,也就是,影响分类结果的准确性。
基于此,本申请在对所述上下文局部指标间强化特征向量进行分类时,优选地对所述上下文局部指标间强化特征向量,例如记为进行希尔伯特正交空间域表示解耦,表示为:所述解耦二级子单元,用于:以如下解耦公式对所述上下文局部指标间强化特征向量进行希尔伯特正交空间域表示解耦以得到所述优化上下文局部指标间强化特征向量;
其中,所述解耦公式为:
其中,是所述上下文局部指标间强化特征向量,/>是所述上下文局部指标间强化特征向量/>的全局特征均值,/>是所述上下文局部指标间强化特征向量/>的二范数,/>是所述上下文局部指标间强化特征向量/>的长度,/>表示一维卷积,/>是卷积后特征向量,是单位向量,/>表示向量的按位置相减,/>是相减后特征向量,/>是所述优化上下文局部指标间强化特征向量。
这里,所述希尔伯特正交空间域表示解耦用于通过强调所述上下文局部指标间强化特征向量的多样化特征表达内的本质域特定(domain-specific)信息,即,通过基于向量自空间度量和向量自内积表示下的希尔伯特空间度量,来从所述上下文局部指标间强化特征向量/>的整体域表示内进行域恒定(domain-invariant)表征的正交空间域解耦,以提升所述上下文局部指标间强化特征向量/>在分类回归域内的域自适应泛化性能,从而提升所述上下文局部指标间强化特征向量通过分类器得到的分类结果的准确性。
根据本申请的实施例,将所述优化上下文局部指标间强化特征向量通过分类器以得到分类结果,所述分类结果用于表示网络状态的评价等级标签,包括:使用所述分类器的多个全连接层对所述优化上下文局部指标间强化特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
值得注意的是,分类器是一种机器学习模型,用于将输入数据分为不同的类别或标签。它可以根据输入数据的特征,学习并预测新的未知数据所属的类别。
全连接编码是一种常见的神经网络编码方法,也称为全连接层或密集层。在神经网络中,全连接层将输入数据与每个神经元都连接起来,每个连接都有一个权重。全连接编码可以用于将输入数据映射到更高维度的特征空间,以便进行分类、回归或其他任务。
Softmax分类函数是一种常用的多类别分类函数,常用于神经网络中的输出层。它将一组实数转换为表示概率分布的向量,用于表示输入属于各个类别的概率。Softmax函数的特点是将输入映射到一个概率分布上,使得所有类别的概率之和为1。因此,Softmax函数常用于多类别分类任务,可以将神经网络的输出转换为表示各个类别概率的向量。
值得一提的是,在本申请的其他具体示例中,还可以通过其他方式对所述用户观看所述视频时的各种指标数据进行分析以得到网络状态分析结果,例如:收集指标数据:收集初始缓冲成功率、初始缓冲时长、视频播放时长、视频卡顿或中断时长及次数等指标数据;确保数据来源可靠,并记录每个用户的相关数据。数据预处理:对收集到的数据进行预处理,包括数据清洗、去除异常值和缺失值等根据需要,可以将数据进行归一化或标准化,以便进行后续的分析和比较。 分析指标数据:对初始缓冲成功率进行分析,计算成功率的平均值、最大值、最小值等统计指标,以了解初始缓冲的稳定性分析初始缓冲时长和视频播放时长的关系,观察是否存在相关性,统计视频卡顿或中断的时长和次数,评估视频播放的稳定性;网络状态分析:根据分析的指标数据,结合网络条件和用户观看经验,进行网络状态分析,根据初始缓冲成功率和初始缓冲时长,评估网络的稳定性和响应速度,根据视频播放时长和卡顿或中断情况,评估网络的带宽和延迟情况。结果解释和改进:根据网络状态分析的结果,解释网络在视频观看过程中的表现,如果发现网络存在问题,可以根据分析结果提出改进建议,例如优化网络带宽、减少延迟或改进缓冲策略等。
应可以理解,在利用上述神经网络模型进行推断之前,需要对所述基于转换器模块的上下文编码器、所述基于LSTM模型的指标间关联强化器和所述分类器进行训练。也就是说,在本申请的基于移动互联网视频的用户感知与分析系统300中,还包括训练阶段,用于对所述基于转换器模块的上下文编码器、所述基于LSTM模型的指标间关联强化器和所述分类器进行训练。
图3为根据本申请实施例的基于移动互联网视频的用户感知与分析系统的训练阶段的框图。如图3所示,根据本申请实施例的基于移动互联网视频的用户感知与分析系统300,包括:训练阶段400,包括:训练数据获取单元410,用于获取训练数据,所述训练数据包括用户观看视频时的多个训练指标数据,以及,所述网络状态的评价等级标签的真实值;数据编码单元420,用于分别将所述多个训练指标数据进行独热编码以得到多个训练指标独热编码向量;语义理解单元430,用于将所述多个训练指标独热编码向量通过所述基于转换器模块的上下文编码器以得到多个训练上下文指标数据语义特征向量;关联信息增强单元440,用于将所述多个训练上下文指标数据语义特征向量通过所述基于LSTM模型的指标间关联强化器以得到训练上下文局部指标间强化特征向量;优化单元450,用于对所述训练上下文局部指标间强化特征向量进行希尔伯特正交空间域表示解耦以得到训练优化上下文局部指标间强化特征向量;分类损失单元460,用于将所述训练优化上下文局部指标间强化特征向量通过分类器以得到分类损失函数值;共有流形隐式相似性因数计算单元470,用于计算所述多个训练上下文指标数据语义特征向量的级联特征向量和所述训练上下文局部指标间强化特征向量的共有流形隐式相似性因数;以及,训练单元480,用于以所述共有流形隐式相似性因数和所述分类损失函数值的加权和作为损失函数值来对所述基于转换器模块的上下文编码器、所述基于LSTM模型的指标间关联强化器和所述分类器进行训练。
特别地,在本申请的技术方案中,通过将所述多个指标独热编码向量通过基于转换器模块的上下文编码器得到多个上下文指标数据语义特征向量,可以解决不同的指标独热编码向量直接的编码上下文相关性差的问题,在此基础上,进一步通过基于LSTM模型的指标间关联强化器,可以提取各个指标数据之间的近程-远程双向上下文关联特征,但是,考虑到所述指标数据包含不同模态的数据,例如时间模态,次数模态等,这会使得所述上下文局部指标间强化特征向量整体在表达高维提取特征时,存在其特征表示的高维特征流形的几何单调性差的问题。这里,本申请的申请人考虑到在基于转换器模块的上下文编码器的训练过程中,由于全局上下文相关编码,得到的所述多个上下文指标数据语义特征向量会存在整体编码一致性,因此通过所述多个上下文指标数据语义特征向量来对所述上下文局部指标间强化特征向量进行约束。也就是,针对所述多个上下文指标数据语义特征向量的级联特征向量,例如记为和所述上下文局部指标间强化特征向量,例如记为/>,引入共有流形隐式相似性因数作为损失函数,具体表示为:
表示向量的二范数,且/>表示矩阵的Frobenius范数的平方根,所述级联特征向量/>和所述上下文局部指标间强化特征向量/>均为列向量形式,/>、/>、/>和/>为权重超参数。这里,所述共有流形隐式相似性因数可以以所述级联特征向量/>和所述上下文局部指标间强化特征向量/>间的结构化关联来表示各自特征流形在交叉维度下的共有流形,并以相同因数化权重来共享所述级联特征向量/>和所述上下文局部指标间强化特征向量/>的差异性、对应性、关联性等流形结构性因素的共同约束,从而对依赖共有流形的几何衍生结构表示的分布相似性进行度量,以实现跨模态特征间的特征语义关联融合的非线性几何单调性,提升所述优化上下文局部指标间强化特征向量通过分类器进行分类回归时的收敛效果,从而提升分类结果的准确性。
如上所述,根据本申请实施例的基于移动互联网视频的用户感知与分析系统300可以实现在各种无线终端中,例如基于移动互联网视频的用户感知与分析算法的服务器等。在一种可能的实现方式中,根据本申请实施例的基于移动互联网视频的用户感知与分析系统300可以作为一个软件模块和/或硬件模块而集成到无线终端中。例如,该基于移动互联网视频的用户感知与分析系统300可以是该无线终端的操作系统中的一个软件模块,或者可以是针对于该无线终端所开发的一个应用程序;当然,该基于移动互联网视频的用户感知与分析系统300同样可以是该无线终端的众多硬件模块之一。
替换地,在另一示例中,该基于移动互联网视频的用户感知与分析系统300与该无线终端也可以是分立的设备,并且该基于移动互联网视频的用户感知与分析系统300可以通过有线和/或无线网络连接到该无线终端,并且按照约定的数据格式来传输交互信息。
进一步地,还提供一种基于移动互联网视频的用户感知与分析方法。
图6为根据本申请实施例的基于移动互联网视频的用户感知与分析方法的流程图。如图6所示,根据本申请实施例的基于移动互联网视频的用户感知与分析方法,包括:S110,判断用户通过移动互联网访问的内容是否为视频;S120,对所述视频进行组包、拆解和分析以取出与视频感知有关的关键参数和关键包到达时间点;S130,并对所述与视频感知有关的关键参数进行修订和调整以得到所述用户观看所述视频时的各种指标数据,其中,所述所述指标数据包括:初始缓冲成功率、初始缓冲时长、视频播放时长、视频卡顿或中断时长及次数;以及,S140,对所述用户观看所述视频时的各种指标数据进行分析以得到网络状态分析结果。
综上,根据本申请实施例的基于移动互联网视频的用户感知与分析方法被阐明,其通过采用基于深度神经网络模型的机器学习算法来捕捉各个指标数据之间的关联信息,并通过使用非线性激活函数的分类器来进行分类判断以得到网络状态评估标签。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (5)

1.一种基于移动互联网视频的用户感知与分析系统,其特征在于,包括:
视频业务类型确定单元,用于判断用户通过移动互联网访问的内容是否为视频;
视频内容解析单元,用于对所述视频进行组包、拆解和分析以取出与视频感知有关的关键参数和关键包到达时间点;
感知参数修订单元,用于并对所述与视频感知有关的关键参数进行修订和调整以得到所述用户观看所述视频时的各种指标数据,其中,所述指标数据包括:初始缓冲成功率、初始缓冲时长、视频播放时长、视频卡顿或中断时长及次数;以及
网络分析单元,用于对所述用户观看所述视频时的各种指标数据进行分析以得到网络状态分析结果;
其中,所述网络分析单元,包括:
上下文语义关联分析子单元,用于提取所述多个指标数据的上下文语义关联信息以得到上下文局部指标间强化特征向量;以及
状态评估子单元,用于基于所述上下文局部指标间强化特征向量,确定所述网络状态的评价等级;
其中,所述上下文语义关联分析子单元,包括:
数据编码二级子单元,用于对所述多个指标数据进行数据编码处理以得到多个指标独热编码向量;
上下文语义理解二级子单元,用于对所述多个指标独热编码向量进行语义分析与理解以得到多个上下文指标数据语义特征向量;以及
局部增强二级子单元,用于增强所述多个上下文指标数据语义特征向量之间的语义关联特征以得到上下文局部指标间强化特征向量;
其中,所述数据编码二级子单元,包括:
独热编码三级子单元,用于分别将所述多个指标数据进行独热编码以得到所述多个指标独热编码向量;
其中,所述上下文语义理解二级子单元,包括:
上下文编码三级子单元,用于将所述多个指标独热编码向量通过基于转换器模块的上下文编码器以得到所述多个上下文指标数据语义特征向量;
其中,所述局部增强二级子单元,包括:
将所述多个上下文指标数据语义特征向量通过基于LSTM模型的指标间关联强化器以得到所述上下文局部指标间强化特征向量。
2.根据权利要求1所述的基于移动互联网视频的用户感知与分析系统,其特征在于,状态评估子单元,包括:
解耦二级子单元,用于对所述上下文局部指标间强化特征向量进行希尔伯特正交空间域表示解耦以得到优化上下文局部指标间强化特征向量;
分类结果生成二级子单元,用于将所述优化上下文局部指标间强化特征向量通过分类器以得到分类结果,所述分类结果用于表示网络状态的评价等级标签。
3.根据权利要求2所述的基于移动互联网视频的用户感知与分析系统,其特征在于,所述解耦二级子单元,用于:以如下解耦公式对所述上下文局部指标间强化特征向量进行希尔伯特正交空间域表示解耦以得到所述优化上下文局部指标间强化特征向量;
其中,所述解耦公式为:
其中,是所述上下文局部指标间强化特征向量,/>是所述上下文局部指标间强化特征向量/>的全局特征均值,/>是所述上下文局部指标间强化特征向量/>的二范数,/>是所述上下文局部指标间强化特征向量/>的长度,/>表示一维卷积,/>是卷积后特征向量,/>是单位向量,/>表示向量的按位置相减,/>是相减后特征向量,/>是所述优化上下文局部指标间强化特征向量。
4.根据权利要求3所述的基于移动互联网视频的用户感知与分析系统,其特征在于,还包括用于对所述基于转换器模块的上下文编码器、所述基于LSTM模型的指标间关联强化器和所述分类器进行训练的训练模块;
其中,所述训练模块,包括:
训练数据获取单元,用于获取训练数据,所述训练数据包括用户观看视频时的多个训练指标数据,以及,所述网络状态的评价等级标签的真实值;
数据编码单元,用于分别将所述多个训练指标数据进行独热编码以得到多个训练指标独热编码向量;
语义理解单元,用于将所述多个训练指标独热编码向量通过所述基于转换器模块的上下文编码器以得到多个训练上下文指标数据语义特征向量;
关联信息增强单元,用于将所述多个训练上下文指标数据语义特征向量通过所述基于LSTM模型的指标间关联强化器以得到训练上下文局部指标间强化特征向量;
优化单元,用于对所述训练上下文局部指标间强化特征向量进行希尔伯特正交空间域表示解耦以得到训练优化上下文局部指标间强化特征向量;
分类损失单元,用于将所述训练优化上下文局部指标间强化特征向量通过分类器以得到分类损失函数值;
共有流形隐式相似性因数计算单元,用于计算所述多个训练上下文指标数据语义特征向量的级联特征向量和所述训练上下文局部指标间强化特征向量的共有流形隐式相似性因数;以及
训练单元,用于以所述共有流形隐式相似性因数和所述分类损失函数值的加权和作为损失函数值来对所述基于转换器模块的上下文编码器、所述基于LSTM模型的指标间关联强化器和所述分类器进行训练。
5.根据权利要求4所述的基于移动互联网视频的用户感知与分析系统,其特征在于,所述共有流形隐式相似性因数计算单元,用于:以如下公式计算所述多个训练上下文指标数据语义特征向量的级联特征向量和所述训练上下文局部指标间强化特征向量的共有流形隐式相似性因数;
其中,所述公式为:
其中表示所述级联特征向量,/>表示所述上下文局部指标间强化特征向量,/>表示向量的二范数,且/>表示矩阵的Frobenius范数的平方根,所述级联特征向量和所述上下文局部指标间强化特征向量均为列向量形式,/>、/>、/>和/>为权重超参数,/>表示向量乘法,/>表示按位置点乘,/>表示按位置差分,/>表示所述共有流形隐式相似性损失函数值。
CN202311331150.6A 2023-10-16 2023-10-16 基于移动互联网视频的用户感知与分析系统 Active CN117197722B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311331150.6A CN117197722B (zh) 2023-10-16 2023-10-16 基于移动互联网视频的用户感知与分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311331150.6A CN117197722B (zh) 2023-10-16 2023-10-16 基于移动互联网视频的用户感知与分析系统

Publications (2)

Publication Number Publication Date
CN117197722A CN117197722A (zh) 2023-12-08
CN117197722B true CN117197722B (zh) 2024-03-15

Family

ID=88983499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311331150.6A Active CN117197722B (zh) 2023-10-16 2023-10-16 基于移动互联网视频的用户感知与分析系统

Country Status (1)

Country Link
CN (1) CN117197722B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117540935B (zh) * 2024-01-09 2024-04-05 上海银行股份有限公司 一种基于区块链技术的dao运营管理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434159A (zh) * 2020-11-17 2021-03-02 东南大学 一种利用深度神经网络进行论文多标签分类的方法
CN115909166A (zh) * 2022-08-25 2023-04-04 北京创源微致软件有限公司 一种视频评估方法、装置、电子设备和存储介质
CN116319599A (zh) * 2023-02-20 2023-06-23 养哇(南京)科技有限公司 一种承载voip业务的信道分配系统及其方法
CN116373732A (zh) * 2023-04-06 2023-07-04 重庆赛力斯新能源汽车设计院有限公司 车辆指示灯的控制方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11423304B2 (en) * 2020-01-15 2022-08-23 Beijing Jingdong Shangke Information Technology Co., Ltd. System and method for semantic analysis of multimedia data using attention-based fusion network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434159A (zh) * 2020-11-17 2021-03-02 东南大学 一种利用深度神经网络进行论文多标签分类的方法
CN115909166A (zh) * 2022-08-25 2023-04-04 北京创源微致软件有限公司 一种视频评估方法、装置、电子设备和存储介质
CN116319599A (zh) * 2023-02-20 2023-06-23 养哇(南京)科技有限公司 一种承载voip业务的信道分配系统及其方法
CN116373732A (zh) * 2023-04-06 2023-07-04 重庆赛力斯新能源汽车设计院有限公司 车辆指示灯的控制方法及系统

Also Published As

Publication number Publication date
CN117197722A (zh) 2023-12-08

Similar Documents

Publication Publication Date Title
Gündüz et al. Beyond transmitting bits: Context, semantics, and task-oriented communications
US11409791B2 (en) Joint heterogeneous language-vision embeddings for video tagging and search
Liu et al. Generalized zero-shot learning for action recognition with web-scale video data
CN110795657A (zh) 文章推送及模型训练方法、装置、存储介质和计算机设备
CN117197722B (zh) 基于移动互联网视频的用户感知与分析系统
EP3885966B1 (en) Method and device for generating natural language description information
CN114820871B (zh) 字体生成方法、模型的训练方法、装置、设备和介质
CN111680147A (zh) 一种数据处理方法、装置、设备以及可读存储介质
CN113761219A (zh) 基于知识图谱的检索方法、装置、电子设备及存储介质
WO2021159787A1 (zh) 内容处理方法、装置、计算机可读存储介质和计算机设备
CN110781818A (zh) 视频分类方法、模型训练方法、装置及设备
CN115983497A (zh) 一种时序数据预测方法和装置、计算机设备、存储介质
CN115269781A (zh) 模态关联度预测方法、装置、设备、存储介质及程序产品
CN115640449A (zh) 媒体对象推荐方法、装置、计算机设备和存储介质
CN115705706A (zh) 视频处理方法、装置、计算机设备和存储介质
US20210014540A1 (en) Method and system for codec of visual feature data
CN117251795A (zh) 基于自适应融合的多模态虚假新闻检测方法
CN115659995B (zh) 一种文本情感分析方法和装置
CN111382232A (zh) 问答信息处理方法、装置及计算机设备
CN116543339A (zh) 一种基于多尺度注意力融合的短视频事件检测方法及装置
CN115269998A (zh) 信息推荐方法、装置、电子设备及存储介质
CN117009577A (zh) 一种视频数据处理方法、装置、设备及可读存储介质
CN114443904A (zh) 视频查询方法、装置、计算机设备及计算机可读存储介质
CN114169418A (zh) 标签推荐模型训练方法及装置、标签获取方法及装置
CN113239215A (zh) 多媒体资源的分类方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant