CN107729381A

CN107729381A - 基于多维特征识别的交互多媒体资源聚合方法及系统

Info

Publication number: CN107729381A
Application number: CN201710833855.6A
Authority: CN
Inventors: 夏冰
Original assignee: GUANGZHOU JIAYING SOFTWARE CO Ltd
Current assignee: GUANGZHOU JIAYING SOFTWARE CO Ltd
Priority date: 2017-09-15
Filing date: 2017-09-15
Publication date: 2018-02-23
Anticipated expiration: 2037-09-15
Also published as: CN107729381B

Abstract

本发明公开了基于多维特征识别的交互多媒体资源聚合方法及系统，该方法包括：实时获取媒体数据后；结合预先训练好的多维特征库验证集，对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后，重构为可实时交互的模型数据；将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源。本方法可以形成与环境景物协调一致、适用范围广、沉浸体验强的交互多媒体聚合形式，实现了景物深度融合、灵活互动，对增进媒体表现效果开辟了广阔空间，可以呈现出更为逼真、立体的感官体验，聚合、观看效果好，可广泛应用于媒体数据的处理领域中。

Description

基于多维特征识别的交互多媒体资源聚合方法及系统

技术领域

本发明涉及数据处理领域，特别是涉及基于多维特征识别的交互多媒体资源聚合方法及系统。

背景技术

DBN：Dynamic Bayesian Network,动态贝叶斯网络；

交互式多媒体聚合是可实时响应外界输入的媒体资源，随着增强现实技术的完善，将虚拟内容聚合为交互应用成为传播展示的重要发展方向。特别是基于增强现实的互动应用具有内容丰富、信息量大、应用领域广等特点和优势。与传统媒体相比具有更加全面、多元的表现空间。

然而，目前的交互式聚合媒体通常只能进行简单交互和画面层的叠加显示，很难创造与环境景物协调互动的深层次体验，如何做到与景物深度融合、灵活互动，呈现出更为逼真、立体的感官体验，成为业界亟待解决的问题。

发明内容

为了解决上述的技术问题，本发明的目的是提供基于多维特征识别的交互多媒体资源聚合方法及系统。

本发明解决其技术问题所采用的技术方案是：

基于多维特征识别的交互多媒体资源聚合方法，包括步骤：

实时获取媒体数据，并将实时获取的媒体数据构成样本数据集；

结合预先训练好的多维特征库验证集，对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后，重构为可实时交互的模型数据；

将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源。

进一步，还包括多维特征库验证集的构建步骤，所述构建步骤包括：

获取由批量的媒体数据构成的验证样本集；

对验证样本集中的媒体数据依次进行拓扑系列分割、时间粒度分割和影像配准预处理后，获得验证样本集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件；

基于动态贝叶斯网络，根据该描述文件对验证样本集进行多维特征向量采集，进而基于采集的多维特征向量，构建该验证样本集的多维特征库验证集。

进一步，所述对验证样本集中的媒体数据依次进行拓扑系列分割、时间粒度分割和影像配准预处理后，获得验证样本集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件的步骤，具体包括：

对验证样本集中的每个媒体数据，对其帧序列分别进行边缘检测和角点检测，获得每个特定几何结构的最低六个特征点的特征向量；

将相邻的连续时间区间内，出现相同特征向量的特定几何结构标记为同构，同时将同构的特定几何结构所在的帧序列信息作为该特定几何结构的拓扑序列；

获得多个不同特定几何结构所对应的拓扑序列及对应的时间分布信息后，进行拓扑序列分割；

对媒体数据进行快速检索，建立时间粒度的稀疏分布，以获得时间变化特性的线性描述文件；

基于多个不同特定几何结构所对应的拓扑系列及对应的时间分布信息，结合时间变化特性的线性描述文件，建立描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件。

进一步，所述结合预先训练好的多维特征库验证集，对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后，重构为可实时交互的模型数据的步骤，具体包括：

S101、对样本数据集的媒体数据进行拓扑系列分割预处理；

S102、对拓扑序列分割处理后的媒体数据依次进行时间粒度分割和影像配准预处理后，获得样本数据集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件；

S103、基于动态贝叶斯网络，根据该描述文件对样本数据集进行多维特征向量采集，进而基于采集的多维特征向量，构建该样本数据集的多维特征库测试集；

S104、结合预先训练好的多维特征库验证集，将测试集与验证集进行交叉验证，并将验证成功的多维特征向量拟合为对应的特定几何结构后，执行步骤S108，反之判断迭代次数是否达到预设阈值，若是，则直接执行步骤S107；反之，针对验证不成功的多维特征向量，继续执行步骤S105和S106；

S105、基于隐马尔可夫推理，对验证不成功的多维特征向量中的结构特征进行结构学习，并采用非线性非接触式神经网络对学习得到的结构进行推理后，返回执行步骤S102；

S106、基于隐马尔可夫推理，对验证不成功的多维特征向量中的非结构特征进行模糊聚类后，采用基于时钟频率驱动-循环神经网络对聚类结果进行推理，构建新的测试集，进而返回执行步骤S104；

S107、将学习推理得到的结构以及模糊聚类获得的非结构特征进行关联后，标记为新的特定几何结构，更新多维特征库的验证集，并输出该新的特定几何结构后执行步骤S108；

S108、根据输出的特定几何结构，与预设格式的媒体资源匹配获得对应的可实时交互的模型数据。

进一步，所述步骤S104中所述结合预先训练好的多维特征库验证集，将测试集与验证集进行交叉验证，并将验证成功的多维特征向量拟合为对应的特定几何结构的步骤，具体包括：

S1041、结合预先训练好的多维特征库验证集，将测试集与验证集进行空间拓扑结构的同胚检测，并在连续性时间区间进行频率同步性检测，对测试集中待拟合的多维特征向量进行一致性筛查，并将通过筛查的多维特征向量作为粗拟合多维特征向量；

S1042、基于动态贝叶斯网络，将粗拟合多维特征向量进行分形结构迭代拟合，进一步拟合获得细分的多维特征向量，在命中率和相关度达到匹配阈值后，结束迭代，拟合获得对应的特定几何结构。

进一步，所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤，其具体为：

将模型数据与预设格式的媒体资源以增强现实方式深度融合，形成具有不同拟合精度、重构效果的交互多媒体资源；

所述预设格式的媒体资源是按照媒体资源的环境、特效、置换、基本参数中的至少一种参数进行聚类获得的，或者按照情境、气候、季节、自然地理条件中的至少一种自定义模板提取获得的。

进一步，所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤之后，还包括步骤：

将交互多媒体资源通过有线网络或无线网络发送到作为资源重现载体的回放终端处融合为虚拟内容后，叠加显示、播放对应的画面。

进一步，所述回放终端包括智能手机、计算机、平板电脑、智能电视、投影设备中的至少一种。

进一步，所述虚拟内容包括图形、图像、音视频特效、音视频文件、文本文档、2D\3D动画、矢量动画、二维码\条形码、2D\3D模型、全景图像\视频、二维三维场景中的任意一种或采用其中两种以上的组合、叠加或形变。

本发明解决其技术问题所采用的另一技术方案是：

基于多维特征识别的交互多媒体资源聚合系统，包括存储介质和处理器，所述存储介质中存储有至少一个指令，所述处理器用于加载所述至少一个指令并执行以下步骤：

本发明方法、系统的有益效果是：本发明通过实时获取媒体数据后，结合预先训练好的多维特征库验证集，对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后，重构为可实时交互的模型数据，然后将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源，可以形成与环境景物协调一致、适用范围广、沉浸体验强的交互多媒体聚合形式，实现了景物深度融合、灵活互动，对增进媒体表现效果开辟了广阔空间，围绕增强现实技术实现了多渠道内容汇聚、虚拟和现实景物融合、局域和远程联结的复合化、多样化和平台化，可以呈现出更为逼真、立体的感官体验，聚合、观看效果好。

附图说明

图1是本发明的基于多维特征识别的交互多媒体资源聚合方法的流程图。

具体实施方式

参照图1，本发明提供了一种基于多维特征识别的交互多媒体资源聚合方法，包括步骤：

实时获取媒体数据，并将实时获取的媒体数据构成样本数据集；媒体数据是通过航拍机、无人机、摄像机、全息照相机、光场摄像机、全景摄像机、监控设备采集真实景物的影像资源数据，或者采集自扫描件、OCR识别、纸质媒体和互联网的链接、引用、分享、点评等途径的文本信息；

将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源。交互多媒体资源包括图形、图像、音视频特效、音视频文件、文本文档、2D\3D动画、矢量动画、二维码\条形码、2D\3D模型、全景图像\视频、二维三维场景中的任意一种或两种以上的组合、叠加或形变。

进一步作为优选的实施方式，还包括多维特征库验证集的构建步骤，所述构建步骤包括：

获取由批量的媒体数据构成的验证样本集；

进一步作为优选的实施方式，所述对验证样本集中的媒体数据依次进行拓扑系列分割、时间粒度分割和影像配准预处理后，获得验证样本集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件的步骤，具体包括：

获得的描述文件用于给予动态贝叶斯网络一个信息墒的指示，调度动态贝叶斯网络进行自动阈值调整限定维度范围，限制信息墒大小是降维的一种权衡措施，以提升识别性能。

进一步作为优选的实施方式，所述结合预先训练好的多维特征库验证集，对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后，重构为可实时交互的模型数据的步骤，具体包括：

S101、对样本数据集的媒体数据进行拓扑系列分割预处理；

S102、对拓扑序列分割处理后的媒体数据依次进行时间粒度分割和影像配准预处理后，获得样本数据集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件；步骤S101和S102中的拓扑系列分割预处理、时间粒度分割和影像配准预处理的详细过程，与多维特征库训练步骤中的一致，这里不再赘述；

有时候连续视频中识别的多维特征向量无法与原有的多维特征库中的特征向量匹配。这即代表着它可能是个新事物，原有的特征空间中没有这个事物的特征向量。例如，原来没有雨伞这类事物的特征向量集，即使景物中明明是个雨伞，但是动态贝叶斯网络连续迭代都找不到与其匹配的多维特征向量。因此，表示动态贝叶斯网络无法认识未储存的特征。所以需要进行隐马尔科夫推理，去记录和学习这个新事物的各种特征，从而标记为新的特定几何结构并输出。

进一步作为优选的实施方式，所述步骤S104中所述结合预先训练好的多维特征库验证集，将测试集与验证集进行交叉验证，并将验证成功的多维特征向量拟合为对应的特定几何结构的步骤，具体包括：

S1042、基于动态贝叶斯网络，将粗拟合多维特征向量进行分形结构迭代拟合，进一步拟合获得细分的多维特征向量，在命中率和相关度达到匹配阈值后，结束迭代，拟合获得对应的特定几何结构。分形结构迭代拟合的原理：例如已经识别出一个同胚的圆柱状几何结构，则与圆柱体相关的判别器会被调动起来。那么圆柱的细分结构就需要进一步分形的拟合。才能获得瓶盖、瓶身、瓶底的逐步识别。当然，多维特征库中的各种瓶子的父类都是圆柱体。分形拟合只是在圆柱体中进一步发现详细的特征，这些特征究竟代表着瓶子、柱子还是罐子。迭代拟合就是在已知父类的情况下，在局部分形上进一步比对特征向量，确定局部分形是否命中已有的特征。高度相关的命中就能识别局部究竟是什么。因此，迭代拟合过程是个细节识别过程。

步骤S1041中，同胚检测具体过程如下：

结合预先训练好的多维特征库验证集，将获得的测试集的多维特征向量与训练集的多维特征向量进行空间拓扑结构的同胚检测，将与多维特征库的验证集同胚的多维特征向量的相似度加权值增加1；相似度加权值的初始化值为0；

同时将获得的测试集的多维特征向量与训练集的多维特征向量在连续性时间区间进行频率同步性检测，将与多维特征库的验证集同步的多维特征向量的相关度加权值加1；相关度加权值的初始化值为0。

最后，获得相关度加权值和相似度加权值均为1的多维特征向量，作为通过筛查的多维特征向量，即前述的粗拟合多维特征向量。

在连续性时间区间进行检测，是因为物体具有时间特性，例如昨天大街上的录像里面的汽车，和今天大街录像上的汽车，极小概率是同一辆汽车。因此，连续性时间区间是一致性筛查措施，保证了进行检测对比的多维特征向量是同一个景物的特征向量，否则没有可比性或丧失比较意义。

进一步作为优选的实施方式，所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤，其具体为：

所述预设格式的媒体资源是按照媒体资源的环境、特效、置换、基本参数中的至少一种参数进行聚类获得的，或者按照情境、气候、季节、自然地理条件中的至少一种自定义模板提取获得的。本方案可以给予用户丰富的立体互动体验，具有先进性、高扩展性、深度关联性、操作简单易用等优势。

本发明的媒体资源具有多样化、景物环境多元化、回放终端多样化、资源分享广域化和互动体验新颖化等特点。对增进媒体表现效果开辟了广阔空间，对增强市场活力，激活更多的复合内容提供方式和商业服务领域提供了技术基础。

进一步作为优选的实施方式，所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤之后，还包括步骤：

进一步作为优选的实施方式，所述回放终端包括智能手机、计算机、平板电脑、智能电视、投影设备中的至少一种，可以采用同一种终端进行拼接或组合排列后作为回放终端。回放终端设置有有线网络通信模块，或无线网络通信模块，可以通过有线通信或无线通信方式进行数据交互，回放终端的数量可以为多个，多路回放终端可以并行处理且彼此兼容。

本实施例通过与多种回放终端的无缝结合实现了跨终端跨平台的数据交互，进一步提升了增强现实领域的应用广度和深度，对增强市场活力，激活更多的复合内容提供方式和商业服务领域提供了技术基础。

进一步作为优选的实施方式，所述虚拟内容包括图形、图像、音视频特效、音视频文件、文本文档、2D\3D动画、矢量动画、二维码\条形码、2D\3D模型、全景图像\视频、二维三维场景中的任意一种或采用其中两种以上的组合、叠加或形变。这里，形变包括卡通化、滤镜风格化、数据可视化、拟人化以及拓扑形变处理中的至少一种。

本方法通过获取媒体数据后，结合预先训练好的多维特征库验证集，对样本数据集进行基于动态贝叶斯网络DBN的多维特征识别与反演拟合后，重构为可实时交互的模型数据，然后将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源，可以形成与环境景物协调一致、适用范围广、沉浸体验强的交互多媒体聚合形式，实现了景物深度融合、灵活互动，对增进媒体表现效果开辟了广阔空间，本方法以媒体资源聚合为核心，围绕增强现实技术实现了多渠道内容汇聚、虚拟和现实景物融合、局域和远程联结的复合化、多样化和平台化。

本发明还提供了一种基于多维特征识别的交互多媒体资源聚合系统，包括存储介质和处理器，所述存储介质中存储有至少一个指令，所述处理器用于加载所述至少一个指令并执行以下步骤：

本系统用于实现前述方法，其具体各个步骤的细节可参照前述方法的描述。

以上是对本发明的较佳实施进行了具体说明，但本发明创造并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换，这些等同的变型或替换均包含在本申请权利要求所限定的范围内。

Claims

1.基于多维特征识别的交互多媒体资源聚合方法，其特征在于，包括步骤：

2.根据权利要求1所述的基于多维特征识别的交互多媒体资源聚合方法，其特征在于，还包括多维特征库验证集的构建步骤，所述构建步骤包括：

获取由批量的媒体数据构成的验证样本集；

3.根据权利要求2所述的基于多维特征识别的交互多媒体资源聚合方法，其特征在于，所述对验证样本集中的媒体数据依次进行拓扑系列分割、时间粒度分割和影像配准预处理后，获得验证样本集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件的步骤，具体包括：

4.根据权利要求1所述的基于多维特征识别的交互多媒体资源聚合方法，其特征在于，所述结合预先训练好的多维特征库验证集，对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后，重构为可实时交互的模型数据的步骤，具体包括：

S101、对样本数据集的媒体数据进行拓扑系列分割预处理；

5.根据权利要求4所述的基于多维特征识别的交互多媒体资源聚合方法，其特征在于，所述步骤S104中所述结合预先训练好的多维特征库验证集，将测试集与验证集进行交叉验证，并将验证成功的多维特征向量拟合为对应的特定几何结构的步骤，具体包括：

6.根据权利要求1所述的基于多维特征识别的交互多媒体资源聚合方法，其特征在于，所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤，其具体为：

7.根据权利要求1所述的基于多维特征识别的交互多媒体资源聚合方法，其特征在于，所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤之后，还包括步骤：

8.根据权利要求7所述的基于多维特征识别的交互多媒体资源聚合方法，其特征在于，所述回放终端包括智能手机、计算机、平板电脑、智能电视、投影设备中的至少一种。

9.根据权利要求7所述的基于多维特征识别的交互多媒体资源聚合方法，其特征在于，所述虚拟内容包括图形、图像、音视频特效、音视频文件、文本文档、2D\3D动画、矢量动画、二维码\条形码、2D\3D模型、全景图像\视频、二维三维场景中的任意一种或采用其中两种以上的组合、叠加或形变。

10.基于多维特征识别的交互多媒体资源聚合系统，其特征在于，包括存储介质和处理器，所述存储介质中存储有至少一个指令，所述处理器用于加载所述至少一个指令并执行以下步骤：