CN107729381A - 基于多维特征识别的交互多媒体资源聚合方法及系统 - Google Patents

基于多维特征识别的交互多媒体资源聚合方法及系统 Download PDF

Info

Publication number
CN107729381A
CN107729381A CN201710833855.6A CN201710833855A CN107729381A CN 107729381 A CN107729381 A CN 107729381A CN 201710833855 A CN201710833855 A CN 201710833855A CN 107729381 A CN107729381 A CN 107729381A
Authority
CN
China
Prior art keywords
multidimensional characteristic
interactive multimedia
collection
multimedia resource
media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710833855.6A
Other languages
English (en)
Other versions
CN107729381B (zh
Inventor
夏冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUANGZHOU JIAYING SOFTWARE CO Ltd
Original Assignee
GUANGZHOU JIAYING SOFTWARE CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGZHOU JIAYING SOFTWARE CO Ltd filed Critical GUANGZHOU JIAYING SOFTWARE CO Ltd
Priority to CN201710833855.6A priority Critical patent/CN107729381B/zh
Publication of CN107729381A publication Critical patent/CN107729381A/zh
Application granted granted Critical
Publication of CN107729381B publication Critical patent/CN107729381B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于多维特征识别的交互多媒体资源聚合方法及系统,该方法包括:实时获取媒体数据后;结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后,重构为可实时交互的模型数据;将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源。本方法可以形成与环境景物协调一致、适用范围广、沉浸体验强的交互多媒体聚合形式,实现了景物深度融合、灵活互动,对增进媒体表现效果开辟了广阔空间,可以呈现出更为逼真、立体的感官体验,聚合、观看效果好,可广泛应用于媒体数据的处理领域中。

Description

基于多维特征识别的交互多媒体资源聚合方法及系统
技术领域
本发明涉及数据处理领域,特别是涉及基于多维特征识别的交互多媒体资源聚合方法及系统。
背景技术
DBN:Dynamic Bayesian Network,动态贝叶斯网络;
交互式多媒体聚合是可实时响应外界输入的媒体资源,随着增强现实技术的完善,将虚拟内容聚合为交互应用成为传播展示的重要发展方向。特别是基于增强现实的互动应用具有内容丰富、信息量大、应用领域广等特点和优势。与传统媒体相比具有更加全面、多元的表现空间。
然而,目前的交互式聚合媒体通常只能进行简单交互和画面层的叠加显示,很难创造与环境景物协调互动的深层次体验,如何做到与景物深度融合、灵活互动,呈现出更为逼真、立体的感官体验,成为业界亟待解决的问题。
发明内容
为了解决上述的技术问题,本发明的目的是提供基于多维特征识别的交互多媒体资源聚合方法及系统。
本发明解决其技术问题所采用的技术方案是:
基于多维特征识别的交互多媒体资源聚合方法,包括步骤:
实时获取媒体数据,并将实时获取的媒体数据构成样本数据集;
结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后,重构为可实时交互的模型数据;
将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源。
进一步,还包括多维特征库验证集的构建步骤,所述构建步骤包括:
获取由批量的媒体数据构成的验证样本集;
对验证样本集中的媒体数据依次进行拓扑系列分割、时间粒度分割和影像配准预处理后,获得验证样本集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件;
基于动态贝叶斯网络,根据该描述文件对验证样本集进行多维特征向量采集,进而基于采集的多维特征向量,构建该验证样本集的多维特征库验证集。
进一步,所述对验证样本集中的媒体数据依次进行拓扑系列分割、时间粒度分割和影像配准预处理后,获得验证样本集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件的步骤,具体包括:
对验证样本集中的每个媒体数据,对其帧序列分别进行边缘检测和角点检测,获得每个特定几何结构的最低六个特征点的特征向量;
将相邻的连续时间区间内,出现相同特征向量的特定几何结构标记为同构,同时将同构的特定几何结构所在的帧序列信息作为该特定几何结构的拓扑序列;
获得多个不同特定几何结构所对应的拓扑序列及对应的时间分布信息后,进行拓扑序列分割;
对媒体数据进行快速检索,建立时间粒度的稀疏分布,以获得时间变化特性的线性描述文件;
基于多个不同特定几何结构所对应的拓扑系列及对应的时间分布信息,结合时间变化特性的线性描述文件,建立描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件。
进一步,所述结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后,重构为可实时交互的模型数据的步骤,具体包括:
S101、对样本数据集的媒体数据进行拓扑系列分割预处理;
S102、对拓扑序列分割处理后的媒体数据依次进行时间粒度分割和影像配准预处理后,获得样本数据集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件;
S103、基于动态贝叶斯网络,根据该描述文件对样本数据集进行多维特征向量采集,进而基于采集的多维特征向量,构建该样本数据集的多维特征库测试集;
S104、结合预先训练好的多维特征库验证集,将测试集与验证集进行交叉验证,并将验证成功的多维特征向量拟合为对应的特定几何结构后,执行步骤S108,反之判断迭代次数是否达到预设阈值,若是,则直接执行步骤S107;反之,针对验证不成功的多维特征向量,继续执行步骤S105和S106;
S105、基于隐马尔可夫推理,对验证不成功的多维特征向量中的结构特征进行结构学习,并采用非线性非接触式神经网络对学习得到的结构进行推理后,返回执行步骤S102;
S106、基于隐马尔可夫推理,对验证不成功的多维特征向量中的非结构特征进行模糊聚类后,采用基于时钟频率驱动-循环神经网络对聚类结果进行推理,构建新的测试集,进而返回执行步骤S104;
S107、将学习推理得到的结构以及模糊聚类获得的非结构特征进行关联后,标记为新的特定几何结构,更新多维特征库的验证集,并输出该新的特定几何结构后执行步骤S108;
S108、根据输出的特定几何结构,与预设格式的媒体资源匹配获得对应的可实时交互的模型数据。
进一步,所述步骤S104中所述结合预先训练好的多维特征库验证集,将测试集与验证集进行交叉验证,并将验证成功的多维特征向量拟合为对应的特定几何结构的步骤,具体包括:
S1041、结合预先训练好的多维特征库验证集,将测试集与验证集进行空间拓扑结构的同胚检测,并在连续性时间区间进行频率同步性检测,对测试集中待拟合的多维特征向量进行一致性筛查,并将通过筛查的多维特征向量作为粗拟合多维特征向量;
S1042、基于动态贝叶斯网络,将粗拟合多维特征向量进行分形结构迭代拟合,进一步拟合获得细分的多维特征向量,在命中率和相关度达到匹配阈值后,结束迭代,拟合获得对应的特定几何结构。
进一步,所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤,其具体为:
将模型数据与预设格式的媒体资源以增强现实方式深度融合,形成具有不同拟合精度、重构效果的交互多媒体资源;
所述预设格式的媒体资源是按照媒体资源的环境、特效、置换、基本参数中的至少一种参数进行聚类获得的,或者按照情境、气候、季节、自然地理条件中的至少一种自定义模板提取获得的。
进一步,所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤之后,还包括步骤:
将交互多媒体资源通过有线网络或无线网络发送到作为资源重现载体的回放终端处融合为虚拟内容后,叠加显示、播放对应的画面。
进一步,所述回放终端包括智能手机、计算机、平板电脑、智能电视、投影设备中的至少一种。
进一步,所述虚拟内容包括图形、图像、音视频特效、音视频文件、文本文档、2D\3D动画、矢量动画、二维码\条形码、2D\3D模型、全景图像\视频、二维三维场景中的任意一种或采用其中两种以上的组合、叠加或形变。
本发明解决其技术问题所采用的另一技术方案是:
基于多维特征识别的交互多媒体资源聚合系统,包括存储介质和处理器,所述存储介质中存储有至少一个指令,所述处理器用于加载所述至少一个指令并执行以下步骤:
实时获取媒体数据,并将实时获取的媒体数据构成样本数据集;
结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后,重构为可实时交互的模型数据;
将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源。
本发明方法、系统的有益效果是:本发明通过实时获取媒体数据后,结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后,重构为可实时交互的模型数据,然后将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源,可以形成与环境景物协调一致、适用范围广、沉浸体验强的交互多媒体聚合形式,实现了景物深度融合、灵活互动,对增进媒体表现效果开辟了广阔空间,围绕增强现实技术实现了多渠道内容汇聚、虚拟和现实景物融合、局域和远程联结的复合化、多样化和平台化,可以呈现出更为逼真、立体的感官体验,聚合、观看效果好。
附图说明
图1是本发明的基于多维特征识别的交互多媒体资源聚合方法的流程图。
具体实施方式
参照图1,本发明提供了一种基于多维特征识别的交互多媒体资源聚合方法,包括步骤:
实时获取媒体数据,并将实时获取的媒体数据构成样本数据集;媒体数据是通过航拍机、无人机、摄像机、全息照相机、光场摄像机、全景摄像机、监控设备采集真实景物的影像资源数据,或者采集自扫描件、OCR识别、纸质媒体和互联网的链接、引用、分享、点评等途径的文本信息;
结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后,重构为可实时交互的模型数据;
将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源。交互多媒体资源包括图形、图像、音视频特效、音视频文件、文本文档、2D\3D动画、矢量动画、二维码\条形码、2D\3D模型、全景图像\视频、二维三维场景中的任意一种或两种以上的组合、叠加或形变。
进一步作为优选的实施方式,还包括多维特征库验证集的构建步骤,所述构建步骤包括:
获取由批量的媒体数据构成的验证样本集;
对验证样本集中的媒体数据依次进行拓扑系列分割、时间粒度分割和影像配准预处理后,获得验证样本集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件;
基于动态贝叶斯网络,根据该描述文件对验证样本集进行多维特征向量采集,进而基于采集的多维特征向量,构建该验证样本集的多维特征库验证集。
进一步作为优选的实施方式,所述对验证样本集中的媒体数据依次进行拓扑系列分割、时间粒度分割和影像配准预处理后,获得验证样本集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件的步骤,具体包括:
对验证样本集中的每个媒体数据,对其帧序列分别进行边缘检测和角点检测,获得每个特定几何结构的最低六个特征点的特征向量;
将相邻的连续时间区间内,出现相同特征向量的特定几何结构标记为同构,同时将同构的特定几何结构所在的帧序列信息作为该特定几何结构的拓扑序列;
获得多个不同特定几何结构所对应的拓扑序列及对应的时间分布信息后,进行拓扑序列分割;
对媒体数据进行快速检索,建立时间粒度的稀疏分布,以获得时间变化特性的线性描述文件;
基于多个不同特定几何结构所对应的拓扑系列及对应的时间分布信息,结合时间变化特性的线性描述文件,建立描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件。
获得的描述文件用于给予动态贝叶斯网络一个信息墒的指示,调度动态贝叶斯网络进行自动阈值调整限定维度范围,限制信息墒大小是降维的一种权衡措施,以提升识别性能。
进一步作为优选的实施方式,所述结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后,重构为可实时交互的模型数据的步骤,具体包括:
S101、对样本数据集的媒体数据进行拓扑系列分割预处理;
S102、对拓扑序列分割处理后的媒体数据依次进行时间粒度分割和影像配准预处理后,获得样本数据集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件;步骤S101和S102中的拓扑系列分割预处理、时间粒度分割和影像配准预处理的详细过程,与多维特征库训练步骤中的一致,这里不再赘述;
S103、基于动态贝叶斯网络,根据该描述文件对样本数据集进行多维特征向量采集,进而基于采集的多维特征向量,构建该样本数据集的多维特征库测试集;
S104、结合预先训练好的多维特征库验证集,将测试集与验证集进行交叉验证,并将验证成功的多维特征向量拟合为对应的特定几何结构后,执行步骤S108,反之判断迭代次数是否达到预设阈值,若是,则直接执行步骤S107;反之,针对验证不成功的多维特征向量,继续执行步骤S105和S106;
S105、基于隐马尔可夫推理,对验证不成功的多维特征向量中的结构特征进行结构学习,并采用非线性非接触式神经网络对学习得到的结构进行推理后,返回执行步骤S102;
S106、基于隐马尔可夫推理,对验证不成功的多维特征向量中的非结构特征进行模糊聚类后,采用基于时钟频率驱动-循环神经网络对聚类结果进行推理,构建新的测试集,进而返回执行步骤S104;
S107、将学习推理得到的结构以及模糊聚类获得的非结构特征进行关联后,标记为新的特定几何结构,更新多维特征库的验证集,并输出该新的特定几何结构后执行步骤S108;
S108、根据输出的特定几何结构,与预设格式的媒体资源匹配获得对应的可实时交互的模型数据。
有时候连续视频中识别的多维特征向量无法与原有的多维特征库中的特征向量匹配。这即代表着它可能是个新事物,原有的特征空间中没有这个事物的特征向量。例如,原来没有雨伞这类事物的特征向量集,即使景物中明明是个雨伞,但是动态贝叶斯网络连续迭代都找不到与其匹配的多维特征向量。因此,表示动态贝叶斯网络无法认识未储存的特征。所以需要进行隐马尔科夫推理,去记录和学习这个新事物的各种特征,从而标记为新的特定几何结构并输出。
进一步作为优选的实施方式,所述步骤S104中所述结合预先训练好的多维特征库验证集,将测试集与验证集进行交叉验证,并将验证成功的多维特征向量拟合为对应的特定几何结构的步骤,具体包括:
S1041、结合预先训练好的多维特征库验证集,将测试集与验证集进行空间拓扑结构的同胚检测,并在连续性时间区间进行频率同步性检测,对测试集中待拟合的多维特征向量进行一致性筛查,并将通过筛查的多维特征向量作为粗拟合多维特征向量;
S1042、基于动态贝叶斯网络,将粗拟合多维特征向量进行分形结构迭代拟合,进一步拟合获得细分的多维特征向量,在命中率和相关度达到匹配阈值后,结束迭代,拟合获得对应的特定几何结构。分形结构迭代拟合的原理:例如已经识别出一个同胚的圆柱状几何结构,则与圆柱体相关的判别器会被调动起来。那么圆柱的细分结构就需要进一步分形的拟合。才能获得瓶盖、瓶身、瓶底的逐步识别。当然,多维特征库中的各种瓶子的父类都是圆柱体。分形拟合只是在圆柱体中进一步发现详细的特征,这些特征究竟代表着瓶子、柱子还是罐子。迭代拟合就是在已知父类的情况下,在局部分形上进一步比对特征向量,确定局部分形是否命中已有的特征。高度相关的命中就能识别局部究竟是什么。因此,迭代拟合过程是个细节识别过程。
步骤S1041中,同胚检测具体过程如下:
结合预先训练好的多维特征库验证集,将获得的测试集的多维特征向量与训练集的多维特征向量进行空间拓扑结构的同胚检测,将与多维特征库的验证集同胚的多维特征向量的相似度加权值增加1;相似度加权值的初始化值为0;
同时将获得的测试集的多维特征向量与训练集的多维特征向量在连续性时间区间进行频率同步性检测,将与多维特征库的验证集同步的多维特征向量的相关度加权值加1;相关度加权值的初始化值为0。
最后,获得相关度加权值和相似度加权值均为1的多维特征向量,作为通过筛查的多维特征向量,即前述的粗拟合多维特征向量。
在连续性时间区间进行检测,是因为物体具有时间特性,例如昨天大街上的录像里面的汽车,和今天大街录像上的汽车,极小概率是同一辆汽车。因此,连续性时间区间是一致性筛查措施,保证了进行检测对比的多维特征向量是同一个景物的特征向量,否则没有可比性或丧失比较意义。
进一步作为优选的实施方式,所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤,其具体为:
将模型数据与预设格式的媒体资源以增强现实方式深度融合,形成具有不同拟合精度、重构效果的交互多媒体资源;
所述预设格式的媒体资源是按照媒体资源的环境、特效、置换、基本参数中的至少一种参数进行聚类获得的,或者按照情境、气候、季节、自然地理条件中的至少一种自定义模板提取获得的。本方案可以给予用户丰富的立体互动体验,具有先进性、高扩展性、深度关联性、操作简单易用等优势。
本发明的媒体资源具有多样化、景物环境多元化、回放终端多样化、资源分享广域化和互动体验新颖化等特点。对增进媒体表现效果开辟了广阔空间,对增强市场活力,激活更多的复合内容提供方式和商业服务领域提供了技术基础。
进一步作为优选的实施方式,所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤之后,还包括步骤:
将交互多媒体资源通过有线网络或无线网络发送到作为资源重现载体的回放终端处融合为虚拟内容后,叠加显示、播放对应的画面。
进一步作为优选的实施方式,所述回放终端包括智能手机、计算机、平板电脑、智能电视、投影设备中的至少一种,可以采用同一种终端进行拼接或组合排列后作为回放终端。回放终端设置有有线网络通信模块,或无线网络通信模块,可以通过有线通信或无线通信方式进行数据交互,回放终端的数量可以为多个,多路回放终端可以并行处理且彼此兼容。
本实施例通过与多种回放终端的无缝结合实现了跨终端跨平台的数据交互,进一步提升了增强现实领域的应用广度和深度,对增强市场活力,激活更多的复合内容提供方式和商业服务领域提供了技术基础。
进一步作为优选的实施方式,所述虚拟内容包括图形、图像、音视频特效、音视频文件、文本文档、2D\3D动画、矢量动画、二维码\条形码、2D\3D模型、全景图像\视频、二维三维场景中的任意一种或采用其中两种以上的组合、叠加或形变。这里,形变包括卡通化、滤镜风格化、数据可视化、拟人化以及拓扑形变处理中的至少一种。
本方法通过获取媒体数据后,结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络DBN的多维特征识别与反演拟合后,重构为可实时交互的模型数据,然后将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源,可以形成与环境景物协调一致、适用范围广、沉浸体验强的交互多媒体聚合形式,实现了景物深度融合、灵活互动,对增进媒体表现效果开辟了广阔空间,本方法以媒体资源聚合为核心,围绕增强现实技术实现了多渠道内容汇聚、虚拟和现实景物融合、局域和远程联结的复合化、多样化和平台化。
本发明还提供了一种基于多维特征识别的交互多媒体资源聚合系统,包括存储介质和处理器,所述存储介质中存储有至少一个指令,所述处理器用于加载所述至少一个指令并执行以下步骤:
实时获取媒体数据,并将实时获取的媒体数据构成样本数据集;
结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后,重构为可实时交互的模型数据;
将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源。
本系统用于实现前述方法,其具体各个步骤的细节可参照前述方法的描述。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.基于多维特征识别的交互多媒体资源聚合方法,其特征在于,包括步骤:
实时获取媒体数据,并将实时获取的媒体数据构成样本数据集;
结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后,重构为可实时交互的模型数据;
将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源。
2.根据权利要求1所述的基于多维特征识别的交互多媒体资源聚合方法,其特征在于,还包括多维特征库验证集的构建步骤,所述构建步骤包括:
获取由批量的媒体数据构成的验证样本集;
对验证样本集中的媒体数据依次进行拓扑系列分割、时间粒度分割和影像配准预处理后,获得验证样本集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件;
基于动态贝叶斯网络,根据该描述文件对验证样本集进行多维特征向量采集,进而基于采集的多维特征向量,构建该验证样本集的多维特征库验证集。
3.根据权利要求2所述的基于多维特征识别的交互多媒体资源聚合方法,其特征在于,所述对验证样本集中的媒体数据依次进行拓扑系列分割、时间粒度分割和影像配准预处理后,获得验证样本集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件的步骤,具体包括:
对验证样本集中的每个媒体数据,对其帧序列分别进行边缘检测和角点检测,获得每个特定几何结构的最低六个特征点的特征向量;
将相邻的连续时间区间内,出现相同特征向量的特定几何结构标记为同构,同时将同构的特定几何结构所在的帧序列信息作为该特定几何结构的拓扑序列;
获得多个不同特定几何结构所对应的拓扑序列及对应的时间分布信息后,进行拓扑序列分割;
对媒体数据进行快速检索,建立时间粒度的稀疏分布,以获得时间变化特性的线性描述文件;
基于多个不同特定几何结构所对应的拓扑系列及对应的时间分布信息,结合时间变化特性的线性描述文件,建立描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件。
4.根据权利要求1所述的基于多维特征识别的交互多媒体资源聚合方法,其特征在于,所述结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后,重构为可实时交互的模型数据的步骤,具体包括:
S101、对样本数据集的媒体数据进行拓扑系列分割预处理;
S102、对拓扑序列分割处理后的媒体数据依次进行时间粒度分割和影像配准预处理后,获得样本数据集的描述媒体数据的拓扑序列和时间变化特性之间的映射关系的描述文件;
S103、基于动态贝叶斯网络,根据该描述文件对样本数据集进行多维特征向量采集,进而基于采集的多维特征向量,构建该样本数据集的多维特征库测试集;
S104、结合预先训练好的多维特征库验证集,将测试集与验证集进行交叉验证,并将验证成功的多维特征向量拟合为对应的特定几何结构后,执行步骤S108,反之判断迭代次数是否达到预设阈值,若是,则直接执行步骤S107;反之,针对验证不成功的多维特征向量,继续执行步骤S105和S106;
S105、基于隐马尔可夫推理,对验证不成功的多维特征向量中的结构特征进行结构学习,并采用非线性非接触式神经网络对学习得到的结构进行推理后,返回执行步骤S102;
S106、基于隐马尔可夫推理,对验证不成功的多维特征向量中的非结构特征进行模糊聚类后,采用基于时钟频率驱动-循环神经网络对聚类结果进行推理,构建新的测试集,进而返回执行步骤S104;
S107、将学习推理得到的结构以及模糊聚类获得的非结构特征进行关联后,标记为新的特定几何结构,更新多维特征库的验证集,并输出该新的特定几何结构后执行步骤S108;
S108、根据输出的特定几何结构,与预设格式的媒体资源匹配获得对应的可实时交互的模型数据。
5.根据权利要求4所述的基于多维特征识别的交互多媒体资源聚合方法,其特征在于,所述步骤S104中所述结合预先训练好的多维特征库验证集,将测试集与验证集进行交叉验证,并将验证成功的多维特征向量拟合为对应的特定几何结构的步骤,具体包括:
S1041、结合预先训练好的多维特征库验证集,将测试集与验证集进行空间拓扑结构的同胚检测,并在连续性时间区间进行频率同步性检测,对测试集中待拟合的多维特征向量进行一致性筛查,并将通过筛查的多维特征向量作为粗拟合多维特征向量;
S1042、基于动态贝叶斯网络,将粗拟合多维特征向量进行分形结构迭代拟合,进一步拟合获得细分的多维特征向量,在命中率和相关度达到匹配阈值后,结束迭代,拟合获得对应的特定几何结构。
6.根据权利要求1所述的基于多维特征识别的交互多媒体资源聚合方法,其特征在于,所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤,其具体为:
将模型数据与预设格式的媒体资源以增强现实方式深度融合,形成具有不同拟合精度、重构效果的交互多媒体资源;
所述预设格式的媒体资源是按照媒体资源的环境、特效、置换、基本参数中的至少一种参数进行聚类获得的,或者按照情境、气候、季节、自然地理条件中的至少一种自定义模板提取获得的。
7.根据权利要求1所述的基于多维特征识别的交互多媒体资源聚合方法,其特征在于,所述将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源的步骤之后,还包括步骤:
将交互多媒体资源通过有线网络或无线网络发送到作为资源重现载体的回放终端处融合为虚拟内容后,叠加显示、播放对应的画面。
8.根据权利要求7所述的基于多维特征识别的交互多媒体资源聚合方法,其特征在于,所述回放终端包括智能手机、计算机、平板电脑、智能电视、投影设备中的至少一种。
9.根据权利要求7所述的基于多维特征识别的交互多媒体资源聚合方法,其特征在于,所述虚拟内容包括图形、图像、音视频特效、音视频文件、文本文档、2D\3D动画、矢量动画、二维码\条形码、2D\3D模型、全景图像\视频、二维三维场景中的任意一种或采用其中两种以上的组合、叠加或形变。
10.基于多维特征识别的交互多媒体资源聚合系统,其特征在于,包括存储介质和处理器,所述存储介质中存储有至少一个指令,所述处理器用于加载所述至少一个指令并执行以下步骤:
实时获取媒体数据,并将实时获取的媒体数据构成样本数据集;
结合预先训练好的多维特征库验证集,对样本数据集进行基于动态贝叶斯网络的多维特征识别与反演拟合后,重构为可实时交互的模型数据;
将模型数据与预设格式的媒体资源以增强现实方式聚合为交互多媒体资源。
CN201710833855.6A 2017-09-15 2017-09-15 基于多维特征识别的交互多媒体资源聚合方法及系统 Active CN107729381B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710833855.6A CN107729381B (zh) 2017-09-15 2017-09-15 基于多维特征识别的交互多媒体资源聚合方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710833855.6A CN107729381B (zh) 2017-09-15 2017-09-15 基于多维特征识别的交互多媒体资源聚合方法及系统

Publications (2)

Publication Number Publication Date
CN107729381A true CN107729381A (zh) 2018-02-23
CN107729381B CN107729381B (zh) 2020-05-08

Family

ID=61206513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710833855.6A Active CN107729381B (zh) 2017-09-15 2017-09-15 基于多维特征识别的交互多媒体资源聚合方法及系统

Country Status (1)

Country Link
CN (1) CN107729381B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109894495A (zh) * 2019-01-11 2019-06-18 广东工业大学 一种基于能耗数据和贝叶斯网络的挤压机异常检测方法及系统
CN114329063A (zh) * 2021-10-29 2022-04-12 腾讯科技(深圳)有限公司 视频片段检测方法、装置以及设备
CN114329063B (zh) * 2021-10-29 2024-06-11 腾讯科技(深圳)有限公司 视频片段检测方法、装置以及设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103325048A (zh) * 2012-03-23 2013-09-25 上海凯哲信息科技有限公司 联网多媒体信息智能化发布控制系统
CN103531199A (zh) * 2013-10-11 2014-01-22 福州大学 基于快速稀疏分解和深度学习的生态声音识别方法
CN104541324A (zh) * 2013-05-01 2015-04-22 克拉科夫大学 一种使用动态贝叶斯网络模型的语音识别系统和方法
CN104950306A (zh) * 2015-06-25 2015-09-30 电子科技大学 一种海杂波背景下前视海面目标角超分辨成像方法
CN105229707A (zh) * 2013-03-22 2016-01-06 诺基亚技术有限公司 用于提供增强现实对象的信息的本地同步的方法和装置
CN105635716A (zh) * 2015-02-04 2016-06-01 苏州梦想人软件科技有限公司 基于增强现实的聚合媒体方法
CN106663411A (zh) * 2014-11-16 2017-05-10 易欧耐特感知公司 用于增强现实准备、处理和应用的系统和方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103325048A (zh) * 2012-03-23 2013-09-25 上海凯哲信息科技有限公司 联网多媒体信息智能化发布控制系统
CN105229707A (zh) * 2013-03-22 2016-01-06 诺基亚技术有限公司 用于提供增强现实对象的信息的本地同步的方法和装置
CN104541324A (zh) * 2013-05-01 2015-04-22 克拉科夫大学 一种使用动态贝叶斯网络模型的语音识别系统和方法
CN103531199A (zh) * 2013-10-11 2014-01-22 福州大学 基于快速稀疏分解和深度学习的生态声音识别方法
CN106663411A (zh) * 2014-11-16 2017-05-10 易欧耐特感知公司 用于增强现实准备、处理和应用的系统和方法
CN105635716A (zh) * 2015-02-04 2016-06-01 苏州梦想人软件科技有限公司 基于增强现实的聚合媒体方法
CN104950306A (zh) * 2015-06-25 2015-09-30 电子科技大学 一种海杂波背景下前视海面目标角超分辨成像方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DAVID WEIKERSDORFER 等: ""Event-based 3D SLAM with a depth-augmented dynamic vision sensor"", 《2014 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS & AUTOMATION (ICRA)》 *
倪小虹 等: ""融合多数据源的非平稳动态贝叶斯网络学习算法"", 《小型微型计算机系统》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109894495A (zh) * 2019-01-11 2019-06-18 广东工业大学 一种基于能耗数据和贝叶斯网络的挤压机异常检测方法及系统
CN109894495B (zh) * 2019-01-11 2020-12-22 广东工业大学 一种基于能耗数据和贝叶斯网络的挤压机异常检测方法及系统
CN114329063A (zh) * 2021-10-29 2022-04-12 腾讯科技(深圳)有限公司 视频片段检测方法、装置以及设备
CN114329063B (zh) * 2021-10-29 2024-06-11 腾讯科技(深圳)有限公司 视频片段检测方法、装置以及设备

Also Published As

Publication number Publication date
CN107729381B (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN107273502B (zh) 一种基于空间认知学习的图像地理标注方法
CN110188835B (zh) 基于生成式对抗网络模型的数据增强行人再识别方法
CN110399518A (zh) 一种基于图卷积的视觉问答增强方法
CA3069365A1 (en) Generation of point of interest copy
CN105574848A (zh) 用于对象的自动分割的方法和装置
CN110674925B (zh) 基于3d卷积神经网络的无参考vr视频质量评价方法
CN113192073A (zh) 基于交叉融合网络的服装语义分割方法
CN114170468B (zh) 文本识别方法、存储介质及计算机终端
CN113536856A (zh) 图像识别方法和系统、数据处理方法
CN115249306A (zh) 图像分割模型训练方法、图像处理方法、装置及存储介质
CN115546589B (zh) 一种基于图神经网络的图像生成方法
CN111046213B (zh) 一种基于图像识别的知识库构建方法
Li et al. Student behavior recognition for interaction detection in the classroom environment
CN109615576B (zh) 基于级联回归基学习的单帧图像超分辨重建方法
CN114610677A (zh) 一种转换模型的确定方法和相关装置
CN107729381A (zh) 基于多维特征识别的交互多媒体资源聚合方法及系统
Xu The research on applying artificial intelligence technology to virtual YouTuber
CN112069412A (zh) 信息推荐方法、装置、计算机设备及存储介质
CN103226818B (zh) 基于流形正则稀疏支撑回归的单帧图像超分辨率重建方法
Liu et al. Remote video detection algorithm of sports wrong actions under wireless network
CN115272667B (zh) 农田图像分割模型训练方法、装置、电子设备和介质
CN110826392A (zh) 一种结合上下文信息的跨模态行人检测方法
CN113628349B (zh) 基于场景内容自适应的ar导航方法、设备及可读存储介质
Tan et al. Unsupervised anomaly detection and localization with one model for all category
Meng et al. Distortion-aware room layout estimation from a single fisheye image

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant