CN202502737U

CN202502737U - 一种视音频信息的智能编辑系统

Info

Publication number: CN202502737U
Application number: CN2012200892946U
Authority: CN
Inventors: 李海峰; 袁玉平; 张玮; 张成鹤; 马琳; 许凤叶; 芮志湘; 陶培亚; 张田; 李嵩; 高畅; 曹振中; 韩文静; 孙佳音; 韦秋华; 蒋瑞
Original assignee: SECOND DEPARTMENT OF JINAN MILITARY REGION HEADQUARTERS PLA
Current assignee: SECOND DEPARTMENT OF JINAN MILITARY REGION HEADQUARTERS PLA
Priority date: 2012-03-12
Filing date: 2012-03-12
Publication date: 2012-10-24
Anticipated expiration: 2022-03-12

Abstract

本实用新型提供一种视音频信息的智能编辑系统，技术方案包括文本提取模块，文本关联模块和视音频编辑模块。其中，文本提取模块利用模式识别手段，提取视音频信息中所包含的文字信息，并将文字信息形成文本和视音频信息一起输出至文本关联模块。文本关联模块，将文本与视音频信息中对应的音频、视频关联在一起，使三者保持同步；文本关联模块将关联后的文本、视频和音频输出至视音频编辑模块。视音频编辑模块实现的功能是，根据需要对文本进行编辑时，由文本的编辑结果，同步实现视频和音频编辑结果，形成需要的视音频成品信息。本实用新型提出了根据文本内容对视音频进行编辑的概念，使音视频编辑的过程更加智能化、自动化。

Description

一种视音频信息的智能编辑系统

技术领域

本实用新型属于多媒体信息处理领域，涉及一种音视频的内容分析编辑系统。

背景技术

多源海量的视音频信息需要进行实时监控，并需要将感兴趣的音视频进行分类、检出及重新编辑。目前的各种视音频信息处理系统，仅能够对音视频信息进行编辑处理。而根据音视频内容进行编辑的工作，则主要由人工完成，这需要大量人力、物力和财力。

总之，现有的音视频信息处理系统严重依赖人工，效率低下、可利用程度低，多元信息整合能力弱，缺乏简便的视音频编辑手段，存在资料搜索难、自动分析水平低等缺点。

实用新型内容

本实用新型提供了一种根据视音频信息的内容对视音频信息进行编辑的系统。该系统能够解决传统的视音频信息处理过程对人工的依赖性高及处理速度慢的缺点。

本实用新型的技术方案是，一种视音频信息的智能编辑系统，其特征在于，包括文本提取模块，文本关联模块和视音频编辑模块。其中，文本提取模块利用模式识别手段，提取视音频信息中所包含的文字信息，并将文字信息形成文本和视音频信息一起输出至文本关联模块。文本关联模块，将文本与视音频信息中对应的音频、视频关联在一起，使三者处于同一条时间线的不同信息轨道中，并保持同步；文本关联模块将关联后的文本、视频和音频输出至视音频编辑模块。视音频编辑模块实现的功能是，根据需要对文本进行编辑时，由文本的编辑结果，同步实现视频和音频编辑结果，形成需要的视音频成品信息。

本实用新型的有益效果是：本实用新型提供的视音频信息的智能编辑系统，提出了根据文本内容对视音频进行编辑的概念，使音视频编辑的过程更加智能化、自动化。通过视频、音频、文本三者的关联保持同步，保证了编辑的准确性。本实用新型能够实现对视音频信息的自动分析和整编处理，无需人工识别，减少了对人力的依赖，同时提高了处理速度。能全方位的获取视音频信息，同时保证了处理的实时性。

附图说明：

图1为本实用新型提供的系统原理结构示意图。

具体实施方式：

下面结合附图详细叙述本实用新型的实施例。

本实用新型提供的视音频信息的智能编辑系统，以计算机系统为硬件平台，该硬件平台能够进行视频、音频和文本三种信息形式的输入和输出，结合软件实现文本提取模块，文本关联模块和视音频编辑模块。其中，文本提取模块接受视音频信息的输入，利用模式识别手段，提取视音频信息中所包含的文字信息，并将文字信息形成文本和视音频信息一起输出至关联模块。比如，利用语音识别技术提取音频信息中的文字信息，并将其形成文本。再比如，利用OCR(Optical Character Recognition，光学字符识别)技术提取视频信息中的文字信息，并将其形成文本。文本关联模块将文本与视音频信息中对应的音频、视频关联在一起，使三者处于同一条时间线的不同信息轨道中，并保持同步；因为生成的文本从视音频信息中提出，因此可知文本中每个文字在音频、视频中对应的时刻，从而可将三者同步；文本关联模块将关联后的文本、视频和音频输出至视音频编辑模块。视音频编辑模块接收用户对文本的编辑，并且视音频编辑模块保存用户对文本的编辑结果，根据文本、音频、视频三者的关联关系，对应实现视频和音频的相应编辑处理，最终形成需要的视音频成品信息。对本领域的技术人员而言，利用现有硬件技术基础和软件工具，再通过软件编程，即可实现上述系统的三个模块，从而构成本发明提供的系统。

Claims

1.一种视音频信息的智能编辑系统，其特征在于，包括文本提取模块，文本关联模块和视音频编辑模块；其中，文本提取模块利用模式识别手段，提取视音频信息中所包含的文字信息，并将文字信息形成文本和视音频信息一起输出至文本关联模块；文本关联模块，将文本与视音频信息中对应的音频、视频关联在一起，使三者处于同一条时间线的不同信息轨道中，并保持同步；文本关联模块将关联后的文本、视频和音频输出至视音频编辑模块；视音频编辑模块实现的功能是，根据需要对文本进行编辑时，由文本的编辑结果，同步实现视频和音频编辑结果，形成需要的视音频成品信息。