CN202502737U - 一种视音频信息的智能编辑系统 - Google Patents

一种视音频信息的智能编辑系统 Download PDF

Info

Publication number
CN202502737U
CN202502737U CN2012200892946U CN201220089294U CN202502737U CN 202502737 U CN202502737 U CN 202502737U CN 2012200892946 U CN2012200892946 U CN 2012200892946U CN 201220089294 U CN201220089294 U CN 201220089294U CN 202502737 U CN202502737 U CN 202502737U
Authority
CN
China
Prior art keywords
text
video
audio
editing
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2012200892946U
Other languages
English (en)
Inventor
李海峰
袁玉平
张玮
张成鹤
马琳
许凤叶
芮志湘
陶培亚
张田
李嵩
高畅
曹振中
韩文静
孙佳音
韦秋华
蒋瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SECOND DEPARTMENT OF JINAN MILITARY REGION HEADQUARTERS PLA
Original Assignee
SECOND DEPARTMENT OF JINAN MILITARY REGION HEADQUARTERS PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SECOND DEPARTMENT OF JINAN MILITARY REGION HEADQUARTERS PLA filed Critical SECOND DEPARTMENT OF JINAN MILITARY REGION HEADQUARTERS PLA
Priority to CN2012200892946U priority Critical patent/CN202502737U/zh
Application granted granted Critical
Publication of CN202502737U publication Critical patent/CN202502737U/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)

Abstract

本实用新型提供一种视音频信息的智能编辑系统,技术方案包括文本提取模块,文本关联模块和视音频编辑模块。其中,文本提取模块利用模式识别手段,提取视音频信息中所包含的文字信息,并将文字信息形成文本和视音频信息一起输出至文本关联模块。文本关联模块,将文本与视音频信息中对应的音频、视频关联在一起,使三者保持同步;文本关联模块将关联后的文本、视频和音频输出至视音频编辑模块。视音频编辑模块实现的功能是,根据需要对文本进行编辑时,由文本的编辑结果,同步实现视频和音频编辑结果,形成需要的视音频成品信息。本实用新型提出了根据文本内容对视音频进行编辑的概念,使音视频编辑的过程更加智能化、自动化。

Description

一种视音频信息的智能编辑系统
技术领域
本实用新型属于多媒体信息处理领域,涉及一种音视频的内容分析编辑系统。
背景技术
多源海量的视音频信息需要进行实时监控,并需要将感兴趣的音视频进行分类、检出及重新编辑。目前的各种视音频信息处理系统,仅能够对音视频信息进行编辑处理。而根据音视频内容进行编辑的工作,则主要由人工完成,这需要大量人力、物力和财力。
总之,现有的音视频信息处理系统严重依赖人工,效率低下、可利用程度低,多元信息整合能力弱,缺乏简便的视音频编辑手段,存在资料搜索难、自动分析水平低等缺点。
实用新型内容
本实用新型提供了一种根据视音频信息的内容对视音频信息进行编辑的系统。该系统能够解决传统的视音频信息处理过程对人工的依赖性高及处理速度慢的缺点。
本实用新型的技术方案是,一种视音频信息的智能编辑系统,其特征在于,包括文本提取模块,文本关联模块和视音频编辑模块。其中,文本提取模块利用模式识别手段,提取视音频信息中所包含的文字信息,并将文字信息形成文本和视音频信息一起输出至文本关联模块。文本关联模块,将文本与视音频信息中对应的音频、视频关联在一起,使三者处于同一条时间线的不同信息轨道中,并保持同步;文本关联模块将关联后的文本、视频和音频输出至视音频编辑模块。视音频编辑模块实现的功能是,根据需要对文本进行编辑时,由文本的编辑结果,同步实现视频和音频编辑结果,形成需要的视音频成品信息。
本实用新型的有益效果是:本实用新型提供的视音频信息的智能编辑系统,提出了根据文本内容对视音频进行编辑的概念,使音视频编辑的过程更加智能化、自动化。通过视频、音频、文本三者的关联保持同步,保证了编辑的准确性。本实用新型能够实现对视音频信息的自动分析和整编处理,无需人工识别,减少了对人力的依赖,同时提高了处理速度。能全方位的获取视音频信息,同时保证了处理的实时性。
附图说明:
图1为本实用新型提供的系统原理结构示意图。
具体实施方式:
下面结合附图详细叙述本实用新型的实施例。
本实用新型提供的视音频信息的智能编辑系统,以计算机系统为硬件平台,该硬件平台能够进行视频、音频和文本三种信息形式的输入和输出,结合软件实现文本提取模块,文本关联模块和视音频编辑模块。其中,文本提取模块接受视音频信息的输入,利用模式识别手段,提取视音频信息中所包含的文字信息,并将文字信息形成文本和视音频信息一起输出至关联模块。比如,利用语音识别技术提取音频信息中的文字信息,并将其形成文本。再比如,利用OCR(Optical Character Recognition,光学字符识别)技术提取视频信息中的文字信息,并将其形成文本。文本关联模块将文本与视音频信息中对应的音频、视频关联在一起,使三者处于同一条时间线的不同信息轨道中,并保持同步;因为生成的文本从视音频信息中提出,因此可知文本中每个文字在音频、视频中对应的时刻,从而可将三者同步;文本关联模块将关联后的文本、视频和音频输出至视音频编辑模块。视音频编辑模块接收用户对文本的编辑,并且视音频编辑模块保存用户对文本的编辑结果,根据文本、音频、视频三者的关联关系,对应实现视频和音频的相应编辑处理,最终形成需要的视音频成品信息。对本领域的技术人员而言,利用现有硬件技术基础和软件工具,再通过软件编程,即可实现上述系统的三个模块,从而构成本发明提供的系统。

Claims (1)

1.一种视音频信息的智能编辑系统,其特征在于,包括文本提取模块,文本关联模块和视音频编辑模块;其中,文本提取模块利用模式识别手段,提取视音频信息中所包含的文字信息,并将文字信息形成文本和视音频信息一起输出至文本关联模块;文本关联模块,将文本与视音频信息中对应的音频、视频关联在一起,使三者处于同一条时间线的不同信息轨道中,并保持同步;文本关联模块将关联后的文本、视频和音频输出至视音频编辑模块;视音频编辑模块实现的功能是,根据需要对文本进行编辑时,由文本的编辑结果,同步实现视频和音频编辑结果,形成需要的视音频成品信息。
CN2012200892946U 2012-03-12 2012-03-12 一种视音频信息的智能编辑系统 Expired - Fee Related CN202502737U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012200892946U CN202502737U (zh) 2012-03-12 2012-03-12 一种视音频信息的智能编辑系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012200892946U CN202502737U (zh) 2012-03-12 2012-03-12 一种视音频信息的智能编辑系统

Publications (1)

Publication Number Publication Date
CN202502737U true CN202502737U (zh) 2012-10-24

Family

ID=47039345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012200892946U Expired - Fee Related CN202502737U (zh) 2012-03-12 2012-03-12 一种视音频信息的智能编辑系统

Country Status (1)

Country Link
CN (1) CN202502737U (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9870128B1 (en) * 2013-02-19 2018-01-16 Audible, Inc. Rule-based presentation of related content items
CN111445927A (zh) * 2020-03-11 2020-07-24 维沃软件技术有限公司 一种音频处理方法及电子设备
WO2023287360A3 (zh) * 2021-07-15 2023-04-13 脸萌有限公司 多媒体处理方法、装置、电子设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9870128B1 (en) * 2013-02-19 2018-01-16 Audible, Inc. Rule-based presentation of related content items
CN111445927A (zh) * 2020-03-11 2020-07-24 维沃软件技术有限公司 一种音频处理方法及电子设备
WO2021179991A1 (zh) * 2020-03-11 2021-09-16 维沃移动通信有限公司 音频处理方法及电子设备
WO2023287360A3 (zh) * 2021-07-15 2023-04-13 脸萌有限公司 多媒体处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN103414949B (zh) 一种基于智能电视的多媒体编辑系统与方法
CN106340291A (zh) 一种双语字幕制作方法及系统
CN103856689B (zh) 面向新闻视频的人物对话字幕提取方法
CN106162293B (zh) 一种视频声音与图像同步的方法及装置
GB2523496A (en) Systems and methods for computer assisted dispatch, incident report-based video search and tagging
CN103456314A (zh) 一种情感识别方法以及装置
CN109064532B (zh) 动画角色自动口型生成方法及装置
CN105245917A (zh) 一种多媒体语音字幕生成的系统和方法
CN110012349A (zh) 一种端到端的新闻节目结构化方法及其结构化框架体系
CN104484656A (zh) 基于深度学习的唇语识别唇形模型库构建方法
CN202502737U (zh) 一种视音频信息的智能编辑系统
CN104504088A (zh) 一种用于唇语识别的唇形模型库构建方法
CN103700370A (zh) 一种广播电视语音识别系统方法及系统
CN105244026A (zh) 一种语音处理方法及装置
CN101159834A (zh) 一种重复性视频音频节目片段的检测方法和系统
CN104538034A (zh) 一种语音识别方法及系统
CN104537358A (zh) 基于深度学习的唇语识别唇形训练数据库的生成方法
CN105336329A (zh) 一种语音处理方法及系统
CN105227966A (zh) 电视播放控制方法、服务器及电视播放控制系统
CN112002328A (zh) 一种字幕生成方法、装置及计算机存储介质、电子设备
CN101833982A (zh) 一种通过特定语音触发的法庭庭审音频文件实时标引方法
CN106921893A (zh) 一种基于年龄段的广告推送方法
CN103916677A (zh) 一种广告视频识别方法和装置
WO2009041772A3 (en) Method and system for creating report using object-oriented program
CN204760038U (zh) 具有录音和文本记录功能的录音笔

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121024

Termination date: 20130312