CN101877223A - 影音编辑系统、方法及具有该影音编辑系统的电子设备 - Google Patents
影音编辑系统、方法及具有该影音编辑系统的电子设备 Download PDFInfo
- Publication number
- CN101877223A CN101877223A CN2009103019776A CN200910301977A CN101877223A CN 101877223 A CN101877223 A CN 101877223A CN 2009103019776 A CN2009103019776 A CN 2009103019776A CN 200910301977 A CN200910301977 A CN 200910301977A CN 101877223 A CN101877223 A CN 101877223A
- Authority
- CN
- China
- Prior art keywords
- sound
- indecency
- module
- image
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000003860 storage Methods 0.000 claims abstract description 37
- 238000001914 filtration Methods 0.000 claims abstract description 3
- 230000015654 memory Effects 0.000 claims description 8
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims 2
- 230000002349 favourable effect Effects 0.000 abstract 1
- 230000009471 action Effects 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 206010038743 Restlessness Diseases 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/036—Insert-editing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/22—Means responsive to presence or absence of recorded information signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44016—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
一种影音编辑系统,其用于影音内容的过滤,影音编辑系统包括样本存储器及处理器,样本存储器内存储有不雅声音样本,处理器包括:声音获取模块,用于从影音内容中获取声音;声音辨识模块,用于将获取的声音进行识别;声音对比模块,用于将识别出的声音与样本存储器内的不雅声音样本对比,判断是否存在不雅声音;声音编辑模块,用于当对比模块判断出存在不雅声音时,将不雅声音进行编辑。本发明提供的影音编辑系统可以对影音内容中不雅声音进行过滤,从而有利于保证影音内容的健康。另,本发明还提供一种影音编辑方法,及具有该影音编辑系统的电子设备。
Description
技术领域
本发明涉及一种影音编辑系统、方法及具有该影音编辑系统的电子设备。
背景技术
科技的进步为人们带来越来越多的便利。电子产品、信息产品已经与人们的生活结合的越来越紧密。而声音信息及图像信息的传递和记录也随着科技的发展变得越来越容易。但是,无论是播放的电视节目还是家庭录像中,偶尔会有些不雅的言语被播出或记录下来。这可能会造成小孩错误的示范或对小孩的言行产生不利的影响。而一般家庭在使用摄像机进行录音录像时,也可能会因录像中包含不雅的话语而造成一些具有纪念价值的影片无法与别人分享。
发明内容
有鉴于此,有必要提供一种可以对不雅的影音内容进行过滤的影音编辑系统、方法及具有该影音编辑系统的电子设备。
一种影音编辑系统,其用于影音内容的过滤,所述影音编辑系统包括样本存储器及处理器。所述样本存储器内存储有不雅声音样本,所述处理器包括:声音获取模块,用于从所述影音内容中获取声音;声音辨识模块,用于将获取的声音进行识别;声音对比模块,用于将识别出的声音与所述样本存储器内的不雅声音样本对比,判断是否存在不雅声音;声音编辑模块,用于当所述对比模块判断出存在不雅声音时,将不雅声音进行编辑。
一种影音编辑方法,该影音编辑方法根据预设的不雅声音样本,将影音内容中的不雅声音进行编辑。所述影音编辑方法包括以下步骤:获取影音内容中的声音;将获取的声音与不雅声音样本进行对比;若存在不雅声音,将不雅声音进行编辑。
一种电子设备,该电子设备包括可以输出影音数据的影音输出端。所述电子设备还包括样本存储器及处理器,所述样本存储器内存储有不雅声音样本,所述处理器与所述影音输出端电连接,所述处理器包括:声音获取模块,用于从所述影音内容中获取声音;声音辨识模块,用于将获取的声音进行识别;声音对比模块,用于将识别出的声音与所述样本存储器内的不雅声音样本对比,判断是否存在不雅声音;声音编辑模块,用于当所述对比模块判断出存在不雅声音时,将不雅声音进行编辑。
本发明提供的影音编辑系统、方法及具有该影音编辑系统的电子设备可以对影音内容中不雅声音进行过滤,从而有利于保证影音内容的健康。
附图说明
图1为本发明提供的电子设备的硬件架构图。
图2为图1的电子设备的影音编辑方法的流程图。
具体实施方式
请参见图1,为本发明实施方式提供的电子设备100,所述电子设备100可以是具有摄像功能的手机、具有摄像功能的掌上电脑、数码相机或数码摄像机等。本实施方式中,所述电子设备100为数码摄像机。所述电子设备100还可以是具有图像处理及存储功能的数字电视或网络电视等图像播放设备。
所述电子设备100包括影音输出端10、样本存储器20、影音存储器30、处理器40。所述影音输出端10用于输出影音数据。所述影音输出端10可以由影像感测器及麦克风组成,也可以由接收影音信号的接收装置、图像解码器组成。本实施方式中,所述电子设备100为数码摄像机。所述影音输出端10由影像感测器及麦克风组成。
所述样本存储器20内存储有不雅声音样本及不雅图像样本。本实施方式中,先利用语音识别技术,将大量不雅的字、词、句、声调等通过神经网络算法进行训练,从而提取各种不雅声音所具有的特征值,再将各种不雅声音的特征值作为不雅声音样本存储于所述样本存储器20内。对于不雅图像样本,是通过图像识别技术,将大量与不雅声音样本相对应的嘴、手势、文字等图形进行处理,从而提取各种不雅图像所具有的特征图形作为不雅图像样本存储于所述样本存储器20内。本实施方式中,所述样本存储器20内存储的不雅图像样本是与不雅声音信息对应的嘴形。
所述影音存储器30用于存储录制及编辑过的影音数据。
所述处理器40包括声音获取模块41、声音辨识模块42、声音对比模块43、声音编辑模块44、图像获取模块45、时间段模块46、图像辨识模块47、图像对比模块48、图像编辑模块49及存储模块50。
所述声音获取模块41用于从影音数据中获取声音。本实施方式中,所述获取模块41用于从影音输出端10获取声音数据。
声音辨识模块42用于将获取的声音进行识别。本实施方式中,所述声音辨识模块42利用端点侦测技术判断所述获取模块41获取的声音数据中哪些区段是有声段,那些是属于无声段或背景噪声。当找到有声段后,所述声音辨识模块42利用强波处理技术补偿语音讯号中浊音讯号的衰减,以提高辨识的准确率,然后利用数字滤波器组来处理语音讯号,将每个滤波器的频谱能量值利用线性倒频谱系数转换成为声音的特征值。
所述声音对比模块43用于将识别出的声音与所述存储器内的不雅声音样本对比,判断是否存在不雅声音。本实施方式中,所述声音对比模块43将所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值进行对比,根据特征值是否相同来判断获取的声音数据中是否存在不雅声音。
所述声音编辑模块44用于当所述声音对比模块43判断出存在不雅声音时,将不雅声音进行编辑。本实施方式中,若所述声音对比模块43判断出所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值相同,所述声音编辑模块42将对不雅声音进行编辑。所述声音编辑模块42可以将不雅声音进行替换或删除。本实施方式中,当所述声音对比模块43判断出存在不雅的言语时,所述声音编辑模块44就将包含不雅声音的数据进行删除。当所述声音编辑模块42需要将不雅声音进行替换时,所述声音编辑模块42内应预先存有替换声音,例如“哔哔”声。当存在不雅的言语时,所述声音编辑模块44就将包含不雅声音的数据利用替换声音进行替换。
有时,不雅声音存在的场景中也会存在不希望看到的动作或景象,例如嘴、手势及暴露的衣着等。当发现存在不雅声音时,将利用图像获取模块45、时间段模块46、图像辨识模块47、图像对比模块48及图像编辑模块49对存在不雅声音的时间段内的不雅图像进行编辑。
所述图像获取模块45用于从所述影音内容中获取图像。本实施方式中,所述图像获取模块45在所述声音获取模块41获取声音时,从所述影音输出端10获取图像数据。
所述时间段模块46用于获取存在不雅声音的时间段。本实施方式中,所述时间段模块46直接利用所述声音辨识模块42辨识出存在不雅声音的时间段。
所述图像辨识模块47用于获取图像中的特征图形。本实施方式中,所述图像辨识模块47是用于辨识人的嘴部。所述图像辨识模块47首先利用人脸识别技术从所述图像获取模块45获取的图像数据中侦测出人脸。然后在人脸上找出嘴巴的区域,为了处理方便,可以将彩色影像转换成灰阶影像。接着依照适应性临界值法,将嘴巴依照灰阶值的比例作二值化。再经过形态学的闭合运算,将很接近的黑色部位连接起来。最后运用连同成分标示法,找出图像中所有的区域,并经过比对后找出最大区域作为嘴巴的特征图形。
所述图像对比模块48用于所述图像辨识模块47获取的特征图形与所述样本存储器20中存储的图像样本进行对比。本实施方式中,所述图像对比模块47将所述图像辨识模块47获取的嘴巴特征图形与所述样本存储器20中存储的嘴巴样本进行对比。若相符合,则认定获取的图像中存在嘴巴。由于言语由嘴发出,当出现不雅的言语时,嘴巴往往会有开合动作。本实施方式中,所述图像对比模块48还包括动作模块481,所述动作模块481用于判断识别出的嘴巴是否在不雅语言出现时产生变化。本实施方式中,所述动作模块481判断的嘴巴边缘是否产生变形,当所述动作模块481判断出嘴巴不雅语言出现时产生变形时,则对嘴巴进行编辑。当然,若是手势、文字等不易变动的图形,则可以无需判断图像是否产生变形,只需找到与不雅图像样本相符的图形即可。
所述图像编辑模块49用于根据图像辨识模块47的对比结果,对图像进行编辑。所述图像编辑模块49既可以删除图像也可以对图像进行修改。当所述图像编辑模块49需要删除图像时,根据时间段模块46获取的存在不雅声音的时间,删除对应时间的图像数据。当图像编辑模块49需要对图像做修改时,可以预先存储可以替换的图形,或利用图像编辑程序做图像变形,马赛克等。当存在不雅图像时,利用替换图形覆盖到不雅图形上,或将不雅图形进行图像变形,马赛克编辑等。所述本实施方式中,所述图像编辑模块49对嘴巴部位添加马赛克。
所述存储模块50用于将编辑过的声音、图像存储到所述影音存储器30中。
请参阅图2,为本发明实施方式提供的影音编辑的流程图。
步骤S110:获取影音内容中的声音及图像。本实施方式中,所述获取模块41用于从所述影音输出端10中获取图像数据及声音数据。
步骤S115:从所述获取的声音信息中提取声音的特征。本实施方式中,所述声音辨识模块42利用端点侦测技术对所述获取模块41判断所述获取模块41获取的声音数据中哪些区段是有声段,那些是属于无声段或背景噪声。当找到有声段后,所述声音辨识模块42利用强波处理技术补偿语音讯号中浊音讯号的衰减,以提高辨识的准确率,然后利用数字滤波器组来处理语音讯号,将每个滤波器的频谱能量值利用线性倒频谱系数转换成为声音的特征值。
步骤S120:将获取的声音的特征与不雅声音样本进行对比是否相同。本实施方式中,所述声音对比模块43将所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值进行对比,以判断获取的声音数据中是否存在不雅声音。
步骤S125:根据对比结果将与所述不雅声音样本相符的声音进行编辑。本实施方式中,若所述声音对比模块43判断出所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值相同,所述声音编辑模块42将对不雅声音进行编辑。所述声音编辑模块42可以将不雅声音进行替换或删除。本实施方式中,当所述声音对比模块43判断出存在不雅的言语时,所述声音编辑模块44就将包含不雅声音的数据进行删除。当所述声音编辑模块42需要将不雅声音进行替换时,所述声音编辑模块42内应预先存有替换声音,例如“哔哔”声。当存在不雅的言语时,所述声音编辑模块44就将包含不雅声音的数据利用替换声音进行替换。
步骤S130:获取与所述不雅声音样本相符的声音信息的时间段。本实施方式中,所述时间段模块46直接利用所述声音辨识模块42辨识出存在不雅声音的时间段。
步骤S135:获取在所述不雅声音对应时间段内图像的特征图形。利用所述图像辨识模块47将存在不雅声音的时间段的图像与不雅图像样本对比,判断是否存在不雅图像。本实施方式中,所述图像辨识模块47是用于辨识人的嘴部。所述图像辨识模块47首先利用人脸识别技术从所述图像获取模块45获取的图像数据中侦测出人脸。然后在人脸上找出嘴巴的区域,为了处理方便,可以将彩色影像转换成灰阶影像。接着依照适应性临界值法,将嘴巴依照灰阶值的比例作二值化。再经过形态学的闭合运算,将很接近的黑色部位连接起来。最后运用连同成分标示法,找出图像中所有的区域,并经过比对后找出最大区域作为嘴巴的特征图形。所述图像辨识模块47再将该区域与所述样本存储器20中存储的嘴巴样本进行对比。若相符合,则认定获取的图像中存在嘴巴。由于言语由嘴发出,当出现不雅的言语时,嘴巴往往会有开合动作。
步骤S140:将获取的特征图形与不雅图像样本进行对比。本实施方式中,所述图像对比模块47将所述图像辨识模块47获取的嘴巴特征图形与所述样本存储器20中存储的嘴巴样本进行对比。若相符合,则认定获取的图像中存在嘴巴。
步骤S145:判断与所述不雅图像样本相符的特征图形是否变形。由于言语由嘴发出,当出现不雅的言语时,嘴巴往往会有开合动作。本实施方式中,所述图像对比模块48还包括动作模块481,所述动作模块481用于判断识别出的嘴巴是否在不雅语言出现时产生变化。本实施方式中,所述动作模块481判断的嘴巴边缘是否产生变形,当所述动作模块481判断出嘴巴不雅语言出现时产生变形时,则对嘴巴进行编辑。当然,若是手势、文字等不易变动的图形,则可以无需判断图像是否产生变形,只需找到与不雅图像样本相符的图形即可,可以无需此步骤。
步骤S150:根据对比结果将与所述不雅图像样本相符的图像进行编辑。所述图像编辑模块49用于根据图像辨识模块47的对比结果,对图像进行编辑。所述图像编辑模块49既可以删除图像也可以对图像进行修改。当所述图像编辑模块49需要删除图像时,根据时间段模块46获取的存在不雅声音的时间,删除对应时间的图像数据。当图像编辑模块49需要对图像做修改时,可以预先存储可以替换的图形,或利用图像编辑程序做图像变形,马赛克等。当存在不雅图像时,利用替换图形覆盖到不雅图形上,或将不雅图形进行图像变形,马赛克编辑等。所述本实施方式中,所述图像编辑模块49对嘴巴部位添加马赛克。
步骤S155:将编辑完的影音内容进行存储。本实施方式中,所述存储模块50将编辑过的声音及图像保存到所述影音存储器30内。
在步骤S120中,若声音对比模块43判断出获取的声音的特征值与所述样本存储器20内不雅声音样本的特征值不同,则返回到所述步骤S110重新获取声音数据及图像数据。
在步骤S140中,若获取的特征图形与不雅图像样本不同。则不再对图像进行处理,直接转到步骤S155。
在步骤S145中,若与所述不雅图像样本相符的特征图形不存在变形,则不再对图像进行处理,直接转到步骤S155。
本发明提供的影音编辑系统可以对影音内容中不雅声音进行过滤,从而有利于保证影音内容的健康。
本技术领域的普通技术人员应当认识到,以上的实施方式仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围之内,对以上实施方式所作的适当改变和变化都落在本发明要求保护的范围之内。
Claims (13)
1.一种影音编辑系统,其用于影音内容的过滤,所述影音编辑系统包括样本存储器及处理器,其特征在于,所述样本存储器内存储有不雅声音样本,所述处理器包括:
声音获取模块,用于从所述影音内容中获取声音;
声音辨识模块,用于将获取的声音进行识别;
声音对比模块,用于将识别出的声音与所述存储器内的不雅声音样本对比,判断是否存在不雅声音;
声音编辑模块,用于当所述声音对比模块判断出存在不雅声音时,将不雅声音进行编辑。
2.如权利要求1所述的影音编辑系统,所述样本存储器内还存有不雅图象样本,所述处理器还包括:图像获取模块,时间段模块,图像辨识模块、图像对比模块及图像编辑模块,所述图像获取模块用于从所述影音内容中获取图像;所述时间段模块用于获取存在不雅声音的时间段;所述图像辨识模块用于获取图像中的特征图形;所述图像对比模块用于将所述图像辨识模块获取的特征图形与所述样本存储器中存储的图像样本进行对比,所述图像编辑模块用于当所述图像对比模块判断出存在不雅图像时,将不雅图像进行编辑。
3.如权利要求1所述的影音编辑系统,其特征在于,所述声音编辑模块内预设有替换声音,当存在不雅声音时,所述声音编辑模块对不雅声音的编辑是利用替换声音替换不雅声音。
4.如权利要求1所述的影音编辑系统,其特征在于,所述声音编辑模块对声音的编辑是将不雅声音删除。
5.如权利要求2所述的影音编辑系统,其特征在于,所述图像编辑模块内预设有替换图,当存在不雅图像时,所述图像编辑模块对图像的编辑是利用替换图覆盖不雅图像。
6.如权利要求2所述的影音编辑系统,其特征在于,所述图像编辑模块对图像的编辑是将不雅图像删除。
7.一种影音编辑方法,该影音编辑方法根据预设的不雅声音样本,将影音内容中的不雅声音进行编辑,所述影音编辑方法包括以下步骤:
获取影音内容中的声音;
将获取的声音与不雅声音样本进行对比;
若存在不雅声音,将不雅声音进行编辑。
8.如权利要求7所述的影音编辑方法,其特征在于,在不雅声音进行编辑的步骤中,对不雅声音进行替换或删除处理。
9.如权利要求7所述的影音编辑方法,其特征在于,所述影音编辑方法还根据预设的不雅图像样本,将影音内容中的不雅图像进行编辑,所述影音编辑方法还包括以下步骤:在获取影音内容中的声音的同时获取图像;若存在不雅声音,获取不雅声音所在的时间段;将不雅声音所在时间段的图像与不雅图像样本进行对比;若存在不雅图像,将不雅图像进行编辑。
10.如权利要求9所述的影音编辑方法,其特征在于,在将不雅图像进行编辑的步骤中,对不雅图像进行替换或删除处理。
11.一种电子设备,该电子设备包括可以输出影音数据的影音输出端,其特征在于,所述电子设备还包括样本存储器及处理器,所述样本存储器内存储有不雅声音样本,所述处理器与所述影音输出端电连接,所述处理器包括:
声音获取模块,用于从所述影音内容中获取声音;
声音辨识模块,用于将获取的声音进行识别;
声音对比模块,用于将识别出的声音与所述样本存储器内的不雅声音样本对比,判断是否存在不雅声音;
声音编辑模块,用于当所述声音对比模块判断出存在不雅声音时,将不雅声音进行编辑。
12.如权利要求11所述的电子设备,其特征在于,该电子设备是摄像设备或影音播放设备。
13.如权利要求11所述的电子设备,其特征在于,所述样本存储器内还存有不雅图象样本,所述处理器还包括图像获取模块,时间段模块,图像辨识模块、图像对比模块及图像编辑模块,所述图像获取模块用于从所述影音内容中获取图像;所述时间段模块用于获取存在不雅声音的时间段;所述图像辨识模块用于获取图像中的特征图形;所述图像对比模块用于将所述图像辨识模块获取的特征图形与所述样本存储器中存储的图像样本进行对比,所述图像编辑模块用于当所述图像对比模块判断出存在不雅图像时,将不雅图像进行编辑。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009103019776A CN101877223A (zh) | 2009-04-29 | 2009-04-29 | 影音编辑系统、方法及具有该影音编辑系统的电子设备 |
US12/641,334 US8615153B2 (en) | 2009-04-29 | 2009-12-18 | Multi-media data editing system, method and electronic device using same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009103019776A CN101877223A (zh) | 2009-04-29 | 2009-04-29 | 影音编辑系统、方法及具有该影音编辑系统的电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101877223A true CN101877223A (zh) | 2010-11-03 |
Family
ID=43019759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009103019776A Pending CN101877223A (zh) | 2009-04-29 | 2009-04-29 | 影音编辑系统、方法及具有该影音编辑系统的电子设备 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8615153B2 (zh) |
CN (1) | CN101877223A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104934043A (zh) * | 2015-06-17 | 2015-09-23 | 广东欧珀移动通信有限公司 | 音频处理方法及装置 |
CN106165017A (zh) * | 2014-02-07 | 2016-11-23 | 高通科技公司 | 允许在图像记录或显示之前进行场景相关图像修改的即时场景识别 |
CN109545200A (zh) * | 2018-10-31 | 2019-03-29 | 深圳大普微电子科技有限公司 | 编辑语音内容的方法及存储装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9426385B2 (en) * | 2014-02-07 | 2016-08-23 | Qualcomm Technologies, Inc. | Image processing based on scene recognition |
AU2018422752A1 (en) * | 2018-05-10 | 2020-12-03 | Axon Enterprise, Inc. | Systems and methods for cross-redaction |
US11823713B1 (en) * | 2022-10-03 | 2023-11-21 | Bolt-On Ip Solutions, Llc | System and method for editing an audio stream |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5764852A (en) * | 1994-08-16 | 1998-06-09 | International Business Machines Corporation | Method and apparatus for speech recognition for distinguishing non-speech audio input events from speech audio input events |
US5986692A (en) * | 1996-10-03 | 1999-11-16 | Logan; James D. | Systems and methods for computer enhanced broadcast monitoring |
US5870708A (en) * | 1996-10-10 | 1999-02-09 | Walter S. Stewart | Method of and apparatus for scanning for and replacing words on video cassettes |
US8949878B2 (en) | 2001-03-30 | 2015-02-03 | Funai Electric Co., Ltd. | System for parental control in video programs based on multimedia content information |
US8245252B2 (en) * | 2002-09-10 | 2012-08-14 | Caption Tv, Inc. | System, method, and computer program product for selective replacement of objectionable program content with less-objectionable content |
CA2622744C (en) * | 2005-09-16 | 2014-09-16 | Flixor, Inc. | Personalizing a video |
CN101030369B (zh) | 2007-03-30 | 2011-06-29 | 清华大学 | 基于子词隐含马尔可夫模型的嵌入式语音识别方法 |
-
2009
- 2009-04-29 CN CN2009103019776A patent/CN101877223A/zh active Pending
- 2009-12-18 US US12/641,334 patent/US8615153B2/en not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106165017A (zh) * | 2014-02-07 | 2016-11-23 | 高通科技公司 | 允许在图像记录或显示之前进行场景相关图像修改的即时场景识别 |
CN111326183A (zh) * | 2014-02-07 | 2020-06-23 | 高通科技公司 | 用于处理时间图像序列的系统和方法 |
CN104934043A (zh) * | 2015-06-17 | 2015-09-23 | 广东欧珀移动通信有限公司 | 音频处理方法及装置 |
CN109545200A (zh) * | 2018-10-31 | 2019-03-29 | 深圳大普微电子科技有限公司 | 编辑语音内容的方法及存储装置 |
Also Published As
Publication number | Publication date |
---|---|
US8615153B2 (en) | 2013-12-24 |
US20100278505A1 (en) | 2010-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103035247B (zh) | 基于声纹信息对音频/视频文件进行操作的方法及装置 | |
CN101877223A (zh) | 影音编辑系统、方法及具有该影音编辑系统的电子设备 | |
JP4441879B2 (ja) | 信号処理装置および方法、プログラム、並びに記録媒体 | |
US8494338B2 (en) | Electronic apparatus, video content editing method, and program | |
CN101647265B (zh) | 在视频中自动检测、移除、替换和标记闪光帧 | |
CN110149548B (zh) | 视频配音方法、电子装置和可读存储介质 | |
CN104580888B (zh) | 一种图像处理方法及终端 | |
CN111556254A (zh) | 利用视频内容进行视频切割的方法、系统、介质及智能设备 | |
EP1213915A2 (en) | Video and audio recording | |
CN101373482B (zh) | 信息处理设备和信息处理方法 | |
KR20140114238A (ko) | 오디오와 결합된 이미지 표시 방법 | |
Matthews et al. | Audiovisual speech recognition using multiscale nonlinear image decomposition | |
CN103186780B (zh) | 视频字幕识别方法及装置 | |
CN110148418B (zh) | 一种场景记录分析系统、方法及其装置 | |
US9058384B2 (en) | System and method for identification of highly-variable vocalizations | |
WO2017166483A1 (zh) | 一种动态图片处理方法及系统 | |
CN105373705A (zh) | 一种自动采集生活数据的方法、装置及设备 | |
CN114120969A (zh) | 智能终端的语音识别功能测试方法、系统、电子设备 | |
CN111615008A (zh) | 基于多设备体验的智能摘要生成和字幕阅读系统 | |
CN110089123B (zh) | 录制方法、解码器盒及存储装置 | |
CN114554268B (zh) | 音视频数据的处理方法及装置、电子设备、存储介质 | |
Umamaheswaran et al. | Caption positioning structure for hard of hearing people using deep learning method | |
CN113990297A (zh) | 一种基于enf的音频篡改识别方法 | |
TWI385646B (zh) | 影音編輯系統、方法及具有該影音編輯系統的電子設備 | |
CN115700880A (zh) | 一种行为监测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20101103 |