CN101877223A - 影音编辑系统、方法及具有该影音编辑系统的电子设备 - Google Patents

影音编辑系统、方法及具有该影音编辑系统的电子设备 Download PDF

Info

Publication number
CN101877223A
CN101877223A CN2009103019776A CN200910301977A CN101877223A CN 101877223 A CN101877223 A CN 101877223A CN 2009103019776 A CN2009103019776 A CN 2009103019776A CN 200910301977 A CN200910301977 A CN 200910301977A CN 101877223 A CN101877223 A CN 101877223A
Authority
CN
China
Prior art keywords
sound
indecency
module
image
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009103019776A
Other languages
English (en)
Inventor
吴全峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN2009103019776A priority Critical patent/CN101877223A/zh
Priority to US12/641,334 priority patent/US8615153B2/en
Publication of CN101877223A publication Critical patent/CN101877223A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/22Means responsive to presence or absence of recorded information signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

一种影音编辑系统,其用于影音内容的过滤,影音编辑系统包括样本存储器及处理器,样本存储器内存储有不雅声音样本,处理器包括:声音获取模块,用于从影音内容中获取声音;声音辨识模块,用于将获取的声音进行识别;声音对比模块,用于将识别出的声音与样本存储器内的不雅声音样本对比,判断是否存在不雅声音;声音编辑模块,用于当对比模块判断出存在不雅声音时,将不雅声音进行编辑。本发明提供的影音编辑系统可以对影音内容中不雅声音进行过滤,从而有利于保证影音内容的健康。另,本发明还提供一种影音编辑方法,及具有该影音编辑系统的电子设备。

Description

影音编辑系统、方法及具有该影音编辑系统的电子设备
技术领域
本发明涉及一种影音编辑系统、方法及具有该影音编辑系统的电子设备。
背景技术
科技的进步为人们带来越来越多的便利。电子产品、信息产品已经与人们的生活结合的越来越紧密。而声音信息及图像信息的传递和记录也随着科技的发展变得越来越容易。但是,无论是播放的电视节目还是家庭录像中,偶尔会有些不雅的言语被播出或记录下来。这可能会造成小孩错误的示范或对小孩的言行产生不利的影响。而一般家庭在使用摄像机进行录音录像时,也可能会因录像中包含不雅的话语而造成一些具有纪念价值的影片无法与别人分享。
发明内容
有鉴于此,有必要提供一种可以对不雅的影音内容进行过滤的影音编辑系统、方法及具有该影音编辑系统的电子设备。
一种影音编辑系统,其用于影音内容的过滤,所述影音编辑系统包括样本存储器及处理器。所述样本存储器内存储有不雅声音样本,所述处理器包括:声音获取模块,用于从所述影音内容中获取声音;声音辨识模块,用于将获取的声音进行识别;声音对比模块,用于将识别出的声音与所述样本存储器内的不雅声音样本对比,判断是否存在不雅声音;声音编辑模块,用于当所述对比模块判断出存在不雅声音时,将不雅声音进行编辑。
一种影音编辑方法,该影音编辑方法根据预设的不雅声音样本,将影音内容中的不雅声音进行编辑。所述影音编辑方法包括以下步骤:获取影音内容中的声音;将获取的声音与不雅声音样本进行对比;若存在不雅声音,将不雅声音进行编辑。
一种电子设备,该电子设备包括可以输出影音数据的影音输出端。所述电子设备还包括样本存储器及处理器,所述样本存储器内存储有不雅声音样本,所述处理器与所述影音输出端电连接,所述处理器包括:声音获取模块,用于从所述影音内容中获取声音;声音辨识模块,用于将获取的声音进行识别;声音对比模块,用于将识别出的声音与所述样本存储器内的不雅声音样本对比,判断是否存在不雅声音;声音编辑模块,用于当所述对比模块判断出存在不雅声音时,将不雅声音进行编辑。
本发明提供的影音编辑系统、方法及具有该影音编辑系统的电子设备可以对影音内容中不雅声音进行过滤,从而有利于保证影音内容的健康。
附图说明
图1为本发明提供的电子设备的硬件架构图。
图2为图1的电子设备的影音编辑方法的流程图。
具体实施方式
请参见图1,为本发明实施方式提供的电子设备100,所述电子设备100可以是具有摄像功能的手机、具有摄像功能的掌上电脑、数码相机或数码摄像机等。本实施方式中,所述电子设备100为数码摄像机。所述电子设备100还可以是具有图像处理及存储功能的数字电视或网络电视等图像播放设备。
所述电子设备100包括影音输出端10、样本存储器20、影音存储器30、处理器40。所述影音输出端10用于输出影音数据。所述影音输出端10可以由影像感测器及麦克风组成,也可以由接收影音信号的接收装置、图像解码器组成。本实施方式中,所述电子设备100为数码摄像机。所述影音输出端10由影像感测器及麦克风组成。
所述样本存储器20内存储有不雅声音样本及不雅图像样本。本实施方式中,先利用语音识别技术,将大量不雅的字、词、句、声调等通过神经网络算法进行训练,从而提取各种不雅声音所具有的特征值,再将各种不雅声音的特征值作为不雅声音样本存储于所述样本存储器20内。对于不雅图像样本,是通过图像识别技术,将大量与不雅声音样本相对应的嘴、手势、文字等图形进行处理,从而提取各种不雅图像所具有的特征图形作为不雅图像样本存储于所述样本存储器20内。本实施方式中,所述样本存储器20内存储的不雅图像样本是与不雅声音信息对应的嘴形。
所述影音存储器30用于存储录制及编辑过的影音数据。
所述处理器40包括声音获取模块41、声音辨识模块42、声音对比模块43、声音编辑模块44、图像获取模块45、时间段模块46、图像辨识模块47、图像对比模块48、图像编辑模块49及存储模块50。
所述声音获取模块41用于从影音数据中获取声音。本实施方式中,所述获取模块41用于从影音输出端10获取声音数据。
声音辨识模块42用于将获取的声音进行识别。本实施方式中,所述声音辨识模块42利用端点侦测技术判断所述获取模块41获取的声音数据中哪些区段是有声段,那些是属于无声段或背景噪声。当找到有声段后,所述声音辨识模块42利用强波处理技术补偿语音讯号中浊音讯号的衰减,以提高辨识的准确率,然后利用数字滤波器组来处理语音讯号,将每个滤波器的频谱能量值利用线性倒频谱系数转换成为声音的特征值。
所述声音对比模块43用于将识别出的声音与所述存储器内的不雅声音样本对比,判断是否存在不雅声音。本实施方式中,所述声音对比模块43将所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值进行对比,根据特征值是否相同来判断获取的声音数据中是否存在不雅声音。
所述声音编辑模块44用于当所述声音对比模块43判断出存在不雅声音时,将不雅声音进行编辑。本实施方式中,若所述声音对比模块43判断出所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值相同,所述声音编辑模块42将对不雅声音进行编辑。所述声音编辑模块42可以将不雅声音进行替换或删除。本实施方式中,当所述声音对比模块43判断出存在不雅的言语时,所述声音编辑模块44就将包含不雅声音的数据进行删除。当所述声音编辑模块42需要将不雅声音进行替换时,所述声音编辑模块42内应预先存有替换声音,例如“哔哔”声。当存在不雅的言语时,所述声音编辑模块44就将包含不雅声音的数据利用替换声音进行替换。
有时,不雅声音存在的场景中也会存在不希望看到的动作或景象,例如嘴、手势及暴露的衣着等。当发现存在不雅声音时,将利用图像获取模块45、时间段模块46、图像辨识模块47、图像对比模块48及图像编辑模块49对存在不雅声音的时间段内的不雅图像进行编辑。
所述图像获取模块45用于从所述影音内容中获取图像。本实施方式中,所述图像获取模块45在所述声音获取模块41获取声音时,从所述影音输出端10获取图像数据。
所述时间段模块46用于获取存在不雅声音的时间段。本实施方式中,所述时间段模块46直接利用所述声音辨识模块42辨识出存在不雅声音的时间段。
所述图像辨识模块47用于获取图像中的特征图形。本实施方式中,所述图像辨识模块47是用于辨识人的嘴部。所述图像辨识模块47首先利用人脸识别技术从所述图像获取模块45获取的图像数据中侦测出人脸。然后在人脸上找出嘴巴的区域,为了处理方便,可以将彩色影像转换成灰阶影像。接着依照适应性临界值法,将嘴巴依照灰阶值的比例作二值化。再经过形态学的闭合运算,将很接近的黑色部位连接起来。最后运用连同成分标示法,找出图像中所有的区域,并经过比对后找出最大区域作为嘴巴的特征图形。
所述图像对比模块48用于所述图像辨识模块47获取的特征图形与所述样本存储器20中存储的图像样本进行对比。本实施方式中,所述图像对比模块47将所述图像辨识模块47获取的嘴巴特征图形与所述样本存储器20中存储的嘴巴样本进行对比。若相符合,则认定获取的图像中存在嘴巴。由于言语由嘴发出,当出现不雅的言语时,嘴巴往往会有开合动作。本实施方式中,所述图像对比模块48还包括动作模块481,所述动作模块481用于判断识别出的嘴巴是否在不雅语言出现时产生变化。本实施方式中,所述动作模块481判断的嘴巴边缘是否产生变形,当所述动作模块481判断出嘴巴不雅语言出现时产生变形时,则对嘴巴进行编辑。当然,若是手势、文字等不易变动的图形,则可以无需判断图像是否产生变形,只需找到与不雅图像样本相符的图形即可。
所述图像编辑模块49用于根据图像辨识模块47的对比结果,对图像进行编辑。所述图像编辑模块49既可以删除图像也可以对图像进行修改。当所述图像编辑模块49需要删除图像时,根据时间段模块46获取的存在不雅声音的时间,删除对应时间的图像数据。当图像编辑模块49需要对图像做修改时,可以预先存储可以替换的图形,或利用图像编辑程序做图像变形,马赛克等。当存在不雅图像时,利用替换图形覆盖到不雅图形上,或将不雅图形进行图像变形,马赛克编辑等。所述本实施方式中,所述图像编辑模块49对嘴巴部位添加马赛克。
所述存储模块50用于将编辑过的声音、图像存储到所述影音存储器30中。
请参阅图2,为本发明实施方式提供的影音编辑的流程图。
步骤S110:获取影音内容中的声音及图像。本实施方式中,所述获取模块41用于从所述影音输出端10中获取图像数据及声音数据。
步骤S115:从所述获取的声音信息中提取声音的特征。本实施方式中,所述声音辨识模块42利用端点侦测技术对所述获取模块41判断所述获取模块41获取的声音数据中哪些区段是有声段,那些是属于无声段或背景噪声。当找到有声段后,所述声音辨识模块42利用强波处理技术补偿语音讯号中浊音讯号的衰减,以提高辨识的准确率,然后利用数字滤波器组来处理语音讯号,将每个滤波器的频谱能量值利用线性倒频谱系数转换成为声音的特征值。
步骤S120:将获取的声音的特征与不雅声音样本进行对比是否相同。本实施方式中,所述声音对比模块43将所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值进行对比,以判断获取的声音数据中是否存在不雅声音。
步骤S125:根据对比结果将与所述不雅声音样本相符的声音进行编辑。本实施方式中,若所述声音对比模块43判断出所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值相同,所述声音编辑模块42将对不雅声音进行编辑。所述声音编辑模块42可以将不雅声音进行替换或删除。本实施方式中,当所述声音对比模块43判断出存在不雅的言语时,所述声音编辑模块44就将包含不雅声音的数据进行删除。当所述声音编辑模块42需要将不雅声音进行替换时,所述声音编辑模块42内应预先存有替换声音,例如“哔哔”声。当存在不雅的言语时,所述声音编辑模块44就将包含不雅声音的数据利用替换声音进行替换。
步骤S130:获取与所述不雅声音样本相符的声音信息的时间段。本实施方式中,所述时间段模块46直接利用所述声音辨识模块42辨识出存在不雅声音的时间段。
步骤S135:获取在所述不雅声音对应时间段内图像的特征图形。利用所述图像辨识模块47将存在不雅声音的时间段的图像与不雅图像样本对比,判断是否存在不雅图像。本实施方式中,所述图像辨识模块47是用于辨识人的嘴部。所述图像辨识模块47首先利用人脸识别技术从所述图像获取模块45获取的图像数据中侦测出人脸。然后在人脸上找出嘴巴的区域,为了处理方便,可以将彩色影像转换成灰阶影像。接着依照适应性临界值法,将嘴巴依照灰阶值的比例作二值化。再经过形态学的闭合运算,将很接近的黑色部位连接起来。最后运用连同成分标示法,找出图像中所有的区域,并经过比对后找出最大区域作为嘴巴的特征图形。所述图像辨识模块47再将该区域与所述样本存储器20中存储的嘴巴样本进行对比。若相符合,则认定获取的图像中存在嘴巴。由于言语由嘴发出,当出现不雅的言语时,嘴巴往往会有开合动作。
步骤S140:将获取的特征图形与不雅图像样本进行对比。本实施方式中,所述图像对比模块47将所述图像辨识模块47获取的嘴巴特征图形与所述样本存储器20中存储的嘴巴样本进行对比。若相符合,则认定获取的图像中存在嘴巴。
步骤S145:判断与所述不雅图像样本相符的特征图形是否变形。由于言语由嘴发出,当出现不雅的言语时,嘴巴往往会有开合动作。本实施方式中,所述图像对比模块48还包括动作模块481,所述动作模块481用于判断识别出的嘴巴是否在不雅语言出现时产生变化。本实施方式中,所述动作模块481判断的嘴巴边缘是否产生变形,当所述动作模块481判断出嘴巴不雅语言出现时产生变形时,则对嘴巴进行编辑。当然,若是手势、文字等不易变动的图形,则可以无需判断图像是否产生变形,只需找到与不雅图像样本相符的图形即可,可以无需此步骤。
步骤S150:根据对比结果将与所述不雅图像样本相符的图像进行编辑。所述图像编辑模块49用于根据图像辨识模块47的对比结果,对图像进行编辑。所述图像编辑模块49既可以删除图像也可以对图像进行修改。当所述图像编辑模块49需要删除图像时,根据时间段模块46获取的存在不雅声音的时间,删除对应时间的图像数据。当图像编辑模块49需要对图像做修改时,可以预先存储可以替换的图形,或利用图像编辑程序做图像变形,马赛克等。当存在不雅图像时,利用替换图形覆盖到不雅图形上,或将不雅图形进行图像变形,马赛克编辑等。所述本实施方式中,所述图像编辑模块49对嘴巴部位添加马赛克。
步骤S155:将编辑完的影音内容进行存储。本实施方式中,所述存储模块50将编辑过的声音及图像保存到所述影音存储器30内。
在步骤S120中,若声音对比模块43判断出获取的声音的特征值与所述样本存储器20内不雅声音样本的特征值不同,则返回到所述步骤S110重新获取声音数据及图像数据。
在步骤S140中,若获取的特征图形与不雅图像样本不同。则不再对图像进行处理,直接转到步骤S155。
在步骤S145中,若与所述不雅图像样本相符的特征图形不存在变形,则不再对图像进行处理,直接转到步骤S155。
本发明提供的影音编辑系统可以对影音内容中不雅声音进行过滤,从而有利于保证影音内容的健康。
本技术领域的普通技术人员应当认识到,以上的实施方式仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围之内,对以上实施方式所作的适当改变和变化都落在本发明要求保护的范围之内。

Claims (13)

1.一种影音编辑系统,其用于影音内容的过滤,所述影音编辑系统包括样本存储器及处理器,其特征在于,所述样本存储器内存储有不雅声音样本,所述处理器包括:
声音获取模块,用于从所述影音内容中获取声音;
声音辨识模块,用于将获取的声音进行识别;
声音对比模块,用于将识别出的声音与所述存储器内的不雅声音样本对比,判断是否存在不雅声音;
声音编辑模块,用于当所述声音对比模块判断出存在不雅声音时,将不雅声音进行编辑。
2.如权利要求1所述的影音编辑系统,所述样本存储器内还存有不雅图象样本,所述处理器还包括:图像获取模块,时间段模块,图像辨识模块、图像对比模块及图像编辑模块,所述图像获取模块用于从所述影音内容中获取图像;所述时间段模块用于获取存在不雅声音的时间段;所述图像辨识模块用于获取图像中的特征图形;所述图像对比模块用于将所述图像辨识模块获取的特征图形与所述样本存储器中存储的图像样本进行对比,所述图像编辑模块用于当所述图像对比模块判断出存在不雅图像时,将不雅图像进行编辑。
3.如权利要求1所述的影音编辑系统,其特征在于,所述声音编辑模块内预设有替换声音,当存在不雅声音时,所述声音编辑模块对不雅声音的编辑是利用替换声音替换不雅声音。
4.如权利要求1所述的影音编辑系统,其特征在于,所述声音编辑模块对声音的编辑是将不雅声音删除。
5.如权利要求2所述的影音编辑系统,其特征在于,所述图像编辑模块内预设有替换图,当存在不雅图像时,所述图像编辑模块对图像的编辑是利用替换图覆盖不雅图像。
6.如权利要求2所述的影音编辑系统,其特征在于,所述图像编辑模块对图像的编辑是将不雅图像删除。
7.一种影音编辑方法,该影音编辑方法根据预设的不雅声音样本,将影音内容中的不雅声音进行编辑,所述影音编辑方法包括以下步骤:
获取影音内容中的声音;
将获取的声音与不雅声音样本进行对比;
若存在不雅声音,将不雅声音进行编辑。
8.如权利要求7所述的影音编辑方法,其特征在于,在不雅声音进行编辑的步骤中,对不雅声音进行替换或删除处理。
9.如权利要求7所述的影音编辑方法,其特征在于,所述影音编辑方法还根据预设的不雅图像样本,将影音内容中的不雅图像进行编辑,所述影音编辑方法还包括以下步骤:在获取影音内容中的声音的同时获取图像;若存在不雅声音,获取不雅声音所在的时间段;将不雅声音所在时间段的图像与不雅图像样本进行对比;若存在不雅图像,将不雅图像进行编辑。
10.如权利要求9所述的影音编辑方法,其特征在于,在将不雅图像进行编辑的步骤中,对不雅图像进行替换或删除处理。
11.一种电子设备,该电子设备包括可以输出影音数据的影音输出端,其特征在于,所述电子设备还包括样本存储器及处理器,所述样本存储器内存储有不雅声音样本,所述处理器与所述影音输出端电连接,所述处理器包括:
声音获取模块,用于从所述影音内容中获取声音;
声音辨识模块,用于将获取的声音进行识别;
声音对比模块,用于将识别出的声音与所述样本存储器内的不雅声音样本对比,判断是否存在不雅声音;
声音编辑模块,用于当所述声音对比模块判断出存在不雅声音时,将不雅声音进行编辑。
12.如权利要求11所述的电子设备,其特征在于,该电子设备是摄像设备或影音播放设备。
13.如权利要求11所述的电子设备,其特征在于,所述样本存储器内还存有不雅图象样本,所述处理器还包括图像获取模块,时间段模块,图像辨识模块、图像对比模块及图像编辑模块,所述图像获取模块用于从所述影音内容中获取图像;所述时间段模块用于获取存在不雅声音的时间段;所述图像辨识模块用于获取图像中的特征图形;所述图像对比模块用于将所述图像辨识模块获取的特征图形与所述样本存储器中存储的图像样本进行对比,所述图像编辑模块用于当所述图像对比模块判断出存在不雅图像时,将不雅图像进行编辑。
CN2009103019776A 2009-04-29 2009-04-29 影音编辑系统、方法及具有该影音编辑系统的电子设备 Pending CN101877223A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2009103019776A CN101877223A (zh) 2009-04-29 2009-04-29 影音编辑系统、方法及具有该影音编辑系统的电子设备
US12/641,334 US8615153B2 (en) 2009-04-29 2009-12-18 Multi-media data editing system, method and electronic device using same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009103019776A CN101877223A (zh) 2009-04-29 2009-04-29 影音编辑系统、方法及具有该影音编辑系统的电子设备

Publications (1)

Publication Number Publication Date
CN101877223A true CN101877223A (zh) 2010-11-03

Family

ID=43019759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009103019776A Pending CN101877223A (zh) 2009-04-29 2009-04-29 影音编辑系统、方法及具有该影音编辑系统的电子设备

Country Status (2)

Country Link
US (1) US8615153B2 (zh)
CN (1) CN101877223A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104934043A (zh) * 2015-06-17 2015-09-23 广东欧珀移动通信有限公司 音频处理方法及装置
CN106165017A (zh) * 2014-02-07 2016-11-23 高通科技公司 允许在图像记录或显示之前进行场景相关图像修改的即时场景识别
CN109545200A (zh) * 2018-10-31 2019-03-29 深圳大普微电子科技有限公司 编辑语音内容的方法及存储装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9426385B2 (en) * 2014-02-07 2016-08-23 Qualcomm Technologies, Inc. Image processing based on scene recognition
AU2018422752A1 (en) * 2018-05-10 2020-12-03 Axon Enterprise, Inc. Systems and methods for cross-redaction
US11823713B1 (en) * 2022-10-03 2023-11-21 Bolt-On Ip Solutions, Llc System and method for editing an audio stream

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5764852A (en) * 1994-08-16 1998-06-09 International Business Machines Corporation Method and apparatus for speech recognition for distinguishing non-speech audio input events from speech audio input events
US5986692A (en) * 1996-10-03 1999-11-16 Logan; James D. Systems and methods for computer enhanced broadcast monitoring
US5870708A (en) * 1996-10-10 1999-02-09 Walter S. Stewart Method of and apparatus for scanning for and replacing words on video cassettes
US8949878B2 (en) 2001-03-30 2015-02-03 Funai Electric Co., Ltd. System for parental control in video programs based on multimedia content information
US8245252B2 (en) * 2002-09-10 2012-08-14 Caption Tv, Inc. System, method, and computer program product for selective replacement of objectionable program content with less-objectionable content
CA2622744C (en) * 2005-09-16 2014-09-16 Flixor, Inc. Personalizing a video
CN101030369B (zh) 2007-03-30 2011-06-29 清华大学 基于子词隐含马尔可夫模型的嵌入式语音识别方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106165017A (zh) * 2014-02-07 2016-11-23 高通科技公司 允许在图像记录或显示之前进行场景相关图像修改的即时场景识别
CN111326183A (zh) * 2014-02-07 2020-06-23 高通科技公司 用于处理时间图像序列的系统和方法
CN104934043A (zh) * 2015-06-17 2015-09-23 广东欧珀移动通信有限公司 音频处理方法及装置
CN109545200A (zh) * 2018-10-31 2019-03-29 深圳大普微电子科技有限公司 编辑语音内容的方法及存储装置

Also Published As

Publication number Publication date
US8615153B2 (en) 2013-12-24
US20100278505A1 (en) 2010-11-04

Similar Documents

Publication Publication Date Title
CN103035247B (zh) 基于声纹信息对音频/视频文件进行操作的方法及装置
CN101877223A (zh) 影音编辑系统、方法及具有该影音编辑系统的电子设备
JP4441879B2 (ja) 信号処理装置および方法、プログラム、並びに記録媒体
US8494338B2 (en) Electronic apparatus, video content editing method, and program
CN101647265B (zh) 在视频中自动检测、移除、替换和标记闪光帧
CN110149548B (zh) 视频配音方法、电子装置和可读存储介质
CN104580888B (zh) 一种图像处理方法及终端
CN111556254A (zh) 利用视频内容进行视频切割的方法、系统、介质及智能设备
EP1213915A2 (en) Video and audio recording
CN101373482B (zh) 信息处理设备和信息处理方法
KR20140114238A (ko) 오디오와 결합된 이미지 표시 방법
Matthews et al. Audiovisual speech recognition using multiscale nonlinear image decomposition
CN103186780B (zh) 视频字幕识别方法及装置
CN110148418B (zh) 一种场景记录分析系统、方法及其装置
US9058384B2 (en) System and method for identification of highly-variable vocalizations
WO2017166483A1 (zh) 一种动态图片处理方法及系统
CN105373705A (zh) 一种自动采集生活数据的方法、装置及设备
CN114120969A (zh) 智能终端的语音识别功能测试方法、系统、电子设备
CN111615008A (zh) 基于多设备体验的智能摘要生成和字幕阅读系统
CN110089123B (zh) 录制方法、解码器盒及存储装置
CN114554268B (zh) 音视频数据的处理方法及装置、电子设备、存储介质
Umamaheswaran et al. Caption positioning structure for hard of hearing people using deep learning method
CN113990297A (zh) 一种基于enf的音频篡改识别方法
TWI385646B (zh) 影音編輯系統、方法及具有該影音編輯系統的電子設備
CN115700880A (zh) 一种行为监测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20101103