CN101877223A

CN101877223A - 影音编辑系统、方法及具有该影音编辑系统的电子设备

Info

Publication number: CN101877223A
Application number: CN2009103019776A
Authority: CN
Inventors: 吴全峰
Original assignee: Hongfujin Precision Industry Shenzhen Co Ltd; Hon Hai Precision Industry Co Ltd
Current assignee: Hongfujin Precision Industry Shenzhen Co Ltd; Hon Hai Precision Industry Co Ltd
Priority date: 2009-04-29
Filing date: 2009-04-29
Publication date: 2010-11-03
Also published as: US8615153B2; US20100278505A1

Abstract

一种影音编辑系统，其用于影音内容的过滤，影音编辑系统包括样本存储器及处理器，样本存储器内存储有不雅声音样本，处理器包括：声音获取模块，用于从影音内容中获取声音；声音辨识模块，用于将获取的声音进行识别；声音对比模块，用于将识别出的声音与样本存储器内的不雅声音样本对比，判断是否存在不雅声音；声音编辑模块，用于当对比模块判断出存在不雅声音时，将不雅声音进行编辑。本发明提供的影音编辑系统可以对影音内容中不雅声音进行过滤，从而有利于保证影音内容的健康。另，本发明还提供一种影音编辑方法，及具有该影音编辑系统的电子设备。

Description

影音编辑系统、方法及具有该影音编辑系统的电子设备

技术领域

本发明涉及一种影音编辑系统、方法及具有该影音编辑系统的电子设备。

背景技术

科技的进步为人们带来越来越多的便利。电子产品、信息产品已经与人们的生活结合的越来越紧密。而声音信息及图像信息的传递和记录也随着科技的发展变得越来越容易。但是，无论是播放的电视节目还是家庭录像中，偶尔会有些不雅的言语被播出或记录下来。这可能会造成小孩错误的示范或对小孩的言行产生不利的影响。而一般家庭在使用摄像机进行录音录像时，也可能会因录像中包含不雅的话语而造成一些具有纪念价值的影片无法与别人分享。

发明内容

有鉴于此，有必要提供一种可以对不雅的影音内容进行过滤的影音编辑系统、方法及具有该影音编辑系统的电子设备。

一种影音编辑系统，其用于影音内容的过滤，所述影音编辑系统包括样本存储器及处理器。所述样本存储器内存储有不雅声音样本，所述处理器包括：声音获取模块，用于从所述影音内容中获取声音；声音辨识模块，用于将获取的声音进行识别；声音对比模块，用于将识别出的声音与所述样本存储器内的不雅声音样本对比，判断是否存在不雅声音；声音编辑模块，用于当所述对比模块判断出存在不雅声音时，将不雅声音进行编辑。

一种影音编辑方法，该影音编辑方法根据预设的不雅声音样本，将影音内容中的不雅声音进行编辑。所述影音编辑方法包括以下步骤：获取影音内容中的声音；将获取的声音与不雅声音样本进行对比；若存在不雅声音，将不雅声音进行编辑。

一种电子设备，该电子设备包括可以输出影音数据的影音输出端。所述电子设备还包括样本存储器及处理器，所述样本存储器内存储有不雅声音样本，所述处理器与所述影音输出端电连接，所述处理器包括：声音获取模块，用于从所述影音内容中获取声音；声音辨识模块，用于将获取的声音进行识别；声音对比模块，用于将识别出的声音与所述样本存储器内的不雅声音样本对比，判断是否存在不雅声音；声音编辑模块，用于当所述对比模块判断出存在不雅声音时，将不雅声音进行编辑。

本发明提供的影音编辑系统、方法及具有该影音编辑系统的电子设备可以对影音内容中不雅声音进行过滤，从而有利于保证影音内容的健康。

附图说明

图1为本发明提供的电子设备的硬件架构图。

图2为图1的电子设备的影音编辑方法的流程图。

具体实施方式

请参见图1，为本发明实施方式提供的电子设备100，所述电子设备100可以是具有摄像功能的手机、具有摄像功能的掌上电脑、数码相机或数码摄像机等。本实施方式中，所述电子设备100为数码摄像机。所述电子设备100还可以是具有图像处理及存储功能的数字电视或网络电视等图像播放设备。

所述电子设备100包括影音输出端10、样本存储器20、影音存储器30、处理器40。所述影音输出端10用于输出影音数据。所述影音输出端10可以由影像感测器及麦克风组成，也可以由接收影音信号的接收装置、图像解码器组成。本实施方式中，所述电子设备100为数码摄像机。所述影音输出端10由影像感测器及麦克风组成。

所述样本存储器20内存储有不雅声音样本及不雅图像样本。本实施方式中，先利用语音识别技术，将大量不雅的字、词、句、声调等通过神经网络算法进行训练，从而提取各种不雅声音所具有的特征值，再将各种不雅声音的特征值作为不雅声音样本存储于所述样本存储器20内。对于不雅图像样本，是通过图像识别技术，将大量与不雅声音样本相对应的嘴、手势、文字等图形进行处理，从而提取各种不雅图像所具有的特征图形作为不雅图像样本存储于所述样本存储器20内。本实施方式中，所述样本存储器20内存储的不雅图像样本是与不雅声音信息对应的嘴形。

所述影音存储器30用于存储录制及编辑过的影音数据。

所述处理器40包括声音获取模块41、声音辨识模块42、声音对比模块43、声音编辑模块44、图像获取模块45、时间段模块46、图像辨识模块47、图像对比模块48、图像编辑模块49及存储模块50。

所述声音获取模块41用于从影音数据中获取声音。本实施方式中，所述获取模块41用于从影音输出端10获取声音数据。

声音辨识模块42用于将获取的声音进行识别。本实施方式中，所述声音辨识模块42利用端点侦测技术判断所述获取模块41获取的声音数据中哪些区段是有声段，那些是属于无声段或背景噪声。当找到有声段后，所述声音辨识模块42利用强波处理技术补偿语音讯号中浊音讯号的衰减，以提高辨识的准确率，然后利用数字滤波器组来处理语音讯号，将每个滤波器的频谱能量值利用线性倒频谱系数转换成为声音的特征值。

所述声音对比模块43用于将识别出的声音与所述存储器内的不雅声音样本对比，判断是否存在不雅声音。本实施方式中，所述声音对比模块43将所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值进行对比，根据特征值是否相同来判断获取的声音数据中是否存在不雅声音。

所述声音编辑模块44用于当所述声音对比模块43判断出存在不雅声音时，将不雅声音进行编辑。本实施方式中，若所述声音对比模块43判断出所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值相同，所述声音编辑模块42将对不雅声音进行编辑。所述声音编辑模块42可以将不雅声音进行替换或删除。本实施方式中，当所述声音对比模块43判断出存在不雅的言语时，所述声音编辑模块44就将包含不雅声音的数据进行删除。当所述声音编辑模块42需要将不雅声音进行替换时，所述声音编辑模块42内应预先存有替换声音，例如“哔哔”声。当存在不雅的言语时，所述声音编辑模块44就将包含不雅声音的数据利用替换声音进行替换。

有时，不雅声音存在的场景中也会存在不希望看到的动作或景象，例如嘴、手势及暴露的衣着等。当发现存在不雅声音时，将利用图像获取模块45、时间段模块46、图像辨识模块47、图像对比模块48及图像编辑模块49对存在不雅声音的时间段内的不雅图像进行编辑。

所述图像获取模块45用于从所述影音内容中获取图像。本实施方式中，所述图像获取模块45在所述声音获取模块41获取声音时，从所述影音输出端10获取图像数据。

所述时间段模块46用于获取存在不雅声音的时间段。本实施方式中，所述时间段模块46直接利用所述声音辨识模块42辨识出存在不雅声音的时间段。

所述图像辨识模块47用于获取图像中的特征图形。本实施方式中，所述图像辨识模块47是用于辨识人的嘴部。所述图像辨识模块47首先利用人脸识别技术从所述图像获取模块45获取的图像数据中侦测出人脸。然后在人脸上找出嘴巴的区域，为了处理方便，可以将彩色影像转换成灰阶影像。接着依照适应性临界值法，将嘴巴依照灰阶值的比例作二值化。再经过形态学的闭合运算，将很接近的黑色部位连接起来。最后运用连同成分标示法，找出图像中所有的区域，并经过比对后找出最大区域作为嘴巴的特征图形。

所述图像对比模块48用于所述图像辨识模块47获取的特征图形与所述样本存储器20中存储的图像样本进行对比。本实施方式中，所述图像对比模块47将所述图像辨识模块47获取的嘴巴特征图形与所述样本存储器20中存储的嘴巴样本进行对比。若相符合，则认定获取的图像中存在嘴巴。由于言语由嘴发出，当出现不雅的言语时，嘴巴往往会有开合动作。本实施方式中，所述图像对比模块48还包括动作模块481，所述动作模块481用于判断识别出的嘴巴是否在不雅语言出现时产生变化。本实施方式中，所述动作模块481判断的嘴巴边缘是否产生变形，当所述动作模块481判断出嘴巴不雅语言出现时产生变形时，则对嘴巴进行编辑。当然，若是手势、文字等不易变动的图形，则可以无需判断图像是否产生变形，只需找到与不雅图像样本相符的图形即可。

所述图像编辑模块49用于根据图像辨识模块47的对比结果，对图像进行编辑。所述图像编辑模块49既可以删除图像也可以对图像进行修改。当所述图像编辑模块49需要删除图像时，根据时间段模块46获取的存在不雅声音的时间，删除对应时间的图像数据。当图像编辑模块49需要对图像做修改时，可以预先存储可以替换的图形，或利用图像编辑程序做图像变形，马赛克等。当存在不雅图像时，利用替换图形覆盖到不雅图形上，或将不雅图形进行图像变形，马赛克编辑等。所述本实施方式中，所述图像编辑模块49对嘴巴部位添加马赛克。

所述存储模块50用于将编辑过的声音、图像存储到所述影音存储器30中。

请参阅图2，为本发明实施方式提供的影音编辑的流程图。

步骤S110：获取影音内容中的声音及图像。本实施方式中，所述获取模块41用于从所述影音输出端10中获取图像数据及声音数据。

步骤S115：从所述获取的声音信息中提取声音的特征。本实施方式中，所述声音辨识模块42利用端点侦测技术对所述获取模块41判断所述获取模块41获取的声音数据中哪些区段是有声段，那些是属于无声段或背景噪声。当找到有声段后，所述声音辨识模块42利用强波处理技术补偿语音讯号中浊音讯号的衰减，以提高辨识的准确率，然后利用数字滤波器组来处理语音讯号，将每个滤波器的频谱能量值利用线性倒频谱系数转换成为声音的特征值。

步骤S120：将获取的声音的特征与不雅声音样本进行对比是否相同。本实施方式中，所述声音对比模块43将所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值进行对比，以判断获取的声音数据中是否存在不雅声音。

步骤S125：根据对比结果将与所述不雅声音样本相符的声音进行编辑。本实施方式中，若所述声音对比模块43判断出所述声音辨识模块42获取的声音的特征值与所述样本存储器20内的不雅声音的特征值相同，所述声音编辑模块42将对不雅声音进行编辑。所述声音编辑模块42可以将不雅声音进行替换或删除。本实施方式中，当所述声音对比模块43判断出存在不雅的言语时，所述声音编辑模块44就将包含不雅声音的数据进行删除。当所述声音编辑模块42需要将不雅声音进行替换时，所述声音编辑模块42内应预先存有替换声音，例如“哔哔”声。当存在不雅的言语时，所述声音编辑模块44就将包含不雅声音的数据利用替换声音进行替换。

步骤S130：获取与所述不雅声音样本相符的声音信息的时间段。本实施方式中，所述时间段模块46直接利用所述声音辨识模块42辨识出存在不雅声音的时间段。

步骤S135：获取在所述不雅声音对应时间段内图像的特征图形。利用所述图像辨识模块47将存在不雅声音的时间段的图像与不雅图像样本对比，判断是否存在不雅图像。本实施方式中，所述图像辨识模块47是用于辨识人的嘴部。所述图像辨识模块47首先利用人脸识别技术从所述图像获取模块45获取的图像数据中侦测出人脸。然后在人脸上找出嘴巴的区域，为了处理方便，可以将彩色影像转换成灰阶影像。接着依照适应性临界值法，将嘴巴依照灰阶值的比例作二值化。再经过形态学的闭合运算，将很接近的黑色部位连接起来。最后运用连同成分标示法，找出图像中所有的区域，并经过比对后找出最大区域作为嘴巴的特征图形。所述图像辨识模块47再将该区域与所述样本存储器20中存储的嘴巴样本进行对比。若相符合，则认定获取的图像中存在嘴巴。由于言语由嘴发出，当出现不雅的言语时，嘴巴往往会有开合动作。

步骤S140：将获取的特征图形与不雅图像样本进行对比。本实施方式中，所述图像对比模块47将所述图像辨识模块47获取的嘴巴特征图形与所述样本存储器20中存储的嘴巴样本进行对比。若相符合，则认定获取的图像中存在嘴巴。

步骤S145：判断与所述不雅图像样本相符的特征图形是否变形。由于言语由嘴发出，当出现不雅的言语时，嘴巴往往会有开合动作。本实施方式中，所述图像对比模块48还包括动作模块481，所述动作模块481用于判断识别出的嘴巴是否在不雅语言出现时产生变化。本实施方式中，所述动作模块481判断的嘴巴边缘是否产生变形，当所述动作模块481判断出嘴巴不雅语言出现时产生变形时，则对嘴巴进行编辑。当然，若是手势、文字等不易变动的图形，则可以无需判断图像是否产生变形，只需找到与不雅图像样本相符的图形即可，可以无需此步骤。

步骤S150：根据对比结果将与所述不雅图像样本相符的图像进行编辑。所述图像编辑模块49用于根据图像辨识模块47的对比结果，对图像进行编辑。所述图像编辑模块49既可以删除图像也可以对图像进行修改。当所述图像编辑模块49需要删除图像时，根据时间段模块46获取的存在不雅声音的时间，删除对应时间的图像数据。当图像编辑模块49需要对图像做修改时，可以预先存储可以替换的图形，或利用图像编辑程序做图像变形，马赛克等。当存在不雅图像时，利用替换图形覆盖到不雅图形上，或将不雅图形进行图像变形，马赛克编辑等。所述本实施方式中，所述图像编辑模块49对嘴巴部位添加马赛克。

步骤S155：将编辑完的影音内容进行存储。本实施方式中，所述存储模块50将编辑过的声音及图像保存到所述影音存储器30内。

在步骤S120中，若声音对比模块43判断出获取的声音的特征值与所述样本存储器20内不雅声音样本的特征值不同，则返回到所述步骤S110重新获取声音数据及图像数据。

在步骤S140中，若获取的特征图形与不雅图像样本不同。则不再对图像进行处理，直接转到步骤S155。

在步骤S145中，若与所述不雅图像样本相符的特征图形不存在变形，则不再对图像进行处理，直接转到步骤S155。

本发明提供的影音编辑系统可以对影音内容中不雅声音进行过滤，从而有利于保证影音内容的健康。

本技术领域的普通技术人员应当认识到，以上的实施方式仅是用来说明本发明，而并非用作为对本发明的限定，只要在本发明的实质精神范围之内，对以上实施方式所作的适当改变和变化都落在本发明要求保护的范围之内。

Claims

1.一种影音编辑系统，其用于影音内容的过滤，所述影音编辑系统包括样本存储器及处理器，其特征在于，所述样本存储器内存储有不雅声音样本，所述处理器包括：

声音获取模块，用于从所述影音内容中获取声音；

声音辨识模块，用于将获取的声音进行识别；

声音对比模块，用于将识别出的声音与所述存储器内的不雅声音样本对比，判断是否存在不雅声音；

声音编辑模块，用于当所述声音对比模块判断出存在不雅声音时，将不雅声音进行编辑。

2.如权利要求1所述的影音编辑系统，所述样本存储器内还存有不雅图象样本，所述处理器还包括：图像获取模块，时间段模块，图像辨识模块、图像对比模块及图像编辑模块，所述图像获取模块用于从所述影音内容中获取图像；所述时间段模块用于获取存在不雅声音的时间段；所述图像辨识模块用于获取图像中的特征图形；所述图像对比模块用于将所述图像辨识模块获取的特征图形与所述样本存储器中存储的图像样本进行对比，所述图像编辑模块用于当所述图像对比模块判断出存在不雅图像时，将不雅图像进行编辑。

3.如权利要求1所述的影音编辑系统，其特征在于，所述声音编辑模块内预设有替换声音，当存在不雅声音时，所述声音编辑模块对不雅声音的编辑是利用替换声音替换不雅声音。

4.如权利要求1所述的影音编辑系统，其特征在于，所述声音编辑模块对声音的编辑是将不雅声音删除。

5.如权利要求2所述的影音编辑系统，其特征在于，所述图像编辑模块内预设有替换图，当存在不雅图像时，所述图像编辑模块对图像的编辑是利用替换图覆盖不雅图像。

6.如权利要求2所述的影音编辑系统，其特征在于，所述图像编辑模块对图像的编辑是将不雅图像删除。

7.一种影音编辑方法，该影音编辑方法根据预设的不雅声音样本，将影音内容中的不雅声音进行编辑，所述影音编辑方法包括以下步骤：

获取影音内容中的声音；

将获取的声音与不雅声音样本进行对比；

若存在不雅声音，将不雅声音进行编辑。

8.如权利要求7所述的影音编辑方法，其特征在于，在不雅声音进行编辑的步骤中，对不雅声音进行替换或删除处理。

9.如权利要求7所述的影音编辑方法，其特征在于，所述影音编辑方法还根据预设的不雅图像样本，将影音内容中的不雅图像进行编辑，所述影音编辑方法还包括以下步骤：在获取影音内容中的声音的同时获取图像；若存在不雅声音，获取不雅声音所在的时间段；将不雅声音所在时间段的图像与不雅图像样本进行对比；若存在不雅图像，将不雅图像进行编辑。

10.如权利要求9所述的影音编辑方法，其特征在于，在将不雅图像进行编辑的步骤中，对不雅图像进行替换或删除处理。

11.一种电子设备，该电子设备包括可以输出影音数据的影音输出端，其特征在于，所述电子设备还包括样本存储器及处理器，所述样本存储器内存储有不雅声音样本，所述处理器与所述影音输出端电连接，所述处理器包括：

声音获取模块，用于从所述影音内容中获取声音；

声音辨识模块，用于将获取的声音进行识别；

声音对比模块，用于将识别出的声音与所述样本存储器内的不雅声音样本对比，判断是否存在不雅声音；

12.如权利要求11所述的电子设备，其特征在于，该电子设备是摄像设备或影音播放设备。

13.如权利要求11所述的电子设备，其特征在于，所述样本存储器内还存有不雅图象样本，所述处理器还包括图像获取模块，时间段模块，图像辨识模块、图像对比模块及图像编辑模块，所述图像获取模块用于从所述影音内容中获取图像；所述时间段模块用于获取存在不雅声音的时间段；所述图像辨识模块用于获取图像中的特征图形；所述图像对比模块用于将所述图像辨识模块获取的特征图形与所述样本存储器中存储的图像样本进行对比，所述图像编辑模块用于当所述图像对比模块判断出存在不雅图像时，将不雅图像进行编辑。