CN106095764A - 一种动态图片处理方法及系统 - Google Patents

一种动态图片处理方法及系统 Download PDF

Info

Publication number
CN106095764A
CN106095764A CN201610196491.0A CN201610196491A CN106095764A CN 106095764 A CN106095764 A CN 106095764A CN 201610196491 A CN201610196491 A CN 201610196491A CN 106095764 A CN106095764 A CN 106095764A
Authority
CN
China
Prior art keywords
dynamic picture
vocal print
sound
module
print feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610196491.0A
Other languages
English (en)
Inventor
姜天宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Holding Beijing Co Ltd
LeTV Mobile Intelligent Information Technology Beijing Co Ltd
Original Assignee
LeTV Holding Beijing Co Ltd
LeTV Mobile Intelligent Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Holding Beijing Co Ltd, LeTV Mobile Intelligent Information Technology Beijing Co Ltd filed Critical LeTV Holding Beijing Co Ltd
Priority to CN201610196491.0A priority Critical patent/CN106095764A/zh
Priority to PCT/CN2016/088859 priority patent/WO2017166483A1/zh
Priority to US15/245,743 priority patent/US20170287524A1/en
Publication of CN106095764A publication Critical patent/CN106095764A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data

Abstract

本发明涉及动态图片处理技术领域,尤其涉及一种动态图片处理方法及系统。所述动态图片处理方法包括:步骤100:拍摄动态图片,并在动态图片拍摄过程中进行录音;步骤200:对录音信息进行声纹特征提取;步骤300:将提取的声纹特征写入动态图片中,对动态图片进行声纹标注。本发明通过实时计算并提取动态图片拍摄场景的声纹特征,将声纹特征写入动态图片中,实现动态图片的声纹标注,并根据声纹特征对动态图片进行归类,实现动态图片的归类检索和基于声纹特征的快速匹配查询的目的,使用户的检索图片操作更高效、直观。

Description

一种动态图片处理方法及系统
技术领域
本发明涉及动态图片处理技术领域,尤其涉及一种动态图片处理方法及系统。
背景技术
自多家移动设备厂商推出诸如Zoe、LivePhoto等新图像媒体格式后,动态图片格式极有可能会在未来替代现有的静态图片格式,成为下一个移动设备创新技术领域的重要竞争环节。现有的动态图片只是记录拍摄范围内的图像信息和单纯的录制原始数字媒体信号,而没有考虑拍摄场景声音的内容信息,因此,在动态图片格式处理领域,用户的使用体验还有很多可提升的空间。
发明内容
本发明提供了一种动态图片处理方法及系统,旨在解决现有的动态图片只是记录拍摄范围内的图像信息和单纯的录制原始数字媒体信号,而没有考虑拍摄场景声音的内容信息的技术问题。
为了解决以上提出的问题,本发明实施例采用的技术方案为:一种动态图片处理方法,包括以下步骤:
步骤100:拍摄动态图片,并在动态图片拍摄过程中进行录音;
步骤200:对录音信息进行声纹特征提取;
步骤300:将提取的声纹特征写入动态图片中,对动态图片进行声纹标注。
本发明实施例采取的技术方案还包括:所述步骤100还包括:将拍摄的动态图片和录音信息进行存储;所述动态图片的存储形式为缩略图形式,所述录音信息包括语音、环境音或噪音。
本发明实施例采取的技术方案还包括:在所述步骤200中,所述声纹特征提取方法包括以下步骤:
步骤201:检测是否有效音源数据进入;
步骤202:对进入的音源数据进行差分和滤波处理;
步骤203:对流式音源进行离散化处理;
步骤204:通过哈明窗对帧数据做加窗处理;
步骤205:通过快速傅氏变换将时域音源转为频域能量;
步骤206:对音源进行带通滤波与声纹特征提取。
本发明实施例采取的技术方案还包括:在所述步骤300中,所述将提取的声纹特征写入动态图片中的写入方式为:读取存储的动态图片,将提取的声纹特征以序列化的方式写入动态图片的指定文件数据节点。
本发明实施例采取的技术方案还包括:所述步骤300后还包括:根据声纹特征对声纹标注后的动态图片进行归类并存储;所述归类方式包括语音特征归类、环境音特征归类或噪声特征归类。
本发明实施例采取的技术方案还包括:所述步骤300后还包括:通过语音输入或者归类查找方式检索具有特定声纹特征的动态图片。
本发明实施例采取的另一技术方案为:一种动态图片处理系统,包括拍摄模块、录音模块、声纹提取模块和声纹标注模块;所述拍摄模块用于拍摄动态图片;所述录音模块用于在动态图片拍摄过程中进行录音;所述声纹提取模块用于对录音信息进行声纹特征提取;所述声纹标注模块用于将提取的声纹特征写入动态图片中,对动态图片进行声纹标注。
本发明实施例采取的技术方案还包括:所述声纹提取模块包括端点检测单元、预加重单元、音频分帧单元、加窗单元、音源转换单元和滤波单元;
所述端点检测单元用于检测是否有效音源数据进入;
所述预加重单元用于对进入的音源数据进行差分和滤波处理;
所述音频分帧单元用于对流式音源进行离散化处理;
所述加窗单元用于通过哈明窗对帧数据做加窗处理;
所述音源转换单元用于通过快速傅氏变换将时域音源转为频域能量;
所述滤波单元用于对音源进行带通滤波与声纹特征提取。
本发明实施例采取的技术方案还包括存储模块,所述存储模块用于将拍摄的动态图片和录音信息进行存储。
本发明实施例采取的技术方案还包括归类模块和检索模块,所述归类模块用于根据声纹特征对声纹标注后的动态图片进行归类并存储;所述归类模块的归类方式包括语音特征归类、环境音特征归类或噪声特征归类;所述检索模块用于通过语音输入或者归类查找方式检索具有特定声纹特征的动态图片。
与现有技术相比,本发明的有益效果在于:本发明实施例的动态图片处理方法及系统通过充分利用拍摄场景的声音信息,实时计算并提取动态图片拍摄场景的声纹特征,将声纹特征写入动态图片中,实现动态图片的声纹标注,并根据声纹特征对动态图片进行归类,实现动态图片的归类检索和基于声纹特征的快速匹配查询的目的,使用户的检索图片操作更高效、直观。
附图说明
图1为本发明实施例的动态图片处理方法的流程图;
图2是本发明实施例的声纹特征提取示意图;
图3为本发明实施例的动态图片处理系统的结构示意图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
请参阅图1,是本发明实施例的动态图片处理方法的流程图。本发明实施例的动态图片处理方法包括以下步骤:
步骤100:启动动态拍照功能,开始拍摄动态图片;
步骤200:启动录音功能,在动态图片拍摄过程中进行录音,并将拍摄的动态图片和录音信息进行存储;
在步骤200中,本发明实施例通过Thumbnail+MOV(缩略图)的形式存储动态图片,图片来自相机的Preview(预览)数据,通过对多帧图像数据的编码生成MOV,并裁剪时间中轴图像作为Thumbnail;默认录制的MOV格式(QuickTime影片格式,是Apple公司开发的一种音频、视频文件格式,用于存储常用数字媒体类型)带有音源的视频长度为4秒,录音信息包括语音、环境音或噪音等。
步骤300:通过声纹提取模块对存储的录音信息进行声纹特征提取,并对提取的声纹特征进行存储;
在步骤300中,本发明实施例使用媒体信息特殊段落来存储声纹特征;具体如图2所示,是本发明实施例的声纹特征提取示意图。本发明实施例的声纹特征提取过程包括以下步骤:
步骤301:端点检测:检测是否有效音源数据进入;
步骤302:预加重:对进入的音源数据进行差分和滤波处理;
在步骤302中,所述预加重滤波算法公式为:
步骤303:音频分帧:对流式音源进行离散化处理;
在步骤303中,为了保留音源的一些细节特征,特别是某些环境场景的特殊音质,同时考虑处理数据量的大小,本发明选用1 Channel 44100Hz的采样标准;而按照音频处理的规则,音频帧的时长通常控制在20-30ms左右,因此可以将单个音频帧的采样点数定为1024个,实际对应时长为1024+44100×1000≈2。
步骤304:加窗处理:选用常见哈明窗对帧数据做加窗处理;
在步骤304中,对经过音频分帧处理的每帧音频数据S(n)进行哈明窗处理,得到处理后的数据S′(n)=S(n)×W(n),其中W(n)形式如下:
W ( n , a ) = ( 1 - a ) - a × cos [ 2 π n N - 1 ] , 0 ≤ n ≤ N - 1 , a = 0.48 - - - ( 2 )
步骤305:FFT(Fast Fourier Transformation,快速傅氏变换):将时域音源转为频域能量;
在步骤305中,原子运算级快速傅里叶变换将时域音源转换为频域数据,转换公式为:
X a ( k ) = Σ n = 0 N - 1 x ( n ) e - j 2 π k N , 0 ≤ k ≤ N - - - ( 3 )
步骤306:对音源进行带通滤波与声纹特征提取。
在步骤306中,针对分析所需要的不同声源特征,使用特定的滤波器和提取算法进行滤波与声纹特征提取,例如:语音特征则可以使用三角带通滤波器+DCT收集MFCC系数特征;环境音则可以使用对数滤波器+小波变换收集Jaccard系数位元特征等。
步骤400:读取存储的动态图片,将提取的声纹特征以序列化的方式写入动态图片的指定文件数据节点,对动态图片进行声纹标注;
步骤500:根据声纹特征对声纹标注后的动态图片进行归类并存储;
在步骤500中,所述根据声纹特征对声纹标注后的动态图片进行归类的归类方式包括语音特征归类、环境音特征归类或噪声特征归类等。
步骤600:通过语音输入或者归类查找等方式进行检索,从而快速检索出具有特定声纹特征的动态图片;
在步骤600中,语音特征可以直接通过输入语音的相似度识别的方式进行快速索引,而对于较为复杂的环境音特征或噪声特征以及其它声音特征则应按照诸如发声物、场景地点、声音强度等特点进行归类,并按照归类类别进行查找。
请参阅图3,是本发明实施例的动态图片处理系统的结构示意图。本发明实施例的动态图片处理系统包括拍摄模块、录音模块、存储模块、声纹提取模块、声纹标注模块、归类模块和检索模块;
拍摄模块用于拍摄动态图片;
录音模块用于在动态图片拍摄过程中进行录音;
存储模块用于将拍摄的动态图片和录音信息进行存储;
声纹提取模块用于对存储的录音信息进行声纹特征提取,并对提取的声纹特征进行存储;具体地,声纹提取模块还包括端点检测单元、预加重单元、音频分帧单元、加窗单元、音源转换单元和滤波单元
端点检测单元用于检测是否有效音源数据进入;
预加重单元用于对进入的音源数据进行差分和滤波处理;其中,所述预加重滤波算法公式为:
音频分帧单元用于对流式音源进行离散化处理;其中,为了保留音源的一些细节特征,特别是某些环境场景的特殊音质,同时考虑处理数据量的大小,本发明选用1Channel 44100Hz的采样标准;而按照音频处理的规则,音频帧的时长通常控制在20-30ms左右,因此可以将单个音频帧的采样点数定为1024个,实际对应时长为1024+44100×1000≈2。
加窗单元用于通过哈明窗对帧数据做加窗处理;其中,对经过音频分帧处理的每帧音频数据S(n)进行哈明窗处理,得到处理后的数据S′(n)=S(n)×W(n),其中W(n)形式如下:
W ( n , a ) = ( 1 - a ) - a × cos [ 2 π n N - 1 ] , 0 ≤ n ≤ N - 1 , a = 0.48 - - - ( 2 )
音源转换单元用于通过FFT将时域音源转为频域能量;其中,原子运算级快速傅里叶变换将时域音源转换为频域数据,转换公式为:
X a ( k ) = Σ n = 0 N - 1 x ( n ) e - j 2 π k N , 0 ≤ k ≤ N - - - ( 3 )
滤波单元用于对音源进行带通滤波与声纹特征提取;其中,针对分析所需要的不同声源特征,使用特定的滤波器和提取算法进行滤波与声纹特征提取,例如:语音特征则可以使用三角带通滤波器+DCT收集MFCC系数特征;环境音则可以使用对数滤波器+小波变换收集Jaccard系数位元特征等。
声纹标注模块用于读取存储的动态图片,将提取的声纹特征以序列化的方式写入动态图片的指定文件数据节点,对动态图片进行声纹标注;
归类模块用于根据声纹特征对声纹标注后的动态图片进行归类并存储;其中,所述根据声纹特征对声纹标注后的动态图片进行归类的归类方式包括语音特征归类、环境音特征归类或噪声特征归类等。
检索模块用于通过语音输入或者归类查找等方式进行检索,从而快速检索出具有特定声纹特征的动态图片;其中,语音特征可以直接通过输入语音的相似度识别的方式进行快速索引,而对于较为复杂的环境音特征或噪声特征以及其它声音特征则应按照诸如发声物、场景地点、声音强度等特点进行归类,并按照归类类别进行查找。
本发明实施例的动态图片处理方法及系统通过充分利用拍摄场景的声音信息,实时计算并提取动态图片拍摄场景的声纹特征,将声纹特征写入动态图片中,实现动态图片的声纹标注,并根据声纹特征对动态图片进行归类,实现动态图片的归类检索和基于声纹特征的快速匹配查询的目的,使用户的检索图片操作更高效、直观。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.一种动态图片处理方法,其特征在于:包括以下步骤:
步骤100:拍摄动态图片,并在动态图片拍摄过程中进行录音;
步骤200:对录音信息进行声纹特征提取;
步骤300:将提取的声纹特征写入动态图片中,对动态图片进行声纹标注。
2.根据权利要求1所述的动态图片处理方法,其特征在于:所述步骤100还包括:将拍摄的动态图片和录音信息进行存储;所述动态图片的存储形式为缩略图形式,所述录音信息包括语音、环境音或噪音。
3.根据权利要求1所述的动态图片处理方法,其特征在于:在所述步骤200中,所述声纹特征提取方法包括以下步骤:
步骤201:检测是否有效音源数据进入;
步骤202:对进入的音源数据进行差分和滤波处理;
步骤203:对流式音源进行离散化处理;
步骤204:通过哈明窗对帧数据做加窗处理;
步骤205:通过快速傅氏变换将时域音源转为频域能量;
步骤206:对音源进行带通滤波与声纹特征提取。
4.根据权利要求1或2所述的动态图片处理系统,其特征在于:在所述步骤300中,所述将提取的声纹特征写入动态图片中的写入方式为:读取存储的动态图片,将提取的声纹特征以序列化的方式写入动态图片的指定文件数据节点。
5.根据权利要求4所述的动态图片处理系统,其特征在于:所述步骤300后还包括:根据声纹特征对声纹标注后的动态图片进行归类并存储;所述归类方式包括语音特征归类、环境音特征归类或噪声特征归类。
6.根据权利要求5所述的动态图片处理系统,其特征在于:所述步骤300后还包括:通过语音输入或者归类查找方式检索具有特定声纹特征的动态图片。
7.一种动态图片处理系统,其特征在于,包括拍摄模块、录音模块、声纹提取模块和声纹标注模块;所述拍摄模块用于拍摄动态图片;所述录音模块用于在动态图片拍摄过程中进行录音;所述声纹提取模块用于对录音信息进行声纹特征提取;所述声纹标注模块用于将提取的声纹特征写入动态图片中,对动态图片进行声纹标注。
8.根据权利要求7所述的动态图片处理系统,其特征在于:所述声纹提取模块包括端点检测单元、预加重单元、音频分帧单元、加窗单元、音源转换单元和滤波单元;
所述端点检测单元用于检测是否有效音源数据进入;
所述预加重单元用于对进入的音源数据进行差分和滤波处理;
所述音频分帧单元用于对流式音源进行离散化处理;
所述加窗单元用于通过哈明窗对帧数据做加窗处理;
所述音源转换单元用于通过快速傅氏变换将时域音源转为频域能量;
所述滤波单元用于对音源进行带通滤波与声纹特征提取。
9.根据权利要求8所述的动态图片处理系统,其特征在于:还包括存储模块,所述存储模块用于将拍摄的动态图片和录音信息进行存储。
10.根据权利要求9所述的动态图片处理系统,其特征在于:还包括归类模块和检索模块,所述归类模块用于根据声纹特征对声纹标注后的动态图片进行归类并存储;所述归类模块的归类方式包括语音特征归类、环境音特征归类或噪声特征归类;所述检索模块用于通过语音输入或者归类查找方式检索具有特定声纹特征的动态图片。
CN201610196491.0A 2016-03-31 2016-03-31 一种动态图片处理方法及系统 Pending CN106095764A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201610196491.0A CN106095764A (zh) 2016-03-31 2016-03-31 一种动态图片处理方法及系统
PCT/CN2016/088859 WO2017166483A1 (zh) 2016-03-31 2016-07-06 一种动态图片处理方法及系统
US15/245,743 US20170287524A1 (en) 2016-03-31 2016-08-24 Method and electronic device for processing dynamic image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610196491.0A CN106095764A (zh) 2016-03-31 2016-03-31 一种动态图片处理方法及系统

Publications (1)

Publication Number Publication Date
CN106095764A true CN106095764A (zh) 2016-11-09

Family

ID=58702491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610196491.0A Pending CN106095764A (zh) 2016-03-31 2016-03-31 一种动态图片处理方法及系统

Country Status (2)

Country Link
CN (1) CN106095764A (zh)
WO (1) WO2017166483A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108124479A (zh) * 2017-12-29 2018-06-05 深圳前海达闼云端智能科技有限公司 地图标注的方法、装置、云端服务器、终端及应用程序
CN108281147A (zh) * 2018-03-31 2018-07-13 南京火零信息科技有限公司 基于lpcc和adtw的声纹识别系统
WO2018170663A1 (zh) * 2017-03-20 2018-09-27 深圳前海达闼云端智能科技有限公司 图像标注方法、装置及电子设备
CN109361858A (zh) * 2018-10-29 2019-02-19 北京小米移动软件有限公司 获取图像的方法、装置、电子设备及存储介质
CN110647635A (zh) * 2019-09-29 2020-01-03 维沃移动通信有限公司 一种图像管理方法及电子设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750773B (zh) * 2019-09-16 2023-08-18 康佳集团股份有限公司 一种基于声纹属性的图像识别方法、智能终端及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1728131A (zh) * 2004-07-29 2006-02-01 鸿富锦精密工业(深圳)有限公司 声音影像控制装置及方法
CN101102240A (zh) * 2006-07-04 2008-01-09 王建波 一种音频、视频内容的采集方法和检索方法
CN102301698A (zh) * 2009-01-29 2011-12-28 日本电气株式会社 时间分段表示特征矢量生成设备
CN103035247A (zh) * 2012-12-05 2013-04-10 北京三星通信技术研究有限公司 基于声纹信息对音频/视频文件进行操作的方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150371629A9 (en) * 2005-01-03 2015-12-24 Luc Julia System and method for enabling search and retrieval operations to be performed for data items and records using data obtained from associated voice files
CN102609968B (zh) * 2012-03-05 2015-06-24 深圳市优利麦克科技开发有限公司 实现有声图片的方法及系统
CN103035020A (zh) * 2012-11-23 2013-04-10 惠州Tcl移动通信有限公司 移动终端及其图片备注方法
CN104298694A (zh) * 2013-07-19 2015-01-21 深圳市康睿祥通讯有限公司 一种照片信息添加方法、装置及移动终端
TW201513095A (zh) * 2013-09-23 2015-04-01 Hon Hai Prec Ind Co Ltd 語音處理系統、裝置及方法
CN105677799A (zh) * 2015-12-31 2016-06-15 宇龙计算机通信科技(深圳)有限公司 一种照片检索方法与系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1728131A (zh) * 2004-07-29 2006-02-01 鸿富锦精密工业(深圳)有限公司 声音影像控制装置及方法
CN101102240A (zh) * 2006-07-04 2008-01-09 王建波 一种音频、视频内容的采集方法和检索方法
CN102301698A (zh) * 2009-01-29 2011-12-28 日本电气株式会社 时间分段表示特征矢量生成设备
CN103035247A (zh) * 2012-12-05 2013-04-10 北京三星通信技术研究有限公司 基于声纹信息对音频/视频文件进行操作的方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018170663A1 (zh) * 2017-03-20 2018-09-27 深圳前海达闼云端智能科技有限公司 图像标注方法、装置及电子设备
US11321583B2 (en) 2017-03-20 2022-05-03 Cloudminds Robotics Co., Ltd. Image annotating method and electronic device
CN108124479A (zh) * 2017-12-29 2018-06-05 深圳前海达闼云端智能科技有限公司 地图标注的方法、装置、云端服务器、终端及应用程序
CN108281147A (zh) * 2018-03-31 2018-07-13 南京火零信息科技有限公司 基于lpcc和adtw的声纹识别系统
CN109361858A (zh) * 2018-10-29 2019-02-19 北京小米移动软件有限公司 获取图像的方法、装置、电子设备及存储介质
CN110647635A (zh) * 2019-09-29 2020-01-03 维沃移动通信有限公司 一种图像管理方法及电子设备

Also Published As

Publication number Publication date
WO2017166483A1 (zh) 2017-10-05

Similar Documents

Publication Publication Date Title
CN106095764A (zh) 一种动态图片处理方法及系统
CN103035247B (zh) 基于声纹信息对音频/视频文件进行操作的方法及装置
CN101202864B (zh) 动画再现装置
Mezei et al. Drone sound detection
CN105957531B (zh) 基于云平台的演讲内容提取方法及装置
CN107240047A (zh) 一种教学视频的学分评估方法和装置
JP2007519987A (ja) 内部及び外部オーディオビジュアルデータの統合解析システム及び方法
Khan et al. A novel audio forensic data-set for digital multimedia forensics
CN108831456B (zh) 一种通过语音识别对视频标记的方法、装置及系统
US20090031425A1 (en) Methods, systems, and computer program products for detecting alteration of audio or image data
CN106409298A (zh) 一种声音重录攻击的识别方法
KR20160047485A (ko) 사운드 태그들에 기초하여 데이터 아이템들을 분류하기 위한 방법 및 장치
CN102067589A (zh) 数字录像机系统及其应用方法
CN107507626A (zh) 一种基于语音频谱融合特征的手机来源识别方法
Koenig et al. Forensic authentication of digital audio recordings
JP6046393B2 (ja) 情報処理装置、情報処理システム、情報処理方法および記録媒体
CN104298694A (zh) 一种照片信息添加方法、装置及移动终端
US9420204B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
CN112257709A (zh) 一种招牌照片审核方法、装置、电子设备及可读存储介质
CN111860523A (zh) 一种声像档案的智能著录系统与方法
CN107274912B (zh) 一种手机录音的设备来源辨识方法
CN110189767B (zh) 一种基于双声道音频的录制移动设备检测方法
CN113255438B (zh) 一种结构化的录像文件标记方法、系统、主机及存储介质
Narkhede et al. Acoustic scene identification for audio authentication
CN112560811B (zh) 端到端的音视频抑郁症自动检测研究方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161109