CN108846106A - 一种判断多个音频中是否存在相同音频的方法和装置 - Google Patents
一种判断多个音频中是否存在相同音频的方法和装置 Download PDFInfo
- Publication number
- CN108846106A CN108846106A CN201810644754.9A CN201810644754A CN108846106A CN 108846106 A CN108846106 A CN 108846106A CN 201810644754 A CN201810644754 A CN 201810644754A CN 108846106 A CN108846106 A CN 108846106A
- Authority
- CN
- China
- Prior art keywords
- audio
- slope
- audios
- amplitude
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本发明提供了一种判断多个音频中是否存在相同音频的方法和装置,所述方法包括如下步骤:获取多个音频;分别对所述多个音频进行采样并分别获得各音频对应的若干样本点;分别检测各音频对应的若干样本点的幅度值,并根据所述幅度值计算单位时间内对应音频中样本点的幅度的斜率;对比多个音频中样本点的幅度的斜率或斜率的倍率,若存在至少两个音频中样本点的幅度的斜率或斜率成倍率关系,且幅度的斜率相同或斜率呈倍率关系的样本点的比例不少于预设阈值,则判断所述至少两个音频为相同的音频。本发明通过对多个音频进行采样,再计算采样点的斜率并以此判断是否为相同音频的过程,不仅能够减少人力,而且还极大的提高音频判断的效率和精确率。
Description
技术领域
本发明涉及音频处理技术领域,尤其涉及一种判断多个音频中是否存在相同音频的方法和装置。
背景技术
在存储设备(如Hard Disk,SSD等)中,常常出现同一个音频档案存放在存储设备中的不同位置的情况,因此会造成存储空间的浪费,如何将这类相同的音频档案一一辨别出,以帮助管理者是否删除相同的多余的音频档案仅留其一,从而避免存储设备空间的浪费,成为一大难题。
一般来说在存储设备中要辨别出同一个音频档案,通常最简单的方式是看音频档案的命名是否相同或类似,并判断这些命名相同或类似的音频档案的大小是否也一致,如果音频档案的命名相同或类似且其大小也一致,再由人工一一检查来断定哪些是相同的音频档案。然而上述过程都是人工决定及操作,如果命名相同或类似且其大小也一致的音频档案的数量众多,这对于管理者来说更是难上加难。
发明内容
本发明针对现有方式的缺点,提出一种判断多个音频中是否存在相同音频的方法和装置,用以解决现有技术存在的上述问题。
根据本发明的第一个方面,提供了一种判断多个音频中是否存在相同音频的方法,包括如下步骤:
获取多个音频;
分别对所述多个音频进行采样并分别获得各音频对应的若干样本点;
分别检测各音频对应的若干样本点的幅度值,并根据所述幅度值计算单位时间内对应音频中样本点的幅度的斜率;
对比多个音频中样本点的幅度的斜率或斜率的倍率,多个音频中若存在至少两个音频的样本点的幅度的斜率相同或斜率成倍率关系,且幅度的斜率相同或斜率成倍率关系的样本点的比例不少于预设阈值,则判断所述多个音频中的至少两个音频为相同的音频。
进一步的,还包括,根据所述幅度值计算单位时间内对应音频中样本点的幅度的斜率的公式:
k为幅度的斜率,x[j]和x[i]分别为音频中的第j个样本和第i个样本点的幅度值,为两个样本点之间的采样时间间隔。
进一步的,还包括,判断所述多个音频中的至少两个音频为相同的音频之后,
分析所述相同的音频的内容,若其相同的内容仅为部分相同,则将这些音频归纳到一个文件夹中;
若所述相同的音频中的一个音频的内容被包含在其他音频中,且该音频的采样率低于其他音频,则删除该音频。
另一方面,本发明提供了一种判断多个音频中是否存在相同音频的装置,包括如下步骤:
获取模块,用于获取多个音频;
采样模块,用于分别对所述多个音频进行采样并分别获得各音频对应的若干样本点;
处理模块,用于分别检测各音频对应的若干样本点的幅度值,并根据所述幅度值计算单位时间内对应音频中样本点的幅度的斜率;
对比模块,用于对比多个音频中样本点的幅度的斜率或斜率的倍率,多个音频中若存在至少两个音频的幅度的斜率相同或斜率成倍率关系,且幅度的斜率相同或斜率成倍率关系的样本点的比例不少于预设阈值,则判断所述多个音频中的至少两个音频为相同的音频。
进一步的,还包括,所述处理模块根据所述幅度值计算单位时间内对应音频中样本点的幅度的斜率的公式:
k为幅度的斜率,x[j]和x[i]分别为音频中的第j个样本和第i个样本点的幅度值,为两个样本点之间的采样时间间隔。
进一步的,还包括分析模块;
所述分析模块用于分析所述相同的音频的内容,若其相同的内容仅为部分相同,则将这些音频归纳到一个文件夹中;
若所述相同的音频中的一个音频的内容被包含在其他音频中,且该音频的采样率低于其他音频,则删除该音频。
与现有技术相比,本发明的有益效果是:
1、本发明通过对多个音频进行采样,再计算采样点的斜率并以此判断是否为相同音频的过程,不仅能够减少人力,而且还极大的提高音频判断的效率和精确率;
2、本发明通过对判定为相同的音频的内容进行分析,将部分内容相同的音频归纳到一个文件夹中,或者删除全部内容被其他音频包含且采样率也低于其他音频的某一音频,以此进行归档以节约人力和存储空间。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例一中的一种判断多个音频中是否存在相同音频的方法的流程图;
图2为本发明实施例中的第一音频档案的采样率示意图;
图3为本发明实施例中的第二音频档案的采样率示意图;
图4为本发明实施例中的音量放大后的第一音频档案的采样率示意图;
图5为本发明实施例中的音量放大后的第二音频档案的采样率示意图;
图6为本发明实施例中的第一音频档案在单位时间的斜率示意图;
图7为本发明实施例中的第二音频档案在单位时间的斜率示意图;
图8为本发明实施例中的音量放大后的第一音频档案在单位时间的斜率示意图;
图9为本发明实施例中的音量放大后的第二音频档案在单位时间的斜率示意图;
图10为本发明实施例二中的一种判断多个音频中是否存在相同音频的装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分例,实施而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
实施例一
如图1所示,提供了本发明一个实施例的一种判断多个音频中是否存在相同音频的方法,其特征在于,包括如下步骤:
A101获取多个音频;
A102分别对多个音频进行采样并分别获得各音频对应的若干样本点;
A103分别检测各音频对应的若干样本点的幅度值,并根据幅度值计算单位时间内对应音频中样本点的幅度的斜率;
根据幅度值计算单位时间内对应音频中样本点的幅度的斜率的公式:
k为幅度的斜率,x[j]和x[i]分别为音频中的第j个样本和第i个样本点的幅度值,为两个样本点之间的采样时间间隔。
A104对比多个音频中样本点的幅度的斜率或斜率的倍率,多个音频中若存在至少两个音频的样本点的幅度的斜率相同或斜率成倍率关系,且幅度的斜率相同或斜率成倍率关系的样本点的比例不少于预设阈值,则判断多个音频中的至少两个音频为相同的音频。
如图2-3所示,为两个不同采样率的音频档案的采样率示意图,虽然第一音频和第二音频的内容一致,但第一音频档案的采样率要高于第二音频的采样率;如图4-5所示,将第一音频和第二音频的音量放大到3倍后分别观察它们的采样率;再分别获取图2-5中音频档案的斜率,依次如图6-9所示,可知图6和图7中音频档案在单位时间内的斜率一致,由于截图的时间不是单位时间,故不能直观判断图6和图7中音频档案在单位时间内有相同的斜率,下文中的图8和图9同理;图8和图9中音频档案在单位时间内的斜率一致,且图6和图8中音频档案的斜率成倍率关系,图7和图9中音频档案的斜率成倍率关系,因此,判断两个以上音频档案的内容是否一致,不在于它们之间的采样率和音量大小,而是在于它们的斜率是否一致或者成倍率关系。
在确定至少两个音频为相同的音频之后,对这些相同的音频进行分析:
第一、如果这些音频档案中的相同内容仅为部分相同,则将这些音频归纳到一个文件夹中并命名文件夹;
第二、如果这些音频档案中的某一音频档案的全部内容被包含在其他单一音频档案的内容中,且该音频的采样率低于该其他单一音频档案的采样率,则删除该音频档案。
本实施例的优点如下:
1、本发明通过对多个音频进行采样,再计算采样点的斜率并以此判断是否为相同音频的过程,不仅能够减少人力,而且还极大的提高音频判断的效率和精确率;
2、本发明通过对判别为相同的音频的内容分析,将部分内容相同的音频归纳到一个文件夹中,或者删除全部内容被其他音频包含且采样率也低于其他音频的某一音频,以此进行归档以节约人力和空间。
实施例二
如图10所示,提供了本发明另一个实施例的一种判断多个音频中是否存在相同音频的装置,包括:
获取模块A201,用于获取多个音频;
采样模块A202,用于分别对多个音频进行采样并分别获得各音频对应的若干样本点;
处理模块A203,用于分别检测各音频对应的若干样本点的幅度值,并根据幅度值计算单位时间内对应音频中样本点的幅度的斜率;
处理模块根据幅度值计算单位时间内对应音频中样本点的幅度的斜率的公式:
k为幅度的斜率,x[j]和x[i]分别为音频中的第j个样本和第i个样本点的幅度值,为两个样本点之间的采样时间间隔。
对比模块A204,用于对比多个音频中样本点的幅度的斜率或斜率的倍率,多个音频中若存在至少两个音频的样本点的幅度的斜率相同或斜率成倍率关系,且幅度的斜率相同或斜率成倍率关系的样本点的比例不少于预设阈值,则判断多个音频中的至少两个音频为相同的音频。
在对比模块A204判断多个音频中的至少两个音频为相同的音频之后,分析模块对这些相同的音频进行分析:
第一、如果这些音频中的相同内容仅为部分相同,则将这些音频归纳到一个文件夹中;
第二、如果这些音频中的某一音频档案的全部内容被包含在其他单一音频档案的内容中,且该音频的采样率低于其他音频档案的,则删除该音频档案。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的模块、相关工作单元和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的2个实施例中,应该理解到,所揭露的方法、系统、装置、模块和/或单元,可以通过其它的方式实现。例如,以上所描述的方法实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (6)
1.一种判断多个音频中是否存在相同音频的方法,其特征在于,包括如下步骤:
获取多个音频;
分别对所述多个音频进行采样并分别获得各音频对应的若干样本点;
分别检测各音频对应的若干样本点的幅度值,并根据所述幅度值计算单位时间内对应音频中样本点的幅度的斜率;
对比多个音频中样本点的幅度的斜率或斜率的倍率,多个音频中若存在至少两个音频的样本点的幅度的斜率相同或斜率成倍率关系,且幅度的斜率相同或斜率成倍率关系的样本点的比例不少于预设阈值,则判断所述多个音频中的至少两个音频为相同的音频。
2.根据权利要求1所述的方法,其特征在于,还包括,根据所述幅度值计算单位时间内对应音频中样本点的幅度的斜率的公式:
k为幅度的斜率,x[j]和x[i]分别为音频中的第j个样本和第i个样本点的幅度值,为两个样本点之间的采样时间间隔。
3.根据权利要求1或2所述的方法,其特征在于,还包括,判断所述多个音频中的至少两个音频为相同的音频之后,
分析所述相同的音频的内容,若其相同的内容仅为部分相同,则将这些音频归纳到一个文件夹中;
若所述相同的音频中的一个音频的内容被包含在其他音频中,且该音频的采样率低于其他音频,则删除该音频。
4.一种判断多个音频中是否存在相同音频的装置,其特征在于,包括:
获取模块,用于获取多个音频;
采样模块,用于分别对所述多个音频进行采样并分别获得各音频对应的若干样本点;
处理模块,用于分别检测各音频对应的若干样本点的幅度值,并根据所述幅度值计算单位时间内对应音频中样本点的幅度的斜率;
对比模块,用于对比多个音频中样本点的幅度的斜率或斜率的倍率,多个音频中若存在的至少两个音频的样本点的幅度的斜率或斜率成倍率关系,且幅度的斜率相同或斜率成倍率关系的样本点的比例不少于预设阈值,则确定判断所述多个音频中的至少两个音频为相同的音频。
5.根据权利要求4所述的装置,其特征在于,还包括,所述处理模块根据所述幅度值计算单位时间内对应音频中样本点的幅度的斜率的公式:
k为幅度的斜率,x[j]和x[i]分别为音频中的第j个样本和第i个样本点的幅度值,为两个样本点之间的采样时间间隔。
6.根据权利要求4或5所述的装置,其特征在于,还包括分析模块;
所述分析模块用于分析所述相同的音频的内容,若其相同的内容仅为部分相同,则将这些音频归纳到一个文件夹中;
若所述相同的音频中的一个音频的内容被包含在其他音频中,且该音频的采样率低于其他音频,则删除该音频。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810644754.9A CN108846106A (zh) | 2018-06-21 | 2018-06-21 | 一种判断多个音频中是否存在相同音频的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810644754.9A CN108846106A (zh) | 2018-06-21 | 2018-06-21 | 一种判断多个音频中是否存在相同音频的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108846106A true CN108846106A (zh) | 2018-11-20 |
Family
ID=64203289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810644754.9A Pending CN108846106A (zh) | 2018-06-21 | 2018-06-21 | 一种判断多个音频中是否存在相同音频的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108846106A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829265A (zh) * | 2019-01-30 | 2019-05-31 | 杭州拾贝知识产权服务有限公司 | 一种音频作品的侵权取证方法和系统 |
CN110971914A (zh) * | 2019-11-22 | 2020-04-07 | 北京凯视达科技有限公司 | 一种在时间轴模式下动态节省视音频解码资源的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1996307A (zh) * | 2000-07-31 | 2007-07-11 | 兰德马克数字服务公司 | 用于从媒体样本辨认媒体实体的方法 |
WO2010061294A2 (en) * | 2008-11-25 | 2010-06-03 | Musicmyne Ab | Media data compilation method and system |
CN106094598A (zh) * | 2016-08-10 | 2016-11-09 | 广州奥迪威传感应用科技有限公司 | 声控开关控制方法、系统及声控开关 |
CN108021635A (zh) * | 2017-11-27 | 2018-05-11 | 腾讯科技(深圳)有限公司 | 一种音频相似度的确定方法、装置和存储介质 |
CN108140402A (zh) * | 2015-10-01 | 2018-06-08 | 穆迪利泽股份公司 | 音频内容的动态修改 |
-
2018
- 2018-06-21 CN CN201810644754.9A patent/CN108846106A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1996307A (zh) * | 2000-07-31 | 2007-07-11 | 兰德马克数字服务公司 | 用于从媒体样本辨认媒体实体的方法 |
WO2010061294A2 (en) * | 2008-11-25 | 2010-06-03 | Musicmyne Ab | Media data compilation method and system |
CN108140402A (zh) * | 2015-10-01 | 2018-06-08 | 穆迪利泽股份公司 | 音频内容的动态修改 |
CN106094598A (zh) * | 2016-08-10 | 2016-11-09 | 广州奥迪威传感应用科技有限公司 | 声控开关控制方法、系统及声控开关 |
CN108021635A (zh) * | 2017-11-27 | 2018-05-11 | 腾讯科技(深圳)有限公司 | 一种音频相似度的确定方法、装置和存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829265A (zh) * | 2019-01-30 | 2019-05-31 | 杭州拾贝知识产权服务有限公司 | 一种音频作品的侵权取证方法和系统 |
CN110971914A (zh) * | 2019-11-22 | 2020-04-07 | 北京凯视达科技有限公司 | 一种在时间轴模式下动态节省视音频解码资源的方法 |
CN110971914B (zh) * | 2019-11-22 | 2022-03-08 | 北京凯视达科技股份有限公司 | 一种在时间轴模式下动态节省视音频解码资源的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101951034B1 (ko) | 순차통계 일정 오경보율 검파의 처리 속도 향상방법 | |
CN109474359A (zh) | 一种扫频方法及终端设备 | |
US20170296081A1 (en) | Frame based spike detection module | |
US9424743B2 (en) | Real-time traffic detection | |
CN108229382A (zh) | 振动信号特征提取方法、装置、存储介质和计算机设备 | |
FI107081B (fi) | Menetelmä ja järjestely osittaispurkauslähteiden lukumäärän selvittämiseksi | |
CA2369989A1 (en) | Apparatus and method for a digital, wideband, intercept and analysis processor for frequency hopping signals | |
CN105640545A (zh) | 一种胎儿心电信号提取方法及装置 | |
US20160322064A1 (en) | Method and apparatus for signal extraction of audio signal | |
CN108846106A (zh) | 一种判断多个音频中是否存在相同音频的方法和装置 | |
CN106569129A (zh) | 电机安全检测方法及系统和电机控制系统 | |
CN106646034A (zh) | 一种避雷器结构健康在线监测分析系统 | |
CN106850511B (zh) | 识别访问攻击的方法及装置 | |
CN105306439A (zh) | 一种基于决策树自修复的特征规则检测方法 | |
CN101841155A (zh) | 用于电力系统暂态稳定分析的典型故障集识别方法 | |
US7459962B2 (en) | Transient signal detection algorithm using order statistic filters applied to the power spectral estimate | |
CN107743292B (zh) | 一种音频电路的故障自动检测方法 | |
WO2002095633A3 (en) | Method and apparatus for determining the health of a component using condition indicators | |
CN110853677A (zh) | 歌曲的鼓声节拍识别方法、装置、终端和非临时性计算机可读存储介质 | |
US8175829B2 (en) | Analyzer for signal anomalies | |
CN105911153B (zh) | 一种基于移动窗函数的信号分离与去噪方法及装置 | |
CN105721090B (zh) | 一种非法调频广播电台的检测和识别方法 | |
CN108646091A (zh) | 一种多分量多项式相位信号的分离方法 | |
CN107271204B (zh) | 非等幅域值数据压缩方法及装置 | |
CN114818830A (zh) | 一种基于图谱的放电类型识别方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181120 |