CN117275494A - 音频水印嵌入方法、音频水印提取方法和音频检测方法 - Google Patents

音频水印嵌入方法、音频水印提取方法和音频检测方法 Download PDF

Info

Publication number
CN117275494A
CN117275494A CN202311550729.1A CN202311550729A CN117275494A CN 117275494 A CN117275494 A CN 117275494A CN 202311550729 A CN202311550729 A CN 202311550729A CN 117275494 A CN117275494 A CN 117275494A
Authority
CN
China
Prior art keywords
watermark
audio
target
frequency spectrum
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311550729.1A
Other languages
English (en)
Other versions
CN117275494B (zh
Inventor
李龙晨
游华章
张洁
许震洪
沈东生
支洪平
雷琴辉
刘俊峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iflytek Suzhou Technology Co Ltd
Original Assignee
Iflytek Suzhou Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iflytek Suzhou Technology Co Ltd filed Critical Iflytek Suzhou Technology Co Ltd
Priority to CN202311550729.1A priority Critical patent/CN117275494B/zh
Publication of CN117275494A publication Critical patent/CN117275494A/zh
Application granted granted Critical
Publication of CN117275494B publication Critical patent/CN117275494B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明提供一种音频水印嵌入方法、音频水印提取方法和音频检测方法,涉及音频处理技术领域。其中音频水印嵌入方法包括:确定待嵌入水印的目标音频,并获取待嵌入的目标水印;将所述目标水印嵌入所述目标音频对应的音频频谱中,得到嵌入水印的目标频谱;将所述目标频谱转换为时域的音频信号;其中,所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。本发明可以避免水印被篡改、删除和攻击,进而提高音频水印的安全性和可靠性。

Description

音频水印嵌入方法、音频水印提取方法和音频检测方法
技术领域
本发明涉及音频处理技术领域,尤其涉及一种音频水印嵌入方法、音频水印提取方法和音频检测方法。
背景技术
随着音频处理技术的快速发展,人们对于音频的要求越来越高,相应的,对于音频版权的意识也越来越强。因此,为了标识音频的所有者或创作者,需要在音频中嵌入水印。
目前,将明文水印直接嵌入至音频信号。然而,仅仅将明文水印嵌入至音频信号,该明文水印容易被篡改、删除和攻击,导致音频的所有者或创作者无法证明该音频是否为自己的音频,即导致音频水印的安全性和可靠性降低。
发明内容
本发明提供一种音频水印嵌入方法、音频水印提取方法、音频检测方法、装置、电子设备和存储介质,用以解决现有技术中音频水印的安全性和可靠性低的缺陷。
本发明提供一种音频水印嵌入方法,包括:
确定待嵌入水印的目标音频,并获取待嵌入的目标水印;
将所述目标水印嵌入所述目标音频对应的音频频谱中,得到嵌入水印的目标频谱;
将所述目标频谱转换为时域的音频信号;
其中,所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
根据本发明提供的一种音频水印嵌入方法,在所述目标水印包括预设的明文水印和调音参数水印的情况下,所述将所述目标水印嵌入所述目标音频对应的音频频谱中,得到嵌入水印的目标频谱,包括:
从所述目标音频对应的音频频谱中确定出待嵌入水印的第一频谱,以及所述第一频谱之外的第二频谱;
基于用于控制水印嵌入强度的第一水印嵌入系数,将所述明文水印嵌入所述第一频谱中,得到嵌入所述明文水印的第一目标频谱;
基于用于控制水印嵌入强度的第二水印嵌入系数,将所述调音参数水印嵌入所述第一目标频谱中,得到嵌入所述调音参数水印的第二目标频谱;
基于所述第二频谱和所述第二目标频谱的聚合结果,确定嵌入水印的目标频谱。
根据本发明提供的一种音频水印嵌入方法,在所述目标水印还包括隐写水印的情况下,所述基于所述第二频谱和所述第二目标频谱的聚合结果,确定嵌入水印的目标频谱,包括:
基于所述第二频谱和所述第二目标频谱的聚合结果,确定嵌入水印的第三目标频谱;
基于用于控制水印嵌入强度的第三水印嵌入系数,将所述隐写水印嵌入所述第三目标频谱中,得到嵌入水印的目标频谱。
根据本发明提供的一种音频水印嵌入方法,所述从所述目标音频对应的音频频谱中确定出待嵌入水印的第一频谱,以及所述第一频谱之外的第二频谱,包括:
基于多个预设频段,对所述目标音频对应的音频频谱进行多频段筛选,得到所述多个预设频段中至少一个第一预设频段对应的所述第一频谱和所述多个预设频段中至少一个第二预设频段对应的所述第二频谱;
其中,所述第一预设频段大于所述第二预设频段。
本发明还提供一种音频水印提取方法,包括:
获取待提取水印的音频信号,并将所述音频信号转换为频域的目标音频频谱;
基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到音频水印;
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
本发明还提供一种音频检测方法,包括:
获取待提取水印的待检测音频,并将所述待检测音频转换为频域的目标音频频谱;
基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到待检测水印;
基于所述目标水印与所述待检测水印的差异程度,确定所述待检测音频是否为所述目标音频;
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
本发明还提供一种音频水印嵌入装置,包括:
水印获取模块,用于确定待嵌入水印的目标音频,并获取待嵌入的目标水印;
水印嵌入模块,用于将所述目标水印嵌入所述目标音频对应的音频频谱中,得到嵌入水印的目标频谱;
频谱转换模块,用于将所述目标频谱转换为时域的音频信号;
其中,所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
本发明还提供一种音频水印提取装置,包括:
信号获取模块,用于获取待提取水印的音频信号,并将所述音频信号转换为频域的目标音频频谱;
水印提取模块,用于基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到音频水印;
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
本发明还提供一种音频检测装置,包括:
音频获取模块,用于获取待提取水印的待检测音频,并将所述待检测音频转换为频域的目标音频频谱;
水印检测模块,用于基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到待检测水印;
音频确定模块,用于基于所述目标水印与所述待检测水印的差异程度,确定所述待检测音频是否为所述目标音频;
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述音频水印嵌入方法,或者实现如上述任一种所述音频水印提取方法,或者实现如上述任一种所述音频检测方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述音频水印嵌入方法,或者实现如上述任一种所述音频水印提取方法,或者实现如上述任一种所述音频检测方法。
本发明提供的音频水印嵌入方法、音频水印提取方法、音频检测方法、装置、电子设备和存储介质,将目标水印嵌入目标音频对应的音频频谱中,得到嵌入水印的目标频谱,且目标水印包括预设的明文水印、调音参数水印和隐写水印中的至少两种,或者,目标水印包括调音参数水印和隐写水印中的至少一种,从而不是仅将明文水印进行嵌入,而是可以嵌入对目标音频对应的调音参数进行加密得到的调音参数水印,和/或,可以嵌入基于预设的隐写信息确定的隐写水印,从而可以避免水印被篡改、删除和攻击,进而提高音频水印的安全性和可靠性;同时,可以嵌入对目标音频对应的调音参数进行加密得到的调音参数水印,以将目标音频的调音参数作为水印嵌入,确保传输目标音频的同时可以传输调音参数,且将加密的调音参数作为水印嵌入,可以避免水印被篡改、删除和攻击,并避免调音参数被篡改、删除和攻击,从而提高调音参数的安全性和可靠性;同时,本发明是在频域上完成水印嵌入操作的,相比直接在时域上进行水印嵌入操作而言,本发明更容易完成水印嵌入操作,且在将目标频谱转换为时域的音频信号后,嵌入的水印不会在音频信号中直接表现出来,从而提高水印的安全性和可靠性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的音频水印嵌入方法的流程示意图之一;
图2为本发明提供的音频水印嵌入方法的流程示意图之二;
图3为本发明提供的音频水印提取方法的流程示意图;
图4为本发明提供的音频检测方法的流程示意图;
图5为本发明提供的音频水印嵌入装置的结构示意图;
图6为本发明提供的音频水印提取装置的结构示意图;
图7为本发明提供的音频检测装置的结构示意图;
图8为本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着音频处理技术的快速发展,人们对于音频的要求越来越高,相应的,对于音频版权的意识也越来越强。例如,近几年来,电动汽车的市场份额在逐步增加,越来越受到广大消费者的青睐;由于电动汽车缺少引擎噪声所带来的动力感,很多主机厂或者汽车零部件供应商会通过主动声浪算法来改善车内的声品质,提高驾驶乐趣。目前,多数主动声浪算法依赖于设计好的声浪音频,主动声浪算法根据实车状态信息调整声浪音频的输出规则,以最终实现车内主动声浪的效果,因此,这些设计好的声浪音频及调音参数是创作者的辛苦杰作,创作者具有唯一的版权,需要有效的保护起来,避免被篡改或者直接盗用。因此,为了标识音频的所有者或创作者,需要在音频中嵌入水印。
目前,将明文水印直接嵌入至音频信号。然而,仅仅将明文水印嵌入至音频信号,该明文水印容易被篡改、删除和攻击,导致音频的所有者或创作者无法证明该音频是否为自己的音频,即导致音频水印的安全性和可靠性降低。
例如,CN111968654A-一种自适应混合域音频水印嵌入方法,其仅仅公开能够在相同音频信号的情况下嵌入更多的水印信息,然而,这些水印信息都是明文水印,仍存在易篡改的问题。
针对上述问题,本发明提出以下各实施例。图1为本发明提供的音频水印嵌入方法的流程示意图之一,如图1所示,该音频水印嵌入方法包括:
步骤110,确定待嵌入水印的目标音频,并获取待嵌入的目标水印。
此处,目标音频为需要嵌入水印的音频;示例性的,该目标音频为新创作的音频,即其为需要保护版权的音频。在一实施例中,该目标音频为时域上的音频信号。例如,该目标音频为汽车的主动声浪音频。
其中,所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
进一步地,目标水印包括预设的明文水印、调音参数水印和隐写水印中的至少两种。
此处,明文水印是预先设定的,即根据目标音频的所有者或创作者的标识确定,以标识目标音频的所有者或创作者。
在一具体实施例中,明文水印为频谱图,该图像频谱图为图像水印(例如“IFLYTEK”)。进一步地,获取明文水印对应的目标图像(如,x和y为图像像素的坐标),对该目标图像进行预处理以得到可以转换为频谱的图像,将预处理后的目标图像转换为频谱图。
考虑到目标音频对应的调音参数也是创作者的辛苦杰作,因此,也需要保护调音参数。基于此,基于该调音参数构建调音参数水印,以在将该调音参数水印嵌入目标音频后,在解析嵌入水印的音频信号时,同时可以解析得到该调音参数。同时,调音参数水印是对该调音参数进行加密得到的,从而攻击者无法解密(解析)得到该调音参数,从而避免该调音参数被篡改、删除和攻击。
在一具体实施例中,基于预设加密规则对该调音参数进行加密,得到调音参数水印。该预设加密规则为预先设定的加密规则,该预设加密规则只有目标音频的创作者或所有者得知,以及创作者或所有者所认证的用户得知,因此,只有得知该预设加密规则,才能解密(解析)得到该调音参数,从而避免该调音参数被篡改、删除和攻击。
示例性的,预设加密规则为将调音参数转换为预设位数的预设进制的数值数据;例如,预设位数为256位,预设进制为16进制。可以理解的是,预设加密规则可以根据实际需要设定,只要加密端和解密端均按照该预设加密规则进行加密和解密即可。
考虑到明文水印比较容易被篡改、删除和攻击,因此,可以嵌入隐写水印至目标音频,隐写水印并不会像明文水印一样显示,而是隐藏在目标音频中,因此,其他人并无法得知是否添加了隐写水印,以及隐写水印是什么,从而攻击者无法解密(解析)得到该调音参数,从而避免该调音参数被篡改、删除和攻击。
在一具体实施例中,基于预设隐写规则对隐写信息进行加密,得到隐写水印。该预设隐写规则为预先设定的隐写规则,该预设隐写规则只有目标音频的创作者或所有者得知,以及创作者或所有者所认证的用户得知,因此,只有得知该预设隐写规则,才能解密(解析)得到该隐写信息,从而避免该隐写信息被篡改、删除和攻击。
示例性的,预设隐写规则包括:将隐写信息转换为字符数组;基于预设的字符-数值转换规则,将字符数组转换为第一预设进制数值数组;将第一预设进制数值数组转换为预设位数的第二预设进制数值数组;将第二预设进制数值数组作为隐写水印。例如,预设的字符-数值转换规则为ASCII转换规则,第一预设进制为10进制,第二预设进制为二进制,预设位数为8。可以理解的是,预设隐写规则可以根据实际需要设定,只要加密端和解密端均按照该预设隐写规则进行加密和解密即可。
步骤120,将所述目标水印嵌入所述目标音频对应的音频频谱中,得到嵌入水印的目标频谱。
此处,目标音频对应的音频频谱为目标音频对应的音频信号在频域上的表示,其中音频频谱中每个频率分量对应着音频信号的不同频率成分的强度信息(例如幅度)。应理解的是,通过音频信号计算音频频谱,可以更好地理解音频信号的频谱结构。
在一具体实施例中,对音频信号进行傅里叶变换处理得到音频频谱。例如,音频信号为,t为时间,则音频频谱为/>,/>为频率。
在一具体实施例中,将目标水印与目标音频对应的音频频谱进行相加处理,得到嵌入水印的目标频谱。进一步地,基于用于控制水印嵌入强度的水印嵌入系数,将目标水印嵌入目标音频对应的音频频谱中,得到嵌入水印的目标频谱。示例性的,基于水印嵌入系数与目标水印的乘积,确定真实水印,将真实水印与目标音频对应的音频频谱进行相加处理,得到嵌入水印的目标频谱。
在目标水印包括明文水印的情况下,明文水印是基于如下步骤嵌入音频频谱中:
从目标音频对应的音频频谱中确定出待嵌入水印的第一频谱,以及第一频谱之外的第二频谱;基于用于控制水印嵌入强度的第一水印嵌入系数,将明文水印嵌入第一频谱中,得到嵌入明文水印的第一目标频谱;基于第二频谱和第一目标频谱的聚合结果,确定嵌入水印的目标频谱。
此处,第一水印嵌入系数可以是预设的值;也可以为基于用户的输入指令确定该第一水印嵌入系数,示例性的,用户根据明文水印确定第一水印嵌入系数,如明文水印可见度足够高则第一水印嵌入系数应该小点,明文水印可见度较低则第一水印嵌入系数应该大点,即明文水印可以用于指导嵌入操作,以调整明文水印的嵌入强度。该第一水印嵌入系数可以控制明文水印的嵌入强度,从而控制明文水印的可见度和鲁棒性。
示例性的,通过下述公式将明文水印嵌入第一频谱:
式中,表示第一目标频谱,/>表示第一频谱,/>表示第一水印嵌入系数,表示明文水印。换言之,将明文水印和第一频谱在相同频率的强度信息(如幅度)进行相加。
在目标水印包括调音参数水印的情况下,调音参数水印是基于如下步骤嵌入音频频谱中:
从目标音频对应的音频频谱中确定出待嵌入水印的第一频谱,以及第一频谱之外的第二频谱;基于用于控制水印嵌入强度的第二水印嵌入系数,将调音参数水印嵌入第一频谱中,得到嵌入调音参数水印的第二目标频谱;基于第二频谱和第二目标频谱的聚合结果,确定嵌入水印的目标频谱。
此处,第二水印嵌入系数可以是预设的值;也可以为基于用户的输入指令确定该第二水印嵌入系数,示例性的,用户根据调音参数水印确定第二水印嵌入系数,即调音参数水印可以用于指导嵌入操作,以调整调音参数水印的嵌入强度。该第二水印嵌入系数可以控制调音参数水印的嵌入强度,从而控制调音参数水印的可见度和鲁棒性。
示例性的,通过下述公式将调音参数水印嵌入第一频谱:
式中,表示第二目标频谱,/>表示第一频谱,/>表示第二水印嵌入系数,/>表示调音参数水印。换言之,将调音参数水印和第一频谱在相同频率的强度信息(如幅度)进行相加。
在目标水印包括隐写水印的情况下,隐写水印是基于如下步骤嵌入音频频谱中:
基于用于控制水印嵌入强度的第三水印嵌入系数,将隐写水印嵌入音频频谱中,得到嵌入水印的目标频谱。
此处,第三水印嵌入系数可以是预设的值;也可以为基于用户的输入指令确定该第三水印嵌入系数,示例性的,用户根据隐写水印确定第三水印嵌入系数,即隐写水印可以用于指导嵌入操作,以调整隐写水印的嵌入强度。该第三水印嵌入系数可以控制隐写水印的嵌入强度,从而控制隐写水印的可见度和鲁棒性。
示例性的,通过下述公式将隐写水印嵌入音频频谱:
式中,为目标频谱中的第/>个频率分量,/>为音频频谱中的第/>个频率分量,/>为隐写水印中的第/>个分量,/>为第三水印嵌入系数。为便于理解,假设音频频谱,目标频谱为/>
步骤130,将所述目标频谱转换为时域的音频信号。
在一具体实施例中,对目标频谱进行傅里叶逆变换处理得到音频信号。例如,音频信号为,t为时间,则音频信号为/>,/>为频率,/>表示目标频谱。
本发明实施例提供的音频水印嵌入方法,将目标水印嵌入目标音频对应的音频频谱中,得到嵌入水印的目标频谱,且目标水印包括预设的明文水印、调音参数水印和隐写水印中的至少两种,或者,目标水印包括调音参数水印和隐写水印中的至少一种,从而不是仅将明文水印进行嵌入,而是可以嵌入对目标音频对应的调音参数进行加密得到的调音参数水印,和/或,可以嵌入基于预设的隐写信息确定的隐写水印,从而可以避免水印被篡改、删除和攻击,进而提高音频水印的安全性和可靠性;同时,可以嵌入对目标音频对应的调音参数进行加密得到的调音参数水印,以将目标音频的调音参数作为水印嵌入,确保传输目标音频的同时可以传输调音参数,且将加密的调音参数作为水印嵌入,可以避免水印被篡改、删除和攻击,并避免调音参数被篡改、删除和攻击,从而提高调音参数的安全性和可靠性;同时,本发明是在频域上完成水印嵌入操作的,相比直接在时域上进行水印嵌入操作而言,本发明更容易完成水印嵌入操作,且在将目标频谱转换为时域的音频信号后,嵌入的水印不会在音频信号中直接表现出来,从而提高水印的安全性和可靠性。
基于上述任一实施例,图2为本发明提供的音频水印嵌入方法的流程示意图之二,如图2所示,在所述目标水印包括预设的明文水印和调音参数水印的情况下,上述步骤120包括:
步骤121,从所述目标音频对应的音频频谱中确定出待嵌入水印的第一频谱,以及所述第一频谱之外的第二频谱。
需要说明的是,音频频谱中并不是所有频率分量(频段)均需要嵌入水印,因此,先从音频频谱中确定出待嵌入水印的第一频谱,以及不需要嵌入水印的第二频谱。该第一频谱的数量可以为1个或多个,该第二频谱的数据也可以为1个或多个,但所有的第一频谱与所有的第二频谱相加为该音频频谱。
步骤122,基于用于控制水印嵌入强度的第一水印嵌入系数,将所述明文水印嵌入所述第一频谱中,得到嵌入所述明文水印的第一目标频谱。
此处,第一水印嵌入系数可以是预设的值;也可以为基于用户的输入指令确定该第一水印嵌入系数,示例性的,用户根据明文水印确定第一水印嵌入系数,如明文水印可见度足够高则第一水印嵌入系数应该小点,明文水印可见度较低则第一水印嵌入系数应该大点,即明文水印可以用于指导嵌入操作,以调整明文水印的嵌入强度。该第一水印嵌入系数可以控制明文水印的嵌入强度,从而控制明文水印的可见度和鲁棒性。
示例性的,通过下述公式将明文水印嵌入第一频谱:
式中,表示第一目标频谱,/>表示第一频谱,/>表示第一水印嵌入系数,表示明文水印。换言之,将明文水印和第一频谱在相同频率的强度信息(如幅度)进行相加。
步骤123,基于用于控制水印嵌入强度的第二水印嵌入系数,将所述调音参数水印嵌入所述第一目标频谱中,得到嵌入所述调音参数水印的第二目标频谱。
此处,第二水印嵌入系数可以是预设的值;也可以为基于用户的输入指令确定该第二水印嵌入系数,示例性的,用户根据调音参数水印确定第二水印嵌入系数,即调音参数水印可以用于指导嵌入操作,以调整调音参数水印的嵌入强度。该第二水印嵌入系数可以控制调音参数水印的嵌入强度,从而控制调音参数水印的可见度和鲁棒性。
示例性的,通过下述公式将调音参数水印嵌入第一目标频谱:
式中,表示第二目标频谱,/>表示第一目标频谱,/>表示第二水印嵌入系数,/>表示调音参数水印。换言之,将调音参数水印和第一目标频谱在相同频率的强度信息(如幅度)进行相加。
步骤124,基于所述第二频谱和所述第二目标频谱的聚合结果,确定嵌入水印的目标频谱。
需要说明的是,音频频谱划分为第一频谱和第二频谱,第一频谱嵌入水印后得到第二目标频谱,则最终得到的目标音频也需包括该第二频谱和该第二目标频谱。在一具体实施例中,聚合结果为相加结果,即将第二频谱和第二目标频谱进行相加得到目标频谱。
本发明实施例提供的音频水印嵌入方法,基于用于控制水印嵌入强度的第一水印嵌入系数,将明文水印嵌入第一频谱中,得到嵌入明文水印的第一目标频谱,基于用于控制水印嵌入强度的第二水印嵌入系数,将调音参数水印嵌入第一目标频谱中,得到嵌入调音参数水印的第二目标频谱,基于此,对目标音频对应的音频频谱进行二次水印嵌入(明文水印与加密的调音参数混合嵌入),由于第二次嵌入的调音参数水印是对目标音频对应的调音参数进行加密得到的,因此,在无法解析得到调音参数水印的情况下,自然也无法解密(解析)得到明文水印,从而可以避免明文水印被篡改、删除和攻击,进而提高音频水印的安全性和可靠性。同时,在大多数攻击中,即使采用压缩、滤波、重采样、重量化、剪切、加噪声等信号处理操作手段强行去除明文水印,同样也会丢失被加密的调音参数,基于此,也无法基于调音参数播放目标音频对应的音效效果,从而间接保护目标音频及其调音参数。
基于上述任一实施例,该方法中,在所述目标水印还包括隐写水印的情况下,上述步骤124包括:
基于所述第二频谱和所述第二目标频谱的聚合结果,确定嵌入水印的第三目标频谱;
基于用于控制水印嵌入强度的第三水印嵌入系数,将所述隐写水印嵌入所述第三目标频谱中,得到嵌入水印的目标频谱。
需要说明的是,音频频谱划分为第一频谱和第二频谱,第一频谱嵌入水印后得到第二目标频谱,则最终得到的第三目标频谱也需包括该第二频谱和该第二目标频谱。
此处,第三水印嵌入系数可以是预设的值;也可以为基于用户的输入指令确定该第三水印嵌入系数,示例性的,用户根据隐写水印确定第三水印嵌入系数,即隐写水印可以用于指导嵌入操作,以调整隐写水印的嵌入强度。该第三水印嵌入系数可以控制隐写水印的嵌入强度,从而控制隐写水印的可见度和鲁棒性。
示例性的,通过下述公式将隐写水印嵌入第三目标频谱:
式中,为目标频谱中的第/>个频率分量,/>为第三目标频谱中的第/>个频率分量,为隐写水印中的第/>个分量,/>为第三水印嵌入系数。为便于理解,假设目标频谱为
可以理解的是,将目标频谱转换为时域的音频信号,表示该音频信号嵌入了隐写信息(隐藏信息)。
本发明实施例提供的音频水印嵌入方法,在嵌入明文水印和调音参数水印之后,基于用于控制水印嵌入强度的第三水印嵌入系数,将隐写水印嵌入二次水印嵌入的第三目标频谱中,得到嵌入水印的目标频谱,由于隐写水印是基于预设的隐写信息确定的,因此可以避免水印被篡改、删除和攻击,而在无法解析得到隐写水印的情况下,自然也无法解密(解析)得到调音参数水印和明文水印,从而可以避免调音参数水印和明文水印被篡改、删除和攻击,进而进一步提高音频水印的安全性和可靠性。
基于上述任一实施例,该方法中,上述步骤121包括:
基于多个预设频段,对所述目标音频对应的音频频谱进行多频段筛选,得到所述多个预设频段中至少一个第一预设频段对应的所述第一频谱和所述多个预设频段中至少一个第二预设频段对应的所述第二频谱。
其中,所述第一预设频段大于所述第二预设频段。需要说明的是,所有第一频谱的频率均大于第二频谱的频率。
需要说明的是,考虑到人能够听到的声音频率有上限,且声音的频率也有上限,因此,将用户听不到的频段(即第一预设频段)对应的第一频谱筛选出来进行水印嵌入,从而不会影响用户听感,进而提高用户体验感。
在一具体实施例中,由于极少的声音能达到19KHZ,几乎没有任何声音能达到21KHZ,且用户听不到19KHZ-21KHZ内的声音,因此,将第一预设频段设为19KHZ-21KHZ,将第二预设频段设为0-19KHZ。
在一具体实施例中,基于多个预设频段对应的频率通道,对目标音频对应的音频频谱进行多频段筛选(多通道筛选),得到多个通道输出的频谱,该多个通道输出的频谱包括至少一个第一预设频段对应的第一频谱和至少一个第二预设频段对应的第二频谱。
示例性的,通过下述公式将调音参数水印嵌入第一目标频谱:
式中,表示第二目标频谱,/>表示第一目标频谱,/>表示第二水印嵌入系数,/>表示调音参数水印,/>表示至少一个第一预设频段,/>表示频率。上述公式描述了在选择的频率通道范围内对第一目标频谱的嵌入操作,通过将二次水印嵌入强度调节系数/>乘以二次水印频谱图(调音参数水印),并将其与主要水印频谱图/>(第一目标频谱)相加,得到经过二次水印嵌入后的频谱图/>(第二目标频谱)。对于不在选择的频率通道范围内的频率(即至少一个第二预设频段),指示函数的结果为0,不会对第一目标频谱进行修改,保持为原始的第一目标频谱。
本发明实施例提供的音频水印嵌入方法,音频频谱中并不是所有频率分量(频段)均需要嵌入水印,因此,先从音频频谱中确定出至少一个第一预设频段对应的第一频谱,以及至少一个第二预设频段对应的第二频谱,且第一预设频段大于第二预设频段,从而可以将用户听不到的频段(即第一预设频段)对应的第一频谱筛选出来进行水印嵌入,从而不会影响用户听感,在确保水印嵌入的同时提高用户体验感。
基于上述任一实施例,该方法中,所述隐写水印是基于如下步骤确定:
将所述隐写信息转换为字符数组;基于预设的字符-数值转换规则,将所述字符数组转换为十进制数值数组;将所述十进制数值数组转换为预设位数的二进制数值数组;将所述二进制数值数组作为所述隐写水印。
示例性的,假设要嵌入的隐写信息为“Copyright © 2023 iFlyTek. All rightsreserved”,预设的字符-数值转换规则为ASCII转换规则,预设位数为8,则隐写过程如下:
第一步,将隐写信息转换为字符数组
第二步,将字符数组转换为十进制数值数组(ASCII码数组)A,该十进制数值数组A如下所示:
第三步,将十进制数值数组转换为8位数的二进制数值数组B,即将每个ASCII码转换为8位二进制,该二进制数值数组B如下所示:
B={01000001,01100011,01110010,01100011,01100111,…,00101110};
第四步,将二进制数值数组作为隐写水印,以将二进制数值数组中各二进制位嵌入到音频频谱的适当位置,具体嵌入到哪个位置可以根据实际需要进行设定。
示例性的,通过下述公式将隐写水印嵌入音频频谱:
式中,为目标频谱中的第/>个频率分量,/>为音频频谱中的第/>个频率分量,/>为隐写水印中的第/>个二进制数值,/>为第三水印嵌入系数。为便于理解,假设音频频谱,目标频谱为/>
可以理解的是,预设位数和预设的字符-数值转换规则可以根据实际需要设定,只要加密端和解密端均按照相同的预设规则进行加密和解密即可。
本发明实施例提供的音频水印嵌入方法,通过上述方式对隐写信息进行加密,得到隐写水印,从而可以避免水印被篡改、删除和攻击,进而提高音频水印的安全性和可靠性,且上述加密方式只有目标音频的创作者或所有者得知,以及创作者或所有者所认证的用户得知,因此,只有得知该加密方式,才能解密(解析)得到该隐写信息,从而避免该隐写信息被篡改、删除和攻击。
基于上述任一实施例中,该方法中,所述调音参数水印是基于如下步骤确定:
基于预设加密规则对所述调音参数进行加密,得到加密数据;将所述加密数据转换为频域的所述调音参数水印。
此处,该预设加密规则为预先设定的加密规则,该预设加密规则只有目标音频的创作者或所有者得知,以及创作者或所有者所认证的用户得知,因此,只有得知该预设加密规则,才能解密(解析)得到该调音参数,从而避免该调音参数被篡改、删除和攻击。
示例性的,预设加密规则为将调音参数转换为预设位数的预设进制的数值数据;例如,预设位数为256位,预设进制为16进制,即将调音参数转换为256位的16进制数据,再将该256位的16进制数据转换为频域表示。其中,将调音参数转换为256位的16进制数据也是根据预设转换规则进行转换的,该预设转换规则可以根据实际需要设定,只要加密端和解密端均按照该预设转换规则进行加密和解密即可。
可以理解的是,预设加密规则可以根据实际需要设定,只要加密端和解密端均按照该预设加密规则进行加密和解密即可。
本发明实施例提供的音频水印嵌入方法,通过上述方式对调音参数进行加密,得到调音参数水印,从而可以避免水印被篡改、删除和攻击,进而提高音频水印的安全性和可靠性,且上述预设加密规则只有目标音频的创作者或所有者得知,以及创作者或所有者所认证的用户得知,因此,只有得知该预设加密规则,才能解密(解析)得到该调音参数,从而避免该调音参数被篡改、删除和攻击。
基于上述音频水印嵌入方法的任一实施例,考虑到将音频水印嵌入目标音频后,还需要将水印提取出来,以验证音频的所有者或创作者。基于此,本发明还提供一种音频水印提取方法,图3为本发明提供的音频水印提取方法的流程示意图,如图3所示,该音频水印提取方法包括:
310,获取待提取水印的音频信号,并将所述音频信号转换为频域的目标音频频谱。
此处,音频信号为需要提取水印的音频,该音频信号为时域上的音频信号。由于上述是在频谱上进行水印嵌入的,即上述是进行频谱重构的,因此,在提取水印时需要将音频信号转换为频域的目标音频频谱。
在一具体实施例中,对音频信号进行傅里叶变换处理得到音频频谱。例如,音频信号为,t为时间,则目标音频频谱为/>
320,基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到音频水印。
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
此处,目标水印如何嵌入音频频谱具体参见上述音频水印嵌入方法的各实施例,此处不再一一赘述。
需要说明的是,需要基于与上述音频水印嵌入方法的嵌入规则(水印加密规则)对应的提取规则(水印解密规则),才能提取得到目标水印,否则提取的音频水印与目标水印并不相同。可以理解的是,水印提取的过程需要逆向操作,将嵌入的水印从重构的音频信号中恢复出来。
在一具体实施例中,若水印嵌入规则为:将目标水印与目标音频对应的音频频谱进行相加处理,得到嵌入水印的目标频谱;相应地,将目标音频频谱与目标音频对应的音频频谱进行相减处理,得到音频水印。进一步地,若水印嵌入规则为:基于用于控制水印嵌入强度的水印嵌入系数,将目标水印嵌入目标音频对应的音频频谱中,得到嵌入水印的目标频谱;相应地,基于音频频谱和水印嵌入系数,对目标音频频谱进行水印提取,得到音频水印。示例性的,若水印嵌入规则为:基于水印嵌入系数与目标水印的乘积,确定真实水印,将真实水印与目标音频对应的音频频谱进行相加处理,得到嵌入水印的目标频谱;相应地,将目标音频频谱与目标音频对应的音频频谱进行相减处理,得到子音频水印,将子音频水印与水印嵌入系数进行相除处理,得到音频水印。
在目标水印包括明文水印的情况下,若明文水印是基于如下步骤嵌入音频频谱中:从目标音频对应的音频频谱中确定出待嵌入水印的第一频谱,以及第一频谱之外的第二频谱;基于用于控制水印嵌入强度的第一水印嵌入系数,将明文水印嵌入第一频谱中,得到嵌入明文水印的第一目标频谱;基于第二频谱和第一目标频谱的聚合结果,确定嵌入水印的目标频谱;相应地,从目标音频频谱中确定出待提取水印的第一目标频谱,以及第一目标频谱之外的第二频谱,基于音频频谱和第一水印嵌入系数,对第一目标频谱进行水印提取,得到音频水印。
在目标水印包括调音参数水印的情况下,若调音参数水印是基于如下步骤嵌入音频频谱中:从目标音频对应的音频频谱中确定出待嵌入水印的第一频谱,以及第一频谱之外的第二频谱;基于用于控制水印嵌入强度的第二水印嵌入系数,将调音参数水印嵌入第一频谱中,得到嵌入调音参数水印的第二目标频谱;基于第二频谱和第二目标频谱的聚合结果,确定嵌入水印的目标频谱;相应地,从目标音频频谱中确定出待提取水印的第一目标频谱,以及第一目标频谱之外的第二频谱,基于音频频谱和第二水印嵌入系数,对第一目标频谱进行水印提取,得到音频水印。
在目标水印包括隐写水印的情况下,若隐写水印是基于如下步骤嵌入音频频谱中:
基于用于控制水印嵌入强度的第三水印嵌入系数,将隐写水印嵌入音频频谱中,得到嵌入水印的目标频谱;相应地,基于音频频谱和第三水印嵌入系数,对目标音频频谱进行水印提取,得到音频水印。
在一实施例中,若提取到隐写水印后,可以基于预设隐写规则,对隐写水印进行解密,得到隐写信息。该预设隐写规则为预先设定的隐写规则,该预设隐写规则只有目标音频的创作者或所有者得知,以及创作者或所有者所认证的用户得知,因此,只有得知该预设隐写规则,才能解密(解析)得到该隐写信息,从而避免该隐写信息被篡改、删除和攻击。
示例性的,预设隐写规则包括:将隐写信息转换为字符数组;基于预设的字符-数值转换规则,将字符数组转换为第一预设进制数值数组;将第一预设进制数值数组转换为预设位数的第二预设进制数值数组;将第二预设进制数值数组作为隐写水印。
例如,预设的字符-数值转换规则为ASCII转换规则,第一预设进制为10进制,第二预设进制为二进制,预设位数为8,则解密过程如下:
第一步,将二进制数值数组(隐写水印)转换为十进制数值数组(ASCII码数组),其中,/>表示从目标音频频谱的频率分量/>中提取的二进制信息;
第二步,将十进制数值数组转换为字符数组;
第三步,将字符数组转换为隐写信息,即得到隐藏在音频信号中的隐写信息。
在一具体实施例中,若水印嵌入规则为:从所述目标音频对应的音频频谱中确定出待嵌入水印的第一频谱,以及所述第一频谱之外的第二频谱,基于用于控制水印嵌入强度的第一水印嵌入系数,将所述明文水印嵌入所述第一频谱中,得到嵌入所述明文水印的第一目标频谱,基于用于控制水印嵌入强度的第二水印嵌入系数,将所述调音参数水印嵌入所述第一目标频谱中,得到嵌入所述调音参数水印的第二目标频,基于所述第二频谱和所述第二目标频谱的聚合结果,确定嵌入水印的第三目标频谱,基于用于控制水印嵌入强度的第三水印嵌入系数,将所述隐写水印嵌入所述第三目标频谱中,得到嵌入水印的目标频谱;相应地,基于第三水印嵌入系数和第三目标频谱,对目标音频频谱进行水印提取,提取得到第一隐写水印;相应地,基于第三水印嵌入系数和隐写水印,从目标音频频谱中提取得到第三频谱,基于第二水印嵌入系数和第一目标频谱,对第三频谱进行水印提取,提取得到第一调音参数水印;相应地,基于第二水印嵌入系数和调音参数水印,从第三频谱中提取得到第二频谱,基于第一水印嵌入系数和音频频谱,对第二频谱进行水印提取,提取得到第一明文水印。
可以理解的是,此处还包括其他水印提取方式,具体可以参照上述水印嵌入方式,此处不再一一赘述。
在一些实施例中,在上述步骤320之后,基于目标水印与音频水印的差异程度,确定音频信号是否为目标音频。
在一实施例中,判断音频水印与目标水印是否相同,若相同,则该音频信号为目标水印对应的音频信号,即该音频信号为目标水印所标识的创作者或所有者的音频;若不相同,则该音频信号不为目标水印对应的音频信号。
本发明实施例提供的音频水印提取方法,获取待提取水印的音频信号,并将音频信号转换为频域的目标音频频谱;基于待嵌入目标水印的目标音频对应的音频频谱,对目标音频频谱进行水印提取,得到音频水印。通过上述方式,对应的音频水印嵌入方法中,是将目标水印嵌入目标音频对应的音频频谱中,得到嵌入水印的目标频谱,且目标水印包括预设的明文水印、调音参数水印和隐写水印中的至少两种,或者,目标水印包括调音参数水印和隐写水印中的至少一种,从而不是仅将明文水印进行嵌入,而是可以嵌入对目标音频对应的调音参数进行加密得到的调音参数水印,和/或,可以嵌入基于预设的隐写信息确定的隐写水印,从而可以避免水印被篡改、删除和攻击,进而提高音频水印的安全性和可靠性;同时,可以嵌入对目标音频对应的调音参数进行加密得到的调音参数水印,以将目标音频的调音参数作为水印嵌入,确保传输目标音频的同时可以传输调音参数,且将加密的调音参数作为水印嵌入,可以避免水印被篡改、删除和攻击,并避免调音参数被篡改、删除和攻击,从而提高调音参数的安全性和可靠性;同时,本发明是在频域上完成水印嵌入和提取操作的,相比直接在时域上进行水印嵌入和提取操作而言,本发明更容易完成水印嵌入和提取操作,且在将目标频谱转换为时域的音频信号后,嵌入的水印不会在音频信号中直接表现出来,从而提高水印的安全性和可靠性。
基于上述任一实施例,考虑到将音频水印嵌入目标音频后,还需要将水印提取出来,并验证音频的所有者或创作者。基于此,本发明还提供一种音频检测方法,图4为本发明提供的音频检测方法的流程示意图,如图4所示,该音频检测方法包括:
步骤410,获取待提取水印的待检测音频,并将所述待检测音频转换为频域的目标音频频谱。
此处,待检测音频为需要提取水印并检测水印的音频,该待检测音频为时域上的音频信号。由于上述是在频谱上进行水印嵌入的,即上述是进行频谱重构的,因此,在提取水印时需要将待检测音频转换为频域的目标音频频谱。
步骤420,基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到待检测水印。
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
此处,目标水印如何嵌入音频频谱具体参见上述音频水印嵌入方法的各实施例,此处不再一一赘述。
需要说明的是,需要基于与上述音频水印嵌入方法的嵌入规则(水印加密规则)对应的提取规则(水印解密规则),才能提取得到目标水印,否则提取的待检测水印与目标水印并不相同。可以理解的是,水印提取的过程需要逆向操作,将嵌入的水印从重构的音频信号中恢复出来。
此处,水印提取方式参见上述音频水印嵌入方法和音频水印提取方法的各实施例,此处不再一一赘述。
步骤430,基于所述目标水印与所述待检测水印的差异程度,确定所述待检测音频是否为所述目标音频。
此处,差异程度用于衡量从待检测音频中提取的待检测水印与目标水印的匹配程度。差异程度可以通过比特误码率(Bit Error Rate,BER)或误码率(Symbol Error Rate,SER)等算法计算得到。
在一些实施例中,基于目标水印与待检测水印的比特误码率,确定待检测音频是否为目标音频。
在一些实施例中,在差异程度小于预设差异程度的情况下,确定待检测音频为目标音频,即确定待检测音频为目标水印所标识的创作者或所有者的音频;在差异程度大于或等于预设差异程度的情况下,确定待检测音频不为目标音频。该预设差异程度可以根据实际情况设定,此处不作具体限定。
在目标水印包括隐写水印的情况下,基于目标水印中的隐写水印与待检测水印中的隐写水印的差异程度,确定待检测音频是否为目标音频。
在一些实施例中,基于目标水印中的隐写水印与待检测水印中的隐写水印的比特误码率,确定待检测音频是否为目标音频。
在一实施例中,基于目标水印中的隐写水印对应的隐写信息,确定其对应的第一字符数组(ASCII码数组);基于待检测水印中的隐写水印对应的隐写信息,确定其对应的第二字符数组(ASCII码数组);基于第一字符数组和第二字符数组的比特误码率,确定待检测音频是否为目标音频。
示例性的,比特误码率的计算公式如下所示:
式中,表示第一字符数组和第二字符数组的比特误码率,不匹配ASCII码数量为第一字符数组与第二字符数组中不匹配的ASCII码的数量,总ASCII码数量可以为第一字符数组中ASCII码的数量,总ASCII码数量也可以为第二字符数组中ASCII码的数量,总ASCII码数量还可以为两个字符数组的ASCII码数量的最大值。
在一实施例中,在比特误码率小于预设比特误码率的情况下,确定待检测音频为目标音频,即确定待检测音频为目标水印所标识的创作者或所有者的音频;在比特误码率大于或等于预设比特误码率的情况下,确定待检测音频不为目标音频。该预设比特误码率可以根据实际情况设定,例如,10%,此处不作具体限定。
在目标水印包括调音参数水印的情况下,基于目标水印中的调音参数水印与待检测水印中的调音参数水印的差异程度,确定待检测音频是否为目标音频。
在目标水印包括明文水印的情况下,基于目标水印中的明文水印与待检测水印中的明文水印的差异程度,确定待检测音频是否为目标音频。
在目标水印包括多个水印的情况下,基于多个水印对应的差异程度,综合确定待检测音频是否为目标音频。
本发明实施例提供的音频水印提取方法,获取待提取水印的待检测音频,并将待检测音频转换为频域的目标音频频谱;基于待嵌入目标水印的目标音频对应的音频频谱,对目标音频频谱进行水印提取,得到待检测水印;基于目标水印与待检测水印的差异程度,确定待检测音频是否为目标音频。通过上述方式,对应的音频水印嵌入方法中,是将目标水印嵌入目标音频对应的音频频谱中,得到嵌入水印的目标频谱,且目标水印包括预设的明文水印、调音参数水印和隐写水印中的至少两种,或者,目标水印包括调音参数水印和隐写水印中的至少一种,从而不是仅将明文水印进行嵌入,而是可以嵌入对目标音频对应的调音参数进行加密得到的调音参数水印,和/或,可以嵌入基于预设的隐写信息确定的隐写水印,从而可以避免水印被篡改、删除和攻击,进而提高音频水印的安全性和可靠性;同时,可以嵌入对目标音频对应的调音参数进行加密得到的调音参数水印,以将目标音频的调音参数作为水印嵌入,确保传输目标音频的同时可以传输调音参数,且将加密的调音参数作为水印嵌入,可以避免水印被篡改、删除和攻击,并避免调音参数被篡改、删除和攻击,从而提高调音参数的安全性和可靠性;同时,本发明是在频域上完成水印嵌入和提取操作的,相比直接在时域上进行水印嵌入和提取操作而言,本发明更容易完成水印嵌入和提取操作,且在将目标频谱转换为时域的音频信号后,嵌入的水印不会在音频信号中直接表现出来,从而提高水印的安全性和可靠性。
假设音频水印嵌入方法的执行主体为音频水印嵌入端,音频水印提取方法的执行主体为音频水印提取端。在一些实施例中,为确保音频水印提取端可以提取得到嵌入的水印,并提取得到嵌入的调音参数或隐写信息,音频水印嵌入端与音频水印提取端需要有一套对应的通信规则,该通信规则为内部定义的串口解析协议,以用于在音频水印嵌入端与音频水印提取端之间传输数据,并确保数据不被篡改、删除和攻击。该通信规则还用于确保音频水印嵌入端可以传输其水印嵌入规则(如调音参数的预设加密规则、隐写水印的加密规则、各水印的嵌入规则等等),以确保音频水印提取端可以正确提取水印,而其他人并无法得知该水印嵌入规则,从而攻击者无法解密(解析)得到目标水印,从而避免该目标水印被篡改、删除和攻击。
在一实施例中,通信规则包括数据格式规则,该数据格式规则为规定了数据的数据格式,确保音频水印嵌入端与音频水印提取端之间能够正确解析和解释数据。
在一实施例中,通信规则包括指令定义规则,该指令定义规则为明确定义了各种指令的含义和用途,其包括参数查询、参数设置、数据传输等指令,以确保通信双方能够准确理解和执行指令。
在一实施例中,通信规则包括容错机制,该容错机制为设置了相应的校验机制(如CRC校验机制),如果存在CRC检测不成功则不会加载错误的参数,保证数据的可靠传输和解析。
此外,例如在主动声浪场景中,音频水印提取端将解析后的声浪音频和调音参数传至主动声浪算法中。音频水印提取端中的声浪算法引擎负责接收解析后声浪音频和调音参数,并进行声音处理和优化。声浪算法引擎在主动声浪系统中起到关键作用,通过其高效的算法和处理能力,实现对原始声浪音频的优化,输出更加真实和沉浸式的声浪。音频水印提取端负责对采集到的环境声音进行解析,获取声浪音频数据,并采集相关的调音参数,包括音量、频率、声场模式等信息。这些解析后的声浪原始音频和调音参数将被传输至声浪算法引擎,为后续的声音处理提供基础数据。
下面对本发明提供的音频水印嵌入装置进行描述,下文描述的音频水印嵌入装置与上文描述的音频水印嵌入方法可相互对应参照。
图5为本发明提供的音频水印嵌入装置的结构示意图,如图5所示,该音频水印嵌入装置,包括:
水印获取模块510,用于确定待嵌入水印的目标音频,并获取待嵌入的目标水印;
水印嵌入模块520,用于将所述目标水印嵌入所述目标音频对应的音频频谱中,得到嵌入水印的目标频谱;
频谱转换模块530,用于将所述目标频谱转换为时域的音频信号;
其中,所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
下面对本发明提供的音频水印提取装置进行描述,下文描述的音频水印提取装置与上文描述的音频水印提取方法可相互对应参照。
图6为本发明提供的音频水印提取装置的结构示意图,如图6所示,该音频水印提取装置,包括:
信号获取模块610,用于获取待提取水印的音频信号,并将所述音频信号转换为频域的目标音频频谱;
水印提取模块620,用于基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到音频水印;
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
下面对本发明提供的音频检测装置进行描述,下文描述的音频检测装置与上文描述的音频检测方法可相互对应参照。
图7为本发明提供的音频检测装置的结构示意图,如图7所示,该音频检测装置,包括:
音频获取模块710,用于获取待提取水印的待检测音频,并将所述待检测音频转换为频域的目标音频频谱;
水印检测模块720,用于基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到待检测水印;
音频确定模块730,用于基于所述目标水印与所述待检测水印的差异程度,确定所述待检测音频是否为所述目标音频;
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
图8示例了一种电子设备的实体结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行上述任一实施例的音频水印嵌入方法,或执行上述任一实施例的音频水印提取方法,或执行上述任一实施例的音频检测方法。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的音频水印嵌入方法,或者执行上述各方法提供的音频水印提取方法,或者执行上述各方法提供的音频检测方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (11)

1.一种音频水印嵌入方法,其特征在于,包括:
确定待嵌入水印的目标音频,并获取待嵌入的目标水印;
将所述目标水印嵌入所述目标音频对应的音频频谱中,得到嵌入水印的目标频谱;
将所述目标频谱转换为时域的音频信号;
其中,所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
2.根据权利要求1所述的音频水印嵌入方法,其特征在于,在所述目标水印包括预设的明文水印和调音参数水印的情况下,所述将所述目标水印嵌入所述目标音频对应的音频频谱中,得到嵌入水印的目标频谱,包括:
从所述目标音频对应的音频频谱中确定出待嵌入水印的第一频谱,以及所述第一频谱之外的第二频谱;
基于用于控制水印嵌入强度的第一水印嵌入系数,将所述明文水印嵌入所述第一频谱中,得到嵌入所述明文水印的第一目标频谱;
基于用于控制水印嵌入强度的第二水印嵌入系数,将所述调音参数水印嵌入所述第一目标频谱中,得到嵌入所述调音参数水印的第二目标频谱;
基于所述第二频谱和所述第二目标频谱的聚合结果,确定嵌入水印的目标频谱。
3.根据权利要求2所述的音频水印嵌入方法,其特征在于,在所述目标水印还包括隐写水印的情况下,所述基于所述第二频谱和所述第二目标频谱的聚合结果,确定嵌入水印的目标频谱,包括:
基于所述第二频谱和所述第二目标频谱的聚合结果,确定嵌入水印的第三目标频谱;
基于用于控制水印嵌入强度的第三水印嵌入系数,将所述隐写水印嵌入所述第三目标频谱中,得到嵌入水印的目标频谱。
4.根据权利要求2所述的音频水印嵌入方法,其特征在于,所述从所述目标音频对应的音频频谱中确定出待嵌入水印的第一频谱,以及所述第一频谱之外的第二频谱,包括:
基于多个预设频段,对所述目标音频对应的音频频谱进行多频段筛选,得到所述多个预设频段中至少一个第一预设频段对应的所述第一频谱和所述多个预设频段中至少一个第二预设频段对应的所述第二频谱;
其中,所述第一预设频段大于所述第二预设频段。
5.一种音频水印提取方法,其特征在于,包括:
获取待提取水印的音频信号,并将所述音频信号转换为频域的目标音频频谱;
基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到音频水印;
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
6.一种音频检测方法,其特征在于,包括:
获取待提取水印的待检测音频,并将所述待检测音频转换为频域的目标音频频谱;
基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到待检测水印;
基于所述目标水印与所述待检测水印的差异程度,确定所述待检测音频是否为所述目标音频;
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
7.一种音频水印嵌入装置,其特征在于,包括:
水印获取模块,用于确定待嵌入水印的目标音频,并获取待嵌入的目标水印;
水印嵌入模块,用于将所述目标水印嵌入所述目标音频对应的音频频谱中,得到嵌入水印的目标频谱;
频谱转换模块,用于将所述目标频谱转换为时域的音频信号;
其中,所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
8.一种音频水印提取装置,其特征在于,包括:
信号获取模块,用于获取待提取水印的音频信号,并将所述音频信号转换为频域的目标音频频谱;
水印提取模块,用于基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到音频水印;
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
9.一种音频检测装置,其特征在于,包括:
音频获取模块,用于获取待提取水印的待检测音频,并将所述待检测音频转换为频域的目标音频频谱;
水印检测模块,用于基于待嵌入目标水印的目标音频对应的音频频谱,对所述目标音频频谱进行水印提取,得到待检测水印;
音频确定模块,用于基于所述目标水印与所述待检测水印的差异程度,确定所述待检测音频是否为所述目标音频;
其中,所述目标水印用于嵌入所述目标音频对应的音频频谱;所述目标水印包括调音参数水印和隐写水印中的至少一种;所述调音参数水印是对所述目标音频对应的调音参数进行加密得到的,所述隐写水印是基于预设的隐写信息确定的。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述音频水印嵌入方法,或者,实现如权利要求5所述音频水印提取方法,或者,实现如权利要求6所述音频检测方法。
11.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述音频水印嵌入方法,或者,实现如权利要求5所述音频水印提取方法,或者,实现如权利要求6所述音频检测方法。
CN202311550729.1A 2023-11-21 2023-11-21 音频水印嵌入方法、音频水印提取方法和音频检测方法 Active CN117275494B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311550729.1A CN117275494B (zh) 2023-11-21 2023-11-21 音频水印嵌入方法、音频水印提取方法和音频检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311550729.1A CN117275494B (zh) 2023-11-21 2023-11-21 音频水印嵌入方法、音频水印提取方法和音频检测方法

Publications (2)

Publication Number Publication Date
CN117275494A true CN117275494A (zh) 2023-12-22
CN117275494B CN117275494B (zh) 2024-02-20

Family

ID=89212785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311550729.1A Active CN117275494B (zh) 2023-11-21 2023-11-21 音频水印嵌入方法、音频水印提取方法和音频检测方法

Country Status (1)

Country Link
CN (1) CN117275494B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117979051A (zh) * 2024-01-17 2024-05-03 广东保伦电子股份有限公司 一种音频防伪方法、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163883A (ja) * 1998-09-22 2000-06-16 Matsushita Electric Ind Co Ltd 光ディスク、および、光ディスクの追記情報の記録再生方法並びに光ディスクの再生装置と記録再生装置
JP2003099077A (ja) * 2001-09-26 2003-04-04 Oki Electric Ind Co Ltd 電子透かし埋込装置、抽出装置及び方法
US20170148451A1 (en) * 2013-11-28 2017-05-25 Fundacio Per A La Universitat Oberta De Catalunya Method and apparatus for embedding and extracting watermark data in an audio signal
CN110929235A (zh) * 2018-09-19 2020-03-27 珠海金山办公软件有限公司 一种处理水印的方法、装置、计算机存储介质及终端
CN113362835A (zh) * 2020-03-05 2021-09-07 杭州网易云音乐科技有限公司 音频水印处理方法、装置、电子设备及存储介质
CN114758660A (zh) * 2022-04-18 2022-07-15 中国银行股份有限公司 一种银行专属音频版权保护方法和装置
CN115910080A (zh) * 2023-01-09 2023-04-04 北京承启通科技有限公司 一种通信音频数字水印写入、读取方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163883A (ja) * 1998-09-22 2000-06-16 Matsushita Electric Ind Co Ltd 光ディスク、および、光ディスクの追記情報の記録再生方法並びに光ディスクの再生装置と記録再生装置
JP2003099077A (ja) * 2001-09-26 2003-04-04 Oki Electric Ind Co Ltd 電子透かし埋込装置、抽出装置及び方法
US20170148451A1 (en) * 2013-11-28 2017-05-25 Fundacio Per A La Universitat Oberta De Catalunya Method and apparatus for embedding and extracting watermark data in an audio signal
CN110929235A (zh) * 2018-09-19 2020-03-27 珠海金山办公软件有限公司 一种处理水印的方法、装置、计算机存储介质及终端
CN113362835A (zh) * 2020-03-05 2021-09-07 杭州网易云音乐科技有限公司 音频水印处理方法、装置、电子设备及存储介质
CN114758660A (zh) * 2022-04-18 2022-07-15 中国银行股份有限公司 一种银行专属音频版权保护方法和装置
CN115910080A (zh) * 2023-01-09 2023-04-04 北京承启通科技有限公司 一种通信音频数字水印写入、读取方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117979051A (zh) * 2024-01-17 2024-05-03 广东保伦电子股份有限公司 一种音频防伪方法、设备及介质

Also Published As

Publication number Publication date
CN117275494B (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
EP0828372B1 (en) A spread spectrum watermark for embedded signalling
CN117275494B (zh) 音频水印嵌入方法、音频水印提取方法和音频检测方法
Dhar et al. Blind SVD-based audio watermarking using entropy and log-polar transformation
KR101744744B1 (ko) 불법 콘텐츠 유통 방지 및 불법 배포자 추적 시스템 및 그 방법
Dhar et al. Audio watermarking in transform domain based on singular value decomposition and Cartesian-polar transformation
CN108648761B (zh) 一种在音频数字水印中嵌入区块链账本的方法
EP3078024A1 (en) Method and apparatus for embedding and extracting watermark data in an audio signal
Liu et al. Semi-fragile zernike moment-based image watermarking for authentication
Abrar et al. Secure Image Authentication Using Watermarking and Blockchain.
Bhat K et al. Design of a blind quantization‐based audio watermarking scheme using singular value decomposition
Nassiri et al. Secure transmission of medical images by watermarking technique
Zhang Audio dual watermarking scheme for copyright protection and content authentication
Chetan et al. Audio watermarking using modified least significant bit technique
CN113095993A (zh) 一种混沌加密与数字水印的图像验证方法及系统
CN116155623B (zh) 一种基于电网频率特征嵌入的数字音频加密方法及系统
Hemis et al. New secure and robust audio watermarking algorithm based on QR factorization in wavelet domain
Gupta et al. Perceptually transparent & robust audio watermarking algorithm using multi resolution decomposition & Cordic QR decomposition
CN113362835A (zh) 音频水印处理方法、装置、电子设备及存储介质
Lu et al. Chaos-based spread spectrum robust watermarking in DWT domain
Soppari et al. Study of digital watermarking algorithms for digital rights management and their attacks
Dhar et al. FFT-Based Audio Watermarking Using SVD and CPT
CN116095245B (zh) 秘密信息分享方法、系统、终端及存储介质
Bhattacharyya et al. Authentication and Secret Message Transmission Technique Using Discrete Fourier Transformation
CN115798490B (zh) 基于sift变换的音频水印植入方法和装置
Sultani et al. Image and audio steganography based on indirect LSB

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant