CN117476019A - 音频数据处理方法、装置、设备及存储介质 - Google Patents

音频数据处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117476019A
CN117476019A CN202311493867.0A CN202311493867A CN117476019A CN 117476019 A CN117476019 A CN 117476019A CN 202311493867 A CN202311493867 A CN 202311493867A CN 117476019 A CN117476019 A CN 117476019A
Authority
CN
China
Prior art keywords
processed
audio data
data
audio
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311493867.0A
Other languages
English (en)
Inventor
原照萌
王波
张应团
马广博
谢继刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Unicom Digital Technology Co Ltd
China Unicom Western Innovation Research Institute Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Unicom Digital Technology Co Ltd
China Unicom Western Innovation Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd, Unicom Digital Technology Co Ltd, China Unicom Western Innovation Research Institute Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202311493867.0A priority Critical patent/CN117476019A/zh
Publication of CN117476019A publication Critical patent/CN117476019A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请提供一种音频数据处理方法、装置、设备及存储介质。该方法包括:获取待处理音频数据和待隐写内容;基于预设长度和预设类型,根据待隐写内容生成为多个填充字符串;判断待处理音频数据的编码格式;若判定待处理音频数据的编码格式为目标音频编码格式,则根据待处理音频数据,获取待处理数据元素;将多个填充字符串和待处理数据元素进行合并,得到新的填充元素;将新的填充元素输入待处理音频数据,得到包含隐写内容的音频流。本申请的方法,增强了音频中隐写内容的隐秘性。

Description

音频数据处理方法、装置、设备及存储介质
技术领域
本申请涉及信息安全技术领域,尤其涉及一种音频数据处理方法、装置、设备及存储介质。
背景技术
随着互联网音视频的流行,在音频中隐写特定信息,以满足保密传输和版权保护的需求越来越多。
现有技术中,通过在ID3tag(文件曲目标签)中的特定属性写入要植入的信息,来达到隐写信息的目的。
然而,这种方式在详细信息时容易被发现,隐秘性低。
发明内容
本申请提供一种音频数据处理方法、装置、设备及存储介质,用以解决音频中特定信息隐秘性低的技术问题。
第一方面,本申请提供一种音频数据处理方法,包括:
获取待处理音频数据和待隐写内容;
基于预设长度和预设类型,根据待隐写内容生成为多个填充字符串;
判断待处理音频数据的编码格式;
若判定待处理音频数据的编码格式为目标音频编码格式,则根据待处理音频数据,获取待处理数据元素;
将多个填充字符串和待处理数据元素进行合并,得到新的填充元素;
将新的填充元素输入待处理音频数据,得到包含隐写内容的音频流。
在一种可能的实现方式中,判断待处理音频数据的编码格式之后,还包括:若待处理音频数据的格式不为目标音频编码格式,则将待处理音频数据的格式转换为目标音频编码格式。
在一种可能的实现方式中,根据待处理音频数据,获取待处理数据元素,包括:
判断待处理音频数据的文件格式;若待处理音频数据的文件格式为音频数据交换格式,则根据头信息,得到待处理音频数据的原始数据块信息;根据原始数据块信息,解析得到待处理数据元素,头信息表征待处理音频数据的开始;若待处理音频数据的文件格式为音频数据传输流,则根据同步头信息,得到待处理音频数据的帧头信息,根据帧头信息,解析得到原始数据块信息;根据原始数据块信息,解析得到待处理数据元素,同步头信息表征待处理音频数据中任一帧的开始。
在一种可能的实现方式中,基于预设长度和预设类型,根据待隐写内容生成为多个填充字符串,包括:采用预设算法,对待隐写内容进行编码,得到待隐写密文;将待隐写密文的类型设置为预设类型;基于预设长度将预设类型的隐写密文切分为多个,以得到多个填充字符串。
在一种可能的实现方式中,将多个填充字符串和待处理数据元素进行合并,得到新的填充元素,包括:为每个填充字符串添加预设前缀,得到具有预设前缀的填充字符串;将所有的具有预设前缀的填充字符串和待处理数据元素进行合并,得到新的填充元素。
在一种可能的实现方式中,还包括:
读取包含隐写内容的音频流并进行解析,得到数据元素;基于预设类型,对数据元素进行过滤,得到待处理数据;基于预设前缀,对待处理数据进行过滤,得到多个填充字符串;去除多个填充字符串的预设前缀,并按照预设顺序合并,得到待隐写内容。
第二方面,本申请提供一种音频数据处理装置,包括:
数据获取模块,用于获取待处理音频数据和待隐写内容;
填充字符串生成模块,用于基于预设长度和预设类型,根据待隐写内容生成为多个填充字符串;
编码格式判断模块,用于判断待处理音频数据的编码格式;
待处理数据元素获取模块,用于若判定待处理音频数据的编码格式为目标音频编码格式,则根据待处理音频数据,获取待处理数据元素;
填充元素合并模块,用于将多个填充字符串和待处理数据元素进行合并,得到新的填充元素;
输出模块,用于将新的填充元素输入待处理音频数据,得到包含隐写内容的音频流。
第三方面,本申请实施例提供一种电子设备,包括:处理器和与处理器通信连接的存储器;存储器存储计算机执行指令;处理器执行存储器存储的计算机执行指令,使得处理器执行如上第一方面以及第一方面各种可能的涉及的音频数据处理方法。
第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如上第一方面以及第一方面各种可能的涉及的音频数据处理方法。
本申请提供的音频数据处理方法、装置、设备及存储介质,通过将隐写内容转化为填充字符串,并获取待处理音频数据对应的待处理数据元素,然后将填充字符串和待处理数据元素进行合并,写入待处理音频数据中,能够实现在音频数据中隐写特定信息的目的,达到隐写内容不易被发现,增强其隐秘性的技术效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的电子设备的结构示意图;
图2为本申请的实施例提供的音频数据处理方法的流程示意图;
图3为本申请实施例提供的音频数据处理装置的结构示意图;
图4是本申请实施例提供的电子设备的硬件结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
随着互联网音视频的不断流行,如何满足在音频中隐写特定信息,满足保密传输、版权保护的需求越来越重要。现有的技术一般来说有两种,一种是通过在ID3tag中的特定属性中写入要植入的信息,另一种是基于AAC编码方法,在编码过程中针对变换域进行信息写入,比如基于Huffman域或者小波变化域,通过写入最低有效位来隐写信息。然而,基于ID3tag中特定属性写入信息容易在查看音视频详细信息时被发现,隐秘性不够,而基于AAC编码,在编码过程的特定域写入,会影响到音视频文件本身的音质,可使用空间也很小。
为了解决上述技术问题,本申请实施例提出以下技术思路:基于AAC格式标准,在AAC的FILL Element中插入要隐写的信息,能够在查看音视频信息时不会被发现,同时不影响音频的音质,可使用的空间也很大。
下面以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1为本申请实施例提供的电子设备的结构示意图。如图1所示,电子设备包括:接收装置101、处理器102和显示装置103。可以理解的是,本申请实施例示意的结构并不构成对物品识别方法的具体限定。在本申请另一些可行的实施方式中,上述架构可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置,具体可根据实际应用场景确定,在此不做限制。图1所示的部件可以以硬件、软件或软件与硬件的组合实现。
在具体实现过程中,接收装置101可以是输入/输出接口,也可以是通信接口,可以获取待处理音频数据和待隐写内容。
处理器102,可以基于预设长度和预设类型,根据待隐写内容生成为多个填充字符串;判断待处理音频数据的编码格式;若判定待处理音频数据的编码格式为目标音频编码格式,则根据待处理音频数据,获取待处理数据元素;将多个填充字符串和待处理数据元素进行合并,得到新的填充元素;将新的填充元素输入待处理音频数据,得到包含隐写内容的音频流。
显示装置103,可以用于对包含隐写内容的音频流进行显示。
显示装置还可以是触摸显示屏,用于在显示上述内容的同时接收用户指令,以实现与用户的操作交互。
应理解,上述处理器可以通过处理器读取存储器中的指令并执行指令的方式实现,也可以通过芯片电路实现。
另外,本申请实施例描述的网络架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着网络架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
图2为本申请的实施例提供的音频数据处理方法的流程示意图,本实施例的执行主体可以为图1所示实施例中的电子设备,也可以是具有相似功能的其他服务设备,本实施例此处不做特别限制。如图2所示,该方法包括:
S201:获取待处理音频数据和待隐写内容。
其中,待处理音频数据指的是数字化的声音,待隐写内容指的是需要隐写的特定信息。
S202:基于预设长度和预设类型,根据待隐写内容生成为多个填充字符串。
具体地,步骤S202包括S2021~S2023:
S2021:采用预设算法,对待隐写内容进行编码,得到待隐写密文。
其中,待隐写内容可以为中文字符,预设算法可以是ASCII(American StandardCode for Information Interchange,美国信息交换用标准代码)编码、国标扩展GBK编码或UTF8(Unicode Transformation Format,统一码字符集转换格式)编码,也可以是对称性加密算法或非对称性加密算法。
示例性地,对待隐写内容采用UTF8编码格式进行编码,得到待隐写密文。
S2022:将待隐写密文的类型设置为预设类型。
示例性地,预设类型可以是EXT_FILL类型,EXT_FILL类型的数据不会被解码器读取。
S2023:基于预设长度将预设类型的隐写密文切分为多个,以得到多个填充字符串。
具体地,按照预设长度将预设类型的隐写密文进行切分,得到多个填充字符串。
S203:判断待处理音频数据的编码格式。
其中,音频数据常见的编码格式有PCM(Pulse-Code Modulation,脉冲调制编码)、WAV(波形音频文件格式)、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)以及AAC(Advanced Audio Coding,高级音频编码技术)。
具体地,判断待处理音频数据的编码格式是否为AAC格式,若待处理音频数据的编码格式不为目标音频编码,则将待处理音频数据的格式转换为目标音频编码格式,示例性地,可以采用在线工具如视频转换器,通过导入其他格式的音频数据,并设置导出格式,完成音频数据的格式转换。
S204:若判定待处理音频数据的编码格式为目标音频编码格式,则根据待处理音频数据,获取待处理数据元素。
其中,目标音频编码格式为AAC格式。
具体地,若判定待处理音频数据的编码格式为AAC格式,则根据待处理音频数据,获取待处理数据元素,包括步骤S2041~S2043:
S2041:判断待处理音频数据的文件格式。
若待处理音频数据的文件格式包括header()和raw_data_stream()文件,则表示待处理音频数据的文件格式为音频数据交换格式,若待处理音频数据的文件格式包括syncword、header()、error_check()和raw_data_stream()文件,则表示到处理音频数据的文件格式为音频数据传输流格式。
S2042:若待处理音频数据的文件格式为音频数据交换格式,则根据头信息,得到待处理音频数据的原始数据块信息;根据原始数据块信息,解析得到待处理数据元素,头信息表征待处理音频数据的开始。
其中,ADIF(Audio Data Interchange Format,音频数据交换格式)是可以确定的找到这个音频数据的开始的,不需进行在音频数据流中间的解码,即它的解码必须在明确定义的开始处进行。
具体地,若待处理音频数据的文件格式为ADIF,则对待处理音频数据进行解析,得到头信息,根据头信息获取待处理音频数据的原始数据块的大小,根据头信息和原始数据块的大小,即可得到原始数据块信息,对原始数据块信息进行解析得到待处理数据元素,即Fill element类型的数据,其中Fill element类型的数据在编码中的作用是提供一些辅助信息,如SBR增强、动态范围控制以及其他附加信息,Fill element类型数据又分为EXT_FILL子类型的数据。
S2043:若待处理音频数据的文件格式为音频数据传输流,则根据同步头信息,得到待处理音频数据的帧头信息,根据帧头信息,解析得到原始数据块信息;根据原始数据块信息,解析得到待处理数据元素,同步头信息表征待处理音频数据中任一帧的开始。
具体地,若待处理音频数据的文件格式为ADTS,则对待处理音频数据进行解析,寻找同步头信息,在同步头信息之后即为待处理音频数据的帧头信息,解析帧头信息,即可得到原始数据块的大小,根据帧头信息及原始数据块的大小,即可得到原始数据块信息,对原始数据块信息进行解析得到待处理数据元素,即Fill element类型的数据,其中Fillelement类型的数据在编码中的作用是提供一些辅助信息,如SBR增强、动态范围控制以及其他附加信息,Fill element类型数据又分为EXT_FILL子类型的数据。
S205:将多个填充字符串和待处理数据元素进行合并,得到新的填充元素。
步骤S205包括S2051~S2052:
S2051:为每个填充字符串添加预设前缀,得到具有预设前缀的填充字符串。
具体地,在每个填充字符串开头插入预设前缀,得到具有预设前缀的填充字符串,这样可以和可能存在的已有的Fill Element包作区分。
S2052:将所有的具有预设前缀的填充字符串和待处理数据元素进行合并,得到新的填充元素。
具体地,将构造的具有预设前缀的填充字符串和已有的Fill Element包进行合并,作为新的填充元素,即Fill Element包。
S206:将新的填充元素输入待处理音频数据,得到包含隐写内容的音频流。
综上可知,通过将隐写内容转化为填充字符串,并获取待处理音频数据对应的待处理数据元素,然后将填充字符串和待处理数据元素进行合并,写入待处理音频数据中,能够实现在音频数据中隐写特定信息的目的,达到隐写内容不易被发现,增强其隐秘性的技术效果。
在上述实施例的基础上,还包括音频流中的隐写信息读取的流程,包括:
S301:读取包含隐写内容的音频流并进行解析,得到数据元素。
具体地,通过查找同步字或者头信息,获取包含待隐写内容的音频流的数据块,对数据块进行解析,得到所有的数据元素。
S302:基于预设类型,对数据元素进行过滤,得到待处理数据。
具体地,基于EXT_FILL类型,对所有的数据元素进行过滤筛选,得到所有的EXT_FILL类型的数据,作为待处理数据。
S303:基于预设前缀,对待处理数据进行过滤,得到多个填充字符串。
具体地,根据为多个填充字符串开头插入的预设前缀,对待处理数据进行过滤,得到多个填充字符串,过滤掉待处理音频数据原始数据块中EXT_FILL类型的数据元素。
S304:去除多个填充字符串的预设前缀,并按照预设顺序合并,得到待隐写内容。
具体地,将得到的多个填充字符串全部去除插入在开头的预设前缀,并按照预设顺序合并,得到预设类型的隐写密文,采用预设算法对应的解码算法,对预设类型的隐写密文进行解码,得到待隐写内容。
综上可知,通过解析包含隐写内容的音频流得到数据元素,基于预设类型和预设前缀筛选多个填充字符串,在去除每个填充字符串的预设前缀后进行合并,得到待隐写内容,保证了待隐写内容的保密性。
图3为本申请实施例提供的音频数据处理装置的结构示意图。如图3所示,该音频数据处理装置包括:数据获取模块301、填充字符串生成模块302、编码格式判断模块303、待处理数据元素获取模块304、填充元素合并模块305和输出模块306。
数据获取模块301,用于获取待处理音频数据和待隐写内容。
填充字符串生成模块302,用于基于预设长度和预设类型,根据待隐写内容生成为多个填充字符串。
编码格式判断模块303,用于判断待处理音频数据的编码格式。
待处理数据元素获取模块304,用于若判定待处理音频数据的编码格式为目标音频编码格式,则根据待处理音频数据,获取待处理数据元素。
填充元素合并模块305,用于将多个填充字符串和待处理数据元素进行合并,得到新的填充元素。
输出模块306,用于将新的填充元素输入待处理音频数据,得到包含隐写内容的音频流。
在一种可能的实现方式中,该音频数据处理装置还包括:格式转换模块307。
格式转换模块307,用于若待处理音频数据的格式不为目标音频编码格式,则将待处理音频数据的格式转换为目标音频编码格式。
在一种可能的实现方式中,待处理数据元素获取模块304,具体用于判断待处理音频数据的文件格式;若待处理音频数据的文件格式为音频数据交换格式,则根据头信息,得到待处理音频数据的原始数据块信息;根据原始数据块信息,解析得到待处理数据元素,头信息表征待处理音频数据的开始;若待处理音频数据的文件格式为音频数据传输流,则根据同步头信息,得到待处理音频数据的帧头信息,根据帧头信息,解析得到原始数据块信息;根据原始数据块信息,解析得到待处理数据元素,同步头信息表征待处理音频数据中任一帧的开始。
在一种可能的实现方式中,填充字符串生成模块302,具体用于采用预设算法,对待隐写内容进行编码,得到待隐写密文;将待隐写密文的类型设置为预设类型;基于预设长度将预设类型的隐写密文切分为多个,以得到多个填充字符串。
在一种可能的实现方式中,填充元素合并模块305,具体用于为每个填充字符串添加预设前缀,得到具有预设前缀的填充字符串;将所有的具有预设前缀的填充字符串和待处理数据元素进行合并,得到新的填充元素。
在一种可能的实现方式中,该音频数据处理装置还包括:隐写音频流解析模块308。
隐写音频流解析模块308,用于读取包含隐写内容的音频流并进行解析,得到数据元素;基于预设类型,对数据元素进行过滤,得到待处理数据;基于预设前缀,对待处理数据进行过滤,得到多个填充字符串;去除多个填充字符串的预设前缀,并按照预设顺序合并,得到待隐写内容。
本实施例提供的装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图4是本申请实施例提供的电子设备的硬件结构示意图。如图4所示,本实施例的电子设备包括:处理器401,以及与处理器通信连接的存储器402;存储器存储计算机执行指令;处理器执行存储器存储的计算机执行指令,使得处理器执行如图2所示的音频数据处理方法。
可选地,存储器402既可以是独立的,也可以跟处理器401集成在一起。
当存储器402独立设置时,该电子设备还包括总线403,用于连接存储器402和处理器401。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如图2所示的音频数据处理方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上所图2所示的音频数据处理方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
进一步需要说明的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
应该理解,上述的装置实施例仅是示意性的,本申请的装置还可通过其它的方式实现。例如,上述实施例中单元/模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如,多个单元、模块或组件可以结合,或者可以集成到另一个系统,或一些特征可以忽略或不执行。
另外,若无特别说明,在本申请各个实施例中的各功能单元/模块可以集成在一个单元/模块中,也可以是各个单元/模块单独物理存在,也可以两个或两个以上单元/模块集成在一起。上述集成的单元/模块既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
集成的单元/模块如果以硬件的形式实现时,该硬件可以是数字电路,模拟电路等等。硬件结构的物理实现包括但不局限于晶体管,忆阻器等等。若无特别说明,处理器可以是任何适当的硬件处理器,比如CPU、GPU、FPGA、DSP和ASIC等等。若无特别说明,存储单元可以是任何适当的磁存储介质或者磁光存储介质,比如,阻变式存储器RRAM(ResistiveRandom Access Memory)、动态随机存取存储器DRAM(Dynamic Random Access Memory)、静态随机存取存储器SRAM(Static Random-Access Memory)、增强动态随机存取存储器EDRAM(Enhanced Dynamic Random Access Memory)、高带宽内存HBM(High-Bandwidth Memory)、混合存储立方HMC(Hybrid Memory Cube)等等。
集成的单元/模块如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。上述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (10)

1.一种音频数据处理方法,其特征在于,包括:
获取待处理音频数据和待隐写内容;
基于预设长度和预设类型,根据所述待隐写内容生成为多个填充字符串;
判断所述待处理音频数据的编码格式;
若判定所述待处理音频数据的编码格式为目标音频编码格式,则根据所述待处理音频数据,获取待处理数据元素;
将所述多个填充字符串和所述待处理数据元素进行合并,得到新的填充元素;
将所述新的填充元素输入所述待处理音频数据,得到包含隐写内容的音频流。
2.根据权利要求1所述的方法,其特征在于,所述判断所述待处理音频数据的编码格式之后,还包括:
若所述待处理音频数据的格式不为所述目标音频编码格式,则将所述待处理音频数据的格式转换为所述目标音频编码格式。
3.根据权利要求1所述的方法,其特征在于,所述根据所述待处理音频数据,获取待处理数据元素,包括:
判断所述待处理音频数据的文件格式;
若所述待处理音频数据的文件格式为音频数据交换格式,则根据头信息,得到所述待处理音频数据的原始数据块信息;根据所述原始数据块信息,解析得到所述待处理数据元素,所述头信息表征所述待处理音频数据的开始;
若所述待处理音频数据的文件格式为音频数据传输流,则根据同步头信息,得到所述待处理音频数据的帧头信息,根据所述帧头信息,解析得到所述原始数据块信息;根据所述原始数据块信息,解析得到所述待处理数据元素,所述同步头信息表征所述待处理音频数据中任一帧的开始。
4.根据权利要求1所述的方法,其特征在于,所述基于预设长度和预设类型,根据所述待隐写内容生成为多个填充字符串,包括:
采用预设算法,对所述待隐写内容进行编码,得到待隐写密文;
将所述待隐写密文的类型设置为所述预设类型;
基于所述预设长度将所述预设类型的隐写密文切分为多个,以得到多个填充字符串。
5.根据权利要求1所述的方法,其特征在于,所述将所述多个填充字符串和所述待处理数据元素进行合并,得到新的填充元素,包括:
为每个填充字符串添加预设前缀,得到具有预设前缀的填充字符串;
将所有的具有预设前缀的填充字符串和所述待处理数据元素进行合并,得到所述新的填充元素。
6.根据权利要求5所述的方法,其特征在于,还包括:
读取所述包含隐写内容的音频流并进行解析,得到数据元素;
基于所述预设类型,对所述数据元素进行过滤,得到待处理数据;
基于所述预设前缀,对所述待处理数据进行过滤,得到所述多个填充字符串;
去除所述多个填充字符串的所述预设前缀,并按照预设顺序合并,得到所述待隐写内容。
7.一种音频数据处理装置,其特征在于,包括:
数据获取模块,用于获取待处理音频数据和待隐写内容;
填充字符串生成模块,用于基于预设长度和预设类型,根据所述待隐写内容生成为多个填充字符串;
编码格式判断模块,用于判断所述待处理音频数据的编码格式;
待处理数据元素获取模块,用于若判定所述待处理音频数据的编码格式为目标音频编码格式,则根据所述待处理音频数据,获取待处理数据元素;
填充元素合并模块,用于将所述多个填充字符串和所述待处理数据元素进行合并,得到新的填充元素;
输出模块,用于将所述新的填充元素输入所述待处理音频数据,得到包含隐写内容的音频流。
8.根据权利要求7所述的装置,其特征在于,
所述待处理数据元素获取模块,具体用于判断所述待处理音频数据的文件格式;若所述待处理音频数据的文件格式为音频数据交换格式,则根据头信息,得到所述待处理音频数据的原始数据块信息;根据所述原始数据块信息,解析得到所述待处理数据元素,所述头信息表征所述待处理音频数据的开始;
若所述待处理音频数据的文件格式为音频数据传输流,则根据同步头信息,得到所述待处理音频数据的帧头信息,根据所述帧头信息,解析得到所述原始数据块信息;根据所述原始数据块信息,解析得到所述待处理数据元素,所述同步头信息表征所述待处理音频数据中任一帧的开始。
9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至6任一项所述的方法。
CN202311493867.0A 2023-11-09 2023-11-09 音频数据处理方法、装置、设备及存储介质 Pending CN117476019A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311493867.0A CN117476019A (zh) 2023-11-09 2023-11-09 音频数据处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311493867.0A CN117476019A (zh) 2023-11-09 2023-11-09 音频数据处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117476019A true CN117476019A (zh) 2024-01-30

Family

ID=89639472

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311493867.0A Pending CN117476019A (zh) 2023-11-09 2023-11-09 音频数据处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117476019A (zh)

Similar Documents

Publication Publication Date Title
CN108090329B (zh) 一种对文本内容进行数字水印加密保护的方法及装置
Divya et al. Hiding text in audio using multiple LSB steganography and provide security using cryptography
Roy et al. A novel approach to format based text steganography
US7965841B2 (en) Method and apparatus for compressing and decompressing data, and computer product
CN109785222B (zh) 一种用于网页的信息快速嵌入和提取的方法
Saroha et al. A variant of LSB steganography for hiding images in audio
Rakhi A review on steganography methods
US9620133B2 (en) Watermark insertion in frequency domain for audio encoding/decoding/transcoding
JP2004078477A (ja) コンテンツサーバ、コンテンツ受信装置、ネットワークシステム及びそのデジタルコンテンツへの情報付加方法
Kaur et al. Audio steganography techniques-a survey
Santosa et al. Audio-to-image wavelet transform based audio steganography
Alkhudaydi et al. Integrating light-weight cryptography with diacritics Arabic text steganography improved for practical security applications
Chen et al. High-capacity reversible data-hiding for LZW codes
CN102158768B (zh) 基于mp4文件封装格式的视频认证水印嵌入和提取方法
CN117476019A (zh) 音频数据处理方法、装置、设备及存储介质
CN100384119C (zh) 数字音频处理
Li et al. Parameterization of LSB in Self‐Recovery Speech Watermarking Framework in Big Data Mining
CN115985329A (zh) 音频隐水印的添加、提取方法和系统
Sharma et al. A study of steganography based data hiding techniques
Hu et al. A semi fragile watermarking algorithm based on compressed sensing applied for audio tampering detection and recovery
Bhattacharyya et al. A method of data hiding in audio signal
CN114091080A (zh) 一种字幕文件加密解密方法、系统、存储介质及电子设备
Pareek et al. An Overview of Steganography: Data Hiding Technique
Mahato et al. Personal characters to bits mapping using dot pattern character encoding scheme (DPCES)
TWI330004B (en) Method and apparatus for encoding/ decoding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination