CN109003615B - 语音流嵌入信息方法及装置、语音流解码信息方法及装置 - Google Patents
语音流嵌入信息方法及装置、语音流解码信息方法及装置 Download PDFInfo
- Publication number
- CN109003615B CN109003615B CN201810982577.5A CN201810982577A CN109003615B CN 109003615 B CN109003615 B CN 109003615B CN 201810982577 A CN201810982577 A CN 201810982577A CN 109003615 B CN109003615 B CN 109003615B
- Authority
- CN
- China
- Prior art keywords
- target
- index
- gain
- value
- gain quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000013139 quantization Methods 0.000 claims description 244
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000001514 detection method Methods 0.000 abstract description 6
- 230000000694 effects Effects 0.000 abstract description 5
- 238000011156 evaluation Methods 0.000 abstract description 4
- 238000004458 analytical method Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000007547 defect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明提供一种语音流嵌入信息的方法及装置、语音流解码信息的方法及装置,本发明根据语音帧确定目标增益值,继而根据目标增益值和第二增益量化表以及要嵌入的比特位确定第二目标索引或第三目标索引,从而实现信息的嵌入。上述技术方案隐写容量相对较高,能抵抗一般的隐写分析检测,并且合成语音的嵌入失真较小,语音质量客观评估和主观评估效果都较好。
Description
技术领域
本发明涉及语音处理领域,具体涉及一种语音流嵌入信息的方法及装置、语音流解码信息的方法及装置。
背景技术
在iLBC低比特率语音流中进行隐写,能够在隐藏秘密信息的同时隐藏通信传输的存在,因此利用在iLBC低比特率语音流中隐写能够将密钥、数字签名等秘密信息在开放的环境中安全的传送,这对加强信息安全保护有重要意义。但是,由于iLBC低比特率语音经压缩编码之后冗余很少,因此能够隐写到iLBC低比特率语音流中的信息很少,同时由于人耳对语音比图像或视频等载体更敏感,因此能够更容易觉察语音流存在异常,即更容易找到隐藏在语音流中的隐藏信息。基于以上原因,目前研究iLBC低比特率语音流的隐写技术相对较少。
当前,iLBC低比特率语音流隐写技术不仅存在隐藏信息容量小的缺陷,并且隐藏的信息容易被QIM隐写分析技术检测出来,同时iLBC低比特率语音流隐写技术还会引起原语音流失真,存在隐写精度低的缺陷。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种语音流嵌入信息的方法及装置、语音流解码信息的方法及装置,解决了现有技术中隐藏信息容量小、容易被QIM隐写分析技术检测出来以及隐写精度低的缺陷。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
第一方面,本发明实施例提供了一种语音流嵌入信息的方法,所述方法包括:
获取待嵌入信息,并对所述待嵌入信息进行转换,得到待若干个待嵌入位;
获取原始语音帧,并对所述原始语音帧进行预处理,得到目标语音帧;
对所述目标语音帧进行矢量量化,得到所述目标语音帧的矢量量化值,并根据所述矢量量化值得到所述目标语音帧的目标增益值;
从第一增益量化表中查找与所述目标增益值最接近的增益量化值,得到第一目标增益量化值;
根据所述第一增益量化表,获取与所述第一目标增益量化值对应的索引值,得到第一目标索引;其中,所述第一增益量化表包括若干个增益量化值以及每个所述增益量化值对应的索引值;
将第二增益量化表中索引号为奇数的项分为一组,得到第一量化组,将第二增益量化表中索引号为偶数的项分为一组,得到第二量化组;判断第N个待嵌入位是否等于1,若是,则从所述第一量化组中选取与所述目标增益值最接近的增益量化值,得到第二目标增益量化值;根据所述第二增益量化表,获取与所述第二目标增益量化值对应的索引值,得到第二目标索引;若第N个待嵌入位不等于1,则从所述第二量化组中选取与所述目标增益值最接近的增益量化值,得到第三目标增益量化值;根据所述第二增益量化表,获取与所述第三目标增益量化值对应的索引值,得到第三目标索引;其中,所述第二增益量化表包括若干个项,每个项均包括增益量化值以及与所述增益量化值对应的索引值;N为大于0的奇数;
根据所述第二目标索引或第三目标索引写入所述第N个待嵌入位。
结合第一方面,在第一种可能的实现方式中,所述方法包括如下步骤:
将第三增益量化表中索引号为奇数的项分为一组,得到第三量化组,将第三增益量化表中索引号为偶数的项分为一组,得到第四量化组;判断第N+1个待嵌入位是否等于1,若是,则从所述第三量化组中选取与所述目标增益值最接近的增益量化值,得到第四目标增益量化值;根据所述第三增益量化表,获取与所述第四目标增益量化值对应的索引值,得到第四目标索引;若第N+1个待嵌入位不等于1,则从所述第四量化组中选取与所述目标增益值最接近的增益量化值,得到第五目标增益量化值;根据所述第三增益量化表,获取与所述第五目标增益量化值对应的索引值,得到第五目标索引;其中,所述第三增益量化表包括若干个项,每个项均包括增益量化值以及与所述增益量化值对应的索引值;
根据所述第四目标索引或第五目标索引写入所述第N+1个待嵌入位。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述方法包括如下步骤:
将所述第一目标索引发送给解码端;
将所述第二目标索引或所述第三目标索引发送给所述解码端;
将所述第四目标索引或所述第五目标索引发送给所述解码端。
结合第一方面、第一方面的第一种可能的实现方式或第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述方法还包括如下步骤:
获取下一个原始语音帧,返回所述并对所述原始语音帧进行预处理的步骤,对第N+2个待嵌入位进行写入。
第二方面,本发明实施例提供了一种语音流解码信息的方法,所述方法包括:
获取第二目标索引或第三目标索引;
判断所述第二目标索引或第三目标索引是否为偶数,若是,则第N个待嵌入位为0,否则第N个待嵌入位为1。
结合第二方面,在第一种可能的实现方式中,所述方法还包括如下步骤:
获取第四目标索引或第五目标索引;
判断所述第四目标索引或第五目标索引是否为偶数,若是,则第N+1待嵌入位为0,否则第N+1个待嵌入位为1。
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述方法还包括如下步骤:
按照从前往后的顺序,将所有待嵌入位对应的数值排列成一串二进制码,得到待嵌入信息的二进制码。
结合第二方面的第一种可能的实现方式,在第三种可能的实现方式中,所述方法还包括如下步骤:
根据所述第二目标索引或第三目标索引确定第N个待嵌入位写入的位置;
根据所述第四目标索引或第五目标索引确定第N+1个待嵌入位写入的位置。
第三方面,本发明实施例提供了一种语音流嵌入信息的装置,所述装置包括:
嵌入信息获取单元,用于获取待嵌入信息,并对所述待嵌入信息进行转换,得到待若干个待嵌入位;
语音获取单元,用于获取原始语音帧,并对所述原始语音帧进行预处理,得到目标语音帧;
矢量量化单元,用于对所述目标语音帧进行矢量量化,得到所述目标语音帧的矢量量化值,并根据所述矢量量化值得到所述目标语音帧的目标增益值;
目标增益确定单元,用于从第一增益量化表中查找与所述目标增益值最接近的增益量化值,得到第一目标增益量化值;
第一索引确定单元,用于根据所述第一增益量化表,获取与所述第一目标增益量化值对应的索引值,得到第一目标索引;其中,所述第一增益量化表包括若干个增益量化值以及每个所述增益量化值对应的索引值;
第二索引确定单元,用于将第二增益量化表中索引号为奇数的项分为一组,得到第一量化组,将第二增益量化表中索引号为偶数的项分为一组,得到第二量化组;判断第N个待嵌入位是否等于1,若是,则从所述第一量化组中选取与所述目标增益值最接近的增益量化值,得到第二目标增益量化值;根据所述第二增益量化表,获取与所述第二目标增益量化值对应的索引值,得到第二目标索引;若第N个待嵌入位不等于1,则从所述第二量化组中选取与所述目标增益值最接近的增益量化值,得到第三目标增益量化值;根据所述第二增益量化表,获取与所述第三目标增益量化值对应的索引值,得到第三目标索引;其中,所述第二增益量化表包括若干个项,每个项均包括增益量化值以及与所述增益量化值对应的索引值;N为大于0的奇数;
嵌入单元,用于根据所述第二目标索引或第三目标索引写入所述第N个待嵌入位。
第四方面,本发明实施例提供了一种语音流解码信息的装置,所述装置包括:
索引获取单元,用于获取第二目标索引或第三目标索引;
嵌入数值确定单元,用于判断所述第二目标索引或第三目标索引是否为偶数,若是,则第N个待嵌入位为0,否则第N个待嵌入位为1。
(三)有益效果
本发明实施例提供了一种语音流嵌入信息的方法及装置、语音流解码信息的方法及装置。具备以下有益效果:
本发明实施例根据语音帧确定目标增益值,继而根据目标增益值和第二增益量化表以及要嵌入的比特位确定第二目标索引或第三目标索引,从而实现信息的嵌入。上述技术方案隐写容量相对较高,能抵抗一般的隐写分析检测,并且合成语音的嵌入失真较小,语音质量客观评估和主观评估效果都较好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性的示出了本发明一实施例的语音流嵌入信息的方法流程图;
图2示意性的示出了本发明另一实施例的语音流嵌入信息的方法流程图;
图3示意性的示出了本发明一实施例的语音流解码信息的方法的流程图;
图4示意性的示出了本发明另一实施例的语音流解码信息的方法的流程图;
图5示意性的示出了本发明一实施例的语音流嵌入信息的装置框图;
图6示意性的示出了本发明一实施例的语音流解码信息的装置的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种语音流嵌入信息的方法,本实施例的方法是在iLBC的编码方法进行的改进。具体地,如图1所示,本实施例的方法包括:
110、获取待嵌入信息,并对所述待嵌入信息进行转换,得到待若干个待嵌入位;
这里,每个待嵌入信息进行转化后得到一串二进制码;
120、获取原始语音帧,并对所述原始语音帧进行预处理,得到目标语音帧;
这里,目标语音帧也可以认为是语音的残差信号;
130、对所述目标语音帧进行矢量量化,得到所述目标语音帧的矢量量化值,并根据所述矢量量化值得到所述目标语音帧的目标增益值;
这里,不对目标语音帧的开始状态进行矢量量化;
140、从第一增益量化表中查找与所述目标增益值最接近的增益量化值,得到第一目标增益量化值;
150、根据所述第一增益量化表,获取与所述第一目标增益量化值对应的索引值,得到第一目标索引;其中,所述第一增益量化表包括若干个增益量化值以及每个所述增益量化值对应的索引值;
以上步骤不执行信息嵌入;
160、将第二增益量化表中索引号为奇数的项分为一组,得到第一量化组,将第二增益量化表中索引号为偶数的项分为一组,得到第二量化组;判断第N个待嵌入位是否等于1,若是,则从所述第一量化组中选取与所述目标增益值最接近的增益量化值,得到第二目标增益量化值;根据所述第二增益量化表,获取与所述第二目标增益量化值对应的索引值,得到第二目标索引;若第N个待嵌入位不等于1,则从所述第二量化组中选取与所述目标增益值最接近的增益量化值,得到第三目标增益量化值;根据所述第二增益量化表,获取与所述第三目标增益量化值对应的索引值,得到第三目标索引;其中,所述第二增益量化表包括若干个项,每个项均包括增益量化值以及与所述增益量化值对应的索引值;N为大于0的奇数;
170、根据所述第二目标索引或第三目标索引写入所述第N个待嵌入位。
进一步地,本实施例的方法包括如下步骤:
将第三增益量化表中索引号为奇数的项分为一组,得到第三量化组,将第三增益量化表中索引号为偶数的项分为一组,得到第四量化组;判断第N+1个待嵌入位是否等于1,若是,则从所述第三量化组中选取与所述目标增益值最接近的增益量化值,得到第四目标增益量化值;根据所述第三增益量化表,获取与所述第四目标增益量化值对应的索引值,得到第四目标索引;若第N+1个待嵌入位不等于1,则从所述第四量化组中选取与所述目标增益值最接近的增益量化值,得到第五目标增益量化值;根据所述第三增益量化表,获取与所述第五目标增益量化值对应的索引值,得到第五目标索引;其中,所述第三增益量化表包括若干个项,每个项均包括增益量化值以及与所述增益量化值对应的索引值;
根据所述第四目标索引或第五目标索引写入所述第N+1个待嵌入位。
本实施例中,在对第N位和第N+1位嵌入完成后,获取下一个原始语音帧,返回步骤110,对第N+2个待嵌入位进行嵌入,直到嵌入位嵌入完毕或已无语音帧载体。
进一步地,本实施例的语音流嵌入信息的方法还包括如下步骤:
将所述第一目标索引发送给解码端;
将所述第二目标索引或所述第三目标索引发送给所述解码端;
将所述第四目标索引或所述第五目标索引发送给所述解码端。
解码端根据接收的目标索引进行解码,确定嵌入为的位置和数值,从而得到带嵌入信息转码后的带嵌入位。
下面再通过一个实施例对上述语音流嵌入信息的方法进行详细说明。
本实施例的语音流嵌入信息的方法针对语音的残差信号进行3个阶段矢量量化的同时也要进行3个阶段的增益量化,这个增益量化过程指的是根据残差信号矢量量化计算得到,目标增益值,在相应的增益量化表中找到最匹配的索引。本实施例的方法根据不同的秘密比特(即每个待嵌入位的数值)信息,通过修改增益量化表的搜索范围从而嵌入秘密信息。具体步骤如下:
步骤1:在第一阶段,不执行信息嵌入,并且根据第一增益量化表正常地搜索最匹配的索引,得到第一目标索引;
步骤2:将第二阶段所对应的第二增益量化表进行分组,索引号为奇数的分为第一组,索引号为偶数的分为第二组,若秘密bit=‘1’,则在第一组里搜索最匹配增益值的索引,得到第二目标索引;若秘密bit=‘0’,则在第二组里搜索最匹配增益值的索引,得到第三目标索引;根据第二目标索引或第三目标索引嵌入了当前秘密bit;
步骤3:同步骤2,将第三阶段所对应的第三增益量化表进行分组,索引号为奇数的分为第一组,索引号为偶数的分为第二组,若秘密bit=‘1’,则在第一组里搜索最匹配增益值的索引,得到第四目标索引;若秘密bit=‘0’,则在第二组里搜索最匹配增益值的索引,得到第五目标索引;根据第四目标索引或第五目标索引嵌入了当前秘密bit;
步骤:当前一个语音帧的隐写嵌入已经结束,接下来进行后一个语音帧的隐写嵌入,直到秘密信息完全嵌入完毕或已无语音帧载体。
本实施例的方法在iLBC语音编码流中的索引这一参数,不同参数做嵌入的效果是不同的。在增益量化的第一阶段不进行嵌入,原因是第一阶段的索引在后来的校正编码过程中要被改变。上述第二阶段和第三阶段的分组方法是能够有效增加嵌入量。
本实施例的方法,对于10s的iLBC压缩语音流,以30ms每帧为例,可以嵌入416字节的秘密信息,而现有技术中的算法只能嵌入250字节的秘密信息。在相同嵌入容量下,通过隐写分析技术进行检测,上述方法嵌入后,检测准确率平均在50%左右,而现有技术中的算法的检测准确率平均却达到90%以上。
下面再通过一个具体的实施例对本发明的语音流嵌入信息的方法进行详细说明。
如图2所示,图中VQ_1-VQ_5是指参与矢量量化的残差信号块,gain_sq4Tbl[16]和gain_sq3Tbl[8]是指增益量化中第二阶段和第三阶段的量化表,分组结果是上标为‘0’和‘1’的两个子量化表(即两个分组)。如图2所示,本实施例的方法包括一下步骤:
步骤一、输入一个残差信号,例如VQ_1;
步骤二、在第一阶段,不执行信息嵌入,正常进行矢量量化,得到目标增益值;
步骤三、更新目标矢量,即更新目标增益值;
步骤四、对第二增益量化表进行分组,即对gain_sq4Tbl[16]进行分组;
步骤五、若秘密bit=‘1’,则在第一组里搜索最匹配增益值的索引,得到第二目标索引;若秘密bit=‘0’,则在第二组里搜索最匹配增益值的索引,得到第三目标索引;
步骤六、更新目标矢量;
步骤七、对第三增益量化表进行分组,即对gain_sq3Tbl[8]进行分组;
步骤八、若秘密bit=‘1’,则在第一组里搜索最匹配增益值的索引,得到第四目标索引;若秘密bit=‘0’,则在第二组里搜索最匹配增益值的索引,得到第五目标索引;
步骤九、保存三个阶段得到的目标索引;
步骤十、得到最终的增益索引数组,传递给解码端。
以上是实施例的语音流嵌入信息的方法,嵌入容量得到进一步提升,30ms一帧可以嵌入10bit的秘密信息,与现有技术中的算法一帧只能嵌入6bit相比有进步。同时,嵌入后,语音质量的客观评估和主观评估效果很好。另外,在抵抗语音隐写分析方面,上述方法可以抵抗一般通用的隐写分析技术。
本发明实施例还公开了一种语音流解码信息的方法,如图3所示,该方法包括:
210、获取第二目标索引或第三目标索引;
220、判断所述第二目标索引或第三目标索引是否为偶数,若是,则第N个待嵌入位为0,否则第N个待嵌入位为1。
进一步地,上述方法还包括如下步骤:
230、获取第四目标索引或第五目标索引;
240、判断所述第四目标索引或第五目标索引是否为偶数,若是,则第N+1待嵌入位为0,否则第N+1个待嵌入位为1。
进一步地,上述方法还包括如下步骤:
250、按照从前往后的顺序,将所有待嵌入位对应的数值排列成一串二进制码,得到待嵌入信息的二进制码。
进一步地,上述方法还包括如下步骤:
260、根据所述第二目标索引或第三目标索引确定第N个待嵌入位写入的位置;
270、根据所述第四目标索引或第五目标索引确定第N+1个待嵌入位写入的位置。
本实施例的方法是解码端执行的操作,实现了对传输的语音流的解码。本实施例利用目标索引的奇偶(性)能够确定嵌入位的二进制数值,继而根据索引值确定嵌入位的位置。
下面通过一个具体的实施例对本发明的语音流解码信息的方法进行详细说明。
如图4所示,extra_gain_index[3]和gain_index[3*4]是从编码流中解压提取出来的增益量化索引(及目标索引)本实施例的方法包括如下步骤:
步骤一、输入目标索引extra_gain_index[3];
步骤二、在第一阶段不提取;
步骤三、判断索引号是否为偶数,若是,则提取得到比特0,否则提取得到比特1;
步骤四、整合得到的所有比特‘
步骤五、对所有残差信号得到的目标索引进行比特提取;
步骤六、整合所有的得到秘密比特(及上述提取得到的比特);
步骤七,输出秘密信息(及步骤六整合得到的信息)。
对应于上述实施例的语音流嵌入信息的方法,本发明实施例还提供了一种语音流嵌入信息的装置,如图5所示,该装置包括:
嵌入信息获取单元,用于获取待嵌入信息,并对所述待嵌入信息进行转换,得到待若干个待嵌入位;
语音获取单元,用于获取原始语音帧,并对所述原始语音帧进行预处理,得到目标语音帧;
矢量量化单元,用于对所述目标语音帧进行矢量量化,得到所述目标语音帧的矢量量化值,并根据所述矢量量化值得到所述目标语音帧的目标增益值;
目标增益确定单元,用于从第一增益量化表中查找与所述目标增益值最接近的增益量化值,得到第一目标增益量化值;
第一索引确定单元,用于根据所述第一增益量化表,获取与所述第一目标增益量化值对应的索引值,得到第一目标索引;其中,所述第一增益量化表包括若干个增益量化值以及每个所述增益量化值对应的索引值;
第二索引确定单元,用于将第二增益量化表中索引号为奇数的项分为一组,得到第一量化组,将第二增益量化表中索引号为偶数的项分为一组,得到第二量化组;判断第N个待嵌入位是否等于1,若是,则从所述第一量化组中选取与所述目标增益值最接近的增益量化值,得到第二目标增益量化值;根据所述第二增益量化表,获取与所述第二目标增益量化值对应的索引值,得到第二目标索引;若第N个待嵌入位不等于1,则从所述第二量化组中选取与所述目标增益值最接近的增益量化值,得到第三目标增益量化值;根据所述第二增益量化表,获取与所述第三目标增益量化值对应的索引值,得到第三目标索引;其中,所述第二增益量化表包括若干个项,每个项均包括增益量化值以及与所述增益量化值对应的索引值;N为大于0的奇数;
嵌入单元,用于根据所述第二目标索引或第三目标索引写入所述第N个待嵌入位。
对应于上述实施例的语音流解码信息的方法,本发明实施例还提供了一种语音流解码信息的装置,如图6所示,该装置包括:
索引获取单元,用于获取第二目标索引或第三目标索引;
嵌入数值确定单元,用于判断所述第二目标索引或第三目标索引是否为偶数,若是,则第N个待嵌入位为0,否则第N个待嵌入位为1。
本发明实施例的方法中的每个步骤是于本发明实施例的装置中每个部件的功能一一对应的,对于重复的部分,这里不再进行赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种语音流嵌入信息的方法,其特征在于,所述方法包括:
获取待嵌入信息,并对所述待嵌入信息进行转换,得到待若干个待嵌入位;
获取原始语音帧,并对所述原始语音帧进行预处理,得到目标语音帧;
对所述目标语音帧进行矢量量化,得到所述目标语音帧的矢量量化值,并根据所述矢量量化值得到所述目标语音帧的目标增益值;
从第一增益量化表中查找与所述目标增益值最接近的增益量化值,得到第一目标增益量化值;
根据所述第一增益量化表,获取与所述第一目标增益量化值对应的索引值,得到第一目标索引;其中,所述第一增益量化表包括若干个增益量化值以及每个所述增益量化值对应的索引值;
将第二增益量化表中索引号为奇数的项分为一组,得到第一量化组,将第二增益量化表中索引号为偶数的项分为一组,得到第二量化组;判断第N个待嵌入位是否等于1,若是,则从所述第一量化组中选取与所述目标增益值最接近的增益量化值,得到第二目标增益量化值;根据所述第二增益量化表,获取与所述第二目标增益量化值对应的索引值,得到第二目标索引;若第N个待嵌入位不等于1,则从所述第二量化组中选取与所述目标增益值最接近的增益量化值,得到第三目标增益量化值;根据所述第二增益量化表,获取与所述第三目标增益量化值对应的索引值,得到第三目标索引;其中,所述第二增益量化表包括若干个项,每个项均包括增益量化值以及与所述增益量化值对应的索引值;N为大于0的奇数;
根据所述第二目标索引或第三目标索引写入所述第N个待嵌入位。
2.根据权利要求1所述的方法,其特征在于,所述方法包括如下步骤:
将第三增益量化表中索引号为奇数的项分为一组,得到第三量化组,将第三增益量化表中索引号为偶数的项分为一组,得到第四量化组;判断第N+1个待嵌入位是否等于1,若是,则从所述第三量化组中选取与所述目标增益值最接近的增益量化值,得到第四目标增益量化值;根据所述第三增益量化表,获取与所述第四目标增益量化值对应的索引值,得到第四目标索引;若第N+1个待嵌入位不等于1,则从所述第四量化组中选取与所述目标增益值最接近的增益量化值,得到第五目标增益量化值;根据所述第三增益量化表,获取与所述第五目标增益量化值对应的索引值,得到第五目标索引;其中,所述第三增益量化表包括若干个项,每个项均包括增益量化值以及与所述增益量化值对应的索引值;
根据所述第四目标索引或第五目标索引写入所述第N+1个待嵌入位。
3.根据权利要求2所述的方法,其特征在于,所述方法包括如下步骤:
将所述第一目标索引发送给解码端;
将所述第二目标索引或所述第三目标索引发送给所述解码端;
将所述第四目标索引或所述第五目标索引发送给所述解码端。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括如下步骤:
获取下一个原始语音帧,返回所述并对所述原始语音帧进行预处理的步骤,对第N+2个待嵌入位进行写入。
5.根据权利要求1所述的方法,其特征在于,所述方法对应的语音流解码信息的方法,包括:
获取第二目标索引或第三目标索引;
判断所述第二目标索引或第三目标索引是否为偶数,若是,则第N个待嵌入位为0,否则第N个待嵌入位为1。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括如下步骤:
获取第四目标索引或第五目标索引;
判断所述第四目标索引或第五目标索引是否为偶数,若是,则第N+1待嵌入位为0,否则第N+1个待嵌入位为1。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括如下步骤:
按照从前往后的顺序,将所有待嵌入位对应的数值排列成一串二进制码,得到待嵌入信息的二进制码。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括如下步骤:
根据所述第二目标索引或第三目标索引确定第N个待嵌入位写入的位置;
根据所述第四目标索引或第五目标索引确定第N+1个待嵌入位写入的位置。
9.一种语音流嵌入信息的装置,其特征在于,所述装置包括:
嵌入信息获取单元,用于获取待嵌入信息,并对所述待嵌入信息进行转换,得到待若干个待嵌入位;
语音获取单元,用于获取原始语音帧,并对所述原始语音帧进行预处理,得到目标语音帧;
矢量量化单元,用于对所述目标语音帧进行矢量量化,得到所述目标语音帧的矢量量化值,并根据所述矢量量化值得到所述目标语音帧的目标增益值;
目标增益确定单元,用于从第一增益量化表中查找与所述目标增益值最接近的增益量化值,得到第一目标增益量化值;
第一索引确定单元,用于根据所述第一增益量化表,获取与所述第一目标增益量化值对应的索引值,得到第一目标索引;其中,所述第一增益量化表包括若干个增益量化值以及每个所述增益量化值对应的索引值;
第二索引确定单元,用于将第二增益量化表中索引号为奇数的项分为一组,得到第一量化组,将第二增益量化表中索引号为偶数的项分为一组,得到第二量化组;判断第N个待嵌入位是否等于1,若是,则从所述第一量化组中选取与所述目标增益值最接近的增益量化值,得到第二目标增益量化值;根据所述第二增益量化表,获取与所述第二目标增益量化值对应的索引值,得到第二目标索引;若第N个待嵌入位不等于1,则从所述第二量化组中选取与所述目标增益值最接近的增益量化值,得到第三目标增益量化值;根据所述第二增益量化表,获取与所述第三目标增益量化值对应的索引值,得到第三目标索引;其中,所述第二增益量化表包括若干个项,每个项均包括增益量化值以及与所述增益量化值对应的索引值;N为大于0的奇数;
嵌入单元,用于根据所述第二目标索引或第三目标索引写入所述第N个待嵌入位。
10.如权利要求9所述的装置,其特征在于,所述装置对应的语音流解码信息的装置,包括:
索引获取单元,用于获取第二目标索引或第三目标索引;
嵌入数值确定单元,用于判断所述第二目标索引或第三目标索引是否为偶数,若是,则第N个待嵌入位为0,否则第N个待嵌入位为1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810982577.5A CN109003615B (zh) | 2018-08-27 | 2018-08-27 | 语音流嵌入信息方法及装置、语音流解码信息方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810982577.5A CN109003615B (zh) | 2018-08-27 | 2018-08-27 | 语音流嵌入信息方法及装置、语音流解码信息方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109003615A CN109003615A (zh) | 2018-12-14 |
CN109003615B true CN109003615B (zh) | 2020-12-25 |
Family
ID=64592517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810982577.5A Active CN109003615B (zh) | 2018-08-27 | 2018-08-27 | 语音流嵌入信息方法及装置、语音流解码信息方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109003615B (zh) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7376242B2 (en) * | 2001-03-22 | 2008-05-20 | Digimarc Corporation | Quantization-based data embedding in mapped data |
US7805292B2 (en) * | 2006-04-21 | 2010-09-28 | Dilithium Holdings, Inc. | Method and apparatus for audio transcoding |
CN104064193B (zh) * | 2013-03-21 | 2016-12-28 | 中国科学院声学研究所 | 一种线性预测语音编码的信息隐藏方法与提取方法 |
JP6389525B2 (ja) * | 2014-02-27 | 2018-09-12 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 |
CN104683362B (zh) * | 2015-03-27 | 2017-05-17 | 合肥工业大学 | 一种细粒度隐私安全的访问控制系统及其访问控制方法 |
CN107527621A (zh) * | 2017-08-29 | 2017-12-29 | 中国民航大学 | 动态码本基于完全二叉树分组的语音信息隐藏算法 |
CN107547196A (zh) * | 2017-08-29 | 2018-01-05 | 中国民航大学 | 基于参数修正的语音信息隐藏算法 |
CN107689226A (zh) * | 2017-08-29 | 2018-02-13 | 中国民航大学 | 基于iLBC编码的一种小容量语音信息隐藏方法 |
-
2018
- 2018-08-27 CN CN201810982577.5A patent/CN109003615B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109003615A (zh) | 2018-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108880556B (zh) | 基于lz77的无损数据压缩方法、误码修复方法及编码器和解码器 | |
Yang et al. | Fractal curves to improve the reversible data embedding for VQ-indexes based on locally adaptive coding | |
KR101476699B1 (ko) | 디지털 오디오 신호들의 계층적 코딩 | |
CN104064193B (zh) | 一种线性预测语音编码的信息隐藏方法与提取方法 | |
JP2006217340A5 (zh) | ||
Yan et al. | Steganalysis for MP3Stego using differential statistics of quantization step | |
US8571112B2 (en) | Specification method and apparatus for coding and decoding | |
KR20110043684A (ko) | 디지털 신호의 압축 또는 압축해제를 위한 방법, 시스템 및 장치 | |
CN109003615B (zh) | 语音流嵌入信息方法及装置、语音流解码信息方法及装置 | |
CN1199516A (zh) | 对诸语音频谱参数进行最小冗余检错和纠错的方法和诸设备 | |
Peng et al. | A steganography scheme in a low-bit rate speech codec based on 3D-sudoku matrix | |
US10084477B2 (en) | Method and apparatus for adaptive data compression | |
CN110689897A (zh) | 基于线性预测语音编码的信息隐藏及隐藏信息提取方法 | |
Abdulmunem et al. | Advanced Intelligent Data Hiding Using Video Stego and Convolutional Neural Networks | |
CN107545899A (zh) | 一种基于清音基音延迟抖动特性的amr隐写方法 | |
Rahmani et al. | A reversible data embedding scheme based on search order coding for VQ index tables | |
CN105575401B (zh) | 一种基于C-MAC特征的AACHuffman域隐写分析方法 | |
CN113240761A (zh) | 一种适用于遥感卫星的高位深图像无损压缩方法 | |
CN101741392A (zh) | 一种快速解析码长的哈夫曼解码方法 | |
CN110958417B (zh) | 一种基于语音线索的视频通话类视频去除压缩噪声的方法 | |
Liu et al. | Content-Aware Robust JPEG Steganography for Lossy Channels Using LPCNet | |
CN113784147A (zh) | 一种基于卷积神经网络的高效视频编码方法及系统 | |
Chang et al. | A Reversible Data Hiding Method for SMVQ Indices Based on Improved Locally Adaptive Coding. | |
Rahmani et al. | A location map free reversible data hiding scheme for VQ-compressed images based on search order coding | |
CN101771416B (zh) | 位平面编码和解码方法、通信系统及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |