CN109003615B

CN109003615B - 语音流嵌入信息方法及装置、语音流解码信息方法及装置

Info

Publication number: CN109003615B
Application number: CN201810982577.5A
Authority: CN
Inventors: 苏兆品; 李望望; 张国富; 岳峰; 周仙仙
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2018-08-27
Filing date: 2018-08-27
Publication date: 2020-12-25
Anticipated expiration: 2038-08-27
Also published as: CN109003615A

Abstract

本发明提供一种语音流嵌入信息的方法及装置、语音流解码信息的方法及装置，本发明根据语音帧确定目标增益值，继而根据目标增益值和第二增益量化表以及要嵌入的比特位确定第二目标索引或第三目标索引，从而实现信息的嵌入。上述技术方案隐写容量相对较高，能抵抗一般的隐写分析检测，并且合成语音的嵌入失真较小，语音质量客观评估和主观评估效果都较好。

Description

语音流嵌入信息方法及装置、语音流解码信息方法及装置

技术领域

本发明涉及语音处理领域，具体涉及一种语音流嵌入信息的方法及装置、语音流解码信息的方法及装置。

背景技术

在iLBC低比特率语音流中进行隐写，能够在隐藏秘密信息的同时隐藏通信传输的存在，因此利用在iLBC低比特率语音流中隐写能够将密钥、数字签名等秘密信息在开放的环境中安全的传送，这对加强信息安全保护有重要意义。但是，由于iLBC低比特率语音经压缩编码之后冗余很少，因此能够隐写到iLBC低比特率语音流中的信息很少，同时由于人耳对语音比图像或视频等载体更敏感，因此能够更容易觉察语音流存在异常，即更容易找到隐藏在语音流中的隐藏信息。基于以上原因，目前研究iLBC低比特率语音流的隐写技术相对较少。

当前，iLBC低比特率语音流隐写技术不仅存在隐藏信息容量小的缺陷，并且隐藏的信息容易被QIM隐写分析技术检测出来，同时iLBC低比特率语音流隐写技术还会引起原语音流失真，存在隐写精度低的缺陷。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种语音流嵌入信息的方法及装置、语音流解码信息的方法及装置，解决了现有技术中隐藏信息容量小、容易被QIM隐写分析技术检测出来以及隐写精度低的缺陷。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

第一方面，本发明实施例提供了一种语音流嵌入信息的方法，所述方法包括：

获取待嵌入信息，并对所述待嵌入信息进行转换，得到待若干个待嵌入位；

获取原始语音帧，并对所述原始语音帧进行预处理，得到目标语音帧；

对所述目标语音帧进行矢量量化，得到所述目标语音帧的矢量量化值，并根据所述矢量量化值得到所述目标语音帧的目标增益值；

从第一增益量化表中查找与所述目标增益值最接近的增益量化值，得到第一目标增益量化值；

根据所述第一增益量化表，获取与所述第一目标增益量化值对应的索引值，得到第一目标索引；其中，所述第一增益量化表包括若干个增益量化值以及每个所述增益量化值对应的索引值；

将第二增益量化表中索引号为奇数的项分为一组，得到第一量化组，将第二增益量化表中索引号为偶数的项分为一组，得到第二量化组；判断第N个待嵌入位是否等于1，若是，则从所述第一量化组中选取与所述目标增益值最接近的增益量化值，得到第二目标增益量化值；根据所述第二增益量化表，获取与所述第二目标增益量化值对应的索引值，得到第二目标索引；若第N个待嵌入位不等于1，则从所述第二量化组中选取与所述目标增益值最接近的增益量化值，得到第三目标增益量化值；根据所述第二增益量化表，获取与所述第三目标增益量化值对应的索引值，得到第三目标索引；其中，所述第二增益量化表包括若干个项，每个项均包括增益量化值以及与所述增益量化值对应的索引值；N为大于0的奇数；

根据所述第二目标索引或第三目标索引写入所述第N个待嵌入位。

结合第一方面，在第一种可能的实现方式中，所述方法包括如下步骤：

将第三增益量化表中索引号为奇数的项分为一组，得到第三量化组，将第三增益量化表中索引号为偶数的项分为一组，得到第四量化组；判断第N+1个待嵌入位是否等于1，若是，则从所述第三量化组中选取与所述目标增益值最接近的增益量化值，得到第四目标增益量化值；根据所述第三增益量化表，获取与所述第四目标增益量化值对应的索引值，得到第四目标索引；若第N+1个待嵌入位不等于1，则从所述第四量化组中选取与所述目标增益值最接近的增益量化值，得到第五目标增益量化值；根据所述第三增益量化表，获取与所述第五目标增益量化值对应的索引值，得到第五目标索引；其中，所述第三增益量化表包括若干个项，每个项均包括增益量化值以及与所述增益量化值对应的索引值；

根据所述第四目标索引或第五目标索引写入所述第N+1个待嵌入位。

结合第一方面的第一种可能的实现方式，在第二种可能的实现方式中，所述方法包括如下步骤：

将所述第一目标索引发送给解码端；

将所述第二目标索引或所述第三目标索引发送给所述解码端；

将所述第四目标索引或所述第五目标索引发送给所述解码端。

结合第一方面、第一方面的第一种可能的实现方式或第一方面的第二种可能的实现方式，在第三种可能的实现方式中，所述方法还包括如下步骤：

获取下一个原始语音帧，返回所述并对所述原始语音帧进行预处理的步骤，对第N+2个待嵌入位进行写入。

第二方面，本发明实施例提供了一种语音流解码信息的方法，所述方法包括：

获取第二目标索引或第三目标索引；

判断所述第二目标索引或第三目标索引是否为偶数，若是，则第N个待嵌入位为0，否则第N个待嵌入位为1。

结合第二方面，在第一种可能的实现方式中，所述方法还包括如下步骤：

获取第四目标索引或第五目标索引；

判断所述第四目标索引或第五目标索引是否为偶数，若是，则第N+1待嵌入位为0，否则第N+1个待嵌入位为1。

结合第二方面的第一种可能的实现方式，在第二种可能的实现方式中，所述方法还包括如下步骤：

按照从前往后的顺序，将所有待嵌入位对应的数值排列成一串二进制码，得到待嵌入信息的二进制码。

结合第二方面的第一种可能的实现方式，在第三种可能的实现方式中，所述方法还包括如下步骤：

根据所述第二目标索引或第三目标索引确定第N个待嵌入位写入的位置；

根据所述第四目标索引或第五目标索引确定第N+1个待嵌入位写入的位置。

第三方面，本发明实施例提供了一种语音流嵌入信息的装置，所述装置包括：

嵌入信息获取单元，用于获取待嵌入信息，并对所述待嵌入信息进行转换，得到待若干个待嵌入位；

语音获取单元，用于获取原始语音帧，并对所述原始语音帧进行预处理，得到目标语音帧；

矢量量化单元，用于对所述目标语音帧进行矢量量化，得到所述目标语音帧的矢量量化值，并根据所述矢量量化值得到所述目标语音帧的目标增益值；

目标增益确定单元，用于从第一增益量化表中查找与所述目标增益值最接近的增益量化值，得到第一目标增益量化值；

第一索引确定单元，用于根据所述第一增益量化表，获取与所述第一目标增益量化值对应的索引值，得到第一目标索引；其中，所述第一增益量化表包括若干个增益量化值以及每个所述增益量化值对应的索引值；

第二索引确定单元，用于将第二增益量化表中索引号为奇数的项分为一组，得到第一量化组，将第二增益量化表中索引号为偶数的项分为一组，得到第二量化组；判断第N个待嵌入位是否等于1，若是，则从所述第一量化组中选取与所述目标增益值最接近的增益量化值，得到第二目标增益量化值；根据所述第二增益量化表，获取与所述第二目标增益量化值对应的索引值，得到第二目标索引；若第N个待嵌入位不等于1，则从所述第二量化组中选取与所述目标增益值最接近的增益量化值，得到第三目标增益量化值；根据所述第二增益量化表，获取与所述第三目标增益量化值对应的索引值，得到第三目标索引；其中，所述第二增益量化表包括若干个项，每个项均包括增益量化值以及与所述增益量化值对应的索引值；N为大于0的奇数；

嵌入单元，用于根据所述第二目标索引或第三目标索引写入所述第N个待嵌入位。

第四方面，本发明实施例提供了一种语音流解码信息的装置，所述装置包括：

索引获取单元，用于获取第二目标索引或第三目标索引；

嵌入数值确定单元，用于判断所述第二目标索引或第三目标索引是否为偶数，若是，则第N个待嵌入位为0，否则第N个待嵌入位为1。

(三)有益效果

本发明实施例提供了一种语音流嵌入信息的方法及装置、语音流解码信息的方法及装置。具备以下有益效果：

本发明实施例根据语音帧确定目标增益值，继而根据目标增益值和第二增益量化表以及要嵌入的比特位确定第二目标索引或第三目标索引，从而实现信息的嵌入。上述技术方案隐写容量相对较高，能抵抗一般的隐写分析检测，并且合成语音的嵌入失真较小，语音质量客观评估和主观评估效果都较好。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示意性的示出了本发明一实施例的语音流嵌入信息的方法流程图；

图2示意性的示出了本发明另一实施例的语音流嵌入信息的方法流程图；

图3示意性的示出了本发明一实施例的语音流解码信息的方法的流程图；

图4示意性的示出了本发明另一实施例的语音流解码信息的方法的流程图；

图5示意性的示出了本发明一实施例的语音流嵌入信息的装置框图；

图6示意性的示出了本发明一实施例的语音流解码信息的装置的框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种语音流嵌入信息的方法，本实施例的方法是在iLBC的编码方法进行的改进。具体地，如图1所示，本实施例的方法包括：

110、获取待嵌入信息，并对所述待嵌入信息进行转换，得到待若干个待嵌入位；

这里，每个待嵌入信息进行转化后得到一串二进制码；

120、获取原始语音帧，并对所述原始语音帧进行预处理，得到目标语音帧；

这里，目标语音帧也可以认为是语音的残差信号；

130、对所述目标语音帧进行矢量量化，得到所述目标语音帧的矢量量化值，并根据所述矢量量化值得到所述目标语音帧的目标增益值；

这里，不对目标语音帧的开始状态进行矢量量化；

140、从第一增益量化表中查找与所述目标增益值最接近的增益量化值，得到第一目标增益量化值；

150、根据所述第一增益量化表，获取与所述第一目标增益量化值对应的索引值，得到第一目标索引；其中，所述第一增益量化表包括若干个增益量化值以及每个所述增益量化值对应的索引值；

以上步骤不执行信息嵌入；

160、将第二增益量化表中索引号为奇数的项分为一组，得到第一量化组，将第二增益量化表中索引号为偶数的项分为一组，得到第二量化组；判断第N个待嵌入位是否等于1，若是，则从所述第一量化组中选取与所述目标增益值最接近的增益量化值，得到第二目标增益量化值；根据所述第二增益量化表，获取与所述第二目标增益量化值对应的索引值，得到第二目标索引；若第N个待嵌入位不等于1，则从所述第二量化组中选取与所述目标增益值最接近的增益量化值，得到第三目标增益量化值；根据所述第二增益量化表，获取与所述第三目标增益量化值对应的索引值，得到第三目标索引；其中，所述第二增益量化表包括若干个项，每个项均包括增益量化值以及与所述增益量化值对应的索引值；N为大于0的奇数；

170、根据所述第二目标索引或第三目标索引写入所述第N个待嵌入位。

进一步地，本实施例的方法包括如下步骤：

本实施例中，在对第N位和第N+1位嵌入完成后，获取下一个原始语音帧，返回步骤110，对第N+2个待嵌入位进行嵌入，直到嵌入位嵌入完毕或已无语音帧载体。

进一步地，本实施例的语音流嵌入信息的方法还包括如下步骤：

将所述第一目标索引发送给解码端；

解码端根据接收的目标索引进行解码，确定嵌入为的位置和数值，从而得到带嵌入信息转码后的带嵌入位。

下面再通过一个实施例对上述语音流嵌入信息的方法进行详细说明。

本实施例的语音流嵌入信息的方法针对语音的残差信号进行3个阶段矢量量化的同时也要进行3个阶段的增益量化，这个增益量化过程指的是根据残差信号矢量量化计算得到，目标增益值，在相应的增益量化表中找到最匹配的索引。本实施例的方法根据不同的秘密比特(即每个待嵌入位的数值)信息，通过修改增益量化表的搜索范围从而嵌入秘密信息。具体步骤如下:

步骤1:在第一阶段，不执行信息嵌入，并且根据第一增益量化表正常地搜索最匹配的索引，得到第一目标索引；

步骤2:将第二阶段所对应的第二增益量化表进行分组，索引号为奇数的分为第一组，索引号为偶数的分为第二组，若秘密bit＝‘1’,则在第一组里搜索最匹配增益值的索引，得到第二目标索引；若秘密bit＝‘0’,则在第二组里搜索最匹配增益值的索引，得到第三目标索引；根据第二目标索引或第三目标索引嵌入了当前秘密bit；

步骤3：同步骤2,将第三阶段所对应的第三增益量化表进行分组，索引号为奇数的分为第一组，索引号为偶数的分为第二组，若秘密bit＝‘1’,则在第一组里搜索最匹配增益值的索引，得到第四目标索引；若秘密bit＝‘0’,则在第二组里搜索最匹配增益值的索引，得到第五目标索引；根据第四目标索引或第五目标索引嵌入了当前秘密bit；

步骤：当前一个语音帧的隐写嵌入已经结束，接下来进行后一个语音帧的隐写嵌入，直到秘密信息完全嵌入完毕或已无语音帧载体。

本实施例的方法在iLBC语音编码流中的索引这一参数，不同参数做嵌入的效果是不同的。在增益量化的第一阶段不进行嵌入，原因是第一阶段的索引在后来的校正编码过程中要被改变。上述第二阶段和第三阶段的分组方法是能够有效增加嵌入量。

本实施例的方法，对于10s的iLBC压缩语音流，以30ms每帧为例，可以嵌入416字节的秘密信息，而现有技术中的算法只能嵌入250字节的秘密信息。在相同嵌入容量下，通过隐写分析技术进行检测，上述方法嵌入后，检测准确率平均在50％左右，而现有技术中的算法的检测准确率平均却达到90％以上。

下面再通过一个具体的实施例对本发明的语音流嵌入信息的方法进行详细说明。

如图2所示，图中VQ_1-VQ_5是指参与矢量量化的残差信号块，gain_sq4Tbl[16]和gain_sq3Tbl[8]是指增益量化中第二阶段和第三阶段的量化表，分组结果是上标为‘0’和‘1’的两个子量化表(即两个分组)。如图2所示，本实施例的方法包括一下步骤：

步骤一、输入一个残差信号，例如VQ_1；

步骤二、在第一阶段，不执行信息嵌入，正常进行矢量量化，得到目标增益值；

步骤三、更新目标矢量，即更新目标增益值；

步骤四、对第二增益量化表进行分组，即对gain_sq4Tbl[16]进行分组；

步骤五、若秘密bit＝‘1’,则在第一组里搜索最匹配增益值的索引，得到第二目标索引；若秘密bit＝‘0’,则在第二组里搜索最匹配增益值的索引，得到第三目标索引；

步骤六、更新目标矢量；

步骤七、对第三增益量化表进行分组，即对gain_sq3Tbl[8]进行分组；

步骤八、若秘密bit＝‘1’,则在第一组里搜索最匹配增益值的索引，得到第四目标索引；若秘密bit＝‘0’,则在第二组里搜索最匹配增益值的索引，得到第五目标索引；

步骤九、保存三个阶段得到的目标索引；

步骤十、得到最终的增益索引数组，传递给解码端。

以上是实施例的语音流嵌入信息的方法，嵌入容量得到进一步提升，30ms一帧可以嵌入10bit的秘密信息，与现有技术中的算法一帧只能嵌入6bit相比有进步。同时，嵌入后，语音质量的客观评估和主观评估效果很好。另外，在抵抗语音隐写分析方面，上述方法可以抵抗一般通用的隐写分析技术。

本发明实施例还公开了一种语音流解码信息的方法，如图3所示，该方法包括：

210、获取第二目标索引或第三目标索引；

220、判断所述第二目标索引或第三目标索引是否为偶数，若是，则第N个待嵌入位为0，否则第N个待嵌入位为1。

进一步地，上述方法还包括如下步骤：

230、获取第四目标索引或第五目标索引；

240、判断所述第四目标索引或第五目标索引是否为偶数，若是，则第N+1待嵌入位为0，否则第N+1个待嵌入位为1。

进一步地，上述方法还包括如下步骤：

250、按照从前往后的顺序，将所有待嵌入位对应的数值排列成一串二进制码，得到待嵌入信息的二进制码。

进一步地，上述方法还包括如下步骤：

260、根据所述第二目标索引或第三目标索引确定第N个待嵌入位写入的位置；

270、根据所述第四目标索引或第五目标索引确定第N+1个待嵌入位写入的位置。

本实施例的方法是解码端执行的操作，实现了对传输的语音流的解码。本实施例利用目标索引的奇偶(性)能够确定嵌入位的二进制数值，继而根据索引值确定嵌入位的位置。

下面通过一个具体的实施例对本发明的语音流解码信息的方法进行详细说明。

如图4所示，extra_gain_index[3]和gain_index[3*4]是从编码流中解压提取出来的增益量化索引(及目标索引)本实施例的方法包括如下步骤：

步骤一、输入目标索引extra_gain_index[3]；

步骤二、在第一阶段不提取；

步骤三、判断索引号是否为偶数，若是，则提取得到比特0，否则提取得到比特1；

步骤四、整合得到的所有比特‘

步骤五、对所有残差信号得到的目标索引进行比特提取；

步骤六、整合所有的得到秘密比特(及上述提取得到的比特)；

步骤七，输出秘密信息(及步骤六整合得到的信息)。

对应于上述实施例的语音流嵌入信息的方法，本发明实施例还提供了一种语音流嵌入信息的装置，如图5所示，该装置包括：

对应于上述实施例的语音流解码信息的方法，本发明实施例还提供了一种语音流解码信息的装置，如图6所示，该装置包括：

索引获取单元，用于获取第二目标索引或第三目标索引；

本发明实施例的方法中的每个步骤是于本发明实施例的装置中每个部件的功能一一对应的，对于重复的部分，这里不再进行赘述。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种语音流嵌入信息的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法包括如下步骤：

3.根据权利要求2所述的方法，其特征在于，所述方法包括如下步骤：

将所述第一目标索引发送给解码端；

4.根据权利要求1至3任一项所述的方法，其特征在于，所述方法还包括如下步骤：

5.根据权利要求1所述的方法，其特征在于，所述方法对应的语音流解码信息的方法，包括：

获取第二目标索引或第三目标索引；

6.根据权利要求5所述的方法，其特征在于，所述方法还包括如下步骤：

获取第四目标索引或第五目标索引；

7.根据权利要求6所述的方法，其特征在于，所述方法还包括如下步骤：

8.根据权利要求6所述的方法，其特征在于，所述方法还包括如下步骤：

9.一种语音流嵌入信息的装置，其特征在于，所述装置包括：

10.如权利要求9所述的装置，其特征在于，所述装置对应的语音流解码信息的装置，包括：

索引获取单元，用于获取第二目标索引或第三目标索引；