CN107689226A - 基于iLBC编码的一种小容量语音信息隐藏方法 - Google Patents

基于iLBC编码的一种小容量语音信息隐藏方法 Download PDF

Info

Publication number
CN107689226A
CN107689226A CN201710789703.0A CN201710789703A CN107689226A CN 107689226 A CN107689226 A CN 107689226A CN 201710789703 A CN201710789703 A CN 201710789703A CN 107689226 A CN107689226 A CN 107689226A
Authority
CN
China
Prior art keywords
secret information
embedded
ilbc
information
secret
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710789703.0A
Other languages
English (en)
Inventor
吴志军
崔子涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Civil Aviation University of China
Original Assignee
Civil Aviation University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Civil Aviation University of China filed Critical Civil Aviation University of China
Priority to CN201710789703.0A priority Critical patent/CN107689226A/zh
Publication of CN107689226A publication Critical patent/CN107689226A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

为实现以低速率编码语音为载体的隐蔽通信,本发明使用了一款专为互联网通信设计的低速率编码器——iLBC编码器,以此获得编码比特流。本发明在编码过程中结合了编码索引调制的码本分块算法,实现了隐秘信息的嵌入;在解码过程中根据量化索引值的数字特征判断嵌入的隐秘信息,实现隐秘信息的提取。根据实验结果,该方法获得了至少100bps的隐藏容量,平均PESQ_MOS值下降不到0.5%,嵌入隐秘信息对载体语音的影响几乎可以忽略,具有较好的隐蔽性。

Description

基于iLBC编码的一种小容量语音信息隐藏方法
技术领域
本发明涉及一种信息隐藏方法,针对低速率编码器iLBC编码器的小容量信息隐藏方法,可以保证嵌入信息具有良好的隐蔽性并且不会对载体语音有较大影响。
背景技术
随着信息社会的不断发展,人们在享受快捷方便的网络通信时,不得不面对隐私泄露和信息失窃的风险。为了实现隐私保护和信息安全,一些安全技术被逐渐应用到了网络通信领域中。就语音的保密通信来看,传统的语音加密技术虽然可以起到保证信息安全的作用,但是由于在网络上传输的是经过加密的语音信号,即密文,这就就会极大的激发非授权者破解密文的欲望,很可能导致语音信息被破解或者暴力破坏,最终导致隐私泄露,失去保密通信的意义。语音信息隐藏技术不同于加密技术,它在信道上传输的是一些不会引起非授权者兴趣的普通语音信息,但是,作为载体,这些普通语音信息中承载了一部分隐秘信息。发送方通过某种隐藏算法,把一些隐秘信息嵌入到普通语音信息中,然后发送到网络上,这并不会引起非授权者的注意。当这些信息到达接收端后,接收端采用提取算法提取出隐秘信息,这就达到了保密通信的效果。
语音信息隐藏领域的研究已经获得了不少成果,Wu等人提出了一种基于G.711编码的自适应语音信息隐藏方法;Ma等人提出了在G.721编码流中嵌入隐秘信息的方法;Wu等人使用LPC系数的替换实现语音信息隐藏;Huang等人在低速率编码语音流中使用基音预测完成信息嵌入;Huang等人研究了在VoIP语音流的非活动帧中嵌入隐秘信息的隐藏算法,发现了VoIP语音流的非活动帧比活动帧更适合做信息隐藏的重要结论;Wang等人提出了使用LSB算法在VoIP语音流中做实时嵌入的方法;Liu等人研究了VoIP语音流中基于帧比特率变化的信息隐藏技术,他们提出了BD(Bitrate Downgrading)和BS(Bitrate Switching)两种隐藏算法,等等。与以上研究成果不同,Xiao等人提出了一种互补邻居节点(ComplementaryNeighbor Vertices,CNV)算法,该算法是信息隐藏领域中第一次结合图论相关知识实现码本分组的算法,与传统码本分组算法不同,CNV算法把每个码字都看成多维空间中一个孤立的点,每两个码字之间的关系用边和权重来表示。相邻的点分别被0和1标记,标记的过程就是码本分组的过程,然后根据隐秘信息中比特的0和1分别在相应的码本组中做搜索,完成隐秘信息的嵌入。
然而,信息隐藏技术是利用载体中的冗余来嵌入隐秘信息的,语音信息在经过iLBC这种低速率编码器压缩编码以后可利用的冗余空间较少,直接导致隐藏容量的下降,同时,由于人耳对声音变化比较敏感,这就对隐秘信息的隐蔽性提出了较高的要求。因此,在低速率语音中,保证容量较大的情况下实现高隐蔽性的语音信息隐藏是一项具有挑战性的研究工作。
iLBC是Global IP Sound公司在2000年研发的一款能够提供稳健的IP语音通信编解码器。为了节省带宽,iLBC专为窄带语音通信而设计。其采用帧独立线性预测编码(linear perdictive coding,LPC)算法,该算法对输入语音信号做一系列分析,计算出能够表征原始语音信号的特征参数,把这些特征参数按照一定的格式打包输出,发送到网络上,接收端接收到数据包后对数据解析,根据特征参数恢复出原始语音。
iLBC编码主要分为两部分:
(1)初始状态的选择与编码
根据iLBC编码标准,iLBC编码器的输入信号是经过8000Hz采样,16bit量化的标准pcm信号,输入信号按20ms或30ms划分为帧,对于20ms帧,采用8000Hz采样,16bit量化就会生成160个样点,同理,30ms帧会产生240个样点。对于每帧信号,每40个样点又划分为一个子帧,即20ms帧有4个子帧,30ms帧有6个子帧。所有信号帧做相应处理得到残差信号,为初始状态的选择做准备。
对于每帧残差信号,在4或6个子帧中寻找两个能量值最大的连续子帧作为初始状态所在的子帧。为了使初始状态向中间偏移,所有能量值都要乘以一个权重因子,对于20ms帧,权重因子ssqEn_win[3]={0.9,1.0,0.9},对于30ms帧,权重因子ssqEn_win[5]={0.8,0.9,1.0,0.9,0.8}。
为了有效的降低初始状态的比特率,取30ms帧的初始状态长度为58,两个连续子帧的最前或最后22个样点的能量值决定了初始状态取前58个样点,还是后58个样点;20ms帧的初始状态长度为57,选择方法同30ms帧。帧内初始状态位置state_first使用1bit编码:
state_first=1:初始状态取前58或57个样点;
state_first=0:初始状态取后58或57个样点;
随后,初始状态通过一个全通滤波器,做相位杂散处理,使信号具有偶对称性,同时,在滤波器响应中选出幅值最大的样点,对该幅值取对数运算,然后用6位量化器做量化,输出量化索引值idxForMax,与idxForMax相对应的量化值为qmax,并产生归一化因子scal,对初始状态做归一化运算。用感知加权滤波器Wk(z)对每个归一化样点滤波,产生加权语音样点x[n],x[n]减预测样值y[n]产生目标样值d[n],其中预测滤波器由下式给出
目标样值d[n]通过3位量化器得到初始状态编码u[n]。至此,完成初始状态的编码工作。
(2)剩余样点编码
对编码完成的初始状态做解码,得到LPC激励信号,将这些信号缓存在一块固定的内存中,这块内存就是固定码本内存。按照一定的规则选取码本内存中的样点序列,就可以构造出用于编码下一个子帧的动态码本。此过程又包含以下三部分:
1)编码顺序的确定
剩余样点的编码顺序是包含初始状态的两个子帧中除去初始状态后剩余的23/22个样点;时间轴上滞后于初始状态的样点;时间轴上超前于初始状态的样点。
2)码本的构建
用于搜索的码本由两部分组成,第一部分是基码本,第二部分是扩展码本,对于长度为40样点的目标矢量,基码本和扩展码本都会有一个增广部分,称为增广基码本和增广扩展码本。
基码本由码本内存构建,在长度为1Mem的码本内存上滑动长度为1Target的窗,得到不同的码本矢量,每个码本矢量对应一个索引号。基码本通过一个8阶FIR滤波器得到扩展码本,扩展码本长度与基码本长度相同。
3)码本的搜索
码本搜索就是在码本中找到与感知加权目标矢量的最优匹配矢量。搜索方法是三级增益形状匹配法。在每一级中,找到与目标矢量最匹配的码本矢量,然后计算增益并量化,最后更新感知加权目标矢量,为下一级搜索做准备。
每级搜索中,最优匹配矢量由3个准则共同确定:
①使测度最大。最优匹配码本矢量要使得下式的值达到最大,式中target表示目标矢量,cbvec表示选择的码本矢量。
②增益的绝对值小于给定门限。最优匹配码本矢量增益的绝对值要小于给定的门限,通常这个门限值是1.3,即增益满足下式。
③第一级搜索中,目标矢量和码本矢量的点积大于0,即满足下式:
target*cbvec>0
如果没有码本矢量满足上边第二条和第三条准则,那么最优匹配矢量就是满足准则1的码本矢量。
在下一级搜索开始之前,要进行目标更新。通过目标矢量减去最优匹配矢量乘以对应的量化增益值完成更新,更新过程可以用下式表示:
target[i]=target[i] gainQ*selected_v ec[i]
发明内容
本发明中针对iLBC编码器提出了一种适用于固定码本的信息隐藏方法,可以利用该方法实现小容量的信息隐藏并具有良好的隐蔽性。
使用iLBC编码器编码语音信号时,选定的初始状态会通过一个全通滤波器,在滤波器响应中选出幅值最大的样点,对该幅值取对数运算,然后用6位量化器做量化,输出量化索引值idxForMax,为了实现隐秘信息的嵌入,根据嵌入隐秘信息的值,修正idxForMax的值,使idxForMax具有某种的特征,发送端根据改特征嵌入隐秘信息,接收端根据该特征提取隐秘信息,以此达到语音信息隐藏的效果。隐秘信息嵌入过程如图1所示。
接收端收到包含隐秘信息的iLBC数据包后对其做解析,提取出相关编码参数,根据提取出的idxForMax索引号的奇偶性判断发送方在载体中嵌入的是0还是1,隐秘信息提取过程如图2所示。由于发送方在隐秘信息嵌入完成后并没有立即停止编码器,而是等待所有载体语音编码完成后停止编码器,因此,没有嵌入隐秘信息的载体的索引号就会表现出随机性,接收方不能根据索引号的奇偶性判断出是否有隐秘信息存在,故接收端采用的提取算法是一种非盲提取方法,需要通过对比接收到的索引号和从本地iLBC编解码器对载体语音的编解码提取出的索引号来判断隐秘信息的位数。
附图说明
图1是隐秘信息嵌入过程。
图2是隐秘信息提取过程。
图3是嵌入前后语音时域波形图。
图4是嵌入前后语音频谱图。
图5是30ms帧格式下PESQ_MOS值对比。
图6是20ms帧格式下PESQ_MOS值对比。
具体实施方式
1.首先将隐秘信息数字化,得到二进制流;使用接收端的公钥对得到的二进制流做加密操作,得到加密后的二进制流;如果当前嵌入的隐秘信息是0,那么使用次优且为偶数的idxForMax的值来替换最优idxForMax值,如果当前嵌入的隐秘信息是1,那么使用次优且为奇数的idxForMax值来替换最优idxForMax值;根据修正后的idxForMax值对应的qmax值归一化初始状态并编码;编码除初始状态以外的样点,完成当前帧的编码;若隐秘信息嵌入完毕,则剩余载体做标准iLBC编码,否则,返回第三步,直至隐秘信息完全嵌入完毕。
2.接收端对接收到的iLBC数据包做解析,得到相应参数;本地iLBC编解码器对载体语音做编解码,得到和之前相同的参数;对比两组参数的不同之处,判断发送方时候有隐秘信息嵌入,并确定嵌入隐秘信息的位数;如果有隐秘信息嵌入,则根据获取的索引号判断嵌入的隐秘信息的值,如果索引号是奇数,那么嵌入的隐秘信息是1,如果索引号是偶数,那么嵌入的隐秘信息是0;将提取出的隐秘信息做整合,形成二进制流;使用秘钥对得到的二进制流做解密,再次整合,得到解密后的二进制流;根据得到的二进制流还原出发送方嵌入的隐秘信息,完成隐秘信息提取过程。
3.进行实验结果的分析。对于语音信息隐藏,最直观的隐蔽性来源于嵌入隐秘信息之后,载体信息的变化问题,如果载体信息变化过大,非授权者可以轻易判断是否有隐秘信息的存在,那么这种隐藏算法是不实用的。
嵌入隐秘信息后载体的变化问题可以用语音的时域波形或者频谱变化来直观判断。为了验证本算法的隐蔽性,在40组10s的语音信号中随机选取一组,画出该信号的时域波形和频谱图,如图3,图4所示。从图中可以看出,时域波形变化较小,频谱图变化较小,从信号处理角度来看,该算法隐蔽性较好。
目前,最流行的语音质量测评工具是PESQ_MOS值,该值可以反映嵌入隐秘信息之后与未嵌入隐秘信息的载体之间的变化。PESQ_MOS值在理论范围内越大,语音质量变化越小,越接近原始语音,隐蔽性越好;PESQ_MOS值越小,语音质量变化越大,隐蔽性越差。本发明也使用PESQ_MOS值对语音做分析,画出30ms帧格式下PESQ_MOS值变化如图5所示,20ms帧格式下PESQ_MOS值变化如图6所示。对比图5和图6可以看出,PESQ_MOS值变化微小,意味着嵌入隐秘信息对于载体语音语音质量的影响几乎可以忽略。
本发明采用的方法从PESQ_MOS角度来说隐蔽性较好,20ms帧格式的平均PESQ_MOS值下降不到0.5%,故本发明中隐藏方法在语音质量方面具有明显优势。

Claims (2)

1.基于iLBC编码的一种小容量语音信息隐藏方法,其特征在于:
(1)针对固定码本并结合iLBC编码器速率低的特点,设计了隐秘信息嵌入的算法,以实现小容量的语音信息隐藏;
(2)针对隐秘信息嵌入算法,设计了相应的隐秘信息提取算法,以实现隐秘信息的提取恢复;
2.根据权利要求1所述的基于iLBC编码的一种小容量语音信息隐藏方法,其特征在于:
其中:特征(1)中的隐秘信息嵌入算法分为三个步骤:隐秘信息的转化、固定码本的生成、隐秘信息的嵌入;
①隐秘信息的转化
将隐秘信息数字化,得到二进制流,并利用接收端的公钥对二进制流进行加密,得到加密后二进制流;
②固定码本的生成
根据iLBC编码原理,选择适当的初始状态并进行编码,通过解密后得到线性预测编码的(Linear perdictive coding,LPC)激励信号,将其缓存到一块固定的内存中,这块内存即固定码本内存;
③隐秘信息的嵌入
如果当前嵌入的隐秘信息是0,那么使用次优且为偶数的量化索引值(idxForMax)的值来替换最优idxForMax值,如果当前嵌入的隐秘信息是1,那么使用次优且为奇数的idxForMax值来替换最优idxForMax值,对修正后的idxForMax所对应的量化值归一化初始状态并编码,最后对除初始状态外的样点进行编码,完成当前帧的编码,若隐秘信息嵌入完毕,则剩余载体做标准的iLBC编码,否则,重复此嵌入过程;
特征(2)中的隐秘信息提取算法分为三个步骤:判断隐秘信息是否存在、隐秘信息的提取、隐秘信息的还原;
①判断隐秘信息是否存在
接收端对接收到的iLBC数据包做解析并对本地iLBC编码器对载体语音做编码,得到相应的编码参数,对比两组参数的不同之处,判断发送方是否有隐秘信息嵌入,并确定嵌入隐秘信息的位数;
②隐秘信息的提取
根据获取的索引号判断嵌入的隐秘信息的值,如果索引号是奇数,那么嵌入的隐秘信息是1,如果索引号是偶数,那么嵌入的隐秘信息是0,将提取出的隐秘信息做整合,形成二进制流;
③隐秘信息的还原
使用秘钥对得到的二进制流做解密,再次整合,得到解密后的二进制流,最后还原出发送方嵌入的隐秘信息,完成信息提取过程。
CN201710789703.0A 2017-08-29 2017-08-29 基于iLBC编码的一种小容量语音信息隐藏方法 Pending CN107689226A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710789703.0A CN107689226A (zh) 2017-08-29 2017-08-29 基于iLBC编码的一种小容量语音信息隐藏方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710789703.0A CN107689226A (zh) 2017-08-29 2017-08-29 基于iLBC编码的一种小容量语音信息隐藏方法

Publications (1)

Publication Number Publication Date
CN107689226A true CN107689226A (zh) 2018-02-13

Family

ID=61155874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710789703.0A Pending CN107689226A (zh) 2017-08-29 2017-08-29 基于iLBC编码的一种小容量语音信息隐藏方法

Country Status (1)

Country Link
CN (1) CN107689226A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003615A (zh) * 2018-08-27 2018-12-14 合肥工业大学 语音流嵌入信息方法及装置、语音流解码信息方法及装置
CN110111799A (zh) * 2019-04-28 2019-08-09 武汉大学 一种基于脉冲分布模型的amr固定码本安全隐写方法
CN110689897A (zh) * 2019-10-09 2020-01-14 中国科学院声学研究所南海研究站 基于线性预测语音编码的信息隐藏及隐藏信息提取方法
CN111698222A (zh) * 2020-05-21 2020-09-22 扬州大学 基于vanitygen生成的特殊比特币地址的隐蔽通信方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007124485A3 (en) * 2006-04-21 2008-06-19 Dilithium Networks Pty Ltd Method and apparatus for audio transcoding
CN104347076A (zh) * 2013-08-09 2015-02-11 中国电信股份有限公司 网络音频丢包掩蔽方法和装置
CN106653034A (zh) * 2016-12-08 2017-05-10 广东工业大学 一种用于移动终端的语音通信系统和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007124485A3 (en) * 2006-04-21 2008-06-19 Dilithium Networks Pty Ltd Method and apparatus for audio transcoding
CN104347076A (zh) * 2013-08-09 2015-02-11 中国电信股份有限公司 网络音频丢包掩蔽方法和装置
CN106653034A (zh) * 2016-12-08 2017-05-10 广东工业大学 一种用于移动终端的语音通信系统和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WU ZHIJUN等: "An Implementation of Speech Steganography for iLBC by Using Fixed Codebook", 《2016 2ND IEEE INTERNATIONAL CONFERENCE ON COMPUTER AND COMMUNICATIONS》 *
沙永鹏: "基于iLBC编码的VoIP语音信息隐藏与提取算法研究", 《中国民航大学》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003615A (zh) * 2018-08-27 2018-12-14 合肥工业大学 语音流嵌入信息方法及装置、语音流解码信息方法及装置
CN110111799A (zh) * 2019-04-28 2019-08-09 武汉大学 一种基于脉冲分布模型的amr固定码本安全隐写方法
CN110689897A (zh) * 2019-10-09 2020-01-14 中国科学院声学研究所南海研究站 基于线性预测语音编码的信息隐藏及隐藏信息提取方法
CN111698222A (zh) * 2020-05-21 2020-09-22 扬州大学 基于vanitygen生成的特殊比特币地址的隐蔽通信方法
CN111698222B (zh) * 2020-05-21 2022-06-07 扬州大学 基于vanitygen生成的特殊比特币地址的隐蔽通信方法

Similar Documents

Publication Publication Date Title
JP4927257B2 (ja) 可変レートスピーチ符号化
CN101577605B (zh) 基于滤波器相似度的语音lpc隐藏和提取算法
CN107689226A (zh) 基于iLBC编码的一种小容量语音信息隐藏方法
Ren et al. AMR steganalysis based on the probability of same pulse position
EP2038883B1 (en) Vocoder and associated method that transcodes between mixed excitation linear prediction (melp) vocoders with different speech frame rates
JP2006099124A (ja) デジタル無線チャネル上の自動音声/話者認識
Wu et al. An approach of steganography in G. 729 bitstream based on matrix coding and interleaving
JP2003501675A (ja) 時間同期波形補間によるピッチプロトタイプ波形からの音声を合成するための音声合成方法および音声合成装置
Ozkan et al. Secure voice communication via GSM network
CN103714823A (zh) 一种基于综合语音编码的自适应水下通信方法
Faundez-Zanuy et al. Speaker identification security improvement by means of speech watermarking
CN103456307B (zh) 音频解码器中帧差错隐藏的谱代替方法及系统
CN111246469A (zh) 人工智能保密通信系统及通信方法
CA2293165A1 (en) Method for transmitting data in wireless speech channels
Özkan et al. Data transmission via GSM voice channel for end to end security
Ambika et al. Secure Speech Communication–A Review
CA2424558C (en) Pitch cycle search range setting apparatus and pitch cycle search apparatus
He et al. A Novel AMR‐WB Speech Steganography Based on Diameter‐Neighbor Codebook Partition
Zhijun et al. An implementation of speech steganography for iLBC by using fixed codebook
CN107545899B (zh) 一种基于清音基音延迟抖动特性的amr隐写方法
Qi et al. A speech privacy protection method based on sound masking and speech corpus
CN107547196A (zh) 基于参数修正的语音信息隐藏算法
US20060247926A1 (en) Information flow transmission method whereby said flow is inserted into a speech data flow, and parametric codec used to implement same
CN101169934A (zh) 时域听觉阈值加权滤波器的构造方法和设备、编解码器
JP2006507720A (ja) 音響チャネルと圧縮によるデータ通信

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180213

WD01 Invention patent application deemed withdrawn after publication