CN112002341B - 语音信号的参数化表达、加密传输和重构的方法 - Google Patents

语音信号的参数化表达、加密传输和重构的方法 Download PDF

Info

Publication number
CN112002341B
CN112002341B CN202010853837.6A CN202010853837A CN112002341B CN 112002341 B CN112002341 B CN 112002341B CN 202010853837 A CN202010853837 A CN 202010853837A CN 112002341 B CN112002341 B CN 112002341B
Authority
CN
China
Prior art keywords
signal
sequence
kernel function
frequency
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010853837.6A
Other languages
English (en)
Other versions
CN112002341A (zh
Inventor
李宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Institute of Technology
Original Assignee
Nanjing Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Institute of Technology filed Critical Nanjing Institute of Technology
Priority to CN202010853837.6A priority Critical patent/CN112002341B/zh
Publication of CN112002341A publication Critical patent/CN112002341A/zh
Application granted granted Critical
Publication of CN112002341B publication Critical patent/CN112002341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明给出了一种基于数据驱动的语音信号参数化表达、加密传输和重构的方法和装置,该方法基于频带划分将频率成份混杂的信号分解成频率成份相对简单的低频分量和各个带通分量。以辛格函数为核函数,各个频率分量可以表达为核函数的线性组合,相应的系数成为唯一确定各个频率分量的参数组。由于辛格函数在频域呈现出频率窗口特性,辛格函数的主瓣在时域呈现出类似小波函数的急剧减小的特性,本发明给出的方法不仅在频域有很高的分辨率,在时域也具有局部性,可以体现各个频率分量在某个时间点上的变化,适合于处理类似于语音的非平稳信号,实现了语音信号的参数化表达,为加密传输提供了条件。运用语音信号的参数,可以唯一地重构还原语音信号。

Description

语音信号的参数化表达、加密传输和重构的方法
技术领域
本发明涉及语音信号处理和分析领域,具体涉及一种对语音信号的参数化表达、加密传输和重构的方法及装置。
背景技术
目前语音信号一般以WAV文件的格式存储,如果想在不降低语音质量的前提下实现语音文件的压缩,最好的办法就是对于语音信号进行时频域的分解,从而以参数化的形态来表达语音信号,如果能够实现语音信号的参数化表达,不仅可以最大程度压缩语音信号的存储体积,还可以方便的实现加密传输和保真重构。
傅里叶级数和傅里叶变换是最早的信号和处理和数据分析的工具,利用这一工具可以将时域信号变换到频域中,实现了时域函数的频域分解。但是傅里叶变换的本质是在整个时域里求取待变换的函数与相应频率的基函数的相关系数,虽能反映出信号的总体特征,但对信号的局部特征不能很好反映。傅里叶变换只适合处理平稳信号,语音信号是典型的非平稳信号,不适合利用傅里叶变换来处理。傅里叶变换可以对信号进行频域分析,但频域分析与时域分析是相互独立的。傅里叶变换只适用于确定信号或平稳随机信号。
小波变换可以将非平稳信号变换到时频域,用小波变换对语音信号进行频率成份研究是合适的,但是小波变换的时频域中的各点之间的相关性较大,以至于小波变换的数据冗余度很大,不能满足对语音信号压缩存储的要求,再者,小波逆变换不是1-1映射,这导致了对语音信号加密和重构过程中的困难。
近年来,出现了用经验模态分解(EMD)和希尔伯特变换相结合的方法(HHT)来分析非平稳信号,这种方法可以比较准确地得出信号的时间与频率的对应关系,在很多运用领域都取得了比较好的效果,但是经验模态分解不是基于明确的数学模型,因此不能实现语音信号的参数化表达。
发明内容
本发明的目的在于克服现有技术中存在的上述缺陷或缺陷之一,本发明提出了一种新的基于数据驱动的语音信号的参数化表达、加密传输和重构的方法及装置,本发明给出的方法的数学原理是基于频带划分来实现对时域函数空间的各个相应的子空间的分解,以此将频率成份混杂的信号分解成频率成份相对简单的低频分量和各个带通分量。采用辛格函数为核函数,各个频率分量可以表达为核函数的线性组合,相应的系数成为唯一确定各个频率分量的参数组。由于辛格函数在频域呈现出频率窗口特性,辛格函数的主瓣在时域呈现出类似小波函数的急剧减小的特性,所以本发明给出的方法不仅在频域有很高的分辨率,而且在时域也具有较好的局部性,可以体现各个频率分量在某个时间点上的变化,适合于处理类似于语音的非平稳信号,以较小的运算量实现了语音信号的参数化表达,从而为加密传输提供了条件。运用语音信号的参数,可以唯一地重构还原语音信号。
为实现上述目的,本发明提供的技术方案是:
一种语音信号的参数化表达、加密传输和重构的方法,其特征在于:对于任一个时间段[0,T]的语音信号f(t)=r(t)+w,其中r(t)是信号,w是噪声,根据语音信号r(t)的频带宽度ωM和给定的时频带划分要求{0<ω0<ω1<…<ωn<ωn+1<…<ωM},基于核函数序列{φn(t)|n=0,1,2,3…M},实现对语音信号的时频域分解,具体是:确定如下辛格函数族
Figure SMS_1
以辛格函数簇中的各个成员为基础核函数,以基础核函数构成核函数序列,分别对数据序列及其派生的子数据序列进行M次最小方差回归运算,得到函数序列{fn(t)n=0,1,2…M+1},使得/>
Figure SMS_2
其中f0(t)是低频信号,其带宽是[0,ω0),fn(t)n=1,2…M是带通信号,其频域范围是[ωn-1,ωn),fM+1(t)是经过多步分解后的残差,也是带通信号,其频带的下限为ωM,其频带上限与原始信号f(t)=r(t)+w的频带上限相同,对信号进行时频域分解后形成参数化数组,可用于加密传输和重构。
对所述时间段[0,T]的音频信号f(t)=r(t)+w,以采样周期T0进行采样,得到数据序列
Figure SMS_3
以其为数据样本,以辛格函数/>
Figure SMS_4
为基础核函数,并以此构建核函数序列,通过最小方差回归运算得到带宽是[0,ω0)的低频信号f0(t),再计算第一次差值信号c1(t)=f(t)-f0(t),并以采样周期T1对c1(t)进行采样,得到数据序列
Figure SMS_5
以其为数据样本,以辛格函数/>
Figure SMS_6
为基础核函数,并以此构建核函数序列,通过最小方差回归运算得到带宽是[ω0,ω1)的带通信号f1(t),一般地,当得到带通信号fn-1(t)后,计算第n次的差值信号/>
Figure SMS_7
以采样周期Tn对cn(t)进行采样,得到数据序列/>
Figure SMS_8
以其为数据样本,以辛格函数/>
Figure SMS_9
为基础核函数,并以此构建核函数序列,通过最小方差回归运算得到带宽是[ωn-1,ωn)的带通信号fn(t)。
每次获取差值信号
Figure SMS_10
及相应采样数据序列/>
Figure SMS_11
Figure SMS_12
要计算该数据序列的范数/>
Figure SMS_13
当范数Fn小于设定的值时,对信号的时频分解结束,差值信号cn(t)作为残差信号。
在求取所述的低频信号和各带通信号时,选取采样周期的应当按照下面的方法:在求取低频信号f0(t)时,采样周期上限为
Figure SMS_14
一般地,求取带通信号fn(t)时,采样周期上限为/>
Figure SMS_15
进一步地,所述的一种语音信号的参数化表达、加密传输和重构的方法,其特征在于,所述以辛格函为基础核函数,并以此构建核函数序列的方法是:在以采样周期T0对信号f(t)=r(t)+w进行采样时,采样时间点序列为
Figure SMS_16
以辛格函数
Figure SMS_17
为基础核函数,并以此构建的核函数序列为:/>
Figure SMS_18
Figure SMS_19
一般地,在以采样周期Tn对第n次差值信号cn(t)进行采样时,采样时间点序列为/>
Figure SMS_20
以辛格函数/>
Figure SMS_21
为基础核函数,并以此构建的核函数序列为:/>
Figure SMS_22
进一步地,所述的一种语音信号的参数化表达、加密传输和重构的方法,其特征在于,所述通过最小方差回归运算得到带宽是[0,ω0)的低频信号f0(t),以及带宽是[ωn-1,ωn)的带通信号fn(t)的方法包括以下步骤:
步骤一:根据核函数序列
Figure SMS_23
构建矩阵Ψ0
Figure SMS_24
步骤二:将从原始语音信号f(t)采样而得到的数据序列
Figure SMS_25
视为列向量,记为Y0,取定拉格朗日乘子λ0,形成对角矩阵λ0I,定义系数向量/>
Figure SMS_26
Figure SMS_27
按下式计算系数向量:
Figure SMS_28
步骤三:以
Figure SMS_29
和/>
Figure SMS_30
构建低频信号:
Figure SMS_31
步骤四:根据核函数序列
Figure SMS_32
构建矩阵Ψn
Figure SMS_33
步骤五::将从第n次差值信号
Figure SMS_34
采样而得到的数据序列
Figure SMS_35
视为列向量,记为Yn,取定拉格朗日乘子λn,形成对角矩阵λnI,定义系数向量/>
Figure SMS_36
按下式计算系数向量:
Figure SMS_37
步骤六::以
Figure SMS_38
和/>
Figure SMS_39
Figure SMS_40
构建带通信号fn(t):
Figure SMS_41
/>
进一步地,上面所述拉格朗日乘子λ0,可根据数据序列
Figure SMS_42
的均方差σ0以及低频信号f0(t)的带宽ω0,按下面公式取定:
Figure SMS_43
进一步地,上面所述拉格朗日乘子{λn|n=1,2…M}可根据相应的数据序列
Figure SMS_44
的均方差σn以及带通信号fn(t)的带宽上限ωn,按下面公式取定:
Figure SMS_45
在按照规定的频域切分点[0,ω0,ω1,…ωn,ωn+1,…ωM],对语音信号时频域分解后,所得到的各个时频域成份由其系数数组序列唯一确定,具体包括:
Figure SMS_46
Figure SMS_47
此数组序列为语音信号的参数化表达,从而实现语音信号的压缩,数组序列中的数字转为ASCII码,形成文本文件。
所述频率切分点{0<ω0<ω1<…<ωn<ωn+1<…<ωM}和由各个频率切分点确定的核函数族
Figure SMS_48
被当作实现语音通讯的双方的密钥,发送方以此对语音信号进行时频域分解,实现参数化表达,参数组序列以文本文件的形式进行压缩传输,接收方在收到参数组序列文件后,根据同样的频率切分点和核函数族
Figure SMS_49
以及参数组序列,还原出低频信号f0(t)和各个带通信号{fn(t)|n=1,2…M},将其相加,以还原出语音信号。
一种语音信号的参数化表达、加密传输和重构的装置:
其特征在于,所述装置采用STM32H750为中央处理器芯片,STM32H750处理器芯片分别与语音信号调理放大电路、音频输出放大电路及2.4G无线通信模块相连接,语音信号调理放大电路与话筒连接,音频输出放大电路与扬声器连接,2.4G无线通信模块与天线连接,话筒输入的语音信号经过语音信号调理放大电路输入到STM32H750的A/D转换端,由处理器STM32H750对语音信号进行A/D转换,并通过软件实现对语音信号的时频域分解和参数化表达,形成参数组序列的文本文件,再将参数组文件输出到2.4G无线通信模块,通过天线发送出去。由天线接收到的信号,也经过2.4G无线通信模块,输入到处理器芯片STM32H750中,该接收信号也是语音信号的参数组序列文件,由STM32H750中的软件对参数组序列实现重构,并通过微处理器内部的D/A环节实现数模转换,再通过音频输出放大电路放大,通过扬声器转成语音。
进一步地,所述的一种语音信号的参数化表达、加密传输和重构的装置,其特征在于,所述2.4G通信模块与微处理器STM32H750通过SPI接口连接。
进一步地,所述的一种语音信号的参数化表达、加密传输和重构的装置,其特征在于,所述语音信号调理放大电路包括放大电路和电平移动电路两部份。
本发明的技术效果在于,本发明给出的实现语音信号参数化表达、加密传输和重构的方法,不仅在频域有很高的分辨率,而且在时域具有较好的局部性,可以体现各个频率分量在某个时间点上的变化,适合于处理类似于语音的非平稳信号,而且运算量较小,实现了语音信号的参数化表达,从而为加密传输提供了条件。运用语音信号参数,可以唯一地重构还原语音信号。
本发明给出的实现语音信号参数化表达、加密传输和重构的装置,电路简单,可以实现语音信号的输入和放大、时频域分解和参数化表达、无线发送和接收、语音信号的保真重构和输出等功能。
附图说明
附图1是语音信号的时频域分解和参数化的流程图。
附图2是语音信号的重构的流程图。
附图3是实现语音信号参数化表达、加密传输和重构装置的结构框图。
附图4是语音信号调理放大电路原理图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
本发明的具体实施装置采用STM32H750为中央处理器芯片,STM32H750处理器芯片分别与语音信号调理放大电路、音频输出放大电路及2.4G无线通信模块相连接,语音信号调理放大电路与话筒连接,音频输出放大电路与扬声器连接,2.4G无线通信模块与天线连接,话筒输入的语音信号经过语音信号调理放大电路输入到STM32H750的A/D转换端,由处理器STM32H750对语音信号进行A/D转换,并通过软件实现对语音信号的时频域分解和参数化表达,形成参数组序列的文本文件,再将参数组文件输出到2.4G无线通信模块,通过天线发送出去。由天线接收到的信号,也经过2.4G无线通信模块,输入到处理器芯片STM32H750中,该接收信号也是语音信号的参数组序列文件,由STM32H750中的软件对参数组序列实现重构,并通过微处理器内部的D/A环节实现数模转换,再通过音频输出放大电路放大,通过扬声器转成语音。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,依据本发明的技术实质,对以上实施例所做的任何简单修改、等同替换与改进等,均仍属于本发明技术方案的保护范围之内。

Claims (8)

1.一种语音信号的参数化表达、加密传输和重构的方法,其特征在于:对于任一个时间段[0,T]的语音信号f(t)=r(t)+w,其中r(t)是信号,w是噪声,根据语音信号r(t)的频带宽度ωM和给定的时频带划分要求{0<ω0<ω1<…<ωn<ωn+1<…<ωM},基于核函数序列{φn(t)|n=0,1,2,3…M},实现对语音信号的时频域分解,具体是:确定如下辛格函数族
Figure QLYQS_1
以辛格函数簇中的各个成员为基础核函数,以基础核函数构成核函数序列,分别对数据序列及其派生的子数据序列进行M次最小方差回归运算,得到函数序列{fn(t)|n=0,1,2…M+1},使得/>
Figure QLYQS_2
其中f0(t)是低频信号,其带宽是[0,ω0),fn(t)n=1,2…M是带通信号,其频域范围是[ωn-1,ωn),fM+1(t)是经过多步分解后的残差,也是带通信号,其频带的下限为ωM,其频带上限与原始信号f(t)=r(t)+w的频带上限相同,对信号进行时频域分解后形成参数化数组,可用于加密传输和重构。
2.根据权利要求1所述的一种语音信号的参数化表达、加密传输和重构的方法,其特征在于,对所述时间段[0,T]的语音信号f(t)=r(t)+w,以采样周期T0进行采样,采样周期T0的上限为
Figure QLYQS_4
通过采样得到数据序列/>
Figure QLYQS_6
以其为数据样本,以辛格函数
Figure QLYQS_8
为基础核函数,并以此构建核函数序列,通过最小方差回归运算得到带宽是[0,ω0)的低频信号f0(t),再计算第一次差值信号c1(t)=f(t)-f0(t),并以采样周期T1对c1(t)进行采样,得到数据序列/>
Figure QLYQS_5
以其为数据样本,以辛格函数
Figure QLYQS_9
为基础核函数,并以此构建核函数序列,通过最小方差回归运算得到带宽是[ω0,ω1)的带通信号f1(t),一般地,当得到带通信号fn-1(t)后,计算第n次的差值信号
Figure QLYQS_10
以采样周期Tn对cn(t)进行采样,采样周期Tn的上限为/>
Figure QLYQS_11
通过采样得到数据序列/>
Figure QLYQS_3
以其为数据样本,以辛格函数/>
Figure QLYQS_7
为基础核函数,并以此构建核函数序列,通过最小方差回归运算得到带宽是[ωn-1,ωn)的带通信号fn(t)。
3.根据权利要求2所述的一种语音信号的参数化表达、加密传输和重构的方法,其特征在于,获取所述的差值信号
Figure QLYQS_12
及相应采样数据序列
Figure QLYQS_13
时,要计算该数据序列的范数/>
Figure QLYQS_14
当范数Fn小于设定的值时,对信号的时频分解结束,差值信号cn(t)作为残差信号。
4.根据权利要求1或权利要求2所述的一种语音信号的参数化表达、加密传输和重构的方法,其特征在于,所述以辛格函为基础核函数,并以此构建核函数序列的方法是:在以采样周期T0对信号f(t)=r(t)+w进行采样时,采样时间点序列为
Figure QLYQS_15
Figure QLYQS_16
以辛格函数/>
Figure QLYQS_17
为基础核函数,并以此构建的核函数序列为:
Figure QLYQS_18
一般地,在以采样周期Tn对第n次差值信号cn(t)进行采样时,采样时间点序列为/>
Figure QLYQS_19
以辛格函数/>
Figure QLYQS_20
为基础核函数,并以此构建的核函数序列为:/>
Figure QLYQS_21
5.根据权利要求2所述的一种语音信号的参数化表达、加密传输和重构的方法,其特征在于,所述通过最小方差回归运算得到带宽是[0,ω0)的低频信号f0(t),以及带宽是[ωn-1,ωn)的带通信号fn(t)的方法包括以下步骤:
S1:根据核函数序列
Figure QLYQS_22
构建矩阵Ψ0
Figure QLYQS_23
S2:将从原始语音信号f(t)采样而得到的数据序列
Figure QLYQS_24
视为列向量,记为Y0,取定拉格朗日乘子λ0,形成对角矩阵λ0I,定义系数向量/>
Figure QLYQS_25
按下式计算系数向量:
Figure QLYQS_26
S3:以
Figure QLYQS_27
和/>
Figure QLYQS_28
构建低频信号:
Figure QLYQS_29
S4:根据核函数序列
Figure QLYQS_30
构建矩阵Ψn
Figure QLYQS_31
S5:将从第n次差值信号
Figure QLYQS_32
采样而得到的数据序列/>
Figure QLYQS_33
Figure QLYQS_34
视为列向量,记为Yn,取定拉格朗日乘子λn,形成对角矩阵λnI,定义系数向量
Figure QLYQS_35
按下式计算系数向量:
Figure QLYQS_36
S6:以
Figure QLYQS_37
和/>
Figure QLYQS_38
构建带通信号fn(t):
Figure QLYQS_39
/>
6.根据权利要求5所述的一种语音信号的参数化表达、加密传输和重构的方法,其特征在于,所述拉格朗日乘子λ0,可根据数据序列
Figure QLYQS_40
的均方差σ0以及低频信号f0(t)的带宽ω0,按下面公式取定:/>
Figure QLYQS_41
所述拉格朗日乘子λnn=1,2…M可根据相应的数据序列/>
Figure QLYQS_42
的均方差σn以及带通信号fn(t)的带宽上限ωn,按下面公式取定:/>
Figure QLYQS_43
7.根据权利要求1所述的一种语音信号的参数化表达、加密传输和重构的方法,其特征在于,在按照规定的频域切分点[0,ω0,ω1,…ωn,ωn+1,…ωM],对语音信号时频域分解后,所得到的各个时频域成份由其系数数组序列唯一确定,具体包括:
Figure QLYQS_44
此数组序列为语音信号的参数化表达,从而实现语音信号的压缩,数组序列中的数字转为ASCII码,形成文本文件。
8.根据权利要求7所述的一种语音信号的参数化表达、加密传输和重构的方法,其特征在于,频率切分点{0<ω0<ω1<…<ωn<ωn+1<…<ωM}和由各个频率切分点确定的核函数族
Figure QLYQS_45
被当作实现语音通信的双方的密钥,发送方以此对语音信号进行时频域分解,实现参数化表达,参数组序列以文本文件的形式进行压缩传输,接收方在收到参数组序列文件后,根据同样的频率切分点和核函数族
Figure QLYQS_46
以及参数组序列,还原出低频信号f0(t)和各个带通信号{fn(t)|n=0,1,2…M},将其相加,以还原出语音信号。/>
CN202010853837.6A 2020-08-21 2020-08-21 语音信号的参数化表达、加密传输和重构的方法 Active CN112002341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010853837.6A CN112002341B (zh) 2020-08-21 2020-08-21 语音信号的参数化表达、加密传输和重构的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010853837.6A CN112002341B (zh) 2020-08-21 2020-08-21 语音信号的参数化表达、加密传输和重构的方法

Publications (2)

Publication Number Publication Date
CN112002341A CN112002341A (zh) 2020-11-27
CN112002341B true CN112002341B (zh) 2023-06-09

Family

ID=73473012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010853837.6A Active CN112002341B (zh) 2020-08-21 2020-08-21 语音信号的参数化表达、加密传输和重构的方法

Country Status (1)

Country Link
CN (1) CN112002341B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112130068B (zh) * 2020-09-09 2023-08-01 南京工程学院 一种鉴别电机异常负载类型的方法
CN115249482B (zh) * 2022-01-15 2023-10-31 江苏怀业信息技术股份有限公司 基于人工智能和物联网的音频数据加密方法及解密方法
CN115982786B (zh) * 2023-03-20 2024-01-05 马云生 通过频率混淆实现的多芯片并行加密方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104681032A (zh) * 2013-11-28 2015-06-03 中国移动通信集团公司 一种语音通信方法和设备
CN110364161A (zh) * 2019-08-22 2019-10-22 北京小米智能科技有限公司 响应语音信号的方法、电子设备、介质及系统
CN110706719A (zh) * 2019-11-14 2020-01-17 北京远鉴信息技术有限公司 一种语音提取方法、装置、电子设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130297299A1 (en) * 2012-05-07 2013-11-07 Board Of Trustees Of Michigan State University Sparse Auditory Reproducing Kernel (SPARK) Features for Noise-Robust Speech and Speaker Recognition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104681032A (zh) * 2013-11-28 2015-06-03 中国移动通信集团公司 一种语音通信方法和设备
CN110364161A (zh) * 2019-08-22 2019-10-22 北京小米智能科技有限公司 响应语音信号的方法、电子设备、介质及系统
CN110706719A (zh) * 2019-11-14 2020-01-17 北京远鉴信息技术有限公司 一种语音提取方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种基于二阶盲信号分离的多路声回波抑制模型;何培宇等;《电子学报》;20061125(第11期);全文 *
内插滤波器及其FPGA实现;王建新等;《电信科学》;20011215(第12期);全文 *

Also Published As

Publication number Publication date
CN112002341A (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN112002341B (zh) 语音信号的参数化表达、加密传输和重构的方法
CN102519725B (zh) 通过非线性冗余提升小波包处理轴承设备振动信号的方法
EP2992689B1 (en) Method and apparatus for compressing and decompressing a higher order ambisonics representation
CN104854655A (zh) 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
US8392176B2 (en) Processing of excitation in audio coding and decoding
EP3038261B1 (fr) Procédé de prétraitement de compression de données adapté à des données de mesures de signaux électro-corticographiques (ecog) et système d'acquisition et de transmission de données ecog
CN112560699B (zh) 基于密度和压缩感知的齿轮振动信源欠定盲源分离方法
CN102377454B (zh) 一种回声消除的方法和装置
EP2517201B1 (en) Sparse audio processing
Abood et al. Provably secure and efficient audio compression based on compressive sensing
CN105206277A (zh) 基于单比特压缩感知的语音压缩方法
Parkale et al. Application of 1-D discrete wavelet transform based compressed sensing matrices for speech compression
CN107895580B (zh) 一种音频信号的重建方法和装置
Kumar et al. The optimized wavelet filters for speech compression
JP2013068938A (ja) 信号処理装置、信号処理方法及びコンピュータプログラム
CN110120228A (zh) 基于声谱图及深度残差网络的音频通用隐写分析方法及系统
CN101527036B (zh) 基于邻域加窗的提升小波图像去噪方法
zohra Chelali et al. Wavelet transform for speech compression and denoising
Desai et al. Compressive sensing in speech processing: A survey based on sparsity and sensing matrix
CN100517298C (zh) 将数字信号从时域变换到频域及其反向变换的方法
Zheng et al. Adaptive multiscale decomposition of graph signals
Lai et al. An efficient method of ECG signal compression by using a DCT-IV spectrum
Yu et al. Compressed sensing in audio signals and it's reconstruction algorithm
Bhadoria et al. Comparative analysis of basis & measurement matrices for non-speech audio signal using compressive sensing
Surakanti et al. Compression of speech signals using Kronecker enhanced compressive sensing method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant