CN107221335A - 一种监控音频信号的数字化装置和方法 - Google Patents
一种监控音频信号的数字化装置和方法 Download PDFInfo
- Publication number
- CN107221335A CN107221335A CN201710391613.6A CN201710391613A CN107221335A CN 107221335 A CN107221335 A CN 107221335A CN 201710391613 A CN201710391613 A CN 201710391613A CN 107221335 A CN107221335 A CN 107221335A
- Authority
- CN
- China
- Prior art keywords
- signal
- bit
- carried out
- bit digital
- digital signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000005236 sound signal Effects 0.000 title claims abstract description 34
- 238000012544 monitoring process Methods 0.000 title claims abstract description 33
- 230000002159 abnormal effect Effects 0.000 claims abstract description 95
- 230000003044 adaptive effect Effects 0.000 claims abstract description 32
- 238000006243 chemical reaction Methods 0.000 claims abstract description 19
- 238000013139 quantization Methods 0.000 claims abstract description 16
- 238000001514 detection method Methods 0.000 claims description 42
- 239000000872 buffer Substances 0.000 claims description 19
- 238000005070 sampling Methods 0.000 claims description 18
- 238000012546 transfer Methods 0.000 claims description 8
- 230000010354 integration Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 abstract description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005422 blasting Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 239000006063 cullet Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000005674 electromagnetic induction Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G11/00—Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
- H03G11/02—Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general by means of diodes
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M3/00—Conversion of analogue values to or from differential modulation
- H03M3/30—Delta-sigma modulation
- H03M3/458—Analogue/digital converters using delta-sigma modulation as an intermediate step
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种监控音频信号的数字化装置及方法,其装置包括:能够对待数字化的模拟音频信号x(t)进行自适应步长量化编码以输出1比特数字信号x1(n),并对其进行加扰以输出数字信号x2(n)的音频编码器;能够对数字信号x2(n)进行解扰以输出1比特数字信号x11(n),并对其进行采样率转换以获得N比特精度的数字信号y(n)的解码器。本发明通过采用自适应步长的Σ‑Δ编解码技术,使音频数字化装置对正常声音和大幅度的异常声音均保持较高的信噪比;能够存储高分辨率的异常声信号以便后续分析;其成本低,编码过程简单,易于电路实现,不需要附加额外A/D芯片可直接实现;在传输误码率较高的情况下仍保持高信噪比,有较好的抗误码能力等优点。
Description
技术领域
本发明属于音频信号处理技术,具体说是涉及一种监控音频信号的数字化 装置和方法。
背景技术
尽管视频监控是大部分安防系统的首要功能,但有效的音频监控则可补充 很多有益信息,提高监控效能。作为音频监控系统的重要组成部分,监控音频 信号的编解码技术需求主要表现在以下几个方面:(1)低时延:要求从音频源经 编码、传输、解码到回放端应该具有足够小的时延。(2)信号间切换快:多路监 控音频流之间切换迅速、平滑,以满足实时监控的需要。(3)环境的适应性:编 解码后还原的音频具有“忠实于场景”的质量。即在编解码过程中,要尽量真 实、完整的保留监控场景的信息,避免信息的损失,为后续的综合研判以及作 为法律证据提供良好的保障。尤其对较恶劣场景中出现的特殊声音(如嘈杂大街上的枪声、高声呼救等)具有良好的还原效果,不应出现失真等现象,满足 公安业务需求。(4)数据安全性:安全监控音频编码器在传输和存储中应该具有 一定的保密性。(5)相对而言,编码器要简单,而解码器可以略复杂,以降低系 统综合成本。
因此可见作为音频监控系统的重要组成部分,监控音频信号数字化性能决 定着整个系统的音频质量。但是现有的音频数字化技术却存在以下问题:(1)随 着音频识别技术在音频监控领域中的应用,要求监控音频信号数字化技术有更 高的分辨率和信噪比;但传统的A/D转换器其元器件的匹配精度决定了模数转 换器的精度,存在信噪比和分辨率不高等问题,要达到较高精度,则对应的电 路实现却复杂且价格昂贵;再者,模拟系统元器件存在易受温度、噪声、电磁 感应等影响,可靠性差等缺点。(2)在音频监控系统中,异常声(如枪声,玻璃 碎声,呼救声等)往往携带着重要信息。由于异常声信号幅度大,变化剧烈等特 点,传统的Σ-ΔA/D转换器往往对其产生过载失真,其结构如图1所示,其 缺点主要是没有量化阶的自适应调制,对于异常信号(如枪声、爆破声、碎玻 璃声、呼救声等)量化效果不佳,不能满足安全监控的要求。(3)传统的加扰方 式存在算法复杂,不易于集成等问题。(4)现有的音频数字化技术抗误码能力较 弱。(5)现有的音频数字化技术、编码技术存在电路实现复杂、价格昂贵等问题。
发明内容
鉴于已有技术存在的缺陷,本发明的目的是要提供一种监控音频信号的数 字化装置,该装置通过采用自适应步长的Σ-Δ编解码技术,使得本装置对正 常声音和异常声音均保持较高的信噪比。
为了实现上述目的,本发明的技术方案:
一种监控音频信号的数字化装置,其特征在于,包括:
能够对待数字化的模拟信号x(t)进行自适应步长量化编码处理以输出1比特 数字信号x1(n),并将所述1比特数字信号x1(n)转换成对应的数字信号x2(n)的 音频编码器;
能够对数字信号x2(n)进行数字解扰以输出1比特数字信号x11(n),并对1比 特数字信号x11(n)进行采样率转换以获得N比特精度的数字信号y(n)的音频解码 器。
进一步的,所述的音频编码器至少具有:
1比特Σ-ΔA/D转换器、对所述1比特Σ-ΔA/D转换器进行自适应步长控 制的峰值检波及限幅电路以及能够将所述1比特数字信号x1(n)转换成对应的数 字信号x2(n)的扰码器。
进一步的,所述的1比特Σ-ΔA/D转换器至少具有:
所述的1比特Σ-ΔA/D转换器至少具有:
接收模拟信号x(t)的积分器;
根据步长对1比特数字信号x1(n)进行D/A转换和积分的1比特D/A积分器;
能够比较上述两种积分器输出值大小的比较器;
确定抽样频率fs的抽样器以及能够进行1比特量化编码的符号检测器。
进一步的,所述峰值检波及限幅电路至少具有:
所述峰值检波及限幅电路至少具有:
对模拟信号x(t)进行全波整流的绝对值电路;
对绝对值电路进行限幅的限幅器;
对限幅器的输出信号进行峰值检波的峰值检波器;
以及保证步长Δ随峰值检波器输出而自适应变化的放大器。
进一步的,所述解码器至少具有:
能够对数字信号x2(n)进行数字解扰,以输出1比特数字信号x11(n)的解扰器;
以及对1比特数字信号x11(n)进行采样率转换以获得N比特精度的数字信号 y(n)的采样率转换器。
进一步的,所述扰码器对应的加扰规则为:若1比特数字信号x1(n)中的符 号连续3个为“1”或者“0”时,则将第三个数字符号置为“-1”;所述解扰器对应的 解扰规则为:若数字信号x2(n)中符号为“-1”,使得符号“-1”被置为与符号 “-1”前一位符号极性相同的符号。
进一步的,所述解码器还具有:能够对采样率转换过程中的数字信号进行 异常声检测的异常声检测器及对检测到的异常声进行存储的异常声存储器。
进一步的,所述异常声存储器至少具有:
能够对预设时间段内的数字信号进行预存储的缓存器;
异常声检测控制器,其能够在检测到异常声信号时,同步控制缓存器将当 前所预存储的信号存储至异常声存储器内且在所设定的时间段内未发现异常声 信号时,停止存储缓存器内所发送的信号。
本发明还要提供一种监控音频信号的数字化方法,其特征在于,包括:
步骤1、通过音频编码器对待数字化的模拟信号x(t)、对模拟信号x(t)进行 自适应步长量化编码处理以输出1比特数字信号x1(n)并将所述1比特数字信号 x1(n)转换成对应的数字信号x2(n);
步骤2、通过音频解码器对数字信号x2(n)进行数字解扰,以输出1比特数 字信号x11(n),并对1比特数字信号x11(n)进行采样率转换以获得N比特精度的 数字信号y(n)。
进一步的,所述的音频编码器至少具有:
1比特Σ-ΔA/D转换器;所述的1比特Σ-ΔA/D转换器包括接收模拟信号 x(t)的积分器、根据步长对1比特数字信号x1(n)进行D/A转换和积分的1比特D/A 积分器、能够比较上述两种积分器输出值大小的比较器、确定抽样频率fs的抽 样器、能够进行1比特量化编码的符号检测器;对所述1比特Σ-ΔA/D转换器 进行自适应步长控制的峰值检波及限幅电路;所述峰值检波及限幅电路包括对 模拟信号x(t)进行全波整流的绝对值电路、对绝对值电路进行限幅的限幅器、对 限幅器的输出信号进行峰值检波的峰值检波器、保证步长Δ随峰值检波器输出 而自适应变化的放大器;以及能够将所述1比特数字信号x1(n)转换成对应的数 字信号x2(n)的扰码器;所述扰码器对应的加扰规则为:若1比特数字信号x1(n)中的符号连续3个为“1”或者“0”时,则将第三个数字符号置为“-1”;
所述音频解码器至少具有:能够对数字信号x2(n)进行数字解扰,以输出1 比特数字信号x11(n)的解扰器;以及对1比特数字信号x11(n)进行采样率转换以 获得N比特精度的数字信号y(n)的采样率转换器;所述解扰器对应的解扰规则 为:若数字信号x2(n)中符号为“-1”,使得符号“-1”被置为与符号“-1”前 一位符号极性相同的符号。
进一步的,所述扰码器对应的加扰规则为:若1比特数字信号x1(n)中的符 号连续3个为“1”或者“0”时,则将第三个数字符号置为“-1”;所述解扰器对应的 解扰规则为:若数字信号x2(n)中符号为“-1”,使得符号“-1”被置为与符号 “-1”前一位符号极性相同的符号。
所述解码器还具有:能够对数字信号中进行异常声检测的异常声检测器及 对检测到的异常声进行存储的异常声存储器;所述异常声存储器至少具有:能 够对预设时间段内的数字信号进行预存储的缓存器;异常声检测控制器,其能 够在检测到异常声信号时,同步控制缓存器将当前所预存储的信号存储至异常 声存储器内且在所设定的时间段内未发现异常声信号时,停止存储缓存器内所 发送的信号。
与现有技术相比,本发明的有益效果:
本发明通过采用自适应步长的Σ-Δ编解码技术,使其对正常声音和异常 声音均保持较高的信噪比,并配合编解码较为简单的加扰解扰方式,使音频数 字化装置易于硬件实现;同时能够存储高分辨率的异常声信号,便于后续分析、 研判;因此可见本发明所提出的方法具有成本低,编码过程简单,易于电路实 现,不需要附加额外A/D芯片可直接实现;在传输误码率较高的情况下仍保持 高信噪比,有较好的抗误码能力等优点。
附图说明
图1为传统的一阶Σ-ΔA/D转换器的电路原理框图;
图2为本发明所述装置的电路原理框图;
图3为本发明所述峰值检波限幅器结构图;
图4为本发明所述积分器结构图;
图5为本发明所述比较器结构图;
图6为本发明所述1比特D/A积分器结构图;
图7为本发明所述加扰器对应的数字逻辑电路;
图8为本发明所述音频解码器的采样率转换器等效模型;
图9为本发明所述异常声训练模块原理框图;
图10为本发明所述异常声识别模块原理框图;
图11为本发明所述异常声存储器原理框图;
图12为本发明所述实例-幅度-信噪比曲线;
图13为本发明所述实例-跳变幅度-信噪比曲线;
图14为本发明所述实例-异常声音波形图;
图15a为本发明所述实例-经由现有Σ-Δ编解码后的带有异常声的音频 信号波形图;
图15b为本发明所述实例-经由自适应步长Σ-Δ编解码后的带有异常声的 音频信号波形图;
图16为本发明所述实例-误码率-信噪比曲线。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施 例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本 领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都 属于本发明保护的范围。
由于在音频监控系统中,传统的Σ-Δ编码器由于其步长恒定,往往对幅度 很大的异常声信号无法有效跟踪,从而导致异常声编解码后出现过载失真。为 了保证大幅度异常声信号的信噪比,则需对步长值Δ进行自适应控制;因而本 发明提出一种监控音频信号数字化装置,其编码器原理如图2所示:模拟信号 x(t)经过自适应步长Σ-ΔA/D转换器编码后输出1比特数字码流x1(n),再经扰码 器得到可在双绞线上差分传输的数字信号x2(n);音频解码器原理如图2所示: 数字信号x2(n)经过数字解扰后得到1比特数字信号x11(n),再经过采样率转换得 到N比特精度的数字信号y(n);同时在采样率转换过程中,按照新存储策略存 储高分辨率的异常声信号,以便后续对异常声音进行分析、研判。
基于上述设计思想,一种监控音频信号的数字化装置,其特征在于,包括:
能够对模拟信号x(t)进行自适应步长量化编码处理以输出1比特数字信号 x1(n),并将所述1比特数字信号x1(n)转换成对应的数字信号x2(n)的音频编码器;
能够对数字信号x2(n)进行数字解扰以输出1比特数字信号x11(n),并对1比 特数字信号x11(n)进行采样率转换以获得N比特精度的数字信号y(n)的音频解码 器。
进一步,所述的音频编码器至少具有:
1比特Σ-ΔA/D转换器、对所述1比特Σ-ΔA/D转换器进行自适应步长控 制的峰值检波及限幅电路以及能够将所述1比特数字信号x1(n)转换成对应的数 字信号x2(n)的扰码器;所述的1比特Σ-ΔA/D转换器至少具有:接收模拟信号 x(t)的积分器;根据步长对1比特数字信号x1(n)进行D/A转换和积分的1比特D/A 积分器;能够比较上述两种积分器输出值大小的比较器;确定抽样频率fs的抽 样器以及能够进行1比特量化编码的符号检测器。更进一步优选的,所述积分 器采用开关电容滤波器来实现,具体结构如图4所示:Φ与Φ为同源反向时钟, 时钟频率为fs,分别控制K1~K4等4个由MOS管构成的开关即Φ为高电平时, K1、K4接通,Φ为低电平时,K2、K3接通;则开关K1~K4及电容C1构成 的等效电阻为Re1=1/fsC1,该等效电阻接入放大器的反相端输入,放大器输出 即为积分信号x'(t),x'(t)与1比特D/A积分器的输出信号x'1(t)经过电压比较器、 符号检测器得到1比特数字信号x1(n),完成1比特量化,如图5、图6所示; 从上述各图可见,x1(n)通过1比特D/A积分器电路中的组合逻辑控制开关K8、 K9选择对量化阶电压Δ或-Δ积分,从而完成1比特D/A转换,该量化阶梯电 压经过积分后得到模拟信号x'1(t),x'1(t)再与积分信号x'(t)进行电压比较,从而形 成反馈环路。
对所述1比特Σ-ΔA/D转换器进行自适应步长控制的峰值检波及限幅电 路,优选的,所述峰值检波及限幅电路至少具有:对模拟信号x(t)进行全波整流 的绝对值电路;对绝对值电路进行限幅的限幅器;对限幅器的输出信号进行峰 值检波的峰值检波器;以及保证步长Δ随峰值检波器输出而自适应变化的放大 器;更进一步优选的,所述峰值检波及限幅具体电路如图3所示,图3中的OP4、 OP5、R1、R2、D1、D2构成精密绝对值电路;OP6、D3、Cp、Rp构成精密峰 值检波电路,其对应的时间常数由τ=CpRp确定;OP7、D4和设定电压Am构成 限幅器,其中Am为预定正常声音信号的最大幅度;OP8构成同相放大器,OP9、 R3、R4构成反向放大器,且要求R1=R2、R3=0.5R4、R5=R3,以保证在峰值 检波器的输出大于限幅器输出时,步长Δ随峰值检波器输出而自适应变化;所 述变化规则是步长值Δ始终保持峰值检波器输出值的两倍;
以及能够将所述1比特数字信号x1(n)转换成对应的数字信号x2(n)的扰码器, 优选的,所述扰码器对应的加扰规则为:若1比特数字信号x1(n)中的符号连续 3个为“1”或者“0”时,则将第三个数字符号置为“-1”;之所以设定这样的规则是 为了使得信号发送端减少连“0”码或连“1”码以保证定时恢复质量,具体的 在数字基带传输过程,特别是经过自适应步长Σ-Δ编码后,可能会出现连续 的“0”或连续的“1”;为解决此问题所提出一种加扰解扰方式;例如,当x1(n) 为“1、1、1、1、0、0、0、1、0、1”时,加扰后信号x2(n)为“1、1、-1、1、 0、0、-1、1、0、1”,所述扰码器具体实现数字逻辑电路如图8所示。
进一步的,所述解码器至少具有:
能够对数字信号x2(n)进行数字解扰,以输出1比特数字信号x11(n)的解扰器, 优选的,从上述编码规则看出,每一个“-1”脉冲总是与之前的非“-1”符号极性相 同。因此,解码时每个“-1”应被置成此脉冲之前的非“-1”符号,则解扰器对应的 解扰规则为:若数字信号x2(n)中符号为“-1”,使得符号“-1”被置为与符号 “-1”前一位符号极性相同的符号;例如,当加扰后信号x2(n)为“1、1、-1、1、 0、0、-1、1、0、1”时,解扰后信号x11(n)为“1、1、1、1、0、0、0、1、0、1”, 这种加扰解扰方式,避免了连续“1”与连续“0”的情况,有利于解码时定时信息的 恢复;且编码和解码都比较简单,易于硬件电路实现;以及对1比特数字信号 x11(n)进行采样率转换以获得N比特精度的数字信号y(n)的采样率转换器。优选 的,如图2所示所述采样率转换器至少包括数字低通滤波器以及D倍数字抽取 器。为了更进一步表述本方案下面以实例进行说明,所述D倍数字抽取器采用 512倍降采样,其分别采用4个抽取器进行降采样,具体的所述音频解码器采样 率转换器的等效模型如图8所示,其包括作为低通滤波器的平均器H1,以实现 对1比特数字信号x11(n)的实时处理,同时由于考虑到单个平均器旁瓣较大,为 抑制抽取时频谱混叠和降低计算复杂度,平均器H1采用级联的形式,其时域差分方程为:
其中,y1(n)为平均器H1的输出;同时设置有低通滤波器H2、H3,进一步的, 对于N2阶低通滤波器H2与N3阶低通滤波器H3,其时域差分方程分别为
其中,h2(i)、h3(i)分别为低通滤波器H2、H3的滤波系数,y2(n)、y3(n)分别为低 通滤波器H2、H3的输出,y11(n)为y1(n)经32倍抽取的输出,y21(n)为y2(n)经4 倍抽取的输出。更进一步的,在降采样过程中,应考虑在满足0~40KHz间的频 谱不发生混叠的条件下,滤波器通带应尽量宽,则相应的本发明中计算低通滤 波器通带截止频率的方法如下:
其中,低通滤波器H2的采样频率fc为低通滤波器H2的通带截止频 率;低通滤波器H3的采样频率fc′为低通滤波器H3的通带截止频率, 可见根据式(4)可设计出低通滤波器H2、H3的滤波系数h2(i)、h3(i);采样率转 换器还包括N4阶低通滤波器H4,其时域差分方程为:
其中,h4(i)为滤波系数,y31(n)为y3(n)经2倍抽取的输出;同时为满足0~20KHz之间的频谱不产生混叠,其通带截止频率应满足以下条件:
其中,低通滤波器H4的采样频率fc″为低通滤波器H4的通带截止频率。 根据式(6)可设计出低通滤波器H4的滤波系数h4(i)。
进一步的,所述解码器还具有:能够对采样率转换过程中的数字信号进行 异常声检测的异常声检测器及对检测到的异常声进行存储的异常声存储器,异 常声检测与存储的作用是检测并存储高分辨率的异常声信号,以便后续分析。 优选的,所述异常声存储器至少具有:能够对预设时间段内的采样率转换过程 中的数字信号中进行预存储的缓存器;异常声检测控制器,其能够在检测到异 常声信号时,同步控制缓存器将当前所预存储的信号存储至异常声存储器内且 在所设定的时间段内未发现异常声信号时,停止存储缓存器内所发送的信号。 之所以设置异常声存储器,其作用是存储异常声及异常声发生的前后时间段如5 分钟高分辨率的音频信号;具体的为存储高分辨率信号,本申请中异常声存储 器位置如图8所示,并定义缓存器内存至多可存5分钟的音频信号,存储流程 如图11所示,相应的异常声检测控制器对应的控制规则为:(a)缓存器持续存储 5分钟的音频信号;(b)当检测出异常声时,控制器通过控制开关K接通使得缓 存器内容存入存储器中;(c)连续10分钟未检测到另一异常声时,控制器通过控 制开关K断开使得缓存器内容停止存入存储器中;这样的设计使得监控场景发 生异常声音时,可根据存储器中的内容,便于分析与识别,便于还原异常声前 后时刻的场景。
更进一步优选的,所述的异常声检测方法采用吕霄云等在“基于MFCC和短 时能量混合的异常声音识别算法”中提出的异常声检测方法,以实现对数字信号 y31(n)进行异常声检测,如图9-10,首先对训练样本(异常声)进行特征提取, 根据特征矢量训练出不同异常声音(如叫喊声、枪声、碎玻璃声)的GMM模 型,随后按照胡益平在“基于GMM的说话人识别技术研究与实现”提出的方 法,对提取之后的音频特征矢量训练4种异常声音的GMM模型;异常声GMM 模型训练完后,对识别监控场所的异常声音进行识别,相应的识别模型如图10。更进一步优选的,为了提高异常声检测精度,防止因抽取之后的分辨率降低的 问题,如图8所示,所述的异常声检测过程还可以将对采样率转换过程中的数 字信号设置为在第一个2倍抽取器之后对信号进行异常声检测。
本发明的另一目的是要提供一种监控音频信号的数字化方法,其特征在于, 包括:
步骤1、通过音频编码器对模拟信号x(t)进行自适应步长量化编码处理以输 出1比特数字信号x1(n)并将所述1比特数字信号x1(n)转换成对应的数字信号 x2(n);
步骤2、通过音频解码器对数字信号x2(n)进行数字解扰,以输出1比特数 字信号x11(n),并对1比特数字信号x11(n)进行采样率转换以获得N比特精度的 数字信号y(n)。
进一步的,所述的音频编码器至少具有:
1比特Σ-ΔA/D转换器;所述的1比特Σ-ΔA/D转换器包括接收模拟信号 x(t)的积分器、根据步长对1比特数字信号x1(n)进行D/A转换和积分的1比特D/A 积分器、能够比较上述两种积分器输出值大小的比较器、确定抽样频率fs的抽 样器、能够进行1比特量化编码的符号检测器;对所述1比特Σ-ΔA/D转换器 进行自适应步长控制的峰值检波及限幅电路;所述峰值检波及限幅电路包括对 模拟信号x(t)进行全波整流的绝对值电路、对绝对值电路进行限幅的限幅器、对 限幅器的输出信号进行峰值检波的峰值检波器、保证步长Δ随峰值检波器输出 而自适应变化的放大器;以及能够将所述1比特数字信号x1(n)转换成对应的数 字信号x2(n)的扰码器;所述扰码器对应的加扰规则为:若1比特数字信号x1(n)中的符号连续3个为“1”或者“0”时,则将第三个数字符号置为“-1”;
所述音频解码器至少具有:能够对数字信号x2(n)进行数字解扰,以输出1 比特数字信号x11(n)的解扰器;以及对1比特数字信号x11(n)进行采样率转换以 获得N比特精度的数字信号y(n)的采样率转换器;所述解扰器对应的解扰规则 为:若数字信号x2(n)中符号为“-1”,使得符号“-1”被置为与符号“-1”前 一位符号极性相同的符号。
所述解码器还具有:能够对采样率转换过程中所涉及的数字信号进行异常 声检测的异常声检测器及对检测到的异常声进行存储的异常声存储器;所述异 常声存储器至少具有:能够对预设时间段内的数字信号进行预存储的缓存器; 异常声检测控制器,其能够在检测到异常声信号时,同步控制缓存器将当前所 预存储的信号存储至异常声存储器内且在所设定的时间段内未发现异常声信号 时,停止存储缓存器内所发送的信号。
下述以具体实验例对本发明的有效性进行验证,采样信号为:对不同频率、 不同幅度的正弦信号及带有异常声的音频信号进行编解码,具体的其实验中采 样频率fs=24.576MHz,Am=0.002伏,τ=0.203秒。
具体过程为:首先,采用本发明所提出的方法对不同频率、不同幅度的正 弦信号进行编解码;设正弦信号x(t)的幅度为A,频率为f,则
x(t)=Asin(2πft) (7)
当f取0.02KHz、0.2KHz、2KHz、20KHz时,随着幅度A在0.002~2区间上的 变化,解码后信噪比变化如图12所示;由图12可见,当Am恒定,幅度A从0.002 升至2时,不同频率的信号解码后信噪比均有所下降;其中,频率越高,下降越 小。由于异常声中的高频成分较多,所以本专利方法对异常声信号有较高的信 噪比。当f取0.02KHz、0.2KHz、2KHz、20KHz,幅度A从0.002跳变至Ajp时,解 码后信噪比如图13所示,当Ajp取0.01到1.25时,不同频率的信号经跳变后其解码 后信噪比如图13所示,其中,频率越高,其信噪比越高;由于异常声中往往高 频成分较多,所以本方法对异常声中的幅度突然增大过程保持较高的信噪比。
其次,本发明对一段带有异常声的音频信号进行编解码;当发生异常声时 (敲打桌子的声音),信号幅度突然增大,音频信号波形如图14所示,此信号 经过现有技术中的Σ-Δ编解码与本专利所提出的自适应步长Σ-Δ编解码技术编解 码后,波形如图15所示;可见由于现有技术中Σ-Δ编码时步长恒定,导致异常声 信号产生了过载失真;而本专利所提出的方法,当发生异常声时,步长随异常 声音的幅度而自适应变化,保证了异常声音有较高的信噪比。
最后,为测试误码率对本发明的影响,给出其误码率—信噪比曲线,如图 16所示;图16中,横轴表示传输信道中误码率,纵轴表示经过解码后的音频信 号信噪比;由图可见,当传输信道误码率BER=10-7、f=20KHz时,解码后信号 最高信噪比高达77.69dB;传输信道误码率BER=10-4、f=0.02KHz时,解码后信 号最低信噪比为52.17dB。由此说明本发明所提出的方法有较好的抗信道误码能 力。
综上所述,本发明所提出的方案具有成本低,编码过程简单,易于电路实 现,不需要附加额外A/D芯片可直接实现;在传输误码率较高的情况下仍保持 高信噪比,有较好的抗误码能力等优点;且其通过采用自适应步长的Σ-Δ编解 码技术,实现了对正常声音和异常声音均保持较高的信噪比;通过采用加扰解 扰方式其编解码比较简单,易于硬件实现;通过采用存储高分辨率的异常声信 号,便于后续分析、研判。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局 限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本 发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护 范围之内。
Claims (10)
1.一种监控音频信号的数字化装置,其特征在于,包括:
能够对待数字化的模拟信号x(t)进行自适应步长量化编码处理以输出1比特数字信号x1(n),并将所述1比特数字信号x1(n)转换成对应的数字信号x2(n)的音频编码器;
能够对数字信号x2(n)进行数字解扰以输出1比特数字信号x11(n),并对1比特数字信号x11(n)进行采样率转换以获得N比特精度的数字信号y(n)的音频解码器。
2.根据权利要求1所述的监控音频信号的数字化装置,其特征在于:
所述的音频编码器至少具有:
1比特Σ-ΔA/D转换器、对所述1比特Σ-ΔA/D转换器进行自适应步长控制的峰值检波及限幅电路以及能够将所述1比特数字信号x1(n)转换成对应的数字信号x2(n)的扰码器。
3.根据权利要求2所述的监控音频信号的数字化装置,其特征在于:
所述的1比特Σ-ΔA/D转换器至少具有:
接收模拟信号x(t)的积分器;
根据步长对1比特数字信号x1(n)进行D/A转换和积分的1比特D/A积分器;
能够比较上述两种积分器输出值大小的比较器;
确定抽样频率fs的抽样器以及能够进行1比特量化编码的符号检测器。
4.根据权利要求2所述的监控音频信号的数字化装置,其特征在于:
所述峰值检波及限幅电路至少具有:
对模拟信号x(t)进行全波整流的绝对值电路;
对绝对值电路进行限幅的限幅器;
对限幅器的输出信号进行峰值检波的峰值检波器;
以及保证步长Δ随峰值检波器输出而自适应变化的放大器。
5.根据权利要求2所述的监控音频信号的数字化装置,其特征在于:
所述解码器至少具有:
能够对数字信号x2(n)进行数字解扰,以输出1比特数字信号x11(n)的解扰器;
以及对1比特数字信号x11(n)进行采样率转换以获得N比特精度的数字信号y(n)的采样率转换器。
6.根据权利要求5所述的监控音频信号的数字化装置,其特征在于:
所述扰码器对应的加扰规则为:若1比特数字信号x1(n)中的符号连续3个为“1”或者“0”时,则将第三个数字符号置为“-1”;所述解扰器对应的解扰规则为:若数字信号x2(n)中符号为“-1”,使得符号“-1”被置为与符号“-1”前一位符号极性相同的符号。
7.根据权利要求2所述的监控音频信号的数字化装置,其特征在于:
所述解码器还具有:能够对采样率转换过程中的数字信号进行异常声检测的异常声检测器及对检测到的异常声进行存储的异常声存储器。
8.根据权利要求7所述的监控音频信号的数字化装置,其特征在于:
所述异常声存储器至少具有:
能够对预设时间段内的数字信号进行预存储的缓存器;
异常声检测控制器,其能够在检测到异常声信号时,同步控制缓存器将当前所预存储的信号存储至异常声存储器内且在所设定的时间段内未发现异常声信号时,停止存储缓存器内所发送的信号。
9.一种监控音频信号的数字化方法,其特征在于,包括:
步骤1、通过音频编码器对待数字化的模拟信号x(t)进行自适应步长量化编码处理以输出1比特数字信号x1(n)并将所述1比特数字信号x1(n)转换成对应的数字信号x2(n);
步骤2、通过音频解码器对数字信号x2(n)进行数字解扰,以输出1比特数字信号x11(n),并对1比特数字信号x11(n)进行采样率转换以获得N比特精度的数字信号y(n)。
10.根据权利要求9所述的监控音频信号的数字化方法,其特征在于:
所述的音频编码器至少具有:
1比特Σ-ΔA/D转换器;所述的1比特Σ-ΔA/D转换器包括接收模拟信号x(t)的积分器、根据步长对1比特数字信号x1(n)进行D/A转换和积分的1比特D/A积分器、能够比较上述两种积分器输出值大小的比较器、确定抽样频率fs的抽样器、能够进行1比特量化编码的符号检测器;对所述1比特Σ-ΔA/D转换器进行自适应步长控制的峰值检波及限幅电路;所述峰值检波及限幅电路包括对模拟信号x(t)进行全波整流的绝对值电路、对绝对值电路进行限幅的限幅器、对限幅器的输出信号进行峰值检波的峰值检波器、保证步长Δ随峰值检波器输出而自适应变化的放大器;以及能够将所述1比特数字信号x1(n)转换成对应的数字信号x2(n)的扰码器;所述扰码器对应的加扰规则为:若1比特数字信号x1(n)中的符号连续3个为“1”或者“0”时,则将第三个数字符号置为“-1”;
所述音频解码器至少具有:能够对数字信号x2(n)进行数字解扰,以输出1比特数字信号x11(n)的解扰器;以及对1比特数字信号x11(n)进行采样率转换以获得N比特精度的数字信号y(n)的采样率转换器;所述解扰器对应的解扰规则为:若数字信号x2(n)中符号为“-1”,使得符号“-1”被置为与符号“-1”前一位符号极性相同的符号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710391613.6A CN107221335B (zh) | 2017-05-27 | 2017-05-27 | 一种监控音频信号的数字化装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710391613.6A CN107221335B (zh) | 2017-05-27 | 2017-05-27 | 一种监控音频信号的数字化装置和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107221335A true CN107221335A (zh) | 2017-09-29 |
CN107221335B CN107221335B (zh) | 2020-07-14 |
Family
ID=59946804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710391613.6A Active CN107221335B (zh) | 2017-05-27 | 2017-05-27 | 一种监控音频信号的数字化装置和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107221335B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7042375B1 (en) * | 2005-03-29 | 2006-05-09 | Broadcom Corporation | System and method using dither to tune a filter |
CN1894855A (zh) * | 2003-03-21 | 2007-01-10 | D2音频有限公司 | 用于限幅检测和信号修改的系统和方法 |
US20070069931A1 (en) * | 2005-09-23 | 2007-03-29 | Hong-Yean Hsieh | Self-calibrating continuous-time delta-sigma modulator |
CN101454836A (zh) * | 2006-07-27 | 2009-06-10 | 三星电子株式会社 | 将输入信号二值化的方法和设备、盘驱动器及记录介质 |
CN101499282A (zh) * | 2008-02-03 | 2009-08-05 | 深圳艾科创新微电子有限公司 | 一种语音模数转换方法及装置 |
CN1879446B (zh) * | 2003-11-24 | 2011-02-16 | 桑尼奥公司 | 包括整体多电平量化器和单比特转换装置的麦克风 |
CN102377436A (zh) * | 2010-08-16 | 2012-03-14 | Nxp股份有限公司 | 低功率高动态范围西格玛-德尔塔调制器 |
CN106027981A (zh) * | 2016-06-22 | 2016-10-12 | 成都嘉泽兴业科技有限责任公司 | 一种存储控制系统 |
-
2017
- 2017-05-27 CN CN201710391613.6A patent/CN107221335B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1894855A (zh) * | 2003-03-21 | 2007-01-10 | D2音频有限公司 | 用于限幅检测和信号修改的系统和方法 |
CN1879446B (zh) * | 2003-11-24 | 2011-02-16 | 桑尼奥公司 | 包括整体多电平量化器和单比特转换装置的麦克风 |
US7042375B1 (en) * | 2005-03-29 | 2006-05-09 | Broadcom Corporation | System and method using dither to tune a filter |
US20070069931A1 (en) * | 2005-09-23 | 2007-03-29 | Hong-Yean Hsieh | Self-calibrating continuous-time delta-sigma modulator |
CN101454836A (zh) * | 2006-07-27 | 2009-06-10 | 三星电子株式会社 | 将输入信号二值化的方法和设备、盘驱动器及记录介质 |
CN101499282A (zh) * | 2008-02-03 | 2009-08-05 | 深圳艾科创新微电子有限公司 | 一种语音模数转换方法及装置 |
CN102377436A (zh) * | 2010-08-16 | 2012-03-14 | Nxp股份有限公司 | 低功率高动态范围西格玛-德尔塔调制器 |
CN106027981A (zh) * | 2016-06-22 | 2016-10-12 | 成都嘉泽兴业科技有限责任公司 | 一种存储控制系统 |
Non-Patent Citations (2)
Title |
---|
卞佳丽等: "《现代交换原理与通信网技术》", 31 May 2005, 北京邮电大学出版社 * |
孙肖子等: "《模拟电子技术基础》", 31 January 2001, 西安电子科技大学出版社 * |
Also Published As
Publication number | Publication date |
---|---|
CN107221335B (zh) | 2020-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8370144B2 (en) | Detection of voice inactivity within a sound stream | |
CN107645343A (zh) | 基于声波的数据发送/接收方法及数据传输系统 | |
CA3190346A1 (en) | Method and apparatus for compressing and decompressing a higher order ambisonics representation | |
MX2007005103A (es) | Codificacion y decodificacion de senales de audio utilizando bancos de filtros de valor complejo. | |
BRPI0913228B1 (pt) | Método de recuperação de uma mensagem de dados incorporados em um sinal de áudio e aparelho receptor | |
Gabor | Communication theory and cybernetics | |
JPH03166839A (ja) | ディジタル情報検出装置 | |
AU5557198A (en) | Methods of and apparatus for coding discrete signals and decoding coded discrete signals, respectively | |
JP4666030B2 (ja) | 情報処理装置、及び信号判定方法 | |
CN110545124B (zh) | 一种基于蟋蟀叫声的伪装隐蔽通信结构及方法 | |
JP2023548707A (ja) | 音声強調方法、装置、機器及びコンピュータプログラム | |
CN107221335A (zh) | 一种监控音频信号的数字化装置和方法 | |
CN101951271B (zh) | 基于压缩采样的脉冲超宽带信号检测方法 | |
CN103456307A (zh) | 音频解码器中帧差错隐藏的谱代替方法及系统 | |
JP4683093B2 (ja) | 情報処理装置、信号伝送方法、及び復号方法 | |
JPS5938999A (ja) | アナログ信号記憶装置 | |
CN101976567B (zh) | 一种语音信号差错掩盖方法 | |
CN207302043U (zh) | 一种动态双阈值的bmc解码装置 | |
JP2010062762A (ja) | 情報処理装置、復号処理方法、及び信号伝送方法 | |
CN101908888B (zh) | 反量化处理方法与装置 | |
MalmirChegini et al. | Performance improvement of level-crossing a/d converters | |
Kundu et al. | A computationally efficient approach to the removal of impulse noise from digitized speech | |
TWI251426B (en) | FSK decoder for caller ID | |
CN111081264B (zh) | 一种语音信号处理方法、装置、设备及存储介质 | |
Bracken et al. | Adaptive continuous-time equalization and FDTS/DF sequence detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |