CN114446311A - 一种数字声音重构方法、系统、设备及介质 - Google Patents

一种数字声音重构方法、系统、设备及介质 Download PDF

Info

Publication number
CN114446311A
CN114446311A CN202210121026.6A CN202210121026A CN114446311A CN 114446311 A CN114446311 A CN 114446311A CN 202210121026 A CN202210121026 A CN 202210121026A CN 114446311 A CN114446311 A CN 114446311A
Authority
CN
China
Prior art keywords
digital
audio data
module
sound
digital audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210121026.6A
Other languages
English (en)
Other versions
CN114446311B (zh
Inventor
刘长华
杜海江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Earth Mountain Suzhou Microelectronics Technology Co ltd
Original Assignee
Earth Mountain Suzhou Microelectronics Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Earth Mountain Suzhou Microelectronics Technology Co ltd filed Critical Earth Mountain Suzhou Microelectronics Technology Co ltd
Priority to CN202210121026.6A priority Critical patent/CN114446311B/zh
Publication of CN114446311A publication Critical patent/CN114446311A/zh
Application granted granted Critical
Publication of CN114446311B publication Critical patent/CN114446311B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开一种数字声音重构方法、系统、设备及介质,涉及声音重构技术领域,用于解决现有技术中无法实现数字发声且精度低的问题。包括:接收第一数字音频数据;对第一数字音频数据进行格式转换,得到通用格式的第二数字音频数据;对第二数字音频数据执行sigma‑delta调制以及抽取操作,得到多路量化音频数字流;将多路量化音频数字流转换为驱动电信号;并采用驱动电信号驱动换能元件阵列,得到声音信号。其中基于Sigma‑Delta的数字声音重构方法,能够实现了一种高信噪比的数字发声,具有减少失真、减小频响非线性、提高信噪比等技术效果。

Description

一种数字声音重构方法、系统、设备及介质
技术领域
本发明涉及声音重构技术领域,尤其涉及一种数字声音重构方法、系统、设备及介质。
背景技术
扬声器是一种电声换能器件,可以将声音电信号转换成声音。从发展的历史看,曾出现过各种各样的扬声器,例如:电动式扬声器、电磁式扬声器(即舌簧扬声器),晶体扬声器、静电扬声器等。
从贝尔发明的第一部电话到现在,扬声器经过一百多年的发展。如今,声音的采集、存储以及处理都已实现数字化,而最后发声仍为模拟发声。目前市面应用的扬声器几乎都是模拟扬声器,其通过控制振膜运动推动空气从而实现模拟发声。但是,在实际应用中,如果想精确控制振膜运动是难以实现的,尤其当扬声器微型化时。
因此,亟需提供一种更为可靠的数字声音重构方案。
发明内容
本发明的目的在于提供一种数字声音重构方法、系统、设备及介质,用于解决现有技术中无法实现数字发声且精度低的问题。
为了实现上述目的,本发明提供如下技术方案:
本发明提供一种数字声音重构方法,包括:
接收第一数字音频数据;
对所述第一数字音频数据进行格式转换,得到通用格式的第二数字音频数据;
对所述第二数字音频数据执行sigma-delta调制以及抽取操作,得到多路量化音频数字流;
将所述多路量化音频数字流转换为驱动电信号;
采用所述驱动电信号驱动换能元件阵列,得到声音信号。
本发明提供一种数字声音重构系统,包括:
音频接收模块、数字音频解码转换模块、数字声音重构模块以及驱动模块;
所述音频接收模块用于接收第一数字音频数据,并将所述第一数字音频数据传输给所述数字音频解码转换模块;所述数字音频解码转换模块对所述第一数字音频数据进行格式转换,得到通用格式的第二数字音频数据,并将所述第二数字音频数据发送给所述数字声音重构模块;所述数字声音重构模块用于对所述第二数字音频数据执行sigma-delta调制以及抽取操作,得到多路量化音频数字流,并将所述多路量化音频数字流发送给所述驱动模块;所述驱动模块用于将所述多路量化音频数字流转换为驱动电信号;所述驱动电信号用于驱动换能元件阵列,得到声音信号。
本发明提供通信单元/通信接口,用于接收第一数字音频数据;
处理单元/处理器,用于对所述第一数字音频数据进行格式转换,得到通用格式的第二数字音频数据;
对所述第二数字音频数据执行Sigma-Delta调制以及抽取操作,得到多路量化音频数字流;
将所述多路量化音频数字流转换为驱动电信号;
采用所述驱动电信号驱动换能元件阵列,得到声音信号。
一种计算机存储介质,所述计算机存储介质中存储有指令,当所述指令被运行时,实现上述的数字声音重构方法。
与现有技术相比,本发明提供的数字声音重构方法,通过接收第一数字音频数据;对第一数字音频数据进行格式转换,得到通用格式的第二数字音频数据;对第二数字音频数据执行sigma-delta调制以及抽取操作,得到多路量化音频数字流;将多路量化音频数字流转换为驱动电信号;并采用驱动电信号驱动换能元件阵列,得到声音信号。基于Sigma-Delta的数字声音重构方法,能够实现了一种高信噪比的数字发声,克服了传统模拟扬声器发声的失真差、频响非线性、低信噪比等缺点。
本发明提供的数字声音重构系统,包括音频接收模块、数字音频解码转换模块、数字声音重构模块以及驱动模块;音频接收模块用于接收第一数字音频数据,数字音频解码转换模块对第一数字音频数据进行格式转换,得到通用格式的第二数字音频数据;数字声音重构模块对第二数字音频数据执行Sigma-Delta调制以及抽取操作,得到多路量化音频数字流,驱动模块用于将多路量化音频数字流转换为驱动电信号,以驱动换能元件阵列,得到声音信号。基于Sigma-Delta数字扬声器控制系统,相较于传统PCM数字控制方式实现了一种高精度的数字发声,克服了传统模拟扬声器发声的失真差、频响非线性、低信噪比等缺点。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本说明书实施例提供的一种数字声音重构系统的系统结构示意图;
图2为本说明书实施例提供的一种数字声音重构方法流程示意图;
图3为本说明书实施例提供的一种单Bit SDM信号驱动方案示意图;
图4为本说明书实施例提供的一种多Bit SDM信号驱动方案示意图;
图5为本说明书实施例提供的一种数字声音重构设备示意图。
附图标记:
110-音频接收模块,120-数字音频编码转换模块,130-DSR模块,140-音量调节模块,150-声场定向技术模块,160-降噪模块,170-驱动模块。
具体实施方式
为了便于清楚描述本发明实施例的技术方案,在本发明的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如,第一阈值和第二阈值仅仅是为了区分不同的阈值,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
需要说明的是,本发明中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
本发明中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,a和b的结合,a和c的结合,b和c的结合,或a、b和c的结合,其中a,b,c可以是单个,也可以是多个。
在介绍本发明实施例之前首先对本发明实施例中涉及到的相关名词作如下释义:
微机电系统 (Microelectro Mechanical Systems,简称MEMS),可利用集成电路(IC) 制造技术和微加工技术把微传感器、微执行器等制造在一块或者多块芯片上的微型集成系统。典型的 MEMS 由传感器、信息处理单元、执行器和通讯/接口单元等组成。输入信号是物理信号,通过传感器转换为电信号,经过信号处理(模拟的或/和数字的)后,由执行器与外界产生作用。每一个微系统可以采用数字或模拟信号(电、光、磁等物理量) 与其他的微系统进行通信。
Delta-sigma ADC(也称为Sigma-Delta)的硬件体系结构包含积分器、比较器和1位数模转换器(DAC),按序排列在一个负反馈循环中。将输入信号和取反的DAC输出相加馈入积分器电路。积分器的输出是一个斜坡信号,该信号的斜率与积分器的输入信号幅度成正比。积分器输出与比较器参考信号进行比较,产生0或1。比较器的二进制输出基于ADC过采样时钟Foversamp送入数字抽取滤波器。每个位代表积分的斜坡输出相对于比较器参考的方向,多次循环之后,位流代表输入信号的量化数值。
脉冲编码调制(Pulse Code Modulation,简称PCM)。数字信号是对连续变化的模拟信号进行抽样、量化和编码产生。
扬声器是一种把电信号转变为声信号的换能器件,扬声器的性能优劣对音质的影响很大。扬声器在音响设备中是一个最薄弱的器件,而对于音响效果而言,它又是一个最重要的部件。扬声器的种类繁多,而且价格相差很大。音频电能通过电磁,压电或静电效应,使其纸盆或膜片振动并与周围的空气产生共振(共鸣)而发出声音。
随着MEMS制造工艺的发展,多像素扬声器发声单元能够被批量制造在一个MEMS芯片上。目前市面应用的扬声器几乎全为模拟扬声器,其通过控制振膜运动推动空气从而实现模拟发声。而要想精确控制振膜运动是难以实现的,尤其当扬声器微型化时。例如:传统的PCM数字控制系统,假设想要实现16Bit精度发声,其需要2的16次方量级(65536个)的量化台阶数,意味着需要约相同数量级的像素扬声器单元,这在工艺难度和成本上是巨大的。
基于此,本发明提出一种数字声音重构方案,基于高精度的Sigma-Delta的数字扬声器系统,与传统的PCM控制不同,Sigma-Delta数字系统可以实现高信噪比的数字声音控制。有效的解决了PCM像素数量控制扬声器数量的问题。
接下来,结合附图对本说明书实施例提供的方案进行说明:
实施例1
本说明书实施例提供了一种数字声音重构系统。图1为本说明书实施例提供的一种数字声音重构系统的系统结构示意图。如图1所示,该系统可以包括:
音频接收模块110、数字音频解码转换模块120、数字声音重构模块130以及驱动模块170。其中,数字声音重构(Digital Sound Reconstruction,简称DSR),因此,数字声音重构模块130也可以称为DSR模块。
音频接收模块110可以用于接收第一数字音频数据,例如:图1中的音源,音源作为整个系统的输入端,其格式可以为各种数字声音文件。如WAV、MP3、AIF等通用的声音存储格式数据。输入的不同格式文件,有不同Bit、不同采样频率的PCM数据,也有DSD格式的数据。在输入到DSR模块130之前,需要先经过数字音频解码转换模块120,将输入的不同格式数字声音文件转换为通用格式,如16Bit的PCM数据,再传递给DSR模块130。常见音源格式如24Bit、44.1Hz的PCM数据,并将通用格式的音频数据发送给DSR模块130;所述DSR模块130可以对通用格式的音频数据执行Sigma-Delta调制以及抽取操作,得到多路量化音频数字流,并将多路量化音频数字流发送给驱动模块170;驱动模块170可以将多路量化音频数字流转换为驱动电信号;驱动电信号用于驱动换能元件阵列,得到声音信号。
可选的,DSR模块130中可以包括调制量化模块;所述调制量化模块可以用于对第二数字音频数据进行调制量化;。
可选的,图1中的数字声音重构系统还可以包括音量调节模块140、声场定向技术模块150以及降噪模块160,其中,音量调节模块140用于对所述声音信号对应的音量进行调节;所述声场定向技术模块150用于对所述声音信号进行声场定向;所述降噪模块160用于对所述声音信号进行降噪。
图1中的系统,基于Sigma-Delta技术,配合数字音频解码转换模块、音量调节模块、声场定向技术模块、降噪模块、驱动模块,可以控制扬声器换能阵列,从而实现高精度数字发声。
实施例2
图2为本说明书实施例提供的一种数字声音重构方法流程示意图。从程序角度而言,流程的执行主体可以为数字声音重构系统对应的服务器集群或者处理器;以服务器集群为例,该服务器集群中可以包含系统中的各种虚拟模块,实现基于接收到的音频数据进行处理后进行数字发声。
如图2所示,该流程可以包括以下步骤:
步骤210:接收第一数字音频数据。
该步骤可以由图1中的音频接收模块来执行,第一数字音频数据可以是图1中的音源,可以是各种格式的数字声音文件。
步骤220:对所述第一数字音频数据进行格式转换,得到通用格式的第二数字音频数据。
该步骤可以由图1中的数字音频解码转换模块执行,数字音频解码转换模块可以将输入声音数字流转换为特定Bit,特定采样频率的音频数据。如16Bit、44.1Hz的PCM数据。该过程中分别包含量化Bit的转换、以及采样频率的转换。
步骤230:对所述第二数字音频数据执行Sigma-Delta调制以及抽取操作,得到多路量化音频数字流。
该步骤可以由图1中的数字声音重构模块来实现,数字信号处理和通信系统的性能很大程度上受到了模拟信号到数字信号转换接口-ADC的精度和分辨率的限制。而传统的线性脉冲编码调制(PCM)ADC受到了制造工艺的限制。但基于Sigma-Delta调制技术的ADC可以在现有工艺下实现高信噪比以及高分辨率(例如:大于16位)。
步骤240:将所述多路量化音频数字流转换为驱动电信号。
步骤250:采用所述驱动电信号驱动换能元件阵列,得到声音信号。
本说明书实施例中提供的方案,数字扬声器系统的硬件设备主要对发声阵列拓扑结构硬件的保护,发声阵列为线性声源或N*M阵列等。可以应用在微型MEMS扬声器中,MEMS扬声器中,电极板上可以设置有阵列分布的圆孔或长孔,以便于空气通过圆孔或长孔流入电极板和振动板之间形成空气阻尼。MEMS扬声器的数量可以为多个,排布方式可以呈阵列分布、线排布或行列排布。对应的,在驱动发声时,可以将多路量化音频数字流转换为驱动电信号,并采用驱动电信号驱动换能元件阵列,得到声音信号。
在扬声器微型化时,传统的模拟扬声器,其通过控制振膜运动推动空气从而实现模拟发声,要想精确控制振膜运动是难以实现的。图1中的上述方法,
可以有效解决PCM像素数量控制扬声器数量的问题,实现数字发声,并且具有高信噪比。
需要说明的是,本说明书实施例中以PCM数字控制为例对现有技术中的控制方式进行说明,仅为了突出本申请提供的技术方案可以解决像素数量控制扬声器数量的问题,并不表示本申请的技术方案仅能解决PCM数字控制带来的缺陷,只要是需要实现数字发声以及涉及到需要满足扬声器尺寸和低频二者兼顾的需求或者想要克服失真差、频响非线性、低信噪比等等的应用场景,均可以采用本申请提供的技术方案进行实现。
基于图2的方法,本说明书实施例还提供了该方法的一些具体实施方式,下面进行说明。
本申请提供的方案中,DSR模块可以基于单Bit 的Sigma-Delta数字声音重构技术,也可以基于多Bit 的Sigma-Delta数字声音重构技术,单Bit的Sigma-Delta DSR技术已经具备了高信噪比的优势,多Bit Sigma-Delta将该优势进一步扩大。接下来分别进行说明:
实施方式一、以基于单Bit 的Sigma-Delta数字声音重构技术为例:
可选的,所述对所述第二数字音频数据执行Sigma-Delta调制以及抽取操作,得到多路量化音频数字流,具体可以包括:
对所述第二数字音频数据进行过采样操作,得到第三数字音频数据;所述第三数字音频数据为经过过采样R倍的数字音频数据;所述R≥0;具体地,R可以为64、128等。
对所述第三数字音频数据进行噪波整形并进行量化,得到量化音频数字流;
对所述量化音频数字流按照预设抽取规则进行分组抽取,得到多路量化音频数字流。
数字扬声器系统在接收数字音频数据后,首先可以通过PCM转换器生成标准的通用格式PCM音频数据。具体实现时,可以设PCM信号
Figure 939920DEST_PATH_IMAGE001
Figure 377854DEST_PATH_IMAGE002
矩阵,其中
Figure 798471DEST_PATH_IMAGE003
为每个采样的比特数,
Figure 84090DEST_PATH_IMAGE004
为总的采样数,假设
Figure 197540DEST_PATH_IMAGE005
=16,
Figure 122770DEST_PATH_IMAGE006
=44100。则
Figure 347078DEST_PATH_IMAGE001
数据表示为:
Figure 470892DEST_PATH_IMAGE007
(1)
其中,
Figure 755243DEST_PATH_IMAGE008
用于表示m采样数的n bit位的PCM形式数字音频数字信息。转换器输出的信号
Figure 167770DEST_PATH_IMAGE001
在通过Sigma-Delta调制过程(也可以称作SDM调制过程),过采样R倍、噪波整形后再量化得到1/N Bit量化数据流,具体这里以1-bit量化表示如下:
Figure 195769DEST_PATH_IMAGE009
(2)
其中
Figure 688936DEST_PATH_IMAGE010
用于表示经过Sigma-Delta调制后的
Figure 878609DEST_PATH_IMAGE011
采样数的音频数字信息;
Figure 778431DEST_PATH_IMAGE012
用于表示对
Figure 344542DEST_PATH_IMAGE013
进行Sigma-Delta调制 ;
Figure 646210DEST_PATH_IMAGE014
用于表示Sigma-Delta调制后的音频数字流。通过提高过采样、噪波整形等技术都有利于提高听觉范围内的信噪比和失真。SD处理后的数据为1维的脉冲密度调制(PDM)格式数据,数据采样总数
Figure 69101DEST_PATH_IMAGE015
上述SDM调制的数据可以直接拿来驱动扬声器阵列,但是,由于像素扬声器数量存在空间分布,需要消除声源空间位置带来的相位噪声,并且SDM的采样频率远高于换能单元的谐振频率,需要降低SDM的信号频率,因此,在本申请提供的技术方案中,所述对所述量化音频数字流按照预设抽取规则进行分组抽取,得到多路量化音频数字流,具体可以包括:
将所述量化音频数字流按照扬声器数量进行分组,得到多路量化音频数字流。
SDM按扬声器数量 K间隔抽取法,即:
Figure 456220DEST_PATH_IMAGE016
(3)
其中,
Figure 826022DEST_PATH_IMAGE017
用于表示对Sigma-Delta调制后的数据进行抽取分组;
Figure 716618DEST_PATH_IMAGE018
用于表示第k路信号的第1个音频数字;
Figure 326722DEST_PATH_IMAGE019
用于表示第k路信号的第s个音频数字。
Figure 935557DEST_PATH_IMAGE020
被按照扬声器数量分为K组,每组驱动信号为
Figure 109050DEST_PATH_IMAGE021
,信号采样频率被降低K倍,具体公式如下:
Figure 119731DEST_PATH_IMAGE022
(4)
所述将所述多路量化音频数字流转换为驱动电信号,具体可以包括:
将所述多路量化音频数字流转换为对应周期的驱动脉冲,得到驱动电信号;所述驱动脉冲包括三角脉冲、矩形脉冲或梯形脉冲。
在具体实现中,信号驱动可以结合图3进行说明:
图3为本说明书实施例提供的一种单Bit SDM信号驱动方案示意图。如图3所示,
Figure 150004DEST_PATH_IMAGE023
Figure 246136DEST_PATH_IMAGE024
Figure 957740DEST_PATH_IMAGE025
Figure 211478DEST_PATH_IMAGE026
作为驱动信号分别输送到指定换能器上进行驱动,以对扬声器进行分组驱动发声。
实施方式二、以基于多Bit 的Sigma-Delta数字声音重构技术为例:
该实施方式可以结合图4进行说明。图4为本说明书实施例提供的一种多Bit SDM信号驱动方案示意图。如图4所示:
多Bit SDM和单Bit SDM原理大概相同。只是给每个像素扬声器的电信号幅值有多个阶梯值。在量化精度上,多Bit更高。如:
1Bit-SDM数字流为0、1;
2Bit-SDM数字流为0、0.5、1;
多Bit实现数字扬声器发声的方法,主要有两种方式:
方式一:和1Bit一样,直接抽取K组数据,只是每个信号包含的电平不止0、1,还存在中间台阶。然后将数据流直接发送给对应的扬声器,扬声器在接到不同大小台阶电信号后,输出不同脉冲幅值的声能。
方式二:以2Bit为例:2Bit-SDM数字流为0、0.5、1;假设每个像素扬声器按0.5进行工作,1即需要2个像素同时参与工作。因此,给出另外一种逻辑:假设每行扬声器数量可以为1或2个。假设数字流0.5,对应驱动1个扬声器;数字流为1,对应驱动2个扬声器。这种量化台阶大小是通过一次驱动扬声器数量来响应的。这里同时需要一个开关器,保证扬声器数量的切换。一致性比较好。
需要说明的是,上述方式仅是能够实现本说明书实施例中提供的方案的个别实施方式,并不表示本申请保护的全部范围,除了上述列举的方式外,还可以有更多的实现方式,对此,本说明书实施例不作具体限定。
驱动电压方案是驱动模块将0、1数字转换为对应的一个周期的脉冲电压方案,最后给到换能元件。多Bit较1Bit的还原的信号失真低,量化台阶越小,失真THD越低。
基于本申请的技术方案具体实现时,还需要保证高信噪比的需求,对于高信噪比,本申请提供的Sigma-Delta技术采用了过采样和噪波整形技术,其中过采样通过提高芯片的时钟频率,噪波整形可以将听觉范围噪声移到听域范围之外上,从而实现音频降噪目的。
本申请提供一种基于Sigma-Delta的数字声音重构技术及数字扬声器系统。所述数字扬声器系统可以包含扬声器发声模块。所述发声阵列模块为多个电声换能器件组成。所述的数字声音重构单元可以为1位或者为多位Sigma-Delta DSR模块。所述Sigma-DeltaDSR算法采用了过采样、噪波整形技术提高音域范围内的信噪比。并通过控制芯片和扬声器阵列,实现了一种高信噪比的直接数字发声控制。
在实际应用中,可选的,Sigma-Delta调制的过程通过加法器、积分器以及比较器实现;其中,加法器可以负责将输入信号和反馈调制信号进行差分运算,也叫差分器,该步骤主要提取信号的增量信息。积分器可以负责将加法器的微分结果进行积分,得到原始信号量化信息。量化比较器可以将积分的信息进行数字量化,该步骤量化台阶可以为1bit,也可以是多Bit。
结合本说明书实施例中提供的方案进行说明:所述加法器可以用于将所述第二数字音频数据和反馈调制信号进行差分运算,得到差分结果;所述积分器可以用于将所述差分结果进行积分运算,得到积分结果;所述比较器可以用于对所述积分结果进行数字量化,得到多路量化音频数字流。
进一步地,整个Sigma Delta电路可以为一阶或高阶Sigma Delta电路。在一阶Sigma Delta电路中,比较器和D触发器可以共同组成一个量化器, 高阶∆-Σ调制的优点:噪波整形更优。高阶∆-Σ调制,可以将噪声移到高频段,对音频领域来说,可以将人耳可听域20-20kHz内的噪音移到超声范围内,从而在听域范围内实现更好的信噪比。
基于同样的思路,本说明书实施例还提供了一种数字声音重构设备。图5为本说明书实施例提供的一种数字声音重构设备示意图。可以包括:
通信单元/通信接口,用于接收第一数字音频数据;
处理单元/处理器,用于对所述第一数字音频数据进行格式转换,得到通用格式的第二数字音频数据;
对所述第二数字音频数据执行Sigma-Delta调制以及抽取操作,得到多路量化音频数字流;
将所述多路量化音频数字流转换为驱动电信号;
采用所述驱动电信号驱动换能元件阵列,得到声音信号。
如图5所示,上述终端设备还可以包括通信线路。通信线路可包括一通路,在上述组件之间传送信息。
可选的,如图5所示,该终端设备还可以包括存储器。存储器用于存储执行本发明方案的计算机执行指令,并由处理器来控制执行。处理器用于执行存储器中存储的计算机执行指令,从而实现本发明实施例提供的方法。
如图5所示,存储器可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路与处理器相连接。存储器也可以和处理器集成在一起。
可选的,本发明实施例中的计算机执行指令也可以称之为应用程序代码,本发明实施例对此不作具体限定。
在具体实现中,作为一种实施例,如图5所示,处理器可以包括一个或多个CPU,如图5中的CPU0和CPU1。
在具体实现中,作为一种实施例,如图5所示,终端设备可以包括多个处理器,如图5中的处理器。这些处理器中的每一个可以是一个单核处理器,也可以是一个多核处理器。
基于同样的思路,本说明书实施例还提供了上述实施例对应的计算机存储介质,计算机存储介质中存储有指令,当所述指令被运行时,实现实施例2中的数字声音重构方法。
上述主要从各个模块之间交互的角度对本发明实施例提供的方案进行了介绍。可以理解的是,各个模块为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件单元。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本发明能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本发明实施例可以根据上述方法示例进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本发明实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
本说明书中的处理器还可以具有存储器的功能。存储器用于存储执行本发明方案的计算机执行指令,并由处理器来控制执行。处理器用于执行存储器中存储的计算机执行指令,从而实现本发明实施例提供的方法。
存储器可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路与处理器相连接。存储器也可以和处理器集成在一起。
可选的,本发明实施例中的计算机执行指令也可以称之为应用程序代码,本发明实施例对此不作具体限定。
上述本发明实施例揭示的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(digital signal processing,DSP)、ASIC、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
一种可能的实现方式中,提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令被运行时,用于实现上述实施例中的逻辑运算控制方法和/或逻辑运算读取方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机程序或指令。在计算机上加载和执行所述计算机程序或指令时,全部或部分地执行本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、终端、用户设备或者其它可编程装置。所述计算机程序或指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机程序或指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是集成一个或多个可用介质的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,例如,软盘、硬盘、磁带;也可以是光介质,例如,数字视频光盘(digital video disc,DVD);还可以是半导体介质,例如,固态硬盘(solid state drive,SSD)。
尽管在此结合各实施例对本发明进行了描述,然而,在实施所要求保护的本发明过程中,本领域技术人员通过查看附图、公开内容、以及所附权利要求书,可理解并实现公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
尽管结合具体特征及其实施例对本发明进行了描述,显而易见的,在不脱离本发明的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本发明的示例性说明,且视为已覆盖本发明范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (10)

1.一种数字声音重构方法,其特征在于,包括:
接收第一数字音频数据;
对所述第一数字音频数据进行格式转换,得到通用格式的第二数字音频数据;
对所述第二数字音频数据执行Sigma-Delta调制以及抽取操作,得到多路量化音频数字流;
将所述多路量化音频数字流转换为驱动电信号;
采用所述驱动电信号驱动换能元件阵列,得到声音信号。
2.根据权利要求1所述的方法,其特征在于,所述对所述第二数字音频数据执行Sigma-Delta调制以及抽取操作,得到多路量化音频数字流,具体包括:
对所述第二数字音频数据进行过采样操作,得到第三数字音频数据;所述第三数字音频数据为经过过采样R倍的数字音频数据;其中,R≥0;
对所述第三数字音频数据进行噪波整形并进行量化,得到量化音频数字流;
对所述量化音频数字流按照预设抽取规则进行分组抽取,得到多路量化音频数字流。
3.根据权利要求2所述的方法,其特征在于,所述对所述量化音频数字流按照预设抽取规则进行分组抽取,得到多路量化音频数字流,具体包括:
将所述量化音频数字流按照扬声器数量进行分组,得到多路量化音频数字流。
4.根据权利要求1所述的方法,其特征在于,所述将所述多路量化音频数字流转换为驱动电信号,具体包括:
将所述多路量化音频数字流转换为对应周期的驱动脉冲,得到驱动电信号;所述驱动脉冲包括三角脉冲、矩形脉冲或梯形脉冲。
5.根据权利要求1所述的方法,其特征在于,所述Sigma-Delta调制的过程通过加法器、积分器以及比较器实现;其中,所述加法器用于将所述第二数字音频数据和反馈调制信号进行差分运算,得到差分结果;所述积分器用于将所述差分结果进行积分运算,得到积分结果;所述比较器用于对所述积分结果进行数字量化,得到多路量化音频数字流;所述数字量化的量化台阶包括单bit或多bit。
6.根据权利要求1所述的方法,用于所述Sigma-Delta调制的Sigma-Delta调制电路为一阶电路或者多阶电路。
7.一种数字声音重构系统,其特征在于,包括:
音频接收模块、数字音频解码转换模块、数字声音重构模块以及驱动模块;
所述音频接收模块用于接收第一数字音频数据,并将所述第一数字音频数据传输给所述数字音频解码转换模块;所述数字音频解码转换模块对所述第一数字音频数据进行格式转换,得到通用格式的第二数字音频数据,并将所述第二数字音频数据发送给所述数字声音重构模块;所述数字声音重构模块用于对所述第二数字音频数据执行Sigma-Delta调制以及抽取操作,得到多路量化音频数字流,并将所述多路量化音频数字流发送给所述驱动模块;所述驱动模块用于将所述多路量化音频数字流转换为驱动电信号;所述驱动电信号用于驱动换能元件阵列,得到声音信号。
8.根据权利要求7所述的系统,其特征在于,所述数字声音重构模块包括调制量化模块,所述调制量化模块用于对所述第二数字音频数据进行调制量化;
所述系统还包括:音量调节模块、声场定向技术模块以及降噪模块;所述音量调节模块用于对所述声音信号对应的音量进行调节;所述声场定向技术模块用于对所述声音信号进行声场定向;所述降噪模块用于对所述声音信号进行降噪。
9.一种数字声音重构设备,其特征在于,包括:
通信单元/通信接口,用于接收第一数字音频数据;
处理单元/处理器,用于对所述第一数字音频数据进行格式转换,得到通用格式的第二数字音频数据;
对所述第二数字音频数据执行Sigma-Delta调制以及抽取操作,得到多路量化音频数字流;
将所述多路量化音频数字流转换为驱动电信号;
采用所述驱动电信号驱动换能元件阵列,得到声音信号。
10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有指令,当所述指令被运行时,实现权利要求1~6任一项所述的数字声音重构方法。
CN202210121026.6A 2022-02-09 2022-02-09 一种数字声音重构方法、系统、设备及介质 Active CN114446311B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210121026.6A CN114446311B (zh) 2022-02-09 2022-02-09 一种数字声音重构方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210121026.6A CN114446311B (zh) 2022-02-09 2022-02-09 一种数字声音重构方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN114446311A true CN114446311A (zh) 2022-05-06
CN114446311B CN114446311B (zh) 2023-12-01

Family

ID=81371600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210121026.6A Active CN114446311B (zh) 2022-02-09 2022-02-09 一种数字声音重构方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN114446311B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5155743A (en) * 1990-11-27 1992-10-13 Nuance Designworks, Inc. Digital data converter
JP2006303618A (ja) * 2005-04-15 2006-11-02 Hosiden Corp スピーカ駆動システム
US20100085230A1 (en) * 2008-10-08 2010-04-08 Samsung Electronics Co., Ltd. Sigma delta modulator and sigma delta a/d converter using the same
CN103493507A (zh) * 2011-04-15 2014-01-01 歌乐株式会社 数字扬声器系统
CN103701465A (zh) * 2013-12-02 2014-04-02 苏州上声电子有限公司 一种基于多比特△—σ调制的数字扬声器系统实现方法和装置
CN111049481A (zh) * 2018-10-15 2020-04-21 半导体元件工业有限责任公司 具有多个σ-δ调制器以驱动输出负载的音频放大器
CN112994696A (zh) * 2021-04-15 2021-06-18 易兆微电子(杭州)股份有限公司 一种Sigma-Delta型ADC数字处理装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5155743A (en) * 1990-11-27 1992-10-13 Nuance Designworks, Inc. Digital data converter
JP2006303618A (ja) * 2005-04-15 2006-11-02 Hosiden Corp スピーカ駆動システム
US20100085230A1 (en) * 2008-10-08 2010-04-08 Samsung Electronics Co., Ltd. Sigma delta modulator and sigma delta a/d converter using the same
CN103493507A (zh) * 2011-04-15 2014-01-01 歌乐株式会社 数字扬声器系统
CN103701465A (zh) * 2013-12-02 2014-04-02 苏州上声电子有限公司 一种基于多比特△—σ调制的数字扬声器系统实现方法和装置
CN111049481A (zh) * 2018-10-15 2020-04-21 半导体元件工业有限责任公司 具有多个σ-δ调制器以驱动输出负载的音频放大器
CN112994696A (zh) * 2021-04-15 2021-06-18 易兆微电子(杭州)股份有限公司 一种Sigma-Delta型ADC数字处理装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王智韬;王升杨;胡淑花;雷凯;李挥;: "数字音频功放处理芯片设计与实现", 电声技术, no. 01, pages 42 - 44 *
马登永;蔡野锋;沐永生;杨军;周建明;柴国强;: "关于全数字式扬声器系统的讨论", 电声技术, no. 01, pages 24 - 29 *

Also Published As

Publication number Publication date
CN114446311B (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
EP1690437B1 (en) Microphone comprising integral multi-level quantizer and single-bit conversion means
JP5721155B2 (ja) データ変換装置
CA2935487C (en) Implementation method and device of multi-bit .delta.-.sigma. modulation-based digital speaker system
US10165359B2 (en) Microphone assembly with pulse density modulated signal
EP3161964B1 (en) Systems and methods for compressing a digital signal
US20140301571A1 (en) Systems and methods for generating a digital output signal in a digital microphone system
CN101924973A (zh) 信号处理设备和信号处理方法
KR20040111385A (ko) 디지털 마이크로폰
CN101803202A (zh) 基于超采样数字处理的低延迟信号处理
KR102514329B1 (ko) 보간을 이용하는 디지털 실리콘 마이크로폰
JP2013543715A (ja) オールデジタルスピーカー装置
CN113179474A (zh) 使用内部时钟改变的可配置麦克风
CN114598969A (zh) 一种数字扬声器音量控制方法、装置、设备及介质
KR20220066220A (ko) Sdm 인코더 및 관련 신호 처리 시스템
CN113179473A (zh) 使用内部时钟改变的可配置麦克风
CN114446311B (zh) 一种数字声音重构方法、系统、设备及介质
Kulka Advances in digitization of microphones and loudspeakers
US10200053B2 (en) Magnitude compensation technique for processing single-bit wide data
CN114745632A (zh) 一种数字发声的音量控制方法、装置、设备及介质
JP6551716B2 (ja) マイクロフォン用の電子回路およびマイクロフォン
JPH11234785A (ja) パネル型スピーカ装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant