CN102165699A - 使用变换域对数压缩扩展来进行信号处理的方法和装置 - Google Patents
使用变换域对数压缩扩展来进行信号处理的方法和装置 Download PDFInfo
- Publication number
- CN102165699A CN102165699A CN2009801377943A CN200980137794A CN102165699A CN 102165699 A CN102165699 A CN 102165699A CN 2009801377943 A CN2009801377943 A CN 2009801377943A CN 200980137794 A CN200980137794 A CN 200980137794A CN 102165699 A CN102165699 A CN 102165699A
- Authority
- CN
- China
- Prior art keywords
- signal
- data
- compression
- conversion
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012545 processing Methods 0.000 title abstract description 5
- 230000006835 compression Effects 0.000 claims abstract description 116
- 238000007906 compression Methods 0.000 claims abstract description 116
- 230000005236 sound signal Effects 0.000 claims abstract description 28
- 230000003595 spectral effect Effects 0.000 claims abstract description 22
- 238000006243 chemical reaction Methods 0.000 claims description 73
- 238000000354 decomposition reaction Methods 0.000 claims description 14
- 230000007480 spreading Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 24
- 238000004891 communication Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 12
- 238000003860 storage Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000000712 assembly Effects 0.000 description 5
- 238000000429 assembly Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 239000011469 building brick Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 108010022579 ATP dependent 26S protease Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000009172 bursting Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/50—Conversion to or from non-linear codes, e.g. companding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Nonlinear Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
Abstract
一种用于通过对音频信号的谱域或时域表示应用对数压缩扩展以提供编码的音频信号来进行音频信号处理的方法和装置,所述编码的音频信号在接收到时被解码。音频信号的频域表示或时域表示是通过将音频信号分成特定频带来计算的,每个频带具有系数。对每个系数使用不同的压缩比执行对数压缩扩展以提供编码的信号。接收到编码的信号后,执行逆对数压缩扩展和时域或时间标度重建以提供音频信号。
Description
本专利申请要求2008年9月26日提交的、标题为“Transform-Domain Log Companding”的临时申请No.61/100,645(律师签号No.082855P1)以及2008年9月29日提交的、标题为“Transform-Domain Log Companding”的临时申请No.61/101,070(律师签号No.082855P2)的优先权。每个前述申请已转让给本申请的受让人,并由此通过引用被明确地并入本文。
技术领域
本公开一般地涉及通信,更具体而言,涉及使用谱域(spectral domain)对数压缩扩展(compand)的信号压缩。
背景技术
通过数字技术进行的音频(例如话音和音乐)传输变得普遍,特别是在长距离电话、分组交换电话(例如互联网协议语音(VoIP))以及数字无线电电话(例如蜂窝电话)中。音频传输的激增产生了对于减少用在传输信道上传输话音通信使用的信息量同时维持对重建语音的感知质量的兴趣。例如,最佳地利用可用无线系统带宽是合乎需要的。有效地使用系统带宽的一种方法是使用信号压缩技术。对于传送语音(speech)信号的无线系统而言,语音压缩(或“语音编码”)技术通常用于此目的。本文所述的技术适用于其它信号,例如用于健康护理和保健应用的生物医学信号。
配置为通过提取与人类语音生成的模型有关的参数来压缩语音的设备常常被称为“话音编码器”、“声码器”、“音频编码器”、“语音编码器”或“编解码器(codecs)”。编解码器通常包括编码器和解码器。编码器一般将进入的语音信号(表示音频信息的数字信号)划分成称作“帧”的时间段,分析每个帧以提取某些相关参数,并将参数进行量化为编码的帧。经编码的帧通过传输信道(即,有线或无线网络连接)发送到包括解码器的接收机。解码器接收并处理编码帧,解量化这些帧以产生参数,并使用解量化的参数来重新产生语音帧。
传统的音频/语音压缩方法依赖于复杂的心理声学模型来实现显著的压缩,同时维持高水平的质量。传统音频压缩方法,例如MPEG-1音频层3(MP3)和高级音频编码(AAC)方案,一般基于依赖人类听觉系统的相关信息的心理声学模型。这些方案能够实现明显的压缩(例如,原始信号的大约1/10的比特率),同时维持的再生质量的水平接近于原始未压缩内容的质量水平。然而,虽然获得了这些大的压缩率,这些方法复杂,以消耗高功率的压缩/解压缩电路、相当多的等待时间为代价出现,且通常不是非常适合于低功率、低等待时间的应用/设备。随着现代设备中带宽的增加,以低复杂性编码/解码方案进行互换,对于重型压缩的要求可以得以降低。
具有免提操作的无线耳机(headset)在移动电话中变得日益常见。体域网(BAN)的背景下的短距离无线电技术的趋势在于:以较低功率损耗提供较高的数据率。BAN无线电的演进趋势涉及仅使用数毫瓦(mW)的功率消耗来实现数兆比特/秒的吞吐量的低功率无线电。在BAN的背景下,对于可佩带的设备,增加电池寿命、缩小形状因子并减少成本是合乎需要的。
在传统服务的背景下,随着3G网络中宽带编解码器(例如AMR-WB和EVRC-WB)的发展,存在提高话音质量并减少BAN中较低功率的需要。类似地,对于音频流服务,存在使用无线耳机保持电线质量的需要以便不损害用户体验。
因此,需要处理一个或多个上述缺点。
发明内容
下文提供了一个或多个方面的简单概要,以便提供对这样的方面的基本理解。该概要不是所有设想方面的详尽概述,且既不旨在标识所有方面的关键或重要元件,也不旨在描述任何或所有方面的范围。其唯一目的是以简化形式提供一个或多个方面的一些概念,作为以后提供的更详细描述的序言。
在本公开的一个方面中,公开了用于编码的方法。该方法包括接收数据信号,执行对数据信号的转换以提供至少两个系数,以及执行对所述至少两个系数的对数压缩扩展以提供经压缩的数据信号。
在本公开的另一方面中,公开了用于解码的方法。该方法包括接收经压缩的数据信号,通过对经压缩的数据信号的逆对数压缩扩展来执行扩展,以获取至少两个系数,以及对所述至少两个系数执行逆转换以提供数据信号。
在本公开的又一方面中,公开了用于编码的装置。该装置包括:接收机,用于接收数据信号;转换电路,用于分解(decompose)数据信号以提供至少两个系数;以及,对数压缩扩展电路,用于对所述至少两个系数进行编码以提供经压缩的数据信号。
在本公开的再一方面中,公开了用于解码的装置。该装置包括:接收机,用于接收压缩的数据信号;逆对数压缩扩展电路,用于对压缩的数据信号进行解码以获取至少两个系数;以及,逆转换电路,用于根据所述至少两个系数来重建数据信号。
在本公开的又一方面中,公开了用于编码的装置。该装置包括:用于接收数据信号的模块、用于对数据信号执行转换以提供至少两个系数的模块、以及用于对所述至少两个系数执行对数压缩扩展以提供压缩的数据信号的模块。
在本公开的再一方面中,公开了用于解码的装置。该装置包括:用于对压缩的数据信号进行接收的模块、用于通过对压缩的数据信号进行解码以执行逆对数压缩扩展来获取至少两个系数的模块、以及用于对所述至少两个系数执行逆转换以提供数据信号的模块。
在本公开的又一方面中,公开了用于编码的计算机程序产品。该计算机程序产品包括计算机可读介质,该计算机可读介质包括可执行用于进行以下操作的指令:接收数据信号、执行对数据信号的转换以提供至少两个系数、以及执行对所述至少两个系数的对数压缩扩展以提供压缩的数据信号。
在本公开的再一方面中,公开了用于解码的计算机程序产品。该计算机程序产品包括计算机可读介质,该计算机可读介质包括可执行用于进行以下操作的指令:接收压缩的数据信号、通过对压缩的数据信号进行解码来执行逆对数压缩扩展以获取至少两个系数、以及对所述至少两个系数执行逆转换以提供数据信号。
在本公开的又一方面中,公开了一种耳机。该耳机包括:接收机,用于接收压缩的数据信号;逆对数压缩扩展电路,用于对压缩的数据信号进行解码以获取至少两个系数;逆转换电路,用于根据所述至少两个系数来重建数据信号;以及,换能器(transducer),用于根据重建的数据信号来提供音频输出。
在本公开的再一方面中,公开了一种传感设备。该传感设备包括:传感器,用于检测数据信号;转换电路,用于分解数据信号以提供至少两个系数;对数压缩扩展电路,用于对所述至少两个系数进行编码以提供压缩的数据信号;以及,发射机,用于发射压缩的数据信号。
在本公开的再一方面中,公开了一种耳机。该耳机包括:换能器,用于检测音频信号;转换电路,用于分解音频信号以提供至少两个系数;对数压缩扩展电路,用于对所述至少两个系数进行编码以提供压缩的音频信号;以及,天线,用于发射压缩的数据信号。在本公开的又一方面中,公开了一种手表(watch)。该手表包括:接收机,用于接收压缩的数据信号;逆对数压缩扩展电路,用于对压缩的数据信号进行解码以获取至少两个系数;逆转换电路,用于从所述至少两个系数重建数据信号;以及,用户界面,用于根据重建的数据信号来提供指示。
为了实现前述和有关的目的,一个或多个方面包括在下文中充分描述并在权利要求中特别指出的特征。下文的描述和附图详细阐述了一个或多个方面的例证性特征。然而,这些特征只表示可使用各种方面的原理的各种方法中的几个,且该描述不旨在包括所有这样的方面及其等效形式。
附图说明
在下文中结合附图来描述所公开的方面,提供所述附图以进行说明而不是对公开的方面进行限制,其中相似的标号表示相似的元件,且其中:
图1是示出无线网络的实例的图示;
图2是示出根据本文公开的不同方面配置的信号压缩系统的结构图;
图3A-3C分别是根据本公开的不同方面的第一、第二和第六离散余弦变换(DCT)的系数的示例性概率分布的曲线;
图4A和4B是示出根据本公开的方面执行的编码/解码功能的流程图;
图5是示出根据本公开的方面用于促进无线网络中的语音/音频信号处理的系统的框图;
图6是示出根据本公开的方面用于促进改进的无线音频/语音解码的接收机的框图;
图7是示出根据本公开的方面用于促进语音/音频信号压缩的发射机的框图;
图8是示出根据本公开的方面配置的编码装置的框图;以及
图9是示出根据本公开的方面配置的解码装置的框图。
具体实施方式
下文参考附图更充分描述了不同的方面。然而,本文公开的方面可以以很多不同的形式来实现,且不应被解释为局限于本公开中提出的任何特定的结构或功能。更确切地,提供了这些方面使得本公开是全面和完整的,并将本公开的范围充分传达给本领域的技术人员。根据本文的教导,本领域技术人员应认识到,本公开的范围旨在涵盖本文公开的任何方面,无论该方面是独立地实现还是与任何其它方面结合地来实现的。例如,使用本文阐述的任何数量的方面可实现一种装置或可实践一种方法。此外,本公开的范围旨在涵盖使用附加于或不同于本文阐述的各个方面的其它结构、功能或结构和功能来实现的装置或方法。应了解,本文公开的任何方面可由权利要求的一个或多个元素来实现。
存在对新类别的高质量语音和音频解决方案的需要,与压缩效率相比,低功率对于这些解决方案至关重要。
在图1中示出了适合于支持本公开中提出的一个或多个方面的短距离通信网络的实例。将网络100示为具有使用任何适当的无线电技术或无线协议进行通信的各种无线节点。作为例子,无线节点可配置为支持超宽带(UWB)技术。可选地,无线节点可配置为支持各种无线协议,例如蓝牙或IEEE 802.11等等。
将网络100示出为具有与其它无线节点进行通信的计算机102。在该实例中,计算机102可从数码相机104接收数字照片,将文档发送到打印件106用于打印,同步个人数字助理(PDA)108上的电子邮件,将音乐文件传输到数字音频播放器(例如,MP3播放器)110,将数据和文件备份到移动存储设备112,并经由无线集线器114与远程网络(例如互联网)进行通信。网络100还可包括可佩带或移植到人体内的多个移动和紧凑节点。作为例子,人可佩带从计算机102接收流式音频的耳机(headset)116(例如头戴式耳机(headphone)、听筒等)、由计算机102设置的手表118、和/或监控极其重要的身体参数的传感器120(例如,生物测定传感器、心率监控器、计步器和EKG设备等)。
虽然示出为网络支持的短距离通信,本公开中提出的方面还可配置为支持广域网中的通信,该广域网支持任何适当的无线协议,例如,所述无线协议包括演进数据优化(EV-DO)、超移动宽带(UMB)、码分多址(CDMA)2000、长期演进(LTE)或宽带CDMA(W-CDMA)等等。可选地,无线节点可配置为使用电缆调制解调器、数字用户线(DSL)、光纤、以太网、HomeRF或任何其它适当的有线接入协议来支持有线通信。
在一些方面中,无线设备可经由基于脉冲的无线通信链路进行通信。例如,基于脉冲的无线通信链路可利用具有相对短的长度(例如,大约几纳秒或更少)和相对宽的带宽的超宽带脉冲。在一些方面中,超宽带脉冲可具有大约20%或更多的分数带宽(fractional bandwidth)和/或具有大约500MHz或更多的带宽。
本文的教导可以包含在各种装置(例如设备)中(例如,在装置内实现或由装置执行)。例如,本文教导的一个或多个方面可以包含在电话(例如蜂窝电话)、个人数字助理(“PDA”)、娱乐设备(例如,音乐或音频设备)、耳机(例如,头戴式耳机、听筒等)、麦克风、医疗传感设备(例如,生物测定传感器、心率监控器、计步器、EKG设备、智能绷带等)、用户I/O设备(例如,手表、远程控制器、照明开关(light switch)、键盘、鼠标等)、环境传感设备(例如,轮胎压力监控器)、可从医疗或环境传感设备接收数据的监视器、计算机、销售点设备、娱乐设备、助听器、机顶盒或任何其它适当的设备中。
这些设备具有不同的功率和数据要求。在一些方面中,本文的教导可适合用在低功率应用(例如,通过使用基于脉冲的信令方案和低占空模式)中,并可支持不同的数据率,包括相对高的数据率(例如,通过使用高带宽脉冲)。
以包括多个设备、组件、模块等的系统的形式来提出各种方面或特征。应理解和认识到,各种系统可包括额外的设备、组件、模块等,和/或可不包括结合附图讨论的所有设备、组件、模块等。还可使用这些方法的组合。本领域技术人员将清楚,本文描述的方面可扩展到目前使用变换域对数压缩扩展来实现信号压缩的任何其它装置、系统、方法、过程、设备或产品。
本文公开的方面利用人耳对频域中漏失(drop-out)的隐蔽(concealment)比对时域中漏失的隐蔽更不敏感的事实。因此,本文公开的方面可同样良好地适用于各种各样的信号,包括音频、超宽带语音、宽带语音和窄带语音等等。
本公开的方面对音频/语音压缩的信道误差解决方案提供低复杂性、低等待时间和健壮性并实现宽带语音和音频的透明质量,该音频/语音压缩利用谱域对数压缩扩展(压缩和扩展)。本文公开的方面可使用比传统解码器需要更少功率和面积的硬件友好操作(例如移位相加)来实现。
本文公开的方面通过对信号的谱域表示应用对数压缩扩展来进行信号压缩。本公开的方面通过首先计算信号的频域表示来合并这些概念。以允许应用某种心理声学掩蔽的方式来表达原始数据为目标,转换操作将数据从一个基础投射到另一个基础。一般地,这是借助于使用转换、通过将信号分成特定频带(在本文可互换地称为“仓(bin)”)来完成的,例如在MP3编码器的情况下。
计算音频/语音信号的谱域表示之后,本公开的方面以不同的压缩率对每个频谱系数执行对数压缩扩展。因为非常少的音频/语音能量存在于高频带中,在这些频带中分配非常少的比特可维持良好的质量。因此,所得的每样本平均比特数量可减少,并可根据音频/语音质量而可伸缩。此外,因为信号是在谱域中编码的,所以,如果存在猝发的信道错误,则它们影响时间-频率平面中的频带,而不是时间上的单一漏失。这些错误对人耳较少地令人不快,且受到简单的谱域内插时可被有效地隐蔽。
应认识到,除了时间-频率域以外,还可通过在时间-标度(time-scale)域中执行转换来实现本发明。这种时间-标度转换的实例是小波(wavelet)。
现在参考图2,其中示出根据本文公开的不同方面配置的信号压缩系统200。系统200包括编码器210和解码器220。编码器210包括时间-频率分解块212、多个压缩扩展器214和打包器216。解码器220包括解包器222、多个逆压缩扩展器224和逆转换块226。
根据一个方面,时间-频率分解块212使用离散余弦变换(DCT)算法将输入信号解相关为多个频带,每个频带具有频谱DCT系数。DCT算法将信号解相关为多个频带或仓。例如,可执行8点DCT转换,虽然点数是变化的。应注意,每个频谱系数的统计分布在本质上是拉普拉斯的(Laplacian),其对于较低的振幅系数相对于较高的振幅系数具有高得多的概率。还应注意,对于高谱DCT系数,系数的方差明显降低。在图3A-3C中分别示出第一、第二和第六DCT系数的示例性概率分布。如可从图3A-3C中的示例性分布看到,为较高DCT系数分配较少的比特。还应注意,虽然这些方面是参考DCT算法描述的,但将信号解相关成多个频带的任何转换可用于获得相似的结果。
根据本公开的一个方面,可将DCT的使用与将信号能量分类到均匀划分的频带进行比较。例如,对于以32/48kHz采样的数据,来自8点DCT的系数可粗略地在连续的2/3kHz频带处表示能量的数量达16/24kHz。根据心理声学建模已知,人听觉在高于16kHz的频率处变得较不敏感。
对数压缩扩展(例如μ-定律A-定律算法)是对具有拉普拉斯/指数分布的信号的有效压缩工具,并且,对于诸如语音信号的信号而言,尽管其具有宽动态范围,但具有类似拉普拉斯分布的分布,对数压缩扩展可以良好地起作用。在对数压缩扩展中,较粗略的量化用于较大的采样值,且逐渐更精细的量化用于较小的采样值。该特征已经成功用于电话压缩算法(例如G.711规范)中,所述电话压缩算法允许以低得多的比特率(例如,每个样本8个比特)智能地传输语音。对G.711对数压缩扩展(压缩和扩展)规范的描述请见:国际电信联盟(ITU-T)建议G.711(1988年11月)-Pulse code modulation(PCM)of voice frequencies,以及G.711.C:G.711ENCODING/DECODING FUNCTIONS,将这些规范的全部内容并入本文。
存在两种G.711对数压缩扩展方案:μ-定律压缩扩展方案和A-定律压缩扩展方案。μ-定律压缩扩展方案和A-定律压缩扩展方案都是脉冲编码调制(PCM)方法。也就是说,对模拟信号进行采样,且对每个采样信号的振幅进行量化,即,分配数字值。μ-定律和A-定律压缩扩展方案两者都通过对采样信号的对数曲线进行线性近似来量化采样信号。
μ-定律和A-定律压缩扩展方案两者都操作于对数曲线上。因此,将对数曲线分成数段,其中每个相继的段是前一段的长度的两倍。因为μ-定律和A-定律压缩扩展方案以不同方式来计算线性近似,所以μ-定律和A-定律压缩扩展方案具有不同的段长度。应注意,虽然使用G.711规范参考对数压缩扩展来描述了这些方面,但允许以低比特率智能地传输语音的任何对数压缩扩展规范都可用于实现类似的目的。
再次参考图2,根据一个方面,多个对数压缩扩展器214将针对-1和1之间的值进行操作的对数压缩扩展应用于DCT系数上,每个对数压缩扩展器214使用不同的压缩扩展参数,例如μ常数(μ1到μn)。对数压缩扩展有效地在0附近分配更多的量化步阶,而随着采样值增加而分配较少量化步阶。由于语音/音频信号在高频带中较尖锐(如从图3A-3C中所见),可将较少的比特分配到这些频带,同时维持良好的质量。例如,第一、第二和第三系数可分别缩减4倍、2倍和2倍,这确保了多个对数压缩扩展器214的正确数据范围。根据一个方面,以大于1的幅值对DCT系数值执行限幅(clipping)。
根据上文的变型,解码器220对执行用来压缩信号的压缩扩展和DCT转换操作进行反向操作。在由解包器222对接收信号进行解包之后,分别将前3个系数放大4倍、2倍和2倍,且在逆压缩扩展器224中执行逆对数压缩扩展。在逆转换块226中执行逆DCT转换以获得重建的时间-频率信号。
现在参考图4A和4B,其中示出根据本文公开的方面执行的功能的流程图。在图4A的编码过程400A中示出编码器中执行的功能的实例。步骤410中接收到数据信号之后,在步骤420中执行转换以实现信号的时间-频率分解。在步骤430中执行具有不同的压缩扩展参数(例如μ常数)的对数压缩扩展,且在步骤440中输出压缩的数据信号。
在图4B的解码过程400B中示出解码器中执行的功能的实例。步骤450中接收到经压缩的数据信号之后,在步骤460中执行逆对数压缩扩展。在步骤470中执行逆转换,且在步骤480中输出数据信号。
参考图5,其中示出的是根据不同方面在无线网络中促进语音/音频信号处理的系统500。
例如,系统500可以包括编码器510和解码器540。例如,编码器510可以至少部分地驻留在基站内。应认识到,将系统500示出为包括功能块,其可以是表示由处理器、软件或其组合(例如,固件)实现的功能的功能块。编码器包括可联合地操作的电子组件的逻辑组520、530。解码器540也包括可联合地操作的电子组件的逻辑组550、560。
例如,逻辑组520、530可包括:用于对接收到的语音/音频信号执行转换的模块520,其运行以执行将语音音频信号时间-频率分解为多个频带。进一步地,逻辑组520、530可包括:用于执行对数压缩扩展的模块530,其运行以通过对每个频带的每个频谱系数应用不同的压缩比来压缩信号。此外,逻辑组520、530可包括存储器(未示出),其保持用于执行与电子组件520、530相关的功能的指令。
进一步地,逻辑组550、560可包括:用于执行逆对数压缩扩展的模块550,其运行以通过应用逆压缩比来对信号解码,以及,用于逆转换的模块560,其用作时间-频率重建电路以使信号的时间-频率分解反转。
图6是促进改进的无线音频/语音解码的接收机600的图示。例如,接收机600从接收天线(未示出)接收信号,并对接收信号执行常规操作(例如,滤波、放大、下变频等),以及对经调节的信号进行数字化以获得采样。接收机602可包括解调器604,其可解调接收符号,并将其提供到处理器606用于信道估计。处理器606可以是专用于分析由接收机600接收的信息的处理器、控制接收机600的一个或多个组件的处理器、和/或分析由接收机600接收的信息并控制接收机600的一个或多个组件的处理器。
接收机600可附加地包括存储器608,其操作性地耦合到处理器606,并可储存待发送的数据、接收到的数据、关于可用信道的信息、与被分析信号和/或干扰强度相关的数据、关于所分配的信道、功率、速率等的信息、以及用于估计信道并经由信道传递的任何其它适当的信息。存储器608可附加地存储与估计和/或利用信道相关(例如,基于性能的、基于容量的,等等)的协议和/或算法。此外,存储器608可储存可执行代码和/或指令。例如,存储器608可储存用于解压缩接收到的语音/音频信号的指令。进一步地,存储器608可储存用于执行逆对数压缩扩展以通过应用逆编码率来对信号解码的指令和用于执行逆转换以反转信号的时间-频率分解的指令。
应认识到,本文描述的数据存储器(例如存储器608)可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。举例而言而非限制性地,非易失性存储器可包括:只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除PROM(EEPROM)或闪存。易失性存储器可包括:充当外部高速缓冲存储器的随机存取存储器(RAM)。举例而言而非限制性地,可利用以很多形式的RAM,诸如:同步RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)和直接Rambus RAM(DRRAM)。本主题系统和方法的存储器608旨在包括而不限于这些和任何其它适当类型的存储器。
处理器606还操作性地耦合到解码器610,其中,逆对数压缩扩展块612可执行逆对数压缩扩展,以通过应用逆编码率来对信号解码,以及,逆转换块618(例如,时间-频率重建电路)可执行逆转换以反转信号的时间-频率分解。逆对数压缩扩展块612和/或逆转换块618可包括上文参考图2-5描述的方面以获得时间-频率重建的信号。虽然将逆对数压缩扩展块612或逆转换块618描述为与处理器606分离,应认识到,逆对数压缩扩展块612或逆转换块618可以是处理器606或多个处理器(未示出)的部分。输出块620提供来自于处理器606的输出。
图7是示出根据本文公开的方面促进语音/音频信号压缩的示例性发射机系统700。系统700包括发射机724,其通过多个发射天线(未示出)来向一个或多个移动设备(未示出)进行发送。进入发射机的输入可由处理器714来分析,处理器714类似于上文结合图6描述的处理器并耦合到存储器716,存储器716存储与要发送到移动设备(未示出)或不同的基站(未示出)或从该移动设备或基站接收的数据有关的信息、和/或与执行本文阐述的各种操作和功能有关的任何其它适当的信息。
处理器714还耦合到编码器718,其中,转换块720可执行对接收的语音/音频信号的时间频率分解,以及对数压缩扩展块722,其可以执行对数压缩扩展以通过对每个频带的每个频谱系数应用不同的压缩比来对信号编码。转换块720和/或对数压缩扩展块722可包括上文参考图2-图5描述的方面。可以将待发送信息提供到调制器726。调制器726可复用信息,用于通过天线(未示出)由发射机724传输到移动设备(未示出)。虽然将转换块720和/或对数压缩扩展块722描述为与处理器714分离,应认识到,转换块720和/或对数压缩扩展块722可以是处理器714或多个处理器(未示出)的部分。
应注意,参考图6描述的接收机和参考图7描述的发射机系统可合并在单个设备(例如,移动设备)中,或可以是其它设备(例如,听筒或监控极其重要的身体功能的传感器)的分开的部分。
图8示出用于给无线通信设备的数据信号进行编码的编码装置800,该无线通信设备具有可操作来使用时间-频率分解和对数压缩扩展来编码数据的各种模块。数据信号接收机802用于接收数据信号。时间-频率分解器804配置为执行数据信号的时间-频率分解,以提供至少两个频谱系数。对数压缩扩展器806配置为执行所述至少两个频谱系数的对数压缩扩展以提供经压缩的数据信号。
图9示出用于给无线通信设备的数据信号进行解码的解码装置900,该无线通信设备具有可操作来使用逆对数压缩扩展和逆时间-频率分解来解码数据的各种模块。压缩信号接收机902用于接收压缩的信号。逆对数压缩扩展器904配置为通过给压缩的数据信号进行解码来执行逆对数压缩扩展,以获得至少两个频谱系数。时间-频率分解器906配置为对所述至少两个频谱系数执行逆时间-频率分解以提供数据信号。
本文描述的技术可用于各种无线通信系统,诸如:CDMA、TDMA、FDMA、OFDMA、SC-FDMA和其它系统。术语“系统”和“网络”常常可互换地使用。CDMA系统可实现诸如通用地面无线接入(UTRA)、CDMA2000等无线电技术。UTRA包括宽带CDMA(WCDMA)和CDMA的其它变形。进一步地,CDMA2000涵盖IS-2000、IS-95和IS-856标准。TDMA系统可实现诸如全球移动通信系统(GSM)的无线电技术。OFDMA系统可实现无线电技术,诸如:演进UTRA(E-UTRA)、超移动宽带(UMB)、IEEE 802.11(Wi-Fi)、IEEE 802.16(WiMAX)、IEEE 802.20、Flash-OFDM等。UTRA和E-UTRA是通用移动电信系统(UMTS)的部分。3GPP长期演进(LTM)是使用E-UTRA的UMTS的新版本,其在下行链路上使用OFDMA在上行链路使用SC-FDMA。在来自名为“第三代合作伙伴计划”(3GPP)的组织的文件中描述了UTRA、E-UTRA、UMTS、LTE、LTE-A和GSM。附加地,在来自名为“第三代合作伙伴计划2”(3GPP2)的组织的文件中描述了CDMA2000和UMB。进一步地,这种无线通信系统可另外包括端对端(例如,移动设备到移动设备)ad hoc网络系统,其常常使用不成对的免授权频谱、802.xx无线LAN、蓝牙和任何其它短距离或长距离无线通信技术。
在一个或多个方面中,所述功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现,则功能可作为计算机可读介质上的一个或多个指令或代码进行存储或传输。计算机可读介质包括计算机存储介质和通信介质,通信介质包括便于计算机程序从一个地方传送到另一地方的任何介质。存储介质可以是可由计算机访问的任何可用介质。作为例子且非限制地,此类计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储设备、或可用于携带或存储指令或数据结构形式的并可由计算机访问的期望程序代码模块的任何其它介质。此外,可以适当地将任何连接称为计算机可读介质。例如,如果使用同轴电缆、光纤电缆、双绞线、数据用户线(DSL)、或诸如红外、无线电和微波的无线技术从网站、服务器或其它远程源传输软件,则同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电和微波的无线技术包括在介质的定义中。本文使用的磁盘和盘片包括光盘(CD)、激光盘、光学盘、数字多用途盘(DVD)、软盘或蓝光盘,其中磁盘通常磁性地再现数据,而盘片使用激光光学地再现数据。上面各项的组合也应包括在计算机可读介质的范围内。
本文所述的组件可用各种方法实现。例如,装置可被表示为一系列相关的功能块,这些功能块可表示由例如一个或多个集成电路(例如ASIC)实现的功能,或可用本文教导的某种其它方式实现。本文讨论的集成电路可包括处理器、软件、其它组件或其组合。这种装置可包括执行上文结合各个附图描述的一个或多个功能的一个或多个模块。
如上所述,在一些方面中,这些组件可经由适当的处理器组件来实现。在一些方面中,可以至少部分地使用本文教导的结构来实现这些处理器组件。在一些方面中,处理器可适合于实现这些组件中的一个或多个组件的一部分或全部功能。
如上所述,装置可包括一个或多个集成电路。例如,在一些方面中,单个集成电路可实现一个或多个所示组件的功能,而在其它方面,多于一个的集成电路可实现一个或多个所示组件的功能。
此外,本文所述的组件和功能可使用任何适当的模块来实现。这种模块也可至少部分地使用本文教导的相应结构来实现。例如,上文所述的组件可在“ASIC”中实现,并且还可相应于类似指定的“用于...的模块”的功能。因此,在一些方面中,一个或多个这种模块可使用一个或多个处理器组件、集成电路或本文教导的其它适当的结构来实现。
此外,应理解,本文使用诸如“第一”、“第二”等参考符号对元素进行的任何参考通常不限制这些元素的数量或顺序。更确切地,本文中使用这些参考符号,作为区分开两个或多个元素或元素实例的方便的方法。因此,第一和第二元素的参考符号并不意味着仅使用两个元素,或第一元素必须以某种方式在第二元素之前。此外,除非另外说明,一组元素可包括一个或多个元素。此外,在说明书和权利要求中使用的“A、B或C中的至少一个”的形式的术语意指“A或B或C或其任何组合”。
本领域技术人员应理解,信息和信号可使用各种不同的技术和方法中的任何一个来表示。例如,可以由电压、电流、电磁波、磁场或粒子、光场或光粒子或其任何组合来表示上文描述中提及的数据、指令、命令、信息、信号、比特、符号和码片。
技术人员还将认识到,在本文中结合本公开描述的各种示例性逻辑块、模块、处理器、装置、电路和算法步骤可实现为电子硬件(例如,数字实现、模拟实现或两者的组合,其可使用源编码或某种其它技术来设计)、包括指令的各种形式的程序或设计代码(在本文中为了方便将其称为“软件”或“软件模块”)、或两者的组合。为了清楚地示出硬件和软件的这种可互换性,通常以其功能的形式对上文所述的各种示例性组件、块、模块、电路和步骤进行描述。将这些功能实现为硬件还是软件取决于在整个系统的特定应用和设计限制。本领域的技术人员可以针对每个特定应用,以变化的方式来实现所述功能,但此类实现决策不应解释为引起对本公开的范围的偏离。
结合本文公开的方面描述的各种例证性逻辑块、模块和电路可在集成电路(IC)、接入终端或接入点内实现或由集成电路(IC)、接入终端或接入点执行。IC可包括使用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程的逻辑设备、分立的门或晶体管逻辑、分立的硬件组件、电组件、光学组件、机械组件、或设计为执行本文所述功能的其任何组合来实现,并且可执行存在于IC内、IC外部或两者的代码或指令。通用处理器可以是微处理器,但可选地,处理器可以是现有处理器、控制器、微控制器或状态机。处理器还可以实现为计算设备的组合,例如DSP和微处理器、多个微处理器、一个或多个微处理器和DSP内核、或任何其它此类配置。
应理解,任何公开过程的步骤的任何特定顺序或层次是范例方法的实例。根据设计偏好,应理解,可重新布置过程中的步骤的任何特定顺序或层次,同时保持着本文所公开的方面的范围内。附随的方法权利要求示出了范例顺序的各种步骤的元素,且并不意味着局限于所示出的特定顺序或层次。
结合本文公开的方面而描述的方法或算法的步骤可直接实现在硬件中、处理器执行的软件中、或两者的组合中。软件模块(例如,包括可执行的指令和有关数据)和其它数据可存在于数据存储器中,所述数据存储器诸如:RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移除磁盘、CD-ROM、或本领域已知的任何其它形式的计算机可读存储介质。示例性存储介质可耦合到机器,例如计算机/处理器(其为了方便在本文中可称为“处理器”),这种处理器可从存储介质读取信息(例如代码)或将信息写到存储介质。示例性存储介质可以集成到处理器。处理器和存储介质可存在于ASIC中。ASIC可存在于用户设备中。可选地,处理器和存储介质可作为分立的组件存在于用户设备中。此外,在一些方面中,任何适当的计算机程序产品可包括计算机可读介质,计算机可读介质包括与本文公开的一个或多个方面有关的代码(例如,可由至少一个计算机执行)。在一些方面中,计算机程序产品可包括包装材料。
提供了前面的描述,以使本领域技术人员能够充分理解本公开的完全的范围。对本文公开的各种配置的更改对本领域技术人员来说是清楚的。因此,权利要求不旨在局限于本文描述的公开的各种方面,应给予与权利要求的语言相一致的完全范围,其中,除非另有明确说明,以单数形式对元件的引用不旨在意指“一个且只有一个”,而更确切地为“一个或多个”。此外,权利要求中使用的短语“a、b和c中的至少一个”应解释为针对a、b或c或其任何组合的权利要求。除非另有明确说明,术语“一些”或“至少一个”指一个或多个元件。通过引用将本领域普通技术已知或以后将知道的本公开中所述各方面的元件的所有结构性和功能性等效形式明确地并入本文,且旨在包括在权利要求中。此外,无论权利要求中是否显式地进行了引用,本文公开的任何内容都不旨在奉献于公共领域。除非使用短语“用于…的模块”明确地对权利要求中的元素进行引用,或者在方法权利要求的情况下使用短语“用于…的步骤”对元素进行引用,任何权利要求的元素都不应根据35U.S.C§112的第六段的规定进行理解。。
虽然前述公开讨论了示例性方面和/或多个方面,应注意,可在本文进行各种变化和更改,而不偏离所附权利要求所定义的所述方面和/或多个方面的范围。此外,虽然以单数形式对所述方面和/或多个方面的元素进行描述或要求权利,但除非明确陈述了将其限制为单数,旨在包括其复数形式。此外,除非另有说明,任何方面和/或多个方面的全部或部分可以与其它方面和/或多个方面的全部或部分一起使用。
Claims (54)
1.一种用于编码的方法,所述方法包括:
接收数据信号;
执行对所述数据信号的转换以提供至少两个系数;以及
执行对所述至少两个系数的对数压缩扩展以提供压缩的数据信号。
2.如权利要求1所述的方法,其中,所述转换是时间-频率分解和时间标度分解中的一个。
3.如权利要求1所述的方法,其中,所述转换是离散余弦变换(DCT)转换。
4.如权利要求1所述的方法,其中,所述转换是改进离散余弦变换(MDCT)转换。
5.如权利要求1所述的方法,其中,每个系数是频谱系数。
6.如权利要求1所述的方法,其中,所述对数压缩扩展包括使用至少两个压缩扩展参数对所述至少两个系数进行编码。
7.如权利要求6所述的方法,其中,所述至少两个压缩扩展参数具有相同的值。
8.如权利要求1所述的方法,其中,所述数据信号是音频信号、语音信号和生物医学信号中的一个。
9.一种用于解码的方法,所述方法包括:
接收压缩的数据信号;
通过对所述压缩的数据信号进行解码来执行逆对数压缩扩展以获得至少两个系数;以及
对所述至少两个系数执行逆转换以提供数据信号。
10.如权利要求9所述的方法,其中,所述逆转换是逆时间-频率分解和逆时间标度分解中的一个。
11.如权利要求9所述的方法,其中,所述逆转换是逆离散余弦变换(DCT)转换。
12.如权利要求9所述的方法,其中,所述逆转换是逆改进离散余弦变换(MDCT)转换。
13.如权利要求9所述的方法,其中,每个系数是频谱系数。
14.如权利要求9所述的方法,其中,所述逆对数压缩扩展是通过使用至少两个压缩扩展参数对所述压缩的数据信号进行解码来执行的。
15.如权利要求14所述的方法,其中,所述压缩扩展参数具有相同的值。
16.如权利要求9所述的方法,其中,所述数据信号是音频信号、语音信号和生物医学信号中的一个。
17.一种用于编码的装置,所述装置包括:
接收机,配置为接收数据信号;
转换电路,配置为分解所述数据信号以提供至少两个系数;以及
对数压缩扩展电路,配置为对所述至少两个系数进行编码以提供压缩的数据信号。
18.如权利要求17所述的装置,其中,所述转换是时间-频率分解和时间标度分解中的一个。
19.如权利要求17所述的装置,其中,所述转换是DCT转换。
20.如权利要求17所述的装置,其中,所述转换是改进DCT(MDCT)转换。
21.如权利要求17所述的装置,其中,每个系数是频谱系数。
22.如权利要求17所述的装置,其中,所述对数压缩扩展电路使用不同的压缩扩展参数对每个系数编码。
23.如权利要求22所述的装置,其中,所述不同的压缩扩展参数具有相同的值。
24.如权利要求17所述的装置,其中,所述数据信号是音频信号和语音信号中的一个。
25.一种用于解码的装置,所述装置包括:
接收机,配置为接收压缩的数据信号;
逆对数压缩扩展电路,配置为对所述压缩的数据信号进行解码以获得至少两个系数;以及
逆转换电路,配置为根据所述至少两个系数来重建数据信号。
26.如权利要求25所述的装置,其中,所述逆转换电路是逆时间-频率分解和逆时间标度分解中的一个。
27.如权利要求25所述的装置,其中,所述逆转换电路是逆DCT转换。
28.如权利要求25所述的装置,其中,所述逆转换电路是逆改进DCT(MDCT)转换。
29.如权利要求25所述的装置,其中,每个系数是频谱系数。
30.如权利要求25所述的装置,其中,所述逆对数压缩扩展电路使用至少两个压缩扩展参数对所述压缩的数据信号进行解码。
31.如权利要求30所述的装置,其中,所述压缩扩展参数具有相同的值。
32.如权利要求25所述的装置,其中,所述数据信号是音频信号和语音信号中的一个。
33.一种用于编码的装置,所述装置包括:
用于接收数据信号的模块;
用于执行对所述数据信号的转换以提供至少两个系数的模块;以及
用于执行对所述至少两个系数的对数压缩扩展以提供压缩的数据信号的模块。
34.如权利要求33所述的装置,其中,所述转换是时间-频率分解和时间标度分解中的一个。
35.如权利要求33所述的装置,其中,所述转换是DCT转换。
36.如权利要求33所述的装置,其中,所述转换是改进DCT(MDCT)转换。
37.如权利要求33所述的装置,其中,每个系数是频谱系数。
38.如权利要求33所述的装置,其中,所述对数压缩扩展是通过使用至少两个压缩扩展参数对每个系数进行编码来执行的。
39.如权利要求38所述的装置,其中,所述压缩扩展参数具有相同的值。
40.如权利要求33所述的装置,其中,所述数据信号是音频信号和语音信号中的一个。
41.一种用于解码的装置,所述装置包括:
用于接收压缩的数据信号的模块;
用于通过对所述压缩的数据信号进行解码来执行逆对数压缩扩展以获得至少两个系数的模块;以及
用于对所述至少两个系数执行逆转换以提供数据信号的模块。
42.如权利要求41所述的装置,其中,所述逆转换是逆时间-频率分解和逆时间标度分解中的一个。
43.如权利要求41所述的装置,其中,所述逆转换是逆DCT转换。
44.如权利要求41所述的装置,其中,所述逆转换是逆改进DCT(MDCT)转换。
45.如权利要求41所述的装置,其中,每个系数是频谱系数。
46.如权利要求41所述的装置,其中,所述逆对数压缩扩展是通过使用至少两个压缩扩展参数对所述压缩的数据信号进行解码来执行的。
47.如权利要求46所述的装置,其中,所述压缩扩展参数具有相同的值。
48.如权利要求41所述的装置,其中,所述数据信号是音频信号、语音信号和生物医学信号中的一个。
49.一种用于编码的计算机程序产品,包括:
编码有指令的计算机可读介质,所述指令可执行来:
接收数据信号;
执行对所述数据信号的转换以提供至少两个系数;以及
执行对所述至少两个系数的对数压缩扩展以提供压缩的数据信号。
50.一种用于解码的计算机程序产品,包括:
编码有指令的计算机可读介质,所述指令可执行来:
接收压缩的数据信号;
通过对所述压缩的数据信号进行解码来执行逆对数压缩扩展以获得至少两个系数;以及
对所述至少两个系数执行逆转换以提供数据信号。
51.一种耳机,包括:
接收机,配置为接收压缩的数据信号;
逆对数压缩扩展电路,配置为对所述压缩的数据信号进行解码以获得至少两个系数;
逆转换电路,配置为根据所述至少两个系数来重建数据信号;以及
传感器,配置为根据所重建的数据信号来提供音频输出。
52.一种传感设备,包括:
传感器,配置为检测数据信号;
转换电路,配置为分解所述数据信号以提供至少两个系数;
对数压缩扩展电路,配置为对所述至少两个系数进行编码以提供压缩的数据信号;以及
发射机,配置为发送所述压缩的数据信号。
53.一种耳机,包括:
传感器,配置为检测音频信号;
转换电路,配置为分解所述音频信号以提供至少两个系数;
对数压缩扩展电路,配置为对所述至少两个系数进行编码以提供压缩的音频信号;以及
天线,配置为发送所述压缩的音频信号。
54.一种手表,包括:
接收机,配置为接收压缩的数据信号;
逆对数压缩扩展电路,配置为对所述压缩的数据信号进行解码以获得至少两个系数;
逆转换电路,配置为根据所述至少两个系数来重建数据信号;以及
用户界面,配置为根据所重建的数据信号来提供指示。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10064508P | 2008-09-26 | 2008-09-26 | |
US61/100,645 | 2008-09-26 | ||
US10107008P | 2008-09-29 | 2008-09-29 | |
US61/101,070 | 2008-09-29 | ||
US12/428,336 US20100106269A1 (en) | 2008-09-26 | 2009-04-22 | Method and apparatus for signal processing using transform-domain log-companding |
US12/428,336 | 2009-04-22 | ||
PCT/US2009/058387 WO2010036897A1 (en) | 2008-09-26 | 2009-09-25 | Method and apparatus for signal processing using transform-domain log-companding |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102165699A true CN102165699A (zh) | 2011-08-24 |
Family
ID=41667444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009801377943A Pending CN102165699A (zh) | 2008-09-26 | 2009-09-25 | 使用变换域对数压缩扩展来进行信号处理的方法和装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20100106269A1 (zh) |
EP (1) | EP2345166A1 (zh) |
JP (2) | JP2012504373A (zh) |
KR (1) | KR101278880B1 (zh) |
CN (1) | CN102165699A (zh) |
TW (1) | TW201019315A (zh) |
WO (1) | WO2010036897A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103974268A (zh) * | 2013-01-29 | 2014-08-06 | 上海携昌电子科技有限公司 | 精细粒度可调的低延时传感器网络数据传输方法 |
CN108632697A (zh) * | 2017-03-22 | 2018-10-09 | 雅马哈株式会社 | 声学系统、头戴式耳机装置、扩音器装置和声学输出方法 |
CN110035299A (zh) * | 2019-04-18 | 2019-07-19 | 雷欧尼斯(北京)信息技术有限公司 | 沉浸式对象音频的压缩传输方法与架构 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2965687A1 (fr) * | 2010-09-30 | 2012-04-06 | France Telecom | Limitation de bruit pour une transmission dans un canal a voies multiples |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9177570B2 (en) * | 2011-04-15 | 2015-11-03 | St-Ericsson Sa | Time scaling of audio frames to adapt audio processing to communications network timing |
US9077183B2 (en) | 2011-09-06 | 2015-07-07 | Portland State University | Distributed low-power wireless monitoring |
US9642543B2 (en) | 2013-05-23 | 2017-05-09 | Arizona Board Of Regents | Systems and methods for model-based non-contact physiological data acquisition |
CN103532936A (zh) * | 2013-09-28 | 2014-01-22 | 福州瑞芯微电子有限公司 | 一种蓝牙音频自适应传输方法 |
US9626521B2 (en) | 2014-04-16 | 2017-04-18 | Arizona Board Of Regents On Behalf Of Arizona State University | Physiological signal-based encryption and EHR management |
EP3195507B1 (en) * | 2014-09-19 | 2021-01-20 | Telefonaktiebolaget LM Ericsson (publ) | Methods for compressing and decompressing iq data, and associated devices |
US10542961B2 (en) | 2015-06-15 | 2020-01-28 | The Research Foundation For The State University Of New York | System and method for infrasonic cardiac monitoring |
US10861475B2 (en) * | 2015-11-10 | 2020-12-08 | Dolby International Ab | Signal-dependent companding system and method to reduce quantization noise |
US10373630B2 (en) | 2017-03-31 | 2019-08-06 | Intel Corporation | Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
US6363338B1 (en) * | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
US6377916B1 (en) * | 1999-11-29 | 2002-04-23 | Digital Voice Systems, Inc. | Multiband harmonic transform coder |
US7206420B2 (en) * | 1999-11-29 | 2007-04-17 | Syfx Tekworks | Softclip method and apparatus |
US6681207B2 (en) * | 2001-01-12 | 2004-01-20 | Qualcomm Incorporated | System and method for lossy compression of voice recognition models |
US20030135374A1 (en) * | 2002-01-16 | 2003-07-17 | Hardwick John C. | Speech synthesizer |
US7225135B2 (en) * | 2002-04-05 | 2007-05-29 | Lectrosonics, Inc. | Signal-predictive audio transmission system |
US7043423B2 (en) * | 2002-07-16 | 2006-05-09 | Dolby Laboratories Licensing Corporation | Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding |
JP4296957B2 (ja) * | 2004-02-18 | 2009-07-15 | トヨタ自動車株式会社 | 車両用無段変速機の制御装置 |
US20070094035A1 (en) * | 2005-10-21 | 2007-04-26 | Nokia Corporation | Audio coding |
JP5236005B2 (ja) * | 2008-10-10 | 2013-07-17 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
-
2009
- 2009-04-22 US US12/428,336 patent/US20100106269A1/en not_active Abandoned
- 2009-09-25 EP EP09793011A patent/EP2345166A1/en not_active Withdrawn
- 2009-09-25 JP JP2011529264A patent/JP2012504373A/ja not_active Withdrawn
- 2009-09-25 KR KR1020117009533A patent/KR101278880B1/ko active IP Right Grant
- 2009-09-25 CN CN2009801377943A patent/CN102165699A/zh active Pending
- 2009-09-25 WO PCT/US2009/058387 patent/WO2010036897A1/en active Application Filing
- 2009-09-28 TW TW098132773A patent/TW201019315A/zh unknown
-
2012
- 2012-12-07 JP JP2012268459A patent/JP2013081229A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103974268A (zh) * | 2013-01-29 | 2014-08-06 | 上海携昌电子科技有限公司 | 精细粒度可调的低延时传感器网络数据传输方法 |
CN103974268B (zh) * | 2013-01-29 | 2017-09-29 | 上海携昌电子科技有限公司 | 精细粒度可调的低延时传感器网络数据传输方法 |
CN108632697A (zh) * | 2017-03-22 | 2018-10-09 | 雅马哈株式会社 | 声学系统、头戴式耳机装置、扩音器装置和声学输出方法 |
CN108632697B (zh) * | 2017-03-22 | 2021-08-10 | 雅马哈株式会社 | 声学系统、头戴式耳机装置、扩音器装置和声学输出方法 |
CN110035299A (zh) * | 2019-04-18 | 2019-07-19 | 雷欧尼斯(北京)信息技术有限公司 | 沉浸式对象音频的压缩传输方法与架构 |
Also Published As
Publication number | Publication date |
---|---|
WO2010036897A1 (en) | 2010-04-01 |
KR101278880B1 (ko) | 2013-06-26 |
TW201019315A (en) | 2010-05-16 |
US20100106269A1 (en) | 2010-04-29 |
EP2345166A1 (en) | 2011-07-20 |
KR20110074887A (ko) | 2011-07-04 |
JP2012504373A (ja) | 2012-02-16 |
JP2013081229A (ja) | 2013-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102165699A (zh) | 使用变换域对数压缩扩展来进行信号处理的方法和装置 | |
CN1942928B (zh) | 用于处理音频信号的模块和方法 | |
KR102217709B1 (ko) | 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템 | |
ZA200606713B (en) | Classification of audio signals | |
KR20030076646A (ko) | 음성 비활동 동안에 보이스 송신 시스템들 사이에상호운용성을 제공하는 방법 및 장치 | |
US8190440B2 (en) | Sub-band codec with native voice activity detection | |
KR20150123961A (ko) | 데이터를 프로세싱 및 재구성하기 위한 방법 및 장치 | |
CN109785847B (zh) | 基于动态残差网络的音频压缩算法 | |
WO2019233364A1 (zh) | 基于深度学习的音频音质增强 | |
CN103187065A (zh) | 音频数据的处理方法、装置和系统 | |
KR20190057052A (ko) | 잡음 환경에 적응적인 신호 처리방법 및 장치와 이를 채용하는 단말장치 | |
EP3614384B1 (en) | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals | |
JP2009512895A (ja) | スペクトル・ダイナミックスに基づく信号コーディング及びデコーディング | |
KR101389830B1 (ko) | 일정한 비트 레이트 애플리케이션들을 위한 최적의 비트 할당을 가지는 오디오 및 음성 프로세싱 | |
CN105957533B (zh) | 语音压缩方法、语音解压方法及音频编码器、音频解码器 | |
US11696075B2 (en) | Optimized audio forwarding | |
US8131216B2 (en) | Data format conversion for electronic devices | |
CN214336333U (zh) | 录音笔及录音系统 | |
CN103035249B (zh) | 一种基于时频平面上下文的音频算术编码方法 | |
Talbi et al. | New Speech Compression Technique based on Filter Bank Design and Psychoacoustic Model | |
Radha et al. | Comparative analysis of compression techniques for Tamil speech datasets | |
CN114863942A (zh) | 音质转换的模型训练方法、提升语音音质的方法及装置 | |
CN116631418A (zh) | 语音编码、解码方法、装置、计算机设备和存储介质 | |
Abdullah | Silence Encoding Technique for Compressing Digital Speech Signal | |
Saleh et al. | A comparative study of different compression laws of speech encoding and regeneration technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C05 | Deemed withdrawal (patent law before 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20110824 |