CN1666255A - 根据有优选次序的像素传输方法传输音频信号的方法 - Google Patents

根据有优选次序的像素传输方法传输音频信号的方法 Download PDF

Info

Publication number
CN1666255A
CN1666255A CN038160870A CN03816087A CN1666255A CN 1666255 A CN1666255 A CN 1666255A CN 038160870 A CN038160870 A CN 038160870A CN 03816087 A CN03816087 A CN 03816087A CN 1666255 A CN1666255 A CN 1666255A
Authority
CN
China
Prior art keywords
value
group
priority
matrix
sound signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN038160870A
Other languages
English (en)
Other versions
CN1323385C (zh
Inventor
格尔德·莫萨科夫斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telekom Deutschland GmbH
Original Assignee
T Mobile Deutschland GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by T Mobile Deutschland GmbH filed Critical T Mobile Deutschland GmbH
Publication of CN1666255A publication Critical patent/CN1666255A/zh
Application granted granted Critical
Publication of CN1323385C publication Critical patent/CN1323385C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Communication Control (AREA)
  • Stereophonic System (AREA)
  • Television Systems (AREA)
  • Transmitters (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

本发明涉及一种用于在一个发送方和至少一个接收方之间根据有优选次序的像素传输方法传输音频信号的方法。首先将音频信号拆分成n个频谱分量。将拆分后的音频信号存储在一个带有多个域的二维矩阵中,该矩阵以频率和时间作为维度,并且以振幅作为分别记入域中的值。然后由矩阵中每个单个的域和至少两个与这个域相邻的域构成组,为每个组分配一个优先权,其中组值的幅值越大,和/或一个组的值的幅值差别越大,和/或该组距离当前时间越近,则为该组选择的优先权越高。最后按照其优先权的顺序将组传输到接收方。

Description

根据有优选次序的像素传输方法传输音频信号的方法
如权利要求1的前序部分所述,本发明涉及一种用于根据有优选次序的像素传输方法传输音频信号的方法。
目前已有多种不同的用于压缩传输音频信号的方法。主要存在下述方法:
-降低采样率,例如用3kHz来代替44kHz,
-非线性传输采样值,例如在ISDN传输中,
-利用事先所存储的声音序列,例如MIDI或音调模拟,
-使用马尔可夫模型来校正传输错误。
已知方法的共同之处在于,在较低的采样率下仍然可以提供令人满意的语音理解度。这主要是通过形成均值来实现的。但是来自声源的不同音调在低音区产生了听起来很类似的音调,这使得例如在正常说话时可识别出的语调升降不再被传输。从而明显限制了通信质量。
用于借助于有优先次序的像素传输对图像或视频数据进行压缩和解压的方法在德国专利申请DE10113880.6(对应于PCT/DE02/00987)和DE10152612.1(对应于PCT/DE02/00995)中进行了描述。在这种方法中,例如由单个像点(像素)的矩阵组成的数字图像或视频数据被处理,其中每个像素具有一个随时间变化的像素值,这个像素值表示该像素的颜色信息或亮度信息。根据本发明,为每个像素或每个像素组分配一个优先权,对应于其优先权的像素被记录在一个优先权阵列中。这个阵列在每一时刻包含根据优先权排序的像素值。对应于优先权,这些像素以及为计算优先权所使用的像素值被传输或存储。当一个像素与其相邻的像素差别很大时,这个像素得到一个高优先权。为了进行重建,当前的像素值分别被显示在显示器上。还未传输的像素由已经传输的像素计算得到。这种方法在原理上也可以用于传输音频信号。
本发明的任务在于给出一种用于传输音频信号的方法,该方法在低传输带宽的情况也可以尽可能无损地工作。
根据本发明该任务通过权利要求1所述的特征来解决。
根据本发明,音频信号首先被拆分成n个频谱分量。拆分后的音频信号被存储在一个带有多个域的二维矩阵中,该矩阵以频率和时间作为维度,并且以振幅作为分别要记入各个域中的值。然后由矩阵中每个单个的域以及至少两个与这个域相邻的域构成组,并为每个组分配一个优先权,其中组值的幅值越大,和/或一个组中的值的幅值差别越大,和/或该组距离当前时间越近,则为该组选择的优先权越高。最好将组按照其优先权的顺序传输给接收方。
这种新的方法主要是基于香农(Shannon)定理。根据该定理,当人们用两倍的频率来采样时,信号可以无损耗地传输。这意味着,声波可以分成不同振幅和频率的正弦振荡。在此之后,可以通过传输各个频率分量,包括振幅和相位,唯一地、无损耗地重新生成声音信号。其中还特别利用了下述原理:经常所采用的声源,例如乐器、人的语调,是由谐振体构成的,其谐振频率不变或者仅很缓慢地改变。
本发明具有优点的实施例和改进由从属权利要求给出。
下面将说明本发明的一个实施例。其中还特别参考在先的专利申请DE10113880.6和DE10152612.1的说明书和附图。
首先记录声波,将其转换成电信号,并拆分为其频率分量。这可以通过FFT(快速傅立叶变换)或者通过n个选频滤波器来实现。如果采用n个滤波器,则每个滤波器只选取一个频率或一个很窄的频带(类似于人耳中的绒毛)。这样人们在每个时刻得到了频率和该频率下的幅值。其中数目n可以根据终端设备特性来选取不同的值。数目n越大,则音频信号就能够越好地重现。因此n是能够衡量音频传输质量的一个参数。
幅值被中间存储在一个二维矩阵的域中。其中该矩阵的第一个维度对应于时间轴,第二个维度对应于频率。这样每个采样值通过其各自的振幅和相位被唯一地确定,并且可以作为虚数存储到该矩阵相应的域中。语音信号从而在矩阵中用三个声音维度(参数)来表示:时间,例如以毫秒(ms)为单位,代表周期,作为矩阵的第一个维度;频率,以赫兹(Hz)为单位,代表音高,作为矩阵的第二个维度;信号能量(或强度),代表声强或密度,作为矩阵相应域中的计数值被存储。
与申请DE10113880.6和DE10152612.1相比较,例如频率对应于图像高度,时间对应于图像宽度,音频信号的振幅(强度)对应于颜色值。
与在图像/视频编码中对像素组分配优先次序的方法相类似,所述组由相邻的值构成,并对其分配优先权。每个域本身与至少一个、但最好是多个相邻的域共同构成了一个组。组是由通过时间和频率限定的位置值、在该位置值处的幅值、以及对应于事先已确定的形状的周围的值的幅值构成的(参见申请DE10113880.6和DE10152612.1的图2)。其中特别是距离当前时间很近的组,和/或其幅值相对于其他组非常高的组,和/或其中该组内的幅值相互差别很大的组,得到一个非常高的优先权。像素组的值降序排列,并且按照该顺序被存储或传输。矩阵的宽度(时间轴)最好只具有有限的大小(例如5秒),即始终只处理例如5秒时间长度内的信号段。在这段时间(例如5秒)之后,用后面的信号段的值来填充矩阵。
对应于上面所述的优先级参数(幅值,靠近时间的位置,以及与相邻值的幅值差别),在接收方接收各个组的值。
在接收方,组被再次记入到相应的矩阵中。对应于专利申请DE10113880.6和DE10152612.1,然后可以由所传输的组再次产生三维的频谱表示。接收到的组越多,则重建过程越精确。还未被传输的矩阵值借助于内插方法由已经传输的矩阵值计算得到。然后在接收方由如此产生的矩阵可以生成相应的音频信号,它可以转换为声音。为了对音频信号进行综合,例如可以使用n个频率发生器,其信号被加到一个输出信号上。通过这种并联设置n个频率发生器的结构,得到了非常好的可量化性(Skalierbarkeit)。因此通过并行处理能够大大降低采样率,从而用较少的能量消耗就能改善移动终端设备的再现时间。为了采用并行处理,例如可以使用FPGA或ASIC的简单构造形式。
所述方法并不局限在音频信号。该方法特别能够普遍地有效用在采用多种传感器(声音传感器、光传感器、触摸传感器等)测量连续信号的场合下,所测量的信号然后可以在一个(n阶)矩阵中表示。
相对于现有系统的优点在于,可以在提高压缩率的前提下灵活地应用。通过采用一个由不同源馈送的矩阵,人们自动得到了不同源的同步。在常规方法中相应的同步必须通过特殊的协议或措施来保证。特别是在需要很长传输时间的视频传输中,例如卫星连接,其中通过不同信道来传输语音和图像,嘴唇与语音的同步经常出现错误。这在某种程度上可以通过所述的方法来克服。
由于具有优先次序的像素组传输的相同原理可以用在语音、图像和视频传输中,可以在实际应用中利用强大的协同作用的效果。此外,以这种方式可以在语音和图像之间实现简单的同步。另外可以在图像和音频分辨率之间进行任意的调节。
当人们根据新的方法进行一次音频传输时,在语音方面得到了自然的再现,因为每个人的典型的频率分量(频率组)具有最高的优先权,因此被无损耗地传输。

Claims (7)

1.用于在一个发送方和至少一个接收方之间根据有优选次序的像素传输方法传输音频信号的方法,其特征在于下列步骤:
a)将音频信号拆分成n个频谱分量,
b)将拆分后的音频信号存储在一个带有多个域的二维矩阵中,该矩阵以频率和时间作为维度,并且以振幅作为分别记入域中的值,
c)由矩阵中每个单个的域和至少两个与这个域相邻的域构成组,
d)为每个组分配一个优先权,其中组值的幅值越大,和/或一个组的值的幅值差别越大,和/或该组距离当前时间越近,则为该组选择的优先权越高,并且
e)按照其优先权的顺序将组传输到接收方。
2.根据权利要求1所述的方法,其特征在于,整个音频信号被设置为音频文件,并作为一个整体被处理和传输。
3.根据权利要求1所述的方法,其特征在于,音频信号分别只有一个部分被处理和传输。
4.根据权利要求1至3中任一项所述的方法,其特征在于,音频信号借助于FFT被拆分为其频谱分量。
5.根据权利要求1至3中任一项所述的方法,其特征在于,音频信号通过n个选频滤波器被拆分为其频谱分量。
6.根据权利要求1至5中任一项所述的方法,其特征在于,在接收方,根据其优先权被传输的组对应于一个相应的矩阵,其中矩阵中还未被传输的值通过内插方法由已有的值计算得到。
7.根据权利要求1至6中任一项所述的方法,其特征在于,由接收方中已提供的值和计算出的值生成一个电信号,并将其转换为音频信号。
CNB038160870A 2002-07-08 2003-07-07 根据有优选次序的像素传输方法传输音频信号的方法 Expired - Fee Related CN1323385C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10230809A DE10230809B4 (de) 2002-07-08 2002-07-08 Verfahren zur Übertragung von Audiosignalen nach dem Verfahren der priorisierenden Pixelübertragung
DE10230809.8 2002-07-08

Publications (2)

Publication Number Publication Date
CN1666255A true CN1666255A (zh) 2005-09-07
CN1323385C CN1323385C (zh) 2007-06-27

Family

ID=29796219

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038160870A Expired - Fee Related CN1323385C (zh) 2002-07-08 2003-07-07 根据有优选次序的像素传输方法传输音频信号的方法

Country Status (16)

Country Link
US (1) US7603270B2 (zh)
EP (1) EP1579426B1 (zh)
JP (1) JP4637577B2 (zh)
CN (1) CN1323385C (zh)
AT (1) ATE454695T1 (zh)
AU (1) AU2003250775A1 (zh)
CY (1) CY1109952T1 (zh)
DE (2) DE10230809B4 (zh)
DK (1) DK1579426T3 (zh)
ES (1) ES2339237T3 (zh)
HK (1) HK1081714A1 (zh)
PL (1) PL207103B1 (zh)
PT (1) PT1579426E (zh)
RU (1) RU2322706C2 (zh)
SI (1) SI1579426T1 (zh)
WO (1) WO2004006224A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3469567B2 (ja) * 2001-09-03 2003-11-25 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法
DE102007017254B4 (de) * 2006-11-16 2009-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Kodieren und Dekodieren
EP3121814A1 (en) * 2015-07-24 2017-01-25 Sound object techology S.A. in organization A method and a system for decomposition of acoustic signal into sound objects, a sound object and its use

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2914974B2 (ja) * 1987-02-27 1999-07-05 株式会社日立製作所 可変レート音声信号伝送方法および伝送システム
US5253326A (en) * 1991-11-26 1993-10-12 Codex Corporation Prioritization method and device for speech frames coded by a linear predictive coder
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
US5517511A (en) * 1992-11-30 1996-05-14 Digital Voice Systems, Inc. Digital transmission of acoustic signals over a noisy communication channel
US5675705A (en) * 1993-09-27 1997-10-07 Singhal; Tara Chand Spectrogram-feature-based speech syllable and word recognition using syllabic language dictionary
JP2797959B2 (ja) * 1994-03-12 1998-09-17 日本ビクター株式会社 多次元画像圧縮伸張方法
JPH1083623A (ja) * 1996-09-10 1998-03-31 Sony Corp 信号記録方法、信号記録装置、記録媒体および信号処理方法
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
US6144937A (en) * 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
US6351730B2 (en) * 1998-03-30 2002-02-26 Lucent Technologies Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6584509B2 (en) * 1998-06-23 2003-06-24 Intel Corporation Recognizing audio and video streams over PPP links in the absence of an announcement protocol
JP3522137B2 (ja) * 1998-12-18 2004-04-26 富士通株式会社 可変レート符号化・復号装置
JP3797836B2 (ja) * 1999-12-09 2006-07-19 株式会社東芝 リモートメンテナンスシステム
DE10008055A1 (de) * 2000-02-22 2001-08-30 Infineon Technologies Ag Verfahren zur Kompression von Daten
JP3576936B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
JP3576935B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
JP2002135122A (ja) * 2000-10-19 2002-05-10 Nec Corp オーディオ信号符号化装置
US6952669B2 (en) * 2001-01-12 2005-10-04 Telecompression Technologies, Inc. Variable rate speech data compression
DE10113880B4 (de) * 2001-03-21 2004-04-29 T-Mobile Deutschland Gmbh Verfahren zur Komprimierung und Dekomprimierung von Videodaten
WO2002078322A1 (de) * 2001-03-21 2002-10-03 T-Mobile Deutschland Gmbh Verfahren zur komprimierung und dekomprimierung von bilddaten
DE10152612B4 (de) * 2001-03-21 2006-02-23 T-Mobile Deutschland Gmbh Verfahren zur Komprimierung und Dekomprimierung von Bilddaten
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US7079658B2 (en) * 2001-06-14 2006-07-18 Ati Technologies, Inc. System and method for localization of sounds in three-dimensional space
JP3463752B2 (ja) * 2001-07-25 2003-11-05 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法および音響復号化方法
US20030236674A1 (en) * 2002-06-19 2003-12-25 Henry Raymond C. Methods and systems for compression of stored audio
DE10229706A1 (de) * 2002-07-02 2004-12-09 T-Mobile Deutschland Gmbh Verfahren zur Speicherplatzverwaltung in einem Speichrmedium eines digitalen Endgeräts bei einer Datenspeicherung nach dem Verfahren der priorisierten Pixelübertragung
DE10229976B4 (de) * 2002-07-03 2007-06-28 T-Mobile Deutschland Gmbh Verfahren zur Ver- und Entschlüsselung von nach dem Verfahren der priorisierten Pixelübertragung übertragenen oder gespeicherten digitalen Daten
US7359979B2 (en) * 2002-09-30 2008-04-15 Avaya Technology Corp. Packet prioritization and associated bandwidth and buffer management techniques for audio over IP

Also Published As

Publication number Publication date
WO2004006224A1 (de) 2004-01-15
CY1109952T1 (el) 2014-09-10
DE50312330D1 (de) 2010-02-25
PT1579426E (pt) 2010-04-08
ES2339237T3 (es) 2010-05-18
JP4637577B2 (ja) 2011-02-23
PL207103B1 (pl) 2010-11-30
RU2005102935A (ru) 2005-10-27
JP2005532580A (ja) 2005-10-27
HK1081714A1 (en) 2006-05-19
DE10230809B4 (de) 2008-09-11
US20060015346A1 (en) 2006-01-19
CN1323385C (zh) 2007-06-27
RU2322706C2 (ru) 2008-04-20
EP1579426A1 (de) 2005-09-28
AU2003250775A1 (en) 2004-01-23
US7603270B2 (en) 2009-10-13
SI1579426T1 (sl) 2010-05-31
EP1579426B1 (de) 2010-01-06
DK1579426T3 (da) 2010-05-17
DE10230809A1 (de) 2004-01-29
ATE454695T1 (de) 2010-01-15
PL374146A1 (en) 2005-10-03

Similar Documents

Publication Publication Date Title
KR102020334B1 (ko) 고조파 전위에 기초하여 개선된 서브밴드 블록
EP1974225B1 (en) Signal analyser
US20110010400A1 (en) Lidar point cloud compression
Mbu Nyamsi et al. On the extraction of some time dependent parameters of an acoustic signal by means of the analytic signal concept. Its application to animal sound study
US20110106547A1 (en) Audio signal compression device, audio signal compression method, audio signal demodulation device, and audio signal demodulation method
CN102811665B (zh) 超声波诊断装置及超声波图像显示方法
CN104064191B (zh) 混音方法及装置
US20030169940A1 (en) Method and apparatus for the compression and decompression of image files using a chaotic system
CN1323385C (zh) 根据有优选次序的像素传输方法传输音频信号的方法
JPH05268098A (ja) 反復性をもつサンプル化アナログ信号をコード化しデコードするための方法およびその装置
KR19990013247A (ko) 디지털 데이터의 부호화/복호화 방법 및 장치
CN108737812A (zh) 一种视频质量的测试方法及装置
Balasubramanian et al. Wavelet application in compression of a remote sensed image
JP2000122676A (ja) 音楽信号の波形符号化方式
Mermelstein Computer-generated spectrogram displays for on-line speech research
Michael et al. Signal Computing: Digital Signals in the Software Domain
KR0185838B1 (ko) 대역분할 벡터 양자화기
KR20150017134A (ko) 악기 소리 식별 시스템
Gammell et al. A PRE‐EMPHASIS TECHNIQUE TO BROADEN THE USABLE FREQUENCY RANGE IN SWEPT‐FREQUENCY SYSTEMS
JPH02117271A (ja) 画像情報圧縮方式
DE1280352T1 (de) Drahtloses Videogegensprechgerät für Aufnahme, Fernübertragung und Empfang von Bild- und Tonsignale
WO2014130585A1 (en) Waveform resynthesis
JPH03113993A (ja) 多チャンネルテレメータ

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1081714

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070627