CN1552171A - 音频再现设备 - Google Patents
音频再现设备 Download PDFInfo
- Publication number
- CN1552171A CN1552171A CNA028174291A CN02817429A CN1552171A CN 1552171 A CN1552171 A CN 1552171A CN A028174291 A CNA028174291 A CN A028174291A CN 02817429 A CN02817429 A CN 02817429A CN 1552171 A CN1552171 A CN 1552171A
- Authority
- CN
- China
- Prior art keywords
- signal
- channel
- voice
- audio
- audio reproducing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012546 transfer Methods 0.000 claims abstract description 14
- 230000004044 response Effects 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 7
- 230000005236 sound signal Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 claims description 7
- 239000004576 sand Substances 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 abstract description 9
- 238000013459 approach Methods 0.000 description 3
- 229920006395 saturated elastomer Polymers 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
一种音频再现设备,该设备具有用于接收n声道输入信号的输入端、用于把l声道输出信号提供到l个扬声器的输出端以及用于处理输入信号的音频处理单元。该音频处理单元包括用于增强n声道输入信号的m声道信号部分的增强装置,其中m≤n,增强装置具有对于所述m声道信号部分的每个声道信号部分的一个非线性反对称单调转移函数。所述音频再现设备被提供了一个语音-音乐鉴别器,该鉴别器响应于为语音指定的所述m声道信号部分的声道信号部分中的一个来产生一个控制信号,该控制信号指示声道信号部分的所述一个包括语音信号的概率p。利用所述控制信号来控制增强装置。
Description
本发明涉及一种音频再现设备,该设备具有一个用于接收n声道输入信号的输入端、用于把l声道输出信号提供到l个扬声器的输出端以及用于处理输入信号的音频处理单元,该音频处理单元包括用于增强n声道输入信号的m声道信号部分的增强装置,其中m≤n,增强装置具有对于所述m声道信号部分的每个声道信号部分的一个非线性反对称单调转移函数。
从先前提交的没有预先公开的专利申请PHNL000696EPP中可以获知这种音频再现设备。这种已知的音频再现设备被用于增强多声道声音的再现。特别地,由一个非线性设备来处理中央和环绕声道,以便增强语音可理解性和加强精细的环绕效果。
不过,通常希望只提高多声道再现的语音可理解性。在这种情况下,可能不需要处理环绕效果。一个非常简单的解决方案是把上述增强仅应用到中央声道,通常用于语音而不是环绕声道。这具有的缺点是中央声道中的非语音信号仍然被处理。
本发明的目的是消除这个缺点。因此,根据本发明,在开始的段落中描述的音频再现设备的特征在于该音频再现设备被提供了语音-音乐鉴别器,该语音-音乐鉴别器响应于指定给语音的所述m声道信号部分中的声道信号部分中的一个部分来提供一个控制信号,该控制信号指示所述声道信号部分中的所述一个部分包括语音信号的概率p,所述控制信号控制增强装置。
语音-音乐鉴别器本身是已知的并且在J.Audio Eng.Soc.第47卷第9期(1999年9月)的第720-725页中Ronald M.Aarts和RobertToonen Dekker的A Real-time Speech-Music Discriminator(实时语音-音乐鉴别器)中进行了描述。在该文档中描述的设备响应于单声道音频信号来提供一个具有在0和1之间的值p的信号,该信号指示音频输入信号包括语音的概率。根据本发明,例如所述文档中描述的类型的语音-音乐鉴别器与PHNL000696EPP中描述的类型的声音增强设备进行组合。在不影响环绕声音或者不增强声道信号部分的所述一个部分中除了语音之外的声音的情况下实现语音增强的程度,也就是其被确定了概率值p的声道,是根据概率p的值来进行的。
在一个更实际的实施例中,音频再现设备的特征在于n声道输入信号包括特别指定给语音的中央声道信号部分以及环绕声道信号部分,并且语音-音乐鉴别器响应于所述中央声道信号部分来提供所述控制信号,而所述控制信号控制增强装置来增强中央声道信号部分和环绕声道信号部分。特别地,音频再现设备的特征在于输入信号包括中央声道信号部分C、左和右声道信号部分L和R以及左和右环绕声道信号部分Ls和Rs,语音-音乐鉴别器响应于中央声道信号部分C来提供控制信号,并且增强装置被提供只用于中央声道信号部分C和环绕声道信号部分Ls和Rs,所述增强装置由所述控制信号来控制。
在专利申请PHNL000696EPP中,给出了对于m声道信号部分中的每一个的增强装置的转移函数;该转移函数不适用于控制相关声音信号的增强。根据本发明,转移函数依赖于概率p。其例子在进一步的描述中给出。
本发明不仅仅涉及音频再现设备,而且还涉及对经受语音增强的n声道音频信号的m声道部分进行处理的方法。该方法的特征在于响应于所述m声道信号部分的声道信号部分中的一个来产生一个控制信号,该控制信号指示声道信号部分中的所述一个包括语音信号的概率,并且借助于所述控制信号来控制增强m声道音频信号部分的过程。
本发明还涉及一种计算机程序,用于如所述方法所述地来处理经受语音增强的n声道音频信号的m声道部分,该计算机程序能够运行在具有说明书中描述的音频再现设备的音频再现装备中的信号处理装置上。与其相关地,本发明还涉及具有这种计算机程序的任何信息载体。
本发明还涉及一种音频再现设备,包括如上所述的音频再现设备,产生或接收音频信号的装置,所述音频信号被提供到音频再现设备和连接到所述音频再现设备的扬声器。
通过参考如下所述的例子和附图来阐明本发明并且使得本发明更加清楚,附图1示意地说明了根据本发明的音频再现设备。
图1所示的框图示出了音频再现设备1,该设备具有五个分立的输入声道:左(L)、右(R)、中央(C)、左环绕(Ls)和右环绕(Rs)。由相应带撇的符号给出输出信号。应当指出,例如使用2到5解码器可以从少于五个声道中产生出五个输入声道。而且,例如使用5到2转换装置可以减少五个输出信号。音频再现设备1包括语音-音乐鉴别器2和增强装置3。
音乐-鉴别器2是在上面提到的J.Audio Eng.Soc中的Ronald M.Aarts和Robert Toonen Dekker的文章中描述的类型,并且响应于一个输入信号而经由中央声道(C)来提供一个输出信号,该输出信号指示这个输入信号可以被看作是语音的概率p。p的值可以在0和1之间;输入信号是语音的概率越高,p就越接近于1。如果这个输入信号是语音的可能性小,则p就接近于零。语音-音乐鉴别器2的输出信号形成用于增强装置的控制信号。
在本实施例中,在中央声道和环绕声道中引入了增强装置。以相同的方式来处理所有三个声道。不过,根据再现设置的需求,可以改变实现方式,以便由语音-音乐鉴别器控制的增强装置只被引入到中央声道,或者由语音-音乐鉴别器控制的增强装置被引入到中央声道中,而固定的增强装置被引入到环绕声道中。
增强装置是专利申请PHNL000696EPP中描述的类型;不过,在本实施例中,转移函数依赖于概率p。在中央和环绕声道中的增强装置的输入x与输出y之间的关系的一个特定例子是:y(x,p)=(1-p)x+pctgh(ax/c)。
对于p=0,所述关系简化为y=x;这意味着如果对于中央声道的输入信号具有是语音的可能性小,则增强装置没有影响。对于p=1,所述关系简化为y=c tgh(ax/c)。如果x比较小y=ax;则在增强装置中,增益a被应用到输入信号(通常a=2)。如果x比较大,则输出信号y饱和到c。对于p的中间值,获得这两个区域之间的平滑转换。对于p的所有值,在线性区域中:y=[1+(a-1)p]x。输入信号语音的概率越高,则转移函数中的增益就越高。这意味着中央声道中的语音将被增强,但是环绕声道中的音乐和噪声有些受到消极影响。在非线性区域中,其中y饱和,在中央声道中的语音增强是多余的,而环绕声道中的可能声音失真是可接受的。
在中央和环绕声道中的增强装置的输入x和输出y之间的关系的另一个例子是:y(x,p)=c tgh[(1+ap)x/c]。对于小的x值,所述关系简化成为y=(1+ap)x。在a=1的情况下,对于小信号的增益与第一次提及的a=2情况下的转移函数中的相同。对于比较大的信号,y再次饱和到c(c≠0)。清楚的是,其它转移函数也是可能的。
由于语音-音乐鉴别器的性质,p的值是随时间变化的。尽管由于p的变化会反映在相关的音频信号的变化的增强中,而可能预期这将导致讨厌的声音,但是实际上这种讨厌没有出现。整体效果是语音被增强,从而给出了更高的可理解性。非语音声音没有被处理。
此外,应当指出,即使语音-音乐鉴别器做出了关于控制信号的错误判断,也就是尽管输入音频信号已经被认为是语音但是p却接近于零,反之亦然,这并不会导致讨厌的假象(artefact)。只获得了不同于最佳的中央和环绕声道的输出幅度。
可以利用一个算法来实现上述实施例,该算法的至少一部分的形式可以是能够运行在音频再现设备中的信号处理装置上的计算机程序。附图的一部分示出了执行某些可编程功能的单元,这些单元可以被认为是计算机程序的子部分。
本发明并不限于上述实施例。修改是可能的。所以,可以使用其它语音-音乐鉴别器,例如给出关于输入信号的“硬”判断的鉴别器:或者是语音(p=1)或者是音乐/非语音(p=0),而没有在中间的概率。这将导致语音增强开/关之间的硬切换。在这种情况下可以通过对语音-音乐鉴别器的输出信号进行低通滤波来获得改进。而且,具有如上所述的功能行为的其它转移函数也是可能的。
Claims (10)
1.一种音频再现设备,该设备具有用于接收n声道输入信号的输入端、用于把l声道输出信号提供到l个扬声器的输出端以及用于处理输入信号的音频处理单元,该音频处理单元包括用于增强n声道输入信号的m声道信号部分的增强装置,其中m≤n,增强装置具有用于所述m声道信号部分的每个声道信号部分的一个非线性反对称单调转移函数,其特征在于所述音频再现设备装备有语音-音乐鉴别器,该鉴别器响应于为语音指定的所述m声道信号部分的声道信号部分中的一个来提供一个控制信号,该控制信号指示声道信号部分中的所述一个包括语音信号的概率p,所述控制信号控制增强装置。
2.根据权利要求1所述的音频再现设备,其特征在于n声道输入信号包括特别为语音指定的中央声道信号部分和环绕声道信号部分,语音-音乐鉴别器响应于所述中央声道信号部分来提供所述控制信号,而所述控制信号控制增强装置来增强中央声道信号部分和环绕声道信号部分。
3.根据权利要求1或2所述的音频再现设备,其特征在于输入信号包括中央声道信号部分C、左和右声道信号部分L和R以及左和右环绕声道信号部分Ls和Rs,语音-音乐鉴别器响应于中央声道信号部分C来提供控制信号,并且增强装置被提供只用于中央声道信号部分C和环绕声道信号部分Ls和Rs,所述增强装置由所述控制信号来控制。
4.根据上述任何一个权利要求所述的音频再现设备,其特征在于用于m声道信号部分的每个的增强装置的转移函数依赖于概率p。
5.根据权利要求4所述的音频再现设备,其特征在于增强装置的转移函数是:
y(x,p)=(1-p)x+pc tgh(ax/c),其中a和c是调整过的常数。
6.根据权利要求4所述的音频再现设备,其特征在于增强装置的转移函数是:
y(x,p)=c tgh[(1+ap)x/c],其中a和c是调整过的常数。
7.一种处理经受语音增强的n声道音频信号的m声道部分的方法,其特征在于响应于所述m声道信号部分的声道信号部分中的一个来产生一个控制信号,该控制信号表示声道信号部分中的所述一个包括语音信号的概率,并且借助于所述控制信号来控制增强m声道音频信号部分的过程。
8.一种用于按照权利要求8所述的方法来处理经受语音增强的n声道音频信号的m声道部分的计算机程序,该计算机程序能够运行在具有按照权利要求1-7中的任何一个所述的音频再现设备的音频再现装备中的信号处理装置上。
9.具有根据权利要求8所述的计算机程序的信息载体。
10.一种音频再现装备,包括如权利要求1-6中的任何一个所述的音频再现设备,用于产生或接收音频信号的装置,所述音频信号被提供给音频再现设备和连接到所述音频再现设备的扬声器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01203363 | 2001-09-06 | ||
EP01203363.5 | 2001-09-06 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1552171A true CN1552171A (zh) | 2004-12-01 |
Family
ID=8180894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA028174291A Pending CN1552171A (zh) | 2001-09-06 | 2002-08-27 | 音频再现设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6914988B2 (zh) |
EP (1) | EP1430749A2 (zh) |
JP (1) | JP2005502247A (zh) |
KR (1) | KR20040034705A (zh) |
CN (1) | CN1552171A (zh) |
WO (1) | WO2003022003A2 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102137326A (zh) * | 2008-04-18 | 2011-07-27 | 杜比实验室特许公司 | 用于保持多通道音频中的语音可听度的方法和设备 |
CN106664499A (zh) * | 2014-08-13 | 2017-05-10 | 华为技术有限公司 | 音频信号处理装置 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2829293B1 (fr) | 2001-08-31 | 2003-11-14 | Centre Nat Rech Scient | Memoire moleculaire et son procede de fabrication |
JP4480335B2 (ja) * | 2003-03-03 | 2010-06-16 | パイオニア株式会社 | 複数チャンネル音声信号の処理回路、処理プログラム及び再生装置 |
DE102004049347A1 (de) | 2004-10-08 | 2006-04-20 | Micronas Gmbh | Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale |
US7974422B1 (en) | 2005-08-25 | 2011-07-05 | Tp Lab, Inc. | System and method of adjusting the sound of multiple audio objects directed toward an audio output device |
JP5530720B2 (ja) * | 2007-02-26 | 2014-06-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体 |
ATE514163T1 (de) | 2007-09-12 | 2011-07-15 | Dolby Lab Licensing Corp | Spracherweiterung |
ES2528006T3 (es) * | 2008-07-31 | 2015-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Generación de señales para señales binaurales |
AU2015207815B2 (en) * | 2008-07-31 | 2016-10-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Signal generation for binaural signals |
US8712771B2 (en) * | 2009-07-02 | 2014-04-29 | Alon Konchitsky | Automated difference recognition between speaking sounds and music |
TWI459828B (zh) * | 2010-03-08 | 2014-11-01 | Dolby Lab Licensing Corp | 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統 |
JP4837123B1 (ja) * | 2010-07-28 | 2011-12-14 | 株式会社東芝 | 音質制御装置及び音質制御方法 |
JP2011205687A (ja) * | 2011-06-09 | 2011-10-13 | Pioneer Electronic Corp | 音声調整装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2009092A (en) * | 1929-12-16 | 1935-07-23 | Universal Oil Prod Co | Heating apparatus |
US4589129A (en) * | 1984-02-21 | 1986-05-13 | Kintek, Inc. | Signal decoding system |
US5216718A (en) * | 1990-04-26 | 1993-06-01 | Sanyo Electric Co., Ltd. | Method and apparatus for processing audio signals |
EP0517233B1 (en) * | 1991-06-06 | 1996-10-30 | Matsushita Electric Industrial Co., Ltd. | Music/voice discriminating apparatus |
US5493617A (en) * | 1991-10-09 | 1996-02-20 | Waller, Jr.; James K. | Frequency bandwidth dependent exponential release for dynamic filter |
BE1007355A3 (nl) * | 1993-07-26 | 1995-05-23 | Philips Electronics Nv | Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling. |
KR20020076312A (ko) | 2000-12-18 | 2002-10-09 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 재생 디바이스 |
-
2002
- 2002-08-27 JP JP2003525553A patent/JP2005502247A/ja not_active Withdrawn
- 2002-08-27 KR KR10-2004-7003370A patent/KR20040034705A/ko not_active Application Discontinuation
- 2002-08-27 EP EP02760489A patent/EP1430749A2/en not_active Withdrawn
- 2002-08-27 CN CNA028174291A patent/CN1552171A/zh active Pending
- 2002-08-27 WO PCT/IB2002/003541 patent/WO2003022003A2/en not_active Application Discontinuation
- 2002-09-04 US US10/234,805 patent/US6914988B2/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102137326A (zh) * | 2008-04-18 | 2011-07-27 | 杜比实验室特许公司 | 用于保持多通道音频中的语音可听度的方法和设备 |
CN102007535B (zh) * | 2008-04-18 | 2013-01-16 | 杜比实验室特许公司 | 对环绕体验具有最小影响的用于保持多通道音频中的语音可听度的方法和设备 |
CN102137326B (zh) * | 2008-04-18 | 2014-03-26 | 杜比实验室特许公司 | 用于保持多通道音频中的语音可听度的方法和设备 |
CN106664499A (zh) * | 2014-08-13 | 2017-05-10 | 华为技术有限公司 | 音频信号处理装置 |
US9961474B2 (en) | 2014-08-13 | 2018-05-01 | Huawei Technologies Co., Ltd. | Audio signal processing apparatus |
CN106664499B (zh) * | 2014-08-13 | 2019-04-23 | 华为技术有限公司 | 音频信号处理装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2003022003A3 (en) | 2003-10-23 |
KR20040034705A (ko) | 2004-04-28 |
US6914988B2 (en) | 2005-07-05 |
EP1430749A2 (en) | 2004-06-23 |
JP2005502247A (ja) | 2005-01-20 |
US20030044032A1 (en) | 2003-03-06 |
WO2003022003A2 (en) | 2003-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1075653C (zh) | 盘驱动系统的音频信号解码装置及方法 | |
CN1941073B (zh) | 用于消除音频信号中的人声分量的设备和方法 | |
CN1992513B (zh) | 效果增加方法和效果增加装置 | |
CN100381016C (zh) | 信号处理装置、信号处理方法 | |
EP1915026B1 (en) | Audio reproducing apparatus and corresponding method | |
CN1630434A (zh) | 再现虚拟声音的设备和方法 | |
CN1552171A (zh) | 音频再现设备 | |
CN1877988A (zh) | 声音质量调节装置 | |
CN101577848B (zh) | 一种重低音增强方法及系统 | |
CN102077609B (zh) | 声学处理装置 | |
EP2194733B1 (en) | Sound volume correcting device, sound volume correcting method, sound volume correcting program, and electronic apparatus. | |
CN103262409A (zh) | 用于改进的感觉的频谱不平衡的音频信号的动态补偿 | |
CN102461207A (zh) | 声音重放装置、声音重放方法和程序 | |
CN101421779A (zh) | 用于产生环境信号的设备和方法 | |
JP2003516555A (ja) | ステレオ音響信号の処理方法と装置 | |
CN1136760C (zh) | 多声道音频信号中误差掩蔽的方法和装置 | |
RU2437247C1 (ru) | Способ и устройство для обработки звукового сигнала | |
CN1929698A (zh) | 声音再现设备和增强低频分量的方法 | |
CN1672191A (zh) | 改进音乐内容再现的方法和设备 | |
CN201243266Y (zh) | 一种基于dsp的声频系统频响特性均衡处理装置 | |
JPH06289898A (ja) | 音声信号処理装置 | |
CA2192511A1 (en) | Apparatus for enhancing stereo effect with central sound image maintenance circuit | |
KR100641454B1 (ko) | 오디오 시스템의 크로스토크 제거 장치 | |
JPH11113097A (ja) | オーディオ装置 | |
KR20040091110A (ko) | 사용자 제어 다중-채널 오디오 변환 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |