CN102138341A - 声信号处理设备、其处理方法以及程序 - Google Patents

声信号处理设备、其处理方法以及程序 Download PDF

Info

Publication number
CN102138341A
CN102138341A CN2010800024665A CN201080002466A CN102138341A CN 102138341 A CN102138341 A CN 102138341A CN 2010800024665 A CN2010800024665 A CN 2010800024665A CN 201080002466 A CN201080002466 A CN 201080002466A CN 102138341 A CN102138341 A CN 102138341A
Authority
CN
China
Prior art keywords
spectrum
unit
band
frequency
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800024665A
Other languages
English (en)
Other versions
CN102138341B (zh
Inventor
锦织修一郎
铃木志朗
井上晃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN102138341A publication Critical patent/CN102138341A/zh
Application granted granted Critical
Publication of CN102138341B publication Critical patent/CN102138341B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V3/00Electric or magnetic prospecting or detecting; Measuring magnetic field characteristics of the earth, e.g. declination, deviation
    • G01V3/12Electric or magnetic prospecting or detecting; Measuring magnetic field characteristics of the earth, e.g. declination, deviation operating with electromagnetic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Abstract

提供了一种声信号处理设备、其处理方法以及程序,通过其可以对在多个声道的声信号生成的差别信号中出现的听觉噪声进行抑制。差别谱计算单元(320)计算来自频谱生成单元(311和312)的左声道和右声道的频谱的绝对差值作为差别谱。低水平带确定单元(330)从所有频带的差别谱当中,确定与低水平带对应的差别谱。替代谱生成单元(350)基于左声道的频谱,生成用于替代差别谱的替代谱。谱替代单元(360)将与低水平带对应的差别谱替代成与差别谱对应的替代谱。伴奏信号生成单元(370)通过将来自谱替代单元(360)的频谱转换成时域信号来生成伴奏信号。

Description

声信号处理设备、其处理方法以及程序
技术领域
本发明涉及一种声信号处理设备,并且更具体地,涉及一种对包括在声信号中的音频成分进行抑制的声信号处理设备、其中的处理方法以及用于使得计算机执行该方法的程序。
背景技术
迄今为止,已设计出大量立体声信号处理设备,其基于声乐位于中心的立体声信号,对包括在该立体声信号中的声乐的音频成分进行抑制。例如,已提出了一种声乐信号去除设备,其从左声道信号减去右声道信号,以去除包括在两个声道中的相同相位和相同水平的声乐信号(参见例如PTL1)。
引用列表
专利文献
PTL1:日本未审查专利申请公布第63-50198号(图1)
发明内容
技术问题
在上述的现有技术中,可以获得如下音乐信号:其中,已通过从左声道信号减去右声道信号去除了作为包括在立体声信号中的声乐信号的音频成分。然而,基于通过对通过编码所压缩的立体声信号进行解码而产生的压缩信号的音乐信号的生成可导致听觉噪声,其中,该音乐信号是左声道和右声道的压缩信号之间的差别信号。这是因为通过对立体声信号的编码处理而使得同一频带中的左声道和右声道的压缩信号的谱水平相等。
本发明是在考虑到这样情形的情况下做出的,并且本发明的目的是对在由多个声道的声信号生成的差别信号中导致的听觉噪声进行抑制。
问题的解决方案
做出本发明以便解决以上问题,并且其第一方面提供了一种声信号处理设备,其包括:差别谱计算单元,其计算在多个声道的声信号当中,包括音频成分的基本上相等的频率分布的两个声道的声信号的频谱之间的差作为差别谱;低水平带确定单元,其确定如下频带为低水平带:其中,在该频带中,在差别谱计算单元算出的差别谱的包络中,水平快速下降;替代谱生成单元,其基于两个声道的声信号的频谱中的至少一个,生成替代差别谱的替代谱;谱替代单元,其将与差别谱计算单元算出的差别谱内的低水平带对应的差别谱替代成替代谱;以及伴奏(accompaniment)信号生成单元,其通过将从谱替代单元输出的频谱转换成时域信号,生成伴奏信号,并且还提供了一种处理方法和一种用于使得计算机执行该方法的程序。这实现了如下效果:允许基于两个声道的声信号的频谱生成替代谱,并且允许与在差别谱的包络中水平快速下降的低水平带对应的差别谱被替代谱所替代。
此外,在第一方面中,替代谱生成单元可被配置成基于两个声道的声信号的至少一个频谱和用于调整替代谱的水平的预定水平调整系数,生成替代谱。这实现了如下效果:允许生成两个声道的声信号的至少一个频谱的水平与水平调整系数相乘的水平作为替代谱的水平。在该情况下,替代谱生成单元可被配置成基于音频带的水平调整系数和至少一个频谱的水平,生成替代谱,其中,该音频带的水平调整系数小于与除该音频带之外的带对应的水平调整系数。这实现了如下效果:允许音频带的替代谱的水平下降程度大于除该音频带之外的带的替代谱的水平下降程度。
此外,在第一方面中,还可设置有音频系数设置单元,其基于在两个声道的声信号的至少一个频谱中,与除音频带之外的带对应的频谱和与音频带对应的频谱的水平比,设置与音频带对应的音频系数,并且替代谱生成单元可被配置成基于至少一个频谱和音频系数设置单元设置的音频系数,生成替代谱。这实现了如下效果:允许使用与音频带对应的音频系数生成替代谱,其中,该音频系数是基于与除音频带之外的带对应的频谱的平均水平和与音频带对应的频谱的平均水平的水平比而设置的。在该情况下,音频系数设置单元可被配置成对于与除音频带之外的带对应的频谱的较高水平,将音频系数设置得较大,而对于与音频带对应的频谱的较高水平,将音频系数设置得较小。这实现了如下效果:允许音频系数设置单元对于与除音频带之外的带对应的频谱的较高水平,将音频系数设置得较大,而对于与音频带对应的频谱的较高水平,将音频系数设置得较小。
此外,在第一方面中,低水平带确定单元可被配置成基于用于指定在包络中水平快速下降的频带的低水平阈值和差别谱的每个水平,确定低水平带。这实现了如下效果:在差别谱的每个水平小于低水平阈值的情况下,允许低水平确定单元确定与小于低水平阈值的差别谱对应的频带为低水平带。在该情况下,低水平带确定单元可被配置成使用低水平阈值和差别谱的水平,确定低水平带,其中,该低水平阈值是基于两个声道的声信号的至少一个频谱的水平设置的。这实现了如下效果:允许低水平带确定单元基于两个声道的声信号的至少一个频谱的水平,设置低水平阈值。
本发明的有利效果
根据本发明,可以实现如下有益效果:其能够对在由多个声道的声信号生成的差别信号中导致的听觉噪声进行抑制。
附图说明
图1是示出根据本发明的第一实施例的音乐回放设备的示例配置的框图。
图2是示出现有的声信号编码设备的配置的框图。
图3包括示出关于通过归一化单元721和722划分的频谱示例的概念图。
图4是示出根据本发明的第一实施例的声信号解码处理单元200的示例配置的框图。
图5是示出根据本发明的第一实施例的音频成分去除单元300的示例配置的框图。
图6包括示出基于左声道和右声道的声信号之间的差别而生成的差别信号中的音频成分和伴奏成分的频率分布的示例的概念图。
图7包括关于由于声信号编码设备700中的量化单元731和732的量化而导致的低水平带的图。
图8包括关于由于声信号编码设备700中的共享带编码单元800的共享带编码处理而导致的低水平带的图。
图9包括示出基于通过根据本发明第一实施例的差别谱计算单元320算出的差别谱的子带B[i]的示例的概念图。
图10包括示出了如下示例的抽象图:其中,通过根据本发明的第一实施例的音频成分去除单元300将与低水平带对应的差别谱替代成替代谱。
图11是示出保存在根据本发明的第一实施例的水平调整系数保存单元340中的水平调整系数的频率特性341的示例的图。
图12是关于根据本发明的第一实施例的低水平带确定单元330执行的、用于确定与低水平带对应的差别谱的方法的示例的图。
图13是示出根据本发明的第一实施例的音频成分去除单元300执行的伴奏信号生成方法的示例处理过程的流程图。
图14是示出根据本发明的第一实施例的低水平带确定单元330执行的低水平带确定处理(步骤S930)的示例处理过程的流程图。
图15是示出根据本发明的第一实施例的谱替代单元360执行的谱替代处理(步骤S940)的示例处理过程的流程图。
图16是示出根据本发明的第二实施例的音频成分去除单元300的示例配置的图。
图17是示出关于根据本发明的第二实施例的音频系数设置单元651执行的音频系数设置方法的示例的图。
图18是示出根据本发明的第二实施例的音频成分去除单元300执行的谱替代处理(步骤S950)的示例处理过程的流程图。
图19是示出根据本发明的第三实施例的音频成分去除单元300的示例配置的框图。
具体实施方式
在下文中将描述用于执行本发明的模式(在下文中称作实施例)。将按以下顺序给出描述:
1.第一实施例(伴奏信号生成方法:基于左声道的频率分量生成替代谱的示例)
2.第二实施例(伴奏信号生成方法:基于左声道的频率分量设置用于调整替代谱的水平的音频系数的示例)
3.第三实施例(伴奏信号生成方法:基于右声道和左声道的频率分量生成替代谱的示例)
<1.第一实施例>
[音乐回放设备的示例配置]
图1是示出根据本发明的第一实施例的音乐回放设备的示例配置的框图。音乐回放设备100包括操作接收单元110、控制单元120、显示单元130、声数据存储单元140、声数据输入单元150、模拟转换单元160、放大器170以及扬声器180。注意,音乐回放设备100是权利要求中所述的声信号处理设备的示例。
操作接收单元110被配置成接收基于使用音乐回放设备100的用户的操作的各种设置。操作接收单元110接收例如用于再现存储在声数据存储单元140中的多条声数据当中的任意一条声数据的设置。此外,操作接收单元110接收卡拉OK功能的设置,用于当再现存储在声数据存储单元140中的声数据时,减少包括在声数据中的音频成分并且将所得到的数据作为伴奏信号从扬声器180输出。此外,操作接收单元110基于所接收的设置生成设置信号,并且将设置信号提供到控制单元120。
控制单元120被配置成基于从操作接收单元110提供的设置信号,控制显示单元130、声数据存储单元140、模拟转换单元160、声信号解码处理单元200以及音频成分去除单元300。控制单元120基于关于从操作接收单元110转送的设置信号,使得声数据存储单元140存储从声数据输入单元150输入的声数据。
控制单元120将声信号作为声数据存储在声数据存储单元140中,其中,该声信号是使用例如PCM(Pulse Code Modulation:脉冲编码调制)码生成的数字信号。此外,控制单元120将例如通过对声信号进行编码获得的编码声数据作为声数据存储在声数据存储单元140中。
此外,控制单元120基于关于来自操作接收单元110的再现的设置信号,将存储在声数据存储单元140中的声数据当中的任意一条编码声数据提供到声信号解码处理单元200。此外,控制单元120基于关于来自操作接收单元110的再现的设置信号,将从声数据输入单元150发送的编码声数据提供到声信号解码处理单元200。
此外,控制单元120将声信号解码处理单元200解码的声信号或从声数据存储单元140发送的声信号作为数字信号提供到模拟转换单元160。此外,控制单元120基于关于来自操作接收单元110的卡拉OK功能的设置信号,将从声数据存储单元140发送的声信号提供到音频成分去除单元300。此外,控制单元120基于关于来自操作接收单元110的卡拉OK功能的设置信号,将音频成分去除单元300从其去除了包括在声信号中的音频成分的伴奏信号提供到模拟转换单元160。
此外,控制单元120基于来自操作接收单元110的设置信号,使得显示单元130显示关于音乐回放设备100的各种信息。控制单元120使得显示单元130显示例如关于存储在声数据存储单元140中的声数据的信息。控制单元120使得显示单元130显示例如声数据的再现状态、卡拉OK功能等的设置状态等。
显示单元130被配置成显示从控制单元120发送的、关于音乐回放设备100的各种信息。显示单元130可以通过例如LCD(液晶显示器)来实现。
声数据存储单元140被配置成存储从控制单元120提供的声数据。声数据存储单元140存储从声数据输入单元150发送的编码声数据和声信号作为声数据。另外,声数据存储单元140存储从声信号解码处理单元200发送的声信号。此外,声数据存储单元140将存储的声数据输出到控制单元120。
声数据输入单元150被配置成将从外部装置输入的声数据提供到控制单元120。声数据输入单元150将例如从外部装置发送的编码声数据或声信号提供到控制单元120。
模拟转换单元160被配置成将作为从控制单元120提供的声信号的数字信号转换成模拟信号。模拟转换单元160基于作为声信号的数字信号,生成作为模拟信号的电信号。此外,模拟转换单元160将生成的电信号提供到放大器170。
放大器170被配置成对从模拟转换单元160提供的模拟信号的幅度进行放大。放大器170将放大后的模拟信号提供到扬声器180。扬声器180被配置成将从放大器170提供的模拟信号转换成声波并且输出该声波。
声信号解码处理单元200被配置成对从控制单元120发送的编码声数据进行解码。声信号解码处理单元200将解码后的编码声数据作为声信号经由信号线290提供到控制单元120或音频成分去除单元300。
音频成分去除单元300被配置成从包括在从声信号解码处理单元200或声数据存储单元140发送的声信号中的音频成分和伴奏成分中去除音频成分,以生成包括伴奏成分的伴奏信号。音频成分去除单元300将生成的伴奏信号经由控制单元120提供到模拟转换单元160。
以此方式,在设置了音频成分去除单元300的情况下,音乐回放设备100可以基于从声数据存储单元140或声数据输入单元150发送的声信号,生成抑制了包括在声信号中的音频成分的伴奏信号。这里,在下文中将参照附图描述声信号编码设备的示例,其生成从声数据存储单元140或声数据输入单元150提供的声数据。
[声信号编码设备的示例配置]
图2是示出现有的声信号编码设备的配置的框图。这里,作为示例,将描述使用强度方法执行编码处理的声信号编码设备700。声信号编码设备700被配置成对经由输入线701和702输入的双声道声信号进行编码,并且经由输出线759输出编码后的声信号作为编码声数据。
声信号编码设备700包括频谱生成单元711和712、归一化单元721和722、量化单元731和732、编码单元741和742、复用单元750以及共享带编码单元800。此外,共享带编码单元800包括共享带选择单元810、量化单元830以及编码单元840。
频谱生成单元711和712被配置成通过将针对右声道和左声道从输入线701和702输入的各个声道的声信号转换到频域来生成频谱。即,频谱生成单元711和712将作为各个声道的声信号的时域信号转换成频率分量。
具体地,频谱生成单元711和712以一定数量的样本为单位,提取作为在特定时间间隔处采样的离散时间信号的声信号,并且生成所提取的时域信号作为帧。然后,频谱生成单元711和712将所生成的帧转换到频域以生成频谱。
频谱生成单元711和712生成例如通过对各个声道的声信号执行快速傅立叶变换(FFT)而算出的傅立叶系数作为频谱。替选地,频谱生成单元711和712生成通过改良离散余弦变换(MDCT)算出的MDCT系数作为频谱。此外,频谱生成单元711和712将表示各个频率分量的所生成的频谱提供到归一化单元721和722。
归一化单元721和722被配置成基于从频谱生成单元711和712提供的各个频谱的水平,执行归一化。归一化单元721和722将从频谱生成单元711和712发送的频谱划分成预定频带。
此外,归一化单元721和722基于子带中的各个频谱的最大水平,以所获得的子带(比例因子带)为单位来生成归一化参考值(比例因子)。然后,归一化单元721和722基于子带的归一化参考值,对基于与子带对应的各个频谱的幅度水平的功率值进行归一化。即,归一化单元721和722以子带为单位,对作为各个频谱的水平的功率值进行归一化,从而生成各个子带的归一化分量。
此外,归一化单元721和722将作为归一化后的功率值的归一化值经由信号线726和728提供到量化单元731、量化单元732以及共享带选择单元810。另外,由于需要对编码后的声信号进行解码,因此归一化单元721和722将各个子带的归一化参考值经由信号线727和729提供到复用单元750。
量化单元731和732被配置成以子带为单位,对从归一化单元721和722提供的归一化值进行量化。量化单元731和732利用针对各个子带设置的量化步数对归一化后的功率值进行量化。量化单元731和732通过特定的量化步宽,将例如归一化后的功率值(0到1)转换成离散值。即,量化单元731和732以子带为单位对归一化值进行量化,以生成各个子带的量化分量。
此外,量化单元731和732将作为量化后功率值的量化值经由信号线736和738提供到编码单元741和742。另外,由于需要对编码后的声信号进行解码,因此量化单元731和732将各个子带的量化步数经由信号线737和739提供到复用单元750。
编码单元741和742被配置成以子带为单位,通过参考编码表对从量化单元731和732发送的量化值进行编码。编码单元741和742通过参考例如作为编码表的固定长度或可变长度的码簿,基于量化值执行到具有预定比特长度的码的转换。以此方式,基于所参考的编码表对量化值进行编码,从而允许对量化值的信息量进行压缩。
此外,编码单元741和742将编码后的量化值作为编码后数据经由信号线746和748提供到复用单元750。另外,由于需要对编码后的声信号进行解码,因此编码单元741和742经由信号线747和749,以子带为单位提供关于所参考的编码表的表识别信息。
共享带编码单元800被配置成当子带中的两个声道的归一化值之间的相关性较高时,执行用于仅对该子带中的一个声道的归一化值进行编码的共享带编码处理。共享带选择单元810选择在来自归一化单元721的左声道的归一化值和来自归一化单元722的右声道的归一化值之间具有较高相关性的子带作为共享带。
共享带选择单元810基于右声道和左声道的归一化值计算每个子带的相关水平,并且在算出的相关水平超过特定相关水平阈值的情况下,选择该子带中的一个声道的归一化值作为共享带。此外,共享带选择单元810将表示所选择的共享带的共享带信息经由信号线819提供到复用单元750。
此外,共享带选择单元810将所选择的共享带中的一个声道的归一化值经由信号线818提供到量化单元830。例如,共享带选择单元810将所选择的共享带中的左声道的归一化值提供到量化单元830。
量化单元830被配置成对从共享带选择单元810提供的归一化值进行量化。量化单元830的功能与量化单元731和732的功能类似,因此此处省略其详细描述。量化单元830将量化步数经由信号线839提供到复用单元750,并且还将量化值经由信号线838提供到编码单元840。
编码单元840被配置成对从量化单元830提供的量化值进行编码。编码单元840的功能与编码单元741和742的功能类似,因此此处省略其详细描述。编码单元840将表识别信息经由信号线849提供到复用单元750,并且还将编码后数据经由信号线848提供到复用单元750。
复用单元750被配置成将从归一化单元721和722、共享带选择单元810、量化单元731、732和830、以及编码单元741、742和840提供的数据复用成一个码串。复用单元750对两个声道的归一化参考值、量化步数、表识别信息和编码后数据、以及从共享带编码单元800发送的共享带信息、归一化参考值、量化步数、表识别信息和编码后数据进行复用。即,复用单元750通过时分对以上数据进行复用,以生成一个码串(比特流)。
此外,复用单元750例如基于从共享带选择单元810提供的共享带信息,从复用的对象排除与共享带信息对应的子带中的、从量化单元731和732以及编码单元741和742发送的数据。这允许对通过仅对两个声道的频谱当中的、具有较高相关性的子带中的一个声道的频谱进行编码而获得的编码后数据进行复用。
此外,复用单元750将生成的码串输出到输出线759作为编码后声数据。复用单元750将编码后声数据经由输出线759提供到例如图1中示出的声数据输入单元150。复用单元750还将编码后声数据经由输出线759提供到例如外部存储装置等。
以此方式,声信号编码设备700设置有共享带编码单元800,以仅对具有较高相关性的子带中的两个声道的编码后数据当中的、一个声道的编码后数据进行复用,从而减小编码后声数据的量。这里,在下文中将参照附图简要描述子带中的由归一化单元721和722划分的频谱。
[关于声信号的频率分量划分频带的示例]
图3包括示出了关于归一化单元721和722划分的频谱的示例的概念图。图3的部分(a)是示出左声道的归一化单元721根据预定带将声信号的频率分量的频谱所划分成的子带的概念图。图3的部分(b)是示出图3的部分(a)中示出的子带中的频谱的概念图。
在图3的部分(a)中,作为左声道声信号分量720,示出了频谱生成单元711生成的左声道频谱的包络725和九个子带B[0]至B[9]。这里,垂直轴表示左声道中的频率分量的功率Pl,而水平轴表示与频率对应的频谱号(索引)f。
子带B[0]至B[9]表示通过使用归一化单元721将频谱生成单元711生成的频谱划分成九段而获得的频带。子带B[0]至B[9]的水平(高度)表示基于子带中的频谱的最大水平而算出的归一化参考值(比例因子)。注意,这里,示出了如下示例:其通过将对低频区域中的频率分量的较高的人听觉灵敏度纳入考虑来设置子带,以使得低频区域中的子带变得较窄,而较宽的子带设置在较高的频率区域中。
在图3的部分(b)中,示出了包括在子带B[0]和B[1]中的第0至第四频谱的水平Pl(f)。这些频谱的水平Pl(f)表示基于编号f的频谱的幅度水平而算出的功率值。例如,水平Pl(f)是基于编号f的傅立叶系数的平方而算出的值。注意,这里,子带B的索引以[i]来表示。
以此方式,当声信号编码设备700对声信号进行编码时,通过将多个频谱f与每个子带B[i]相关联来执行编码。接下来,在下文中将参照附图描述声信号解码处理单元200的示例配置,其对声信号编码设备700生成的编码后声数据进行解码。
[声信号解码处理单元200的示例配置]
图4是示出根据本发明的第一实施例的声信号解码处理单元200的示例配置的框图。声信号解码处理单元200包括解码单元210、左声道去量化单元221、右声道去量化单元222、共享带去量化单元223、选择单元231和232、反向归一化单元241和242、以及声信号生成单元251和252。
解码单元210被配置成对作为从信号线129提供的码串的编码后声数据进行解码。解码单元210将编码后声数据分离成各个声道的归一化参考值、量化步数、表识别信息以及编码后数据。此外,解码单元210从分离后的编码后声数据中提取编码后数据和表识别信息,并且参考所提取的表识别信息指定的解码表,以将编码后数据解码成量化值。
此外,解码单元210将分离后的编码后声数据内的左声道和右声道的量化步数分别经由信号线214和215提供到左声道去量化单元221和右声道去量化单元222。另外,解码单元210将各个子带的右声道和左声道的量化值分别经由信号线211和212提供到左声道去量化单元221和右声道去量化单元222。
此外,解码单元210将分离后的编码后声数据内的共享带信息指定的共享带的量化值和相应量化步数经由信号线213提供到共享带去量化单元223。此外,解码单元210基于分离后的编码后声数据内的共享带信息,将用于选择来自共享带去量化单元223的输出的选择信号经由信号线216和217提供到选择单元231和232。即,解码单元210同时将来自共享带去量化单元223的与共享带对应的输出提供到两个声道的反向归一化单元241和242。
此外,解码单元210针对每个子带,将分离后的编码后声数据内的左声道和右声道的归一化参考值分别经由信号线218和219提供到反向归一化单元241和242。
左声道和右声道去量化单元221和222被配置成针对每个子带,基于量化步数对量化值进行去量化。左声道和右声道去量化单元221和222基于从信号线214和215发送的量化步数,针对来自信号线211和212的每个子带的量化值,生成各个声道的归一化值。
即,左声道去量化单元221基于从信号线214发送的量化步数,针对来自信号线211的左声道的量化值,生成左声道的归一化值。右声道去量化单元222基于从信号线215发送的量化步数,针对来自信号线212的右声道的量化值,生成右声道的归一化值。
此外,左声道和右声道去量化单元221和222将各个声道的所生成的归一化值分别经由选择单元231和232提供到反向归一化单元241和242。
共享带去量化单元223被配置成基于相应的量化步数,对共享带信息指定的共享带中的量化值进行去量化。共享带去量化单元223基于从信号线213提供的量化值和量化步数,生成共享带中的归一化值。共享带去量化单元223将所生成的归一化值分别经由选择单元231和232提供到反向归一化单元241和242。
选择单元231和232被配置成基于从解码单元210发送的选择信号,选择共享带中的归一化值或者除共享带之外的子带中的归一化值,并且将所选择的归一化值提供到反向归一化单元241和242。例如,在与共享带对应的归一化值是从共享带去量化单元223提供的情况下,选择单元231和232基于从解码单元210发送的选择信号,将与同一共享带对应的归一化值输出到反向归一化单元241和242两者。
另一方面,在归一化值是从左声道和右声道去量化单元221和222提供的情况下,选择单元231和232基于从解码单元210发送的选择信号,将各个声道的归一化值输出到反向归一化单元241和242。
反向归一化单元241和242被配置成针对每个子带,基于归一化参考值对归一化值进行反向归一化。反向归一化单元241和242使用来自信号线218和219的归一化参考值,针对来自选择单元231和232的每个子带的归一化值,生成各个声道的频谱。
即,左声道去量化单元221基于从选择单元231发送的归一化值和从信号线218发送的归一化参考值,生成左声道的频谱的功率值。此外,右声道去量化单元222基于从选择单元232发送的归一化值和从信号线219发送的归一化参考值,生成右声道的频谱的功率值。此外,反向归一化单元241和242将各个声道的所生成的频谱分别提供到声信号生成单元251和252。
声信号生成单元251和252被配置成基于从反向归一化单元241和242提供的各个声道的频谱,生成各个声道的声信号。即,声信号生成单元251和252将作为频域数据的频谱转换成作为时域信号的声信号。声信号生成单元251和252通过例如对各个声道的频谱执行反向快速傅立叶变换(IFFT:反向FFT),逐帧地恢复时域信号。替选地,声信号生成单元251和252通过反向改良离散余弦变换(IMDCT:反向MDCT),逐帧地恢复时域信号。
此外,声信号生成单元251和252将各个声道的所生成的声信号分别提供到左声道和右声道信号线291和292。即,声信号生成单元251和252将右声道和左声道的声信号提供到音频成分去除单元300。注意,在本发明的实施例中,通过使用声信号生成单元251和252等对编码后声信号进行解码所生成的声信号被称为压缩信号。
以此方式,在设置了共享带去量化单元223及选择单元231和232的情况下,声信号解码处理单元200可以对声信号编码单元700所编码的编码后声数据进行解码。注意,对于在声信号解码处理单元200所解码的两个声道的声信号中的共享带当中的、两个声道的归一化参考值相等的共享带,该共享带中的频率分布是基本上相等的。
注意,这里,描述了对两个声道的声信号进行解码的声信号解码处理单元200的示例配置;然而,该描述不应被解释为限制意义,而是可对三个或更多个声道的声信号进行解码。接下来,将参照附图描述音频成分去除单元300的示例配置,其减少了包括在从声信号解码处理单元200或控制单元120提供的声信号中的音频成分。
[音频成分去除单元300的示例配置]
图5是示出根据本发明的第一实施例的音频成分去除单元300的示例配置的框图。音频成分去除单元300减少经由包括在信号线290中的左声道和右声道信号线291和292而从声信号解码处理单元200提供的各个声道的声信号中的音频成分,并且输出所得到的信号作为伴奏信号。
此外,这里,假设在两个或更多个声道的多个声信号当中,包括音频成分的基本上相等的频率分布的两个声道的声信号是从左声道和右声道信号线291和292提供的。
音频成分去除单元300包括频谱生成单元311和312、差别谱计算单元320、低水平带确定单元330、水平调整系数保存单元340以及替代谱生成单元350。另外,音频成分去除单元300包括谱替代单元360和伴奏信号生成单元370。
频谱生成单元311和312被配置成通过将从左声道和右声道信号线291和292发送的各个声道的声信号转换成频率分量来生成频谱。频谱生成单元311和312的功能与图2中示出的频谱生成单元711和712的功能类似,因此在此省略其详细描述。
频谱生成单元311将表示左声道的频率分量的各个所生成的频谱提供到差别谱计算单元320、低水平带确定单元330以及替代谱生成单元350。此外,频谱生成单元312将右声道的各个所生成的频谱提供到差别谱计算单元320。
差别谱计算单元320是计算单元,其计算来自频谱生成单元311和312的与同一频率对应的频谱的水平之间的绝对差值作为差别谱。即,差别谱计算单元320计算在多个声道的声信号当中,包括音频成分的基本上相等的频率分布的两个声道的声信号的频谱之间的差作为差别谱。以此方式,计算右声道的频谱和左声道的频谱之间的差,并且因此可以减少声信号中的音频成分。
差别谱计算单元320计算通过从作为左声道的频谱水平的功率值减去右声道的频谱的功率值而获得的相减值的绝对值作为差别谱的功率值。例如,差别谱计算单元320从左声道中的编号0的频谱的功率值减去右声道中的编号0的频谱的功率值,从而计算其之间的绝对差值作为编号0的差别谱。
此外,差别谱计算单元320将算出的差别谱提供到低水平带确定单元330和谱替代单元360。注意,差别谱计算单元320是权利要求中所述的差别谱计算单元的示例。
低水平带确定单元330被配置成确定如下频带为低水平带:其中,在该频带中,在差别谱计算单元320算出的差别谱的包络中,水平快速下降。低水平带确定单元330将每个差别谱的水平与用于指定在频谱的包络中水平快速的频带的低水平阈值进行比较。
例如,低水平带确定单元330将基于所有差别谱的幅度水平的功率值与预先设置的低水平阈值进行比较。作为另一示例,低水平带确定单元330基于与要比较的差别谱对应的左声道的频谱的水平,设置低水平阈值,并且将差别谱与设置的低水平阈值进行比较。在该示例中,低水平带确定单元330可使用左声道的频谱中的平均值、整体包络等。
此外,低水平带确定单元330针对每个差别谱,基于比较结果确定差别谱的水平是否低于低水平阈值。然后,低水平带确定单元330确定小于低水平阈值的差别谱为低水平带。即,例如,在低水平阈值和差别谱的水平之间的差超过特定条件的情况下,低水平带确定单元330确定该差别谱为低水平带。
此外,低水平带确定单元330生成每个差别谱的替代信息,以便将被确定为低水平带的差别谱替代成另一谱。例如,低水平带确定单元330在确定为低水平带的情况下生成表示为真(TRUE)的替代信息,并且在确定为非低水平带的情况下生成表示为假(FALSE)的替代信息。
此外,低水平带确定单元330将生成的替代信息提供到谱替代单元360。注意,低水平带确定单元330是权利要求中所述的低水平带确定单元的示例。
替代谱生成单元350被配置成基于与差别谱对应的左声道的频谱,生成替代谱,该替代谱用于在差别谱被确定为低水平带的情况下,将差别谱的分量替代成另一分量。即,替代谱生成单元350基于两个声道的至少一个频谱,生成替代差别谱的替代谱。
替代谱生成单元350基于例如左声道的频谱和保存在水平调整系数保存单元340中的预定水平调整系数,生成替代谱。替代谱生成单元350生成左声道的频谱值和与该频谱对应的水平调整系数的乘积作为替代谱的水平。
此外,替代谱生成单元350将生成的替代谱提供到谱替代单元360。注意,替代谱生成单元350是权利要求中所述的替代谱生成单元的示例。
水平调整系数保存单元340被配置成保存用于调整替代谱的水平的水平调整系数。水平调整系数保存单元340保存例如预先确定的水平调整系数。在该情况下,水平调整系数保存单元340保存例如如下水平调整系数:其中,与音频带对应的水平调整系数具有小于与除音频带之外的带对应的水平调整系数的值。即,替代谱生成单元350基于小于与除音频带之外的带对应的水平调整系数的、音频带的水平调整系数并且基于左声道的频谱,生成替代谱。此外,水平调整系数保存单元340将所保存的水平调整系数输出到替代谱生成单元350。
谱替代单元360被配置成在差别谱计算单元320算出的各个差别谱当中,将与低水平带对应的差别谱替代成替代谱。谱替代单元360基于来自低水平带确定单元330的替代信息,将从差别谱计算单元320发送的差别谱替代成从替代谱生成单元350发送的替代谱。
具体地,谱替代单元360将被确定为低水平带的差别谱的水平转换成与该差别谱对应的替代谱的水平。例如,在与编号1的差别谱对应的替代信息表示真(TRUE)的情况下,谱替代单元360将基于左声道中的编号1的频谱而生成的替代谱替代成编号1的新的差别谱。
此外,谱替代单元360将被确定为低水平带的差别谱的水平替代成与该差别谱对应的替代谱的水平,并且将所得到的谱输出到伴奏信号生成单元370。另一方面,谱替代单元360将被确定为不是低水平带的差别谱的水平按原样输出到伴奏信号生成单元370。注意,谱替代单元360是权利要求中所述的谱替代单元的示例。
伴奏信号生成单元370被配置成通过将从谱替代单元360输出的所有频带中的频谱转换成时域信号来生成伴奏信号。伴奏信号生成单元370将作为频谱的频域数据转换成作为时域信号的伴奏信号,其中,该频谱表示从谱替代单元360输出的频率分量。
伴奏信号生成单元370通过例如对频谱执行反向快速傅立叶变换,逐帧地恢复时域信号。作为另一示例,伴奏信号生成单元370通过反向改良离散余弦变换,逐帧地恢复时域信号。
此外,伴奏信号生成单元370将所生成的伴奏信号输出到信号线128。即,伴奏信号生成单元370将伴奏信号提供到控制单元120,并且将其作为伴奏声音从扬声器180输出。注意,伴奏信号生成单元370是权利要求中所述的伴奏信号生成单元的示例。
以此方式,在设置了低水平带确定单元330的情况下,在差别谱计算单元320算出的差别谱当中,可以确定与低水平带对应的差别谱。此外,在设置了替代谱生成单元350的情况下,可以基于具有差别谱的近似频率特性的左声道的频谱,生成替代谱。因此,可以生成具有与真正的差别谱的频谱特性近似的频率特性的替代谱,并且因此可以实现对更自然的差别谱的校正。
此外,在设置了谱替代单元360的情况下,可以将低水平带中的频谱的水平替代成替代谱生成单元350生成的替代谱的水平。这里,在下文中将参照附图描述差别谱计算单元320算出的差别谱。
[通过差别谱计算单元320的声信号的频率分布的示例]
图6包括示出了差别信号中的音频成分和伴奏成分的频率分布的示例的概念图,其中,该差别信号是基于左声道和右声道的声信号之间的差别而生成的。这里,假设通过使用减法单元321,对具有右声道和左声道的声信号的立体声信号执行减法来生成差别信号,其中,在该立体声信号中,声乐声音位于中心,并且其中,伴奏中的乐器声音的位置是分散的。
图6的部分(a)和(b)是示出作为左声道信号分量的、包括在左声道声信号中的音频成分和伴奏成分的频率分布的图。图6的部分(c)和(d)是示出作为右声道信号分量的、包括在右声道声信号中的音频成分和伴奏成分的频率分布的图。此外,在图6的部分(a)至(d)中,垂直轴表示功率,而水平轴表示频率。
在图6的部分(a)中,示出了包括在左声道声信号中的伴奏成分Pli。左声道的伴奏成分Pli主要在小于或等于200Hz的频带中呈现出较大的功率分布。在图6的部分(b)中,示出了包括在左声道声信号中的音频成分Plv。左声道的音频成分Plv主要在200Hz至2KHz的频带中呈现出较大的功率分布。
在图6的部分(c)中,示出了包括在右声道声信号中的伴奏成分Pri。右声道的伴奏成分Pri主要在小于或等于200Hz的频带中呈现出较大的功率分布,其不同于左声道的伴奏成分P1i的频率分布。在图6的部分(d)中,示出了包括在右声道声信号中的音频成分Prv。右声道的音频成分Prv主要在200Hz至2KHz的频带中呈现出较大的功率分布,其等于左声道的音频成分Plv的频率分布。
以此方式,在声乐声音位于中心的立体声信号中,左声道的音频成分和右声道的音频成分呈现出基本上相等的频率分布。相反,因为乐器声音的位置是空间分散的,因此伴奏成分趋向于在左声道和右声道中呈现出不同的频率分布。
图6的部分(e)和(f)是示出包括在差别信号中的音频成分和伴奏成分的频率分布的图,其中,该差别信号是由图6的部分(a)至(d)中示出的右声道和左声道声信号之间的绝对差值生成的。这里,垂直轴表示功率,并且水平轴表示频率。
在图6的部分(e)中,示出了包括在差别信号中的伴奏成分Pdi。在差别信号的伴奏成分Pdi中,由于右声道和左声道的伴奏成分Pli和Pri的频率分布是不同的,因此两个声道的频率分量之间的抵消程度较小。
在图6的部分(f)中,示出了包括在差别信号中的音频成分Pdv。此外,这里,右声道或左声道的音频成分Plv或Prv的频率分布以虚线来表示。由于右声道和左声道的音频成分Plv和Prv的频率分布彼此相等,因此差别信号中的音频成分Pdv被两个声道的频率分量抵消。
以此方式,在声乐声音位于中心的双声道声信号中,可以通过从另一声道的声信号减去一个声道的声信号,生成抑制了音频成分的伴奏信号。注意,这里,描述了在时域中生成的差别信号;然而,在将双声道声信号转换成频谱之后,基于由其之间的绝对差值算出的差别谱生成差别信号的情况下,也以类似方式抑制音频成分。即,在包括呈现出基本上相等的频率分布的音频成分的双声道声信号中,由其频谱之间的差算出的差别谱被转换成时域信号,从而允许生成抑制了音频成分的差别信号。
然而,如果基于压缩之后的声信号生成差别信号,则幅度水平极低的低水平带会出现在差别信号的频率分量中,其中,该压缩之后的声信号是通过对图2中示出的声信号编码设备700等压缩的声信号进行解码而获得的。差别信号中这样的低水平带的出现表现为人听觉中的不愉快噪声。这里,在下文中将参照附图描述出现在基于作为已解码的、压缩之后的声信号的压缩信号而生成的差别信号中的低水平带出现的原因。
[由于量化误差导致的低水平带出现的示例]
图7包括关于由于声信号编码设备700中的量化单元731和732进行的量化而导致的低水平带的图。图7的部分(a)和(b)是示出分别由声信号编码设备700中的归一化单元721和722生成的左归一化分量771和右归一化分量772的示例的图。图7的部分(c)是示出作为左归一化分量771和右归一化分量772之间的绝对差值的归一化绝对差值773的图。
图7的部分(d)和(e)是示出左量化分量781和右量化分量782的示例的图,其中,该左量化分量781和右量化分量782是通过分别使用声信号编码设备700中的量化单元731和732对左归一化分量771和右归一化分量772进行量化而获得的。图7的部分(f)是示出作为左量化分量781和右量化分量782之间的绝对差值的量化绝对差值783的图。
在图7的部分(a)中,示出了包括在左声道的编号i的子带B[i]中的四个频谱(f1至f4)的归一化值Pl。在图7的部分(b)中,示出了包括在右声道的编号i的子带B[i]中的四个频谱(f1至f4)的归一化值Pr。
在图7的部分(c)中,示出了右声道和左声道中的频谱(f1至f4)的归一化值之间的绝对差值Pd。频谱(f1至f4)的绝对差值Pd呈现出不同的水平。
在图7的部分(d)中,示出了包括在左声道的编号i的子带B[i]中的四个频谱(f1至f4)的量化值Q。例如,对于编号f1的频谱,通过对归一化值进行量化,量化值Q被设置为“2”。
在图7的部分(e)中,示出了包括在右声道的编号i的子带B[i]中的四个频谱(f1至f4)的量化值Q。例如,对于编号f1的频谱,通过对归一化值进行量化,量化值Q被设置为“2”,其与左声道中的量化值相同。
在图7的部分(f)中,示出了右声道和左声道中的同一频谱(f1至f4)的量化值的绝对差值Q。与图7的部分(c)中示出的绝对差值773不同,频谱(f1至f4)的所有绝对差值Q变为“0”。这是因为各个声道的归一化值的量化将频谱(f1至f4)的归一化值限制为五个量化值Q(0至4)。即,由于量化导致的量化误差,编号i的子带B[i]中的频谱(f1至f4)的所有量化绝对差值Q变为“0”。
以此方式,即使归一化单元721和722生成的归一化分量771和7772彼此不同,也可通过量化单元731和732的量化使得右声道和左声道的量化值相同。在该情况下,当与使得两个声道的量化值相同的编号i的子带B[i]对应的归一化参考值相互匹配时,与编号i的子带B[i]对应的频带被设置作为差别信号中的低水平带。
[由于共享带编码导致的低水平带出现的示例]
图8包括关于由声信号编码设备700中的共享带编码单元800进行的共享带编码处理导致的低水平带的图。这里,假设共享带编码单元800确定如下编号i的子带B[i]为共享带以及确定共享带中的左声道的归一化分量被量化:其中,左声道和右声道的归一化分量之间的相关水平较高。
图8的部分(a)和(b)是示出分别由声信号编码设备700中的归一化单元721和722生成的左归一化分量771和右归一化分量774的示例的图。图8的部分(c)是示出作为左归一化分量771和右归一化分量774之间的绝对差值的归一化绝对值差值775的图。
图8的部分(d)和(e)是示出如下示例的图:左归一化分量771生成的量化分量由共享带编码单元800共享作为右声道和左声道量化分量781和右量化分量784。图7的部分(f)是示出作为左量化分量781和右量化分量784之间的绝对差值的量化绝对差值785。
在图8的部分(a)中,示出了包括在左声道的编号i的子带B[i]中的四个频谱(f1至f4)的归一化值Pl。在图8的部分(b)中,示出了包括在右声道的编号i的子带B[i]中的四个频谱(f1至f4)的归一化值Pr。
在图8的部分(c)中,示出了右声道和左声道中的频谱(f1至f4)的归一化值之间的绝对差值Pd。频谱(f1至f4)的绝对差值Pd呈现出不同的水平。
在图8的部分(d)中,示出了包括在左声道的编号i的子带B[i]中的四个频谱(f1至f4)的量化值Q。四个频谱(f1至f4)的量化值与图7的部分(d)中的量化值类似。
在图8的部分(e)中,示出了包括在右声道的编号i的子带B[i]中的四个频谱(f1至f4)的量化值Q。右声道中的四个频谱(f1至f4)的量化值Q表示与左声道的量化值Q相同的值。即,由于共享带编码单元800确定编号i的子带B[i]是共享带,因此频谱(f1至f4)的量化值Q表示左声道的量化值Q也用于右声道的量化值Q。
在图8的部分(f)中,示出了右声道和左声道中的频谱(f1至f4)的量化值的绝对差值Q。与图8的部分(c)中示出的绝对差值773不同,频谱(f1至f4)的所有绝对差值Q变为“0”。这是因为左声道的子带B[i]中的频谱的归一化值被共享带编码单元800共享为两个声道的归一化值。
以此方式,即使归一化单元721和722生成的归一化分量771和774是不同的,共享带编码单元800生成的量化值分量也被共享为两个声道的量化值。因此,当解码时,使得量化值彼此相等。因此,如果编号i的子带B[i]的归一化值被共享带编码单元800共享的编码后数据被解码、并且基于解码后的压缩信号计算差别谱,则与编号i的子带B[i]对应的差别谱被设置作为低水平带。
[压缩信号中低水平带出现的示例]
图9包括示出基于根据本发明的第一实施例的差别谱计算单元320算出的差别谱的子带B[i]的示例的概念图。这里,为了方便图示,没有示出与图3的部分(a)中示出的频谱包络725相同的谱包络。
图9的部分(a)和(b)是作为示例,示出频谱生成单元311和312生成的左声道和右声道声信号中的压缩信号分量313和314的图。图9的部分(c)是作为示例,示出基于差别谱计算单元320算出的差别谱的绝对差值分量321的图。这里,垂直轴表示与子带B[i]对应的归一化参考值(比例因子)的幅值,而水平轴表示频率。
左声道和右声道压缩信号分量313和314是通过使用十个子带B[0]至B[9]的、压缩信号中的左声道和右声道频率分布的抽象表示,其中,该压缩信号是通过对编码后声信号进行解码而恢复的。注意,如图3的部分(b)所示,子带B[i]包括多个频谱。
绝对差值分量321是通过使用十个子带B[0]至B[9]的、左声道和右声道压缩信号分量313和314中的频谱的绝对差值的频率分布的抽象表示。这里,如图7所述,编号1的子带B[1]是如下低水平带:其中,通过量化使得两个声道的量化值彼此相等,并且其中,各个差别谱的水平显著降低。此外,如图8所述,第五、第七以及第八子带B[5]、B[7]以及B[8]是如下低水平带:其中,通过共享带编码使得两个声道的量化值彼此相等,并且其中,各个差别谱的水平大大降低。
以此方式,诸如量化或共享带编码的处理可导致差别谱计算单元320算出的差别谱的水平极低的低水平带。如果具有这样的低水平带的伴奏信号从扬声器180输出,则听者可感觉到输出的伴奏信号为不愉快的声音。因此,在本发明的第一实施例中,低水平带确定单元330确定低水平带,并且与所确定的低水平带对应的差别谱被替代成替代谱。这里,在下文中将参照附图描述将低水平带中的差别谱替代成替代谱的示例。
[音频成分去除单元300进行的差别谱替代的示例]
图10包括示出如下示例的抽象图:其中,根据本发明的第一示例的音频成分去除单元300将与低水平带对应的差别谱替代成替代谱。
图10的部分(a)是示出被提供到替代谱生成单元350的左声道压缩信号分量313的图。图10的部分(b)是示出在图9的部分(c)中示出的绝对差值分量321中的低水平带的差别谱被谱替代单元360替代成替代谱之后而获得的绝对差值分量361的图。这里,垂直轴表示与子带B[i]对应的归一化参考值(比例因子)的幅值,而水平轴表示频率。此外,左声道压缩信号分量313与图9的部分(a)中示出的类似,因此在此省略其描述。
替代后的绝对差值分量361呈现出如下频率分布:其中,被低水平带确定单元330确定为低水平带的绝对差值分量321中的子带B[1]、B[5]、B[7]以及B[8]的差别谱已被替代成替代谱。这里,为了方便图示,通过使用子带B[0]至B[9]而非频谱来示出频率分布。
子带B[1]、B[5]、B[7]以及B[8]的替代谱是由替代谱生成单元350基于与被确定为低水平带的差别谱对应的左声道的频谱而生成的。替代谱生成单元350通过将与低水平带对应的频谱的水平乘以水平调整系数保存单元340中的水平调整系数来计算替代谱的水平。
在该示例中,包括在编号1的子带B[1]中的替代谱的水平是通过与编号1的子带B[1]对应的水平调整系数g1和包括在左声道的子带B[1]中的每个频谱Pl的乘积值而生成的。此外,包括在编号5的子带B[5]中的替代谱的水平是通过与编号5的子带B[5]对应的水平调整系数g2和包括在左声道的子带B[5]中的每个频谱Pl的乘积值而生成的。
此外,包括在编号7的子带B[7]中的替代谱的水平是通过与编号7的子带B[7]对应的水平调整系数g3和包括在左声道的子带B[7]中的每个频谱Pl的乘积值而生成的。此外,包括在编号5的子带B[8]中的替代谱的水平是通过与编号8的子带B[8]对应的水平调整系数g4和包括在左声道的子带B[8]中的每个频谱Pl的乘积值而生成的。
以此方式,与低水平带对应的差别谱被替代成水平调整系数乘以左声道的频谱的替代谱,并且因此可以消除伴奏信号中的低水平带。接下来,在下文中将参照附图描述调整用于消除低水平带的替代谱的水平的水平调整系数的频率特性。
[水平调整系数的示例频率特性]
图11是示出保存在根据本发明的第一实施例的水平调整系数保存单元340中的水平调整系数的频率特性341的示例的图。这里,水平轴表示频率,而垂直轴表示水平调整系数的幅值。
水平调整系数频率特性341表示用于调整替代谱生成单元350生成的替代谱的水平的水平调整系数g(f)的频率特性。在水平调整系数频率特性341中,与音频成分对应的中等音频带(fvl至fvh)中的水平调整系数具有和与除音频带之外的带对应的水平调整系数不同的幅值。
与水平调整系数频率特性341中除音频带之外的带对应的水平调整系数g(f)是“1.0”。因此,替代谱生成单元350生成的替代谱的水平按原样采用左声道的频谱的水平。
另一方面,与水平调整系数频率特性341中音频带(fvl至fvh)对应的水平调整系数g(f)是gv。水平调整系数gv是小于“1.0”的值。由于当使用近似0.1时,听者感到差别信号中的音频成分足够低,因此优选地,水平调整系数gv被设置为近似0.1。然而,取决于差别信号中的频率特性,即使当设置近似0.1时,也可导致不自然的感觉。因此,在这样的情况下,水平调整系数gv可被设置为近似0.2至0.3。
以此方式,将与包括音频成分的音频带(fvl至fvh)对应的水平调整系数gv设置为小于与除音频带之外的带对应的水平调整系数,允许生成充分抑制了音频成分的舒服伴奏信号。接下来,在下文中将参照附图描述低水平带确定单元330执行的、用于确定与低水平带对应的差别谱的确定方法。
[用于确定与低水平带对应的差别谱的方法]
图12是关于根据本发明的第一实施例的低水平带确定单元330执行的、用于确定与低水平带对应的差别谱的方法示例的图。这里,示出了左声道谱包络315、左声道谱平滑线331、差别谱包络322以及低水平阈值线332。这里,此外,垂直轴表示功率,而水平轴表示频率。
左声道谱包络315表示频谱生成单元311生成的左声道的频谱Pl(f)的包络。总体上,频谱的水平Pl(f)随着频率f增加而减小。
左声道谱平滑线331是通过对左声道谱包络315进行平滑而生成的平滑现SMT(f)。在该示例中,平滑线SMT(f)是通过基于左声道的频谱的水平对线的梯度进行计算而生成的。
注意,左声道谱平滑线331可以是由例如移动平均生成的。此外,这里,示出了基于左声道的频谱计算平滑线331的示例;然而,平滑线SMT(f)可以是基于差别谱包络322生成的。
差别谱包络322是差别谱计算单元320算出的差别谱D(f)的包络。差别谱包络322表示水平快速下降的第一和第二低水平带Δfa(fla至fha)和Δfb(flb至fhb)。此外,与左声道谱包络315类似,总体上,差别谱的水平D(f)随着频率f增加而减小。以此方式,左声道的差别谱D(f)和频谱Pl(f)趋向于具有总体上近似的特性。
注意,这里,与差别谱包络322中的第一和第二低水平带(Δfa和Δfb)对应的差别谱的水平彼此不同。这是因为当对具有如下带的编码后数据进行解码时,各个声道的频谱从频域被转换到时域:其中,左声道和右声道的量化值由于量化或共享带编码而彼此匹配。该转换处理导致共享带中的左声道和右声道的频谱水平之间的微小差别,因此第一和第二低水平带(Δfa和Δfb)中的差别谱包络322的谱水平之间出现差别。
低水平阈值线332是基于左声道谱平滑线331和特定阈值系数而设置的低水平阈值TH(f)的线。阈值系数被配置成根据假设的低水平带而进行设置。注意,如果阈值系数过大,则低水平带确定单元330可能会错误地确定非低水平带作为低水平带。因此,优选地,阈值系数被设置为尽可能小的值。
以此方式,利用左声道的频谱的水平Pl(f)和阈值系数,低水平带确定单元330可以设置低水平阈值线332,其频率特性容易地近似差别谱的总体频率特性。因此,低水平带确定单元330可以确定与比当特定阈值是针对所有频带设置时更精确的低水平带对应的差别谱。注意,这里,描述了基于左声道的频谱生成低水平阈值线332的示例;然而,可使用右声道的频谱或两个声道的频谱的和。
[音频成分去除单元300的示例操作]
接下来,将参照附图描述根据本发明的第一实施例的音频成分去除单元300的操作。
图13是示出根据本发明的第一实施例的音频成分去除单元300执行的伴奏信号生成方法的示例处理过程的流程图。
首先,频谱生成单元311和312基于从左声道和右声道信号线291和292提供的立体声信号,针对各个声道生成N个频谱(步骤S911)。
然后,低水平带确定单元330基于左声道中N个频谱的水平Pl(0至N-1),计算左声道谱平滑线SMT(f)(步骤S912)。随后,将要计算其差别谱的各个声道的频谱Pl(f)和Pr(f)的谱编号f设置为“0”(步骤S913)。
此后,分别从频谱生成单元311和312输出左声道和右声道中的编号0的频谱的水平Pl(0)和Pr(0)(步骤S914)。然后,差别谱计算单元320计算编号0的差别谱D(0)(步骤S915),其是右声道和左声道中的编号0的频谱之间的差(Pl(0)-Pr(0))的绝对值。注意,步骤S915是权利要求中所述的差别谱计算过程的示例。
然后,低水平带确定单元330执行低水平带确定处理(步骤S930),用于确定算出的编号0的差别谱D(0)是否是与低水平带对应的差别谱。然后,谱替代单元360确定与编号0的差别谱D(0)对应的替代信息Info(0)是否为真(TRUE)(步骤S916)。
然后,在替代信息Info(0)为真(TRUE)的情况下,执行谱替代处理(步骤S940)。另一方面,在替代信息Info(0)不为真(TURE)的情况下,处理前进到步骤S917,而不将编号0的差别谱替代成替代谱生成单元350的替代谱。
接下来,将谱编号f加“1”(步骤S917)。然后,确定所得到的谱编号f是否小于谱的数量N(步骤S918)。然后,在谱编号f小于谱的数量N的情况下,处理返回到步骤S914,并且重复步骤S914至S918和S930的系列处理操作,直至谱编号f与谱的数量N匹配。
另一方面,在谱编号f与谱的数量N匹配的情况下,伴奏信号生成单元370通过将从谱替代单元360输出的N个差别谱D(0至N-1)转换成时域信号来生成伴奏信号(步骤S919)。因此,如下伴奏信号生成处理结束:其中,抑制了包括在从左声道和右声道信号线291和291提供的立体声信号中的音频成分。注意,步骤S919是权利要求中所述的伴奏信号生成过程的示例。
[低水平带确定单元330的示例操作]
图14是示出根据本发明的第一实施例的低水平带确定单元330执行的低水平带确定处理(步骤S930)的示例处理过程的流程图。
首先,计算低水平阈值TH(f)(步骤S931),其中,将在步骤S912的处理中生成的谱平滑线SMT(f)乘以特定阈值系数α。注意,在该示例中,描述了在步骤S912中基于所有频谱生成谱平滑线SMT(f)的示例;然而,可使用特定数量的在前频谱Pl(f)的平均值作为谱平滑线SMT(f)。
然后,确定从差别谱计算单元320输出的差别谱水平D(f)是否小于低水平阈值TH(f)(步骤S932)。即,确定从差别谱计算单元320输出的差别谱D(f)是否是与低水平带对应的差别谱。
然后,在差别谱D(f)小于低水平阈值TH(f)的情况下,将替代信息Info(f)设置为真(TRUE),以便将差别谱的水平替代成替代谱的水平(步骤S933)。即,确定在差别谱的包络中水平快速下降的频带为低水平带。注意,步骤S932和S933是权利要求中所述的低水平带确定过程的示例。
另一方面,在差别谱D(f)大于或等于低水平阈值TH(f)的情况下,不需要将差别谱D(f)替代成替代谱。因此,将替代信息Info(f)设置为假(FALSE)(步骤S934)。在执行了步骤S933或S934的处理操作之后,低水平带确定处理结束。
[替代谱生成单元350和谱替代单元360的示例操作]
图15是示出根据本发明的第一实施例的谱替代单元360执行的谱替代处理(步骤S940)的示例处理过程的流程图。
首先,替代谱生成单元350从水平调整系数保存单元340获得水平调整系数g(f)(步骤S941)。随后,替代谱生成单元350从左声道的频谱生成单元311获得频谱Pl(f)(步骤S942)。
然后,替代谱生成单元350通过将所获得的水平调整系数g(f)乘以左声道的频谱Pl(f)来计算替代谱R(f)(步骤S943)。即,替代谱生成单元350基于左声道声信号的频谱,生成替代差别谱的替代谱。注意,步骤S943是权利要求中所述的替代谱生成过程的示例。
随后,谱替代单元360通过将与低水平带对应的差别谱D(f)替代成算出的替代谱R(f),生成新的差别谱D(f)(步骤S944),并且然后,谱替代处理结束。注意,步骤S944是权利要求中所述的谱替代过程的示例。
以此方式,在本发明的第一实施例中,与低水平带对应的差别谱D(f)被替代成基于左声道的频谱Pl(f)生成的替代谱,从而允许生成舒服的伴奏信号。
此外,如图11所示,与音频带对应的水平调整系数g(f)被设置为小于其它带的水平调整系数,从而允许充分抑制伴奏信号中的音频成分。然而,在该情况下,当伴奏信号中的伴奏成分较大时,与音频带对应的替代谱的水平相对过于低于其它差别谱的水平,并且会导致听觉中不自然的伴奏信号。
相反,在以下部分描述的第二实施例中提供了如下改进:用于根据伴奏成分的幅值来调整与音频带对应的替代谱的水平,以抑制替代谱和其它差别谱之间的水平差的过度增大。
<2.第二实施例>
[音频成分去除单元300的示例配置]
图16是示出根据本发明的第二实施例的音频成分去除单元300的示例配置的图。取代图5中示出的替代谱生成单元350,音频成分去除单元300包括音频系数设置单元651和替代谱生成单元652。这里,除音频系数设置单元651和替代谱生成单元652之外的配置与图5的配置类似。因此,给出与图5相同的附图标记,并且此处省略其描述。
音频系数设置单元651被配置成基于从频谱生成单元311发送的左声道的频谱,并且基于从水平调整系数保存单元340发送的、与音频带对应的水平调整系数,设置音频系数。音频系数设置单元651基于左声道的整个频谱中,与除音频带之外的带对应的频谱和与音频带对应的频谱的水平比,设置与音频带对应的音频系数。
音频系数设置单元651基于例如在左声道的频谱内,与除音频带之外的带对应的频谱的平均水平和与音频带对应的频谱的平均水平的水平比,设置音频系数。即,音频系数设置单元651对于与除音频带之外的带对应的频谱的较高水平,将音频系数设置得较大,而对于与音频带对应的频谱的较高水平,将音频系数设置得较小。
此外,音频系数设置单元651将设置的音频系数和保存在水平调整系数保存单元340中的、与除音频带之外的带对应的水平调整系数提供到替代谱生成单元652。注意,音频系数设置单元651是权利要求中所述的音频系数设置单元的示例。
替代谱生成单元652基于左声道的频谱和从音频系数设置单元651发送的、与该频谱对应的音频系数或水平调整系数,生成替代谱。替代谱生成单元652基于从频谱生成单元311发送的左声道的频谱和音频系数设置单元651设置的音频系数,生成替代谱。
替代谱生成单元652通过例如将左声道的频谱的水平乘以从音频系数设置单元651发送的音频系数或水平调整系数,来计算替代谱的水平。此外,替代谱生成单元652将算出的替代谱提供到谱替代单元360。注意,替代谱生成单元652对应于图5中示出的替代谱生成单元350。此外,替代谱生成单元652是权利要求中所述的替代谱生成单元的示例。
以此方式,在设置了音频系数设置单元651的情况下,可以根据左声道的频谱的水平,调整与音频带对应的替代谱的水平。这里,将参照附图描述关于音频系数设置单元651执行的音频系数设置方法的示例。
[音频系数设置方法的示例]
图17是示出关于根据本发明的第二实施例的音频系数设置单元651执行的音频系数设置方法的示例的图。这里,示出了左声道谱包络Pl(f)316、伴奏带平均值Pia以及音频带平均值Pva。此外,垂直轴表示功率值,而水平轴表示频率。
左声道谱包络Pl(f)表示频谱生成单元311生成的左声道的频谱Pl(f)的包络。伴奏带平均值Pia表示伴奏带(0至fvl)中的频谱Pl(f)的平均值。伴奏带平均值Pia是通过音频系数设置单元651计算的。音频带平均值Pva表示音频带(fvl至fvh)中的频谱Pl(f)的平均值。音频带平均值Pva是通过音频系数设置单元651计算的。
在该情况下,音频系数设置单元651根据例如以下等式来计算音频系数V。这里,gv表示保存在水平调整系数保存单元340中的、与音频带对应的水平调整系数。
V=gv×(Pia/Pva)
从以上等式得出,随着伴奏带平均值Pia增加,基于音频系数V的水平调整系数gv增加,并且随着音频带平均值Pva增加,基于水平调整系数gv的音频系数V减小。
以此方式,在伴奏带平均值Pia大于音频带平均值Pva的情况下,音频系数V取大于水平调整系数gv的值。因此,与音频带对应的替代谱的水平增加,并且和与除音频带之外的带对应的差别谱的水平差减小。因此,可以抑制伴奏信号中的听觉噪声。
另一方面,在伴奏带平均值Pia小于音频带平均值Pva的情况下,音频系数V取小于水平调整系数gv的值。因此,与音频带对应的替代谱的水平减小,并且和与除音频带之外的带对应的差别谱的水平差减小。因此,可以抑制伴奏信号中的听觉噪声。此外,在该情况下,与音频成分对应的替代谱的水平下降。因此,与特定水平调整系数gv相比,可以更多地抑制伴奏信号中的音频成分。
以此方式,在本发明的第二实施例中,在设置了音频系数设置单元651的情况下,可以根据左声道的频谱的特性,调整与音频带对应的替代谱的水平。即,可以基于与差别谱的频率特性近似的、左声道的频谱的频率特性,调整与音频带对应的替代谱的水平。
因此,与第一实施例相比,可以更多地抑制伴奏信号中的差别谱与替代谱之间的水平差导致的听觉噪声。接下来,在下文中将参照谱替代处理的流程图描述音频系数设置单元651的操作。
[谱替代处理的示例处理过程]
图18是示出根据本发明的第二实施例的音频成分去除单元300执行的谱替代处理(步骤S950)的示例处理过程的流程图。步骤S950的处理对应于图13中示出的步骤S940的处理。此外,这里,假设音频系数设置单元651基于从频谱生成单元311发送的频谱的水平,计算伴奏带平均值Pia和音频带平均值Pva。此外,假设水平调整系数保存单元340保存与图11中示出的音频带对应的水平调整系数gv。
首先,音频系数设置单元651从水平调整系数保存单元340获得水平调整系数g(f)(步骤S951)。随后,替代谱生成单元652从频谱生成单元311获得左声道的频谱Pl(f)(步骤S952)。
此后,音频系数设置单元651确定谱编号f是否是与音频带对应的编号(步骤S953)。然后,在谱编号f不是与音频带对应的编号的情况下,替代谱生成单元652通过将水平调整系数g(f)乘以左声道的频谱Pl(f)来计算替代谱R(f)(步骤S958)。
另一方面,在谱编号f是与音频带对应的编号的情况下,获得伴奏带平均值Pia和音频带平均值Pva(步骤S954)。随后,音频系数设置单元651通过将伴奏带平均值Pia与音频带平均值Pva的比率乘以与音频带对应的水平调整系数gv来计算音频系数V(步骤S955)。
随后,替代谱生成单元652通过将算出的音频系数V乘以左声道的频谱Pl(f)来计算替代谱R(f)(步骤S956)。注意,步骤S953至S956和S958是权利要求中所述的替代谱生成过程的示例。
然后,谱替代单元360将差别谱D(f)替代成算出的替代谱R(f)(步骤S957),并且然后,谱替代处理结束。注意,步骤S957是权利要求中所述的谱替代过程的示例。
以此方式,在本发明的第二实施例中,可以根据左声道的如下频谱中的伴奏成分的幅值,适当地调整与音频带对应的替代谱的水平:其中,该频谱的频率特性与差别谱的频率特性近似。
以此方式,根据本发明的实施例,在基于压缩信号中的频谱生成伴奏信号的情况下,可以通过将与低水平带对应的差别谱替代成替代谱来生成舒服的伴奏信号。即,可以通过基于左声道的如下频谱对差别信号的频率分量进行校正来生成更自然的伴奏信号:其中,该频谱的频率特性与差别信号的频率特性近似。
注意,在本发明的实施例中,描述了基于左声道的频谱生成替代谱的示例;然而,可基于从频谱生成单元312发送的右声道的频谱来生成替代谱。作为另一示例,可基于右声道和左声道的频谱的水平来生成替代谱。在下文中将参照附图描述在该情况下的音频成分去除单元300的示例配置作为第三实施例。
<3.第三实施例>
图19是示出根据本发明的第三实施例的音频成分去除单元300的示例配置的框图。除图5中示出的音频成分去除单元300之外,该音频成分去除单元300还包括频谱相加单元380。这里,除频谱相加单元380之外的配置与图5中示出的配置类似。因此,给出了相同的附图标记,并且此处省略其描述。
频谱相加单元380被配置成将从频谱生成单元311和312提供的、右声道和左声道的频谱相加,并且将所得到的和值除以2。即,频谱相加单元380计算左声道和右声道的频谱的平均值。此外,频谱相加单元380将频谱的算出的平均值提供到替代谱生成单元350和低水平带确定单元330。
以此方式,在本发明的第三实施例中,在设置了频谱相加单元380的情况下,可以基于右声道和左声道两者的频率特性的平均值,使用替代谱来校正差别信号的频率分量。因此,去除了包括在右声道和左声道的声信号中的分量的偏置。因此,可以实现更自然的谱校正。即,基于两个声道的声信号中的至少一个频谱生成替代谱,从而允许抑制伴奏信号中的听觉噪声。
注意,在本发明的实施例中,可在伴奏信号生成单元370之后,设置增强低频分量以便增强伴奏成分的增强滤波器、衰减中间频率分量以便衰减音频成分的衰减滤波器等。
注意,本发明的实施例示出了用于实施本发明的示例,并且,如在本发明的实施例中清楚描述的是,本发明的实施例中的内容与定义本发明的内容具有对应关系。类似地,权利要求中所述的定义本发明的内容与在本发明的实施例中具有相同名称的内容具有对应关系。然而,本发明不限于实施例,而是在不背离本发明的范围的情况下,可以通过对实施例所做的多种修改来实施本发明。
此外,本发明的实施例中描述的处理过程可被视为具有系列过程的方法,并且也可被视为用于使得计算机执行该系列过程的程序或者视为存储该程序的记录介质。记录介质的示例包括CD(光盘)、MD(迷你盘)、DVD(数字多功能盘)、存储卡、蓝光盘(注册商标)。
附图标记列表
100 音乐回放设备
110 操作接收单元
120 控制单元
130 显示单元
140 声数据存储单元
150 声数据输入单元
160 模拟转换单元
170 放大器
180 扬声器
200 声信号解码处理单元
210 解码单元
221 左声道去量化单元
222 右声道去量化单元
223 共享带去量化单元
231、232 选择单元
241 反向归一化单元
251 声信号生成单元
300 音频成分去除单元
311、312 频谱生成单元
320 差别谱计算单元
330 低水平带确定单元
340 水平调整系数保存单元
350 替代谱生成单元
360 谱替代单元
370 伴奏信号生成单元
380 频谱相加单元
651 音频系数设置单元
652 替代谱生成单元

Claims (9)

1.一种声信号处理设备,包括:
差别谱计算单元,其计算在多个声道的声信号当中,包括音频成分的基本上相等的频率分布的两个声道的声信号的频谱之间的差作为差别谱;
低水平带确定单元,其确定下述频带为低水平带:其中,在所述频带中,在所述差别谱计算单元算出的所述差别谱的包络中,水平快速下降;
替代谱生成单元,其基于所述两个声道的所述声信号的频谱中的至少一个,生成替代所述差别谱的替代谱;
谱替代单元,其将与所述差别谱计算单元算出的所述差别谱内的所述低水平带对应的差别谱替代成所述替代谱;以及
伴奏信号生成单元,其通过将从所述谱替代单元输出的频谱转换成时域信号来生成伴奏信号。
2.根据权利要求1所述的声信号处理设备,其中,所述替代谱生成单元基于所述两个声道的所述声信号的至少一个频谱和用于调整所述替代谱的水平的预定水平调整系数,生成所述替代谱。
3.根据权利要求2所述的声信号处理设备,其中,所述替代谱生成单元基于音频带的所述水平调整系数和所述至少一个频谱的水平,生成所述替代谱,其中,所述音频带的所述水平调整系数小于与除所述音频带之外的带对应的所述水平调整系数。
4.根据权利要求1所述的声信号处理设备,还包括音频系数设置单元,所述音频系数设置单元基于在所述两个声道的所述声信号的至少一个频谱中,与除音频带之外的带对应的频谱和与所述音频带对应的频谱的水平比,设置与所述音频带对应的音频系数,
其中,所述替代谱生成单元基于所述至少一个频谱和所述音频系数设置单元设置的所述音频系数,生成所述替代谱。
5.根据权利要求4所述的声信号处理设备,其中,所述音频系数设置单元对于与除所述音频带之外的带对应的频谱的较高水平,将所述音频系数设置得较大,而对于与所述音频带对应的频谱的较高水平,将所述音频系数设置得较小。
6.根据权利要求1所述的声信号处理设备,其中,所述低水平带确定单元基于用于指定在所述包络中水平快速下降的频带的低水平阈值和所述差别谱的每个水平,确定所述低水平带。
7.根据权利要求6所述的声信号处理设备,其中,所述低水平带确定单元使用所述低水平阈值和所述差别谱的水平,确定所述低水平带,其中,所述低水平阈值是基于所述两个声道的所述声信号的至少一个频谱的水平设置的。
8.一种伴奏信号生成方法,包括:
差别谱计算过程,用于计算在多个声道的声信号当中,包括音频成分的基本上相等的频率分布的两个声道的声信号的频谱之间的差作为差别谱;
低水平带确定过程,用于确定下述频带为低水平带:其中,在所述频带中,在通过所述差别谱计算过程算出的所述差别谱的包络中,水平快速下降;
替代谱生成过程,用于基于所述两个声道的所述声信号的频谱中的至少一个,生成替代所述差别谱的替代谱;
谱替代过程,用于将与通过所述差别谱计算过程算出的所述差别谱内的所述低水平带对应的差别谱替代成所述替代谱;以及
伴奏信号生成过程,用于通过将由所述谱替代过程输出的频谱转换成时域信号来生成伴奏信号。
9.一种用于使得计算机执行以下过程的程序:
差别谱计算过程,用于计算在多个声道的声信号当中,包括音频成分的基本上相等的频率分布的两个声道的声信号的频谱之间的差作为差别谱;
低水平带确定过程,用于确定下述频带为低水平带:其中,在所述频带中,在通过所述差别谱计算过程算出的所述差别谱的包络中,水平快速下降;
替代谱生成过程,用于基于所述两个声道的所述声信号的频谱中的至少一个,生成替代所述差别谱的替代谱;
谱替代过程,用于将与通过所述差别谱计算过程算出的所述差别谱内的所述低水平带对应的差别谱替代成所述替代谱;以及
伴奏信号生成过程,用于通过将由所述谱替代过程输出的频谱转换成时域信号来生成伴奏信号。
CN201080002466.5A 2009-07-07 2010-06-30 声信号处理设备及其处理方法 Expired - Fee Related CN102138341B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009160561A JP5365380B2 (ja) 2009-07-07 2009-07-07 音響信号処理装置、その処理方法およびプログラム
JP2009-160561 2009-07-07
PCT/JP2010/061108 WO2011004744A1 (ja) 2009-07-07 2010-06-30 音響信号処理装置、その処理方法およびプログラム

Publications (2)

Publication Number Publication Date
CN102138341A true CN102138341A (zh) 2011-07-27
CN102138341B CN102138341B (zh) 2014-03-12

Family

ID=43429166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080002466.5A Expired - Fee Related CN102138341B (zh) 2009-07-07 2010-06-30 声信号处理设备及其处理方法

Country Status (6)

Country Link
US (1) US8891774B2 (zh)
JP (1) JP5365380B2 (zh)
CN (1) CN102138341B (zh)
HK (1) HK1159391A1 (zh)
TW (1) TWI391916B (zh)
WO (1) WO2011004744A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111613197A (zh) * 2020-05-15 2020-09-01 腾讯音乐娱乐科技(深圳)有限公司 音频信号处理方法、装置、电子设备及存储介质
CN111667805A (zh) * 2019-03-05 2020-09-15 腾讯科技(深圳)有限公司 一种伴奏音乐的提取方法、装置、设备和介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2974084T3 (da) * 2013-03-12 2020-11-09 Hear Ip Pty Ltd Fremgangsmåde og system til støjreduktion
JP6314803B2 (ja) * 2014-11-26 2018-04-25 ソニー株式会社 信号処理装置、信号処理方法及びプログラム
CN110278721B (zh) 2018-01-18 2021-10-12 Ask工业有限公司 用于将描绘音乐作品的音频信号经由输出装置输出到内部空间中的方法
CN115914910A (zh) 2021-08-17 2023-04-04 达发科技股份有限公司 适应性主动噪声消除装置以及使用其的声音播放系统
TWI777729B (zh) * 2021-08-17 2022-09-11 達發科技股份有限公司 適應性主動雜訊消除裝置以及使用其之聲音播放系統

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143171A (ja) * 1996-11-07 1998-05-29 Sony Corp 信号処理装置および方法
JP2005141121A (ja) * 2003-11-10 2005-06-02 Matsushita Electric Ind Co Ltd オーディオ再生装置
JP2005326587A (ja) * 2004-05-13 2005-11-24 Fuji Television Network Inc 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム
CN1756446A (zh) * 2004-09-28 2006-04-05 索尼株式会社 音频信号处理装置及用于其的方法
JP2008072600A (ja) * 2006-09-15 2008-03-27 Kobe Steel Ltd 音響信号処理装置、音響信号処理プログラム、音響信号処理方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6405163B1 (en) * 1999-09-27 2002-06-11 Creative Technology Ltd. Process for removing voice from stereo recordings
JP3810004B2 (ja) * 2002-03-15 2006-08-16 日本電信電話株式会社 ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム
JP4594681B2 (ja) * 2004-09-08 2010-12-08 ソニー株式会社 音声信号処理装置および音声信号処理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143171A (ja) * 1996-11-07 1998-05-29 Sony Corp 信号処理装置および方法
JP2005141121A (ja) * 2003-11-10 2005-06-02 Matsushita Electric Ind Co Ltd オーディオ再生装置
JP2005326587A (ja) * 2004-05-13 2005-11-24 Fuji Television Network Inc 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム
CN1756446A (zh) * 2004-09-28 2006-04-05 索尼株式会社 音频信号处理装置及用于其的方法
JP2008072600A (ja) * 2006-09-15 2008-03-27 Kobe Steel Ltd 音響信号処理装置、音響信号処理プログラム、音響信号処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111667805A (zh) * 2019-03-05 2020-09-15 腾讯科技(深圳)有限公司 一种伴奏音乐的提取方法、装置、设备和介质
CN111667805B (zh) * 2019-03-05 2023-10-13 腾讯科技(深圳)有限公司 一种伴奏音乐的提取方法、装置、设备和介质
CN111613197A (zh) * 2020-05-15 2020-09-01 腾讯音乐娱乐科技(深圳)有限公司 音频信号处理方法、装置、电子设备及存储介质
CN111613197B (zh) * 2020-05-15 2023-05-26 腾讯音乐娱乐科技(深圳)有限公司 音频信号处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
US8891774B2 (en) 2014-11-18
JP5365380B2 (ja) 2013-12-11
TW201126518A (en) 2011-08-01
WO2011004744A1 (ja) 2011-01-13
HK1159391A1 (zh) 2012-07-27
CN102138341B (zh) 2014-03-12
TWI391916B (zh) 2013-04-01
JP2011018962A (ja) 2011-01-27
US20120114142A1 (en) 2012-05-10

Similar Documents

Publication Publication Date Title
CN102138341B (zh) 声信号处理设备及其处理方法
CN101223821B (zh) 音频解码器
JP4899359B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP5461437B2 (ja) マルチチャネル拡張データのオーディオ信号との同期及びオーディオ信号の処理のための装置並びに方法
JP5302977B2 (ja) オーディオ信号のフィンガープリントを計算するための装置及び方法、同期のための装置及び方法、並びに試験オーディオ信号の特徴付けのための装置及び方法
WO2011013381A1 (ja) 符号化装置および復号装置
JP4925671B2 (ja) デジタル信号の符号化/復号化方法及びその装置並びに記録媒体
US20130030818A1 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
CN111316353B (zh) 确定空间音频参数编码和相关联的解码
KR20100086000A (ko) 오디오 신호 처리 방법 및 장치
JP2011059714A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JPWO2006022190A1 (ja) オーディオエンコーダ
JP2009510514A (ja) マルチチャネルオーディオ信号の符号化/復号化方法及び装置
CN101958120B (zh) 信号编码和解码设备及处理方法、信号处理系统
CN104641414A (zh) 立体声音频信号编码器
CN102119413B (zh) 声信号处理系统、声信号解码设备、该系统和设备中的处理方法
JP2010520510A (ja) ノイズ信号の符号化及び復号化の装置及び方法
US7206414B2 (en) Method and device for selecting a sound algorithm
US8271291B2 (en) Method and an apparatus for identifying frame type
WO2006030754A1 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
EP2489036A1 (en) Method, apparatus and computer program for processing multi-channel audio signals
CN101292285A (zh) 编码和解码多声道音频信号的方法及其装置
EP1386311A1 (en) Inverse filtering method, synthesis filtering method, inverse filter device, synthesis filter device and devices comprising such filter devices
JP2007178529A (ja) 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法
JP5569476B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1159391

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1159391

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140312

Termination date: 20150630

EXPY Termination of patent right or utility model