CN105913851A - 对音频/语音信号进行编码和解码的方法和设备 - Google Patents

对音频/语音信号进行编码和解码的方法和设备 Download PDF

Info

Publication number
CN105913851A
CN105913851A CN201610509620.7A CN201610509620A CN105913851A CN 105913851 A CN105913851 A CN 105913851A CN 201610509620 A CN201610509620 A CN 201610509620A CN 105913851 A CN105913851 A CN 105913851A
Authority
CN
China
Prior art keywords
signal
unit
time domain
audio
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610509620.7A
Other languages
English (en)
Other versions
CN105913851B (zh
Inventor
吴殷美
金重会
成昊相
金美英
朱基岘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=41505940&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN105913851(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN105913851A publication Critical patent/CN105913851A/zh
Application granted granted Critical
Publication of CN105913851B publication Critical patent/CN105913851B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提供了一种对音频/语音信号进行编码和解码的方法和设备。输入的音频信号或语音信号可被变换为高频率分辨率信号和高时间分辨率信号中的至少一个。可通过确定合适的分辨率来对信号进行编码,可对编码的信号进行解码,从而,可处理音频信号、语音信号以及音频信号和语音信号的混合信号。

Description

对音频/语音信号进行编码和解码的方法和设备
本申请是申请日为2009年7月14日,申请号为“200980135987.5”,标题为“对音频/语音信号进行编码和解码的方法和设备”的发明专利申请的分案申请。
技术领域
示例实施例涉及一种对音频/语音信号进行编码和解码的方法和设备。
背景技术
编解码器可被分为语音编解码器和音频编解码器。语音编解码器可使用语音建模在50Hz到7kHz的范围的频带中对信号进行编码/解码。一般来说,语音编解码器可通过对声带和声道进行建模来提取语音信号的参数,以执行编码和解码。音频编解码器可通过应用心理声学建模(如高效高级音频编码(HE-AAC))在0Hz到24Hz的范围的频带中对信号进行编码/解码。音频编解码器可基于人类听觉特征,通过去除不易察觉的信号来执行编码和解码。
语音编解码器虽然适合于对语音信号进行编码/解码,但由于声音质量的下降,语音编解码器不适合于对音频信号进行编码/解码。此外,当音频编解码器对语音信号进行编码/解码时,可能降低信号压缩效率。
发明内容
示例实施例可提供一种对音频/语音信号进行编码和解码的方法和设备,所述方法和设备可有效地对语音信号、音频信号以及语音信号和音频信号的混合信号进行编码和解码。
本总体发明构思的另外特征和效用将在下面的描述中部分地阐明,并且从描述中部分是清楚的,或者通过本总体发明构思的实施可以被得知。
根据本总体发明构思的示例实施例,可提供一种对音频/语音信号进行编码的设备,所述设备包括:信号变换单元,将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个;心理声学建模单元,控制信号变换单元;时域编码单元,基于语音建模,对由信号变换单元变换的信号进行编码;量化单元,对从信号变换单元和时域编码单元中的至少一个输出的信号进行量化。
根据本总体发明构思的示例实施例,还可提供一种对音频/语音信号进行编码的设备,所述设备包括:参数立体声处理单元,处理输入的音频信号或语音信号的立体声信息;高频信号处理单元,处理输入的音频信号或语音信号的高频信号;信号变换单元,将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个;心理声学建模单元,控制信号变换单元;时域编码单元,基于语音建模,对由信号变换单元变换的信号进行编码;量化单元,对从信号变换单元和时域编码单元中的至少一个输出的信号进行量化。
根据本总体发明构思的示例实施例,还可提供了一种对音频/语音信号进行编码的设备,所述设备包括:信号变换单元,将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个;心理声学建模单元,控制信号变换单元;低码率确定单元,确定变换的信号是否处于低码率;时域编码单元,当变换的信号处于低码率时,基于语音建模,对变换的信号进行编码;时间噪声整形单元,对变换的信号进行整形;高码率立体声单元,对整形的信号的立体声信息进行编码;量化单元,对来自高码率立体声单元的输出信号和来自时域编码单元的输出信号中的至少一个进行量化。
根据本总体发明构思的示例实施例,还可提供一种对音频/语音信号进行解码的设备,所述设备包括:分辨率确定单元,基于关于时域编码或频域编码的信息,确定当前帧信号是高频率分辨率信号还是高时间分辨率信号,所述信息包括在比特流中;反量化单元,当分辨率确定单元确定所述信号是高频率分辨率信号时,对比特流进行反量化;时域解码单元,从比特流中解码出用于反线性预测的附加信息,并使用该附加信息来恢复高时间分辨率信号;反信号变换单元,将来自时域解码单元的输出信号和来自反量化单元的输出信号中的至少一个反变换到时域的音频信号或语音信号。
根据本总体发明构思的示例实施例,还可提供一种对音频/语音信号进行解码的设备,所述设备包括:反量化单元,对比特流进行反量化;高码率立体声系统/解码器,对反量化的信号进行解码;时间噪声整形器/解码器,处理由高码率立体声系统/解码器解码的信号;反信号变换单元,将处理的信号反变换到时域的音频信号或语音信号,其中,通过将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个来产生比特流。
根据本总体发明构思的示例实施例,对音频/语音信号进行编码和解码的方法和设备可有效地对语音信号、音频信号以及语音信号和音频信号的混合信号进行编码和解码。
此外,根据本总体发明构思的示例性实施例,对音频/语音信号进行编码和解码的方法和设备可使用较少比特执行编码和解码,从而可提高声音质量。
本总体发明构思的另外效用将在下面的描述中部分地阐明,并且从描述中部分是清楚的,或者通过实施例的实施可以被得知。
本总体发明构思的示例性实施例还提供了一种对音频信号和语音信号进行编码的方法,所述方法包括:接收至少一个音频信号和至少一个语音信号;将接收的音频信号和接收的语音信号中的至少一个变换为频率分辨率信号和时域分辨率信号中的至少一个;对变换的信号进行编码;对变换的信号和编码的信号中的至少一个进行量化。
本总体发明构思的示例性实施例还提供了一种对音频信号和语音信号进行解码的方法,所述方法包括:使用接收的信号的比特流中的关于时域编码或频域编码的信息,来确定当前帧信号是频率分辨率信号还是时域分辨率信号;当接收的信号是频率分辨率信号时,对比特流进行反量化;从比特流中的信息进行反线性预测,并使用该信息来恢复时域分辨率信号;将反量化的信号和恢复的时域分辨率信号中的至少一个反变换到时域的音频信号或语音信号。
附图说明
从下面通过结合附图对示例实施例的描述中,本总体发明构思的这些和/或其它特征及效用将会变得清楚,并且更易于理解,其中:
图1是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图2是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图3是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图4是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图5是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图6是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图7是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图8是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图9是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图10是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图11是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图12是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图13是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图14是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图15是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图16是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的方法的流程图;
图17是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的方法的流程图。
具体实施方式
现在将详细地参照示例实施例,其示例在附图中示出,其中,相同的标号始终表示相同的元件。以下通过参照附图描述示例性实施例以解释本公开。
图1是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图1,对音频/语音信号进行编码的设备可包括:信号变换单元110、心理声学建模单元120、时域编码单元130、量化单元140、参数立体声处理单元150、高频信号处理单元160和复用单元170。
信号变换单元110可将输入的音频信号或语音信号变换为高分辨率信号(high frequentcy resoluteion signal)和/或高时间分辨率信号(high temporalresolution signal)。
心理声学建模单元120可控制信号变换单元110将输入的音频信号或语音信号变换为高频率分辨率信号和/或高时间分辨率信号。
具体地,心理声学建模单元120可计算用于量化的掩蔽阈值(maskingthreshold),并至少使用计算的掩蔽阈值来控制信号变换单元110将输入的音频信号或语音信号变换为高频率分辨率信号和/或高时间分辨率信号。
时域编码单元130可至少使用语音建模来对由信号变换单元110变换的信号进行编码。
具体地,心理声学建模单元120可将信息信号提供给时域编码单元130以控制时域编码单元130。
在这种情况下,时域编码单元130可包括预测单元(未示出)。预测单元可通过对由信号变换单元110变换的信号应用语音建模并去除相关信息来对数据进行编码。此外,预测单元可包括短时预测器和长时预测器。
量化单元140可对从信号变换单元110和/时域编码单元130输出的信号进行量化和编码。
在这种情况下,量化单元140可包括码激励线性预测(CELP)单元,用于模拟去除了相关信息的信号。在图1中未示出CELP单元。
参数立体声处理单元150可处理输入的音频信号或语音信号的立体声信息。高频信号处理单元160可处理输入的音频信号或语音信号的高频信息。
以下,将更详细地描述对音频/语音信号进行编码的设备。
信号变换单元110可将频谱系数划分为多个频带。心理声学建模单元120可分析频谱特性并确定多个频带的每个频带的时域分辨率或频域分辨率。
当高时间分辨率适合于特定频带时,可由利用变换方案的反变换单元(如反调制重叠变换(IMLT)单元)来对特定频带中的频谱系数进行变换,可由时域编码单元130对变换的信号进行编码。反变换单元可包括在信号变换单元110中。
在这种情况下,时域编码单元130可包括短时预测器和长时预测器。
当输入的信号是语音信号时,由于提高的时域分辨率,时域编码单元130可有效地反映语音产生单元的特性。具体地,短时预测器可处理从信号变换单元110接收的数据,并可去除时域中的采样点的短时相关信息。此外,长时预测器可处理已执行短时预测的残差信号数据,从而可去除长时相关信息。
量化单元140可计算输入的比特率的步长。可处理量化单元140的量化的采样点和附加信息以去除可能包括(例如)算术编码或霍夫曼编码的统计相关信息。
可以以小于32kbps的比特率来操作参数立体声处理单元150。此外,扩展运动图像专家组(MPEG)立体声处理单元可被用作参数立体声处理单元150。高频信号处理单元160可有效地对高频信号进行编码。
复用单元170可将上述单元中的一个或多个单元的输出信号输出为比特流。可使用压缩方案(如算术编码、霍夫曼编码或任何其它合适的压缩编码)来产生比特流。
图2是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
参照图2,对音频/语音信号进行解码的设备可包括:分辨率确定单元210、时域解码单元220、反量化单元230、反信号变换单元240、高频信号处理单元250和参数立体声处理单元260。
分辨率确定单元210可基于关于时域编码或频域编码的信息,确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。所述信息可包括在比特流中。
反量化单元230可基于分辨率确定单元210的输出信号来对比特流进行反量化。
时域解码单元220可从反量化单元230接收反量化的信号,从比特流中解码出用于反线性预测的附加信息,并至少使用所述附加信息和所述反量化的信号来恢复高时间分辨率信号。
反信号变换单元240可将来自时域解码单元220的输出信号和/或来自反量化单元230的反量化的信号反变换到时域的音频信号或语音信号。
反频变调制重叠变换(FV-MLT)可以是反信号变换单元240。
高频信号处理单元250可处理反变换的信号的高频信号,参数立体声处理单元260可处理反变换的信号的立体声信息。
可将比特流输入到反量化单元230、高频信号处理单元250和参数立体声处理单元260以对比特流进行解码。
图3是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图3,对音频/语音信号进行编码的设备可包括:信号变换单元310、心理声学建模单元320、时间噪声(temporalnoise)整形单元330、高码率(highrate)立体声单元340、量化单元350、高频信号处理单元360和复用单元370。
信号变换单元310可将输入的音频信号或语音信号变换为高频率分辨率信号和/或高时间分辨率信号。
改进离散余弦变换(MDCT)可被用作信号变换单元310。
心理声学建模单元320可控制信号变换单元310将输入的音频信号或语音信号变换为高频率分辨率信号和/或高时间分辨率信号。
时间噪声整形单元330可对变换的信号的时域噪声进行整形。
高码率立体声单元340可对变换的信号的立体声信息进行编码。
量化单元350可对从时间噪声整形单元330和/或高码率立体声单元340输出的信号进行量化。
高频信号处理单元360可处理音频信号或语音信号的高频信号。
复用单元370可将上述的单元的每个单元的输出信号输出为比特流。可使用压缩方案(如算术编码、霍夫曼编码或任何其它适合的编码)来产生比特流。
图4是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
参照图4,对音频/语音信号进行解码的设备可包括:反量化单元410、高码率立体声系统/解码器420、时间噪声整形器/解码器430、反信号变换单元440和高频信号处理单元450。
反量化单元410可对比特流进行反量化。
高码率立体声系统/解码器420可对反量化的信号进行解码。时间噪声整形器/解码器430可对在对音频/语音信号进行编码的设备中执行时域整形的信号进行解码。
反信号变换单元440可将解码的信号反变换到时域的音频信号或语音信号。反MDCT可被用作反信号变换单元440。
高频信号处理单元450可处理反变换的解码的信号的高频信号。
图5是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图5,CELP单元可包括在对音频/语音信号进行编码的设备的时域编码单元520中,然而,CELP单元可包括在图1中的量化单元140中。
也就是说,时域编码单元520可包括:短时预测器、长时预测器和CELP单元。CELP单元可指示模拟去除了相关信息的信号的激励建模模块。
当信号变换单元在心理声学建模单元的控制下,将输入的音频信号或语音信号变换为高时间分辨率信号时,时域编码单元130可在不在频谱量化单元510中对高时间分辨率信号进行量化的情况下,或作为可选,通过使在频谱量化单元510中对高时间分辨率信号的量化最小化,来对变换的高时域分辨信号进行编码。
包括在时域编码单元520中的CELP单元可对短时相关信息和长时相关信息的残差信号进行编码。
图6是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图6,图1中示出的对音频/语音信号进行编码的设备还可包括切换单元610。
切换单元610可至少使用关于时域编码或频域编码的信息来选择任何一个或多个量化单元620的量化和时域编码单元630的编码。量化单元620可以是频谱量化单元。
图7是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
参照图7,图2中示出的对音频/语音信号进行解码的设备还可包括切换单元710。切换单元710可至少根据分辨率确定单元的确定来控制切换到时域解码单元730或频谱反量化单元720。
图8是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图8,图1中示出的对音频/语音信号进行编码的设备还可包括下采样单元810。
下采样单元810可将输入的信号下采样为低频信号。可通过下采样来产生低频信号,当低频信号处于高码率和低码率的双重码率时,可执行下采样。也就是说,当以与高频信号处理单元的采样率的一半或四分之一相应的低采样率操作低频信号编码方案的采样频率时,可利用低频信号。当参数立体声处理单元包括在对音频/语音信号进行编码的设备中时,可在参数立体声处理单元执行正交镜像滤波器(QMF)合成时执行下采样。
在这种情况下,高码率可以是高于64kbps的码率,低码率可以是低于64kbps的码率。
图9是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
分辨率确定单元910可至少部分基于关于时域编码或频域编码的信息,确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。所述信息可包括在比特流中。
反量化单元920可基于分辨率确定单元910的输出信号来对比特流进行反量化。
时域解码单元930可从反量化单元920接收编码的残差信号,从比特流中解码出用于反线性预测的附加信息,并使用所述附加信息和所述残差信号来恢复高时间分辨率信号。
反信号变换单元940可将来自时域解码单元930的输出信号和/或来自反量化单元920的反量化的信号反变换到时域的音频信号或语音信号。
在这种情况下,高频信号处理单元950可在图9的对音频/语音信号进行解码的设备中执行上采样。
图10是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图10,图5中示出的对音频/语音信号进行编码的设备还可包括下采样单元1010。也就是说,可通过下采样产生低频信号。
当应用参数立体声处理单元1020时,在参数立体声处理单元1020可执行QMF合成以产生缩混(downmix)信号时,下采样单元1010可执行下采样。时域编码单元1030可包括短时预测器、长时预测器和CELP单元。
图11是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
分辨率确定单元1110可基于关于时域编码或频域编码的信息,确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。所述信息可包括在比特流中。
当分辨率确定单元1110确定当前帧信号是高频率分辨率信号时,频谱反量化单元1130可至少部分基于分辨率确定单元1110的输出信号来对比特流进行反量化。
当分辨率确定单元1110确定当前帧信号是高时间分辨率信号时,时域解码单元1120可恢复高时间分辨率信号。
反信号变换单元1140可将来自时域解码单元1120的输出信号和/或来自频谱反量化单元1130的反量化的信号反变换到时域的音频信号或语音信号。
此外,高频信号处理单元1150可在图11的对音频/语音信号进行解码的设备中执行上采样。
图12是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图12,图6中示出的对音频/语音信号进行编码的设备还包括下采样单元1210。也就是说,可通过下采样来产生低频信号。
当应用参数立体声处理单元1220时,在参数立体声处理单元1220执行QMF合成时,下采样单元1210可执行下采样。
图12的对音频/语音信号进行编码的设备的上/下采样因子可以是(例如)高频信号处理单元的采样率的一半或四分之一。也就是说,当以48kHz输入信号时,可通过上/下采样使用24kHz或12kHz。
图13是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
参照图13,图2中示出的对音频/语音信号进行解码的设备还可包括切换单元。也就是说,切换单元可控制切换到时域解码单元1320或频谱反量化单元1310。
图14是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图14,图1中示出的对音频/语音信号进行编码的设备和图3中示出的对音频/语音信号进行编码的设备可至少部分组合。
也就是说,当作为低码率确定单元1430基于预定的低码率和高码率的确定的结果,变换的信号处于低码率时,可操作信号变换单元1410、时域编码单元1440和量化单元1470。当变换的信号处于高码率时,可操作信号变换单元1410、时间噪声整形单元1450和高码率立体声单元1460。
可基于预定标准打开/关闭参数立体声处理单元1481和高频信号处理单元1491。此外,可不同时操作高码率立体声单元1460和参数立体声处理单元1481。此外,可基于预定信息在高频信号处理确定单元1490和参数立体声处理确定单元1480的控制下,分别操作高频信号处理单元1491和参数立体声处理单元1481。
图15是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
参照图15,图2中示出的对音频/语音信号进行解码的设备和图4中示出的对音频/语音信号进行解码的设备可至少部分组合。
也就是说,当作为低码率确定单元1510的确定的结果,变换的信号处于高码率时,可操作高码率立体声系统/解码器1520、时间噪声整形器/解码器1530和反信号变换单元1540。当变换的信号处于低码率时,可操作分辨率确定单元1550、时域解码单元1560和高频信号处理单元1570。此外,可基于预定信息在高频信号处理确定单元和参数立体声处理确定单元的控制下,分别操作高频信号处理单元1570和参数立体声处理单元1580。
图16是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的方法的流程图。
在操作S 1610中,输入的音频信号或语音信号可被变换为频域。在操作S 1620中,可确定是否要执行变换到时域。
还可进一步包括对输入的音频信号或语音信号进行下采样的操作。
至少根据操作S 1620中确定的结果,在操作S 1630中,输入的音频信号或语音信号可被变换为高频率分辨率信号和/或高时间分辨率信号。
也就是说,当将要执行变换到时域时,在操作S 1630中,输入的音频信号或语音信号可被变换为高时间分辨率信号并可被量化。当将不执行变换到时域时,在操作S 1640,输入的音频信号或语音信号可被量化并被编码。
图17是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的方法的流程图。
在操作S 1710中,可确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。
在这种情况下,所述确定可基于关于时域编码或频域编码的信息,并且所述信息可包括在比特流中。
在操作S 1720中,可对比特流进行反量化。
在操作S 1730中,可接收反量化的信号,可从比特流中解码出用于反线性预测的附加信息,并且可使用所述附加信息和编码的残差信号来恢复高时间分辨率信号。
在操作S 1740中,可将从时域解码单元输出的信号和/或来自反量化单元的反量化的信号反变换到时域的音频信号或语音信号。
本总体发明构思还可实现为计算机可读介质上的计算机可读代码。计算机可读介质可包括计算机可读记录介质和计算机可读传输介质。计算机可读记录介质是可将数据存储为其后可由计算机系统读取的程序的任何数据存储装置。所述计算机可读记录介质的示例包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光学数据存储装置。所述计算机可读记录介质也可分布于联网的计算机系统上,以便所述计算机可读代码以分布方式被存储和执行。计算机可读传输介质可通过载波或信号发送(例如,通过因特网的有线数据传输或无线数据传输)。此外,本总体发明构思所属的领域的程序员可容易解释实现本总体发明构思的功能程序、代码和代码段。
虽然已经示出和描述了本总体发明构思的若干示例实施例,但是本领域的技术人员应该理解,在不脱离本总体发明构思的原理和精神的范围内可对这些示例实施例进行改变,本总体发明构思的范围由权利要求及其等同物限定。

Claims (9)

1.一种用于对音频或语音信号进行解码的方法,所述方法包括:
基于关于时域编码或频域编码的第一信息,确定当前帧信号是在频域中被编码还是在时域中被编码;
当确定当前帧信号是在频域中被编码时,对在频域中被编码的当前帧信号进行无损解码和反量化,并将被无损解码并被反量化的信号反变换为时域信号;
当确定当前帧信号是在时域中被编码时,通过使用关于线性预测的第二信息来重建在时域中被编码的当前帧信号;
使用被反变换的信号或被重建的信号来产生高频带信号。
2.如权利要求1所述的方法,还包括:
从高频带信号以及被反变换的信号或被重建的信号产生立体声信号。
3.如权利要求1所述的方法,其中,重建在时域中被编码的当前帧信号的步骤包括:
通过至少使用长期预测因子来重建在时域中被编码的当前帧信号。
4.如权利要求1所述的方法,还包括:
当确定当前帧信号是在频域中被编码时,对被解码并被反量化的信号执行时间噪声整形。
5.一种用于对音频或语音信号进行解码的设备,所述设备包括:
确定单元,基于包括在比特流中的编码信息,确定信号是在频域中被编码还是在时域中被编码;
频域解码单元,当确定单元确定信号是在频域中被编码时,对信号进行无损解码和反量化;
时域解码单元,当确定单元确定信号是在时域中被编码时,通过使用线性预测来重建信号;
反变换单元,将被解码并被反量化的信号反变换为时域信号。
6.如权利要求5所述的设备,还包括:
高频产生单元,使用被反变换的信号或被重建的信号产生高频带信号。
7.如权利要求6所述的设备,还包括:
立体声处理单元,从高频带信号以及被反变换的信号或被重建的信号产生立体声信号。
8.如权利要求5所述的设备,其中,时域解码单元被构造为:通过至少使用长期预测因子来重建在时域中被编码的信号。
9.如权利要求5所述的设备,还包括:
时间噪声整形单元,当确定单元确定信号是在频域中被编码时,对被解码并被反量化的信号执行时间噪声整形。
CN201610509620.7A 2008-07-14 2009-07-14 对音频/语音信号进行编码和解码的方法和设备 Active CN105913851B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020080068377A KR101756834B1 (ko) 2008-07-14 2008-07-14 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
KR10-2008-0068377 2008-07-14
CN200980135987.5A CN102150202B (zh) 2008-07-14 2009-07-14 对音频/语音信号进行编码和解码的方法和设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200980135987.5A Division CN102150202B (zh) 2008-07-14 2009-07-14 对音频/语音信号进行编码和解码的方法和设备

Publications (2)

Publication Number Publication Date
CN105913851A true CN105913851A (zh) 2016-08-31
CN105913851B CN105913851B (zh) 2019-12-24

Family

ID=41505940

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201610509620.7A Active CN105913851B (zh) 2008-07-14 2009-07-14 对音频/语音信号进行编码和解码的方法和设备
CN200980135987.5A Active CN102150202B (zh) 2008-07-14 2009-07-14 对音频/语音信号进行编码和解码的方法和设备
CN201610515415.1A Active CN105957532B (zh) 2008-07-14 2009-07-14 对音频/语音信号进行编码和解码的方法和设备

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN200980135987.5A Active CN102150202B (zh) 2008-07-14 2009-07-14 对音频/语音信号进行编码和解码的方法和设备
CN201610515415.1A Active CN105957532B (zh) 2008-07-14 2009-07-14 对音频/语音信号进行编码和解码的方法和设备

Country Status (10)

Country Link
US (3) US8532982B2 (zh)
EP (1) EP2313888A4 (zh)
JP (1) JP2011528135A (zh)
KR (1) KR101756834B1 (zh)
CN (3) CN105913851B (zh)
BR (1) BRPI0916449A8 (zh)
IL (1) IL210664A (zh)
MX (1) MX2011000557A (zh)
MY (1) MY154100A (zh)
WO (1) WO2010008185A2 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090006081A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd. Method, medium and apparatus for encoding and/or decoding signal
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
CA2793140C (en) 2010-04-09 2016-05-31 Dolby International Ab Mdct-based complex prediction stereo coding
BR112016004299B1 (pt) * 2013-08-28 2022-05-17 Dolby Laboratories Licensing Corporation Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida
CN103473836B (zh) * 2013-08-30 2015-11-25 福建星网锐捷通讯股份有限公司 一种面向安全的具有声音变调功能的室内机及其智能楼宇对讲系统
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
CN105957533B (zh) * 2016-04-22 2020-11-10 杭州微纳科技股份有限公司 语音压缩方法、语音解压方法及音频编码器、音频解码器
US10141009B2 (en) 2016-06-28 2018-11-27 Pindrop Security, Inc. System and method for cluster-based audio event detection
US9824692B1 (en) 2016-09-12 2017-11-21 Pindrop Security, Inc. End-to-end speaker recognition using deep neural network
US10553218B2 (en) 2016-09-19 2020-02-04 Pindrop Security, Inc. Dimensionality reduction of baum-welch statistics for speaker recognition
CA3179080A1 (en) 2016-09-19 2018-03-22 Pindrop Security, Inc. Channel-compensated low-level features for speaker recognition
US10325601B2 (en) 2016-09-19 2019-06-18 Pindrop Security, Inc. Speaker recognition in the call center
US10397398B2 (en) 2017-01-17 2019-08-27 Pindrop Security, Inc. Authentication using DTMF tones
CN108768587B (zh) * 2018-05-11 2021-04-27 Tcl华星光电技术有限公司 编码方法、设备及可读存储介质
US11355103B2 (en) 2019-01-28 2022-06-07 Pindrop Security, Inc. Unsupervised keyword spotting and word discovery for fraud analytics
US11019201B2 (en) 2019-02-06 2021-05-25 Pindrop Security, Inc. Systems and methods of gateway detection in a telephone network
WO2020164751A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
US11646018B2 (en) 2019-03-25 2023-05-09 Pindrop Security, Inc. Detection of calls from voice assistants
US12015637B2 (en) 2019-04-08 2024-06-18 Pindrop Security, Inc. Systems and methods for end-to-end architectures for voice spoofing detection
CN111341330B (zh) * 2020-02-10 2023-07-25 科大讯飞股份有限公司 音频编解码方法、存取方法及其相关设备及存储装置
US20230230605A1 (en) * 2020-08-28 2023-07-20 Google Llc Maintaining invariance of sensory dissonance and sound localization cues in audio codecs

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3342996B2 (ja) * 1995-08-21 2002-11-11 三星電子株式会社 多チャネルオーディオ符号化器及び符号化方法
JP2005141121A (ja) * 2003-11-10 2005-06-02 Matsushita Electric Ind Co Ltd オーディオ再生装置
CN1787078A (zh) * 2005-10-25 2006-06-14 芯晟(北京)科技有限公司 一种基于量化信号域的立体声及多声道编解码方法与系统
CN101136202A (zh) * 2006-08-29 2008-03-05 华为技术有限公司 音频信号处理系统、方法以及音频信号收发装置
CN101305423A (zh) * 2005-11-08 2008-11-12 三星电子株式会社 自适应的基于时间/频率的音频编码和解码设备和方法
CN101583994A (zh) * 2006-11-17 2009-11-18 三星电子株式会社 对音频和/或语音信号进行编码和/或解码的方法和设备

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
JP3158932B2 (ja) * 1995-01-27 2001-04-23 日本ビクター株式会社 信号符号化装置及び信号復号化装置
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19730129C2 (de) * 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
CA2246532A1 (en) * 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
US6975254B1 (en) * 1998-12-28 2005-12-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Methods and devices for coding or decoding an audio signal or bit stream
ATE341074T1 (de) 2000-02-29 2006-10-15 Qualcomm Inc Multimodaler mischbereich-sprachkodierer mit geschlossener regelschleife
US6947888B1 (en) 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP4399185B2 (ja) * 2002-04-11 2010-01-13 パナソニック株式会社 符号化装置および復号化装置
WO2003085644A1 (en) * 2002-04-11 2003-10-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
CN1922654A (zh) * 2004-02-17 2007-02-28 皇家飞利浦电子股份有限公司 音频分发系统、音频编码器、音频解码器及其操作方法
WO2005096273A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Ameliorations apportees a un procede et un dispositif de codage/decodage audio
CN1677490A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
WO2005096508A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Equipement de codage et de decodage audio ameliore, procede associe
KR101037931B1 (ko) 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
KR100634506B1 (ko) * 2004-06-25 2006-10-16 삼성전자주식회사 저비트율 부호화/복호화 방법 및 장치
CN101010726A (zh) * 2004-08-27 2007-08-01 松下电器产业株式会社 音频解码器、方法以及程序
US8019087B2 (en) * 2004-08-31 2011-09-13 Panasonic Corporation Stereo signal generating apparatus and stereo signal generating method
US7548853B2 (en) 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
KR101237413B1 (ko) * 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
US7809018B2 (en) * 2005-12-16 2010-10-05 Coding Technologies Ab Apparatus for generating and interpreting a data stream with segments having specified entry points
ATE429118T1 (de) * 2005-12-16 2009-05-15 Dolby Sweden Ab Vorrichtung zum erzeugen und interpretieren eines datenstroms mit einer reihe von segmenten unter verwendung von daten in nachfolgenden datenrahmen
KR100964402B1 (ko) 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
KR100883656B1 (ko) 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
RU2439721C2 (ru) * 2007-06-11 2012-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
EP2201566B1 (en) * 2007-09-19 2015-11-11 Telefonaktiebolaget LM Ericsson (publ) Joint multi-channel audio encoding/decoding
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3342996B2 (ja) * 1995-08-21 2002-11-11 三星電子株式会社 多チャネルオーディオ符号化器及び符号化方法
JP2005141121A (ja) * 2003-11-10 2005-06-02 Matsushita Electric Ind Co Ltd オーディオ再生装置
CN1787078A (zh) * 2005-10-25 2006-06-14 芯晟(北京)科技有限公司 一种基于量化信号域的立体声及多声道编解码方法与系统
CN101305423A (zh) * 2005-11-08 2008-11-12 三星电子株式会社 自适应的基于时间/频率的音频编码和解码设备和方法
CN101136202A (zh) * 2006-08-29 2008-03-05 华为技术有限公司 音频信号处理系统、方法以及音频信号收发装置
CN101583994A (zh) * 2006-11-17 2009-11-18 三星电子株式会社 对音频和/或语音信号进行编码和/或解码的方法和设备

Also Published As

Publication number Publication date
IL210664A0 (en) 2011-03-31
US20160254005A1 (en) 2016-09-01
US9728196B2 (en) 2017-08-08
US9355646B2 (en) 2016-05-31
US8532982B2 (en) 2013-09-10
CN105957532B (zh) 2020-04-17
CN102150202B (zh) 2016-08-03
IL210664A (en) 2014-07-31
MX2011000557A (es) 2011-03-15
US20140012589A1 (en) 2014-01-09
EP2313888A4 (en) 2016-08-03
MY154100A (en) 2015-04-30
KR20100007651A (ko) 2010-01-22
JP2011528135A (ja) 2011-11-10
US20100010807A1 (en) 2010-01-14
WO2010008185A2 (en) 2010-01-21
CN105913851B (zh) 2019-12-24
CN102150202A (zh) 2011-08-10
BRPI0916449A8 (pt) 2017-11-28
EP2313888A2 (en) 2011-04-27
CN105957532A (zh) 2016-09-21
KR101756834B1 (ko) 2017-07-12
WO2010008185A3 (en) 2010-05-27

Similar Documents

Publication Publication Date Title
CN105913851A (zh) 对音频/语音信号进行编码和解码的方法和设备
JP6941643B2 (ja) 全帯域ギャップ充填を備えた周波数ドメインプロセッサと時間ドメインプロセッサとを使用するオーディオ符号器及び復号器
US11705137B2 (en) Apparatus for encoding and decoding of integrated speech and audio
JP6838091B2 (ja) 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器
KR101664434B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
Neuendorf et al. Unified speech and audio coding scheme for high quality at low bitrates
JP6126006B2 (ja) 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法
US20110202354A1 (en) Low Bitrate Audio Encoding/Decoding Scheme Having Cascaded Switches
TW200532646A (en) Classification of audio signals
CN102177426A (zh) 多分辨率切换音频编码/解码方案
JP2013508761A (ja) マルチモードオーディオコーデックおよびそれに適応されるcelp符号化
MX2011000373A (es) Aparato y metodo para la codificacion/decodificacion de una señal de audio utilizando un esquema de conmutacion de generacion de señal ajena.
MX2011000383A (es) Esquema de codificacion/decodificacion de audio a baja tasa de bits con pre-procesamiento comun.
CN101432802A (zh) 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备
TW201214415A (en) Low-delay unified speech and audio codec
JP5355387B2 (ja) 符号化装置および符号化方法
US7197454B2 (en) Audio coding
KR20080092823A (ko) 부호화/복호화 장치 및 방법
KR101455648B1 (ko) 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant