KR20220013024A - 복호화 장치 및 방법, 및 프로그램 - Google Patents

복호화 장치 및 방법, 및 프로그램 Download PDF

Info

Publication number
KR20220013024A
KR20220013024A KR1020227002138A KR20227002138A KR20220013024A KR 20220013024 A KR20220013024 A KR 20220013024A KR 1020227002138 A KR1020227002138 A KR 1020227002138A KR 20227002138 A KR20227002138 A KR 20227002138A KR 20220013024 A KR20220013024 A KR 20220013024A
Authority
KR
South Korea
Prior art keywords
gain
value
interpolation
sample position
sample
Prior art date
Application number
KR1020227002138A
Other languages
English (en)
Other versions
KR102513009B1 (ko
Inventor
유키 야마모토
도루 치넨
히로유키 혼마
런유 시
Original Assignee
소니그룹주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니그룹주식회사 filed Critical 소니그룹주식회사
Priority to KR1020237009428A priority Critical patent/KR20230042410A/ko
Publication of KR20220013024A publication Critical patent/KR20220013024A/ko
Application granted granted Critical
Publication of KR102513009B1 publication Critical patent/KR102513009B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G11/00Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
    • H03G11/008Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Stereophonic System (AREA)

Abstract

본 기술은, 보다 고음질의 음성을 얻을 수 있도록 하는 복호화 장치 및 방법, 및 프로그램에 관한 것이다. 비다중화 회로는, 입력 부호열을 게인 부호열과 신호 부호열에 비다중화한다. 신호 복호화 회로는, 신호 부호열을 복호화하여 시계열 신호를 출력한다. 게인 복호화 회로는, 게인 부호열을 복호화한다. 즉, 게인 복호화 회로는, 게인 부호열로부터, 시계열 신호의 소정의 게인 샘플 위치의 게인 값 및 게인 기울기 값과, 보간 모드 정보를 판독한다. 그리고, 보간 처리부는, 게인 값 및 게인 기울기 값에 기초하여, 보간 모드 정보에 따라, 선형 보간 또는 비선형 보간에 의해, 2개의 게인 샘플 위치 사이의 각 샘플 위치의 게인 값을 구한다. 게인 적용 회로는, 게인 값에 기초하여 시계열 신호의 게인 조정을 행한다. 본 기술은, 복호화 장치에 적용할 수 있다.

Description

복호화 장치 및 방법, 및 프로그램{DECODING DEVICE, METHOD, AND PROGRAM}
본 기술은, 복호화 장치 및 방법, 및 프로그램에 관한 것으로, 특히 보다 고음질의 음성을 얻을 수 있도록 한 복호화 장치 및 방법, 및 프로그램에 관한 것이다.
종래, MPEG(Moving Picture Experts Group) AAC(Advanced Audio Coding)(ISO/IEC14496-3:2001)의 오디오 부호화 기술에서는, 비트 스트림 중에 다운 믹스나 DRC(Dinamic Range Compression)의 보조 정보를 기록하고, 재생측에서 그 환경에 따라 보조 정보를 사용할 수 있다(예를 들어, 비특허문헌 1 참조).
이러한 보조 정보를 사용하면, 재생측에 있어서 음성 신호를 다운 믹스하거나, DRC에 의해 적절한 음량 제어를 행하거나 할 수 있다.
Information technology Coding of audiovisual objects Part 3: Audio(ISO/IEC 14496-3:2001)
예를 들어 상술한 부호화 기술에서는, DRC의 보조 정보로서 음량 제어를 위한 DRC 게인 정보를 음성 신호의 프레임 단위로 지정할 수 있고, 재생측에 있어서는, 이 DRC 게인 정보에 기초하여 음성 신호의 음량 보정을 행함으로써, 적절한 음량의 음성을 얻을 수 있다.
그러나, 이러한 DRC 게인 정보에 의해 나타나는 게인은, 시간 신호인 음성 신호의 1프레임 내의 각 샘플에 대하여 동일값이 되어 버린다. 즉, 1 프레임에 포함되는 전체 샘플이 동일한 게인으로 보정된다.
그로 인해, 예를 들어 프레임 간에서 DRC 게인 정보에 의해 나타나는 게인의 크기가 크게 변화하면, 음성 신호의 시간 파형의 프레임 간의 부분이 불연속으로 되어 버려, 청감 상의 열화가 발생해 버린다.
본 기술은, 이러한 상황을 감안하여 이루어진 것이며, 보다 고음질의 음성을 얻을 수 있도록 하는 것이다.
본 기술의 제1 측면의 복호화 장치는, 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값을 판독하는 게인 판독부와, 상기 시계열 신호의 각 샘플 위치의 상기 게인 값을 선형 보간에 의해 구할지, 또는 비선형 보간에 의해 구할지를 나타내는 보간 정보를 판독하는 보간 정보 판독부와, 상기 게인 샘플 위치의 상기 게인 값에 기초하여, 상기 시계열 신호의 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을, 상기 보간 정보에 따라서 선형 보간 또는 비선형 보간에 의해 구하는 보간 처리부를 구비한다.
상기 게인 판독부에는, 상기 게인 샘플 위치에 있어서의 상기 게인 값의 기울기를 나타내는 게인 기울기 값을 더 판독시키고, 상기 보간 처리부에는, 비선형 보간에 의해 상기 게인 값을 구할 경우, 상기 게인 샘플 위치의 상기 게인 값 및 상기 게인 기울기 값에 기초하여, 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을 구하게 할 수 있다.
복호화 장치에는, 상기 게인 값이 소정의 하한값 이상의 값 또는 소정의 상한값 이하의 값이 되도록, 비선형 보간에 의해 구해진 상기 게인 값에 대하여 리미팅 처리를 실시하는 리미팅 처리부를 더 구비할 수 있다.
상기 리미팅 처리부에는, 0을 하한값으로 하는 리미팅 처리, 1을 하한값으로 하는 리미팅 처리, 또는 1을 상한값으로 하는 리미팅 처리를 실시하게 할 수 있다.
복호화 장치에는, 상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선을 구하고, 상기 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차를 구하는 연산부를 더 구비하고, 상기 보간 처리부에는, 상기 보간 정보가 선형 보간에 의해 상기 게인 값을 구하는 것을 나타내는 정보인 경우, 선형 보간에 의해 상기 게인 값을 구하게 하고, 상기 보간 정보가 비선형 보간에 의해 상기 게인 값을 구하는 것을 나타내는 정보인 경우, 상기 차에 따라서 비선형 보간 또는 선형 보간에 의해 상기 게인 값을 구하게 할 수 있다.
본 기술의 제1 측면의 복호화 방법 또는 프로그램은, 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값을 판독하고, 상기 시계열 신호의 각 샘플 위치의 상기 게인 값을 선형 보간에 의해 구할지, 또는 비선형 보간에 의해 구할지를 나타내는 보간 정보를 판독하고, 상기 게인 샘플 위치의 상기 게인 값에 기초하여, 상기 시계열 신호의 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을, 상기 보간 정보에 따라서 선형 보간 또는 비선형 보간에 의해 구하는 스텝을 포함한다.
본 기술의 제1 측면에 있어서는, 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값이 판독되고, 상기 시계열 신호의 각 샘플 위치의 상기 게인 값을 선형 보간에 의해 구할지, 또는 비선형 보간에 의해 구할지를 나타내는 보간 정보가 판독되고, 상기 게인 샘플 위치의 상기 게인 값에 기초하여, 상기 시계열 신호의 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값이, 상기 보간 정보에 따라서 선형 보간 또는 비선형 보간에 의해 구해진다.
본 기술의 제2 측면의 복호화 장치는, 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값, 및 상기 게인 값의 기울기를 나타내는 게인 기울기 값을 판독하는 게인 판독부와, 상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선을 구하고, 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차를 구하는 연산부와, 상기 차에 따라, 상기 시계열 신호의 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을 선형 보간 또는 비선형 보간에 의해 구하는 보간 처리부를 구비한다.
본 기술의 제2 측면의 복호화 방법 또는 프로그램은, 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값, 및 상기 게인 값의 기울기를 나타내는 게인 기울기 값을 판독하고, 상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선을 구하고, 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차를 구하고, 상기 차에 따라, 상기 시계열 신호의 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을 선형 보간 또는 비선형 보간에 의해 구하는 스텝을 포함한다.
본 기술의 제2 측면에 있어서는, 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값, 및 상기 게인 값의 기울기를 나타내는 게인 기울기 값이 판독되고, 상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선이 구해지고, 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차가 구해지고, 상기 차에 따라, 상기 시계열 신호의 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값이 선형 보간 또는 비선형 보간에 의해 구해진다.
본 기술의 제1 측면 및 제2 측면에 의하면, 보다 고음질의 음성을 얻을 수 있다.
또한, 여기에 기재된 효과는 반드시 한정되는 것은 아니며, 본 개시 중에 기재된 어느 효과들 일 수 있다.
도 1은 게인의 선형 보간에 대하여 설명하는 도면이다.
도 2는 게인 파형의 예를 도시하는 도면이다.
도 3은 게인의 비선형 보간에 대하여 설명하는 도면이다.
도 4는 부호화 장치의 구성예를 도시하는 도면이다.
도 5는 부호화 처리를 설명하는 흐름도이다.
도 6은 DRC 특성을 도시하는 도면이다.
도 7은 복호화 장치의 구성예를 도시하는 도면이다.
도 8은 복호화 처리를 설명하는 흐름도이다.
도 9는 게인 복호화 처리를 설명하는 흐름도이다.
도 10은 복호화 장치의 구성예를 도시하는 도면이다.
도 11은 게인 복호화 처리를 설명하는 흐름도이다.
도 12는 게인 파형의 보간에 대하여 설명하는 도면이다.
도 13은 게인 파형의 보간에 대하여 설명하는 도면이다.
도 14는 게인 파형의 보간에 대하여 설명하는 도면이다.
도 15는 복호화 장치의 구성예를 도시하는 도면이다.
도 16은 게인 복호화 처리를 설명하는 흐름도이다.
도 17은 게인 파형의 보간에 대하여 설명하는 도면이다.
도 18은 게인 복호화 처리를 설명하는 흐름도이다.
도 19는 컴퓨터의 구성예를 도시하는 도면이다.
이하, 도면을 참조하여, 본 기술을 적용한 실시 형태에 대하여 설명한다.
<제1 실시 형태>
<본 기술의 개요>
본 기술은, 음성 신호를 재생측에서 음량 보정할 때의 게인 값을 부호화하고, 게인 값의 부호화에 의해 얻어진 게인 부호열과, 음성 신호의 부호화에 의해 얻어진 신호 부호열을 다중화하여 전송하는 기술, 및 이들 게인 부호열과 신호 부호열을 복호화하여, 음성 신호의 음량 보정을 행하는 기술에 관한 것이다.
본 기술에서는, 음량 보정을 위한 게인 값으로서, 음성 신호의 프레임 내의 샘플마다 임의의 값을 지정함으로써, 보다 매끄러운 시간 파형의 음성을 얻을 수 있게 이루어져 있다. 이에 의해, 위화감이 없는 고음질의 음성을 얻을 수 있다. 여기서, 음량 보정을 위한 게인 값은 dB 값으로 되어도 되고, 리니어 값으로 되어도 되지만, 이하에서는 게인 값이 리니어 값인 것으로 하여 설명을 계속한다.
또한, 게인 값의 부호화 시에, 예를 들어 프레임 내의 각 샘플 위치의 게인 값 중, 게인 파형의 변국점 등의 특징적인 위치나, 소정 간격으로 배열하는 위치의 게인 값 등, 일부의 샘플 위치의 게인 값만을 부호화하여 게인 부호열로 하면, 게인 부호열의 부호량을 삭감할 수도 있다.
이 경우, 게인 부호열의 복호화측에서는, 게인 부호열의 복호화에 의해 얻어진 몇가지 샘플 위치의 게인 값에 기초하여, 원래의 게인 파형을 얻을 필요가 있다.
여기서, 원래의 게인 파형을 얻기 위한 수법으로서, 예를 들어 도 1에 도시하는 바와 같이 선형 보간을 행함으로써, 게인 부호열에 포함되어 있지 않은 샘플 위치의 게인 값을 구하는 수법을 생각할 수 있다.
또한, 도 1에 있어서 종축 및 횡축은, 각각 게인 값, 및 음성 신호의 프레임 내의 샘플 위치를 나타내고 있다.
또한, 이하, 게인 부호열에, 부호화된 게인 값이 포함되어 있는 샘플 위치를, 특히 게인 샘플 위치라고도 칭하는 것으로 한다. 또한, 이하에서는, 게인 부호열에 포함되어 있는 부호화된 샘플 위치 및 게인 값에 의해 표시되는, 게인 파형 상의 점도 간단히 게인 샘플 위치라고도 칭하는 것으로 한다.
도 1의 예에서는, 게인 샘플 위치 G11과 게인 샘플 위치 G12의 정보가 게인 부호열의 복호화에 의해 얻어지고 있다.
여기서, 프레임 내의 k번째의 게인 샘플 위치의 게인 값을 g[k]라 하고, k번째의 게인 샘플 위치로부터 k+1번째의 게인 샘플 위치까지의 샘플 축 방향의 샘플 길이(샘플수)를 T[k]로 나타내는 것으로 한다.
이 경우, k번째의 게인 샘플 위치 G11의 샘플 위치가 n=0이라 하면, 게인 샘플 위치 G11은, 좌표 (0, g[k])로 표시되는 점이 되고, 게인 샘플 위치 G12는, 좌표 (T[k], g[k+1])로 표시되는 점이 된다. 여기서, n은 프레임의 선두로부터 n번째의 샘플 위치인 것을 나타내는 인덱스이다.
또한, 선형 보간에 의해 얻어지는, 게인 샘플 위치 G11과 게인 샘플 위치 G12 사이의 게인 파형은, 직선 L11에 나타내는 파형이 된다. 즉, 게인 샘플 위치 G11과 게인 샘플 위치 G12의 사이에는, 게인 값이 선형으로 변화하는 것으로서 보간에 의해 각 샘플 위치의 게인 값이 구해지고 있다.
그런데, 선형 보간에 의해 게인 파형을 추정하면, 예를 들어 도 2의 곡선 C11에 나타내는 바와 같이, 매끄러운 게인 파형을 부호화하고자 하는 경우에는, 게인 파형의 부호화해야 할 점, 즉 게인 샘플 위치의 수가 많아져 버린다. 또한, 도 2에 있어서, 종축 및 횡축은, 각각 게인 값 및 음성 신호의 프레임 내의 샘플 위치를 나타내고 있다.
이 예에서는, 곡선 C11에 나타내는 게인 파형은 매끄러운 파형으로 되어 있기 때문에, 복호화측에 있어서, 어느 정도의 정밀도로 게인 파형을 재현하고자 하면, 많은 게인 샘플 위치에서의 게인 값의 부호화가 필요해진다. 그러면, 게인 부호열과 신호 부호열을 다중화하여 얻어지는 비트 스트림의 부호량, 즉 비트 레이트가 높아져 버린다.
따라서, 본 기술에서는, 보다 적은 부호량으로 보다 고음질의 음성을 얻을 수 있도록 하기 위해, 선형 보간에 추가하여, 새로이 비선형 보간도 적절히 행하도록 하였다. 즉, 선형 보간과 비선형 보간 중, 보다 적절한 방식이 선택되어 보간 처리가 행해져, 게인 파형이 생성되도록 하였다. 또한, 비선형의 보간은, 예를 들어 2차 함수나 3차 함수로의 보간으로 할 수 있다.
예를 들어, 3차 함수를 이용한 비선형 보간이 행해지는 경우, 도 1에 나타낸 게인 샘플 위치 G11과 게인 샘플 위치 G12 사이의 게인 파형으로서, 도 3의 곡선 C21에 나타내는 파형이 얻어진다. 또한, 도 3에 있어서 종축 및 횡축은, 각각 게인 값 및 음성 신호의 프레임 내의 샘플 위치를 나타내고 있다. 또한, 도 3에 있어서 도 1에서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있고, 그 설명은 적절히 생략한다.
이 예에서는, 게인 부호열에는, 게인 샘플 위치 G11의 샘플 위치, 게인 값, 및 게인 기울기 값을 나타내는 정보와, 게인 샘플 위치 G12의 샘플 위치, 게인 값, 및 게인 기울기 값을 나타내는 정보가 포함되어 있다.
여기서, 게인 기울기 값이란, 원래의 게인 파형의 게인 샘플 위치에 있어서의 기울기를 나타내는 정보이다. 이하에서는, k번째의 게인 샘플 위치의 게인 기울기 값을 s[k]로 나타내는 것으로 한다.
도 3에서는, 화살표 D11이 게인 샘플 위치 G11의 게인 기울기 값 s[k]를 나타내고 있으며, 화살표 D12가 게인 샘플 위치 G12의 게인 기울기 값 s[k+1]을 나타내고 있다.
복호화측에서는, 게인 샘플 위치 G11과 게인 샘플 위치 G12의 사이의 게인 파형이 3차 함수를 이용한 비선형 보간에 의해 구해지고, 그 결과로서 곡선 C21에 나타내는 게인 파형이 얻어지고 있다.
곡선 C21에 나타내는 게인 파형은, 예를 들어 게인 샘플 위치 G11과 게인 샘플 위치 G12를 통과하고, 또한 게인 샘플 위치 G11 및 게인 샘플 위치 G12에 있어서의 기울기가, 각각 s[k] 및 s[k+1]이 되는 3차 함수의 곡선이 된다.
이렇게 적절히, 비선형 보간을 이용함으로써, 게인 파형이 매끄러운 파형인 경우에도, 보다 적은 게인 샘플 위치의 부호화, 즉, 보다 적은 부호량으로 고정밀도로 게인 파형을 재현할 수 있다.
본 기술에서는, 예를 들어 선형 보간과 비선형 보간을 전환하기 위한 파라미터로서, 선형 보간에 의한 보간 방식 또는 비선형 보간에 의한 보간 방식을 나타내는 보간 모드 정보가 게인 부호열에 포함되어 있다. 그리고, 복호화측에서는, 이 보간 모드 정보에 따라서 선형 보간과 비선형 보간의 전환이 행해진다.
여기서 보간 모드 정보는, 예를 들어 선형 보간, 2차 함수에 의한 보간, 3차 함수에 의한 보간을 전환하기 위한 2비트의 인덱스여도 되고, 선형 보간과, 비선형 보간인 3차 함수에 의한 보간을 전환하기 위한 1비트의 플래그여도 된다. 즉, 보간 모드 정보는, 게인 파형을 보간하는 수법을 나타내는 정보라면, 어떤 것이어도 된다.
또한, 본 기술에서는, 보간 모드 정보가 비선형 보간에 의한 보간 방식을 나타내는 정보로 된 경우, 게인 샘플 위치마다, 게인 값에 추가하여 게인 기울기 값이 게인 부호열에 포함되도록 이루어져 있다.
여기서 게인 기울기 값 s[k]는, 1 샘플당 게인 값의 변화를 나타내고 있다. 예를 들어, k번째의 게인 샘플 위치의 게인 기울기 값 s[k]는, k번째의 게인 샘플 위치에 있어서의 게인 파형 위의 점과, k번째의 게인 샘플 위치의 다음 샘플 위치에 있어서의 게인 파형 위의 점을 연결하는 직선의 기울기가 된다. 또한, 게인 기울기 값은, 게인 파형 위의 게인 샘플 위치에 있어서의 기울기를 나타내는 값이라면, 어떻게 구해져도 된다.
또한, 게인 기울기 값이 그대로 게인 부호열에 저장되도록 해도 되고, 게인 기울기 값의 양자화 값이나, 게인 기울기 값의 허프만 부호화 값 등의 엔트로피 부호화 값이 게인 부호열에 저장되도록 해도 된다.
<선형 보간에 대해서>
또한, 2개의 게인 샘플 위치 사이의 각 샘플 위치의 게인 값을 선형 보간하는 방법 및 비선형 보간하는 방법의 구체예에 대하여 설명한다. 먼저, 선형 보간하는 방법에 대하여 설명한다.
보간 모드 정보에 의해 선형 보간이 행해지는 것으로 된 경우, 복호화측에서는, 게인 부호열로부터 게인 샘플 위치마다 게인 값이 판독된다.
여기서, k번째의 게인 샘플 위치의 인덱스를 k라 하고, 게인 부호열로부터 판독된, k번째의 게인 샘플 위치의 게인 값을 g[k]라 한다. 또한, k번째의 게인 샘플 위치로부터 k+1번째의 게인 샘플 위치 사이의 샘플 길이를 T[k]라 하고, k+1번째의 게인 샘플 위치의 샘플 위치를 나타내는 정보로서 샘플 길이 T[k]가 게인 부호열에 포함되어 있는 것으로 한다.
이제, k번째의 게인 샘플 위치가 프레임의 선두 위치, 즉 n=0번째의 샘플 위치인 것으로 한다. 그러한 경우, k번째의 게인 샘플 위치와, k+1번째의 게인 샘플 위치의 사이에 있는, 선두로부터 n번째(단, 0≤n<T[k])에 있는 샘플 n의 게인 값 g_interpolated[n]은, 다음 식 (1)에 의해 산출된다.
Figure pat00001
또한, 식 (1)에 있어서 a[k] 및 b[k]는, 각각 이하의 식 (2) 및 식 (3)에 의해 구해지는 값이 된다.
Figure pat00002
Figure pat00003
즉, a[k] 및 b[k]는, k번째와 k+1번째의 게인 샘플 위치를 연결하는 직선의 기울기와 절편을 나타내고 있다. 따라서, 이 예에서는, 도 1을 참조하여 설명한 바와 같이, k번째와 k+1번째의 게인 샘플 위치의 사이에서는, 게인 값이 선형으로 변화하는 것이 되고, 선형 보간에 의해 각 샘플 n의 게인 값이 구해지고 있다.
<비선형 보간에 대해서>
이어서, k번째와 k+1번째의 게인 샘플 위치 사이의 샘플 n의 게인 값이 비선형 보간에 의해 구해지는 경우에 대하여 설명한다. 여기에서는, 비선형 보간으로서, 3차 함수에 의한 보간이 행해지는 경우를 예로 들어 설명을 계속한다.
보간 모드 정보에 의해 비선형 보간이 행해지는 것으로 된 경우, 복호화측에서는, 게인 부호열로부터 게인 샘플 위치마다 게인 값과 게인 기울기 값이 판독된다.
여기서, 선형 보간에 있어서의 경우와 마찬가지로, k번째의 게인 샘플 위치의 게인 값이 g[k]이고, k번째와 k+1번째의 게인 샘플 위치 사이의 샘플 길이가 T[k]인 것으로 한다. 또한, k번째의 게인 샘플 위치의 게인 기울기 값이 s[k]인 것으로 한다.
이제, k번째의 게인 샘플 위치가 프레임의 선두 위치, 즉 n=0번째의 샘플 위치인 것으로 한다. 그러한 경우, k번째의 게인 샘플 위치와, k+1번째의 게인 샘플 위치와의 사이에 있는, 선두로부터 n번째(단, 0≤n<T[k])에 있는 샘플 n의 게인 값 g_interpolated[n]은, 다음 식 (4)에 의해 산출된다.
Figure pat00004
또한, 식 (4)에 있어서 c[k], d[k], e[k] 및 f[k]는, 각각 이하의 식 (5) 내지 식 (8)에 의해 구해지는 값이 된다.
Figure pat00005
Figure pat00006
Figure pat00007
Figure pat00008
이 예에서는, 도 3을 참조하여 설명한 바와 같이, k번째와 k+1번째의 게인 샘플 위치의 사이에는, 식 (4)에 나타내는 3차 함수에 의해 게인 값이 변화하는 것이 되어, 비선형 보간, 즉, 3차 함수에 의한 보간으로 각 샘플 n의 게인 값이 구해지고 있다.
이상과 같이, 적절히, 비선형 보간에 의해 게인 값을 구함으로써, 예를 들어 도 2에 도시한 바와 같은 매끄러운 게인 파형을, 보다 낮은 비트 레이트로 부호화할 수 있어, 부호화 효율을 향상시킬 수 있다.
<부호화 장치의 구성예>
계속해서, 이상에 있어서 설명한 본 기술을 적용한 구체적인 실시 형태에 대하여 설명한다.
도 4는 본 기술을 적용한 부호화 장치의 일 실시 형태의 구성예를 도시하는 도면이다.
부호화 장치(11)는, 음압 레벨 계산 회로(21), 게인 계산 회로(22), 게인 부호화 회로(23), 신호 부호화 회로(24), 및 다중화 회로(25)를 갖고 있다.
음압 레벨 계산 회로(21)는, 공급된 멀티채널의 음성 신호인 입력 시계열 신호에 기초하여, 입력 시계열 신호를 구성하는 각 채널의 음압 레벨을 계산하고, 그들 채널마다의 음압 레벨의 대표값을 대표 음압 레벨로서 구한다.
또한, 음압 레벨의 대표값은 입력 시계열 신호의 각 프레임에 대하여 구해진다. 또한, 음압 레벨 계산 회로(21)에서 처리 단위가 된 프레임은, 후술하는 신호 부호화 회로(24)에서 처리되는 입력 시계열 신호의 프레임과 동기하여, 신호 부호화 회로(24)에서의 프레임 이하의 길이의 프레임이 된다.
음압 레벨 계산 회로(21)는, 구한 대표 음압 레벨을 게인 계산 회로(22)에 공급한다. 이와 같이 하여 얻어진 대표 음압 레벨은, 예를 들어 11.1ch 등의 소정수의 채널의 음성 신호를 포함하는 입력 시계열 신호의 채널의 대표적인 음압 레벨을 나타내고 있다.
게인 계산 회로(22)는, 음압 레벨 계산 회로(21)로부터 공급된 대표 음압 레벨에 기초하여 게인 값을 계산하고, 게인 부호화 회로(23)에 공급한다.
여기서, 게인 값은, 복호화측에 있어서 입력 시계열 신호를 재생했을 때 최적인 음량의 음성이 얻어지도록, 입력 시계열 신호를 음량 보정할 때의 게인 값을 나타내고 있으며, 게인 계산 회로(22)에서는 프레임 내의 샘플 위치마다 게인 값이 산출된다.
게인 부호화 회로(23)는, 게인 계산 회로(22)로부터 공급된 게인 값을 부호화하고, 그 결과 얻어진 게인 부호열을 다중화 회로(25)에 공급한다.
여기서, 게인 부호열에는, 각 게인 샘플 위치의 게인 값을 얻기 위한 게인 정보와, 보간 모드 정보가 포함되어 있다.
신호 부호화 회로(24)는, 공급된 입력 시계열 신호를 소정의 부호화 방식, 예를 들어 MEPG AAC에 의한 부호화 수법으로 대표되는 일반적인 부호화 수법에 의해 부호화하고, 그 결과 얻어진 신호 부호열을 다중화 회로(25)에 공급한다.
다중화 회로(25)는, 게인 부호화 회로(23)로부터 공급된 게인 부호열과, 신호 부호화 회로(24)로부터 공급된 신호 부호열을 다중화하고, 그 결과 얻어진 출력 부호열을 출력한다.
<부호화 처리의 설명>
이어서, 부호화 장치(11)의 구체적인 동작에 대하여 설명한다.
부호화 장치(11)는, 입력 시계열 신호가 1 프레임분만큼 공급되면, 그 입력 시계열 신호를 부호화하여 출력 부호열을 출력하는 부호화 처리를 행한다. 이하, 도 5의 흐름도를 참조하여, 부호화 장치(11)에 의한 부호화 처리에 대하여 설명한다.
스텝 S11에 있어서, 음압 레벨 계산 회로(21)는, 공급된 입력 시계열 신호에 기초하여, 입력 시계열 신호의 대표 음압 레벨을 산출하고, 게인 계산 회로(22)에 공급한다.
구체적으로는, 음압 레벨 계산 회로(21)는, 입력 시계열 신호를 구성하는 각 채널의 음압 레벨을 계산하고, 그들 채널의 음압 레벨의 대표값을 대표 음압 레벨로 한다.
예를 들어, 음압 레벨의 계산 방법은, 입력 시계열 신호를 구성하는 채널의 음성 신호의 프레임의 최댓값이나 RMS(Root Mean Square) 등으로 되고, 입력 시계열 신호의 프레임에 대해서, 입력 시계열 신호를 구성하는 채널마다 음압 레벨이 구해진다.
또한, 대표 음압 레벨로 되는 대표값의 계산 방법으로서는, 예를 들어 동일한 프레임에 있어서의 각 채널의 음압 레벨 중 최댓값을 대표값으로 하는 수법이나, 각 채널의 음압 레벨로부터 특정한 계산식으로 하나의 대표값으로 산출하는 수법 등을 사용할 수 있다. 구체적으로는, 예를 들어 ITU-R BS. 1770-2(03/2011)에 기재된 라우드니스 계산식을 사용하여 대표값을 산출하는 것이 가능하다.
스텝 S12에 있어서, 게인 계산 회로(22)는, 음압 레벨 계산 회로(21)로부터 공급된 대표 음압 레벨에 기초하여 게인 값을 산출하고, 게인 부호화 회로(23)에 공급한다.
예를 들어 게인 계산 회로(22)는, 상위의 제어 장치에 의해 지정된 DRC 특성에 따라서 게인 값을 산출한다.
상위의 제어 장치에 의해 지정되는 DRC 특성은, 예를 들어 도 6에 도시하는 바와 같은 DRC의 특성으로 할 수 있다. 또한, 도 6에 있어서, 횡축은 입력 음압 레벨(dBFS), 즉 대표 음압 레벨을 나타내고 있고, 종축은 출력 음압 레벨(dBFS), 즉 입력 시계열 신호를 음압 레벨 보정(음량 보정)했을 때의 보정 후의 음압 레벨을 나타내고 있다.
꺾은선 L31 및 꺾은선 L32는, 각각 입출력 음압 레벨의 관계를 나타내고 있다. 예를 들어, 꺾은선 L31에 나타나는 DRC 특성에 의하면, 0dBFS의 대표 음압 레벨의 입력이 있었을 경우, 입력 시계열 신호의 음압 레벨이 -27dBFS가 되도록 음량 보정된다.
한편, 예를 들어 꺾은선 L32에 나타나는 DRC 특성에 의하면, 0dBFS의 대표 음압 레벨의 입력이 있었을 경우, 입력 시계열 신호의 음압 레벨이 -21dBFS가 되도록 음량 보정된다.
게인 계산 회로(22)에서는, 이러한 꺾은선 L31이나 꺾은선 L32에 의해 나타나는 DRC 특성에 따라서 게인 값이 결정된다. 이 게인 값은, 신호 부호화 회로(24)의 프레임과 동기한 게인 파형으로서 출력된다. 즉, 게인 계산 회로(22)에서는, 입력 시계열 신호의 처리 대상이 되어 있는 프레임을 구성하는 샘플마다 게인 값이 산출된다.
보다 구체적으로는, 예를 들어 게인 계산 회로(22)는, 다음 식 (9)를 계산함으로써, 프레임 J에 있어서의 게인 파형 g(J, n)을 구한다.
Figure pat00009
또한, 식 (9)에 있어서, n은 프레임 길이를 N으로 했을 때 0부터 N-1까지의 값을 취하는 샘플의 위치를 나타내고 있고, Gt(J)는 상술한 DRC 특성, 즉 입력 음압 레벨과 출력 음압 레벨에 의해 정해지는 프레임 J에 있어서의 목표 게인을 나타내고 있다.
또한, 식 (9)에 있어서의 A는 다음 식 (10)에 의해 정해지는 값이 된다.
Figure pat00010
식 (10)에 있어서, Fs는 샘플링 주파수(Hz)를 나타내고 있고, Tc(J)는 프레임 J에 있어서의 시상수를 나타내고 있으며, exp(x)는 지수 함수를 나타내고 있다. 또한 식 (9)에 있어서, n=0인 경우에 있어서의 게인 파형 g(J, n-1)로서, 직전의 프레임에 있어서의 마지막 샘플의 게인 값이 사용된다.
도 5의 흐름도의 설명으로 되돌아가, 스텝 S13에 있어서, 게인 부호화 회로(23)는, 게인 부호화 처리를 행하고, 게인 계산 회로(22)로부터 공급된 게인 값을 부호화한다. 그리고, 게인 부호화 회로(23)는, 게인 부호화 처리에 의해 얻어진 게인 부호열을 다중화 회로(25)에 공급한다.
예를 들어, 게인 부호화 회로(23)는, 게인 계산 회로(22)로부터 공급된 각 샘플 위치의 게인 값, 즉 처리 대상 프레임의 게인 파형으로부터 부호화 대상으로 하는 게인 샘플 위치를 추출한다. 예를 들어 게인 파형에 있어서의 변국점 등의 특징적인 샘플이 게인 샘플 위치가 되도록 해도 되고, 소정 간격으로 배열하는 각 샘플이 게인 샘플 위치가 되도록 해도 된다.
게인 부호화 회로(23)는, 이와 같이 하여 추출한 게인 샘플 위치마다, 보간 모드 정보와 게인 정보를 생성한다.
예를 들어 게인 부호화 회로(23)는, 소위 로컬 디코드를 행함으로써, 보간 모드 정보를 생성한다.
즉, 게인 부호화 회로(23)는, 선형 보간과 비선형 보간에 대해서, 각각 보간에 의해 서로 인접하는 2개의 게인 샘플 위치 사이의 게인 파형을 생성하고, 그 게인 파형과 실제의 게인 파형과의 차분을 산출한다. 그리고, 게인 부호화 회로(23)는, 구한 차분이 더 작은 보간 방식을 나타내는 정보를 보간 모드 정보로서 생성한다.
또한, 선형 보간이 행해지도록 할지, 또는 비선형 보간이 행해지도록 할지는, 그 밖의 어떠한 방법으로 정해져도 된다. 예를 들어, 처리 대상의 게인 샘플 위치와, 그 직전의 게인 샘플 위치에 있어, 게인 값이 동일하고, 직전의 게인 샘플 위치의 게인 기울기 값이 0일 경우에 선형 보간이 되고, 그 이외의 경우에는 비선형 보간이 되도록 해도 된다. 또한, 상위의 제어 장치에 의해 선형 보간이나 비선형 보간이 지정되도록 해도 된다.
또한, 게인 부호화 회로(23)는, 각 게인 샘플 위치에 대하여, 샘플 위치를 나타내는 샘플 길이 T[k], 게인 값 g[k], 및 게인 기울기 값 s[k]를 필요에 따라서 부호화하고, 게인 정보로 한다. 또한, 보간 모드 정보가 선형 보간에 의한 보간 방식을 나타내는 정보인 경우에는, 샘플 길이 및 게인 값만이 포함되고, 게인 기울기 값이 포함되어 있지 않은 게인 정보가 생성된다.
게인 부호화 회로(23)는, 이와 같이 하여 얻어진 각 게인 샘플 위치의 게인 정보와 보간 모드 정보가 포함되는 게인 부호열을 다중화 회로(25)에 공급한다.
스텝 S14에 있어서, 신호 부호화 회로(24)는, 공급된 입력 시계열 신호를 소정의 부호화 방식에 따라서 부호화하고, 그 결과 얻어진 신호 부호열을 다중화 회로(25)에 공급한다.
스텝 S15에 있어서, 다중화 회로(25)는, 게인 부호화 회로(23)로부터 공급된 게인 부호열과, 신호 부호화 회로(24)로부터 공급된 신호 부호열을 다중화하고, 그 결과 얻어진 출력 부호열을 출력한다. 이와 같이 하여 1 프레임분의 출력 부호열이 비트 스트림으로서 출력되면, 부호화 처리는 종료된다. 그리고, 다음 프레임의 부호화 처리가 행해진다.
이상과 같이 하여, 부호화 장치(11)는, 입력 시계열 신호의 프레임 내의 샘플마다 게인 값을 구하여 게인 샘플 위치를 추출하고, 각 게인 샘플 위치의 게인 정보와 보간 모드 정보를 포함하는 게인 부호열을 생성한다.
이렇게 프레임 내에서 샘플마다 게인 값을 정하게 함으로써, 복호화측에 있어서, 음성 신호의 프레임 간의 시간 파형이 원활하게 접속되고, 보다 고음질의 음성을 얻을 수 있게 된다. 게다가, 게인 부호열에 보간 모드 정보가 포함되도록 함으로써, 적절히 비선형 보간을 이용하여, 더 적은 부호량으로 고정밀도로 게인 파형을 재현할 수 있게 된다.
<복호화 장치의 구성예>
이어서, 부호화 장치(11)로부터 출력된 출력 부호열을 입력 부호열로서 입력하고, 입력 부호열의 복호화를 행하는 복호화 장치에 대하여 설명한다.
도 7은 본 기술을 적용한 복호화 장치의 일 실시 형태의 구성예를 도시하는 도면이다.
도 7에 도시하는 복호화 장치(51)는, 비다중화 회로(61), 신호 복호화 회로(62), 게인 복호화 회로(63), 및 게인 적용 회로(64)를 갖고 있다.
비다중화 회로(61)는, 공급된 입력 부호열, 즉 부호화 장치(11)로부터 수신한 출력 부호열을 비다중화하고, 그 결과 얻어진 신호 부호열을 신호 복호화 회로(62)에 공급함과 함께, 게인 부호열을 게인 복호화 회로(63)에 공급한다.
신호 복호화 회로(62)는, 비다중화 회로(61)로부터 공급된 신호 부호열을 복호화하고, 그 결과 얻어진 시계열 신호를 게인 적용 회로(64)에 공급한다. 여기서, 시계열 신호는 예를 들어 11.1ch나 7.1ch의 음성 신호이며, 시계열 신호를 구성하는 각 채널의 음성 신호는, PCM(Pulse Code Modulation) 신호가 된다.
게인 복호화 회로(63)는, 비다중화 회로(61)로부터 공급된 게인 부호열을 복호화하고, 그 결과 얻어진 게인 값을 게인 적용 회로(64)에 공급한다. 게인 복호화 회로(63)는, 보간 처리부(71)를 갖고 있으며, 보간 처리부(71)는, 게인 부호열로부터 얻어진 게인 정보와 보간 모드 정보에 기초하여, 선형 보간 또는 비선형 보간에 의해, 시계열 신호의 각 샘플 위치의 게인 값을 산출한다.
게인 적용 회로(64)는, 게인 복호화 회로(63)로부터 공급된 게인 값에 기초하여, 신호 복호화 회로(62)로부터 공급된 시계열 신호의 게인 조정을 행함으로써, 시계열 신호를 음량 보정하고, 그 결과 얻어진 출력 시계열 신호를 출력한다.
<복호화 처리의 설명>
계속해서, 복호화 장치(51)의 동작에 대하여 설명한다.
복호화 장치(51)는, 입력 부호열이 1 프레임분만큼 공급되면, 그 입력 부호열을 복호화하여 출력 시계열 신호를 출력하는 복호화 처리를 행한다. 이하, 도 8의 흐름도를 참조하여, 복호화 장치(51)에 의한 복호화 처리에 대하여 설명한다.
스텝 S41에 있어서, 비다중화 회로(61)는, 부호화 장치(11)로부터 송신된 입력 부호열을 수신하여 비다중화하고, 그 결과 얻어진 신호 부호열을 신호 복호화 회로(62)에 공급함과 함께, 게인 부호열을 게인 복호화 회로(63)에 공급한다.
스텝 S42에 있어서, 신호 복호화 회로(62)는, 비다중화 회로(61)로부터 공급된 신호 부호열을 복호화하고, 그 결과 얻어진 시계열 신호를 게인 적용 회로(64)에 공급한다.
스텝 S43에 있어서, 게인 복호화 회로(63)는 게인 복호화 처리를 행하고, 비다중화 회로(61)로부터 공급된 게인 부호열을 복호화하고, 그 결과 얻어진 처리 대상 프레임의 각 샘플 위치의 게인 값을 게인 적용 회로(64)에 공급한다. 또한, 게인 복호화 처리의 상세는 후술한다.
스텝 S44에 있어서, 게인 적용 회로(64)는, 게인 복호화 회로(63)로부터 공급된 게인 값에 기초하여, 신호 복호화 회로(62)로부터 공급된 시계열 신호의 게인 조정을 행하고, 얻어진 출력 시계열 신호를 출력한다. 즉, 시계열 신호의 각 샘플에 게인 값이 승산되어, 적절한 음량의 출력 시계열 신호로 된다.
출력 시계열 신호가 출력되면, 복호화 처리는 종료된다.
이상과 같이 하여 복호화 장치(51)는, 게인 부호열을 복호화하고, 얻어진 각 샘플 위치의 게인 값을 시계열 신호에 적용하여 시간 영역에서 게인(음량)을 조정한다. 이렇게 샘플 위치마다 정해진 게인 값으로 게인 조정을 행함으로써, 출력 시계열 신호의 프레임 간의 시간 파형을 원활하게 접속하여, 보다 고음질의 음성을 얻을 수 있다.
게다가, 적절히, 비선형 보간을 이용하여 게인 파형을 얻도록 했으므로, 게인 파형이 매끄러운 파형인 경우에도, 보다 적은 부호량으로 고정밀도로 게인 파형을 재현할 수 있다.
<게인 복호화 처리의 설명>
또한, 도 9의 흐름도를 참조하여, 도 8의 스텝 S43의 처리에 대응하는 게인 복호화 처리에 대하여 설명한다.
스텝 S71에 있어서, 게인 복호화 회로(63)는, 비다중화 회로(61)로부터 공급된 게인 부호열로부터 처리 대상이 되는 게인 샘플 위치의 게인 정보를 판독하고, 필요에 따라 게인 정보로서 포함되어 있는 샘플 길이 T[k], 게인 값 g[k], 및 게인 기울기 값 s[k]를 복호화한다. 또한, 보간 모드 정보에 의해 나타나는 보간 방식이 선형 보간에 의한 보간 방식인 경우에는, 게인 정보에는 게인 기울기 값은 포함되어 있지 않다.
예를 들어 게인 부호열에는, 각 게인 샘플 위치의 게인 정보와 보간 모드 정보가, 프레임의 선두로부터의 거리가 가까운 차례로 배열되어 저장되어 있다. 게인 복호화 회로(63)는, 게인 부호열로부터 차례로 게인 정보와 보간 모드 정보를 판독해 가므로, 프레임의 선두에 가까운 게인 샘플 위치부터 차례로, 처리 대상의 게인 샘플 위치로 되어 간다.
스텝 S72에 있어서, 게인 복호화 회로(63)는, 게인 부호열로부터 처리 대상이 되는 게인 샘플 위치의 보간 모드 정보를 판독한다.
또한, 여기에서는 보간 모드 정보가 게인 부호열에 포함되어 있는 예에 대하여 설명하는데, 보간 모드 정보가 각 프레임의 입력 부호열이 포함되는 비트 스트림의 헤더 등에 포함되어 있도록 해도 되고, 보간 모드 정보가 상위의 제어 장치 등으로부터 취득되도록 해도 된다.
스텝 S73에 있어서, 보간 처리부(71)는, 판독된 보간 모드 정보에 의해 나타나는 보간 방식이, 선형 보간에 의한 방식인지 여부를 판정한다.
스텝 S73에 있어서, 선형 보간에 의한 방식이라고 판정된 경우, 스텝 S74에 있어서, 보간 처리부(71)는, 선형 보간을 행하여 게인 파형을 생성한다.
구체적으로는, 보간 처리부(71)는, 처리 대상의 게인 샘플 위치의 게인 값 g[k] 및 샘플 길이 T[k-1]과, 처리 대상의 게인 샘플 위치보다도 1개 프레임의 선두측에 있는 게인 샘플 위치의 게인 값 및 샘플 위치에 기초하여, 상술한 식 (1)과 마찬가지의 계산을 행하고, 게인 샘플 위치 사이의 게인 파형을 생성한다. 즉, 시계열 신호의 2개의 게인 샘플 위치의 사이에 있는 각 샘플 위치의 게인 값이 산출되고, 그들 각 샘플 위치의 게인 값을 포함하는 파형이 게인 파형이 된다.
이와 같이 하여 인접하는 2개의 게인 샘플 위치 사이의 게인 파형이 얻어지면, 처리는 스텝 S76으로 진행된다.
이에 반해, 스텝 S73에 있어서, 선형 보간에 의한 방식이 아닌, 즉 비선형 보간에 의한 방식이라고 판정된 경우, 스텝 S75에 있어서, 보간 처리부(71)는, 비선형 보간을 행하여 게인 파형을 생성한다.
구체적으로는, 보간 처리부(71)는, 처리 대상의 게인 샘플 위치의 게인 값 g[k], 샘플 길이 T[k-1], 및 게인 기울기 값 s[k]와, 처리 대상의 게인 샘플 위치보다도 1개 프레임의 선두측에 있는 게인 샘플 위치의 게인 값, 샘플 위치, 및 게인 기울기 값에 기초하여, 상술한 식 (4)와 마찬가지의 계산을 행하고, 게인 샘플 위치 사이의 게인 파형을 생성한다. 즉, 시계열 신호의 2개의 게인 샘플 위치의 사이에 있는 각 샘플 위치의 게인 값이 산출되고, 그들 각 샘플 위치의 게인 값을 포함하는 파형이 게인 파형이 된다.
이와 같이 하여 인접하는 2개의 게인 샘플 위치 사이의 게인 파형이 얻어지면, 처리는 스텝 S76으로 진행된다.
스텝 S74 또는 스텝 S75에 있어서 보간에 의해 게인 샘플 위치 사이의 게인 파형이 얻어지면, 스텝 S76에 있어서, 게인 복호화 회로(63)는, 모든 게인 샘플 위치를 처리 대상으로서 처리했는지 여부를 판정한다.
스텝 S76에 있어서, 아직 모든 게인 샘플 위치를 처리하고 있지 않다고 판단되었을 경우, 처리는 스텝 S71로 복귀되고, 상술한 처리가 반복된다. 즉, 다음 게인 샘플 위치가 처리 대상으로서 선택되고, 게인 파형이 보간에 의해 구해진다.
이에 반해 스텝 S76에 있어서, 모든 게인 샘플 위치를 처리했다고 판정된 경우, 게인 복호화 회로(63)는, 지금까지의 처리에서 얻어진 각 샘플 위치의 게인 값을 포함하는 1 프레임분의 게인 파형을 게인 적용 회로(64)에 공급하고, 게인 복호화 처리는 종료된다. 게인 복호화 처리가 종료되면, 그 후, 처리는 도 8의 스텝 S44로 진행된다.
이상과 같이 하여 복호화 장치(51)는, 보간 모드 정보에 따라서 선형 보간 또는 비선형 보간에 의해 게인 파형을 구한다. 이와 같이, 보간 모드 정보에 따라, 적절히, 비선형 보간에 의해 게인 파형을 얻도록 함으로써, 더 적은 부호량으로 고정밀도로 게인 파형을 재현할 수 있다.
또한, 이상에 있어서는, 게인 샘플 위치마다 보간 모드 정보가 생성되고, 선형 보간 또는 비선형 보간이 전환되는 예에 대하여 설명했지만, 1 프레임으로 하나의 보간 모드 정보가 생성되도록 해도 된다. 이 경우, 프레임 단위로 선형 보간과 비선형 보간이 전환되게 된다.
또한, 복수 프레임 단위나, 1 파일 단위로 선형 보간과 비선형 보간이 전환되도록 해도 된다. 예를 들어 파일 단위로 보간 방식의 전환이 행해지는 경우, 예를 들어 비트 스트림의 헤더에 하나의 보간 모드 정보가 저장된다. 그리고, 보간 처리부(71)는, 그 보간 모드 정보에 의해 나타나는 보간 방식으로, 즉 선형 보간 또는 비선형 보간 중 어느 하나의 방식으로 각 프레임의 보간 처리를 행하여, 1 파일분의 게인 파형을 구한다.
<제2 실시 형태>
<리미팅에 대해서>
그런데, 비선형 보간으로 얻어진 게인 파형은, 선형 보간으로 얻어진 게인 파형과는 상이하게, 2개의 게인 샘플 위치 사이의 샘플 위치에 있어서, 게인 부호열에 포함되는 2개의 게인 샘플 위치의 게인 값보다도 크거나, 또는 작은 값을 취할 수 있다.
예를 들어 도 3에 도시한 예에서는, 비선형 보간에 의해 얻어진, 곡선 C21에 의해 나타나는 게인 파형의 일부에 있어서, 게인 샘플 위치 G11의 게인 값 g[k]보다도 작은 게인 값이 되는 부분이 있다. 또한, 곡선 C21에 의해 나타나는 게인 파형의 일부에 있어서, 게인 샘플 위치 G12의 게인 값 g[k+1]보다도 큰 게인 값이 되는 부분도 있다.
그로 인해, 비선형 보간에 의해 얻어진 게인 값이, 게인 값으로서 부적절한, 부(마이너스)의 값이 되는 경우가 있다. 따라서, 보간으로 얻어지는 게인 값이 부적절한 값이 되어 버리는 것을 방지하기 위해서, 다음 식 (11)의 계산을 행함으로써, 게인 값에 대하여 0을 하한값으로 하는 리미팅을 행하도록 해도 된다.
Figure pat00011
식 (11)에서는, 보간에 의해 구해진 게인 값 g_interpolated[n]과 0 중, 보다 큰 쪽이, 최종적인 게인 값 g_interpolated[n]이 된다. 따라서, 최종적인 게인 값은 0 이상의 값이 되고, 게인 값이 부의 값이 되는 경우가 없어진다.
또한, 게인 조정(음량 보정)에 의해, 시계열 신호를 부스트(증폭)시키고 싶은 경우와, 시계열 신호를 컴프레스(억압)시키고 싶은 경우가 있다.
예를 들어 시계열 신호를 부스트시키고 싶은 경우에는, 게인 값이 1보다도 작은 값이 되면, 그 게인 값은 부적절한 값이 된다. 따라서, 시계열 신호를 부스트시킬 경우에는, 다음 식 (12)의 계산을 행함으로써, 게인 값에 대하여 1을 하한값으로 하는 리미팅을 행하도록 해도 된다.
Figure pat00012
식 (12)에서는, 보간에 의해 구해진 게인 값 g_interpolated[n]과 1 중, 보다 큰 쪽이, 최종적인 게인 값 g_interpolated[n]이 된다. 따라서, 게인 값이 1 미만의 값이 되는 경우가 없어진다. 환언하면, 게인 값은 반드시 하한값인 1 이상의 값이 된다.
또한, 예를 들어 시계열 신호를 컴프레스시키고 싶은 경우에는, 게인 값이 1보다도 큰 값이 되면, 그 게인 값은 부적절한 값이 된다. 따라서, 시계열 신호를 컴프레스시킬 경우에는, 다음 식 (13)의 계산을 행함으로써, 게인 값에 대하여 1을 상한값으로 하는 리미팅을 행하도록 해도 된다.
Figure pat00013
식 (13)에서는, 보간에 의해 구해진 게인 값 g_interpolated[n]과 1 중, 보다 작은 쪽이, 최종적인 게인 값 g_interpolated[n]이 된다. 따라서, 게인 값이 1보다 큰 값이 되는 경우가 없어진다. 환언하면, 게인 값은, 반드시 상한값인 1 이하의 값이 된다.
식 (12)나 식 (13)에 나타내는 리미팅 처리가 행해지는 경우에는, 부호화된 게인 파형에 관한 정보로서, 게인 파형이 부스트를 위한 것인지, 또는 컴프레스를 위한 것인지를 나타내는 리미팅 정보가 게인 복호화 회로(63)에 부여되도록 하면 된다. 예를 들어, 리미팅 정보는, 상위의 제어 장치로부터 게인 복호화 회로(63)에 공급되도록 해도 되고, 게인 부호열이나 비트 스트림의 헤더 등에 리미팅 정보가 포함되어 있도록 해도 된다.
이하에서는, 게인 부호열에 리미팅 정보가 포함되어 있는 것으로서 설명을 계속한다. 이 경우, 도 5의 스텝 S13의 처리에서는, 리미팅 정보가 포함되는 게인 부호열이 생성된다.
이상과 같이 게인 값에 대하여 리미팅 처리를 실시함으로써, 보다 적절한 게인 값을 얻을 수 있게 된다. 이에 의해, 보다 적절한 게인 조정(음량 보정)이 가능해지고, 그 결과, 보다 고음질의 음성을 얻을 수 있다.
<복호화 장치의 구성예>
게인 값에 대하여 리미팅 처리를 실시하는 경우, 복호화 장치(51)는, 예를 들어 도 10에 도시하는 바와 같이 구성된다. 또한, 도 10에 있어서 도 7에서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있으며, 그 설명은 적절히 생략한다.
도 10에 도시하는 복호화 장치(51)의 구성은, 게인 복호화 회로(63)에 새로이 리미팅 처리부(101)가 설치되어 있는 점에서 도 7의 복호화 장치(51)와 상이하고, 그 밖의 구성은 도 7의 복호화 장치(51)와 같은 구성으로 되어 있다.
리미팅 처리부(101)는, 보간 처리부(71)에 의해 비선형 보간이 행해져서 산출된 게인 값에 대하여 리미팅 처리를 실시하여, 최종적인 게인 값으로 한다.
<게인 복호화 처리의 설명>
이어서, 복호화 장치(51)가 도 10에 도시하는 구성이 되는 경우에 행해지는 게인 복호화 처리에 대하여 설명한다.
예를 들어, 복호화 장치(51)에서는, 도 8을 참조하여 설명한 복호화 처리가 행해진다. 단, 스텝 S43에 대응하는 게인 복호화 처리에서는, 도 11에 도시하는 게인 복호화 처리가 행해진다. 이하, 도 11의 흐름도를 참조하여, 도 10의 복호화 장치(51)에 의한 게인 복호화 처리에 대하여 설명한다.
또한, 스텝 S101 내지 스텝 S105의 처리는, 도 9의 스텝 S71 내지 스텝 S75의 처리와 마찬가지이므로, 그 설명은 생략한다.
스텝 S106에 있어서, 리미팅 처리부(101)는, 스텝 S105의 처리에서 얻어진 각 샘플 위치의 게인 값에 대하여 상술한 식 (11)의 계산을 행함으로써, 게인 값이 부의 값이 되지 않도록, 적절히 게인 값을 변경한다.
또한, 리미팅 처리부(101)는, 식 (11)의 계산에 의해 리미팅된 게인 값에 대하여, 또한 게인 부호열에 포함되어 있는 리미팅 정보에 따라, 식 (12) 또는 식 (13) 중 어느 하나의 계산을 행함으로써, 최종적인 게인 값으로 한다.
구체적으로는, 게인 부호열에 포함되어 있는 리미팅 정보가 부스트를 위한 것임을 나타내고 있을 경우, 리미팅 처리부(101)는, 식 (12)의 계산을 행함으로써, 게인 값이 1 미만의 값이 되지 않도록 한다.
이에 반해, 게인 부호열에 포함되어 있는 리미팅 정보가 컴프레스를 위한 것임을 나타내고 있을 경우, 리미팅 처리부(101)는, 식 (13)의 계산을 행함으로써, 게인 값이 1보다 큰 값이 되지 않도록 한다.
스텝 S104에 있어서 선형 보간에 의해 게인 파형이 생성되었거나, 또는 스텝 S106에 있어서 리미팅 처리가 행해지면, 스텝 S107의 처리가 행해져서 게인 복호화 처리는 종료되지만, 스텝 S107의 처리는 도 9의 스텝 S76의 처리와 마찬가지이므로, 그 설명은 생략한다.
이상과 같이 하여, 복호화 장치(51)는, 비선형 보간에 의해 구한 게인 값에 대하여 리미팅 처리를 실시한다. 이에 의해, 보다 적절한 게인 값으로 게인 조정(음량 보정)을 행할 수 있다. 따라서, 보다 고음질의 음성을 얻을 수 있다.
<제3 실시 형태>
<게인 값의 보간에 대해서>
또한, 이상에 있어서는, 게인 샘플 위치마다 선형 보간 또는 비선형 보간 중 어느 보간 방식으로 게인 값의 보간을 행할지를 전환하여 게인 파형을 얻는 예에 대하여 설명했지만, 기본적으로는 비선형 보간이 행해지고, 특정한 조건 하에서만 선형 보간이 행해지도록 해도 된다.
예를 들어, 도 12에 나타내는 꺾은선 L41에 나타내는 게인 파형을 부호화하고, 복호화측에 있어서, 비선형 보간으로 게인 파형을 얻는 경우에 대하여 생각한다. 또한, 도 12에 있어서 종축 및 횡축은, 각각 게인 값 및 샘플 위치를 나타내고 있다.
부호화 장치(11)에 있어서, k번째의 게인 샘플 위치 G21과, k+1번째의 게인 샘플 위치 G22가 추출되고, 그들 게인 샘플 위치에서의 게인 값, 샘플 길이, 및 게인 기울기 값이 포함되는 게인 부호열이 얻어진 것으로 한다.
여기서, 화살표 D21은 게인 샘플 위치 G21의 게인 기울기 값 s[k]를 나타내고 있고, 화살표 D22는 게인 샘플 위치 G22의 게인 기울기 값 s[k+1]을 나타내고 있다.
이제, 복호화 장치(51)에 있어서 게인 부호열에 포함되는 게인 값, 샘플 길이, 및 게인 기울기 값에 기초하여 3차 함수에 의한 비선형 보간이 행해지고, 곡선 C31에 나타내는 게인 파형이 얻어진 것으로 한다.
이 예에서는, 비선형 보간에 의해 얻어진 곡선 C31에 나타내는 게인 파형과, 꺾은선 L41에 나타내는 원래의 게인 파형과의 차분이 커져 버렸다.
비선형 보간에 의해 게인 파형을 구하는 방식에서는, 이 예와 같이 게인 값이 선형으로 변화하는 게인 파형에 대하여 부호화를 행하면, 원래의 게인 파형과 복호화 시에 비선형 보간하여 얻어진 게인 파형과의 차분이 커져 버린다.
이 차분을 작게 하기 위해서는, 부호화 장치(11)에 있어서, 부호화하려고 하는 게인 값과 게인 기울기 값을, 비선형 보간으로 얻어지는 게인 파형을 산출하여 조정하는 등의 처리(로컬 디코드)가 필요해져, 부호화의 처리량이 증가되어 버린다.
따라서, 본 기술에서는, 복호화 장치(51)에서 비선형 보간을 행하는 경우에 있어서, 특정한 조건 하에서는 선형 보간이 행해지도록 함으로써, 보다 적은 부호화의 처리량으로 보다 고정밀도로 게인 파형을 재현할 수 있도록 하였다.
구체적으로는, 예를 들어 k번째와 k+1번째의 게인 샘플 위치 사이의 샘플 위치의 게인 값을 보간에 의해 구하는 경우에, 그들 게인 샘플 위치의 게인 값과 게인 기울기 값으로부터, 2개의 직선 L[k]와 직선 L[k+1]과의 교점 X[k, k+1]이 구해진다.
여기서, 직선 L[k]은, 게인 파형 위의 k번째 게인 샘플 위치(점)를 통과하고, 게인 기울기 값 s[k]에 의해 나타나는 기울기를 갖는 직선이다. 즉, 직선 L[k]은, 샘플 축 방향의 좌표 값이 k번째의 게인 샘플 위치와 동일값일 경우에, 게인 축 방향의 좌표 값으로서 k번째의 게인 샘플 위치의 게인 값 g[k]를 취하고, 또한 게인 기울기 값 s[k]에 의해 나타나는 기울기를 갖는 직선이다.
마찬가지로 직선 L[k+1]은, k+1번째의 게인 샘플 위치를 통과하고, 게인 기울기 값 s[k+1]에 의해 나타나는 기울기를 갖는 직선이다.
그리고, k번째 또는 k+1번째의 게인 샘플 위치 중 어느 하나와, 구해진 교점 X[k, k+1]와의 거리가 소정의 역치 이하인지 여부가 판정된다. 여기에서의 판정은, 예를 들어 이하의 식 (14)가 성립되는지 여부가 된다.
Figure pat00014
또한, 식 (14)에 있어서, d_sample[k] 및 d_sample[k+1]은, 각각 k번째 및 k+1번째의 게인 샘플 위치로부터, 교점 X[k, k+1]로의 샘플 축 방향의 거리를 나타내고 있다. 또한, d_gain[k] 및 d_gain[k+1]은, 각각 k번째 및 k+1번째의 게인 샘플 위치로부터, 교점 X[k, k+1]로의 게인 축 방향의 거리, 즉 게인 값의 차를 나타내고 있다.
또한, thre_sample 및 thre_gain은, 각각 샘플 축 방향의 거리의 역치 및 게인 축 방향의 거리의 역치를 나타내고 있다.
따라서, 식 (14)에서는, 거리 d_sample[k]가 역치 thre_sample 이하이며, 또한 거리 d_gain[k]가 역치 thre_gain 이하인 경우, 또는 거리 d_sample[k+1]이 역치 thre_sample 이하이며, 또한 거리 d_gain[k+1]이 역치 thre_gain 이하인 경우에, 게인 샘플 위치로부터, 교점 X[k, k+1]까지의 거리가 역치 이하이게 된다.
예를 들어 k번째의 게인 샘플 위치가 프레임의 선두 위치, 즉 n=0번째의 샘플 위치일 경우, 식 (14)에 있어서의 거리 d_sample[k], 거리 d_gain[k], 거리 d_sample[k+1], 및 거리 d_gain[k+1]은, 각각 이하의 식 (15) 내지 식 (18)에 의해 구해진다. 또한, 역치 thre_sample 및 역치 thre_gain은, 예를 들어 역치 thre_sample=32, 및 역치 thre_gain=0.01 등이 된다.
Figure pat00015
Figure pat00016
Figure pat00017
Figure pat00018
또한, 식 (15) 내지 식 (18)에 있어서, abs(x)는, x의 절댓값을 구하는 것을 나타내고 있다.
이러한 식 (14)에 나타내는 조건식이 성립된다고 판정된 경우에는, 선형 보간에 의해, 즉 상술한 식 (1)의 계산에 의해 게인 파형이 구해진다. 이에 반해, 식 (14)에 나타내는 조건식이 성립되지 않는다고 판정된 경우에는, 비선형 보간에 의해, 즉 상술한 식 (4)의 계산에 의해 게인 파형이 구해진다.
예를 들어 도 13에 도시하는 바와 같이, 게인 샘플 위치 G31과, 게인 샘플 위치 G32 사이의 각 샘플 위치의 게인 값을 보간으로 구하는 경우에, 식 (14)에 나타내는 조건식이 성립되는지 여부는, 교점 CP11이 영역 TR11 또는 영역 TR12 중 어느 하나에 포함되는지 여부를 특정하는 것이다. 또한, 도 13에 있어서 종축 및 횡축은, 각각 게인 값 및 시계열 신호의 프레임 내의 샘플 위치를 나타내고 있다.
도 13에서는, 게인 샘플 위치 G31이 k번째의 게인 샘플 위치를 나타내고 있고, 화살표 D31이 게인 샘플 위치 G31의 게인 기울기 값 s[k]를 나타내고 있다. 따라서, 직선 L51이 직선 L[k]이 된다.
마찬가지로 게인 샘플 위치 G32가 k+1번째의 게인 샘플 위치를 나타내고 있고, 화살표 D32가 게인 샘플 위치 G32의 게인 기울기 값 s[k+1]를 나타내고 있다. 따라서, 직선 L52가 직선 L[k+1]이 된다. 그리고, 직선 L51과 직선 L52의 교점인 교점 CP11이 교점 X[k, k+1]이 된다.
이제, 영역 TR11이, 게인 샘플 위치 G31을 중심으로 하고, 또한 도면 중, 세로 방향 및 가로 방향의 길이가, 각각 2×thre_gain 및 2×thre_sample인 것으로 한다. 마찬가지로, 영역 TR12가, 게인 샘플 위치 G32를 중심으로 하고, 또한 도면 중, 세로 방향 및 가로 방향의 길이가, 각각 2×thre_gain 및 2×thre_sample인 것으로 한다.
이 경우, 교점 CP11이 영역 TR11 내에 위치하고 있거나, 또는 교점 CP11이 영역 TR12 내에 위치하고 있을 경우에, 식 (14)에 나타내는 조건식이 성립되게 된다. 도 13의 예에서는, 교점 CP11이 영역 TR12 내에 위치하고 있기 때문에, 식 (14)에 나타내는 조건식이 성립된다.
도 13에 도시하는 예에서는, 재현(복원)하고자 하는 원래의 게인 파형은, 직선 L51과 직선 L52로 이루어지는 파형에 가까운 파형이 되어 있었을 것이다. 즉, 보다 상세하게는, 게인 샘플 위치 G31부터 교점 CP11까지의 사이는 직선 L51에 가까운 파형이며, 교점 CP11로부터 게인 샘플 위치 G32까지의 사이는 직선 L52에 가까운 파형이었을 것이다.
그러나, 이 예에서는 교점 CP11이 영역 TR12 내에 위치하기 때문에, 교점 CP11과 게인 샘플 위치 G32와의 거리가 충분히 짧고, 원래의 게인 파형이 게인 샘플 위치 G31과 게인 샘플 위치 G32를 연결하는 직선이라고 근사할 수 있다.
이 경우, 게인 샘플 위치 G31과 게인 샘플 위치 G32 사이의 게인 파형에서는, 게인 값이 거의 선형으로 변화한다고 할 수 있으므로, 게인 파형을 비선형 보간으로 구하기 보다도, 선형 보간으로 구한 편이, 보다 고정밀도로 게인 파형을 재현할 수 있다. 따라서, 본 기술에서는 상술한 식 (14)에 나타내는 조건식이 성립되는 경우에는, 선형 보간에 의해 게인 파형이 구해지도록 하였다.
따라서, 도 13의 예에서는, 게인 샘플 위치 G31과 게인 샘플 위치 G32 사이의 각 샘플 위치의 게인 값이 선형 보간에 의해 구해지고, 이에 의해 예를 들어 도 14에 도시하는 게인 파형이 얻어진다. 또한, 도 14에 있어서, 도 13에서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있으며, 그 설명은 적절히 생략한다.
도 14에서는, 게인 샘플 위치 G31과 게인 샘플 위치 G32를 연결하는 직선 L61이, 그들 게인 샘플 위치 G31과 게인 샘플 위치 G32 사이의 게인 파형으로서 구해지고 있다.
또한, 예를 들어 상술한 도 12에 나타낸 예에 있어서도 식 (14)에 나타내는 조건식이 성립되므로, 선형 보간에 의해 게인 파형이 구해진다.
도 12의 예에서는, 교점 X[k, k+1]가 게인 샘플 위치 G22의 위치가 되므로 식 (14)가 성립되고, 게인 샘플 위치 G21과 게인 샘플 위치 G22를 연결하는 직선이, 그들 게인 샘플 위치 사이의 게인 파형이 된다. 따라서, 이 예에서는, 원래의 게인 파형이 정확하게 재현되게 된다.
이상과 같이 특정한 조건 하에서 선형 보간이 행해지도록 함으로써, 기본적으로 비선형 보간이 행해지도록 하는 경우에 있어서, 부호화의 처리량을 증가시키는 일 없이, 원래의 게인 파형과 복호화 후의 게인 파형의 차분을 보다 작게 할 수 있다.
게다가, 이러한 복호화 방식으로 하면, 비선형 보간을 행하는 보간 방식만으로, 선형 및 비선형의 양쪽 보간에 대응할 수 있으므로, 게인 부호열에 보간 모드 정보를 포함할 필요가 없어져, 출력 부호열의 비트 레이트를 낮출 수 있다. 즉, 출력 부호열의 부호량을 보다 적게 할 수 있다.
<복호화 장치의 구성예>
특정한 조건 하에서 선형 보간이 행해지는 경우, 복호화 장치(51)는, 예를 들어 도 15에 도시하는 바와 같이 구성된다. 또한, 도 15에 있어서 도 7에서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있으며, 그 설명은 적절히 생략한다.
도 15에 도시하는 복호화 장치(51)의 구성은, 게인 복호화 회로(63)에 새로이 연산부(131)가 설치되어 있는 점에서 도 7의 복호화 장치(51)와 상이하고, 그 밖의 구성은 도 7의 복호화 장치(51)와 같은 구성으로 되어 있다.
연산부(131)는, 상술한 식 (14)에 나타낸 조건식을 계산한다.
<게인 복호화 처리의 설명>
이어서, 복호화 장치(51)가 도 15에 도시하는 구성이 되는 경우에 행해지는 게인 복호화 처리에 대하여 설명한다.
예를 들어 부호화 장치(11)에서는, 도 5를 참조하여 설명한 부호화 처리가 행해지지만, 스텝 S13의 게인 부호화 처리에서는, 게인 정보만이 포함되고, 보간 모드 정보가 포함되어 있지 않은 게인 부호열이 생성되어, 다중화에 의해 얻어진 출력 부호열이 출력된다. 또한, 이 경우, 게인 정보에는 항상 게인 기울기 값이 포함되어 있다.
그리고 복호화 장치(51)에서는, 도 8을 참조하여 설명한 복호화 처리가 행해진다. 단, 스텝 S43에 대응하는 게인 복호화 처리에서는, 도 16에 나타내는 게인 복호화 처리가 행해진다. 이하, 도 16의 흐름도를 참조하여, 도 15의 복호화 장치(51)에 의한 게인 복호화 처리에 대하여 설명한다.
또한, 스텝 S131의 처리는, 도 9의 스텝 S71의 처리와 마찬가지이므로, 그 설명은 생략한다.
스텝 S132에 있어서, 연산부(131)는, 판독된 게인 정보에 기초하여 식 (14)에 나타내는 조건식을 계산한다.
즉, 연산부(131)는 게인 정보로서 판독된 게인 샘플 위치의 게인 값, 샘플 길이, 및 게인 기울기 값에 기초하여, 상술한 식 (15) 내지 식 (18)과 마찬가지의 계산을 행한다. 그리고 연산부(131)는, 그 결과 얻어진 게인 샘플 위치로부터 교점 X[k, k+1]까지의 거리에 기초하여 식 (14)를 계산한다.
이와 같이, 식 (15) 내지 식 (18)의 계산을 행하는 것은, 직선 L[k] 및 직선 L[k+1]을 구함과 함께, 그들 직선의 교점 X[k, k+1]를 구하고, 또한 k번째 및 k+1번째의 게인 샘플 위치 각각에 있어서의 게인 값과, 교점 X[k, k+1]의 게인 값의 차를 구하는 것이다. 그리고, 식 (14)의 조건식을 계산하는 것은, 게인 샘플 위치와 교점 X[k, k+1]와의 게인 값의 차가 소정의 역치 이하인지 여부를 판정하는 것이다.
따라서, 복호화 장치(51)에서는, 게인 샘플 위치의 게인 값과, 교점 X[k, k+1]의 게인 값과의 차에 따라, 선형 보간 또는 비선형 보간에 의해 2개의 게인 샘플 위치 사이의 각 샘플 위치의 게인 값이 구해진다고 할 수 있다.
스텝 S133에 있어서, 보간 처리부(71)는, 스텝 S132에 있어서의 조건식의 계산 결과에 기초하여, 선형 보간을 행할지 여부를 판정한다. 예를 들어 식 (14)에 의해 나타나는 조건식이 성립되는 경우, 선형 보간을 행한다고 판정된다.
스텝 S133에 있어서 선형 보간을 행한다고 판정된 경우, 스텝 S134에 있어서, 보간 처리부(71)는 선형 보간을 행하여 게인 파형을 생성하고, 그 후, 처리는 스텝 S136으로 진행된다. 스텝 S134에서는, 도 9의 스텝 S74의 처리와 마찬가지의 처리가 행해진다.
이에 반해, 스텝 S133에 있어서 선형 보간을 행하지 않는다고 판정된 경우, 스텝 S135에 있어서, 보간 처리부(71)는 비선형 보간을 행하여 게인 파형을 생성하고, 그 후, 처리는 스텝 S136으로 진행된다. 또한, 스텝 S135에서는, 도 9의 스텝 S75의 처리와 마찬가지 처리가 행해진다.
스텝 S134 또는 스텝 S135에 있어서 게인 파형이 생성되면, 스텝 S136의 처리가 행해져서 게인 복호화 처리는 종료되는데, 스텝 S136의 처리는 도 9의 스텝 S76의 처리와 마찬가지이므로, 그 설명은 생략한다.
이상과 같이 하여, 복호화 장치(51)는, 특정한 조건 하에서는 선형 보간에 의해 게인 파형을 생성한다. 이에 의해, 보다 적은 처리량으로, 보다 고정밀도로 원래의 게인 파형을 얻을 수 있음과 함께, 출력 부호열의 부호량을 보다 적게 할 수 있다.
<제3 실시 형태의 변형예 1>
<게인 값의 보간에 대해서>
또한, 제3 실시 형태에서는, 특정한 조건 하에서 선형 보간이 행해진다고 설명했지만, 게인 샘플 위치와 교점을 이용하여 게인 값을 선형 보간해도 된다.
즉, 제3 실시 형태에서는, 2개의 게인 샘플 위치 사이의 각 샘플 위치의 게인 값이 식 (1)에 의한 선형 보간으로 산출되고 있었다. 이 실시 형태에서는, 이것 대신에, 도 17에 도시하는 바와 같이 2개의 직선 L51 및 직선 L52의 교점 CP11과, 2개의 각 게인 샘플 위치를 연결하는 각각의 직선으로 이루어지는 파형이, 선형 보간에 의해 얻어진 게인 파형이 된다. 또한, 도 17에 있어서, 도 13에서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있으며, 그 설명은 적절히 생략한다.
이 예에서는, 게인 샘플 위치 G31과 교점 CP11을 연결하는 직선, 및 게인 샘플 위치 G32와 교점 CP11을 연결하는 직선으로 이루어지는 꺾은선 L71이, 게인 샘플 위치 G31과 게인 샘플 위치 G32 사이의 게인 파형이 된다.
도 17에 도시하는 게인 파형의 예에서는, 보다 정확하게 게인 파형을 재현하고자 하면, 2개의 게인 샘플 위치를 연결하는 직선으로 선형 보간할 경우에는, 게인 파형의 부호화 시에 게인 샘플 위치 G31로부터 게인 샘플 위치 G32까지의 구간에서, 게인 샘플 위치의 수를 3개 이상으로 할 필요가 있다.
즉, 게인 파형의 부호화 시에 게인 샘플 위치 G31, 교점 CP11, 및 게인 샘플 위치 G32의 샘플 위치를 게인 샘플 위치로 하지 않으면, 부호화 전의 게인 파형과, 복호화에 의해 얻어지는 게인 파형과의 차분(오차)이 발생해 버린다.
이에 반해, 교점 CP11을 이용하여, 꺾은선 L71을 게인 파형으로 하는 경우에는, 게인 샘플 위치 G31과 게인 샘플 위치 G32의 2개의 위치를 게인 샘플 위치로 하기만 하면, 부호화 전의 게인 파형과, 복호화에 의해 얻어지는 게인 파형과의 차분을 작게 할 수 있다. 따라서, 교점을 이용하여 선형 보간을 행하는 수법으로는, 게인 샘플 위치의 수를 저감시킬 수 있고, 이것에 의해 출력 부호열의 비트 레이트를 낮게 억제하여, 부호화 효율을 향상시킬 수 있다.
또한, 교점을 이용하여 선형 보간을 행하는 경우, 2개의 직선의 교점이, 2개의 게인 샘플 위치의 사이에 위치하고 있어야 한다.
예를 들어 도 17의 예에서는, 샘플 축 방향에 있어서, 교점 CP11이 게인 샘플 위치 G31과 게인 샘플 위치 G32의 사이에 위치하고 있어야 한다.
그로 인해, 비선형 보간을 행할지 또는 선형 보간을 행할지의 판정에 사용되는 영역이, 도 13의 예와 도 17의 예에 있어서 상이하다. 도 17의 예에서는, 교점CP11이 영역 TR21 또는 영역 TR22 중 어느 하나에 포함되는 경우, 교점을 이용한 선형 보간이 행해진다.
여기서, 영역 TR21은, 도 13에 도시한 영역 TR11의 우측 절반의 영역, 즉 영역 TR11 중 게인 샘플 위치 G31보다도 도 13 중, 우측에 있는 영역이다. 마찬가지로, 영역 TR22는, 도 13에 도시한 영역 TR12의 좌측 절반의 영역, 즉 영역 TR12 중 게인 샘플 위치 G32보다도 도 13 중, 좌측에 있는 영역이다.
이와 같이, 교점을 이용한 선형 보간이 행해지는 경우, 식 (14)에 대응하는 조건식은, 다음 식 (19)에 나타내게 된다. 즉, 다음 식 (19)가 성립되는 경우, 교점을 이용한 선형 보간이 행해진다.
Figure pat00019
식 (19)에서는 거리 d_sample[k]가 0보다도 크고, 역치 thre_sample 이하이며, 또한 거리 d_gain[k]가 역치 thre_gain 이하인 경우, 또는 거리 d_sample[k+1]이 0보다 크고, 역치 thre_sample 이하이며, 또한 거리 d_gain[k+1]이 역치 thre_gain 이하인 경우에, 게인 샘플 위치로부터 교점 X[k, k+1]까지의 거리가 역치 이하로 된다.
예를 들어 k번째의 게인 샘플 위치가 프레임의 선두 위치, 즉 n=0번째의 샘플일 경우, 식 (19)에 있어서의 거리 d_sample[k], 거리 d_gain[k], 거리 d_sample[k+1], 및 거리 d_gain[k+1]은, 각각 이하의 식 (20) 내지 식 (23)에 의해 구해진다.
Figure pat00020
Figure pat00021
Figure pat00022
Figure pat00023
식 (19)에 나타내는 조건식이 성립되지 않는다고 판정된 경우에는, 비선형 보간에 의해, 즉 상술한 식 (4)의 계산에 의해 게인 파형이 구해진다.
이에 반해, 식 (19)에 나타내는 조건식이 성립된다고 판정된 경우에는, 선형 보간에 의해 게인 파형이 구해진다.
예를 들어 k번째의 게인 샘플 위치가 프레임의 선두 위치, 즉 n=0번째의 샘플 위치일 경우, 교점 X[k, k+1]의 샘플 위치, 즉 k번째의 게인 샘플 위치로부터 교점 X[k, k+1]까지의 샘플 길이를 T'[k]라 하면, 샘플 위치 T'[k]는 다음 식 (24)에 의해 구해진다.
Figure pat00024
또한, k번째의 게인 샘플 위치와, 교점 X[k, k+1]과의 사이에 있는, 프레임 선두로부터 n번째(단, 0≤n<T'[k])에 있는 샘플 n의 게인 값 g_interpolated[n]은, 다음 식 (25)에 의해 산출된다.
Figure pat00025
또한, 식 (25)에 있어서 a1[k] 및 b1[k]는, 각각 이하의 식 (26) 및 식 (27)에 의해 구해지는 값이 된다.
Figure pat00026
Figure pat00027
a1[k] 및 b1[k]는, k번째의 게인 샘플 위치와 교점 X[k, k+1]을 연결하는 직선의 기울기 및 절편을 나타내고 있다. 따라서, 이 예에서는, 도 17을 참조하여 설명한 바와 같이, k번째의 게인 샘플 위치 G31과 교점 CP11의 사이에는, 게인 값이 선형으로 변화하는 것이 되고, 선형 보간에 의해 각 샘플 n의 게인 값이 구해지고 있다.
또한, 교점 X[k, k+1]과 k+1번째의 게인 샘플 위치의 사이에 있는, 프레임 선두로부터 n번째(단, T'[k]≤n<T[k])에 있는 샘플 n의 게인 값 g_interpolated[n]은, 다음 식 (28)에 의해 산출된다.
Figure pat00028
또한, 식 (28)에 있어서 a2[k] 및 b2[k]는, 각각 이하의 식 (29) 및 식 (30)에 의해 구해지는 값이 된다.
Figure pat00029
Figure pat00030
a2[k] 및 b2[k]는, 교점 X[k, k+1]과 k+1번째의 게인 샘플 위치를 연결하는 직선의 기울기 및 절편을 나타내고 있다. 따라서, 이 예에서는, 도 17을 참조하여 설명한 바와 같이, 교점 CP11과 k+1번째의 게인 샘플 위치 G32의 사이에는, 게인 값이 선형으로 변화하는 것이 되고, 선형 보간에 의해 각 샘플 n의 게인 값이 구해지고 있다.
이상과 같이 특정한 조건 하에서 교점을 이용한 선형 보간이 행해지는 경우, 도 16을 참조하여 설명한 게인 복호화 처리에서는, 스텝 S132에 있어서 연산부(131)는, 판독된 게인 정보에 기초하여 식 (19)에 나타내는 조건식을 계산한다.
그리고, 식 (19)에 나타내는 조건식이 성립되는 경우에는, 스텝 S134에 있어서 보간 처리부(71)는, 게인 정보로서 판독된 게인 샘플 위치의 게인 값, 샘플 길이, 및 게인 기울기 값에 기초하여, 식 (24)에 의해 교점 X[k, k+1]의 샘플 위치 T'[k]를 산출한다. 또한, 보간 처리부(71)는, 얻어진 샘플 위치 T'[k]를 사용하여 식 (25) 및 식 (28)의 계산을 행하고, 선형 보간에 의해 게인 파형을 생성한다.
이에 반해, 식 (19)에 나타내는 조건식이 성립되지 않는 경우에는, 스텝 S135에 있어서 보간 처리부(71)는, 비선형 보간을 행하여 게인 파형을 생성한다.
이와 같이, 특정한 조건 하에서 교점을 이용한 선형 보간을 행하도록 함으로써, 부호화 시의 처리량을 증가시키는 일 없이, 부호화 전의 원래의 게인 파형과, 복호화에 의해 얻어지는 게인 파형의 차분을 작게 할 수 있다.
또한, 비선형 보간을 행하는 방식만으로, 선형 및 비선형의 양쪽 보간에 대응할 수 있으므로, 게인 부호열에 보간 모드 정보를 포함할 필요가 없어져, 출력 부호열의 비트 레이트를 낮출 수 있다. 즉, 출력 부호열의 부호량을 보다 적게 할 수 있다.
<제4 실시 형태>
<게인 복호화 처리의 설명>
또한, 제3 실시 형태 및 제3 실시 형태의 변형예 1에서는, 게인 부호열에 보간 모드 정보가 포함되고 있지 않고, 기본적으로는 비선형 보간이 행해진다고 설명하였다.
그러나, 게인 부호열에 보간 모드 정보가 포함되어 있고, 기본적으로는 보간 모드 정보에 의해 나타나는 보간 방식에 의해 게인 파형이 구해지지만, 보간 모드 정보에 의해 나타나는 보간 방식이 비선형 보간에 의한 방식인 경우, 특정한 조건 하에서 선형 보간이 행해지도록 해도 된다.
그러한 경우, 복호화 장치(51)에서는, 도 8을 참조하여 설명한 복호화 처리가 행해진다. 단, 스텝 S43에 대응하는 게인 복호화 처리에서는, 도 18에 도시하는 게인 복호화 처리가 행해진다. 이하, 도 18의 흐름도를 참조하여, 도 15의 복호화 장치(51)에 의한 게인 복호화 처리에 대하여 설명한다.
또한, 스텝 S161 내지 스텝 S164의 처리는, 도 9의 스텝 S71 내지 스텝 S74의 처리와 마찬가지이므로, 그 설명은 생략한다.
스텝 S163에 있어서, 비선형 보간에 의한 방식이라고 판정된 경우, 스텝 S165에 있어서, 연산부(131)는, 판독된 게인 정보에 기초하여 식 (14)에 나타내는 조건식을 계산한다.
그리고, 그 후, 스텝 S166 내지 스텝 S168의 처리가 행해지지만, 이들 처리는 도 16의 스텝 S133 내지 스텝 S135의 처리와 마찬가지이므로, 그 설명은 생략한다. 또한, 스텝 S165 내지 스텝 S168에서는, 제3 실시 형태에서 설명한 처리가 행해지도록 해도 되고, 제3 실시 형태의 변형예 1에서 설명한 처리가 행해지도록 해도 된다. 또한, 비선형 보간이 행해진 경우에는, 리미팅 처리가 행해지도록 해도 된다.
스텝 S164, 스텝 S167, 또는 스텝 S168에 있어서 보간에 의해 게인 파형이 생성되면, 그 후, 처리는 스텝 S169로 진행된다.
스텝 S169에 있어서, 게인 복호화 회로(63)는, 모든 게인 샘플 위치를 처리 대상으로서 처리했는지 여부를 판정한다.
스텝 S169에 있어서, 아직 모든 게인 샘플 위치를 처리하지 않았다고 판단되었을 경우, 처리는 스텝 S161로 복귀되고, 상술한 처리가 반복된다.
이에 반해 스텝 S169에 있어서, 모든 게인 샘플 위치를 처리했다고 판정된 경우, 게인 복호화 회로(63)는, 지금까지의 처리에서 얻어진, 각 샘플 위치의 게인 값을 포함하는 1프레임분의 게인 파형을 게인 적용 회로(64)에 공급하고, 게인 복호화 처리는 종료된다. 게인 복호화 처리가 종료되면, 그 후, 처리는 도 8의 스텝 S44로 진행된다.
이상과 같이 하여 복호화 장치(51)는, 보간 모드 정보에 따라서 선형 보간 또는 비선형 보간에 의해 게인 파형을 구한다. 이와 같이, 보간 모드 정보에 따라, 적절히, 비선형 보간에 의해 게인 파형을 얻도록 함으로써, 더 적은 부호량으로 고정밀도로 게인 파형을 재현할 수 있다.
게다가, 보간 모드 정보에 의해 나타나는 보간 방식이, 비선형 보간에 의한 방식인 경우에도, 특정한 조건 하에서 선형 보간을 행하도록 함으로써, 보다 적은 부호화의 처리량으로, 보다 고정밀도로 원래의 게인 파형을 재현할 수 있다. 또한, 출력 부호열의 부호량을 보다 적게 할 수 있다.
그런데, 상술한 일련의 처리는, 하드웨어에 의해 실행할 수도 있고, 소프트웨어에 의해 실행할 수도 있다. 일련의 처리를 소프트웨어에 의해 실행하는 경우에는, 그 소프트웨어를 구성하는 프로그램이, 컴퓨터에 인스톨된다. 여기서, 컴퓨터에는, 전용의 하드웨어에 내장되어 있는 컴퓨터나, 각종 프로그램을 인스톨함으로써, 각종 기능을 실행하는 것이 가능한, 예를 들어 범용의 컴퓨터 등이 포함된다.
도 19는, 상술한 일련의 처리를 프로그램에 의해 실행하는 컴퓨터 하드웨어의 구성예를 도시하는 블록도이다.
컴퓨터에 있어서, CPU(Central Processing Unit)(501), ROM(Read Only Memory)(502), RAM(Random Access Memory)(503)은, 버스(504)에 의해 서로 접속되어 있다.
버스(504)에는, 또한 입출력 인터페이스(505)가 접속되어 있다. 입출력 인터페이스(505)에는, 입력부(506), 출력부(507), 기록부(508), 통신부(509), 및 드라이브(510)가 접속되어 있다.
입력부(506)는, 키보드, 마우스, 마이크로폰, 촬상 소자 등을 포함한다. 출력부(507)는, 디스플레이, 스피커 등을 포함한다. 기록부(508)는, 하드 디스크나 불휘발성이 메모리 등을 포함한다. 통신부(509)는, 네트워크 인터페이스 등을 포함한다. 드라이브(510)는, 자기 디스크, 광 디스크, 광자기 디스크, 또는 반도체 메모리 등의 리무버블 미디어(511)를 구동한다.
이상과 같이 구성되는 컴퓨터에서는 CPU(501)가, 예를 들어 기록부(508)에 기록되어 있는 프로그램을, 입출력 인터페이스(505) 및 버스(504)를 통하여, RAM(503)에 로드하여 실행함으로써, 상술한 일련의 처리가 행해진다.
컴퓨터(CPU(501))가 실행하는 프로그램은, 예를 들어 패키지 미디어 등으로서의 리무버블 미디어(511)에 기록하여 제공할 수 있다. 또한, 프로그램은, 로컬에리어 네트워크, 인터넷, 디지털 위성 방송 등의, 유선 또는 무선의 전송 매체를 통하여 제공할 수 있다.
컴퓨터에서는, 프로그램은, 리무버블 미디어(511)를 드라이브(510)에 장착함으로써, 입출력 인터페이스(505)를 통하여 기록부(508)에 인스톨할 수 있다. 또한, 프로그램은, 유선 또는 무선의 전송 매체를 통하여 통신부(509)에서 수신하고, 기록부(508)에 인스톨할 수 있다. 그 밖에, 프로그램은, ROM(502)이나 기록부(508)에, 미리 인스톨해 둘 수 있다.
또한, 컴퓨터가 실행하는 프로그램은, 본 명세서에서 설명하는 순서에 따라서 시계열로 처리가 행해지는 프로그램이어도 되고, 병렬로, 또는 호출이 행해졌을 때 등의 필요한 타이밍에 처리가 행해지는 프로그램이어도 된다.
또한, 본 기술의 실시 형태는, 상술한 실시 형태에 한정되는 것은 아니며, 본 기술의 요지를 일탈하지 않는 범위에서 다양한 변경이 가능하다.
예를 들어, 본 기술은, 하나의 기능을 네트워크를 통하여 복수의 장치로 분담, 공동하여 처리하는 클라우드 컴퓨팅의 구성을 취할 수 있다.
또한, 상술한 흐름도에서 설명한 각 스텝은, 하나의 장치로 실행하는 것 외에, 복수의 장치로 분담하여 실행할 수 있다.
또한, 하나의 스텝에 복수의 처리가 포함되는 경우에는, 그 하나의 스텝에 포함되는 복수의 처리는, 하나의 장치로 실행하는 것 외, 복수의 장치로 분담하여 실행할 수 있다.
또한, 본 명세서 중에 기재된 효과는 어디까지나 예시이며 한정되는 것은 아니고, 다른 효과가 있어도 된다.
또한, 본 기술은, 이하의 구성으로 하는 것도 가능하다.
(1)
시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값을 판독하는 게인 판독부와,
상기 시계열 신호의 각 샘플 위치의 상기 게인 값을 선형 보간에 의해 구할지, 또는 비선형 보간에 의해 구할지를 나타내는 보간 정보를 판독하는 보간 정보 판독부와,
상기 게인 샘플 위치의 상기 게인 값에 기초하여, 상기 시계열 신호의 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을, 상기 보간 정보에 따라서 선형 보간 또는 비선형 보간에 의해 구하는 보간 처리부를 구비하는 복호화 장치.
(2)
상기 게인 판독부는, 상기 게인 샘플 위치에 있어서의 상기 게인 값의 기울기를 나타내는 게인 기울기 값을 더 판독하고,
상기 보간 처리부는, 비선형 보간에 의해 상기 게인 값을 구할 경우, 상기 게인 샘플 위치의 상기 게인 값 및 상기 게인 기울기 값에 기초하여, 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을 구하는
(1)에 기재된 복호화 장치.
(3)
상기 게인 값이 소정의 하한값 이상의 값 또는 소정의 상한값 이하의 값이 되도록, 비선형 보간에 의해 구해진 상기 게인 값에 대하여 리미팅 처리를 실시하는 리미팅 처리부를 더 구비하는
(1) 또는 (2)에 기재된 복호화 장치.
(4)
상기 리미팅 처리부는, 0을 하한값으로 하는 리미팅 처리, 1을 하한값으로 하는 리미팅 처리, 또는 1을 상한값으로 하는 리미팅 처리를 실시하는
(3)에 기재된 복호화 장치.
(5)
상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선을 구하고, 상기 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차를 구하는 연산부를 더 구비하고,
상기 보간 처리부는, 상기 보간 정보가 선형 보간에 의해 상기 게인 값을 구하는 것을 나타내는 정보인 경우, 선형 보간에 의해 상기 게인 값을 구하고, 상기 보간 정보가 비선형 보간에 의해 상기 게인 값을 구하는 것을 나타내는 정보인 경우, 상기 차에 따라서 비선형 보간 또는 선형 보간에 의해 상기 게인 값을 구하는
(2) 내지 (4) 중 어느 한 항에 기재된 복호화 장치.
(6)
시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값을 판독하고,
상기 시계열 신호의 각 샘플 위치의 상기 게인 값을 선형 보간에 의해 구할지, 또는 비선형 보간에 의해 구할지를 나타내는 보간 정보를 판독하고,
상기 게인 샘플 위치의 상기 게인 값에 기초하여, 상기 시계열 신호의 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을, 상기 보간 정보에 따라서 선형 보간 또는 비선형 보간에 의해 구하는 스텝을 포함하는 복호화 방법.
(7)
시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값을 판독하고,
상기 시계열 신호의 각 샘플 위치의 상기 게인 값을 선형 보간에 의해 구할지, 또는 비선형 보간에 의해 구할지를 나타내는 보간 정보를 판독하고,
상기 게인 샘플 위치의 상기 게인 값에 기초하여, 상기 시계열 신호의 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을, 상기 보간 정보에 따라서 선형 보간 또는 비선형 보간에 의해 구하는 스텝을 포함하는 처리를 컴퓨터에 실행시키는 프로그램.
(8)
시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값, 및 상기 게인 값의 기울기를 나타내는 게인 기울기 값을 판독하는 게인 판독부와,
상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선을 구하고, 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차를 구하는 연산부와,
상기 차에 따라, 상기 시계열 신호의 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을 선형 보간 또는 비선형 보간에 의해 구하는 보간 처리부를 구비하는 복호화 장치.
(9)
시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값, 및 상기 게인 값의 기울기를 나타내는 게인 기울기 값을 판독하고,
상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선을 구하고, 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차를 구하고,
상기 차에 따라, 상기 시계열 신호의 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을 선형 보간 또는 비선형 보간에 의해 구하는 스텝을 포함하는 복호화 방법.
(10)
시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값, 및 상기 게인 값의 기울기를 나타내는 게인 기울기 값을 판독하고,
상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선을 구하고, 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차를 구하고,
상기 차에 따라, 상기 시계열 신호의 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을 선형 보간 또는 비선형 보간에 의해 구하는 스텝을 포함하는 처리를 컴퓨터에 실행시키는 프로그램.
51: 복호화 장치
61: 비다중화 회로
62: 신호 복호화 회로
63: 게인 복호화 회로
64: 게인 적용 회로
71: 보간 처리부
101: 리미팅 처리부
131: 연산부

Claims (10)

  1. 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값을 판독하는 게인 판독부와,
    상기 시계열 신호의 각 샘플 위치의 상기 게인 값을 선형 보간에 의해 구할지, 또는 비선형 보간에 의해 구할지를 나타내는 보간 정보를 판독하는 보간 정보 판독부와,
    상기 게인 샘플 위치의 상기 게인 값에 기초하여, 상기 시계열 신호의 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을, 상기 보간 정보에 따라서 선형 보간 또는 비선형 보간에 의해 구하는 보간 처리부를 구비하는, 복호화 장치.
  2. 제1항에 있어서,
    상기 게인 판독부는, 상기 게인 샘플 위치에 있어서의 상기 게인 값의 기울기를 나타내는 게인 기울기 값을 더 판독하고,
    상기 보간 처리부는, 비선형 보간에 의해 상기 게인 값을 구할 경우, 상기 게인 샘플 위치의 상기 게인 값 및 상기 게인 기울기 값에 기초하여, 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을 구하는, 복호화 장치.
  3. 제1항에 있어서,
    상기 게인 값이 소정의 하한값 이상의 값 또는 소정의 상한값 이하의 값이 되도록, 비선형 보간에 의해 구해진 상기 게인 값에 대하여 리미팅 처리를 실시하는 리미팅 처리부를 더 구비하는, 복호화 장치.
  4. 제3항에 있어서,
    상기 리미팅 처리부는, 0을 하한값으로 하는 리미팅 처리, 1을 하한값으로 하는 리미팅 처리, 또는 1을 상한값으로 하는 리미팅 처리를 실시하는, 복호화 장치.
  5. 제2항에 있어서,
    상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선을 구하고, 상기 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차를 구하는 연산부를 더 구비하고,
    상기 보간 처리부는, 상기 보간 정보가 선형 보간에 의해 상기 게인 값을 구하는 것을 나타내는 정보인 경우, 선형 보간에 의해 상기 게인 값을 구하고, 상기 보간 정보가 비선형 보간에 의해 상기 게인 값을 구하는 것을 나타내는 정보인 경우, 상기 차에 따라서 비선형 보간 또는 선형 보간에 의해 상기 게인 값을 구하는, 복호화 장치.
  6. 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값을 판독하고,
    상기 시계열 신호의 각 샘플 위치의 상기 게인 값을 선형 보간에 의해 구할지, 또는 비선형 보간에 의해 구할지를 나타내는 보간 정보를 판독하고,
    상기 게인 샘플 위치의 상기 게인 값에 기초하여, 상기 시계열 신호의 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을, 상기 보간 정보에 따라서 선형 보간 또는 비선형 보간에 의해 구하는 스텝을 포함하는, 복호화 방법.
  7. 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값을 판독하고,
    상기 시계열 신호의 각 샘플 위치의 상기 게인 값을 선형 보간에 의해 구할지, 또는 비선형 보간에 의해 구할지를 나타내는 보간 정보를 판독하고,
    상기 게인 샘플 위치의 상기 게인 값에 기초하여, 상기 시계열 신호의 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을, 상기 보간 정보에 따라서 선형 보간 또는 비선형 보간에 의해 구하는 스텝을 포함하는 처리를 컴퓨터에 실행시키는 프로그램.
  8. 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값, 및 상기 게인 값의 기울기를 나타내는 게인 기울기 값을 판독하는 게인 판독부와,
    상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선을 구하고, 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차를 구하는 연산부와,
    상기 차에 따라, 상기 시계열 신호의 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을 선형 보간 또는 비선형 보간에 의해 구하는 보간 처리부를 구비하는, 복호화 장치.
  9. 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값, 및 상기 게인 값의 기울기를 나타내는 게인 기울기 값을 판독하고,
    상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선을 구하고, 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차를 구하고,
    상기 차에 따라, 상기 시계열 신호의 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을 선형 보간 또는 비선형 보간에 의해 구하는 스텝을 포함하는, 복호화 방법.
  10. 시계열 신호의 적어도 2개의 게인 샘플 위치의 부호화된 게인 값, 및 상기 게인 값의 기울기를 나타내는 게인 기울기 값을 판독하고,
    상기 게인 샘플 위치에 있어서, 그 상기 게인 샘플 위치의 상기 게인 값을 취하고, 또한 그 상기 게인 샘플 위치의 상기 게인 기울기 값에 의해 나타나는 기울기를 갖는 직선을 구하고, 2개의 상기 게인 샘플 위치에 대하여 각각 구한 상기 직선의 교점의 게인 값과, 상기 2개의 상기 게인 샘플 위치의 각각의 상기 게인 값과의 차를 구하고,
    상기 차에 따라, 상기 시계열 신호의 상기 2개의 상기 게인 샘플 위치의 사이에 있는 각 샘플 위치의 상기 게인 값을 선형 보간 또는 비선형 보간에 의해 구하는 스텝을 포함하는 처리를 컴퓨터에 실행시키는, 프로그램.
KR1020227002138A 2013-12-27 2014-12-12 복호화 장치 및 방법, 및 프로그램 KR102513009B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020237009428A KR20230042410A (ko) 2013-12-27 2014-12-12 복호화 장치 및 방법, 및 프로그램

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JPJP-P-2013-272943 2013-12-27
JP2013272943 2013-12-27
KR1020167015462A KR102356012B1 (ko) 2013-12-27 2014-12-12 복호화 장치 및 방법, 및 프로그램
PCT/JP2014/082925 WO2015098564A1 (ja) 2013-12-27 2014-12-12 復号化装置および方法、並びにプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020167015462A Division KR102356012B1 (ko) 2013-12-27 2014-12-12 복호화 장치 및 방법, 및 프로그램

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020237009428A Division KR20230042410A (ko) 2013-12-27 2014-12-12 복호화 장치 및 방법, 및 프로그램

Publications (2)

Publication Number Publication Date
KR20220013024A true KR20220013024A (ko) 2022-02-04
KR102513009B1 KR102513009B1 (ko) 2023-03-22

Family

ID=53478428

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020227002138A KR102513009B1 (ko) 2013-12-27 2014-12-12 복호화 장치 및 방법, 및 프로그램
KR1020167015462A KR102356012B1 (ko) 2013-12-27 2014-12-12 복호화 장치 및 방법, 및 프로그램
KR1020237009428A KR20230042410A (ko) 2013-12-27 2014-12-12 복호화 장치 및 방법, 및 프로그램

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020167015462A KR102356012B1 (ko) 2013-12-27 2014-12-12 복호화 장치 및 방법, 및 프로그램
KR1020237009428A KR20230042410A (ko) 2013-12-27 2014-12-12 복호화 장치 및 방법, 및 프로그램

Country Status (14)

Country Link
US (3) US10692511B2 (ko)
EP (2) EP3608909B1 (ko)
JP (4) JP6593173B2 (ko)
KR (3) KR102513009B1 (ko)
CN (1) CN105849801B (ko)
AU (1) AU2014371411A1 (ko)
BR (1) BR112016014476B1 (ko)
CA (2) CA3162763A1 (ko)
MX (1) MX2016008172A (ko)
MY (1) MY188538A (ko)
RU (2) RU2764260C2 (ko)
SG (1) SG11201605015XA (ko)
TW (1) TWI644308B (ko)
WO (1) WO2015098564A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI447709B (zh) 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
CN112185399A (zh) 2012-05-18 2021-01-05 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
US9841941B2 (en) 2013-01-21 2017-12-12 Dolby Laboratories Licensing Corporation System and method for optimizing loudness and dynamic range across different playback devices
MX339611B (es) 2013-01-21 2016-05-31 Dolby Laboratories Licensing Corp Codificador y decodificador de audio con metadatos de limite y sonoridad de programa.
US9715880B2 (en) 2013-02-21 2017-07-25 Dolby International Ab Methods for parametric multi-channel encoding
CN104080024B (zh) 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
CN105190618B (zh) 2013-04-05 2019-01-25 杜比实验室特许公司 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN105556837B (zh) 2013-09-12 2019-04-19 杜比实验室特许公司 用于各种回放环境的动态范围控制
EP4379714A2 (en) 2013-09-12 2024-06-05 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
CA3162763A1 (en) * 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
CN105142067B (zh) 2014-05-26 2020-01-07 杜比实验室特许公司 音频信号响度控制
EP4060661B1 (en) 2014-10-10 2024-04-24 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
CN110312146B (zh) * 2019-06-06 2021-11-09 百度在线网络技术(北京)有限公司 音频处理方法、装置、电子设备和存储介质
KR20190085889A (ko) 2019-06-28 2019-07-19 신원제 태양광 패널 청소기

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100083344A1 (en) * 2008-09-30 2010-04-01 Dolby Laboratories Licensing Corporation Transcoding of audio metadata
KR102356012B1 (ko) * 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램

Family Cites Families (230)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4817151A (en) * 1987-11-09 1989-03-28 Broadcast Technology Partners Selective decoder for compatible FM stereophonic system utilizing companding of difference signal
JPH0364800A (ja) 1989-08-03 1991-03-20 Ricoh Co Ltd 音声符号化及び復号化方式
JPH03254223A (ja) 1990-03-02 1991-11-13 Eastman Kodak Japan Kk アナログデータ伝送方式
JP3137805B2 (ja) * 1993-05-21 2001-02-26 三菱電機株式会社 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法
US6022222A (en) * 1994-01-03 2000-02-08 Mary Beth Guinan Icon language teaching system
JP2655485B2 (ja) * 1994-06-24 1997-09-17 日本電気株式会社 音声セル符号化装置
JP3498375B2 (ja) 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置
JP3189598B2 (ja) 1994-10-28 2001-07-16 松下電器産業株式会社 信号合成方法および信号合成装置
US5640490A (en) * 1994-11-14 1997-06-17 Fonix Corporation User independent, real-time speech recognition system and method
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5749064A (en) * 1996-03-01 1998-05-05 Texas Instruments Incorporated Method and system for time scale modification utilizing feature vectors about zero crossing points
JPH1020888A (ja) 1996-07-02 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化・復号化装置
US6073100A (en) 1997-03-31 2000-06-06 Goodridge, Jr.; Alan G Method and apparatus for synthesizing signals using transform-domain match-output extension
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
CN1144179C (zh) 1997-07-11 2004-03-31 索尼株式会社 声音信号解码方法和装置、声音信号编码方法和装置
US5913194A (en) * 1997-07-14 1999-06-15 Motorola, Inc. Method, device and system for using statistical information to reduce computation and memory requirements of a neural network based speech synthesis system
JPH11168622A (ja) 1997-12-05 1999-06-22 Canon Inc 画像処理装置、画像処理方法および記憶媒体
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6829360B1 (en) 1999-05-14 2004-12-07 Matsushita Electric Industrial Co., Ltd. Method and apparatus for expanding band of audio signal
JP4218134B2 (ja) * 1999-06-17 2009-02-04 ソニー株式会社 復号装置及び方法、並びにプログラム提供媒体
US6904405B2 (en) * 1999-07-17 2005-06-07 Edwin A. Suominen Message recognition using shared language model
JP3454206B2 (ja) 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
AU2000231602A1 (en) * 2000-02-24 2001-09-03 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. System for estimating a non-linear characteristic of an amplifier
US6782366B1 (en) * 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
JP2002268698A (ja) 2001-03-08 2002-09-20 Nec Corp 音声認識装置と標準パターン作成装置及び方法並びにプログラム
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
JP4231987B2 (ja) 2001-06-15 2009-03-04 日本電気株式会社 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
WO2003003350A1 (en) 2001-06-28 2003-01-09 Koninklijke Philips Electronics N.V. Wideband signal transmission system
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
AU2002318813B2 (en) 2001-07-13 2004-04-29 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
JP3926726B2 (ja) 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
DE60214027T2 (de) 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
ES2237706T3 (es) 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
US7013011B1 (en) * 2001-12-28 2006-03-14 Plantronics, Inc. Audio limiting circuit
WO2003065353A1 (en) 2002-01-30 2003-08-07 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
JP3815347B2 (ja) 2002-02-27 2006-08-30 ヤマハ株式会社 歌唱合成方法と装置及び記録媒体
JP2003255973A (ja) 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP2003316394A (ja) 2002-04-23 2003-11-07 Nec Corp 音声復号システム、及び、音声復号方法、並びに、音声復号プログラム
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
BR0311601A (pt) 2002-07-19 2005-02-22 Nec Corp Aparelho e método decodificador de áudio e programa para habilitar computador
JP4728568B2 (ja) 2002-09-04 2011-07-20 マイクロソフト コーポレーション レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
ES2259158T3 (es) 2002-09-19 2006-09-16 Matsushita Electric Industrial Co., Ltd. Metodo y aparato decodificador audio.
US7330812B2 (en) 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
EP1586045A1 (en) * 2002-12-27 2005-10-19 Nielsen Media Research, Inc. Methods and apparatus for transcoding metadata
US7787632B2 (en) 2003-03-04 2010-08-31 Nokia Corporation Support of a multichannel audio extension
US7020448B2 (en) * 2003-03-07 2006-03-28 Conwise Technology Corporation Ltd. Method for detecting a tone signal through digital signal processing
CN1458646A (zh) * 2003-04-21 2003-11-26 北京阜国数字技术有限公司 一种滤波参数矢量量化和结合量化模型预测的音频编码方法
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7277537B2 (en) * 2003-09-02 2007-10-02 Texas Instruments Incorporated Tone, modulated tone, and saturated tone detection in a voice activity detection device
KR20050027179A (ko) 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
US7844451B2 (en) 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
WO2005040749A1 (ja) 2003-10-23 2005-05-06 Matsushita Electric Industrial Co., Ltd. スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
KR100587953B1 (ko) 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
US7148415B2 (en) * 2004-03-19 2006-12-12 Apple Computer, Inc. Method and apparatus for evaluating and correcting rhythm in audio data
MXPA06010867A (es) * 2004-04-21 2006-12-15 Dolby Lab Licensing Corp Formato de corriente de bitios de audio en el cual la sintaxis de la corriente de bitios es descrita por una transversal ordenada de una estructura de datos con jerarquia arborea.
EP1744139B1 (en) 2004-05-14 2015-11-11 Panasonic Intellectual Property Corporation of America Decoding apparatus and method thereof
ATE394774T1 (de) 2004-05-19 2008-05-15 Matsushita Electric Ind Co Ltd Kodierungs-, dekodierungsvorrichtung und methode dafür
ATE474310T1 (de) 2004-05-28 2010-07-15 Nokia Corp Mehrkanalige audio-erweiterung
KR100608062B1 (ko) 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
TWI294119B (en) * 2004-08-18 2008-03-01 Sunplus Technology Co Ltd Dvd player with sound learning function
US7716046B2 (en) 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US20060106620A1 (en) 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
SE0402651D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
PL1810281T3 (pl) 2004-11-02 2020-07-27 Koninklijke Philips N.V. Kodowanie i dekodowanie sygnałów audio z wykorzystaniem banków filtrów o wartościach zespolonych
US7983904B2 (en) 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
RU2500043C2 (ru) 2004-11-05 2013-11-27 Панасоник Корпорэйшн Кодер, декодер, способ кодирования и способ декодирования
US7873515B2 (en) * 2004-11-23 2011-01-18 Stmicroelectronics Asia Pacific Pte. Ltd. System and method for error reconstruction of streaming audio information
KR100657916B1 (ko) 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US7616710B2 (en) * 2004-12-08 2009-11-10 Electronics And Telecommunications Research Institute Frequency offset estimating method and receiver employing the same
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
JP5224017B2 (ja) 2005-01-11 2013-07-03 日本電気株式会社 オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
KR100708121B1 (ko) 2005-01-22 2007-04-16 삼성전자주식회사 음성 신호의 대역 확장 방법 및 장치
JP5129115B2 (ja) 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 高帯域バーストの抑制のためのシステム、方法、および装置
KR100933548B1 (ko) 2005-04-15 2009-12-23 돌비 스웨덴 에이비 비상관 신호의 시간적 엔벨로프 정형화
US20070005351A1 (en) 2005-06-30 2007-01-04 Sathyendra Harsha M Method and system for bandwidth expansion for voice communications
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR100813259B1 (ko) 2005-07-13 2008-03-13 삼성전자주식회사 입력신호의 계층적 부호화/복호화 장치 및 방법
CN101253556B (zh) 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
US7653146B2 (en) * 2005-09-06 2010-01-26 Liquid Xstream Systems Inc. System and method for delivery of video, content on demand and IP packets
RU2378790C1 (ru) * 2005-09-27 2010-01-10 Квэлкомм Инкорпорейтед Методики масштабируемости на основе информации содержимого
CN101273404B (zh) 2005-09-30 2012-07-04 松下电器产业株式会社 语音编码装置以及语音编码方法
CN101283407B (zh) 2005-10-14 2012-05-23 松下电器产业株式会社 变换编码装置和变换编码方法
BRPI0520729B1 (pt) 2005-11-04 2019-04-02 Nokia Technologies Oy Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital.
EP2381440A3 (en) 2005-11-30 2012-03-21 Panasonic Corporation Subband coding apparatus and method of coding subband
JP4876574B2 (ja) 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4863713B2 (ja) 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
EP1977312A2 (en) * 2006-01-16 2008-10-08 Zlango Ltd. Iconic communication
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7590523B2 (en) 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
JP4976381B2 (ja) 2006-03-31 2012-07-18 パナソニック株式会社 音声符号化装置、音声復号化装置、およびこれらの方法
ES2400160T3 (es) * 2006-04-04 2013-04-08 Dolby Laboratories Licensing Corporation Control de una característica percibida del volumen sonoro de una señal de audio
DE602007013026D1 (de) 2006-04-27 2011-04-21 Panasonic Corp Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür
EP2017830B9 (en) 2006-05-10 2011-02-23 Panasonic Corporation Encoding device and encoding method
JP2007316254A (ja) 2006-05-24 2007-12-06 Sony Corp オーディオ信号補間方法及びオーディオ信号補間装置
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
JP2007333785A (ja) 2006-06-12 2007-12-27 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置およびオーディオ信号符号化方法
KR101244310B1 (ko) 2006-06-21 2013-03-18 삼성전자주식회사 광대역 부호화 및 복호화 방법 및 장치
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
JP5061111B2 (ja) 2006-09-15 2012-10-31 パナソニック株式会社 音声符号化装置および音声符号化方法
JP4918841B2 (ja) 2006-10-23 2012-04-18 富士通株式会社 符号化システム
JP5141180B2 (ja) 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
US8295507B2 (en) 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
JP4930320B2 (ja) 2006-11-30 2012-05-16 ソニー株式会社 再生方法及び装置、プログラム並びに記録媒体
JP5339919B2 (ja) 2006-12-15 2013-11-13 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
RU2394283C1 (ru) * 2007-02-14 2010-07-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов
JP4984983B2 (ja) 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
JP2008261978A (ja) 2007-04-11 2008-10-30 Toshiba Microelectronics Corp 再生音量自動調整方法
US8015368B2 (en) 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
WO2009001874A1 (ja) 2007-06-27 2008-12-31 Nec Corporation オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
JP5071479B2 (ja) 2007-07-04 2012-11-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
JP5045295B2 (ja) 2007-07-30 2012-10-10 ソニー株式会社 信号処理装置及び方法、並びにプログラム
US8041577B2 (en) 2007-08-13 2011-10-18 Mitsubishi Electric Research Laboratories, Inc. Method for expanding audio signal bandwidth
US20090154726A1 (en) * 2007-08-22 2009-06-18 Step Labs Inc. System and Method for Noise Activity Detection
EP2186089B1 (en) 2007-08-27 2018-10-03 Telefonaktiebolaget LM Ericsson (publ) Method and device for perceptual spectral decoding of an audio signal including filling of spectral holes
CN101939782B (zh) 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
US9495971B2 (en) 2007-08-27 2016-11-15 Telefonaktiebolaget Lm Ericsson (Publ) Transient detector and method for supporting encoding of an audio signal
US8554349B2 (en) 2007-10-23 2013-10-08 Clarion Co., Ltd. High-frequency interpolation device and high-frequency interpolation method
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
JP4733727B2 (ja) 2007-10-30 2011-07-27 日本電信電話株式会社 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体
EP2214163A4 (en) 2007-11-01 2011-10-05 Panasonic Corp CODING DEVICE, DECODING DEVICE AND METHOD THEREFOR
BRPI0818927A2 (pt) 2007-11-02 2015-06-16 Huawei Tech Co Ltd Método e aparelho para a decodificação de áudio
US20090132238A1 (en) 2007-11-02 2009-05-21 Sudhakar B Efficient method for reusing scale factors to improve the efficiency of an audio encoder
CA2704807A1 (en) 2007-11-06 2009-05-14 Nokia Corporation Audio coding apparatus and method thereof
JP2009116275A (ja) 2007-11-09 2009-05-28 Toshiba Corp 雑音抑圧、音声スペクトル平滑化、音声特徴抽出、音声認識及び音声モデルトレーニングための方法及び装置
US8527282B2 (en) 2007-11-21 2013-09-03 Lg Electronics Inc. Method and an apparatus for processing a signal
US8688441B2 (en) 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
EP2224432B1 (en) 2007-12-21 2017-03-15 Panasonic Intellectual Property Corporation of America Encoder, decoder, and encoding method
WO2009084221A1 (ja) 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
EP2077550B8 (en) 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
WO2009093466A1 (ja) 2008-01-25 2009-07-30 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
KR101413968B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
CN101965612B (zh) 2008-03-03 2012-08-29 Lg电子株式会社 用于处理音频信号的方法和装置
KR101449434B1 (ko) 2008-03-04 2014-10-13 삼성전자주식회사 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치
ES2898865T3 (es) 2008-03-20 2022-03-09 Fraunhofer Ges Forschung Aparato y método para sintetizar una representación parametrizada de una señal de audio
US8085941B2 (en) * 2008-05-02 2011-12-27 Dolby Laboratories Licensing Corporation System and method for dynamic sound delivery
KR20090122142A (ko) 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2009154797A2 (en) 2008-06-20 2009-12-23 Rambus, Inc. Frequency responsive bus coding
US8532932B2 (en) * 2008-06-30 2013-09-10 Nellcor Puritan Bennett Ireland Consistent signal selection by signal segment selection techniques
CN102089816B (zh) 2008-07-11 2013-01-30 弗朗霍夫应用科学研究促进协会 音频信号合成器及音频信号编码器
ES2642906T3 (es) 2008-07-11 2017-11-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador
JP5203077B2 (ja) 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
BRPI0917953B1 (pt) 2008-08-08 2020-03-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho de atenuação de espectro, aparelho de codificação, aparelho terminal de comunicação, aparelho de estação base e método de atenuação de espectro.
JP2010079275A (ja) 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010028292A1 (en) 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
WO2010028299A1 (en) 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
GB2466201B (en) 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
PT2359366T (pt) * 2008-12-15 2017-01-20 Fraunhofer Ges Forschung Codificador de áudio e descodificador de extensão de largura de banda
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
ES2901735T3 (es) 2009-01-16 2022-03-23 Dolby Int Ab Transposición armónica mejorada de productos de cruce
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
JP4945586B2 (ja) 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
RU2538334C2 (ru) 2009-02-26 2015-01-10 Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка Кодер, декодер и способ для них
JP5564803B2 (ja) 2009-03-06 2014-08-06 ソニー株式会社 音響機器及び音響処理方法
CN101853663B (zh) 2009-03-30 2012-05-23 华为技术有限公司 比特分配方法、编码装置及解码装置
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
US8392200B2 (en) 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
TWI643187B (zh) 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
JP5223786B2 (ja) 2009-06-10 2013-06-26 富士通株式会社 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機
US8515768B2 (en) 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
JP5928539B2 (ja) 2009-10-07 2016-06-01 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8600749B2 (en) 2009-12-08 2013-12-03 At&T Intellectual Property I, L.P. System and method for training adaptation-specific acoustic models for automatic speech recognition
US8447617B2 (en) 2009-12-21 2013-05-21 Mindspeed Technologies, Inc. Method and system for speech bandwidth extension
EP2357649B1 (en) 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
TWI447709B (zh) 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
PL3570278T3 (pl) 2010-03-09 2023-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rekonstrukcja wysokiej częstotliwości wejściowego sygnału audio przy użyciu kaskadowych banków filtrów
JP5375683B2 (ja) 2010-03-10 2013-12-25 富士通株式会社 通信装置および電力補正方法
JP2011203483A (ja) 2010-03-25 2011-10-13 Yamaha Corp 音声処理装置
EP2555188B1 (en) 2010-03-31 2014-05-14 Fujitsu Limited Bandwidth extension apparatuses and methods
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103069484B (zh) 2010-04-14 2014-10-08 华为技术有限公司 时/频二维后处理
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
CA3027803C (en) 2010-07-19 2020-04-07 Dolby International Ab Processing of audio signals during high frequency reconstruction
US8560330B2 (en) 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP2012058358A (ja) 2010-09-07 2012-03-22 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
US8407020B1 (en) * 2010-09-28 2013-03-26 The United States Of America As Represented By The Secretary Of The Navy Fast method to search for linear frequency-modulated signals
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012052802A1 (en) 2010-10-18 2012-04-26 Nokia Corporation An audio encoder/decoder apparatus
US8521541B2 (en) * 2010-11-02 2013-08-27 Google Inc. Adaptive audio transcoding
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5719966B2 (ja) * 2011-04-08 2015-05-20 ドルビー ラボラトリーズ ライセンシング コーポレイション 2つのエンコードされたビットストリームからのオーディオストリームの混合において使用するためのメタデータの自動設定
WO2012146290A1 (en) 2011-04-28 2012-11-01 Telefonaktiebolaget L M Ericsson (Publ) Frame based audio signal classification
JP6024077B2 (ja) * 2011-07-01 2016-11-09 ヤマハ株式会社 信号送信装置および信号処理装置
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
IN2014CN01270A (ko) 2011-09-29 2015-06-19 Dolby Int Ab
US9354968B2 (en) * 2011-09-30 2016-05-31 Johnson Controls Technology Company Systems and methods for data quality control and cleansing
JP2013102411A (ja) * 2011-10-14 2013-05-23 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
US9583108B2 (en) * 2011-12-08 2017-02-28 Forrest S. Baker III Trust Voice detection for automated communication system
JP5810946B2 (ja) * 2012-01-31 2015-11-11 富士通株式会社 特定通話検出装置、特定通話検出方法及び特定通話検出用コンピュータプログラム
WO2013138633A1 (en) * 2012-03-15 2013-09-19 Regents Of The University Of Minnesota Automated verbal fluency assessment
US20150088528A1 (en) 2012-04-13 2015-03-26 Sony Corporation Decoding apparatus and method, audio signal processing apparatus and method, and program
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
KR20150032649A (ko) 2012-07-02 2015-03-27 소니 주식회사 복호 장치 및 방법, 부호화 장치 및 방법, 및 프로그램
CN103748629B (zh) 2012-07-02 2017-04-05 索尼公司 解码装置和方法、编码装置和方法以及程序
JPWO2014007097A1 (ja) 2012-07-02 2016-06-02 ソニー株式会社 復号装置および方法、符号化装置および方法、並びにプログラム
US9991861B2 (en) * 2012-08-10 2018-06-05 Bellevue Investments Gmbh & Co. Kgaa System and method for controlled dynamics adaptation for musical content
JP2014123011A (ja) 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム
US9841941B2 (en) * 2013-01-21 2017-12-12 Dolby Laboratories Licensing Corporation System and method for optimizing loudness and dynamic range across different playback devices
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
WO2015144587A1 (en) * 2014-03-25 2015-10-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100083344A1 (en) * 2008-09-30 2010-04-01 Dolby Laboratories Licensing Corporation Transcoding of audio metadata
KR102356012B1 (ko) * 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Frank Baumgarte, et al. A Dynamic Range Compression Tool for Audio, ISO/IEC JTC1/SC29/WG11 MPEG2021/M31471, 2013.10.23.* *
Hiroyuki Honma, et al. Technical description Technical description Technical description, ISO/IEC JTC1/SC29/WG11 MPEG2021/M31359, 2013.10.23.* *
Information technology Coding of audiovisual objects Part 3: Audio(ISO/IEC 14496-3:2001)

Also Published As

Publication number Publication date
JP2019215585A (ja) 2019-12-19
CA2934602C (en) 2022-08-30
JP6593173B2 (ja) 2019-10-23
KR20160102403A (ko) 2016-08-30
WO2015098564A1 (ja) 2015-07-02
US20230245665A1 (en) 2023-08-03
RU2016124464A (ru) 2017-12-22
MX2016008172A (es) 2016-10-21
CA3162763A1 (en) 2015-07-02
EP3608909B1 (en) 2021-08-25
RU2018132534A3 (ko) 2021-11-11
US11705140B2 (en) 2023-07-18
BR112016014476B1 (pt) 2021-11-23
EP3089161A1 (en) 2016-11-02
JP6753499B2 (ja) 2020-09-09
CA2934602A1 (en) 2015-07-02
US10692511B2 (en) 2020-06-23
KR20230042410A (ko) 2023-03-28
TW201537560A (zh) 2015-10-01
EP3089161A4 (en) 2017-07-12
RU2018132534A (ru) 2018-10-23
AU2014371411A1 (en) 2016-06-23
EP3089161B1 (en) 2019-10-23
EP3608909A1 (en) 2020-02-12
TWI644308B (zh) 2018-12-11
KR102356012B1 (ko) 2022-01-27
MY188538A (en) 2021-12-20
JP2020187377A (ja) 2020-11-19
US20180197555A1 (en) 2018-07-12
BR112016014476A2 (pt) 2020-09-08
JP2021177260A (ja) 2021-11-11
CN105849801A (zh) 2016-08-10
JPWO2015098564A1 (ja) 2017-03-23
US20200265845A1 (en) 2020-08-20
CN105849801B (zh) 2020-02-14
JP6927385B2 (ja) 2021-08-25
SG11201605015XA (en) 2016-08-30
RU2764260C2 (ru) 2022-01-14
JP7215534B2 (ja) 2023-01-31
RU2667627C1 (ru) 2018-09-21
KR102513009B1 (ko) 2023-03-22

Similar Documents

Publication Publication Date Title
KR102356012B1 (ko) 복호화 장치 및 방법, 및 프로그램
USRE49107E1 (en) Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
JP6531649B2 (ja) 符号化装置および方法、復号化装置および方法、並びにプログラム
RU2634422C2 (ru) Эффективное кодирование звуковых сцен, содержащих звуковые объекты
RU2630754C2 (ru) Эффективное кодирование звуковых сцен, содержащих звуковые объекты

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right