KR20100039824A - 신호처리장치 및 방법과 프로그램 - Google Patents

신호처리장치 및 방법과 프로그램 Download PDF

Info

Publication number
KR20100039824A
KR20100039824A KR1020097010316A KR20097010316A KR20100039824A KR 20100039824 A KR20100039824 A KR 20100039824A KR 1020097010316 A KR1020097010316 A KR 1020097010316A KR 20097010316 A KR20097010316 A KR 20097010316A KR 20100039824 A KR20100039824 A KR 20100039824A
Authority
KR
South Korea
Prior art keywords
gain control
normalization coefficient
coefficient information
information
amount
Prior art date
Application number
KR1020097010316A
Other languages
English (en)
Inventor
히로유키 혼마
Original Assignee
소니 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 주식회사 filed Critical 소니 주식회사
Publication of KR20100039824A publication Critical patent/KR20100039824A/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

입력 단자(110)로부터의 부호화된 부호열이 비다중화 회로(101)에서 비다중화되며, 부호열 중의 정규화계수정보가 정규화 계수 양보 이득 증감회로(102)에 보내지고, 정수치의 가산 또는 감산이 행해져 신호의 레벨조정이 행해진다.
정규화계수정보 중지량 계산회로(103)에서는, 정규화계수정보의 감산량이 정규화계수정보보다 크고, 감산 후의 정규화계수정보가 취할 수 있는 최소치로 중지되는 경우의 중지량을 계산한다. 게인 제어함수 생성정보 수정회로(104)에서는, 중지량에 따라서, 게인 제어함수 생성정보를 수정한다.

Description

신호처리장치 및 방법과 프로그램{Signal processing device and method, and program}
본 발명은, 신호처리장치 및 방법과 프로그램에 관한 것이며, 특히, 부호열을 복호하지 않고 음량의 증감을 행할 경우에 이용하여 매우 적합한 신호처리장치 및 방법과 프로그램에 관한 것이다.
오디오 신호의 고능률 부호화는, 인간의 청각구조(청각특성 등)를 이용함으로써, 예를 들면 CD(Compact Disk)의 1/10에서 1/20 정도의 데이터량으로 압축하여도 양호한 음질을 실현하는 것이 가능해지고 있다. 현재, 시장에도 이러한 기술을 이용한 상품이 유통되고 있으며, 보다 작은 기록 매체에 기록하거나, 네트워크를 통한 전달 등이 가능하게 되어 있다.
이러한 오디오 신호의 고능률 부호화에 이용되는 청각 특성의 주요한 것 중 하나로서, 동시(simultaneous) 마스킹과 계시(繼時)(temporal) 마스킹을 들 수 있다.
동시 마스킹이란, 동 시각에 다른 주파수의 소리가 존재하고 있는 경우에, 대진폭 소리의 근방 주파수에 소진폭의 소리가 있으면, 소진폭 소리는 마스크 되어버려 지각하기 어려워진다고 하는 청각 특성이다.
한편, 계시 마스킹이란, 시간 방향의 마스킹 효과이며, 예를 들면 대진폭의 소리 전후의 시각에 존재하는 소진폭의 소리는 마스크 되어버려 지각하기 어려워진다고 하는 청각 특성이다.
이 계시 마스킹에는, 시간적으로 전에 발생한 소리가 후에 발생한 소리를 마스크하는 순향마스킹과, 시간적으로 후에 발생한 소리가 전에 발생한 소리를 마스크하는 역향마스킹의 두 개의 현상이 있다.
순향마스킹에 관해서는, 수십 msec(밀리 세컨드)의 오더로 효과가 있지만, 역행마스킹의 효과가 있는 것은 1msec 정도의 매우 짧은 시간인 것이 알려져 있다.
대표적인 오디오 고능률 부호화 방식으로는, 시간 신호를 MDCT(수정 이산 코사인 변환)로 직교변환한 후, 얻어진 주파수축 상의 MDCT 계수에 대해서, 복수의 MDCT 계수의 덩어리마다, 정규화를 행하고, 그 후, 양자화 및 부호화를 행하고 있지만, 여기서, 상술한 청각 특성을 효과적으로 이용하기 위해, MDCT 계수의 덩어리마다 양자화 스텝수를 적응적으로 변화시켜 양자화 잡음의 발생을 컨트롤하는 것으로 효율 좋게 신호를 압축하고 있다.
이 MDCT의 변환 길이는, 동시 마스킹이 효과적으로 움직이는 시간 등을 고려하여, 20∼40msec 정도로 설계되어 있지만, 캐스터네츠(castanets) 등의 험난한 공격을 가지는 비정상적인 신호의 경우에는, 발생하는 양자화 잡음(양자화 오차)이 MDCT 역변환 후의 프레임에 한결같이 분포한다. 도 9 및 도 10은 이러한 상태를 나타내고 있다.
현실의 부호화 장치에 있어서의 MDCT에서는, 인접 프레임을 일부 중복시킨 형태로 이용되고 있지만, 여기에서는 설명을 간략화하기 위해서, 프레임 간의 중복이 없는 것으로서, 보다 일반적인 형태에서의 설명을 행한다.
도 9에 나타내는 바와 같은 시간축 상의 입력 신호, 즉 어택부가 펄스 상의 입력 신호에 대해서, 상술한 방법으로 부호화를 행하고, 얻어진 부호열을 복호화하여 얻어지는 시간축 상의 신호는, 도 10에 나타내는 바와 같은 것이 된다. 이 도 10에서도 분명한 바와 같이, 도면 중의 사선부에 나타내는 양자화 잡음(양자화 오차)은, 프레임 내의 시간축 상에서 한결같이 분포하고 있다. 또한, 이러한 도 9, 도 10 중의 「Frame」은, MDCT의 변환 길이인 프레임을 나타내고 있으며, 이하와 같다.
이와 같이 하여 발생하는 잡음에 관하여, 일반적으로, 어택부보다 시간적으로 전에 발생하는 잡음은 프리 에코 노이즈라고 불리고 있으며, 또한, 어택부보다 시간적으로 후에 발생하는 잡음은 포스트 에코 노이즈라고 불리고 있다.
상술한 계시 마스킹이 이들 프리 에코 노이즈나 포스트 에코 노이즈를 청각적으로 마스크 할 시간은 매우 짧기 때문에, 상기 20∼40msec의 MDCT 변환 길이로는 이것을 막지 못하고, 대표적인 오디오 고능률 부호화 방식에 있어서는, 이러한 잡음을 계시 마스킹이 유효한 시간에 한정시키기 위한 여러 가지 궁리가 도모되고 있다.
예를 들면, MPEG1 Audio Layer III(MPEG:Moving Picture Experts Group), 이른바 MP3에서는, 입력 PCM 신호를 서브밴드 필터 뱅크로 등대역 분할하여 서브밴드 신호를 만들어 낸 후, 신호의 정상성(定常性)에 따라서 두 개의 다른 길이의 MDCT의 변환 길이를 적응적으로 선택하는 것으로, 프리·포스트 에코 노이즈의 억제 대책을 행하고 있다. 예를 들면, 험난한 어택을 가지는 비정상 신호가 입력된 경우는, 짧은 MDCT의 변환 길이를 선택하는 것으로, 프리·포스트 에코 노이즈가 발생하는 시간을 짧은 MDCT 프레임 내에 한정시켜, 노이즈가 지각되는 것을 억제하고 있다.
또한, 이른바 MD(미니디스크, 상표) 등으로 이용되고 있는 부호화 방식으로는, 특허 문헌 1에 개시되어 있는 바와 같이, 입력 PCM 신호를 서브밴드 필터 뱅크에서 등대역 분할하여 서브밴드 신호를 만들어 낸 후, 신호의 정상성에 의해서 서브밴드 신호의 게인을 시간축 상에서 변화시켜 게인 제어하는 것으로, 정상적인 서브밴드 신호로 한 후, 일정 변환 길이의 MDCT를 행하고, 정규화·양자화·부호화를 행하는 것으로, 프리·포스트 에코 노이즈의 억제 대책을 행하고 있다.
도 11, 도 12 및 도 13은, 게인 제어의 효과를 설명하기 위한 도면이다. 또한, 상기 특허 문헌 1에서는, 인접 프레임을 일부 중복시킨 형태에서의 설명이 이루어지고 있지만, 여기에서는 보다 일반적으로, 프레임간의 중복이 없는 형태에서의 설명을 행한다.
우선 부호화 장치에서는, 도 9의 입력 신호에 대해서, 도 11의 G_0(t), G_1(t), G_2(t)와 같은 게인 제어함수를 얻는다.
이 게인 제어함수는, 각 프레임을 시간축 상에서 더 등분할하여 서브 프레임으로 하고, 이러한 서브 프레임에 있어서의 최대 진폭 혹은 파워를 구해, 그것을 일차 함수 등으로 보간 한 것에 상당한다. 이 게인 제어함수로 입력 신호를 곱셈 하고, 소진폭 부분을 증폭시켜, 대진폭 부분을 감쇠시키는 것으로, 일단, 시간적으로 거의 평탄한 신호로 한 다음, 정규화, 양자화 및 부호화를 행하고, 게인 제어함수 생성정보나 정규화 정보 등과 함께 다중화를 행해, 부호열을 얻는다.
복호장치에 있어서는, 입력된 부호열에 대해서, 비다중화(다중화의 역처리), 복호화, 역양자화 및 비정규화(정규화의 역처리)를 차례로 진행한다. 여기까지의 처리로 얻어진 시간축 상의 신호는, 도 12와 같은 것이 되며, 도 12 중의 사선부에 나타내는 양자화 오차가 프레임 전체에 한결같이 분포하고 있다. 여기서, 상기 부호열을 비다중화하여 얻어진 게인 제어함수 생성정보로부터, 도 11의 게인 제어함수와 쌍의 관계에 있는 역게인 제어함수(게인 제어함수의 값을 역수로 한 함수)를 재구성하여, 도 12의 파형(波形)에 곱하는 것으로, 도 13과 같은 파형이 얻어진다.
이 도 13에서 분명한 바와 같이, 도면 중의 사선부에 나타내는 양자화 오차는, 어택부인 펄스의 전후 부근의 레벨에 비해 다른 부분의 레벨이 감쇠된 것처럼 분포하여, 계시 마스킹의 효과에 의해 프리 에코 노이즈 및 포스트 에코 노이즈를 큰 폭으로 억제할 수 있다. 이 게인 제어 자체는, 부호화 장치의 부호화 알고리즘의 최적화의 범주에 있어, 예를 들면, 큰 어택이 존재하는 신호가 입력되어도, 풍부하게 비트 할당이 이루어지며, 양자화 오차의 발생이 지극히 적으면 게인 제어를 행하지 않는 등 부호화 장치의 회로 규모나 용도에 따라 여러 가지 설계를 행할 수 있다.
이와 같이, 오디오 고능률 부호화에서는, 청각의 특성을 잘 이용하면서, 신 호의 성질에 따라 적응적으로 양자화 노이즈의 발생을 컨트롤하는 것으로, 효율 좋게 신호의 압축을 행하는 것이 가능하게 되어 있다.
그런데, 이러한 오디오 신호의 고능률 부호화 기술에 있어서는, 부호화·복호화를 할 때, 비교적 많은 연산량이나 메모리가 필요하게 되기 때문에, 일단, 부호화된 부호열에 대해서, 간편한 신호처리를 가하는 기술이 제안되고 있다. 이것은, 부호열에 대해서, 시간축 상의 신호에까지 복호화한 후에 소망한 신호처리를 행하여 재차 부호화한다고 하는 처리는 행하지 않고, 부호열에 포함되는 파라미터 등을 직접 변경하는 것으로, 적은 연산량이나 작은 메모리로 소망한 신호처리를 행하는 기술이다.
예를 들면, 특허 문헌 2에는, 부호열 안의 정규화계수정보를 직접 변경하는 것으로, 신호의 필터링을 행하는 것을 가능하게 하는 기술이 개시되고 있다. 또, 특허 문헌 3에는, 부호열 안의 정규화계수정보를 직접 변경하는 것으로 신호의 레벨조정을 행하는 것을 가능하게 하는 기술이 개시되고 있다.
[특허 문헌 1] 특허 제 3263881호 공보
[특허 문헌 2] 특허 제 3879249호 공보
[특허 문헌 3] 특허 제 3879250호 공보
그런데, 상술한 게인 제어 기술을 채용하고 있는 오디오 고능률 부호화 방식에 있어서는, 상술한 특허 문헌 2, 3에 기재한 기술을 직접 적용한 경우에, 신호의 성질에 따라서는 문제가 발생하는 경우가 있다. 이하, 도면을 참조하면서 이 문제의 설명을 행한다.
예를 들면, 도 9와 같은 펄스 상의 신호를, 상술한 게인 제어 기술을 채용하고 있는 오디오 고능률 부호화 방식으로 부호화하여 부호열이 얻어지고 있는 경우에, 그 부호열을 상술한 특허 문헌 3의 기술을 이용하여 부호열 중의 정규화 정보를 직접 변경하여 레벨조정을 행하는 것으로 페이드인(fade in)의 효과를 얻고 싶은 경우를 생각할 수 있다.
복호화 장치에 있어서 부호열을 복호하여 출력 PCM 신호를 얻은 후에, 이 신호처리를 행한 경우의 결과는, 도 14와 같이 된다.
이것은, 0부터 1.0의 범위로 시간과 함께 서서히 증가하는 페이드인 함수 Fi(t)를 복호화 장치의 출력 PCM 신호에 곱한 것이다.
이 페이드인 함수 Fi(t)의 형상을, 상기 특허 문헌 3에 기재된 기술을 이용하여 프레임 마다의 정규화계수정보의 감산으로 표현한 경우는, 도 15와 같이 된다. 도 15에 있어서의 SFfi(frame)는, 이산 시간의 함수인 Fi(t)를 프레임 사이즈의 간격으로 재샘플링하여, 그 값을 정규화계수정보의 차분치로서 양의 정수로 표현한 것에 상당한다.
상술한 정규화계수정보는, 상기 특허 문헌 1에 기재한 오디오 고능률 부호화 방식의 경우에 있어서는, 도 16과 같이 2데시벨 조각의 6비트로 표현된다. 이 도 16에 있어서, SF는 양의 정수인 정규화계수정보, SFval(SF)는 양의 실수인 정규화 계수이다.
도 17은, 상기 특허 문헌 3에 기재된 기술에 의거하여, 정규화계수정보를 감산함으로써 페이드인을 실현하는 처리를 나타내고 있다. 이 기술에 있어서는, 정규화 계수는 주파수 영역 상의 MDCT 계수를 정규화하는 것이며, 복수의 MDCT 계수를 정리한 양자화 유닛으로 불리는 단위마다 구해지는 것이지만, 여기에서는 간단하게 하기 위해 단일의 정규화 계수로 설명을 행한다.
도 17에 있어서의 SForg(frame)는, 각 프레임마다 구해진 정규화계수정보를 나타내고 있다.
여기서, 프레임 번호 2의 프레임에 대해서는, 펄스와 MDCT에 있어서의 창문의 위치 관계나, 게인 제어의 알고리즘 등의 요인에 의해, 게인 제어가 행해지지 않았던 프레임이다.
이것에 대해서, 도 15에서 설명한 SFfi(frame)를 이용하여 정규화계수정보의 감산을 행하면, 도 18과 같이 된다. 정규화계수정보는 0부터 63까지의 양의 정수이므로, 감산결과로서 음의 정규화계수정보가 된 경우는, 0에서 중지되게 된다. Tsf는 중지된 정규화계수정보의 양을 나타내고 있다.
도 19는, 상술한 정규화계수정보의 감산결과가 음이 되어 0의 정규화계수정보로 중지된 프레임을 포함한 결과를 나타내고 있다.
도 19의 SFm(frame)은, 페이드인 처리가 행해진 정규화계수정보를 나타내고 있다.
도 20(a)는, 도 14와 같은 부호열을 복호화한 후의 PCM 신호에 페이드인 처리를 적용한 것으로, 도 20(b)는, 상술한 부호열 상에서의 페이드인 처리가 행하진 부호열을 복호화 장치에 입력하여 얻어진 출력 PCM 신호를 나타내고 있다. 프레임 번호 0 및 1의 프레임에 있어서는, 정규화 계수가 중지된 후에, 역게인 제어가 행해진 결과, 도 20(a)에 비해 큰 펄스 신호로 되어 있다. 또한, 프레임 번호 2에 있어서는, 게인 제어도 행해지지 않고, 정규화 계수의 중지도 없기 때문에, 도 20(a)의 펄스 신호에 상응하는 진폭치로 되어 있다.
본 발명은, 이러한 실정을 감안하여 이루어진 것이며, 게인 제어가 이용되고 있는 고능률 오디오 부호화 방식으로 부호화된 부호열을 직접 가공하여 페이드인이나 페이드아웃 등의 신호처리를 적용하는 경우에 생기는 문제를 해결하고 품질이 좋은 부호열을 출력하는 것을 가능하게 하는 신호처리장치 및 방법과 프로그램을 제공하는 것을 목적으로 한다.
상술의 과제를 해결하기 위해서, 본 발명은, 입력 디지털신호를 시간축 상에서 블록 분할하여, 블록마다 시간축 상의 게인 제어를 행하고, 상기 게인 제어된 신호성분에 대해서 양의 값을 이용하여 정규화를 행하고, 상기 정규화된 신호성분을 양자화하고, 상기 게인 제어를 행하는 게인 제어함수를 생성하는 게인 제어함수 생성정보 및 정규화계수정보와 함께 부호화 및 다중화를 행하는 것으로 얻어지는 부호열에 대해서 행하는 신호처리에 있어서, 상기 부호화된 부호열에 대해서, 상기 부호열 중의 정규화계수정보에, 정수치의 가산 혹은 감산을 행하고, 신호의 레벨조정을 행함과 동시에, 상기 정규화계수정보의 감산량이 정규화계수정보보다 크고, 감산 후의 정규화계수정보가 취할 수 있는 최소치로 중지되는 경우에, 상기 중지량에 따라서, 게인 제어함수 생성정보를 수정해도 좋다.
여기서, 상기 정규화계수정보의 가산량이 크고, 가산 후의 정규화계수정보가 취할 수 있는 최대치로 중지되는 경우에, 상기 중지량에 따라서, 게인 제어함수 생성정보를 수정하도록 해도 좋다.
도 1은, 본 발명의 실시형태로 이루어지는 신호처리장치의 개략 구성을 나타내는 블럭도이다.
도 2는, 본 발명의 실시형태에 있어서의 부호화 방식의 부호열의 포맷의 일례를 나타내는 도면이다.
도 3은, 본 발명의 실시형태에 있어서의 4비트의 게인 제어량 정보 테이블의 일례를 나타내는 도면이다.
도 4(a)는, 본 발명의 실시형태에 있어서의 역게인 제어함수의 구체적인 예를 나타내는 도면이다.
도 4(b)는, 본 발명의 실시형태에 있어서의 역게인 제어함수의 구체적인 예를 나타내는 도면이다.
도 5는, 본 발명의 실시형태에 있어서의 게인 제어함수 생성정보 수정회로의 처리 순서의 일례를 설명하기 위한 플로차트이다.
도 6은, 본 발명의 실시형태에 있어서의 역게인 제어에 의해서 생기는 프레임 전체의 게인의 증폭량(GM)의 계산의 일례를 설명하기 위한 플로차트이다.
도 7은, 정규화계수정보의 가산의 결과와, 거기에 따르는 정규화계수정보의 중지모습을 설명하기 위한 도면이다.
도 8은, 정규화계수정보의 중지의 구체적인 예를 나타내는 도면이다.
도 9는, 일정 주기, 일정 진폭의 펄스 신호를 나타내는 도면이다.
도 10은, 일반적인 오디오 고능률 부호화에 있어서의 복호된 신호중의 에코 노이즈의 발생을 나타내는 도면이다.
도 11은, 펄스 신호가 입력된 경우의 게인 제어함수의 일례를 나타내는 도면이다.
도 12는, 게인 제어가 행해진 신호에 대해서 양자화 오차가 부가된 상태를 나타내는 도면이다.
도 13은, 에코 노이즈를 억제시키기 위한 게인 제어의 효과를 나타내는 도면이다.
도 14는, 시간 샘플마다 페이드인을 행하는 함수를 나타내는 도면이다.
도 15는, 페이드인 함수에 상당하는 정규화계수정보의 감산을 나타내는 도면이다.
도 16은, 6비트의 정규화 계수 테이블의 예를 나타내는 도면이다.
도 17은, 정규화계수정보의 감산결과와, 거기에 따르는 정규화계수정보의 중지모습을 나타내는 도면이다.
도 18은, 정규화계수정보의 중지의 구체적인 예를 나타내는 도면이다.
도 19는, 정규화계수정보의 감산결과와, 거기에 따르는 정규화계수정보의 중지모습을 나타내는 도면이다.
도 20(a)는, 정규화계수정보의 중지와 역게인 제어의 관계에 의해서 신호가 증폭하는 모습을 나타내는 도면이다.
도 20(b)는, 정규화계수정보의 중지와 역게인 제어의 관계에 의해서 신호가 증폭하는 모습을 나타내는 도면이다.
<도면의 주요부분에 대한 부호의 설명>
101. 비다중화 회로
102. 정규화계수정보 증감회로
103. 정규화계수정보 중지량 계산회로
104. 게인 제어함수 생성정보 수정회로
105. 다중화 회로
이하, 본 발명을 적용한 구체적인 실시형태에 대해서, 도면을 참조하면서 상세하게 설명한다.
도 1은, 본 발명의 실시형태에 이용되는 신호처리장치의 구성을 개략적으로 가리키는 블럭도이다.
이 도 1에 나타내는 신호처리장치는, 비다중화 회로(101)와, 정규화계수정보 증감회로(102)(정규화계수정보 증감수단)와, 정규화계수정보 중지량 계산회로(103)(중지량 계산수단)와, 게인 제어함수 생성정보 수정회로(104)(게인 제어함수 생성정보의 수정수단)와 다중화 회로(105)를 가지며 구성된다.
비다중화 회로(101)는, 입력 단자(110)에서 입력된 부호열을 비다중화하여, 정규화계수정보를 정규화계수정보 증감회로(102)에 공급하고, 게인 제어함수 생성정보를 게인 제어함수 생성정보 수정회로(104)에 공급한다. 입력 단자(110)에서 비다중화 회로(101)에 공급되는 부호열의 일례에 대해서는 후술한다.
정규화계수정보 증감회로(102)는, 입력 단자(112)에서 주어진 정규화계수정보 증감량을 기초로 정규화계수정보의 증감을 행하고, 계산결과, 정규화계수정보가 취할 수 있는 상한치 혹은 하한치를 넘고 있던 경우는, 각각, 상한치 혹은 하한치로 옮겨 놓는다. 출력인 정규화계수정보는, 게인 제어함수 생성정보 수정회로(104) 및 다중화 회로(105)에 공급된다.
상한치, 하한치로 옮겨지기 전의 정규화계수정보는, 중지 전 정규화계수정보로서, 정규화계수정보 중지량 계산회로(103)에 공급된다.
여기에서의 정규화계수정보의 증감에 관해서는, 예를 들면 상술한 도 17과 함께 설명한 바와 같은 방법을 이용할 수 있다.
정규화계수정보 중지량 계산회로(103)는, 정규화계수정보 증감회로(102)로부터 출력된 정규화계수정보와, 같이 정규화계수정보 증감회로(102)로부터 출력된 중지 전 정규화계수정보를 비교하여, 정규화계수정보 중지량을 계산하고, 게인 제어함수 생성정보 수정회로(104)로 공급한다.
여기에서의 정규화계수정보 중지량의 계산에 관해서는, 상술한 도 18 및 도 19와 함께 설명한 바와 같은 방법을 이용할 수 있다.
게인 제어 정보 수정회로(104)는, 비다중화 회로(101)로부터 출력된 게인 제어함수 생성정보와, 정규화계수정보 중지량 계산회로(103)로부터 출력된 정규화계수정보 중지량을 비교하여, 게인 제어함수 생성정보 수정량을 구하고, 게인 제어함수 생성정보의 수정을 행한다. 게인 제어함수 생성정보 수정회로(104)의 상세한 동작 등에 대해서는, 후술한다.
수정된 게인 제어함수 생성정보는, 다중화 회로(105)로 공급된다.
다중화 회로(105)는, 정규화계수정보 증감회로(102)로부터 출력된 정규화계수정보와, 게인 제어 정보 수정회로(104)로부터 출력된 게인 제어함수 생성정보와, 입력 단자(110)로부터의 입력 부호열을 입력으로 하고, 입력 부호열의 해당 개소를, 상기 정규화계수정보 증감회로(102) 및 게인 제어 정보 수정회로(104)에 의해 각각 새롭게 얻어진 정규화계수정보 및 게인 제어함수 생성정보로 옮겨놓고, 다중화를 행해, 출력 부호열을 출력 단자(115)에서 출력한다.
여기서, 상술한, 비다중화 회로(101)가 입력이 되는 부호열의 일례에 대해 도 2를 이용하여 설명한다.
도 2는, 상기 부호열을 구성하는 프레임의 하나를 나타낸 것으로, 헤더, 게인 제어함수 생성정보, 정규화계수정보 및 정규화 신호 데이터로 이루어져 있다.
게인 제어함수 생성정보는, 게인 제어 변화점 수, 게인 제어 변화점 위치 정보 및 게인 제어량 정보로 이루어지며, 게인 제어 변화점 수에 의해서, 게인 제어 변화점위치 정보 및 게인 제어량 정보의 개수가 정해진다.
게인 제어량 정보(Glev)는, 예를 들면 도 3과 같이 4비트의 코드이며, 그 게인 제어량(Gain)은, Glev의 함수로서 이하의 식에서 구해진다.
Gain(Glev)=2^(Glev-4)
도 2의 게인 제어함수 생성정보에 의해 복호기에 있어서 생성되는 역게인 제어함수의 구체적인 예를 도 4(a), 도 4(b)에 나타낸다.
도 4(a)에 있어서, 게인 제어 변화점 수는 2이며, 2개의 게인 제어 변화점 위치 정보는 각각, Gloc[0], Gloc[1]로 나타내지며, 또, 2개의 게인 제어량 정보는 각각, Glev[0], Glev[1]로 나타내지고 있다.
게인 제어 변화점 위치 정보(Gloc)는, 프레임을 등분할한 서브 프레임의 위치를 나타내고, 도 4에 나타내는 바와 같이, Gloc[0]에 있어서의 게인 제어량 정보는, Glev[0]에 대응한다. 또, 게인 제어 변화점 위치 정보(Gloc)가 어느 서브 프레임보다 전의 서브 프레임 위치에 있어서의 게인 제어량 정보는, 그 서브 프레임 직후의 Gloc가 있는 서브 프레임에 있어서의 게인 제어량 정보가 된다.
또, 도 4에 나타내는 바와 같이, 프레임 종단의 서브 프레임에 있어서의 게인 제어량은 1.0이 된다.
또, 도 4에 있어서의 역게인 제어함수는, 도 3에 나타낸 4비트의 코드의 게인 제어량 정보의 역수의 관계에 있어, 예를 들면, Gain(3)의 0.5는, 역게인 제어함수에 있어서는, 2.0배의 게인 변화가 된다.
도 4에 있어서의 게인 제어함수는, 각 서브 프레임에 있어서의 게인 제어량을 직선으로 보간 한 것으로 되어 있지만, 본 발명과 관련되는 다른 실시형태로서는, 정현 함수(sine function) 등을 이용한 보간을 행해도 좋고, 혹은 보간을 행하지 않아도 좋다.
도 2에 있어서의 게인 제어함수 생성정보는, 상술의 설명한 바와 같은 포맷으로 기록되어 있고, 또 같은 도 2에 있어서의 정규화 신호 데이터는, 상술한 게인 제어함수로 입력 PCM 신호를 제산한 후에, 정규화 계수에 의해서 정규화를 행해 얻 어진 것에 상당한다.
여기서, 본 발명의 실시형태가 되는 신호처리장치 및 방법의 개략 구성을 정리하면, 다음과 같이 된다. 즉, 먼저 신호처리를 행하는 부호열을 얻기 위한 부호화 방식으로서는, 입력 PCM 신호를 부호화할 때에, 시간 블록마다, 시간축 상의 게인 제어를 행해, 상기 게인 제어된 신호성분에 대해서 양의 값을 이용하여 정규화를 행하고, 상기 정규화된 신호성분을 양자화하여, 상기 게인 제어를 행하는 게인 제어함수를 생성하는 게인 제어함수 생성정보 및 정규화계수정보와 함께 부호화 및 다중화를 행하는 것으로 부호열을 얻는 부호화 방식을 이용하고 있다. 이러한 부호화열을 복호화할 때, 상기 부호열을 비다중화하고, 부호화된 신호성분을 복호하여, 역양자화를 행한 후, 상기 정규화계수정보를 이용하여 비정규화를 행하고, 상기 게인 제어함수 생성정보를 이용하여 상기 게인 제어함수와 쌍의 관계에 있는 역게인 제어함수를 이용하여 역게인 제어를 행하고, 출력 PCM 신호를 얻는 복호화 방식이 이용된다. 본 발명의 실시형태에서는, 상술한 바와 같은 부호화 방식으로 부호화된 부호열에 대해서, 상기 부호열 중의 정규화계수정보에, 정수치의 가산 혹은 감산을 행하여, 신호의 레벨조정을 행하는 신호처리를 행하고, 상기 정규화계수정보의 감산량이 정규화계수정보보다 크고, 감산 후의 정규화계수정보를 취할 수 있는 최소치에서 중지되는 경우에, 상기 중지량에 따라서, 게인 제어함수 생성정보를 수정한다.
이러한 본 발명의 실시형태의 구성에 의하면, 게인 제어를 이용한 오디오 고능률 부호화 방식에 의해서 얻어진 부호열에 대해서, 부호열을 복호하지 않고 정규 화 계수를 조정하는 것으로 적은 계산량 및 메모리 사용량으로 음량의 제어를 행하는 경우에 있어서, 정규화 계수의 중지와 역게인 제어에 의해서 생기는 음량의 과대한 증폭을, 정규화 계수의 중지량에 따라 적응적으로 게인 제어함수 생성정보를 수정하는 것으로 억제하여 소망한 음량의 제어를 행하는 것이 가능해진다.
본 발명의 실시형태의 설명에서는, 입력 PCM 신호에 대해서 게인 제어를 행한 후, 정규화를 행해 양자화 및 부호화를 행하여 얻어지는 부호열을 이용했지만, 본 발명과 관련되는 다른 실시형태로서는, 예를 들면, 입력 PCM 신호에 대해서 서브밴드 분할필터를 이용하여 서브밴드 신호를 얻은 후, 게인 제어를 행하여 얻어지는 부호열을 이용해도 좋다.
또, 본 발명과 관련되는 다른 실시형태로서는, 게인 제어를 행하여 얻어지는 신호에 대해서 MDCT와 같은 시간 주파수 변환을 행하고, 얻어진 MDCT 계수의 특정의 블록마다 정규화, 양자화 및 부호화를 행하여 얻어지는 부호열에도 적용 가능하다.
다음에, 상기 도 1의 구성의 신호처리장치에 있어서의 게인 제어함수 생성정보 수정회로(104)에 대해서, 이하 상세하게 설명한다.
게인 제어함수 생성정보 수정회로(104)는, 상술한 정규화계수정보의 중지와 역게인 제어에 의해서 생기는 신호의 과대 증폭을 방지하기 위한 회로이다. 그 구체적인 동작의 순서를, 도 5 및 도 6의 플로차트를 참조하면서 설명한다.
우선, 도 5의 스텝(S1)에 있어서, 처리를 행하는 프레임으로 게인 제어함수 생성정보의 수정이 필요한지 아닌지의 판정을 행한다.
스텝(S1)의 Tsf는, 상기 도 17에 있어서의 정규화계수정보의 중지량으로, 정규화계수정보 중지량 계산회로(103)의 출력으로서 얻어진다. GM은 역게인 제어에 의해서 생기는 프레임 전체의 게인 증폭량이며, 이것은 도 6의 설명에 있어서 후술한다. α는 정수이다.
이 스텝(S1)에 있어서, 정규화계수정보의 중지량(Tsf)이, α·GM보다 큰지 아닌지를 판별하고, YES(진)로 판정된 경우, 즉, 역게인 제어에 의해서 생기는 프레임 전체의 게인의 증폭량보다, 정규화계수정보의 중지량이 크다고 판정된 경우에는, 스텝(S2)의 처리를 행한다. 스텝(S1)에서 NO라고 판정된 경우에는, 처리를 종료(END)한다.
스텝(S2)에서는, 게인 제어 변화점 수의 카운터인 J를 0으로 초기화하고, 이후, 게인 제어 변화점 수 NGC회의 루프 처리를 행하여, 스텝(S3)으로 진행된다.
스텝(S3)에서는, 게인 제어량 정보 Glev[J]가 4 미만인지 아닌지의 판정, 즉, 역게인 제어함수에 있어서, 게인을 증폭하는 경우의 판정처리를 행한다.
이 스텝(S3)에 있어서 YES(Glev[J]가 4 미만)라고 판정된 경우에는, 스텝(S4)의 처리를 행하고, NO(Glev[J]가 4 이상)라고 판정된 경우에는 스텝(S7)으로 진행된다. 또한, 스텝(S7)에서는, 게인 제어 변화점 수의 카운터(J)를 인크리먼트(increment)(J=J+1) 하는 처리를 행한다.
스텝(S4)에서는, 게인 증폭의 억제 처리가 행해진다. 구체적으로는, 게인 제어량 정보 Glev[J]에, 정규화계수정보 중지량(Tsf)을 3으로 나누는 것으로 게인 제어량 정보 상당의 값으로 하고, 이것을 가산하는 것(Glev[J]=Glev[J]+Tsf/3)에 의해, 게인 증폭의 억제 처리를 행하고 있다. 상술한 도 16 및 상기 도 3에서 분명한 바와 같이, 정규화 계수는, 2dB스텝이며, 게인 제어량은 6dB스텝의 값으로 되어 있다. 스텝(S4)의 처리 후는 스텝(S5)으로 진행된다.
다음에, 스텝(S5) 및 스텝(S6)에서는, 상기 스텝(S4)의 계산 결과의 중지를 실행한다. 즉, 스텝(S5)에 있어서, 스텝(S4)의 처리 후의 게인 제어량 정보 Glev[J]가 중지의 값 15를 넘었는지 아닌지를 판별하여, 15를 넘었을 때는 스텝(S6)으로 진행되어 Glev[J]를 15로 한 후 스텝(S7)(카운터(J)의 인크리먼트(increment) 처리)으로 진행되며, 15 이하일 때는 그대로 스텝(S7)으로 진행된다.
이것은, 게인 제어량 정보에 대한 가산결과, Glev[J]를 취할 수 있는 최대치를 넘지 않게 하기 위해서 행한다. 본 발명과 관련되는 다른 실시 예로서는, 이 중지의 값을 15보다 작게 해도 좋다. 게인 제어는, 프리·포스트 에코 노이즈를 억제하기 위해 행하는 것으로, 부호화와 복호화로 각각 행해지는 게인 제어와 역게인 제어는, 이론적으로는 무손실의 처리로 되어 있다. 그런데, 여기에서의 게인 제어량 정보의 수정이 과도하게 커진 경우에, 게인 제어와 역게인 제어의 쌍의 관계가 큰폭으로 무너지게 된다.
다음에, 도 6의 플로차트를 참조하면서, 역게인 제어에 의해서 생기는 프레임 전체의 게인의 증폭량(GM)의 계산의 설명을 행한다.
우선, 도 6의 스텝(S11)에서는, 각종 초기화가 행해진다. 이 도 6의 플로차트에 있어서, I는 게인 제어 변화점 수의 카운터, J는 서브 프레임의 카운터로서 이용된다. NGC는 게인 제어 변화점 수이며, NS는 서브 프레임 수이다. GL은 게인 제어 변화점 위치 정보(Gloc)를 일시적으로 보관 유지하는 변수이다. GM은 본 플로차트의 처리로 구하는 프레임 전체의 게인 증폭량이며, 0으로 초기화된다. G는 게인의 증폭량(GM)을 계산할 때에 이용되는 게인 제어량 정보의 변수이며, 0으로 초기화된다.
스텝(S11)에서 초기화가 행해진 후, 스텝(S12)에서 스텝(S19)까지 서브 프레임 마다의 루프 처리가 행해진다.
스텝(S12)에서는, 서브 프레임 카운터의 값(J)(서브 프레임의 위치)이 변수(GL)(에 보관 유지된 게인 제어 변화점 위치 정보(Gloc))에 일치하는지 아닌지를 판별하고, YES, 즉 서브 프레임의 카운터의 값(J)이 게인 제어 변화점 위치에 일치할 때, 스텝(S13)으로 진행되고, 현재의 서브 프레임에 있어서의 게인 제어량 정보의 변수(G)가 갱신된다. 스텝(S12)에서 NO라고 판별되었을 때는, 스텝(S17)으로 진행된다.
스텝(S13)에서는, 게인 제어량 정보 Glev[J]로부터 4를 줄인 값을 게인 제어량 정보의 변수(G)에 대입(G=Glev[J]-4)하고, 또, 게인 제어 변화점 수의 카운터를 감소(I=I-1)하고 있다.
스텝(S13)의 처리 후, 스텝(S14)으로부터 스텝(S16)에 있어서, I에 따라 GL의 값이 갱신된다.
즉, 스텝(S14)에서는, I가 0 이상인지 아닌지가 판별되며, YES일 때는 스텝(S15)으로 진행되고, 변수(GL)에 감소 된 I에 대응하는 게인 제어 변화점 위치 정보 Gloc[I]가 대입되며, 스텝(S17)으로 진행된다. 스텝(S14)에서 NO라고 판별되었을 때는, 스텝(S16)에서 GL을 ―1로 하여(GL=-1), 스텝(S17)으로 진행된다.
스텝(S17)에서는, GM에 현재의 서브 프레임의 게인 제어량 정보(G)가 가산(GM=GM+G) 된다.
다음의 스텝(S18)에서는, 서브 프레임 카운터의 값(J)이 감소(J=J-1) 되며, 스텝(S19)으로 진행되고, J가 0 미만인지(J<0) 아닌지가 판별된다. NO일 때는 상기 스텝(S12)으로 돌아오고, YES일 때는, 처리를 종료한다.
이상과 같이, 서브 프레임마다 GM이 갱신되며, 프레임 전체의 게인의 증폭량이 구해진다.
이 처리는, 정규화계수정보의 중지와 역게인 제어에 의해서 생기는 프레임 전체의 게인 증폭량을 고려하여, 게인 제어함수 생성정보를 수정할 필요가 있기 때문에 실시되고 있다.
여기서, 도 4(a), 도 4(b)에는, 게인 제어 변화점 위치 정보의 차이에 의한, 역게인 제어함수의 차이를 나타내고 있다. 도 4(a)보다 도 4(b) 쪽이 프레임 내의 게인 증폭량이 커지고 있다.
이것은 즉, 부호화에 있어서의 게인 제어에 있어서는, 게인의 억제량이 커지고 있는 것을 의미한다. 이 하단과 같은 경우에서는, 정규화계수정보가 작아지며, 따라서, 정규화계수정보의 중지량이 커진다. 이러한 케이스에서는, 정규화계수정보의 중지량에 의한 게인 제어함수 정보의 수정은 불필요하다.
이와 같이 하여, 정규화계수정보의 중지량에 따라서, 게인 제어함수 생성정 보를 적응적으로 수정하는 것으로, 게인의 과대한 증폭을 방지할 수 있다.
이상의 본 발명의 실시형태에 있어서는, 부호열을 복호화하지 않고 신호의 레벨조정을 행하는 경우에, 정규화계수정보의 감산 후의 정규화계수정보의 최소치에서의 중지에 의해서 생기는 문제와 그 해결 방법에 대해 기술해 왔지만, 한편으로, 정규화계수정보에 대한 가산을 이용하여 신호를 증폭하는 경우에도 같은 문제가 일어날 수 있다.
도 7, 도 8은, 정규화계수정보에 대한 가산을 이용하여 신호를 증폭하는 경우의 문제점을 나타낸 도면이다. 선두 프레임에서는, 정규화계수정보로의 가산결과가 67이 되어, 4의 중지가 발생하고 있다. 이러한 경우에, 역게인 제어에 의한 신호의 감쇠가 있었을 경우, 바라고 있는 정규화계수정보를 가산하는 것에 의한 신호의 증폭이라고 하는 결과를 얻을 수 없게 된다.
이러한 경우에 있어서도, 상술한 본 발명의 실시형태와 같은 방법을 이용하여, 게인 제어함수 생성정보를 적응적으로 수정함으로써, 게인의 과대한 감쇠를 방지할 수 있다.
여기서, 이상 설명한 본 발명과 관련되는 신호처리방법에 있어서의 각 순서를 컴퓨터에 의해 실행시키기 위한 프로그램으로서 제공할 수 있다.
상술한 바와 같은 본 발명의 실시형태에 의하면, 게인 제어가 이용되고 있는 고능률 오디오 부호화 방식에서 부호화된 부호열을 직접 가공하여 페이드인이나 페이드아웃 등의 신호처리를 적용하는 경우에, 정규화계수정보의 중지와 역게인 제어에 의해서 생기는 신호의 증폭을, 정규화계수정보의 중지량에 따라 게인 제어 정보 를 적응적으로 고쳐 쓰는 것으로 억제하고, 소망한 신호처리를 행한 부호열을 출력하는 것이 가능하다.
또한, 본 발명은 상술한 실시형태에만 한정되는 것이 아니고, 본 발명의 요지를 일탈하지 않는 범위에 있어서 여러 가지의 변경이 가능한 것은 물론이다.
본 발명에 의하면, 부호열을 직접 가공하여 페이드인이나 페이드아웃 등의 신호처리를 적용하는 경우에, 정규화계수정보의 중지와 역게인 제어에 의해서 생기는 신호의 증폭을, 정규화계수정보의 중지량에 따라 게인 제어 정보를 적응적으로 고쳐 쓰는 것으로 억제하고, 소망한 신호처리를 행한 부호열을 출력하는 것이 가능하다.

Claims (10)

  1. 입력 디지털신호를 시간축 상에서 블록 분할하여, 블록마다 시간축 상의 게인 제어를 행하고, 상기 게인 제어된 신호성분에 대해서 양의 값을 이용하여 정규화를 행하고, 상기 정규화된 신호성분을 양자화하고, 상기 게인 제어를 행하는 게인 제어함수를 생성하는 게인 제어함수 생성정보 및 정규화계수정보와 함께 부호화 및 다중화를 행하는 것으로 얻어지는 부호열에 대해서 신호처리를 행하는 신호처리장치에 있어서,
    상기 부호화된 부호열에 대해서, 상기 부호열 중의 정규화계수정보에, 정수치의 감산 또는 가산을 행하는 것으로, 신호의 레벨조정을 행하는 정규화계수정보 증감수단과,
    상기 정규화계수정보의 감산량 또는 가산량이 큰 것에 의한 감산 또는 가산 후의 정규화계수정보를 취할 수 있는 최소치 또는 최대치로 중지되는 경우의 중지량을 계산하는 중지량 계산수단과,
    상기 중지량 계산수단으로부터의 중지량에 따라서, 상기 게인 제어함수 생성정보를 수정하는 수정수단을 가지는 신호처리장치.
  2. 제 1항에 있어서,
    상기 중지량 계산수단은, 정규화계수정보의 감산량이 정규화계수정보보다 크고, 감산 후의 정규화계수정보를 취할 수 있는 최소치로 중지되는 경우의 중지량을 계산하는 것을 특징으로 하는 신호처리장치.
  3. 제 1항에 있어서,
    상기 중지량 계산수단은, 정규화계수정보의 가산량이 크고, 가산 후의 정규화계수정보가 취할 수 있는 최대치로 중지되는 경우의 중지량을 계산하는 것을 특징으로 하는 신호처리장치.
  4. 제 1항에 있어서,
    상기 게인 제어를 행하는 신호성분은, 입력 디지털신호에 대해서 서브밴드 분할필터를 이용하여 얻어진 서브밴드 신호인 것을 특징으로 하는 신호처리장치.
  5. 제 1항에 있어서,
    상기 정규화를 행하는 신호성분은, 상기 게인 제어를 행한 후, MDCT(수정 이산 코사인 변환)를 행해 얻어지는 MDCT 계수인 것을 특징으로 하는 신호처리장치.
  6. 제 5항에 있어서,
    상기 정규화는, 복수의 MDCT 계수마다 행해지며, 그 출력으로서 복수의 정규화계수정보가 얻어지는 것을 특징으로 하는 신호처리장치.
  7. 제 1항에 있어서,
    상기 게인 제어함수 생성정보의 수정은, 게인 제어함수 생성정보가 부호열 중에 포함되는 경우에만 행해지는 것을 특징으로 하는 신호처리장치.
  8. 입력 디지털신호를 시간축 상에서 블록 분할하여, 블록마다 시간축 상의 게인 제어를 행하고, 상기 게인 제어된 신호성분에 대하여 양의 값을 이용하여 정규화를 행하고, 상기 정규화된 신호성분을 양자화하고, 상기 게인 제어를 행하는 게인 제어함수를 생성하는 게인 제어함수 생성정보 및 정규화계수정보와 함께 부호화 및 다중화를 행하는 것으로 얻어지는 부호열에 대해서 신호처리를 행하는 신호처리방법에 있어서,
    상기 부호화된 부호열에 대해서, 상기 부호열 중의 정규화계수정보에, 정수치의 가산 혹은 감산을 행하고, 신호의 레벨조정을 행함과 동시에,
    상기 정규화계수정보의 감산량이 정규화계수정보보다 크고, 감산 후의 정규화계수정보가 취할 수 있는 최소치로 중지되는 경우에, 상기 중지량에 따라서, 게인 제어함수 생성정보를 수정하는 신호처리방법.
  9. 제 8항에 있어서,
    상기 정규화계수정보의 가산량이 크고, 가산 후의 정규화계수정보가 취할 수 있는 최대치로 중지되는 경우에, 상기 중지량에 따라서, 게인 제어함수 생성정보를 수정하는 것을 특징으로 하는 신호처리방법.
  10. 입력 디지털신호를 시간축 상에서 블록 분할하여, 블록마다 시간축 상의 게인 제어를 행하고, 상기 게인 제어된 신호성분에 대해서 양의 값을 이용하여 정규화를 행하고, 상기 정규화된 신호성분을 양자화하고, 상기 게인 제어를 행하는 게인 제어함수를 생성하는 게인 제어함수 생성정보 및 정규화계수정보와 함께 부호화 및 다중화를 행하는 것으로 얻어지는 부호열에 대해서 행하는 신호처리를 컴퓨터에 실행시키기 위한 프로그램이며,
    상기 부호화된 부호열에 대해서, 상기 부호열 중의 정규화계수정보에, 정수치의 가산 혹은 감산을 행하고, 신호의 레벨조정을 행하는 순서와,
    상기 정규화계수정보의 감산량이 정규화계수정보보다 크고, 감산 후의 정규화계수정보가 취할 수 있는 최소치로 중지되는 경우에, 상기 중지량에 따라서, 게인 제어함수 생성정보를 수정하는 순서를 컴퓨터에 실행시키기 위한 것을 특징으로 하는 프로그램.
KR1020097010316A 2007-07-30 2008-06-26 신호처리장치 및 방법과 프로그램 KR20100039824A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2007-197959 2007-07-30
JP2007197959A JP5045295B2 (ja) 2007-07-30 2007-07-30 信号処理装置及び方法、並びにプログラム

Publications (1)

Publication Number Publication Date
KR20100039824A true KR20100039824A (ko) 2010-04-16

Family

ID=40304138

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097010316A KR20100039824A (ko) 2007-07-30 2008-06-26 신호처리장치 및 방법과 프로그램

Country Status (7)

Country Link
US (1) US8478586B2 (ko)
EP (1) EP2088582A4 (ko)
JP (1) JP5045295B2 (ko)
KR (1) KR20100039824A (ko)
CN (1) CN101595523B (ko)
HK (1) HK1133945A1 (ko)
WO (1) WO2009016901A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9875746B2 (en) * 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3336617B2 (ja) 1993-05-31 2002-10-21 ソニー株式会社 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体
JP3263881B2 (ja) 1994-02-04 2002-03-11 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置並びに情報記録媒体及び情報伝送方法
US5731767A (en) * 1994-02-04 1998-03-24 Sony Corporation Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
JP3164038B2 (ja) 1997-11-05 2001-05-08 日本電気株式会社 音声帯域分割復号装置
KR100304092B1 (ko) * 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JP3879249B2 (ja) 1998-05-14 2007-02-07 ソニー株式会社 エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
US6353584B1 (en) * 1998-05-14 2002-03-05 Sony Corporation Reproducing and recording apparatus, decoding apparatus, recording apparatus, reproducing and recording method, decoding method and recording method
JP3879250B2 (ja) 1998-05-14 2007-02-07 ソニー株式会社 エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP2000078017A (ja) * 1998-09-02 2000-03-14 Sony Corp デコード方法及びデコード装置
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
US6658382B1 (en) * 1999-03-23 2003-12-02 Nippon Telegraph And Telephone Corporation Audio signal coding and decoding methods and apparatus and recording media with programs therefor
JP4639441B2 (ja) * 1999-09-01 2011-02-23 ソニー株式会社 ディジタル信号処理装置および処理方法、並びにディジタル信号記録装置および記録方法
JP4441989B2 (ja) * 2000-05-30 2010-03-31 ソニー株式会社 符号化装置および符号化方法
EP1484841B1 (en) * 2002-03-08 2018-12-26 Nippon Telegraph And Telephone Corporation DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM
CN100346392C (zh) * 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP2004361602A (ja) * 2003-06-04 2004-12-24 Sony Corp データ生成方法およびデータ生成装置、データ復元方法およびデータ復元装置、並びにプログラム
US7595819B2 (en) * 2003-07-31 2009-09-29 Sony Corporation Signal processing device and signal processing method, program, and recording medium
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7860194B2 (en) * 2005-11-11 2010-12-28 Samsung Electronics Co., Ltd. Method and apparatus for normalizing input metric to a channel decoder in a wireless communication system
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP5098492B2 (ja) * 2007-07-30 2012-12-12 ソニー株式会社 信号処理装置及び信号処理方法、並びにプログラム

Also Published As

Publication number Publication date
JP2009031675A (ja) 2009-02-12
US8478586B2 (en) 2013-07-02
HK1133945A1 (en) 2010-04-09
WO2009016901A1 (ja) 2009-02-05
CN101595523B (zh) 2012-04-18
US20100106494A1 (en) 2010-04-29
JP5045295B2 (ja) 2012-10-10
EP2088582A4 (en) 2012-08-01
CN101595523A (zh) 2009-12-02
EP2088582A1 (en) 2009-08-12

Similar Documents

Publication Publication Date Title
JP4579273B2 (ja) ステレオ音響信号の処理方法と装置
JP4219551B2 (ja) 知覚モデルに基づいて信号を符号化する方法および装置
EP2054879B1 (en) Re-phasing of decoder states after packet loss
JP4168976B2 (ja) オーディオ信号符号化装置及び方法
KR100882771B1 (ko) 부호화 음향 신호를 지각적으로 개선 강화시키는 방법 및장치
JP6271531B2 (ja) デジタル音声信号における効果的なプレエコー減衰
EP1315150A2 (en) Adaptive postfiltering methods and systems for decoding speech
EP1199709A1 (en) Error Concealment in relation to decoding of encoded acoustic signals
KR20100039824A (ko) 신호처리장치 및 방법과 프로그램
KR100813193B1 (ko) 정보 신호의 양자화 방법 및 장치
KR20060113998A (ko) 오디오 부호화
CN112185398A (zh) 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
JP2003233395A (ja) オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
EP1001542B1 (en) Voice decoder and voice decoding method
US8010370B2 (en) Bitrate control for perceptual coding
JP5098492B2 (ja) 信号処理装置及び信号処理方法、並びにプログラム
CN105632504B (zh) Adpcm编解码器及adpcm解码器丢包隐藏的方法
KR102243217B1 (ko) 오디오 신호 부호화 방법 및 장치
JP3315708B2 (ja) 比較減衰器付音声符復号器
JPH0916199A (ja) 音声の準可逆符号化装置
JP2012118462A (ja) 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
KR20020008871A (ko) 디지털 오디오 부호화 방법
MXPA96002143A (en) System for speech compression based on adaptable codigocifrado, better

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid