KR20050025583A - 오디오 처리 - Google Patents

오디오 처리 Download PDF

Info

Publication number
KR20050025583A
KR20050025583A KR1020057000189A KR20057000189A KR20050025583A KR 20050025583 A KR20050025583 A KR 20050025583A KR 1020057000189 A KR1020057000189 A KR 1020057000189A KR 20057000189 A KR20057000189 A KR 20057000189A KR 20050025583 A KR20050025583 A KR 20050025583A
Authority
KR
South Korea
Prior art keywords
post
audio signal
audio
fragment
masking threshold
Prior art date
Application number
KR1020057000189A
Other languages
English (en)
Inventor
로날더스 엠. 아알츠
다니엘 더블류. 이. 쇼벤
파이잘 세이크설탄
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20050025583A publication Critical patent/KR20050025583A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

오디오 시스템은 후-처리된 오디오 신호(16)의 연속적인 단편을 제공하기 위해 디코딩된 오디오 신호의 연속적인 단편을 변경하도록 배치된 후-처리기(12)를 포함한다. 마스킹 임계치 생성기(20)는 후-처리된 오디오 신호(16)의 연속적인 단편에 관한 마스킹 임계치의 추정 값을 제공한다. 잡음 레벨 생성기(17)는 후-처리된 오디오 신호(16)의 연속적인 단편에 관한 잡음 레벨의 추정 값을 제공한다. 왜곡 생성기(17)는 잡음 레벨이 후-처리된 오디오 신호(16)의 연속적인 단편에 관한 마스킹 임계치를 초과하는 정도(D)를 결정한다. 조정기(18)는 잡음 레벨이 마스킹 임계치를 초과하는 정도에 따라 후-처리기를 제어한다.

Description

오디오 처리{AUDIO PROCESSING}
본 발명은 오디오 신호 처리에 관한 것이다.
이제 도 1을 참조하면, 종래의 오디오 시스템에서는 디코더(10)는 오디오 신호(미도시)가 인코딩된 오디오 스트림(AS)을 수신한다. 디코더(10)는 오디오 신호의 연속적인 단편(fragment)에 대응하는 시간 영역 신호(14)를 발생시킨다. 스테레오 인코딩된 오디오 신호용으로, 디코더는 한 쌍의 예를 들면 중간/측면(mid/side) 또는 차이 스테레오-채널(difference stereo-channel) 신호(14)를 발생시킨다. 신호의 애스펙트(aspect)를 강화하기 위해서는 이들 채널 신호에 후-처리(post-processing)를 적용하는 것이 알려져 있다. 따라서, 예를 들어 후-처리기(12)는 변경된 채널 신호(16)를 발생시키기 위해, 채널 신호(14) 상에서 스테레오 확장을 실행할 수 있다. 이후 채널 신호(16)는 오디오 출력 시스템(15)에 공급되고, 이 시스템을 통해 신호는 청취자를 위해 재생되거나 또는 달리 저장되거나 전송된다.
예를 들어 MPEG 인코더를 포함하는 많은 인코더에서, 오디오 신호는 손실 과정(lossy process)을 사용하여 비트 스트림으로 인코딩된다. 그러한 비트 스트림을 위해 오디오 디코더(코덱: codecs)와 후-처리 성분을 종속 접속(cascading)하는 것은 문제가 될 수 있다는 것이 알려졌다. 이것은 원래의 오디오 단편을 인코딩할 때 생성된 양자화 잡음으로 인해 손실이 있는 인코딩된 오디오 단편의 후-처리하면 원치 않는 들을 수 있는 아티팩트(audible artefact)를 초래할 수 있기 때문이다.
후-처리 이후에 인코딩된 단편의 오디오 품질이 떨어지는 것을 방지하기 위해, 인코더, 디코더 또는 후-처리기가 수정될 수 있다. 하지만, 이는 기존 시스템의 상당한 재-설계(re-engineering)를 수반한다.
상기 문제점에 대한 해결책이 이미 인코딩된 단편에 후-처리를 적용하는 시스템에서 구현될 필요가 있기 때문에, 비트 스트림이 생성된 본래의 오디오 단편이 일반적으로 이용가능하지 않게 된다는 점이 주목되어야 한다.
동시에, 신호에 어떠한 후-처리 변화가 일어나기 전에, 후-처리 이후의 오디오 신호의 품질이 알려져야 한다. 비록 객관적인 오디오 품질 측정을 위한 일부 기술이 문헌에서 발견될 수 있지만, 이들은 일반적으로 본래의 오디오 단편이 이용 가능한 것으로 가정한다.
교차 상관(cross-correlation)과 같은 종래의 방법은 양자화 잡음이 들을 수 있는지 아닌지를 가리키지 않는다. 간단한 실험이, 후-처리된 중간/측면-인코딩된 그리고 차이-인코딩된 스테레오 단편에 관한 좌측 채널과 우측 채널 사이의 교차-상관이 유사하지만, 양 모드의 후-처리된 단편의 오디오 품질은 완전히 상이하게 될 수 있다는 점을 보여주고 있다.
도 1은 종래 기술의 오디오 시스템을 도시하는 도면.
도 2는 본 발명의 제 1 실시예에 따른 오디오 시스템을 도시하는 도면.
도 3a와 도 3b는 본래 신호와 후-처리된 신호에 대한 들을 수 있는 양자화 잡음의 정도를 각각 도시하는 도면.
도 4와 도 5는 본 발명의 대안적인 실시예에 따른 추가 오디오 시스템을 도시하는 도면.
본 발명에 따르면, 제 1항에 따른 오디오 시스템이 제공된다.
본 발명은 이용 가능한 본래의 오디오 단편을 가지지 않고, 후-처리 후에 들을 수 있는 양자화 잡음을 검출하고, 양자화 잡음이 후-처리 정도를 조정함으로써 들을 수 있게 되는 것을 방지하는 시스템 및 방법을 제공한다.
본 발명은 신호의 "블라인드(blind)" 객관 측정을 제공하는데, 즉 품질 측정이 이용 가능한 디코딩된 오디오 단편만으로 수행된다. 본 발명은 기존의 성분이 본 발명을 구현하기 위해 수정될 필요가 없음을 의미하는 방식으로 신호 경로에 변화를 일으킨다.
이제 본 발명의 실시예가 첨부 도면을 참조한 예를 통해 설명된다.
도 2는 본 발명의 제 1 실시예에 따른 후-처리된 인코딩된 오디오 단편에 관한 오디오 시스템을 도시한다. 먼저 인코딩된 오디오 비트-스트림(AS)이 디코더(10)에서 디코딩되고, 이후 후-처리기(12)에 의해 후-처리된다. 비록, 본 발명이 일반적으로 인코더와 후-처리기에 적용 가능하다는 것을 알게될 것이지만, 바람직한 실시예가 인크레더블 사운드(Incredible Sound) 후-처리기(예를 들어 PCT 출원 번호 WO98/21915호와 미국 특허 5,742,687호에 기술된)와 조합하여 MPEG-1 층(Layer) I 디코더를 참조하여 설명된다. 따라서, 디코더(10)는 예를 들어 합/차 또는 중간/측면 PCM(Pulse Code Modulated) 형태로, 한 쌍의 출력 채널(14)을 생성하고, 후-처리기(12)는 출력 채널(16)을 생성하기 위해 채널(14) 상에서 스테레오-확장(stereo-widening)을 수행한다.
검출기(17)는 오디오 스트림의 각 프레임 또는 단편에 관한 왜곡량(D)을 계산하고 이의 측정값을 조정기(18)에 공급하며, 이는 허용된 후-처리의 최대량을 결정한다. 인크레더블 사운드의 경우, 후-처리기(12)에 의해 수행된 스테레오-확장 정도는 조정기(18)에 의해 제공된 파라미터(α)에 의해 결정된다. 그러므로 필요하다면, 조정기(18)에 의해 후-처리 유닛(12)에 공급된 α의 값을 낮춤으로써, 후-처리량이 감소될 수 있다.
제 1 실시예에서, 후-처리 후에 양자화 잡음의 들을 수 있는 정도(audibility)나 왜곡 정도는, 코드화된 단편에 관한 비트 스트림 만이 이용 가능하다고 가정하여 검출된다. 검출 방법은 심리-음향(psycho-acoustic) 모델과, 비트-할당 과정 동안에 인코더에서 사용된 비트-할당 절차에 기초한다.
심리-음향 모델은 속귀(inner ear)의 특정 거동에 기인하여, 인간의 청각 시스템은 복잡한 오디오 스펙트럼의 작은 부분만을 감지한다는 지식에 기초한다. 주어진 소리의 마스킹(masking) 임계치 위에 있는 스펙트럼의 이들 부분만이 그것의 감지에 기여한다. 따라서, 주어진 소리와 동시에 그러나 더 약한 강도로 발생하며, 따라서 마스킹 임계치 아래에 있는 임의의 청각 행동은 그것이 메인 사운드(main sound) 이벤트에 의해 마스킹되기 때문에, 들리지 않을 것이다. 인코더의 목적은 양자화 잡음을 마스킹 임계치 아래로 유지하면서, 가능한 많이 오디오 스트림의 비트율(bit-rate)을 낮게 하는 것이다.
MPEG 인코더에서, 오디오 신호의 감지할 수 있는 부분은 32개의 등간격으로 배치된 하위-대역(sub-band)으로 주파수 스펙트럼을 분할함으로써 추출된다. 각 하위-대역에서, 신호는 양자화 잡음이 정합하거나 마스킹 임계치 바로 아래에 있는 방식으로 양자화된다.
하지만 후-처리 후에는, 잡음 레벨이 마스킹된 임계치를 초과하게 되어 들을 수 있는 양자화 잡음을 초래할 수 있다. 그러므로 바람직한 실시예의 검출 방법은, 잡음 레벨이 마스킹된 임계치를 어느 정도까지 초과할지를 결정한다.
제 1 실시예에서, 다음 가정이 이루어진다.
ㅇ본래 오디오 신호 단편이 이용 가능하지 않다,
ㅇ오디오 신호에 관해 코드화된 단편의 비트-스트림(AS)이 이용 가능하다,
ㅇ사용된 후-처리 기술의 타입이 알려져 있다, 및
ㅇ코드화된 단편이 감지할 수 있도록 같다. 즉 본래 단편과 동일하게 소리가 나야 한다.
본래 단편이 이용 가능하지 않기 때문에, 양자화로 인한 실제 에러-신호(잡음)(코드화된 단편에서 본래 단편을 뺀)는 또한 이용 가능하지 않다. 하지만 비트 스트림으로부터, 예를 들어 무슨 타입의 코덱, 비트율(들) 및 설정(setting)이 비트 스트림을 생성하기 위해 인코더에서 사용되었는지를 결정하기 위해, 정보는 추출될 수 있다.
비록 본래 단편이 바람직한 실시예에서 이용 가능하지 않다고 가정되더라도, 본래 단편은 바람직한 실시예에서 이용된 추정값의 품질을 설명하는데 있어서 유용하다. 따라서, 도 3a를 참조하면 본래 오디오 단편의 주파수 스펙트럼이 22로 표시된다. 라인(24)은 스펙트럼(22)으로부터 종래의 방식으로 계산된 신호에 대한 마스킹된 임계치를 가리킨다.
MPEG-1 층 I는 균일하고 대칭적인 중간-트레드(mid-tread) 양자화기를 사용한다. 양자화기의 입력 범위가 [-1, +1]이라면, 스텝 크기(Δ)는 2개의 연속적인 양자화 레벨 사이의 차이이고,
로 주어지며, 여기서 M은 사용된 양자화 레벨의 갯수이다.
일반적으로 입력 신호가 양자화-입력 범위 내에 있고 M이 충분히 크다면, 매우 큰 등급의 신호에 대해서 양자화 에러(ε)가
인 분산을 가지고 거의 균일하게 분포되는 것을 볼 수 있다.
오디오 단편의 각 프레임과 모든 하위 대역에 대해서, 한 그룹의 12개의 하위 대역(12) 샘플이 처음에 [-1, +1]로 정규화되어 각 하위 대역(i)에 대해 하나씩 32개의 눈금 계수(scale factor)(scf i )를 만든다. 각 하위 대역(i)에 관한 잡음 레벨의 에너지는 이제 다음 수학식 1과 같이 추정될 수 있다.
이는 좌우측 채널과 모든 하위 대역에 관해서 계산될 수 있다. 그러므로, 가령 MPEG-1 층 I 인코더로 인코딩된다면 단편(22)에 관한 잡음 레벨이 라인(26)에 의해 표시된다. 주파수 범위(28, 28′및 28″)에 관해서 이들 잡음 레벨이 마스킹(masking) 임계값(24)을 초과하는 것을 볼 수 있고, 따라서 일부 왜곡이 심지어 본래 인코딩된 오디오 단편에서도 들려질 수 있는 것으로 가정된다.
하지만, 그러한 손실-인코딩된 오디오 단편을 후-처리할 때, 후-처리된 양자화 잡음이 또한 후-처리된 단편의 마스킹 임계치를 초과할 수 있다. 도 3b에서 범위(30)로부터 알 수 있는 바와 같이, 라인(26′)으로 표시된 잡음 레벨은 큰 주파수 범위에 걸쳐 상당한 양만큼 라인(22′)으로 표시된 후-처리된 신호의 마스킹 임계치(24′)를 초과한다. 그러므로, 도 3b는 도 3a의 코드화된 단편의 것과 비교하여 대략 [5, 15] 바크(Bark) 사이의 들을 수 있는 잡음 레벨에서 상당한 증가를 보여주고, [5, 15] 바크는 대략 [500, 5000]㎐와 같다.
전술한 바와 같이, 본래의 단편은 검출 과정에서 이용 가능하지 않다고 가정된다. 그러므로, 실제 마스킹된 임계치와, 코드화되고 후-처리된 단편의 양자화 잡음 레벨은 이용 가능하지 않다. 하지만, 이들 2개의 양은 코드화된 단편의 비트-스트림(AS)으로부터 추정될 수 있다.
이제, 마스킹 임계치(24′)와 잡음 레벨(26′)의 추정으로 돌아간다. 제 1 실시예의 일 변형예에서, 심리-음향 모델링 성분(20)은 후-처리된 채널(16)로부터 각 프레임에 관해 마스킹 임계치()에 대한 추정치를 생성한다. 인크레더블 사운드 후-처리의 경우, 대부분의 처리는 차이 채널에 영향을 미쳐서, 차이 채널에서의 에너지의 양은 스테레오-인코딩된 단편을 후-처리한 후, 들을 수 있는 양자화 잡음의 양을 결정한다. 그러므로, 이러한 차이 채널의 각 단편에 관한 PCM 데이터는 도 3b에서의 라인(22′)으로 도시된 타입의 후-처리된 단편에 관한 주파수 스펙트럼을 제공하기 위해 심리-음향 모델링 성분(20)에 의해 푸리에 변환된다. 이후, 라인(24′)으로 표시된 마스킹 임계치()의 추정치가 종래의 방식으로 스펙트럼(22′)으로부터 계산되고, 검출기(17)에 제공된다.
후-처리된 단편에 관한 잡음 레벨의 추정치()는, 비트 스트림과 수학식 1에 제공된 양자화 레벨 정보를 사용하는 인코딩된 비트 스트림(AS)으로부터 본래 단편에 관한 잡음 레벨을 먼저 추정함으로써 검출기(17)에서 유도된다. 이후, 디코딩된 신호에 관해 수행될 후-처리의 타입을 알게 되면, 검출기(17)는 후-처리된 단편에 관한 잡음 레벨의 추정치()를 제공하기 위해, 본래 단편에 관해서 추정된 잡음 레벨에 대해 동일한 후-처리를 수행할 수 있다.
이후, 검출기(17)는 마스킹 임계치(24′)를 초과하는 후-처리된 신호에서의 잡음 레벨(26′)의 추정된 양을 적분함으로써 후-처리된 신호에서의 왜곡량(D)의 측정값을 제공하고, 이들 주파수에 대한 양자화 잡음은 프레임 단위로(frame-by-frame) 들을 수 있으며, 즉 왜곡 측정량(D)은
과 같고, >0이면, Di=[dB SPL]이고, 이 외의 경우 Di=0이다.
여기서 i는 하위-밴드 숫자이고, n은 벌칙 지수(penalize-index)이다. n이 더 높을수록, 왜곡이 더욱 불리하게 된다. 48㎑의 샘플링 주파수에 있어서, 범위 i=[1, 5]는 [750, 4500]㎐와 같고, 이는 대략 양자화 잡음이 후-처리 다음에 들릴 수 있는 범위이다. 이후, 왜곡 측정량(D)에 기초하여, 조정기(18)가 들을 수 있는 양자화 잡음에 대하여 조치를 취할지를 결정할 수 있다.
예를 들어, 개선된 왜곡 측정은 또한 마스킹된 임계치를 초과하는 잡음의 지속 시간을 검사한다. 이들 지속 시간이 길수록, 양자화 잡음이 점점 더 들을 수 있게 된다. 하지만, 이는 간단한 상기 왜곡 측정값(D) 보다 더 복잡하다.
제 1 실시예의 이러한 제 1 변형예를 사용하여, 조정기(18)가 정정 조치를 취하기 전에 들을 수 있는 왜곡이 일어나는 것을 허용하는 경향이 있음을 알게 될 것이다. 그러한 경우, 시스템은 후-처리 레벨이 특정 프레임이나 단편에 대해서 떨어진다면, 적어지는 정정이 다시 요구될 때까지 후-처리 레벨이 그 이후 목표 값 쪽으로 점차 증가될 수 있도록, 후-처리의 원하는 레벨을 가질 필요가 있다.
바람직한 실시예의 제 2 변형예인 도 4에서, 심리-음향 모델링 성분(20′)의 변형예는 비트 스트림(AS)으로부터 신호 에너지 레벨 데이터를 끌어낸다. 디코딩된 신호에 대해 수행될 후-처리의 타입을 알게 되면, 잡음과 관련되어 제 1 변형예에서와 같이, 성분(20′)은 도 3b에서의 라인(22′)에 의해 표시된 바와 같은 후-처리된 신호의 주파수 스펙트럼 추정치를 제공하기 위해 본래 단편에 대해서 동일한 처리를 수행할 수 있다. 이후, 마스킹 임계치(24′)가 이 추정된 신호에 대해서 계산될 수 있고, 이는 검출기(17)로 하여금 후-처리의 현재 레벨로 발생될 왜곡량(D)의 추정값을 생성할 수 있도록 이전에서와 같이 검출기(17)로 통과될 수 있다. 검출기(17)는 이후 왜곡 추정값이 만들어진 단편에 대해 수행될 후-처리의 레벨을 감소시킬 수 있는 조정기(18)로 이러한 왜곡 측정값(D)을 통과시킬 수 있다. 예를 들어, 인크레더블 사운드 후-처리에 있어서, 인자(α)는 D의 높은 값에 대해서 낮아진다.
제 1 실시예에서, 코드화된 단편의 비트-스트림은 이용 가능하고, 후-처리 기술의 타입이 알려진 것으로 가정된다. 하지만 본 발명의 제 2 실시예인 도 5에서는, 디코딩된 오디오 채널(14)만이 이용 가능하고, 따라서 어떠한 디코더(10)도 이용되지 않는다. 2002년 5월 10일부터 13일까지 뮌헨에서 개최된 AES의 112회 정기 총회의 총회지 5576호에 실린 S.Moehrs, Jurgen Herre 및 Ralf Geiger의 "동작 알고리듬 쪽으로의 "역 디코더"로 압축 해제된 오디오의 분석"과 2000년 로스 엔젤레스에서 개최된 AES의 109회 정기 총회의 총회지 5256호에 실린 J.Herre와 M.Schug의 "압축 해제된 오디오의 분석-역 디코더"에, 역 디코더(10′)가 기술되어 있다. 이는 단편에 대한 양자화 레벨이 PCM 영역 신호로부터 검출되는 것을 가능하게 한다. 따라서 제 2 실시예에서, 역 디코더(10′)는 이러한 정보를 검출기(17′)의 변형에 제공한다. 검출기(17′)는 먼저 본래 단편에 대한 잡음 레벨을 추정하고, 이후 후-처리된 단편에서의 잡음 레벨의 추정치를 제공하기 위해, 이들을 이전과 같이 처리한다. 도 5에서 심리-음향 모델링 성분(20)은 검출기(17′)에 제공하는 단편에 대한 마스킹 임계치를 생성하기 위해, 도 1에서와 같이 후-처리된 채널(16)로부터 그것의 데이터를 끌어낸다. 이러한 마스킹 임계치와 잡음 레벨을 사용하여, 검출기는 이전과 같이 왜곡 측정값(D)을 생성할 수 있다.
상기 설명으로부터, 바람직한 실시예에서, 원하지 않는 아티팩트가 출력 채널(16)에서 들을 수 있게 되는 것이 방지되고, 오디오 비트 스트림(AS)은 디코딩되며 실시간으로 후-처리된다.
바람직한 실시예에서, 인가된 후-처리량은 줄어들거나 심지어 조정기(18)에 의해 완전히 디스에이블 된다. 이는 일반적으로 처리된 신호의 특정량을 본래 신호의 특정량에 추가하는 모든 후-처리 기술에 적용할 수 있다.
잡음 레벨이나 마스킹 임계치의 사용과는 독립적으로 후-처리를 조정하는 또 다른 예는 함수 f((Li-Ri)/d)로서 α를 결정하는 것으로, 여기서 f()는 0에서 최대값까지 변하는 f()의 독립변수(argument)에 대해서 0과 1 사이에서 변하는 어떤 단조 함수이고, d=Δ*scfi이다. 이는 좌우측 하위 대역 신호 사이의 차이가 작다면, 신호를 너무 많이 끌어올리지 않는 것이 바람직하다는 것을 의미한다.
바람직한 실시예에서, 채널(14, 16)은 스테레오 채널로 설명된다. 하지만 본 발명이 3개 이상의 채널에 대해서도 적용할 수 있고, 본 발명이 동일한 채널(14, 16)의 개수에 제한되지 않는다는 것을 알게 될 것이다.
바람직한 실시예에서, 조정기(18)는 단일 파라미터(α)로 후-처리기(12)를 제어한다. 본 발명은 후-처리기의 많은 파라미터를 제어하도록 확장 가능하다는 것을 알게 될 것이다. 예를 들어 바람직한 실시예의 경우, αi의 벡터는 각 하위-밴드(i)의 후-처리를 제어하는데 사용될 수 있다.
바람직한 실시예에서, 검출기(17, 17′)는 성분들을 결합하는 라인에 의해 표시된 바와 같이, 처리기(12)에 의해 수행된 후-처리를 추정할 수 있다고 가정된다. 그러므로 본 발명은 인크레더블 사운드와 같은 엄격히 한정된 과정에 의해 후-처리의 결과를 추정하는 것에 제한되지 않는다. 예를 들어 디코더 출력 채널(14)로부터 예를 들어 증폭기, 확성기 및 헤드폰을 포함하는 사람의 귀로의 완전한 경로는 후-처리기 신호 경로로서 모델화될 수 있다. 바람직한 실시예의 경우, 이 모델은 완전한 후-처리 신호 경로가 양자화 잡음을 들을 수 있게 만드는 정도를 결정하기 위해 계산된 잡음 레벨 및/또는 마스킹 임계치에 적용될 수 있다. 잡음이 과도하게 들을 수 있게 되면, 조정기는 이러한 잡음을 예를 들어 확성기의 출력 볼륨을 약간 낮추거나 증폭기의 등화를 조정함으로써, 감소시키기 위해 후-처리 신호 경로의 일부 국면을 제어할 수 있다.
전술한 실시예는 본 발명을 제한하기보다는 설명하는 것으로, 당업자라면 첨부된 청구항의 범위를 벗어나지 않고 많은 대안적인 실시예를 설계할 수 있음이 주목되어야만 한다. 청구항에서, 괄호 안에 놓인 임의의 참조 기호는 청구항을 제한하는 것으로 여겨지지 않는다. '포함한다'라는 단어는 청구항에 열거된 것 이외의 다른 요소나 단계의 존재를 배제하지 않는다. 본 발명은 여러 개의 다른 요소를 포함하는 하드웨어와 적절히 프로그램된 컴퓨터에 의해 구현될 수 있다. 여러 개의 수단을 열거하는 디바이스 청구항에서, 이들 수단 중 몇 가지는 하나의 동일한 하드웨어의 항목(item)으로 구현될 수 있다. 특정 측정값이 서로 상이한 종속항에서 재인용된다는 단순한 사실은 이들 측정값의 조합이 유리하게 사용될 수 없음을 가리키지 않는다.
본 발명은 오디오 신호 처리에 이용 가능하다.

Claims (10)

  1. 오디오 시스템으로서,
    후-처리된 오디오 신호의 연속적인 단편을 제공하기 위해, 디코딩된 오디오 신호의 연속적인 단편(fragment)을 변경하도록 배치된 후-처리기;
    오디오 신호의 상기 연속적인 단편을 인코딩하는데 도입된 양자화 잡음이 상기 후-처리로 인해 들려질 수 있는 정도를 결정하는 왜곡 검출기; 및
    상기 정도에 따라 상기 후-처리기를 제어하도록 배치된 조정기를 포함하는, 오디오 시스템.
  2. 제 1항에 있어서,
    후-처리된 오디오 신호의 연속적인 단편에 관한 마스킹(masking) 임계치의 추정치를 제공하도록 배치된 마스킹 임계치 생성기와,
    상기 후-처리된 오디오 신호의 상기 연속적인 단편에 관한 잡음 레벨의 추정치를 제공하도록 배치된 잡음 레벨 검출기를 더 포함하고,
    상기 왜곡 검출기는 상기 잡음 레벨이 상기 후-처리된 오디오 신호의 연속적인 단편에 관한 상기 마스킹 임계치를 초과하는 정도에 따라 상기 정도를 결정하는, 오디오 시스템.
  3. 제 2항에 있어서, 오디오 스트림을 판독하고 오디오 신호의 상기 연속적인 단편을 생성하도록 배치된 디코더를 더 포함하는, 오디오 시스템.
  4. 제 3항에 있어서, 상기 디코더는 오디오 신호의 스테레오(stereo)-인코딩된 연속적인 단편의 쌍을 생성하고, 상기 후-처리기는 오디오 신호의 상기 연속적인 단편의 쌍에 스테레오-확장(stereo-widening)을 적용하는 오디오 시스템.
  5. 제 2항에 있어서, 상기 마스킹 임계치 생성기는 후-처리된 오디오 신호의 상기 연속적인 단편을 주파수 영역으로 변환하고, 그것으로부터 상기 마스킹 임계치를 얻도록 배치된 심리-음향(psycho-acoustic) 모델링 성분을 포함하는, 오디오 시스템.
  6. 제 2항에 있어서, 상기 마스킹 임계치 생성기는 상기 오디오 스트림을 판독하고, 오디오 신호의 연속적인 단편을 생성하며, 유사한 후-처리를 상기 후-처리기로서 오디오 신호의 상기 연속적인 단편으로 적용하고, 상기 연속적인 후-처리된 오디오 신호의 단편을 주파수 영역으로 변환하며, 상기 후-처리된 신호로부터 상기 마스킹 임계치를 얻도록 배치된 심리-음향 모델링 성분을 포함하는, 오디오 시스템.
  7. 제 2항에 있어서, 디코딩된 오디오 신호의 상기 연속적인 단편을 판독하고, 오디오 신호가 디코딩되는 오디오 스트림의 인코딩에 이용된 양자화 레벨의 표시를 제공하도록 배치된 역 디코더(inverse decoder)를 더 포함하는, 오디오 시스템.
  8. 제 3항에 있어서, 상기 잡음 레벨 검출기는 오디오 스트림의 인코딩에서 이용된 양자화 레벨을 상기 오디오 스트림으로부터 얻도록 배치되는, 오디오 시스템.
  9. 제 7항 또는 제 8항에 있어서, 상기 잡음 레벨 검출기는 디코딩된 오디오 신호의 상기 연속적인 단편에 관한 주파수 영역에서의 잡음 레벨의 분포를 상기 양자화 레벨로부터 얻고, 상기 후-처리된 오디오 신호의 상기 연속적인 단편에 관한 잡음 레벨의 연속적인 추정치를 제공하기 위해, 상기 후-처리기로서의 잡음 레벨의 상기 연속적인 분포로 유사한 후-처리를 적용하도록 배치된, 오디오 시스템.
  10. 오디오 스트림의 처리 방법으로서,
    후-처리된 오디오 신호의 연속적인 단편을 제공하기 위해, 디코딩된 오디오 신호의 연속적인 단편을 후-처리하는 단계;
    오디오 신호의 상기 연속적인 단편을 인코딩하는데 도입된 양자화 잡음이 상기 후-처리로 인해 들을 수 있게 되는 정도를 검출하는 단계; 및
    상기 정도에 따라 상기 후-처리 단계를 조정하는 단계를 포함하는, 오디오 스트림의 처리 방법.
KR1020057000189A 2002-07-08 2003-06-18 오디오 처리 KR20050025583A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02077728 2002-07-08
EP02077728.0 2002-07-08

Publications (1)

Publication Number Publication Date
KR20050025583A true KR20050025583A (ko) 2005-03-14

Family

ID=30011170

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057000189A KR20050025583A (ko) 2002-07-08 2003-06-18 오디오 처리

Country Status (7)

Country Link
US (1) US20060025993A1 (ko)
EP (1) EP1522210A1 (ko)
JP (1) JP2005532586A (ko)
KR (1) KR20050025583A (ko)
CN (1) CN1666571A (ko)
AU (1) AU2003242903A1 (ko)
WO (1) WO2004006625A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1954641A (zh) * 2004-05-17 2007-04-25 皇家飞利浦电子股份有限公司 对解码立体声信号进行立体声增强的音频系统和方法
JP5166030B2 (ja) * 2004-09-06 2013-03-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号のエンハンスメント
KR100927897B1 (ko) * 2005-09-02 2009-11-23 닛본 덴끼 가부시끼가이샤 잡음억제방법과 장치, 및 컴퓨터프로그램
CN101816041B (zh) * 2007-07-06 2012-12-26 法国电信 限制音频数字信号解码过程中的后处理步骤引起的失真的方法和装置
EP2863390B1 (en) * 2008-03-05 2018-01-31 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
US20100057473A1 (en) * 2008-08-26 2010-03-04 Hongwei Kong Method and system for dual voice path processing in an audio codec
US8627483B2 (en) * 2008-12-18 2014-01-07 Accenture Global Services Limited Data anonymization based on guessing anonymity
US10733998B2 (en) 2017-10-25 2020-08-04 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to identify sources of network streaming services
US11049507B2 (en) 2017-10-25 2021-06-29 Gracenote, Inc. Methods, apparatus, and articles of manufacture to identify sources of network streaming services
US10726852B2 (en) 2018-02-19 2020-07-28 The Nielsen Company (Us), Llc Methods and apparatus to perform windowed sliding transforms
US10629213B2 (en) 2017-10-25 2020-04-21 The Nielsen Company (Us), Llc Methods and apparatus to perform windowed sliding transforms

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
USRE37864E1 (en) * 1990-07-13 2002-10-01 Sony Corporation Quantizing error reducer for audio signal
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
DK0709006T3 (da) * 1993-07-16 1997-09-01 Dolby Lab Licensing Corp Beregningsmæssig effektiv adaptiv biallokering for kodningsmetode og apparat, der tillader dekoderspektralforvrængninger.
US5451954A (en) * 1993-08-04 1995-09-19 Dolby Laboratories Licensing Corporation Quantization noise suppression for encoder/decoder system
JP3131542B2 (ja) * 1993-11-25 2001-02-05 シャープ株式会社 符号化復号化装置
JP3024468B2 (ja) * 1993-12-10 2000-03-21 日本電気株式会社 音声復号装置
JPH07170193A (ja) * 1993-12-15 1995-07-04 Matsushita Electric Ind Co Ltd マルチチャネル・オーディオ符号化方法
BE1008027A3 (nl) * 1994-01-17 1995-12-12 Philips Electronics Nv Signaalcombinatieschakeling, signaalbewerkingsschakeling voorzien van de signaalcombinatieschakeling, stereofonische audioweergave-inrichting voorzien de signaalbewerkingsschakeling, alsmede een audio-visuele weergave-inrichting voorzien van de stereofonische audioweergave-inrichting.
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6928168B2 (en) * 2001-01-19 2005-08-09 Nokia Corporation Transparent stereo widening algorithm for loudspeakers
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling

Also Published As

Publication number Publication date
WO2004006625A1 (en) 2004-01-15
JP2005532586A (ja) 2005-10-27
CN1666571A (zh) 2005-09-07
AU2003242903A1 (en) 2004-01-23
US20060025993A1 (en) 2006-02-02
EP1522210A1 (en) 2005-04-13

Similar Documents

Publication Publication Date Title
JP7050976B2 (ja) 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法
JP7091411B2 (ja) マルチチャネル信号の符号化方法およびエンコーダ
US7328151B2 (en) Audio decoder with dynamic adjustment of signal modification
KR101265669B1 (ko) 코딩된 오디오의 경제적인 소리세기 측정
US9443525B2 (en) Quality improvement techniques in an audio encoder
CN103262409B (zh) 用于改进的感觉的频谱不平衡的音频信号的动态补偿
KR100898879B1 (ko) 부수 정보에 응답하여 하나 또는 그 이상의 파라메터를변조하는 오디오 또는 비디오 지각 코딩 시스템
US20040162720A1 (en) Audio data encoding apparatus and method
RU2612584C2 (ru) Управление фазовой когерентностью для гармонических сигналов в перцепционных аудиокодеках
ATE147909T1 (de) Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und kodiereinrichtung
JP2007316658A (ja) ステレオ音響信号の処理方法と装置
KR20060121982A (ko) 멀티채널 신호를 처리하는 장치 및 방법
KR20100086001A (ko) 오디오 신호 처리 방법 및 장치
CA2489443C (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US8589155B2 (en) Adaptive tuning of the perceptual model
KR20050025583A (ko) 오디오 처리
JP4313993B2 (ja) オーディオ復号化装置およびオーディオ復号化方法
ES2098974T3 (es) Asignacion adaptativa computacionalmente eficaz de bitios para metodo de codificacion y aparato que permite distorsiones espectrales en la descodificacion.
CN106653035B (zh) 数字音频编码中码率分配的方法和装置
Chen et al. Comparison of two tonality estimation methods used in a psychoacoustic model
Piotrowski Precise psychoacoustic correction method based on calculation of JND level
Lanciani Auditory perception and the MPEG audio standard
Wang Audio Coding
Thiagarajan et al. Psychoacoustic Model II

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application