KR20100049590A - 압축 디지털 텔레비젼을 위한 오디오 처리 방법 및 장치 - Google Patents

압축 디지털 텔레비젼을 위한 오디오 처리 방법 및 장치 Download PDF

Info

Publication number
KR20100049590A
KR20100049590A KR1020107003255A KR20107003255A KR20100049590A KR 20100049590 A KR20100049590 A KR 20100049590A KR 1020107003255 A KR1020107003255 A KR 1020107003255A KR 20107003255 A KR20107003255 A KR 20107003255A KR 20100049590 A KR20100049590 A KR 20100049590A
Authority
KR
South Korea
Prior art keywords
perceptual
volume
loudness
signal
generating
Prior art date
Application number
KR1020107003255A
Other languages
English (en)
Inventor
제프리 톰슨
로버트 림스
Original Assignee
디티에스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디티에스, 인코포레이티드 filed Critical 디티에스, 인코포레이티드
Publication of KR20100049590A publication Critical patent/KR20100049590A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • H04N5/602Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Television Receiver Circuits (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

신호의 복수의 주파수 대역들 각각의 지각 음량을 판정하기 위한 지각 음량 추정 유닛을 포함하는 볼륨 제어 시스템이 개시되어 있다. 본 볼륨 제어 시스템은 신호의 주파수 대역들 중 한 주파수 대역의 지각 음량을 수신하고, 주파수 대역의 지각 음량의 함수로서 신호의 주파수 대역의 이득을 조정하는 이득 조정 유닛을 포함한다.

Description

압축 디지털 텔레비젼을 위한 오디오 처리 방법 및 장치{AUDIO PROCESSING FOR COMPRESSED DIGITAL TELEVISION}
본 발명은 브로드캐스트 신호에 대한 볼륨 제어에 관한 것이다.
볼륨 제어는 여전히 브로드캐스터 커뮤니티 내에서 실재하는 문제이다. 채널들이 뷰어를 짜증나게 할 정도로 되는 경우 뷰어는 실제로 "채널들을 바꾼다". "최신의" 높은 동적 범위 컨텐츠와 (하위의 동적 범위) 레가시 컨텐츠 및 시끄럽게 들리는(loud blaring) (고밀도의) 광고 방송들과의 융합(integration)은 실제로 "뷰어를 불쾌하게 한다".
이러한 문제를 고려한 메타데이터 기술을 연구하고 있지만, 그러나, 컨텐츠와 컨슈머 사이의 메타데이터 융합 문제들 뿐만 아니라 레가시 컨텐츠 문제들(연관된 메타데이터를 갖지 않는 이전에 존재한 컨텐츠)이 존재한다.
1시에, SMPTE는 -20 dBFS를 디지털 오디오 시스템을 위한 "동작 레벨"로서 표준화하고 VU 0을 -2OdBFS로서 설정하여 0의 VU 피크들에 대해 약 -10 dBFS의 통상적인 PPM 피크들을 생성했다. 대사 정규화(dialog normalization)가 -31 dBFS 내지 -1 dBFS의 범위 내에서 가변가능하게 이루어지도록 이를 합의로서 유지하는 것도 어려운 것으로 나타났다. 대화레벨 미터(dialnorm meter)가 상업적으로 입수가능해지고 있지만, 적절한 대화레벨 측정은 프로그램 내의 대화의 적절한 부분을 선택하는 것을 필요로 하며, 매우 제어된 환경에서 모니터링하는 동안 오퍼레이터의 재량에 좌우된다. 이 측정들은 숙련된 오퍼레이터가 모든 쇼의 완전한 레벨 평가를 수행할 시간을 가질 것을 필요로 하는데 이는 브로드캐스트 환경에서는 가능하지 않다. 모든 것이 잘 진행되고 이들 조건 모두가 충족된 후에야만 대화레벨이 모든 수신지 디코더들에 손상없이 전달될 것이다.
본 발명에 따르면, 브로드캐스트 신호의 볼륨을 제어하는 시스템 및 방법을 제공한다.
볼륨을 제어하는 시스템을 제공한다. 본 시스템은 인간의 청취 메카니즘(hearing mechanism)의 심리음향 모델(psychoacoustic)을 이용하여 신호를 처리함에 의한 것과 같이 신호의 복수의 주파수 대역들 각각의 지각 음량(loudness; 소리의 세기)을 판정하기 위한 지각 음량 추정 유닛을 포함한다. 이득 제어 유닛은 신호의 주파수 대역들 중 한 주파수 대역의 지각 음량을 수신하고 신호의 주파수 대역의 이득을 주파수 대역의 지각 음량의 함수로서 조정한다.
당해 기술 분야의 숙련된 자는 도면과 결합하여 다음에 오는 상세한 설명을 읽을 때 본 발명의 다른 중요한 양태들과 함께 본 발명의 이점 및 우수한 특성들을 더욱 이해할 것이다.
본 발명의 구성에 따르면, 여러 환경에 대하여 지각 음량이 엄격하게 조정되도록 합리적이고 예측가능한 방식으로 음량을 제어할 수 있다.
도 1은 본 발명의 예시적인 실시예에 따른 압축 프로파일의 도면을 나타낸다.
도 2는 본 발명의 예시적인 실시예에 따른 등청감 곡선(equal loudness curve)의 도면을 나타낸다.
도 3은 본 발명의 예시적인 실시예에 따른 등음량 필터(equal loudness filter)의 도면을 나타낸다.
도 4a 내지 도 4c는 본 발명의 예시적인 실시예에 따른 3개의 오디오 트랙들에서의 RMS 에너지 값들의 막대 그래프를 나타낸다.
도 5는 본 발명의 예시적인 실시예에 따른 중간 프로세서(interim processor)의 도면을 나타낸다.
도 6은 본 발명의 예시적인 실시예에 따른 동적 범위 컨투어(dynamic range contours; DRC)의 도면을 나타낸다.
도 7은 본 발명의 예시적인 실시예에 따른 날짜 및 시간(15분 군사 시구간)으로 표현되는 하루의 방송 시간 구분(day-parting) 스케쥴을 나타낸다.
도 8은 본 발명의 예시적인 실시예에 따른 컨슈머 "볼륨 로크(volume-lock)" 기능의 도면을 나타낸다.
도 9는 본 발명의 예시적인 실시예에 따른 음량 제어를 위한 시스템의 도면을 나타낸다.
도 10은 본 발명의 예시적인 실시예에 따른 지각 음량 추정을 위한 시스템의 도면을 나타낸다.
도 11은 본 발명의 예시적인 실시예에 따른 지각 평탄도 스케일링(flatness scaling)을 위한 시스템의 도면을 나타낸다.
도 12는 본 발명의 예시적인 실시예에 따른 음량 레벨링을 수행하기 위한 시스템의 도면을 나타낸다.
다음에 오는 설명에서, 동일한 부분들은 각각 동일한 도면 부호로 도면 및 명세서 전반에 걸쳐 표기되어 있다. 도면은 일정한 비율로 도시되어 있지 않으며, 특정한 구성요소들은 일반화되거나 또는 개략적인 형태로 도시될 수 있으며 명료화 및 간결성을 위하여 상업적 표식으로 식별될 수 있다.
일반적으로, 음량 제어 전달 함수의 전체적인 성형은 문제가 전개될 수 있는 곳이다. 프로그램 역학의 "목표 맵"의 디폴트 상태는 메타데이터의 부재시 정의되어 유지될 수 있다. 유효 메타데이터의 존재시, 목표 맵을 메타데이터에 의해 기술되는 압축 프로파일로 변환할 수 있다. 메타데이터가 사라지거나 또는 오류(corrupt)로 되는 경우, 압축 프로파일은 디폴트 상태의 목표 맵으로 다시 변환된다.
도 1은 본 발명의 예시적인 실시예에 따른 압축 프로파일의 도면을 나타낸다. 모든 조건하에서의 전체 프로그램의 장기 지각 음량(long term perceived loudness)((압축 프로파일 내의 "널(null) 대역"의 중심))을 유지하는 것이 바람직한 특성이다. 순시적인 수정이 가능하지 않은 경우에도, 복구/감소 탄도특성(ballistics)이 심리음향 원리에 따라 성형되는 경우에 만족스러운 (국부적) 널 대역 이득 정규화(null band gain normalization)가 달성가능해진다.
그 후, 브로드캐스트 엔지니어가 유효 메타데이터의 존재시 국부적 기준(local norm)을 무시하는 선택권을 갖는다. 이 특성은, 메타데이터가 보다 양호하게 이해되고 보다 신뢰성있게 될 때, 스테이션으로 하여금 국부적 기준과 디폴트 상태의 목표 맵 특성들로 되돌아가게 한다. 모든 것이 잘 진행되는 경우, 스테이션 고유의 동적 선호도를 설정하는 스테이션을 제외하고는 국부적 압축 프로파일 목표 맵의 유지와 널 대역 이득 정규화가 불필요하게 된다.
볼륨 정규화는 오디오 컨텐츠의 헤드 엔드 수집 정보(head end ingest)를 처리한다. 이 단계에서, 장기 지각 음량이 일관성있는 것을 보장하기 위해 통계적 처리와 함께 심리 음향 모델을 이용하여 컨텐츠를 정규화한다. 자동 정규화를 달성하는데 이용될 수 있는 예시적인 구성요소들이 여기에 설명되어 있다.
도 2는 본 발명의 예시적인 실시예에 따른 등청감 곡선의 도면을 나타낸다. 등음량 컨투어들은 1933년에 Fletcher와 Munson에 의해 수행된 최초의 측정들에 기초하여 1956년에 Robinson과 Dadson에 의해 측정되었으며, 곡선들이 종종 이들 이름을 전한다.
선들은 임의의 주파수의 테스트 음조(tone)가 1 kHz의 테스트 음조 정도의 소리로 들리는데 필요한 음압(sound pressure)을 나타낸다. 1 kHz (x 축 상에서 "1"임)에서 "60"으로 표기된 선을 취하면, "60"으로 표기된 선은 (y 축 상에서) 6OdB에 있다. 후속하여, 선 "60"을 0.5 kHz (500 Hz)로 낮추면, y 축 값은 약 55 dB가 된다. 따라서, 55 dB SPL에서의 500 Hz 음조는 인간 청취자에게 60 dB SPL에서 1 kHz 음조의 소리로서 들린다. 이 원리를 이용하여 볼륨 레벨을 제어한다.
도 3은 본 발명의 예시적인 실시예에 따른 등음량 필터의 도면을 나타낸다. 선들이 위쪽을 향하여 곡선을 이루는 경우, 그 주파수에서의 소리들에 대해서는 덜 민감하다. 따라서, 필터는 그 주파수의 소리들을 감쇠시킨다. 이상적인 필터는 역 등음량 필터이다. 재생 레벨(replay level)이 알려져 있지 않고, 달라지는 음량의 소리들에 대해 다른 필터가 바람직하지 않기 때문에, 곡선의 대표 평균을 목표 필터로서 선택할 수 있다.
전체 오디오 파일에 대한 RMS 에너지를 계산할 수 있지만, 이 값은 피크 진폭으로 주어진 것보다 더 정밀하다 하더라도 신호의 지각 음량의 양호한 표시를 제공하지 않는다. 매순간마다(moment by moment basis) RMS 에너지를 계산함으로써, 다음 처리를 이용하여 보다 양호한 솔루션을 달성할 수 있다.
● 신호를 50 ms 길이의 블록들로 샘플링한다.
● 모든 샘플 값을 제곱한다(square).
● 평균(mean average)을 취한다.
● 평균의 제곱근을 계산한다.
이들 4개의 단계를 이용하여, 각각의 50 ms 블록에 대한 RMS 값을 추가 처리에 이용할 수 있다.
25 ms와 1s 사이의 값들의 영향을 연구한 후 50 ms의 블록 길이를 선택하였다. 25 ms는 너무 짧아 일부 소리의 지각 음량을 정확히 반영할 수 없는 것으로 관측되었다. 50 ms를 넘어서면, 통계 처리 후에 변화가 거의 없는 것으로 관측되었다. 이러한 이유로 50 ms를 선택하였다.
스테레오 파일들을 처리하는 것에는 어려움이 따른다. 이들은 RMS 에너지를 계산하기 전에 모노(mono)로 합산될 수 있지만, 이후에 (각각의 채널 상에서의 반대 신호를 갖는) 임의의 이상(out-of-phase) 성분들이 제로로 상쇄된다(즉, 무음(silence)이 된다). 이것은 이들이 감지되는 방식이 아니기 때문에, 그 처리는 좋은 솔루션이 아니다.
대안의 방식은 2개의 RMS 값들 - 각각의 채널 마다 하나씩 - 을 계산한 다음 이들을 더하는 것이다. 그러나, 여전히 선형 가산(linear addition)은 청취자가 듣는 것에 동일한 효과를 주지 못한다. 이를 설명하기 위하여, 모노(단일 채널) 오디오 트랙을 고려하여 본다. 이 오디오 트랙이 한개의 확성기(loudspeaker)를 통해 재생되고 두개의 확성기를 통하여 재생된 소리와 비교되는 경우, 선형 가산은 1/2배의 소리일 것으로서 제안되었지만, 관찰된 볼륨은 0.75 배의 소리이다.
지각적으로, 제곱근을 계산하기 전에 채널 신호들의 평균값을 추가하는 경우, 보다 정밀한 표현이 얻어진다. 팬-폿(pan-pot) 면에서, 그것은 "동일 전압"보다는 "동일 파워(power)"를 이용하는 것을 의미한다. 또한 임의의 모노(단일 채널) 신호가 두개의 확성기들을 통하여 재생되는 것으로 추정되는 경우, 모노 신호는 동일한 스테레오 신호들의 쌍으로서 처리될 수 있다. 이와 같이, 모노 신호는 (a+a)/2(즉, a)를 주지만, 스테레오 신호는 (a+b)/2를 주며, 여기서, a와 b는 각각의 채널의 평균 제곱값들이다. 이 후에, 제곱근을 구하고 dB로 변환한다.
도 4a 내지 도 4c는 본 발명의 예시적인 실시예에 따른 3개의 오디오 트랙들에서의 RMS 에너지 값들의 막대 그래프를 나타낸다. 도 4a는 스피치(speech)를 나타내고 도 4b는 팝 음악을 나타내고 도 4c는 클래식 음악을 나타낸다. 파일 전반에 걸쳐 매 50 ms 마다 RMS 신호 레벨들을 계산하였을 때, 단일의 오프셋 값을 판정하여 전체 파일의 지각 음량을 나타낼 수 있다. 예시적인 막대 그래프들은 각각의 RMS 값이 각각의 파일에서 몇번이나 발생했는지를 나타낸다.
스피치 트랙에서의 대부분의 일반적인 RMS 값은 45dB(백그라운드 노이즈)이였으며, 따라서 대부분의 일반적인 RMS 값은 지각 음량의 양호한 표시자가 분명히 아니다. 평균 RMS 값은 스피치 샘플로 그리고 또한 클래스 음악으로 유사하게 잘못 오인(mislead)될 수 있다.
그 대신, 전체적인 지각 음량을 판정하는 양호한 방법은 RMS 에너지 값들을 번호대로 등급을 매긴 다음, 리스트의 상단 근처의 값들을 평균화하는 것이다.
대표값이 분류된 리스트에서 아래쪽으로 얼마나 멀리 있는지를 결정하기 위하여, 도 4b의 고밀도로 압축된 팝 뮤직에서는 선택이 약간 다르게 이루어진다. 스피치와 클래식 뮤직에서는 선택이 엄청난 차이를 만든다. 지각 음량의 인간 감지와 가장 정확하게 매칭하는 값을 다음과 같이 계산할 수 있다.
Figure pct00001
컨텐츠의 "노멀 레벨"을 계산했을 때, 그 후 -21 dBFS의 선택된 정규화 레벨을 충족시키도록 장기 볼륨을 증가 또는 감소시킨다. 이러한 방법을 이용하여, 스피치 피스(speech piece)를 5.7dB만큼 위로 발생시키고 팝 피스를 6dB만큼 아래로 발생시키며, 클래식 피스를 7dB만큼 아래로 발생시킨다.
그 후, 정규화된 컨텐츠를 서버, 플레이아웃(playout) 또는 헤드-엔드에 상주하는 임의의 다른 매스 매모리(mass memory) 또는 많은 경우에 어필리에이트(affiliate)에 저장한다.
도 5는 본 발명의 예시적인 실시예에 따른 중간 프로세서의 도면을 나타낸다. 헤드 엔드와 국부적 어필리에이트 양쪽 모두에서 컨텐츠를 정규화하였다고 보면, 중간 프로세서는 장기 볼륨 제어 듀티들을 경감받는다. 이것은 현재 중간 프로세서(IP)가 오디오 컨텐츠에서의 갑작스런 증가 및 복잡한 감소 양쪽 모두를 제어하고 있음을 의미한다. 이를 달성하기 위하여, 예비 정규화된 레벨의 컨텐츠를 추적하는 컨텐츠의 상한 경계들과 하한 경계들의 제어를 이용할 수 있다. IP는 컨텐츠의 장기 레벨을 연속적으로 추적할 수 있고 완전한 투과성(transparency)을 유지하도록 경계들을 조정하고 이 경계들을 "회피할 수 있다". 이러한 작업을 달성하는 예시적인 방법은 컨텐츠 엔벨로프와 함께 상한 및 하한 경계 한계값들을 "변동(float)"하게 하는 것이다. 단기 역학 특성(dynamics)이 장기 엔벨로프의 제1 도함수 내에 유지되어 있는 한, 액션을 취하지 않는다.
도 6은 본 발명의 예시적인 실시예에 따른 동적 범위 컨투어(dynamic range contours; DRC)의 도면을 나타낸다. DRC는 컨텐츠의 동적 "캐릭터"를 정의한다. 컨투어는 주어진 시간 슬롯에서의 뷰어의 데모그래피를 보다 양호하게 매칭하도록 컨텐츠의 역학 특성들을 조정하는 능력을 어필리에이트에 허용한다. 메타데이터에 기초한 시스템들이 정확한 경우에도, 하나의 크기가 수개의 시간 구역들을 넘어갈 때 모두 적합한 것은 아니다. 이러한 상태는 DRC의 하루의 방송 시간 구분을 행하고 어필레에이트에 대해 제어를 부여하는 것을 통해 완화될 수 있다. 이러한 방식으로, 넓은 동적 범위의 블록버스터 영화들이 이른 아침 또는 늦은 저녁에 감상되어지지 않게 되고 토크쇼 또는 "저지"쇼("judge" shows)가 어떠한 대화도 놓치지 않도록 엄격하게 조정되어야 하는 점을 고려하여, 사전에(ahead of time) 알려져 있는 프로그래밍을 합리적이고 예측가능한 방식으로 제어할 수 있다. 이러한 프로세스는 컨텐츠의 상한 경계들 및 하한 경계들을 통한 조정가능한 제어를 제공함으로써 달성된다.
상승 및 감소 컨투어는 -21 dBFS 근처에 중심을 두고 있음을 주지해야 한다. 이 레벨이 레가시 및 적절하게 수집된 컨텐츠 양쪽 모두에 최적의 이점을 이루는 것으로 판정되었다. 선택된 동적 범위 컨투어에 따라, 완전히 투과적인 전달 함수의 일부인 "불감 대역(deadband)"을, 컨텐츠에 대한 오직 올바른 제어량만을 이끌어내도록 크기조정한다. 도 6에서 알 수 있는 바와 같이, 통상적인 AGC에 의해 이득 상승 프로파일을 처리할 수 있는 한편, 압축 및 제한(limiting)에 의해 이득 감소 프로파일을 수행할 수 있다.
황색 컨투어는 압축에 대응하고 녹색 컨투어는 AGC 함수에 대응하며, 적색 컨투어는 제한 결과이다. 적절한 DRC를 어셈블링하는 것이 어떻게 매우 간단히 이루어질 수 있는지를 이해하는 것은 쉽다.
DRC "A"는 47dB 범위에 걸쳐 4dB의 동적 범위를 나타내는 세밀하게 제어된 컨투어를 나타낸다. 이 DRC는 극단적이기는 하지만, "절대적으로 중요한(mission critical)" 대화 전달에서의 애플리케이션을 가질 수 있다. DRC "B"는 4OdB 범위에 걸쳐 2OdB의 동적 범위의 더 적은 제어를 나타낸다. 이 컨투어는 중간 범위 영화(medium range movie)를 나타낸다.
중간 프로세서의 "알람" 특성은 컨투어의 적색 또는 녹색 부분으로의 컨텐츠 드리프트를 언제든지 활성화한다. 이 프로세스 동안, 제어 레벨이 황색 구역에 "중심을 둘" 때까지 장기 이득을 조정한다. 이 때, 알람 기능은 낮은 왜곡의 황색 구역으로부터의 다른 편향이 검출될 때까지 활성화하지 않는다. AGC가 관여되는 시간 동안, 알람을 활성화하여 오퍼레이터에게 편향을 통지하고, 알람 시간을 로깅한다.
오디오 관련 메타 데이터 기반 시스템이 컨텐츠 행로의 다른 끝부분에서 컨슈머의 시간 구역을 예상하는 것은 어렵다. 이 현실에 비추어서, 국부적인 하루의 방송 시간 구분에 의해 또는 어필리에이트가 시각(time of day) 함수로서 볼륨 경계를 제어하게 하는 스케쥴링 시스템에 의해 IP를 구동시킨다. 국부 컨텐츠의 유형 및 스케쥴링을 고도로 제어하기 때문에, 어필리에이트가 컨텐츠 유형(토크, 액션, 만화, 드라마(soap))과 (이른 아침과 늦은 저녁에 보다 제어된) 시각 양쪽 모두를 매칭하는 처리를 하루의 방송 시간 구분으로서 행하게 하는 것이 매우 간단해진다.
도 7은 본 발명의 예시적인 실시예에 따른 날짜 및 시간(15분 군사 시구간)으로 표현되는 하루의 방송 시간 구분 스케쥴을 나타낸다. 편집 시간을 절감하기 위해 날짜들을 다른 날짜들 내에 복사할 수 있다. 하루의 방송 시간 구분 스케쥴은 스케쥴에서의 특별한 이벤트들이나 또는 갑작스러운 변동들에 대하여 (인터넷 프로토콜을 통해서와 같이) 원격으로 편집가능하게 될 수 있다. 각각의 날짜/시간은 사전설정값(preset)을 나타낼 수 있다. 각각의 사전설정값은 프로그래밍가능한 특정한 동적 범위의 컨투어를 나타낸다. 하루의 방송 시간 구분 스케쥴이 기록되었다면, 스케쥴은 1년에 수 번 변경 또는 업데이트되는 것만 필요하다.
IP는 또한 컨텐츠가 결함이 있는 경우에도 컨텐츠의 청취 즐거움을 증가시키는 추가적인 처리를 채택할 수 있다. 보다 오래된 컨텐츠에는 디허밍(de-humming) 및 디노이징(de-noising)이 유용한 툴들인 한편, 스테레오 컨텐츠와 믹싱된 좌-우측 기반 컨텐츠(Left-Right based content)를 여전히 브로드캐스팅하고 있는 어필리에이트에는 시간 및 강도 정규화가 유용하다.
컨슈머의 면(end)에서는, 최종 지각 볼륨 제어 또는 로크를 제공할 수 있다. 이 볼륨 로크의 주요 목적은 컨텐츠의 레벨 및 동적 범위 컨투어를 통해 컨슈머 최종 제어를 제공하는 것이다. 컨슈머의 상태들은 컨슈머가 최대의 홈 시어터를 가질 수 있거나 또는 단지 소형인 모노 TV를 가질 수도 있다는 점에서 예측하는 것은 불가능하다. 컨슈머는 매우 시끄러운 환경에서 살 수 있거나 또는 청취가 어려울 수도 있다. 컨슈머에게는, 잠이 든 어린 아이 또는 청취가 어렵고 쉽게 깜짝 놀라기도 하는 나이가 지긋한 친척이 있을 수 있다. 볼륨 로크는 3개의 동적 범위들(넓은 범위, 평균 범위, 및 좁은 범위) 중 한 범위 및 볼륨의 간단한 선택에 의해 컨슈머에게 간단한 솔루션을 제공한다.
도 8은 본 발명의 예시적인 실시예에 따른 컨슈머 "볼륨 로크" 기능의 도면을 나타낸다. AGC 목표값 및 압축기(compressor)와 리미터(limiter) 임계값 함수를 "조편성(gang)"하여, 원하는 볼륨 레벨의 쉬운 설정을 가능하게 한다. 3개의 국부적 사전 설정은 좁은 동적 범위 컨투어, 중간 동적 범위 컨투어 또는 넓은 동적 범위 컨투어의 선택을 컨슈머에게 허용한다. "넓은" 모드에서는, 컨슈머가 브로드캐스트를 있는 그대로 신뢰하도록 선택하는 것이다. "중간" 모드에서는, 컨슈머가 엄격하지 않은 제어(loose control) 하에서 다양한 프로그래밍을 즐길 수 있다. "좁은" 모드는 거친 말이 섞여 있는 큰 소리의 광고방송과 함께 퍼지는 토크쇼나 드라마(soap opera)에 유용하다.
모여진 정보는 3개 부분의 시스템 - 수집, 하루의 방송 시간 구분에 의한 중간 처리 및 컨슈머 제어 - 을 가르킨다. 이들 3개의 처리 중 어느 하나가 그 진가를 발휘하여 컨슈머의 경험을 이롭게 한다. 이들은 결합될 경우 갑작스런 레벨 점프 또는 하락(drop off) 없이 컨텐츠의 오디오 부분에 대해 고장에 안전한 환경(fail safe environment)을 제공한다. 본 시스템은 임의의 레가시 인프라스트럭쳐와 함께 동작하고, 정규화된 레벨 또는 동적 범위 컨투어를 제어하기 위해 메타데이터에 의존하지 않는다. 이는 시끄러운 광고 방송 또는 헤드 엔드 및 어필리에이트 에러들에 대해 개선된 성능을 제공한다. 수집 및 중간 처리 프로토콜이 뒤따르는 경우, 편리함을 위한 것을 제외하면 컨슈머 처리에 그 필요성이 존재하지 않는다. 컨텐츠가 수집되고 중간 프로세스의 하루의 방송 시간 구분이 프로그래밍되면, 시스템은 자율적이어서, 인간의 간섭을 필요로 하지 않는다. 적절하게 수집된 컨텐츠의 부재시, 중간 처리는 오직 극소적이고 초단기의 트래킹 에러(tracking error)를 갖는 레벨만을 지능적으로 제어한다.
도 9는 본 발명의 예시적인 실시예에 따른 음량 제어를 위한 시스템(900)의 도면을 나타낸다. 시스템(900)은 지각 음량 추정부(902), 이득 제어부(904), 압축기(906) 및 최종 리미터(908)를 포함하며, 이들 각각은 하드웨어, 소프트웨어, 또는 하드웨어와 소프트웨어의 적절한 조합으로 구현될 수 있고 범용 처리 플랫폼 상에서 동작하는 하나 이상의 소프트웨어 시스템들일 수 있다. 여기에 이용된 바와 같이, "하드웨어"는 이산 소자, 집적 회로, 응용 주문형 집적 회로, 필드 프로그래밍 가능 게이트 어레이, 또는 다른 적절한 하드웨어의 조합을 포함할 수 있다. 여기에 이용된 바와 같이, "소프트웨어"는 하나 이상의 오브젝트들, 에이전트들, 스레드들, 코드 라인들, 서브루틴들, 별도의 소프트웨어 애플리케이션들, 둘 이상의 소프트웨어 애플리케이션에서 또는 둘 이상의 프로세서 상에서 동작하는 둘 이상의 코드 라인들 또는 다른 적절한 소프트웨어 구조들 또는 다른 적절한 소프트웨어 구조들을 포함할 수 있다. 예시적인 일 실시예에서, 소프트웨어는 운영 시스템들과 같이 범용 소프트웨어 애플리케이션에서 동작하는 하나 이상의 코드 라인들 또는 다른 적절한 소프트웨어 구조들 및 특수 목적 소프트웨어 애플리케이션에서 동작하는 하나 이상의 코드 라인들 또는 다른 적절한 소프트웨어 구조들을 포함할 수 있다.
지각 음량 추정 시스템(902)은 심리 음향 기술 및 신호 처리 기술을 이용하여, 도 9에 도시된 예시적인 5.1 소스와 같은 적절한 소스의 지각 음량을 정확하게 검출 및 조절한다. 마찬가지로, 모노 신호들, 스테레오 신호들, 7.1 신호들, 또는 다른 적절한 신호들과 같은 음원(sound source)을 처리할 수 있다.
이득 제어 시스템(904)을 이용하여, 지각 음량 추정 시스템(902)으로부터의 파워, 미리 정해진 음량 구속조건들, 또는 다른 적절한 인자들에 기초하여 신호의 이득을 증가 또는 감소하여 음량을 변경한다.
압축기(906)를 이용하여, 지각 음량 추정 시스템(902) 및 이득 제어 시스템(904)에 의해 적절하게 처리되지 않은 단기 음량 변동량(variation)들을 제어할 수 있다. 예시적인 일 실시예에서, 압축기(906)는 미리 정해진 허용가능한 단기 피크를 2 dB 내지 8 dB와 같은 미리 정해진 목표 레벨을 넘어서도록 설정될 수 있다. 압축기(906)는 0.40 내지 0.80와 같이 사용자가 선택한 범위에 걸쳐 압축비를 적용할 수 있다.
최종 리미터(908)를 이용하여, 절대 파형 피크 레벨을 제어할 수 있다. 예시적인 일 실시예에서, 최종 리미터(908)는 -10 dB 풀 스케일(full scale; FS) 내지 0 dBFS와 같이 미리 정해진 범위에 걸쳐 사용자가 선택가능하게 이루어질 수 있다.
동작시, 시스템(900)은 심리 음향 기술 및 신호 처리 기술을 이용하여, 압축기 및 리미터와 같은 다른 적절한 음량 제어부들과 결합하여 음원의 지각 음량을 정확하게 검출하고 조정함에 의한 것과 같이 브로드캐스트 시스템 또는 다른 적절한 위치들에서 음량을 제어할 수 있게 한다. 다른 적절한 음량 제어와 심리 음향 기술 및 신호 처리 기술을 결합함으로써, 시스템(900)은 권총 발사음(gun shot), 굉음(crash), 폭발음(explosion) 또는 다른 원하는 컨텐츠와 같은 주기적으로 큰 소리의 노이즈에 대해 온화한 대화를 오프셋시키는 경우와 같은 음량의 과잉 보상을 피한다.
도 10은 본 발명의 예시적인 실시예에 따른 지각 음량 추정을 위한 시스템(1000)의 도면을 나타낸다. 소스 오디오 신호의 오디오 채널들(x1(t) 내지 xN(t); 여기서, N은 소스 오디오 데이터의 채널들의 수를 나타내는 적절한 정수임)은 복소수 시간 대 주파수 필터 뱅크(1002a 내지 1002n)를 통해 처리되며, 이 필터 뱅크는 시간 도메인 신호(x1(t) 내지 xN(t))를 대응 주파수 도메인 신호(x1(f) 내지 xN(f))로 변환한다. 그 후, 각각의 부대역의 크기 |X1(f)| 내지 |XN(f)|를 대응 지각 평탄도 스케일링부(1004a 내지 1004n)에 입력하며, 이 평탄도 스케일링부는 각각의 대응하는 부대역의 크기에 적용되는 스케일링 값(a1 내지 aN)을 발생시킨다.
각각의 채널의 오디오 스펙트럼을 지각 평탄도 측정값에 대해 비례적으로 스케일링한 후, 모든 채널들(a1|X1(f)| 내지 aN|XN(f)|)을 다음 등식에 따르는 바와 같이 일정 파워 합산(constant power summation; 1006)에 의해 합산한다.
Figure pct00002
일정 파워 합산은 일정 파워 패닝 법칙(constant power panning law)에 의해 유도되며, 오디오 신호가 확성기를 통하여 재생되었을 경우에 청취한 "스위트 스폿(sweet-spot)" 내에 존재하는 각각의 부대역에 대한 음압 레벨을 모델링하는데 이용될 수 있다. 일정 파워 합산을 이용하여 음력(sound power) 레벨을 모델링하는 것은 채널을 합산하는 것 뿐만 아니라 입력 채널들의 수에서의 확장성(scalability)을 제공하기 위한 인지적으로 적절한 방법을 제공한다. 일정 파워 합산(1006)은 결합된 오디오 스펙트럼(Y(f))을 출력한다.
등음량 성형부(1008)는 Fletcher-Munson 곡선 또는 다른 적절한 등음량 컨투어와 같은 등음량 컨투어를 이용하여 결합된 오디오 스펙트럼(Y(f))을 처리하며, 등음량 컨투어는 통상적인 인간 청취자에 대해 서로 다른 주파수들이 서로 다른 음량 레벨들에서 감지된다는 현상을 모델링한다. 예를 들어, 주어진 음압 레벨(SPL)에 대해, 평균적인 청취자는 대략 1-4kHz의 중간 주파수가 그보다 더 낮거나 더 높은 주파수보다 더 크게 들린다고 인지한다. 등음량 성형부(1008)는 등음량으로 성형된 스펙트럼(YEL(f))을 발생시킨다.
등음량으로 성형된 스펙트럼(YEL(f))의 각각의 부대역을 네제곱한 다음, 지각 대역 그룹화부(1010)에 의해 지각 대역들로 그룹화된다. 스펙트럼(YEL(f))을 네제곱하는 것을 수행하여 후속의 처리에 대해 보상하며, 여기서 대역 스펙트럼(YEL(bark))을 0.25제곱을 수행한다. 그 후, 합산부(1012)에 의해 모든 압축된 지각 대역 YEL(bark)0.25를 합산하고 dB로 변환하여 주어진 오디오 세그먼트에 대해 지각 음량 추정값(perceptual loudness estimate; PLE)을 가져온다.
도 11은 본 발명의 예시적인 실시예에 따른 지각 평탄도 스케일링을 위한 시스템(1100)의 도면을 나타낸다. 지각 대역 그룹화부(1102)가 스펙트럼 |X1(f)|을 지각 대역으로 그룹화하여 파워 |X1(barks)|을 발생시킨다. 스펙트럼 평탄도 측정부(1104)는 지각 대역 상의 스펙트럼 단조성 측정값 |X1(barks)|을 계산하여 지각 평탄도 측정값(perceptual flatness measure; PFM)을 가져온다. 높은 지각 평탄도 측정값은 모든 지각 대역들에서 신호가 거의 동일한 양의 에너지를 갖고 있어 핑크 잡음(pink noise)과 거의 유사하게 들린다는 것을 나타낸다. 낮은 지각 평탄도 측정값은 신호 에너지가 적은 수의 지각 대역들 내에 집중되어 있어 혼합음조(mixture of tone)에 거의 유사하게 들린다는 것을 나타낸다.
그후, 인버터(1106)에 의해 지각 평탄도 측정값(PFM)을 스케일링 값(ai)으로 변환하며, 스케일링 값(ai)을 이용하여 멀티플렉서(1108)에 의해 |X1(f)|의 전체 스펙트럼을 스케일링한다. 광대역이고 인지적으로 단조로운 신호들이 일반적으로 이들의 지각 음량에 비해 너무 높은 에너지 레벨을 갖는다는 경험적 관측에 기초하여, PFM이 높은 경우, 스케일링 인수(ai)는 낮아야 되고, PFM이 낮은 경우, 스케일링 값(ai)은 높아야 한다. 예시적인 일 실시예에서, 스케일링 값(ai)은 지각적 단조 물질에 있어 -6dB 내지 지각적 음조 물질(perceptually tonal material)에 있어 OdB 범위에 있을 수 있다.
도 12는 본 발명의 예시적인 실시예에 따른 음량 레벨화를 수행하기 위한 시스템(1200)의 도면을 나타낸다. 시스템(1200)은 지각 음량 추정 시스템(902)으로부터 간단한 1차 저대역 통과 필터를 통하여 수신되는 단기 지각 음량 추정값(PLE)을 평활화한다.
감산기(subtractor; 1208)에 입력된 TARGET 지각 음량 레벨은 사용자에 의해 미리 정하여 설정할 수 있거나 또는 달리 결정할 수 있다. 엔드유저 재생 볼륨 레벨을 알지 못하기 때문에, 목표 음량 레벨은 SPL보다는 dBFS로 설정될 수 있다. 예를 들어, 사용자가 목표 음량 레벨을 -20 dBFS이 되도록 선택한 경우에 수정된 오디오 신호는 -20 dBFS의 장기 평균 레벨을 가지면서 지각 등음량을 유지할 것이다.
시스템(1200)은 필터 LP1(1202)과 LP2(1204)를 포함하며, 이는 1차 무한 임펄스 응답 저대역 통과 필터들 또는 다른 적절한 필터들일 수 있다. 필터 LP1(1202)은 음량 수정 신호의 상승 시간에 기초하여 제어되고 필터 LP2(1204)는 음량 수정 신호의 하강 신호에 기초하여 제어된다. PLE 값은 필터 LP1(1202) 및 필터 LP2(1204)를 통하여 전송되고, 최대 파워는 평활화된 PLE 값으로서 max(1206)에 의해 선택된다. 실제로, 하강 시간 값보다 더 빠른 상승 시간 값을 이용한다. 이 처리는 상승 시간 필터 LPl(1202)가 온셋(onset) 이벤트를 제어하고, 하강 시간 필터 LP2(1204)가 붕괴(decay) 이벤트를 제어하는 것을 가져온다.
피드백 루프는 음량 수정에 대한 가변 속도 처리를 제공하기 위해 존재한다. DELTA 값은 현재의 평활화된 PLE 값과 이전의 평활화된 PLE 값 사이의 차이값으로서 계산된다. DELTA 값이 미리 정해진 또는 사용자가 정의한 임계값을 초과하는 경우, 필터 LPl(1202) 및 필터 LP2(1204)에 대한 컷오프 주파수를 FastRT 및 FastFT의 미리 정해진 값 또는 사용자가 정의한 값들로 각각 설정한다. DELTA 값들의 값이 임계값 아래로 떨어지면, 컷오프 주파수는 SlowRT 및 SlowFT의 미리 정해진 값 또는 사용자가 정의한 값으로 설정한다. 이러한 간단한 피드백 루프와 가변 속도 평활화를 통합하는 것은 급격한 음량 온셋이 발생할 경우 이들을 캡쳐하는 것을 돕는다.
감산기(1208)에 의해 최종 수정 값을 TARGET 값과 평활화된 PLE 값 사이의 차이값으로서 계산한다. 그 후, 이 수정값을 가산기들(1210a 내지 121On)에 의해 소스 신호의 모든 채널들(x1(f) 내지 xN(f))에 적용하고, 주파수 대 시간 변환부(1212a 내지 1212n)에 의해 각각 음량 수정된 출력 신호들(y1(t) 내지 yN(t))을 발생시킨다.
본 발명의 시스템 및 방법의 예시적인 실시예들이 여기에 자세히 설명되어 있지만, 당해 기술 분야의 숙련된 자는 또한 첨부된 청구범위의 범위 및 사상에 벗어남이 없이 여러 수정 및 변형들이 시스템 및 방법들에 대해 이루어질 수 있음을 알고 있다.
902 지각 음량 추정부
904 이득 제어부
906 압축기
908 최종 리미터
1006 일정 파워 합산부
1008 등음량 성형부
1010 지각 대역 그룹화부
1004a - 1004n 지각 평탄도 스케일링부
1102 지각 대역 그룹화부
1104 스펙트럼 평탄도 측정부
1106 인버터
1202, 1204 저대역 통과 필터

Claims (20)

  1. 볼륨을 제어하는 시스템으로서,
    신호의 복수의 주파수 대역 각각의 지각 음량(perceived loudness)을 판정하는 지각 음량 추정 유닛과,
    상기 신호의 주파수 대역들 중 한 주파수 대역의 지각 음량을 수신하고 상기 주파수 대역의 지각 음량의 함수로서 상기 신호의 주파수 대역의 이득을 조정하는 이득 제어 유닛
    을 포함하는 볼륨 제어 시스템.
  2. 제1항에 있어서,
    상기 지각 음량 추정 유닛은 복수의 지각 평탄도 스케일링 유닛을 더 포함하며, 상기 지각 평탄도 스케일링 유닛 각각은 상기 신호의 부대역에 대한 크기 데이터를 수신하고, 대응하는 스케일링 값을 발생시키고, 상기 크기 데이터와 상기 대응하는 스케일링 값을 곱하여 스케일링된 부대역 크기를 발생시키는 것인 볼륨 제어 시스템.
  3. 제2항에 있어서,
    상기 지각 음량 추정 유닛은 복수의 스케일링된 부대역 크기들을 수신하고 결합된 오디오 스펙트럼을 발생시키는 일정 파워 합산 유닛(constant power summation unit)을 더 포함하는 것인 볼륨 제어 시스템.
  4. 제3항에 있어서,
    상기 결합된 오디오 스펙트럼은 식,
    Figure pct00003

    에 따라 결정되는 것인 볼륨 제어 시스템.
  5. 제3항에 있어서,
    상기 결합된 오디오 스펙트럼을 수신하고, 등음량 컨투어(equal loudness contour)에 의해 상기 결합된 오디오 스펙트럼을 스케일링함으로써 등음량으로 성형된 스펙트럼을 발생시키는 등음량 성형 시스템을 더 포함하는 볼륨 제어 시스템.
  6. 제5항에 있어서,
    상기 등음량 성형 스펙트럼을 수신하고 지각 음량 추정값을 발생시키는 지각 음량 추정 시스템을 더 포함하는 볼륨 제어 시스템.
  7. 제1항에 있어서,
    상기 이득 제어 유닛은,
    지각 음량 추정값을 수신하고 온셋 이벤트(onset event)를 제어하는 상승 시간 필터(rise time filter), 및
    상기 지각 음량 추정값을 수신하고 붕괴 이벤트(decay event)를 제어하는 하강 시간 필터(fall time filter)
    를 더 포함하는 것인 볼륨 제어 시스템.
  8. 제1항에 있어서,
    상기 이득 제어 유닛은 지각 음량 추정 값들의 시퀀스를 수신하고 평활화된 지각 음량 추정값들을 발생시키는 지각 음량 추정 평활화 시스템을 더 포함하는 것인 볼륨 제어 시스템.
  9. 제1항에 있어서,
    상기 이득 제어 유닛은 현재의 평활화된 지각 음량 추정값과 이전의 평활화된 지각 음량 추정값으로부터 차이값을 발생시키고 상기 차이값이 미리 정해진 임계값을 초과하는 경우 하나 이상의 필터들에 대한 컷오프 주파수(cutoff frequency)를 변경하는 피드백 루프를 더 포함하는 것인 볼륨 제어 시스템.
  10. 볼륨을 제어하는 방법으로서,
    신호의 복수의 주파수 대역 각각의 지각 음량을 판정하고,
    이득 제어 유닛에서, 상기 신호의 주파수 대역들 중 한 주파수 대역의 지각 음량을 수신하고,
    상기 주파수 대역의 지각 음량의 함수로서 상기 신호의 주파수 대역의 이득을 조정하는 것
    을 포함하는 볼륨 제어 방법.
  11. 제10항에 있어서,
    상기 신호의 복수의 부대역에 대한 크기 데이터를 수신하고,
    상기 신호의 복수의 부대역 각각에 대한 대응하는 스케일링 값을 발생시키고,
    상기 크기 데이터와 상기 대응하는 스케일링 값을 곱하여 스케일링된 부대역 크기를 발생시키는 것
    을 더 포함하는 볼륨 제어 방법.
  12. 제11항에 있어서,
    복수의 스케일링된 부대역 크기들을 수신하고 결합된 오디오 스펙트럼을 발생시키는 것을 더 포함하는 볼륨 제어 방법.
  13. 제12항에 있어서,
    상기 결합된 오디오 스펙트럼은 식,
    Figure pct00004

    에 따라 발생되는 것인 볼륨 제어 방법.
  14. 제12항에 있어서,
    등음량 컨투어에 의해 상기 결합된 오디오 스펙트럼을 스케일링함으로써 등음량 성형 스펙트럼을 발생시키는 것을 더 포함하는 볼륨 제어 방법.
  15. 제14항에 있어서,
    지각 음량 추정값을 발생시키는 것을 더 포함하는 볼륨 제어 방법.
  16. 제10항에 있어서,
    지각 음량 추정값에 기초하여 온셋 이벤트를 제어하고,
    상기 지각 음량 추정값에 기초하여 붕괴 이벤트를 제어하는 것
    을 더 포함하는 볼륨 제어 방법.
  17. 제10항에 있어서,
    지각 음량 추정 값들의 시퀀스를 수신하고 평활화된 지각 음량 추정값들을 발생시키는 것을 더 포함하는 볼륨 제어 방법.
  18. 제10항에 있어서,
    현재의 평활화된 지각 음량 추정값과 이전의 평활화된 지각 음량 추정값으로부터 차이값을 발생시키고,
    상기 차이값이 미리 정해진 임계값을 초과하는 경우 하나 이상의 필터들에 대한 컷오프 주파수를 변경하는 것
    을 더 포함하는 볼륨 제어 방법.
  19. 볼륨을 제어하는 시스템으로서,
    신호의 복수의 주파수 대역들 각각의 지각 음량을 판정하는 수단과,
    상기 신호의 주파수 대역들 중 한 주파수 대역의 지각 음량을 수신하고 상기 주파수 대역의 지각 음량의 함수로서 상기 신호의 주파수 대역의 이득을 조정하는 수단
    을 포함하는 볼륨 제어 시스템.
  20. 제19항에 있어서,
    복수의 지각 평탄도 스케일링 유닛을 더 포함하며, 상기 지각 평탄도 스케일링 유닛 각각은 상기 신호의 부대역에 대한 크기 데이터를 수신하고, 대응하는 스케일링 값을 발생시키고, 상기 크기 데이터와 상기 대응하는 스케일링 값을 곱하여 스케일링된 부대역 크기를 발생시키는 것인 볼륨 제어 시스템.
KR1020107003255A 2007-08-16 2008-08-15 압축 디지털 텔레비젼을 위한 오디오 처리 방법 및 장치 KR20100049590A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US96493007P 2007-08-16 2007-08-16
US60/964,930 2007-08-16

Publications (1)

Publication Number Publication Date
KR20100049590A true KR20100049590A (ko) 2010-05-12

Family

ID=40378541

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107003255A KR20100049590A (ko) 2007-08-16 2008-08-15 압축 디지털 텔레비젼을 위한 오디오 처리 방법 및 장치

Country Status (8)

Country Link
US (1) US20090074209A1 (ko)
EP (1) EP2188986B1 (ko)
JP (1) JP2010537233A (ko)
KR (1) KR20100049590A (ko)
CN (1) CN101855901B (ko)
CA (1) CA2694613A1 (ko)
HK (1) HK1144513A1 (ko)
WO (1) WO2009026143A1 (ko)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8315409B2 (en) * 2008-09-16 2012-11-20 International Business Machines Corporation Modifications of audio communications in an online environment
WO2010044439A1 (ja) * 2008-10-17 2010-04-22 シャープ株式会社 音声信号調整装置及び音声信号調整方法
JP5394905B2 (ja) * 2009-01-14 2014-01-22 ローム株式会社 自動レベル制御回路およびそれを用いたオーディオ用デジタル信号プロセッサならびに可変利得増幅器の利得制御方法
US8302047B2 (en) * 2009-05-06 2012-10-30 Texas Instruments Incorporated Statistical static timing analysis in non-linear regions
US9998081B2 (en) 2010-05-12 2018-06-12 Nokia Technologies Oy Method and apparatus for processing an audio signal based on an estimated loudness
US8731216B1 (en) * 2010-10-15 2014-05-20 AARIS Enterprises, Inc. Audio normalization for digital video broadcasts
TW201218784A (en) * 2010-10-28 2012-05-01 Optoma Technology Inc Speaker system and method for optimizing output of speaker thereof
CN102253117B (zh) * 2011-03-31 2014-05-21 浙江大学 一种基于压缩感知的声学信号采集方法
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
JP5827442B2 (ja) 2012-04-12 2015-12-02 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号におけるラウドネス変化をレベリングするシステム及び方法
JP6056356B2 (ja) 2012-10-10 2017-01-11 ティアック株式会社 録音装置
JP6079119B2 (ja) * 2012-10-10 2017-02-15 ティアック株式会社 録音装置
CN103796136B (zh) * 2012-10-30 2017-02-08 广州三星通信技术研究有限公司 保证不同音效模式输出响度及音质的设备和方法
US10027303B2 (en) * 2012-11-13 2018-07-17 Snell Advanced Media Limited Management of broadcast audio loudness
CN103916097B (zh) * 2013-01-02 2018-10-19 三星电子株式会社 用于处理音频信号的设备和方法
US9171552B1 (en) * 2013-01-17 2015-10-27 Amazon Technologies, Inc. Multiple range dynamic level control
KR102660144B1 (ko) * 2013-01-21 2024-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
CN104080024B (zh) 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
US9521501B2 (en) 2013-09-12 2016-12-13 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
CN109785851B (zh) 2013-09-12 2023-12-01 杜比实验室特许公司 用于各种回放环境的动态范围控制
CN103714824B (zh) * 2013-12-12 2017-06-16 小米科技有限责任公司 一种音频处理方法、装置及终端设备
US9608588B2 (en) * 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
US9338552B2 (en) 2014-05-09 2016-05-10 Trifield Ip, Llc Coinciding low and high frequency localization panning
US20170078793A1 (en) * 2015-03-23 2017-03-16 Eric Jay Alexander Inversion Speaker and Headphone for Music Production
US9590580B1 (en) * 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
CN105513606B (zh) * 2015-11-27 2019-12-06 百度在线网络技术(北京)有限公司 语音信号处理方法、装置和系统
CN108322848A (zh) * 2017-01-16 2018-07-24 塞舌尔商元鼎音讯股份有限公司 具有听力保护功能的声音调整装置及其声音调整的方法
US10911013B2 (en) 2018-07-05 2021-02-02 Comcast Cable Communications, Llc Dynamic audio normalization process
CN109473115B (zh) * 2018-11-22 2022-04-12 四川长虹电器股份有限公司 数字音频信号音量等响度调节方法
US20220322004A1 (en) * 2019-09-13 2022-10-06 Dolby Laboratories Licensing Corporation Dynamic range compression with reduced artifacts
US11128925B1 (en) * 2020-02-28 2021-09-21 Nxp Usa, Inc. Media presentation system using audience and audio feedback for playback level control

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0123274B1 (ko) * 1992-12-31 1997-11-17 김주용 사용자 기호 보상형 심리음향 모델
KR0144841B1 (ko) * 1993-09-24 1998-07-15 김광호 음향신호의 적응적 부호화 및 복호화장치
KR100285419B1 (ko) * 1999-04-30 2001-03-15 박종섭 방송용 디지털 오디오 부호화 장치 및 그 제어방법
JP4486646B2 (ja) * 2003-05-28 2010-06-23 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の感知音量を計算し調整する方法、装置及びコンピュータプログラム
KR20060022053A (ko) * 2004-09-06 2006-03-09 삼성전자주식회사 Av 시스템 및 그 튜닝 방법
US8090120B2 (en) 2004-10-26 2012-01-03 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
KR100636213B1 (ko) * 2004-12-28 2006-10-19 삼성전자주식회사 실시간 주파수 특성 보정 방법 및 그를 적용한 사운드재생 장치

Also Published As

Publication number Publication date
US20090074209A1 (en) 2009-03-19
CN101855901B (zh) 2012-11-14
EP2188986A4 (en) 2010-10-06
HK1144513A1 (en) 2011-02-18
EP2188986A1 (en) 2010-05-26
WO2009026143A1 (en) 2009-02-26
JP2010537233A (ja) 2010-12-02
EP2188986B1 (en) 2016-04-06
CA2694613A1 (en) 2009-02-26
CN101855901A (zh) 2010-10-06

Similar Documents

Publication Publication Date Title
EP2188986B1 (en) Audio processing for compressed digital television
US10956121B2 (en) Dynamic range control for a wide variety of playback environments
JP6812599B2 (ja) ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
US9859858B2 (en) Correction of unknown audio content
CN107925391B (zh) 基于编码音频元数据的响度均衡和drc期间的动态均衡的方法和系统
AU2004234745B2 (en) Volume and compression control in movie theaters
KR930004932B1 (ko) 음향 효과장치
MXPA05012785A (es) Metodo, aparato y programa de computadora para el calculo y ajuste de la sonoridad percibida de una senal de audio.
NO20160775A1 (en) System and Method for digital signal processing
US9991861B2 (en) System and method for controlled dynamics adaptation for musical content
TWI692937B (zh) 具高階環繞處理之可調整多重頻段壓縮器架構
US10128809B2 (en) Intelligent method and apparatus for spectral expansion of an input signal
EP2838196B1 (en) System and method for controlled dynamics adaptation for musical content
CN112005491A (zh) 电视机中音频处理的配置和状态报告系统
GB2494894A (en) Dynamic range control
JPH03159332A (ja) Cm音声レベルの自動制御方式
Monroe A new approach to balanced audio levels in television
Ziółko et al. Computer Games Sound Effects
Katz D. Dynamic Range 2: Dynamic Manipulation
JP2018509031A (ja) 自動サウンドレベルの調整を有する増幅器

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid