KR20090074191A - 다이알로그 증폭 기술을 위한 컨트롤러 및 사용자 인터페이스 - Google Patents

다이알로그 증폭 기술을 위한 컨트롤러 및 사용자 인터페이스 Download PDF

Info

Publication number
KR20090074191A
KR20090074191A KR1020097007409A KR20097007409A KR20090074191A KR 20090074191 A KR20090074191 A KR 20090074191A KR 1020097007409 A KR1020097007409 A KR 1020097007409A KR 20097007409 A KR20097007409 A KR 20097007409A KR 20090074191 A KR20090074191 A KR 20090074191A
Authority
KR
South Korea
Prior art keywords
volume
dialogue
volume control
dialog
signal
Prior art date
Application number
KR1020097007409A
Other languages
English (en)
Other versions
KR101061415B1 (ko
Inventor
오현오
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20090074191A publication Critical patent/KR20090074191A/ko
Application granted granted Critical
Publication of KR101061415B1 publication Critical patent/KR101061415B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Image Processing (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Separation By Low-Temperature Treatments (AREA)
  • Electrotherapy Devices (AREA)
  • Manufacture, Treatment Of Glass Fibers (AREA)

Abstract

복수 채널의 오디오 신호 (예를 들어, 스테레오 오디오) 는 타 신호 (반사되거나 굴절되는 소리) 와 비교하여 추정되는 다이알로그 (예를 들어, 영화에서 배우가 이야기 하는 다이알로그) 의 게인 (예를 들어, 볼륨 레벨 또는 소음 정도) 을 조절하는 절차가 진행된다. 일부 실시예에서, 컨트롤러는 주 음량과 다이알로그 볼륨을 조절하는데 사용된다. 일부 실시예에서, 하나 또는 그 이상의 도식적인 객체 및/또는 사용자 인터페이스 성분은 볼륨 레벨과 여타 정보를 가리키는데 사용된다.
본 발명의 직접적인 구현 방법, 시스템 및 컴퓨터로 판독 가능한 기록매체를 포함한 타 구현예가 개시된다.

Description

다이알로그 증폭 기술을 위한 컨트롤러 및 사용자 인터페이스{CONTROLLER AND USER INTERFACE FOR DIALOGUE ENHANCEMENT TECHNIQUES}
본 발명은 일반적인 신호 처리에 관한 것이다.
오디오 증폭 기술은 종종 가정 내 오락 시스템, 입체음향 및 여타 소비자 전자 기기에서 저주파 신호를 증폭시키고 다양한 청취 환경 (예를 들어, 콘서트 홀) 을 구현하기 위하여 사용된다. 예를 들어, 일부 기술은 고주파 신호를 삽입함으로써 영화 다이알로그를 보다 명확하게 만드는데 사용되기도 한다. 그러나 어떠한 기술도 다이알로그를 주변환경이나 다른 성분의 신호와 비교하여 상대적으로 증폭시키는 기술을 개시하지 않는다.
본 발명은 현재 계류중인 아래 미국 가출원을 우선권으로 주장한다.
- 2006년 9월 14일 출원된 발명의 명칭 "Method of Separately Controlling Dialogue Volume,", 미국 가출원 번호 60/844,806, 대리인 관리 번호 19819-047P01;
- 2007년 1월 11일 출원된 발명의 명칭 "Separate Dialogue Volume (SDV),", 미국 가출원 번호 60/884,594, 대리인 관리 번호 19819-120P01; 및
- 2007년 6월 11일 출원된 발명의 명칭 "Enhancing Stereo Audio with Remix Capability and Separate Dialogue," 미국 가출원 번호 60/943,268, 대리인 관리 번호 19819-160P01.
상기 각 가출원은 전체가 참조로서 본 명세서에 통합된다.
다이알로그 증폭 기술
도 1은 두 스피커를 사용하여 가상 음원의 위치의 함수로서 채널 게인을 나타내는 모델을 도시한 도면이다. 일부 실시예에 있어서, 오디오/비디오 신호에 포함되어 있는 다이알로그의 볼륨만을 조절하는 방법은 텔레비전 수신기, 디지털 멀티미디어 방송 (DMB) 플레이어, 또는 퍼스널 멀티미디어 플레이어 (PMP) 를 포함하는 오디오 신호를 재생하는 다양한 장치에서 사용자의 요구에 따라 다이알로그를 효율적으로 조절할 수 있도록 한다.
배경 잡음 또는 전송 잡음이 발생하지 않는 환경에서 대화체 신호만이 전송되는 경우, 청취자는 어려움 없이 전송된 다이알로그를 청취할 수 있다. 만약 전송되는 다이알로그의 볼륨이 작을 경우, 청취자는 볼륨을 증가시킴으로써 다이알로그를 청취할 수 있다. 다이알로그가 영화, 드라마, 또는 스포츠를 재생하는 극장 또는 텔레비전 수상기에서 다양한 음향 효과와 함께 재생될 때, 음악, 음향 효과 및/또는 배경 또는 전송 잡음으로 인하여 청취자는 다이알로그를 청취하는데 어려움을 겪을 수도 있다. 이때, 다이알로그의 볼륨을 키우기 위해 전체 볼륨을 키우는 경우, 배경 잡음, 음악, 음향 효과의 볼륨 역시 커지게 되므로, 귀에 거슬리는 소리가 발생한다.
일부 실시예에 있어서, 만약 전송되는 복수 채널의 오디오 신호가 스테레오 신호일 경우, 센터 채널은 가상으로 생성될 수 있고, 가상 센터 채널에 게인이 적용될 수 있으며, 가상 센터 채널은 복수 채널의 오디오 신호의 좌, 우 (L/R) 채널에 더해질 수 있다. 상기 가상 센터 채널은 좌 채널과 우 채널의 결합에 의하여 생성될 수 있다.
Figure 112009021730613-PCT00001
Figure 112009021730613-PCT00002
Figure 112009021730613-PCT00003
Figure 112009021730613-PCT00004
여기서 Lin 과 Rin 은 좌, 우 채널의 입력신호를 의미하고, Lout 과 Rout 은 좌, 우 채널의 출력 신호를 의미하며, Cvirtual 과 Cout 은 중간 과정에서 사용되는 값으로 각각 가상 센터 채널과 가공된 가상 센터 채널의 출력 신호를 의미하며, Gcenter 는 가상 센터 채널의 레벨 결정에 사용되는 게인 값을 의미하며, GL 과 GR 은 좌, 우 채널의 입력 값에 적용되는 게인 값을 의미한다. 본 예에서, GL 와 GR 은 1로 가정된다.
이에 추가하여, 가상 센터 채널에 게인을 적용하는 방법뿐만 아니라, 특정 주파수를 증폭 또는 감쇄시키기 위해 하나 또는 그 이상의 필터 (예를 들어, 밴드 패스 필터) 를 적용하는 방법이 사용될 수 있다. 이 경우, 함수 fcenter 를 이용하여 필터를 적용할 수 있다. 만약 Gcenter 를 이용하여 가상 센터 채널의 볼륨을 키울 경우, 다이알로그 신호가 증폭됨과 동시에 좌, 우 채널에 포함된 음악 또는 음향 효과와 같은 타 성분이 증폭되는 한계가 있다. 만약 fcenter 를 이용한 밴드 패스 필터가 사용될 경우, 다이알로그 발음이 명료해지나, 다이알로그, 음악 및 배경음과 같은 신호가 귀에 거슬리는 소리로 왜곡된다.
아래에 설명되는 것과 같이 일부 실시예에 있어서, 상기에서 설명된 문제점은 전송되는 오디오 신호에 포함된 다이알로그의 볼륨을 조절함으로써 효율적으로 해소될 수 있다.
다이알로그의 볼륨을 조절 하는 방법
일반적으로, 다이알로그는 멀티 채널 신호 환경 하에서 센터 채널에 집중되어 있다. 예를 들어, 5.1, 6.1 또는 7.1 채널 서라운드 (surround) 시스템에서, 다이알로그는 일반적으로 센터 채널에 할당된다. 만약 수신되는 오디오 신호가 복수 채널의 신호일 경우, 센터 채널의 게인만을 조절함으로써 충분한 효과를 얻을 수 있다. 만약 오디오 신호에 센터 채널이 포함되지 않았다면 (예를 들어, 스테레오 신호), 복수 채널의 오디오 신호의 채널 중 다이알로그가 집중될 것으로 추정되는 센터 영역 (이하, 다이알로그 영역으로도 참조됨) 에 소정의 게인을 적용하기 위한 방법이 요구된다.
센터 채널을 포함하는 멀티 채널 입력 신호
상기 5.1, 6.1 또는 7.1 채널 서라운드 시스템은 센터 채널을 포함한다. 이러한 시스템 하에서는 센터 채널의 게인만을 조정함으로써 원하는 효과를 충분히 얻을 수 있다. 이 경우 상기 센터 채널은 다이알로그가 할당되는 채널을 지칭한다. 그러나, 본 명세서에서 개시된 다이알로그 증폭 기술은 센터 채널에 제한되지 않는다.
출력 채널이 센터 채널을 포함할 경우
이 경우, 만약 센터 채널이 C_out 이고, 입력 센터 채널이 C_in 일 경우, 아래 수학식 2가 얻어질 수 있다.
Figure 112009021730613-PCT00005
여기서, G_center 는 소정의 게인을 나타내고, f_center 는 센터 채널에 적용되는 필터 (함수) 를 나타내며, 이는 용도에 따라 구성될 수 있다. 경우에 따라서는, G_center 는 f_center 가 적용된 다음 적용될 수 있다.
Figure 112009021730613-PCT00006
출력 채널이 센터 채널을 포함하지 않을 경우
만약 출력 채널이 센터 채널을 포함하지 않는 경우 C_out (게인이 상기 설명한 방법에 의하여 조절된) 은 좌, 우 채널에 적용된다. 이것은 아래 식에 의하여 얻어진다.
Figure 112009021730613-PCT00007
Figure 112009021730613-PCT00008
신호 파워 (power) 를 얻기 위하여, C_out 은 소정의 게인 (예를 들어, 1/√2) 을 이용하여 계산될 수 있다.
센터 채널을 포함하지 않는 복수 채널의 입력 신호
만약 복수 채널의 오디오 신호가 상기 센터 채널을 포함하지 않는 경우, 다이알로그가 집중될 것으로 추정되는 다이알로그 신호 (역시 가상 센터의 채널 신호로 참조됨) 가 복수 채널의 오디오 신호로부터 획득될 수 있으며, 상기 추정되는 다이알로그 영역에 소정의 게인이 적용될 수 있다. 예를 들어, 2007년 9월 14일 출 원된, 미국 특허 출원 번호 , "Dialogue Enhancement Technique (다이알로그 증폭 기술) " 대리인 관리 번호 19819-120001 에 개시된 바와 같이 오디오 신호 특성 (예를 들어, 레벨, 좌, 우 채널 신호 사이의 연관관계, 스펙트럴 (spectral) 성분) 이 다이알로그를 추측하는데 사용될 수 있으며, 상기 특허출원은 전체가 참조로서 본 출원에 통합된다.
도 1을 다시 참조하면, 사인 (sine) 법칙에 의해, 음원 (예를 들어, 도 1에서 가상 소스) 이 소리 상 (image) 의 어떠한 포지션에 위치하든, 상기 채널의 게인은 두 스피커를 이용하는 소리 상 안에서의 음원의 위치를 표시하기 위해 조절될 수 있다.
Figure 112009021730613-PCT00009
Figure 112009021730613-PCT00010
사인 함수 외에 탄젠트 (tangent) 함수가 사용될 수도 있음을 밝혀둔다.
이와는 대조적으로 두 스피커에 입력되는 신호의 레벨 즉, g1 과 g2 를 아는 경우 신호 입력의 음원 위치를 알 수 있다. 만약 센터 스피커가 포함되지 않았다면, 센터 스피커에 포함될 소리를 재생하는 전면 좌 스피커와 전면 우 스피커를 허용함으로써 가상 센터 채널을 획득할 수 있다. 이 경우, 소리의 센터 영역에 유사한 게인 즉, g1, g2 를 주는 두 스피커를 허용함으로써, 가상 소스가 소리 상의 센 터 영역에 존재하는 효과를 얻을 수 있다. 사인 법칙 방정식에서 만약, g1, g2 가 유사한 값을 가진다면, 우변의 값은 거의 0이 된다. 따라서, sin φ 값은 0에 가까운 값을 가져야 하고, 즉, φ 은 0에 가까운 값을 가지며, 이에 의하여, 가상 음원은 센터에 위치하게 된다. 만약 가상 음원이 센터 영역에 위치한다면, 가상 센터 채널을 구성하는 두 채널 (예를 들어, 좌, 우 채널) 은 유사한 게인을 가지고, 센터 영역 (즉, 다이알로그 영역) 의 게인은 가상 센터 채널의 추정되는 신호의 게인 값을 조절함으로써 조절된다.
채널의 레벨 정보와 각 채널 사이의 상관 관계는 다이알로그를 포함할 것으로 가정되는 가상 센터 채널 신호의 추정에 사용될 수 있다. 예를 들어, 좌, 우 채널의 상관 관계가 낮다면 (예를 들어, 입력 신호가 소리 상의 어떠한 지점에 집중되어 있기보다는 넓게 퍼져있는 경우), 상기 신호는 다이알로그가 아닐 가능성이 증가한다. 역으로, 상기 좌, 우 채널의 상관 관계가 높다면 (예를 들어, 입력 신호가 공간의 한 지점에 집중되어 있다면), 상기 신호는 다이알로그 또는 음향 효과 (예를 들어, 문닫는 소리) 일 가능성이 증가한다.
이처럼, 상기 채널의 레벨 정보와, 상기 채널 사이의 상관 관계를 함께 사용하면 다이알로그를 효과적으로 추정할 수 있다. 다이알로그의 주파수 대역은 100 Hz 에서 8 KHz가 일반적이기 때문에, 이 주파수 대역에서 추가적인 정보를 이용하여 다이알로그를 추정할 수 있다.
일반적인 복수 채널의 오디오 신호는 다이알로그, 음악, 음향 효과와 같은 다양한 신호를 포함할 수 있다. 이에 따라 다이알로그를 추정하기 전에 전송된 신 호가 다이알로그인지, 음악인지, 아니면 다른 신호인지 결정하는 분류기를 배치하여 다이알로그의 추정 효율을 향상시킬 수 있다. 상기 분류기는 참조된 도 5A 내지 5C에 도시된 바와 같이 다이알로그의 추정이 이루어진 후에 적용될 수도 있다.
시간 도메인 (Time Domain) 에서의 조절
도 2는 다이알로그 추정기 (200) 와 오디오 컨트롤러 (202) 의 예를 도시한 블럭도이다. 도 2에서 도시된 바와 같이 다이알로그는 입력 신호를 이용하여 다이알로그 추정기 (200) 에서 추정된다. 소정의 게인 (예를 들어, 사용자에 의하여 설정된) 은 상기 오디오 컨트롤러 (202) 를 이용하여 추정되는 다이알로그에 적용될 수 있고 그것에 의하여 출력을 획득한다. 게인을 조절하기 위한 추가적인 정보는 다이알로그 추정기 (200) 에서 생성될 수 있다. 사용자 조절 정보는 다이알로그 볼륨 조절 정보를 포함할 수 있다. 오디오 신호는 음악, 다이알로그, 반향음 (reverberation), 및 배경 잡음을 확인하기 위해 분석될 수 있고, 이러한 신호의 레벨과 특성은 상기 오디오 컨트롤러 (202) 에 의하여 조절될 수 있다.
서브밴드 (Subband) 기반 처리
도 3은 입력 신호의 다이알로그를 강화하는 다이알로그 추정기 (302) 와 오디오 컨트롤러 (304), 오디오 신호에서 서브밴드를 생성하는 분석 필터뱅크(analysis filterbank:300) 및 서브밴드로부터 오디오 신호를 합성하는 합성 필터뱅크 (synthesis filterbank;306) 를 포함하는 예를 도시한 블럭도이다. 입력 오 디오 신호의 전체 대역에 대해 다이알로그를 추정하거나 조절하는 것보다는 일부 예에서는 입력 오디오 신호를 상기 분석 필터뱅크 (300) 를 통해 복수의 서브밴드로 분할하고, 각 서브밴드별로 상기 다이알로그 추정기 (302) 를 통해 다이알로그를 추정하는 것이 보다 효율적이다. 몇몇 경우는 다이알로그가 입력되는 오디오 신호의 특정 주파수 대역에 집중될 수도 있고, 특정 주파수 대역에는 존재하지 않을 수도 있다. 이러한 경우 다이알로그를 포함하는 입력 오디오 신호의 주파수 대역만이 다이알로그 영역을 추정하는데 사용될 수 있다. 서브밴드 신호를 획득하는데에는 폴리페이즈 (polyphase) 필터뱅크, 쿼드러쳐 미러 (quadrature mirror) 필터뱅크 (QMF), 하이브리드 (hybrid) 필터뱅크, 이산 여현 변환 (discrete Fourier transform;DFT), 수정 이산 여현 변환 (modified discrete cosine transform;MDCT) 등을 포함하나 이에 제한되지 않으며 다양한 공지된 방법이 사용될 수 있다.
일부 실시예에 있어서, 다이알로그는 제 1복수 채널의 오디오 신호를 필터링하여 좌, 우 채널 신호를 제공하고; 상기 좌, 우 채널 신호를 주파수 도메인으로 변환하고; 변환된 좌, 우 채널 신호를 이용하여 다이알로그를 추정함으로써, 추정될 수 있다.
분류기 (Classifier) 의 이용
도 4는 오디오 신호에 포함된 오디오 컨텐츠 (content) 를 분류하는 분류기를 포함하며, 입력 신호의 다이알로그를 강화하는 다이알로그 추정기 (402) 및 오디오 컨트롤러 (404) 의 예를 도시한 블럭도이다. 일부 실시예에 있어서, 상기 분 류기 (400) 는 입력 오디오의 통계적 또는 지각적 특성을 분석하여 입력되는 오디오 신호를 카테고리별 (categories) 로 분류하는데 사용될 수 있다. 예를 들어, 상기 분류기 (400) 는 입력 오디오 신호가 다이알로그, 음악, 음향 효과 또는 묵음 (mute) 인지 여부를 결정할 수 있고, 결정된 결과를 출력할 수 있다. 또 다른 예로, 상기 분류기 (400) 는 2007년 9월 14일 출원된 미국 특허 출원 번호 "Dialogue Enhancement Technique (다이알로그 증폭 기술) ", 대리인 관리번호 19819-120001 에 개시된 바와 같이 교차 상호 관계 (cross-correlation) 를 이용하여 모노 또는 모노 유사 오디오 신호를 대체적으로 검출하는데 사용될 수 있다. 이 기술을 이용하여, 다이알로그 증폭 기술은 입력 오디오 신호가 실질적으로 상기 분류기 (400) 의 출력에 기반한 모노가 아닌 경우, 입력 오디오 신호에 적용될 수 있다.
상기 분류기 (400) 의 출력을 다이알로그 또는 음악과 같은 출력으로 결정하는 것은 힘든 결정일 수 있으나, 출력을 입력 오디오 신호에 다이알로그가 포함되었을 확률 (probability) 또는 비율 (percentage) 과 같이 결정하는 것은 쉬운 결정일 수 있다. 분류기들의 예로 네이브 베이즈 분류기 (naive Bayes classifiers), 베이스 네트워크 (Bayesian networks), 선형 분류기 (linear classifiers), 베이스 인터페이스 (Bayesian inference), 퍼지 이론 (fuzzy logic), 기호 논리 회기(logistic regression), 신경 네트워크 (neural networks), 예측 분석학 (predictive analytics), 퍼셉트론 (perceptrons), SVMs (support vector machines) 등이 포함될 수 있으나, 이에 한정되는 것은 아니다.
도 5A 내지 5C는 다이알로그 증폭 프로세스 내의 분류기 (502) 의 다양한 구조 가능성을 보여주는 블럭도이다. 도 5A에서, 분류기 (502) 에 의하여 신호에 다이알로그가 포함되었다고 결정되면, 504, 506, 508 및 510 의 순차적인 프로세스 단계가 수행되고, 신호에 다이알로그가 포함되지 않았다고 결정되면, 상기 순차적인 프로세스 단계는 생략될 수 있다. 만약 상기 사용자 조절 정보가 상기 다이알로그보다 오디오 신호의 볼륨과 관련된 경우 (예를 들어, 상기 다이알로그 볼륨이 유지되는 동안 상기 음악 볼륨이 커질 경우), 상기 분류기 (502) 는 상기 신호가 음악 신호임을 결정하고, 상기 음악 볼륨은 504, 506, 508, 510 의 순차적인 단계를 통해 조절될 수 있다.
도 5B에서, 상기 분류기 (502) 는 상기 분석 필터뱅크 (504) 후에 적용된다. 상기 분류기 (502) 는 어떤 시점에서 주파수 대역에 따라 분류된 (서브밴드들) 서로 다른 출력을 가질 수 있다. 사용자 조절 정보에 따라 재생되는 상기 오디오 신호의 상기 특성들 (예를 들어, 상기 다이알로그 볼륨의 증폭, 반향음 (reverberation) 의 감쇄 등) 은 조절될 수 있다.
도 5C에서, 상기 분류기 (502) 는 상기 다이알로그 추정기 (506) 후에 적용된다. 이 구조는 상기 음악 신호가 소리 상의 센터에 집중되어 있고, 다이알로그 영역이 인식되지 않을 경우 효율적일 수 있다. 예를 들어, 상기 분류기 (502) 는 상기 추정되는 가상 센터 채널 신호가 음성 (speech) 성분 신호를 포함하는지 결정할 수 있다. 만약 상기 가상 센터 채널 신호가 음성 성분 신호를 포함하는 경우, 게인이 추정되는 가상 센터 채널 신호에 적용될 수 있다. 만약 상기 추정되는 가상 센터 채널 신호가 음악, 또는 다른 비음성 (non-speech) 성분으로 분류될 경우 게인은 적용되지 않을 수 있다. 이밖에 분류기와 관련된 다른 구조도 가능하다.
자동 다이알로그 볼륨 조절 기능
도 6은 자동 조절 정보 생성기 (608) 를 포함하는 다이알로그 증폭 시스템을 예시하는 블럭도이다. 도 6에서, 설명의 편의를 위하여, 상기 분류기 블록은 도시되지 않았다. 그러나, 도 4-5 에서와 같이 도 6에 분류기가 포함될 수 있음은 자명하다. 상기 분석 필터뱅크 (600) 와 합성 필터뱅크 (606) (역 변환) 는 서브밴드가 사용되지 않을 경우 포함되지 않을 수 있다.
일부 실시예에 있어, 상기 자동 조절 정보 생성기 (608) 는 가상 센터 채널 신호와 복수 채널 오디오 신호의 비율을 비교한다. 만약, 상기 비율이 제 1임계값 (threshold value) 보다 낮을 경우, 상기 가상 센터 채널 신호는 증폭될 수 있다. 만약 상기 비율이 제 2임계값보다 높을 경우 상기 가상 센터 채널 신호는 감쇄될 수 있다. 예를 들어, 상기 P_dialogue 가 상기 다이알로그 영역 신호의 상기 레벨을 표시하고, P_input 이 상기 입력 신호의 상기 레벨을 표시할 경우, 상기 게인은 아래 방정식에 의하여 자동적으로 보정될 수 있다.
Figure 112009021730613-PCT00011
Figure 112009021730613-PCT00012
여기서, 상기 P_ratio 는 P_dialogue/P_input로 정의되고, P_threshold 는 기결정된 값이며, 그리고 G_dialogue 는 상기 다이알로그 영역 (이전에 설명되었던 G_center 와 동일한 개념임) 에 적용되는 게인 값이다. P_threshold 는 사용자(남성/여성)의 취향에 따라 상기 사용자에 의해 설정될 수 있다.
다른 실시예에 있어, 상기 상대적인 레벨은 아래의 방정식을 이용하여 기 결정된 값보다 작게 유지될 수 있다.
Figure 112009021730613-PCT00013
Figure 112009021730613-PCT00014
상기 자동 조절 정보의 생성은, 재생된 오디오 신호에 따라 사용자가 원하는 상대적인 값의 다이알로그 볼륨뿐만 아니라, 상기 배경 음악의 볼륨, 반향음의 볼륨 및 공간의 큐 (cue) 를 지속시킨다. 예를 들어, 상기 사용자는 시끄러운 환경 하에서는 상기 전송된 신호에 비하여 높은 볼륨의 다이알로그를 청취할 수 있으며, 조용한 환경 하에서는 상기 전송된 신호에 비하여 같거나 작은 볼륨으로 다이알로그를 청취할 수 있다.
상기 다이알로그의 볼륨을 효율적으로 조절하는 방법
일부 실시예에 있어서, 사용자에 의해서 조절되는 정보를 상기 사용자로 되돌리는 컨트롤러 및 방법이 설명된다. 예를 들어, 설명의 편의를 위하여 텔레비전 수상기의 리모콘 (remote controller) 이 기술된다. 그러나, 상기 개시된 실시예는 오디오 장치의 리모콘, 디지털 멀티미디어 방송 (DMB) 플레이어, 포터블 미디어 플레이어 (PMP), DVD 플레이어, 자동차 오디오 플레이어, 텔레비전 수신기 및 오디오 장치를 조절하는 방법에 적용될 수 있음이 자명하다.
독립적인 조절 장치의 구조 #1
도 7은 다이알로그 볼륨을 조정하기 위한 개별적인 입력 신호 조정부 (예를 들어, 키, 버튼) 를 포함하여, 다이알로그 볼륨을 처리할 수 있는 일반적인 텔레비전 수신기 또는 다른 장치와의 통신을 수행하는 리모콘을 나타낸 예시도이다.
도 7에 도시된 바와 같이, 상기 리모콘 (700) 은 채널을 제어 (예를 들어, 정보 탐색 (surfing) ) 할 수 있는 채널 조절 키 (702) 와, 주 음량 (예를 들어, 전체 신호의 볼륨) 을 키우거나 줄이는 주 음량 조절 키 (704) 를 포함한다. 또한, 예를 들어, 도 4-5를 참조하여 설명된 바와 같이, 예를 들어, 다이알로그 추정기를 통하여 계산되는 다이알로그 신호와 같은 특정 오디오 신호의 볼륨을 키우거나 줄이는 다이알로그 볼륨 조절 키 (706) 를 포함한다.
일부 실시예에 있어서, 상기 리모콘 (700) 은 2007년 9월 14일 출원된 미국 특허 출원 번호 ,"Dialogue Enhancement Technique", 대리인 관리 번호 19819-120001 에 설명된 다이알로그 증폭 기술과 함께 사용될 수 있다. 이 경우 상기 리모콘 (700) 은 소정의 게인 Gd 및/또는 게인 팩터 g (i,k) 를 제공할 수 있다. 다이알로그 볼륨을 조절하는데 개별적인 다이알로그 볼륨 조절 키 (706) 를 사 용함으로써, 사용자가 리모콘 (700) 을 이용하여 다이알로그의 볼륨만을 편리하고 효율적으로 조절하는 것이 가능하다.
도 8은 오디오 신호의 주 음량과 다이알로그 볼륨을 조절하는 프로세스를 나타내는 블럭도이다. 설명의 편의를 위하여, 도 2-10를 참조하여 설명된 다이알로그 증폭 프로세스 단계는 생략되며, 필요한 구성요소만 도 8에 개시된다. 예를 들어, 도 8의 구조에서, 다이알로그 추정기 (800) 는 오디오 신호를 수신하고, 센터, 좌, 우 채널 신호를 추정한다. 상기 센터 채널 (예를 들어, 추정된 다이알로그 영역) 은 증폭기 (810) 로 입력되고, 좌, 우 채널은 합성기 (812, 814) 를 이용하여 증폭기 (810) 의 출력 신호와 각각 더해진다. 상기 합성기 (812, 814) 의 출력 신호는 좌, 우 채널 (주 음량) 의 볼륨을 각각 조절하기 위하여 증폭기 (816, 818) 로 각각 입력된다.
일부 실시예에 있어서, 상기 다이알로그 볼륨은 다이알로그 게인 팩터 G_Dialogue 를 출력하는 게인 생성기 (806) 와 결합되는 다이알로그 볼륨 조절 키 (802) 에 의하여 조절될 수 있다. 상기 좌, 우 볼륨은 마스터 게인 G_Master 를 제공하는 게인 생성기 (808) 와 결합되는 주 음량 조절 키 (804) 에 의하여 조절될 수 있다. 상기 게인 팩터 G_Dialogue와 G_Master는 다이알로그과 주 음량의 게인을 조정하기 위해 증폭기 (810, 816, 818) 에서 사용될 수 있다.
독립적인 조절 장치의 구조 #2
도 9는 채널 조절 키 (902), 볼륨 조절 키 (904) 와, 다이알로그 볼륨 조절 선택 키 (906) 를 포함하는 리모콘 (900) 을 나타낸 예시도이다. 상기 다이알로그 볼륨 조절 선택 키 (906) 는 다이알로그 볼륨 조절 기능을 켜거나 끌 때 사용된다. 만약 상기 다이알로그 볼륨 조절 선택 기능이 켜질 경우, 다이알로그 영역의 신호 볼륨은 볼륨 조절 키 (904) 를 이용하여 단계적인 방법 (예를 들어, 점진적으로) 으로 증가되거나 감소될 수 있다. 예를 들어, 다이알로그 볼륨 조절 선택 키 (906) 가 눌려지거나, 다른 방법으로 작동되어 상기 다이알로그 볼륨 조절 기능이 동작할 경우, 상기 다이알로그 영역 신호는 기 설정된 게인 값 (예를 들어, 6dB) 으로 증가할 수 있다. 만약 상기 다이알로그 볼륨 조절 선택 키 (906) 가 다시 눌려지는 경우, 상기 볼륨 조절 키 (904) 는 주 음량을 조절하는데 사용될 수 있다.
선택적으로, 상기 다이알로그 볼륨 조절 선택 키 (906) 가 켜질 경우, 도 6을 참조하여 설명된 바와 같이 자동 다이알로그 조절 기능 (예를 들어, 자동 조절 정보 생성기 (608) ) 이 동작할 수 있다. 상기 볼륨 조절 키 (904) 가 눌려지거나, 다른 방법으로 작동되는 때에 상기 다이알로그 게인은 예를 들어, 0, 3 dB, 6 dB, 12 dB 그리고 0 의 순서로 일정 단위별로 연속적으로 증가하면서 순환되게 작동할 수 있다. 이와 같은 조절 방법은 사용자가 다이알로그 볼륨을 직관적으로 조절할 수 있도록 한다.
상기 리모콘 (900) 은 다이알로그 볼륨을 조절하는 장치의 일 예이다. 다른 장치로 터치 방식 (touch-sensitive) 의 디스플레이 장치를 포함할 수 있으나 이에 한정되지는 않는다. 상기 리모콘 (900) 은 다이알로그 게인을 조절하기 위해 공지된 통신 채널 ( 예를 들어, 적외선, 라디오 주파수, 케이블) 을 이용하여 어떠한 미디어 장치 (예를 들어, 텔레비전 미디어 플레이어, 컴퓨터, 휴대폰 (mobile phone), 셋톱 (set-top) 박스, DVD 플레이어) 와도 통신할 수 있다.
일부 실시예에 있어서, 상기 다이알로그 볼륨 조절 선택 키 (906) 가 켜질 때, 상기 선택 사항이 스크린에 출력되거나, 다이알로그 볼륨 조절 선택 키 (906) 의 색상이나 상징이 변하거나, 볼륨 조절 키 (904) 의 색상이나 상징이 변화하거나, 및/또는 다이알로그 볼륨 조절 선택 키 (906) 의 높이가 변하는 등의 방법으로 볼륨 조절 키 (904) 의 기능이 변했음을 사용자에게 통지할 수 있다. 소리 또는 힘을 피드백하거나, 리모콘 화면 또는 텔레비전 스크린, 모니터 등에 텍스트 메시지나 그래픽을 현시하는 방법과 같은, 리모콘에서의 선택을 사용자에게 알려주는 다른 다양한 방법 역시 구현 가능하다.
이와 같은 조절 방법의 이점은 사용자가 볼륨을 직관적으로 조절할 수 있고, 다이알로그, 배경 음악, 반향음 등과 같은 오디오 신호의 다양한 특성을 조절하기 위해 상기 리모콘에서 많은 수의 버튼과 키가 증가하는 것을 방지할 수 있다는 점이다. 다양한 오디오 신호들이 제어될 때, 조절되어야 하는 오디오 신호의 특별한 성분 신호는 상기 다이알로그 볼륨 조절 선택 키 (906) 를 이용하여 선택될 수 있다. 이러한 성분 신호는 다이알로그 신호, 배경 음악, 음향 효과 등을 포함할 수 있으며, 이에 한정되지 않는다.
사용자에게 조절 정보를 통지하는 방법
OSD 를 이용한 방법 #1
아래 예에서, 텔레비전 수신기의 OSD (On Screen Display) 가 설명된다. 그러나 본 발명은 증폭기의 OSD, PMP의 OSD, 증폭기/PMP의 LDC 창 등과 같이 장치의 상태를 출력할 수 있는 미디어의 다른 형태에 적용될 수 있음은 자명하다.
도 10은 일반적인 텔레비전 수상기 (1002) 의 OSD (1000) 를 나타낸다. 다이알로그 볼륨 내의 변화는 숫자로 표현되거나, 도 12에 도시된 바와 같이 틀 (1004) 형태로 표현될 수 있다. 일부 실시예에 있어서, 다이알로그 볼륨은 상대적인 레벨 (도 10) 이나 도 11에 나타난 바와 같이 주 음량 또는 타 성분 신호와의 비율로 출력될 수 있다.
도 11은 주 음량과 다이알로그 볼륨의 도식적인 객체 (예를 들어, 틀, 라인) 를 디스플레이하는 방법을 예시한다. 도 11의 예에서, 상기 틀은 주 음량을 가리키고, 틀의 중간 영역에 그려진 라인의 길이는 다이알로그 볼륨의 레벨을 가리킨다. 예를 들어, 틀 (1100) 안에 있는 라인 (1106) 은 사용자에게 다이알로그 볼륨이 조절되지 않았음을 알려준다. 만약 볼륨이 조절되지 않았다면, 상기 다이알로그 볼륨은 주 음원과 동일한 값을 가지게 된다. 틀 (1102) 안에 있는 상기 라인 (1108) 은 사용자에게 상기 다이알로그 볼륨이 키워졌음을 알려주며, 틀 (1104) 안에 있는 상기 라인 (1110) 은 사용자에게 상기 다이알로그 볼륨이 줄어들었음을 알려준다.
도 11을 참조하여 기술된 출력 방법은 사용자가 상기 다이알로그 볼륨의 상대적인 값을 알 수 있기 때문에 상기 다이알로그 볼륨을 보다 효율적으로 조절할 수 있다는 장점이 있다. 게다가, 다이알로그 볼륨 틀이 주 음량 틀과 함께 출력되므로 OSD (1000) 를 효율적이고 일관성 있게 구현할 수 있다.
상기 개시된 실시예는 도 11에서 보인 바와 같이 틀 형식의 출력에 제한되지 않는다. 이 보다는 주 음량과 조절되어야 하는 특정 볼륨 (예를 들어, 상기 다이알로그 볼륨) 을 동시에 출력하거나, 조절되어야 하는 볼륨과 주 음량 사이의 상대적인 대비를 제공하는 어떠한 도식적인 객체가 사용될 수 있다. 예를 들어, 두 개의 틀들이 개별적으로 현시되거나 서로 다른 색상 및/또는 넓이를 가진 오버랩 (overlapping) 된 틀이 같이 출력될 수 있다.
조절되는 볼륨의 형식의 수가 둘 이상일 경우, 상기 볼륨은 위에서 직접 설명한 방법에 따라 출력될 수 있다. 그러나, 조절되는 볼륨의 형식의 수가 셋 이상일 경우, 사용자의 혼동을 방지하기 위해 현재 조절되는 볼륨 정보만을 출력하는 방법이 사용될 수 있다. 예를 들어, 만일 반향음 볼륨 및 다이알로그 볼륨이 조절될 수 있지만, 다이알로그가 현재 크기로 유지되는 동안 반향음의 볼륨만 조절되는 경우에는, 예를 들어, 앞서 서술된 방법을 이용하여 주 음량과 반향음의 볼륨만 표시된다. 본 예에서, 상기 주 음량과 반향음의 볼륨은 서로 다른 색상 또는 모양을 가져 직관적으로 확인될 수 있도록 하는 것이 보다 바람직하다.
OSD 를 이용한 방법 #2
도 12는 장치 (1200) (예를 들어, 텔레비전 수신기) 의 OSD (1202) 에 다이알로그 볼륨을 표시하는 방법의 예를 도시한 도면이다. 일부 실시예에 있어서, 다이알로그 레벨 정보 (1206) 는 볼륨 틀 (1204) 과 별개로 출력될 수 있다. 상기 다이알로그 레벨 정보 (1206) 는 다양한 사이즈, 폰트, 색상, 밝기 레벨, 번쩍임 또 는 또 다른 시각적 장식 또는 표지로 출력될 수 있다. 이러한 출력 방법은 도 9를 참조하여 설명되었듯이 상기 볼륨이 단계적으로 순환되도록 조절될 때 보다 효과적으로 사용될 수 있다. 일부 실시예에 있어서, 다이알로그 볼륨은 상대적인 레벨, 또는 상기 주 음량 또는 타 성분 신호와의 비로 출력될 수 있다.
도 13에 보이는 바와 같이, 다이알로그 볼륨의 분리 지시기 (1306) 는 장치 (1300) 의 OSD (1302) 에서 조절되는 볼륨의 형태를 출력하는 것 대신 또는 이에 추가적으로 사용될 수 있다. 이러한 출력 방식의 장점은 스크린에서 보여지는 컨텐츠가 현시되는 볼륨 정보에 의하여 비교적 덜 영향 (예를 들어, 분명하지 않은) 을 받는다는 것이다.
조절 장치의 출력
일부 실시예에 있어서, 상기 다이알로그 볼륨 조절 선택 키 (906) (도 9) 가 선택될 때, 볼륨키의 기능이 변화하였음을 사용자에 통지하기 위하여 상기 다이알로그 볼륨 조절 선택 키 (906) 의 색상이 변화할 수 있다. 선택적으로, 상기 다이알로그 볼륨 조절 선택 키 (906) 가 활성화될 때 상기 볼륨 조절 키 (904) 의 색상이나 높이를 변화시키는 것이 사용될 수 있다.
디지털 텔레비전 시스템 예
도 14는 도 1-14를 참조하여 기술된 기능과 프로세스가 수행되는 디지털 텔레비전 시스템 (1400) 의 예를 도시한 블럭도이다. 디지털 텔레비전 (DTV) 은 디지 털 신호의 수단에 의해 동영상 및 소리를 수신하고 방송하는 원격 통신 시스템이다. 디지털 텔레비전은 디지털적으로 압축되고 특별히 디자인된 텔레비전 세트, 또는 셋톱 박스가 구비된 표준 수신기, 또는 텔레비전 카드가 구비된 PC에 의하여 복호화될 것이 요구되는 디지털 변조 데이터를 사용한다. 비록 도 14의 시스템이 디지털 텔레비전 시스템에 관한 것이지만, 상기 다이알로그 증폭을 위해 개시된 실시예들은 다이알로그 증폭이 필요한 아날로그 텔레비전 시스템 또는 여타 다른 시스템에 적용될 수 있다.
일부 실시예에 있어서, 상기 시스템 (1400) 은 인터페이스 (1402), 디모듈레이터 (1404), 디코더 (1406), 및 오디오/비디오 출력부 (1408), 사용자 입력 인터페이스 (1410), 하나 또는 그 이상의 프로세서 (1412) (예를 들어, Intel® processors), 하나 또는 그 이상의 컴퓨터로 판독가능한 매체 (1414) (예를 들어, 램 (RAM), 롬 (ROM), 에스디램 (SDRAM), 하드 디스크 (hard disk), 광 디스크 (optical disk), 플래쉬 메모리 (flash memory), SAN 등) 을 포함할 수 있다. 각각의 이러한 요소들은 하나 또는 그 이상의 통신 채널 (1416) (예를 들어, 버스) 과 결합한다. 일부 실시예에 있어서, 상기 인터페이스 (1402) 는 오디오 신호 또는 결합된 오디오/비디오 신호를 획득하기 위한 다양한 회로를 포함한다. 예를 들어, 아날로그 텔레비전 시스템에서 인터페이스는 안테나 장치, 튜너, 또는 믹서, 라디오 주파수 (RF) 증폭기, 로컬 오실레이터 (local oscillator), IF (intermediate frequency) 증폭기, 하나 또는 그 이상의 필터, 디모듈레이터, 오디오 증폭기 등을 포함할 수 있다. 이에 부가되거나 한정되는 구성요소를 갖는 실시예를 포함하는 시 스템 (1400) 의 또 다른 실시예의 구현이 가능하다.
상기 튜너 (1402) 는 비디오와 오디오 컨텐츠를 포함하는 디지털 텔레비전 신호를 수신하는 디지털 텔레비전 튜너일 수 있다. 상기 디모듈레이터 (1404) 는 상기 디지털 텔레비전 신호로부터 비디오 및 오디오 신호를 추출한다. 비디오와 오디오 신호가 부호화되었을 경우 (예를 들어, MPEG 부호화), 상기 디코더 (1406) 는 그러한 신호를 복호화한다. 상기 오디오/비디오 출력은 비디오를 출력하고, 오디오를 재생시킬 수 있는 어떠한 장치 (예를 들어, 텔레비전 디스플레이, 컴퓨터 모니터, LCD, 스피커, 오디오 시스템) 에서도 출력될 수 있다.
일부 실시예에 있어서, 상기 사용자 입력 인터페이스는 리모콘 (예를 들어, 도 9의 리모콘 (900) ) 으로부터 생성된 적외선 통신 또는 무선 통신 신호를 수신하여 복호화하는 회로 소자 및/또는 소프트웨어를 포함할 수 있다.
일부 실시예에 있어서, 상기 하나 또는 그 이상의 프로세서는 도 1-13를 참조하여 서술된 바와 같이 상기 특성과 기능 (1418, 1420, 1422, 및 1426) 을 수행하는 상기 컴퓨터로 판독 가능한 매체 (1414) 에 저장되어 있는 코드를 수행할 수 있다.
상기 컴퓨터로 판독 가능한 매체는 운영체제 (1418), 분석/합성 필터뱅크 (1420), 다이알로그 추정기 (1422), 분류기 (1424) 및 자동 정보 생성기 (1426) 를 더 포함한다. 상기 "컴퓨터로 판독 가능한 매체" 용어는 비휘발성 매체 (예를 들어, 광학 또는 자기 디스크), 휘발성 매체 (예를 들어, 메모리), 및 전송 매체를 포함하나 이에 한정되지 않으며, 실행을 위해 프로세서 (1412) 로 명령을 제공하는 데 관계된 어떠한 매체를 의미한다. 전송 매체는 동축 케이블, 구리선 및 광섬유를 포함하나 이에 한정되지 않는다. 전송 매체는 상기 음향, 광선 또는 라디오 주파수 파동 형태를 수신할 수 있다.
상기 운영체제 (1418) 는 다중 사용자 (multi-user), 멀티프로세싱 (multiprocessing), 멀티태스킹 (multitasking), 멀티스래딩 (multithreading), 실시간 (real time) 등이 가능하다. 상기 운영체제 (1418) 는 상기 사용자 입력 인터페이스 (1410) 로부터의 입력 신호 인식; 트랙 유지 및, 컴퓨터로 판독 가능한 매체 (1414) (예를 들어, 메모리 또는 저장 장치) 에서의 파일 또는 디렉토리 (directories) 관리; 주변 장치의 제어; 및 상기 하나 또는 그 이상의 통신 채널 (1416) 의 소통 관리를 포함하나 이에 한정되지 않는 기본적인 기능을 수행한다.
상기 설명된 특성은 적어도 하나 이상의 입력 장치와 출력 장치를 가지는 데이터 저장 시스템으로부터 데이터 및 명령을 수신하고, 데이터 및 명령을 전송하는 적어도 하나 이상의 프로그램화 될 수 있는 프로세서를 포함하는 프로그래밍 시스템에서 실행될 수 있는 하나 또는 그 이상의 컴퓨터 프로그램에서 유리하게 수행될 수 있다. 컴퓨터 프로그램은 특정 행위를 수행하거나 특정 결과를 야기하는 컴퓨터에서 직접 또는 간접적으로 사용될 수 있는 명령의 집합이다. 컴퓨터 프로그램은 컴파일 또는 기계어 (interpreted languages) 를 포함한 어떠한 프로그래밍 언어 (예를 들어, Objective-C, Java) 로도 쓰일 수 있고, 독립된 프로그램과 같은 형태, 또는 모듈과 성분 (component) 과 서브루틴 (subroutine) 의 형태, 또는 컴퓨터 환경 하에서 사용자에 적정한 다른 유닛을 포함하는 어떠한 형태로도 구성될 수 있다.
상기 명령의 프로그램의 수행을 위한 적정한 프로세서는 예를 들어, 어떠한 종류의 컴퓨터의 일반적 또는 특별한 목적의 마이크로프로세서 (microprocessors) 뿐만 아니라 단독 프로세서 또는 멀티플 프로세서 또는 코어 (cores) 를 포함한다. 일반적으로 프로세서는 ROM (read-only memory), RAM (random access memory) 또는 이 둘 모두로부터 명령 및 데이터를 수신한다. 상기 컴퓨터의 필수 요소는 명령을 수행하는 프로세서와, 명령 및 데이터를 저장하기 위한 하나 또는 그 이상의 메모리이다. 일반적으로, 컴퓨터는 데이터 파일을 저장하기 위한 하나 또는 그 이상의 대용량 저장 장치를 포함하거나, 통신하여 동작가능하도록 연결된다. 이러한 저장 장치는 내부 하드 디스크와 데이터 삭제 가능 디스크와 같은 자기 디스크, 자기 광 디스크, 및 광 디스크를 포함한다. 컴퓨터 프로그램 명령 및 데이터를 실체적으로 구체화하는데 적합한 저장 장치는 비휘발성 메모리의 모든 형태, 예로 들어, EPROM, EEPROM, 플래쉬 메모리 장치와 같은 반도체 메모리 장치, 내부 하드 디스크와 데이터 삭제 가능 디스크와 같은 자기 디스크, 자기 광 디스크, 및 CD-ROM, DVD-ROM 디스크를 포함한다. 상기 프로세서와 메모리는 ASICS (application-specific integrated circuits) 에 의하여 또는 ASICS와 일체화되어 보강될 수 있다.
사용자와의 상호 작용을 제공하기 위해 상기 특성들은 상기 사용자에게 정보를 출력하는 CRT (cathode ray tube) 또는 LCD (liquid crystal display) 모니터와 같은 디스플레이 장치와 사용자가 컴퓨터에 명령을 입력할 수 있는 키보드 및 마우 스 또는 트랙볼 (trackball) 과 같은 포인팅 장치가 구비된 컴퓨터에서 실행될 수 있다.
상기 특성들은 데이터 서버 (data server) 와 같은 백 앤드 컴포넌트 (back-end component) 를 포함하거나, 어플리케이션 서버 (application server) 또는 인터넷 서버 (Internet server) 와 같은 미들웨어 컴포넌트 (middleware component) 를 포함하거나, 도식적인 사용자 인터페이스 또는 인터넷 브라우져 (Internet browser) 또는 이들의 결합을 구비하는 클라이언트 컴퓨터 (client computer) 와 같은 프론트 앤드 컴포넌트 (front-end component) 를 포함하는 컴퓨터 시스템에서 실행될 수 있다. 상기 시스템의 성분들은 통신 네트워크와 같은 디지털 데이터 통신의 어떠한 형태 또는 매체와 연결될 수 있다. 통신 네트워크의 예로 LAN, WAN 등을 포함하고, 상기 컴퓨터와 네트워크는 인터넷을 구성한다.
상기 컴퓨터 시스템은 클라이언트와 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 원거리에 떨어져 있으며, 대체로 네트워크를 통하여 상호 통신한다. 상기 클라이언트와 서버의 관계는 각각의 컴퓨터에서 동작하고, 서로 클라이언트 서버 관계를 가지는 컴퓨터 프로그램의 영향으로 이루어진다.
많은 수의 실시예가 설명되었다. 그럼에도 불구하고, 다양한 변형예가 만들어질 수 있음을 이해하여야 한다. 예를 들어, 하나 또는 그 이상의 실시예를 구성하는 구성요소는 다른 실시예를 형성하기 위해 결합되거나, 생략되거나, 변형되거나, 또는 추가될 수 있다. 다른 예로서, 도면에 묘사된 논리 플로우는 원하는 결과를 얻기 위해 보여진 특별한 순서나 순차적인 순서가 요구되지는 않는다. 이에 더 하여, 설명된 플로우에서 다른 단계가 추가될 수 있고, 단계가 생략될 수도 있으며, 설명된 시스템에서 다른 성분이 추가되거나 생략될 수도 있다. 따라서, 다른 실시예 역시 아래 청구항의 권리 범위 내에서 포함된다.
도 1은 두 스피커를 사용하여 가상 음원의 위치의 함수로서 채널 게인을 나타내는 모델을 도시한 도면이다.
도 2는 입력 신호의 다이알로그를 증폭하기 위한 다이알로그 추정기와 오디오 컨트롤러의 예를 도시한 블록도이다.
도 3은 필터뱅크 및 역변환을 포함하고, 입력 신호의 다이알로그를 강화하는 다이알로그 추정기와 오디오 컨트롤러의 예를 도시한 블록도이다.
도 4는 오디오 신호 또는 추정된 다이알로그에 포함된 컴포넌트 신호를 분류하는 분류기를 포함하고, 입력 신호의 다이알로그를 강화하는 다이알로그 추정기와 오디오 컨트롤러의 예를 도시한 블록도이다.
도 5a 내지 5c는 다이알로그 증폭 프로세스 내의 분류기의 다양한 배치 가능성을 보여주는 블록도이다.
도 6은 시간축에서 적용되는 분류기를 포함하는 다이알로그 증폭 시스템을 예시하는 블록도이다.
도 7은 다이알로그 볼륨을 조정하기 위한 개별적인 입력 신호 조정부를 포함하여, 다이알로그 볼륨을 처리할 수 있는 일반적인 텔레비전 수신기 또는 다른 장치와의 통신을 수행하는 리모콘을 나타낸 예시도이다.
도 8은 오디오 신호의 주 음량과 다이알로그 볼륨을 조절하는 시스템을 나타내는 블록도이다.
도 9는 다이알로그 볼륨을 켜거나 끌 수 있는 리모콘의 예를 도시하는 도면이다.
도 10은 다이알로그 볼륨 조절 정보를 출력하는 일반적인 텔레비전 수상기의 OSD를 예시하는 도면이다.
도 11은 다이알로그의 도식적인 객체를 디스플레이하는 방법을 예시하는 도면이다.
도 12는 디스플레이 장치에 다이알로그 볼륨 레벨과 다이알로그 볼륨 조절의 온/오프 상태를 예시하는 도면이다.
도 13은 조절되는 볼륨의 타입과 다이알로그 볼륨 조절의 온/오프 상태를 지시하는 분리 지시기를 도시하는 도면이다.
도 14는 도 1-14를 참조하여 설명된 기능과 프로세스가 수행되는 디지털 텔레비전 시스템의 예를 도시한 블럭도이다.

Claims (21)

  1. 다이알로그 볼륨 컨트롤부;
    주 음량 컨트롤부; 및
    상기 다이알로그 볼륨 컨트롤부 및 주 음량 컨트롤부와 동작 가능하도록 결합되고, 오디오 신호의 상기 다이알로그 볼륨 및 상기 주 음량을 각각 개별적으로 조절하기 위한 다이알로그 볼륨 조절 신호 및 주 음량 조절 신호를 개별적으로 생성하도록 구성되는 회로부를 포함하는 것을 특징으로 하는 장치.
  2. 제 1항에 있어서,
    상기 다이알로그 볼륨 조절 신호는 주 음량 레벨 또는 하나 이상의 다른 오디오 신호들의 음량 레벨에 비례하여 오디오 신호의 다이알로그 볼륨 레벨을 조정하기 위하여 이용되는 것을 특징으로 하는 장치.
  3. 제 1항 또는 제 2항에 있어서,
    상기 다이알로그 볼륨 조절 신호는 다이알로그 볼륨을 증폭하거나 감쇄시키는 것을 특징으로 하는 장치.
  4. 제 1항 내지 제 3항 중 어느 한 항에 있어서,
    상기 다이알로그 볼륨 컨트롤부와 사용자와의 상호작용에 대응하여 기 설정 된 양만큼 상기 오디오 신호의 상기 다이알로그 볼륨을 점진적으로 증가시키거나 감소시키는 것을 특징으로 하는 장치.
  5. 제 1항 내지 제 4항 중 어느 한 항에 있어서,
    상기 다이알로그 볼륨 컨트롤부 또는 주 음량 컨트롤부의 시각적 형태는 그것의 기능 또는 활성화를 나타내기 위하여 변형되는 것을 특징으로 하는 장치.
  6. 제 1항 내지 제 5항 중 어느 한 항에 있어서,
    상기 다이알로그 볼륨 컨트롤 신호는 시각적 피드백 신호를 제공하기 위하여 디스플레이 수단에 다이알로그 볼륨 레벨을 나타내는 하나 또는 그 이상의 도식적 객체를 생성하기 위하여 이용되는 것을 특징으로 하는 장치.
  7. 제 6항에 있어서,
    상기 제 1 도식적 객체는 주 음량 레벨을 나타내고, 제 2 도식적 객체는 주 음량 레벨 또는, 다른 오디오 신호의 볼륨 레벨에 대하여 상대적인 다이알로그 볼륨 레벨을 나타내는 것을 특징으로 하는 장치.
  8. 제 1항 내지 제 7항 중 어느 한 항에 있어서,
    상기 다이알로그 볼륨 조절 신호는 상기 다이알로그 볼륨 컨트롤부가 활성화되어 있다는 지시자를 생성하기 위하여 이용되는 것을 특징으로 하는 장치.
  9. 볼륨 컨트롤부;
    다이알로그 볼륨 조절 선택부; 및
    상기 볼륨 컨트롤부와 동작 가능하도록 결합되고, 상기 다이알로그 볼륨 조절 선택부가 활성화되었을 때, 다이알로그 볼륨 조절 신호를 생성하고, 상기 다이알로그 볼륨 조절 선택부가 활성화되지 않았을 때, 주 음량 조절 신호를 생성하도록 구성되는 회로부를 포함하는 것을 특징으로 하는 장치.
  10. 제 9항에 있어서,
    오디오 신호의 상기 다이알로그 볼륨은 상기 다이알로그 볼륨 컨트롤부와 사용자와의 상호작용에 대응하여 기 설정된 양만큼 점진적으로 증가하거나 감소하는 것을 특징으로 하는 장치.
  11. 제 9항 또는 제 10항에 있어서,
    상기 볼륨 컨트롤부 또는 상기 다이알로그 볼륨 조절 선택부의 시각적 형태는 그것의 동작 또는 활성화를 나타내기 위하여 변형되는 것을 특징으로 하는 장치.
  12. 제 9항 내지 제 11항 중 어느 한 항에 있어서,
    상기 다이알로그 볼륨 조절 신호는 장치 또는 다른 장치에 의해 출력되도록 다이알로그 볼륨 컨트롤부가 활성화되어 있다는 지시자를 생성하기 위해 이용되는 것을 특징으로 하는 장치.
  13. 제 1 볼륨 조절 신호를 수신하는 단계;
    제 2 볼륨 조절 신호를 수신하는 단계;
    상기 제 1 볼륨 조절 신호에 반응하여 제 1 볼륨 레벨을 나타내는 제 1 도식적 객체를 현시하는 단계; 및
    상기 제 2 볼륨 조절 신호에 반응하여 제 1 볼륨 레벨에 상대적인 제 2 볼륨 레벨을 나타내기 위하여 제 2 객체를 상기 제 1 도식적 객체에 포함되거나 인접하도록 현시하는 단계를 포함하는 것을 특징으로 하는 방법.
  14. 제 13항에 있어서,
    상기 제 1 도식적인 객체는 바 형태이고, 제 2 도식적인 객체는 상기 제 1 볼륨에 상대적인 상기 제 2 볼륨 레벨을 시각적으로 나타내도록 상기 바 내부에 뻗은 선인 것을 특징으로 하는 방법.
  15. 제 13항 또는 제 14항에 있어서,
    상기 제 1 볼륨 레벨은 복수 채널 오디오 신호의 주 음량 레벨이고, 상기 제 2 볼륨 레벨은 상기 주 음량 레벨에 상대적인 다이알로그 볼륨 레벨인 것을 특징으로 하는 방법.
  16. 복수 채널 오디오 신호를 획득하는 단계;
    상기 오디오 신호를 이용하여 센터 채널 신호와 최소한 좌, 우 채널 신호를 추정하는 단계;
    상기 다이알로그 볼륨 컨트롤부에서 생성된 게인 팩터를 이용하여 상기 센터 채널 신호의 제 1 게인을 수정하는 단계;
    상기 좌, 우 채널 신호와 상기 수정된 센터 채널 신호를 포함한 결합된 채널 신호를 생성하는 단계; 및
    주 음량 컨트롤부를 이용하여 상기 결합된 채널 신호의 제 2 게인을 수정하는 단계를 포함하는 것을 특징으로 하는 방법.
  17. 다이알로그 볼륨 조절 신호를 생성하도록 구성되는 컨트롤러; 및
    상기 다이알로그 볼륨 조절 신호를 수신하고, 상기 다이알로그 볼륨 조절 신호를 이용하기 위하여 상기 복수 채널 오디오 신호의 적어도 일부분의 볼륨 레벨을 수정하지 아니하고 텔레비전 수신기에 의해 처리된 복수 채널 오디오 신호의 다이알로그 볼륨 레벨을 수정하는 리시버를 포함하는 것을 특징으로 하는 시스템.
  18. 제 17항에 있어서,
    상기 리시버와 동작가능하도록 결합되며, 제 1 볼륨 레벨과 상기 제 1 볼륨 레벨에 상대적인 제 2 볼륨 레벨을 나타내는 하나 또는 그 이상의 도식적 객체를 현시하는 디스플레이부를 더 포함하는 것을 특징으로 하는 시스템.
  19. 제 18항에 있어서,
    상기 제 1 도식적인 객체는 바 형태이고, 제 2 도식적인 객체는 상기 제 1 볼륨에 상대적인 상기 제 2 볼륨 레벨을 시각적으로 나타내기 위하여 상기 바 내부에 뻗은 선인 것을 특징으로 하는 시스템.
  20. 제 18항 또는 제 19항에 있어서,
    상기 제 1 볼륨 레벨은 복수 채널 오디오 신호의 주 음량 레벨이고, 상기 제 2 볼륨 레벨은 상기 주 음량 레벨에 상대적인 다이알로그 볼륨 레벨인 것을 특징으로 하는 시스템.
  21. 제 17항 내지 제 20항 중 어느 한 항에 있어서,
    상기 컨트롤러는 ,
    대사 볼륨 컨트롤부; 및
    상기 볼륨 컨트롤부와 동작 가능하게 결합하고, 상기 다이알로그 볼륨 컨트롤부와 사용자와의 상호작용에 반응하여 상기 다이알로그 볼륨 조절 신호를 생성하는 회로부를 더 포함하는 것을 특징으로 하는 시스템.
KR1020097007409A 2006-09-14 2007-09-14 다이알로그 증폭 기술을 위한 컨트롤러 및 사용자 인터페이스 KR101061415B1 (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US84480606P 2006-09-14 2006-09-14
US60/844,806 2006-09-14
US88459407P 2007-01-11 2007-01-11
US60/884,594 2007-01-11
US94326807P 2007-06-11 2007-06-11
US60/943,268 2007-06-11
PCT/IB2007/003073 WO2008032209A2 (en) 2006-09-14 2007-09-14 Controller and user interface for dialogue enhancement techniques

Publications (2)

Publication Number Publication Date
KR20090074191A true KR20090074191A (ko) 2009-07-06
KR101061415B1 KR101061415B1 (ko) 2011-09-01

Family

ID=38853226

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020097007409A KR101061415B1 (ko) 2006-09-14 2007-09-14 다이알로그 증폭 기술을 위한 컨트롤러 및 사용자 인터페이스
KR1020097007408A KR101137359B1 (ko) 2006-09-14 2007-09-14 다이알로그 증폭 기술
KR1020097007407A KR101061132B1 (ko) 2006-09-14 2007-09-14 다이알로그 증폭 기술

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020097007408A KR101137359B1 (ko) 2006-09-14 2007-09-14 다이알로그 증폭 기술
KR1020097007407A KR101061132B1 (ko) 2006-09-14 2007-09-14 다이알로그 증폭 기술

Country Status (11)

Country Link
US (3) US8275610B2 (ko)
EP (3) EP2070389B1 (ko)
JP (3) JP2010504008A (ko)
KR (3) KR101061415B1 (ko)
AT (2) ATE487339T1 (ko)
AU (1) AU2007296933B2 (ko)
BR (1) BRPI0716521A2 (ko)
CA (1) CA2663124C (ko)
DE (1) DE602007010330D1 (ko)
MX (1) MX2009002779A (ko)
WO (3) WO2008032209A2 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017127286A1 (en) * 2016-01-19 2017-07-27 Boomcloud 360, Inc. Audio enhancement for head-mounted speakers
WO2019014069A1 (en) * 2017-07-11 2019-01-17 Boomcloud 360, Inc. COMPENSATION OF CROSSTALK AND SPATIAL SUB-BAND TREATMENT
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
US10764704B2 (en) 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8275610B2 (en) 2006-09-14 2012-09-25 Lg Electronics Inc. Dialogue enhancement techniques
MY179314A (en) * 2008-04-18 2020-11-04 Dolby Laboratories Licensing Corp Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
US8396223B2 (en) * 2008-07-29 2013-03-12 Lg Electronics Inc. Method and an apparatus for processing an audio signal
JP4826625B2 (ja) 2008-12-04 2011-11-30 ソニー株式会社 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
JP4844622B2 (ja) 2008-12-05 2011-12-28 ソニー株式会社 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器、音響装置
JP5120288B2 (ja) 2009-02-16 2013-01-16 ソニー株式会社 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
JP5564803B2 (ja) * 2009-03-06 2014-08-06 ソニー株式会社 音響機器及び音響処理方法
JP5577787B2 (ja) * 2009-05-14 2014-08-27 ヤマハ株式会社 信号処理装置
JP2010276733A (ja) * 2009-05-27 2010-12-09 Sony Corp 情報表示装置、情報表示方法および情報表示プログラム
WO2011039413A1 (en) * 2009-09-30 2011-04-07 Nokia Corporation An apparatus
EP2532178A1 (en) 2010-02-02 2012-12-12 Koninklijke Philips Electronics N.V. Spatial sound reproduction
TWI459828B (zh) 2010-03-08 2014-11-01 Dolby Lab Licensing Corp 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
JP5736124B2 (ja) * 2010-05-18 2015-06-17 シャープ株式会社 音声信号処理装置、方法、プログラム、及び記録媒体
RU2551792C2 (ru) * 2010-06-02 2015-05-27 Конинклейке Филипс Электроникс Н.В. Система и способ для обработки звука
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
US8761410B1 (en) * 2010-08-12 2014-06-24 Audience, Inc. Systems and methods for multi-channel dereverberation
JP5581449B2 (ja) 2010-08-24 2014-08-27 ドルビー・インターナショナル・アーベー Fmステレオ無線受信機の断続的モノラル受信の隠蔽
US8611559B2 (en) * 2010-08-31 2013-12-17 Apple Inc. Dynamic adjustment of master and individual volume controls
US9620131B2 (en) 2011-04-08 2017-04-11 Evertz Microsystems Ltd. Systems and methods for adjusting audio levels in a plurality of audio signals
US20120308042A1 (en) * 2011-06-01 2012-12-06 Visteon Global Technologies, Inc. Subwoofer Volume Level Control
FR2976759B1 (fr) * 2011-06-16 2013-08-09 Jean Luc Haurais Procede de traitement d'un signal audio pour une restitution amelioree.
JP5591423B1 (ja) * 2013-03-13 2014-09-17 パナソニック株式会社 オーディオ再生装置およびオーディオ再生方法
US9729992B1 (en) 2013-03-14 2017-08-08 Apple Inc. Front loudspeaker directivity for surround sound systems
CN104683933A (zh) * 2013-11-29 2015-06-03 杜比实验室特许公司 音频对象提取
EP2945303A1 (en) * 2014-05-16 2015-11-18 Thomson Licensing Method and apparatus for selecting or removing audio component types
JP6683618B2 (ja) * 2014-09-08 2020-04-22 日本放送協会 音声信号処理装置
CA2962806C (en) 2014-10-02 2023-03-14 Dolby International Ab Decoding method and decoder for dialog enhancement
CN107004427B (zh) 2014-12-12 2020-04-14 华为技术有限公司 增强多声道音频信号内语音分量的信号处理装置
JP2018513424A (ja) * 2015-02-13 2018-05-24 フィデリクエスト リミテッド ライアビリティ カンパニー ディジタルオーディオの補足
JP6436573B2 (ja) * 2015-03-27 2018-12-12 シャープ株式会社 受信装置、受信方法、及びプログラム
WO2016204125A1 (ja) * 2015-06-17 2016-12-22 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US10251016B2 (en) 2015-10-28 2019-04-02 Dts, Inc. Dialog audio signal balancing in an object-based audio program
WO2017132396A1 (en) 2016-01-29 2017-08-03 Dolby Laboratories Licensing Corporation Binaural dialogue enhancement
GB2547459B (en) * 2016-02-19 2019-01-09 Imagination Tech Ltd Dynamic gain controller
US10375489B2 (en) * 2017-03-17 2019-08-06 Robert Newton Rountree, SR. Audio system with integral hearing test
US10258295B2 (en) * 2017-05-09 2019-04-16 LifePod Solutions, Inc. Voice controlled assistance for monitoring adverse events of a user and/or coordinating emergency actions such as caregiver communication
EP3662470B1 (en) 2017-08-01 2021-03-24 Dolby Laboratories Licensing Corporation Audio object classification based on location metadata
US10511909B2 (en) * 2017-11-29 2019-12-17 Boomcloud 360, Inc. Crosstalk cancellation for opposite-facing transaural loudspeaker systems
CN108877787A (zh) * 2018-06-29 2018-11-23 北京智能管家科技有限公司 语音识别方法、装置、服务器及存储介质
US11335357B2 (en) * 2018-08-14 2022-05-17 Bose Corporation Playback enhancement in audio systems
FR3087606B1 (fr) * 2018-10-18 2020-12-04 Connected Labs Decodeur televisuel ameliore
JP7001639B2 (ja) * 2019-06-27 2022-01-19 マクセル株式会社 システム
JP7314427B2 (ja) * 2020-05-15 2023-07-25 ドルビー・インターナショナル・アーベー オーディオ・データの再生中のダイアログ了解性を改善するための方法および装置
US11288036B2 (en) 2020-06-03 2022-03-29 Microsoft Technology Licensing, Llc Adaptive modulation of audio content based on background noise
US11410655B1 (en) 2021-07-26 2022-08-09 LifePod Solutions, Inc. Systems and methods for managing voice environments and voice routines
US11404062B1 (en) 2021-07-26 2022-08-02 LifePod Solutions, Inc. Systems and methods for managing voice environments and voice routines
CN114023358B (zh) * 2021-11-26 2023-07-18 掌阅科技股份有限公司 对话小说的音频生成方法、电子设备及存储介质

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL278131A (ko) * 1961-05-08 1900-01-01
GB1522599A (en) 1974-11-16 1978-08-23 Dolby Laboratories Inc Centre channel derivation for stereophonic cinema sound
NL8200555A (nl) * 1982-02-13 1983-09-01 Rotterdamsche Droogdok Mij Spaninrichting.
US4897878A (en) 1985-08-26 1990-01-30 Itt Corporation Noise compensation in speech recognition apparatus
JPH03118519A (ja) 1989-10-02 1991-05-21 Hitachi Ltd 液晶表示素子
JPH03118519U (ko) * 1990-03-20 1991-12-06
JPH03285500A (ja) 1990-03-31 1991-12-16 Mazda Motor Corp 音響装置
JPH04249484A (ja) 1991-02-06 1992-09-04 Hitachi Ltd テレビジョン受信機用音声回路
US5142403A (en) 1991-04-01 1992-08-25 Xerox Corporation ROS scanner incorporating cylindrical mirror in pre-polygon optics
JPH05183997A (ja) 1992-01-04 1993-07-23 Matsushita Electric Ind Co Ltd 効果音付加自動判別装置
JPH05292592A (ja) 1992-04-10 1993-11-05 Toshiba Corp 音質補正装置
JP2950037B2 (ja) 1992-08-19 1999-09-20 日本電気株式会社 前方3chマトリクス・サラウンド・プロセッサ
DE69423922T2 (de) 1993-01-27 2000-10-05 Koninkl Philips Electronics Nv Tonsignalverarbeitungsanordnung zur Ableitung eines Mittelkanalsignals und audiovisuelles Wiedergabesystem mit solcher Verarbeitungsanordnung
US5572591A (en) 1993-03-09 1996-11-05 Matsushita Electric Industrial Co., Ltd. Sound field controller
JPH06335093A (ja) 1993-05-21 1994-12-02 Fujitsu Ten Ltd 音場拡大装置
JP3118519B2 (ja) 1993-12-27 2000-12-18 日本冶金工業株式会社 排気ガス浄化用メタルハニカム担体及びその製造方法
JPH07115606A (ja) 1993-10-19 1995-05-02 Sharp Corp 音声モード自動切替装置
JPH08222979A (ja) 1995-02-13 1996-08-30 Sony Corp オーディオ信号処理装置、およびオーディオ信号処理方法、並びにテレビジョン受像機
US5737331A (en) * 1995-09-18 1998-04-07 Motorola, Inc. Method and apparatus for conveying audio signals using digital packets
KR100206333B1 (ko) 1996-10-08 1999-07-01 윤종용 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US7085387B1 (en) * 1996-11-20 2006-08-01 Metcalf Randall B Sound system and method for capturing and reproducing sounds originating from a plurality of sound sources
US7016501B1 (en) 1997-02-07 2006-03-21 Bose Corporation Directional decoding
US6243476B1 (en) 1997-06-18 2001-06-05 Massachusetts Institute Of Technology Method and apparatus for producing binaural audio for a moving listener
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6111755A (en) 1998-03-10 2000-08-29 Park; Jae-Sung Graphic audio equalizer for personal computer system
JPH11289600A (ja) 1998-04-06 1999-10-19 Matsushita Electric Ind Co Ltd 音響装置
WO1999053721A1 (en) * 1998-04-14 1999-10-21 Hearing Enhancement Company, L.L.C. Improved hearing enhancement system and method
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
WO1999053612A1 (en) * 1998-04-14 1999-10-21 Hearing Enhancement Company, Llc User adjustable volume control that accommodates hearing
US6990205B1 (en) * 1998-05-20 2006-01-24 Agere Systems, Inc. Apparatus and method for producing virtual acoustic sound
US6170087B1 (en) * 1998-08-25 2001-01-09 Garry A. Brannon Article storage for hats
JP2000115897A (ja) 1998-10-05 2000-04-21 Nippon Columbia Co Ltd 音響処理装置
GB2353926B (en) * 1999-09-04 2003-10-29 Central Research Lab Ltd Method and apparatus for generating a second audio signal from a first audio signal
JP2001245237A (ja) 2000-02-28 2001-09-07 Victor Co Of Japan Ltd 放送受信装置
US6879864B1 (en) 2000-03-03 2005-04-12 Tektronix, Inc. Dual-bar audio level meter for digital audio with dynamic range control
JP4474806B2 (ja) 2000-07-21 2010-06-09 ソニー株式会社 入力装置、再生装置及び音量調整方法
JP3670562B2 (ja) * 2000-09-05 2005-07-13 日本電信電話株式会社 ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体
US6813600B1 (en) 2000-09-07 2004-11-02 Lucent Technologies Inc. Preclassification of audio material in digital audio compression applications
US7010480B2 (en) * 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
JP3755739B2 (ja) 2001-02-15 2006-03-15 日本電信電話株式会社 ステレオ音響信号処理方法及び装置並びにプログラム及び記録媒体
US6804565B2 (en) * 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
AU2002363054A1 (en) * 2001-09-12 2003-05-06 Bitwave Private Limited System and apparatus for speech communication and speech recognition
JP2003084790A (ja) 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd 台詞成分強調装置
DE10242558A1 (de) * 2002-09-13 2004-04-01 Audi Ag Audiosystem insbesondere für ein Kraftfahrzeug
WO2004032351A1 (en) * 2002-09-30 2004-04-15 Electro Products Inc System and method for integral transference of acoustical events
JP4694763B2 (ja) * 2002-12-20 2011-06-08 パイオニア株式会社 ヘッドホン装置
US7076072B2 (en) * 2003-04-09 2006-07-11 Board Of Trustees For The University Of Illinois Systems and methods for interference-suppression with directional sensing patterns
JP2004343590A (ja) 2003-05-19 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> ステレオ音響信号処理方法、装置、プログラムおよび記憶媒体
JP2005086462A (ja) * 2003-09-09 2005-03-31 Victor Co Of Japan Ltd オーディオ信号再生装置のボーカル音帯域強調回路
US7307807B1 (en) * 2003-09-23 2007-12-11 Marvell International Ltd. Disk servo pattern writing
JP4317422B2 (ja) 2003-10-22 2009-08-19 クラリオン株式会社 電子機器、及び、その制御方法
JP4765289B2 (ja) 2003-12-10 2011-09-07 ソニー株式会社 音響システムにおけるスピーカ装置の配置関係検出方法、音響システム、サーバ装置およびスピーカ装置
US20070211910A1 (en) 2004-04-06 2007-09-13 Naoki Kurihara Sound Volume Control Circuit, Semiconductor Integrated Circuit And Sound Source Device
KR20060003444A (ko) 2004-07-06 2006-01-11 삼성전자주식회사 모바일 기기에서 크로스토크 제거 장치 및 방법
US7383179B2 (en) * 2004-09-28 2008-06-03 Clarity Technologies, Inc. Method of cascading noise reduction algorithms to avoid speech distortion
US7502112B2 (en) 2004-12-23 2009-03-10 Brytech Inc. Colorimetric device and colour determination process
SG124306A1 (en) * 2005-01-20 2006-08-30 St Microelectronics Asia A system and method for expanding multi-speaker playback
JP2006222686A (ja) 2005-02-09 2006-08-24 Fujitsu Ten Ltd オーディオ装置
KR100608025B1 (ko) * 2005-03-03 2006-08-02 삼성전자주식회사 2채널 헤드폰용 입체 음향 생성 방법 및 장치
US8270620B2 (en) 2005-12-16 2012-09-18 The Tc Group A/S Method of performing measurements by means of an audio system comprising passive loudspeakers
US8275610B2 (en) 2006-09-14 2012-09-25 Lg Electronics Inc. Dialogue enhancement techniques

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
US10721564B2 (en) 2016-01-18 2020-07-21 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reporoduction
WO2017127286A1 (en) * 2016-01-19 2017-07-27 Boomcloud 360, Inc. Audio enhancement for head-mounted speakers
US10009705B2 (en) 2016-01-19 2018-06-26 Boomcloud 360, Inc. Audio enhancement for head-mounted speakers
WO2019014069A1 (en) * 2017-07-11 2019-01-17 Boomcloud 360, Inc. COMPENSATION OF CROSSTALK AND SPATIAL SUB-BAND TREATMENT
US10313820B2 (en) 2017-07-11 2019-06-04 Boomcloud 360, Inc. Sub-band spatial audio enhancement
US10764704B2 (en) 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing
US11284213B2 (en) 2019-10-10 2022-03-22 Boomcloud 360 Inc. Multi-channel crosstalk processing

Also Published As

Publication number Publication date
US20080165975A1 (en) 2008-07-10
EP2070389A1 (en) 2009-06-17
EP2070391A2 (en) 2009-06-17
JP2010515290A (ja) 2010-05-06
KR101061415B1 (ko) 2011-09-01
EP2064915B1 (en) 2014-08-27
KR20090053950A (ko) 2009-05-28
DE602007010330D1 (de) 2010-12-16
US8184834B2 (en) 2012-05-22
WO2008031611A1 (en) 2008-03-20
WO2008032209A3 (en) 2008-07-24
US8238560B2 (en) 2012-08-07
KR101061132B1 (ko) 2011-08-31
JP2010504008A (ja) 2010-02-04
EP2064915A4 (en) 2012-09-26
JP2010518655A (ja) 2010-05-27
BRPI0716521A2 (pt) 2013-09-24
CA2663124C (en) 2013-08-06
EP2070391A4 (en) 2009-11-11
CA2663124A1 (en) 2008-03-20
ATE510421T1 (de) 2011-06-15
WO2008035227A3 (en) 2008-08-07
EP2064915A2 (en) 2009-06-03
US20080167864A1 (en) 2008-07-10
US8275610B2 (en) 2012-09-25
AU2007296933A1 (en) 2008-03-20
WO2008035227A2 (en) 2008-03-27
AU2007296933B2 (en) 2011-09-22
MX2009002779A (es) 2009-03-30
ATE487339T1 (de) 2010-11-15
KR101137359B1 (ko) 2012-04-25
EP2070391B1 (en) 2010-11-03
US20080165286A1 (en) 2008-07-10
WO2008032209A2 (en) 2008-03-20
EP2070389B1 (en) 2011-05-18
KR20090053951A (ko) 2009-05-28

Similar Documents

Publication Publication Date Title
KR101061415B1 (ko) 다이알로그 증폭 기술을 위한 컨트롤러 및 사용자 인터페이스
CN101518102B (zh) 对话增强技术
US9865279B2 (en) Method and electronic device
TWI429302B (zh) 音頻訊號之處理方法及其裝置
US9071215B2 (en) Audio signal processing device, method, program, and recording medium for processing audio signal to be reproduced by plurality of speakers

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140724

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150724

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160722

Year of fee payment: 6