KR20130115382A - 동적 사운드 전달을 위한 시스템과 방법 - Google Patents
동적 사운드 전달을 위한 시스템과 방법 Download PDFInfo
- Publication number
- KR20130115382A KR20130115382A KR1020137023675A KR20137023675A KR20130115382A KR 20130115382 A KR20130115382 A KR 20130115382A KR 1020137023675 A KR1020137023675 A KR 1020137023675A KR 20137023675 A KR20137023675 A KR 20137023675A KR 20130115382 A KR20130115382 A KR 20130115382A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- noise
- band
- compression
- sub
- Prior art date
Links
- 238000000034 method Methods 0.000 title description 40
- 238000007906 compression Methods 0.000 claims description 68
- 230000006835 compression Effects 0.000 claims description 67
- 238000002716 delivery method Methods 0.000 claims 2
- 238000004891 communication Methods 0.000 abstract description 27
- 230000005236 sound signal Effects 0.000 abstract description 8
- 238000005259 measurement Methods 0.000 abstract description 6
- 230000008569 process Effects 0.000 description 21
- 238000009499 grossing Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000000354 decomposition reaction Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001066 destructive effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/24—Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/32—Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Control Of Amplification And Gain Control (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
본 발명은 동적 범위 조작 시스템에 관한 것이고, 예를 들어, 상기 시스템은 쌍방향 통신 시스템, 휴대용 전화기, MP3 플레이어 등의 오디오 재생 시스템에 사용하며, 재생 위치에서 주변 소음을 측정하며, 재생되는 오디오 신호를 기초로 및 상기 측정을 기초로 확성기에 제공되는 드라이브 신호의 이득을 조정하는 것을 특징으로 한다.
Description
본 발명은, 예를 들어 휴대 전화 및 워키토키와 같은 쌍방향 통신 시스템의 오디오 재생(audio playback)에 관한 것이다.
주변 소음(ambient noise)은 때로 오디오 정보의 전달을 방해한다. 예를 들어, 원단 발신자(far-end talker)가 근단 수신자(near-end listener)로부터 먼 위치에 있는 쌍방향 통신 시스템에서, 수신자의 위치에서 소음 조건을 무시한 원단 발신자는 (순간 또는 지속형의) 파괴적 소음 이벤트의 발생을 보상하기 위한 조치를 취하지 않을 수 있다. 예를 들어, 시스템이 이러한 보상을 전기 및 기계적으로 처리할 수 있다고 하더라고, 수신자의 위치에서 차량 통과를 인지하지 못하는 발신자는 수신자에 대한 가청도를 유지하기 위해 그/그녀의 음성을 올리지 않을 수 있고, 발신자의 말이 들리지 않거나 수신자가 이해하지 못할 수 있다. 이러한 환경에서 수신자가 발신자의 말을 인식하지 못하는 것은 "차폐(masking)"라고 불리는 잘 알려진 정신 물리학적 현상 때문으로, 이는 아주 시끄러운 경우, 국부적인 소음이 재생 원단 사운드 신호(played-back far-end sound signal)를 완전히 덮거나 차폐하는 것이다. 이러한 문제점은 물론 쌍방향 통신 시스템에만 제한되지 않고, 이와 유사하게 주변 소음도 재생되는 미리 녹음된 음성, 임의의 미리 저장된 오디오 정보를 방해할 수 있다.
상술한 바와 같이, 동적 범위 조작 시스템은 정보 신호를 제공하도록 구성된 제 1 입력과, 소음 표시 신호를 제공하도록 구성된 제 2 입력과, 상기 정보 신호와 상기 소음 표시 신호를 수신하고 상기 정보 신호와 상기 소음 신호에서 전력 측정을 기초로 하여 이득 제어 출력 신호(gain-controlled output signal)를 생성하도록 구성된 프로세서를 포함한다.
본 명세서에 기술된 것 외에, 오디오 재생 장치는 정보 신호를 제공하도록 구성된 정보원(information source)과, 재생 드라이브 신호와 관련한 오디오 정보를 나타내도록 구성된 확성기(loudspeaker)와, 상기 확성기의 위치에서 주변 소음을 기초로 하여 소음 표시 신호를 제공하도록 구성된 소음 표시 신호원(noise indication signal source)과, 상기 정보 신호와 상기 소음 표시 신호의 함수로 재생 드라이브 신호를 생성하도록 구성된 프로세서를 포함하고, 상기 프로세서는 상기 정보 신호와 소음 신호에서 전력 측정을 기초로 하여 재생 신호의 이득 제어에 영향을 준다.
또한 본 명세서에는 재생 위치에서 주변 소음을 보상하는 방법이 기술되어 있다. 상기 방법은 주변 소음을 나타내는 주변 소음 신호 표시를 수신하는 단계와, 정보 신호를 수신하는 단계와, 상기 주변 소음 신호와 상기 정보 신호에서 전력의 함수로 이득 제어된 출력 신호를 생성하는 단계를 포함한다.
본 발명은, 휴대 전화 및 워키토키와 같은 쌍방향 통신 시스템의 오디오 재생을 제공하는 효과를 갖는다.
본 명세서에 포함되고, 본 명세서의 일 부분을 구성하는 첨부된 도면은 실시예의 하나 이상의 예를 예시하고, 실시예의 설명과 함께 실시예의 원리와 구현을 설명하는 역할을 한다.
도 1a는 두 명의 사용자가 서로 원거리에서 통신할 수 있도록 하는 쌍방향 통신 시스템(100)의 도면.
도 1b는 도 1a의 통신 시스템(100)의 통신 장치(102)의 블록도.
도 2는 동적 사운드 전달 시스템의 블록도.
도 3은 도 2의 프로세서(202)(및 도 1b의 컨트롤러)의 구성 부분일 수 있는 동적 범위 조작 시스템(300)의 블록도.
도 4는 표준 단시간 푸리에 변환(STFT) 과정과 관련된 블록도.
도 5는 동적 범위 조작 과정의 흐름도.
도 6은 도 5 과정의 구현에 사용되는 프로세싱 모듈 또는 회로의 블록도.
도 7a는 다양한 압축/확장 곡선의 플롯.
도 7b는 서브-밴드를 위한 이득 등고선 플롯.
도 7c는 확성기(206)를 구동하기 위해 사용되는 재생 신호 레벨의 등고선.
도 1a는 두 명의 사용자가 서로 원거리에서 통신할 수 있도록 하는 쌍방향 통신 시스템(100)의 도면.
도 1b는 도 1a의 통신 시스템(100)의 통신 장치(102)의 블록도.
도 2는 동적 사운드 전달 시스템의 블록도.
도 3은 도 2의 프로세서(202)(및 도 1b의 컨트롤러)의 구성 부분일 수 있는 동적 범위 조작 시스템(300)의 블록도.
도 4는 표준 단시간 푸리에 변환(STFT) 과정과 관련된 블록도.
도 5는 동적 범위 조작 과정의 흐름도.
도 6은 도 5 과정의 구현에 사용되는 프로세싱 모듈 또는 회로의 블록도.
도 7a는 다양한 압축/확장 곡선의 플롯.
도 7b는 서브-밴드를 위한 이득 등고선 플롯.
도 7c는 확성기(206)를 구동하기 위해 사용되는 재생 신호 레벨의 등고선.
동적 사운드 전달을 위한 시스템과 방법과 관련해서 예시적인 실시예가 본 명세서에 설명되어 있다. 당업자는 다음의 설명이 단지 예시적인 것이고, 임의의 방식에 제한을 두지 않는다는 것을 인식할 것이다. 다른 실시예는 이러한 기재 내용의 이익을 갖는 당업자에게 용이하게 제안될 것이다. 첨부된 도면에 예시된 실시예를 구현하기 위해 이제 상세히 참조를 나타낼 것이다. 동일하거나 유사한 항목을 가리키기 위해 도면 전체와 다음의 상세한 설명에서 가능한 정도로 동일한 참조 표시가 사용될 것이다.
명료함을 위해, 본 명세서에 기술된 구현예의 모든 일반적인 특징이 나타나거나 기술되지는 않는다. 물론, 이러한 임의의 실제 구현의 개발에서, 여러 구현에 특정한 결정이 이루어져서 개발자의 특정한 목적, 예를 들어 용도 및 사업과 관련된 제약과의 컴플라이언스를 이루어야만 하고, 이러한 특정 목적은 구현예마다 다르고 개발자마다 서로 다를 것으로 이해될 것이다. 또한, 이러한 개발 노력은 어렵고, 시간 소비적일 수 있지만, 본 기재 내용의 이익을 갖는 당업자에게 일반적인 엔지니어링 사업일 것으로 이해될 것이다.
이러한 기재 내용에 따라, 본 명세서에 기술된 구성요소, 공정 단계, 및/또는 데이터 구조는 여러 유형의 작동 시스템, 컴퓨팅 플랫폼, 컴퓨터 프로그램 및/또는 일반적인 목적의 기계를 사용하여 구현될 수 있다. 또한, 당업자는, 보다 덜 일반적인 목적의 성질을 갖는 장치, 예를 들어, 하드와이어 장치, 필드 프로그래머블 게이트 어레이(FPGAs), 용도에 특정한 집적 회로(ASICs) 등이 본 명세서에 기재된 본 발명의 개념의 범위와 사상을 벗어나지 않으면서 사용될 수 있다는 것을 인지할 것이다. 일련의 공정 단계를 포함하는 방법이 컴퓨터 또는 기계에 의해 구현되고, 이러한 공정 단계가 기계에 의해서 판독 가능한 일련의 명령으로 저장될 수 있는 경우, 컴퓨터 메모리 장치{예를 들어, ROM(Read Only Memory), PROM(Programmable Read Only Memory), EEPROM(Electrically Erasable Programmable Read Only Memory), FLASH 메모리, 점프 드라이브 등}, 자기 저장 매체(예를 들어, 테이프, 자기 디스크 드라이드 등), 광학 저장 매체(예를 들어, CD-ROM, DVD-ROM, 페이퍼 카드, 페이퍼 테이프 등) 및 다른 유형의 프로그램 메모리에 저장될 수 있다.
본 명세서에 기술된 실시예는 디지털 신호 프로세스를 사용하여 구현된 프로세스의 관계에서 존재한다. 각각의 프로세스 단계는 대안적인 구현, 예를 들어 아날로그 회로를 사용하여 완성될 수 있는 것으로 인지될 것이다. 아날로그 구현을 지지하는 하드웨어는 디지털 영역에서 하드웨어 구현과 다른 것으로 나타나지만, 대응하는 프로세스 단계 각각의 기본적인 성질은 동일하다. 따라서, 본 명세서에 기술된 프로세스는 아날로그 또는 디지털 영역에서 임의의 하드웨어 구현에 응용 가능한 것으로 의도된다.
도 1a는 두 명의 사용자가 서로 원거리에서 통신할 수 있도록 하는 쌍방향 오디오 통신 시스템(100)의 도면이다. 각 사용자는 도 1b의 블록도에 보다 상세히 도시되어 있는 통신 장치(102)를 구비한다. 각 통신 장치(102)는 마이크로폰(104), 확성기(106), 트랜스시버(108) 및 프로세서 또는 컨트롤러(110)를 포함한다. 제 1 통신 "회로(circuit)"에서, 멀거나 원단 위치에서 사용자의 음성은 사용자의 위치에서 통신 장치(102)의 마이크로폰(104)에 의해 픽업되고, 국부 또는 근단 사용자 위치에서 통신 장치(102)의 확성기(106)에 의해 재생하려고 무선 또는 이와 다른 방식으로 전송된다. 이와 유사하게, 제 2 통신 "회로"에서, 국부 또는 근단 위치에서 사용자의 음성은 근단 통신 장치(102)의 마이크로폰(104)에 의해 픽업되어, 멀거나 원단 위치에서 확성기(106)에 의해 재생된다.
통신 시스템(100)은 쌍방향 시스템으로 간주되는데, 이는 기술된 바와 같이 두 개의 통신 "회로"를 포함하기 때문이다. 그러나, 본 명세서에 기술된 구현은 개별적으로 통신 "회로"에 관한 것이고, 이에 따라 쌍방향 시스템에 제한되지 않는 것으로 이해해야 한다. 오히려, 이것은 국부 또는 근단 사용자가 원거리 사용자를 들을 수만 있고, 멀리 있는 사용자에게 말을 할 수 없는 일 방향 시스템에 또한 적용 가능하다. 보다 더 일반적으로, 본 명세서에 기술된 구현은, 오디오 정보원의 상태 또는 위치와 관계없이, 음악, 사운드 신호, 및 미리 녹음된 음성과 같은 오디오 정보를 독점적으로 재생 또는 제공할 수 있는 시스템에 적용 가능하고, 원거리 사용자 또는 오디오 공급원은 관련될 필요가 없다. 이러한 시스템은, 예를 들어, 워크맨, 콤팩트 디스크 플레이어, 홈 스테레오, 텔레비젼 세트, 개인 휴대 정보 단말기(PDAs) 등과 같은 휴대용 및 비휴대용 오디오 시스템을 포함한다. 이러한 시스템에서, 쌍방향 통신 시스템(100)에서와 달리, 재생은 반드시 실시간으로 영향을 받지 않고, 즉 오디오 정보는 생성되는 동시에 반드시 제공될 필요는 없다.
도 1b를 참조하면, 트랜스시버(108)가 이 예에서 전송할 것으로 예측되는 정보는 사용자의 음성과 같은 음성 신호로, 이는 마이크로폰(104)에 의해 픽업되고 전기 신호로 변환되어 도시된 바와 같이 직접 또는 컨트롤러(110)에 의해 트랜스시버로 전달된다. 컨트롤러(110) 통과시, 픽업 정보는 통신 시스템(100)의 장치(102) 사이에서 관찰될 특별한 용도 및/또는 프로토콜에 따라 전송하기 위한 적절한 형태로 통합(packaging)될 수 있다. 여러 유형의 모듈레이션 중 적어도 하나일 수 있는 이러한 통합 이후, 정보는 전송을 위해서 트랜스시버(108)에 전달된다. 이와 반대로, 트랜스시버(108)는 수신한 정보를 "분해(unpackaging)" 및 하기에 기재한 것과 같이 프로세싱 및 조작하기 위해 컨트롤러(110)에 무선 또는 이와 다른 방식으로 전달하는 작용을 하여, 정보가 확성기(106)에 의해 재생되는 동안 음향 형태로 변환될 때, 수신 사용자가 몰두한 소음 환경에 관계없이, 명확하게 유지되거나, 또는 가능한 한 많은 그 원래 메시지 또는 특성을 유지한다.
트랜스시버(108)는 정보가 전송 및/또는 접수되도록 구성되고, 단일 구성요소 형태일 수 있다. 대안적으로, 상기 두 개의 기능 각각으로 특정된 개별 구성요소들이 사용될 수 있다. 전송은 무선으로 예를 들어, 모듈화 라디오 신호를 경유하여 실행될 수 있거나, 또는 종래의 전력선 또는 광학적으로 섬유를 사용하거나 또는 조준선(line-of-sight)을 통해서 실행될 수 있다.
도 1a와 1b의 실시예에서, 원단 발신자는 근단 수신자로부터 먼 위치에 있기 때문에, 발신자는 수신자의 위치에서의 소음 조건을 모를 수 있고, 수신자와 거리를 둔 위치에서 발신자는 (순간 또는 지속형의) 파괴적 소음 이벤트의 발생을 보상하기 위한 조치를 취하지 않을 수 있으며, 이것은 이러한 발생을 발신자가 인지할 수 없기 때문이다. 간단하게 예를 들어, 수신자의 위치에서 통과하는 차를 인지하지 못하는 발신자는 수신자로의 그/그녀의 가청도를 유지하기 위해 그의 음성을 올리지 않으며, 그/그녀의 말 등은 이러한 보상을 전기 및 기계적으로 처리할 수 있는 시스템이라고 해도 수신자에게 들리거나 또는 수신자가 이해할 수 없을 수 있다. 이러한 환경하에서 발신자의 대사를 파악하는 것에 대한 수신자의 불능에 대한 원인은 아주 시끄러운 경우에 국부 소음이 재생 원단 사운드 신호를 완전히 덮거나 차폐하는 잘 알려진 정신 물리학적 현상인 "차폐(masking)" 때문이다. 그러나, 본 명세서에 개시된 바와 같이, 컨트롤러(110)는 파괴적 소음 이벤트를 인지하도록 구성될 수 있고, 필요하다면 다른 구성요소를 장착하여 이를 보상하거나 이의 충격을 최소화하기 위한 필요한 조치를 취할 수 있다.
앞에서 설명한 바와 같이, 본 명세서의 기술 내용은 쌍방향 통신 시스템에 관련된 것이지만, 이에 제한되지 않고, 독점적으로 예를 들어, 음악, 사운드 신호, 및 미리 녹음된 음성과 같은 오디오 정보를 재생하기 위한 시스템의 용도가 오디오 정보원의 상태 또는 특성과 관계없이, 실시간 또는 이와 다르게 관찰된다. 도 2는 동적 사운드 전달 시스템(20)에서 프로세서(202)는 오디오 정보원(204)에 의해 제공되는 오디오 정보 상에서 작동되어 정보를 조작하고, 사용자에게 재생 또는 제시하기 위해 확성기(206)로 재생 신호 또는 출력 신호의 형태로 이것을 전달하기 이전에 절충된 수신 환경 조건용 보상을 위한 조치를 취하는 일반적인 용도에 관한 것을 나타낸다. 시스템(200)에서 재생 위치에서 환경 오디오 소음의 표현 또는 가중치는 오디오 소음 인디케이터(208)에 의해 발생된다. 이러한 경우에 재생 시스템에는 사용 가능한 것이 없다면 마이크로폰이 장착될 수 있다. 조작 및 보상은 실시간으로 이루어지며, 지속형 또는 개별 순간 샘플링 형태일 수 있다. 이후에는 주변 소음 징후 또는 소음 징후로 나타낼 수 있는 표현 또는 가중치는 재생시 필요한 보상을 위해 정보원(204)으로부터의 정보 신호와 함께 이용되는 프로세서(202)로 제공된다.
상기 징후가 유도될 수 있는 인디케이터(indicator)(208)는 재생 위치에서 주변 소음을 감지하기 위해 사용되는 간단한 마이크로폰 또는 마이크로폰 어레이{예를 들어, 도 1b의 마이크로폰(들)(104)}일 수 있다. 대안적으로, (또는 이에 추가해서), 소음 징후(noise indicia)는 다른 경우와 마찬가지로 시스템으로 실행되거나 또는 상이한 목적과 함께 또는 동일하거나 또는 관련된 목적을 위한 연결 시스템으로 실행되는 부수적인 프로세싱 작동으로부터 유래될 수 있다. 예를 들어, 쌍방향 시스템에서 소음 징후는 주변 소음의 존재하에 송출 오디오 신호를 강화시키기 위해서 근단에서 사용되는 소음 감소 알고리즘으로부터 유래될 수 있다. 주변 소음의 결정은 다양한 방식으로 소음 감소 알고리즘에 의해서 수득될 수 있으며, 이러한 결정을 사용하면 재생을 개선할 수 있는 동적 사운드 전달 시스템(200)에 의해 필요로 하는 소음 징후를 제공할 수 있다. 송출 오디오 신호를 위한 소음 감소 알고리즘은 흔히 멀티-밴드 방법을 사용하여 증식으로 송출 소음 신호로 전송되는 일련의 감쇄값을 생성한다. 상기 감쇄값은 "0" 내지 "1"의 수일 수 있다. 송출 소음 신호로 전송되는 경우에 대부분 또는 단지 소음이 되는 소음 신호의 감쇄 부분에 의해서 소음을 감쇄시키는 역할을 하는 반면에 감쇄가 되지 않거나 또는 목적하는 신호가 되는 부분, 즉 적은 정도로만 감쇄가 된다. 상기 동적 사운드 전달 시스템(200)은 "1"로부터 각 감쇄값을 빼 소음 표시를 수득할 수 있다. 다음에 동적 사운드 전달 시스템(200)은 상기에서 유래된 "감쇄 방지(anti-attenuation)" 값을 원래의 소음 신호에 적용하여 소음 인디케이터(208)로부터 소음 징후를 유도할 수 있다. 또한 하기에서 기술한 하나의 변환에서 1) 감쇄값을 제곱하여 파워 백분율로 나타내며, 2) 상기에서 얻어진 값들을 각 주파수 밴드 내에서 가산하여 밴드당 비-소음 파워의 총 퍼센트 측정을 수득하며, 3) 각 밴드에서 원래 소음 신호의 총 파워를 계산하며, 및 4) 100%에서 비-소음 파워 퍼센트를 뺀 소음 퍼센트를 곱함으로써 감쇄값을 사용하여 총 파워 타이밍을 맞추어 각 밴드에서 단지 소음만의 파워 측정을 수득하는 것이 바람직할 수 있다.
아래에 보다 자세히 설명된 바와 같이, 도 2의 동적 사운드 전달 시스템(200)은 소음 근단 환경에서 재생되어야 하는 신호의 동적 범위를 조정하기 위해 압축을 사용하는 멀티-밴드 동적 범위 프로세서로서 구동하도록 구성될 수 있다. 상기 시스템(200)은 이득 제어가 소음 인디케이터(208)로부터의 주변 소음 조건(소음 징후) 및 정보원(204)으로부터의 오디오 정보 모두의 상관관계인 확성기(206)를 구동하기 위해 사용되는 출력 재생 신호에 선택적 이득 제어를 적용시킨다. 특정 환경에 따라 출력 드라이브 신호의 부분은 압착을 하지 않거나 심지어 하방 확장이 될 수 있다.
도 3은 도 2의 프로세서(202){및 도 1b의 컨트롤러(110)}의 구성 부분일 수 있는 동적 범위 조작 시스템(300)의 블록도이다. 프로세서(202)는 하기에서 기재한 것으로부터 상이한 기능을 갖는 다른 프로세싱 모듈 또는 회로를 포함할 수 있다. 이전에 설명한 것과 같이 동적 범위 조작 시스템(300)에 의해 실행되는 프로세싱이 단일-밴드 또는 멀티-밴드 프로세스로서 구형될 수 있는 반면, 도 3의 예는 멀티-밴드 접근법에 관한 것이다. 여기서 벌티-밴드 프로세스의 각 밴드는 서브-밴드로서 나타낼 것이며, 실시예는 두 개의 서브-밴드 프로세스에 관하여 기재할 것이지만, 이에 제한되지 않는다. 일 실시예에서, 두 개의 서브-밴드 사이의 컷오프는 약 1kHz에 있도록 선택된다. 1kHz 이하의 오디오 신호는 일반적으로 스피치 음량으로 표시될 수 있는 스피치의 모음 사운드를 포함하는 반면, 1kHz 이상은 일반적으로 좀 더 많은 정보가 풍부한 자음 사운드를 포함한다. 보다 구체적으로, 예를 통해서만, 하부 서브-밴드는 약 50Hz 내지 약 1kHz로 확대되는 반면, 상부 서브-밴드는 약 1kHz 내지 약 3.5kHz로 확대된다. 두 개의 서브-밴드 예를 통해, 신호 프로세싱 모듈(308)은 상부 서브-밴드 동적 범위 조작 프로세스를 제공한다. 단일-밴드 구현은 전체의 목적하는 스펙트럼을 포함하기 위해서 구성될 수 있는 신호 프로세싱 모듈(306)만을 요구하는 반면, 여러 서브-밴드 구현은 도 3에서 점선으로 도시한 신호 프로세싱 모듈로 나타내는 추가의 신호 프로세싱 모듈을 요구한다.
동적 범위 조작 시스템(300)은 이의 제 1 입력(301)에 오디오 소음 인디케이터 신호를 수신하며, 상기 신호를 주파수 빈 또는 밴드로 분해되는 제 1 주파수 분해 모듈(302)로 제공한다. 이전에 기재한 것과 같이 오디오 소음 인디케이터 신호는 재생 위치에서의 주변 소음을 나타낸다. 동적 범위 조작 시스템(300)은 제 2 입력(303)에서 오디오 정보 신호를 수신하고, 이를 제 2 주파수 분해 모듈(304)로 제공한다. 주파수 분해 모듈(304)는 이의 오디오 정보 신호를 주파수 빈(frequency bin) 또는 밴드로 분해한다.
도 1a 및 1b의 쌍방향 통신 시스템에서, 상기 오디오 정보 신호는 원단 위치에서 통신 장치(102)의 마이크로폰에 의해 픽업되어 재생되도록 하는 근단 통신 장치(102)로 전송하는 것과 같이 먼거리의 원단 위치로부터 발신자의 음성을 대표한다. 그러나 보다 일반적으로 상기 오디오 정보는 도 2에서 나타내는 정보원(204)으로부터 나오며, 예를 들어, 음악, 녹화 음성 등으로 저장될 수 있으며, 실시간으로 재생되는 것에 반드시 제한되는 것은 아니다.
두 개의 서브-밴드 실시예에서, 주파수 분해 모듈(302, 304)은 각각 표준 단시간 푸리에 변환(STFT) 프로세스를 입력(301,303)으로부터 각각의 입력 신호 상에 적용한다. 상기 프로세스는 도 4의 흐름도(400)를 참조하여 설명하였다. 신호의 타임 샘플을 취했으며(402), 상기 타임 샘플은 윈도우화되는(406) 프레임(404)으로 나눈다(증식과 관련된 윈도잉 기술은 공지되어 있음). 제로 패딩(zero padding)이 실행될 수 있으며(408), 시간 데이터의 패딩된 프레임이 본 실시예에서 신속한 푸리어 변환(FFT)를 이용하여 주파수 영역에서 변환된다(410). 다른 이용 가능한 변환 방법으로는, 코사인 변환, 하틀리 변환, 웨이브렛 변환 등을 포함한다. 일례로, 결과의 주파수 분해능을 증가시키기 위해서 512 샘플로 패딩되고, 완벽한 재생 오디오 윈도우로 인도우화되는 384 샘플 프레임과, 8ksps(초당 킬로샘플)의 샘플 속도 및 16-비트 단어가 사용된다. 따라서, 257 주파수 "빈(bin)"의 총 수가 획득된다{나이퀴스트 주파수(Nyquist frequency) 및 DC 하프-빈 포함}. 56 샘플의 프레임 전진을 사용하여 작동 초당 143 프레임을 전달한다. 따라서, 제어 프로세스는 초당 143회의 서브-샘플 속도로 작동되며, 이것은 스피치 및 듣는 모듈레이션 속도 이상이며(~30Hz), 컴퓨트 파워를 저장하기 위한 8ksps의 원래 샘플 속도 이하이다.
주파수 영역 실시예에서, 주파수 빈은 그룹 또는 서브-밴드로 어셈블리된다. 본 실시예에서, 1kHz 내지 3.5kHz의 빈 그룹은 하나의 서브-밴드("상부 서브-밴드")를 형성하고, 50Hz 내지 1kHz의 그룹은 개별 제 2 서브-밴드("하부 서브-밴드")를 형성한다. 따라서, 주파수 영역을 구성하는 이러한 두 개의 일련의 빈은 오디오 소음 인디케이터 신호를 나타내며, 정보 신호는 각각 빈 또는 서브-밴드의 두 개의 그룹으로 나뉘어 소음 인디케이터 신호와 오디오 정보 신호 각각에 대해의 높은 서브-밴드 및 낮은 서브-밴드를 제공한다.
상술한 실시예는 주파수 영역에서 실행된다. 그러나, 대안적인 타임 영역 실시예에서 주파수 분해는 밴드-패스 필터로 유발될 수 있다. 두 개의 서브-밴드에 있어서는 두 개의 일련의 두 개의 밴드-패스 필터가 있으며, 각 세트는 하부 서브-밴드에 대한 주파수의 관련 범위를 통과하는 하나의 밴드-패스 필터 및 상부 서브-밴드에 대한 관련된 범위의 주파수를 통과하는 하나의 밴드-패스 필터를 포함한다. 상기 두 개의 밴드-패스 필터 세트 중 하나는 소음 인디케이터 신호와 관련이 있으며, 밴드-패스 필터 세트 중 하나는 오디오 정보 신호와 관련이 있다. 따라서, 본 실시예에서는 주파수 분해 프로세스를 실행하는 4개의 밴드-패스 필터가 있다.
동적 범위 조작 제어 신호는 이의 조작에 사용되는 프로세싱 모듈 또는 회로의 블록도인 도 6 및 프로세스의 흐름도를 나타내는 도 5를 참조하여 기재한 것과 같이 서브-프로세서(306, 308)로 발생한다. 각 데이터 프레임에 있어서 도 5에서 나타내는 프로세스는 각 서브-밴드에 대한 실행된다. 각 하부 및 상부 서브-밴드에 대한 관련된 서브-프로세서(306,308)는 확성기(206)로 출력되는 재생 드라이브 신호에 전사되는 이득 제어를 기본으로 형성되는 프레임 파워 결정을 실행한다(도 2). 소음과 정보 신호 각각에 대해의 프레임 파워 결정을 구동하기 위해서, 각 신호의 각 주파수 빈에 있어서의 등급값(magnitude values)를 제곱하여, 서브-밴드의 모든 빈으로부터의 결과를 서브-밴드의 주파수 범위 상에서 함께 부가한다. 이는, 도 5에서 501, 501', 도 6에서 601, 601'로 도시된다. 각 프레임 파워 결정은 각 신호의 각각의 서브-밴드 내에서 빈 파워 값의 합계를 계산하는 합계 회로 또는 모듈(601,601'), 예를 들어, (601b)(도 6) 및 비 파워 값을 형성하기 위해 등급값을 제곱하는 제곱 회로 또는 모듈(601,601'), 예를 들어, (601a)(도 6)에 의해 성립된다. 다음에 얻어진 빈 파워 합의 값은 로그 변환기(603)에 의해서 로그 빈 파워 합의 값으로 변환되어 각 프레임에 대한 총 4개의 프레임 파워 값을 제공한다: 하나는 하부 서브-밴드에서의 소음 신호와 관련이 있으며, 하나는 하부 서브-밴드에서의 정보 신호와 관련이 있으며, 하나는 상부 서브-밴드에서의 소음 신호와 관련이 있으며, 및 하나는 상부 서브-밴드에서의 정보 신호와 관련이 있다. 물론 제곱 연산은 단지 많은 가능한 파워-확정 접근법 중의 하나이며, 다른 것도 생각할 수 있다. 하부 서브-밴드 프로세스로 구체적 실시예에서 소음 하부 서브-밴드 프레임 파워 값에 있어서 합한 빈 수 3으로부터의 빈 수 64까지 개개 빈 파워 값을 합하고, 또한 이는 정보 하부 서브-밴드 프레임 파워 값을 위한 것이다. 상부 서브-밴드 프로세스로 정보 상부 서브-밴드 프레임 파워 값 및 소음 상부 서브-밴드 프레임 파워 값에 있어서 빈 수 65에서 빈 수 224로 개개 빈 파워 값을 합한다. 다음에 각 결과에 예를 들어, 도 6에서 (604,604')에 예시된 바와 같이 목적한다면 10일 수 있으며, 각 서브-밴드 및 각 신호에 있어서는 상이할 수 있는 표준화 값으로 곱해서 표준화시킬 수 있다.
이와 같이 얻어진 프레임 파워 값은 특히 소음 프레임 파워 값에 있어서 프레임에서 프레αβ임으로 자연스럽게 다양화되며, 이의 가변성을 감소시키는 것이 바람직할 수 있다. 따라서 프레임 파워 값의 얻어진 4개의 스트림을 개개 프레임 파워 값을 추적하는 평활화 필터(605,605')를 통과시킨다. 이러한 평활화는 로그 영역에서 실행하여 4개의 스트림이 첫째로 상술한 로그 파워 값의 스트림으로 변환된다. 평활화는 도 5에서 505, 505'로 도시되고, 일반적으로 도 6의 저역 통과 평활화 필터(605,605')로 실행되는 저역 통과 필터링 프로세스이다. 임의의 이러한 저역 통과 필터를 이용할 수 있지만, 본 특정 실시예에서는 하기의 식으로 기재되는 필터를 사용한다:
상기 식 (1)에서, Pi는 현재 프레임, 신호, 및 서브-밴드에 대한 탐지된 파워이고, Pi-1은 이전 프레임에 대한 탐지된 파워이며, α와 β는 필터 계수이고, Si는 현재 프레임, 신호, 및 서브-밴드에 대한 합계 파워이며, i는 프레임 인덱스이다. 구체적인 실시예에서, 값 α=0.83(통상적인 값 범위 약 0.5 내지 약 0.95) 및 β=0.134(통상적인 값 범위 약 0.01 내지 약 0.5)가 사용된다.
소음 프레임 파워 값이 정보 프레임 파워 값보다 더 큰 가변성을 가지며, 또한 압축 시스템의 최종 출력으로 도입되는 "펌핑(pumping)" 사운드 특성을 방지하기 위한 느린 반응을 필요로 하기 때문에 두 개의 서브-밴드 소음 프레임 파워 값은 또한 탐지 필터(607)(저역 통과 필터 분류에 있으며, 임의의 이러한 필터는 일반적으로 이러한 기능으로 응용 가능)를 적용시킴으로써 평활화된다. 대표적인 두 개의 서브-밴드 시스템에서, 이러한 평활화는 다음 식으로 나타낸다:
상기 식 (2)에서, Ni는 현재의 프레임과 서브-밴드에 대한 평활화 및 탐지된 소음 파워이고, Ni-1은 이전 프레임에 대한 평활화 및 탐지된 소음 파워이며, δ는 필터 평활화 계수이다. 예를 들어, 값 δ=0.4(통상적인 값 범위는 약 0.1 내지 약 0.8)를 사용한다.
본 명세서에 기술된 실시예에서, 평활화 필터(605,605')는 동일한 특성을 가질 것이며, 만약 이들이 DSP(디지털 신호 프로세서) 코드로 구형된다면 탐지 필터(607)의 도움으로 이루어지는 소음 성분에 사용되는 탐지 필터링과 함께 두 개의 필터를 위해 동일한 코드가 사용될 수 있다. 대안적으로, 평활화 필터(605) 및 탐지 필터(607)는 필터(605')보다 더 큰 일정한 시간을 가질 수 있는 단일 필터로 결합시킬 수 있다.
평활화 및 탐지된 소음 파워로부터 압축 역치 값(compression knee value)은 다음 식 3에 의해서 각 서브-밴드에 대한 계산한다(509, 609):
상기 식 (3)에서, Ki는 현재의 프레임에 대한 압축 역치 값이고, μ는 오프셋 인자이다. 상기 값 μ=-1.2를 사용한다.
도 7a의 곡선을 참조하여 압축 역치 값의 유의성을 설명하며, 실선으로 통합-이득/제로-압축 곡선을 나타내며, 점선으로 약 52 dB에서 나타난 문턱값(threshold)으로 분리되는 하방 확장과 온화한 압축의 결합을 나타내며, 짧은 직선과 점으로 이루어진 선에서 문턱값으로 분리되는 하방 확장과 강한 압축을 나타낸다. 패밀리의 각 "압축" 곡선의 각 곡선은 상이한 수준의 국부 소음에서의 반응을 나타내며, 실선은 낮은 60 dB 근단 소음 수준에서의 반응을 나타내며, 점선은 보다 큰 75 dB 근단 소음 수준에서의 반응을 나타내며, 및 짧은 직선과 점으로 이루어진 선은 큰 90 dB 근단 소음 수준에서의 반응을 나타낸다. 관련된 소음 레벨 그 자체는 수평선으로 나타내며, 실선 소음은 실선 "압축" 곡선 등에 대응한다. 상기 각각의 대응하는 소음 레벨 선 이상의 압축 곡선 부분 또는 보다 명확하게 각각 대응하는 소음 레벨 선의 약 5 dB 이하의 부분은 타당한 명료성을 갖는 근단 수신자가 효과적으로 들을 수 있는 부분을 나타낸다. 즉 사람은 약 -5 dB 이상의 신호 대 소음 비율(SNR)에서의 스피치를 이해할 수 있는 것으로 알려져 있다.
도 7a의 플롯에서, 3개의 "압축" 곡선에 있어서, 대응하는 소음 양이 이들 사이에서 상이하고, 압축 양도 이들 사이에서 상이한 반면에 각각의 근단 소음을 기준으로 명료성 범위에 있는 각 "압축" 곡선의 부분은 세 개의 모든 곡선에서 유사하다. 즉, 근단 주변 소음에 자동으로 반응하는 압축 파라미터를 조정하는 제어 프로세스의 사용을 통해서 재생 드라이드 신호의 동적 범위가 조정될 수 있으며, 신호를 국부 소음 증가로서 더 작은 동적 범위로 압축하여 사람의 통상적인 침묵 동적 범위로 유래되는 신호가 근단 소음 차폐 레벨 이상의 가청도 범위를 나타내는 동적 범위로 압축될 것이다. 플롯에서의 절대값은 예시이지만 이들은 통신 시스템에 사용될 수 있는 수준의 타당한 표시를 구성한다. 실시예 플롯에서 축은 균등 음향 dB SPL로 조정된다. 따라서 입력 신호 축은 사용자가 쌍방향 통신 시스템 예에서 원단 발신자로 직접 수신되도록 할 수 있다면 사용자의 귀에서 일어날 수 있는 원단 신호의 균등 음향 수준을 나타내며, 출력 신호 축은 스피커 전달 사운드의 실제 음향 수준을 나타내며, 소음 신호 축은 국부 소음의 실제 음향 수준을 나타낸다.
상기 압축 역치 값을 평활화 신호 파워와 함께 사용하여 확성기(206)를 구동하기 위해 사용되는 출력 신호를 만들기 위해서 입력 정보 신호의 각 서브-밴드에 이후에 적용되는 (511) 및 (611)에서의 압축 이득(또는 감쇄)을 생성한다. 상기 압축 이득은 하기와 같이 한정한다:
상기 식 (4)에서, Gi는 현재 프레임과 서브-밴드에 대해 로그 형태로 표시된 압축 이득이고, η와 μ는 압축 이득 파라미터이다. 이 예에서, η=0.4(통상적인 값은 약 0.1 내지 약 2임) 및 μ=10(통상적인 값은 약 1 내지 약 100임)을 사용한다. 상기 식의 결과는 도 7b에 도시된 이득 등고선이며, 도 7b에서 식 (4)로부터의 이득은 10을 곱하여 그래핑 목적의 dB로 변환된다.
주어진 잠깐 동안, 특정 서브-밴드에 대해, 식 4는 압축 곡선을 한정하고, 압축 역치 값은 단일 변수이다. 상기 식의 작동은 파라미터가 평온하게 최소 균등 가청 SPL을 나타내는 최소 입력 신호 레벨을 한정하며, 최대 균등 음향 SPL를 나타내는 최대 신호 레벨을 한정하며, 및 수신자가 소음 중에 있는 경우에 가청도를 유지하려고 하는 가장 낮은 음향 SPL를 나타내는 압축 역치 문턱값 레벨을 한정한다. 도 7a에서 나타내는 곡선으로 설명되는 예시적인 실시예에 있어서, 최소 균등 입력 사운드 압력 레벨은 대략 20 dB 이상으로 주어진 파라미터 값으로 설정된다. 이때 그래프의 플롯 부분의 왼쪽에 20 dBSPL의 균등 입력 신호 레벨은 그래프의 왼쪽 측면 너머로 교차하는 세 개의 압축 곡선 지점인 20 dBSPL의 균등 출력 신호 레벨을 생성할 것이다. 다시 도 7a에서 나타내는 곡선으로 설명되는 예시적인 실시예에 있어서 최대 균등 입력 사운드 압력 레벨은 대략 110 dB로 파라미터 값에 의해 설정된다. 그래프의 플롯 부분의 오른쪽인 상기 최대 지점에서 110 dBSPL의 균등 입력 신호 레벨은 110 dBSPL의 균등 출력 신호 레벨을 생성할 것이다. 이는 세 개의 압축 곡선이 그래프의 오른쪽 측면을 너머 교차하는 지점으로서 나타낸다. 세 번째, 도 7a에 도시된 곡선으로 예시된 예시적인 실시예에 대해, (압축이 나타나는 입력 신호 이상의 수준) 압축 역치 문턱값 레벨은 대략 52 dB로 상기에서 주어진 파라미터 값으로 설정된다. 상기 입력 신호 레벨에서, 압축 역치(이득) 값은 신호에 적용된다. 따라서, 입력 신호 레벨 지점에서의 압축 곡선의 높이는 모두를 로그 조건(dB)로 나타내는 경우, 압축 역치 값 더하기 입력 신호 레벨과 동일하다.
상기 단일 값 압축 제어를 가시화하기 위한 하나의 방법으로는 최소 및 최대 지점이 실제 고정되고, 출력 수준이 상기 두 개의 고정 지점에서의 입력 수준과 동일하게 인지하는 것이다. 이러한 시각화로 도움을 주기 위해서, 러버 밴드가 상기 두 개의 지점 사이에서 신장되고, 압축 역치 값을 압축 역치 문턱값 레벨의 위치에서 압축 역치 값에 동일한 양에 의해 러버 밴드를 올려서 적용시키는 경우, 다음에 러버 밴드는 도 7a에 도시된 곡선과 같은 압축 곡선 형태를 취할 것이다. 따라서, 식 (4)를 적용함으로써, 단일 압축 역치 값은 전체 압축 곡선을 결정한다.
상기 압축 제어 방법의 특성은 상기 영역에서 압축 곡선의 하나의 기울기 보다 더 가파른 것으로 확인되는 것과 같이 압축 역치 문턱값의 왼쪽에 생성되는 하방 팽창이다. 상기 문턱값을 원하는 가장 낮은 기대 입력 신호 레벨 이하로만 선택함으로써, 입력 신호에 포함되는 낮은 레벨 소음 성분의 증폭이 방지되며, 대신에 이러한 원하지 않는 성분은 억제된다.
압축 이득 Gi가 식 (4)로 정의된 후, 상기 이득은 다음과 같이 선형 형태로 변환될 수 있다:
상기 식 (5)에서, Gfi는 현재 프레임과 신호 서브-밴드의 선형 이득 인자이다. 따라서, 예시적인 실시예에 대해 식 (5)로 예시된 바와 같이, 압축 이득은 "2"로 식 (4)에 의해 주어진 값을 나누고, 선형 이득 인자를 생성하기 위해 이 파워에 10을 올림으로써 로그 영역으로부터 선형 영역으로 다시 변환된다. 이는, 도 6의 역로그 변환기 및 팽창기(613)의 일 부분에 의해 수행된 바와 같이, 도 5에서 513으로 도시된다. 이는 각 서브-밴드에 대해 프레임당 하나의 선형 이득 인자를 생성한다.
이때, 데이터의 각 프레임에 대응하는 두 개의 서브-밴드 선형 이득 인자가 있다. 이러한 인자는 각 서브-밴드에서 (도 5의 513, 도 6의 613) 모든 빈과 관련된 각각의 빈 수에 적절한 선형 이득 인자를 할당하여 257 개별 빈 이득 인자로 다시 확장한다. 제로 값은 임의의 서브-밴드 내가 아닌 곳에서 빈으로 할당된다. 인접한 서브-밴드가 일반적으로 여러 가지 선형 이득 인자를 가지므로, 주파수 평활화를 적용시키지 않는다면 인접한 서브-밴드 경계선을 가로지르는 이득에서의 단계가 있을 것이며, 이로 인해 가청 신호의 왜곡이 일어난다. 주파수 빈 이득 인자를 가로지르는 평활화는 압축 이득이 선형 영역으로 다시 변환되고 개별 빈 이득 인자로 확장된 후(513) 적용될 수 있다(도 5의 515). 평활화는 도 6의 컨벌버(convolver)/스플라인(spline) 보간기(interpolator)(615)로 보다 구체적으로 예시된 바와 같이, 선택적으로 적용될 수 있다. 예를 들어, 테이블(614)로부터 판독될 수 있거나, 또는 식으로 계산될 수 있거나 또는 다른 방법으로 판독될 수 있는 커널(Kernel)로 알려진 일련의 테이퍼링 값을 사용하여, 컨벌버/스플라인 보간기(615)는 빈 이득 인자로 평활화 커널을 감아 인접한 서브-밴드 사이의 전송을 가로지르는 빈 이득 값을 평활화시킨다. 대안적으로, 스플라인으로 알려진 짧은 커널은 빈 이득 인자로 다중화시켜 경계선을 가로질러 인자를 평활화시킬 수 있다. 주파수를 가로지르는 평활화를 위한 다른 방법도 기술 분야에 잘 공지되어 있으며, 임의의 방법도 생각할 수 있다. 평활화 프로세스로 일련의 빈 압축 이득을 생성하고, 하나는 각 주파수 빈과 관련이 있다. 이러한 결과적인 빈 압축 이득은 (517) 및 (617)에서 각각의 빈 압축 이득에 의해 각 빈에서 신호를 곱하여 정보 신호에 적용된다. 각 서브-밴드에 대한 얻어진 처리 출력 신호는 도 5에서 (519), 도 6에서 (619)로 도시된다.
빈 압축 이득을 적용시킨 후, 얻어진 감쇄 주파수 멀티-밴드 신호(519, 619)는 잘 알려진 인버스 STFT 중첩 가산법으로 결합한다. 이는 도 3에서 신호 분해 블록(310)으로 도시된다. 상기 분해 결과는 (312)에서 압축 풀 밴드 출력 신호로서, 이는 확성기(306)를 구동하기 위해 사용되는 출력 신호이다(도 2). 대안적으로, 예시적인 시간-영역 구현에서, 각 밴드 제한 서브-밴드 신호는 (517, 617)에서 그 각각의 서브-밴드 선형 이득 인자가 곱해지고(도 5와 6), 각각의 서브-밴드에 대한 다중 처리 출력 신호는 재조합 단계 또는 회로(310)에서 더해져서 (312)에서 압축 풀 밴드 출력 신호를 제공하고, 이 신호는 확성기(206)을 구동하기 위해 사용되는 출력 신호이다 (도 2).
도 7b에 도시된 이득 등고선 플롯은 서브-밴드에 대한 이득 등고선을 나타낸다. 도 7b의 이득 등고선 플롯에서, 수직 축은 확성기(306)를 구동하기 위해 사용된 재생 정보 신호의 관련 서브-밴드에 적용되는 이득이다. 이는, 인디케이터(208)로부터 입력 국부(근단) 주변 소음의 레벨과 정보원(204)으로부터 입력 정보 신호의 순간적인 레벨 모두의 함수인 것으로 볼 수 있다. 도 7c는 확성기(206)를 구동하기 위해 사용되는 재생 신호 레벨의 등고선으로서, 이는 인디케이터(208)로부터 입력 국부(근단) 주변 소음의 레벨과 정보원(204)으로부터 입력 정보 신호의 순간적인 레벨 모두의 함수로 도시된다.
소음과 정보 신호 모두의 프로세싱에서, 이들의 크기보다는 신호 파워가 사용된다. 신호 파워를 사용함으로써, 처리된 출력 신호를 획득하기 위한 컴퓨터화 파워 요구사항이 최소화된다. 그러나, 대안적으로, 크기가 또한 사용될 수 있고, 이러한 작업이 또한 생각된다. 또한, 평활화는 선형 영역보다는 로그 영역에서 필터에 의해 수행되므로, 로그 평균 둘레에서 로그 대칭을 제공하고, 이는 선형 영역의 필터링과 분명하게 다르다. 사람의 청력에서 시끄러움을 인지하는 것은 로그 특성을 따르는 것으로 알려져 있으므로, 이 프로세스는 선형 영역 프로세싱과 반대로, 매우 자연스러운 사운딩 결과를 제공한다. 그렇지만, 이러한 특징은 제한하는 것으로 의도되지 않고, 선형뿐만 아니라 다른 비선형 대안도 생각할 수 있다.
본 명세서에 설명된 바와 같이, 상기 구성으로 얻어지는 이점은 압축 역치 값(압축 문턱값에서 적용된 이득의 값)을 제어하여 압축을 제어한다는 것이다. 즉, 출력 신호 레벨은 최대 spl(예를 들어, 110 db spl, 범위 90~120) 및 최소 spl(예를 들어, 20 db spl, 범위 10~40)에서 입력 신호 레벨(이득=1)의 값으로 유지될 수 있다. 다음으로, 압축 역치 문턱값(예를 들어, 52 db spl, 범위는 40~75)에서 적용될 순간적인 이득이 계산된다. 압축 역치 문턱값은 입력 신호 레벨로, 이 레벨에서 입력 신호가 압축 역치 문턱값 전체에서 증가할 때 하방 확장으로부터 압축까지 전이가 일어난다. 근단 소음 함수로 압축 문턱값에 적용되는 이득(압축 역치 값)을 결정하고, 상기 압축 역치 값을 기초로 하는 압축/확장 곡선을 유도한다. 압축 곡선에서 다른 모든 지점은 세 개의 지점 사이를 선형으로 보간하여 간단히 확인된다 (도 7a 참조). 따라서, 임의의 하나의 프레임과 임의의 하나의 밴드에 대한 적용 이득은 입력 신호 진폭 및 압축/확장 곡선의 함수이며, 상기 압축/확장 곡선은 그 자체가 근단 소음 수준의 함수이다. 따라서, 적용되는 이득은 원단 신호의 진폭 및 근단 소음의 진폭 모두로 제어된다. 상기 접근법은 단지 하나의 수만이 계산을 위해 필요하고, 하나의 수는 전체 압축/확장 곡선(프레임 당, 서브-밴드 당)을 한정할 수 있음을 의미한다.
따라서, 파워 측정 자체가 가장 중요하지 않음이 분명하다. 보다 중요하게도, 얻어지는 것은 "프로파일" 또는 저장을 필요로 하지 않는 간단한 계산이고, 원단 신호 레벨과 근단 소음 레벨 모두에 반응하는 적절한 양의 압축/확장을 제공한다.
실시예 및 용도가 도시되고 기술되었지만, 본 기재 내용의 이점을 갖는 당업자에게 본 명세서에 기재된 본 발명의 개념을 벗어나지 않으면서 상술한 것보다 더 많은 변형이 가능하다는 것이 명백할 것이다. 예를 들어, 소음 또는 정보 어느 것이든 신호의 파워를 탐지하는 것은 필수적으로 엔밸럽 형태이고, 임의 유형의 엔밸럽 감지(또는 엔밸럽 팔로잉/팔로우어)는 본 발명의 범위 내에 있다. 따라서, 본 발명은 첨부된 청구 범위의 사상을 제외하고 제한되지 않는다.
Claims (1)
- 동적 사운드 전달 방법에 있어서,
주변 소음을 나타내는 주변 소음 신호를 수신하는 단계;
정보 신호를 수신하는 단계;
상기 주변 소음 신호의 수준의 함수로 미리 결정된 정보 신호 문턱값 수준에서 압축 역치를 결정하는 단계;
상기 압축 역치에 기초하여 압축/확장 함수를 생성하는 단계; 및
이득-제어 출력 신호를 생성하기 위하여, 상기 정보 신호에 상기 압축/확장 함수로부터 결정된 압축/확장 특성을 적용하는 단계;를 포함하는 것을 특징으로 하는
동적 사운드 전달 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/150,970 US8085941B2 (en) | 2008-05-02 | 2008-05-02 | System and method for dynamic sound delivery |
US12/150,970 | 2008-05-02 | ||
PCT/US2009/042629 WO2009135192A1 (en) | 2008-05-02 | 2009-05-01 | System and method for dynamic sound delivery |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107027012A Division KR101541452B1 (ko) | 2008-05-02 | 2009-05-01 | 동적 사운드 전달을 위한 재생 시스템, 회로, 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20130115382A true KR20130115382A (ko) | 2013-10-21 |
Family
ID=41255465
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107027012A KR101541452B1 (ko) | 2008-05-02 | 2009-05-01 | 동적 사운드 전달을 위한 재생 시스템, 회로, 장치 및 방법 |
KR1020137023675A KR20130115382A (ko) | 2008-05-02 | 2009-05-01 | 동적 사운드 전달을 위한 시스템과 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107027012A KR101541452B1 (ko) | 2008-05-02 | 2009-05-01 | 동적 사운드 전달을 위한 재생 시스템, 회로, 장치 및 방법 |
Country Status (11)
Country | Link |
---|---|
US (1) | US8085941B2 (ko) |
EP (1) | EP2283484B1 (ko) |
JP (2) | JP5542122B2 (ko) |
KR (2) | KR101541452B1 (ko) |
CN (1) | CN102016984B (ko) |
AU (1) | AU2009242464B2 (ko) |
BR (1) | BRPI0911587B1 (ko) |
CA (1) | CA2722883C (ko) |
ES (1) | ES2548977T3 (ko) |
MY (1) | MY151363A (ko) |
WO (1) | WO2009135192A1 (ko) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009086174A1 (en) | 2007-12-21 | 2009-07-09 | Srs Labs, Inc. | System for adjusting perceived loudness of audio signals |
US8254590B2 (en) * | 2009-04-29 | 2012-08-28 | Dolby Laboratories Licensing Corporation | System and method for intelligibility enhancement of audio information |
US20100318353A1 (en) * | 2009-06-16 | 2010-12-16 | Bizjak Karl M | Compressor augmented array processing |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
JP2012070024A (ja) * | 2010-09-21 | 2012-04-05 | Mitsubishi Electric Corp | 音声ダイナミックレンジコントロール装置 |
KR101726738B1 (ko) * | 2010-12-01 | 2017-04-13 | 삼성전자주식회사 | 음성처리장치 및 그 방법 |
US8718562B2 (en) * | 2011-05-20 | 2014-05-06 | Skype | Processing audio signals |
US8965774B2 (en) * | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
US9423944B2 (en) | 2011-09-06 | 2016-08-23 | Apple Inc. | Optimized volume adjustment |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
EP2880655B8 (en) * | 2012-08-01 | 2016-12-14 | Dolby Laboratories Licensing Corporation | Percentile filtering of noise reduction gains |
US20140278393A1 (en) | 2013-03-12 | 2014-09-18 | Motorola Mobility Llc | Apparatus and Method for Power Efficient Signal Conditioning for a Voice Recognition System |
US20140270249A1 (en) | 2013-03-12 | 2014-09-18 | Motorola Mobility Llc | Method and Apparatus for Estimating Variability of Background Noise for Noise Suppression |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
JP6593173B2 (ja) | 2013-12-27 | 2019-10-23 | ソニー株式会社 | 復号化装置および方法、並びにプログラム |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
US9484043B1 (en) * | 2014-03-05 | 2016-11-01 | QoSound, Inc. | Noise suppressor |
US10446168B2 (en) * | 2014-04-02 | 2019-10-15 | Plantronics, Inc. | Noise level measurement with mobile devices, location services, and environmental response |
CN103915103B (zh) * | 2014-04-15 | 2017-04-19 | 成都凌天科创信息技术有限责任公司 | 语音质量增强系统 |
GB201509483D0 (en) * | 2014-12-23 | 2015-07-15 | Cirrus Logic Internat Uk Ltd | Feature extraction |
EP3038106B1 (en) * | 2014-12-24 | 2017-10-18 | Nxp B.V. | Audio signal enhancement |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
US9401158B1 (en) * | 2015-09-14 | 2016-07-26 | Knowles Electronics, Llc | Microphone signal fusion |
WO2018144367A1 (en) | 2017-02-03 | 2018-08-09 | iZotope, Inc. | Audio control system and related methods |
WO2019005885A1 (en) * | 2017-06-27 | 2019-01-03 | Knowles Electronics, Llc | POST-LINEARIZATION SYSTEM AND METHOD USING A TRACKING SIGNAL |
US10491179B2 (en) * | 2017-09-25 | 2019-11-26 | Nuvoton Technology Corporation | Asymmetric multi-channel audio dynamic range processing |
US11894006B2 (en) | 2018-07-25 | 2024-02-06 | Dolby Laboratories Licensing Corporation | Compressor target curve to avoid boosting noise |
CN108962268B (zh) * | 2018-07-26 | 2020-11-03 | 广州酷狗计算机科技有限公司 | 确定单声道的音频的方法和装置 |
CN112437957B (zh) * | 2018-07-27 | 2024-09-27 | 杜比实验室特许公司 | 用于全面收听的强加间隙插入 |
CN111726730A (zh) * | 2019-03-18 | 2020-09-29 | 塞舌尔商元鼎音讯股份有限公司 | 声音播放装置及其调整输出声音的方法 |
US11418894B2 (en) * | 2019-06-01 | 2022-08-16 | Apple Inc. | Media system and method of amplifying audio signal using audio filter corresponding to hearing loss profile |
CN112992123B (zh) * | 2021-03-05 | 2024-07-12 | 西安交通大学 | 一种语音特征提取电路及方法 |
CN114554353B (zh) * | 2022-02-24 | 2024-01-16 | 北京小米移动软件有限公司 | 音频处理方法、装置、设备及存储介质 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3422023C2 (de) * | 1984-06-14 | 1987-04-23 | Drägerwerk AG, 2400 Lübeck | Lungenautomat für Atemschutzgerät |
US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4887299A (en) * | 1987-11-12 | 1989-12-12 | Nicolet Instrument Corporation | Adaptive, programmable signal processing hearing aid |
GB2239971B (en) | 1989-12-06 | 1993-09-29 | Ca Nat Research Council | System for separating speech from background noise |
JPH05110362A (ja) * | 1991-10-18 | 1993-04-30 | Mitsubishi Electric Corp | 車載音響装置 |
US5434922A (en) * | 1993-04-08 | 1995-07-18 | Miller; Thomas E. | Method and apparatus for dynamic sound optimization |
FI102337B (fi) * | 1995-09-13 | 1998-11-13 | Nokia Mobile Phones Ltd | Menetelmä ja piirijärjestely audiosignaalin käsittelemiseksi |
FI99062C (fi) | 1995-10-05 | 1997-09-25 | Nokia Mobile Phones Ltd | Puhesignaalin taajuuskorjaus matkapuhelimessa |
JPH09311696A (ja) * | 1996-05-21 | 1997-12-02 | Nippon Telegr & Teleph Corp <Ntt> | 自動利得調整装置 |
JPH11234068A (ja) * | 1998-02-16 | 1999-08-27 | Mitsubishi Electric Corp | ディジタル音声放送受信機 |
JP4288433B2 (ja) * | 1998-12-25 | 2009-07-01 | ソニー株式会社 | 音声信号処理装置及びこれを具備した電子機器 |
US6970558B1 (en) | 1999-02-26 | 2005-11-29 | Infineon Technologies Ag | Method and device for suppressing noise in telephone devices |
US6507623B1 (en) * | 1999-04-12 | 2003-01-14 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by time-domain spectral subtraction |
JP2001298394A (ja) * | 2000-04-12 | 2001-10-26 | Ntt Docomo Inc | 携帯電話装置 |
JP2002051108A (ja) * | 2000-08-04 | 2002-02-15 | Matsushita Electric Ind Co Ltd | 電話装置および着信音制御方法 |
US20030223597A1 (en) | 2002-05-29 | 2003-12-04 | Sunil Puria | Adapative noise compensation for dynamic signal enhancement |
US7333618B2 (en) * | 2003-09-24 | 2008-02-19 | Harman International Industries, Incorporated | Ambient noise sound level compensation |
EP1580882B1 (en) * | 2004-03-19 | 2007-01-10 | Harman Becker Automotive Systems GmbH | Audio enhancement system and method |
US7433463B2 (en) | 2004-08-10 | 2008-10-07 | Clarity Technologies, Inc. | Echo cancellation and noise reduction method |
CN1870135A (zh) * | 2005-05-24 | 2006-11-29 | 北京大学科技开发部 | 基于掩蔽曲线的数字助听器频响补偿方法 |
JP4926005B2 (ja) * | 2007-11-13 | 2012-05-09 | ソニー・エリクソン・モバイルコミュニケーションズ株式会社 | 音声信号処理装置及び音声信号処理方法、通信端末 |
-
2008
- 2008-05-02 US US12/150,970 patent/US8085941B2/en active Active
-
2009
- 2009-05-01 BR BRPI0911587-0A patent/BRPI0911587B1/pt active IP Right Grant
- 2009-05-01 KR KR1020107027012A patent/KR101541452B1/ko active IP Right Grant
- 2009-05-01 AU AU2009242464A patent/AU2009242464B2/en active Active
- 2009-05-01 ES ES09739994.3T patent/ES2548977T3/es active Active
- 2009-05-01 WO PCT/US2009/042629 patent/WO2009135192A1/en active Application Filing
- 2009-05-01 EP EP09739994.3A patent/EP2283484B1/en active Active
- 2009-05-01 JP JP2011507702A patent/JP5542122B2/ja active Active
- 2009-05-01 CN CN2009801158414A patent/CN102016984B/zh active Active
- 2009-05-01 MY MYPI2010004718A patent/MY151363A/en unknown
- 2009-05-01 CA CA2722883A patent/CA2722883C/en active Active
- 2009-05-01 KR KR1020137023675A patent/KR20130115382A/ko not_active Application Discontinuation
-
2013
- 2013-02-15 JP JP2013027425A patent/JP6104629B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
MY151363A (en) | 2014-05-15 |
EP2283484A1 (en) | 2011-02-16 |
US20090274310A1 (en) | 2009-11-05 |
EP2283484A4 (en) | 2012-08-15 |
CA2722883C (en) | 2014-09-30 |
KR101541452B1 (ko) | 2015-08-03 |
KR20110002494A (ko) | 2011-01-07 |
CN102016984B (zh) | 2013-08-28 |
CN102016984A (zh) | 2011-04-13 |
JP2013117734A (ja) | 2013-06-13 |
AU2009242464A1 (en) | 2009-11-05 |
WO2009135192A1 (en) | 2009-11-05 |
EP2283484B1 (en) | 2015-07-29 |
JP5542122B2 (ja) | 2014-07-09 |
BRPI0911587B1 (pt) | 2020-03-03 |
US8085941B2 (en) | 2011-12-27 |
JP6104629B2 (ja) | 2017-03-29 |
ES2548977T3 (es) | 2015-10-22 |
CA2722883A1 (en) | 2009-11-05 |
JP2011523086A (ja) | 2011-08-04 |
AU2009242464B2 (en) | 2012-01-19 |
BRPI0911587A2 (pt) | 2016-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101541452B1 (ko) | 동적 사운드 전달을 위한 재생 시스템, 회로, 장치 및 방법 | |
CN100555848C (zh) | 音频信号处理系统 | |
US9299333B2 (en) | System for adaptive audio signal shaping for improved playback in a noisy environment | |
US8588430B2 (en) | Controlling an adaptation of a behavior of an audio device to a current acoustic environmental condition | |
JP4649546B2 (ja) | 補聴器 | |
US20140188466A1 (en) | Integrated speech intelligibility enhancement system and acoustic echo canceller | |
KR20060061259A (ko) | 잔향 추정 및 억제 시스템 | |
KR20240007168A (ko) | 소음 환경에서 음성 최적화 | |
US8254590B2 (en) | System and method for intelligibility enhancement of audio information | |
EP3830823B1 (en) | Forced gap insertion for pervasive listening | |
US20230320903A1 (en) | Ear-worn device and reproduction method | |
JP2002064617A (ja) | 反響抑圧方法・反響抑圧装置 | |
US11259117B1 (en) | Dereverberation and noise reduction | |
US20240339101A1 (en) | Ear-worn device and reproduction method | |
US20190355341A1 (en) | Methods and apparatus for playback of captured ambient sounds | |
KR20070022206A (ko) | 오디오 신호 처리를 위한 시스템 | |
Hedlund et al. | Quantification of audio quality loss after wireless transfer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E601 | Decision to refuse application |