KR20130096625A - 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치 - Google Patents
오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치 Download PDFInfo
- Publication number
- KR20130096625A KR20130096625A KR1020120148590A KR20120148590A KR20130096625A KR 20130096625 A KR20130096625 A KR 20130096625A KR 1020120148590 A KR1020120148590 A KR 1020120148590A KR 20120148590 A KR20120148590 A KR 20120148590A KR 20130096625 A KR20130096625 A KR 20130096625A
- Authority
- KR
- South Korea
- Prior art keywords
- audio signal
- noise
- signal
- audio
- level
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers without distortion of the input signal
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/32—Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Abstract
오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치가 제공된다. 상기 방법은 다음 단계를 포함한다. 환경 노이즈는 컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라서 음성 구간 검출을 실행함으로써 검출된다. 노이즈 정보는 검출된 환경 노이지 및 제 1 오디오 신호에 따라 획득된다. 제 2 오디오 신호는 노이즈 정보 및 제 1 오디오 신호에 따라 출력되되, 컴퓨팅 장치에 의해 조정가능한 헤드룸 하에서 제 1 오디오 신호를 증폭시킴으로써 출력된다.
Description
기술된 실시예들은 일반적으로 오디오 명료도 향상(audio intelligibility enhancement)에 관한 것으로, 특히, 신호 및 컴퓨팅 장치(computing apparatus)에 있어 오디오 명료도 향상을 위한 방법 및 장치에 관한 것이다.
경험에 있어 전화 통화 동안 오디오의 품질은 모바일 폰 사용자에게 중요하다. 일부 모바일 폰은 출력되는 오디오 신호에 있는 환경적인 노이즈를 감소시킴으로써, 통화 중 출력되는 오디오 신호의 품질을 향상시키기 위해 노이즈 감소를 사용한다. 한편, 입력되는 오디오 신호의 품질은 환경 노이즈로 인해 악화된다. 이 경우에, 모바일 폰 사용자는 모바일 폰의 볼륨을 수동으로 보다 크게 한다. 이러한 접근 방식은 사용자에게 불편함을 주고 볼륨이 전반적으로 커지는 경우, 청취하는 중에 적절한 품질을 얻을 수가 없다.
본 발명의 목적은 재생용 신호에 대한 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치를 제공하는 것에 있다.
일 실시예에 따라서, 오디오 명료도를 향상시키는 방법이 제공된다. 상기 방법은 다음 단계를 포함한다. 환경 노이즈는 컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라서 음성 구간 검출(voice activity detection)을 실행함으로써 검출된다. 노이즈 정보는 검출된 환경 노이지 및 제 1 오디오 신호에 따라 획득된다. 제 2 오디오 신호는 노이즈 정보 및 제 1 오디오 신호에 따라 출력되되, 컴퓨팅 장치에 의해 조정가능한 헤드룸(adjustable headroom) 하에서 제 1 오디오 신호를 증폭시킴으로써 출력된다.
또 다른 실시예에 따라서, 오디오 명료도를 향상시키는 장치가 제공된다. 장치는 환경 노이즈 판별 유닛 및 명료도 향상 유닛을 포함한다. 환경 노이즈 판별 유닛은 컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 환경 노이즈를 검출하기 위해 사용된다. 환경 노이즈 판별 유닛에 연결된 명료도 향상 유닛은 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하기 위해, 그리고 노이즈 정보 및 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하기 위해 사용된다.
대안적인 실시예에 따라서, 컴퓨팅 장치가 제공된다. 컴퓨팅 장치는 적어도 하나의 마이크로폰, 컴퓨팅 장치를 제어하는 프로세싱 유닛, 통신 유닛 및 오디오 명료도를 향상시키는 신호 프로세싱 유닛을 포함한다. 오디오 명료도를 향상시키는, 프로세싱 유닛과 통신 유닛이 연결된 신호 프로세싱 유닛은 환경 노이즈 판별 유닛 및 명료도 향상 유닛을 포함한다. 환경 노이즈 판별 유닛은 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라서 환경 노이즈를 검출하기 위해 사용된다. 환경 노이즈 판별 유닛에 연결된 명료도 향상 유닛은 검출되는 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하기 위해, 그리고 노이즈 정보 및 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하기 위해 사용된다.
도 1은 실시예에 따른 오디오 명료도를 향상시키는 방법의 순서도;
도 2는 실시예에 따른 컴퓨팅 장치의 블럭도;
도 3a는 실시예에 따른 컴퓨팅 장치에서 오디오 명료도를 향상시키는 시스템의 블럭도;
도 3b는 명료도 향상 유닛의 또 다른 실시예의 블럭도;
도 4는 오디오 명료도 향상 유닛의 동작 실시예의 도면;
도 5는 서로 다른 주파수 대역에 의해 다운링크 음성을 증폭시키는 실시예의 도면;
도 6은 SNR 평가 방식에 의한 노이즈 정보의 실시예의 도면이다.
설명을 목적으로 하는 다음의 상세한 설명에서, 다수의 특정 설명은 개시된 실시예의 전반적인 이해를 제공하기 위해서 개시된다. 그러나, 분명한 바와 같이, 하나 이상의 실시예는 이러한 특정 설명 없이 실행될 수 있다. 다른 예에서, 매우 잘 알려진 구조 및 장치는 도면을 간단하게 하기 위해 개략적으로 도시된다.
도 2는 실시예에 따른 컴퓨팅 장치의 블럭도;
도 3a는 실시예에 따른 컴퓨팅 장치에서 오디오 명료도를 향상시키는 시스템의 블럭도;
도 3b는 명료도 향상 유닛의 또 다른 실시예의 블럭도;
도 4는 오디오 명료도 향상 유닛의 동작 실시예의 도면;
도 5는 서로 다른 주파수 대역에 의해 다운링크 음성을 증폭시키는 실시예의 도면;
도 6은 SNR 평가 방식에 의한 노이즈 정보의 실시예의 도면이다.
설명을 목적으로 하는 다음의 상세한 설명에서, 다수의 특정 설명은 개시된 실시예의 전반적인 이해를 제공하기 위해서 개시된다. 그러나, 분명한 바와 같이, 하나 이상의 실시예는 이러한 특정 설명 없이 실행될 수 있다. 다른 예에서, 매우 잘 알려진 구조 및 장치는 도면을 간단하게 하기 위해 개략적으로 도시된다.
컴퓨팅 장치의 재생 신호를 위해 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치의 실시예들이 제공된다. 도 1은 실시예에 따른 컴퓨팅 장치의 오디오 명료도를 향상시키는 방법의 순서도를 도시한다. 이러한 방법의 실시예에 따라서, 다운링크 음성(downlink voice)의 오디오 명료도는 통화 중에 향상될 수 있는데, 통화가 노이즈 환경에 있거나 노이즈 환경에 처하게 될 경우에도 그러하다. 다른 실시예들에서, 방법은 또한 재생 동안, 예를 들면, 오디오 파일, 멀티미디어 파일, 스트림식 오디오 또는 비디오(예를 들면, 컴퓨팅 장치 상의 유투브로부터 비롯된 시청 비디오물)를 재생시킴으로써, 멀티미디어 소스로부터 나오는 동안 오디오가 가능한 사운드의 명료도를 향상시키기 위해서 사용될 수 있는데, 환경 노이즈가 너무 시끄러울 경우에도 그러하다. 나아가, 모바일 장치의 하드웨어 및 사용자의 청취를 위한 보호물은 추가로 오디오 명료도를 향상시키는 것에서 고려될 수 있다.
방법은 컴퓨팅 장치, 예를 들면, 음성 통신 기능(전화 기술, 모바일 통신 VoIP 등)을 가진 컴퓨팅 장치, 예를 들면, 모바일 폰, 스마트 폰, 태블릿 컴퓨터, 노드 북 컴퓨터 등에서 사용될 수 있다. 모바일 장치가 얻어질 수 있는 구조는 도 2에 도시된 대표적인 실시예에 나타나 있으며, 모바일 장치(2)는 신호 프로세싱 유닛(21), 통신 유닛(23), 프로세싱 유닛(25)(예를 들면, 싱글 코어 또는 멀티 코어를 구비함), 적어도 하나의 마이크로폰(M1), 및 적어도 하나의 스피커(SK1)를 포함한다. 예를 들면, 방법은 신호 프로세싱 유닛(21)에서 사용될 수 있고, 상기 신호 프로세싱 유닛은 통신 유닛(23)(하나 이상의 통신 표준, 예를 들면, 2G, 3G, 3.5G, LTE, 4G를 지원함)으로부터 다운링크 음성 신호(SRx)를 수신하고, 업링크 음성 신호(STx)를 통신 유닛(23)으로 출력한다.
다른 예에서, 방법은 멀티미디어 기능을 가진 컴퓨팅 장치, 예를 들면 퍼스널 컴퓨터, 랩탑, 멀티미디어 장치, 게임 장치 등에 사용될 수 있어서, 오디오 명료도를 향상시킬 수 있다. 예를 들면, 방법은 신호 프로세싱 유닛(21)에 사용될 수 있고, 상기 신호 프로세싱 유닛은 프로세싱 유닛(25) 또는 통신 유닛(23)(또는 심지어 멀티미디어 칩 또는 소스)로부터 나온 오디오 신호(SRx)를, 멀티미디어 소스, 즉, 오디오 또는 멀티미디어 데이터, 예를 들면, 컴퓨팅 장치에 저장된 음악 또는 비디오 파일, 또는 원격 장치, 웹사이트 또는 네트워크 클라우드의 장치로부터 나온 스트림식 오디오 또는 비디오(예를 들면, 모바일 장치에서 유투브 시청)를 재생하는 동안에 수신한다. 나아가, 방법은 무선 네트워크 기능(예를 들면, Wi-Fi)을 가진 모바일 장치에 사용될 수도 있어서, IP-기반 음성 통신 또는 스트림식 멀티미디어를 위해 오디오 명료도를 향상시킬 수 있다.
도 1을 참조하면, 단계 S10에서, 환경 노이즈는 예를 들면 음성 구간 검출(VAD)을 실행함으로써, 검출되는 오디오 신호에 따라 검출된다. 예를 들면, 검출되는 오디오 신호는 통화(예를 들면, 텔레폰, 모바일 통신 또는 IP 음성(Voice-over-IP)) 동안 업링크를 위해, 또는 오디오 또는 멀티미디어 데이터 재생 동안 업링크 없이, 적어도 하나의 마이크로폰, 예를 들면 마이크로폰(M1)으로부터 나온 신호이다. 단계 S20에서, 노이즈 정보는 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 획득되며, 상기 제 1 오디오 신호는 오디오 명료도, 예를 들면 다운링크 음성 신호(예를 들면, SRx), 또는 프로세싱 유닛(21) 또는 멀티미디어 칩 또는 소스로부터 나온 오디오 신호 등을 향상시킨다. 단계 S30에서, 제 2 오디오 신호는 노이즈 정보 및 제 1 오디오 신호에 따라서 출력되고, 예를 들면 증대(또는 증폭)되어 출력된다. 그 후, 제 2 오디오 신호는 제 1 오디오 신호의 오디오-명료도-향상 버전으로 간주될 수 있다. 일부 실시예에서, 제 2 오디오 신호(디지털 또는 아날로그 형태일 수 있음)는 스피커 또는 헤드셋을 가진 컴퓨팅 장치에 의해 재생될 수 있거나, 다른 목적을 위해, 예를 들면 컴퓨팅 장치에 의해 녹음을 위해, 외부 스피커에 의한 재생을 위해, 또는 컴퓨팅 장치를 통해 무선으로 방송을 위해 출력된다.
대표적인 실시예에서, 제 2 오디오 신호는 컴퓨팅 장치에 의해 조정가능한 헤드룸 하에서 제 1 오디오 신호를 증폭시킴으로써, 출력된다. 다른 실시예들에서, 노이즈 정보는 제 1 오디오 신호와 관련되어 검출되는 환경 노이즈의 측정 레벨을 나타낸다. 예를 들면, 노이즈 정보, 예를 들면, 신호 대 노이즈 비 또는 노이즈 신호 강도 또는 다른 노이즈 측정은 단계 S30에서 사용되기 위해 판별될 수 있되, 예를 들면, 제 1 오디오 신호를 증폭시키기 위해 판별될 수 있다.
도 1의 방법에 의해 예시화되는 이러한 방식으로, VAD를 사용하여 검출되는 오디오 신호(예를 들면 마이크로폰으로부터 나온 신호)로부터 검출된 환경 노이즈의 어플리케이션은 제 1 오디오 신호에 대해 오디오 명료도를 용이하게 향상시킨다(예를 들면, 다운링크 음성 신호(SRx) 또는 재생용 오디오 신호). 특히, VAD를 사용하여 검출된 환경 노이즈는 단계 S20에서 충분히 정확하게 맞아서, 단계 S30의 예시에서 이후의 판별 및 증폭을 하기 위해 신뢰가능한 노이즈 정보를 제공할 수 있다. 이러한 접근법은 또한 단계 S30의 예에서, 환경 노이즈로서의 음성 또는 사운드의 부정확한 판별 및 부적절하거나 비정상적인 증대 또는 다운링크 음성 신호의 증폭을 방지할 수 있다.
예에서, 단계 S30에서는 증폭된 다운링크 음성 신호를 타깃 레벨(예를 들면, 3dB)보다 크지 않은 신호-대-노이즈(SNR) 비를 유지시키는 것이 실행될 수 있다. 검출된 환경 노이즈가 -15dB의 레벨(Le로 표시)을 가지고, 다운링크 음성 신호가 -30dB의 레벨(Ld로 표시)에 있는 경우, 증폭된 다운링크 음성 신호는 Ld의 신호 레벨에 값 Lg를 더한 것이 될 수 있어서, 타깃 레벨을 달성할 수가 있다.
노이즈 환경에 대하여, 컴퓨팅 장치의 사용자는 노이즈 환경에 처해 통화를 하는 동안, 다운링크 오디오 신호의 형편없는 오디오 명료도에 고통스러워할 수 있는데, 스피커의 볼륨이 커질 경우에도 그러하다. 최악의 경우는, 너무 증폭된 다운링크 음성 신호의 구동은 오디오 구성요소 또는 스피커에 하드웨어 손상을 줄 수 있다. 너무 증폭된 다운링크 음성 신호는 사용자가 청취하는데 있어 불편한 청취 경험을 제공할 수 있거나 심지어 유해할 수도 있다. 이에 대해, 이루 예에서, 값 Lg는 모바일 장치의 신호 품질 또는 하드웨어 보호를 위해, 헤드룸(즉, 최대로 증가할 수 있는 허용가능한 게인) 내에 있도록 고안될 수 있다. 헤드룸은 또한 명목상의 신호 값과 왜곡이 없이 최대 값 간의 차이로 정의될 수도 있다. 예를 들면, 상기의 숫자 예에 이어, 헤드룸은 10dB로 미리 판별될 수 있고, 그 결과 증폭된 다운링크 음성 신호는 -5dB(즉, -15dB + 10dB)의 신호 레벨을 가지도록 증폭될 수 있다.
그러나, 다운링크 음성 신호의 신호 레벨이 크거나 최대 레벨(예를 들면, 0 dB)에 근접한 상황에서, 증폭된 다운링크 음성 신호는 왜곡될 수 있다. 도 4에 도시된 경우에서, 검출된 환경 노이즈의 레벨(Le)이 -2dB이고 다운링크 음성 신호가 시간(t1) 전에 -9dB의 레벨(Ld)에 있는 경우, 증폭된 다운링크 음성 신호는 +1dB(즉, -9dB + 10dB)의 신호 레벨(Lx)을 가질 수 있는 것으로 기대될 수 있으며, 이때 미리 판별된 헤드룸은 10dB이다. 특히, 신호 레벨이 디지털 영역에서 최대 신호 레벨인 0dB를 초과하는 것은 불가능하며, 이 경우에 증폭된 다운링크 음성 신호는 최대 신호 레벨에서 왜곡될 수 있다. 이는 모바일 장치의 하드웨어 또는 스피커에 하드웨어 손상을 줄 수 있거나, 사용자가 청취하는데 있어 불편한 청취 경험을 불러일으키거나, 또는 심지어 유해할 수도 있다.
이에 따라서, 다른 실시예에서, 단계 S30은 조정가능한 헤드룸으로 실행될 수 있다. 예를 들면, 헤드룸의 조정은 하나 이상의 조건에 따라 달라질 수 있거나, 동력학적으로 구현될 수도 있다. 추가로, 헤드룸은 신호 왜곡뿐만 아니라 사람이 청취하는데, 또는 하드웨어에 다른 손상을 제공하는 것을 방지하기 위해서 설정될 수 있다.
일부 예시에서, 조정가능한 헤드룸은 제 1 오디오 신호의 신호 레벨에 따라 조정될 수 있고, 그 결과 제 2 오디오 신호의 신호 레벨은 제 1 오디오 신호의 신호 레벨에 선형적으로 또는 비-선형적으로 비례하지만, 그러나 여전하게 클립 레벨(clipping level) 미만, 예를 들면 0 dB 미만에 있다.
일 예에서, 단계 S30에서의 다운링크 음성 신호의 증폭은, 다운링크 음성 신호 레벨(예를 들면, 신호 에너지 레벨)이 특정 임계치 레벨(즉, 최대 레벨에 근접하지 않음) 아래로 내려갈 시에 제 1 값(예를 들면, 10dB)을 가진 헤드룸을 사용하여, 그리고 다운링크 음성 신호 레벨(예를 들면, -9dB)이 특정 임계치 레벨을 초과할 시에, 제 1 값 미만인 제 2 값(예를 들면 5dB)을 가진 헤드룸을 사용하여 판별될 수 있다. 도 4를 참조하여, 헤드룸이 제 1 값 미만인 8dB일 시에, 증폭된 다운링크 음성 신호는 최대 레벨보다 낮은 -1dB인 레벨(Lb라 함)에 있게 되고, 이로써, 하드웨어 보호 및 인간 청취를 위하여, 증폭된 다운링크 음성 신호가 안전하게 되는데, 상기의 예시에서와 같이 노이즈 환경이 있는 곳에서도 그러하다.
또 다른 예에서, 헤드룸은 모바일 장치(2)의 볼륨 제어 레벨(volume control level)에 따라 조정가능할 수 있다. 예를 들면, 신호 프로세싱 유닛(21)은, 볼륨 제어 레벨이 변화될 시에, 볼륨 제어 레벨을 나타내는 볼륨 데이터에 대한 정보를 알아낸다. 신호 프로세싱 유닛(21)은 볼륨 데이터에 따라 서로 다른 값의 헤드룸으로 단계 S30을 실행한다. 예를 들면, 볼륨 제어 레벨이 특정 임계치 레벨(예를 들면, 중앙 레벨 또는 그 이상의 레벨)에 있거나, 그보다 아래에 있는 경우에, 헤드룸은 제 1 값(예를 들면, 10dB)으로 설정될 수 있다. 볼륨 제어 레벨이 최대 레벨에 있거나 근접하거나, 또는 특정 임계치 이상으로 있다는 것을 볼륨 데이터가 나타내는 경우, 헤드룸은 제 1 값 미만인 제 2 값(예를 들면, 5dB)으로 설정될 수 있다. 다른 예에서, 헤드룸은 하나 이상의 조건에 따라 예를 들면 다운링크 음성 신호 레벨 및 볼륨 제어 레벨에 따라 조정될 수 있다.
나아가 다른 예에서, 단계 S30에서 제 1 오디오 신호는 서로 다른 주파수 대역에 대해 증폭될 수도 있다. 예를 들면, 노이즈 스펙트럼은 도 5에 도시된다. 충분한 SNR을 유지시키기 위하여, 하나 이상의 주파수 대역에서의 오디오 신호(예를 들면, 파일 또는 스트림식 비디오 또는 오디오 등의 소스로부터 나온 다운링크 음성 또는 오디오 신호)는 인간 청취를 위한 오디오 명료도를 고려할 시에 증폭된다. 이 예에서, 다운링크 음성 신호의 약 500Hz(B1으로 나타남) 및 3kHz(B2로 나타남)의 주파수 대역은 커져야 한다.
도 3a를 참조하면, 블럭도는 실시예에 따른 컴퓨팅 장치에서 오디오 명료도 향상을 위한 시스템을 도시한다. 컴퓨팅 장치의 적어도 하나의 마이크로폰(M1)으로부터 나온 검출되는 오디오 신호 및 오디오 명료도가 향상되는 제 1 오디오 신호(예를 들면, 모바일 장치의 도 2의 통신 유닛(23)으로부터 나온 다운링크 음성 신호 또는 오디오 재생을 위한 프로세싱 유닛(25)으로부터 나온 신호)에 응답하여, 시스템(3)은 컴퓨팅 장치의 적어도 하나의 스피커(SK1)로 제 2 오디오 신호를 출력한다. 시스템(3)은 환경 노이즈 판별 유닛(30) 및 명료도 향상 유닛(32)을 포함한다. 시스템(3)은 소프트웨어, 회로로 실행될 수 있거나, 신호 프로세싱 유닛 또는 일반적인 프로세서를 프로그램밍함으로써 실행될 수 있다. 환경 노이즈 판별 유닛(30)은 도 1에 도시된 바와 같이 단계 S10의 실시예로 간주될 수 있다. 명료도 향상 유닛(32)은 도 1에 도시된 바와 같이 단계 S20 및 S30의 실시예로 간주될 수 있다.
환경 노이즈 판별 유닛(30)은 예비 프로세싱 모듈(pre-processing module)(301) 및 노이즈 평가 모듈(303)을 포함한다. 예비 프로세싱 모듈(301)은 마이크로폰(M1)으로부터 검출되는 오디오 신호가 오디오 또는 노이즈인지를 판별하기 위해, VAD 모듈(3013)에 의해 나타난 음성 구간 검출(VAD)을 실행한다. 예비 프로세싱 모듈(301)은 노이즈 평가 모듈(303)로 판별 결과를 출력한다. 예비 프로세싱 모듈(301)로부터 오디오 신호 및 판별 결과에 응답하여, 노이즈 평가 모듈(303)은 모바일 장치가 위치되는 곳에서 환경 노이즈를 나타내는 기준 노이즈 신호(SRN)를 출력한다. 즉, 노이즈 평가 모듈(303)은, 검출되는 오디오 신호가 노이즈를 나타낼 시에, 검출된 환경 노이즈를 출력할 수 있다. 이에 대하여, 다양한 균등물 실시예가 이용될 수 있다. 실시예들 중 하나에서, 노이즈 평가 모듈(303)은 예비 프로세싱 모듈(301)로부터 검출되는 오디오 신호를 출력하고, 기준 노이즈 신호(SRN)는 SNR 평가용 정보로 환경 노이즈를 나타낸다. 예를 들면, VAD 모듈(3013)이, 검출되는 오디오 신호가 사용자 음성을 나타낸다고 하는 경우, 노이즈 평가 모듈(303)은 스코어가 낮은 노이즈(lower noise score)와 함께 기준 노이즈 신호(SRN)를 출력한다. 검출되는 오디오 신호가 노이즈를 나타내는 경우, 예를 들면 소리지르는 아이들 소리와 같은 특정 사운드와 유사한 노이즈를 나타내는 경우, 노이즈 평가 모듈(303)은, 기준 노이즈 신호(SRN)의 환경 노이즈가 무시될 수 있는 다음 단계(예를 들면, SNR 평가)를 알리는 노이즈가 큰 스코어로 기준 노이즈 신호(SRN)를 출력한다. 또 다른 실시예에서, 노이즈 평가 모듈(303)은, VAD 모듈(3013)이 음성 구간이 없는 것을 나타낼 시에만, 노이즈 스코어가 특정 임계치보다 낮을 시에만 환경 노이즈를 출력하는 것으로서 실행될 수 있다. 상기와 같이, 노이즈 평가 모듈(303)의 실행은 상기의 예에 한정되는 것이 아니라, 다른 방식으로도 실현될 수 있다.
VAD 모듈(3013)은 환경 노이즈로서 음성 또는 사운드의 부정확한 판별을 방지하기 위함이고, 다음 단계에서 제 1 오디오 신호의 증대 또는 증폭 및 적절한 노이즈 평가를 용이하게 하기 위함이다. 일부 예에서, 에너지 레벨 임계치는 음성 구간 검출용 조건으로서 취할 수 있다. 신호 레벨이 특정 에너지 레벨 임계치를 초과하는 경우, 업링크용 오디오 신호가 음성 구간을 나타낸 것으로 판별된다. 이와 반대로, 신호 레벨이 특정 임계치보다 낮은 경우, 오디오 신호는 환경 노이즈로 간주된다. 다른 예에서, 오디오 수단은 음성 구간을 판별하는 VAD 모듈(3013)의 시간 도멘인 또는 주파수의 검출되는 오디오 신호로부터 추출될 수 있다. 예를 들면, 미리 판별된 오디오 수단, 예를 들면, 사무소 또는 기차 역에서 말하는 소리, 걷는 소리 등은 음성 구간의 판별을 참조하기 위해 저장되어 사용될 수 있다. 일 예에서, VAD 모듈(3013)은 직렬로, 병렬로 음성 구간(예를 들면, 노이즈 스코어; 또는 음성 또는 노이지 표시)을 위한 판별 결과로 검출되는 오디오 신호를 출력하는 것으로 실행될 수 있다.
게다가, 예비 프로세싱 모듈(301)은 VAD 모듈(3013) 전에 디-에코 모듈(de-echo module)(3011)에 의해 나타난 바와 같이 디-에코 프로세싱을 실행할 수도 있고, 그 결과 음성 구간의 판별 결과는 보다 정확해질 수 있다. 예를 들면, 디-에코 모듈(3011)의 디-에코 프로세싱은 시간 도메인에 적합한 필터에 의해 실행될 수 있고, 디-에코 모듈(3011)은 검출되는 오디오 신호의 디-에코된 버전을 VAD 모듈(3013)로 출력할 수 있다.
다른 예에서, 환경 노이즈 판별 유닛(30)은 인간의 말과 노이즈 간을 구별하기 위해 사용될 수 있는 노이즈 스펙트럼 검출 또는 평가를 사용함으로써, 검출되는 오디오 신호에 따라 환경 노이즈를 검출할 수 있다.
명료도 향상 유닛(32)은 신호 대 노이즈 비(SNR) 평가 모듈(321), 게인 계산 모듈(323), 및 증폭 모듈(boosting module)(325)을 포함한다. SNR 평가 모듈(321)은 단계 S20에서 나타난 바와 같이, 노이즈 정보를 획득할 수 있다. 기준 노이즈 신호(SRN) 및 다운링크 음성 신호(SRx)에 응답하여, SNR 평가 모듈(321)은 도 6에 도시된 파선 곡선(N)과 같이 주파수에 대한 노이즈 레벨 등의 노이즈 정보를 출력한다. 게인 계산 모듈(323) 및 증폭 모듈(325)은 단계(S30)에 도시된 바와 같이, 다운링크 음성 신호(SRx)를 증폭하기 위해 사용된다. 노이즈 정보 및 제 1 다운링크 음성 신호(SRx)에 응답하여, 게인 계산 모듈(323)은 제 1 다운링크 음성 신호(SRx)를 증폭하기 위해, 증폭 모듈(325)을 제어하도록 하나 이상의 파라미터를 판별한다. 예를 들면, 게인 계산 모듈(323)은 도 6에 도시된 바와 같이, 일부 주파수 대역에서, Sg로 표기된 제 1 다운링크 음성 신호(SRx)에 대한 신호 레벨이 환경 노이즈(N)에 대한 신호 레벨보다 낮다고 판별한다. 이에 따라서, 게인 계산 모듈(323)은 주파수 대역(W1)의 제 1 다운링크 음성 신호를 증폭하는 것이 필요하다고 판별하고, 판별된 주파수 대역에 대한 제 1 다운링크 음성 신호(SRx)를 증폭하여 오디오 명료도에 대해 충분한 SNR을 유지하기 위해, 증폭 모듈(325)을 제어한다. 하나 이상의 주파수 대역은, 예를 들면, 도 6의 주파수 대역들(W1 및 W2)은 판별된 주파수 대역일 수 있다. 예를 들면, 게인 계산 모듈(323)은 환경 노이즈의 노이즈 레벨을 제 1 다운링크 음성 신호(SRx)의 신호 레벨과 비교하여, 증폭 모듈(325)을 제어하는 판별 결과를 판별하고, 상기 판별 결과는 또한 증폭 모듈(325)에 대한 신호레벨의 증가량을 포함할 수 있다.
나아가, 단계 S30에 대한 상기의 예는 하나 이상의 주파수 대역용 다운링크 음성 신호를 증폭시키는 하나 이상의 레벨을 판별하는 게인 계산 모듈(323)에 적용될 수도 있다. 예를 들면, 게인 계산 모듈(323)의 헤드룸의 조정은 하나 이상의 조건에 따라 달라질 수 있거나, 동력학적으로도 구현될 수 있다. 게다가, 헤드룸은 신호 왜곡뿐만 아니라 하드웨어 또는 인가 청취에 대한 다른 손상을 방지하기 위해서도 설정될 수 있다. 일부 예에서, 게인 계산 모듈(323)은 헤드 룸을 조정하는 방법 및 어떻게 조정할지를 판별하기 위해 모바일 장치의 다른 구성요소 또는 프로세싱 유닛으로부터 볼륨 데이터를 획득할 수 있다.
증폭 모듈(325)은 이퀄라이제이션(equalization) 또는 다른 증대 또는 증폭 기술을 사용하여 실행될 수 있다.
일부 실시예들에서, 도 3에 도시된 시스템(3)의 하나 이상의 모듈, 유닛 및 블럭은 소프트웨어 코드, 소프트웨어 모듈, 또는 전용 회로(예를 들면, 칩 또는 칩의 회로 모듈)로 실현될 수 있거나 신호 프로세싱 유닛 또는 프로그램밍이 가능한 칩 또는 일반적인 프로세서를 프로그램밍함으로써 실행될 수 있다. 예를 들면, 시스템(3)은 프로세서(예를 들면, 하나 이상의 코어를 가짐), 예를 들면, 어플리케이션 프로세서 또는 디지털 신호 프로세서(DSP) 또는 어플리케이션 특정 집적 회로(ASIC)를 사용함으로써 실현될 수 있거나, FPGA(field-programmable gate array)에서 실현될 수 있으며, 이때 상기 FPGA는 도 3a의 시스템(3)(또는 도 1의 방법)의 특정 동작을 실행하기 위해 설계된다.
도 3b를 참조하여, 명료도 향상 유닛의 또 다른 실시예가 도시된다. 도 3a와 비교하여, 도 3b에 도시된 명료도 향상 유닛(42)은 재생용 제 1 오디오 신호에 대한 경로 상(예를 들면, SRx로 표기됨)의 예비 프로세싱 모듈(420)을 더 포함한다. 제 1 오디오 신호에 응답하여, 예비 프로세싱 모듈(420)은 다음 단계에서 증폭될, 예비 처리된 제 1 오디오 신호를 출력하되, 제 1 오디오 신호가 원하는 음성 또는 사운드를 나타내는 경우에 출력한다. 예를 들면, 통화 중에 일부 시간 동안 제 1 오디오 신호가 음성이 없거나 또는 노이즈가 없다고 하는 경우, 바람직하지 않아서, 증폭될 필요가 없거나 필터링될 수 있다. 일부 실시예들에서, 예비 프로세싱 모듈(420)은 상기에서 예로 나타난 바와 같이, VAD 모듈 또는 노이즈 평가 모듈, 또는 이들 둘 다를 포함할 수 있다. 일부 실시예들에서, 예비 프로세싱 모듈(420)은 하나 이상의 제어 신호 또는 표시 데이터(indication data)를 명료도 향상 유닛(42)의 하나 이상의 다른 모듈에 출력할 수 있어서, 예비 처리된 제 1 오디오 신호가 다음 단계에 의해 증폭될 수 있도록 하는데, 제 1 오디오 신호가 원하는 음성 또는 사우드를 나타낼 경우에 그러하다.
나아가, 다른 실시예들은 프로그램 코드를 저장하는, 기계장치 또는 장치로 판독가능한 정보 저장 매체 또는 하나 또는 다수의 프로그램 모듈을 더 개시한다. 프로그램 코드는 도 1의 오디오 명료도 향상을 위한 방법, 또는 도 3a 또는 3b의 시스템(3)을 구현시키기 위해 실행될 수 있다. 실시예 각각의 판독가능한 정보 저장 매체는 광학 정보 저장 매체, 자기 정보 저장 매체 또는 메모리, 예를 들면 메모리 카드, 펌웨어, 디지털 신호 프로세서 또는 일반적인 프로세서 등과 같은 프로그램밍이 가능한 칩에 매립되어 있거나 전용으로 사용될 수 있는 ROM 또는 RAM을 제한 없이 포함한다.
기술 분야의 통상의 기술자에게 있어서, 다양한 변형 및 변화가 개시된 실시예에서 구현될 수 있음은 명백할 것이다. 의도된 바와 같이, 명세서 및 예시는 단지 예시일뿐, 명세서의 참된 권리 범위는 다음의 청구항 및 이들의 균등물에 의해 나타난다.
Claims (32)
- 컴퓨팅 장치에서 오디오 명료도를 향상시키는 방법에 있어서,
컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 음성 구간 검출을 실행함으로써, 환경 노이즈를 검출하는 단계;
검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하는 단계; 및
상기 노이즈 정보 및 상기 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 컴퓨팅 장치에 의해 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하는 단계를 포함하는 오디오 명료도 향상 방법. - 청구항 1에 있어서,
상기 노이즈 정보는 상기 제 1 오디오 신호와 관련되어 검출된 환경 노이즈의 측정 레벨을 나타내는 것을 특징으로 하는 오디오 명료도 향상 방법. - 청구항 1에 있어서,
상기 환경 노이즈를 검출하는 단계는:
상기 검출되는 오디오 신호가 노이즈인지 또는 노이즈가 아닌지를 판별하기 위해 음성 구간 검출을 실행하는 단계; 및
상기 검출되는 오디오 신호가 노이즈를 나타낼 시에, 상기 검출된 환경 노이즈를 출력하는 단계를 포함하는 것을 특징으로 하는 오디오 명료도 향상 방법. - 청구항 1에 있어서,
상기 환경 노이즈를 검출하는 단계는:
상기 검출되는 오디오 신호의 디-에코된 버전을 출력하는 단계; 및
상기 검출되는 오디오 신호가 노이즈를 나타낼 시에, 상기 검출된 환경 노이즈를 출력하는 단계를 포함하고,
상기 음성 구간 검출은 상기 검출되는 오디오 신호가 노이즈인지 또는 노이즈가 아닌지를 판별하기 위해 상기 검출되는 오디오 신호의 디-에코된 버전에 따라 실행되는 것을 특징으로 하는 오디오 명료도 향상 방법. - 청구항 1에 있어서,
상기 조정가능한 헤드룸이 상기 제 1 오디오 신호의 신호 레벨에 따라 조정되며, 그 결과 상기 제 2 오디오 신호의 신호 레벨은 상기 제 1 오디오 신호의 신호 레벨과 비례하되, 클립 레벨 미만 하에 비례하는 것을 특징으로 하는 오디오 명료도 향상 방법. - 청구항 1에 있어서,
상기 조정가능한 헤드룸은, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨 아래에 있을 시에 제 1 값에 있고, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨을 초과할 시에 상기 제 1 값 미만인 제 2 값에 있는 것을 특징으로 하는 오디오 명료도 향상 방법. - 청구항 1에 있어서,
상기 조정가능한 헤드룸은 상기 컴퓨팅 장치의 볼륨 제어 레벨에 따라서 조정되는 것을 특징으로 하는 오디오 명료도 향상 방법. - 청구항 7에 있어서,
상기 조정가능한 헤드룸은, 상기 볼륨 제어 레벨이 임계치 레벨 아래에 있을 시에 제 1 값에 있고, 상기 볼륨 제어 레벨이 임계치 레벨을 초과할 시에 제 1 값 미만인 제 2 값에 있는 것을 특징으로 하는 오디오 명료도 향상 방법. - 청구항 1에 있어서,
상기 오디오 명료도 향상 방법은 상기 제 1 오디오 신호가 상기 제 1 오디오 신호를 예비 처리함으로써 노이즈인지를 판별하는 단계를 더 포함하고,
상기 제 2 오디오 신호를 출력하는 단계에서, 상기 제 2 오디오 신호는 상기 제 1 오디오 신호를 증폭시킴 없이 출력되되, 예비 처리될 시에 상기 제 1 오디오 신호가 노이즈라고 판별된 경우에 출력되는 것을 특징으로 하는 오디오 명료도 향상 방법. - 청구항 9에 있어서,
상기 예비 처리는 음성 구간 검출을 사용함으로써 상기 제 1 오디오 신호에 대해 실행되는 것을 특징으로 하는 오디오 명료도 향상 방법. - 청구항 9에 있어서,
상기 예비 처리는 노이즈 평가를 사용함으로써 상기 제 1 오디오 신호에 대해 실행되는 것을 특징으로 하는 오디오 명료도 향상 방법. - 청구항 1에 있어서,
상기 제 2 오디오 신호는 인간 청취를 위한 적어도 하나의 주파수 대역에 관련된 제 1 오디오 신호를 증폭시킴으로써 출력되는 것을 특징으로 하는 오디오 명료도 향상 방법. - 컴퓨팅 장치에서 오디오 명료도를 향상시키는 장치에 있어서,
컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 환경 노이즈를 검출하는 환경 노이즈 판별 유닛; 및
상기 환경 노이즈 판별 유닛에 연결되며, 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하고, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하는 명료도 향상 유닛을 포함하는 오디오 명료도 향상 장치. - 청구항 13에 있어서,
상기 노이즈 정보는 상기 제 1 오디오 신호와 관련되어 검출된 환경 노이즈의 측정 레벨을 나타내는 것을 특징으로 하는 오디오 명료도 향상 장치. - 청구항 13에 있어서,
상기 환경 노이즈 판별 유닛은:
상기 검출되는 오디오 신호에 따라 오디오 신호를 출력하며, 상기 검출되는 오디오 신호가 노이즈인지 또는 노이즈가 이난지를 판별하고 상기 판별 결과를 출력하는 음성 구간 검출 모듈을 포함하는 예비 프로세싱 모듈; 및
상기 예비 프로세싱 모듈로부터 나온 상기 판별 결과 및 상기 오디오 신호에 응답하여 기준 노이즈 신호를 출력하는 노이즈 평가 모듈을 포함하는 것을 특징으로 하는 오디오 명료도 향상 장치. - 청구항 13에 있어서,
상기 명료도 향상 유닛은 상기 제 1 오디오 신호의 신호 레벨에 따라 조정가능한 헤드룸을 조정하기 위해 동작되고, 그 결과 상기 제 2 오디오 신호의 신호 레벨은 상기 제 1 오디오 신호의 신호 레벨과 비례하되, 불완전한 임계치(truncated threshold) 미만 하에 비례하는 것을 특징으로 하는 오디오 명료도 향상 장치. - 청구항 13에 있어서,
상기 명료도 향상 유닛은, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 제 1 오디오 신호의 신호 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 오디오 명료도 향상 장치. - 청구항 13에 있어서,
상기 명료도 향상 유닛은 상기 컴퓨팅 장치의 볼륨 제어 레벨에 따라서 조정가능한 헤드룸을 조정하기 위해 동작하는 것을 특징으로 하는 오디오 명료도 향상 장치. - 청구항 18에 있어서,
상기 명료도 향상 유닛은, 상기 볼륨 제어 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 볼륨 제어 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 상기 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 오디오 명료도 향상 장치. - 청구항 13에 있어서,
상기 명료도 향상 유닛은:
기준 노이즈 신호 및 제 1 오디오 신호에 응답하여 노이즈 정보를 출력하는 신호 대 노이즈 비 평가 모듈;
증폭 모듈; 및
상기 증폭 모듈과 상기 신호 대 노이즈 비 평가 모듈 사이에 연결되며, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 응답하여, 상기 제 1 오디오 신호를 증폭시키기 위해 상기 증폭 모듈을 제어하는 게인 계산 모듈을 포함하는 것을 특징으로 하는 오디오 명료도 향상 장치. - 청구항 20에 있어서,
상기 명료도 향상 유닛은:
상기 제 1 오디오 신호가 노이지인지를 판별하는 예비 프로세싱 모듈을 더 포함하며,
상기 예비 프로세싱 모듈이 상기 제 1 오디오 신호가 노이즈라고 판별하는 경우에, 상기 예비 프로세싱 모듈은 상기 제 1 오디오 신호를 증폭시킴 없이 제 2 오디오 신호를 출력하기 위해서, 상기 게인 계산 모듈에게 상기 증폭 모듈을 제어하라고 알리는 것을 특징으로 하는 오디오 명료도 향상 장치. - 청구항 20에 있어서,
상기 예비 프로세싱 모듈은, 상기 제 1 오디오 신호가 상기 1 오디오 신호의 노이즈 평가 또는 음성 구간 검출에 따른 노이즈인지를 판별하는 것을 특징으로 하는 오디오 명료도 향상 장치. - 적어도 하나의 마이크로폰;
컴퓨팅 장치를 제어하는 프로세싱 유닛;
통신 유닛;
상기 프로세싱 유닛과 상기 통신 유닛에 연결되며, 오디오 명료도를 향상시키기 위한 신호 프로세싱 유닛을 포함하며,
상기 신호 프로세싱 유닛은:
상기 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 환경 노이즈를 검출하는 환경 노이즈 판별 유닛; 및
상기 환경 노이즈 판별 유닛에 연결되며, 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하고, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하는 명료도 향상 유닛을 포함하는 것을 특징으로 하는 컴퓨팅 장치. - 청구항 23에 있어서,
상기 명료도 향상 유닛은 상기 제 1 오디오 신호의 신호 레벨에 따라 조정가능한 헤드룸을 조정하기 위해 동작되고, 그 결과 상기 제 2 오디오 신호의 신호 레벨은 상기 제 1 오디오 신호의 신호 레벨과 비례하되, 불완전한 임계치(truncated threshold) 미만 하에 비례하는 것을 특징으로 하는 컴퓨팅 장치. - 청구항 23에 있어서,
상기 명료도 향상 유닛은, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 제 1 오디오 신호의 신호 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 컴퓨팅 장치. - 청구항 23에 있어서,
상기 명료도 향상 유닛은 상기 컴퓨팅 장치의 볼륨 제어 레벨에 따라서 조정가능한 헤드룸을 조정하기 위해 동작하는 것을 특징으로 하는 컴퓨팅 장치. - 청구항 26에 있어서,
상기 명료도 향상 유닛, 상기 볼륨 제어 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 볼륨 제어 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 상기 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 컴퓨팅 장치. - 청구항 23에 있어서,
상기 명료도 향상 유닛은:
기준 노이즈 신호 및 제 1 오디오 신호에 응답하여 노이즈 정보를 출력하는 신호 대 노이즈 비 평가 모듈;
증폭 모듈; 및
상기 증폭 모듈과 상기 신호 대 노이즈 비 평가 모듈 사이에 연결되며, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 응답하여, 상기 제 1 오디오 신호를 증폭시키기 위해 상기 증폭 모듈을 제어하는 게인 계산 모듈을 포함하는 것을 특징으로 하는 컴퓨팅 장치. - 청구항 28에 있어서,
상기 명료도 향상 유닛은:
상기 제 1 오디오 신호가 노이지인지를 판별하는 예비 프로세싱 모듈을 더 포함하며,
상기 예비 프로세싱 모듈이 상기 제 1 오디오 신호가 노이즈라고 판별하는 경우에, 상기 예비 프로세싱 모듈은 상기 제 1 오디오 신호를 증폭시킴 없이 제 2 오디오 신호를 출력하기 위해서, 상기 게인 계산 모듈에게 상기 증폭 모듈을 제어하라고 알리는 것을 특징으로 하는 컴퓨팅 장치. - 청구항 23에 있어서,
상기 통신 유닛은 상기 신호 프로세싱 유닛으로 상기 제 1 오디오 신호를 출력하고, 상기 제 1 오디오 신호는 음성 통신을 위한 다운링크 오디오 신호인 것을 특징으로 하는 컴퓨팅 장치. - 청구항 23에 있어서,
상기 프로세싱 유닛은 멀티미디어 소스에 따라 상기 제 1 오디오 신호를 상기 신호 프로세싱 유닛으로 출력하는 것을 특징으로 하는 컴퓨팅 장치. - 청구항 23에 있어서,
상기 제 2 오디오 신호는 인간 청취를 위한 적어도 하나의 주파수 대역에 관련된 제 1 오디오 신호를 증폭시킴으로써 출력되는 것을 특징으로 하는 컴퓨팅 장치.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261601583P | 2012-02-22 | 2012-02-22 | |
US61/601,583 | 2012-02-22 | ||
US13/671,499 US9064497B2 (en) | 2012-02-22 | 2012-11-07 | Method and apparatus for audio intelligibility enhancement and computing apparatus |
US13/671,499 | 2012-11-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130096625A true KR20130096625A (ko) | 2013-08-30 |
KR101455710B1 KR101455710B1 (ko) | 2014-10-28 |
Family
ID=47826798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120148590A KR101455710B1 (ko) | 2012-02-22 | 2012-12-18 | 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9064497B2 (ko) |
EP (1) | EP2631907A1 (ko) |
JP (1) | JP5704470B2 (ko) |
KR (1) | KR101455710B1 (ko) |
CN (1) | CN103295581B (ko) |
TW (1) | TWI484483B (ko) |
Families Citing this family (185)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US9129291B2 (en) * | 2008-09-22 | 2015-09-08 | Personics Holdings, Llc | Personalized sound management and method |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
KR20120034863A (ko) * | 2010-10-04 | 2012-04-13 | 삼성전자주식회사 | 이동통신 단말기에서 오디오 신호 처리 방법 및 장치 |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US9064497B2 (en) | 2012-02-22 | 2015-06-23 | Htc Corporation | Method and apparatus for audio intelligibility enhancement and computing apparatus |
US9349385B2 (en) | 2012-02-22 | 2016-05-24 | Htc Corporation | Electronic device and gain controlling method |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US8639294B2 (en) * | 2012-05-01 | 2014-01-28 | Audyssey Laboratories, Inc. | System and method for performing automatic gain control in mobile phone environments |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR102118209B1 (ko) | 2013-02-07 | 2020-06-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
CN104010265A (zh) * | 2013-02-22 | 2014-08-27 | 杜比实验室特许公司 | 音频空间渲染设备及方法 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) * | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
TWI545556B (zh) * | 2013-10-02 | 2016-08-11 | 宏達國際電子股份有限公司 | 電子裝置與增益控制方法 |
ES2732304T3 (es) * | 2013-10-22 | 2019-11-21 | Fraunhofer Ges Forschung | Concepto para la compresión combinada del intervalo dinámico y prevención guiada de recortes para dispositivos de audio |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
CN104219402A (zh) * | 2014-02-14 | 2014-12-17 | 爱沟通网络科技有限公司 | 一种改善VoIP通信质量的系统 |
JP6106618B2 (ja) * | 2014-02-21 | 2017-04-05 | 日本電信電話株式会社 | 音声区間検出装置、音声認識装置、その方法、及びプログラム |
US9484043B1 (en) * | 2014-03-05 | 2016-11-01 | QoSound, Inc. | Noise suppressor |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
TWI559295B (zh) * | 2014-10-08 | 2016-11-21 | Chunghwa Telecom Co Ltd | Elimination of non - steady - state noise |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
CN104900237B (zh) * | 2015-04-24 | 2019-07-05 | 上海聚力传媒技术有限公司 | 一种用于对音频信息进行降噪处理的方法、装置和系统 |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US20170018282A1 (en) * | 2015-07-16 | 2017-01-19 | Chunghwa Picture Tubes, Ltd. | Audio processing system and audio processing method thereof |
CN105244037B (zh) * | 2015-08-27 | 2019-01-15 | 广州市百果园网络科技有限公司 | 语音信号处理方法及装置 |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
CN105704321B (zh) * | 2016-03-21 | 2019-02-22 | Oppo广东移动通信有限公司 | 利用降噪麦克风动态调节通话音量的方法和系统 |
TWI595791B (zh) * | 2016-03-29 | 2017-08-11 | 高瞻資訊股份有限公司 | 音訊檢測方法 |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
CN106527478A (zh) * | 2016-11-24 | 2017-03-22 | 深圳市道通智能航空技术有限公司 | 无人机现场声音获取方法与有声视频实现方法及相关装置 |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
CN107404625B (zh) * | 2017-07-18 | 2020-10-16 | 海信视像科技股份有限公司 | 终端的音效处理方法及装置 |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
CN108269567B (zh) * | 2018-01-23 | 2021-02-05 | 北京百度网讯科技有限公司 | 用于生成远场语音数据的方法、装置、计算设备以及计算机可读存储介质 |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
TWI665661B (zh) * | 2018-02-14 | 2019-07-11 | 美律實業股份有限公司 | 音頻處理裝置及音頻處理方法 |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
CN108540886A (zh) * | 2018-04-17 | 2018-09-14 | 建荣半导体(深圳)有限公司 | 一种听力保护方法、系统、存储装置及蓝牙耳机 |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US10991377B2 (en) * | 2019-05-14 | 2021-04-27 | Goodix Technology (Hk) Company Limited | Method and system for speaker loudness control |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
RU203218U1 (ru) * | 2020-12-15 | 2021-03-26 | Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" | «речевой корректор» - устройство для улучшения разборчивости речи |
CN114915886A (zh) * | 2021-02-08 | 2022-08-16 | 苏州佳世达电通有限公司 | 动态播音方法及播音装置 |
CN112614513B (zh) * | 2021-03-08 | 2021-06-08 | 浙江华创视讯科技有限公司 | 一种语音检测方法、装置、电子设备及存储介质 |
CN113190207A (zh) | 2021-04-26 | 2021-07-30 | 北京小米移动软件有限公司 | 信息处理方法、装置、电子设备及存储介质 |
WO2023028018A1 (en) | 2021-08-26 | 2023-03-02 | Dolby Laboratories Licensing Corporation | Detecting environmental noise in user-generated content |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI102337B (fi) * | 1995-09-13 | 1998-11-13 | Nokia Mobile Phones Ltd | Menetelmä ja piirijärjestely audiosignaalin käsittelemiseksi |
GB2306086A (en) | 1995-10-06 | 1997-04-23 | Richard Morris Trim | Improved adaptive audio systems |
JP3284176B2 (ja) | 1996-10-25 | 2002-05-20 | シャープ株式会社 | オーディオ装置 |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
JP2000163098A (ja) | 1998-11-25 | 2000-06-16 | Mitsubishi Electric Corp | 音声認識装置 |
KR100742140B1 (ko) * | 1999-03-30 | 2007-07-24 | 퀄컴 인코포레이티드 | 이동전화 스피커와 마이크로폰 이득을 자동으로 조정하는방법 및 장치 |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
JP4145507B2 (ja) | 2001-06-07 | 2008-09-03 | 松下電器産業株式会社 | 音質音量制御装置 |
JP2004173173A (ja) | 2002-11-22 | 2004-06-17 | Matsushita Electric Ind Co Ltd | 音声処理装置 |
EP1652297A2 (en) | 2003-07-28 | 2006-05-03 | Koninklijke Philips Electronics N.V. | Audio conditioning apparatus, method and computer program product |
EP1580882B1 (en) | 2004-03-19 | 2007-01-10 | Harman Becker Automotive Systems GmbH | Audio enhancement system and method |
US8280730B2 (en) * | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
JP4483761B2 (ja) | 2005-10-14 | 2010-06-16 | パナソニック電工株式会社 | 拡声通話装置 |
US20090010452A1 (en) | 2007-07-06 | 2009-01-08 | Texas Instruments Incorporated | Adaptive noise gate and method |
JP5134876B2 (ja) * | 2007-07-11 | 2013-01-30 | 株式会社日立製作所 | 音声通信装置及び音声通信方法並びにプログラム |
US8954324B2 (en) | 2007-09-28 | 2015-02-10 | Qualcomm Incorporated | Multiple microphone voice activity detector |
JP5219522B2 (ja) | 2008-01-09 | 2013-06-26 | アルパイン株式会社 | 音声明瞭度改善システム及び音声明瞭度改善方法 |
US8538749B2 (en) | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
KR101544429B1 (ko) | 2008-10-17 | 2015-08-17 | 삼성전자주식회사 | 이동통신 시스템의 이득 제어 장치 및 방법 |
JP5127754B2 (ja) | 2009-03-24 | 2013-01-23 | 株式会社東芝 | 信号処理装置 |
US8571231B2 (en) * | 2009-10-01 | 2013-10-29 | Qualcomm Incorporated | Suppressing noise in an audio signal |
US9064497B2 (en) | 2012-02-22 | 2015-06-23 | Htc Corporation | Method and apparatus for audio intelligibility enhancement and computing apparatus |
JP6109927B2 (ja) | 2012-05-04 | 2017-04-05 | カオニックス ラブス リミテッド ライアビリティ カンパニー | 源信号分離のためのシステム及び方法 |
EP2880655B8 (en) | 2012-08-01 | 2016-12-14 | Dolby Laboratories Licensing Corporation | Percentile filtering of noise reduction gains |
-
2012
- 2012-11-07 US US13/671,499 patent/US9064497B2/en active Active
- 2012-12-18 KR KR1020120148590A patent/KR101455710B1/ko active IP Right Grant
-
2013
- 2013-02-08 JP JP2013023206A patent/JP5704470B2/ja active Active
- 2013-02-08 TW TW102105328A patent/TWI484483B/zh active
- 2013-02-18 CN CN201310052694.9A patent/CN103295581B/zh active Active
- 2013-02-20 EP EP20130000857 patent/EP2631907A1/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
JP5704470B2 (ja) | 2015-04-22 |
US9064497B2 (en) | 2015-06-23 |
CN103295581B (zh) | 2016-04-06 |
EP2631907A1 (en) | 2013-08-28 |
TW201335931A (zh) | 2013-09-01 |
CN103295581A (zh) | 2013-09-11 |
KR101455710B1 (ko) | 2014-10-28 |
JP2013172454A (ja) | 2013-09-02 |
TWI484483B (zh) | 2015-05-11 |
US20130218560A1 (en) | 2013-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101455710B1 (ko) | 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치 | |
KR101311028B1 (ko) | 주변 잡음 검출을 이용한 요해도 제어 | |
KR101118217B1 (ko) | 오디오 데이터 처리 장치 및 방법 | |
US9208767B2 (en) | Method for adaptive audio signal shaping for improved playback in a noisy environment | |
CA2766196C (en) | Apparatus, method and computer program for controlling an acoustic signal | |
KR101731714B1 (ko) | 음질 개선을 위한 방법 및 헤드셋 | |
WO2017215657A1 (zh) | 音效处理方法及终端设备 | |
JP4940158B2 (ja) | 音補正装置 | |
EP3038255B1 (en) | An intelligent volume control interface | |
WO2014169757A1 (zh) | 自适应调节频响的方法及终端 | |
US7760869B2 (en) | Method and apparatus for controlling the transmit volume level of a speakerphone | |
CN108307022A (zh) | 音量控制方法及装置 | |
US11616873B2 (en) | Communication device and output sidetone adjustment method thereof | |
KR101760122B1 (ko) | 휴대단말기의 평균 음압 향상 장치 및 방법 | |
CN108307046B (zh) | 一种通话管理方法及终端 | |
US9686613B2 (en) | Method for audio signal processing and system thereof | |
KR20100116276A (ko) | 휴대용 단말기에서 백색 잡음 제거 방법 및 장치 | |
KR100641161B1 (ko) | 이동통신단말기의 음량 조정 장치 및 방법 | |
CN115460476A (zh) | 一种对讲系统的音频参数处理方法、装置和对讲系统 | |
JP2009239650A (ja) | 出力音量自動制御装置、出力音量自動制御方法 | |
KR20120137657A (ko) | 음향 출력이 가능한 단말기 및 그 음향 출력방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20170919 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20180918 Year of fee payment: 5 |