KR20130096625A - 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치 - Google Patents

오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치 Download PDF

Info

Publication number
KR20130096625A
KR20130096625A KR1020120148590A KR20120148590A KR20130096625A KR 20130096625 A KR20130096625 A KR 20130096625A KR 1020120148590 A KR1020120148590 A KR 1020120148590A KR 20120148590 A KR20120148590 A KR 20120148590A KR 20130096625 A KR20130096625 A KR 20130096625A
Authority
KR
South Korea
Prior art keywords
audio signal
noise
signal
audio
level
Prior art date
Application number
KR1020120148590A
Other languages
English (en)
Other versions
KR101455710B1 (ko
Inventor
젠-포 히시아오
팅-웨이 선
한-쉬 통
Original Assignee
에이치티씨 코퍼레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에이치티씨 코퍼레이션 filed Critical 에이치티씨 코퍼레이션
Publication of KR20130096625A publication Critical patent/KR20130096625A/ko
Application granted granted Critical
Publication of KR101455710B1 publication Critical patent/KR101455710B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Abstract

오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치가 제공된다. 상기 방법은 다음 단계를 포함한다. 환경 노이즈는 컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라서 음성 구간 검출을 실행함으로써 검출된다. 노이즈 정보는 검출된 환경 노이지 및 제 1 오디오 신호에 따라 획득된다. 제 2 오디오 신호는 노이즈 정보 및 제 1 오디오 신호에 따라 출력되되, 컴퓨팅 장치에 의해 조정가능한 헤드룸 하에서 제 1 오디오 신호를 증폭시킴으로써 출력된다.

Description

오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치{METHOD AND APPARATUS FOR AUDIO INTELLIGIBILITY ENHANCEMENT AND COMPUTING APPARATUS}
기술된 실시예들은 일반적으로 오디오 명료도 향상(audio intelligibility enhancement)에 관한 것으로, 특히, 신호 및 컴퓨팅 장치(computing apparatus)에 있어 오디오 명료도 향상을 위한 방법 및 장치에 관한 것이다.
경험에 있어 전화 통화 동안 오디오의 품질은 모바일 폰 사용자에게 중요하다. 일부 모바일 폰은 출력되는 오디오 신호에 있는 환경적인 노이즈를 감소시킴으로써, 통화 중 출력되는 오디오 신호의 품질을 향상시키기 위해 노이즈 감소를 사용한다. 한편, 입력되는 오디오 신호의 품질은 환경 노이즈로 인해 악화된다. 이 경우에, 모바일 폰 사용자는 모바일 폰의 볼륨을 수동으로 보다 크게 한다. 이러한 접근 방식은 사용자에게 불편함을 주고 볼륨이 전반적으로 커지는 경우, 청취하는 중에 적절한 품질을 얻을 수가 없다.
본 발명의 목적은 재생용 신호에 대한 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치를 제공하는 것에 있다.
일 실시예에 따라서, 오디오 명료도를 향상시키는 방법이 제공된다. 상기 방법은 다음 단계를 포함한다. 환경 노이즈는 컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라서 음성 구간 검출(voice activity detection)을 실행함으로써 검출된다. 노이즈 정보는 검출된 환경 노이지 및 제 1 오디오 신호에 따라 획득된다. 제 2 오디오 신호는 노이즈 정보 및 제 1 오디오 신호에 따라 출력되되, 컴퓨팅 장치에 의해 조정가능한 헤드룸(adjustable headroom) 하에서 제 1 오디오 신호를 증폭시킴으로써 출력된다.
또 다른 실시예에 따라서, 오디오 명료도를 향상시키는 장치가 제공된다. 장치는 환경 노이즈 판별 유닛 및 명료도 향상 유닛을 포함한다. 환경 노이즈 판별 유닛은 컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 환경 노이즈를 검출하기 위해 사용된다. 환경 노이즈 판별 유닛에 연결된 명료도 향상 유닛은 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하기 위해, 그리고 노이즈 정보 및 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하기 위해 사용된다.
대안적인 실시예에 따라서, 컴퓨팅 장치가 제공된다. 컴퓨팅 장치는 적어도 하나의 마이크로폰, 컴퓨팅 장치를 제어하는 프로세싱 유닛, 통신 유닛 및 오디오 명료도를 향상시키는 신호 프로세싱 유닛을 포함한다. 오디오 명료도를 향상시키는, 프로세싱 유닛과 통신 유닛이 연결된 신호 프로세싱 유닛은 환경 노이즈 판별 유닛 및 명료도 향상 유닛을 포함한다. 환경 노이즈 판별 유닛은 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라서 환경 노이즈를 검출하기 위해 사용된다. 환경 노이즈 판별 유닛에 연결된 명료도 향상 유닛은 검출되는 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하기 위해, 그리고 노이즈 정보 및 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하기 위해 사용된다.
도 1은 실시예에 따른 오디오 명료도를 향상시키는 방법의 순서도;
도 2는 실시예에 따른 컴퓨팅 장치의 블럭도;
도 3a는 실시예에 따른 컴퓨팅 장치에서 오디오 명료도를 향상시키는 시스템의 블럭도;
도 3b는 명료도 향상 유닛의 또 다른 실시예의 블럭도;
도 4는 오디오 명료도 향상 유닛의 동작 실시예의 도면;
도 5는 서로 다른 주파수 대역에 의해 다운링크 음성을 증폭시키는 실시예의 도면;
도 6은 SNR 평가 방식에 의한 노이즈 정보의 실시예의 도면이다.
설명을 목적으로 하는 다음의 상세한 설명에서, 다수의 특정 설명은 개시된 실시예의 전반적인 이해를 제공하기 위해서 개시된다. 그러나, 분명한 바와 같이, 하나 이상의 실시예는 이러한 특정 설명 없이 실행될 수 있다. 다른 예에서, 매우 잘 알려진 구조 및 장치는 도면을 간단하게 하기 위해 개략적으로 도시된다.
컴퓨팅 장치의 재생 신호를 위해 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치의 실시예들이 제공된다. 도 1은 실시예에 따른 컴퓨팅 장치의 오디오 명료도를 향상시키는 방법의 순서도를 도시한다. 이러한 방법의 실시예에 따라서, 다운링크 음성(downlink voice)의 오디오 명료도는 통화 중에 향상될 수 있는데, 통화가 노이즈 환경에 있거나 노이즈 환경에 처하게 될 경우에도 그러하다. 다른 실시예들에서, 방법은 또한 재생 동안, 예를 들면, 오디오 파일, 멀티미디어 파일, 스트림식 오디오 또는 비디오(예를 들면, 컴퓨팅 장치 상의 유투브로부터 비롯된 시청 비디오물)를 재생시킴으로써, 멀티미디어 소스로부터 나오는 동안 오디오가 가능한 사운드의 명료도를 향상시키기 위해서 사용될 수 있는데, 환경 노이즈가 너무 시끄러울 경우에도 그러하다. 나아가, 모바일 장치의 하드웨어 및 사용자의 청취를 위한 보호물은 추가로 오디오 명료도를 향상시키는 것에서 고려될 수 있다.
방법은 컴퓨팅 장치, 예를 들면, 음성 통신 기능(전화 기술, 모바일 통신 VoIP 등)을 가진 컴퓨팅 장치, 예를 들면, 모바일 폰, 스마트 폰, 태블릿 컴퓨터, 노드 북 컴퓨터 등에서 사용될 수 있다. 모바일 장치가 얻어질 수 있는 구조는 도 2에 도시된 대표적인 실시예에 나타나 있으며, 모바일 장치(2)는 신호 프로세싱 유닛(21), 통신 유닛(23), 프로세싱 유닛(25)(예를 들면, 싱글 코어 또는 멀티 코어를 구비함), 적어도 하나의 마이크로폰(M1), 및 적어도 하나의 스피커(SK1)를 포함한다. 예를 들면, 방법은 신호 프로세싱 유닛(21)에서 사용될 수 있고, 상기 신호 프로세싱 유닛은 통신 유닛(23)(하나 이상의 통신 표준, 예를 들면, 2G, 3G, 3.5G, LTE, 4G를 지원함)으로부터 다운링크 음성 신호(SRx)를 수신하고, 업링크 음성 신호(STx)를 통신 유닛(23)으로 출력한다.
다른 예에서, 방법은 멀티미디어 기능을 가진 컴퓨팅 장치, 예를 들면 퍼스널 컴퓨터, 랩탑, 멀티미디어 장치, 게임 장치 등에 사용될 수 있어서, 오디오 명료도를 향상시킬 수 있다. 예를 들면, 방법은 신호 프로세싱 유닛(21)에 사용될 수 있고, 상기 신호 프로세싱 유닛은 프로세싱 유닛(25) 또는 통신 유닛(23)(또는 심지어 멀티미디어 칩 또는 소스)로부터 나온 오디오 신호(SRx)를, 멀티미디어 소스, 즉, 오디오 또는 멀티미디어 데이터, 예를 들면, 컴퓨팅 장치에 저장된 음악 또는 비디오 파일, 또는 원격 장치, 웹사이트 또는 네트워크 클라우드의 장치로부터 나온 스트림식 오디오 또는 비디오(예를 들면, 모바일 장치에서 유투브 시청)를 재생하는 동안에 수신한다. 나아가, 방법은 무선 네트워크 기능(예를 들면, Wi-Fi)을 가진 모바일 장치에 사용될 수도 있어서, IP-기반 음성 통신 또는 스트림식 멀티미디어를 위해 오디오 명료도를 향상시킬 수 있다.
도 1을 참조하면, 단계 S10에서, 환경 노이즈는 예를 들면 음성 구간 검출(VAD)을 실행함으로써, 검출되는 오디오 신호에 따라 검출된다. 예를 들면, 검출되는 오디오 신호는 통화(예를 들면, 텔레폰, 모바일 통신 또는 IP 음성(Voice-over-IP)) 동안 업링크를 위해, 또는 오디오 또는 멀티미디어 데이터 재생 동안 업링크 없이, 적어도 하나의 마이크로폰, 예를 들면 마이크로폰(M1)으로부터 나온 신호이다. 단계 S20에서, 노이즈 정보는 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 획득되며, 상기 제 1 오디오 신호는 오디오 명료도, 예를 들면 다운링크 음성 신호(예를 들면, SRx), 또는 프로세싱 유닛(21) 또는 멀티미디어 칩 또는 소스로부터 나온 오디오 신호 등을 향상시킨다. 단계 S30에서, 제 2 오디오 신호는 노이즈 정보 및 제 1 오디오 신호에 따라서 출력되고, 예를 들면 증대(또는 증폭)되어 출력된다. 그 후, 제 2 오디오 신호는 제 1 오디오 신호의 오디오-명료도-향상 버전으로 간주될 수 있다. 일부 실시예에서, 제 2 오디오 신호(디지털 또는 아날로그 형태일 수 있음)는 스피커 또는 헤드셋을 가진 컴퓨팅 장치에 의해 재생될 수 있거나, 다른 목적을 위해, 예를 들면 컴퓨팅 장치에 의해 녹음을 위해, 외부 스피커에 의한 재생을 위해, 또는 컴퓨팅 장치를 통해 무선으로 방송을 위해 출력된다.
대표적인 실시예에서, 제 2 오디오 신호는 컴퓨팅 장치에 의해 조정가능한 헤드룸 하에서 제 1 오디오 신호를 증폭시킴으로써, 출력된다. 다른 실시예들에서, 노이즈 정보는 제 1 오디오 신호와 관련되어 검출되는 환경 노이즈의 측정 레벨을 나타낸다. 예를 들면, 노이즈 정보, 예를 들면, 신호 대 노이즈 비 또는 노이즈 신호 강도 또는 다른 노이즈 측정은 단계 S30에서 사용되기 위해 판별될 수 있되, 예를 들면, 제 1 오디오 신호를 증폭시키기 위해 판별될 수 있다.
도 1의 방법에 의해 예시화되는 이러한 방식으로, VAD를 사용하여 검출되는 오디오 신호(예를 들면 마이크로폰으로부터 나온 신호)로부터 검출된 환경 노이즈의 어플리케이션은 제 1 오디오 신호에 대해 오디오 명료도를 용이하게 향상시킨다(예를 들면, 다운링크 음성 신호(SRx) 또는 재생용 오디오 신호). 특히, VAD를 사용하여 검출된 환경 노이즈는 단계 S20에서 충분히 정확하게 맞아서, 단계 S30의 예시에서 이후의 판별 및 증폭을 하기 위해 신뢰가능한 노이즈 정보를 제공할 수 있다. 이러한 접근법은 또한 단계 S30의 예에서, 환경 노이즈로서의 음성 또는 사운드의 부정확한 판별 및 부적절하거나 비정상적인 증대 또는 다운링크 음성 신호의 증폭을 방지할 수 있다.
예에서, 단계 S30에서는 증폭된 다운링크 음성 신호를 타깃 레벨(예를 들면, 3dB)보다 크지 않은 신호-대-노이즈(SNR) 비를 유지시키는 것이 실행될 수 있다. 검출된 환경 노이즈가 -15dB의 레벨(Le로 표시)을 가지고, 다운링크 음성 신호가 -30dB의 레벨(Ld로 표시)에 있는 경우, 증폭된 다운링크 음성 신호는 Ld의 신호 레벨에 값 Lg를 더한 것이 될 수 있어서, 타깃 레벨을 달성할 수가 있다.
노이즈 환경에 대하여, 컴퓨팅 장치의 사용자는 노이즈 환경에 처해 통화를 하는 동안, 다운링크 오디오 신호의 형편없는 오디오 명료도에 고통스러워할 수 있는데, 스피커의 볼륨이 커질 경우에도 그러하다. 최악의 경우는, 너무 증폭된 다운링크 음성 신호의 구동은 오디오 구성요소 또는 스피커에 하드웨어 손상을 줄 수 있다. 너무 증폭된 다운링크 음성 신호는 사용자가 청취하는데 있어 불편한 청취 경험을 제공할 수 있거나 심지어 유해할 수도 있다. 이에 대해, 이루 예에서, 값 Lg는 모바일 장치의 신호 품질 또는 하드웨어 보호를 위해, 헤드룸(즉, 최대로 증가할 수 있는 허용가능한 게인) 내에 있도록 고안될 수 있다. 헤드룸은 또한 명목상의 신호 값과 왜곡이 없이 최대 값 간의 차이로 정의될 수도 있다. 예를 들면, 상기의 숫자 예에 이어, 헤드룸은 10dB로 미리 판별될 수 있고, 그 결과 증폭된 다운링크 음성 신호는 -5dB(즉, -15dB + 10dB)의 신호 레벨을 가지도록 증폭될 수 있다.
그러나, 다운링크 음성 신호의 신호 레벨이 크거나 최대 레벨(예를 들면, 0 dB)에 근접한 상황에서, 증폭된 다운링크 음성 신호는 왜곡될 수 있다. 도 4에 도시된 경우에서, 검출된 환경 노이즈의 레벨(Le)이 -2dB이고 다운링크 음성 신호가 시간(t1) 전에 -9dB의 레벨(Ld)에 있는 경우, 증폭된 다운링크 음성 신호는 +1dB(즉, -9dB + 10dB)의 신호 레벨(Lx)을 가질 수 있는 것으로 기대될 수 있으며, 이때 미리 판별된 헤드룸은 10dB이다. 특히, 신호 레벨이 디지털 영역에서 최대 신호 레벨인 0dB를 초과하는 것은 불가능하며, 이 경우에 증폭된 다운링크 음성 신호는 최대 신호 레벨에서 왜곡될 수 있다. 이는 모바일 장치의 하드웨어 또는 스피커에 하드웨어 손상을 줄 수 있거나, 사용자가 청취하는데 있어 불편한 청취 경험을 불러일으키거나, 또는 심지어 유해할 수도 있다.
이에 따라서, 다른 실시예에서, 단계 S30은 조정가능한 헤드룸으로 실행될 수 있다. 예를 들면, 헤드룸의 조정은 하나 이상의 조건에 따라 달라질 수 있거나, 동력학적으로 구현될 수도 있다. 추가로, 헤드룸은 신호 왜곡뿐만 아니라 사람이 청취하는데, 또는 하드웨어에 다른 손상을 제공하는 것을 방지하기 위해서 설정될 수 있다.
일부 예시에서, 조정가능한 헤드룸은 제 1 오디오 신호의 신호 레벨에 따라 조정될 수 있고, 그 결과 제 2 오디오 신호의 신호 레벨은 제 1 오디오 신호의 신호 레벨에 선형적으로 또는 비-선형적으로 비례하지만, 그러나 여전하게 클립 레벨(clipping level) 미만, 예를 들면 0 dB 미만에 있다.
일 예에서, 단계 S30에서의 다운링크 음성 신호의 증폭은, 다운링크 음성 신호 레벨(예를 들면, 신호 에너지 레벨)이 특정 임계치 레벨(즉, 최대 레벨에 근접하지 않음) 아래로 내려갈 시에 제 1 값(예를 들면, 10dB)을 가진 헤드룸을 사용하여, 그리고 다운링크 음성 신호 레벨(예를 들면, -9dB)이 특정 임계치 레벨을 초과할 시에, 제 1 값 미만인 제 2 값(예를 들면 5dB)을 가진 헤드룸을 사용하여 판별될 수 있다. 도 4를 참조하여, 헤드룸이 제 1 값 미만인 8dB일 시에, 증폭된 다운링크 음성 신호는 최대 레벨보다 낮은 -1dB인 레벨(Lb라 함)에 있게 되고, 이로써, 하드웨어 보호 및 인간 청취를 위하여, 증폭된 다운링크 음성 신호가 안전하게 되는데, 상기의 예시에서와 같이 노이즈 환경이 있는 곳에서도 그러하다.
또 다른 예에서, 헤드룸은 모바일 장치(2)의 볼륨 제어 레벨(volume control level)에 따라 조정가능할 수 있다. 예를 들면, 신호 프로세싱 유닛(21)은, 볼륨 제어 레벨이 변화될 시에, 볼륨 제어 레벨을 나타내는 볼륨 데이터에 대한 정보를 알아낸다. 신호 프로세싱 유닛(21)은 볼륨 데이터에 따라 서로 다른 값의 헤드룸으로 단계 S30을 실행한다. 예를 들면, 볼륨 제어 레벨이 특정 임계치 레벨(예를 들면, 중앙 레벨 또는 그 이상의 레벨)에 있거나, 그보다 아래에 있는 경우에, 헤드룸은 제 1 값(예를 들면, 10dB)으로 설정될 수 있다. 볼륨 제어 레벨이 최대 레벨에 있거나 근접하거나, 또는 특정 임계치 이상으로 있다는 것을 볼륨 데이터가 나타내는 경우, 헤드룸은 제 1 값 미만인 제 2 값(예를 들면, 5dB)으로 설정될 수 있다. 다른 예에서, 헤드룸은 하나 이상의 조건에 따라 예를 들면 다운링크 음성 신호 레벨 및 볼륨 제어 레벨에 따라 조정될 수 있다.
나아가 다른 예에서, 단계 S30에서 제 1 오디오 신호는 서로 다른 주파수 대역에 대해 증폭될 수도 있다. 예를 들면, 노이즈 스펙트럼은 도 5에 도시된다. 충분한 SNR을 유지시키기 위하여, 하나 이상의 주파수 대역에서의 오디오 신호(예를 들면, 파일 또는 스트림식 비디오 또는 오디오 등의 소스로부터 나온 다운링크 음성 또는 오디오 신호)는 인간 청취를 위한 오디오 명료도를 고려할 시에 증폭된다. 이 예에서, 다운링크 음성 신호의 약 500Hz(B1으로 나타남) 및 3kHz(B2로 나타남)의 주파수 대역은 커져야 한다.
도 3a를 참조하면, 블럭도는 실시예에 따른 컴퓨팅 장치에서 오디오 명료도 향상을 위한 시스템을 도시한다. 컴퓨팅 장치의 적어도 하나의 마이크로폰(M1)으로부터 나온 검출되는 오디오 신호 및 오디오 명료도가 향상되는 제 1 오디오 신호(예를 들면, 모바일 장치의 도 2의 통신 유닛(23)으로부터 나온 다운링크 음성 신호 또는 오디오 재생을 위한 프로세싱 유닛(25)으로부터 나온 신호)에 응답하여, 시스템(3)은 컴퓨팅 장치의 적어도 하나의 스피커(SK1)로 제 2 오디오 신호를 출력한다. 시스템(3)은 환경 노이즈 판별 유닛(30) 및 명료도 향상 유닛(32)을 포함한다. 시스템(3)은 소프트웨어, 회로로 실행될 수 있거나, 신호 프로세싱 유닛 또는 일반적인 프로세서를 프로그램밍함으로써 실행될 수 있다. 환경 노이즈 판별 유닛(30)은 도 1에 도시된 바와 같이 단계 S10의 실시예로 간주될 수 있다. 명료도 향상 유닛(32)은 도 1에 도시된 바와 같이 단계 S20 및 S30의 실시예로 간주될 수 있다.
환경 노이즈 판별 유닛(30)은 예비 프로세싱 모듈(pre-processing module)(301) 및 노이즈 평가 모듈(303)을 포함한다. 예비 프로세싱 모듈(301)은 마이크로폰(M1)으로부터 검출되는 오디오 신호가 오디오 또는 노이즈인지를 판별하기 위해, VAD 모듈(3013)에 의해 나타난 음성 구간 검출(VAD)을 실행한다. 예비 프로세싱 모듈(301)은 노이즈 평가 모듈(303)로 판별 결과를 출력한다. 예비 프로세싱 모듈(301)로부터 오디오 신호 및 판별 결과에 응답하여, 노이즈 평가 모듈(303)은 모바일 장치가 위치되는 곳에서 환경 노이즈를 나타내는 기준 노이즈 신호(SRN)를 출력한다. 즉, 노이즈 평가 모듈(303)은, 검출되는 오디오 신호가 노이즈를 나타낼 시에, 검출된 환경 노이즈를 출력할 수 있다. 이에 대하여, 다양한 균등물 실시예가 이용될 수 있다. 실시예들 중 하나에서, 노이즈 평가 모듈(303)은 예비 프로세싱 모듈(301)로부터 검출되는 오디오 신호를 출력하고, 기준 노이즈 신호(SRN)는 SNR 평가용 정보로 환경 노이즈를 나타낸다. 예를 들면, VAD 모듈(3013)이, 검출되는 오디오 신호가 사용자 음성을 나타낸다고 하는 경우, 노이즈 평가 모듈(303)은 스코어가 낮은 노이즈(lower noise score)와 함께 기준 노이즈 신호(SRN)를 출력한다. 검출되는 오디오 신호가 노이즈를 나타내는 경우, 예를 들면 소리지르는 아이들 소리와 같은 특정 사운드와 유사한 노이즈를 나타내는 경우, 노이즈 평가 모듈(303)은, 기준 노이즈 신호(SRN)의 환경 노이즈가 무시될 수 있는 다음 단계(예를 들면, SNR 평가)를 알리는 노이즈가 큰 스코어로 기준 노이즈 신호(SRN)를 출력한다. 또 다른 실시예에서, 노이즈 평가 모듈(303)은, VAD 모듈(3013)이 음성 구간이 없는 것을 나타낼 시에만, 노이즈 스코어가 특정 임계치보다 낮을 시에만 환경 노이즈를 출력하는 것으로서 실행될 수 있다. 상기와 같이, 노이즈 평가 모듈(303)의 실행은 상기의 예에 한정되는 것이 아니라, 다른 방식으로도 실현될 수 있다.
VAD 모듈(3013)은 환경 노이즈로서 음성 또는 사운드의 부정확한 판별을 방지하기 위함이고, 다음 단계에서 제 1 오디오 신호의 증대 또는 증폭 및 적절한 노이즈 평가를 용이하게 하기 위함이다. 일부 예에서, 에너지 레벨 임계치는 음성 구간 검출용 조건으로서 취할 수 있다. 신호 레벨이 특정 에너지 레벨 임계치를 초과하는 경우, 업링크용 오디오 신호가 음성 구간을 나타낸 것으로 판별된다. 이와 반대로, 신호 레벨이 특정 임계치보다 낮은 경우, 오디오 신호는 환경 노이즈로 간주된다. 다른 예에서, 오디오 수단은 음성 구간을 판별하는 VAD 모듈(3013)의 시간 도멘인 또는 주파수의 검출되는 오디오 신호로부터 추출될 수 있다. 예를 들면, 미리 판별된 오디오 수단, 예를 들면, 사무소 또는 기차 역에서 말하는 소리, 걷는 소리 등은 음성 구간의 판별을 참조하기 위해 저장되어 사용될 수 있다. 일 예에서, VAD 모듈(3013)은 직렬로, 병렬로 음성 구간(예를 들면, 노이즈 스코어; 또는 음성 또는 노이지 표시)을 위한 판별 결과로 검출되는 오디오 신호를 출력하는 것으로 실행될 수 있다.
게다가, 예비 프로세싱 모듈(301)은 VAD 모듈(3013) 전에 디-에코 모듈(de-echo module)(3011)에 의해 나타난 바와 같이 디-에코 프로세싱을 실행할 수도 있고, 그 결과 음성 구간의 판별 결과는 보다 정확해질 수 있다. 예를 들면, 디-에코 모듈(3011)의 디-에코 프로세싱은 시간 도메인에 적합한 필터에 의해 실행될 수 있고, 디-에코 모듈(3011)은 검출되는 오디오 신호의 디-에코된 버전을 VAD 모듈(3013)로 출력할 수 있다.
다른 예에서, 환경 노이즈 판별 유닛(30)은 인간의 말과 노이즈 간을 구별하기 위해 사용될 수 있는 노이즈 스펙트럼 검출 또는 평가를 사용함으로써, 검출되는 오디오 신호에 따라 환경 노이즈를 검출할 수 있다.
명료도 향상 유닛(32)은 신호 대 노이즈 비(SNR) 평가 모듈(321), 게인 계산 모듈(323), 및 증폭 모듈(boosting module)(325)을 포함한다. SNR 평가 모듈(321)은 단계 S20에서 나타난 바와 같이, 노이즈 정보를 획득할 수 있다. 기준 노이즈 신호(SRN) 및 다운링크 음성 신호(SRx)에 응답하여, SNR 평가 모듈(321)은 도 6에 도시된 파선 곡선(N)과 같이 주파수에 대한 노이즈 레벨 등의 노이즈 정보를 출력한다. 게인 계산 모듈(323) 및 증폭 모듈(325)은 단계(S30)에 도시된 바와 같이, 다운링크 음성 신호(SRx)를 증폭하기 위해 사용된다. 노이즈 정보 및 제 1 다운링크 음성 신호(SRx)에 응답하여, 게인 계산 모듈(323)은 제 1 다운링크 음성 신호(SRx)를 증폭하기 위해, 증폭 모듈(325)을 제어하도록 하나 이상의 파라미터를 판별한다. 예를 들면, 게인 계산 모듈(323)은 도 6에 도시된 바와 같이, 일부 주파수 대역에서, Sg로 표기된 제 1 다운링크 음성 신호(SRx)에 대한 신호 레벨이 환경 노이즈(N)에 대한 신호 레벨보다 낮다고 판별한다. 이에 따라서, 게인 계산 모듈(323)은 주파수 대역(W1)의 제 1 다운링크 음성 신호를 증폭하는 것이 필요하다고 판별하고, 판별된 주파수 대역에 대한 제 1 다운링크 음성 신호(SRx)를 증폭하여 오디오 명료도에 대해 충분한 SNR을 유지하기 위해, 증폭 모듈(325)을 제어한다. 하나 이상의 주파수 대역은, 예를 들면, 도 6의 주파수 대역들(W1 및 W2)은 판별된 주파수 대역일 수 있다. 예를 들면, 게인 계산 모듈(323)은 환경 노이즈의 노이즈 레벨을 제 1 다운링크 음성 신호(SRx)의 신호 레벨과 비교하여, 증폭 모듈(325)을 제어하는 판별 결과를 판별하고, 상기 판별 결과는 또한 증폭 모듈(325)에 대한 신호레벨의 증가량을 포함할 수 있다.
나아가, 단계 S30에 대한 상기의 예는 하나 이상의 주파수 대역용 다운링크 음성 신호를 증폭시키는 하나 이상의 레벨을 판별하는 게인 계산 모듈(323)에 적용될 수도 있다. 예를 들면, 게인 계산 모듈(323)의 헤드룸의 조정은 하나 이상의 조건에 따라 달라질 수 있거나, 동력학적으로도 구현될 수 있다. 게다가, 헤드룸은 신호 왜곡뿐만 아니라 하드웨어 또는 인가 청취에 대한 다른 손상을 방지하기 위해서도 설정될 수 있다. 일부 예에서, 게인 계산 모듈(323)은 헤드 룸을 조정하는 방법 및 어떻게 조정할지를 판별하기 위해 모바일 장치의 다른 구성요소 또는 프로세싱 유닛으로부터 볼륨 데이터를 획득할 수 있다.
증폭 모듈(325)은 이퀄라이제이션(equalization) 또는 다른 증대 또는 증폭 기술을 사용하여 실행될 수 있다.
일부 실시예들에서, 도 3에 도시된 시스템(3)의 하나 이상의 모듈, 유닛 및 블럭은 소프트웨어 코드, 소프트웨어 모듈, 또는 전용 회로(예를 들면, 칩 또는 칩의 회로 모듈)로 실현될 수 있거나 신호 프로세싱 유닛 또는 프로그램밍이 가능한 칩 또는 일반적인 프로세서를 프로그램밍함으로써 실행될 수 있다. 예를 들면, 시스템(3)은 프로세서(예를 들면, 하나 이상의 코어를 가짐), 예를 들면, 어플리케이션 프로세서 또는 디지털 신호 프로세서(DSP) 또는 어플리케이션 특정 집적 회로(ASIC)를 사용함으로써 실현될 수 있거나, FPGA(field-programmable gate array)에서 실현될 수 있으며, 이때 상기 FPGA는 도 3a의 시스템(3)(또는 도 1의 방법)의 특정 동작을 실행하기 위해 설계된다.
도 3b를 참조하여, 명료도 향상 유닛의 또 다른 실시예가 도시된다. 도 3a와 비교하여, 도 3b에 도시된 명료도 향상 유닛(42)은 재생용 제 1 오디오 신호에 대한 경로 상(예를 들면, SRx로 표기됨)의 예비 프로세싱 모듈(420)을 더 포함한다. 제 1 오디오 신호에 응답하여, 예비 프로세싱 모듈(420)은 다음 단계에서 증폭될, 예비 처리된 제 1 오디오 신호를 출력하되, 제 1 오디오 신호가 원하는 음성 또는 사운드를 나타내는 경우에 출력한다. 예를 들면, 통화 중에 일부 시간 동안 제 1 오디오 신호가 음성이 없거나 또는 노이즈가 없다고 하는 경우, 바람직하지 않아서, 증폭될 필요가 없거나 필터링될 수 있다. 일부 실시예들에서, 예비 프로세싱 모듈(420)은 상기에서 예로 나타난 바와 같이, VAD 모듈 또는 노이즈 평가 모듈, 또는 이들 둘 다를 포함할 수 있다. 일부 실시예들에서, 예비 프로세싱 모듈(420)은 하나 이상의 제어 신호 또는 표시 데이터(indication data)를 명료도 향상 유닛(42)의 하나 이상의 다른 모듈에 출력할 수 있어서, 예비 처리된 제 1 오디오 신호가 다음 단계에 의해 증폭될 수 있도록 하는데, 제 1 오디오 신호가 원하는 음성 또는 사우드를 나타낼 경우에 그러하다.
나아가, 다른 실시예들은 프로그램 코드를 저장하는, 기계장치 또는 장치로 판독가능한 정보 저장 매체 또는 하나 또는 다수의 프로그램 모듈을 더 개시한다. 프로그램 코드는 도 1의 오디오 명료도 향상을 위한 방법, 또는 도 3a 또는 3b의 시스템(3)을 구현시키기 위해 실행될 수 있다. 실시예 각각의 판독가능한 정보 저장 매체는 광학 정보 저장 매체, 자기 정보 저장 매체 또는 메모리, 예를 들면 메모리 카드, 펌웨어, 디지털 신호 프로세서 또는 일반적인 프로세서 등과 같은 프로그램밍이 가능한 칩에 매립되어 있거나 전용으로 사용될 수 있는 ROM 또는 RAM을 제한 없이 포함한다.
기술 분야의 통상의 기술자에게 있어서, 다양한 변형 및 변화가 개시된 실시예에서 구현될 수 있음은 명백할 것이다. 의도된 바와 같이, 명세서 및 예시는 단지 예시일뿐, 명세서의 참된 권리 범위는 다음의 청구항 및 이들의 균등물에 의해 나타난다.

Claims (32)

  1. 컴퓨팅 장치에서 오디오 명료도를 향상시키는 방법에 있어서,
    컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 음성 구간 검출을 실행함으로써, 환경 노이즈를 검출하는 단계;
    검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하는 단계; 및
    상기 노이즈 정보 및 상기 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 컴퓨팅 장치에 의해 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하는 단계를 포함하는 오디오 명료도 향상 방법.
  2. 청구항 1에 있어서,
    상기 노이즈 정보는 상기 제 1 오디오 신호와 관련되어 검출된 환경 노이즈의 측정 레벨을 나타내는 것을 특징으로 하는 오디오 명료도 향상 방법.
  3. 청구항 1에 있어서,
    상기 환경 노이즈를 검출하는 단계는:
    상기 검출되는 오디오 신호가 노이즈인지 또는 노이즈가 아닌지를 판별하기 위해 음성 구간 검출을 실행하는 단계; 및
    상기 검출되는 오디오 신호가 노이즈를 나타낼 시에, 상기 검출된 환경 노이즈를 출력하는 단계를 포함하는 것을 특징으로 하는 오디오 명료도 향상 방법.
  4. 청구항 1에 있어서,
    상기 환경 노이즈를 검출하는 단계는:
    상기 검출되는 오디오 신호의 디-에코된 버전을 출력하는 단계; 및
    상기 검출되는 오디오 신호가 노이즈를 나타낼 시에, 상기 검출된 환경 노이즈를 출력하는 단계를 포함하고,
    상기 음성 구간 검출은 상기 검출되는 오디오 신호가 노이즈인지 또는 노이즈가 아닌지를 판별하기 위해 상기 검출되는 오디오 신호의 디-에코된 버전에 따라 실행되는 것을 특징으로 하는 오디오 명료도 향상 방법.
  5. 청구항 1에 있어서,
    상기 조정가능한 헤드룸이 상기 제 1 오디오 신호의 신호 레벨에 따라 조정되며, 그 결과 상기 제 2 오디오 신호의 신호 레벨은 상기 제 1 오디오 신호의 신호 레벨과 비례하되, 클립 레벨 미만 하에 비례하는 것을 특징으로 하는 오디오 명료도 향상 방법.
  6. 청구항 1에 있어서,
    상기 조정가능한 헤드룸은, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨 아래에 있을 시에 제 1 값에 있고, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨을 초과할 시에 상기 제 1 값 미만인 제 2 값에 있는 것을 특징으로 하는 오디오 명료도 향상 방법.
  7. 청구항 1에 있어서,
    상기 조정가능한 헤드룸은 상기 컴퓨팅 장치의 볼륨 제어 레벨에 따라서 조정되는 것을 특징으로 하는 오디오 명료도 향상 방법.
  8. 청구항 7에 있어서,
    상기 조정가능한 헤드룸은, 상기 볼륨 제어 레벨이 임계치 레벨 아래에 있을 시에 제 1 값에 있고, 상기 볼륨 제어 레벨이 임계치 레벨을 초과할 시에 제 1 값 미만인 제 2 값에 있는 것을 특징으로 하는 오디오 명료도 향상 방법.
  9. 청구항 1에 있어서,
    상기 오디오 명료도 향상 방법은 상기 제 1 오디오 신호가 상기 제 1 오디오 신호를 예비 처리함으로써 노이즈인지를 판별하는 단계를 더 포함하고,
    상기 제 2 오디오 신호를 출력하는 단계에서, 상기 제 2 오디오 신호는 상기 제 1 오디오 신호를 증폭시킴 없이 출력되되, 예비 처리될 시에 상기 제 1 오디오 신호가 노이즈라고 판별된 경우에 출력되는 것을 특징으로 하는 오디오 명료도 향상 방법.
  10. 청구항 9에 있어서,
    상기 예비 처리는 음성 구간 검출을 사용함으로써 상기 제 1 오디오 신호에 대해 실행되는 것을 특징으로 하는 오디오 명료도 향상 방법.
  11. 청구항 9에 있어서,
    상기 예비 처리는 노이즈 평가를 사용함으로써 상기 제 1 오디오 신호에 대해 실행되는 것을 특징으로 하는 오디오 명료도 향상 방법.
  12. 청구항 1에 있어서,
    상기 제 2 오디오 신호는 인간 청취를 위한 적어도 하나의 주파수 대역에 관련된 제 1 오디오 신호를 증폭시킴으로써 출력되는 것을 특징으로 하는 오디오 명료도 향상 방법.
  13. 컴퓨팅 장치에서 오디오 명료도를 향상시키는 장치에 있어서,
    컴퓨팅 장치의 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 환경 노이즈를 검출하는 환경 노이즈 판별 유닛; 및
    상기 환경 노이즈 판별 유닛에 연결되며, 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하고, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하는 명료도 향상 유닛을 포함하는 오디오 명료도 향상 장치.
  14. 청구항 13에 있어서,
    상기 노이즈 정보는 상기 제 1 오디오 신호와 관련되어 검출된 환경 노이즈의 측정 레벨을 나타내는 것을 특징으로 하는 오디오 명료도 향상 장치.
  15. 청구항 13에 있어서,
    상기 환경 노이즈 판별 유닛은:
    상기 검출되는 오디오 신호에 따라 오디오 신호를 출력하며, 상기 검출되는 오디오 신호가 노이즈인지 또는 노이즈가 이난지를 판별하고 상기 판별 결과를 출력하는 음성 구간 검출 모듈을 포함하는 예비 프로세싱 모듈; 및
    상기 예비 프로세싱 모듈로부터 나온 상기 판별 결과 및 상기 오디오 신호에 응답하여 기준 노이즈 신호를 출력하는 노이즈 평가 모듈을 포함하는 것을 특징으로 하는 오디오 명료도 향상 장치.
  16. 청구항 13에 있어서,
    상기 명료도 향상 유닛은 상기 제 1 오디오 신호의 신호 레벨에 따라 조정가능한 헤드룸을 조정하기 위해 동작되고, 그 결과 상기 제 2 오디오 신호의 신호 레벨은 상기 제 1 오디오 신호의 신호 레벨과 비례하되, 불완전한 임계치(truncated threshold) 미만 하에 비례하는 것을 특징으로 하는 오디오 명료도 향상 장치.
  17. 청구항 13에 있어서,
    상기 명료도 향상 유닛은, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 제 1 오디오 신호의 신호 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 오디오 명료도 향상 장치.
  18. 청구항 13에 있어서,
    상기 명료도 향상 유닛은 상기 컴퓨팅 장치의 볼륨 제어 레벨에 따라서 조정가능한 헤드룸을 조정하기 위해 동작하는 것을 특징으로 하는 오디오 명료도 향상 장치.
  19. 청구항 18에 있어서,
    상기 명료도 향상 유닛은, 상기 볼륨 제어 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 볼륨 제어 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 상기 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 오디오 명료도 향상 장치.
  20. 청구항 13에 있어서,
    상기 명료도 향상 유닛은:
    기준 노이즈 신호 및 제 1 오디오 신호에 응답하여 노이즈 정보를 출력하는 신호 대 노이즈 비 평가 모듈;
    증폭 모듈; 및
    상기 증폭 모듈과 상기 신호 대 노이즈 비 평가 모듈 사이에 연결되며, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 응답하여, 상기 제 1 오디오 신호를 증폭시키기 위해 상기 증폭 모듈을 제어하는 게인 계산 모듈을 포함하는 것을 특징으로 하는 오디오 명료도 향상 장치.
  21. 청구항 20에 있어서,
    상기 명료도 향상 유닛은:
    상기 제 1 오디오 신호가 노이지인지를 판별하는 예비 프로세싱 모듈을 더 포함하며,
    상기 예비 프로세싱 모듈이 상기 제 1 오디오 신호가 노이즈라고 판별하는 경우에, 상기 예비 프로세싱 모듈은 상기 제 1 오디오 신호를 증폭시킴 없이 제 2 오디오 신호를 출력하기 위해서, 상기 게인 계산 모듈에게 상기 증폭 모듈을 제어하라고 알리는 것을 특징으로 하는 오디오 명료도 향상 장치.
  22. 청구항 20에 있어서,
    상기 예비 프로세싱 모듈은, 상기 제 1 오디오 신호가 상기 1 오디오 신호의 노이즈 평가 또는 음성 구간 검출에 따른 노이즈인지를 판별하는 것을 특징으로 하는 오디오 명료도 향상 장치.
  23. 적어도 하나의 마이크로폰;
    컴퓨팅 장치를 제어하는 프로세싱 유닛;
    통신 유닛;
    상기 프로세싱 유닛과 상기 통신 유닛에 연결되며, 오디오 명료도를 향상시키기 위한 신호 프로세싱 유닛을 포함하며,
    상기 신호 프로세싱 유닛은:
    상기 적어도 하나의 마이크로폰으로부터 검출되는 오디오 신호에 따라 환경 노이즈를 검출하는 환경 노이즈 판별 유닛; 및
    상기 환경 노이즈 판별 유닛에 연결되며, 검출된 환경 노이즈 및 제 1 오디오 신호에 따라 노이즈 정보를 획득하고, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 따라 제 2 오디오 신호를 출력하되, 조정가능한 헤드룸 하에서 상기 제 1 오디오 신호를 증폭시킴으로써 제 2 오디오 신호를 출력하는 명료도 향상 유닛을 포함하는 것을 특징으로 하는 컴퓨팅 장치.
  24. 청구항 23에 있어서,
    상기 명료도 향상 유닛은 상기 제 1 오디오 신호의 신호 레벨에 따라 조정가능한 헤드룸을 조정하기 위해 동작되고, 그 결과 상기 제 2 오디오 신호의 신호 레벨은 상기 제 1 오디오 신호의 신호 레벨과 비례하되, 불완전한 임계치(truncated threshold) 미만 하에 비례하는 것을 특징으로 하는 컴퓨팅 장치.
  25. 청구항 23에 있어서,
    상기 명료도 향상 유닛은, 상기 제 1 오디오 신호의 신호 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 제 1 오디오 신호의 신호 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 컴퓨팅 장치.
  26. 청구항 23에 있어서,
    상기 명료도 향상 유닛은 상기 컴퓨팅 장치의 볼륨 제어 레벨에 따라서 조정가능한 헤드룸을 조정하기 위해 동작하는 것을 특징으로 하는 컴퓨팅 장치.
  27. 청구항 26에 있어서,
    상기 명료도 향상 유닛, 상기 볼륨 제어 레벨이 임계치 레벨 아래에 있을 시에 상기 조정가능한 헤드룸을 제 1 값으로 변화시키고, 상기 볼륨 제어 레벨이 상기 임계치 레벨을 초과할 시에 상기 조정가능한 헤드룸을 상기 제 1 값 미만인 제 2 값으로 변화시키기 위해 동작하는 것을 특징으로 하는 컴퓨팅 장치.
  28. 청구항 23에 있어서,
    상기 명료도 향상 유닛은:
    기준 노이즈 신호 및 제 1 오디오 신호에 응답하여 노이즈 정보를 출력하는 신호 대 노이즈 비 평가 모듈;
    증폭 모듈; 및
    상기 증폭 모듈과 상기 신호 대 노이즈 비 평가 모듈 사이에 연결되며, 상기 노이즈 정보 및 상기 제 1 오디오 신호에 응답하여, 상기 제 1 오디오 신호를 증폭시키기 위해 상기 증폭 모듈을 제어하는 게인 계산 모듈을 포함하는 것을 특징으로 하는 컴퓨팅 장치.
  29. 청구항 28에 있어서,
    상기 명료도 향상 유닛은:
    상기 제 1 오디오 신호가 노이지인지를 판별하는 예비 프로세싱 모듈을 더 포함하며,
    상기 예비 프로세싱 모듈이 상기 제 1 오디오 신호가 노이즈라고 판별하는 경우에, 상기 예비 프로세싱 모듈은 상기 제 1 오디오 신호를 증폭시킴 없이 제 2 오디오 신호를 출력하기 위해서, 상기 게인 계산 모듈에게 상기 증폭 모듈을 제어하라고 알리는 것을 특징으로 하는 컴퓨팅 장치.
  30. 청구항 23에 있어서,
    상기 통신 유닛은 상기 신호 프로세싱 유닛으로 상기 제 1 오디오 신호를 출력하고, 상기 제 1 오디오 신호는 음성 통신을 위한 다운링크 오디오 신호인 것을 특징으로 하는 컴퓨팅 장치.
  31. 청구항 23에 있어서,
    상기 프로세싱 유닛은 멀티미디어 소스에 따라 상기 제 1 오디오 신호를 상기 신호 프로세싱 유닛으로 출력하는 것을 특징으로 하는 컴퓨팅 장치.
  32. 청구항 23에 있어서,
    상기 제 2 오디오 신호는 인간 청취를 위한 적어도 하나의 주파수 대역에 관련된 제 1 오디오 신호를 증폭시킴으로써 출력되는 것을 특징으로 하는 컴퓨팅 장치.
KR1020120148590A 2012-02-22 2012-12-18 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치 KR101455710B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261601583P 2012-02-22 2012-02-22
US61/601,583 2012-02-22
US13/671,499 US9064497B2 (en) 2012-02-22 2012-11-07 Method and apparatus for audio intelligibility enhancement and computing apparatus
US13/671,499 2012-11-07

Publications (2)

Publication Number Publication Date
KR20130096625A true KR20130096625A (ko) 2013-08-30
KR101455710B1 KR101455710B1 (ko) 2014-10-28

Family

ID=47826798

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120148590A KR101455710B1 (ko) 2012-02-22 2012-12-18 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치

Country Status (6)

Country Link
US (1) US9064497B2 (ko)
EP (1) EP2631907A1 (ko)
JP (1) JP5704470B2 (ko)
KR (1) KR101455710B1 (ko)
CN (1) CN103295581B (ko)
TW (1) TWI484483B (ko)

Families Citing this family (185)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9129291B2 (en) * 2008-09-22 2015-09-08 Personics Holdings, Llc Personalized sound management and method
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
KR20120034863A (ko) * 2010-10-04 2012-04-13 삼성전자주식회사 이동통신 단말기에서 오디오 신호 처리 방법 및 장치
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9064497B2 (en) 2012-02-22 2015-06-23 Htc Corporation Method and apparatus for audio intelligibility enhancement and computing apparatus
US9349385B2 (en) 2012-02-22 2016-05-24 Htc Corporation Electronic device and gain controlling method
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US8639294B2 (en) * 2012-05-01 2014-01-28 Audyssey Laboratories, Inc. System and method for performing automatic gain control in mobile phone environments
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
KR102118209B1 (ko) 2013-02-07 2020-06-02 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
CN104010265A (zh) * 2013-02-22 2014-08-27 杜比实验室特许公司 音频空间渲染设备及方法
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) * 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
TWI545556B (zh) * 2013-10-02 2016-08-11 宏達國際電子股份有限公司 電子裝置與增益控制方法
ES2732304T3 (es) * 2013-10-22 2019-11-21 Fraunhofer Ges Forschung Concepto para la compresión combinada del intervalo dinámico y prevención guiada de recortes para dispositivos de audio
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
CN104219402A (zh) * 2014-02-14 2014-12-17 爱沟通网络科技有限公司 一种改善VoIP通信质量的系统
JP6106618B2 (ja) * 2014-02-21 2017-04-05 日本電信電話株式会社 音声区間検出装置、音声認識装置、その方法、及びプログラム
US9484043B1 (en) * 2014-03-05 2016-11-01 QoSound, Inc. Noise suppressor
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
TWI559295B (zh) * 2014-10-08 2016-11-21 Chunghwa Telecom Co Ltd Elimination of non - steady - state noise
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
CN104900237B (zh) * 2015-04-24 2019-07-05 上海聚力传媒技术有限公司 一种用于对音频信息进行降噪处理的方法、装置和系统
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US20170018282A1 (en) * 2015-07-16 2017-01-19 Chunghwa Picture Tubes, Ltd. Audio processing system and audio processing method thereof
CN105244037B (zh) * 2015-08-27 2019-01-15 广州市百果园网络科技有限公司 语音信号处理方法及装置
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
CN105704321B (zh) * 2016-03-21 2019-02-22 Oppo广东移动通信有限公司 利用降噪麦克风动态调节通话音量的方法和系统
TWI595791B (zh) * 2016-03-29 2017-08-11 高瞻資訊股份有限公司 音訊檢測方法
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
CN106527478A (zh) * 2016-11-24 2017-03-22 深圳市道通智能航空技术有限公司 无人机现场声音获取方法与有声视频实现方法及相关装置
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
CN107404625B (zh) * 2017-07-18 2020-10-16 海信视像科技股份有限公司 终端的音效处理方法及装置
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
CN108269567B (zh) * 2018-01-23 2021-02-05 北京百度网讯科技有限公司 用于生成远场语音数据的方法、装置、计算设备以及计算机可读存储介质
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
TWI665661B (zh) * 2018-02-14 2019-07-11 美律實業股份有限公司 音頻處理裝置及音頻處理方法
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
CN108540886A (zh) * 2018-04-17 2018-09-14 建荣半导体(深圳)有限公司 一种听力保护方法、系统、存储装置及蓝牙耳机
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US10991377B2 (en) * 2019-05-14 2021-04-27 Goodix Technology (Hk) Company Limited Method and system for speaker loudness control
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
RU203218U1 (ru) * 2020-12-15 2021-03-26 Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" «речевой корректор» - устройство для улучшения разборчивости речи
CN114915886A (zh) * 2021-02-08 2022-08-16 苏州佳世达电通有限公司 动态播音方法及播音装置
CN112614513B (zh) * 2021-03-08 2021-06-08 浙江华创视讯科技有限公司 一种语音检测方法、装置、电子设备及存储介质
CN113190207A (zh) 2021-04-26 2021-07-30 北京小米移动软件有限公司 信息处理方法、装置、电子设备及存储介质
WO2023028018A1 (en) 2021-08-26 2023-03-02 Dolby Laboratories Licensing Corporation Detecting environmental noise in user-generated content

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI102337B (fi) * 1995-09-13 1998-11-13 Nokia Mobile Phones Ltd Menetelmä ja piirijärjestely audiosignaalin käsittelemiseksi
GB2306086A (en) 1995-10-06 1997-04-23 Richard Morris Trim Improved adaptive audio systems
JP3284176B2 (ja) 1996-10-25 2002-05-20 シャープ株式会社 オーディオ装置
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
JP2000163098A (ja) 1998-11-25 2000-06-16 Mitsubishi Electric Corp 音声認識装置
KR100742140B1 (ko) * 1999-03-30 2007-07-24 퀄컴 인코포레이티드 이동전화 스피커와 마이크로폰 이득을 자동으로 조정하는방법 및 장치
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
JP4145507B2 (ja) 2001-06-07 2008-09-03 松下電器産業株式会社 音質音量制御装置
JP2004173173A (ja) 2002-11-22 2004-06-17 Matsushita Electric Ind Co Ltd 音声処理装置
EP1652297A2 (en) 2003-07-28 2006-05-03 Koninklijke Philips Electronics N.V. Audio conditioning apparatus, method and computer program product
EP1580882B1 (en) 2004-03-19 2007-01-10 Harman Becker Automotive Systems GmbH Audio enhancement system and method
US8280730B2 (en) * 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
JP4483761B2 (ja) 2005-10-14 2010-06-16 パナソニック電工株式会社 拡声通話装置
US20090010452A1 (en) 2007-07-06 2009-01-08 Texas Instruments Incorporated Adaptive noise gate and method
JP5134876B2 (ja) * 2007-07-11 2013-01-30 株式会社日立製作所 音声通信装置及び音声通信方法並びにプログラム
US8954324B2 (en) 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
JP5219522B2 (ja) 2008-01-09 2013-06-26 アルパイン株式会社 音声明瞭度改善システム及び音声明瞭度改善方法
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
KR101544429B1 (ko) 2008-10-17 2015-08-17 삼성전자주식회사 이동통신 시스템의 이득 제어 장치 및 방법
JP5127754B2 (ja) 2009-03-24 2013-01-23 株式会社東芝 信号処理装置
US8571231B2 (en) * 2009-10-01 2013-10-29 Qualcomm Incorporated Suppressing noise in an audio signal
US9064497B2 (en) 2012-02-22 2015-06-23 Htc Corporation Method and apparatus for audio intelligibility enhancement and computing apparatus
JP6109927B2 (ja) 2012-05-04 2017-04-05 カオニックス ラブス リミテッド ライアビリティ カンパニー 源信号分離のためのシステム及び方法
EP2880655B8 (en) 2012-08-01 2016-12-14 Dolby Laboratories Licensing Corporation Percentile filtering of noise reduction gains

Also Published As

Publication number Publication date
JP5704470B2 (ja) 2015-04-22
US9064497B2 (en) 2015-06-23
CN103295581B (zh) 2016-04-06
EP2631907A1 (en) 2013-08-28
TW201335931A (zh) 2013-09-01
CN103295581A (zh) 2013-09-11
KR101455710B1 (ko) 2014-10-28
JP2013172454A (ja) 2013-09-02
TWI484483B (zh) 2015-05-11
US20130218560A1 (en) 2013-08-22

Similar Documents

Publication Publication Date Title
KR101455710B1 (ko) 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치
KR101311028B1 (ko) 주변 잡음 검출을 이용한 요해도 제어
KR101118217B1 (ko) 오디오 데이터 처리 장치 및 방법
US9208767B2 (en) Method for adaptive audio signal shaping for improved playback in a noisy environment
CA2766196C (en) Apparatus, method and computer program for controlling an acoustic signal
KR101731714B1 (ko) 음질 개선을 위한 방법 및 헤드셋
WO2017215657A1 (zh) 音效处理方法及终端设备
JP4940158B2 (ja) 音補正装置
EP3038255B1 (en) An intelligent volume control interface
WO2014169757A1 (zh) 自适应调节频响的方法及终端
US7760869B2 (en) Method and apparatus for controlling the transmit volume level of a speakerphone
CN108307022A (zh) 音量控制方法及装置
US11616873B2 (en) Communication device and output sidetone adjustment method thereof
KR101760122B1 (ko) 휴대단말기의 평균 음압 향상 장치 및 방법
CN108307046B (zh) 一种通话管理方法及终端
US9686613B2 (en) Method for audio signal processing and system thereof
KR20100116276A (ko) 휴대용 단말기에서 백색 잡음 제거 방법 및 장치
KR100641161B1 (ko) 이동통신단말기의 음량 조정 장치 및 방법
CN115460476A (zh) 一种对讲系统的音频参数处理方法、装置和对讲系统
JP2009239650A (ja) 出力音量自動制御装置、出力音量自動制御方法
KR20120137657A (ko) 음향 출력이 가능한 단말기 및 그 음향 출력방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170919

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180918

Year of fee payment: 5