KR20160032138A - 청각 장면 분석 및 음성 모델링에 기초한 음성 신호 분리 및 합성 - Google Patents

청각 장면 분석 및 음성 모델링에 기초한 음성 신호 분리 및 합성 Download PDF

Info

Publication number
KR20160032138A
KR20160032138A KR1020167002690A KR20167002690A KR20160032138A KR 20160032138 A KR20160032138 A KR 20160032138A KR 1020167002690 A KR1020167002690 A KR 1020167002690A KR 20167002690 A KR20167002690 A KR 20167002690A KR 20160032138 A KR20160032138 A KR 20160032138A
Authority
KR
South Korea
Prior art keywords
speech
noise
spectral
mixture
voice
Prior art date
Application number
KR1020167002690A
Other languages
English (en)
Inventor
카를로스 아벤다노
데이비드 클레인
존 우드러프
마이클 굿윈
Original Assignee
오디언스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오디언스 인코포레이티드 filed Critical 오디언스 인코포레이티드
Publication of KR20160032138A publication Critical patent/KR20160032138A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

잡음과 음성의 혼합물을 표시하는 음성 신호로부터 선명한 음성을 생성하는 시스템 및 방법이 제공된다. 상기 선명한 음성은 합성 음성 파라미터로부터 생성될 수 있다. 상기 합성 음성 파라미터는 청각 및 음성 생성 원리를 이용하여 음성 신호 컴포넌트 및 음성 모델에 기초하여 도출된다. 상기 모델링은 음성 신호의 음원-필터 구조를 활용한다. 상기 음성 신호에 대한 하나 이상의 스펙트럼 분석은 스펙트럼 표시를 생성하도록 수행된다. 상기 피처 데이터는 스펙트럼 표시에 기초하여 도출된다. 상기 음성 모델에 따라 상기 타겟 음성에 대응하는 피처는 그룹화되고 피처 데이터로부터 분리된다. 스펙트럼 포락선, 피치 데이터 및 유성음 분류 데이터를 포함하는 합성 음성 파라미터는 타겟 음성에 대응하는 피처에 기초하여 생성된다.

Description

청각 장면 분석 및 음성 모델링에 기초한 음성 신호 분리 및 합성{SPEECH SIGNAL SEPARATION AND SYNTHESIS BASED ON AUDITORY SCENE ANALYSIS AND SPEECH MODELING}
(관련 출원의 상호 참조)
본 출원은 "청각 장면 분석과 음성 모델링에 기초한 음성 신호 분리 및 합성을 위한 시스템 및 방법"이라는 제하의 2013년 7월 19일 출원된 미국가출원번호 제61/856,577호, 및 "동시 개체의 다중 속성 추적"이라는 제하의 2014년 3월 28일 출원된 미국가출원번호 제61/972,112호의 우선권을 주장한다. 상기 출원은 모든 목적을 위해 본원에 참조에 의해 통합된다.
본 발명은 오디오 처리에 관한 것으로, 특히 잡음과 음성의 혼합물로부터 선명한 음성 신호를 생성하는 것에 관한 것이다.
위너 필터링(Wiener filtering)과 같은 현재의 잡음 억제 기술은 전역 신호 대 잡음비(SNR)를 개선하고 저 SNR 영역을 감쇠를 도모하여 음성 신호로의 변형을 도입하도록 한다. 변환 영역에서의 크기 변조와 같은 필터링을 수행하는 것이 일반적이다. 일반적으로, 손상된 신호는 크기 변조로 신호를 재구성하는 데에 이용된다. 이러한 접근 방식은 잡음 지배 신호 컴포넌트를 손실하도록(miss) 하여, 바람직하지 않고 자연스럽지 않은 스펙트럼-시간 변조를 가져올 수 있다.
타겟 신호가 잡음이 우세하게 되는 경우, 변조를 통해 손상된 오디오를 개선하는 대신에 선명한 음성 신호를 합성하는 시스템이 고 신호 대 잡음 비 개선(SNRI) 값과 낮은 신호 왜곡을 달성하는 데에 효익이 있다.
본 요약은 하기의 상세한 설명에 더 기술되는 간략한 형태로 된 개념 중 선택한 것을 소개하기 위해 제공된다. 본 요약은 청구된 본 발명의 주요한 특징 또는 필수적인 특징을 식별하도록 의도되지 않고, 본 발명의 범위를 판정하는 보조 장치로서 사용되는 것을 의도하지도 않는다.
본 발명의 하나의 양태에 따르면, 잡음과 음성의 혼합물로부터 선명한 음성(speech)을 생성하는 방법이 제공된다. 본 방법은 잡음 및 음성의 상기 혼합물 및 음성의 모델에 기초하여 합성 음성 파라미터를 도출하는 단계 및, 상기 음성 파라미터에 적어도 부분적으로 기초하여 선명한 음성을 합성하는 단계를 포함한다.
일부 실시예에서, 음성 파라미터를 도출하는 단계는 하나 이상의 스펙트럼 표시를 생성하기 위해 잡음과 음성의 상기 혼합물에 대한 하나 이상의 스펙트럼 분석을 실시하는 것으로 시작한다. 상기 하나 이상의 스펙트럼 표시는 그런다음 피처 데이터를 도출하도록 사용될 수 있다. 타겟 음성에 대응하는 피처는 그런다음 음성의 모델에 따라서 그룹화되고 피처 데이터로부터 분리될 수 있다. 피처 표시의 분석은 음성 컴포넌트 후보의 세그멘테이션 및 그룹화를 하도록 할 수 있다. 특정한 실시예에서, 타겟 음성에 대응하는 피처에 대한 후보자는 음성 모델에 의해 보조를 받는 다중 가설 추적(multi-hypothesis tracking) 시스템에 의해 평가된다. 합성 음성 파라미터는 상기 타겟 음성에 대응하는 피처에 부분적으로 기초하여 생성될 수 있다.
일부 실시예에서, 상기 생성된 합성 음성 파라미터들은 스펙트럼 포락선 및 유성음(voicing) 정보를 포함한다. 유성음 정보는 피치 데이터 및 유성음 분류 데이터를 포함할 수 있다. 일부 실시예에서, 스펙트럼 포락선은 희소(sparse) 스펙트럼 포락선으로부터 추정된다.
다양한 실시예에서, 본 방법은 잡음 모델에 기초하여 상기 피처 데이터 내에서의 비음성 컴포넌트를 판정하는 단계를 포함한다. 판정된 비음성 컴포넌트는 음성 컴포넌트와 잡음 컴포넌트 사이를 구별하기 위해 부분적으로 사용될 수 있다.
다양한 실시예에서, 음성 컴포넌트는 피치 데이터를 판정하기 위해 사용될 수 있다. 일부 실시예에서, 비음성 컴포넌트는 또한 피치 판정에 사용될 수 있다.(예를 들면, 잡음 컴포넌트가 음성 컴포넌트를 차단하는(occlude) 것에 관한 지식이 사용될 수 있다.) 피치 데이터는 선명한 음성을 합성하기 전에 손실(missing) 프레임을 채우기 위해 보간될 수 있고; 여기서 손실 프레임은 좋은 피치 추정치가 판정 될 수 없는 프레임을 가리킨다.
일부 실시예에서, 상기 방법은 피치 데이터에 기초하여, 유성음 음성을 나타내는 고조파 맵을 생성하는 단계를 포함한다. 본 방법은 피처 데이터와 고조파 맵으로부터 비음성 컴포넌트에 기초하여 무성음 음성(unvoiced speech)용 맵을 추정하는 단계를 더 포함할 수 있다. 고조파 맵과 무성음용 맵은 잡음과 음성의 혼합물의 스펙트럼 표시로부터 희소 스펙트럼 포락선을 추출하기 위한 마스크를 생성하기 위해 사용될 수 있다.
본 발명의 추가적인 예시적인 실시예에서, 방법의 단계들은 하나 이상의 프로세서에 의해 구현될 때, 인용된 단계를 수행하는 명령어들을 포함하는 기계 판독 가능 매체에 저장된다. 그러나, 추가적인 예시적인 실시예에서, 하드웨어 시스템 또는 장치는 인용된 단계들을 수행하도록 조정될 수 있다. 다른 특징, 예시 및 실시예들이 하기에 기술된다.
실시예들은 첨부 도면에서 예시의 방법에 의해(그러나 제한은 아님) 예시되고, 여기서 유사한 참조번호는 유사한 엘리먼트를 가리킨다:
도 1은 잡음과 음성의 혼합물로부터 선명한 음성을 생성하기 위한 방법의 다양한 실시예들을 구현하는데 적합한 예시적인 시스템을 도시한다.
도 2는 예시적인 실시예에 따른, 음성 처리를 위한 시스템을 도시한다.
도 3은 예시적 실시예에 따른, 음성 신호의 분리 및 합성을 위한 시스템을 도시한다.
도 4는 유성음 프레임의 예를 도시한다.
도 5는 예시적인 실시예에 따라, 유성음 프레임에 대한 희소 포락선 추정의 시간-주파수 플롯이다.
도 6은 포락선 추정의 예를 도시한다.
도 7은 예시적 실시예에 따른, 음성 합성 장치를 나타낸 도면이다.
도 8a는 선명한 여성 음성 샘플에 대한 예시적 합성 파라미터를 도시한다.
도 8b는 선명한 여성 음성 샘플에 대한 예시적인 합성 파라미터를 나타내는 도 8a의 상세이다.
도 9는 예시적인 실시예에 따른, 음성 신호의 분리 및 합성을 위한 시스템의 입출력을 도시한다.
도 10은 잡음과 음성의 혼합물로부터 선명한 음성을 생성하기 위한 예시적인 방법을 도시한다.
도 11은 본 기술의 실시예들을 구현하는데 사용될 수 있는 예시적인 컴퓨터 시스템을 도시한다.
하기의 상세한 설명은 상세한 설명의 일부를 형성하는 첨부 도면에 대한 참조를 포함한다. 도면은 예시적인 실시예에 따른 예시를 도시한다. 또한, 본 명세서에서 "예시"로서 참조되는 이러한 예시적인 실시예들은, 당업자들이 본 발명을 실시할 수 있기에 충분히 상세하게 설명된다. 실시예들은 조합될 수 있고, 다른 실시예들이 이용 될 수 있고, 구조적, 논리적, 및 전기적 변경이 청구되는 것의 범위에서 벗어나지 않고 이루어질 수 있다. 하기의 상세한 설명은 따라서 한정의 의미로 간주되지 말아야하고, 상기 범위는 첨부된 청구 범위 및 그 등가물에 의해 한정된다.
잡음과 음성의 혼합물로부터 선명한 음성을 생성하도록 하는 시스템 및 방법이 제공된다. 본 명세서에 기술된 실시예들은 개인용 컴퓨터(PC), 태블릿 컴퓨터, 모바일 장치, 휴대폰, 전화 단말기, 헤드셋, 미디어 장치, 인터넷 연결(사물 인터넷) 장치 및 텔레컨퍼런스 애플리케이션용 시스템을 포함하는(그러나 이에 한정되는 것은 아님) 음성 신호를 수신 및/또는 제공하도록 구성되는 임의의 장치상에서 실시될 수 있다. 본 개시물의 기술은 또한 개인용 청취장치, 비의학용 보청기, 보청기 및 인공귀에서 사용될 수 있다.
다양한 실시예에 따르면, 잡음과 음성의 혼합물로부터 선명한 음성 신호를 생성하는 방법은, 청각(예를 들면, 지각) 및 음성 생성 원리(예를 들면 소스의 분리 및 필터 컴포넌트)를 이용하여 잡음 혼합물로부터 음성 파라미터를 추정하는 단계를 포함한다. 추정된 파라미터는 그런다음 선명한 음성을 합성하는 데에 이용되고 음성 신호가 필수적으로 합성되지는 않지만 선명한 음성 신호에 대응하는 특정한 파라미터 또는 피처가 필요한(예를 들면, 자동음성 인식 및 화자식별(speaker identification)과 같은) 다른 애플리케이션에서 잠재적으로 사용될 수 있다.
도 1은 본 명세서에 기술된 다양한 실시예들에 대한 방법들을 구현하기에 적합한 예시적인 시스템(100)을 도시한다. 일부 실시예에서, 시스템(100)은 수신기(110), 프로세서(120), 마이크로폰(130), 오디오 처리 시스템(140), 및 출력 장치(150)를 포함한다. 시스템(100)은 특정 동작 또는 기능을 제공하기 위한 더 많은 또는 다른 컴포넌트를 포함할 수 있다. 유사하게, 시스템(100)은 도 1에 도시 된 것과 유사하거나 동일한 기능을 수행하는 더 적은 수의 컴포넌트를 포함할 수 있다. 추가로, 시스템(100)의 엘리먼트는 프로세서(120)를 포함하는(그러나 이에 한정되지 않음) 클라우드 기반일 수 있다.
수신기(110)는 인터넷, 광역 네트워크(WAN), 근거리 통신망(LAN), 셀룰러 네트워크 등의 네트워크와 통신하고, 오디오 데이터 스트림을 수신하도록 구성될 수 있으며, 이는 하나 이상의 오디오 데이터 채널을 포함할 수 있다. 수신된 오디오 데이터 스트림은 그런다음 오디오 처리 시스템(140) 및 출력 장치(150)로 포워딩될 수 있다.
프로세서(120)는 시스템(100)(예를 들면, 통신 장치 또는 컴퓨터)의 유형에 따라 오디오 데이터 처리 및 다양한 기타 동작을 구현하는 하드웨어 및 소프트웨어를 포함할 수 있다. 메모리(예를 들면, 비-일시적 컴퓨터 판독 가능 저장 매체)는 프로세서(120)에 의한 실행을 위해 적어도 부분적으로 명령어 및 데이터를 저장할 수 있다.
오디오 처리 시스템(140)은 본 명세서에 개시된 다양한 실시예들에 따른 방법을 구현하는 하드웨어 및 소프트웨어를 포함한다. 오디오 처리 시스템(140)은 또한 (하나 이상의 마이크로폰 또는 음향 센서일 수 있는) 마이크로폰(130)을 통해 음원으로부터 음향 신호를 수신하고, 음향 신호를 처리하도록 더 구성될 수 있다. 마이크로폰(130)에 의해 수신한 후, 음향 신호는 아날로그-디지털 변환기에 의해 전기 신호로 변환될 수 있다.
출력 장치(150)는 청자(listener)(예를 들면, 음원)에 오디오 출력을 제공하는 임의의 장치를 포함한다. 예를 들면, 출력 장치(150)는 시스템(100) 상에 스피커, 클래스 D 출력, 헤드셋의 이어폰, 또는 단말기를 포함할 수 있다.
도 2는 실시예에 따라, 음성 처리를 위한 시스템(200)을 도시한다. 예시적인 시스템(200)은 적어도 분석 모듈(210), 피처 추정 모듈(220), 그룹화 모듈(230), 및 음성 정보 추출 및 모델링 모듈(240)을 포함한다. 특정한 실시예에서, 시스템(200)은 음성 합성 모듈(250)을 포함한다. 다른 실시예에서, 시스템(200)은 화자 인식 모듈(260)을 포함한다, 추가적인 실시예에서, 시스템(200)은 자동 음성 인식 모듈(270)을 포함한다.
일부 실시예에서, 분석 모듈(210)은 하나 이상의 시간-영역(time-domain) 음성 입력 신호를 수신하도록 동작 가능하다. 음성 입력은 다양한 미리정해진 시간-주파수 해상도에서의 스펙트럼 표시를 제공하는 다중 해상도 프론트 엔드로 분석될 수 있다.
일부 실시예에서, 피처 추정 모듈(220)은 분석 모듈(210)로부터 다양한 분석 데이터를 수신한다. 신호 피처는 다차원 피처 공간을 생성하기 위해 피처의 유형에 따른 다양한 분석(예를 들면, 톤 검출을 위한 협소대역 스펙트럼 분석 및 과도(transient) 검출을 위한 광대역 스펙트럼 분석)으로부터 도출될 수 있다.
다양한 실시예에서, 그룹화 모듈(230)은 피처 추정 모듈(220)로부터 피처 데이터를 수신한다. 타겟 음성에 대응하는 피처는 그런 다음 음성 장면 분석 원리(예를 들면, 공통운명(common fate)과 같은)에 따라 그룹화되고 피처의 간섭 또는 잡음으로부터 분리된다. 특정한 실시예에서, 다중 화자(talker) 입력 또는 음성과 같은 기타 방해 자극의 경우, 다중 가설 그루퍼가 장면 구성에 사용될 수 있다.
일부 실시예에서, 그룹화 모듈(230)과 피처 추정 모듈(220)의 순서는, 피처 데이터가 피처 추정 모듈(220)에서 도출되기 전에 그룹화 모듈(230)이 스펙트럼 표시(예를 들면, 분석 모듈(210)로부터)를 그룹화하도록 역전(reverse)될 수 있다.
그 결과인 희소 다차원 피처 설정은 그룹화 모듈(230)로부터 음성 정보 추출 및 모델링 모듈(240)로 전달될 수 있다. 음성 정보 추출 및 모델링 모듈(240)은 잡음 음성 입력에서 타겟 음성을 나타내는 출력 파라미터를 생성하도록 동작할 수 있다.
일부 실시예에서, 음성 정보 추출 및 모델링 모듈(240)의 출력은 합성 파라미터 및 음향 피처를 포함한다. 특정 실시예에서, 합성 파라미터는 선명한 음성 출력을 합성하는 음성 합성 모듈(250)로 전달된다. 다른 실시예에서, 음성 정보 추출 및 모델링 모듈(240)에 의해 생성된 음성 피처는 자동 음성 인식 모듈(270) 또는 화자 인식 모듈(260)로 전달된다.
도 3은 다른 예시적 실시예에 따라 잡음 억제를 위한 음성 처리, 구체적으로는, 음성 분리 및 합성을 위한 시스템(300)을 도시한다. 시스템(300)은 다중 해상도 분석(MRA) 모듈(310), 잡음 모델 모듈(320), 피치 추정 모듈(330), 그룹화 모듈(340), 고조파 맵 유닛(350), 희소 포락선 유닛(360), 음성 포락선 모델 모듈(370), 및 합성 모듈(380)을 포함할 수 있다.
일부 실시예에서, MRA 모듈(310)은 음성 입력 신호를 수신한다. 음성 입력 신호는 부가 잡음 및 실내의 반향에 의해 오염될 수 있다. MRA 모듈(310)은 하나 이상의 단기간 스펙트럼 표시를 생성하도록 동작할 수 있다.
MRA 모듈(310)로부터의 이러한 단기간 분석은 잡음 모델 모듈(320)을 통해 배경 잡음의 추정을 도출하기 위해 먼저 사용될 수 있다. 잡음 추정은 그런다음 그룹화 모듈(340)에서의 그룹화를 하고 피치 추정 모듈(330)에서의 견고성을 개선하기 위해 사용될 수 있다. 유성음 판정을 포함하는 피치 추정 모듈(330)에 의해 생성된 피치 추적은 고조파 맵을 생성하기 위해(고조파 맵 유닛(350)에서) 그리고 합성 모듈(380)로의 입력으로서 사용될 수 있다.
일부 실시예에서, 고조파 맵 유닛(350)으로부터의 고조파 맵(유성음 음성을 나타냄), 잡음 모델 모듈(320)로부터의 잡음 모델이 무성음 음성 맵을 추정하는 데에(즉, 무성음 프레임에서의 입력 및 잡음 모델 사이의 차이) 사용된다. 유성음 및 무성음 맵은 그런다음 그룹화되고(그룹화 모듈(340)에서), 입력 신호 표시로부터 희소 포락선(희소 포락선 유닛(360)에서)을 추출하기 위한 마스크를 생성하는 데에 이용될 수 있다. 마지막으로, 음성 포락선 모델 모듈(370)은 희소 포락선으로부터 스펙트럼 포락선(ENV)를 추정하고, 유성음 정보와 함께(피치 추정 모듈(330)로부터의 유성음/무성음(V/U)과 같은 피치(F0) 및 유성음 분류) 최종 음성 출력을 생성할 수 있는 음성 합성기(예를 들면, 합성 모듈(380))로 ENV를 공급할 수 있다.
일부 실시예에서, 도 3의 시스템은 인간의 청각 인식과 음성 생산 원리 모두에 기초한다. 특정한 실시예에서, 분석 및 처리는 개별적으로(그러나, 반드시 독립적일 필요는 없다) 포락선 및 여기(excitation)에 대해 수행된다. 다양한 실시예에 따라, 음성 파라미터(즉, 이 경우, 포락선 및 유성음)는 관측 잡음으로부터 추출되고 추정치는 합성기를 통해 선명한 음성을 생성하는 데에 이용된다.
잡음 모델링
잡음 모델 모듈(320)은 오디오 입력으로부터 비음성 컴포넌트를 식별 및 추출할 수 있다. 이는 예를 들면 음성 및 비음성 간의 구별이 가능한 피질(cortical) 표시와 같은 다차원 표시를 생성함으로써 달성될 수 있다. 피질 표시상의 일부 배경은 그 개시물의 전체가 참조에 의해 본문에 통합되어있는 M. Elhilali 및 S.A. Shamma의 "A cocktail party with a cortical twist: How cortical mechanisms contribute to sound segregation,", J. Acoust. Soc. Am. 124(6): 3751-3771(2008년 12월)에서 제공된다.
예시적인 시스템(300)에서, 다중 해상도 분석이 잡음 모델 모듈(320)에 의해 잡음을 추정하기 위해 사용될 수 있다. 피치와 같은 유성음 정보가 음성과 잡음 컴포넌트 사이를 구별하기 위해 추정시 사용될 수 있다. 광대역 정상 잡음(stationary noise)에 대해, 변조-영역 필터는 잡음의(그러나 타겟 음성의 것은 아닌) 느리게 변하는(저 변조) 컴포넌트 특징을 추정 및 추출하기 위해 구현될 수 있다. 일부 실시예에서, 최소 통계법과 같은 대안의 모델링 접근 방식이 사용될 수 있다.
피치 분석 및 추적
피치 추정 모듈(330)은 자기상관도(autocorrelogram) 피처에 기초하여 구현될 수 있다. 자기상관도 피처에 대한 일부 배경은 그 개시물의 전체가 참조에 의해 본 명세서에 통합되어 있는 Z. Jin 및 D. Wang의 "HMM-Based Multipitch Tracking for Noisy and Reverberant Speech," IEEE Transactions on Audio, Speech, and Language Processing, 19(5):1091-1102 (2011년 7월)에서 제공된다. 다중 해상도 분석이 해석(resolved) 고조파(협소대역 분석) 및 비해석(unresolved) 고조파(광대역 분석) 모두로부터 피치 정보를 추출하도록 사용될 수 있다. 잡음 추정치는 신호가 잡음이 우세한 불안정한 서브 대역을 폐기함으로써 피치 큐를 수정하도록 통합될 수 있다. 일부 실시예에서, 베이지안 필터(Bayesian Filter) 또는 베이지안 추적기(예를 들면, 숨겨진 마르코프 모델(HMM))가 연속 피치 트랙을 생성하기 위해 시간적 제약을 가지고 프레임 당 피치 큐를 통합하기 위해 사용된다. 그 결과인 피치 트랙은 그런다음 고조파 에너지가 존재하는 시간-주파수 영역을 강조하는 고조파 맵 추정을 위해 사용될 수 있다. 일부 실시예에서, 자기상관도 피처에 기초한 방법 이외의 적합한 대안의 피치 추정 및 추적 방법이 사용된다.
합성을 위해, 피치 트랙은 손실 프레임을 위해 보간될 수 있고 보다 자연스러운 음성 윤곽을 만들기 위해 평탄화될 수 있다. 일부 실시예에서, 통계적 피치 윤곽선(pitch contour) 모델이 내삽/외삽 및 평탄화에 사용된다. 유성음 정보가 피치 추정치의 현출(saliency) 및 신뢰도로부터 도출될 수 있다.
희소 포락선 추출
유성음 음성 및 배경 잡음 영역이 식별되면, 무성음 음성 영역의 추정치가 도출될 수 있다. 일부 실시예에서, 프레임이 음성이 없는 경우(판정이 예를 들면 프레임이 어떻게 경사졌는지의 측정인 피치 현출에 기초하여 이루어질 수 있는) 피처 영역은 무성음으로 선언되고, 신호는 잡음 모델을 따르지 않고, 예를 들면, 신호 레벨(또는 에너지)이 잡음 임계치를 벗어나거나 피처 공간에서의 신호 표시가 피처 공간 내의 잡음 모델 영역을 벗어난다.
유성음 정보가 피치 추정치에 대응하는 고조파 스펙트럼 피크를 식별하고 선택하기 위해 이용될 수 있다. 이 프로세스에서 발견된 스펙트럼 피크는 희소 포락선을 생성하기위해 저장될 수 있다.
무성음 프레임들에 대해, 모든 스펙트럼 피크가 식별될 수 있고, 희소 포락선 신호에 추가될 수 있다. 유성음 프레임에 대한 예시가 도 4에 도시된다. 도 5는 유성음 프레임에 대한 희소 포락선 추정치의 예시적인 시간-주파수 플롯이다.
스펙트럼 포락선 모델링
스펙트럼 포락선은 보간법에 의해 희소 포락선으로부터 도출될 수 있다. 보다 자연스럽고 왜곡되지 않은 음성을 산출할 수 있는 보다 복잡한 데이터-도출 방법 또는 간단한 2차원 메쉬 보간법(예를 들면, 이미지 처리 기술)을 포함하는 다수의 방법이 희소 포락선을 도출하기 위해 적용될 수 있다.
도 6에 도시된 예시에서, 대수 영역(logarithmic domain)에서의 큐빅 보간은 평탄한 스펙트럼 포락선을 획득하기 위해 희소 스펙트럼에 대해 프레임 당 단위로 적용된다. 이 접근 방식을 이용하여, 여기(excitation)에 기인한 미세 구조를 제거하거나 최소화할 수 있다. 잡음이 음성 고조파를 초과하는 경우, 포락선이 일부 억제 법(예를 들면, 위너 필터) 또는 음성 포락선 모델에 기초하여 가중치가 할당될 수 있다.
음성 합성
도 7은 예시적 실시예에 따른, 음성 합성 장치(700)의 블록도이다. 예시적인 음성 합성 장치(700)는 선형 예측 코딩(LPC) 모델링 블록(710), 펄스 블록(720), 백색 가우시안 잡음(WGN) 블록(730), 섭동 모델링 블록(760), 섭동 필터(740 및 750), 및 합성 필터(780)를 포함한다.
피치 트랙 및 스펙트럼 포락선이 연산되면, 선명한 음성 발언이 합성될 수 있다. 이러한 파라미터로, 하기와 같이 혼합 여기 합성 장치가 구현될 수 있다. 스펙트럼 포락선(ENV)이 성도(vocal tract)의 상세를 유지하지만 다른 여기 관련 인공물(artifact)은 배제하도록 높은 오더의 선형 예측 코딩(LPC) 필터(예를 들면, 64번째 오더)에 의해 모델링될 수 있다. 여기(유성음 정보의(도 7의 예시에서의 유성음/무성음 (V/U)과 같은 피치(F0) 및 유성음 분류))는 각각의 프레임에서의 피치 값과 필터링된 백색 가우시안 잡음원(WGN 블록(730), 도 7)에 의해 도출된 필터링된 펄스 열(train)의 합에 의해 모델링될 수 있다. 도 7의 예시적 실시예에서 도시된 바와 같이, 유성음/무성음(V/U)과 같은 피치(F0) 및 유성음 분류가 펄스 블록(720), WGN 블록(730), 및 섭동 모델링 블록(760)으로 입력될 수 있다. 섭동 필터(P(z)(750) 및 Q(z))는 포락선의 스펙트럼 시간 에너지 프로파일로부터 도출될 수 있다.
다른 공지된 방법과는 반대로, 주기적인 펄스열의 섭동은 다양한 실시 형태에 따라, 스페트럼 포락선의 상대적인 국부적(local) 및 전역(global) 에너지에만 기초하고 여기 분석에는 기초하지 않으면서 제어될 수 있다. 필터 (P(z)(750))는 여기시 잡음 컴포넌트에 대해 스펙트럼 정형(shaping)을 추가할 수 있고, 필터(Q(z) (740))는 분산 및 자연스러움을 증가시키기 위해 펄스열의 위상을 수정하도록 사용될 수 있다.
섭동 필터 (P(z)(750) 및 Q(z)(740))를 도출하기 위해, 각 프레임 내에서 동적 범위가 연산될 수 있고, 주파수 종속적인 가중치가 프레임에서의 최소 및 최대 에너지에 대해 상대적인 각각의 스펙트럼 값의 레벨에 기초하여 적용된다. 그런다음, 전역 가중치가 시간 경과에 따라 추적된 최대 및 최소 전역 에너지에 대해 상대적인 프레임 레벨에 기초하여 적용될 수 있다. 이 접근 방식 뒤의 근거는 온셋 및 오프셋 동안(상대적으로 낮은 전역 에너지) 성문 영역이 감소되어 더 높은 레이놀즈 수(난류의 증가 가능성)를 가져온다는 것이다. 정상 상태 동안, 로컬 주파수 섭동이 난류 에너지가 우세한 더 낮은 에너지에서 관찰될 수 있다.
섭동이 유성음 프레임내의 스펙트럼 포락선으로부터 연산될 수 있지만, 실제로는, 일부 실시예에 대해, 섭동은 무성음 영역 중 최대값이 할당된다는 것에 유의해야 한다. 선명한 여성 음성 샘플에 대한 합성 파라미터의 예가 도 8a에 도시된다(또한 도 8b에보다 상세히 도시됨). 섭동 함수는 비주기성(aperiodicity) 함수로서 dB 영역으로 도시된다.
시스템(300)의 성능의 예는 도 9에 도시되고, 여기서 잡음 음성 입력이 시스템(300)에 의해 처리되어, 합성 무잡음 출력을 산출한다.
도 10은 잡음과 음성의 혼합물로부터 선명한 음성을 생성하기 위한 방법(1000)의 플로우 차트이다. 방법(1000)은 하드웨어(예를 들면, 전용 로직, 프로그래머블 로직, 및 마이크로 코드), 소프트웨어(예를 들면, 범용 컴퓨터 시스템 또는 전용 머신에서 실행되는 것과 같은), 또는 이들의 조합을 포함하는 처리 로직에 의해 수행될 수 있다. 일 실시예에서, 처리 로직은 오디오 처리 시스템(140)에 상주한다.
동작(1010)에서, 예시적인 방법(1000)은 잡음과 음성의 혼합물 및 음성의 모델에 기초하여 음성 파라미터를 도출하는 단계를 포함할 수 있다. 음성 파라미터들은 스펙트럼 포락선 및 유성음 정보를 포함할 수 있다. 유성음 정보는 피치 데이터 및 유성음 분류를 포함할 수 있다. 동작(1020)에서, 방법(1000)은 음성 파라미터로부터 선명한 음성을 합성하면서 진행할 수 있다.
도 11은 본 발명의 일부 실시예를 구현하는데 사용될 수 있는 예시적인 컴퓨터 시스템(1100)을 도시한다. 도 11의 컴퓨터 시스템(1100)은 컴퓨팅 시스템, 네트워크, 서버, 또는 이들의 조합과 같은 것들의 의미로 구현될 수 있다. 도 11의 컴퓨터 시스템(1100)은 하나 이상의 프로세서 유닛(1110) 및 메인 메모리(1120)를 포함한다. 메인 메모리(1120)는 프로세서 유닛(1110)에 의해 실행하기 위해 명령어 및 데이터를 부분적으로 저장한다. 메인 메모리(1120)는 동작시 본 예시에서 실행가능한 코드를 저장한다. 도 11의 컴퓨터 시스템(1100)는 대용량 데이터 저장 장치(1130), 휴대용 저장 장치(1140), 출력 장치(1150), 사용자 입력 장치(1160), 그래픽 디스플레이 시스템(1170), 및 주변 장치(1180)를 더 포함한다.
도 11에 도시된 컴포넌트는 단일 버스(1190)를 통해서 연결되는 것으로 도시된다. 컴포넌트들은 하나 이상의 데이터 전송 수단을 통해 연결될 수 있다. 프로세서 유닛(1110) 및 메인 메모리(1120)는 로컬 마이크로프로세서 버스를 통해 연결되고, 대용량 데이터 저장장치(1130), 주변 장치(들)(1180), 휴대용 저장 장치(1140), 및 그래픽 디스플레이 시스템(1170)은 하나 이상의 입/출력(I/O) 버스를 통해 연결된다.
자기 디스크 드라이브, 솔리드 스테이트 드라이브, 또는 광학 디스크 드라이브로 구현될 수 있는 대용량 저장 장치(1130)는 프로세서 유닛(1110)에 의해 사용하기 위한 데이터 및 명령어들을 저장하는 비휘발성 저장 장치이다. 대용량 저장 장치(1130)는 본 개시물의 실시예들을 구현하기 위한 시스템 소프트웨어를 메인 메모리(1120)로 로딩하는 목적으로 시스템 소프트웨어를 저장한다.
휴대용 저장 장치(1140)는 예를 들면 플래시 드라이브, 플로피 디스크, 컴팩트 디스크, 디지털 비디오 디스크, 또는 범용 직렬 버스(USB) 저장 장치와 같은 휴대용 비휘발성 저장 매체와 함께 도 11의 컴퓨터 시스템(1100)으로 데이터 및 코드를 입출력하도록 동작한다. 본 발명의 실시예들을 구현하기 위한 시스템 소프트웨어는 이러한 휴대용 매체에 저장되고 휴대용 저장 장치(1140)를 통해 컴퓨터 시스템 (1100)에 입력된다.
사용자 입력 장치(1160)는 사용자 인터페이스의 일부를 제공할 수 있다. 사용자 입력 장치(1160)는 하나 이상의 마이크로폰, 문자숫자와 기타 정보를 입력하기 위한 키보드와 같은 문자숫자 키패드, 마우스, 트랙볼, 스타일러스, 또는 커서 방향 키와 같은 포인팅 장치를 포함할 수 있다. 사용자 입력 장치(1160)는 또한 터치스크린을 포함할 수 있다. 또한, 도 11에 도시된 것과 같은 컴퓨터 시스템(1100)은 출력 장치(1150)를 포함한다. 적절한 출력 장치(1150)는 스피커, 프린터, 네트워크 인터페이스, 및 모니터를 포함한다.
그래픽 디스플레이 시스템(1170)은 액정 디스플레이(LCD) 또는 다른 적합한 디스플레이 장치를 포함한다. 그래픽 디스플레이 시스템(1170)은 텍스트 및 그래픽 정보를 수신하도록 구성가능하며, 디스플레이 장치에 출력하기 위한 정보를 처리한다.
주변 장치(1180)는 컴퓨터 시스템에 부가 기능을 추가하는 임의의 유형의 컴퓨터 지원 장치를 포함할 수 있다.
도 11의 컴퓨터 시스템(1100)에 제공되는 컴포넌트는 본 개시물의 실시예로 사용하기에 적합할 수 있는 컴퓨터 시스템에서 일반적으로 발견되는 것들이고 종래 기술에 공지된 이러한 컴퓨터 컴포넌트의 폭넓은 카테고리를 표시하도록 의도된다. 따라서, 도 11의 컴퓨터 시스템(1100)은 개인용 컴퓨터(PC), 핸드헬드 컴퓨터 시스템, 전화기, 모바일 컴퓨터 시스템, 워크스테이션, 태블릿, 패블릿, 휴대 전화, 서버, 미니 컴퓨터, 메인 프레임 컴퓨터, 웨어러블, 인터넷 접속 장치, 또는 기타 컴퓨터 시스템일 수 있다. 컴퓨터는 또한 상이한 버스 구성들, 네트워크 플랫폼, 멀티 프로세서 플랫폼 등을 포함할 수 있다. 유닉스, 리눅스, 윈도우, 맥 OS, 팜 OS, QNX 안드로이드, IOS, 크롬, 타이젠, 및 기타 적절한 운영 시스템을 포함하는 다양한 운영 체제가 사용될 수 있다.
다양한 실시예들을 위한 처리가 클라우드 기반 소프트웨어로 구현될 수 있다. 일부 실시예에서, 컴퓨터 시스템(1100)은 컴퓨팅 클라우드 내에서 동작하는 가상 머신과 같은 클라우드 기반 컴퓨팅 환경으로 구현된다. 다른 실시예에서, 컴퓨터 시스템(1100) 자체는 컴퓨터 시스템(1100)의 기능이 분산 방식으로 실행되는 클라우드 기반 컴퓨팅 환경을 포함할 수 있다. 따라서, 컴퓨팅 클라우드로서 구성될 때 컴퓨터 시스템(1100)은 따라서 하기에 더 상술되는 바와 같이 다양한 형태의 복수의 컴퓨팅 장치를 포함할 수 있다.
일반적으로, 클라우드 기반 컴퓨팅 환경은 일반적으로 (예를 들면 웹 서버 내에서와 같은) 큰 그룹의 프로세서의 연산 능력을 조합하고 및/또는 큰 그룹의 컴퓨터 메모리 또는 저장 장치의 저장 능력을 조합하는 자원이다. 클라우드 기반 자원을 제공하는 시스템은 소유자에 의해 배타적으로 이용될 수 있고, 또는 이러한 시스템은 대용량 연산 또는 저장 자원의 효익을 얻기 위해 컴퓨팅 설비 내의 애플리케이션을 사용하는 외부 사용자가 액세스할 수 있다.
클라우드는 예를 들면 각 서버(또는 적어도 복수의 서버)가 프로세서 및/또는 저장 자원을 제공하는 컴퓨터 시스템(1100)과 같은 복수의 컴퓨팅 장치를 포함하는 웹 서버의 네트워크에 의해 형성될 수 있다. 이들 서버는 다중 사용자(예를 들면, 클라우드 자원 고객 또는 기타 사용자)에 의해 제공된 워크로드를 관리할 수 있다. 일반적으로, 각 사용자는 실시간으로 변하는, 때때로 급격하게 변하는 클라우드에 대한 워크로드 요구를 제시한다. 이들 변형의 속성 및 정도는 일반적으로 사용자와 연관된 사업의 유형에 따라 달라진다.
본 기술은 예시적인 실시예를 참조하여 상술한다. 따라서, 예시적인 실시예에 대한 기타 변형은 본 명세서에 포함되는 것으로 의도된다.

Claims (24)

  1. 잡음과 음성(speech)의 혼합물로부터 선명한(clean) 음성을 생성하는 방법으로서:
    잡음 및 음성의 상기 혼합물 및 음성 모델에 기초하여, 음성 파라미터를 도출하는 단계로서, 상기 도출하는 단계는 적어도 하나의 하드웨어 프로세서를 이용하는 상기 도출하는 단계; 및
    상기 음성 파라미터에 적어도 부분적으로 기초하여 선명한 음성을 합성하는 단계;
    를 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  2. 제1 항에 있어서, 상기 음성 파라미터를 도출하는 단계는:
    하나 이상의 스펙트럼 표시를 생성하기 위해 잡음과 음성의 상기 혼합물에 대한 하나 이상의 스펙트럼 분석을 실시하는 단계;
    상기 하나 이상의 스펙트럼 표시에 기초하여 피처 데이터를 도출하는 단계;
    상기 음성 모델에 따라 상기 피처 데이터 내의 타겟 음성 피처를 그룹화하는 단계;
    상기 피처 데이터로부터 상기 타겟 음성 피처를 분리하는 단계; 및
    타겟 음성 피처에 적어도 부분적으로 기초하여, 상기 음성 파라미터를 생성하는 단계;
    를 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  3. 제2 항에 있어서, 타겟 음성 피처에 대한 후보자는 상기 음성 모델에 의해 보조를 받는 다중 가설 추적(multi-hypothesis tracking) 시스템에 의해 평가되는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  4. 제2 항에 있어서, 상기 음성 파라미터는 스펙트럼 포락선(spectral envelope) 및 유성음(voicing) 정보를 포함하고, 상기 유성음 정보는 피치 데이터 및 유성음 분류(voice classification) 데이터를 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  5. 제4 항에 있어서, 상기 피처 데이터를 그룹화하기 전에, 잡음 모델에 기초하여 상기 피처 데이터 내에서의 비음성(non-speech) 컴포넌트를 판정하는 단계를 더 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  6. 제5 항에 있어서, 상기 피치 데이터는 적어도 부분적으로 상기 비음성 컴포넌트에 기초하여 판정되는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  7. 제5 항에 있어서, 상기 피치 데이터는 잡음 컴포넌트가 음성 컴포넌트를 차단하는(occlude) 것에 관한 지식에 적어도 기초하여 판정되는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  8. 제6 항에 있어서, 상기 음성 파라미터를 생성하는 동안:
    유성음(voiced) 음성을 나타내는 고조파 맵을 상기 피치 데이터에 기초하여 생성하는 단계; 및
    상기 비음성 컴포넌트와 상기 고조파 맵에 기초하여 무성음(unvoiced) 음성 맵을 추정하는 단계;
    를 더 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  9. 제8 항에 있어서, 마스크를 이용하여 상기 하나 이상의 스펙트럼 표시로부터 희소(sparse) 스펙트럼 포락선을 추출하는 단계를 더 포함하고, 상기 마스크는 고조파 맵과 무성음 음성 맵에 기초하여 생성되는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  10. 제9 항에 있어서, 상기 희소 스펙트럼 포락선에 기초하여 상기 스펙트럼 포락선을 추정하는 단계를 더 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  11. 제4 항에 있어서, 상기 피치 데이터는 선명한 음성을 합성하기 전에 손실(missing) 프레임을 채우도록 보간되는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  12. 제1 항에 있어서, 음성 파라미터를 도출하는 단계는:
    하나 이상의 스펙트럼 표시를 생성하기 위해 잡음과 음성의 상기 혼합물에 대한 하나 이상의 스펙트럼 분석을 실시하는 단계;
    상기 하나 이상의 스펙트럼 표시를 그룹화하는 단계;
    상기 그룹화된 스펙트럼 표시 중 하나 이상에 기초하여 피처 데이터를 도출하는 단계;
    상기 피처 데이터로부터 상기 타겟 음성 피처를 분리하는 단계; 및
    타겟 음성 피처에 적어도 부분적으로 기초하여, 상기 음성 파라미터를 생성하는 단계;
    를 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 방법.
  13. 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템으로서:
    하나 이상의 프로세서; 및
    상기 프로세서와 통신가능하게 결합되는 메모리;
    를 포함하고,
    상기 하나 이상의 프로세서에 의해 실행될 때, 상기 메모리는:
    잡음 및 음성의 상기 혼합물 및 음성 모델에 기초하여, 음성 파라미터를 도출하는 단계, 및
    상기 음성 파라미터에 적어도 부분적으로 기초하여 선명한 음성을 합성하는 단계;
    를 구비하는 방법을 수행하는 명령어들을 저장하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템.
  14. 제13 항에 있어서, 상기 음성 파라미터를 도출하는 단계는:
    하나 이상의 스펙트럼 표시를 생성하기 위해 잡음과 음성의 상기 혼합물에 대한 하나 이상의 스펙트럼 분석을 실시하는 단계;
    상기 하나 이상의 스펙트럼 표시에 기초하여 피처 데이터를 도출하는 단계;
    상기 음성 모델에 따라 상기 피처 데이터 내의 타겟 음성 피처를 그룹화하는 단계;
    상기 피처 데이터로부터 상기 타겟 음성 피처를 분리하는 단계; 및
    타겟 음성 피처에 적어도 부분적으로 기초하여, 상기 음성 파라미터를 생성하는 단계;
    를 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템.
  15. 제14 항에 있어서, 타겟 음성 피처에 대한 후보자는 상기 음성 모델에 의해 보조를 받는 다중 가설 추적 시스템에 의해 평가되는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템.
  16. 제14 항에 있어서, 상기 음성 파라미터는 스펙트럼 포락선 및 유성음(voicing) 정보를 포함하고, 상기 유성음 정보는 피치 데이터 및 유성음 분류 데이터를 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템.
  17. 제16 항에 있어서, 상기 피처 데이터를 그룹화하기 전에, 잡음 모델에 기초하여 상기 피처 데이터 내에서의 비음성 컴포넌트를 판정하는 단계를 더 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템.
  18. 제17 항에 있어서, 상기 피치 데이터는 부분적으로 상기 비음성 컴포넌트에 기초하여 판정되는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템.
  19. 제17 항에 있어서, 상기 피치 데이터는 잡음 컴포넌트가 음성 컴포넌트를 차단하는 것에 관한 지식에 적어도 기초하여 판정되는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템.
  20. 제18 항에 있어서, 상기 음성 파라미터를 생성하는 동안:
    유성음(voiced) 음성을 나타내는 고조파 맵을 상기 피치 데이터에 기초하여 생성하는 단계; 및
    상기 비음성 컴포넌트와 상기 고조파 맵에 기초하여 무성음(unvoiced) 음성 맵을 추정하는 단계;
    를 더 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템.
  21. 제18 항에 있어서, 마스크를 이용하여 상기 하나 이상의 스펙트럼 표시로부터 희소 스펙트럼 포락선을 추출하는 단계를 더 포함하고, 상기 마스크는 고조파 맵과 무성음 음성 맵에 기초하여 생성되는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템.
  22. 제21 항에 있어서, 상기 희소 스펙트럼 포락선에 기초하여 상기 스펙트럼 포락선을 추정하는 단계를 더 포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템.
  23. 제13 항에 있어서, 음성 파라미터를 도출하는 단계는:
    하나 이상의 스펙트럼 표시를 생성하기 위해 잡음과 음성의 상기 혼합물에 대한 하나 이상의 스펙트럼 분석을 실시하는 단계;
    상기 하나 이상의 스펙트럼 표시를 그룹화하는 단계;
    상기 그룹화된 스펙트럼 표시 중 하나 이상에 기초하여 피처 데이터를 도출하는 단계;
    상기 피처 데이터로부터 상기 타겟 음성 피처를 분리하는 단계; 및
    타겟 음성 피처에 적어도 부분적으로 기초하여, 상기 음성 파라미터를 생성하는 단계;
    포함하는 것을 특징으로 하는 잡음과 음성의 혼합물로부터 선명한 음성을 생성하는 시스템.
  24. 내부에서 프로그램을 구현하는 비일시적 컴퓨터 판독가능 저장 매체에 있어서, 상기 프로그램은 잡음과 음성의 혼합물로부터 선명한 음성을 생성하기 위한 방법을 수행하기 위해 프로세서에 의해 실행가능한 상기 비일시적 컴퓨터 판독가능 저장 매체로서, 상기 방법은:
    잡음 및 음성의 상기 혼합물 및 음성 모델에 기초하여, 메모리에 저장되고 하나 이상의 프로세서에 의해 실행되는 명령어들을 통해서 음성 파라미터를 도출하는 단계; 및
    상기 음성 파라미터에 적어도 부분적으로 기초하여, 상기 메모리에 저장되고 상기 하나 이상의 프로세서에 의해 실행되는 명령어들을 통해 선명한 음성을 합성하는 단계;
    를 포함하는 것을 특징으로 하는 비일시적 컴퓨터 판독가능 저장 매체.
KR1020167002690A 2013-07-19 2014-07-21 청각 장면 분석 및 음성 모델링에 기초한 음성 신호 분리 및 합성 KR20160032138A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361856577P 2013-07-19 2013-07-19
US61/856,577 2013-07-19
US201461972112P 2014-03-28 2014-03-28
US61/972,112 2014-03-28
PCT/US2014/047458 WO2015010129A1 (en) 2013-07-19 2014-07-21 Speech signal separation and synthesis based on auditory scene analysis and speech modeling

Publications (1)

Publication Number Publication Date
KR20160032138A true KR20160032138A (ko) 2016-03-23

Family

ID=52344268

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167002690A KR20160032138A (ko) 2013-07-19 2014-07-21 청각 장면 분석 및 음성 모델링에 기초한 음성 신호 분리 및 합성

Country Status (6)

Country Link
US (1) US9536540B2 (ko)
KR (1) KR20160032138A (ko)
CN (1) CN105474311A (ko)
DE (1) DE112014003337T5 (ko)
TW (1) TW201513099A (ko)
WO (1) WO2015010129A1 (ko)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
WO2014209177A1 (en) * 2013-06-25 2014-12-31 Telefonaktiebolaget L M Ericsson (Publ) Methods, network nodes, computer programs and computer program products for managing processing of an audio stream
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
US9401158B1 (en) 2015-09-14 2016-07-26 Knowles Electronics, Llc Microphone signal fusion
US9779716B2 (en) 2015-12-30 2017-10-03 Knowles Electronics, Llc Occlusion reduction and active noise reduction based on seal quality
US9830930B2 (en) 2015-12-30 2017-11-28 Knowles Electronics, Llc Voice-enhanced awareness mode
US20170206898A1 (en) * 2016-01-14 2017-07-20 Knowles Electronics, Llc Systems and methods for assisting automatic speech recognition
US9812149B2 (en) 2016-01-28 2017-11-07 Knowles Electronics, Llc Methods and systems for providing consistency in noise reduction during speech and non-speech periods
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
US10521657B2 (en) 2016-06-17 2019-12-31 Li-Cor, Inc. Adaptive asymmetrical signal detection and synthesis methods and systems
EP3580754A4 (en) * 2017-02-12 2020-12-16 Cardiokol Ltd. VERBAL PERIODIC SCREENING FOR HEART DISEASE
TWI638351B (zh) * 2017-05-04 2018-10-11 元鼎音訊股份有限公司 語音傳輸裝置及其執行語音助理程式之方法
CN109215668B (zh) * 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN110945519A (zh) * 2017-07-17 2020-03-31 立科有限公司 追踪数据上的光谱响应合成
KR20190037844A (ko) * 2017-09-29 2019-04-08 엘지전자 주식회사 이동 단말기
WO2019133765A1 (en) 2017-12-28 2019-07-04 Knowles Electronics, Llc Direction of arrival estimation for multiple audio content streams
CN109994125B (zh) * 2017-12-29 2021-11-05 音科有限公司 一种提高具有声音触发预设置的听力设备和系统触发精度的方法
CN109817199A (zh) * 2019-01-03 2019-05-28 珠海市黑鲸软件有限公司 一种风扇语音控制系统的语音识别方法
US10891954B2 (en) 2019-01-03 2021-01-12 International Business Machines Corporation Methods and systems for managing voice response systems based on signals from external devices
CN109859768A (zh) * 2019-03-12 2019-06-07 上海力声特医学科技有限公司 人工耳蜗语音增强方法
US11955138B2 (en) * 2019-03-15 2024-04-09 Advanced Micro Devices, Inc. Detecting voice regions in a non-stationary noisy environment
CN109978034B (zh) * 2019-03-18 2020-12-22 华南理工大学 一种基于数据增强的声场景辨识方法
US11170783B2 (en) 2019-04-16 2021-11-09 At&T Intellectual Property I, L.P. Multi-agent input coordination
CN111091807B (zh) * 2019-12-26 2023-05-26 广州酷狗计算机科技有限公司 语音合成方法、装置、计算机设备及存储介质
CN111341341B (zh) * 2020-02-11 2021-08-17 腾讯科技(深圳)有限公司 音频分离网络的训练方法、音频分离方法、装置及介质
CN112420078B (zh) * 2020-11-18 2022-12-30 青岛海尔科技有限公司 一种监听方法、装置、存储介质及电子设备
CN112700794B (zh) * 2021-03-23 2021-06-22 北京达佳互联信息技术有限公司 一种音频场景分类方法、装置、电子设备和存储介质
CN113281705A (zh) * 2021-04-28 2021-08-20 鹦鹉鱼(苏州)智能科技有限公司 一种麦克风阵列装置及基于该装置的移动声源可听化方法
CN113555031B (zh) * 2021-07-30 2024-02-23 北京达佳互联信息技术有限公司 语音增强模型的训练方法及装置、语音增强方法及装置
CN113938749B (zh) * 2021-11-30 2023-05-05 北京百度网讯科技有限公司 音频数据处理方法、装置、电子设备和存储介质
US20230230599A1 (en) * 2022-01-20 2023-07-20 Nuance Communications, Inc. Data augmentation system and method for multi-microphone systems
US20230230581A1 (en) * 2022-01-20 2023-07-20 Nuance Communications, Inc. Data augmentation system and method for multi-microphone systems
US20230230582A1 (en) * 2022-01-20 2023-07-20 Nuance Communications, Inc. Data augmentation system and method for multi-microphone systems
TWI824424B (zh) * 2022-03-03 2023-12-01 鉭騏實業有限公司 語意評估之助聽調整裝置及其方法
CN115035907B (zh) 2022-05-30 2023-03-17 中国科学院自动化研究所 一种目标说话人分离系统、设备及存储介质
CN116403599B (zh) * 2023-06-07 2023-08-15 中国海洋大学 一种高效的语音分离方法及其模型搭建方法
CN117877504B (zh) * 2024-03-11 2024-05-24 中国海洋大学 一种联合语音增强方法及其模型搭建方法

Family Cites Families (528)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3976863A (en) 1974-07-01 1976-08-24 Alfred Engel Optimal decoder for non-stationary signals
US3978287A (en) 1974-12-11 1976-08-31 Nasa Real time analysis of voiced sounds
US4137510A (en) 1976-01-22 1979-01-30 Victor Company Of Japan, Ltd. Frequency band dividing filter
GB2102254B (en) 1981-05-11 1985-08-07 Kokusai Denshin Denwa Co Ltd A speech analysis-synthesis system
US4433604A (en) 1981-09-22 1984-02-28 Texas Instruments Incorporated Frequency domain digital encoding technique for musical signals
JPS5876899A (ja) 1981-10-31 1983-05-10 株式会社東芝 音声区間検出装置
US4536844A (en) 1983-04-26 1985-08-20 Fairchild Camera And Instrument Corporation Method and apparatus for simulating aural response information
US5054085A (en) 1983-05-18 1991-10-01 Speech Systems, Inc. Preprocessing system for speech recognition
US4674125A (en) 1983-06-27 1987-06-16 Rca Corporation Real-time hierarchal pyramid signal processing apparatus
US4581758A (en) 1983-11-04 1986-04-08 At&T Bell Laboratories Acoustic direction identification system
GB2158980B (en) 1984-03-23 1989-01-05 Ricoh Kk Extraction of phonemic information
US4649505A (en) 1984-07-02 1987-03-10 General Electric Company Two-input crosstalk-resistant adaptive noise canceller
GB8429879D0 (en) 1984-11-27 1985-01-03 Rca Corp Signal processing apparatus
US4630304A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4658426A (en) 1985-10-10 1987-04-14 Harold Antin Adaptive noise suppressor
JPH0211482Y2 (ko) 1985-12-25 1990-03-23
GB8612453D0 (en) 1986-05-22 1986-07-02 Inmos Ltd Multistage digital signal multiplication & addition
US4812996A (en) 1986-11-26 1989-03-14 Tektronix, Inc. Signal viewing instrumentation control system
US4811404A (en) 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
IL84902A (en) 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US4969203A (en) 1988-01-25 1990-11-06 North American Philips Corporation Multiplicative sieve signal processing
US4991166A (en) 1988-10-28 1991-02-05 Shure Brothers Incorporated Echo reduction circuit
US5027410A (en) 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
US5099738A (en) 1989-01-03 1992-03-31 Hotz Instruments Technology, Inc. MIDI musical translator
DE69011709T2 (de) 1989-03-10 1994-12-15 Nippon Telegraph & Telephone Einrichtung zur Feststellung eines akustischen Signals.
US5187776A (en) 1989-06-16 1993-02-16 International Business Machines Corp. Image editor zoom function
DE69024919T2 (de) 1989-10-06 1996-10-17 Matsushita Electric Ind Co Ltd Einrichtung und Methode zur Veränderung von Sprechgeschwindigkeit
US5142961A (en) 1989-11-07 1992-09-01 Fred Paroutaud Method and apparatus for stimulation of acoustic musical instruments
GB2239971B (en) 1989-12-06 1993-09-29 Ca Nat Research Council System for separating speech from background noise
US5204906A (en) 1990-02-13 1993-04-20 Matsushita Electric Industrial Co., Ltd. Voice signal processing device
US5058419A (en) 1990-04-10 1991-10-22 Earl H. Ruble Method and apparatus for determining the location of a sound source
JPH0454100A (ja) 1990-06-22 1992-02-21 Clarion Co Ltd 音声信号補償回路
DE69024045T2 (de) 1990-08-16 1996-06-20 Ibm Kodierungsverfahren und Vorrichtung zur Pipeline- und Parallelverarbeitung.
WO1992005538A1 (en) 1990-09-14 1992-04-02 Chris Todter Noise cancelling systems
US5119711A (en) 1990-11-01 1992-06-09 International Business Machines Corporation Midi file translation
GB9107011D0 (en) 1991-04-04 1991-05-22 Gerzon Michael A Illusory sound distance control method
US5216423A (en) 1991-04-09 1993-06-01 University Of Central Florida Method and apparatus for multiple bit encoding and decoding of data through use of tree-based codes
US5224170A (en) 1991-04-15 1993-06-29 Hewlett-Packard Company Time domain compensation for transducer mismatch
US5210366A (en) 1991-06-10 1993-05-11 Sykes Jr Richard O Method and device for detecting and separating voices in a complex musical composition
US5440751A (en) 1991-06-21 1995-08-08 Compaq Computer Corp. Burst data transfer to single cycle data transfer conversion and strobe signal conversion
US5175769A (en) 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
DE69228211T2 (de) 1991-08-09 1999-07-08 Koninkl Philips Electronics Nv Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals
CA2080608A1 (en) 1992-01-02 1993-07-03 Nader Amini Bus control logic for computer system having dual bus architecture
FI92535C (fi) 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
JPH05300419A (ja) 1992-04-16 1993-11-12 Sanyo Electric Co Ltd ビデオカメラ
US5222251A (en) 1992-04-27 1993-06-22 Motorola, Inc. Method for eliminating acoustic echo in a communication device
US5381512A (en) 1992-06-24 1995-01-10 Moscom Corporation Method and apparatus for speech feature recognition based on models of auditory signal processing
US5402496A (en) 1992-07-13 1995-03-28 Minnesota Mining And Manufacturing Company Auditory prosthesis, noise suppression apparatus and feedback suppression apparatus having focused adaptive filtering
US5732143A (en) 1992-10-29 1998-03-24 Andrea Electronics Corp. Noise cancellation apparatus
US5381473A (en) 1992-10-29 1995-01-10 Andrea Electronics Corporation Noise cancellation apparatus
US5402493A (en) 1992-11-02 1995-03-28 Central Institute For The Deaf Electronic simulator of non-linear and active cochlear spectrum analysis
JP2508574B2 (ja) 1992-11-10 1996-06-19 日本電気株式会社 多チャンネルエコ―除去装置
US5355329A (en) 1992-12-14 1994-10-11 Apple Computer, Inc. Digital filter having independent damping and frequency parameters
US5400409A (en) 1992-12-23 1995-03-21 Daimler-Benz Ag Noise-reduction method for noise-affected voice channels
US5416847A (en) 1993-02-12 1995-05-16 The Walt Disney Company Multi-band, digital audio noise filter
US5473759A (en) 1993-02-22 1995-12-05 Apple Computer, Inc. Sound analysis and resynthesis using correlograms
US5590241A (en) 1993-04-30 1996-12-31 Motorola Inc. Speech processing system and method for enhancing a speech signal in a noisy environment
DE4316297C1 (de) 1993-05-14 1994-04-07 Fraunhofer Ges Forschung Frequenzanalyseverfahren
DE69428119T2 (de) 1993-07-07 2002-03-21 Picturetel Corp Verringerung des hintergrundrauschens zur sprachverbesserung
DE4330243A1 (de) 1993-09-07 1995-03-09 Philips Patentverwaltung Sprachverarbeitungseinrichtung
US5675778A (en) 1993-10-04 1997-10-07 Fostex Corporation Of America Method and apparatus for audio editing incorporating visual comparison
JP3353994B2 (ja) 1994-03-08 2002-12-09 三菱電機株式会社 雑音抑圧音声分析装置及び雑音抑圧音声合成装置及び音声伝送システム
US5574824A (en) 1994-04-11 1996-11-12 The United States Of America As Represented By The Secretary Of The Air Force Analysis/synthesis-based microphone array speech enhancer with variable signal distortion
US5471195A (en) 1994-05-16 1995-11-28 C & K Systems, Inc. Direction-sensing acoustic glass break detecting system
JPH07336793A (ja) 1994-06-09 1995-12-22 Matsushita Electric Ind Co Ltd ビデオカメラ用マイクロホン
US5633631A (en) 1994-06-27 1997-05-27 Intel Corporation Binary-to-ternary encoder
US5544250A (en) 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
US5978567A (en) 1994-07-27 1999-11-02 Instant Video Technologies Inc. System for distribution of interactive multimedia and linear programs by enabling program webs which include control scripts to define presentation by client transceiver
JPH0896514A (ja) 1994-07-28 1996-04-12 Sony Corp オーディオ信号処理装置
US5729612A (en) 1994-08-05 1998-03-17 Aureal Semiconductor Inc. Method and apparatus for measuring head-related transfer functions
US5598505A (en) 1994-09-30 1997-01-28 Apple Computer, Inc. Cepstral correction vector quantizer for speech recognition
US5774846A (en) 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
SE505156C2 (sv) 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
JP3307138B2 (ja) 1995-02-27 2002-07-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
US5920840A (en) 1995-02-28 1999-07-06 Motorola, Inc. Communication system and method using a speaker dependent time-scaling technique
US5706395A (en) 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US6263307B1 (en) 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
US5850453A (en) 1995-07-28 1998-12-15 Srs Labs, Inc. Acoustic correction apparatus
US7395298B2 (en) 1995-08-31 2008-07-01 Intel Corporation Method and apparatus for performing multiply-add operations on packed data
US5809463A (en) 1995-09-15 1998-09-15 Hughes Electronics Method of detecting double talk in an echo canceller
US6002776A (en) 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5694474A (en) 1995-09-18 1997-12-02 Interval Research Corporation Adaptive filter for signal processing and method therefor
US5792971A (en) 1995-09-29 1998-08-11 Opcode Systems, Inc. Method and system for editing digital audio information with music-like parameters
US5819215A (en) 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
IT1281001B1 (it) 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
FI100840B (fi) 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US5732189A (en) 1995-12-22 1998-03-24 Lucent Technologies Inc. Audio signal coding with a signal adaptive filterbank
JPH09212196A (ja) 1996-01-31 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧装置
US5749064A (en) 1996-03-01 1998-05-05 Texas Instruments Incorporated Method and system for time scale modification utilizing feature vectors about zero crossing points
US5777658A (en) 1996-03-08 1998-07-07 Eastman Kodak Company Media loading and unloading onto a vacuum drum using lift fins
JP3325770B2 (ja) 1996-04-26 2002-09-17 三菱電機株式会社 ノイズ低減回路及びノイズ低減装置及びノイズ低減方法
US6978159B2 (en) 1996-06-19 2005-12-20 Board Of Trustees Of The University Of Illinois Binaural signal processing using multiple acoustic sensors and digital filtering
US6222927B1 (en) 1996-06-19 2001-04-24 The University Of Illinois Binaural signal processing system and method
US6072881A (en) 1996-07-08 2000-06-06 Chiefs Voice Incorporated Microphone noise rejection system
US5796819A (en) 1996-07-24 1998-08-18 Ericsson Inc. Echo canceller for non-linear circuits
US5806025A (en) 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
JPH1054855A (ja) 1996-08-09 1998-02-24 Advantest Corp スペクトラムアナライザ
DE69725995T2 (de) 1996-08-29 2004-11-11 Cisco Technology, Inc., San Jose Raumzeitliche signalverarbeitung für übertragungssysteme
US5887032A (en) 1996-09-03 1999-03-23 Amati Communications Corp. Method and apparatus for crosstalk cancellation
JP3355598B2 (ja) 1996-09-18 2002-12-09 日本電信電話株式会社 音源分離方法、装置及び記録媒体
US6098038A (en) 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
US6097820A (en) 1996-12-23 2000-08-01 Lucent Technologies Inc. System and method for suppressing noise in digitally represented voice signals
JP2930101B2 (ja) 1997-01-29 1999-08-03 日本電気株式会社 雑音消去装置
US5933495A (en) 1997-02-07 1999-08-03 Texas Instruments Incorporated Subband acoustic noise suppression
US6104993A (en) 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
FI114247B (fi) 1997-04-11 2004-09-15 Nokia Corp Menetelmä ja laite puheen tunnistamiseksi
DE69816610T2 (de) 1997-04-16 2004-06-09 Dspfactory Ltd., Waterloo Verfahren und vorrichtung zur rauschverminderung, insbesondere bei hörhilfegeräten
AU750976B2 (en) 1997-05-01 2002-08-01 Med-El Elektromedizinische Gerate Ges.M.B.H. Apparatus and method for a low power digital filter bank
US6151397A (en) 1997-05-16 2000-11-21 Motorola, Inc. Method and system for reducing undesired signals in a communication environment
US6188797B1 (en) 1997-05-27 2001-02-13 Apple Computer, Inc. Decoder for programmable variable length data
JP3541339B2 (ja) 1997-06-26 2004-07-07 富士通株式会社 マイクロホンアレイ装置
DE59710269D1 (de) 1997-07-02 2003-07-17 Micronas Semiconductor Holding Filterkombination zur Abtastratenumsetzung
US6430295B1 (en) 1997-07-11 2002-08-06 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatus for measuring signal level and delay at multiple sensors
JP3216704B2 (ja) 1997-08-01 2001-10-09 日本電気株式会社 適応アレイ装置
TW392416B (en) 1997-08-18 2000-06-01 Noise Cancellation Tech Noise cancellation system for active headsets
US6122384A (en) 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
US6125175A (en) 1997-09-18 2000-09-26 At&T Corporation Method and apparatus for inserting background sound in a telephone call
US6216103B1 (en) 1997-10-20 2001-04-10 Sony Corporation Method for implementing a speech recognition system to determine speech endpoints during conditions with background noise
US6134524A (en) 1997-10-24 2000-10-17 Nortel Networks Corporation Method and apparatus to detect and delimit foreground speech
US6324235B1 (en) 1997-11-13 2001-11-27 Creative Technology, Ltd. Asynchronous sample rate tracker
US6092126A (en) 1997-11-13 2000-07-18 Creative Technology, Ltd. Asynchronous sample rate tracker with multiple tracking modes
US20020002455A1 (en) 1998-01-09 2002-01-03 At&T Corporation Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system
US6208671B1 (en) 1998-01-20 2001-03-27 Cirrus Logic, Inc. Asynchronous sample rate converter
SE519562C2 (sv) 1998-01-27 2003-03-11 Ericsson Telefon Ab L M Förfarande och anordning för avstånds- och distorsionsskattning vid kanaloptimerad vektorkvantisering
JP3435686B2 (ja) 1998-03-02 2003-08-11 日本電信電話株式会社 収音装置
US6202047B1 (en) 1998-03-30 2001-03-13 At&T Corp. Method and apparatus for speech recognition using second order statistics and linear estimation of cepstral coefficients
US6684199B1 (en) 1998-05-20 2004-01-27 Recording Industry Association Of America Method for minimizing pirating and/or unauthorized copying and/or unauthorized access of/to data on/from data media including compact discs and digital versatile discs, and system and data media for same
US6421388B1 (en) 1998-05-27 2002-07-16 3Com Corporation Method and apparatus for determining PCM code translations
US6717991B1 (en) 1998-05-27 2004-04-06 Telefonaktiebolaget Lm Ericsson (Publ) System and method for dual microphone signal noise reduction using spectral subtraction
US6549586B2 (en) 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
US5990405A (en) 1998-07-08 1999-11-23 Gibson Guitar Corp. System and method for generating and controlling a simulated musical concert experience
US7209567B1 (en) 1998-07-09 2007-04-24 Purdue Research Foundation Communication system with adaptive noise suppression
US20040066940A1 (en) 2002-10-03 2004-04-08 Silentium Ltd. Method and system for inhibiting noise produced by one or more sources of undesired sound from pickup by a speech recognition unit
US6453289B1 (en) 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
JP4163294B2 (ja) 1998-07-31 2008-10-08 株式会社東芝 雑音抑圧処理装置および雑音抑圧処理方法
US6173255B1 (en) 1998-08-18 2001-01-09 Lockheed Martin Corporation Synchronized overlap add voice processing using windows and one bit correlators
US6223090B1 (en) 1998-08-24 2001-04-24 The United States Of America As Represented By The Secretary Of The Air Force Manikin positioning for acoustic measuring
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6122610A (en) 1998-09-23 2000-09-19 Verance Corporation Noise suppression for low bitrate speech coder
US7003120B1 (en) 1998-10-29 2006-02-21 Paul Reed Smith Guitars, Inc. Method of modifying harmonic content of a complex waveform
US6469732B1 (en) 1998-11-06 2002-10-22 Vtel Corporation Acoustic source location using a microphone array
US6188769B1 (en) 1998-11-13 2001-02-13 Creative Technology Ltd. Environmental reverberation processor
US6424938B1 (en) 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US6205422B1 (en) 1998-11-30 2001-03-20 Microsoft Corporation Morphological pure speech detection using valley percentage
US6456209B1 (en) 1998-12-01 2002-09-24 Lucent Technologies Inc. Method and apparatus for deriving a plurally parsable data compression dictionary
US6266633B1 (en) 1998-12-22 2001-07-24 Itt Manufacturing Enterprises Noise suppression and channel equalization preprocessor for speech and speaker recognizers: method and apparatus
US6381570B2 (en) 1999-02-12 2002-04-30 Telogy Networks, Inc. Adaptive two-threshold method for discriminating noise from speech in a communication signal
US6363345B1 (en) 1999-02-18 2002-03-26 Andrea Electronics Corporation System, method and apparatus for cancelling noise
US6496795B1 (en) 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
EP1161852A2 (de) 1999-03-19 2001-12-12 Siemens Aktiengesellschaft Verfahren und einrichtung zum aufnehmen und bearbeiten von audiosignalen in einer störschallerfüllten umgebung
SE514948C2 (sv) 1999-03-29 2001-05-21 Ericsson Telefon Ab L M Förfarande och anordning för att reducera överhörning
US6487257B1 (en) 1999-04-12 2002-11-26 Telefonaktiebolaget L M Ericsson Signal noise reduction by time-domain spectral subtraction using fixed filters
US7146013B1 (en) 1999-04-28 2006-12-05 Alpine Electronics, Inc. Microphone system
US6490556B2 (en) 1999-05-28 2002-12-03 Intel Corporation Audio classifier for half duplex communication
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US20060072768A1 (en) 1999-06-24 2006-04-06 Schwartz Stephen R Complementary-pair equalizer
US6516136B1 (en) 1999-07-06 2003-02-04 Agere Systems Inc. Iterative decoding of concatenated codes for recording systems
US6355869B1 (en) 1999-08-19 2002-03-12 Duane Mitton Method and system for creating musical scores from musical recordings
EP1081685A3 (en) 1999-09-01 2002-04-24 TRW Inc. System and method for noise reduction using a single microphone
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US7054809B1 (en) 1999-09-22 2006-05-30 Mindspeed Technologies, Inc. Rate selection method for selectable mode vocoder
GB9922654D0 (en) 1999-09-27 1999-11-24 Jaber Marwan Noise suppression system
US6526139B1 (en) 1999-11-03 2003-02-25 Tellabs Operations, Inc. Consolidated noise injection in a voice processing system
NL1013500C2 (nl) 1999-11-05 2001-05-08 Huq Speech Technologies B V Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving.
US6339706B1 (en) 1999-11-12 2002-01-15 Telefonaktiebolaget L M Ericsson (Publ) Wireless voice-activated remote control device
FI116643B (fi) 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US6513004B1 (en) 1999-11-24 2003-01-28 Matsushita Electric Industrial Co., Ltd. Optimized local feature extraction for automatic speech recognition
US6473733B1 (en) 1999-12-01 2002-10-29 Research In Motion Limited Signal enhancement for voice coding
JP2001159899A (ja) 1999-12-01 2001-06-12 Matsushita Electric Ind Co Ltd 騒音抑圧装置
TW510143B (en) 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
US6934387B1 (en) 1999-12-17 2005-08-23 Marvell International Ltd. Method and apparatus for digital near-end echo/near-end crosstalk cancellation with adaptive correlation
GB2357683A (en) 1999-12-24 2001-06-27 Nokia Mobile Phones Ltd Voiced/unvoiced determination for speech coding
US6549630B1 (en) 2000-02-04 2003-04-15 Plantronics, Inc. Signal expander with discrimination between close and distant acoustic source
CN1418448A (zh) 2000-03-14 2003-05-14 奥迪亚科技股份责任有限公司 多麦克风定向系统的适应性麦克风匹配
US7076315B1 (en) 2000-03-24 2006-07-11 Audience, Inc. Efficient computation of log-frequency-scale digital filter cascade
US6434417B1 (en) 2000-03-28 2002-08-13 Cardiac Pacemakers, Inc. Method and system for detecting cardiac depolarization
CN1436436A (zh) 2000-03-31 2003-08-13 克拉里提有限公司 用于话音信号提取的方法和设备
JP2001296343A (ja) 2000-04-11 2001-10-26 Nec Corp 音源方位設定装置及びそれを備えた撮像装置、送信システム
US6584438B1 (en) 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US7225001B1 (en) 2000-04-24 2007-05-29 Telefonaktiebolaget Lm Ericsson (Publ) System and method for distributed noise suppression
JP2001318694A (ja) 2000-05-10 2001-11-16 Toshiba Corp 信号処理装置、信号処理方法および記録媒体
JP2003533152A (ja) 2000-05-10 2003-11-05 ザ・ボード・オブ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・イリノイ 妨害抑制方法および装置
WO2001091513A2 (en) 2000-05-26 2001-11-29 Koninklijke Philips Electronics N.V. Method for noise suppression in an adaptive beamformer
US6377637B1 (en) 2000-07-12 2002-04-23 Andrea Electronics Corporation Sub-band exponential smoothing noise canceling system
US7246058B2 (en) 2001-05-30 2007-07-17 Aliph, Inc. Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors
US8019091B2 (en) 2000-07-19 2011-09-13 Aliphcom, Inc. Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression
US6718309B1 (en) 2000-07-26 2004-04-06 Ssi Corporation Continuously variable time scale modification of digital audio signals
JP4815661B2 (ja) 2000-08-24 2011-11-16 ソニー株式会社 信号処理装置及び信号処理方法
US6862567B1 (en) 2000-08-30 2005-03-01 Mindspeed Technologies, Inc. Noise suppression in the frequency domain by adjusting gain according to voicing parameters
JP2002149200A (ja) 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
DE10045197C1 (de) 2000-09-13 2002-03-07 Siemens Audiologische Technik Verfahren zum Betrieb eines Hörhilfegerätes oder Hörgerätessystems sowie Hörhilfegerät oder Hörgerätesystem
US7020605B2 (en) 2000-09-15 2006-03-28 Mindspeed Technologies, Inc. Speech coding system with time-domain noise attenuation
US6804203B1 (en) 2000-09-15 2004-10-12 Mindspeed Technologies, Inc. Double talk detector for echo cancellation in a speech communication system
US6859508B1 (en) 2000-09-28 2005-02-22 Nec Electronics America, Inc. Four dimensional equalizer and far-end cross talk canceler in Gigabit Ethernet signals
WO2002029780A2 (en) 2000-10-04 2002-04-11 Clarity, Llc Speech detection with source separation
US6907045B1 (en) 2000-11-17 2005-06-14 Nortel Networks Limited Method and apparatus for data-path conversion comprising PCM bit robbing signalling
US7092882B2 (en) 2000-12-06 2006-08-15 Ncr Corporation Noise suppression in beam-steered microphone array
US7472059B2 (en) 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
DE10157535B4 (de) 2000-12-13 2015-05-13 Jörg Houpert Verfahren und Vorrichtung zur Reduzierung zufälliger, kontinuierlicher, instationärer Störungen in Audiosignalen
US20020097884A1 (en) 2001-01-25 2002-07-25 Cairns Douglas A. Variable noise reduction algorithm based on vehicle conditions
US20020133334A1 (en) 2001-02-02 2002-09-19 Geert Coorman Time scale modification of digitally sampled waveforms in the time domain
US6990196B2 (en) 2001-02-06 2006-01-24 The Board Of Trustees Of The Leland Stanford Junior University Crosstalk identification in xDSL systems
US7206418B2 (en) 2001-02-12 2007-04-17 Fortemedia, Inc. Noise suppression for a wireless communication device
US7617099B2 (en) 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
US6915264B2 (en) 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
EP1244094A1 (de) 2001-03-20 2002-09-25 Swissqual AG Verfahren und Vorrichtung zur Bestimmung eines Qualitätsmasses eines Audiosignals
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
BR0204818A (pt) 2001-04-05 2003-03-18 Koninkl Philips Electronics Nv Métodos para modificar e expandir a escala de tempo de um sinal, e para receber um sinal de áudio, dispositivo de modificação de escala de tempo adaptado para modificar um sinal, e, receptor para receber um sinal de áudio
CN1240051C (zh) 2001-04-09 2006-02-01 皇家菲利浦电子有限公司 语音增强设备
DE10118653C2 (de) 2001-04-14 2003-03-27 Daimler Chrysler Ag Verfahren zur Geräuschreduktion
DE60104091T2 (de) 2001-04-27 2005-08-25 CSEM Centre Suisse d`Electronique et de Microtechnique S.A. - Recherche et Développement Verfahren und Vorrichtung zur Sprachverbesserung in verrauschte Umgebung
GB2375688B (en) 2001-05-14 2004-09-29 Motorola Ltd Telephone apparatus and a communication method using such apparatus
US8452023B2 (en) 2007-05-25 2013-05-28 Aliphcom Wind suppression/replacement component for use with electronic systems
JP3457293B2 (ja) 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US6531970B2 (en) 2001-06-07 2003-03-11 Analog Devices, Inc. Digital sample rate converters having matched group delay
US6493668B1 (en) 2001-06-15 2002-12-10 Yigal Brandman Speech feature extraction system
AUPR612001A0 (en) 2001-07-04 2001-07-26 Soundscience@Wm Pty Ltd System and method for directional noise monitoring
US7142677B2 (en) 2001-07-17 2006-11-28 Clarity Technologies, Inc. Directional sound acquisition
US6584203B2 (en) 2001-07-18 2003-06-24 Agere Systems Inc. Second-order adaptive differential microphone array
AUPR647501A0 (en) 2001-07-19 2001-08-09 Vast Audio Pty Ltd Recording a three dimensional auditory scene and reproducing it for the individual listener
WO2003010995A2 (en) 2001-07-20 2003-02-06 Koninklijke Philips Electronics N.V. Sound reinforcement system having an multi microphone echo suppressor as post processor
CA2354858A1 (en) 2001-08-08 2003-02-08 Dspfactory Ltd. Subband directional audio signal processing using an oversampled filterbank
US6653953B2 (en) 2001-08-22 2003-11-25 Intel Corporation Variable length coding packing architecture
US6683938B1 (en) 2001-08-30 2004-01-27 At&T Corp. Method and system for transmitting background audio during a telephone call
EP1430472A2 (en) 2001-09-24 2004-06-23 Clarity, LLC Selective sound enhancement
US6952482B2 (en) 2001-10-02 2005-10-04 Siemens Corporation Research, Inc. Method and apparatus for noise filtering
TW526468B (en) 2001-10-19 2003-04-01 Chunghwa Telecom Co Ltd System and method for eliminating background noise of voice signal
US6937978B2 (en) 2001-10-30 2005-08-30 Chungwa Telecom Co., Ltd. Suppression system of background noise of speech signals and the method thereof
US6792118B2 (en) 2001-11-14 2004-09-14 Applied Neurosystems Corporation Computation of multi-sensor time delays
US6785381B2 (en) 2001-11-27 2004-08-31 Siemens Information And Communication Networks, Inc. Telephone having improved hands free operation audio quality and method of operation thereof
WO2003047115A1 (en) 2001-11-30 2003-06-05 Telefonaktiebolaget Lm Ericsson (Publ) Method for replacing corrupted audio data
US20030103632A1 (en) 2001-12-03 2003-06-05 Rafik Goubran Adaptive sound masking system and method
US7315623B2 (en) 2001-12-04 2008-01-01 Harman Becker Automotive Systems Gmbh Method for supressing surrounding noise in a hands-free device and hands-free device
US7065485B1 (en) 2002-01-09 2006-06-20 At&T Corp Enhancing speech intelligibility using variable-rate time-scale modification
US7042934B2 (en) 2002-01-23 2006-05-09 Actelis Networks Inc. Crosstalk mitigation in a modem pool environment
US7171008B2 (en) 2002-02-05 2007-01-30 Mh Acoustics, Llc Reducing noise in audio systems
US8098844B2 (en) 2002-02-05 2012-01-17 Mh Acoustics, Llc Dual-microphone spatial noise suppression
US20050228518A1 (en) 2002-02-13 2005-10-13 Applied Neurosystems Corporation Filter set for frequency analysis
CA2420989C (en) 2002-03-08 2006-12-05 Gennum Corporation Low-noise directional microphone system
JP2003271191A (ja) 2002-03-15 2003-09-25 Toshiba Corp 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム
US7590250B2 (en) 2002-03-22 2009-09-15 Georgia Tech Research Corporation Analog audio signal enhancement system using a noise suppression algorithm
KR20040101373A (ko) 2002-03-27 2004-12-02 앨리프컴 통신 시스템에서 사용을 위한 마이크로폰과 음성 활동감지(vad) 구성
US7139703B2 (en) 2002-04-05 2006-11-21 Microsoft Corporation Method of iterative noise estimation in a recursive framework
US7190665B2 (en) 2002-04-19 2007-03-13 Texas Instruments Incorporated Blind crosstalk cancellation for multicarrier modulation
US7174292B2 (en) 2002-05-20 2007-02-06 Microsoft Corporation Method of determining uncertainty associated with acoustic distortion-based noise reduction
US20030228019A1 (en) 2002-06-11 2003-12-11 Elbit Systems Ltd. Method and system for reducing noise
JP2004023481A (ja) 2002-06-17 2004-01-22 Alpine Electronics Inc 音響信号処理装置及び方法並びにオーディオ装置
US7242762B2 (en) 2002-06-24 2007-07-10 Freescale Semiconductor, Inc. Monitoring and control of an adaptive filter in a communication system
BR0305556A (pt) 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar pelo menos parte de um sinal de áudio a fim de obter um sinal codificado, sinal codificado representando pelo menos parte de um sinal de áudio, meio de armazenamento, método e decodificador para decodificar um sinal codificado, transmissor, receptor, e, sistema
US7555434B2 (en) 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
JP4227772B2 (ja) 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
US7783061B2 (en) 2003-08-27 2010-08-24 Sony Computer Entertainment Inc. Methods and apparatus for the targeted sound detection
US8019121B2 (en) 2002-07-27 2011-09-13 Sony Computer Entertainment Inc. Method and system for processing intensity from input devices for interfacing with a computer program
CA2399159A1 (en) 2002-08-16 2004-02-16 Dspfactory Ltd. Convergence improvement for oversampled subband adaptive filters
US20040078199A1 (en) 2002-08-20 2004-04-22 Hanoh Kremer Method for auditory based noise reduction and an apparatus for auditory based noise reduction
JP4155774B2 (ja) 2002-08-28 2008-09-24 富士通株式会社 エコー抑制システム及び方法
US6917688B2 (en) 2002-09-11 2005-07-12 Nanyang Technological University Adaptive noise cancelling microphone system
US7283956B2 (en) 2002-09-18 2007-10-16 Motorola, Inc. Noise suppression
US7764752B2 (en) 2002-09-27 2010-07-27 Ikanos Communications, Inc. Method and system for reducing interferences due to handshake tones
US7657427B2 (en) 2002-10-11 2010-02-02 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US7146316B2 (en) 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
US20040083110A1 (en) 2002-10-23 2004-04-29 Nokia Corporation Packet loss recovery based on music signal classification and mixing
US7092529B2 (en) 2002-11-01 2006-08-15 Nanyang Technological University Adaptive control system for noise cancellation
US7970606B2 (en) 2002-11-13 2011-06-28 Digital Voice Systems, Inc. Interoperable vocoder
US7174022B1 (en) 2002-11-15 2007-02-06 Fortemedia, Inc. Small array microphone for beam-forming and noise suppression
JP4286637B2 (ja) 2002-11-18 2009-07-01 パナソニック株式会社 マイクロホン装置および再生装置
US7577262B2 (en) 2002-11-18 2009-08-18 Panasonic Corporation Microphone device and audio player
US20060160581A1 (en) 2002-12-20 2006-07-20 Christopher Beaugeant Echo suppression for compressed speech with only partial transcoding of the uplink user data stream
US20040125965A1 (en) 2002-12-27 2004-07-01 William Alberth Method and apparatus for providing background audio during a communication session
US7263481B2 (en) 2003-01-09 2007-08-28 Dilithium Networks Pty Limited Method and apparatus for improved quality voice transcoding
GB0301093D0 (en) 2003-01-17 2003-02-19 1 Ltd Set-up method for array-type sound systems
US7327985B2 (en) 2003-01-21 2008-02-05 Telefonaktiebolaget Lm Ericsson (Publ) Mapping objective voice quality metrics to a MOS domain for field measurements
DE10305820B4 (de) 2003-02-12 2006-06-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Bestimmen einer Wiedergabeposition
US7895036B2 (en) 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7725315B2 (en) 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7885420B2 (en) 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
GB2398913B (en) 2003-02-27 2005-08-17 Motorola Inc Noise estimation in speech recognition
FR2851879A1 (fr) 2003-02-27 2004-09-03 France Telecom Procede de traitement de donnees sonores compressees, pour spatialisation.
US7165026B2 (en) 2003-03-31 2007-01-16 Microsoft Corporation Method of noise estimation using incremental bayes learning
US8412526B2 (en) 2003-04-01 2013-04-02 Nuance Communications, Inc. Restoration of high-order Mel frequency cepstral coefficients
US7233832B2 (en) 2003-04-04 2007-06-19 Apple Inc. Method and apparatus for expanding audio data
US7577084B2 (en) 2003-05-03 2009-08-18 Ikanos Communications Inc. ISDN crosstalk cancellation in a DSL system
NO318096B1 (no) 2003-05-08 2005-01-31 Tandberg Telecom As Arrangement og fremgangsmate for lokalisering av lydkilde
US7353169B1 (en) 2003-06-24 2008-04-01 Creative Technology Ltd. Transient detection and modification in audio signals
US7428000B2 (en) 2003-06-26 2008-09-23 Microsoft Corp. System and method for distributed meetings
US7376553B2 (en) * 2003-07-08 2008-05-20 Robert Patel Quinn Fractal harmonic overtone mapping of speech and musical sounds
ATE487332T1 (de) 2003-07-11 2010-11-15 Cochlear Ltd Verfahren und einrichtung zur rauschverminderung
US7289554B2 (en) 2003-07-15 2007-10-30 Brooktree Broadband Holding, Inc. Method and apparatus for channel equalization and cyclostationary interference rejection for ADSL-DMT modems
WO2005010725A2 (en) 2003-07-23 2005-02-03 Xow, Inc. Stop motion capture tool
TWI221561B (en) 2003-07-23 2004-10-01 Ali Corp Nonlinear overlap method for time scaling
DE112004001455B4 (de) 2003-08-07 2020-04-23 Intersil Americas LLC Verfahren und System zum Löschen von Übersprechen
DE10339973A1 (de) 2003-08-29 2005-03-17 Daimlerchrysler Ag Intelligentes akustisches Mikrofon-Frontend mit Spracherkenner-Feedback
US7099821B2 (en) 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
CN1839426A (zh) 2003-09-17 2006-09-27 北京阜国数字技术有限公司 多分辨率矢量量化的音频编解码方法及装置
JP2005110127A (ja) 2003-10-01 2005-04-21 Canon Inc 風雑音検出装置及びそれを有するビデオカメラ装置
JP4739219B2 (ja) 2003-10-16 2011-08-03 エヌエックスピー ビー ヴィ 適応ノイズ下限トラッキングを伴う音声動作検出
WO2005048239A1 (ja) 2003-11-12 2005-05-26 Honda Motor Co., Ltd. 音声認識装置
JP4396233B2 (ja) 2003-11-13 2010-01-13 パナソニック株式会社 複素指数変調フィルタバンクの信号分析方法、信号合成方法、そのプログラム及びその記録媒体
JP4520732B2 (ja) 2003-12-03 2010-08-11 富士通株式会社 雑音低減装置、および低減方法
US6982377B2 (en) 2003-12-18 2006-01-03 Texas Instruments Incorporated Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
JP4162604B2 (ja) 2004-01-08 2008-10-08 株式会社東芝 雑音抑圧装置及び雑音抑圧方法
US7725314B2 (en) 2004-02-16 2010-05-25 Microsoft Corporation Method and apparatus for constructing a speech filter using estimates of clean speech and noise
US7499686B2 (en) 2004-02-24 2009-03-03 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
CN1930607B (zh) 2004-03-05 2010-11-10 松下电器产业株式会社 差错隐藏装置以及差错隐藏方法
JP3909709B2 (ja) 2004-03-09 2007-04-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 雑音除去装置、方法、及びプログラム
EP1581026B1 (en) 2004-03-17 2015-11-11 Nuance Communications, Inc. Method for detecting and reducing noise from a microphone array
JP4437052B2 (ja) 2004-04-21 2010-03-24 パナソニック株式会社 音声復号化装置および音声復号化方法
US20050249292A1 (en) 2004-05-07 2005-11-10 Ping Zhu System and method for enhancing the performance of variable length coding
WO2005114656A1 (en) 2004-05-14 2005-12-01 Loquendo S.P.A. Noise reduction for automatic speech recognition
GB2414369B (en) 2004-05-21 2007-08-01 Hewlett Packard Development Co Processing audio data
EP1600947A3 (en) 2004-05-26 2005-12-21 Honda Research Institute Europe GmbH Subtractive cancellation of harmonic noise
US7254665B2 (en) 2004-06-16 2007-08-07 Microsoft Corporation Method and system for reducing latency in transferring captured image data by utilizing burst transfer after threshold is reached
US20050288923A1 (en) 2004-06-25 2005-12-29 The Hong Kong University Of Science And Technology Speech enhancement by noise masking
US8340309B2 (en) 2004-08-06 2012-12-25 Aliphcom, Inc. Noise suppressing multi-microphone headset
US7529486B1 (en) 2004-08-18 2009-05-05 Atheros Communications, Inc. Remote control capture and transport
CN101015001A (zh) 2004-09-07 2007-08-08 皇家飞利浦电子股份有限公司 提高了噪声抑制能力的电话装置
KR20060024498A (ko) 2004-09-14 2006-03-17 엘지전자 주식회사 오디오신호 에러 복원방법
ATE405925T1 (de) 2004-09-23 2008-09-15 Harman Becker Automotive Sys Mehrkanalige adaptive sprachsignalverarbeitung mit rauschunterdrückung
US7383179B2 (en) 2004-09-28 2008-06-03 Clarity Technologies, Inc. Method of cascading noise reduction algorithms to avoid speech distortion
US8170879B2 (en) 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
KR20070109982A (ko) 2004-11-09 2007-11-15 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩 및 디코딩
JP4283212B2 (ja) 2004-12-10 2009-06-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 雑音除去装置、雑音除去プログラム、及び雑音除去方法
US20070116300A1 (en) 2004-12-22 2007-05-24 Broadcom Corporation Channel decoding for wireless telephones with multiple microphones and multiple description transmission
US20060133621A1 (en) 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
US20060149535A1 (en) 2004-12-30 2006-07-06 Lg Electronics Inc. Method for controlling speed of audio signals
US7561627B2 (en) 2005-01-06 2009-07-14 Marvell World Trade Ltd. Method and system for channel equalization and crosstalk estimation in a multicarrier data transmission system
US20060184363A1 (en) 2005-02-17 2006-08-17 Mccree Alan Noise suppression
JP4819881B2 (ja) 2005-04-28 2011-11-24 シーメンス アクチエンゲゼルシヤフト ノイズを抑制するための方法と装置
EP1878013B1 (en) 2005-05-05 2010-12-15 Sony Computer Entertainment Inc. Video game control with joystick
US8126159B2 (en) 2005-05-17 2012-02-28 Continental Automotive Gmbh System and method for creating personalized sound zones
US8160732B2 (en) 2005-05-17 2012-04-17 Yamaha Corporation Noise suppressing method and noise suppressing apparatus
JP4670483B2 (ja) 2005-05-31 2011-04-13 日本電気株式会社 雑音抑圧の方法及び装置
US7647077B2 (en) 2005-05-31 2010-01-12 Bitwave Pte Ltd Method for echo control of a wireless headset
JP2006339991A (ja) 2005-06-01 2006-12-14 Matsushita Electric Ind Co Ltd マルチチャンネル収音装置、マルチチャンネル音声再生装置、およびマルチチャンネル収音再生装置
US8311819B2 (en) 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
US9300790B2 (en) 2005-06-24 2016-03-29 Securus Technologies, Inc. Multi-party conversation analyzer and logger
CN1889172A (zh) 2005-06-28 2007-01-03 松下电器产业株式会社 可增加和修正声音类别的声音分类系统及方法
US8566086B2 (en) 2005-06-28 2013-10-22 Qnx Software Systems Limited System for adaptive enhancement of speech signals
US20090253418A1 (en) 2005-06-30 2009-10-08 Jorma Makinen System for conference call and corresponding devices, method and program products
US7464029B2 (en) 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment
JP4765461B2 (ja) 2005-07-27 2011-09-07 日本電気株式会社 雑音抑圧システムと方法及びプログラム
US7617436B2 (en) 2005-08-02 2009-11-10 Nokia Corporation Method, device, and system for forward channel error recovery in video sequence transmission over packet-based network
KR101116363B1 (ko) 2005-08-11 2012-03-09 삼성전자주식회사 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치
US7330138B2 (en) 2005-08-29 2008-02-12 Ess Technology, Inc. Asynchronous sample rate correction by time domain interpolation
US8326614B2 (en) 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
JP4356670B2 (ja) 2005-09-12 2009-11-04 ソニー株式会社 雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置
US7917561B2 (en) 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
US20080247567A1 (en) 2005-09-30 2008-10-09 Squarehead Technology As Directional Audio Capturing
US7813923B2 (en) 2005-10-14 2010-10-12 Microsoft Corporation Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
US7957960B2 (en) 2005-10-20 2011-06-07 Broadcom Corporation Audio time scale modification using decimation-based synchronized overlap-add algorithm
CN101346896B (zh) 2005-10-26 2012-09-05 日本电气株式会社 回声抑制方法及设备
US7366658B2 (en) 2005-12-09 2008-04-29 Texas Instruments Incorporated Noise pre-processor for enhanced variable rate speech codec
US7899669B2 (en) * 2005-12-12 2011-03-01 Gregory John Gadbois Multi-voice speech recognition
US7565288B2 (en) 2005-12-22 2009-07-21 Microsoft Corporation Spatial noise suppression for a microphone array
JP4876574B2 (ja) 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
CN1809105B (zh) 2006-01-13 2010-05-12 北京中星微电子有限公司 适用于小型移动通信设备的双麦克语音增强方法及系统
US8346544B2 (en) 2006-01-20 2013-01-01 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
JP4940671B2 (ja) 2006-01-26 2012-05-30 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US20070195968A1 (en) 2006-02-07 2007-08-23 Jaber Associates, L.L.C. Noise suppression method and system with single microphone
EP1827002A1 (en) 2006-02-22 2007-08-29 Alcatel Lucent Method of controlling an adaptation of a filter
FR2898209B1 (fr) 2006-03-01 2008-12-12 Parrot Sa Procede de debruitage d'un signal audio
US8494193B2 (en) 2006-03-14 2013-07-23 Starkey Laboratories, Inc. Environment detection and adaptation in hearing assistance devices
US7676374B2 (en) 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
JP4544190B2 (ja) 2006-03-31 2010-09-15 ソニー株式会社 映像音声処理システム、映像処理装置、音声処理装置、映像音声の出力装置および映像と音声の同期処理方法
US7555075B2 (en) 2006-04-07 2009-06-30 Freescale Semiconductor, Inc. Adjustable noise suppression system
GB2437559B (en) 2006-04-26 2010-12-22 Zarlink Semiconductor Inc Low complexity noise reduction method
US8180067B2 (en) 2006-04-28 2012-05-15 Harman International Industries, Incorporated System for selectively extracting components of an audio input signal
US7548791B1 (en) 2006-05-18 2009-06-16 Adobe Systems Incorporated Graphically displaying audio pan or phase information
US8044291B2 (en) 2006-05-18 2011-10-25 Adobe Systems Incorporated Selection of visually displayed audio data for editing
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
JP4745916B2 (ja) 2006-06-07 2011-08-10 日本電信電話株式会社 雑音抑圧音声品質推定装置、方法およびプログラム
CN101089952B (zh) 2006-06-15 2010-10-06 株式会社东芝 噪声抑制、提取特征、训练模型及语音识别的方法和装置
US20070294263A1 (en) 2006-06-16 2007-12-20 Ericsson, Inc. Associating independent multimedia sources into a conference call
JP5053587B2 (ja) 2006-07-31 2012-10-17 東亞合成株式会社 水酸化アルカリ金属の高純度製造方法
KR100883652B1 (ko) 2006-08-03 2009-02-18 삼성전자주식회사 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템
WO2008022226A2 (en) 2006-08-15 2008-02-21 Ess Technology, Inc. Asynchronous sample rate converter
JP2007006525A (ja) 2006-08-24 2007-01-11 Nec Corp ノイズ除去の方法及び装置
US20080071540A1 (en) 2006-09-13 2008-03-20 Honda Motor Co., Ltd. Speech recognition method for robot under motor noise thereof
US8036767B2 (en) 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
US7339503B1 (en) 2006-09-29 2008-03-04 Silicon Laboratories Inc. Adaptive asynchronous sample rate conversion
JP4184400B2 (ja) 2006-10-06 2008-11-19 誠 植村 地下構造物の構築方法
FR2908005B1 (fr) 2006-10-26 2009-04-03 Parrot Sa Circuit de reduction de l'echo acoustique pour un dispositif "mains libres"utilisable avec un telephone portable
ATE425532T1 (de) 2006-10-31 2009-03-15 Harman Becker Automotive Sys Modellbasierte verbesserung von sprachsignalen
US7492312B2 (en) 2006-11-14 2009-02-17 Fam Adly T Multiplicative mismatched filters for optimum range sidelobe suppression in barker code reception
US8019089B2 (en) 2006-11-20 2011-09-13 Microsoft Corporation Removal of noise, corresponding to user input devices from an audio signal
US7626942B2 (en) 2006-11-22 2009-12-01 Spectra Link Corp. Method of conducting an audio communications session using incorrect timestamps
JP2008135933A (ja) 2006-11-28 2008-06-12 Tohoku Univ 音声強調処理システム
CN101197798B (zh) 2006-12-07 2011-11-02 华为技术有限公司 信号处理系统、芯片、外接卡、滤波、收发装置及方法
CN101197592B (zh) 2006-12-07 2011-09-14 华为技术有限公司 远端串扰抵消方法、装置及信号发送装置和信号处理系统
TWI312500B (en) 2006-12-08 2009-07-21 Micro Star Int Co Ltd Method of varying speech speed
US20080152157A1 (en) 2006-12-21 2008-06-26 Vimicro Corporation Method and system for eliminating noises in voice signals
US8078188B2 (en) 2007-01-16 2011-12-13 Qualcomm Incorporated User selectable audio mixing
TWI465121B (zh) 2007-01-29 2014-12-11 Audience Inc 利用全方向麥克風改善通話的系統及方法
US8103011B2 (en) 2007-01-31 2012-01-24 Microsoft Corporation Signal detection using multiple detectors
US8060363B2 (en) 2007-02-13 2011-11-15 Nokia Corporation Audio signal encoding
EP2118885B1 (en) 2007-02-26 2012-07-11 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
US7912567B2 (en) 2007-03-07 2011-03-22 Audiocodes Ltd. Noise suppressor
JP5186510B2 (ja) 2007-03-19 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション スピーチ明瞭度強化方法と装置
US20080273683A1 (en) 2007-05-02 2008-11-06 Menachem Cohen Device method and system for teleconferencing
WO2008143569A1 (en) 2007-05-22 2008-11-27 Telefonaktiebolaget Lm Ericsson (Publ) Improved voice activity detector
TWI421858B (zh) 2007-05-24 2014-01-01 Audience Inc 用於處理音頻訊號的系統及方法
US8488803B2 (en) 2007-05-25 2013-07-16 Aliphcom Wind suppression/replacement component for use with electronic systems
JP4455614B2 (ja) 2007-06-13 2010-04-21 株式会社東芝 音響信号処理方法及び装置
CA2690433C (en) 2007-06-22 2016-01-19 Voiceage Corporation Method and device for sound activity detection and sound signal classification
US8428275B2 (en) 2007-06-22 2013-04-23 Sanyo Electric Co., Ltd. Wind noise reduction device
US20090012786A1 (en) 2007-07-06 2009-01-08 Texas Instruments Incorporated Adaptive Noise Cancellation
US7873513B2 (en) 2007-07-06 2011-01-18 Mindspeed Technologies, Inc. Speech transcoding in GSM networks
JP4456622B2 (ja) 2007-07-25 2010-04-28 沖電気工業株式会社 ダブルトーク検出器、ダブルトーク検出方法及びエコーキャンセラ
JP5009082B2 (ja) 2007-08-02 2012-08-22 シャープ株式会社 表示装置
WO2009020001A1 (ja) 2007-08-07 2009-02-12 Nec Corporation 音声ミキシング装置およびその雑音抑圧方法、ならびにプログラム
US20090043577A1 (en) 2007-08-10 2009-02-12 Ditech Networks, Inc. Signal presence detection using bi-directional communication data
JP4469882B2 (ja) 2007-08-16 2010-06-02 株式会社東芝 音響信号処理方法及び装置
US8032365B2 (en) 2007-08-31 2011-10-04 Tellabs Operations, Inc. Method and apparatus for controlling echo in the coded domain
KR101409169B1 (ko) 2007-09-05 2014-06-19 삼성전자주식회사 억제 폭 조절을 통한 사운드 줌 방법 및 장치
US8917972B2 (en) 2007-09-24 2014-12-23 International Business Machines Corporation Modifying audio in an interactive video using RFID tags
EP2045801B1 (en) 2007-10-01 2010-08-11 Harman Becker Automotive Systems GmbH Efficient audio signal processing in the sub-band regime, method, system and associated computer program
US8046219B2 (en) 2007-10-18 2011-10-25 Motorola Mobility, Inc. Robust two microphone noise suppression system
US8326617B2 (en) 2007-10-24 2012-12-04 Qnx Software Systems Limited Speech enhancement with minimum gating
US8606566B2 (en) 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction
ATE456130T1 (de) 2007-10-29 2010-02-15 Harman Becker Automotive Sys Partielle sprachrekonstruktion
US8509454B2 (en) 2007-11-01 2013-08-13 Nokia Corporation Focusing on a portion of an audio scene for an audio signal
TW200922272A (en) 2007-11-06 2009-05-16 High Tech Comp Corp Automobile noise suppression system and method thereof
DE602007014382D1 (de) * 2007-11-12 2011-06-16 Harman Becker Automotive Sys Unterscheidung zwischen Vordergrundsprache und Hintergrundgeräuschen
KR101444100B1 (ko) 2007-11-15 2014-09-26 삼성전자주식회사 혼합 사운드로부터 잡음을 제거하는 방법 및 장치
JP5159279B2 (ja) * 2007-12-03 2013-03-06 株式会社東芝 音声処理装置及びそれを用いた音声合成装置。
CN101904098B (zh) 2007-12-20 2014-10-22 艾利森电话股份有限公司 噪声抑制方法和设备
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
DE102008031150B3 (de) 2008-07-01 2009-11-19 Siemens Medical Instruments Pte. Ltd. Verfahren zur Störgeräuschunterdrückung und zugehöriges Hörgerät
GB0800891D0 (en) 2008-01-17 2008-02-27 Cambridge Silicon Radio Ltd Method and apparatus for cross-talk cancellation
US8554551B2 (en) 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
DE102008039330A1 (de) 2008-01-31 2009-08-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
US8200479B2 (en) 2008-02-08 2012-06-12 Texas Instruments Incorporated Method and system for asymmetric independent audio rendering
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
EP2378518B1 (en) 2008-03-04 2018-01-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mixing of input data streams and generation of an output data stream therefrom
US8611554B2 (en) 2008-04-22 2013-12-17 Bose Corporation Hearing assistance apparatus
US8131541B2 (en) 2008-04-25 2012-03-06 Cambridge Silicon Radio Limited Two microphone noise reduction system
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
CN101304391A (zh) 2008-06-30 2008-11-12 腾讯科技(深圳)有限公司 一种基于即时通讯系统的语音通话方法及系统
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
KR20100003530A (ko) 2008-07-01 2010-01-11 삼성전자주식회사 전자기기에서 음성 신호의 잡음 제거 장치 및 방법
US20100027799A1 (en) 2008-07-31 2010-02-04 Sony Ericsson Mobile Communications Ab Asymmetrical delay audio crosstalk cancellation systems, methods and electronic devices including the same
TR201810466T4 (tr) 2008-08-05 2018-08-27 Fraunhofer Ges Forschung Özellik çıkarımı kullanılarak konuşmanın iyileştirilmesi için bir ses sinyalinin işlenmesine yönelik aparat ve yöntem.
JP5157852B2 (ja) 2008-11-28 2013-03-06 富士通株式会社 音声信号処理評価プログラム、音声信号処理評価装置
US7777658B2 (en) 2008-12-12 2010-08-17 Analog Devices, Inc. System and method for area-efficient three-level dynamic element matching
EP2209117A1 (en) 2009-01-14 2010-07-21 Siemens Medical Instruments Pte. Ltd. Method for determining unbiased signal amplitude estimates after cepstral variance modification
US8184180B2 (en) 2009-03-25 2012-05-22 Broadcom Corporation Spatially synchronized audio and video capture
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
JP5169986B2 (ja) 2009-05-13 2013-03-27 沖電気工業株式会社 電話装置、エコーキャンセラ及びエコーキャンセルプログラム
BRPI1008266B1 (pt) 2009-06-02 2020-08-04 Mediatek Inc Disposição canceladora de eco acústico de múltiplos canais e método de cancelamento de eco acústico de múltiplos canais
US8908882B2 (en) 2009-06-29 2014-12-09 Audience, Inc. Reparation of corrupted audio signals
EP2285112A1 (en) 2009-08-07 2011-02-16 Canon Kabushiki Kaisha Method for sending compressed data representing a digital image and corresponding device
US8644517B2 (en) 2009-08-17 2014-02-04 Broadcom Corporation System and method for automatic disabling and enabling of an acoustic beamformer
US8233352B2 (en) 2009-08-17 2012-07-31 Broadcom Corporation Audio source localization system and method
JP5397131B2 (ja) 2009-09-29 2014-01-22 沖電気工業株式会社 音源方向推定装置及びプログラム
JP5400225B2 (ja) 2009-10-05 2014-01-29 ハーマン インターナショナル インダストリーズ インコーポレイテッド オーディオ信号の空間的抽出のためのシステム
CN102044243B (zh) 2009-10-15 2012-08-29 华为技术有限公司 语音激活检测方法与装置、编码器
CN102576528A (zh) 2009-10-19 2012-07-11 瑞典爱立信有限公司 用于语音活动检测的检测器和方法
US20110107367A1 (en) 2009-10-30 2011-05-05 Sony Corporation System and method for broadcasting personal content to client devices in an electronic network
US8340278B2 (en) 2009-11-20 2012-12-25 Texas Instruments Incorporated Method and apparatus for cross-talk resistant adaptive noise canceller
CN102630385B (zh) 2009-11-30 2015-05-27 诺基亚公司 音频场景内的音频缩放处理的方法、装置及系统
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US9210503B2 (en) 2009-12-02 2015-12-08 Audience, Inc. Audio zoom
WO2011080855A1 (ja) 2009-12-28 2011-07-07 三菱電機株式会社 音声信号復元装置および音声信号復元方法
US8488805B1 (en) 2009-12-29 2013-07-16 Audience, Inc. Providing background audio during telephonic communication
US20110178800A1 (en) 2010-01-19 2011-07-21 Lloyd Watts Distortion Measurement for Noise Suppression System
US8626498B2 (en) 2010-02-24 2014-01-07 Qualcomm Incorporated Voice activity detection based on plural voice activity detectors
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8787547B2 (en) 2010-04-23 2014-07-22 Lifesize Communications, Inc. Selective audio combination for a conference
US9449612B2 (en) 2010-04-27 2016-09-20 Yobe, Inc. Systems and methods for speech processing via a GUI for adjusting attack and release times
US8880396B1 (en) 2010-04-28 2014-11-04 Audience, Inc. Spectrum reconstruction for automatic speech recognition
US9099077B2 (en) 2010-06-04 2015-08-04 Apple Inc. Active noise cancellation decisions using a degraded reference
US9094496B2 (en) 2010-06-18 2015-07-28 Avaya Inc. System and method for stereophonic acoustic echo cancellation
US8611546B2 (en) 2010-10-07 2013-12-17 Motorola Solutions, Inc. Method and apparatus for remotely switching noise reduction modes in a radio system
US8311817B2 (en) 2010-11-04 2012-11-13 Audience, Inc. Systems and methods for enhancing voice quality in mobile device
US8831937B2 (en) 2010-11-12 2014-09-09 Audience, Inc. Post-noise suppression processing to improve voice quality
US8744091B2 (en) 2010-11-12 2014-06-03 Apple Inc. Intelligibility control using ambient noise detection
WO2012094422A2 (en) 2011-01-05 2012-07-12 Health Fidelity, Inc. A voice based system and method for data input
US10218327B2 (en) 2011-01-10 2019-02-26 Zhinian Jing Dynamic enhancement of audio (DAE) in headset systems
US9275093B2 (en) 2011-01-28 2016-03-01 Cisco Technology, Inc. Indexing sensor data
US8868136B2 (en) 2011-02-28 2014-10-21 Nokia Corporation Handling a voice communication request
US9107023B2 (en) 2011-03-18 2015-08-11 Dolby Laboratories Licensing Corporation N surround
US9049281B2 (en) 2011-03-28 2015-06-02 Conexant Systems, Inc. Nonlinear echo suppression
US8989411B2 (en) 2011-04-08 2015-03-24 Board Of Regents, The University Of Texas System Differential microphone with sealed backside cavities and diaphragms coupled to a rocking structure thereby providing resistance to deflection under atmospheric pressure and providing a directional response to sound pressure
US8804865B2 (en) 2011-06-29 2014-08-12 Silicon Laboratories Inc. Delay adjustment using sample rate converters
US8378871B1 (en) 2011-08-05 2013-02-19 Audience, Inc. Data directed scrambling to improve signal-to-noise ratio
US9197974B1 (en) 2012-01-06 2015-11-24 Audience, Inc. Directional audio capture adaptation based on alternative sensory input
US8737188B1 (en) 2012-01-11 2014-05-27 Audience, Inc. Crosstalk cancellation systems and methods
US8615394B1 (en) 2012-01-27 2013-12-24 Audience, Inc. Restoration of noise-reduced speech
US9431012B2 (en) 2012-04-30 2016-08-30 2236008 Ontario Inc. Post processing of natural language automatic speech recognition
US9093076B2 (en) 2012-04-30 2015-07-28 2236008 Ontario Inc. Multipass ASR controlling multiple applications
US8737532B2 (en) 2012-05-31 2014-05-27 Silicon Laboratories Inc. Sample rate estimator for digital radio reception systems
US9479275B2 (en) 2012-06-01 2016-10-25 Blackberry Limited Multiformat digital audio interface
US20130343549A1 (en) 2012-06-22 2013-12-26 Verisilicon Holdings Co., Ltd. Microphone arrays for generating stereo and surround channels, method of operation thereof and module incorporating the same
EP2680616A1 (en) 2012-06-25 2014-01-01 LG Electronics Inc. Mobile terminal and audio zooming method thereof
US9119012B2 (en) 2012-06-28 2015-08-25 Broadcom Corporation Loudspeaker beamforming for personal audio focal points
CN104429050B (zh) 2012-07-18 2017-06-20 华为技术有限公司 具有用于立体声音频录音的麦克风的便携式电子装置
EP2875624B1 (en) 2012-07-18 2018-09-12 Huawei Technologies Co., Ltd. Portable electronic device with directional microphones for stereo recording
US9264799B2 (en) 2012-10-04 2016-02-16 Siemens Aktiengesellschaft Method and apparatus for acoustic area monitoring by exploiting ultra large scale arrays of microphones
US20140241702A1 (en) 2013-02-25 2014-08-28 Ludger Solbach Dynamic audio perspective change during video playback
US8965942B1 (en) 2013-03-14 2015-02-24 Audience, Inc. Systems and methods for sample rate tracking
US9984675B2 (en) 2013-05-24 2018-05-29 Google Technology Holdings LLC Voice controlled audio recording system with adjustable beamforming
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9236874B1 (en) 2013-07-19 2016-01-12 Audience, Inc. Reducing data transition rates between analog and digital chips
DE112015000443T5 (de) 2014-01-21 2016-12-01 Knowles Electronics, Llc Mikrofonvorrichtung und Verfahren, um extrem hohe Akustiküberlastpunkte bereitzustellen
US9500739B2 (en) 2014-03-28 2016-11-22 Knowles Electronics, Llc Estimating and tracking multiple attributes of multiple objects from multi-sensor data
US20160037245A1 (en) 2014-07-29 2016-02-04 Knowles Electronics, Llc Discrete MEMS Including Sensor Device
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
WO2016049566A1 (en) 2014-09-25 2016-03-31 Audience, Inc. Latency reduction
US20160162469A1 (en) 2014-10-23 2016-06-09 Audience, Inc. Dynamic Local ASR Vocabulary

Also Published As

Publication number Publication date
CN105474311A (zh) 2016-04-06
US9536540B2 (en) 2017-01-03
WO2015010129A1 (en) 2015-01-22
DE112014003337T5 (de) 2016-03-31
US20150025881A1 (en) 2015-01-22
TW201513099A (zh) 2015-04-01

Similar Documents

Publication Publication Date Title
KR20160032138A (ko) 청각 장면 분석 및 음성 모델링에 기초한 음성 신호 분리 및 합성
CN106486131B (zh) 一种语音去噪的方法及装置
EP3164871B1 (en) User environment aware acoustic noise reduction
US9666183B2 (en) Deep neural net based filter prediction for audio event classification and extraction
EP1638083B1 (en) Bandwidth extension of bandlimited audio signals
US20210193149A1 (en) Method, apparatus and device for voiceprint recognition, and medium
US8655656B2 (en) Method and system for assessing intelligibility of speech represented by a speech signal
KR20120090086A (ko) 협대역 신호로부터의 상위대역 신호의 결정
CN108108357B (zh) 口音转换方法及装置、电子设备
CN108492818B (zh) 文本到语音的转换方法、装置和计算机设备
Shahnaz et al. Pitch estimation based on a harmonic sinusoidal autocorrelation model and a time-domain matching scheme
CN106463106A (zh) 用于音频接收的风噪声降低
US20130332171A1 (en) Bandwidth Extension via Constrained Synthesis
CN108369803B (zh) 用于形成基于声门脉冲模型的参数语音合成系统的激励信号的方法
CN110765868A (zh) 唇读模型的生成方法、装置、设备及存储介质
US20150325252A1 (en) Method and device for eliminating noise, and mobile terminal
US9058820B1 (en) Identifying speech portions of a sound model using various statistics thereof
US20050204286A1 (en) Speech receiving device and viseme extraction method and apparatus
JP6268916B2 (ja) 異常会話検出装置、異常会話検出方法及び異常会話検出用コンピュータプログラム
CN113744715A (zh) 声码器语音合成方法、装置、计算机设备及存储介质
CN111968651A (zh) 一种基于wt的声纹识别方法及系统
CN109272996B (zh) 一种降噪方法及系统
WO2007076279A2 (en) Method for classifying speech data
Kechichian et al. Model-based speech enhancement using a bone-conducted signal
CN113889073A (zh) 语音处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid