KR950013552B1 - 음성신호처리장치 - Google Patents

음성신호처리장치 Download PDF

Info

Publication number
KR950013552B1
KR950013552B1 KR1019910008708A KR910008708A KR950013552B1 KR 950013552 B1 KR950013552 B1 KR 950013552B1 KR 1019910008708 A KR1019910008708 A KR 1019910008708A KR 910008708 A KR910008708 A KR 910008708A KR 950013552 B1 KR950013552 B1 KR 950013552B1
Authority
KR
South Korea
Prior art keywords
signal
noise
spectral
speech
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1019910008708A
Other languages
English (en)
Other versions
KR910020642A (ko
Inventor
죠지 카네
아끼라 노하라
Original Assignee
마쯔시다덴기산교 가부시기가이샤
다니이 아끼오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마쯔시다덴기산교 가부시기가이샤, 다니이 아끼오 filed Critical 마쯔시다덴기산교 가부시기가이샤
Publication of KR910020642A publication Critical patent/KR910020642A/ko
Priority to KR94026430A priority Critical patent/KR950001070B1/ko
Priority to KR1019940026432A priority patent/KR950001067B1/ko
Priority to KR1019940026431A priority patent/KR950001071B1/ko
Priority to KR1019940026429A priority patent/KR960007843B1/ko
Application granted granted Critical
Publication of KR950013552B1 publication Critical patent/KR950013552B1/ko
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

내용 없음.

Description

음성신호처리장치
제1도는 본 발명의 제1실시예에 의한 신호처리장치를 도시한 블록도.
제2도는 본 발명의 제2실시예에 의한 신호처리장치를 도시한 블록도.
제3도는 본 발명의 제3실시예에 의한 신호처리장치를 도시한 블록도.
제4도는 일반적인 켑스트럼분석을 설명하기 위한 그래프.
제5도는 본 발명에 있어서의 잡음예측방법을 설명하기 위한 그래프.
제6도와 제7도는 본 발명의 잡음제거를 설명하기 위한 파형도.
* 도면의 주요부분에 대한 부호의 설명
2 : 기억수단 3 : 신호판별수단
4 : 최대우도(maximum likelihood)검출수단
5 : 출력수단 8 : 잡음예측수단
9 : 잡음파워산출수단 10 : 대역분할수단
11 : 잡음제거수단 12 : 대역합성수단
31 : 피크검출수단 32 : 음성판별수단
본 발명은, 잡음혼입의 음성신호등의 신호에 대해 신호부분의 검출과 함께 신호의 종류의 판별을 행하는 음성신호처리장치에 관한 것이다.
종래, 잡음혼입의 음성신호로부터, 잡음부분과 음성부분을 구별하는 기술이 개발되어 있다(예를들면, 일본국 특개소 59-124397호 공보, 일본국 특개소 59-131997호 공보참조). 상기 잡음부분과 상기 음성부분이 구별된 결과는, 예를들면 음성인식장치에서 음성부분을 인식하는 시스템에 사용되고 있다.
그러나, 이와같이 음성부분을 잡음부분과 구별하는 종래 기술은, 음성부분의 종류, 즉 누구의 음성인지를 알 수 없는 기술이다. 음성인식장치에서는, 음성부분의 종류를 미리 알고 있는 것이 바람직하다.
본 발명의 목적은 이와같은 종래 기술의 과제를 감안하여, 신호부분의 판별과 함께 신호부분의 신호종류를 판별하는 음성신호처리장치를 제공하는데 있다.
상기 목적을 달성하기 위하여, 본 발명의 음성신호처리장치는, 복수종류의 소정신호의 각각에 대한 소정의 특징정보를 미리 기억하고 있는 기억수단과, 잡음혼입의 음성입력신호에 대해 푸리에 변환을 포함한 대역분할처리를 행하여, 복수채널의 스펙트럼신호를 출력하는 대역분할수단과, 상기 대역분할수단으로부터 출력된 복수의 채널의 스펙트럼신호에 대해 켑스트럼분석처리를 행하여, 켑스트럼분석결과를 출력하는 켑스트럼분석수단과, 상기 켑스트럼분석수단으로부터 출력된 켑스트럼분석결과에 응답하여 켑스트럼의 피크를 검출하는 피크검출수단과, 상기 피크검출수단에 의해 검출된 피크에 응답하여 잡음혼입의 음성입력신호의 음성신호구간을 판별하고, 판별된 음성신호구간을 출력하는 음성판별수단과, 잡음혼입의 음성입력신호의 특징과 상기 기억수단에 기억된 특징을 비교하여 잡음혼입의 음성입력신호의 신호종류를 검출하는 최대우도검출수단과, 상기 음성판별수단에 의해 판별된 음성신호구간과 상기 최대우도검출수단에 의해 검출된 잡음혼입의 음성력신호의 신호종류에 응답하여, 잡음혼입의 음성신호로부터 음성신호구간의 잡음을 예측하는 잡음예측수단과, 상기 대역분할수단으로부터 출력된 복수채널의 스펙트럼신호에 응답하여 상기 잡음예측수단에 의해 예측된 잡음을 제거하여, 채널마다 잡음이 억제된 스펙트럼신호를 출력하는 잡음제거수단과, 채널마다 잡음이 억제된 상기 스펙트럼신호를 합성하고, 합성된 스펙트럼신호를 푸리에 역변환하고, 변환된 음성신호를 출력하는 대역합성수단을 포함하는 것을 특징으로 한다.
상기 구성에 의한 음성신호처리장치는, 판별된 음성부분정보와 잡음혼입의 음성입력신호의 신호종류에 응답하여 잡음을 예측하고, 이에 의해 보다 높은 정밀도를 가지고 잡음을 억제할 수 있다.
이하에 본 발명에 의한 각 실시예에 대해서 도면을 참조해서 설명한다.
[제1실시예]
제1도는, 본 발명의 제1실시예에 의한 음성신호처리장치를 도시한 블록도이다.
본 실시예에서는, 신호로서 음성신호를 사용한 경우를 예로 들고 있다.
켑스트럼분석수단(1)은, 대역분할수단에 의해 푸리에 변환된 음성신호로부터 켑스트럼분석을 행하는 수단이다. 켑스트럼은, 입력된 음성신호의 파형의 단시간 간격에 대한 진폭스펙트럼의 대수를 산출하고, 산출된 대수를 푸리에 역변환하여 얻은 것으로서, 제4도에 도사한 바와같다. 제4(a)도는, 입력된 음성신호와 단시간 간격에 대한 스펙트럼이고, 제4(b)도는 입력된 음성신호의 켑스트럼이다.
기억수단(2)은 이미 알고 있는 종류의 신호에 대해 소정의 특징정보를 미리 기억하고 있는 RAM, ROM등의 수단이다. 즉, "A"라고 하는 사람의 음성신호의 켑스트럼분석결과라고 하는 특징을 "A"라고 하는 사람과 함께 기억하고 있다. 상기 켑스트럼분석결과는 적어도 피크(피치)의 존재위치와 포만트정보를 포함한다(제4(b)도 참조). 마찬가지로, 타인 "B", "C",…,의 음성의 켑스트럼분석결과를 기억하고 있다. 피크나 포만트정보는, 각각의 사람마다 서로 다른 정보를 가진다. 또한, 특징정보로서는, 이와같은 켑스트럼분석결과 이외에 진폭, 위상등이 임의의 음성특징으로 된다.
신호판별수단(3)은, 켑스트럼분석수단(1)에 의해 얻은 켑스트럼을 이용해서 음성신호구간과 잡음구간을 판별하기 위한 수단이다. 상기 켑스트럼을 이용해서 음성신호구간을 판별하는 방법으로는, 예를들면, 켑스트럼의 피크를 검출해서 음성신호와 잡음을 판별하는 방법이 알려져 있다. 즉, 분석된 켑스트럼으로부터 피크를 검출하는 피크검출수단(31)과, 검출된 피크정보에 의거해서, 음성신호를 판별하는 음성판별수단(32)을 이용하는 방법이다(제2도 참조). 제4(b)도의 피치가 피크를 표시하고, 피크가 존재하는 부분이 음성신호부분이다. 피크의 검출은, 예를들면 소정의 한계치를 미리 설정해두고, 소정의 한계치와의 비료를 행함으로써 검출된다.
신호판별수단(3)에 의해 음성신호부분이 검출되는 타이밍에서 신호판별수단(3)으로부터 제어신호가 기억수단(2)에 액세스되어, 미리 기억되어 있는 특징정보가 최대우도검출수단(4)에 입력된다. 한편, 켑스트럼분석결과의 특징정보가 켑스트럼분석수단(1)으로부터 입력된다. 그래서, 최대우도검출수단(4)은, 입력된 켑스트럼분석결과와 상기 기억수단(2)의 특징정보를 "A"→"B"→"C"→"D"→,…,로 절환하면서 순차적으로 비교하고, 가장 유사한 특징을 탐색하여 음성신호부분의 신호가 누구의 것인지를 검출하도록 되어 있다. 또한, 유사한 정도의 판단은, 패턴매칭법, 진폭레벨의 유사도, 위상의 유사도를 조사하는 방법등이 있다.
출력수단(5)은, 상기 신호판별수단(3)에 의한 결과와 상기 최대우도검출수단(4)에 의한 결과를 입력하고, 이들을 한쌍으로 해서 출력하는 수단이다. 즉, 이 출력수단(5)으로부터는, 음성신호부분의 존재정보와 함께, 음성신호가 누구의 것인지에 대한 정보가 출력되게 된다.
다음에, 상기 실시예의 동작을 간단히 설명한다.
먼저, 기억수단(2)에 각자의 음성의 켑스트럼분석결과를 미리 기억시켜 둔다.
다음에, 잡음혼입의 음성신호를 입력하고, 켑스트럼분석수단(1)에 의해 분석을 행한다(또한, 상기 켑스트럼분석수단(1)을 이용해서 상기 각자의 켑스트럼분석을 행하여도 된다(제1도의 (6) 참조)).
신호판별수단(3)은 상기 켑스트럼분석결과의 피크등을 이용하여 음성신호구간을 판별한다. 그리고, 음성신호구간이 발생하는 타이밍에서 제어신호가 기억수단(2)에 액세스되고(제1도의 (7) 참조), 기억수단(2)에 기억된 켑스트럼분석결과가 최대우도검출수단(4)으로 출력된다. 한편, 켑스트럼분석수단(1)의 켑스트럼분석 결과가 최대우도검출수단(4)으로 입력된다. 최대우도검출수단(4)은, 쌍방의 켑스트럼의 분석결과를 비교하고, 가장 유사한 것을 결정한다. 어느 정도 이상으로 유사한 것이 없으면, 해당하는 것이 없는 것으로 한다. 출력수단(5)은, 상기 최대우도검출수단(4)의 결과와 신호판별수단(3)의 결과를 조합하여 출력한다.
본 발명은 음성정보에 한정되지 않고, 차의 소리, 비행기의 소리등을 신호로 하고, 그 이외의 신호를 잡음으로 하여도 된다. 이 경우에는, 특징정보로서는, 켑스트럼분석결과를 사용하지 않고, 다른 특징정보를 사용하도록 한다.
[제2실시예]
제2도는 본 발명의 제2실시예에 의한 음성신호처리장치를 도시한 블록도이다.
제1도의 제1실시예와 마찬가지로, 신호판별수단(3)은, 피크검출수단(31)과 음성판별수단(32)을 구비한다. 그리고, 제1도에 도시한 실시예와 다른점은 다음과 같다. 최대우도검출수단(4)은, 상기 기억수단(2)의 켑스트럼분석결과와 켑스트럼분석수단(1)으로부터 입력된 켑스트럼분석결과 뿐만 아니라, 음성신호부분에 대한 예측잡음도 고려해서, 가장 유사한 신호종류를 검출한다. 즉, 음성판별수단(32)에 의해 음성부분의 발생타이밍을 검출할 때에, 검출결과를 음성판별수단(32)으로부터 출력수단(5)을 통하여 잡음예측수단(8)에 입력된다. 한편, 상기 잡음예측수단(8)은 잡음혼입의 음성신호를 입력하고 있다. 그리고, 음성부분 아닌 부분은 잡음만의 부분이므로, 잡음만의 데이터에 의거하여, 음성신호부분의 잡음을 예측하도록 되어 있다. 즉, 이 잡음예측수단(8)은, 예를들면, m개의 채널로 분할된 음성/잡음입력에 의거하여, 잡음성분을 각 채널마다 예측하는 수단이다. 예를들면, 제5도에 표시한 바와같이, X축에 주파수, Y축에 음성레벨, Z축에 시간을 취하는 동시에, 주파수(f1)에서 데이터(P1), (P2),…,(Pi)를 취하고, 후속하는 데이터(Pj)를 예측한다. 예를들면, 잡음부분(P1)∼(Pj)의 평균을 취하여 데이터(Pj)로 한다. 또는 음성신호부분이 다시 계속할때에는, 데이터(Pj)에 감쇠계수를 곱하여도 된다. 잡음파워산출수단(9)은, 상기 잡음예측수단(8)에 의해 예측된 잡음의 크기를 산출하는 수단이다. 예를들면, 진폭의 평균치등이다. 최대우도검출수단(4)은, 잡음파워가 큰때에는, 기억수단(2)에 기억된 켑스트럼결과와 입력된 켑스트럼결과가 다소 상이하여도, 상당히 가까운 것으로 보고, 유사판단기준을 완화한다. 한편, 잡음파워가 작은 때에는, 잡음이 거의 없으므로, 유사판단기준을 엄격하게 운용한다.
[제3실시예]
제3도는, 제2도의 실시예에 의한 잡음예측수단(8)에 의해 예측된 잡음예측치를 이용해서, 잡음이 억압된 신호를 얻는 음성신호처리장치를 표시한 블록도이다.
동도면에 있어서, 대역분할수단(10)은 잡음혼입의 음성신호를 입력하고, A/D변환해서 푸리에 변화하는 수단이다. 이 대역분할수단(10)의 출력이 상기 켑스트럼분석수단(1)과 잡음예측수단(8)에 입력된다. 한편, 잡음제거수단(11)은, 대역분할수단(10)으로부터 출력된 각각의 주파수채널마다 잡음혼입의 음성신호를 입력하고, 잡음예측수단(8)에 의해 예측된 잡음예측치를 채널마다 제거하는 수단이다. 일반적으로, 잡음제거의 방법의 일예로서, 시간축에 대한 잡음제거는, 제6도에 표시한 바와 같이, 잡음혼입의 음성신호(A)로부터 예측된 잡음파형(B)를 감산함으로써, 행해진다.
이에 의해 신호(A-B)만이 인출된다. 또한, 본 실시예에서는, 제7도에 도시한 바와같이, 주파수를 기준으로 한 주파수제거에 의해, 잡음혼입의 음성신호(a)를 푸리에 변환하고, 푸리에 변환된 스펙트럼(b)으로부터 예측잡음의 스펙트럼(c)을 감산하고, 감산된 스펙트럼(d)을 푸리에 역변환해서, 잡음이 없는 음성신호(e)를 얻는다.
대역합성수단(12)은 잡음제거수단(11)으로부터 공급되는 m개의 채널의 신호를 푸리에 역변환해서 음질이 양호한 음성출력을 얻는다.
이와같이, 잡음제거수단(11)에 의해 잡음성분을 제거하고, 대역합성수단(12)에 의해 음성을 합성하므로, 사람을 특정한 정보와 함께 잡음이 억압된 음성신호를 얻을 수 있다. 또한, 기억수단(2)에 기억되는 특징으로서, 본 실시예에서는, 켑스트럼분석결과중에서 피크정보를 선택하고 있다(제3도의 피크검출수단(31)과 기억수단(2) 참조).
[다른 실시예]
또한, 이상의 실시예에 있어서, 켑스트럼분석수단, 최대우도검출수단, 잡음예측수단등은 컴퓨터를 이용해서 소프트웨어적으로 실현할 수 있으나, 전용의 하드회로를 사용해도 실현가능하다.
또한, 본 발명에 있어서, 잡음이란, 착안하는 신호이외의 신호를 의미하므로, 음성에 대해서도 잡음으로 취급되는 일이 있을 수 있다.
상기한 실시예로부터 명백한 바와같이, 본 발명에 의한 음성신호처리장치는, 잡음혼입의 음성신호로부터 잡음성분을 제거할 수 있고, 이에 의해 음성부분만의 신호를 검출할 수 있다.
또한, 본 발명에 의한 음성신호처리장치는, 기지의 신호로부터, 소의 특징정보를 미리 기억하고, 입력되는 신호와 특징과 상기 기억된 특징정보를 비교하고, 신호부분의 신호종류를 검출하므로, 잡음이 혼입한 신호로부터 신호부분을 검출할 수 있고, 또한 신호의 종류도 검출할 수 있다.

Claims (1)

  1. 복수종류의 소정신호의 각각에 대한 소정의 특징정보를 미리 기억하고 있는 기억수단과, 잡음혼입의 음성입력신호에 대해 푸리에 변환을 포함한 대역분할처리를 행하여, 복수채널의 스펙트럼신호를 출력하는 대역분할수단과, 상기 대역분할수단으로부터 출력된 복수채널의 스펙트럼신호에 켑스트럼분석처리를 행하여, 켑스트럼분석결과를 출력하는 켑스트럼분석수단과, 상기 켑스트럼분석수단으로부터 출력된 켑스트럼분석결과에 응답하여 켑스트럼의 피크를 검출하는 피크검출수단과, 상기 피크검출수단에 의해 검출된 피크에 응답하여 잡음혼입의 음성입력신호의 음성신호구간을 판별하고, 판별된 음성신호구간을 출력하는 음성판별수단과, 잡음혼입의 음성입력신호의 특징과 상기 기억수단에 기억된 특징을 비교하여 잡음혼입의 음성입력신호의 신호종류를 검출하는 최대우도검출수단과, 상기 음성판별수단에 의해 판별된 음성신호구간과 상기 최대우도검출수단에 의해 검출된 잡음혼입의 음성입력신호의 신호종류에 응답하여, 잡음혼입의 음성신호로부터 음성신호구간의 잡음을 예측하는 잡음예측수단과, 상기 대역분할수단으로부터 출력된 복수채널의 스펙트럼신호에 응답하여 상기 잡음예측수단에 의해 예측된 잡음을 제거하여, 채널마다 잡음이 억제된 스펙트럼신호를 출력하는 잡음제거수단과, 채널마다 잡음이 억제된 상기 스펙트럼신호를 합성하고, 합성된 스펙트럼신호를 푸리에 역변환하고, 변환된 음성신호를 출력하는 대역합성수단을 포함한 것을 특징으로 하는 음성신호처리장치.
KR1019910008708A 1990-05-28 1991-05-28 음성신호처리장치 Expired - Fee Related KR950013552B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR94026430A KR950001070B1 (en) 1990-05-28 1994-10-15 Speech signal processing device
KR1019940026432A KR950001067B1 (ko) 1990-05-28 1994-10-15 음성인식장치
KR1019940026431A KR950001071B1 (ko) 1990-05-28 1994-10-15 음성신호처리장치
KR1019940026429A KR960007843B1 (ko) 1990-05-28 1994-10-15 음성신호처리장치

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
JP13805390 1990-05-28
JP2-138053 1990-05-28
JP2-138063 1990-05-28
JP2-138061 1990-05-28
JP2-138062 1990-05-28
JP13806190 1990-05-28
JP13806290 1990-05-28
JP13806390 1990-05-28
JP13806790 1990-05-28
JP2-138067 1990-05-28

Related Child Applications (2)

Application Number Title Priority Date Filing Date
KR1019940026429A Division KR960007843B1 (ko) 1990-05-28 1994-10-15 음성신호처리장치
KR1019940026431A Division KR950001071B1 (ko) 1990-05-28 1994-10-15 음성신호처리장치

Publications (2)

Publication Number Publication Date
KR910020642A KR910020642A (ko) 1991-12-20
KR950013552B1 true KR950013552B1 (ko) 1995-11-08

Family

ID=27527503

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019910008708A Expired - Fee Related KR950013552B1 (ko) 1990-05-28 1991-05-28 음성신호처리장치

Country Status (4)

Country Link
US (4) US5355431A (ko)
EP (5) EP0763810B1 (ko)
KR (1) KR950013552B1 (ko)
DE (5) DE69132659T2 (ko)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1272653B (it) * 1993-09-20 1997-06-26 Alcatel Italia Metodo di riduzione del rumore, in particolare per riconoscimento automatico del parlato, e filtro atto ad implementare lo stesso
US5586126A (en) * 1993-12-30 1996-12-17 Yoder; John Sample amplitude error detection and correction apparatus and method for use with a low information content signal
DE19524847C1 (de) * 1995-07-07 1997-02-13 Siemens Ag Vorrichtung zur Verbesserung gestörter Sprachsignale
US5687243A (en) * 1995-09-29 1997-11-11 Motorola, Inc. Noise suppression apparatus and method
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US5822370A (en) * 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
JP3006677B2 (ja) * 1996-10-28 2000-02-07 日本電気株式会社 音声認識装置
EP0994462B1 (en) * 1996-11-07 2002-04-03 Matsushita Electric Industrial Co., Ltd Excitation vector generation
US5946649A (en) * 1997-04-16 1999-08-31 Technology Research Association Of Medical Welfare Apparatus Esophageal speech injection noise detection and rejection
US6804646B1 (en) 1998-03-19 2004-10-12 Siemens Aktiengesellschaft Method and apparatus for processing a sound signal
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US7415120B1 (en) 1998-04-14 2008-08-19 Akiba Electronics Institute Llc User adjustable volume control that accommodates hearing
DE69942784D1 (de) * 1998-04-14 2010-10-28 Hearing Enhancement Co Llc Verfahren und Vorrichtung, die es einem End-Benutzer ermöglichen, Hörer-Präferenzen für Hörbehinderte und Nicht-Hörbehinderte einzustellen
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
AR024353A1 (es) 1999-06-15 2002-10-02 He Chunhong Audifono y equipo auxiliar interactivo con relacion de voz a audio remanente
US6349278B1 (en) 1999-08-04 2002-02-19 Ericsson Inc. Soft decision signal estimation
US6366880B1 (en) * 1999-11-30 2002-04-02 Motorola, Inc. Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7266501B2 (en) 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US20040096065A1 (en) * 2000-05-26 2004-05-20 Vaudrey Michael A. Voice-to-remaining audio (VRA) interactive center channel downmix
US6990061B2 (en) * 2000-05-31 2006-01-24 Interuniversitair Micro-Elektronica Centrum Method and apparatus for channel estimation
WO2002029780A2 (en) * 2000-10-04 2002-04-11 Clarity, Llc Speech detection with source separation
US7177808B2 (en) * 2000-11-29 2007-02-13 The United States Of America As Represented By The Secretary Of The Air Force Method for improving speaker identification by determining usable speech
GB2375027B (en) * 2001-04-24 2003-05-28 Motorola Inc Processing speech signals
US6591991B2 (en) 2001-08-06 2003-07-15 Luce Belle Collapsible tire stand
US7571095B2 (en) * 2001-08-15 2009-08-04 Sri International Method and apparatus for recognizing speech in a noisy environment
JP3673507B2 (ja) * 2002-05-16 2005-07-20 独立行政法人科学技術振興機構 音声波形の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、音声信号の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、ならびに擬似音節核抽出装置およびプログラム
US7013272B2 (en) * 2002-08-14 2006-03-14 Motorola, Inc. Amplitude masking of spectra for speech recognition method and apparatus
JP2004297273A (ja) * 2003-03-26 2004-10-21 Kenwood Corp 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
NO324318B1 (no) * 2005-04-29 2007-09-24 Tandberg Telecom As Fremgangsmate og anordning for stoydeteksjon.
JP4246755B2 (ja) * 2006-05-30 2009-04-02 株式会社エヌ・ティ・ティ・ドコモ 受信信号周波数帯域検出器
JP4757158B2 (ja) * 2006-09-20 2011-08-24 富士通株式会社 音信号処理方法、音信号処理装置及びコンピュータプログラム
US7813924B2 (en) * 2007-04-10 2010-10-12 Nokia Corporation Voice conversion training and data collection
JPWO2009004718A1 (ja) * 2007-07-03 2010-08-26 パイオニア株式会社 楽音強調装置、楽音強調方法、楽音強調プログラムおよび記録媒体
JP4660578B2 (ja) * 2008-08-29 2011-03-30 株式会社東芝 信号補正装置
US8442831B2 (en) * 2008-10-31 2013-05-14 International Business Machines Corporation Sound envelope deconstruction to identify words in continuous speech
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
US20140025374A1 (en) * 2012-07-22 2014-01-23 Xia Lou Speech enhancement to improve speech intelligibility and automatic speech recognition
US9865277B2 (en) * 2013-07-10 2018-01-09 Nuance Communications, Inc. Methods and apparatus for dynamic low frequency noise suppression
US10121488B1 (en) 2015-02-23 2018-11-06 Sprint Communications Company L.P. Optimizing call quality using vocal frequency fingerprints to filter voice calls
CN107274895B (zh) * 2017-08-18 2020-04-17 京东方科技集团股份有限公司 一种语音识别设备及方法
JP7404664B2 (ja) * 2019-06-07 2023-12-26 ヤマハ株式会社 音声処理装置及び音声処理方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5272504A (en) * 1975-12-15 1977-06-17 Fuji Xerox Co Ltd Device for recognizing word audio
GB1541041A (en) * 1976-04-30 1979-02-21 Int Computers Ltd Sound analysing apparatus
GB2104218B (en) * 1981-07-28 1984-08-30 Ferranti Ltd Detecting harmonically-rich acoustic sources
JPS59124397A (ja) 1982-12-29 1984-07-18 松下電器産業株式会社 無音区間検出回路
JPS59131997A (ja) 1983-01-19 1984-07-28 松下電器産業株式会社 音声の有声・無声判定方法
EP0128298B1 (en) * 1983-04-11 1990-07-04 Nec Corporation Orthogonal transformer and apparatus operational thereby
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
KR940009391B1 (ko) * 1985-07-01 1994-10-07 모토로라 인코포레이티드 잡음 억제 시스템
US4852181A (en) * 1985-09-26 1989-07-25 Oki Electric Industry Co., Ltd. Speech recognition for recognizing the catagory of an input speech pattern
US4827516A (en) * 1985-10-16 1989-05-02 Toppan Printing Co., Ltd. Method of analyzing input speech and speech analysis apparatus therefor
WO1987004294A1 (en) * 1986-01-06 1987-07-16 Motorola, Inc. Frame comparison method for word recognition in high noise environments
GB8608289D0 (en) * 1986-04-04 1986-05-08 Pa Consulting Services Noise compensation in speech recognition
US4837830A (en) * 1987-01-16 1989-06-06 Itt Defense Communications, A Division Of Itt Corporation Multiple parameter speaker recognition system and methods
US4989249A (en) * 1987-05-29 1991-01-29 Sanyo Electric Co., Ltd. Method of feature determination and extraction and recognition of voice and apparatus therefore
US5036539A (en) * 1989-07-06 1991-07-30 Itt Corporation Real-time speech processing development system
DE483174T1 (de) * 1989-07-11 1993-08-12 Intelligence Quotient International Ltd., Tavistock, Devon Verfahren zum betrieb eines datenverarbeitungssystems.
AU633673B2 (en) * 1990-01-18 1993-02-04 Matsushita Electric Industrial Co., Ltd. Signal processing device

Also Published As

Publication number Publication date
US5617505A (en) 1997-04-01
EP0763810B1 (en) 2001-09-26
DE69132749T2 (de) 2002-07-04
DE69131739D1 (de) 1999-12-02
EP0763813B1 (en) 2001-07-11
US5621850A (en) 1997-04-15
EP0763811B1 (en) 2001-06-20
DE69132659D1 (de) 2001-08-16
EP0763812A1 (en) 1997-03-19
EP0459382B1 (en) 1999-10-27
DE69132749D1 (de) 2001-10-31
DE69132659T2 (de) 2002-05-02
DE69132645T2 (de) 2002-04-18
EP0763813A1 (en) 1997-03-19
EP0459382A2 (en) 1991-12-04
US5630015A (en) 1997-05-13
DE69131739T2 (de) 2001-10-04
EP0763812B1 (en) 2001-06-20
DE69132644T2 (de) 2002-05-29
EP0459382A3 (en) 1993-03-03
KR910020642A (ko) 1991-12-20
DE69132645D1 (de) 2001-07-26
US5355431A (en) 1994-10-11
EP0763810A1 (en) 1997-03-19
EP0763811A1 (en) 1997-03-19
DE69132644D1 (de) 2001-07-26

Similar Documents

Publication Publication Date Title
KR950013552B1 (ko) 음성신호처리장치
KR950013551B1 (ko) 잡음신호예측장치
KR950013554B1 (ko) 음성신호처리장치
CA1172363A (en) Continuous speech recognition method
CA2034354C (en) Signal processing device
US5930749A (en) Monitoring, identification, and selection of audio signal poles with characteristic behaviors, for separation and synthesis of signal contributions
GB2107102A (en) Speech recognition apparatus and method
KR960007842B1 (ko) 음성잡음분리장치
CA2036199C (en) Voice signal processing device
US5241649A (en) Voice recognition method
EP0459363B1 (en) Voice signal coding system
KR950013553B1 (ko) 음성신호처리장치
US5201004A (en) Speech recognition method with noise reduction and a system therefor
US5295190A (en) Method and apparatus for speech recognition using both low-order and high-order parameter analyzation
US5347612A (en) Voice recognition system and method involving registered voice patterns formed from superposition of a plurality of other voice patterns
JP3106543B2 (ja) 音声信号処理装置
JPH04230796A (ja) 音声信号処理装置
KR950013555B1 (ko) 음성신호처리장치
GB2216320A (en) Selective addition of noise to templates employed in automatic speech recognition systems
KR960007843B1 (ko) 음성신호처리장치
KR950001067B1 (ko) 음성인식장치
JP2001083978A (ja) 音声認識装置
JPH04230798A (ja) 雑音予測装置
KR950001071B1 (ko) 음성신호처리장치
JPH08146986A (ja) 音声認識装置

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

R17-X000 Change to representative recorded

St.27 status event code: A-3-3-R10-R17-oth-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

T11-X000 Administrative time limit extension requested

St.27 status event code: U-3-3-T10-T11-oth-X000

T11-X000 Administrative time limit extension requested

St.27 status event code: U-3-3-T10-T11-oth-X000

T11-X000 Administrative time limit extension requested

St.27 status event code: U-3-3-T10-T11-oth-X000

T11-X000 Administrative time limit extension requested

St.27 status event code: U-3-3-T10-T11-oth-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

T11-X000 Administrative time limit extension requested

St.27 status event code: U-3-3-T10-T11-oth-X000

T11-X000 Administrative time limit extension requested

St.27 status event code: U-3-3-T10-T11-oth-X000

T11-X000 Administrative time limit extension requested

St.27 status event code: U-3-3-T10-T11-oth-X000

T11-X000 Administrative time limit extension requested

St.27 status event code: U-3-3-T10-T11-oth-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

G160 Decision to publish patent application
PG1605 Publication of application before grant of patent

St.27 status event code: A-2-2-Q10-Q13-nap-PG1605

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 6

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 7

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 8

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 9

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 10

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 11

FPAY Annual fee payment

Payment date: 20061026

Year of fee payment: 12

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 12

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20071109

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20071109

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301