KR910020642A - 음성신호처리장치 및 음성인식장치 - Google Patents

음성신호처리장치 및 음성인식장치 Download PDF

Info

Publication number
KR910020642A
KR910020642A KR1019910008708A KR910008708A KR910020642A KR 910020642 A KR910020642 A KR 910020642A KR 1019910008708 A KR1019910008708 A KR 1019910008708A KR 910008708 A KR910008708 A KR 910008708A KR 910020642 A KR910020642 A KR 910020642A
Authority
KR
South Korea
Prior art keywords
signal
noise
peak
band
voice
Prior art date
Application number
KR1019910008708A
Other languages
English (en)
Other versions
KR950013552B1 (ko
Inventor
죠지 카네
아끼라 노하라
Original Assignee
다니이 아끼오
마쯔시다덴기산교 가부시기가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다니이 아끼오, 마쯔시다덴기산교 가부시기가이샤 filed Critical 다니이 아끼오
Publication of KR910020642A publication Critical patent/KR910020642A/ko
Priority to KR1019940026429A priority Critical patent/KR960007843B1/ko
Priority to KR94026430A priority patent/KR950001070B1/ko
Priority to KR1019940026432A priority patent/KR950001067B1/ko
Priority to KR1019940026431A priority patent/KR950001071B1/ko
Application granted granted Critical
Publication of KR950013552B1 publication Critical patent/KR950013552B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

내용 없음

Description

음성신호처리장치 및 음성인식장치
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명에 관한 제1의 실시예의 신호판별장치를 도시한 블럭도, 제2도는 본 발명에 관한 제2의 실시예의 신호판별장치를 도시한 블럭도, 제3도는 본 발명에 관한 제3의 실시예의 잡음억압장치를 도시한 블럭도.

Claims (17)

  1. 입력된 잡음섞인 음성신호의 주파수대역을 분할하는 대역분할수단과, 그 대역 분할수단의 대역분할출력이 입력되어, 켑스트럼분석을 행하는 켑스트럼수단과, 상기 켑스트럼분석수단의 켑스트럼분석결과에 의거하여 피이크를 검출하는 피이크 검출수단과, 그 피이크검출수단에 의해 검출된 피이크정보에 의거하여, 음성부분을 판별하는 음성판별수단단과, 이 음성판별수단에 의해서 판별된 음성부분정보에 의거하여, 상기 잡음섞인 음성신호에 대해서, 음성부분의 잡음을 예측하는 잡음 예측수단과, 상기 대역분할된 잡음섞인 음성신호에 대해서, 잡음예측수단에 의해서 예측된 잡음을 제거하는 캔설수단과, 그 캔설수단으로부터의 출력에 대해서 대역합성을 행하는 대역합성수단을 구비한 것을 특징으로 하는 신호판별장치.
  2. 이미 알고 있는 종류의 신호에 대해서 그 소정의 특징정보를 미리 기억하고 있는 기억수단과, 잡음섞인 신호를 입력하고, 신호부분을 판별하는 신호판별수단과, 그 신호판별수단에 의해서 판별된 신호부분에 대해서의 특징정보와 상기 기억수단의 특징정보를 비교하고, 그 신호부분의 신호종류를 검출하는 공산(Likelihood)검출수단과, 상기 신호판별수단에 의한 결과와 상기 공산검출수단에 의한 결과를 짝으로해서 출력하는 출력수단을 구비한 것을 특징으로하는 신호판별장치.
  3. 제2항에 있어서, 상기 특징정보는, 음성신호에 대해서의 켑스트럼분석결과정보이며, 상기 공산검출수단은, 상기 잡음섞인 신호에 대해서 켑스트럼분석을 행하는 켑스트럼분석수단에 의한 분석결과를 이용해서 음성신호부분의 신호종류를 검출하는것을 특징으로하는 신호판별장치.
  4. 제2항에 있어서, 잡음섞인 신호에 의거해서, 신호부분의 잡음을 예측하는 잡음예측수단을 구비하고 상기 공산검출수단은, 그 잡음예측수단에 의해서 예측된 잡음예측치도 고려해서 신호부분의 신호종류를 검출하는 것을 특징으로하는 신호판별장치.
  5. 제3항에 있어서, 잡음섞인 신호에 의거해서, 신호부분의 잡음을 예측하는 잡음예측수단을 구비하고, 상기 공산검출수단은, 그 잡음예측수단에 의해서 예측된 잡음예측치도 고려해서 신호부분의 신호종류를 검출하는 것을 특징으로하는 신호판별장치.
  6. 입력된 음성신호의 주파수대역을 분할하는 대역분할수단과, 이 대역분할수단의 대역분할출력이 입력되어, 켑스트럼분석을 행하는 켑스트럼수단과, 이 켑스트럼분석수단에 의해서 분석된 분석결과에 의거해서, 피이크주파수를 검출하는 피이크주파수검출수단과, 복수인의 사람음성의 피이크주파수를 순차출력하는 피이크주파수판별제어수단과, 상기 피이크주파수검출수단에 의해서 검출된 피이크주파수와 상기 피이크주파수 판별제어수단으로부터의 각종 피이크주파수를 비교해서 검출된 피이크 주파수가 어떤 사람의 것인지를 판별하는 피이크 주파수 판별수단과, 이 피이크주파수판별수단에 의해서 판별된 판별정보에 따라, 스위치제어신호를 출력하는 스위치제어수단과, 상기 입력된 음성신호에 입력하고, 상기 스위치제어신호에 따라, 사람별로 구별해서 음성신호를 출력하는 스위치수단을 구비한 것을 특징으로하는 신호처리장치.
  7. 제6항에 있어서, 피이크주파수검출수단으로 검출된 피이크주파수에 의거해서, 잡음구간을 산출하는 잡음구간산출수단을 또 구비하고, 상기 스위치수단은, 이 잡음구간산출수단으로부터의 잡음구간정보를 이용해서, 상기 사람별 음성신호외에, 잡음을 구별해서 출력하는 것을 특징으로하는 신호처리장치.
  8. 입력된 음성신호를 프우리에 변환하는 FFT와, 그 프우리에 변환된 신호에 대해서, 켑스트럼분석을 행하는 켑스트럼수단과, 그 켑스트럼분석수단에 의해서 분석된 분석결과에 의거해서, 피이크주파수를 검출하는 피이크주파수검출수단과, 복수인의 사람음성의 피이크주파수를 순차출력하는 피이크주파수 판별제어수단과, 상기 피이크주파수검출수단에 의해서 검출된 피이크주파수와 상기 피이크주파수판별제어수단으로부터의 각종 피이크주파수를 비교해서, 검출된 피이크주파수가 어떤 사람의 것인지를 판별하는 피이크주파수 판별수단과, 이 피이크주파수판별수단에 의해서 판별된 판별정보에 따라서, 스위치제어신호를 출력하는 스위치제어수단과, 상기 프우리에 변환된 신호에 대해서, 상기 스위치제어신호에 따라, 사람별로 구분해서 음성신호를 출력하는 디지틀스위치수단과, 그 디지틀스위치수단으로부터의 각각의 출력신호를 역프우리에 변환하는 IFFT를 구비한 것을 특징으로하는 신호처리장치.
  9. 입력된 음성신호와 주파수대역을 분할하는 대역분할수단과, 이 대역분할수단의 대역분할출력이 입력되어, 켑스트럼분석을 행하는 켑스트럼수단과, 그 대역분할출력이 입력되어 포르만트분석을 행하는 포르만트분석수단과, 그 포르만트 분석수단에 의해서 분석된 포르만트 분석결과와, 상기 켑스트럼분석수단에 의해서 분석된 켑스트럼분석결과에 의거해서, 음성의 특징을 검출하는 음성검출수단과, 복수인의 사람음성특징을 순차출력하는 음성판별제어수단과, 상기 음성출수단에 의해서, 검출된 음성특징과 상기 음성판별제어수단으로부터의 각종 특징을 비교해서, 각종 특징을 비교해서, 검출된 음성특징이 어떤 사람의 것인지를 판별하는 음성판별수단과, 이 음성판별수단에 의해서 판별된 판별정보에 따라, 스위치제어신호를 출력하는 스위치제어수단과, 상기 입력된 음성신호를 입력하고, 상기 스위치제어신호에 따라, 사람별로 구별해서 음성신호를 출력하는 스위치수단을 구비한 것을 특징으로하는 신호처리장치.
  10. 입력된 음성신호의 주파수대역을 분할하는 대역분할수단과, 이 대역분할수단의 대역분할출력이 입력되어, 켑스트럼분석을 행하는 켑스트럼수단과, 그 켑스트럼분석수단에 의해서 분석된 분석결과에 의거해서, 피이크주파수를 검출하는 피이크주파수검출수단과, 복수의 사람음성의 피이크주파수를 순차출력하는 피이크주파수판별제어수단과, 상기 피이크주차수검출수단에 의해서 검출된 피이크주파수와 상기 피이크주파수판별제어수단으로부터의 각종 피이크주파수를 비교해서, 검출된 피이크주파수가 어떤사람의 것인인지를 판별하는 피이크주파수판별수단과, 이 피이크주파수판별수단에 의해서 판별된 판별정보에 따라, 빗살형필터주파수제어신호를 출력하는 빗살형필터주파수제어수단과, 상기 대역분할수단에 의해서 대역분할된 신호를 입력하고, 상기 빗살형필터주파수제어신호에 따라, 판별된 음성신호만 통과시키도록, 적절하게 그 필터링기능을 조정해서 필터링하는 빗살형필터와, 그 빗살형필터의 출력에 대해서, 대역합성을 행하는 대역합성수단을 구비한 것을 특징으로하는 신호처리장치.
  11. 입력된 음성신호의 주파수대역을 분할하는 대역분할수단과, 그 대역분할수단의 대역분할출력이 입력되어, 켑스트럼분석을 행하는 켑스트럼수단과, 그 켑스트럼분석수단에 의해서 분석된 분석결과에 의거해서, 피이크주파수를 검출하는 피이크주파수검출수단과 복수인의 사람음성의 피이크주파수를 순차출력하는 피이크주파수판별제어수단과, 상기 피이크주파수검출수단에 의해서, 검출된 피이크주파수와 상기 피이크주파수 판별제어 수단으로부터의 각종 피이크주파수를 비교해서, 검출된 피이크주파수가 어떤 사람의 것인지를 판별하는 피이크주파수판별수단과, 이 피이크주파수판별수단에 의해서 판별된 판별정보에 따라, 빗살형필터주파수제어신호를 출력하는 빗살형필터주파수제어수단과, 상기 켑스트럼분석수단의 켑스트럼분석결과에 의거하여 피이크를 검출하는 피이크검출수단과, 그 피이크검출수단에 의해서 검출된 피이크정보에 의거하여, 음성부분을 판별하는 음성판별수단과, 이 음성판별수단에 의해서 판별된 은성부분정보에 의거하여, 상기 잡음섞인 음성신호에 대해서, 음성부분의 잡음을 예측하는 잡음예측수단과, 상기 대역분할된 잡음섞인 음성신호에 대해서, 잡음예측수단에 의해서 예측된 잡음을 제거하는 캔설수단과, 그 잡음캔설된 신호를 입력하고, 상기 빗살형필터주파수제어신호에 따라, 판별된 음성신호만 통과시키도록, 적절하게 그 필터링기능을 조정해서 필터링하는 빗살형필터와, 그 빗살형필터의 출력에 대해서, 대역합성을 행하는 대역합성수단을 구비한 것을 특징으로하는 신호처리장치.
  12. 입력된 잡음섞인 음성신호의 주파수대역을 분할하는 대역분할수단과, 그 대역분할수단의 대역분할출력이 입력되어, 켑스트럼분석을 행하는 켑스트럼수단과, 그 켑스트럼분석수단에 의해서 분석된 분석결과에 의거해서, 피이크주파수를 검출하는 피이크주파수검출수단과, 상기 켑스트럼분석결과에 의거해서, 포르만트분석을 행하는 포르만트분석수단과, 상기 검출된 피이크주파수와 상기 포로만트정보에 의거하여 음성특징을 검출하는 음성검출수단과, 복수인의 사람음성의 특징으로 순차출력하는 음성판별제어수단과, 상기 음성검출수단에 의해서 검출된 특징과 상기 음성판별제어수단으로부터의 각종 특징을 비교해서, 검출된 음성특징이 어떤사람의 것인지를 판별하는 음성판별수단과, 이 음성판별수단에 의해서 판별된 판별정보에 따라, 빗살형필터주파수 제어신호를 출력하는 빗살형필터주파수제어수단과, 상기 켑스트럼분석수단의 켑스트럼분석결과에 의거하여 피이크를 검출하는 피이크검출수단과, 그 피이크검출수단에 의해서 검출된 피이크정보에 의거하여, 음성부분을 판별하는 음성판별수단과, 이 음성판별수단에 의해서 판별된 음성부분정보에 의거하여, 상기 잡음섞인 음성신호에 대해서, 음성부분의 잡음을 예측하는 잡음예측수단과, 상기 대역분할된 잡음섞인 음성신호에 대해서, 잡음예측수단에 의해서 예측된 잡음을 제거하는 캔설수단과, 이 잡음캔설된 신호를 입력하고, 상기 빗살형필터주파수제어신호에 따라, 판별된 음성신호만 통과시키도록, 적절하게 그 필터링기능을 조정해서 필터링하는 빗살형필터와, 그 빗살형필터의 출력에 대해서, 대역합성을 행하는 대역합성수단을 구비한 것을 특징으로하는 신호처리장치.
  13. 입력된 잡음섞인 음성신호의 주파수대역을 분할하는 대역분할수단과, 그 대역분할수단의 대역분할출력이 입력되어, 켑스트럼분석을 행하는 켑스트럼수단과, 그 켑스트럼분석수단에 의해서 분석된 분석결과에 의거해서, 피이크주파수를 검출하는 피이크주파수검출수단과, 복수인의 사람음성의 피이크주파수를 순차출력하는 피이크주파수판별제어수단과, 상기 피이크주파수검출수단에 의해서, 검출된 피이크주파수와 상기 피이크주파수 판별제어 수단으로부터의 각종 피이크주파수를 비교해서, 검출된 피이크주파수가 어떤 사람의 것인지를 판별하는 피이크주파수판별수단과, 이 피이크주파수판별수단에 의해서 판별된 판별정보에 따라, 스위치제어신호를 출력하는 스위치제어수단과, 상기 켑스트럼분석수단의 켑스트럼분석결과에 의거하여 피이크를 검출하는 피이크검출수단과, 그 피이크검출수단에 의해서 검출된 피이크정보에 의거하여, 음성부분을 판별하는 음성판별수단과, 이 음성판별수단에 의해서 판별된 음성부분정보에 의거하여, 상기 잡음섞인 음성신호에 대해서, 음성부분의 잡음을 예측하는 잡음예측수단과, 상기 대역분할된 잡음섞인 음성신호에 대해서, 잡음예측수단에 의해서 예측된 잡음을 제거하는 캔설수단과, 그 캔설수단으로부터의 출력에 대해서 대역합성을 행하는 대역합성수단과, 그 대역합성된 신호를 입력하고, 상기 스위치제어신호에 따라, 사람별로 구별해서 음성신호를 출력하는 스위치수단을 구비한 것을 특징으로하는 신호처리장치.
  14. 입력된 잡음섞인 음성신호의 주파수대역을 분할하는 대역분할수단과, 그 대역분할수단의 대역분할출력이 입력되어, 켑스트럼분석을 행하는 켑스트럼수단과, 그 켑스트럼분석수단에 의해서 분석된 분석결과에 의거해서, 피이크주파수를 검출하는 피이크주파수검출수단과, 상기 켑스트럼분석결과에 의거해서, 포르만트분석을 행하는 포르만트분석수단과, 상기 검출된 피이크주파수와 상기 포르만트정보에 의거하여 음성특징을 검출하는 음성검출수단과, 복수인의 사람음성의 특징을 순차출력하는 음성판별제어수단과, 상기 음성검출수단에 의해서 검출된 특징과 상기 음성판별제어수단으로부터의 각종 특징을 비교해서, 검출된 음성특징이 어떤사람의 것인지를 판별하는 음성판별수단과, 이 음성판별수단에 의해서 판별된 판별정보에 따라, 스위치제어신호를 출력하는 스위치제어수단과, 상기 켑스트럼분석수단의 켑스트럼분석결과에 의거하여 피이크를 검출하는 피이크검출수단과, 그 피이크검출수단에 의해서 검출된 피이크정보에 의거하여, 음성부분을 판별하는 음성판별수단과, 이 음성판별수단에 의해서 판별된 음성부분정보에 의거하여, 상기 잡음섞인 음성신호에 대해서, 음성부분의 잡음을 예측하는 잡음예측수단과, 상기 대역분할된 잡음섞인 음성신호에 대해서, 잡음예측수단에 의해서 예측된 잡음을 제거하는 캔설수단과, 그 캔설수단으로부터의 출력에 대해서 상기 스위치제어신호에 따라, 사람별로 구별해서 음성신호를 출력하는 스위치수단과, 그 스위치 수단으로부터의 신호에 대해서 대역합성을 행하는 대역합성수단을 구비한 것을 특징으로하는 신호처리장치.
  15. 미리 이미알고 있는 사람의 음성신호가 대역분할되어, 켑스트럼분석되어서 얻게된 피이크주파수를 기억한 제1의 기억수단과, 미지의 잡음섞인 음성입력신호를 대역분할하는 대역분할수단과, 그 대역분할수단의 출력을 켑스트럼분석하는 켑스트럼분석수단과, 그 켑스트럼분석수단의 켑스트럼분석출력에 있어서의 피이크주파수를 검출하는 피이크주파수검출수단과, 상기 피이크주파수 검출수단의 피이크검출정보와 상기 제1기억수단에 기억된 각 피이크주파수를 비교하고, 그 미지의 음성신호가 누구의 것인지를 판단하는 제1비교수단과, 미리 각종음성의 음성특징을 기억한 제2의 기억수단과, 상기 잡음섞인 음성신호부터 음성부분을 잘라내는 음성 잘라내기수단과, 잘라낸 음성의 특징을 추출하는 특정추출수단과, 그 특징추출수단에 의해서 추출된 음성특징과 상기 제2기억수단에 기억된 음성특징을 비교하고, 음성을 인식하는 제2비교수단과, 상기 제1비교수단의 비교결과와, 제2비교수단의 비교결과에 의거하여, 소정의 처리를 행해서 출력하는 비교합성수단을 구비한 것을 특징으로하는 음성인식장치.
  16. 제15항에 있어서, 켑스트럼수단에 의한 켑스트럼분석결과를 이용해서 음성부분을 판별하는 음성판별수단과, 그 음성판별수단에 의한 음성부분정보를 이용해서, 상기 대역분할된 신호에 대해서 , 음성부분의 잡음을 예측하는 잡음예측수단과, 상기 대역분할된 신호에 대해서, 그 예측된 잡음을 제거하는 캔설수단과, 그 캔설수단의 출력을 대역합성하는 대역합성수단을 구비하고, 상기 음성잘라내기수단은, 이 대역합성 수단에 의해서 합성된 신호에 대해서 잘라내기를 행하는 것을 특징으로하는 음성인식장치.
  17. ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019910008708A 1990-05-28 1991-05-28 음성신호처리장치 KR950013552B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1019940026429A KR960007843B1 (ko) 1990-05-28 1994-10-15 음성신호처리장치
KR94026430A KR950001070B1 (en) 1990-05-28 1994-10-15 Speech signal processing device
KR1019940026432A KR950001067B1 (ko) 1990-05-28 1994-10-15 음성인식장치
KR1019940026431A KR950001071B1 (ko) 1990-05-28 1994-10-15 음성신호처리장치

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
JP13805390 1990-05-28
JP13806290 1990-05-28
JP13806190 1990-05-28
JP2-138067 1990-05-28
JP13806390 1990-05-28
JP2-138061 1990-05-28
JP13806790 1990-05-28
JP2-138063 1990-05-28
JP2-138053 1990-05-28
JP2-138062 1990-05-28

Related Child Applications (2)

Application Number Title Priority Date Filing Date
KR1019940026431A Division KR950001071B1 (ko) 1990-05-28 1994-10-15 음성신호처리장치
KR1019940026429A Division KR960007843B1 (ko) 1990-05-28 1994-10-15 음성신호처리장치

Publications (2)

Publication Number Publication Date
KR910020642A true KR910020642A (ko) 1991-12-20
KR950013552B1 KR950013552B1 (ko) 1995-11-08

Family

ID=27527503

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019910008708A KR950013552B1 (ko) 1990-05-28 1991-05-28 음성신호처리장치

Country Status (4)

Country Link
US (4) US5355431A (ko)
EP (5) EP0763813B1 (ko)
KR (1) KR950013552B1 (ko)
DE (5) DE69132749T2 (ko)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1272653B (it) * 1993-09-20 1997-06-26 Alcatel Italia Metodo di riduzione del rumore, in particolare per riconoscimento automatico del parlato, e filtro atto ad implementare lo stesso
US5586126A (en) * 1993-12-30 1996-12-17 Yoder; John Sample amplitude error detection and correction apparatus and method for use with a low information content signal
DE19524847C1 (de) * 1995-07-07 1997-02-13 Siemens Ag Vorrichtung zur Verbesserung gestörter Sprachsignale
US5687243A (en) * 1995-09-29 1997-11-11 Motorola, Inc. Noise suppression apparatus and method
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US5822370A (en) * 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
JP3006677B2 (ja) * 1996-10-28 2000-02-07 日本電気株式会社 音声認識装置
CN102129862B (zh) * 1996-11-07 2013-05-29 松下电器产业株式会社 降噪装置及包括降噪装置的声音编码装置
US5946649A (en) * 1997-04-16 1999-08-31 Technology Research Association Of Medical Welfare Apparatus Esophageal speech injection noise detection and rejection
EP1062659B1 (de) 1998-03-19 2002-01-30 Siemens Aktiengesellschaft Verfahren und vorrichtung zur bearbeitung eines tonsignals
US7415120B1 (en) 1998-04-14 2008-08-19 Akiba Electronics Institute Llc User adjustable volume control that accommodates hearing
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
EP1076928B1 (en) * 1998-04-14 2010-06-23 Hearing Enhancement Company, Llc. User adjustable volume control that accommodates hearing
AR024353A1 (es) 1999-06-15 2002-10-02 He Chunhong Audifono y equipo auxiliar interactivo con relacion de voz a audio remanente
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
US6349278B1 (en) * 1999-08-04 2002-02-19 Ericsson Inc. Soft decision signal estimation
US6366880B1 (en) * 1999-11-30 2002-04-02 Motorola, Inc. Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
US7266501B2 (en) 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US20040096065A1 (en) * 2000-05-26 2004-05-20 Vaudrey Michael A. Voice-to-remaining audio (VRA) interactive center channel downmix
US6990061B2 (en) * 2000-05-31 2006-01-24 Interuniversitair Micro-Elektronica Centrum Method and apparatus for channel estimation
WO2002029780A2 (en) * 2000-10-04 2002-04-11 Clarity, Llc Speech detection with source separation
US7177808B2 (en) * 2000-11-29 2007-02-13 The United States Of America As Represented By The Secretary Of The Air Force Method for improving speaker identification by determining usable speech
GB2375027B (en) * 2001-04-24 2003-05-28 Motorola Inc Processing speech signals
US6591991B2 (en) 2001-08-06 2003-07-15 Luce Belle Collapsible tire stand
US7571095B2 (en) * 2001-08-15 2009-08-04 Sri International Method and apparatus for recognizing speech in a noisy environment
JP3673507B2 (ja) * 2002-05-16 2005-07-20 独立行政法人科学技術振興機構 音声波形の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、音声信号の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、ならびに擬似音節核抽出装置およびプログラム
US7013272B2 (en) * 2002-08-14 2006-03-14 Motorola, Inc. Amplitude masking of spectra for speech recognition method and apparatus
JP2004297273A (ja) * 2003-03-26 2004-10-21 Kenwood Corp 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
NO324318B1 (no) * 2005-04-29 2007-09-24 Tandberg Telecom As Fremgangsmate og anordning for stoydeteksjon.
JP4246755B2 (ja) * 2006-05-30 2009-04-02 株式会社エヌ・ティ・ティ・ドコモ 受信信号周波数帯域検出器
JP4757158B2 (ja) * 2006-09-20 2011-08-24 富士通株式会社 音信号処理方法、音信号処理装置及びコンピュータプログラム
US7813924B2 (en) * 2007-04-10 2010-10-12 Nokia Corporation Voice conversion training and data collection
US20100189283A1 (en) * 2007-07-03 2010-07-29 Pioneer Corporation Tone emphasizing device, tone emphasizing method, tone emphasizing program, and recording medium
JP4660578B2 (ja) * 2008-08-29 2011-03-30 株式会社東芝 信号補正装置
US8442831B2 (en) * 2008-10-31 2013-05-14 International Business Machines Corporation Sound envelope deconstruction to identify words in continuous speech
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
US20140025374A1 (en) * 2012-07-22 2014-01-23 Xia Lou Speech enhancement to improve speech intelligibility and automatic speech recognition
WO2015005914A1 (en) * 2013-07-10 2015-01-15 Nuance Communications, Inc. Methods and apparatus for dynamic low frequency noise suppression
US10121488B1 (en) * 2015-02-23 2018-11-06 Sprint Communications Company L.P. Optimizing call quality using vocal frequency fingerprints to filter voice calls
CN107274895B (zh) * 2017-08-18 2020-04-17 京东方科技集团股份有限公司 一种语音识别设备及方法
JP7404664B2 (ja) * 2019-06-07 2023-12-26 ヤマハ株式会社 音声処理装置及び音声処理方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5272504A (en) * 1975-12-15 1977-06-17 Fuji Xerox Co Ltd Device for recognizing word audio
GB1541041A (en) * 1976-04-30 1979-02-21 Int Computers Ltd Sound analysing apparatus
GB2104218B (en) * 1981-07-28 1984-08-30 Ferranti Ltd Detecting harmonically-rich acoustic sources
JPS59124397A (ja) 1982-12-29 1984-07-18 松下電器産業株式会社 無音区間検出回路
JPS59131997A (ja) 1983-01-19 1984-07-28 松下電器産業株式会社 音声の有声・無声判定方法
EP0128298B1 (en) * 1983-04-11 1990-07-04 Nec Corporation Orthogonal transformer and apparatus operational thereby
DE3689035T2 (de) * 1985-07-01 1994-01-20 Motorola Inc Rauschminderungssystem.
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4852181A (en) * 1985-09-26 1989-07-25 Oki Electric Industry Co., Ltd. Speech recognition for recognizing the catagory of an input speech pattern
US4827516A (en) * 1985-10-16 1989-05-02 Toppan Printing Co., Ltd. Method of analyzing input speech and speech analysis apparatus therefor
EP0255529A4 (en) * 1986-01-06 1988-06-08 Motorola Inc FRAMEWORK COMPARISON PROCEDURE FOR RECOGNIZING WORDS IN A LARGE NOISE ENVIRONMENT.
GB8608289D0 (en) * 1986-04-04 1986-05-08 Pa Consulting Services Noise compensation in speech recognition
US4837830A (en) * 1987-01-16 1989-06-06 Itt Defense Communications, A Division Of Itt Corporation Multiple parameter speaker recognition system and methods
US4989249A (en) * 1987-05-29 1991-01-29 Sanyo Electric Co., Ltd. Method of feature determination and extraction and recognition of voice and apparatus therefore
US5036539A (en) * 1989-07-06 1991-07-30 Itt Corporation Real-time speech processing development system
EP0483174B1 (en) * 1989-07-11 1995-11-22 Cheyenne Advanced Technology Limited A method of operating a data processing system
AU633673B2 (en) * 1990-01-18 1993-02-04 Matsushita Electric Industrial Co., Ltd. Signal processing device

Also Published As

Publication number Publication date
KR950013552B1 (ko) 1995-11-08
DE69132645T2 (de) 2002-04-18
DE69132749D1 (de) 2001-10-31
EP0763810B1 (en) 2001-09-26
EP0763812B1 (en) 2001-06-20
DE69131739D1 (de) 1999-12-02
EP0763812A1 (en) 1997-03-19
DE69132659T2 (de) 2002-05-02
DE69132645D1 (de) 2001-07-26
EP0459382A2 (en) 1991-12-04
DE69132659D1 (de) 2001-08-16
EP0763811B1 (en) 2001-06-20
EP0763810A1 (en) 1997-03-19
DE69132644T2 (de) 2002-05-29
EP0459382B1 (en) 1999-10-27
US5355431A (en) 1994-10-11
DE69132644D1 (de) 2001-07-26
EP0763813B1 (en) 2001-07-11
US5617505A (en) 1997-04-01
US5621850A (en) 1997-04-15
DE69131739T2 (de) 2001-10-04
DE69132749T2 (de) 2002-07-04
EP0763811A1 (en) 1997-03-19
US5630015A (en) 1997-05-13
EP0459382A3 (en) 1993-03-03
EP0763813A1 (en) 1997-03-19

Similar Documents

Publication Publication Date Title
KR910020642A (ko) 음성신호처리장치 및 음성인식장치
KR950013551B1 (ko) 잡음신호예측장치
JP4065314B2 (ja) 対象音分析装置、対象音分析方法および対象音分析プログラム
KR950013554B1 (ko) 음성신호처리장치
WO2001016937A1 (en) System and method for classification of sound sources
KR910015109A (ko) 신호처리장치
Venter et al. Automatic detection of African elephant (Loxodonta africana) infrasonic vocalisations from recordings
KR910020643A (ko) 음성신호처리장치
KR960007842B1 (ko) 음성잡음분리장치
KR100735343B1 (ko) 음성신호의 피치 정보 추출장치 및 방법
KR910020645A (ko) 음성신호부호화장치
KR910015962A (ko) 음성신호처리장치
US5483617A (en) Elimination of feature distortions caused by analysis of waveforms
US5487129A (en) Speech pattern matching in non-white noise
Loweimi et al. Speech acoustic modelling using raw source and filter components
US20030046069A1 (en) Noise reduction system and method
JPH04230796A (ja) 音声信号処理装置
JPH04230800A (ja) 音声信号処理装置
JP4537821B2 (ja) オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体
JP2968976B2 (ja) 音声認識装置
KR100539176B1 (ko) 음악적 특징 추출 방법 및 장치
Guntur Feature extraction algorithms for speaker recognition system and fuzzy logic
KR960007843B1 (ko) 음성신호처리장치
KR950001067B1 (ko) 음성인식장치
JPH06348293A (ja) 音声情報分析装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20061026

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee