KR960030075A - 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법 및 시스템 - Google Patents

유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법 및 시스템 Download PDF

Info

Publication number
KR960030075A
KR960030075A KR1019960000467A KR19960000467A KR960030075A KR 960030075 A KR960030075 A KR 960030075A KR 1019960000467 A KR1019960000467 A KR 1019960000467A KR 19960000467 A KR19960000467 A KR 19960000467A KR 960030075 A KR960030075 A KR 960030075A
Authority
KR
South Korea
Prior art keywords
speech
parameter
initial
signal
determining
Prior art date
Application number
KR1019960000467A
Other languages
English (en)
Other versions
KR100388387B1 (ko
Inventor
웨인 그리핀 대니엘
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Publication of KR960030075A publication Critical patent/KR960030075A/ko
Application granted granted Critical
Publication of KR100388387B1 publication Critical patent/KR100388387B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • G10L2025/937Signal energy in various frequency bands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Radio Relay Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

디지탈화된 음성 신호에 대해 유기 파라미터를 결정하기 위한 디지탈화된 음성 신호의 분석에 의해 음성을 인코딩하는 방법은 적어도 두개의 주파수 대역으로 디지탈화된 음성 신호를 분할하는 방법과; 변형된 주파수 대역 신호를 실행함에 의해 제1초기 유기 파라미터를 결정하며, 변형된 주파수 대역 신호를 이용하여 제1초기 유기 파라미터를 결정하는 방법과; 제1방법과 다른 방법을 이용하여 제2초기 유기 파라미터를 결정하는 방법; 및 디지탈화된 음성 신호에 대해 유기 파라미터를 결정하기 위한 제1 및 제2초기 유기 파라미터를 이용하는 방법을 포함하며, 음성을 인코딩 하는데 유용한 방법이다.
합성된 음성은 위성 음성 통신으로써 적용되어지기 위한 유용한 각종 비트율에서 높은 질의 음성을 발생하기 위한 본 발명에 기초한 추정된 파라미터를 이용한다.

Description

유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법 및 시스템
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 음성화/비음성화 신호 주파수 대역 중 어떤 것인지를 결정하기 ㅜ이한 시스템 블럭도.

Claims (42)

  1. 디지탈화된 음성 신호에 대한 유기 파라미터의 측정을 위한 디지탈화된 음성 신호 분석 방법으로서, 디지탈화된 음성신호를 하나 또는 그 이상의 주파수 대역신호로 분할하는 단계; 적어도 하나의 주파수 대역 신호를 만들어내기 위해서 적어도 하나의 주파수 대역 신호에 대해 비선형 오퍼레이션을 실행하는 과정과 적어도 하나의 변형된 주파수 대역 신호를 이용하여 제1초기 유리 파라미터를 결정하는 과정을 포함하는 제1방법을 사용하여 제1초기 유기 파라미터를 결정하는 단계; 상기 제1방법과 상기한 제2방법을 사용하여 적어도 제2초기 유기 파라미터를 결정하는 단계; 및 디지탈화된 음성 신호에 대한 유기 파라미터를 결정하기 위해 제1 및 적어도 제2초기 유기 파라미터를 사용하는 단계를 포함하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법.
  2. 제1항에 있어서, 상기 결정 및 사용하는 단계는 시간의 정규화된 간격으로 수행되어짐을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법.
  3. 제1항에 있어서, 상기 디지탈화된 음성 신호가 음성을 코드화하는 단계로 분석되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법.
  4. 제1항에 있어서, 상기 유기 파라미터는 적어도 하나의 주파수 대역에 대한 음성화/비음성화 파라미터를 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법.
  5. 제4항에 있어서, 상기 방법이 디지탈화된 음성 신호에 대한 기본 주파수를 결정하는 단계를 추가로 포함하는 것을 특징으로 하는 유기 파라미터 결정을 위한 디지탈화된 음성 신호 분석방법.
  6. 제4항에 있어서, 상기 제1초기 유기 파라미터는 적어도 하나의 변형된 주파수 대역신호에 대한 제1음성화/비음성화 파라미터를 포함하며, 제1결정 단계를 변형된 주파수 대역 신호의 음성 에너지와 변형된 주파수 대역 신호의 전체 에너지를 비교하므로써 제1음성화/비음성화 파라미터를 결정하는 과정을 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법.
  7. 제6항에 있어서, 상기 변형된 주파수 대역 신호의 음성 에너지는 디지탈화된 음성 신호에 대해 평가된 기본 주파수와 관련된 에너지와 일치함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  8. 제6항에 있어서, 상기 변형된 주파수 대역 신호의 음성 에너지는 디지탈화된 음성 신호에 대해 평가된 피치주기와 관련된 에너지와 일치함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  9. 제6항에 있어서, 상기 제2초기 유기 파라미터는 적어도 하나의 주파수 대역 신호에 대한 음성화/비음성화 파라미터를 포함하며, 상기 제2결정 단계는 적어도 하나의 주파수 대역 신호에서의 사인파 에너지와 적어도 하나의 주파수 대역 신호에서의 전체 에너지를 비교함으로써 제2음성화/비음성화 파라미터를 결정하는 과정을 포함하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  10. 제6항에 있어서, 상기 제2초기 유기 파라미터는 적어도 하나의 주파수 대역 신호에 대한 제2음성화/비음성화 파라미터를 포함하며, 상기 제2결정 단계는 적어도 하나의 주파수 대역 신호를 자동적으로 상관시킴으로써 제2음성화/비음성화 파라미터를 결정하는 과정을 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  11. 제4항에 있어서, 상기 음성화/비음성화 파라미터를 연속적인 범위 이상으로 변화하는 값을 가짐을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  12. 제1항에 있어서, 상기 사용하는 단계는 제1초기 유기 파라미터가 제2초기 유기 파라미터보다 맞을 확률이 더 높은 경우에 디지탈화된 음성 신호에 대한 유기 파라미터를 결정함에 있어서 제2초기 유기 파라미터를 능가하여 제1초기 유기 파라미터를 강조함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  13. 제1항에 있어서, 상기 방법이 평활된 유기 파라미터를 산출하기 위한 유기 파라미터의 평활 단계를 추가로 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  14. 제1항의 방법을 이용하여 평가된 유기 파라미터를 음성의 합성방법으로 이용함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  15. 디지탈화된 음성 신호에 대한 유기 파라미터의 결정을 위한 디지탈화된 음성신호의 분석방법으로서, 디지탈화된 음성 신호로부터 초기 유기 파라미터를 결정하는 단계; 및 유기 파라미터의 산출을 위해 초기 유기 파라미터를 평활하는 단계를 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  16. 제15항에 있어서, 상기 디지탈화된 음성 신호가 음성을 코드화하는 단계로 분석되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  17. 제15항에 있어서, 상기 초기 유기 파라미터는 적어도 하나의 주파수 대역에 대한 초기 음성화/비음성화 파라미터를 포함하며, 상기 유기 파라미터는 적어도 하나의 주파수 대역에 대한 음성화/비음성화 파라미터를 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  18. 제17항에 있어서, 상기 유기 파라미터는 기본 주파수를 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  19. 제17항에 있어서, 상기 평활 단계는 시간 가까운 음성화/비음성화 파라미터가 음성화될 때 음성화/비음성화 파라미터를 초기 음성화/비음성화 파라미터 보다 더 음성화되도록 만드는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  20. 제17항에 있어서, 상기 평활 단계는 주파수 가까운 음성화/비음성화 파라미터가 음성화될 때 음성화/비음성화 파라미터를 초기 음성화/비음성화 파라미터보다 더 음성화되도록 만드는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  21. 제17항에 있어서, 상기 평활 단계는 시간 및 주파수 상으로 가까운 음성화/비음성화 파라미터가 음성화될 때 평활된 음성화/비음성화 파라미터를 초기 음성화/비음성화 파라미터 보다 더 음성화되도록 만드는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  22. 제17항에 있어서, 상기 음성화/비음성화 파라미터가 연속적인 범위 이상으로 변화하는 값을 갖도록 허용되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  23. 제15항에 있어서, 상기 평활 단계가 시간 함수로서 수행되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  24. 제15항에 있어서, 상기 평활 단계가 주파수 함수로서 수행되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  25. 제15항에 있어서, 상기 평활 단계가 시간과 주파수 양자의 함수로서 수행되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  26. 제15항의 방법을 이용하여 평가된 유기 파라미터를 음성의 합성방법에 이용함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  27. 디지탈화된 음성 신호에 대한 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석 방법으로서, 디지탈화된 음성 신호에 대한 기본 주파수를 평가하는 단계; 제1초기 음성화/비음성화 파라미터를 산출하기 위해 평가된 기본 주파수를 사용하여 음성화/비음성화 함수를 사정하는 단계; 적어도 하나의 다른 초기 음성화/비음성화 파라미터를 산출하기 위해 평가된 기본 주파수로부터 유래된 적어도 하나의 다른 주파수를 사용하여 음성화/비음성화 함수를 사정하는 단계; 및 음성화/비음성화 파라미터를 산출하기 위하여 제1 및 적어도 하나의 다른 초기 음성화/비음성화 파라미터를 결합시키는 단계를 포함함을 특징으로 하는 유기 파라미터의 결정을위한 디지탈화된 음성 신호의 분석방법.
  28. 제27항에 있어서, 상기 적어도 하나의 다른 주파수가 상기 평가된 기본 주파수의 배수나 약수로서 평가된 기본 주파수로부터 유도됨을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  29. 제27항에 있어서, 상기 디지탈화된 음성 신호는 음성을 코드화하는 단계로 분석되어짐을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  30. 제27항의 방법을 이용하여 평가된 유기 파라미터를 음성의 합성방법에 이용함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  31. 제27항에 있어서, 상기 결합 단계가 제1초기 음성화/비음성화 파라미터가 디지탈화된 음성 신호가 제2초기 음성화/비음성화 파라미터 보다 더 음성화된 것을 나타내는 경우에, 음성화/비음성화 파라미터로서 제1초기 음성화/비음성화 파라미터를 선택하는 과정을 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  32. 디지탈화된 음성 신호에 대한 기본 주파수 평가를 결정하기 위한 디지탈화된 음성 신호의 분석방법으로서, 이전의 기본 주파수 추정값으로부터 예측되어진 기본 주파수 측정값을 결정하는 단계; 초기 기본 주파수 추정값을 결정하는 단계; 첫번째 에러 함수 값을 산출하기 위하여 초기 기본 주파수 추정값에서 에러 함수를 구하는 단계; 적어도 하나의 다른 에러 함수 값을 산출하기 위하여 초기 기본 주파수 측정값으로부터 유래된 적어도 하나의 다른 주파수에서 에러 함수를 구하는 단계; 및 예측 기본 주파수 추정값, 초기 기본 주파수 추정값, 제1에서 함수값, 및 적어도 하나의 다른 에러 함수 값을 이용하여 기본 주파수 추정값을 선택하는 단계를 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  33. 제32항에 있어서, 상기 적어도 하나의 다른 주파수가 상기 추정된 기본 주파수의 배수 및 약수로서 상기 추정된 기본 주파수로부터 유래되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  34. 제32항에 있어서, 상기 예측 기본 주파수가 이전의 예측 기본 주파수에 델타 함수를 더함으로써 결정되어짐을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  35. 제34항에 있어서, 상기 델타 함수는 이전에 제1 및 적어도 하나의 다른 에러 함수값, 이전의 예측 기본 주파수 및, 이전의 델타 요소로부터 결정되어짐을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  36. 제32항의 방법을 이용하여 평가된 기본 주파수를 음성의 합성방법에 이용함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
  37. 디지탈화된 음성 신호에 대한 유기 파라미터를 결정하기 위한 디지탈화된 음성 신호 분석시스템으로서, 디지탈화된 음성 신호를 하나 이상의 주파수 대역으로 분할하는 수단; 적어도 하나의 변형된 주파수 대역 신호를 형성하기 위해 적어도 하나의 주파수 대역 신호들에 대한 비선형 수행을 실행하는 과정과, 적어도 하나의 변형된 주파수 대역 신호를 사용하여 제1초기 유기 파라미터를 결정하는 과정을 포함하는 첫번째 방법을 이용하여 제1초기 유기 파라미터를 결정하는 수단; 상기 첫번째 방법과 다른 제2방법을 이용하여 제2초기 유기 파라미터를 결정하는 수단; 및 디지탈화된 음성 신호에 대한 유기 파라미터를 결정하기 위해 제1 및 제2초기 유기 파라미터를 사용하는 수단을 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석 시스템.
  38. 디지탈화된 음성 신호에 대한 유기 파라미터를 결정하기 위한 디지탈화된 음성 신호 분석을 위한 시스템으로서, 디지탈화된 음성 신호로부터 초기 유기 파라미터를 결정하는 수단; 유기 파라미터를 산출하기 위해 초기 유기 파라미터를 평활하는 수단을 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석 시스템.
  39. 디지탈화된 음성 신호에 대해 변형된 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석 시스템으로서, 디지탈화된 음성 신호에 대해 기본 주파수를 추정하는 수단; 제1초기 음성화/비음성화 파라미터를 산출하기 위해 추정된 기본 주파수를 이용하여 음성화/비음성화 함수를 구하는 수단; 제2초기 음성화/비음성화 파라미터를 산출하기 위해 추정된 기본 주파수로부터 유도된 다른 주파수를 이용하여 음성화/비음성화 함수를 구하는 수단; 및 음성화/비음성화 파라미터를 산출하기 위해 제1 및 제2초기 음성화/비음성화 파라미터를 결합시키는 수단을 포함하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석 시스템.
  40. 디지탈화된 음성 신호에 대해 기본 주파수 추정값을 결정하기 위한 디지탈화된 음성 신호 분석 시스템으로서, 이전의 기본 주파수 추정값으로부터 예측 기본 주파수 추정값을 결정하는 수단; 초기 기본 주파수 추정값을 결정하는 수단; 제1에러 함수값을 산출하기 위해 초기 주파수 추정값에서 에러 함수를 구하는 수단; 제2에러 함수값을 산출하기 위해 초기 기본 주파수 추정값으로부터 유도된 적어도 하나의 다른 주파수에서 에러 함수를 구하는 수단; 및 예측 기본 주파수 추정값, 초시 기본 주파수 추정값, 제1에러 함수값 및, 제2에서함수값을 이용하여 기본 주파수 추정값을 선정하는 수단을 포함하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석 시스템.
  41. 디지탈화된 음성 신호에 대해 음성화/비음성화 함수를 결정하기 위한 디지탈화된 음성 신호 분석방법으로서, 디지탈화된 음성 신호를 적어도 두개의 주파수 대역 신호로 분할하는 단계; 제1방법을 사용하여 적어도 두개의 주파수 대역 신호에 대한 제1초기 음성화/비음성화 함수를 결정하는 단계; 상기 제1방법과 다른 제2방법을 이용하여 적어도 두개의 주파수 대역 신호에 대한 제2초기 음성화/비음성화 함수를 결정하는 단계; 및 적어도 두개의 주파수 대역 신호에 대한 음성화/비음성화 함수를 결정하기 위해 제1 및 제2초기 유기 파라미터를 이용하는 단계를 포함하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석 방법.
  42. 제1항에 있어서, 제2방법중 적어도 하나는 상기 비선형 수행의 실행없이 적어도 하나의 주파수 대역신호를 이용하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019960000467A 1995-01-12 1996-01-11 여기파라미터의결정을위한디지탈화된음성신호의분석방법및시스템 KR100388387B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37174395A 1995-01-12 1995-01-12
US08/371,743 1995-01-12
US08/371743 1995-01-12

Publications (2)

Publication Number Publication Date
KR960030075A true KR960030075A (ko) 1996-08-17
KR100388387B1 KR100388387B1 (ko) 2003-11-01

Family

ID=23465238

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960000467A KR100388387B1 (ko) 1995-01-12 1996-01-11 여기파라미터의결정을위한디지탈화된음성신호의분석방법및시스템

Country Status (7)

Country Link
US (1) US5826222A (ko)
EP (1) EP0722165B1 (ko)
KR (1) KR100388387B1 (ko)
AU (1) AU696092B2 (ko)
CA (1) CA2167025C (ko)
DE (1) DE69623360T2 (ko)
TW (1) TW289111B (ko)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105194A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
JP3063668B2 (ja) * 1997-04-04 2000-07-12 日本電気株式会社 音声符号化装置及び復号装置
US5970441A (en) * 1997-08-25 1999-10-19 Telefonaktiebolaget Lm Ericsson Detection of periodicity information from an audio signal
US6070137A (en) * 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
KR100474826B1 (ko) * 1998-05-09 2005-05-16 삼성전자주식회사 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치
US6138092A (en) * 1998-07-13 2000-10-24 Lockheed Martin Corporation CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency
US6223090B1 (en) * 1998-08-24 2001-04-24 The United States Of America As Represented By The Secretary Of The Air Force Manikin positioning for acoustic measuring
US6192335B1 (en) * 1998-09-01 2001-02-20 Telefonaktieboiaget Lm Ericsson (Publ) Adaptive combining of multi-mode coding for voiced speech and noise-like signals
US6411927B1 (en) * 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
US6519486B1 (en) 1998-10-15 2003-02-11 Ntc Technology Inc. Method, apparatus and system for removing motion artifacts from measurements of bodily parameters
US7991448B2 (en) * 1998-10-15 2011-08-02 Philips Electronics North America Corporation Method, apparatus, and system for removing motion artifacts from measurements of bodily parameters
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
US6765931B1 (en) * 1999-04-13 2004-07-20 Broadcom Corporation Gateway with voice
FR2796192B1 (fr) * 1999-07-05 2001-10-05 Matra Nortel Communications Procedes et dispositifs de codage et de decodage audio
US6792405B2 (en) * 1999-12-10 2004-09-14 At&T Corp. Bitstream-based feature extraction method for a front-end speech recognizer
AU2094201A (en) * 1999-12-13 2001-06-18 Broadcom Corporation Voice gateway with downstream voice synchronization
EP1143414A1 (en) * 2000-04-06 2001-10-10 TELEFONAKTIEBOLAGET L M ERICSSON (publ) Estimating the pitch of a speech signal using previous estimates
WO2001078061A1 (en) * 2000-04-06 2001-10-18 Telefonaktiebolaget Lm Ericsson (Publ) Pitch estimation in a speech signal
WO2002029782A1 (en) * 2000-10-02 2002-04-11 The Regents Of The University Of California Perceptual harmonic cepstral coefficients as the front-end for speech recognition
US7139711B2 (en) * 2000-11-22 2006-11-21 Defense Group Inc. Noise filtering utilizing non-Gaussian signal statistics
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
US7970606B2 (en) * 2002-11-13 2011-06-28 Digital Voice Systems, Inc. Interoperable vocoder
US7634399B2 (en) * 2003-01-30 2009-12-15 Digital Voice Systems, Inc. Voice transcoder
US8359197B2 (en) * 2003-04-01 2013-01-22 Digital Voice Systems, Inc. Half-rate vocoder
DE102004046045B3 (de) * 2004-09-21 2005-12-29 Drepper, Friedhelm R., Dr. Verfahren und Vorrichtung zur Analyse von instationären Sprachsignalen
US8036886B2 (en) 2006-12-22 2011-10-11 Digital Voice Systems, Inc. Estimation of pulsed speech model parameters
US8352257B2 (en) * 2007-01-04 2013-01-08 Qnx Software Systems Limited Spectro-temporal varying approach for speech enhancement
US8489403B1 (en) * 2010-08-25 2013-07-16 Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission
US20140309992A1 (en) * 2013-04-16 2014-10-16 University Of Rochester Method for detecting, identifying, and enhancing formant frequencies in voiced speech
US11270714B2 (en) 2020-01-08 2022-03-08 Digital Voice Systems, Inc. Speech coding using time-varying interpolation
US11990144B2 (en) 2021-07-28 2024-05-21 Digital Voice Systems, Inc. Reducing perceived effects of non-voice data in digital speech
CN114360587A (zh) * 2021-12-27 2022-04-15 北京百度网讯科技有限公司 识别音频的方法、装置、设备、介质及产品

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3706929A (en) * 1971-01-04 1972-12-19 Philco Ford Corp Combined modem and vocoder pipeline processor
US3982070A (en) * 1974-06-05 1976-09-21 Bell Telephone Laboratories, Incorporated Phase vocoder speech synthesis system
US3975587A (en) * 1974-09-13 1976-08-17 International Telephone And Telegraph Corporation Digital vocoder
US3995116A (en) * 1974-11-18 1976-11-30 Bell Telephone Laboratories, Incorporated Emphasis controlled speech synthesizer
US4004096A (en) * 1975-02-18 1977-01-18 The United States Of America As Represented By The Secretary Of The Army Process for extracting pitch information
US4091237A (en) * 1975-10-06 1978-05-23 Lockheed Missiles & Space Company, Inc. Bi-Phase harmonic histogram pitch extractor
US4015088A (en) * 1975-10-31 1977-03-29 Bell Telephone Laboratories, Incorporated Real-time speech analyzer
GB1563801A (en) * 1975-11-03 1980-04-02 Post Office Error correction of digital signals
US4076958A (en) * 1976-09-13 1978-02-28 E-Systems, Inc. Signal synthesizer spectrum contour scaler
JPS597120B2 (ja) * 1978-11-24 1984-02-16 日本電気株式会社 音声分析装置
ATE15415T1 (de) * 1981-09-24 1985-09-15 Gretag Ag Verfahren und vorrichtung zur redundanzvermindernden digitalen sprachverarbeitung.
US4441200A (en) * 1981-10-08 1984-04-03 Motorola Inc. Digital voice processing system
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
AU570439B2 (en) * 1983-03-28 1988-03-17 Compression Labs, Inc. A combined intraframe and interframe transform coding system
US4696038A (en) * 1983-04-13 1987-09-22 Texas Instruments Incorporated Voice messaging system with unified pitch and voice tracking
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
NL8400728A (nl) * 1984-03-07 1985-10-01 Philips Nv Digitale spraakcoder met basisband residucodering.
US4622680A (en) * 1984-10-17 1986-11-11 General Electric Company Hybrid subband coder/decoder method and apparatus
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
FR2579356B1 (fr) * 1985-03-22 1987-05-07 Cit Alcatel Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation
US5067158A (en) * 1985-06-11 1991-11-19 Texas Instruments Incorporated Linear predictive residual representation via non-iterative spectral reconstruction
US4879748A (en) * 1985-08-28 1989-11-07 American Telephone And Telegraph Company Parallel processing pitch detector
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
KR870009323A (ko) * 1986-03-04 1987-10-26 구자학 음성신호의 특징 파라미터 추출회로
US4799059A (en) * 1986-03-14 1989-01-17 Enscan, Inc. Automatic/remote RF instrument monitoring system
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
DE3640355A1 (de) * 1986-11-26 1988-06-09 Philips Patentverwaltung Verfahren zur bestimmung des zeitlichen verlaufs eines sprachparameters und anordnung zur durchfuehrung des verfahrens
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
ATE80488T1 (de) * 1987-04-03 1992-09-15 American Telephone & Telegraph Abstandsmessungskontrolle eines multidetektorsystems.
NL8701798A (nl) * 1987-07-30 1989-02-16 Philips Nv Werkwijze en inrichting voor het bepalen van het verloop van een spraakparameter, bijvoorbeeld de toonhoogte, in een spraaksignaal.
US4809334A (en) * 1987-07-09 1989-02-28 Communications Satellite Corporation Method for detection and correction of errors in speech pitch period estimates
US5095392A (en) * 1988-01-27 1992-03-10 Matsushita Electric Industrial Co., Ltd. Digital signal magnetic recording/reproducing apparatus using multi-level QAM modulation and maximum likelihood decoding
US5179626A (en) * 1988-04-08 1993-01-12 At&T Bell Laboratories Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
EP0374941B1 (en) * 1988-12-23 1995-08-09 Nec Corporation Communication system capable of improving a speech quality by effectively calculating excitation multipulses
JPH0782359B2 (ja) * 1989-04-21 1995-09-06 三菱電機株式会社 音声符号化装置、音声復号化装置及び音声符号化・復号化装置
DE69029120T2 (de) * 1989-04-25 1997-04-30 Toshiba Kawasaki Kk Stimmenkodierer
US5036515A (en) * 1989-05-30 1991-07-30 Motorola, Inc. Bit error rate detection
US5081681B1 (en) * 1989-11-30 1995-08-15 Digital Voice Systems Inc Method and apparatus for phase synthesis for speech processing
US5216747A (en) * 1990-09-20 1993-06-01 Digital Voice Systems, Inc. Voiced/unvoiced estimation of an acoustic signal
US5226108A (en) * 1990-09-20 1993-07-06 Digital Voice Systems, Inc. Processing a speech signal with estimated pitch
US5247579A (en) * 1990-12-05 1993-09-21 Digital Voice Systems, Inc. Methods for speech transmission
US5226084A (en) * 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
US5504833A (en) * 1991-08-22 1996-04-02 George; E. Bryan Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications
JPH0612098A (ja) * 1992-03-16 1994-01-21 Sanyo Electric Co Ltd 音声符号化装置
US5517511A (en) * 1992-11-30 1996-05-14 Digital Voice Systems, Inc. Digital transmission of acoustic signals over a noisy communication channel

Also Published As

Publication number Publication date
TW289111B (ko) 1996-10-21
AU4085396A (en) 1996-07-18
CA2167025A1 (en) 1996-07-13
EP0722165B1 (en) 2002-09-04
EP0722165A2 (en) 1996-07-17
US5826222A (en) 1998-10-20
CA2167025C (en) 2006-07-11
KR100388387B1 (ko) 2003-11-01
EP0722165A3 (en) 1998-07-15
DE69623360T2 (de) 2003-05-08
DE69623360D1 (de) 2002-10-10
AU696092B2 (en) 1998-09-03

Similar Documents

Publication Publication Date Title
KR960030075A (ko) 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법 및 시스템
US8463599B2 (en) Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
KR100421817B1 (ko) 음성의피치추출방법및장치
KR100908219B1 (ko) 로버스트한 음성 분류를 위한 방법 및 장치
US20040243402A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
KR100269216B1 (ko) 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법
JPH08328591A (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
KR950035136A (ko) 인간의 음성을 나타내는 신호를 합성하는 방법
CA2144823A1 (en) Estimation of excitation parameters
CA2412449A1 (en) Improved speech model and analysis, synthesis, and quantization methods
JP3687181B2 (ja) 有声音/無声音判定方法及び装置、並びに音声符号化方法
EP0843302A2 (en) Voice coder using sinusoidal analysis and pitch control
KR910015962A (ko) 음성신호처리장치
CA2342353C (en) An adaptive criterion for speech coding
Dusan et al. Speech compression by polynomial approximation
Xydeas et al. Split matrix quantization of LPC parameters
KR0155315B1 (ko) Lsp를 이용한 celp보코더의 피치 검색방법
KR100383668B1 (ko) 시간 분리 부호화 알고리즘을 이용한 음성 부호화기 및부호화 방법
KR100711040B1 (ko) 유사주기 신호의 위상을 추적하는 방법 및 장치
JP2899024B2 (ja) ベクトル量子化方法
Brown Solid-State Liquid Chemical Sensor Testing Issues
Walter Interrelationship between several classes of narrowban digital speech communication techniques and an underlying canonical baseline system
Webber et al. Packet transmission of speech using variable‐quality coding and time‐interval modification
Zahorian et al. Principal‐components analysis of speech spectra
Crochiere et al. Analysis of the performance of a tandem connection of a 2.4‐kB/sec LPC vocoder to a 16‐kB/sec CVSD coder

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130524

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20140527

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20150526

Year of fee payment: 13

EXPY Expiration of term