KR960030075A - 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법 및 시스템 - Google Patents
유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법 및 시스템 Download PDFInfo
- Publication number
- KR960030075A KR960030075A KR1019960000467A KR19960000467A KR960030075A KR 960030075 A KR960030075 A KR 960030075A KR 1019960000467 A KR1019960000467 A KR 1019960000467A KR 19960000467 A KR19960000467 A KR 19960000467A KR 960030075 A KR960030075 A KR 960030075A
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- parameter
- initial
- signal
- determining
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract 71
- 238000004458 analytical method Methods 0.000 title claims abstract 9
- 238000009499 grossing Methods 0.000 claims 15
- 230000002194 synthesizing effect Effects 0.000 claims 4
- 238000005259 measurement Methods 0.000 claims 3
- 230000001755 vocal effect Effects 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/937—Signal energy in various frequency bands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Radio Relay Systems (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
디지탈화된 음성 신호에 대해 유기 파라미터를 결정하기 위한 디지탈화된 음성 신호의 분석에 의해 음성을 인코딩하는 방법은 적어도 두개의 주파수 대역으로 디지탈화된 음성 신호를 분할하는 방법과; 변형된 주파수 대역 신호를 실행함에 의해 제1초기 유기 파라미터를 결정하며, 변형된 주파수 대역 신호를 이용하여 제1초기 유기 파라미터를 결정하는 방법과; 제1방법과 다른 방법을 이용하여 제2초기 유기 파라미터를 결정하는 방법; 및 디지탈화된 음성 신호에 대해 유기 파라미터를 결정하기 위한 제1 및 제2초기 유기 파라미터를 이용하는 방법을 포함하며, 음성을 인코딩 하는데 유용한 방법이다.
합성된 음성은 위성 음성 통신으로써 적용되어지기 위한 유용한 각종 비트율에서 높은 질의 음성을 발생하기 위한 본 발명에 기초한 추정된 파라미터를 이용한다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 음성화/비음성화 신호 주파수 대역 중 어떤 것인지를 결정하기 ㅜ이한 시스템 블럭도.
Claims (42)
- 디지탈화된 음성 신호에 대한 유기 파라미터의 측정을 위한 디지탈화된 음성 신호 분석 방법으로서, 디지탈화된 음성신호를 하나 또는 그 이상의 주파수 대역신호로 분할하는 단계; 적어도 하나의 주파수 대역 신호를 만들어내기 위해서 적어도 하나의 주파수 대역 신호에 대해 비선형 오퍼레이션을 실행하는 과정과 적어도 하나의 변형된 주파수 대역 신호를 이용하여 제1초기 유리 파라미터를 결정하는 과정을 포함하는 제1방법을 사용하여 제1초기 유기 파라미터를 결정하는 단계; 상기 제1방법과 상기한 제2방법을 사용하여 적어도 제2초기 유기 파라미터를 결정하는 단계; 및 디지탈화된 음성 신호에 대한 유기 파라미터를 결정하기 위해 제1 및 적어도 제2초기 유기 파라미터를 사용하는 단계를 포함하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법.
- 제1항에 있어서, 상기 결정 및 사용하는 단계는 시간의 정규화된 간격으로 수행되어짐을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법.
- 제1항에 있어서, 상기 디지탈화된 음성 신호가 음성을 코드화하는 단계로 분석되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법.
- 제1항에 있어서, 상기 유기 파라미터는 적어도 하나의 주파수 대역에 대한 음성화/비음성화 파라미터를 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법.
- 제4항에 있어서, 상기 방법이 디지탈화된 음성 신호에 대한 기본 주파수를 결정하는 단계를 추가로 포함하는 것을 특징으로 하는 유기 파라미터 결정을 위한 디지탈화된 음성 신호 분석방법.
- 제4항에 있어서, 상기 제1초기 유기 파라미터는 적어도 하나의 변형된 주파수 대역신호에 대한 제1음성화/비음성화 파라미터를 포함하며, 제1결정 단계를 변형된 주파수 대역 신호의 음성 에너지와 변형된 주파수 대역 신호의 전체 에너지를 비교하므로써 제1음성화/비음성화 파라미터를 결정하는 과정을 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법.
- 제6항에 있어서, 상기 변형된 주파수 대역 신호의 음성 에너지는 디지탈화된 음성 신호에 대해 평가된 기본 주파수와 관련된 에너지와 일치함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제6항에 있어서, 상기 변형된 주파수 대역 신호의 음성 에너지는 디지탈화된 음성 신호에 대해 평가된 피치주기와 관련된 에너지와 일치함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제6항에 있어서, 상기 제2초기 유기 파라미터는 적어도 하나의 주파수 대역 신호에 대한 음성화/비음성화 파라미터를 포함하며, 상기 제2결정 단계는 적어도 하나의 주파수 대역 신호에서의 사인파 에너지와 적어도 하나의 주파수 대역 신호에서의 전체 에너지를 비교함으로써 제2음성화/비음성화 파라미터를 결정하는 과정을 포함하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제6항에 있어서, 상기 제2초기 유기 파라미터는 적어도 하나의 주파수 대역 신호에 대한 제2음성화/비음성화 파라미터를 포함하며, 상기 제2결정 단계는 적어도 하나의 주파수 대역 신호를 자동적으로 상관시킴으로써 제2음성화/비음성화 파라미터를 결정하는 과정을 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제4항에 있어서, 상기 음성화/비음성화 파라미터를 연속적인 범위 이상으로 변화하는 값을 가짐을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제1항에 있어서, 상기 사용하는 단계는 제1초기 유기 파라미터가 제2초기 유기 파라미터보다 맞을 확률이 더 높은 경우에 디지탈화된 음성 신호에 대한 유기 파라미터를 결정함에 있어서 제2초기 유기 파라미터를 능가하여 제1초기 유기 파라미터를 강조함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제1항에 있어서, 상기 방법이 평활된 유기 파라미터를 산출하기 위한 유기 파라미터의 평활 단계를 추가로 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제1항의 방법을 이용하여 평가된 유기 파라미터를 음성의 합성방법으로 이용함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 디지탈화된 음성 신호에 대한 유기 파라미터의 결정을 위한 디지탈화된 음성신호의 분석방법으로서, 디지탈화된 음성 신호로부터 초기 유기 파라미터를 결정하는 단계; 및 유기 파라미터의 산출을 위해 초기 유기 파라미터를 평활하는 단계를 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제15항에 있어서, 상기 디지탈화된 음성 신호가 음성을 코드화하는 단계로 분석되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제15항에 있어서, 상기 초기 유기 파라미터는 적어도 하나의 주파수 대역에 대한 초기 음성화/비음성화 파라미터를 포함하며, 상기 유기 파라미터는 적어도 하나의 주파수 대역에 대한 음성화/비음성화 파라미터를 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제17항에 있어서, 상기 유기 파라미터는 기본 주파수를 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제17항에 있어서, 상기 평활 단계는 시간 가까운 음성화/비음성화 파라미터가 음성화될 때 음성화/비음성화 파라미터를 초기 음성화/비음성화 파라미터 보다 더 음성화되도록 만드는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제17항에 있어서, 상기 평활 단계는 주파수 가까운 음성화/비음성화 파라미터가 음성화될 때 음성화/비음성화 파라미터를 초기 음성화/비음성화 파라미터보다 더 음성화되도록 만드는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제17항에 있어서, 상기 평활 단계는 시간 및 주파수 상으로 가까운 음성화/비음성화 파라미터가 음성화될 때 평활된 음성화/비음성화 파라미터를 초기 음성화/비음성화 파라미터 보다 더 음성화되도록 만드는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제17항에 있어서, 상기 음성화/비음성화 파라미터가 연속적인 범위 이상으로 변화하는 값을 갖도록 허용되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제15항에 있어서, 상기 평활 단계가 시간 함수로서 수행되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제15항에 있어서, 상기 평활 단계가 주파수 함수로서 수행되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제15항에 있어서, 상기 평활 단계가 시간과 주파수 양자의 함수로서 수행되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제15항의 방법을 이용하여 평가된 유기 파라미터를 음성의 합성방법에 이용함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 디지탈화된 음성 신호에 대한 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석 방법으로서, 디지탈화된 음성 신호에 대한 기본 주파수를 평가하는 단계; 제1초기 음성화/비음성화 파라미터를 산출하기 위해 평가된 기본 주파수를 사용하여 음성화/비음성화 함수를 사정하는 단계; 적어도 하나의 다른 초기 음성화/비음성화 파라미터를 산출하기 위해 평가된 기본 주파수로부터 유래된 적어도 하나의 다른 주파수를 사용하여 음성화/비음성화 함수를 사정하는 단계; 및 음성화/비음성화 파라미터를 산출하기 위하여 제1 및 적어도 하나의 다른 초기 음성화/비음성화 파라미터를 결합시키는 단계를 포함함을 특징으로 하는 유기 파라미터의 결정을위한 디지탈화된 음성 신호의 분석방법.
- 제27항에 있어서, 상기 적어도 하나의 다른 주파수가 상기 평가된 기본 주파수의 배수나 약수로서 평가된 기본 주파수로부터 유도됨을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제27항에 있어서, 상기 디지탈화된 음성 신호는 음성을 코드화하는 단계로 분석되어짐을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제27항의 방법을 이용하여 평가된 유기 파라미터를 음성의 합성방법에 이용함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제27항에 있어서, 상기 결합 단계가 제1초기 음성화/비음성화 파라미터가 디지탈화된 음성 신호가 제2초기 음성화/비음성화 파라미터 보다 더 음성화된 것을 나타내는 경우에, 음성화/비음성화 파라미터로서 제1초기 음성화/비음성화 파라미터를 선택하는 과정을 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 디지탈화된 음성 신호에 대한 기본 주파수 평가를 결정하기 위한 디지탈화된 음성 신호의 분석방법으로서, 이전의 기본 주파수 추정값으로부터 예측되어진 기본 주파수 측정값을 결정하는 단계; 초기 기본 주파수 추정값을 결정하는 단계; 첫번째 에러 함수 값을 산출하기 위하여 초기 기본 주파수 추정값에서 에러 함수를 구하는 단계; 적어도 하나의 다른 에러 함수 값을 산출하기 위하여 초기 기본 주파수 측정값으로부터 유래된 적어도 하나의 다른 주파수에서 에러 함수를 구하는 단계; 및 예측 기본 주파수 추정값, 초기 기본 주파수 추정값, 제1에서 함수값, 및 적어도 하나의 다른 에러 함수 값을 이용하여 기본 주파수 추정값을 선택하는 단계를 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제32항에 있어서, 상기 적어도 하나의 다른 주파수가 상기 추정된 기본 주파수의 배수 및 약수로서 상기 추정된 기본 주파수로부터 유래되는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제32항에 있어서, 상기 예측 기본 주파수가 이전의 예측 기본 주파수에 델타 함수를 더함으로써 결정되어짐을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제34항에 있어서, 상기 델타 함수는 이전에 제1 및 적어도 하나의 다른 에러 함수값, 이전의 예측 기본 주파수 및, 이전의 델타 요소로부터 결정되어짐을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 제32항의 방법을 이용하여 평가된 기본 주파수를 음성의 합성방법에 이용함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.
- 디지탈화된 음성 신호에 대한 유기 파라미터를 결정하기 위한 디지탈화된 음성 신호 분석시스템으로서, 디지탈화된 음성 신호를 하나 이상의 주파수 대역으로 분할하는 수단; 적어도 하나의 변형된 주파수 대역 신호를 형성하기 위해 적어도 하나의 주파수 대역 신호들에 대한 비선형 수행을 실행하는 과정과, 적어도 하나의 변형된 주파수 대역 신호를 사용하여 제1초기 유기 파라미터를 결정하는 과정을 포함하는 첫번째 방법을 이용하여 제1초기 유기 파라미터를 결정하는 수단; 상기 첫번째 방법과 다른 제2방법을 이용하여 제2초기 유기 파라미터를 결정하는 수단; 및 디지탈화된 음성 신호에 대한 유기 파라미터를 결정하기 위해 제1 및 제2초기 유기 파라미터를 사용하는 수단을 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석 시스템.
- 디지탈화된 음성 신호에 대한 유기 파라미터를 결정하기 위한 디지탈화된 음성 신호 분석을 위한 시스템으로서, 디지탈화된 음성 신호로부터 초기 유기 파라미터를 결정하는 수단; 유기 파라미터를 산출하기 위해 초기 유기 파라미터를 평활하는 수단을 포함함을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석 시스템.
- 디지탈화된 음성 신호에 대해 변형된 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석 시스템으로서, 디지탈화된 음성 신호에 대해 기본 주파수를 추정하는 수단; 제1초기 음성화/비음성화 파라미터를 산출하기 위해 추정된 기본 주파수를 이용하여 음성화/비음성화 함수를 구하는 수단; 제2초기 음성화/비음성화 파라미터를 산출하기 위해 추정된 기본 주파수로부터 유도된 다른 주파수를 이용하여 음성화/비음성화 함수를 구하는 수단; 및 음성화/비음성화 파라미터를 산출하기 위해 제1 및 제2초기 음성화/비음성화 파라미터를 결합시키는 수단을 포함하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석 시스템.
- 디지탈화된 음성 신호에 대해 기본 주파수 추정값을 결정하기 위한 디지탈화된 음성 신호 분석 시스템으로서, 이전의 기본 주파수 추정값으로부터 예측 기본 주파수 추정값을 결정하는 수단; 초기 기본 주파수 추정값을 결정하는 수단; 제1에러 함수값을 산출하기 위해 초기 주파수 추정값에서 에러 함수를 구하는 수단; 제2에러 함수값을 산출하기 위해 초기 기본 주파수 추정값으로부터 유도된 적어도 하나의 다른 주파수에서 에러 함수를 구하는 수단; 및 예측 기본 주파수 추정값, 초시 기본 주파수 추정값, 제1에러 함수값 및, 제2에서함수값을 이용하여 기본 주파수 추정값을 선정하는 수단을 포함하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석 시스템.
- 디지탈화된 음성 신호에 대해 음성화/비음성화 함수를 결정하기 위한 디지탈화된 음성 신호 분석방법으로서, 디지탈화된 음성 신호를 적어도 두개의 주파수 대역 신호로 분할하는 단계; 제1방법을 사용하여 적어도 두개의 주파수 대역 신호에 대한 제1초기 음성화/비음성화 함수를 결정하는 단계; 상기 제1방법과 다른 제2방법을 이용하여 적어도 두개의 주파수 대역 신호에 대한 제2초기 음성화/비음성화 함수를 결정하는 단계; 및 적어도 두개의 주파수 대역 신호에 대한 음성화/비음성화 함수를 결정하기 위해 제1 및 제2초기 유기 파라미터를 이용하는 단계를 포함하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석 방법.
- 제1항에 있어서, 제2방법중 적어도 하나는 상기 비선형 수행의 실행없이 적어도 하나의 주파수 대역신호를 이용하는 것을 특징으로 하는 유기 파라미터의 결정을 위한 디지탈화된 음성 신호의 분석방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US37174395A | 1995-01-12 | 1995-01-12 | |
US08/371,743 | 1995-01-12 | ||
US08/371743 | 1995-01-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR960030075A true KR960030075A (ko) | 1996-08-17 |
KR100388387B1 KR100388387B1 (ko) | 2003-11-01 |
Family
ID=23465238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019960000467A KR100388387B1 (ko) | 1995-01-12 | 1996-01-11 | 여기파라미터의결정을위한디지탈화된음성신호의분석방법및시스템 |
Country Status (7)
Country | Link |
---|---|
US (1) | US5826222A (ko) |
EP (1) | EP0722165B1 (ko) |
KR (1) | KR100388387B1 (ko) |
AU (1) | AU696092B2 (ko) |
CA (1) | CA2167025C (ko) |
DE (1) | DE69623360T2 (ko) |
TW (1) | TW289111B (ko) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10105194A (ja) * | 1996-09-27 | 1998-04-24 | Sony Corp | ピッチ検出方法、音声信号符号化方法および装置 |
JP3063668B2 (ja) * | 1997-04-04 | 2000-07-12 | 日本電気株式会社 | 音声符号化装置及び復号装置 |
US5970441A (en) * | 1997-08-25 | 1999-10-19 | Telefonaktiebolaget Lm Ericsson | Detection of periodicity information from an audio signal |
US6070137A (en) * | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
KR100474826B1 (ko) * | 1998-05-09 | 2005-05-16 | 삼성전자주식회사 | 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 |
US6138092A (en) * | 1998-07-13 | 2000-10-24 | Lockheed Martin Corporation | CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency |
US6223090B1 (en) * | 1998-08-24 | 2001-04-24 | The United States Of America As Represented By The Secretary Of The Air Force | Manikin positioning for acoustic measuring |
US6192335B1 (en) * | 1998-09-01 | 2001-02-20 | Telefonaktieboiaget Lm Ericsson (Publ) | Adaptive combining of multi-mode coding for voiced speech and noise-like signals |
US6411927B1 (en) * | 1998-09-04 | 2002-06-25 | Matsushita Electric Corporation Of America | Robust preprocessing signal equalization system and method for normalizing to a target environment |
US6519486B1 (en) | 1998-10-15 | 2003-02-11 | Ntc Technology Inc. | Method, apparatus and system for removing motion artifacts from measurements of bodily parameters |
US7991448B2 (en) * | 1998-10-15 | 2011-08-02 | Philips Electronics North America Corporation | Method, apparatus, and system for removing motion artifacts from measurements of bodily parameters |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US7423983B1 (en) * | 1999-09-20 | 2008-09-09 | Broadcom Corporation | Voice and data exchange over a packet based network |
US6765931B1 (en) * | 1999-04-13 | 2004-07-20 | Broadcom Corporation | Gateway with voice |
FR2796192B1 (fr) * | 1999-07-05 | 2001-10-05 | Matra Nortel Communications | Procedes et dispositifs de codage et de decodage audio |
US6792405B2 (en) * | 1999-12-10 | 2004-09-14 | At&T Corp. | Bitstream-based feature extraction method for a front-end speech recognizer |
AU2094201A (en) * | 1999-12-13 | 2001-06-18 | Broadcom Corporation | Voice gateway with downstream voice synchronization |
EP1143414A1 (en) * | 2000-04-06 | 2001-10-10 | TELEFONAKTIEBOLAGET L M ERICSSON (publ) | Estimating the pitch of a speech signal using previous estimates |
WO2001078061A1 (en) * | 2000-04-06 | 2001-10-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Pitch estimation in a speech signal |
WO2002029782A1 (en) * | 2000-10-02 | 2002-04-11 | The Regents Of The University Of California | Perceptual harmonic cepstral coefficients as the front-end for speech recognition |
US7139711B2 (en) * | 2000-11-22 | 2006-11-21 | Defense Group Inc. | Noise filtering utilizing non-Gaussian signal statistics |
US20030135374A1 (en) * | 2002-01-16 | 2003-07-17 | Hardwick John C. | Speech synthesizer |
US7970606B2 (en) * | 2002-11-13 | 2011-06-28 | Digital Voice Systems, Inc. | Interoperable vocoder |
US7634399B2 (en) * | 2003-01-30 | 2009-12-15 | Digital Voice Systems, Inc. | Voice transcoder |
US8359197B2 (en) * | 2003-04-01 | 2013-01-22 | Digital Voice Systems, Inc. | Half-rate vocoder |
DE102004046045B3 (de) * | 2004-09-21 | 2005-12-29 | Drepper, Friedhelm R., Dr. | Verfahren und Vorrichtung zur Analyse von instationären Sprachsignalen |
US8036886B2 (en) | 2006-12-22 | 2011-10-11 | Digital Voice Systems, Inc. | Estimation of pulsed speech model parameters |
US8352257B2 (en) * | 2007-01-04 | 2013-01-08 | Qnx Software Systems Limited | Spectro-temporal varying approach for speech enhancement |
US8489403B1 (en) * | 2010-08-25 | 2013-07-16 | Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ | Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission |
US20140309992A1 (en) * | 2013-04-16 | 2014-10-16 | University Of Rochester | Method for detecting, identifying, and enhancing formant frequencies in voiced speech |
US11270714B2 (en) | 2020-01-08 | 2022-03-08 | Digital Voice Systems, Inc. | Speech coding using time-varying interpolation |
US11990144B2 (en) | 2021-07-28 | 2024-05-21 | Digital Voice Systems, Inc. | Reducing perceived effects of non-voice data in digital speech |
CN114360587A (zh) * | 2021-12-27 | 2022-04-15 | 北京百度网讯科技有限公司 | 识别音频的方法、装置、设备、介质及产品 |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3706929A (en) * | 1971-01-04 | 1972-12-19 | Philco Ford Corp | Combined modem and vocoder pipeline processor |
US3982070A (en) * | 1974-06-05 | 1976-09-21 | Bell Telephone Laboratories, Incorporated | Phase vocoder speech synthesis system |
US3975587A (en) * | 1974-09-13 | 1976-08-17 | International Telephone And Telegraph Corporation | Digital vocoder |
US3995116A (en) * | 1974-11-18 | 1976-11-30 | Bell Telephone Laboratories, Incorporated | Emphasis controlled speech synthesizer |
US4004096A (en) * | 1975-02-18 | 1977-01-18 | The United States Of America As Represented By The Secretary Of The Army | Process for extracting pitch information |
US4091237A (en) * | 1975-10-06 | 1978-05-23 | Lockheed Missiles & Space Company, Inc. | Bi-Phase harmonic histogram pitch extractor |
US4015088A (en) * | 1975-10-31 | 1977-03-29 | Bell Telephone Laboratories, Incorporated | Real-time speech analyzer |
GB1563801A (en) * | 1975-11-03 | 1980-04-02 | Post Office | Error correction of digital signals |
US4076958A (en) * | 1976-09-13 | 1978-02-28 | E-Systems, Inc. | Signal synthesizer spectrum contour scaler |
JPS597120B2 (ja) * | 1978-11-24 | 1984-02-16 | 日本電気株式会社 | 音声分析装置 |
ATE15415T1 (de) * | 1981-09-24 | 1985-09-15 | Gretag Ag | Verfahren und vorrichtung zur redundanzvermindernden digitalen sprachverarbeitung. |
US4441200A (en) * | 1981-10-08 | 1984-04-03 | Motorola Inc. | Digital voice processing system |
US4472832A (en) * | 1981-12-01 | 1984-09-18 | At&T Bell Laboratories | Digital speech coder |
AU570439B2 (en) * | 1983-03-28 | 1988-03-17 | Compression Labs, Inc. | A combined intraframe and interframe transform coding system |
US4696038A (en) * | 1983-04-13 | 1987-09-22 | Texas Instruments Incorporated | Voice messaging system with unified pitch and voice tracking |
EP0127718B1 (fr) * | 1983-06-07 | 1987-03-18 | International Business Machines Corporation | Procédé de détection d'activité dans un système de transmission de la voix |
NL8400728A (nl) * | 1984-03-07 | 1985-10-01 | Philips Nv | Digitale spraakcoder met basisband residucodering. |
US4622680A (en) * | 1984-10-17 | 1986-11-11 | General Electric Company | Hybrid subband coder/decoder method and apparatus |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
FR2579356B1 (fr) * | 1985-03-22 | 1987-05-07 | Cit Alcatel | Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation |
US5067158A (en) * | 1985-06-11 | 1991-11-19 | Texas Instruments Incorporated | Linear predictive residual representation via non-iterative spectral reconstruction |
US4879748A (en) * | 1985-08-28 | 1989-11-07 | American Telephone And Telegraph Company | Parallel processing pitch detector |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
KR870009323A (ko) * | 1986-03-04 | 1987-10-26 | 구자학 | 음성신호의 특징 파라미터 추출회로 |
US4799059A (en) * | 1986-03-14 | 1989-01-17 | Enscan, Inc. | Automatic/remote RF instrument monitoring system |
US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
DE3640355A1 (de) * | 1986-11-26 | 1988-06-09 | Philips Patentverwaltung | Verfahren zur bestimmung des zeitlichen verlaufs eines sprachparameters und anordnung zur durchfuehrung des verfahrens |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
ATE80488T1 (de) * | 1987-04-03 | 1992-09-15 | American Telephone & Telegraph | Abstandsmessungskontrolle eines multidetektorsystems. |
NL8701798A (nl) * | 1987-07-30 | 1989-02-16 | Philips Nv | Werkwijze en inrichting voor het bepalen van het verloop van een spraakparameter, bijvoorbeeld de toonhoogte, in een spraaksignaal. |
US4809334A (en) * | 1987-07-09 | 1989-02-28 | Communications Satellite Corporation | Method for detection and correction of errors in speech pitch period estimates |
US5095392A (en) * | 1988-01-27 | 1992-03-10 | Matsushita Electric Industrial Co., Ltd. | Digital signal magnetic recording/reproducing apparatus using multi-level QAM modulation and maximum likelihood decoding |
US5179626A (en) * | 1988-04-08 | 1993-01-12 | At&T Bell Laboratories | Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
EP0374941B1 (en) * | 1988-12-23 | 1995-08-09 | Nec Corporation | Communication system capable of improving a speech quality by effectively calculating excitation multipulses |
JPH0782359B2 (ja) * | 1989-04-21 | 1995-09-06 | 三菱電機株式会社 | 音声符号化装置、音声復号化装置及び音声符号化・復号化装置 |
DE69029120T2 (de) * | 1989-04-25 | 1997-04-30 | Toshiba Kawasaki Kk | Stimmenkodierer |
US5036515A (en) * | 1989-05-30 | 1991-07-30 | Motorola, Inc. | Bit error rate detection |
US5081681B1 (en) * | 1989-11-30 | 1995-08-15 | Digital Voice Systems Inc | Method and apparatus for phase synthesis for speech processing |
US5216747A (en) * | 1990-09-20 | 1993-06-01 | Digital Voice Systems, Inc. | Voiced/unvoiced estimation of an acoustic signal |
US5226108A (en) * | 1990-09-20 | 1993-07-06 | Digital Voice Systems, Inc. | Processing a speech signal with estimated pitch |
US5247579A (en) * | 1990-12-05 | 1993-09-21 | Digital Voice Systems, Inc. | Methods for speech transmission |
US5226084A (en) * | 1990-12-05 | 1993-07-06 | Digital Voice Systems, Inc. | Methods for speech quantization and error correction |
US5504833A (en) * | 1991-08-22 | 1996-04-02 | George; E. Bryan | Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications |
JPH0612098A (ja) * | 1992-03-16 | 1994-01-21 | Sanyo Electric Co Ltd | 音声符号化装置 |
US5517511A (en) * | 1992-11-30 | 1996-05-14 | Digital Voice Systems, Inc. | Digital transmission of acoustic signals over a noisy communication channel |
-
1996
- 1996-01-08 AU AU40853/96A patent/AU696092B2/en not_active Expired
- 1996-01-11 KR KR1019960000467A patent/KR100388387B1/ko not_active IP Right Cessation
- 1996-01-11 CA CA002167025A patent/CA2167025C/en not_active Expired - Lifetime
- 1996-01-12 EP EP96300245A patent/EP0722165B1/en not_active Expired - Lifetime
- 1996-01-12 DE DE69623360T patent/DE69623360T2/de not_active Expired - Lifetime
- 1996-01-12 TW TW085100336A patent/TW289111B/zh not_active IP Right Cessation
-
1997
- 1997-04-14 US US08/834,145 patent/US5826222A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
TW289111B (ko) | 1996-10-21 |
AU4085396A (en) | 1996-07-18 |
CA2167025A1 (en) | 1996-07-13 |
EP0722165B1 (en) | 2002-09-04 |
EP0722165A2 (en) | 1996-07-17 |
US5826222A (en) | 1998-10-20 |
CA2167025C (en) | 2006-07-11 |
KR100388387B1 (ko) | 2003-11-01 |
EP0722165A3 (en) | 1998-07-15 |
DE69623360T2 (de) | 2003-05-08 |
DE69623360D1 (de) | 2002-10-10 |
AU696092B2 (en) | 1998-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR960030075A (ko) | 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법 및 시스템 | |
US8463599B2 (en) | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder | |
KR100421817B1 (ko) | 음성의피치추출방법및장치 | |
KR100908219B1 (ko) | 로버스트한 음성 분류를 위한 방법 및 장치 | |
US20040243402A1 (en) | Speech bandwidth extension apparatus and speech bandwidth extension method | |
KR100269216B1 (ko) | 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법 | |
JPH08328591A (ja) | 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法 | |
KR950035136A (ko) | 인간의 음성을 나타내는 신호를 합성하는 방법 | |
CA2144823A1 (en) | Estimation of excitation parameters | |
CA2412449A1 (en) | Improved speech model and analysis, synthesis, and quantization methods | |
JP3687181B2 (ja) | 有声音/無声音判定方法及び装置、並びに音声符号化方法 | |
EP0843302A2 (en) | Voice coder using sinusoidal analysis and pitch control | |
KR910015962A (ko) | 음성신호처리장치 | |
CA2342353C (en) | An adaptive criterion for speech coding | |
Dusan et al. | Speech compression by polynomial approximation | |
Xydeas et al. | Split matrix quantization of LPC parameters | |
KR0155315B1 (ko) | Lsp를 이용한 celp보코더의 피치 검색방법 | |
KR100383668B1 (ko) | 시간 분리 부호화 알고리즘을 이용한 음성 부호화기 및부호화 방법 | |
KR100711040B1 (ko) | 유사주기 신호의 위상을 추적하는 방법 및 장치 | |
JP2899024B2 (ja) | ベクトル量子化方法 | |
Brown | Solid-State Liquid Chemical Sensor Testing Issues | |
Walter | Interrelationship between several classes of narrowban digital speech communication techniques and an underlying canonical baseline system | |
Webber et al. | Packet transmission of speech using variable‐quality coding and time‐interval modification | |
Zahorian et al. | Principal‐components analysis of speech spectra | |
Crochiere et al. | Analysis of the performance of a tandem connection of a 2.4‐kB/sec LPC vocoder to a 16‐kB/sec CVSD coder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130524 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20140527 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20150526 Year of fee payment: 13 |
|
EXPY | Expiration of term |