KR970050122A - Samdf를 이용한 기본 주파수와 제1포만트의 비율 측정방법 - Google Patents
Samdf를 이용한 기본 주파수와 제1포만트의 비율 측정방법 Download PDFInfo
- Publication number
- KR970050122A KR970050122A KR1019950049252A KR19950049252A KR970050122A KR 970050122 A KR970050122 A KR 970050122A KR 1019950049252 A KR1019950049252 A KR 1019950049252A KR 19950049252 A KR19950049252 A KR 19950049252A KR 970050122 A KR970050122 A KR 970050122A
- Authority
- KR
- South Korea
- Prior art keywords
- formant
- fundamental frequency
- ratio
- samdf
- measuring
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 238000001228 spectrum Methods 0.000 claims abstract 10
- 230000015572 biosynthetic process Effects 0.000 abstract 1
- 238000001514 detection method Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 abstract 1
- 230000003595 spectral effect Effects 0.000 abstract 1
- 238000003786 synthesis reaction Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
본 발명은 음성의 피치나 제1포만트를 별도로 검출하지 않고 이들의 비율을 측정하는 SAMDF(Spectral Average Magnitude Difference Function)를 이용한 기본 주파수와 제1포만트의 비율 측정방법에 관한 것으로서, 그 특징은 SAMDF를 이용한 기본 주파수와 제1포만트의 비율 측정방법에 있어서, 음성신호를 대수의 진폭 스펙트럼으로 변환한 다음에 최대의 스펙트럼을 이루는 위치를 결정하여 스펙트럼 상에서 제1포만트를 구하는 제1과정과, 상기 제1과정에서 구해진 스펙트럼을 SAMDF 함수에 가하여 SAMDF 함수에 통과된 스펙트럼 중에서 첫 봉우리에서 시작하여 최소의 골을 이루는 주파수 지연값을 기본 주파수로 정하는 제2과정 및 상기 제1포만트 대 기본 주파수의 비율을 측정하는 제3과정을 포함하는 데에 있으므로, 본 발명은 기본 주파수와 제1포만트의 비율법을 이용하여 음성신호의 피치검출에 이용하면 그 비율은 1 내지 20 사이의 정수값이 얻어지고, 유성음-무성음 구간으로의 변화에 대해서는 선형적으로 변하는 특성이 있으며 이 변화도는 기본 주파수와 제1포만트의 상관관계를 파악할 수 잇는 중요한 파라미터가 되며, 또한 음성인식 시에는 화자에 따른 영향을 줄일 수 있고, 음성합성 시에는 자연성과 개성을 쉽게 변경하거나 유지할 수있으며 분석 시에는 성문의 영향이 제거된 정화한 성도 파라미터를 얻을 수 있다는 데에 그 효과가 있다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명의 구현을 위한 하드웨어의 구성도.
제2도는 본 발명의 비율측정 방법을 구현한 소프트웨어 처리 블럭도.
Claims (1)
- SAMDF를 이용한 기본 주파수와 제1포만트의 비율 측정방법에 있어서, 음성신호를 대수의 진폭 스펙트럼으로 변환한 다음에 최대의 스펙트럼을 이루는 위치를 결정하여 스펙트럼 상에서 제1포만트를 구하는 제1과정과, 상기 제1과정에서 구해진 스펙트럼을 SAMDF 함수에 가하여 SAMDF 함수에 통과된 스펙트럼 중에서 첫 봉우리에서 시작하여 최소의 골을 이루는 주파수 지연값을 기본 주파수로 정하는 제2과정 및 상기 제1포만트 대 기본 주파수의 비율을 측정하는 제3과정을 포함하는 것을 특징으로 하는 SAMDF를 이용한 기본 주파수와 제1포만트의 비율 측정방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950049252A KR0171004B1 (ko) | 1995-12-13 | 1995-12-13 | Samdf를 이용한 기본 주파수와 제1포만트의 비율 측정방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950049252A KR0171004B1 (ko) | 1995-12-13 | 1995-12-13 | Samdf를 이용한 기본 주파수와 제1포만트의 비율 측정방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970050122A true KR970050122A (ko) | 1997-07-29 |
KR0171004B1 KR0171004B1 (ko) | 1999-03-30 |
Family
ID=19439599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950049252A KR0171004B1 (ko) | 1995-12-13 | 1995-12-13 | Samdf를 이용한 기본 주파수와 제1포만트의 비율 측정방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR0171004B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100717625B1 (ko) * | 2006-02-10 | 2007-05-15 | 삼성전자주식회사 | 음성 인식에서의 포먼트 주파수 추정 방법 및 장치 |
-
1995
- 1995-12-13 KR KR1019950049252A patent/KR0171004B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR0171004B1 (ko) | 1999-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sukhostat et al. | A comparative analysis of pitch detection methods under the influence of different noise conditions | |
Murthy et al. | Robustness of group-delay-based method for extraction of significant instants of excitation from speech signals | |
RU2010109206A (ru) | Устройство и способ расчета параметров расширения полосы пропускания посредством управления фреймами наклона спектра | |
US20080162122A1 (en) | Perceptual harmonic cepstral coefficients as the front-end for speech recognition | |
US9454976B2 (en) | Efficient discrimination of voiced and unvoiced sounds | |
KR910015962A (ko) | 음성신호처리장치 | |
Prasad et al. | Speech features extraction techniques for robust emotional speech analysis/recognition | |
Ishizuka et al. | Study of noise robust voice activity detection based on periodic component to aperiodic component ratio. | |
US4982433A (en) | Speech analysis method | |
Zhao et al. | A processing method for pitch smoothing based on autocorrelation and cepstral F0 detection approaches | |
KR970050122A (ko) | Samdf를 이용한 기본 주파수와 제1포만트의 비율 측정방법 | |
Ambikairajah | Emerging features for speaker recognition | |
Coyle et al. | Onset detection using comb filters | |
JP2564821B2 (ja) | 音声判定検出装置 | |
Schroeder | Parameter estimation in speech: a lesson in unorthodoxy | |
KR100283604B1 (ko) | 평탄화된 스펙트럼에서 유성-무성구간 분류방법 | |
KR970012285A (ko) | 음성 신호의 피치 검출 방법 | |
Joseph et al. | Indian accent detection using dynamic time warping | |
KR100212453B1 (ko) | 양자화 오차를 이용한 음성 신호의 피치 검출 방법 | |
KR960011838A (ko) | 가변 대역폭 저역통과여파기의 진폭비에 의한 음성신호의 피치 검출방법 | |
Shah et al. | A novel filtering-based F 0 estimation algorithm with an application to voice conversion | |
JPH1097288A (ja) | 背景雑音除去装置及び音声認識装置 | |
Cherif | Pitch and formants extraction algorithm for speech processing | |
Raj et al. | Modification to correct distortions in stops of dysarthrie speech using TMS320C6713 DSK | |
KR970067095A (ko) | 음성신호의 무성파열음 구간검출방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20031001 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |