KR960025316A - 음성인식의 벡터 양자화 검색방법 - Google Patents
음성인식의 벡터 양자화 검색방법 Download PDFInfo
- Publication number
- KR960025316A KR960025316A KR1019940034853A KR19940034853A KR960025316A KR 960025316 A KR960025316 A KR 960025316A KR 1019940034853 A KR1019940034853 A KR 1019940034853A KR 19940034853 A KR19940034853 A KR 19940034853A KR 960025316 A KR960025316 A KR 960025316A
- Authority
- KR
- South Korea
- Prior art keywords
- codeword
- distance
- quantization
- speech recognition
- speech
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 8
- 238000013139 quantization Methods 0.000 claims abstract description 9
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/081—Search algorithms, e.g. Baum-Welch or Viterbi
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 음성인식의 벡터 양자화 검색방법에 관한 것으로, 종래에는 입력의 각 프레임에 대하여 전체 프레임과 비교하여 코드워드를 구하도록 함으로써 벡터 양자화시 양자화 과정시간이 많이 소요되는 문제점이 있다.
따라서 본 발명은 음성인식의 양자화 과정의 계산시간을 줄임으로써 인성인식을 실시간에 처리할 수 있도록 한다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제2도는 음성의 벡터 양자화 방법 설명도, 제3도는 본 발명 음성인식의 벡터 양자화 검색방법에 대한 흐름도.
Claims (2)
- 입력음성의 첫프레임의 양자화된 코드워드를 코드북의 전체 코드워드와 비교하여 최소거리를 갖는 코드워드를 선택하는 단계와, 상기 단계에서 전 프레임의 코드워드와 그 다음 프레임의 입력을 비교하여 거리를 구하는 단계와, 상기 단계에서 구한 거리가 평균거리와 분산거리의 합보다 크면 전체 코드워드와 비교하고, 아니면전 프레임 코드워드에 해당하는 선택된 코드워드만으로 비교하여 양자화 코드워드를 구하는 단계와, 전 음성구간에 대하여 상기 단계를 반복하여 양자화 코드워드를 구하도록 하는 단계로 이루어진 것을 특징으로 하는음성인식의 벡터 양자화 검색방법.
- 제1항에 있어서, 선택된 코드워드는 훈련음성을 코드북으로 양자화 했을 때 평균거리와 분산거리를 구한후 코드북 각각의 코드워드 상호거리를 계산하고 그 거리가 평균거리와 분산거리의 합의 2배보다 작으면 해당코드워드에 대한 선택된 코드워드를 S[Wi][m]에 저장해 놓도록 한 것을 특징으로 하는 음성인식의 벡터 양자화 검색방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940034853A KR100332748B1 (ko) | 1994-12-17 | 1994-12-17 | 음성인식의벡터양자화검색방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940034853A KR100332748B1 (ko) | 1994-12-17 | 1994-12-17 | 음성인식의벡터양자화검색방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR960025316A true KR960025316A (ko) | 1996-07-20 |
KR100332748B1 KR100332748B1 (ko) | 2002-10-25 |
Family
ID=37479515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019940034853A KR100332748B1 (ko) | 1994-12-17 | 1994-12-17 | 음성인식의벡터양자화검색방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100332748B1 (ko) |
-
1994
- 1994-12-17 KR KR1019940034853A patent/KR100332748B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR100332748B1 (ko) | 2002-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Giacobello et al. | Sparse linear prediction and its applications to speech processing | |
AU712412B2 (en) | Speech processing | |
US6529872B1 (en) | Method for noise adaptation in automatic speech recognition using transformed matrices | |
US20050021330A1 (en) | Speech recognition apparatus capable of improving recognition rate regardless of average duration of phonemes | |
KR910008975A (ko) | 오디오 신호 처리 방법 | |
US5568514A (en) | Signal quantizer with reduced output fluctuation | |
KR940012931A (ko) | 코드북 여기 선형 예측 서치 루프 용도의 적응 피치 펄스 강화기 | |
Watanabe et al. | High speed speech recognition using tree-structured probability density function | |
CA2090205C (en) | Speech coding system | |
KR970002849A (ko) | 고정된 코드북을 사용하는 음성 코딩 시스템 | |
CN117496960A (zh) | 语音识别模型的训练方法、装置、电子设备及存储介质 | |
KR960025316A (ko) | 음성인식의 벡터 양자화 검색방법 | |
JP2658816B2 (ja) | 音声のピッチ符号化装置 | |
JP3209248B2 (ja) | 音声の励振信号符号化法 | |
KR970050118A (ko) | 음성인식의 자동모델 결정방법 | |
JP3471542B2 (ja) | 音声符号化装置 | |
KR100322730B1 (ko) | 화자적응방법 | |
Cuperman | Speech coding | |
JP3144203B2 (ja) | ベクトル量子化装置 | |
KR970007791A (ko) | 관찰벡터의 디스토션 확률밀도(Distortion density)를 가진 은닉 마코프 모델(Hidden Markov Model)을 이용한 음성인식 방법 | |
JP3095758B2 (ja) | ベクトル量子化のコードベクトル検索方法 | |
JP3209247B2 (ja) | 音声の励振信号符号化法 | |
KR100624545B1 (ko) | 티티에스 시스템의 음성압축 및 합성방법 | |
KR960039988A (ko) | 윤곽선 부호기 | |
Scagliola et al. | Two novel algorithms for variable frame analysis and word matching for connected word recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20070329 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |