KR960025316A - 음성인식의 벡터 양자화 검색방법 - Google Patents

음성인식의 벡터 양자화 검색방법 Download PDF

Info

Publication number
KR960025316A
KR960025316A KR1019940034853A KR19940034853A KR960025316A KR 960025316 A KR960025316 A KR 960025316A KR 1019940034853 A KR1019940034853 A KR 1019940034853A KR 19940034853 A KR19940034853 A KR 19940034853A KR 960025316 A KR960025316 A KR 960025316A
Authority
KR
South Korea
Prior art keywords
codeword
distance
quantization
speech recognition
speech
Prior art date
Application number
KR1019940034853A
Other languages
English (en)
Other versions
KR100332748B1 (ko
Inventor
김민성
Original Assignee
구자홍
Lg 전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, Lg 전자주식회사 filed Critical 구자홍
Priority to KR1019940034853A priority Critical patent/KR100332748B1/ko
Publication of KR960025316A publication Critical patent/KR960025316A/ko
Application granted granted Critical
Publication of KR100332748B1 publication Critical patent/KR100332748B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/081Search algorithms, e.g. Baum-Welch or Viterbi

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 음성인식의 벡터 양자화 검색방법에 관한 것으로, 종래에는 입력의 각 프레임에 대하여 전체 프레임과 비교하여 코드워드를 구하도록 함으로써 벡터 양자화시 양자화 과정시간이 많이 소요되는 문제점이 있다.
따라서 본 발명은 음성인식의 양자화 과정의 계산시간을 줄임으로써 인성인식을 실시간에 처리할 수 있도록 한다.

Description

음성인식의 벡터 양자화 검색방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제2도는 음성의 벡터 양자화 방법 설명도, 제3도는 본 발명 음성인식의 벡터 양자화 검색방법에 대한 흐름도.

Claims (2)

  1. 입력음성의 첫프레임의 양자화된 코드워드를 코드북의 전체 코드워드와 비교하여 최소거리를 갖는 코드워드를 선택하는 단계와, 상기 단계에서 전 프레임의 코드워드와 그 다음 프레임의 입력을 비교하여 거리를 구하는 단계와, 상기 단계에서 구한 거리가 평균거리와 분산거리의 합보다 크면 전체 코드워드와 비교하고, 아니면전 프레임 코드워드에 해당하는 선택된 코드워드만으로 비교하여 양자화 코드워드를 구하는 단계와, 전 음성구간에 대하여 상기 단계를 반복하여 양자화 코드워드를 구하도록 하는 단계로 이루어진 것을 특징으로 하는음성인식의 벡터 양자화 검색방법.
  2. 제1항에 있어서, 선택된 코드워드는 훈련음성을 코드북으로 양자화 했을 때 평균거리와 분산거리를 구한후 코드북 각각의 코드워드 상호거리를 계산하고 그 거리가 평균거리와 분산거리의 합의 2배보다 작으면 해당코드워드에 대한 선택된 코드워드를 S[Wi][m]에 저장해 놓도록 한 것을 특징으로 하는 음성인식의 벡터 양자화 검색방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019940034853A 1994-12-17 1994-12-17 음성인식의벡터양자화검색방법 KR100332748B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940034853A KR100332748B1 (ko) 1994-12-17 1994-12-17 음성인식의벡터양자화검색방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940034853A KR100332748B1 (ko) 1994-12-17 1994-12-17 음성인식의벡터양자화검색방법

Publications (2)

Publication Number Publication Date
KR960025316A true KR960025316A (ko) 1996-07-20
KR100332748B1 KR100332748B1 (ko) 2002-10-25

Family

ID=37479515

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940034853A KR100332748B1 (ko) 1994-12-17 1994-12-17 음성인식의벡터양자화검색방법

Country Status (1)

Country Link
KR (1) KR100332748B1 (ko)

Also Published As

Publication number Publication date
KR100332748B1 (ko) 2002-10-25

Similar Documents

Publication Publication Date Title
Giacobello et al. Sparse linear prediction and its applications to speech processing
AU712412B2 (en) Speech processing
US6529872B1 (en) Method for noise adaptation in automatic speech recognition using transformed matrices
US20050021330A1 (en) Speech recognition apparatus capable of improving recognition rate regardless of average duration of phonemes
KR910008975A (ko) 오디오 신호 처리 방법
US5568514A (en) Signal quantizer with reduced output fluctuation
KR940012931A (ko) 코드북 여기 선형 예측 서치 루프 용도의 적응 피치 펄스 강화기
Watanabe et al. High speed speech recognition using tree-structured probability density function
CA2090205C (en) Speech coding system
KR970002849A (ko) 고정된 코드북을 사용하는 음성 코딩 시스템
CN117496960A (zh) 语音识别模型的训练方法、装置、电子设备及存储介质
KR960025316A (ko) 음성인식의 벡터 양자화 검색방법
JP2658816B2 (ja) 音声のピッチ符号化装置
JP3209248B2 (ja) 音声の励振信号符号化法
KR970050118A (ko) 음성인식의 자동모델 결정방법
JP3471542B2 (ja) 音声符号化装置
KR100322730B1 (ko) 화자적응방법
Cuperman Speech coding
JP3144203B2 (ja) ベクトル量子化装置
KR970007791A (ko) 관찰벡터의 디스토션 확률밀도(Distortion density)를 가진 은닉 마코프 모델(Hidden Markov Model)을 이용한 음성인식 방법
JP3095758B2 (ja) ベクトル量子化のコードベクトル検索方法
JP3209247B2 (ja) 音声の励振信号符号化法
KR100624545B1 (ko) 티티에스 시스템의 음성압축 및 합성방법
KR960039988A (ko) 윤곽선 부호기
Scagliola et al. Two novel algorithms for variable frame analysis and word matching for connected word recognition

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070329

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee