KR970050118A - 음성인식의 자동모델 결정방법 - Google Patents

음성인식의 자동모델 결정방법 Download PDF

Info

Publication number
KR970050118A
KR970050118A KR1019950058739A KR19950058739A KR970050118A KR 970050118 A KR970050118 A KR 970050118A KR 1019950058739 A KR1019950058739 A KR 1019950058739A KR 19950058739 A KR19950058739 A KR 19950058739A KR 970050118 A KR970050118 A KR 970050118A
Authority
KR
South Korea
Prior art keywords
codebook
model
speech
recognition
models
Prior art date
Application number
KR1019950058739A
Other languages
English (en)
Other versions
KR0176788B1 (ko
Inventor
김민성
Original Assignee
구자홍
Lg 전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, Lg 전자주식회사 filed Critical 구자홍
Priority to KR1019950058739A priority Critical patent/KR0176788B1/ko
Publication of KR970050118A publication Critical patent/KR970050118A/ko
Application granted granted Critical
Publication of KR0176788B1 publication Critical patent/KR0176788B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명는 화자(話者)의 음성특성에 따라 다수개의 모델을 사용할 때 그 음성특성에 최적합한 모델을 자동으로 결정하도록 함과 아울러 모델수의 증가에 따른 처리시간을 단축하도록 하는 음성인식의 자동모델 결정방법에 과한 것으로, 일반적으로 화자의 음성특성으로 더 자세히 표현하기 위하여 다수개의 모델을 사용하는 경우에는 그 수에 비례하여 모델검색시간 증가하게 되어 결론적으로 인식시간이 증가되는 문제점이 있었으나, 본 발명에서는 소정 프레임 구간 동안의 특징벡터열과 가장 유사한 코드북을 선택한 다음 각 코드워드에 가중치를 주고, 입력음성 전체에 대하여 선택된 코드북의 코드워드와 양자화하여 그에 해당하는 모델을 인식결과로 함으로써 코드북 및 모델의 검색시간을 줄일 수 있어 음성인식의 고속화를 이룰 수 있는 효과가 있게 된다.

Description

음성인식의 자동모델 결정방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제3도는 본 발명에 의거한 음성인식의 구성을 나타낸 도,
제5도는 본 발명 음성인식의 자동모델 결정방법을 나타낸 도.

Claims (1)

  1. 입력 음성에 대한 특징벡터를 추출하는 제1과정과, 상기 제1과정에 의하여 추출된 벡터열의 소정 프레임 구간 동아너에 대해 기 훈련된 다수개의 코드북으로 양자화한 다음 그 양자화 오차를 계산하여 그 누적 거리를 계산하는 제2과정과, 상기 제2과정에 의하여 계산된 누적 거리가 최소인 코드북을 선택하는 제3과정과, 상기 제3과정에 의하여 선택된 코드북의 코드워드에 가중치를 부여한 다음 입력음성 전체를 입력받아 선택된 코드북의 코드워드로써 양자화하는 제4과정과, 상기 제4과정에서 양자화에 사용된 코드북에 해당하는 모델을 선택하여 음성인식 결과로 출력하는 제5과정으로 이루어진 것을 특징으로 하는 음성인식의 자동모델 결정방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019950058739A 1995-12-27 1995-12-27 음성인식의 자동모델 결정방법 KR0176788B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950058739A KR0176788B1 (ko) 1995-12-27 1995-12-27 음성인식의 자동모델 결정방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950058739A KR0176788B1 (ko) 1995-12-27 1995-12-27 음성인식의 자동모델 결정방법

Publications (2)

Publication Number Publication Date
KR970050118A true KR970050118A (ko) 1997-07-29
KR0176788B1 KR0176788B1 (ko) 1999-04-01

Family

ID=19445074

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950058739A KR0176788B1 (ko) 1995-12-27 1995-12-27 음성인식의 자동모델 결정방법

Country Status (1)

Country Link
KR (1) KR0176788B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024053854A1 (ko) * 2022-09-05 2024-03-14 서울대학교산학협력단 비터비 빔 서치를 이용한 레지듀얼 벡터 양자화 장치, 방법 및 컴퓨터 판독 가능 매체

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE521225C2 (sv) * 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024053854A1 (ko) * 2022-09-05 2024-03-14 서울대학교산학협력단 비터비 빔 서치를 이용한 레지듀얼 벡터 양자화 장치, 방법 및 컴퓨터 판독 가능 매체

Also Published As

Publication number Publication date
KR0176788B1 (ko) 1999-04-01

Similar Documents

Publication Publication Date Title
WO2022141678A1 (zh) 语音合成方法、装置、设备及存储介质
AU707355B2 (en) Speech recognition
JP2746039B2 (ja) 音声符号化方式
US5033087A (en) Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system
JPH0816187A (ja) 音声分析における音声認識方法
RU2009119491A (ru) Способ и устройство кодирования кадров перехода в речевых сигналах
CN1924994B (zh) 一种嵌入式语音合成方法及系统
JPH05216500A (ja) 音声符号化装置
US11404045B2 (en) Speech synthesis method and apparatus
JP2624130B2 (ja) 音声符号化方式
CN102063897B (zh) 一种用于嵌入式语音合成系统的音库压缩及使用方法
KR970050118A (ko) 음성인식의 자동모델 결정방법
CN115132170A (zh) 语种分类方法、装置及计算机可读存储介质
JPH08292797A (ja) 音声符号化装置
JP3256215B2 (ja) 音声符号化装置
CN118411979B (zh) 合成语音的调整方法、训练方法及相关装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3578933B2 (ja) 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体
JP3024467B2 (ja) 音声符号化装置
JP3194930B2 (ja) 音声符号化装置
JP3144194B2 (ja) 音声符号化装置
KR930011740B1 (ko) 유사단어 인식방법
JP3428595B2 (ja) 音声符号化方式
JP3192051B2 (ja) 音声符号化装置
JPH0844398A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100929

Year of fee payment: 13

LAPS Lapse due to unpaid annual fee