KR970050118A - 음성인식의 자동모델 결정방법 - Google Patents
음성인식의 자동모델 결정방법 Download PDFInfo
- Publication number
- KR970050118A KR970050118A KR1019950058739A KR19950058739A KR970050118A KR 970050118 A KR970050118 A KR 970050118A KR 1019950058739 A KR1019950058739 A KR 1019950058739A KR 19950058739 A KR19950058739 A KR 19950058739A KR 970050118 A KR970050118 A KR 970050118A
- Authority
- KR
- South Korea
- Prior art keywords
- codebook
- model
- speech
- recognition
- models
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 8
- 230000001186 cumulative effect Effects 0.000 claims 2
- 238000013139 quantization Methods 0.000 claims 2
- 230000000694 effects Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명는 화자(話者)의 음성특성에 따라 다수개의 모델을 사용할 때 그 음성특성에 최적합한 모델을 자동으로 결정하도록 함과 아울러 모델수의 증가에 따른 처리시간을 단축하도록 하는 음성인식의 자동모델 결정방법에 과한 것으로, 일반적으로 화자의 음성특성으로 더 자세히 표현하기 위하여 다수개의 모델을 사용하는 경우에는 그 수에 비례하여 모델검색시간 증가하게 되어 결론적으로 인식시간이 증가되는 문제점이 있었으나, 본 발명에서는 소정 프레임 구간 동안의 특징벡터열과 가장 유사한 코드북을 선택한 다음 각 코드워드에 가중치를 주고, 입력음성 전체에 대하여 선택된 코드북의 코드워드와 양자화하여 그에 해당하는 모델을 인식결과로 함으로써 코드북 및 모델의 검색시간을 줄일 수 있어 음성인식의 고속화를 이룰 수 있는 효과가 있게 된다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제3도는 본 발명에 의거한 음성인식의 구성을 나타낸 도,
제5도는 본 발명 음성인식의 자동모델 결정방법을 나타낸 도.
Claims (1)
- 입력 음성에 대한 특징벡터를 추출하는 제1과정과, 상기 제1과정에 의하여 추출된 벡터열의 소정 프레임 구간 동아너에 대해 기 훈련된 다수개의 코드북으로 양자화한 다음 그 양자화 오차를 계산하여 그 누적 거리를 계산하는 제2과정과, 상기 제2과정에 의하여 계산된 누적 거리가 최소인 코드북을 선택하는 제3과정과, 상기 제3과정에 의하여 선택된 코드북의 코드워드에 가중치를 부여한 다음 입력음성 전체를 입력받아 선택된 코드북의 코드워드로써 양자화하는 제4과정과, 상기 제4과정에서 양자화에 사용된 코드북에 해당하는 모델을 선택하여 음성인식 결과로 출력하는 제5과정으로 이루어진 것을 특징으로 하는 음성인식의 자동모델 결정방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950058739A KR0176788B1 (ko) | 1995-12-27 | 1995-12-27 | 음성인식의 자동모델 결정방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950058739A KR0176788B1 (ko) | 1995-12-27 | 1995-12-27 | 음성인식의 자동모델 결정방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970050118A true KR970050118A (ko) | 1997-07-29 |
KR0176788B1 KR0176788B1 (ko) | 1999-04-01 |
Family
ID=19445074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950058739A KR0176788B1 (ko) | 1995-12-27 | 1995-12-27 | 음성인식의 자동모델 결정방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR0176788B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024053854A1 (ko) * | 2022-09-05 | 2024-03-14 | 서울대학교산학협력단 | 비터비 빔 서치를 이용한 레지듀얼 벡터 양자화 장치, 방법 및 컴퓨터 판독 가능 매체 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
-
1995
- 1995-12-27 KR KR1019950058739A patent/KR0176788B1/ko not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024053854A1 (ko) * | 2022-09-05 | 2024-03-14 | 서울대학교산학협력단 | 비터비 빔 서치를 이용한 레지듀얼 벡터 양자화 장치, 방법 및 컴퓨터 판독 가능 매체 |
Also Published As
Publication number | Publication date |
---|---|
KR0176788B1 (ko) | 1999-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022141678A1 (zh) | 语音合成方法、装置、设备及存储介质 | |
AU707355B2 (en) | Speech recognition | |
JP2746039B2 (ja) | 音声符号化方式 | |
US5033087A (en) | Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system | |
JPH0816187A (ja) | 音声分析における音声認識方法 | |
RU2009119491A (ru) | Способ и устройство кодирования кадров перехода в речевых сигналах | |
CN1924994B (zh) | 一种嵌入式语音合成方法及系统 | |
JPH05216500A (ja) | 音声符号化装置 | |
US11404045B2 (en) | Speech synthesis method and apparatus | |
JP2624130B2 (ja) | 音声符号化方式 | |
CN102063897B (zh) | 一种用于嵌入式语音合成系统的音库压缩及使用方法 | |
KR970050118A (ko) | 음성인식의 자동모델 결정방법 | |
CN115132170A (zh) | 语种分类方法、装置及计算机可读存储介质 | |
JPH08292797A (ja) | 音声符号化装置 | |
JP3256215B2 (ja) | 音声符号化装置 | |
CN118411979B (zh) | 合成语音的调整方法、训练方法及相关装置 | |
JP3252285B2 (ja) | 音声帯域信号符号化方法 | |
JP3578933B2 (ja) | 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体 | |
JP3024467B2 (ja) | 音声符号化装置 | |
JP3194930B2 (ja) | 音声符号化装置 | |
JP3144194B2 (ja) | 音声符号化装置 | |
KR930011740B1 (ko) | 유사단어 인식방법 | |
JP3428595B2 (ja) | 音声符号化方式 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JPH0844398A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20100929 Year of fee payment: 13 |
|
LAPS | Lapse due to unpaid annual fee |