KR20000040579A - Lpc 계수를 이용한 이동통신 단말기 음성인식 방법 - Google Patents
Lpc 계수를 이용한 이동통신 단말기 음성인식 방법 Download PDFInfo
- Publication number
- KR20000040579A KR20000040579A KR1019980056241A KR19980056241A KR20000040579A KR 20000040579 A KR20000040579 A KR 20000040579A KR 1019980056241 A KR1019980056241 A KR 1019980056241A KR 19980056241 A KR19980056241 A KR 19980056241A KR 20000040579 A KR20000040579 A KR 20000040579A
- Authority
- KR
- South Korea
- Prior art keywords
- lpc
- lsp
- mobile communication
- communication terminal
- signal
- Prior art date
Links
- 238000010295 mobile communication Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 title claims abstract description 11
- 238000001228 spectrum Methods 0.000 abstract description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
본 발명은 음성의 PCM(pulse code modulation) 데이터를 직접 이용하지 않고 이동통신 단말기의 보코더(VOCODER) 출력인 LSP 코드(line spectrum pair code)로부터 LPC(linear predictive coding) 계수를 추출하여 음성 인식에 사용되는 LPC 계수를 이용한 이동통신 단말기 음성인식 방법에 관한 것으로서, 일정한 패킷의 형태로 입력되는 데이터를 입력받아 상기 패킷중에서 LSP 코드 정보만을 추출하는 단계(S1)와, 상기 단계(S1)에서 추출된 LSP 코드 정보를 LSP 주파수로 변환하는 단계(S2)와, 상기 단계(S2)로부터 출력되는 신호를 입력받아 로우 패스 필터를 통해서 저주파수 성분의 신호만을 통과하는 단계(S3)와, 상기 단계(S3)를 수행한 후 음성 인식부에서 음성 신호를 용이하게 인식하도록 LSP 주파수를 LPC 계수로 변환하는 단계(S4)와, 상기 단계(S4)의 수행으로 LPC 계수로 변환 된 신호를 입력받아 LPC 셉스트럼으로 변환하는 단계(S5)로 이루어져 있어서, 데이터의 계산량을 현저히 감소시킬 수 있어서 데이터의 처리속도를 향상시킬 수 있는 발명이다.
Description
본 발명은 이동 통신 단말기에서의 음성 인식에 관한 것으로서, 특히 음성의 PCM(pulse code modulation) 데이터를 직접 이용하지 않고 이동통신 단말기의 보코더(VOCODER) 출력인 LSP 코드(line spectrum pair code)로부터 LPC(linear predictive coding) 계수를 추출하여 음성 인식에 사용되는 LPC 계수를 이용한 이동통신 단말기 음성인식 방법에 관한 것이다.
종래의 음성인식을 위한 음성의 특정계수로 많이 사용되는 LPC 셉스트럼(cepstrum) 계수는 보통의 경우 PCM 데이터로부터 얻어지게 된다. 이러한 경우 자기 상관계수(autocorrelation coefficients)를 이용하게 되는데, 이런 경우 계산량이 상당히 증가하게 됨으로써, 시스템의 동작 속도가 저하되는 문제점이 있었다.
상기와 같은 문제점을 해결하기 위한 본 발명은, 이동통신 단말기에서 음성의 특정 계수를 보코더 출력인 LSP 코드로부터 추출하고, 패킷의 레이트 정보를 이용하여 음성 신호를 인식하는 LPC 계수를 이용한 이동통신 단말기 음성인식 방법을 제공하는데 있다.
상기와 같은 목적을 달성하기 위한 본 발명의 LPC 계수를 이용한 이동통신 단말기 음성인식 방법은, 일정한 패킷의 형태로 입력되는 데이터를 입력받아 상기 패킷중에서 LSP 코드 정보만을 추출하는 단계(S1)와, 상기 단계(S1)에서 추출된 LSP 코드 정보를 LSP 주파수로 변환하는 단계(S2)와, 상기 단계(S2)로부터 출력되는 신호를 입력받아 로우 패스 필터를 통해서 저주파수 성분의 신호만을 통과하는 단계(S3)와, 상기 단계(S3)를 수행한 후 음성 인식부에서 음성 신호를 용이하게 인식하도록 LSP 주파수를 LPC 계수로 변환하는 단계(S4)와, 상기 단계(S4)의 수행으로 LPC 계수로 변환 된 신호를 입력받아 LPC 셉스트럼으로 변환하는 단계(S5)로 이루어져 있는 것을 특징으로 한다.
도 1은 본 발명의 LPC 계수를 이용한 이동통신 단말기 음성인식 장치에 대한 개략적인 블록도이며,
도 2는 본 발명의 LPC 계수를 이용한 이동통신 단말기 음성인식 방법에 대한 흐름도이다.
도면의 주요부분에 대한 부호의 설명
11 : 마이크로폰 12 : 보코더
14 : 마이컴 16 : 음성 인식부
18 : 구동부
본 발명의 LPC 계수를 이용한 이동통신 단말기 음성인식 방법을 첨부한 도면을 참고로 상세히 기술하면 다음과 같다.
도 1은 본 발명에 대한 개략적인 블럭도로서, 외부로부터 음성신호를 입력받아 전기신호로 변환하는 마이크로폰(microphone)(11)과, 상기 마이크로폰(11)에 의해서 음성 신호가 전기 신호로 변환된 신호를 PCM 코딩한 후 음성 신호의 데이터 크기를 감소시키기 위해서 일정한 형태의 패킷으로 출력하는 보코더(VOCODER)(12)와, 상기 보코더(12)에서 출력된 패킷 데이터(packet data)를 입력받아 음성 구간을 검출하고 음성 통신용 코드인 LSP 계수의 값을 음성 인식에 필요한 LPC 게수로 변환하는 마이컴(14)과, 상기 마이컴(14)으로부터 LPC 값을 입력받아 그 내부에 저장되어 있는 음성 신호와 비교하여 가장 유사한 단어를 인식하는 음성 인식부(16)와, 상기 음성 인식부(16)에서 출력되는 신호가 상기 마이컴(14)에 인가하면 상기 마이컴(14)에서 음성 신호의 내용에 따라 출력되는 제어신호에 의해서 단말기의 다이얼링(dialing)과 같은 동작을 수행하는 구동부(18)로 구성되어 있다.
상기 보코더(12)에서 출력되는 패킷 데이터는 레이트(rate), LSP, 피치(pitch) 및 코드북(codebook) 데이터를 포함하고 있으며, 상기 레이트는 다음의 조건에 의해서 결정된다.
R(0) TH3인 경우에는 레이트=1이고,
R(0) TH2 및 R(0) TH3인 경우에는 레이트= 이고,
R(0) TH1 및 R(0) TH2인 경우에는 레이트= 이고,
R(0) TH1인 경우에는 레이트= 이 된다.
단, 여기에서 TH1, TH2, TH3은 레이트를 결정하기 위한 임계값들로서 R(0)의 값에 따라 결정되며, R(0)은 현재 프레임의 에너지를 나타낸다.
그러므로, 레이트가 1인 경우에는 음성 신호를 나타내고, 레이트가 인 경우에는 묵음 또는 배경음을 나타내고, 레이트가 , 인 경우에는 음성과 묵음 사이의 과도구간을 나타낸다.
상기와 같이 구성된 본 발명의 작용, 효과를 첨부된 도면을 참고로 기술하면 다음과 같다.
먼저, 외부로부터 음성 신호가 마이크로폰(11)을 통해서 입력되면, 상기 마이크로폰(11)에 의해서 음성 신호가 전기신호로 변환된 후 보코더(12)에 입력되어 샘플링 레이트(sampling rate)로 샘플링된 후 레이트(rate)와 LSP(liner spect와 피치와 코드북 등의 정보를 갖는 데이터의 패킷으로 형성되며, 여기서, 레이트는 R(0)과 TH1, TH2, TH3의 값에 따라서 다양하게 변화고 이에 따라서 데이터 량도 변하게 된 후 마이컴(14)에 입력된다.
그러면 상기 마이컴(14)에서는 상기와 같이 일정한 패킷의 형태로 입력되는 데이터를 입력받아 상기 패킷중에서 LSP 코드 정보만을 추출하여(S1), 다음과 같은 식에 의해서(여기서, X는 LSP 주파수이고, Q(X)는 LSP 코드이며, Qmax 는 최대 양자화 레벨이고, Qmin 은 최소 양자화 레벨이며, N은 양자화 비트수이다. ) LSP 주파수로 변환된다(S2).
상기 제 2 단계(S2)로부터 LSP 주파수를 구한 후에는 도시되지 않은 로우 패스 필터(low pass filter)를 통해서 고주파 성분의 신호를 제거하고 저주파 성분의 신호만을 통과한다(S3).
이와 같기, 제 3 단계(S3)를 수행한 후 LSP 주파수 신호는 LPC 계수로 변환되어 상기 음성 인식부(16)에서 음성 신호를 용이하게 인식하도록 하며(S)4, 상기 단계(S)4에서 LPC 계수로 변환된 음성 신호는 다음과 같이,
1) iN인 경우(여기서, N은 LPC 차수임)에는, Cep[i]= - 이 되고,
2) i N인 경우(여기서, N은 LPC 차수임)에는 Cep[i]=
이 되도록(여기서, i, j는 인텍스(index)를 나타냄.) LPC 셉스트럼으로 변환되며(S5), 이때 보통의 경우에는 LPC 셉스트럼의 차수는 LPC 차수보다 크게 설정한다.
이와 같이, 음성 신호가 LPC 계수에서 LPC 셉스트럼으로 변환된 신호는 음성 인식부(16)에 입력되고, 상기 음성 인식부(16)에서는 상기 음성 인식부(16)에서 이미 저장하고 있는 음성 신호와 LPC 셉스트럼으로 변환된 신호를 비교하여 이들의 음성 신호가 동일한지 여부를 판단한 후 마이컴(14)에 출력한다.
그러면 상기 마이컴(14)에서는 상기 음성 인식부(16)로부터 출력되는 비교 결과를 입력받아 음성 신호의 내용에 따라 구동부(18)이 동작하도록 제어신호를 출력한다.
상기와 같이 구성된 본 발명의 LPC 계수를 이용한 이동통신 단말기 음성인식 방법은, 이동통신 단말기에서 통신용 코드인 LSP 코드로부터 바로 음성 특징 계수인 LPC 셉스트럼 계수를 추출하여 이를 음성 인식에 사용함으로써, 비록 하드웨어의 변화는 없더라도 음성의 PCM 데이터로부터 특징 계수를 추출하는 것에 비해서 계산량을 현저히 감소시킬 수 있는 발명이다.
Claims (3)
- 일정한 패킷의 형태로 입력되는 데이터를 입력받아 상기 패킷중에서 LSP 코드 정보만을 추출하는 단계(S1)와, 상기 단계(S1)에서 추출된 LSP 코드 정보를 LSP 주파수로 변환하는 단계(S2)와, 상기 단계(S2)로부터 출력되는 신호를 입력받아 로우 패스 필터를 통해서 저주파수 성분의 신호만을 통과하는 단계(S3)와, 상기 단계(S3)를 수행한 후 음성 인식부에서 음성 신호를 용이하게 인식하도록 LSP 주파수를 LPC 계수로 변환하는 단계(S4)와, 상기 단계(S4)의 수행으로 LPC 계수로 변환 된 신호를 입력받아 LPC 셉스트럼으로 변환하는 단계(S5)로 이루어져 있는 것을 특징으로 하는 LPC 계수를 이용한 이동통신 단말기 음성인식 방법.
- 제 1항에 있어서, 상기 단계(S1)에서의 패킷 데이터는 레이트(rate), LSP, 피치(pitch) 및 코드북(codebook) 데이터를 포함하고 있는 것을 특징으로 하는 LPC 계수를 이용한 이동통신 단말기 음성인식 방법.
- 제 2항에 있어서, 상기 레이트는 R(0) TH3인 경우에는 레이트=1이고, R(0) TH2 및 R(0) TH3인 경우에는 레이트=
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019980056241A KR100667522B1 (ko) | 1998-12-18 | 1998-12-18 | Lpc 계수를 이용한 이동통신 단말기 음성인식 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019980056241A KR100667522B1 (ko) | 1998-12-18 | 1998-12-18 | Lpc 계수를 이용한 이동통신 단말기 음성인식 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20000040579A true KR20000040579A (ko) | 2000-07-05 |
KR100667522B1 KR100667522B1 (ko) | 2007-05-17 |
Family
ID=19563810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019980056241A KR100667522B1 (ko) | 1998-12-18 | 1998-12-18 | Lpc 계수를 이용한 이동통신 단말기 음성인식 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100667522B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100460109B1 (ko) * | 2001-09-19 | 2004-12-03 | 엘지전자 주식회사 | 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 |
CN107767872A (zh) * | 2017-10-13 | 2018-03-06 | 深圳市汉普电子技术开发有限公司 | 语音识别方法、终端设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ZA948426B (en) * | 1993-12-22 | 1995-06-30 | Qualcomm Inc | Distributed voice recognition system |
KR950030565A (ko) * | 1994-04-29 | 1995-11-24 | 김광호 | 교환시스템에 있어서 음성인식방법 및 장치 |
KR100322693B1 (ko) * | 1995-06-29 | 2002-05-13 | 윤종용 | 선형예측분석합성을이용한음성인식방법 |
KR19980069012A (ko) * | 1997-02-25 | 1998-10-26 | 정장호 | 다층신경망을 이용한 음성인식 장치 |
-
1998
- 1998-12-18 KR KR1019980056241A patent/KR100667522B1/ko active IP Right Grant
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100460109B1 (ko) * | 2001-09-19 | 2004-12-03 | 엘지전자 주식회사 | 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 |
CN107767872A (zh) * | 2017-10-13 | 2018-03-06 | 深圳市汉普电子技术开发有限公司 | 语音识别方法、终端设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
KR100667522B1 (ko) | 2007-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1159736B1 (en) | Distributed voice recognition system | |
RU2291499C2 (ru) | Способ передачи речевой активности в распределенной системе распознавания голоса и система для его осуществления | |
EP1006509B1 (en) | Automatic speech/speaker recognition over digital wireless channels | |
EP1420389A1 (en) | Speech bandwidth extension apparatus and speech bandwidth extension method | |
WO2000017856A1 (en) | Method and apparatus for detecting voice activity in a speech signal | |
CN111508498A (zh) | 对话式语音识别方法、系统、电子设备和存储介质 | |
US6983242B1 (en) | Method for robust classification in speech coding | |
KR100698811B1 (ko) | 음성 인식 거부 방식 | |
US6226607B1 (en) | Method and apparatus for eighth-rate random number generation for speech coders | |
KR100366057B1 (ko) | 인간 청각 모델을 이용한 효율적인 음성인식 장치 | |
US5812966A (en) | Pitch searching time reducing method for code excited linear prediction vocoder using line spectral pair | |
KR100667522B1 (ko) | Lpc 계수를 이용한 이동통신 단말기 음성인식 방법 | |
Moattar et al. | A Weighted Feature Voting Approach for Robust and Real‐Time Voice Activity Detection | |
CN118379986B (zh) | 基于关键词的非标准语音识别方法、装置、设备及介质 | |
KR100269357B1 (ko) | 음성 인식 방법 | |
KR0138879B1 (ko) | 보코더용 피치검색 처리시간 단축법 | |
KR100446739B1 (ko) | 지연 피치 추출장치 | |
KR100322704B1 (ko) | 음성신호의지속시간변경방법 | |
JPH05323996A (ja) | 有音無音判定法 | |
JPH0457098A (ja) | 連続音声の音韻認識装置 | |
KR0138878B1 (ko) | 보코더용 피치검색 처리시간 단축법 | |
JPH02192335A (ja) | 語頭検出方式 | |
KR20010046522A (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | |
KR20000040569A (ko) | Hmm 모델의 유사성을 이용한 음성 인식 장치 및 방법 | |
KR20040056741A (ko) | 보코더의 피치 래그 추출 회로 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130102 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20131231 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20141230 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20151224 Year of fee payment: 10 |