KR20000040579A - Lpc 계수를 이용한 이동통신 단말기 음성인식 방법 - Google Patents

Lpc 계수를 이용한 이동통신 단말기 음성인식 방법 Download PDF

Info

Publication number
KR20000040579A
KR20000040579A KR1019980056241A KR19980056241A KR20000040579A KR 20000040579 A KR20000040579 A KR 20000040579A KR 1019980056241 A KR1019980056241 A KR 1019980056241A KR 19980056241 A KR19980056241 A KR 19980056241A KR 20000040579 A KR20000040579 A KR 20000040579A
Authority
KR
South Korea
Prior art keywords
lpc
lsp
mobile communication
communication terminal
signal
Prior art date
Application number
KR1019980056241A
Other languages
English (en)
Other versions
KR100667522B1 (ko
Inventor
박성희
정남호
황창업
권오일
Original Assignee
김영환
현대전자산업 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김영환, 현대전자산업 주식회사 filed Critical 김영환
Priority to KR1019980056241A priority Critical patent/KR100667522B1/ko
Publication of KR20000040579A publication Critical patent/KR20000040579A/ko
Application granted granted Critical
Publication of KR100667522B1 publication Critical patent/KR100667522B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 음성의 PCM(pulse code modulation) 데이터를 직접 이용하지 않고 이동통신 단말기의 보코더(VOCODER) 출력인 LSP 코드(line spectrum pair code)로부터 LPC(linear predictive coding) 계수를 추출하여 음성 인식에 사용되는 LPC 계수를 이용한 이동통신 단말기 음성인식 방법에 관한 것으로서, 일정한 패킷의 형태로 입력되는 데이터를 입력받아 상기 패킷중에서 LSP 코드 정보만을 추출하는 단계(S1)와, 상기 단계(S1)에서 추출된 LSP 코드 정보를 LSP 주파수로 변환하는 단계(S2)와, 상기 단계(S2)로부터 출력되는 신호를 입력받아 로우 패스 필터를 통해서 저주파수 성분의 신호만을 통과하는 단계(S3)와, 상기 단계(S3)를 수행한 후 음성 인식부에서 음성 신호를 용이하게 인식하도록 LSP 주파수를 LPC 계수로 변환하는 단계(S4)와, 상기 단계(S4)의 수행으로 LPC 계수로 변환 된 신호를 입력받아 LPC 셉스트럼으로 변환하는 단계(S5)로 이루어져 있어서, 데이터의 계산량을 현저히 감소시킬 수 있어서 데이터의 처리속도를 향상시킬 수 있는 발명이다.

Description

LPC 계수를 이용한 이동통신 단말기 음성인식 방법
본 발명은 이동 통신 단말기에서의 음성 인식에 관한 것으로서, 특히 음성의 PCM(pulse code modulation) 데이터를 직접 이용하지 않고 이동통신 단말기의 보코더(VOCODER) 출력인 LSP 코드(line spectrum pair code)로부터 LPC(linear predictive coding) 계수를 추출하여 음성 인식에 사용되는 LPC 계수를 이용한 이동통신 단말기 음성인식 방법에 관한 것이다.
종래의 음성인식을 위한 음성의 특정계수로 많이 사용되는 LPC 셉스트럼(cepstrum) 계수는 보통의 경우 PCM 데이터로부터 얻어지게 된다. 이러한 경우 자기 상관계수(autocorrelation coefficients)를 이용하게 되는데, 이런 경우 계산량이 상당히 증가하게 됨으로써, 시스템의 동작 속도가 저하되는 문제점이 있었다.
상기와 같은 문제점을 해결하기 위한 본 발명은, 이동통신 단말기에서 음성의 특정 계수를 보코더 출력인 LSP 코드로부터 추출하고, 패킷의 레이트 정보를 이용하여 음성 신호를 인식하는 LPC 계수를 이용한 이동통신 단말기 음성인식 방법을 제공하는데 있다.
상기와 같은 목적을 달성하기 위한 본 발명의 LPC 계수를 이용한 이동통신 단말기 음성인식 방법은, 일정한 패킷의 형태로 입력되는 데이터를 입력받아 상기 패킷중에서 LSP 코드 정보만을 추출하는 단계(S1)와, 상기 단계(S1)에서 추출된 LSP 코드 정보를 LSP 주파수로 변환하는 단계(S2)와, 상기 단계(S2)로부터 출력되는 신호를 입력받아 로우 패스 필터를 통해서 저주파수 성분의 신호만을 통과하는 단계(S3)와, 상기 단계(S3)를 수행한 후 음성 인식부에서 음성 신호를 용이하게 인식하도록 LSP 주파수를 LPC 계수로 변환하는 단계(S4)와, 상기 단계(S4)의 수행으로 LPC 계수로 변환 된 신호를 입력받아 LPC 셉스트럼으로 변환하는 단계(S5)로 이루어져 있는 것을 특징으로 한다.
도 1은 본 발명의 LPC 계수를 이용한 이동통신 단말기 음성인식 장치에 대한 개략적인 블록도이며,
도 2는 본 발명의 LPC 계수를 이용한 이동통신 단말기 음성인식 방법에 대한 흐름도이다.
도면의 주요부분에 대한 부호의 설명
11 : 마이크로폰 12 : 보코더
14 : 마이컴 16 : 음성 인식부
18 : 구동부
본 발명의 LPC 계수를 이용한 이동통신 단말기 음성인식 방법을 첨부한 도면을 참고로 상세히 기술하면 다음과 같다.
도 1은 본 발명에 대한 개략적인 블럭도로서, 외부로부터 음성신호를 입력받아 전기신호로 변환하는 마이크로폰(microphone)(11)과, 상기 마이크로폰(11)에 의해서 음성 신호가 전기 신호로 변환된 신호를 PCM 코딩한 후 음성 신호의 데이터 크기를 감소시키기 위해서 일정한 형태의 패킷으로 출력하는 보코더(VOCODER)(12)와, 상기 보코더(12)에서 출력된 패킷 데이터(packet data)를 입력받아 음성 구간을 검출하고 음성 통신용 코드인 LSP 계수의 값을 음성 인식에 필요한 LPC 게수로 변환하는 마이컴(14)과, 상기 마이컴(14)으로부터 LPC 값을 입력받아 그 내부에 저장되어 있는 음성 신호와 비교하여 가장 유사한 단어를 인식하는 음성 인식부(16)와, 상기 음성 인식부(16)에서 출력되는 신호가 상기 마이컴(14)에 인가하면 상기 마이컴(14)에서 음성 신호의 내용에 따라 출력되는 제어신호에 의해서 단말기의 다이얼링(dialing)과 같은 동작을 수행하는 구동부(18)로 구성되어 있다.
상기 보코더(12)에서 출력되는 패킷 데이터는 레이트(rate), LSP, 피치(pitch) 및 코드북(codebook) 데이터를 포함하고 있으며, 상기 레이트는 다음의 조건에 의해서 결정된다.
R(0) TH3인 경우에는 레이트=1이고,
R(0) TH2 및 R(0) TH3인 경우에는 레이트= 이고,
R(0) TH1 및 R(0) TH2인 경우에는 레이트= 이고,
R(0) TH1인 경우에는 레이트= 이 된다.
단, 여기에서 TH1, TH2, TH3은 레이트를 결정하기 위한 임계값들로서 R(0)의 값에 따라 결정되며, R(0)은 현재 프레임의 에너지를 나타낸다.
그러므로, 레이트가 1인 경우에는 음성 신호를 나타내고, 레이트가 인 경우에는 묵음 또는 배경음을 나타내고, 레이트가 , 인 경우에는 음성과 묵음 사이의 과도구간을 나타낸다.
상기와 같이 구성된 본 발명의 작용, 효과를 첨부된 도면을 참고로 기술하면 다음과 같다.
먼저, 외부로부터 음성 신호가 마이크로폰(11)을 통해서 입력되면, 상기 마이크로폰(11)에 의해서 음성 신호가 전기신호로 변환된 후 보코더(12)에 입력되어 샘플링 레이트(sampling rate)로 샘플링된 후 레이트(rate)와 LSP(liner spect와 피치와 코드북 등의 정보를 갖는 데이터의 패킷으로 형성되며, 여기서, 레이트는 R(0)과 TH1, TH2, TH3의 값에 따라서 다양하게 변화고 이에 따라서 데이터 량도 변하게 된 후 마이컴(14)에 입력된다.
그러면 상기 마이컴(14)에서는 상기와 같이 일정한 패킷의 형태로 입력되는 데이터를 입력받아 상기 패킷중에서 LSP 코드 정보만을 추출하여(S1), 다음과 같은 식에 의해서(여기서, X는 LSP 주파수이고, Q(X)는 LSP 코드이며, Qmax 는 최대 양자화 레벨이고, Qmin 은 최소 양자화 레벨이며, N은 양자화 비트수이다. ) LSP 주파수로 변환된다(S2).
상기 제 2 단계(S2)로부터 LSP 주파수를 구한 후에는 도시되지 않은 로우 패스 필터(low pass filter)를 통해서 고주파 성분의 신호를 제거하고 저주파 성분의 신호만을 통과한다(S3).
이와 같기, 제 3 단계(S3)를 수행한 후 LSP 주파수 신호는 LPC 계수로 변환되어 상기 음성 인식부(16)에서 음성 신호를 용이하게 인식하도록 하며(S)4, 상기 단계(S)4에서 LPC 계수로 변환된 음성 신호는 다음과 같이,
1) iN인 경우(여기서, N은 LPC 차수임)에는, Cep[i]= - 이 되고,
2) i N인 경우(여기서, N은 LPC 차수임)에는 Cep[i]=
이 되도록(여기서, i, j는 인텍스(index)를 나타냄.) LPC 셉스트럼으로 변환되며(S5), 이때 보통의 경우에는 LPC 셉스트럼의 차수는 LPC 차수보다 크게 설정한다.
이와 같이, 음성 신호가 LPC 계수에서 LPC 셉스트럼으로 변환된 신호는 음성 인식부(16)에 입력되고, 상기 음성 인식부(16)에서는 상기 음성 인식부(16)에서 이미 저장하고 있는 음성 신호와 LPC 셉스트럼으로 변환된 신호를 비교하여 이들의 음성 신호가 동일한지 여부를 판단한 후 마이컴(14)에 출력한다.
그러면 상기 마이컴(14)에서는 상기 음성 인식부(16)로부터 출력되는 비교 결과를 입력받아 음성 신호의 내용에 따라 구동부(18)이 동작하도록 제어신호를 출력한다.
상기와 같이 구성된 본 발명의 LPC 계수를 이용한 이동통신 단말기 음성인식 방법은, 이동통신 단말기에서 통신용 코드인 LSP 코드로부터 바로 음성 특징 계수인 LPC 셉스트럼 계수를 추출하여 이를 음성 인식에 사용함으로써, 비록 하드웨어의 변화는 없더라도 음성의 PCM 데이터로부터 특징 계수를 추출하는 것에 비해서 계산량을 현저히 감소시킬 수 있는 발명이다.

Claims (3)

  1. 일정한 패킷의 형태로 입력되는 데이터를 입력받아 상기 패킷중에서 LSP 코드 정보만을 추출하는 단계(S1)와, 상기 단계(S1)에서 추출된 LSP 코드 정보를 LSP 주파수로 변환하는 단계(S2)와, 상기 단계(S2)로부터 출력되는 신호를 입력받아 로우 패스 필터를 통해서 저주파수 성분의 신호만을 통과하는 단계(S3)와, 상기 단계(S3)를 수행한 후 음성 인식부에서 음성 신호를 용이하게 인식하도록 LSP 주파수를 LPC 계수로 변환하는 단계(S4)와, 상기 단계(S4)의 수행으로 LPC 계수로 변환 된 신호를 입력받아 LPC 셉스트럼으로 변환하는 단계(S5)로 이루어져 있는 것을 특징으로 하는 LPC 계수를 이용한 이동통신 단말기 음성인식 방법.
  2. 제 1항에 있어서, 상기 단계(S1)에서의 패킷 데이터는 레이트(rate), LSP, 피치(pitch) 및 코드북(codebook) 데이터를 포함하고 있는 것을 특징으로 하는 LPC 계수를 이용한 이동통신 단말기 음성인식 방법.
  3. 제 2항에 있어서, 상기 레이트는 R(0) TH3인 경우에는 레이트=1이고, R(0) TH2 및 R(0) TH3인 경우에는 레이트= 이고, R(0) TH1 및 R(0) TH2인 경우에는 레이트= 이고, R(0) TH1인 경우에는 레이트= 이 되는 것을 특징으로 하는 LPC 계수를 이용한 이동통신 단말기 음성인식 방법.
KR1019980056241A 1998-12-18 1998-12-18 Lpc 계수를 이용한 이동통신 단말기 음성인식 방법 KR100667522B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980056241A KR100667522B1 (ko) 1998-12-18 1998-12-18 Lpc 계수를 이용한 이동통신 단말기 음성인식 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980056241A KR100667522B1 (ko) 1998-12-18 1998-12-18 Lpc 계수를 이용한 이동통신 단말기 음성인식 방법

Publications (2)

Publication Number Publication Date
KR20000040579A true KR20000040579A (ko) 2000-07-05
KR100667522B1 KR100667522B1 (ko) 2007-05-17

Family

ID=19563810

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980056241A KR100667522B1 (ko) 1998-12-18 1998-12-18 Lpc 계수를 이용한 이동통신 단말기 음성인식 방법

Country Status (1)

Country Link
KR (1) KR100667522B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100460109B1 (ko) * 2001-09-19 2004-12-03 엘지전자 주식회사 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
CN107767872A (zh) * 2017-10-13 2018-03-06 深圳市汉普电子技术开发有限公司 语音识别方法、终端设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ZA948426B (en) * 1993-12-22 1995-06-30 Qualcomm Inc Distributed voice recognition system
KR950030565A (ko) * 1994-04-29 1995-11-24 김광호 교환시스템에 있어서 음성인식방법 및 장치
KR100322693B1 (ko) * 1995-06-29 2002-05-13 윤종용 선형예측분석합성을이용한음성인식방법
KR19980069012A (ko) * 1997-02-25 1998-10-26 정장호 다층신경망을 이용한 음성인식 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100460109B1 (ko) * 2001-09-19 2004-12-03 엘지전자 주식회사 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
CN107767872A (zh) * 2017-10-13 2018-03-06 深圳市汉普电子技术开发有限公司 语音识别方法、终端设备及存储介质

Also Published As

Publication number Publication date
KR100667522B1 (ko) 2007-05-17

Similar Documents

Publication Publication Date Title
EP1159736B1 (en) Distributed voice recognition system
RU2291499C2 (ru) Способ передачи речевой активности в распределенной системе распознавания голоса и система для его осуществления
EP1006509B1 (en) Automatic speech/speaker recognition over digital wireless channels
EP1420389A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
WO2000017856A1 (en) Method and apparatus for detecting voice activity in a speech signal
CN111508498A (zh) 对话式语音识别方法、系统、电子设备和存储介质
US6983242B1 (en) Method for robust classification in speech coding
KR100698811B1 (ko) 음성 인식 거부 방식
US6226607B1 (en) Method and apparatus for eighth-rate random number generation for speech coders
KR100366057B1 (ko) 인간 청각 모델을 이용한 효율적인 음성인식 장치
US5812966A (en) Pitch searching time reducing method for code excited linear prediction vocoder using line spectral pair
KR100667522B1 (ko) Lpc 계수를 이용한 이동통신 단말기 음성인식 방법
Moattar et al. A Weighted Feature Voting Approach for Robust and Real‐Time Voice Activity Detection
CN118379986B (zh) 基于关键词的非标准语音识别方法、装置、设备及介质
KR100269357B1 (ko) 음성 인식 방법
KR0138879B1 (ko) 보코더용 피치검색 처리시간 단축법
KR100446739B1 (ko) 지연 피치 추출장치
KR100322704B1 (ko) 음성신호의지속시간변경방법
JPH05323996A (ja) 有音無音判定法
JPH0457098A (ja) 連続音声の音韻認識装置
KR0138878B1 (ko) 보코더용 피치검색 처리시간 단축법
JPH02192335A (ja) 語頭検出方式
KR20010046522A (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
KR20000040569A (ko) Hmm 모델의 유사성을 이용한 음성 인식 장치 및 방법
KR20040056741A (ko) 보코더의 피치 래그 추출 회로

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130102

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131231

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20141230

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20151224

Year of fee payment: 10