KR0176751B1 - 음성인식 시스템의 특징추출방법 - Google Patents

음성인식 시스템의 특징추출방법 Download PDF

Info

Publication number
KR0176751B1
KR0176751B1 KR1019910018048A KR910018048A KR0176751B1 KR 0176751 B1 KR0176751 B1 KR 0176751B1 KR 1019910018048 A KR1019910018048 A KR 1019910018048A KR 910018048 A KR910018048 A KR 910018048A KR 0176751 B1 KR0176751 B1 KR 0176751B1
Authority
KR
South Korea
Prior art keywords
recognition system
speech recognition
linear energy
noise
feature
Prior art date
Application number
KR1019910018048A
Other languages
English (en)
Other versions
KR930008721A (ko
Inventor
김락용
Original Assignee
이헌조
엘지전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이헌조, 엘지전자주식회사 filed Critical 이헌조
Priority to KR1019910018048A priority Critical patent/KR0176751B1/ko
Publication of KR930008721A publication Critical patent/KR930008721A/ko
Application granted granted Critical
Publication of KR0176751B1 publication Critical patent/KR0176751B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

본 발명은 음성인식 시스템의 특징추출방법에 관한것으로, 종래에는 배경소음이 음성신호와 같이 입력되는 경우 기준패턴과의 차이에 의해서 음성인식 시스템의 성능이 떨어지므로, 본 발명은 소음 존재시 소음이 없는 조용한 환경에서 만들어진 표준패턴의 차이를 선형 정규화 방법을 이용해서 음원신호의 크기변화에 따른 영향은 물론 소음에 대한 영향을 거의 받지 않게 함으로써 인식시스템의 성능을 개선시키도록 한 것이다.
즉, 대역필터와 저역필터 및 정규화 과정으로 구성되는 특징 인자추출방법에 관한 것으로, 정규화 과정으로 구성되는 특징인자추출방법에 관한것으로, 정규화과정에서 선형에너지를 사용하는 점과 그 선형에너지를 평균화 및 최대값으로 나누는 방법으로 첨가소음에 대해 그 영향을 제거함으로써, 준 백색성의 잡음(소음)이 존재하는 실제환경에서 사용되는 음서인식 시스템의 특징추출과정에 중요한 용도로 쓰이게 된다.

Description

음성인식 시스템의 특징추출방법
제1도는 일반적인 음성인식 시스템의 블럭구성도.
제2도는 제1도에서 특징추출부(5)의 상세회로도.
제3도는 종래에 의한 정규화 방법을 보인 신호흐름도.
제4도는 본 발명에 의한 선형에너지를 이용하는 정규화 방법을 보인 신호흐름도.
제5도의 (a) 내지 (d)는 본 발명에 의한 클린 및 노이즈 스피치인 각 경우의 선형과 대수 스펙트럼을 보인 파형도.
제6도는 본 발명에 의한 대수향수의 특성도.
제7도의 (a) 내지 (f)는 본 발명에 의한 선형정규화 과정의 각 단계에서의 기준패턴과 테스트패턴의 스펙트럼 비교를 보인 파형도.
* 도면의 주요부분에 대한 부호의 설명
1 : 마이크 2 : 저역필터부
3 : 아날로그/디지탈변환부 4 : 끝점검출부
5 : 특징추출부 6 : 동적시간 와핑 및 거리측정부
7 : 기준패턴부 8 : 결정법칙부
9A-9N : 대역필터부 10A-10N : 비선형연산부
11A-11N : 저역필터부 12A-12N : 대수선택부
본 발명은 음성인식 시스템에 관한것으로, 특히 소음이 존재하는 경우 새로운 선형정규화 방법을 이용하여 필터뱅크 에너지를 특징 벡터로 사용하는 음성인식 시스템의 성능저하를 개선시키는데 적당하도록 한 음성인식 시스템의 특징추출방법에 관한것이다.
일반적인 음성인식 시스템은 제1도에 도시된 바와같이, 마이크(1)를 통해 입력된 음성신호S(t)를 저역필터부(2)를 거쳐 디지탈신호를 변환시키는 아날로그/디지탈변환부(3)와, 이 변환된 디지탈신호를 끝점검출부(4)를 통해 끝점을 검출한 후 특징인자를 추출하는 특징추출부(5)와 상기 특징추출부(5)로부터 추출된 특정인자와 기준패턴부(7)의 기준패턴에 의한 동적시간와핑(Dynamic Time Wiping)이 동작시간와이핑 및 측정거리에 의해 법칙을 결정하여 인신결과로 나타내는 결정법칙(8)으로 구성된다.
제2도는 제1도에 있어서, 특징추출부(5)의 상세도로서 이에 도시한 바와같이 상기 끝점검출부(4)를 통한 음성신호S(n)를 다수개의 대역필터부(9A-9N)에 의해 대역으로 필터링시킨후 각각의 비선형 연산부(10A-10N)와 저역필터부(11A-11N)를 통해 비선형으로 연산되어 저역필터링하며, 스위치(SW1-SWN)를 통한 대수선택부(12A-12N)는 얻어진 시간(m)에서 n번째 채널수에서의 대수에너지[X1(m)-XN(m)] 및 선형에너지[X1(m)-XN(m)]가 출력되어 구성되었다.
이와같이 구성된 종래의 회로는 제3도에 도시한 바와같이 정규화 방법을 보인 신호흐름도를 참조해 설명하면 다음과 같다.
먼저, 제1도에서와같이 마이크(1)를 통해 입력된 음성신호S(t)가 저역필터부(2), 아날로그/디지탈변환부(3), 끝점검출부(4)에 의해 끝점검출과정을 수행한후 제2도에서와같이 특징추출부(5)에서 특징인자를 추출한다.
즉, 상기 필터뱅크 에너지 추출과정에서 얻어진 시간(m)에서 채널(1)에서의 대수에너지를 X1(m)이라고 표시하면 그 시간(m)에서 특징 벡터 X(m)는 식(1)과 같다.
이와같이 상기 특징벡터[X(m)]는 다음과 같이 패턴(T)으로 표시할 수 있는데, T={X(1), X(2) -----X(M)} 실제 음성인식을 위한 특징인자로 사용하기 위해선 상기 특징벡터[X(m)]를 각 채널에너지의 평균값으로 정규화 시켜서 음원신호의 크기에 대한 영향을 줄이게 된다.
즉, 현 채널수(i)가 1이고 합(SUM)이 0이면 그 합(SUM)에다 i번쩨 채널수의 대수에너지 Xi(m)를 더하여 현채널(i)이 설정채널수(n)보다 같거나 크면 상기 각 채널의 대수에너지 Xi(m)에 의한 N개의 채널 평균치를 각 채널의 대수에너지 벡터 X(m)에서 빼서 음원신호에 대한 영향을 줄이게 된다.
이와같이 구해진 정규화된 특징벡터를 특징인지를 이용하여 기준패턴부(1)에 의한 동작시간와이칭 및 거리측정부(6)와 결정법칙부(8)를 거쳐서 인식결과를 얻게된다.
그러나, 이와같은 종래 음성인식 시스템의 특징추출방법은 배경소음이 음성신호와 같이 입력되는 경우 기준패턴과의 차이에 의해서 음성인식 시스템의 성능이 떨어진다.
즉, 이와같은 성능저하 현상은 특정벡터를 추출함에 있어 대수를 취함으로써 대수함수의 특성으로 말미암아 첨가 백색잡음이 존재시 더크게 되는 문제점이 있었다.
본 발명은 이와같은 종래의 문제점을 해결하기 위하여 대역통과 필터와 저역통과필터 및 정규화 과정으로 구성되는 특징추출방법에 있어서, 정규화 과정에서 선형에너지를 이용하므로 그 선형에너지를 평균화 및 최대값으로 나누는 방법으로 첨가 소음에 대해 그 영향을 제거할 수 있는 음성인식 시스템의 특징추출방법을 창안한 것으로, 이를 첨부한 도면을 참조해 설명하면 다음과 같다.
본 발명에 의한 음성인식 시스템의 블럭구성도와, 특징 추출부의 상세도는 제1도 및 제2도에 도시된바와같이, 종래와 동일한 것으로, 제1도에서 마이크(1)를 통해 입력된 음성신호 S(t)가 저역필터부(2)와 아날로그/디지탈변환부(3)를 통한후 끝점검출부(4)를 통해 특징추출부(5)에 입력되면, 제2도에서와같이 상기 특징추출부(5)는 대역필터부(9A-9N) 및 비선형연산부(10A-10N)를 통한후 에너지를 측정하기 위해 저역필터부(11A-11N)에 의해 저역필터링하여 음원신호 및 첨가잡음에 대한 영향을 줄이기 위해 정규화 과정을 거친다음, 제1도의 동적시간와핑 및 거리측정부(6)에서 기준패턴부(7)와 비교하여 결정법칙부(8)에 의해 인식결과를 얻도록 구성한다.
이와같이 구성한 본 발명의 작용 및 효과를 제4도의 선형에너지를 이용하는 정규화 방법의 신호흐름도와, 제5도의 클린 및 노이즈 스피치인 각 경우의 선형과 대수스펙트럼 파형도와, 제6도의 대수함수의 특성도 및 제7도의 선형정규화 과정의 각단계에서의 기준패턴과 테스트 패턴의 스펙트럼 비교파형도를 참조해 설명하면 다음과 같다.
먼저, 제1도에서와 같이 마이크(1)를 통해 입력된 음성신호 S(t)는 저역필터부(2) 및 아날로그/디지탈변환부(3)를 거쳐 끝점검출부(4)에서 끝점검출과정을 수행한후 특징추출부(5)를 통해 특징인자를 추출하게 된다.
즉, 이 특징추출과정은 제2도에서와같이 아날로그/디지탈변환된 음성신호 S(n)가 각각의 대역필터부(9A-9N) 및 비선형 연산부(10A-10N)를 거쳐 각 채널의 에너지를 계산하기 위해 각 저역필터부(11A-11N)를 통과한 후 스위치(SW1-SWN)에 의해 구해진 n차원의 특징벡터{x1(m)-xN(m)}를 제4도의 신호흐름도와 같이 정규화 과정을 수행한후 최종적인 특징인자로 사용한다.
그리고, 제5도의 (a)는 선형필터 뱅크에너지 벡터 X(m)를 음성 아에 대해 나타낸것으로, 제5도의 (b)는 이것에 대수 함수를 취한 결과이며, 여기에 첨가백색잡음이 존재하는 경우 음성신호 S(n)는 S'(n)=S(n) +N(n)이 되고, 이것의 선형에너지 스펙트럼과 대수스펙트럼은 제5도의 (c)와 (d)와 같이된다.
또한, 제6도에서 본 바와같이 대수함수의 특성상 큰값은 줄여주고, 작은값은 크게하는 비선형적인 맵핑(MAPPING)의 결과로 그 다이나믹레인지 △4가 △2에 비해 줄어들게 되어 상기 기준패턴부(7)와의 차이가 크게 발생해서 오인식이 된다.
따라서, 대수함수를 취하지 않은 선형스케일의 시간(m)에서 K번째 채널에너지를 xk(m)이라고 표시하면 시간(m)에서의 특징 벡터는 식(2)와 같고, 평균에너지및 평균값을 제거한 특징벡터는 각각 식(3), (4)와 같다.
그리고, 음원신호의 영향을 제거하기 위해 식(5)와 같이 정규화한다.
즉, 제4도의 신호흐름도에서 보면, 현채널수(i) 및 합(SUN)이 각 1과 0일때 그 합(SUM)에다 i번째의 선형에너지 xi(m)를 더하여 현채널수(i)가 설정채널수(n)보다 같거나 크면 상기 각 채널의 선형에너지 xi(m)에 의한 N개의 채널평균치를 각 채널의 선형에너지 벡터 X(m)에서 빼고 아니면 현채널수(i)를 1씩 증가시켜 상기와같이 반복수행한다.
그리고, 채널수(i)가 1이고 최대값(MAX)이 상기 평균값을 제거한 특징벡터이고 그 채널수(J)가 설정채널수(N)보다 작거나 같은가를 판별하여 j≤N이면 최대값(MAX)이 i번째 선형에너지 평균값과 같게되므로 상기채널수(j)를 1씩 증가시켜 수행하고, j≤N 아니면 그 최대값(MAX)과 상기 평균값 X(m)을 계산하여 최대값으로 정규화된 특징벡터을 얻는다.
따라서, 제7도의 (a) 내지 (f)와 같이 정규화과정을 거친동안의 기준음성패턴과 첨가백색잡음(N)이 있는 음성신호 시험패턴의 스펙트럼을 나타낸다.
즉, 상기 식(3) 내지 식(5)에 의해 (a)와 (f)는 기준패턴 및 테스트패턴의 선형에너지 x(m), x'(m)와 (b)와 (e)는 평균값을 제거한 선형에너지,와 (d)와 (f)는 최대값으로 정규화한 선형에너지로 나타내고 있다.
이상에서 상세히 설명한 바와같이 본 발명은 음성인식에 사용되는 특징인자로써 필터뱅크 에너지를 사용할때 기존의 대수함수를 거쳐 정규화하는 대신 선형에너지를 사용하여 정규화하는 방법을 사용함으로써 소음(첨가백색잡음)이 존재하는 환경에서 인식시스템의 성능저하를 개선할 수 있게된다.

Claims (1)

  1. 디지탈로 변환된 음성신호 S(n)를 각각의 대역필터부(9A-9N) 및 비선형연산부(10A-10N)를 통해 대역필터링 및 비선형으로 연산한다음 저역필터부(11A-11N) 및 스위치(SW1-SW2)에 의해 각 채널의 대수 및 선형에너지를 구하여 N차원의 특징벡터를 정규화 과정으로 수행하는 음성인식 시스템에 있어서, 현재 채널수(i)가 1이고 합(SUM)이 0인 초기상태에서 그 합에 기준패턴의 선형에너지{xi(m)}를 더하여 상기 채널수(i)가 설정채널수(N)보다 같거나 크면, 상기 선형 에너지에 의한 채널 평균값구하고, 이 평균값을 특징벡터[x(m)]에서 뺀 선형에너지가최대값이고 설정채널수(N)보다 현채널수(j)가 같거나 작으면 그 평균값을 제거한 선형에너지를 최대값(Max)으로 계산하여 정규화한 선형에너지로 나타내는 것을 특징으로 하는 음성인식 시스템의 특징추출방법.
KR1019910018048A 1991-10-14 1991-10-14 음성인식 시스템의 특징추출방법 KR0176751B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019910018048A KR0176751B1 (ko) 1991-10-14 1991-10-14 음성인식 시스템의 특징추출방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019910018048A KR0176751B1 (ko) 1991-10-14 1991-10-14 음성인식 시스템의 특징추출방법

Publications (2)

Publication Number Publication Date
KR930008721A KR930008721A (ko) 1993-05-21
KR0176751B1 true KR0176751B1 (ko) 1999-04-01

Family

ID=19321222

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019910018048A KR0176751B1 (ko) 1991-10-14 1991-10-14 음성인식 시스템의 특징추출방법

Country Status (1)

Country Link
KR (1) KR0176751B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007066933A1 (en) * 2005-12-08 2007-06-14 Electronics And Telecommunications Research Institute Voice recognition apparatus and method using vocal band signal
KR100738332B1 (ko) * 2005-10-28 2007-07-12 한국전자통신연구원 성대신호 인식 장치 및 그 방법
US7613611B2 (en) 2004-11-04 2009-11-03 Electronics And Telecommunications Research Institute Method and apparatus for vocal-cord signal recognition

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100587260B1 (ko) * 1998-11-13 2006-09-22 엘지전자 주식회사 음향 기기의 음성인식장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7613611B2 (en) 2004-11-04 2009-11-03 Electronics And Telecommunications Research Institute Method and apparatus for vocal-cord signal recognition
KR100738332B1 (ko) * 2005-10-28 2007-07-12 한국전자통신연구원 성대신호 인식 장치 및 그 방법
WO2007066933A1 (en) * 2005-12-08 2007-06-14 Electronics And Telecommunications Research Institute Voice recognition apparatus and method using vocal band signal

Also Published As

Publication number Publication date
KR930008721A (ko) 1993-05-21

Similar Documents

Publication Publication Date Title
US5583961A (en) Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands
Rabiner On the use of autocorrelation analysis for pitch detection
US20040165730A1 (en) Segmenting audio signals into auditory events
EP0838805B1 (en) Speech recognition apparatus using pitch intensity information
US5854999A (en) Method and system for speech recognition with compensation for variations in the speech environment
KR100827153B1 (ko) 음성 신호의 유성음화 비율 검출 장치 및 방법
KR0176751B1 (ko) 음성인식 시스템의 특징추출방법
US5159637A (en) Speech word recognizing apparatus using information indicative of the relative significance of speech features
JP3418005B2 (ja) 音声ピッチ検出装置
US20190028130A1 (en) Method and Device for Processing a Signal
KR100835993B1 (ko) 마스킹 확률을 이용한 음성 인식 전처리 방법 및 전처리장치
JPH10133688A (ja) 音声認識装置
CN113948088A (zh) 基于波形模拟的语音识别方法及装置
JPH0556520B2 (ko)
JPH05143098A (ja) スペクトル分析のための方法及び装置
KR100198057B1 (ko) 음성신호 특징 추출방법 및 장치
JPS6229799B2 (ko)
JP2966452B2 (ja) 音声認識装置の雑音除去システム
JP3023135B2 (ja) 音声認識装置
KR100381372B1 (ko) 음성특징 추출장치
JP3298658B2 (ja) 音声認識方式
JPS6126680B2 (ko)
JPS6334477B2 (ko)
JP2577891B2 (ja) 単語音声予備選択装置
JPS62159195A (ja) 音声パタン作成方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20060911

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee