KR100282555B1 - 음성 인식 속도 향상을 위한 동적 시간 와핑 방법 - Google Patents
음성 인식 속도 향상을 위한 동적 시간 와핑 방법 Download PDFInfo
- Publication number
- KR100282555B1 KR100282555B1 KR1019990003701A KR19990003701A KR100282555B1 KR 100282555 B1 KR100282555 B1 KR 100282555B1 KR 1019990003701 A KR1019990003701 A KR 1019990003701A KR 19990003701 A KR19990003701 A KR 19990003701A KR 100282555 B1 KR100282555 B1 KR 100282555B1
- Authority
- KR
- South Korea
- Prior art keywords
- cumulative distance
- test pattern
- dynamic time
- time warping
- point
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 230000002708 enhancing effect Effects 0.000 title 1
- 230000001186 cumulative effect Effects 0.000 claims abstract description 101
- 238000004364 calculation method Methods 0.000 claims abstract description 69
- 239000013598 vector Substances 0.000 claims abstract description 21
- LFYJSSARVMHQJB-QIXNEVBVSA-N bakuchiol Chemical compound CC(C)=CCC[C@@](C)(C=C)\C=C\C1=CC=C(O)C=C1 LFYJSSARVMHQJB-QIXNEVBVSA-N 0.000 claims description 26
- 230000001965 increasing effect Effects 0.000 claims description 23
- 230000007717 exclusion Effects 0.000 claims description 13
- 238000007689 inspection Methods 0.000 claims 10
- 238000009825 accumulation Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/12—Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 동적 시간 와핑 방법과 그를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 소정의 크기 이상의 값에 대해서는 연산을 수행하지 않는 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법과 그 기록매체를 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 입력된 음성의 음성 특징 벡터를 테스트 패턴으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴으로 하며, 테스트 패턴을 연산의 우선순위로 하여, 테스트 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 단계; 테스트 패턴의 소정의 위치에서 가능한 모든 기준 패턴 위치에 대하여, 누적거리 연산에 의해 얻어진 누적거리가 소정의 값을 넘어서는 기준 패턴 위치를 누적거리 연산의 대상에서 제외하는 제 2 단계; 및 제외된 기준 패턴 위치를 감안하여 누적거리 연산을 테스트 패턴의 끝까지 수행하는 제 3 단계를 포함함.
4. 발명의 중요한 용도
본 발명은 음성 인식 시스템 등에 이용됨.
Description
본 발명은 음성 인식 시스템에 적용되는 음성 인식 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 특히 음성 인식 방법 중의 하나인 동적 시간 와핑(DTW : Dynamic Time Warping) 방법의 연산 속도를 개선한 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
도 1 은 일반적인 음성 인식 시스템의 구성예시도이다.
일반적인 음성 인식 시스템은 크게 끝점 검출기(101), 특징 추출기(102) 및 인식기(103)의 세 부분으로 구성된다. 끝점 검출기(101)는 입력 신호로부터 음성 신호 구간만을 찾아 내며, 특징 추출기(102)는 찾아진 음성 신호 구간에서 인식을 위해 필요한 음성 특징 벡터를 추출하고, 인식기(103)는 이렇게 찾아진 음성 특징 벡터로부터 음성을 인식한다.
일반적으로 음성 인식 시스템에서는 동적 시간 와핑(DTW) 방법을 이용하여 현재 입력된 음성과 기존의 저장된 음성을 비교하여 음성을 인식하게 된다.
도 2 는 일반적인 동적 시간 와핑(DTW) 방법의 설명예시도이다.
동적 시간 와핑(DTW) 방법은 테스트 패턴(test pattern)과 기준 패턴(reference pattern)을 비교함에 있어서, 테스트 패턴의 m번째 프레임과 기준
패턴의 n번째 프레임 사이의 특징 벡터간 거리를 구하여 이 거리의 누적이 최소가 되는 경로를 선택하도록 한다. 이렇게 하여 입력된 테스트 패턴에 대하여 저장된 기준 패턴들과의 최소 경로에 따른 거리를 계산하여 그 값이 최소가 되는 기준 패턴을 인식된 단어로 처리하게 된다.
그런데, 동적 시간 와핑(DTW) 방법은 최적의 경로를 결정하는데 있어서 상당한 계산량을 필요로 하므로 인식 시간이 길어지는 주된 원인이 되고 있다.
따라서, 동적 시간 와핑(DTW) 방법에 의해서 최적의 경로를 정할 경우, 기준 패턴과 테스트 패턴을 양 축으로 하는 이차원 평면 상에서 경로가 지날 수 있는 범위에 대해서 몇 가지 제약 조건이 가해지게 된다. 그 중 대표적인 제약 조건으로는 이타쿠라(Itakura)가 제시한 제약 조건과 사코에(Sakoe) 및 치바(Chiba)가 제안한 제약 조건이 있는데 이들은 몇 가지 규칙을 정하여 시간축을 불필요하게 많이 신장 또는 수축시키지 않게 하였다.
도 3 은 종래의 이타쿠라(Itakura)가 제안한 제약 조건에 따른 동적 시간 와핑(DTW) 방법의 설명예시도이다.
이타쿠라(Itakura)가 제안한 제약 조건은 경로가 지나갈 수 있는 길을 도 3 에 도시한 바와 같이 제한하였다. 이러한 조건하에서는 평행사변형 내의 거리들만 계산하면 되므로 계산량이 감소된다.
도 4 는 종래의 동적 시간 와핑(DTW) 방법에서의 누적 거리 계산 방법의 설명예시도이다.
평행사변형 내에서 테스트 패턴의 m번째 프레임과 기준 패턴의 n번째 프레임
의 점(m,n)에서 누적된 거리 Dacc(m,n)은 도 4 에 도시한 바와 같이 Dacc(m-1,n), Dacc(m-1,n-1), Dacc(m-1,n-2) 중에서 최소값을 찾아, 그 값에 해당하는 점으로부터 점(m,n)까지의 거리를 더하여 구한다.
하지만, 이와 같은 제약 조건에도 불구하고 여전히 상당한 계산량이 남아 있어 인식 시간을 증가시키는 문제점이 있다.
상기한 바와 같은 문제점을 해결하기 위하여 안출된 본 발명은, 음성 인식을 위한 동적 시간 와핑(DTW) 연산 중에 소정의 크기 이상의 값에 대해서는 연산을 수행하지 않는 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도 1 은 일반적인 음성 인식 시스템의 구성예시도.
도 2 는 일반적인 동적 시간 와핑(DTW) 방법의 설명예시도.
도 3 은 종래의 이타쿠라(Itakura)가 제안한 제약 조건에 따른 동적 시간 와핑(DTW) 방법의 설명예시도.
도 4 는 종래의 동적 시간 와핑(DTW) 방법에서의 누적 거리 계산 방법의 설명예시도.
도 5 는 본 발명에 따른 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법에 대한 일예시도.
도 6a 및 도 6b 는 본 발명에 따른 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법에 대한 일실시예 흐름도.
*도면의 주요 부분에 대한 부호의 설명
101 : 끝점 검출기 102 : 특징 추출기
103 : 인식기
상기 목적을 달성하기 위한 본 발명의 방법은, 음성 인식 시스템에 적용되는 동적 시간 와핑(DTW) 방법에 있어서, 입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 테스트 패턴을 연산의 우선순위로 하여, 상기 테스트 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 단계; 상기 테스트
패턴의 소정의 위치에서 가능한 모든 기준 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 기준 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 단계; 및 제외된 상기 기준 패턴 위치를 감안하여 상기 누적거리 연산을 상기 테스트 패턴의 끝까지 수행하는 제 3 단계를 포함하여 이루어진 것을 특징으로 한다.
또한, 본 발명의 다른 방법은, 음성 인식 시스템에 적용되는 동적 시간 와핑(DTW) 방법에 있어서, 입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 기준 패턴을 연산의 우선순위로 하여, 상기 기준 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 단계; 상기 기준 패턴의 소정의 위치에서 가능한 모든 테스트 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 테스트 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 단계; 및 제외된 상기 테스트 패턴 위치를 감안하여 상기 누적거리 연산을 상기 기준 패턴의 끝까지 수행하는 제 3 단계를 포함하여 이루어진 것을 특징으로 한다.
또한, 본 발명은, 대용량 프로세서를 구비한 음성 인식 시스템에, 입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 테스트 패턴을 연산의 우선순위로 하여, 상기 테스트 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 기능; 상기 테스트 패턴의 소정의 위치에서 가능한 모든 기준 패턴 위치에 대하
여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 기준 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 기능; 및 제외된 상기 기준 패턴 위치를 감안하여 상기 누적거리 연산을 상기 테스트 패턴의 끝까지 수행하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
또한, 본 발명은, 대용량 프로세서를 구비한 음성 인식 시스템에, 입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 기준 패턴을 연산의 우선순위로 하여, 상기 기준 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 기능; 상기 기준 패턴의 소정의 위치에서 가능한 모든 테스트 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 테스트 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 기능; 및 제외된 상기 테스트 패턴 위치를 감안하여 상기 누적거리 연산을 상기 기준 패턴의 끝까지 수행하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
본 발명의 일실시예에서는 이타쿠라(Itakura)가 제시한 조건 외에 추가적인 제약을 가하여 경로가 지나갈 수 있는 범위를 좀 더 축소함으로써 불필요한 경로를 찾는데 소요되는 시간, 즉 이차원 평면상에서 경로들이 지날 수 있는 면적을 줄임으로써 계산량을 줄이게 된다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을
통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 5 는 본 발명에 따른 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법에 대한 일예시도이다.
본 발명에 따른 동적 시간 와핑(DTW) 방법은 테스트 패턴 길이의 절반이 되는 위치에서 일정 값 이하를 가지는 경로에 포함되지 못하는 후보를 정하여 다음 프레임 위치에서 누적 거리를 계산할 때 제외시키는 방법을 선택하여 좀 더 계산량을 줄이게 된다. 예를 들어, 도 5 에서와 같이 A, B, C점을 경로 계산에서 제외시키면 이들을 누적 거리 계산에 이용하는 D점은 계산할 필요가 없다. 또한, E, F 점 역시 A점을 포함하고, 이타쿠라(Itakura)의 제약에 벗어나는 점들을 포함하므로 이 역시 계산 대상에서 제외된다. 이러한 효과가 계속 누적되면 상당한 계산량의 감소를 가져온다.
이때, A, B, C점을 결정하는 조건은 특정 m의 위치에서 가능한 모든 n에 대하여 누적거리 Dacc(m,n)의 평균을 구한 후 이를 넘어서는 모든 값에 해당하는 위치를 경로에서 제외하게 된다.
도 6a 및 도 6b 는 본 발명에 따른 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법에 대한 일실시예 흐름도이다.
음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 연산에 있어서, 우선, 테스트 패턴의 프레임 번호인 m을 1로 하여 초기값을 설정하고(601), 기준 패턴의 프레임 번호인 n을 m번째 테스트 패턴 프레임에서 이타쿠라 제약 조건의 범위에 속하
는 최소값으로 설정한다(602). 이타쿠라 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고 점(m,n)에서의 누적거리 Dacc(m,n)을 산출한 후에(603), n을 1 증가시키고(604), n이 이타쿠라 제약 조건을 만족하는지 확인한다(605). n이 이타쿠라 제약 조건을 만족하면, 점(m,n)에서 누적거리 Dacc(m,n)을 산출하는 과정(603)부터 반복하여 수행하고, n이 이타쿠라 제약 조건을 만족하지 않으면, m이 테스트 패턴 길이의 반(1/2)이 되었는지를 검사한다(606).
검사 결과, m이 테스트 패턴 길이의 반(1/2)과 같은 값이 아니면, m을 1 증가시킨 후에(607), 기준 패턴의 프레임 번호인 n을 m에서 이타쿠라 제약 조건에 따른 범위에 속하는 최소값으로 설정하는 과정(602)부터 반복 수행한다.
검사 결과, m이 테스트 패턴 길이의 반과 같은 값이면, m에서 가능한 모든 n에 대하여 누적거리 Dacc(m,n)들의 평균값을 산출하고(608), 평균값 이상의 누적거리를 가진 점을 연산 제외 대상의 점으로 설정한다(609).
테스트 패턴의 프레임 번호인 m을 1 증가시키고(610), 기준 패턴의 프레임 번호인 n을 m에서 이타쿠라 제약 조건의 범위에 속하는 최소값으로 설정한다(611). 평균값 이상의 누적거리로 인하여 설정된 연산 제외 대상의 점과 이타쿠라 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고 점(m,n)의 누적거리 Dacc(m,n)을 산출한다(612).
연산 제외 대상의 점과 이타쿠라 제약 조건을 만족하지 못하는 점으로 인해 누적거리 Dacc(m,n)이 산출되지 못한 점도 연산 제외 대상의 점으로 설정하고(613),
n을 1 증가시켜(614), n이 이타쿠라 제약 조건을 만족하는지를 확인한다(615).
확인 결과, n이 이타쿠라 제약 조건을 만족하면, 연산 제외 대상의 점과 이타쿠라 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고 점(m,n)의 누적거리 Dacc(m,n)을 산출하는 과정(612)부터 반복 수행한다.
확인 결과, n이 이타쿠라 제약 조건을 만족하지 않으면, m이 테스트 패턴 길이와 같은가를 검사한다(616). 검사 결과, m이 테스트 패턴 길이와 같으면, 종료한다. m이 테스트 패턴 길이와 같지 않으면, m을 1 증가시키는 과정(610)부터 반복 수행한다.
상기한 바와 같은 본 발명은 사코에(Sakoe) 및 치바(Chiba)가 제안한 제약 조건을 적용하는 경우에도 동일하게 수행될 수 있다.
또한, 상기한 바와 같은 본 발명은, 테스트 패턴을 연산의 우선 순위로 하여 설명하였으나, 기준 패턴을 연산의 우선 순위로 하는 경우에도 동일하게 수행될 수 있다.
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
상기한 바와 같은 본 발명은, 소정의 크기 이상의 값에 대해서는 연산을 수
행하지 않는데도 최소 경로를 구할 수 있어, 이전의 동적 시간 와핑(DTW) 방법과 동일한 인식율을 보장할 뿐만 아니라 연산 시간을 감소시켜 음성 인식 서비스 이용자가 더 빠르게 음성 인식 기능을 이용할 수 있으며, 음성 인식 시스템도 더 빨리 다음 동작에 들어갈 수 있어 전력소비를 줄일 수 있는 효과가 있다.
Claims (28)
- 음성 인식 시스템에 적용되는 동적 시간 와핑(DTW : Dynamic Time Warping) 방법에 있어서,입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 테스트 패턴을 연산의 우선순위로 하여, 상기 테스트 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 단계;상기 테스트 패턴의 소정의 위치에서 가능한 모든 기준 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 기준 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 단계; 및제외된 상기 기준 패턴 위치를 감안하여 상기 누적거리 연산을 상기 테스트 패턴의 끝까지 수행하는 제 3 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 1 항에 있어서,상기 누적거리 연산은,이타쿠라(Itakura)가 제안한 제약 조건을 감안하여 연산하는 것을 특징으로 하는 동적 시간 와핑 방법.
- 제 2 항에 있어서,상기 제 1 단계는,상기 테스트 패턴의 프레임 번호를 m으로 하고, 상기 기준 패턴의 프레임 번호를 n으로 하는 (m,n)평면상에서, 상기 m의 초기값을 설정하는 제 4 단계;상기 n을 상기 m에서 상기 이타쿠라 제약 조건을 만족하는 최소값으로 설정하는 제 5 단계;상기 이타쿠라 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고, 점(m,n)의 누적거리를 산출하는 제 6 단계;상기 n을 증가시켜, 상기 n이 상기 이타쿠라 제약 조건을 만족하는지 확인하는 제 7 단계;상기 제 7 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하면, 상기 제 6 단계부터 반복 수행하는 제 8 단계;상기 제 7 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하지 않으면, m이 상기 테스트 패턴의 상기 소정의 위치에 대하여 나타내고 있는지 검사하는 제 9 단계;상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 5 단계부터 반복 수행하는 제 10 단계; 및상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있으면, 상기 제 2 단계부터 수행하는 제 11 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 3 항에 있어서,상기 제 2 단계는,상기 m에서 상기 이타쿠라 제약 조건에 의해 가능한 상기 n에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리에 대한 소정의 기준 값을 결정하는 제 12 단계; 및상기 소정의 기준 값을 넘어서는 누적거리를 가진 점을 상기 누적거리 연산의 대상에서 제외하는 제 13 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,상기 제 3 단계는,상기 테스트 패턴의 프레임 번호를 m으로 하고, 상기 기준 패턴의 프레임 번호를 n으로 하는 상기 (m,n)평면상에서, 상기 테스트 패턴의 위치인 상기 m을 증가시키고, 상기 n을 상기 m에서 상기 이타쿠라 제약 조건을 만족하는 최소값으로 설정하는 제 14 단계;상기 설정된 연산 제외 대상의 점과 상기 이타쿠라 제약 조건을 만족하지 못 하는 점을 상기 누적거리 연산의 대상에서 제외하고, 점(m,n)의 누적 거리를 산출하는 제 15 단계;상기 연산 제외 대상의 점과 상기 이타쿠라 제약 조건을 만족하지 못하는 점으로 인해 누적거리를 산출하지 못한 점도 상기 연산 제외 대상의 점으로 설정하는 제 16 단계;상기 n을 증가시켜, 상기 n이 상기 이타쿠라 제약 조건을 만족하는지 확인하는 제 17 단계;상기 제 17 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하면, 상기 제 15 단계부터 반복 수행하는 제 18 단계;상기 제 17 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하지 않으면, 상기 m이 상기 테스트 패턴의 끝을 나타내고 있는지 검사하는 제 19 단계;상기 제 19 단계의 검사 결과, 상기 테스트 패턴의 끝을 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 14 단계부터 반복 수행하는 제 20 단계; 및상기 제 19 단계의 검사 결과, 상기 테스트 패턴의 끝을 나타내고 있으면, 누적거리 연산을 종료하는 제 21 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 5 항에 있어서,상기 소정의 위치는,상기 테스트 패턴의 중간 위치인 것을 특징으로 하는 동적 시간 와핑 방법.
- 제 5 항에 있어서,상기 소정의 기준 값은,상기 누적거리에 대한 합계의 평균인 것을 특징으로 하는 동적 시간 와핑 방법.
- 제 1 항에 있어서,상기 누적거리 연산은,사코에(Sakoe) 및 치바(Chiba)가 제안한 제약 조건을 감안하여 연산하는 것을 특징으로 하는 동적 시간 와핑 방법.
- 제 8 항에 있어서,상기 제 1 단계는,상기 테스트 패턴의 프레임 번호를 m으로 하고, 상기 기준 패턴의 프레임 번호를 n으로 하는 (m,n)평면상에서, 상기 m의 초기값을 설정하는 제 4 단계;상기 n을 상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만 족하는 최소값으로 설정하는 제 5 단계;상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고, 점(m,n)의 누적거리를 산출하는 제 6 단계;상기 n을 증가시켜, 상기 n이 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는지 확인하는 제 7 단계;상기 제 7 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하면, 상기 제 6 단계부터 반복 수행하는 제 8 단계;상기 제 7 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 않으면, m이 상기 테스트 패턴의 상기 소정의 위치에 대하여 나타내고 있는지 검사하는 제 9 단계;상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 5 단계부터 반복 수행하는 제 10 단계; 및상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있으면, 상기 제 2 단계부터 수행하는 제 11 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 9 항에 있어서,상기 제 2 단계는,상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건에 의해 가능한 상기 n에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리에 대한 소정의 기준 값을 결정하는 제 12 단계; 및상기 소정의 기준 값을 넘어서는 누적거리를 가진 점을 상기 누적거리 연산의 대상에서 제외하는 제 13 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 8 항 내지 제 10 항 중 어느 한 항에 있어서,상기 제 3 단계는,상기 테스트 패턴의 프레임 번호를 m으로 하고, 상기 기준 패턴의 프레임 번호를 n으로 하는 상기 (m,n)평면상에서, 상기 테스트 패턴의 위치인 상기 m을 증가시키고, 상기 n을 상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는 최소값으로 설정하는 제 14 단계;상기 설정된 연산 제외 대상의 점과 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 못하는 점을 상기 누적거리 연산의 대상에서 제외하고, 점(m,n)의 누적 거리를 산출하는 제 15 단계;상기 연산 제외 대상의 점과 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 못하는 점으로 인해 누적거리를 산출하지 못한 점도 상기 연산 제외 대상의 점으로 설정하는 제 16 단계;상기 n을 증가시켜, 상기 n이 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조 건을 만족하는지 확인하는 제 17 단계;상기 제 17 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하면, 상기 제 15 단계부터 반복 수행하는 제 18 단계;상기 제 17 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 않으면, 상기 m이 상기 테스트 패턴의 끝을 나타내고 있는지 검사하는 제 19 단계;상기 제 19 단계의 검사 결과, 상기 테스트 패턴의 끝을 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 14 단계부터 반복 수행하는 제 20 단계; 및상기 제 19 단계의 검사 결과, 상기 테스트 패턴의 끝을 나타내고 있으면, 누적거리 연산을 종료하는 제 21 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 11 항에 있어서,상기 소정의 위치는,상기 테스트 패턴의 중간 위치인 것을 특징으로 하는 동적 시간 와핑 방법.
- 제 11 항에 있어서,상기 소정의 기준 값은,상기 누적거리에 대한 합계의 평균인 것을 특징으로 하는 동적 시간 와핑 방법.
- 음성 인식 시스템에 적용되는 동적 시간 와핑(DTW : Dynamic Time Warping) 방법에 있어서,입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 기준 패턴을 연산의 우선순위로 하여, 상기 기준 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 단계;상기 기준 패턴의 소정의 위치에서 가능한 모든 테스트 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 테스트 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 단계; 및제외된 상기 테스트 패턴 위치를 감안하여 상기 누적거리 연산을 상기 기준 패턴의 끝까지 수행하는 제 3 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 14 항에 있어서,상기 누적거리 연산은,이타쿠라(Itakura)가 제안한 제약 조건을 감안하여 연산하는 것을 특징으로 하는 동적 시간 와핑 방법.
- 제 15 항에 있어서,상기 제 1 단계는,상기 기준 패턴의 프레임 번호를 m으로 하고, 상기 테스트 패턴의 프레임 번호를 n으로 하는 (m,n)평면상에서, 상기 m의 초기값을 설정하는 제 4 단계;상기 n을 상기 m에서 상기 이타쿠라 제약 조건을 만족하는 최소값으로 설정하는 제 5 단계;상기 이타쿠라 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고, 점(m,n)의 누적거리를 산출하는 제 6 단계;상기 n을 증가시켜, 상기 n이 상기 이타쿠라 제약 조건을 만족하는지 확인하는 제 7 단계;상기 제 7 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하면, 상기 제 6 단계부터 반복 수행하는 제 8 단계;상기 제 7 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하지 않으면, m이 상기 기준 패턴의 상기 소정의 위치에 대하여 나타내고 있는지 검사하는 제 9 단계;상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있지 않 으면, 상기 m을 증가시키고 상기 제 5 단계부터 반복 수행하는 제 10 단계; 및상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있으면, 상기 제 2 단계부터 수행하는 제 11 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 16 항에 있어서,상기 제 2 단계는,상기 m에서 상기 이타쿠라 제약 조건에 의해 가능한 상기 n에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리에 대한 소정의 기준 값을 결정하는 제 12 단계; 및상기 소정의 기준 값을 넘어서는 누적거리를 가진 점을 상기 누적거리 연산의 대상에서 제외하는 제 13 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 14 항 내지 제 17 항 중 어느 한 항에 있어서,상기 제 3 단계는,상기 기준 패턴의 프레임 번호를 m으로 하고, 상기 테스트 패턴의 프레임 번호를 n으로 하는 상기 (m,n)평면상에서, 상기 기준 패턴의 위치인 상기 m을 증가시 키고, 상기 n을 상기 m에서 상기 이타쿠라 제약 조건을 만족하는 최소값으로 설정하는 제 14 단계;상기 설정된 연산 제외 대상의 점과 상기 이타쿠라 제약 조건을 만족하지 못하는 점을 상기 누적거리 연산의 대상에서 제외하고, 점(m,n)의 누적 거리를 산출하는 제 15 단계;상기 연산 제외 대상의 점과 상기 이타쿠라 제약 조건을 만족하지 못하는 점으로 인해 누적거리를 산출하지 못한 점도 상기 연산 제외 대상의 점으로 설정하는 제 16 단계;상기 n을 증가시켜, 상기 n이 상기 이타쿠라 제약 조건을 만족하는지 확인하는 제 17 단계;상기 제 17 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하면, 상기 제 15 단계부터 반복 수행하는 제 18 단계;상기 제 17 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하지 않으면, 상기 m이 상기 기준 패턴의 끝을 나타내고 있는지 검사하는 제 19 단계;상기 제 19 단계의 검사 결과, 상기 기준 패턴의 끝을 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 14 단계부터 반복 수행하는 제 20 단계; 및상기 제 19 단계의 검사 결과, 상기 기준 패턴의 끝을 나타내고 있으면, 누적거리 연산을 종료하는 제 21 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 18 항에 있어서,상기 소정의 위치는,상기 기준 패턴의 중간 위치인 것을 특징으로 하는 동적 시간 와핑 방법.
- 제 18 항에 있어서,상기 소정의 기준 값은,상기 누적거리에 대한 합계의 평균인 것을 특징으로 하는 동적 시간 와핑 방법.
- 제 14 항에 있어서,상기 누적거리 연산은,사코에(Sakoe) 및 치바(Chiba)가 제안한 제약 조건을 감안하여 연산하는 것을 특징으로 하는 동적 시간 와핑 방법.
- 제 21 항에 있어서,상기 제 1 단계는,상기 기준 패턴의 프레임 번호를 m으로 하고, 상기 테스트 패턴의 프레임 번호를 n으로 하는 (m,n)평면상에서, 상기 m의 초기값을 설정하는 제 4 단계;상기 n을 상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는 최소값으로 설정하는 제 5 단계;상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고, 점(m,n)의 누적거리를 산출하는 제 6 단계;상기 n을 증가시켜, 상기 n이 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는지 확인하는 제 7 단계;상기 제 7 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하면, 상기 제 6 단계부터 반복 수행하는 제 8 단계;상기 제 7 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 않으면, m이 상기 기준 패턴의 상기 소정의 위치에 대하여 나타내고 있는지 검사하는 제 9 단계;상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 5 단계부터 반복 수행하는 제 10 단계; 및상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있으면, 상기 제 2 단계부터 수행하는 제 11 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 22 항에 있어서,상기 제 2 단계는,상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건에 의해 가능한 상기 n에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리에 대한 소정의 기준 값을 결정하는 제 12 단계; 및상기 소정의 기준 값을 넘어서는 누적거리를 가진 점을 상기 누적거리 연산의 대상에서 제외하는 제 13 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 21 항 내지 제 23 항 중 어느 한 항에 있어서,상기 제 3 단계는,상기 기준 패턴의 프레임 번호를 m으로 하고, 상기 테스트 패턴의 프레임 번호를 n으로 하는 상기 (m,n)평면상에서, 상기 기준 패턴의 위치인 상기 m을 증가시키고, 상기 n을 상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는 최소값으로 설정하는 제 14 단계;상기 설정된 연산 제외 대상의 점과 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 못하는 점을 상기 누적거리 연산의 대상에서 제외하고, 점(m,n)의 누적 거리를 산출하는 제 15 단계;상기 연산 제외 대상의 점과 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조 건을 만족하지 못하는 점으로 인해 누적거리를 산출하지 못한 점도 상기 연산 제외 대상의 점으로 설정하는 제 16 단계;상기 n을 증가시켜, 상기 n이 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는지 확인하는 제 17 단계;상기 제 17 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하면, 상기 제 15 단계부터 반복 수행하는 제 18 단계;상기 제 17 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 않으면, 상기 m이 상기 기준 패턴의 끝을 나타내고 있는지 검사하는 제 19 단계;상기 제 19 단계의 검사 결과, 상기 기준 패턴의 끝을 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 14 단계부터 반복 수행하는 제 20 단계; 및상기 제 19 단계의 검사 결과, 상기 기준 패턴의 끝을 나타내고 있으면, 누적거리 연산을 종료하는 제 21 단계를 포함하여 이루어진 동적 시간 와핑 방법.
- 제 24 항에 있어서,상기 소정의 위치는,상기 기준 패턴의 중간 위치인 것을 특징으로 하는 동적 시간 와핑 방법.
- 제 24 항에 있어서,상기 소정의 기준 값은,상기 누적거리에 대한 합계의 평균인 것을 특징으로 하는 동적 시간 와핑 방법.
- 대용량 프로세서를 구비한 음성 인식 시스템에,입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 테스트 패턴을 연산의 우선순위로 하여, 상기 테스트 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 기능;상기 테스트 패턴의 소정의 위치에서 가능한 모든 기준 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 기준 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 기능; 및제외된 상기 기준 패턴 위치를 감안하여 상기 누적거리 연산을 상기 테스트 패턴의 끝까지 수행하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
- 대용량 프로세서를 구비한 음성 인식 시스템에,입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 기준 패턴을 연산의 우선순위로 하여, 상기 기준 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 기능;상기 기준 패턴의 소정의 위치에서 가능한 모든 테스트 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 테스트 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 기능; 및제외된 상기 테스트 패턴 위치를 감안하여 상기 누적거리 연산을 상기 기준 패턴의 끝까지 수행하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019990003701A KR100282555B1 (ko) | 1999-02-04 | 1999-02-04 | 음성 인식 속도 향상을 위한 동적 시간 와핑 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019990003701A KR100282555B1 (ko) | 1999-02-04 | 1999-02-04 | 음성 인식 속도 향상을 위한 동적 시간 와핑 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20000055194A KR20000055194A (ko) | 2000-09-05 |
KR100282555B1 true KR100282555B1 (ko) | 2001-02-15 |
Family
ID=19573307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019990003701A KR100282555B1 (ko) | 1999-02-04 | 1999-02-04 | 음성 인식 속도 향상을 위한 동적 시간 와핑 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100282555B1 (ko) |
-
1999
- 1999-02-04 KR KR1019990003701A patent/KR100282555B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR20000055194A (ko) | 2000-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101988222B1 (ko) | 대어휘 연속 음성 인식 장치 및 방법 | |
US20190057683A1 (en) | Encoder-decoder models for sequence to sequence mapping | |
US5390278A (en) | Phoneme based speech recognition | |
EP0706171A1 (en) | Speech recognition method and apparatus | |
US20110077943A1 (en) | System for generating language model, method of generating language model, and program for language model generation | |
US20140195474A1 (en) | Method and system for improved pattern matching | |
JPH07261784A (ja) | パターン認識方法、音声認識方法および音声認識装置 | |
CA2304747C (en) | Pattern recognition using multiple reference models | |
EP0086081B1 (en) | Continuous speech recognition system | |
US8849662B2 (en) | Method and system for segmenting phonemes from voice signals | |
EP0525640A2 (en) | Dynamic programming matching system for speech recognition | |
EP1887562A1 (en) | Speech recognition by statistical language model using square-root smoothing | |
Brown et al. | Dynamic time warping for isolated word recognition based on ordered graph searching techniques | |
KR100282555B1 (ko) | 음성 인식 속도 향상을 위한 동적 시간 와핑 방법 | |
US20180350358A1 (en) | Voice recognition device, voice emphasis device, voice recognition method, voice emphasis method, and navigation system | |
US7912715B2 (en) | Determining distortion measures in a pattern recognition process | |
EP0215573B1 (en) | Apparatus and methods for speech recognition | |
GB2179483A (en) | Speech recognition | |
Hu et al. | A neural network based nonlinear feature transformation for speech recognition. | |
JP3781215B2 (ja) | 画像データの特徴点検出方法 | |
JPH06324699A (ja) | 連続音声認識装置 | |
KR100293465B1 (ko) | 음성인식방법 | |
KR100492089B1 (ko) | 반음소 모델을 이용한 발화검증시 계산량 감소 방법 | |
JPH0464077B2 (ko) | ||
JPH0195373A (ja) | パタン尤度計算方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121114 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20131031 Year of fee payment: 14 |
|
FPAY | Annual fee payment |
Payment date: 20141028 Year of fee payment: 15 |
|
FPAY | Annual fee payment |
Payment date: 20151030 Year of fee payment: 16 |
|
FPAY | Annual fee payment |
Payment date: 20160823 Year of fee payment: 17 |
|
LAPS | Lapse due to unpaid annual fee |