KR100282555B1 - 음성 인식 속도 향상을 위한 동적 시간 와핑 방법 - Google Patents

음성 인식 속도 향상을 위한 동적 시간 와핑 방법 Download PDF

Info

Publication number
KR100282555B1
KR100282555B1 KR1019990003701A KR19990003701A KR100282555B1 KR 100282555 B1 KR100282555 B1 KR 100282555B1 KR 1019990003701 A KR1019990003701 A KR 1019990003701A KR 19990003701 A KR19990003701 A KR 19990003701A KR 100282555 B1 KR100282555 B1 KR 100282555B1
Authority
KR
South Korea
Prior art keywords
cumulative distance
test pattern
dynamic time
time warping
point
Prior art date
Application number
KR1019990003701A
Other languages
English (en)
Other versions
KR20000055194A (ko
Inventor
김재원
강명수
민병준
김병무
Original Assignee
조정남
에스케이 텔레콤주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 조정남, 에스케이 텔레콤주식회사 filed Critical 조정남
Priority to KR1019990003701A priority Critical patent/KR100282555B1/ko
Publication of KR20000055194A publication Critical patent/KR20000055194A/ko
Application granted granted Critical
Publication of KR100282555B1 publication Critical patent/KR100282555B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 동적 시간 와핑 방법과 그를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 소정의 크기 이상의 값에 대해서는 연산을 수행하지 않는 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법과 그 기록매체를 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 입력된 음성의 음성 특징 벡터를 테스트 패턴으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴으로 하며, 테스트 패턴을 연산의 우선순위로 하여, 테스트 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 단계; 테스트 패턴의 소정의 위치에서 가능한 모든 기준 패턴 위치에 대하여, 누적거리 연산에 의해 얻어진 누적거리가 소정의 값을 넘어서는 기준 패턴 위치를 누적거리 연산의 대상에서 제외하는 제 2 단계; 및 제외된 기준 패턴 위치를 감안하여 누적거리 연산을 테스트 패턴의 끝까지 수행하는 제 3 단계를 포함함.
4. 발명의 중요한 용도
본 발명은 음성 인식 시스템 등에 이용됨.

Description

음성 인식 속도 향상을 위한 동적 시간 와핑 방법{DYNAMIC TIME WARPING METHOD FOR ENHANCING THE SPEED OF SPEECH RECOGNITION}
본 발명은 음성 인식 시스템에 적용되는 음성 인식 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 특히 음성 인식 방법 중의 하나인 동적 시간 와핑(DTW : Dynamic Time Warping) 방법의 연산 속도를 개선한 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
도 1 은 일반적인 음성 인식 시스템의 구성예시도이다.
일반적인 음성 인식 시스템은 크게 끝점 검출기(101), 특징 추출기(102) 및 인식기(103)의 세 부분으로 구성된다. 끝점 검출기(101)는 입력 신호로부터 음성 신호 구간만을 찾아 내며, 특징 추출기(102)는 찾아진 음성 신호 구간에서 인식을 위해 필요한 음성 특징 벡터를 추출하고, 인식기(103)는 이렇게 찾아진 음성 특징 벡터로부터 음성을 인식한다.
일반적으로 음성 인식 시스템에서는 동적 시간 와핑(DTW) 방법을 이용하여 현재 입력된 음성과 기존의 저장된 음성을 비교하여 음성을 인식하게 된다.
도 2 는 일반적인 동적 시간 와핑(DTW) 방법의 설명예시도이다.
동적 시간 와핑(DTW) 방법은 테스트 패턴(test pattern)과 기준 패턴(reference pattern)을 비교함에 있어서, 테스트 패턴의 m번째 프레임과 기준 패턴의 n번째 프레임 사이의 특징 벡터간 거리를 구하여 이 거리의 누적이 최소가 되는 경로를 선택하도록 한다. 이렇게 하여 입력된 테스트 패턴에 대하여 저장된 기준 패턴들과의 최소 경로에 따른 거리를 계산하여 그 값이 최소가 되는 기준 패턴을 인식된 단어로 처리하게 된다.
그런데, 동적 시간 와핑(DTW) 방법은 최적의 경로를 결정하는데 있어서 상당한 계산량을 필요로 하므로 인식 시간이 길어지는 주된 원인이 되고 있다.
따라서, 동적 시간 와핑(DTW) 방법에 의해서 최적의 경로를 정할 경우, 기준 패턴과 테스트 패턴을 양 축으로 하는 이차원 평면 상에서 경로가 지날 수 있는 범위에 대해서 몇 가지 제약 조건이 가해지게 된다. 그 중 대표적인 제약 조건으로는 이타쿠라(Itakura)가 제시한 제약 조건과 사코에(Sakoe) 및 치바(Chiba)가 제안한 제약 조건이 있는데 이들은 몇 가지 규칙을 정하여 시간축을 불필요하게 많이 신장 또는 수축시키지 않게 하였다.
도 3 은 종래의 이타쿠라(Itakura)가 제안한 제약 조건에 따른 동적 시간 와핑(DTW) 방법의 설명예시도이다.
이타쿠라(Itakura)가 제안한 제약 조건은 경로가 지나갈 수 있는 길을 도 3 에 도시한 바와 같이 제한하였다. 이러한 조건하에서는 평행사변형 내의 거리들만 계산하면 되므로 계산량이 감소된다.
도 4 는 종래의 동적 시간 와핑(DTW) 방법에서의 누적 거리 계산 방법의 설명예시도이다.
평행사변형 내에서 테스트 패턴의 m번째 프레임과 기준 패턴의 n번째 프레임 의 점(m,n)에서 누적된 거리 Dacc(m,n)은 도 4 에 도시한 바와 같이 Dacc(m-1,n), Dacc(m-1,n-1), Dacc(m-1,n-2) 중에서 최소값을 찾아, 그 값에 해당하는 점으로부터 점(m,n)까지의 거리를 더하여 구한다.
하지만, 이와 같은 제약 조건에도 불구하고 여전히 상당한 계산량이 남아 있어 인식 시간을 증가시키는 문제점이 있다.
상기한 바와 같은 문제점을 해결하기 위하여 안출된 본 발명은, 음성 인식을 위한 동적 시간 와핑(DTW) 연산 중에 소정의 크기 이상의 값에 대해서는 연산을 수행하지 않는 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도 1 은 일반적인 음성 인식 시스템의 구성예시도.
도 2 는 일반적인 동적 시간 와핑(DTW) 방법의 설명예시도.
도 3 은 종래의 이타쿠라(Itakura)가 제안한 제약 조건에 따른 동적 시간 와핑(DTW) 방법의 설명예시도.
도 4 는 종래의 동적 시간 와핑(DTW) 방법에서의 누적 거리 계산 방법의 설명예시도.
도 5 는 본 발명에 따른 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법에 대한 일예시도.
도 6a 및 도 6b 는 본 발명에 따른 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법에 대한 일실시예 흐름도.
*도면의 주요 부분에 대한 부호의 설명
101 : 끝점 검출기 102 : 특징 추출기
103 : 인식기
상기 목적을 달성하기 위한 본 발명의 방법은, 음성 인식 시스템에 적용되는 동적 시간 와핑(DTW) 방법에 있어서, 입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 테스트 패턴을 연산의 우선순위로 하여, 상기 테스트 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 단계; 상기 테스트 패턴의 소정의 위치에서 가능한 모든 기준 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 기준 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 단계; 및 제외된 상기 기준 패턴 위치를 감안하여 상기 누적거리 연산을 상기 테스트 패턴의 끝까지 수행하는 제 3 단계를 포함하여 이루어진 것을 특징으로 한다.
또한, 본 발명의 다른 방법은, 음성 인식 시스템에 적용되는 동적 시간 와핑(DTW) 방법에 있어서, 입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 기준 패턴을 연산의 우선순위로 하여, 상기 기준 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 단계; 상기 기준 패턴의 소정의 위치에서 가능한 모든 테스트 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 테스트 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 단계; 및 제외된 상기 테스트 패턴 위치를 감안하여 상기 누적거리 연산을 상기 기준 패턴의 끝까지 수행하는 제 3 단계를 포함하여 이루어진 것을 특징으로 한다.
또한, 본 발명은, 대용량 프로세서를 구비한 음성 인식 시스템에, 입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 테스트 패턴을 연산의 우선순위로 하여, 상기 테스트 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 기능; 상기 테스트 패턴의 소정의 위치에서 가능한 모든 기준 패턴 위치에 대하 여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 기준 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 기능; 및 제외된 상기 기준 패턴 위치를 감안하여 상기 누적거리 연산을 상기 테스트 패턴의 끝까지 수행하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
또한, 본 발명은, 대용량 프로세서를 구비한 음성 인식 시스템에, 입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 기준 패턴을 연산의 우선순위로 하여, 상기 기준 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 기능; 상기 기준 패턴의 소정의 위치에서 가능한 모든 테스트 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 테스트 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 기능; 및 제외된 상기 테스트 패턴 위치를 감안하여 상기 누적거리 연산을 상기 기준 패턴의 끝까지 수행하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
본 발명의 일실시예에서는 이타쿠라(Itakura)가 제시한 조건 외에 추가적인 제약을 가하여 경로가 지나갈 수 있는 범위를 좀 더 축소함으로써 불필요한 경로를 찾는데 소요되는 시간, 즉 이차원 평면상에서 경로들이 지날 수 있는 면적을 줄임으로써 계산량을 줄이게 된다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 5 는 본 발명에 따른 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법에 대한 일예시도이다.
본 발명에 따른 동적 시간 와핑(DTW) 방법은 테스트 패턴 길이의 절반이 되는 위치에서 일정 값 이하를 가지는 경로에 포함되지 못하는 후보를 정하여 다음 프레임 위치에서 누적 거리를 계산할 때 제외시키는 방법을 선택하여 좀 더 계산량을 줄이게 된다. 예를 들어, 도 5 에서와 같이 A, B, C점을 경로 계산에서 제외시키면 이들을 누적 거리 계산에 이용하는 D점은 계산할 필요가 없다. 또한, E, F 점 역시 A점을 포함하고, 이타쿠라(Itakura)의 제약에 벗어나는 점들을 포함하므로 이 역시 계산 대상에서 제외된다. 이러한 효과가 계속 누적되면 상당한 계산량의 감소를 가져온다.
이때, A, B, C점을 결정하는 조건은 특정 m의 위치에서 가능한 모든 n에 대하여 누적거리 Dacc(m,n)의 평균을 구한 후 이를 넘어서는 모든 값에 해당하는 위치를 경로에서 제외하게 된다.
도 6a 및 도 6b 는 본 발명에 따른 음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 방법에 대한 일실시예 흐름도이다.
음성 인식 속도 향상을 위한 동적 시간 와핑(DTW) 연산에 있어서, 우선, 테스트 패턴의 프레임 번호인 m을 1로 하여 초기값을 설정하고(601), 기준 패턴의 프레임 번호인 n을 m번째 테스트 패턴 프레임에서 이타쿠라 제약 조건의 범위에 속하 는 최소값으로 설정한다(602). 이타쿠라 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고 점(m,n)에서의 누적거리 Dacc(m,n)을 산출한 후에(603), n을 1 증가시키고(604), n이 이타쿠라 제약 조건을 만족하는지 확인한다(605). n이 이타쿠라 제약 조건을 만족하면, 점(m,n)에서 누적거리 Dacc(m,n)을 산출하는 과정(603)부터 반복하여 수행하고, n이 이타쿠라 제약 조건을 만족하지 않으면, m이 테스트 패턴 길이의 반(1/2)이 되었는지를 검사한다(606).
검사 결과, m이 테스트 패턴 길이의 반(1/2)과 같은 값이 아니면, m을 1 증가시킨 후에(607), 기준 패턴의 프레임 번호인 n을 m에서 이타쿠라 제약 조건에 따른 범위에 속하는 최소값으로 설정하는 과정(602)부터 반복 수행한다.
검사 결과, m이 테스트 패턴 길이의 반과 같은 값이면, m에서 가능한 모든 n에 대하여 누적거리 Dacc(m,n)들의 평균값을 산출하고(608), 평균값 이상의 누적거리를 가진 점을 연산 제외 대상의 점으로 설정한다(609).
테스트 패턴의 프레임 번호인 m을 1 증가시키고(610), 기준 패턴의 프레임 번호인 n을 m에서 이타쿠라 제약 조건의 범위에 속하는 최소값으로 설정한다(611). 평균값 이상의 누적거리로 인하여 설정된 연산 제외 대상의 점과 이타쿠라 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고 점(m,n)의 누적거리 Dacc(m,n)을 산출한다(612).
연산 제외 대상의 점과 이타쿠라 제약 조건을 만족하지 못하는 점으로 인해 누적거리 Dacc(m,n)이 산출되지 못한 점도 연산 제외 대상의 점으로 설정하고(613), n을 1 증가시켜(614), n이 이타쿠라 제약 조건을 만족하는지를 확인한다(615).
확인 결과, n이 이타쿠라 제약 조건을 만족하면, 연산 제외 대상의 점과 이타쿠라 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고 점(m,n)의 누적거리 Dacc(m,n)을 산출하는 과정(612)부터 반복 수행한다.
확인 결과, n이 이타쿠라 제약 조건을 만족하지 않으면, m이 테스트 패턴 길이와 같은가를 검사한다(616). 검사 결과, m이 테스트 패턴 길이와 같으면, 종료한다. m이 테스트 패턴 길이와 같지 않으면, m을 1 증가시키는 과정(610)부터 반복 수행한다.
상기한 바와 같은 본 발명은 사코에(Sakoe) 및 치바(Chiba)가 제안한 제약 조건을 적용하는 경우에도 동일하게 수행될 수 있다.
또한, 상기한 바와 같은 본 발명은, 테스트 패턴을 연산의 우선 순위로 하여 설명하였으나, 기준 패턴을 연산의 우선 순위로 하는 경우에도 동일하게 수행될 수 있다.
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
상기한 바와 같은 본 발명은, 소정의 크기 이상의 값에 대해서는 연산을 수 행하지 않는데도 최소 경로를 구할 수 있어, 이전의 동적 시간 와핑(DTW) 방법과 동일한 인식율을 보장할 뿐만 아니라 연산 시간을 감소시켜 음성 인식 서비스 이용자가 더 빠르게 음성 인식 기능을 이용할 수 있으며, 음성 인식 시스템도 더 빨리 다음 동작에 들어갈 수 있어 전력소비를 줄일 수 있는 효과가 있다.

Claims (28)

  1. 음성 인식 시스템에 적용되는 동적 시간 와핑(DTW : Dynamic Time Warping) 방법에 있어서,
    입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 테스트 패턴을 연산의 우선순위로 하여, 상기 테스트 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 단계;
    상기 테스트 패턴의 소정의 위치에서 가능한 모든 기준 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 기준 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 단계; 및
    제외된 상기 기준 패턴 위치를 감안하여 상기 누적거리 연산을 상기 테스트 패턴의 끝까지 수행하는 제 3 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  2. 제 1 항에 있어서,
    상기 누적거리 연산은,
    이타쿠라(Itakura)가 제안한 제약 조건을 감안하여 연산하는 것을 특징으로 하는 동적 시간 와핑 방법.
  3. 제 2 항에 있어서,
    상기 제 1 단계는,
    상기 테스트 패턴의 프레임 번호를 m으로 하고, 상기 기준 패턴의 프레임 번호를 n으로 하는 (m,n)평면상에서, 상기 m의 초기값을 설정하는 제 4 단계;
    상기 n을 상기 m에서 상기 이타쿠라 제약 조건을 만족하는 최소값으로 설정하는 제 5 단계;
    상기 이타쿠라 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고, 점(m,n)의 누적거리를 산출하는 제 6 단계;
    상기 n을 증가시켜, 상기 n이 상기 이타쿠라 제약 조건을 만족하는지 확인하는 제 7 단계;
    상기 제 7 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하면, 상기 제 6 단계부터 반복 수행하는 제 8 단계;
    상기 제 7 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하지 않으면, m이 상기 테스트 패턴의 상기 소정의 위치에 대하여 나타내고 있는지 검사하는 제 9 단계;
    상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 5 단계부터 반복 수행하는 제 10 단계; 및
    상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있으면, 상기 제 2 단계부터 수행하는 제 11 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  4. 제 3 항에 있어서,
    상기 제 2 단계는,
    상기 m에서 상기 이타쿠라 제약 조건에 의해 가능한 상기 n에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리에 대한 소정의 기준 값을 결정하는 제 12 단계; 및
    상기 소정의 기준 값을 넘어서는 누적거리를 가진 점을 상기 누적거리 연산의 대상에서 제외하는 제 13 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 제 3 단계는,
    상기 테스트 패턴의 프레임 번호를 m으로 하고, 상기 기준 패턴의 프레임 번호를 n으로 하는 상기 (m,n)평면상에서, 상기 테스트 패턴의 위치인 상기 m을 증가시키고, 상기 n을 상기 m에서 상기 이타쿠라 제약 조건을 만족하는 최소값으로 설정하는 제 14 단계;
    상기 설정된 연산 제외 대상의 점과 상기 이타쿠라 제약 조건을 만족하지 못 하는 점을 상기 누적거리 연산의 대상에서 제외하고, 점(m,n)의 누적 거리를 산출하는 제 15 단계;
    상기 연산 제외 대상의 점과 상기 이타쿠라 제약 조건을 만족하지 못하는 점으로 인해 누적거리를 산출하지 못한 점도 상기 연산 제외 대상의 점으로 설정하는 제 16 단계;
    상기 n을 증가시켜, 상기 n이 상기 이타쿠라 제약 조건을 만족하는지 확인하는 제 17 단계;
    상기 제 17 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하면, 상기 제 15 단계부터 반복 수행하는 제 18 단계;
    상기 제 17 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하지 않으면, 상기 m이 상기 테스트 패턴의 끝을 나타내고 있는지 검사하는 제 19 단계;
    상기 제 19 단계의 검사 결과, 상기 테스트 패턴의 끝을 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 14 단계부터 반복 수행하는 제 20 단계; 및
    상기 제 19 단계의 검사 결과, 상기 테스트 패턴의 끝을 나타내고 있으면, 누적거리 연산을 종료하는 제 21 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  6. 제 5 항에 있어서,
    상기 소정의 위치는,
    상기 테스트 패턴의 중간 위치인 것을 특징으로 하는 동적 시간 와핑 방법.
  7. 제 5 항에 있어서,
    상기 소정의 기준 값은,
    상기 누적거리에 대한 합계의 평균인 것을 특징으로 하는 동적 시간 와핑 방법.
  8. 제 1 항에 있어서,
    상기 누적거리 연산은,
    사코에(Sakoe) 및 치바(Chiba)가 제안한 제약 조건을 감안하여 연산하는 것을 특징으로 하는 동적 시간 와핑 방법.
  9. 제 8 항에 있어서,
    상기 제 1 단계는,
    상기 테스트 패턴의 프레임 번호를 m으로 하고, 상기 기준 패턴의 프레임 번호를 n으로 하는 (m,n)평면상에서, 상기 m의 초기값을 설정하는 제 4 단계;
    상기 n을 상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만 족하는 최소값으로 설정하는 제 5 단계;
    상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고, 점(m,n)의 누적거리를 산출하는 제 6 단계;
    상기 n을 증가시켜, 상기 n이 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는지 확인하는 제 7 단계;
    상기 제 7 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하면, 상기 제 6 단계부터 반복 수행하는 제 8 단계;
    상기 제 7 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 않으면, m이 상기 테스트 패턴의 상기 소정의 위치에 대하여 나타내고 있는지 검사하는 제 9 단계;
    상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 5 단계부터 반복 수행하는 제 10 단계; 및
    상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있으면, 상기 제 2 단계부터 수행하는 제 11 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  10. 제 9 항에 있어서,
    상기 제 2 단계는,
    상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건에 의해 가능한 상기 n에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리에 대한 소정의 기준 값을 결정하는 제 12 단계; 및
    상기 소정의 기준 값을 넘어서는 누적거리를 가진 점을 상기 누적거리 연산의 대상에서 제외하는 제 13 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  11. 제 8 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 제 3 단계는,
    상기 테스트 패턴의 프레임 번호를 m으로 하고, 상기 기준 패턴의 프레임 번호를 n으로 하는 상기 (m,n)평면상에서, 상기 테스트 패턴의 위치인 상기 m을 증가시키고, 상기 n을 상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는 최소값으로 설정하는 제 14 단계;
    상기 설정된 연산 제외 대상의 점과 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 못하는 점을 상기 누적거리 연산의 대상에서 제외하고, 점(m,n)의 누적 거리를 산출하는 제 15 단계;
    상기 연산 제외 대상의 점과 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 못하는 점으로 인해 누적거리를 산출하지 못한 점도 상기 연산 제외 대상의 점으로 설정하는 제 16 단계;
    상기 n을 증가시켜, 상기 n이 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조 건을 만족하는지 확인하는 제 17 단계;
    상기 제 17 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하면, 상기 제 15 단계부터 반복 수행하는 제 18 단계;
    상기 제 17 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 않으면, 상기 m이 상기 테스트 패턴의 끝을 나타내고 있는지 검사하는 제 19 단계;
    상기 제 19 단계의 검사 결과, 상기 테스트 패턴의 끝을 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 14 단계부터 반복 수행하는 제 20 단계; 및
    상기 제 19 단계의 검사 결과, 상기 테스트 패턴의 끝을 나타내고 있으면, 누적거리 연산을 종료하는 제 21 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  12. 제 11 항에 있어서,
    상기 소정의 위치는,
    상기 테스트 패턴의 중간 위치인 것을 특징으로 하는 동적 시간 와핑 방법.
  13. 제 11 항에 있어서,
    상기 소정의 기준 값은,
    상기 누적거리에 대한 합계의 평균인 것을 특징으로 하는 동적 시간 와핑 방법.
  14. 음성 인식 시스템에 적용되는 동적 시간 와핑(DTW : Dynamic Time Warping) 방법에 있어서,
    입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 기준 패턴을 연산의 우선순위로 하여, 상기 기준 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 단계;
    상기 기준 패턴의 소정의 위치에서 가능한 모든 테스트 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 테스트 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 단계; 및
    제외된 상기 테스트 패턴 위치를 감안하여 상기 누적거리 연산을 상기 기준 패턴의 끝까지 수행하는 제 3 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  15. 제 14 항에 있어서,
    상기 누적거리 연산은,
    이타쿠라(Itakura)가 제안한 제약 조건을 감안하여 연산하는 것을 특징으로 하는 동적 시간 와핑 방법.
  16. 제 15 항에 있어서,
    상기 제 1 단계는,
    상기 기준 패턴의 프레임 번호를 m으로 하고, 상기 테스트 패턴의 프레임 번호를 n으로 하는 (m,n)평면상에서, 상기 m의 초기값을 설정하는 제 4 단계;
    상기 n을 상기 m에서 상기 이타쿠라 제약 조건을 만족하는 최소값으로 설정하는 제 5 단계;
    상기 이타쿠라 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고, 점(m,n)의 누적거리를 산출하는 제 6 단계;
    상기 n을 증가시켜, 상기 n이 상기 이타쿠라 제약 조건을 만족하는지 확인하는 제 7 단계;
    상기 제 7 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하면, 상기 제 6 단계부터 반복 수행하는 제 8 단계;
    상기 제 7 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하지 않으면, m이 상기 기준 패턴의 상기 소정의 위치에 대하여 나타내고 있는지 검사하는 제 9 단계;
    상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있지 않 으면, 상기 m을 증가시키고 상기 제 5 단계부터 반복 수행하는 제 10 단계; 및
    상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있으면, 상기 제 2 단계부터 수행하는 제 11 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  17. 제 16 항에 있어서,
    상기 제 2 단계는,
    상기 m에서 상기 이타쿠라 제약 조건에 의해 가능한 상기 n에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리에 대한 소정의 기준 값을 결정하는 제 12 단계; 및
    상기 소정의 기준 값을 넘어서는 누적거리를 가진 점을 상기 누적거리 연산의 대상에서 제외하는 제 13 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  18. 제 14 항 내지 제 17 항 중 어느 한 항에 있어서,
    상기 제 3 단계는,
    상기 기준 패턴의 프레임 번호를 m으로 하고, 상기 테스트 패턴의 프레임 번호를 n으로 하는 상기 (m,n)평면상에서, 상기 기준 패턴의 위치인 상기 m을 증가시 키고, 상기 n을 상기 m에서 상기 이타쿠라 제약 조건을 만족하는 최소값으로 설정하는 제 14 단계;
    상기 설정된 연산 제외 대상의 점과 상기 이타쿠라 제약 조건을 만족하지 못하는 점을 상기 누적거리 연산의 대상에서 제외하고, 점(m,n)의 누적 거리를 산출하는 제 15 단계;
    상기 연산 제외 대상의 점과 상기 이타쿠라 제약 조건을 만족하지 못하는 점으로 인해 누적거리를 산출하지 못한 점도 상기 연산 제외 대상의 점으로 설정하는 제 16 단계;
    상기 n을 증가시켜, 상기 n이 상기 이타쿠라 제약 조건을 만족하는지 확인하는 제 17 단계;
    상기 제 17 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하면, 상기 제 15 단계부터 반복 수행하는 제 18 단계;
    상기 제 17 단계의 확인 결과, 상기 이타쿠라 제약 조건을 만족하지 않으면, 상기 m이 상기 기준 패턴의 끝을 나타내고 있는지 검사하는 제 19 단계;
    상기 제 19 단계의 검사 결과, 상기 기준 패턴의 끝을 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 14 단계부터 반복 수행하는 제 20 단계; 및
    상기 제 19 단계의 검사 결과, 상기 기준 패턴의 끝을 나타내고 있으면, 누적거리 연산을 종료하는 제 21 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  19. 제 18 항에 있어서,
    상기 소정의 위치는,
    상기 기준 패턴의 중간 위치인 것을 특징으로 하는 동적 시간 와핑 방법.
  20. 제 18 항에 있어서,
    상기 소정의 기준 값은,
    상기 누적거리에 대한 합계의 평균인 것을 특징으로 하는 동적 시간 와핑 방법.
  21. 제 14 항에 있어서,
    상기 누적거리 연산은,
    사코에(Sakoe) 및 치바(Chiba)가 제안한 제약 조건을 감안하여 연산하는 것을 특징으로 하는 동적 시간 와핑 방법.
  22. 제 21 항에 있어서,
    상기 제 1 단계는,
    상기 기준 패턴의 프레임 번호를 m으로 하고, 상기 테스트 패턴의 프레임 번호를 n으로 하는 (m,n)평면상에서, 상기 m의 초기값을 설정하는 제 4 단계;
    상기 n을 상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는 최소값으로 설정하는 제 5 단계;
    상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 못하는 점을 연산 대상에서 제외하고, 점(m,n)의 누적거리를 산출하는 제 6 단계;
    상기 n을 증가시켜, 상기 n이 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는지 확인하는 제 7 단계;
    상기 제 7 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하면, 상기 제 6 단계부터 반복 수행하는 제 8 단계;
    상기 제 7 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 않으면, m이 상기 기준 패턴의 상기 소정의 위치에 대하여 나타내고 있는지 검사하는 제 9 단계;
    상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 5 단계부터 반복 수행하는 제 10 단계; 및
    상기 제 9 단계의 검사 결과, 상기 소정의 위치에 대하여 나타내고 있으면, 상기 제 2 단계부터 수행하는 제 11 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  23. 제 22 항에 있어서,
    상기 제 2 단계는,
    상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건에 의해 가능한 상기 n에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리에 대한 소정의 기준 값을 결정하는 제 12 단계; 및
    상기 소정의 기준 값을 넘어서는 누적거리를 가진 점을 상기 누적거리 연산의 대상에서 제외하는 제 13 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  24. 제 21 항 내지 제 23 항 중 어느 한 항에 있어서,
    상기 제 3 단계는,
    상기 기준 패턴의 프레임 번호를 m으로 하고, 상기 테스트 패턴의 프레임 번호를 n으로 하는 상기 (m,n)평면상에서, 상기 기준 패턴의 위치인 상기 m을 증가시키고, 상기 n을 상기 m에서 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는 최소값으로 설정하는 제 14 단계;
    상기 설정된 연산 제외 대상의 점과 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 못하는 점을 상기 누적거리 연산의 대상에서 제외하고, 점(m,n)의 누적 거리를 산출하는 제 15 단계;
    상기 연산 제외 대상의 점과 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조 건을 만족하지 못하는 점으로 인해 누적거리를 산출하지 못한 점도 상기 연산 제외 대상의 점으로 설정하는 제 16 단계;
    상기 n을 증가시켜, 상기 n이 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하는지 확인하는 제 17 단계;
    상기 제 17 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하면, 상기 제 15 단계부터 반복 수행하는 제 18 단계;
    상기 제 17 단계의 확인 결과, 상기 사코에(Sakoe) 및 치바(Chiba)의 제약 조건을 만족하지 않으면, 상기 m이 상기 기준 패턴의 끝을 나타내고 있는지 검사하는 제 19 단계;
    상기 제 19 단계의 검사 결과, 상기 기준 패턴의 끝을 나타내고 있지 않으면, 상기 m을 증가시키고 상기 제 14 단계부터 반복 수행하는 제 20 단계; 및
    상기 제 19 단계의 검사 결과, 상기 기준 패턴의 끝을 나타내고 있으면, 누적거리 연산을 종료하는 제 21 단계
    를 포함하여 이루어진 동적 시간 와핑 방법.
  25. 제 24 항에 있어서,
    상기 소정의 위치는,
    상기 기준 패턴의 중간 위치인 것을 특징으로 하는 동적 시간 와핑 방법.
  26. 제 24 항에 있어서,
    상기 소정의 기준 값은,
    상기 누적거리에 대한 합계의 평균인 것을 특징으로 하는 동적 시간 와핑 방법.
  27. 대용량 프로세서를 구비한 음성 인식 시스템에,
    입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 테스트 패턴을 연산의 우선순위로 하여, 상기 테스트 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 기능;
    상기 테스트 패턴의 소정의 위치에서 가능한 모든 기준 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 기준 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 기능; 및
    제외된 상기 기준 패턴 위치를 감안하여 상기 누적거리 연산을 상기 테스트 패턴의 끝까지 수행하는 제 3 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  28. 대용량 프로세서를 구비한 음성 인식 시스템에,
    입력된 음성의 음성 특징 벡터를 테스트 패턴(test pattern)으로 하고, 기준되는 음성의 음성 특징 벡터를 기준 패턴(reference pattern)으로 하며, 상기 기준 패턴을 연산의 우선순위로 하여, 상기 기준 패턴의 소정의 위치까지 누적거리를 연산하는 제 1 기능;
    상기 기준 패턴의 소정의 위치에서 가능한 모든 테스트 패턴 위치에 대하여, 상기 누적거리 연산에 의해 얻어진 상기 누적거리가 소정의 값을 넘어서는 상기 테스트 패턴 위치를 상기 누적거리 연산의 대상에서 제외하는 제 2 기능; 및
    제외된 상기 테스트 패턴 위치를 감안하여 상기 누적거리 연산을 상기 기준 패턴의 끝까지 수행하는 제 3 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1019990003701A 1999-02-04 1999-02-04 음성 인식 속도 향상을 위한 동적 시간 와핑 방법 KR100282555B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990003701A KR100282555B1 (ko) 1999-02-04 1999-02-04 음성 인식 속도 향상을 위한 동적 시간 와핑 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990003701A KR100282555B1 (ko) 1999-02-04 1999-02-04 음성 인식 속도 향상을 위한 동적 시간 와핑 방법

Publications (2)

Publication Number Publication Date
KR20000055194A KR20000055194A (ko) 2000-09-05
KR100282555B1 true KR100282555B1 (ko) 2001-02-15

Family

ID=19573307

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990003701A KR100282555B1 (ko) 1999-02-04 1999-02-04 음성 인식 속도 향상을 위한 동적 시간 와핑 방법

Country Status (1)

Country Link
KR (1) KR100282555B1 (ko)

Also Published As

Publication number Publication date
KR20000055194A (ko) 2000-09-05

Similar Documents

Publication Publication Date Title
KR101988222B1 (ko) 대어휘 연속 음성 인식 장치 및 방법
US20190057683A1 (en) Encoder-decoder models for sequence to sequence mapping
US5390278A (en) Phoneme based speech recognition
EP0706171A1 (en) Speech recognition method and apparatus
US20110077943A1 (en) System for generating language model, method of generating language model, and program for language model generation
US20140195474A1 (en) Method and system for improved pattern matching
JPH07261784A (ja) パターン認識方法、音声認識方法および音声認識装置
CA2304747C (en) Pattern recognition using multiple reference models
EP0086081B1 (en) Continuous speech recognition system
US8849662B2 (en) Method and system for segmenting phonemes from voice signals
EP0525640A2 (en) Dynamic programming matching system for speech recognition
EP1887562A1 (en) Speech recognition by statistical language model using square-root smoothing
Brown et al. Dynamic time warping for isolated word recognition based on ordered graph searching techniques
KR100282555B1 (ko) 음성 인식 속도 향상을 위한 동적 시간 와핑 방법
US20180350358A1 (en) Voice recognition device, voice emphasis device, voice recognition method, voice emphasis method, and navigation system
US7912715B2 (en) Determining distortion measures in a pattern recognition process
EP0215573B1 (en) Apparatus and methods for speech recognition
GB2179483A (en) Speech recognition
Hu et al. A neural network based nonlinear feature transformation for speech recognition.
JP3781215B2 (ja) 画像データの特徴点検出方法
JPH06324699A (ja) 連続音声認識装置
KR100293465B1 (ko) 음성인식방법
KR100492089B1 (ko) 반음소 모델을 이용한 발화검증시 계산량 감소 방법
JPH0464077B2 (ko)
JPH0195373A (ja) パタン尤度計算方式

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121114

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20131031

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20141028

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20151030

Year of fee payment: 16

FPAY Annual fee payment

Payment date: 20160823

Year of fee payment: 17

LAPS Lapse due to unpaid annual fee