KR100612882B1

KR100612882B1 - 시계열 신호의 패턴 인식 가능성 판단 방법 및 장치

Info

Publication number: KR100612882B1
Application number: KR1020040115069A
Authority: KR
Inventors: 황광일
Original assignee: 삼성전자주식회사
Priority date: 2004-12-29
Filing date: 2004-12-29
Publication date: 2006-08-14
Also published as: JP2006189862A; US20060143005A1; US7603274B2; JP5026700B2; KR20060076595A

Abstract

패턴 인식률 자체와는 독립적으로 시계열 신호의 패턴 인식 가능성을 판단할 수 있는 방법 및 장치가 개시된다. 본 발명에 의한 시계열 신호의 패턴 인식 가능성 판단 방법은, 시계열 패턴을 가지는 입력 신호로부터 시간 정방향 특징 및 시간 역방향 특징을 추출하는 단계, 시간 정방향 특징 및 시간 역방향 특징을 이용하여 시간 정방향 정렬 및 시간 역방향 정렬을 생성하는 단계, 시간 정방향 정렬과 시간 역방향 정렬을 서로 비교하여 유사도를 계산하는 단계, 및 유사도가 소정의 임계값 이상인 경우 입력 신호가 인식 가능한 것으로 결정하는 단계를 포함한다. 복수의 패턴 인식 모델을 이용하여 시계열 신호로부터 패턴들을 각각 추출한 후 이들 간의 유사도를 구하여 임계값과 비교함으로써, 각각의 패턴 인식 모델의 패턴 인식 성능과 독립적으로 시스템 전체의 패턴 인식 가능성을 판단할 수 있다. 또한 이를 시계열 신호의 패턴 인식 방법 및 장치에서 채용함에 의해, 무제한 환경에서의 패턴 인식이 가능하게 되는 효과가 있다.

Description

시계열 신호의 패턴 인식 가능성 판단 방법 및 장치{Method and apparatus for determining the possibility of pattern recognition of time series signal}

도 1은 시계열 신호의 패턴 인식 과정을 나타낸 개념도이다.

도 2는 각 프레임별로 특징(feature)에 스테이트들을 대응하는 과정을 나타낸 도면이다.

도 3은 패턴에 대응시킨 특징들의 정렬(alignment of features)을 나타낸 도면이다.

도 4는 핸드폰의 사용자 인터페이스를 나타낸 도면이다.

도 5는 본 발명에 따른 시계열 신호의 패턴 인식 가능성 판단 장치의 구성을 나타낸 블록도이다.

도 6은 도 5에 도시된 시계열 신호의 패턴 인식 가능성 판단 장치에서 수행되는 시계열 신호의 패턴 인식 가능성 판단 방법의 각 단계를 나타낸 흐름도이다.

도 7은 도 5에 도시된 특징 추출부의 일 실시예의 구성을 나타낸 블록도이다.

도 8은 도 7에 도시된 특징 추출부에서 수행되는 특징 추출 방법의 일 실시예의 각 단계를 나타내는 흐름도이다.

도 9는 도 7에 도시된 신호 역전부의 일 실시예의 구성을 나타낸 블록도이 다.

도 10은 도 9에 도시된 신호 역전부에서 수행되는 신호 역전 방법의 일 실시예의 각 단계를 나타낸 흐름도이다.

도 11은 도 9에 도시된 신호역전부의 일 실시예에 의한 시간 역전 과정의 일 예를 나타낸 도면이다.

도 12는 다양한 역전 구간 길이에 대한 피실험자들의 단어 인식률을 나타낸 그래프이다.

도 13은 도 5에 도시된 유사도 계산부의 일 실시예의 구성을 나타낸 블록도이다

도 14는 도 13에 도시된 유사도 계산부에서 수행되는 유사도 계산 방법의 일 실시예의 각 단계를 나타낸 흐름도이다.

도 15는 도 5에 도시된 유사도 계산부의 다른 일 실시예의 구성을 나타낸 블록도이다.

도 16은 본 발명에 따른 유사도 계산부의 일 실시예에 있어서, 여러 환경에서의 유사도의 값들을 나타낸 그래프이다.

<부호의 설명>

2: 무선 전파의 세기를 나타내는 표시

4: 충전지의 충전 상태를 나타내는 표시

6: 시간 정방향 신호(time forward signal)

8: 시간 역방향 신호(time reversed signal)

10: 입력 신호

11: 시간 정방향 특징(time forward feature)

12: 시간 역방향 특징(time reversed feature)

13: 시간 정방향 정렬(time forward alignment)

14: 시간 역방향 정렬(time reversed alignment)

16: 유사도(likelihood)

18: 시간 역방향 신호(time reversed signal)

20: 부분 신호들 22: 시간 역전된 부분 신호들

30: 인식 단어 유사도 32: 정렬 유사도

34: 특징 유사도 36: 시계열 신호(time series signal)

38: 특징(feature) 40: 스테이트들(states)

42: 불일치 프레임 수 44: 일치 프레임 수

56: 시간 정방향 신호의 패턴 인식 시스템에서 사후에 조사된 사용자 만족도

57: 시간 역방향 신호의 패턴 인식 시스템에서 사후에 조사된 사용자 만족도

58: 본 발명에 따른 유사도계산부에서 계산된 유사도

100: 시계열 신호의 패턴 인식 가능성 판단 장치

110: 특징 추출부 120: 정렬 생성부

130: 유사도 계산부 140: 인식 가능성 결정부

150: 신호 역전부 160: 정방향 특징 추출부

170: 역방향 특징 추출부 180: 신호 분리부

190: 부분 신호 역전부 200: 부분 신호 합성부

210: 인식단어 유사도 계산부 220: 정렬 유사도 계산부

230: 특징 유사도 계산부 240: 유사도 조합부

250: 불일치 스테이트 검색부 260: 일치 프레임수 계산부

270: 비율 계산부

본 발명은 신호의 인식에 관한 것으로서, 특히 시계열 신호의 패턴 인식 가능성을 판단하는 방법 및 장치에 관한 것이다.

시계열 신호(time series siganal)이란 시간의 움직임에 따라 그 값이 변화하는 신호를 말한다. 시계열 신호의 예로는 음성 신호(speech signal), 필기체 문자(handwritten character), 제스쳐(gesture) 등이 있다.

시계열 신호로부터 그 안에 포함된 내용을 인식하는 것을 시계열 신호의 패턴 인식(pattern recognition)이라고 한다. 시계열 신호의 패턴 인식의 대표적인 예로서 음성 인식(speech recognition)을 들 수 있다.

음성 인식이란 기계로 하여금 인간의 일상적인 음성을 이해하고 이해된 음성에 따라 업무를 수행하게 하는 것을 말한다. 음성 인식의 기술은 컴퓨터와 정보 통신의 발달로 인해 인간이 직접 움직이지 않고서도 원거리에서 정보를 손쉽게 얻을 수 있으며, 음성에 따라 작동하는 시스템으로 이루어진 기기들의 개발로 이어지고 있다.

이러한 음성 인식 기술을 바탕으로 다양한 음성 인식 응용 시스템이 개발되고 있으며, 그 중의 하나는 사용자가 발성한 언어에 따라 원하는 정보를 안내하는 시스템이다. 예를 들어, 어느 단체의 전화 번호 안내 시스템이 있다고 가정할 때, 사용자가 찾고자 하는 부서의 명칭을 음성으로 발성을 하게 되면 해당 부서의 전화번호를 사용자의 모니터 상에 디스플레이하는 시스템을 생각할 수 있다.

이러한 음성 인식 시스템을 포함한 시계열 신호의 패턴 인식 시스템에 있어서, 가장 바람직한 것은 사용자가 패턴 인식 시스템의 존재를 인식하지 않고 사람과 직접 그 패턴에 포함된 내용을 의사교환하는 것과 같은 환경을 조성하는 것이다. 그러나, 이러한 시스템을 구현하는 것은 매우 어려운 일이다. 현재 기술 수준에서 연구되고 있는 것은 시계열 신호의 패턴 인식 시스템에서는 패턴 인식의 가능성을 판단하여 패턴 인식이 가능한 부분은 기계가 패턴 인식을 수행하고, 패턴 인식이 불가능한 부분은 사람에게 연결하도록 하는 방식이다.

예를 들어, 전화 번호 안내 시스템에 있어, 사용자가 음성 인식 시스템이 인식하지 못하는 말을 하거나 음성 인식 시스템 상의 데이터 베이스에 존재하지 않는 부서의 명칭 등을 요구하는 경우, 이를 인간 안내원(human operator)에게 연결하여 해결하도록 하는 것이다.

그런데, 종래 기술의 문제점은, 시계열 신호의 패턴 인식 시스템에서 시스템 자신이 패턴 인식 할 수 있는 것인지를 판단하는 능력이 시스템의 패턴 인식률 자체에 의존한다는 것이다. 다시 말해 패턴 인식의 능력이 우월한 시스템은 자신이 인식할 수 없는 상황을 판단하는 능력도 우수하지만, 패턴 인식의 능력이 열등한 시스템은 자신이 인식할 수 없는 상황을 판단하는 능력도 열등하다는 것이다.

이는 동일한 시스템 내에서 환경의 변화에 따라 패턴 인식률이 달라지는 경우에도 동일한 문제가 발생한다. 즉, 종래의 시스템은 패턴 인식이 잘 되고 있어서 인간 안내원에게 연결할 필요성이 적은 상황에서는 잘 동작하지만, 정작 패턴 인식이 잘 되지 않아서 인간 안내원에게 연결할 필요성이 큰 상황에서는 자신이 패턴 인식을 잘 하지 못하고 있음을 판단하지 못하게 되고, 따라서 인간 안내원에게 연결하는 대신 계속 자신이 패턴 인식을 하려고 노력하게 되며, 결국 사용자에게 불편함을 초래하게 된다.

본 발명이 이루고자 하는 기술적 과제는, 시계열 패턴을 가지는 신호의 인식에 있어서 인식률 자체와는 독립적으로 인식 가능성을 판단할 수 있는 방법 및 장치를 제공하는 것이다.

본 발명이 이루고자 하는 다른 기술적 과제는 상기의 시계열 패턴을 가지는 신호의 인식 가능성 판단 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 것이다.

상기 기술적 과제를 이루기 위한 시계열 신호의 패턴 인식 가능성 판단 방법 은, 시계열 패턴을 가지는 입력 신호로부터 시간 정방향 특징 및 시간 역방향 특징을 추출하는 단계; 상기 시간 정방향 특징 및 상기 시간 역방향 특징을 이용하여 시간 정방향 정렬 및 시간 역방향 정렬을 생성하는 단계; 상기 시간 정방향 정렬과 상기 시간 역방향 정렬을 서로 비교하여 유사도를 계산하는 단계; 및 상기 유사도가 소정의 임계값 이상인 경우 상기 입력 신호가 인식 가능한 것으로 결정하는 단계를 포함하는 것이 바람직하다.

상기 기술적 과제를 이루기 위한 시계열 신호의 패턴 인식 가능성 판단 장치는, 시계열 패턴을 가지는 입력 신호로부터 시간 정방향 특징 및 시간 역방향 특징을 추출하는 특징추출부; 상기 시간 정방향 특징 및 상기 시간 역방향 특징을 이용하여 시간 정방향 정렬 및 시간 역방향 정렬을 생성하는 정렬생성부; 상기 시간 정방향 정렬과 상기 시간 역방향 정렬을 서로 비교하여 유사도를 계산하는 유사도계산부; 및 상기 유사도가 소정의 임계값 이상인 경우 상기 입력 신호가 인식 가능한 것으로 결정하는 인식가능성결정부를 포함하는 것이 바람직하다.

이하, 첨부된 도면들을 참조하여 본 발명에 따른 시계열 신호의 패턴 인식 가능성 판단 방법 및 장치에 대하여 상세히 설명한다.

도 1은 시계열 신호의 패턴 인식 과정을 나타낸 개념도이다.

시계열 신호(36)는 시간의 변화에 따라 그 값이 변화한다. 시계열 신호의 예로는 음성 신호(speech signal), 필기체 문자(handwritten character), 또는 제스쳐(gesture) 등이 있다. 필기체 문자나 제스쳐 등의 경우 시계열 신호는 2차원 또는 3차원 공간 상의 좌표 값을 가질 수 있다. 이 경우에도 적절한 좌표 변환을 통해 도 1에 도시된 바와 같은 시계열 신호(36)를 얻을 수 있다.

시계열 신호(36)의 패턴 인식을 위해서는 시계열 신호 중에서 패턴 인식에 유효한 정보만을 추출해야 한다. 이를 특징 추출(feature extraction)이라 한다. 도 1을 참조하면, 시계열 신호(36)를 프레임(frame) 단위로 나누고, 각 프레임마다 특징(feature, 38)을 추출한다.

특징을 추출한 후에는 각 프레임 별로 특징에 포함된 내용에 기초하여 스테이트들(states, 40)을 대응시킨다.

도 2는 각 프레임별로 특징(feature)에 스테이트들을 대응하는 과정을 나타낸 도면이다. 도 2를 참조하면 관찰된 특징(observed feature)들은 은닉 마코프 모델(hidden Markof Model: HMM) 상의 각 스테이트들(s₁, s₂, s₃ 등)에 대응된다. 도 2의 예에서는, 특징 o₁과 o₂는 스테이트 s₁에 대응되고, 특징 o₃은 스테이트 s₂에 대응되고, 특징 o₄와 o₅는 스테이트 s₃에 대응되고, 특징 o₆은 스테이트 s₄에 대응된다.

이와 같이 은닉 마코프 모델 상의 각 스테이트에 대응시킨 특징들의 배열을 정렬(alignment)라고 한다. 그리고 각 스테이트는 인식하고자 하는 패턴에 대응하므로, 각 프레임별 특징은 패턴에 대응하게 된다. 이러한 패턴의 예로는, 음성 인식에 있어서의 음소나 단어, 또는 필기체 문자 인식에 있어서의 글자 등이 있다. 즉, 각각의 특징들은 특정 음소나 단어, 또는 글자 등에 대응하게 된다.

도 3은 이러한 패턴에 대응시킨 특징들의 정렬(alignment of features)을 나타낸 도면이다. 도 3의 상단부의 정렬을 살펴보면, 4개의 프레임들이 스테이트(또는 패턴) a에 대응하고, 다음 5개의 프레임들이 스테이트(또는 패턴) b에 대응한 다. 반면, 도 3의 하단부의 정렬을 살펴보면, 4개의 프레임들이 스테이트(또는 패턴) a에 대응하고, 다음 6개의 프레임들이 스테이트(또는 패턴) b에 대응한다.

도 4는 핸드폰의 사용자 인터페이스를 나타낸 도면이다. 도 4를 참조하여 핸드폰의 사용자 인터페이스를 시계열 신호의 패턴 인식에서의 사용자 인터페이스와 비교함으로써, 일반적인 시계열 신호의 패턴 인식 시스템의 문제점을 설명하고자 한다.

도 4에 도시된 바와 같이, 일반적인 핸드폰의 표시 화면 상에는 무선 전파의 세기를 나타내는 표시(2)와 충전지의 충전 상태를 나타내는 표시(4)가 있다. 무선 전파의 세기를 나타내는 표시(2)는 핸드폰 외부의 환경을 나타내는 표시의 하나이고, 충전지의 충전 상태를 나타내는 표시(4)는 핸드폰 내부의 환경을 나타내는 표시의 하나이다.

무선 전파의 세기가 약해지는 경우, 무선 전파의 세기를 나타내는 표시(2)는 안테나의 수를 줄여 표시함으로써 사용자에게 무선 전파의 세기가 약해짐을 알려준다. 만일 무선 전파의 세기가 특정 값 이하로 약해지면, 사용자는 통화가 불가능하게 됨을 미리 알고서 전파의 세기가 더 강한 곳으로 이동하거나 통화를 나중으로 미룰 것이다. 따라서 사용자는 무선 전파의 세기가 약해졌음을 모르는 상태에서 통화를 시도하는 일이 없게 된다.

또한, 충전지의 충전 상태가 변함에 따라, 충전지의 충전 상태를 나타내는 표시(4)는 충전된 전기의 양에 비례하여 검은 점의 수를 변경하여 보여준다. 만일 충전된 전기의 양이 특정 값 이하로 떨어지면, 사용자는 전기가 부족하게 될 것을 미리 알고서 핸드폰을 충전하거나 충전지를 모두 방전시킬 수 있는 긴 통화를 나중으로 미룰 것이다. 따라서 사용자는 충전지가 거의 다 방전되었음을 모르는 상태에서 통화를 시도하는 일이 없게 된다.

이와 같이 핸드폰의 외부 환경 및 내부 환경을 나타내는 표시를 사용자 인터페이스에서 제공함에 의해, 사용자의 만족도를 높여주는 효과가 있다. 예를 들어, 이러한 표시가 제공되지 않는다면, 사용자가 무선 전파의 세기가 약해졌거나 충전지가 거의 다 방전되었음을 모르는 상태에서 통화를 시도하게 되어 여러 번의 통화 시도 실패를 경험하게 될 것이고, 이 경우 사용자는 핸드폰의 사용에 대해 많은 불만을 가지게 될 것이다.

그런데, 음성 인식 시스템과 같은 시계열 신호의 패턴 인식 시스템에서는, 핸드폰의 사용자 인터페이스에서 제공하는 이러한 표시들을 제공하지 않는다. 즉, 일반적인 시계열 신호의 패턴 인식 시스템은 자신이 패턴 인식을 제대로 수행하고 있는지를 사용자에게 알려주는 표시를 제공하지 않는다.

따라서, 시계열 신호의 패턴 인식 시스템에서 자신이 패턴 인식을 제대로 수행하고 있는지를 판단하여 이를 사용자에게 알려주는 방식에 대한 연구가 진행되어 왔다. 이러한 연구 중에 대표적인 것은, 시계열 신호의 패턴 인식 시스템이 패턴 인식의 가능성을 판단하여, 패턴 인식이 가능한 부분은 자신이 직접 패턴 인식을 수행하고, 패턴 인식이 불가능한 부분은 그것이 불가능한 것임을 사용자에게 알려주는 방식이다. 이는 다시 말하면, 아는 것은 안다고 하고 모르는 것은 모른다고 할 수 있는 시스템에 대한 연구라고 할 것이다.

그런데, 이러한 방식의 패턴 인식 시스템에서의 문제점은, 패턴 인식 시스템에서 자신이 패턴 인식을 수행할 수 있는지를 판단하는 과정이 시스템의 패턴 인식 과정을 이용한다는 것이다. 이에 의해, 패턴 인식이 잘 되는 경우에는 자신이 패턴 인식을 잘 하고 있다는 것을 인식하는 능력도 우수하지만, 반대로 패턴 인식이 잘 되지 않는 경우에는 자신이 패턴 인식을 잘 하고 있지 못하다는 것을 인식하는 능력도 열등한 결과를 낳게 된다.

본 발명에서는 이러한 문제점을 해결하고, 패턴 인식 과정 자체와 독립적으로 패턴 인식 가능성을 판단하는 방식을 제공하기 위하여, 복수의 패턴 인식 모델을 이용하여 시계열 신호의 패턴을 인식하는 방식을 채택한다.

본 발명에 의한 패턴 인식 시스템의 기본적인 접근 방식은, 입력된 시계열 신호에 서로 다른 복수의 패턴 인식 모델을 이용하여 패턴 인식을 수행한 후 그 결과들을 비교하는 것에 의해 패턴 인식이 제대로 되었는지를 판단하는 것이다. 이러한 방식에 의하면, 각각의 패턴 인식 모델의 패턴 인식률과는 독립적으로 시스템의 패턴 인식의 가능성을 판단할 수 있게 된다.

본 발명의 접근 방식을 일그러진 거울창의 비유를 통해 설명할 수 있다. 이 비유에 있어서는 각각 여러 개의 거울창이 붙어있는 벽과, 그 벽에 비친 건물을 생각해 볼 수 있다. 이 비유에 있어서, 전체 거울창들은 패턴 인식 시스템 전체에 비유되고, 각각의 거울창은 패턴 인식 시스템을 구성하는 각각의 패턴 인식 모델에 비유된다.

이 비유에 있어서, 건물의 실체는 하나이지만 그것이 보이는 모습은 벽을 구 성하는 거울창의 특성에 따라 변하는 것을 알 수 있다. 이는 각각의 패턴 인식 모델에 따라 동일한 시계열 신호를 패턴 인식한 결과가 달라질 수가 있다는 것에 비유된다.

그러나, 각 거울창에 비친 모습과 그 주변의 거울창에 비친 모습을 비교하면 서로 상대적 유사성이 있게 된다. 즉, 주어진 환경에 따라 건물의 모습을 얼마나 잘 반영하는지 여부는 달라지지만, 동일한 환경이 적용되는 전체 거울창이 건물의 모습을 반영하는 정도는 서로 유사하게 된다.

따라서, 어느 거울창에 비친 모습과 그 주변의 거울창에 비친 모습이 전혀 무관한 경우는 발생하지 않게 된다. 실제 거울창의 예에서 이러한 경우가 발생하지 않는 것과 마찬가지로, 패턴 인식 시스템에 있어서도 특정 패턴 인식 모델의 적용 결과가 다른 패턴 인식 모델의 적용 결과와 극단적으로 차이가 나는 경우는 발생하지 않게 된다.

본 발명에 의한 패턴 인식 시스템에 있어서는, 복수의 패턴 인식 모델을 이용하여 시계열 신호로부터 패턴들을 각각 추출한 후, 이들을 비교하는 방법을 사용한다. 이때 각각의 패턴들을 비교하여 유사도(likelihood)를 계산하여 유사도가 임계값 이상일 때만 그 패턴을 채택한다. 종래의 시계열 신호의 패턴 인식 시스템에서는 하나의 패턴 인식 모델에 의해 추출된 패턴에 대해 신뢰도(confidence)를 계산하여 신뢰도가 임계값 이상인 경우 그 패턴이 제대로 인식된 것으로 간주하여 이를 그대로 사용하였다. 그러나, 본 발명에 의한 패턴 인식 시스템에서는 이러한 과정과 함께 각각의 패턴 인식 모델들을 적용하여 추출된 패턴들을 비교하여 어느 정 도의 유사도를 가지지 않는 경우에는 추출된 패턴을 채택하지 않는 방식을 사용한다. 이를 통하여 패턴 인식률 자체와는 독립적으로 패턴 인식이 제대로 된 것인지 여부를 알 수 있게 된다.

도 5는 본 발명에 따른 시계열 신호의 패턴 인식 가능성 판단 장치의 구성을 나타낸 블록도이다. 도 5를 참조하면, 본 발명에 따른 시계열 신호의 패턴 인식 가능성 판단 장치(100)의 일 실시예는 특징 추출부(110), 정렬 생성부(120), 유사도 계산부(130), 및 인식 가능성 결정부(140)를 포함한다.

특징 추출부(110)는 시계열 패턴을 가지는 입력 신호(10)로부터 시간 정방향 특징(time forward feature, 11) 및 시간 역방향 특징(time reversed feature, 12)을 추출한다(S100).

시간 정방향 특징(time forward feature, 11)이란 입력 신호에 대해 도 1에서 도시한 바와 같은 특징 추출 과정을 적용하여 추출한 특징을 말한다. 시간 역방향 특징(time reversed feature, 12)이란 입력 신호(10)의 시간 역방향 신호(time reversed signal)에 대해 특징 추출 과정을 적용하여 추출한 특징을 말한다. 시간 역방향 신호(time reversed signal)이란 입력 신호에 대해 시간 역전 과정(time reversed process)을 적용한 것을 말한다. 시간 역전 과정에 대해서는 도 9의 신호역전부를 설명하면서 같이 설명하기로 한다.

정렬 생성부(120)는 시간 정방향 특징(11) 및 시간 역방향 특징(12)을 이용 하여 시간 정방향 정렬(time forward alignment, 13) 및 시간 역방향 정렬(time reversed alignment, 14)을 생성한다(S110). 시간 정방향 정렬(time forward alignment, 13)이란 시간 정방향 특징(11)의 각 프레임(frame) 별로 은닉 마코프 모델(Hidden Markof Model: HMM) 상의 각 스테이트를 대응시킨 것이다. 시간 역방향 정렬(time reversed alignment, 14)이란 시간 역방향 특징(12)의 각 프레임(frame) 별로 은닉 마코프 모델(Hidden Markof Model: HMM) 상의 각 스테이트를 대응시킨 것이다.

정렬 생성부(120)는 정방향 정렬 생성부 및 역방향 정렬 생성부를 포함하는 것이 바람직하다.

정방향 정렬 생성부는 시간 정방향 특징을 각 프레임 별로 시간 정방향 은닉 마코프 모델 상의 각 스테이트에 대응시킨다.

역방향 정렬 생성부는 시간 역방향 특징으로 각 프레임 별로 시간 역방향 은닉 마코프 모델 상의 각 스테이트에 대응시킨다.

유사도 계산부(130)는 시간 정방향 정렬(13)과 시간 역방향 정렬(14)을 서로 비교하여 유사도(16)를 계산한다(S120).

인식가능성 결정부(140)는 유사도가 임계값 이상인가를 판단하여(S130), 유사도(16)가 임계값 이상인 경우 입력 신호(10)가 인식 가능한 것으로 결정하고(S140), 유사도(16)가 임계값 이상이 아닌 경우 입력 신호(10)가 인식 불가능한 것으로 결정한다(S150).

도 7은 도 5에 도시된 특징 추출부(110)의 일 실시예의 구성을 나타낸 블록 도이다. 도 7을 참조하면, 본 발명에 따른 특징 추출부(110)는 신호 역전부(150), 정방향 특징 추출부(160), 및 역방향 특징 추출부(170)를 포함하는 것이 바람직하다.

도 8은 도 7에 도시된 특징 추출부(110)에서 수행되는 특징 추출 방법의 일 실시예의 각 단계를 나타내는 흐름도이다. 도 8에 도시된 특징 추출 방법은 도 6의 S100 단계의 일 실시예이다.

신호 역전부(150)는 입력 신호(10)를 시간 역전하여 시간 역방향 신호(18)를 생성한다(S160).

정방향 특징 추출부(160)는 입력 신호(10)으로부터 시간 정방향 특징(11)을 추출한다(S170).

역방향 특징 추출부(170)는 시간 역방향 신호(18)로부터 시간 역방향 특징(12)를 추출한다(S180).

도 9는 도 7에 도시된 신호 역전부(150)의 일 실시예의 구성을 나타낸 블록도이다. 도 9를 참조하면, 본 발명에 따른 신호 역전부(150)는 신호 분리부(180), 부분 신호 역전부(190), 및 부분신호 합성부(200)를 포함하는 것이 바람직하다.

도 10은 도 9에 도시된 신호 역전부(150)에서 수행되는 신호 역전 방법의 일 실시예의 각 단계를 나타낸 흐름도이다. 도 10에 도시된 신호 역전 방법은 도 8의 S160 단계의 일 실시예이다.

신호 분리부(180)는 입력 신호(10)를 역전 구간 길이(reversed region length) 단위의 부분 신호들(20)로 나눈다(S190).

부분 신호 역전부(190)는 부분 신호들(20)을 각각 시간 역전한다(S200).

부분신호 합성부(200)는 시간 역전된 부분 신호들(22)을 합쳐서 시간 역방향 신호(time reversed signal, 18)를 생성한다(S210).

도 11은 도 9에 도시된 신호역전부(150)의 일 실시예에 의한 시간 역전 과정의 일 예를 나타낸 도면이다.

입력 신호인 시간 정방향 신호(time forward signal, 6)는 신호 분리부(180)에 의해 부분 신호들(f1, f2, f3, 등)로 나누어 진다. 이때 부분 신호들은 역전 구간 길이(도 18의 l) 단위를 가진다. 나누어진 부분 신호들(f1, f2, f3, 등)은 부분신호 역전부(190)에서 각각 시간 역전된다. 시간 역전된 부분 신호들은 부분 신호 합성부에서 합쳐져서 시간 역방향 신호(time reversed signal, 8)을 이루게 된다.

역전 구간 길이(reversed region length)는 입력 신호 전체의 길이가 될 수도 있고, 프레임의 길이도 될 수 있다.

음향 심리학에서는 이러한 시간 역전 방식에 의한 음성 신호에 대한 연구가 많이 이루어졌는데 이들 중 하나로 다음과 같은 것이 있다.

피실험자들에게 역전 구간 길이가 서로 다른 음성 신호를 들려 주어 어떤 단어로 인식되는지를 조사하여 원래의 단어와 동일하게 인식하는가를 연구하였다. 다수의 피실험자들에게 역전 구간 길이를 변경하면서 다수의 단어에 대해 실험을 행하였다.

도 12는 이러한 실험의 결과 다양한 역전 구간 길이에 대한 피실험자들의 단어 인식률을 나타낸 그래프이다. 도 12를 참조하면, 역전 구간 길이가 20 msec에서 60 msec까지는 단어 인식률이 정상을 유지하지만, 역전 구간 길이가 그 이상이 되기 시작하는 구간에서는 급격히 단어 인식률이 감소한다.

본 발명의 일 실시예에 있어서는, 역전 구간 길이가 도 12의 A 구간, 즉 40 msec 내지 60 msec 정도가 되도록 할 수 있다. 이는 이 구간에서의 시간 역방향 신호를 이용하는 것이, 실시간에서 시간의 역전이 용이하며 또한 시간 역방향 신호의 특성이 잘 나타나기 때문이다.

도 13은 도 5에 도시된 유사도 계산부(130)의 일 실시예의 구성을 나타낸 블록도이다. 도 13을 참조하면, 유사도 계산부(130)는 인식단어 유사도계산부(210), 정렬 유사도계산부(220), 특징 유사도 계산부(230), 및 유사도 조합부(240)를 포함하는 것이 바람직하다.

도 14는 도 13에 도시된 유사도 계산부(130)에서 수행되는 유사도 계산 방법의 일 실시예의 각 단계를 나타낸 흐름도이다. 도 14에 도시된 유사도 계산 방법은 도 6의 S120 단계의 일 실시예이다.

인식단어 유사도계산부(210)는 시간 정방향 정렬에 대응하는 인식된 단어와 시간 역방향 정렬에 대응하는 인식된 단어 간의 유사도인 인식단어 유사도(30)를 계산한다(S300).

정렬 유사도계산부(220)는 시간 정방향 정렬과 시간 역방향 정렬 간의 유사도인 정렬 유사도(32)를 계산한다(S310).

특징 유사도 계산부(230)는 시간 정방향 정렬에 대응하는 특징들과 시간 역방향 정렬에 대응하는 특징들 간의 유사도인 특징 유사도(34)를 계산한다(S320).

유사도 조합부(240)는 인식단어 유사도, 정렬 유사도, 및 특징 유사도를 조합하여 정방향 정렬과 역방향 정렬 간의 전체 유사도(16)를 계산한다(S330).

도 15는 도 5에 도시된 유사도 계산부(130)의 다른 일 실시예의 구성을 나타낸 블록도이다. 도 15를 참조하면, 본 발명에 따른 유사도 계산부(130)는 불일치스테이트검색부(250), 일치프레임수계산부(260), 및 비율계산부(270)를 포함하는 것이 바람직하다.

불일치스테이트검색부(250)는 시간 정방향 정렬 상의 프레임 별 스테이트와 시간 역방향 정렬 상의 프레임 별 스테이트를 서로 비교하여 삽입, 삭제, 또는 치환된 것을 찾는다.

일치프레임수계산부(260)는 삽입, 삭제, 또는 치환된 스테이트에 대응하는 프레임의 수를 전체 프레임의 수에서 뺀 프레임, 즉 시간 정방향 정렬 상의 프레임과 시간 역방향 정렬 상의 프레임이 스테이트가 일치하는 프레임의 수를 구한다.

비율계산부(270)는 일치 프레임 수를 전체 프레임의 수로 나누어 그 비율을 유사도로 결정한다.

도 16을 참조하면, 본 발명에 따른 유사도계산부(130)에서 계산된 유사도(58)는 시간 정방향 신호를 입력 신호로 하는 일반적인 패턴 인식 시스템에서 사후에 조사된 사용자 만족도(56) 및 시간 역방향 신호를 입력 신호로 하는 일반적인 패턴 인식 시스템에서 사후에 조사된 사용자 만족도(57)와 유사한 모양을 가지게 됨을 알 수 있다.

도 16의 A나 B 등과 같이, 하나의 패턴 인식 시스템에 의한 신뢰도는 조금 높은 값을 가지더라도 다른 하나의 음성 인식 시스템에 의한 신뢰도가 낮은 값을 가지는 경우, 정렬 간의 불일치가 크게 된다. 따라서 본 발명에 의한 패턴 인식 가능성 판단 시스템에서는 낮은 유사도를 산출하게 된다. 이러한 방식에 의해, 잘못 인식된 결과를 사용자에게 전달하지 않고, 시스템이 패턴 인식이 불가능한 시계열 신호임을 사용자에게 알리거나 인간 안내원에게 사용자를 연결시키게 된다.

따라서, 본 발명에 따른 시계열 신호의 패턴 인식 가능성 판단 방법 및 장치를 시계열 신호의 패턴 인식 방법 및 장치에서 채용함에 의해, 무제한 환경에서의 패턴 인식이 가능하다. 즉 패턴 인식이 가능한 환경에서는 패턴 인식을 수행하고, 패턴 인식이 불가능한 환경에서는 사용자에게 알리거나 인간의 도움을 요청하는 등 적응적인 패턴 인식을 수행하는 것이 가능하게 된다.

본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.

비록 상기 설명이 다양한 실시예들에 적용되는 본 발명의 신규한 특징들에 초점을 맞추어 설명되었지만, 본 기술 분야에 숙달된 기술을 가진 사람은 본 발명 의 범위를 벗어나지 않으면서도 상기 설명된 장치 및 방법의 형태 및 세부 사항에서 다양한 삭제, 대체, 및 변경이 가능함을 이해할 것이다. 따라서, 본 발명의 범위는 상기 설명에서보다는 첨부된 특허청구범위에 의해 정의된다. 특허청구범위의 균등 범위 안의 모든 변형은 본 발명의 범위에 포섭된다.

본 발명에 의한 시계열 신호의 패턴 인식 가능성 판단 방법 및 장치에 의하면, 복수의 패턴 인식 모델을 이용하여 시계열 신호로부터 패턴들을 각각 추출한 후 이들 간의 유사도를 구하여 임계값과 비교함으로써, 각각의 패턴 인식 모델의 패턴 인식 성능과 독립적으로 시스템 전체의 패턴 인식 가능성을 판단할 수 있다. 또한 이를 시계열 신호의 패턴 인식 방법 및 장치에서 채용함에 의해, 무제한 환경에서의 패턴 인식이 가능하게 되는 효과가 있다.

Claims

(a) 시계열 패턴을 가지는 입력 신호로부터 시간 정방향 특징(feature) 및 시간 역방향 특징을 추출하는 단계;

(b) 상기 시간 정방향 특징 및 상기 시간 역방향 특징을 이용하여 시간 정방향 정렬(alignment) 및 시간 역방향 정렬을 생성하는 단계;

(c) 상기 시간 정방향 정렬과 상기 시간 역방향 정렬을 서로 비교하여 유사도(likelihood)를 계산하는 단계; 및

(d) 상기 유사도가 소정의 임계값 이상인 경우 상기 입력 신호가 인식 가능 한 것으로 결정하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
제1항에 있어서, 상기 (a) 단계는,

(a1) 상기 입력 신호를 시간 역전하여 시간 역방향 신호를 생성하는 단계;

(a2) 상기 입력 신호로부터 시간 정방향 특징을 추출하는 단계; 및

(a3) 상기 시간 역방향 신호로부터 시간 역방향 특징을 추출하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
제2항에 있어서, 상기 (a1) 단계는,

상기 입력 신호를 소정의 역전 구간 길이 단위의 부분 신호들로 나누는 단계;

상기 부분 신호들을 각각 시간 역전하는 단계; 및

상기 시간 역전된 부분 신호들을 합쳐서 시간 역방향 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
제3항에 있어서, 상기 역전 구간 길이는 40 msec 내지 60 msec인 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
제1항에 있어서, 상기 입력 신호는 음성 신호, 필기체 문자 신호, 또는 제스 쳐 신호인 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
제1항에 있어서, 상기 (b) 단계는,

상기 시간 정방향 특징을 각 프레임 별로 시간 정방향 은닉 마코프 모델 상의 각 스테이트에 대응시킨 시간 정방향 정렬을 생성하는 단계; 및

상기 시간 역방향 특징을 각 프레임 별로 시간 역방향 은닉 마코프 모델 상의 각 스테이트에 대응시킨 시간 역방향 정렬을 생성하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
제6항에 있어서, 상기 (c) 단계는,

(c1) 상기 시간 정방향 정렬에 대응하는 인식된 단어와 상기 시간 역방향 정렬에 대응하는 인식된 단어 간의 인식단어유사도를 계산하는 단계;

(c2) 상기 시간 정방향 정렬과 상기 시간 역방향 정렬 간의 정렬유사도를 계산하는 단계;

(c3) 상기 시간 정방향 정렬에 대응하는 특징들과 상기 시간 역방향 정렬에 대응하는 특징들 간의 특징유사도를 계산하는 단계; 및

(c4) 상기 인식단어유사도, 정렬유사도, 및 특징유사도를 조합하여 상기 정방향 정렬과 상기 역방향 정렬 간의 전체 유사도를 계산하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
제7항에 있어서, 상기 (c4) 단계는,

상기 인식단어유사도, 정렬유사도, 및 특징유사도 각각에 소정의 가중치를 곱한 뒤 합산하여 가중합을 구하는 단계; 및

상기 가중합을 상기 가중치들의 합으로 나누어 전체 유사도를 계산하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
제6항에 있어서, 상기 (c) 단계는,

상기 시간 정방향 정렬 상의 프레임 별 스테이트와 상기 시간 역방향 정렬 상의 프레임 별 스테이트를 서로 비교하여 삽입, 삭제, 또는 치환된 것을 찾는 단계;

상기 삽입, 삭제, 또는 치환된 스테이트에 대응하는 프레임의 수를 전체 프레임의 수에서 뺀 일치 프레임 수를 구하는 단계; 및

상기 일치 프레임 수를 상기 전체 프레임 수로 나눈 비율을 유사도로 결정하는 단계를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 방법.
시계열 패턴을 가지는 입력 신호로부터 시간 정방향 특징 및 시간 역방향 특징을 추출하는 특징추출부;

상기 시간 정방향 특징 및 상기 시간 역방향 특징을 이용하여 시간 정방향 정렬 및 시간 역방향 정렬을 생성하는 정렬생성부;

상기 시간 정방향 정렬과 상기 시간 역방향 정렬을 서로 비교하여 유사도를 계산하는 유사도계산부; 및

상기 유사도가 소정의 임계값 이상인 경우 상기 입력 신호가 인식 가능한 것으로 결정하는 인식가능성결정부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
제10항에 있어서, 상기 특징추출부는,

상기 입력 신호를 시간 역전하여 시간 역방향 신호를 생성하는 신호역전부;

상기 입력 신호로부터 상기 시간 정방향 특징으로 추출하는 정방향특징추출부; 및

상기 시간 역방향 신호로부터 상기 시간 역방향 특징으로 추출하는 역방향특징추출부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
제11항에 있어서, 상기 신호역전부는,

상기 입력 신호를 소정의 역전 구간 길이 단위의 부분 신호들로 나누는 신호분리부;

상기 부분 신호들을 각각 시간 역전하는 부분신호역전부; 및

상기 시간 역전된 부분 신호들을 합쳐서 시간 역방향 신호를 생성하는 부분신호합성부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
제12항에 있어서, 상기 역전 구간 길이는 40 msec 내지 60 msec인 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
제10항에 있어서, 상기 입력 신호는 음성 신호, 필기체 문자 신호, 또는 제스쳐 신호인 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
제10항에 있어서, 상기 정렬생성부는,

상기 시간 정방향 특징을 각 프레임 별로 시간 정방향 은닉 마코프 모델 상의 각 스테이트에 대응시킨 시간 정방향 정렬을 생성하는 정방향정렬생성부; 및

상기 시간 역방향 특징으로 각 프레임 별로 시간 역방향 은닉 마코프 모델 상의 각 스테이트에 대응시킨 시간 역방향 정렬을 생성하는 역방향정렬생성부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
제15항에 있어서, 상기 유사도계산부는,

상기 시간 정방향 정렬에 대응하는 인식된 단어와 상기 시간 역방향 정렬에 대응하는 인식된 단어 간의 인식단어유사도를 계산하는 인식단어유사도계산부;

상기 시간 정방향 정렬과 상기 시간 역방향 정렬 간의 정렬유사도를 계산하는 정렬유사도계산부;

상기 시간 정방향 정렬에 대응하는 특징들과 상기 시간 역방향 정렬에 대응하는 특징들 간의 특징유사도를 계산하는 특징유사도계산부; 및

상기 인식단어유사도, 정렬유사도, 및 특징유사도를 조합하여 상기 정방향 정렬과 상기 역방향 정렬 간의 전체 유사도를 계산하는 유사도조합부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
제15항에 있어서, 상기 유사도계산부는,

상기 시간 정방향 정렬 상의 프레임 별 스테이트와 상기 시간 역방향 정렬 상의 프레임 별 스테이트를 서로 비교하여 삽입, 삭제, 또는 치환된 것을 찾는 불일치스테이트검색부;

상기 삽입, 삭제, 또는 치환된 스테이트에 대응하는 프레임의 수를 전체 프레임의 수에서 뺀 일치 프레임 수를 구하는 일치프레임수계산부; 및

상기 일치 프레임 수를 상기 전체 프레임 수로 나눈 비율을 유사도로 결정하는 비율계산부를 포함하는 것을 특징으로 하는 시계열 신호의 패턴 인식 가능성 판단 장치.
시계열 패턴을 가지는 입력 신호로부터 시간 정방향 특징 및 시간 역방향 특징을 추출하는 단계;

상기 시간 정방향 특징 및 상기 시간 역방향 특징을 이용하여 시간 정방향 정렬 및 시간 역방향 정렬을 생성하는 단계;

상기 시간 정방향 정렬과 상기 시간 역방향 정렬을 서로 비교하여 유사도를 계산하는 단계; 및

상기 유사도가 소정의 임계값 이상인 경우 상기 입력 신호가 인식 가능한 것으로 결정하는 단계를 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.