KR101383552B1

KR101383552B1 - 다중 명령어가 포함된 단일 문장의 음성인식방법

Info

Publication number: KR101383552B1
Application number: KR1020130019991A
Authority: KR
Inventors: 송민규; 김혜진; 김상윤
Original assignee: 미디어젠(주)
Priority date: 2013-02-25
Filing date: 2013-02-25
Publication date: 2014-04-10
Also published as: US20140244258A1; WO2014129856A1

Abstract

음성 대화형 사용자 인터페이스에서의 다중 명령어가 포함된 단일 문장의 음성인식방법이 개시된다. 이를 위하여 음성 인식된 단일 문장의 형태소를 분석하여 연결어미를 검출하는 단계와, 상기 연결어미를 기준으로 단일 문장을 복수개의 구절로 분리하는 단계와, 상기 연결어미를 분석하여 다중 연결어미를 검출하고, 상기 다중 연결어미가 포함된 구절을 세부적으로 분석하여 명령어를 추출하는 단계, 및 상기 명령어를 추출하는 단계를 통해 추출된 명령어를 취합하여 단일 문장에 포함된 다중 명령어를 출력하는 단계로 이루어진 다중 명령어가 포함된 단일 문장의 음성인식방법을 제공한다. 본 발명에 의하면, 하나의 문장에서 다중의 동작 의도를 파악할 수 있으므로 소비자의 사용성이 크게 증대된다.

Description

다중 명령어가 포함된 단일 문장의 음성인식방법{SPEECH RECOGNITION METHOD OF SENTENCE HAVING MULTIPLE INSTRUCTION}

본 발명은 다중 명령어가 포함된 단일 문장의 음성인식방법에 관한 것으로, 보다 상세하게는 음성 대화형 사용자 인터페이스에서의 다중 명령어가 포함된 단일 문장의 음성인식방법에 관한 것이다.

도 1 은 일반적인 연속 음성인식시스템의 구성 예시도로서, 현재 널리 쓰이고 있는 트리 기반의 인식기 구조를 나타낸다.

일반적인 연속 음성인식시스템의 구성 및 동작은 당해 분야에서 이미 주지된 기술에 지나지 아니하므로 여기에서는 그에 관한 자세한 설명한 생략하기로 한다. 다만, 입력된 음성에 대해 음성인식 기능을 수행하는 과정에 대해 간략히 설명한다.

일반적인 연속 음성인식시스템에 있어서, 입력된 음성은 특징추출부(101)에서 인식에 유용한 정보만을 추출한 특징벡터로 변환되고, 이러한 특징벡터로부터 탐색부(102)에서 학습과정에서 미리 구해진 음향모델 데이터베이스(104)와 발음사전 데이터베이스(105), 언어모델 데이터베이스(106)를 이용하여 가장 확률이 높은 단어열을 비터비 알고리듬을 이용하여 찾게 된다. 여기서, 대어휘 인식을 위하여 인식 대상 어휘들은 트리를 구성하고 있으며, 탐색부(102)는 이러한 트리를 탐색한다.

마지막으로, 후처리부(103)에서는 탐색 결과로부터 잡음기호 등을 제거하고, 음절단위로 모아쓰기를 하여 최종 인식결과(즉, 텍스트)를 출력한다.

이러한 종래의 연속 음성인식시스템에서는 연속 음성을 인식하기 위하여 인식 대상 어휘를 하나의 커다란 트리(Tree)로 구성하여 비터비(Viterbi) 알고리즘을 이용하여 탐색하였다. 이러한 구조를 갖는 종래의 탐색 방법에서는 언어모델 및 단어 삽입 벌점이 트리의 잎사귀 노드(Leaf Node)로부터 트리의 루트(Root)로의 천이시에 조사나 어미 활용이 있는 어절에 대해서도 적용되기 때문에 어절 형성 규칙과 같은 부가 정보 활용 및 고품위 언어모델 적용이 어려운 단점이 있었다.

이러한 문제점을 도 2를 참조하여 보다 구체적으로 설명한다.

도 2는 종래 탐색 트리의 예시도로서, 도면에서 '201'은 루트 노드, '202'는 잎사귀 노드, '203'은 일반 노드, 및 '204'는 단어 간 천이를 각각 나타낸다. 여기서는, 인식 대상 어휘가 '사과', '사람', '이것', '이고', '입니다'인 경우에 탐색 트리의 예를 나타낸 것이다.

도 2를 참조하면, 인식 대상 어휘는 모두 하나의 가상적인 루트 노드(201)에 연결된 형태를 갖는다.

따라서, 음성 입력이 들어오면, 매 프레임마다 트리의 모든 모드에서의 확률값을 계산한 후에, 각 노드로 들어오는 천이들 중에서 가장 확률이 높은 천이만을 남긴다. 여기서, 잎사귀 노드(202)에서 루트 노드(201)로의 천이는 단어가 변경되므로 단어간의 연결을 제한하기 위하여 언어모델 데이터베이스(106)가 적용된다.

언어모델 데이터베이스(106)에는 현재 단어 다음에 어떤 단어가 나타날 확률 정보가 실리는데, 예를 들면 '이것' 다음에 '사람'이라는 단어가 올 확률보다는 '사과'라는 단어가 올 확률이 높으므로 이러한 정보를 확률값으로 미리 구한 후에, 탐색부(102)에서 이를 이용하게 된다.

일반적으로, 연속 음성인식에서는 음소 개수가 적은 단어들로 인식이 잘 되는 경향이 있어서, 이를 막기 위하여 단어간의 천이시에 일정한 값의 단어 삽입 벌점을 부가하여 인식문장에서 인식 단어의 개수를 조절하도록 되어 있다.

도 2에 도시된 바와 같이, 하나를 트리를 이용한 종래의 음성 인식방법은 모든 단어들을 같은 방식으로 처리하기 때문에, 한국어에서와 같이 명사+조사 또는 용언어간+어미로 이루어지는 어절이 입력되면 모든 단어간 천이시에, 단어 삽입 벌점이 부가되므로 입력음성이 명사+조사 또는 용언어간+어미로 인식되기 보다는 하나의 단어로 인식되는 문제점이 있었다.

특히, 차량용 음성인식장치는 비교적 간단한 동작을 통해 구동되는데 명령어에 대한 물리적 입력에 비해 음성인식의 시간이 오래 걸린다는 단점이 있었다.

일반적으로, 차량용 음성인식장치를 사용하기 위해 사용자는 음성인식장치의 동작버튼을 클릭하는 제 1 단계와, "명령어를 말씀해 주세요" 등의 안내멘트를 듣는 제 2 단계와, 특정 단어를 발화하는 제 3 단계와, 음성인식장치가 인식한 단어에 대한 확인 멘트를 듣는 제 4 단계와, 상기 음성인식장치가 인식한 단어에 대한 진행여부를 발화하는 제 5 단계를 약 10초 동안 수행한다.

이에 반해, 사용자가 명령어를 물리적 방법을 통해 입력하는 경우에는 명령어에 해당하는 버튼을 터치하는 한 번의 단계를 통해 완료할 수 있으다.

물론, 음성인식을 이용한 POI(Point Of Interest) 검색이나 주소 검색 등의 검색은 물리적 방법을 통한 검색에 비해 빠른 사용성을 보이나, 기본 동작의 소요 시간이 과다와 오인식 발생은 음성인식 기술의 신뢰성을 저하시키는 원인이 되고 있는 실정이다.

따라서, 한 번의 발화 문장에서 다중의 동작을 지원함으로써, 전술한 문제를 해결할 수 있는 기술 개발의 필요성이 요구되고 있다.

대한민국 등록특허 제10-0486733호(2005.05.03 공고) 대한민국 공개특허 제10-2000-0026814호(2000.05.15 공개) 대한민국 공개특허 제10-2010-0120740호(2010.11.17 공개)

따라서, 본 발명의 목적은 사용자가 한 문장을 발화하여도 한 문장에 포함된 다중 명령어를 용이하게 음성 인식하여 그에 상응하는 동작을 출력할 수 있는 다중 명령어가 포함된 단일 문장의 음성인식방법을 제공하는데 있다.

상술한 본 발명의 목적을 달성하기 위하여, 본 발명의 일 실시예에서는 음성 인식된 단일 문장의 형태소를 분석하여 연결어미를 검출하는 단계와, 상기 연결어미를 기준으로 단일 문장을 복수개의 구절로 분리하는 단계와, 상기 연결어미를 분석하여 다중 연결어미를 검출하고, 상기 다중 연결어미가 포함된 구절을 세부적으로 분석하여 명령어를 추출하는 단계, 및 상기 명령어를 추출하는 단계를 통해 추출된 명령어를 취합하여 단일 문장에 포함된 다중 명령어를 출력하는 단계로 이루어진 다중 명령어가 포함된 단일 문장의 음성인식방법을 제공한다.

본 발명에 의하면, 하나의 문장에서 다중의 동작 의도를 파악할 수 있으므로 소비자의 사용성이 크게 증대된다.

그리고 본 발명은 미리 구축된 언어정보 사전이 저장된 언어정보 DB를 참조하는 방식을 이용하므로 알고리즘이 간결하여 구현이 용이하다.

또한, 본 발명은 문법적 연결 정보를 파악하므로 다중 동작의 수에 제한이 없다. 즉, 발화자로부터 발화된 단일 문장을 통해서도 N개의 다중 동작의 처리가 가능하다.

아울러, 본 발명은 기존의 언어처리 기술이 낮은 성공률로 어려움에 처한 것과 달리, "명령"과 "검색"이라는 2가지 큰 카테고리에 대한 처리만 진행하므로, 성공률을 대폭 향상시킬 수 있다.

도 1은 일반적인 연속 음성인식장치의 구성을 나타내는 블록도이다.
도 2는 종래의 탐색 트리를 설명하기 위한 개략도이다.
도 3은 본 발명의 일 실시예에 따른 음성인식방법을 나타내는 순서도이다.
도 4는 본 발명의 일 실시예에 따른 음성인식장치를 나타내는 구성도이다.
도 5 내지 도 8은 본 발명에 따른 음성인식방법을 세부적으로 설명하기 위한 순서도이다.

이하, 첨부도면을 참조하여 본 발명의 바람직한 실시예들에 의한 다중 명령어가 포함된 단일 문장의 음성인식방법(이하, '음성인식방법'이라 약칭함)을 상세하게 설명한다.

도 3은 본 발명의 일 실시예에 따른 음성인식방법을 나타내는 순서도이다.

본 발명에 따른 음성인식방법은 음성 대화형 사용자 인터페이스를 통해 입력된 단일 문장을 분석하고 상기 단일 문장에 포함된 복수개의 명령어를 추출하여 단일 문장에 대한 다중 동작을 처리하는 음성인식방법이다.

도 3을 참조하면, 본 발명에 따른 음성인식방법은 음성인식한 단일 문장의 형태소를 분석하여 연결어미를 검출하는 제 1 단계(S100)와, 상기 연결어미를 기준으로 단일 문장을 복수개의 구절로 분리하는 제 2 단계(S200)와, 상기 연결어미를 분석하여 다중 연결어미를 검출하고, 상기 다중 연결어미가 포함된 구절을 세부적으로 분석하여 다중 명령어를 추출하는 제 3 단계(S300), 및 상기 다중 명령어를 추출하는 단계(S300)를 통해 추출된 다중 명령어를 취합하여 단일 문장에 포함된 다중 명령어를 출력하는 제 4 단계(S400)를 포함한다.

이러한 음성인식방법은 도 4에 도시된 바와 같이 사용자로부터 발화된 단일 문장의 음성정보를 수집하여 텍스트 데이터를 추출하는 입력부(10), 상기 단일 문장의 텍스트 데이터에 포함된 형태소를 분석하는 형태소 분석기(20), 상기 텍스트 데이터로부터 분석된 형태소 중 연결어미를 검출하는 연결어미 DB(30), 검출된 연결어미에 따라 텍스트 데이터를 하나 이상의 구절로 분리하는 구절 분리모듈(40), 각 구절에 포함된 연결어미 중 다중 연결어미를 검출하는 다중 연결어미 검출모듈(50), 언어정보 사전이 미리 구축된 언어정보 DB(60), 및 전술한 각 구성요소에 연결되어 각 구성요소를 제어하는 제어부(70)를 포함하여 구성된 음성인식장치로 구현될 수 있다.

상기 음성인식장치는 사용자로부터 동작신호를 입력받는 조작부(미도시), 상기 조작부로부터 동작신호가 입력됨에 따라 음성 대화형 사용자 인터페이스를 제공하는 출력모듈(미도시), 상기 입력부(10)를 통해 수집된 단일 문장의 텍스트 데이터를 저장하는 저장부(미도시), 다중 연결어미가 포함된 각 구절을 품사별로 분류하여 품사별로 의미 값을 할당하는 품사별 분류모듈(미도시)을 더 포함할 수 있다.

이하, 도면을 참조하여 각 단계별로 보다 구체적으로 설명한다.

본 발명에 따른 음성인식방법은 먼저 음성인식한 단일 문장의 형태소를 분석하여 연결어미를 검출하는 제 1 단계를 수행한다(S100).

도 5는 본 발명에 따른 음성인식방법의 일 구간을 설명하기 위한 순서도이다.

도 5를 참조하면, 상기 제 1 단계(S100)는 단일 문장에 대한 사용자의 음성을 인식하는 음성 인식과정(S110)과, 형태소 분석기(20)를 통해 상기 단일 문장의 형태소를 분석하는 형태소 분석과정(S120), 및 연결어미 DB(30)을 통해 형태소로부터 연결어미를 검출하는 연결어미 검출과정(S130)을 포함한다.

상기 음성 인식과정(S110)에서는 사용자가 조작부를 터치하여 음성인식장치의 동작을 명령하면 상기 음성인식장치의 제어부(70)가 출력모듈을 통해 음성 대화형 사용자 인터페이스를 상기 사용자에 제공하여 사용자가 발화한 단일 문장의 음성정보를 입력부(10)를 통해 수집한다. 이를 위해, 입력부(10)에는 마이크 등이 구비된다. 이어서, 입력부(10)는 마이크 등을 통해 수집된 단일 문장의 음성정보를 텍스트 데이터로 변환시켜 제어부(70)로 제공한다.

상기 형태소 분석과정(S120)에서는 제어부(70)가 형태소 분석기(20)를 통해 상기 단일 문장의 텍스트 데이터를 구성하는 형태소를 분석한다.

상기 연결어미 검출과정(S130)에서는 제어부(70)가 형태소 분석과정(S120)에 의해 분석된 형태소 중 연결어미를 검출한다. 이때, 연결어미의 검출은 연결어미 사전이 구축된 연결어미 DB(30)를 통해 이루어진다.

필요에 따라, 제어부(70)는 상기 입력부(10)로부터 제공된 단일 문장의 텍스트 데이터, 사용자가 발화한 단일 문장의 음성정보를 저장부에 저장할 수도 있다.

이어서, 본 발명에 따른 음성인식방법은 연결어미를 기준으로 단일 문장을 복수개의 구절로 분리하는 제 2 단계를 수행한다(S200).

도 6은 본 발명에 따른 음성인식방법의 다른 구간을 설명하기 위한 순서도이다.

도 3 및 도 6을 참조하면, 본 단계(S200)에서는 제어부(70)가 제 1 단계(S100)를 통해 검출된 연결어미를 구절 분리모듈(40)로 제공한다. 이어서, 구절 분리모듈(40)은 제 1 단계(S100)를 통해 검출된 연결어미를 기준으로 단일 문장의 텍스트 데이터를 복수개의 구절로 분리한다.

계속하여, 본 발명에 따른 음성인식방법은 연결어미를 분석하여 다중 연결어미를 검출하고, 상기 다중 연결어미가 포함된 구절을 세부적으로 분석하여 명령어를 추출하는 제 3 단계를 수행한다(S300).

도 7은 본 발명에 따른 음성인식방법의 또 다른 구간을 설명하기 위한 순서도이다.

도 6 및 도 7을 참조하면, 상기 제 3 단계(S300)는 연결어미의 분석을 통해 다중 연결어미를 검출하며, 다중 연결어미의 유무에 따라 분석 대상과 비분석 대상을 분류하는 분석대상 결정과정(S310), 및 상기 분석 대상에 해당하는 구절을 언어정보 사전이 미리 구축된 언어정보 DB에 매칭시켜 명령어를 추출하는 명령어 추출과정(S320)을 포함한다.

상기 분석대상 결정과정(S310)에서는 제어부(70)의 제어에 의해 다중 연결어미 검출모듈(50)이 연결어미가 포함된 구절 중 다중 연결어미가 포함된 구절을 검출한다. 이때, 다중 연결어미 검출모듈(50)은 다중 연결어미 사전이 미리 구축된 다중 연결어미 DB를 바탕으로 연결어미를 비교하여 상기 연결어미 중 다중 연결어미를 검출한다.

여기서, 다중 연결어미란 다중동작 연결어미, 연속 연결어미, 시간 연결어미 중 어느 하나를 의미한다.

또한, 다중 연결어미는 미리 정의된 의미 정보 사전의 검색 결과를 참조한다. 여기서, 의미 정보 사전은 연결어미 검출 모듈(50) 내에 위치하며, 연결어미 검출의 과정(S312)에서 해당 사전에 등록된 다중 연결어미가 입력 문장 분석의 기준이 된다.

예를 들면, 상기 다중동작 연결어미는 -고, -와, -과, -랑 중 어느 하나이고, 상기 연속 연결어미는 -으면서 이며, 상기 시간 연결어미는 -고, -으며, -으면서, -자, -자마자, -아, -어서 중 어느 하나이다.

보다 구체적으로, 다중동작 연결어미 '-고'의 경우, "라디오를 켜고, 내비를 꺼라"라는 명령어 내려지면, 라디오를 켜고 내비를 끄는 다중 동작이 순차적으로 수행되어야 하는 경우이다.

또한, '-랑'의 경우는 "라디오랑 내비를 켜라"처럼 라디오와 내비를 켜는 동작을 동시에 수행하는 경우가 이에 해당된다.

그리고 연속 연결어미 '-으면서'의 경우는 "라디오를 켜면서 내비를 꺼라"처럼 라디오 동작과 내비 동작을 연속적으로 수행하는 경우가 해당된다.

아울러, 시간 연결어미는 "라디오 켜자마자 내비 켜라"와 같이 동작 시점에 맞는 동작을 하는 경우가 해당된다.

이와 같이 연결어미의 분석을 통해 다중 연결어미가 검출되면(S312), 제어부(70)는 다중 연결어미의 유무에 따라 각 구절을 분석 대상과 비분석 대상을 분류한다(S314, S316). 다시 말해, 다중 연결어미가 포함된 구절은 분석 대상으로 확정하고 다중 연결어미가 미 포함된 구절은 비분석 대상으로 확정한다.

구체적으로, 분석의 대상은 다중 연결어미 왼쪽의 구절이며, 문장의 마지막 구절은 종결어미를 기준으로 하여 왼쪽 구절이 분석의 대상이 된다.

상기 명령어 추출과정(S320)에서는 분석대상 결정과정(S310)을 통해 분석 대상에 해당하는 구절이 확정되면, 제어부(70)가 상기 구절을 언어정보 사전이 미리 구축된 언어정보 DB(60)에 매칭시켜 명령어를 추출한다.

이때, 언어정보 DB(60)으로는 의미 계층 단어 DB(62) 및 문장 패턴 DB(64)이 사용될 수 있다. 여기서, 의미 계층 단어 DB(62)란 명사와 동사에 높은 가중치를 부여할 수 있도록 의미 기준에 따라 계층적으로 구성된 사전이 구축된 DB를 의미한다.

보다 구체적으로, 명령어 추출과정(S320)에서는 제어부(70)가 분석 대상의 구절에 포함된 어절을 분석하고(S321)한 후, 의미 계층 단어 DB(62)을 통해 분석 대상의 구절에 포함된 명사와 동사를 추출(S322)하여 구절의 문장 패턴을 결정한다(S323). 이러한 명령어 추출과정(S320)에서는 구절에 포함된 간투사나 상용구, 콤마, 마침표 등은 분석 대상에서 제외하여, 최종적으로 분석 대상의 구절이 <명사> + <동사>의 구조가 되도록 설정한다(S324).

이때, 문장 패턴은 문장 분석 결과에 따라 <명사> + <동사>, <명사> + <명사> + <동사>, <동사> 등의 다양한 문장 패턴이 출현될 수 있다.

또한, 명령어 추출과정(S320)에서 제어부(70)는 동작 가능한 필수 패턴이 미리 정의되어 있는 문장 패턴 DB(64)을 참조하여 미리 지정된 문장 패턴은 출력처리 대상으로 분류하고(S325), 미리 지정된 문장 패턴 이외의 문장 패턴은 에러처리 대상으로 분류한다(S326). 이때, 에러 처리는 예외처리 시나리오 전개나 종료, 또는 질문 생성 등으로 구현될 수 있다.

마지막으로, 제어부(70)는 최종적으로 결정된 구절의 <명사> + <동사>의 문장 패턴에 의미 계층 단어 DB(62)을 참조하여 의미 값을 할당한다(S327).

예를 들어, '라디오'라는 명령어가 동작 대상 명사로서 등록이 되어 있다면, "켜다, 듣다, 작동하다" 등 라디오 동작과 관련된 동사들 또한 사전에 등록하며, 해당 동사의 동작이 가지는 의미 값을 세분화하여 DB(62)에 저장한다. 모든 동작 대상 명사에 대해 조응하는 동사의 세부 의미 값을 미리 정의함으로써 다중 동작 시 동작의 대상과 동작의 방법을 구체적으로 수행할 수 있도록 한다.

도 8은 본 발명에 따른 음성인식방법의 또 다른 구간을 설명하기 위한 순서도이다.

도 3 및 도 8을 참조하면, 본 발명에 따른 음성인식방법의 제 3 단계(S300)는 상기 명령어 추출과정(S320) 이후에 품사 분류 기준에 따라 의미 정보를 추출할 수 있는 단위들로 나누어 분석하는 의미 값 할당과정(S330)을 더 포함할 수 있다.

이러한 의미 값 할당과정(S330)에서는 제어부(70)에 의해 품사 분리모듈이 문장 패턴이 결정된 각 구절을 품사별로 분류한다(S332).

그리고 제어부(70)는 구절의 각 품사별로 의미 값을 할당한다. 또한, 제어부(70)는 의미 값이 할당된 명사를 통해 주체와 대상을 추출하고, 의미 값이 할당된 동사를 통해 의도를 추출하며, 의미 값이 할당된 기타 품사를 통해 카테고리의 정보를 추출한다.

또한, 제어부(70)는 명사와 동사 및 기타 품사를 통해 추출된 정보를 바탕으로 명령어를 추출한다(S334).

마지막으로, 본 발명에 따른 음성인식방법은 제 3 단계를 통해 추출된 명령어를 취합하여 단일 문장에 포함된 다중 명령어를 출력하는 제 4 단계를 수행한다(S400).

도 3 및 도 8을 참조하면, 본 단계(S400)에서는 단일 문장을 구성하는 복수개의 구절 중 분석 대상에 해당하는 구절의 분석이 종료되면, 제어부(70)가 각 구절에 포함된 명령어를 취합하여 복수개의 명령어로 이루어진 다중 명령어를 확정한다.

이때, 다중 명령어의 출력은 취합된 다중 명령어에 대응되는 제어 신호를 생성하고, 상기 제어신호를 해당 기기로 전송함으로써 해당 기기를 제어하는 과정을 통해 진행될 수 있다.

상술한 내용을 예를 들어 설명하면 다음과 같다.

사용자가 "공릉역으로 목적지 찍고, 지도를 확대해라"고 발화하면 음성인식장치의 입력부(10)는 이를 음성 인식하여 텍스트 데이터를 추출한다(S110).

이어서, 제어부(70)는 형태소 분석기(20)를 통해 텍스트 데이터의 형태소를 분석하고(S120), 연결어미 DB(30)를 참조하여 형태소로부터 상기 텍스트 데이터에 포함된 연결어미인 "-고"를 검출한다(S130).

그 다음, 제어부(70)는 연결어미인 "-고"를 기준으로 텍스트 데이터를 제 1 구절인 "공릉역으로 목적지를 찍고"와 제 2 구절인 "지도를 확대해라"로 분리한다(S200).

그리고 제어부(70)는 다중 연결어미 DB(30)를 통해 제 1 구절인 "공릉역으로 목적지를 찍고"에 포함된 다중 연결어미인 "-고"를 검출하여, 제 1 구절과 제 2 구절을 분석 대상으로 분류한다(S310).

이 후, 제어부(70)는 언어정보 DB(60)을 통해 "공릉역으로 목적지를 찍고"로부터 '공릉역'을 명사로 '목적지 찍다'를 동사로 하는 <명사> + <동사>의 문장 패턴을 추출한다. 또한, 제어부(70)는 의미 계층 단어 DB(62)을 통해 '공릉역'과 '목적지 찍다'의 의미 값을 부여한다. 이때, '공릉역'의 의미 값 할당을 통해 네비게이션의 목적지를 추출하고, '목적지 찍다'의 의미 값 할당을 통해 사용자의 의도(목적지에 대한 운전 경로 안내)를 추출한다. 마지막으로, 제 1 구절에 대한 결과 값 할당을 수행하고 이를 통해 명령어를 추출한다(S320).

이어서, 제어부(70)는 제 1 구절에 대한 결과 값 할당이 완료되면, 제 2 구절에 대한 분석을 수행하여 제 2 구절의 명령어를 추출하여 문장에 포함된 다중 명령어를 출력한다(S400). 다시 말해, "공릉역으로 목적지 찍고, 지도를 확대해라"는 문장은 2가지 명령어를 내포하고 있으므로, 제어부(70)는 2가지 명령어에 대응되는 제어 신호를 생성하여 네비게이션에 전송한다.

이상에서 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

10 : 입력부 20 : 형태소 분석기
30 : 연결어미 DB 40 : 구절 분리모듈
50 : 다중 연결어미 검출모듈 60 : 언어정보 DB
62 : 의미 계층 단어 DB 64 : 문장 패턴 DB
70 : 제어부

Claims

(ⅰ) 음성 인식된 단일 문장의 형태소를 분석하여 연결어미를 검출하는 단계;
(ⅱ) 상기 연결어미를 기준으로 단일 문장을 복수개의 구절로 분리하는 단계;
(ⅲ) 상기 연결어미를 분석하여 다중 연결어미를 검출하고, 상기 다중 연결어미가 포함된 구절을 세부적으로 분석하여 명령어를 추출하는 단계; 및
(ⅳ) 상기 (ⅲ)를 통해 추출된 명령어를 취합하여 단일 문장에 포함된 다중 명령어를 출력하는 단계로 이루어진 다중 명령어가 포함된 단일 문장의 음성인식방법.
제 1 항에 있어서, 상기 다중 연결어미는
다중동작 연결어미, 연속 연결어미, 시간 연결어미 중 어느 하나인 것을 특징으로 하는 다중 명령어가 포함된 단일 문장의 음성인식방법.
제 2 항에 있어서, 상기 다중동작 연결어미는
-고, -와, -과, -랑으로 이루어진 군으로부터 선택된 어느 하나인 것을 특징으로 하는 다중 명령어가 포함된 단일 문장의 음성인식방법.
제 2 항에 있어서, 상기 연속 연결어미는
-으면서 인 것을 특징으로 하는 다중 명령어가 포함된 단일 문장의 음성인식방법.
제 2 항에 있어서, 상기 시간 연결어미는
-고, -으며, -으면서, -자, -자마자, -아, -어서로 이루어진 군으로부터 선택된 어느 하나인 것을 특징으로 하는 다중 명령어가 포함된 단일 문장의 음성인식방법.
제 1 항에 있어서, 상기 (ⅳ)의 출력은
상기 다중 명령어에 대응되는 제어 신호를 생성하여 해당 기기로 전송하는 과정인 것을 특징으로 하는 다중 명령어가 포함된 단일 문장의 음성인식방법.
제 1 항에 있어서, 상기 (ⅰ) 단계는
단일 문장에 대한 사용자의 음성을 인식하는 과정과,
형태소 분석기를 통해 상기 단일 문장의 형태소를 분석하는 과정, 및
연결어미 DB을 통해 형태소로부터 연결어미를 검출하는 과정으로 이루어진 것을 특징으로 하는 다중 명령어가 포함된 단일 문장의 음성인식방법.
제 1 항에 있어서, 상기 (ⅲ) 단계는
연결어미의 분석을 통해 다중 연결어미를 검출하며, 다중 연결어미의 유무에 따라 분석 대상과 비분석 대상을 분류하는 분석대상 결정과정, 및
상기 분석 대상에 해당하는 구절을 미리 구축된 언어정보 DB에 매칭시켜 명령어를 추출하는 명령어 추출과정으로 이루어진 것을 특징으로 하는 다중 명령어가 포함된 단일 문장의 음성인식방법.
제 8 항에 있어서, 상기 미리 구축된 언어정보 DB는
의미 계층 단어 DB 및 문장 패턴 DB로 구성된 것을 특징으로 하는 다중 명령어가 포함된 단일 문장의 음성인식방법.
제 8 항에 있어서, 상기 명령어 추출과정은
상기 분석 대상에 해당하는 구절을 미리 구축된 언어정보 DB에 매칭시켜 의미 값을 추출하는 과정과,
상기 의미 값이 추출된 구절의 문장 유형을 분석하는 과정과,
미리 구축된 문장 패턴 DB를 통해 출력처리 대상과 에러처리 대상을 분류하는 과정, 및
상기 출력처리 대상으로 선택된 구절에 최종 동작 값을 할당하여 명령어를 추출하는 과정으로 이루어진 것을 특징으로 하는 다중 명령어가 포함된 단일 문장의 음성인식방법.