KR20070043625A

KR20070043625A - 혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동생성 방법 및 머신 판독 가능 저장 장치

Info

Publication number: KR20070043625A
Application number: KR1020060101554A
Authority: KR
Inventors: 순톤 아티바니차야퐁; 데이비드 자라밀로; 제랄드 매튜 맥콥
Original assignee: 인터내셔널 비지네스 머신즈 코포레이션
Priority date: 2005-10-21
Filing date: 2006-10-18
Publication date: 2007-04-25
Also published as: CN1952926A; CN1952926B; KR100923180B1; US8229745B2; KR20080092327A; US20070094026A1

Abstract

혼합 주도형 문법(mixed-initiative grammar)을 구성하는 방법은 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법(directed dialog grammars)을 식별하는 단계와, 선택된 문법 생성 기법에 따라서 혼합 주도형 문법을 자동적으로 생성하는 단계를 포함하는 것에 의해, 혼합 주도형 문법은 복수의 지시적 담화 문법을 상술하게 된다.

Description

혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동 생성 방법 및 머신 판독 가능 저장 장치{CREATING A MIXED-INITIATIVE GRAMMAR FROM DIRECTED DIALOG GRAMMARS}

도 1은 본 발명의 일 실시예에 따라서 혼합 주도형 문법을 생성하는 데 이용되는 GUI(graphical user interface)를 나타내는 도식적인 도면.

도 2는 본 발명의 다른 실시예에 따라서 혼합 주도형 문법을 생성하는 데 이용되는 GUI를 나타내는 도식적인 도면.

도 3은 본 명세서에 개시된 본 발명의 장치에 따라서 생성될 수 있는 하나의 다양한 혼합 주도형 문법을 나타내는 예시적인 코드.

도 4는 본 명세서에 개시된 본 발명의 구성에 따라서 생성될 수 있는 다른 다양한 혼합 주도형 문법을 나타내는 예시적인 코드.

도 5는 본 명세서에 개시된 본 발명의 구성에 따라서 생성될 수 있는 또 다른 다양한 혼합 주도형 문법을 나타내는 예시적인 코드.

도 6은 사용자가 혼합 주도형 문법 내에 포함될 수 있는 지시적 담화 문법을 선택 및/또는 식별할 수 있게 하는 하나의 방식을 나타내는 예시적인 코드.

도 7은 본 발명의 다른 실시예에 따라서 혼합 주도형 문법을 생성하는 방법을 도시하는 흐름도.

도면의 주요 부분에 대한 부호의 설명

100, 200 : GUI 105, 110, 115 : 필드

저작권 보호 자료에서 저작권의 유보 사항

본 특허 문헌의 개시 내용의 일부분은 저작권이 보호된 자료를 포함한다. 저작권 소유자는 특허 및 상표 관리국의 특허 파일 또는 기록에 보관된 특허 문헌 또는 특허 명세서가 누군가에 의해 팩스로 복제되는 것에는 이의를 갖지 않으나 그 이외의 경우에는 어떤 경우든지 모든 저작권을 행사할 수 있도록 유보한다.

기술 분야

본 발명은 혼합 주도형 화법 기반 시스템(mixed-initiative speech-based systems)에 관한 것으로서, 보다 구체적으로는 이러한 시스템에서 사용되는 문법(grammars)의 생성에 관한 것이다.

종래 기술

여러 견고한 음성 적용 분야는 혼합 주도형 대화(mixed-initiative interaction)로 지칭되는 소정 형태의 인간-컴퓨터 대화를 이용한다. 혼합 주도형 대화는 사용자와 컴퓨터 시스템 사이에서 임의의 시점에 각자가 대화의 흐름을 안내하거나 변경할 차례를 가질 수 있게 하는 유연한 대화 기법이다. 혼합 주도형 시스템은 보다 자연적이고 일반적으로 선호되는 사용자와 컴퓨터 시스템 사이의 대화 방법을 제공한다.

혼합 주도형 화법 시스템 내에서, 사용자는 먼저 각각의 개별 정보 항목을 프롬프트(prompt)하지 않으면서도 다양한 순서로 정보의 서로 다른 부분을 제공할 수 있다. 컴퓨터 시스템은 사용자가 발음한 발화 내용(user spoken utterance)으로부터 필수적인 정보 항목을 추출할 수 있고, 그 정보 항목을 이용하여 예를 들면 전자 형태의 적절한 필드 내에 채워 넣을 수 있다. 예로서, 사용자는 "나는 6월 23일날 보스톤으로부터 뉴욕의 라가디아(La Guardia) 공항으로 비행하고 싶다."라고 말할 수 있다. 혼합 주도형 시스템은 그 하나의 발음된 발화 내용으로부터 출발 도시, 도착 공항 및 비행 일자 등과 같은 필수 정보 항목을 추출할 수 있다. 그에 대한 비교로서, 지시적 담화 시스템(directed dialog system)은 사용자가 한 번에 하나씩 각 정보의 개별 부분을 프롬프트하고, 특정한 순서로 데이터 수집을 실행한다. 이러한 방식으로, 지시적 담화 시스템은 사용자가 지정된 흐름에서 벗어날 어떠한 기회도 제공하지 않으면서 대화 또는 담화의 흐름을 실질적으로 "지시"한다.

혼합 주도형 시스템의 개발의 일 측면은 사용자가 발음한 발화 내용을 처리하는 데 이용되는 혼합 주도형 문법을 개발하는 것이다. VoiceXML(Voice Extensible Markup Language) 등과 같은 현대적 기법은 혼합 주도형 담화를 지원하 기는 하지만, VoiceXML 내에서 혼합 주도형 문법을 생성하는 것은 여전히 복잡한 작업이다. 전형적으로, 혼합 주도형 문법을 개발 및 유지하는 것은 지시적 담화 문법을 개발 및 유지하는 것보다 더 어렵고 복잡하다. 이것은 혼합 주도형 문법이 전형적으로 지시적 담화 문법을 그 성분으로 하여 설계되기 때문이다. 혼합 주도형 문법의 개발을 더 복잡하게 하는 것은 이러한 문법들이 사용자에 의해 수동으로 개발된다는 점이다. 그 때문에 혼합 주도형 문법의 생성은 시간 소모적이고 에러가 발생하기 쉬운 프로세스일 수 있다.

상술된 문제점을 극복하면서 보다 효과적인 혼합 주도형 문법 생성 기법을 제공하는 것이 유용할 것이다.

본 발명은 혼합 주도형 문법을 구성하는 방법 및 장치를 제공하고, 지시적 담화 문법의 재사용을 가능하게 한다. 본 발명의 일 실시예는 혼합 주도형 문법을 설계하는 방법을 포함할 수 있다. 이러한 방법은 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법을 식별하는 단계와, 선택된 문법 생성 기법에 따라서 혼합 주도형 문법을 자동으로 생성하는 단계를 포함할 수 있으므로, 혼합 주도형 문법은 복수의 지시적 담화 문법을 상술한다.

본 발명의 다른 실시예는 복수의 지시적 담화 문법으로부터 혼합 주도형 문법을 자동적으로 구성하는 방법을 포함할 수 있다. 이 방법은 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법을 식별하는 단계와, 사용자 프롬프트에 응 답하여 선택된 문법 생성 기법을 기술하는 사용자 입력을 수신하는 단계를 포함할 수 있다. 이러한 방법은 복수의 직접 담화 문법을 기술하는 혼합 주도형 문법을 자동적으로 생성하는 단계를 더 포함할 수 있다. 복수의 지시적 담화 문법은 적어도 부분적으로 선택된 문법 생성 기법에 따라서 결정된 사용자가 발음한 발화 내용을 처리하기 위해 서로에 대해 순차화된 관계를 가질 수 있다.

본 발명의 다른 실시예는 머신에 의해 실행되어 머신이 본 명세서에 개시된 여러 단계 및 방법을 실행하게 하는 복수의 코드 섹션을 갖는 컴퓨터 프로그램을 저장하고 있는 머신 판독 가능 저장 장치를 포함할 수 있다.

도면 내에는 현재 바람직한 실시예가 도시되어있으나, 본 발명은 도시된 바로 그 장치 및 수단으로 한정되지 않는다는 것을 이해할 것이다.

본 명세서는 새로운 것으로서 간주되는 본 발명의 특징을 정의하는 청구항으로 결론을 내리고 있으나, 본 발명은 도면을 참조하여 이하의 설명을 고려함으로써 더욱 잘 이해될 수 있을 것으로 생각된다. 필요한 것으로 간주되는 본 발명의 상세한 실시예를 본 명세서에 개시하였으나, 이러한 개시된 실시예는 여러 형태로 구현될 수 있는 본 발명의 예시에 불과하다는 것을 이해할 것이다. 그러므로, 본 명세서에 개시된 특정한 구조 및 기능적 세부 사항은 한정하는 것으로 해석되는 것이 아니라 당업자들이 본 발명을 사실상 임의의 적절한 세부 구조로 다양하게 사용할 수 있도록 알리는 청구항의 기초 및 대표물의 기초로서 제시된 것이다. 또한, 본 명세서에서 사용된 용어 및 문구는 한정하는 것으로 의도된 것이 아니라 본 발명의 이해 가능한 설명을 제공하기 위한 것이다.

본 발명은 혼합 주도형 컴퓨터 시스템에서 사용하기 위한 문법을 개발하기 위한 해결책을 제공하는 것이다. 본 명세서에 개시된 본 발명의 구성에 따르면, 지시적 담화 문법을 사용 및/또는 재사용하여 혼합 주도형 시스템을 생성할 수 있다. 본 발명은 사용자 또는 소프트웨어 개발자로부터 혼합 주도형 문법을 생성하는 데 필요한 서로 다른 정보 항목을 도출할 수 있다. 예를 들면 일실시예에서, 여러 연접 문구(conjoin phrases)뿐만 아니라 하나 이상의 지시적 담화 문법을 식별할 수 있다. 연접 문구는 지시적 담화 문법 중 선택된 것을 연결하는 데 이용될 수 있다. 복수의 서로 다른 문법 생성 기법 중 하나를 이용하면, 혼합 주도형 문법이 사용자 지정 정보로부터 자동적으로 생성될 수 있고, 그것에 의해 전형적으로 혼합 주도형 문법의 수동 생성과 연관되었던 여러 복잡성을 감소 및/또는 제거할 수 있게 된다.

일 실시예에서, 본 명세서에 개시된 본 발명의 구성은 소프트웨어 기반의 개발 시스템 내에서 또는 그 일부분으로서 구현될 수 있다. 예를 들면, 본 명세서에 개시된 여러 실시예는 WebSphere

보이스 툴키트(Voice Tookit) V6.0(이하에서는 "보이스 툴키트"로 지칭함) 등과 같은 소프트웨어 개발 시스템의 일부분으로서 구현될 수 있다. 보이스 툴키트는 음성 작동 적용 분야(voice-enabled application)의 개발을 위한 토대를 제공하는 뉴욕주 아몬크에 소재한 인터내셔널 비지네스 머신즈 코포레이션(IBM)으로부터 입수 가능한 소프트웨어 개발 플랫폼이다. 보이스 툴키 트는 화법 인식을 위한 문법 파일의 시각적 조합을 위한 그래픽 문법 제작기와, 재사용 가능 담화 성분을 지원하는 통신 흐름 제작기와, VoiceXML(Voice Extensible Markup Language)에 대한 기반 및/또는 다른 기능을 제공한다.

본 명세서에 개시된 실시예는 보이스 툴키트의 일부분으로서 구현될 수 있으나, 이것은 하나의 실시예에 불과하다는 것을 이해할 것이다. 본 명세서에 개시된 실시예는 임의의 적합한 소프트웨어 개발 시스템 및/또는 환경의 일부분으로서 제공될 수 있으므로, 본 발명은 사용된 특정한 주요 적용 분야에 의해 한정되도록 의도되지 않았다. 또한, 본 명세서에 개시된 실시예는 독립형 소프트웨어 개발 시스템 또는 적용 분야로서 구현될 수 있다는 것을 이해할 것이다.

도 1은 본 발명의 일 실시예에 따라서 혼합 주도형 문법을 생성하는 데 이용되는 GUI(graphical user interface)(100)를 나타내는 도식적인 도면이다. GUI(100)는 복수의 서로 다른 필드 타입(105, 110, 115)을 포함할 수 있다. 필드(105, 115)는 여러 연접 문구를 명시하는 사용자 입력을 수신할 수 있다. 도시된 바와 같이 접두사 타입의 문구는 필드(105) 내에서 수신 또는 명시될 수 있는 한편, 접미사 타입의 문구는 필드(115) 내에서 명시될 수 있다. 특정한 지시적 담화 문법은 필드(110) 내에서 명시될 수 있다. 본 명세서에 이용된 바와 같이, 지시적 담화 문법은 하나 이상의 사용자가 발음한 발화 내용으로부터 추출 또는 인식되는 데이터에 기초하여 기입될 전자 형태의 특정 필드에 대한 허용 가능 입력인 하나 이상의 단어 또는 문구를 명시할 수 있다.

도 1은 혼합 주도형 문법이 음성 작동형 항공 예약 시스템에서 개발되는 경 우를 나타낸다. 그러나, 본 명세서에 개시된 본 발명의 구성은 임의의 다양한 서로 다른 음성 작동형 시스템에 적용될 수 있고, 도 1에서 특정 산업을 이용한 것은 오로지 예시를 목적으로 제시된 것임을 이해할 것이다. 따라서, 도 1은 본 발명을 제한하도록 의도된 것이 아니고, 본 발명의 여러 측면을 설명하는 기반으로서 제공된 것이다.

다시 필드(105, 115)를 참조하면, 어떠한 경우에도 연접 문구는 사용되는 특정한 지시적 담화 문법을 나타내는 대기 행렬(queue)로서 기능을 하거나, 이와 다르게 2개 이상의 지시적 담화 문법을 연결하는 기능을 할 수 있다. 연접 문구는 경우에 따라서 하나 이상의 단어, 기호 또는 문자 성분을 포함할 수 있다. 따라서, 사용자가 발음한 발화 내용 내에서 인식될 때 연접 문구는 특정한 지시적 담화 문법을 사용하여 주어진 단어 또는 사용자가 발음한 발화 내용의 부분을 처리한다는 것을 나타낸다. 언급된 바와 같이, 연접 문구는 또한 2개 이상의 지시적 담화 문법 사이에서 실질적으로 연결하거나 연관 또는 관계를 형성하는 기능을 할 수 있다. 따라서, 연접 문구는 연접 문구를 이용하여 연결되는 지시적 담화 문법 사이의 순서를 형성할 수 있다.

GUI(100)는 연접 문구 "depart from"(여기에서 "depart"는 선택 사항으로서 표시됨)가 "departGrammar"로 지칭된 지시적 담화 문법과 연관된 것을 나타낸다. 이 문법은 출발 도시의 목록을 명시할 수 있다. 마찬가지로, 연접 문구 "depart on"(여기에서도 "depart"는 선택 사항으로서 표시됨)는 "departDate"로 지칭된 지시적 담화 문법과 연관된다. 이 문법은 날짜의 목록을 명시할 수 있다. 따라서, 예를 들어 사용자가 "수요일에 웨스트 팜 비치에서 출발한다"라고 말하면, 연접 문구 "depart from"는 "departGrammar"로 지칭되는 지시적 담화 문법이 발화 내용으로부터 다음의 여러 단어(들), 즉 "웨스트 팜 비치"를 인식하는데 이용되는 것을 나타낸다. 연접 문구 "on"이 인식될 때, 음성 작동형 시스템은 "departDate" 문법이 발화 내용으로부터 다음의 여러 단어, 즉 "수요일"을 인식하는 데 이용될 수 있다는 것을 판단할 수 있다.

이러한 예에서, 2개의 연접 문구는 모두 접두사 문구로서 분류된다. 접두사 연접 문구는 사용자가 발음한 발화 내용 내의 연접 문구 이후에 뒤따르는 단어들이 특정한 지시적 담화 문법을 이용하여 처리된다는 것을 나타낸다. 따라서, "수요일"이라는 단어는 "departGrammar"를 이용하여 인식된다. 접미사 연접 문구는 사용자가 발음한 발화 내용 내의 연접 문구 앞에 선행하는 단어들이 특정한 지시적 담화 문법을 이용하여 처리된다는 것을 나타낸다. GUI(100)에 도시된 바와 같이, 지시적 담화 문법은 접두사 문구, 접미사 문구, 접두사와 접미사 문구 또는 그 외의 타입의 연접 문구와 연관될 수 있다.

일 실시예에서, 지시적 담화 문법은 문법의 명칭을 GUI(100)의 필드(110) 내에 타이핑하는 것에 의해 명시될 수 있다. 다른 실시예에서, 드래그 앤드 드롭 기능(drag and drop functionality)을 이용하여 코드의 부분 또는 지시적 담화 문법 파일이 임의의 필드(110)로 선택 및 입력(dropped)되게 할 수 있다. 또 다른 실시예에서, 파일 선택 네비게이션 윈도우(file selection navigation window)를 열어 사용자가 지시적 담화 문법(들)을 선택하게 할 수 있다. 이러한 기법은 연접 문구 를 명시하는 데에도 이용될 수 있다.

도 2는 본 발명의 다른 실시예에 따라서 혼합 주도형 문법을 생성하는 데 이용되는 GUI(200)를 나타내는 도식적인 도면이다. GUI(200)는 사용자가 혼합 주도형 문법을 생성하는 데 이용할 수 있는 복수의 이용 가능한 문법 생성 기법을 선택할 수 있게 한다. 이러한 경우에, 상자(205) 내에 도시된 3개의 이용 가능 문법 생성 기법이 존재한다. 이러한 기법은 고정된 순서, 넓은 범위의 조합(wide combination) 및 좁은 범위의 조합(narrow combination)이다.

GUI(200)는 개발된 혼합 주도형 시스템의 최종 사용자에게 정보를 요청하기 위해 이용될 초기 프롬프트(initial prompt)를 명시하는 사용자 제공 입력을 수신할 수 있는 필드(220)도 포함할 수 있다. 초기 프롬프트는 생성된 혼합 주도형 문법을 이용하여 처리되는 최종 사용자가 발언한 발화 내용을 요청하는 데 이용될 것이다. VoiceXML을 이용한 본 발명의 실시예에서, 예를 들면 프롬프트는 "초기" 태그를 가지고 이용될 수 있다. "초기" 태그는 VoiceXML 혼합 주도형 담화 내에 이용되어 사용자가 형태 방식 정보(form-wide information)를 기입할 수 있게 한다. "초기" 태그는 사용자가 하나의 발화가 있는 복수의 필드 프롬프트를 건너뛰는 것을 가능하게 한다. 일반적으로, 혼합 주도형 담화 내의 제 1 프롬프트는 사용자에게 모든 정보를 질의한다. 전형적으로, 필드는 모든 필드 변수가 기입되지 않았다고 판정된 이후에만 실행된다. "초기" 성분은 그 자체의 어떠한 문법 또는 기입된 사건을 포함하는 것이 아니라, 각각의 개별 필드의 문법 및 기입된 성분에 의존한다.

고정 순서의 문법 생성 기법은 GUI(200)의 시야(210)에 도시되어 있다. 고정 순서를 이용하면, 사용자는 연접 문구를 설정하는 특정한 순서를 지정할 수 있고, GUI(100)에서 명시 또는 생성된 연관되는 지시적 담화 문법은 생성된 혼합 주도형 문법 내에서 순차화된다. 사용자는 특정한 연접 문구-지시적 담화 문법의 세트를 선택하고, 화살표(215)를 이용하여 이 세트를 그 순위 내에서 위 또는 아래로 이동시킬 수 있다. 이러한 기법을 이용하면, 혼합 주도형 문법은 균일한 성분의 지시적 담화 문법 목록 내에 생성될 수 있다.

도 3은 본 명세서에 개시된 본 발명의 구성에 따라서 생성될 수 있는 하나의 다양한 혼합 주도형 문법을 도시하는 예시적인 코드이다. 보다 구체적으로, 도 3은 도 2를 참조하여 도시된 바와 같이 선택되는 선택 사항에 기초하여 문법 생성 도구에 의해 생성 가능한 다양한 혼합 주도형 문법을 도시한다.

도 4는 본 명세서에 개시된 본 발명의 구성에 따라서 생성될 수 있는 다른 다양한 혼합 주도형 문법을 도시하는 예시적인 코드이다. 보다 구체적으로, 도 4는 넓은 범위의 조합 선택 사항이 문법 생성 기법으로서 선택될 때 문법 생성 도구에 의해 생성 가능한 다양한 혼합 주도형 문법을 도시한다. 넓은 범위의 조합 문법 생성 기법은 사용자가 하나 이상의 또는 모든 지시적 담화 문법을 임의의 순서로 말할 수 있게 한다.

넓은 범위의 조합 문법 생성 기법은 경우에 따라서 "비의도적 단어" 또는 "비의도적 문구"로 지칭될 수 있는 성분이 존재할 수 있게 한다. 도 4에서 확인되는 바와 같이 혼합 주도형 문법의 종료 부분에 "*" 신택스(syntax)가 이용되어 있 다. "*"는 JSGF(Java Application Programming Interface Speech Grammar Format), SRGS(W3C Speech Recognition Grammar Specification), ABNF(Augmented Backus-Naur form) 등과 같은 여러 타입의 문법 내에서 문법의 확장이 0회 이상으로 발언될 수 있다는 것을 나타내는 표준 표기 형태이다. 본 명세서에서 이용된 "문구"라는 용어는 하나 이상의 단어, 기호, 문자 성분 등을 포함할 수 있다.

예에서, 도 4에 도시된 문법은 사용자가 다음의 문구, "보스톤으로부터 마이애미로 5월 1일에" 및 "5월 1일에 보스톤으로부터 마이애미로"라고 발언할 수 있게 한다. 문법은 또한 사용자가 "보스톤으로부터 마이애미로 5월 1일에, 올란도로부터"라는 문구를 발언할 수 있게 한다. 이 마지막 사용자 발언 발화 내용은 출발 도시의 2가지의 예시, 즉 "보스톤으로부터" 및 "올란도로부터"를 포함한다. 도 4의 문법은 이러한 발화 내용을 허용한다. 출발 도시의 중복은 비의도적 문구로서 지칭되고, 이것은 문법의 확장이 0회 이상 발언될 수 있도록 허용하기 때문에 가능해진다.

도 5는 본 명세서에 개시된 본 발명의 구성에 따라서 생성될 수 있는 또 다른 다양한 혼합 주도형 문법을 도시하는 예시적인 코드이다. 특히, 도 5는 문법 생성 기법으로서 좁은 범위의 조합 선택 사항이 선택될 때 문법 생성 도구에 의해 생성 가능한 다양한 혼합 주도형 문법을 도시한다. 좁은 범위의 조합 선택 사항은 사용자가 하나 이상 또는 모든 지시적 문법을 임의의 순서로 발언할 수 있게 할 뿐만 아니라 넓은 범위의 조합 기법을 이용할 때 허용되었던 비의도적 문구의 목록을 제거하는 혼합 주도형 문법을 생성할 것이다.

예를 들어, 혼합 주도형 문법이 형성되고, 연접 문구 및 지시적 담화 문법(A, B, C)이 식별되었다고 가정하면, 결과적인 혼합 주도형 문법은 다음의 지시적 담화 순차화, 즉 A, B, C, AB, CA, BC, ABC, BAC, CAB 등을 가능하게 할 것이다. 그러나, AABC, AA, BCC 등과 같은 순차화는 허용 불가능하다. 이러한 예에서 A는 전체 문장"([depart] from) <departGrammar>"를 나타내고, B는 문장"(to | arrive at) <arrivalGrammar>"를 나타내고, C는 "([depart] on) <departDate>"를 나타낸다. 비의도적 문구가 허용 불가능하기 때문에, 비부합(noncompliant) 또는 비의도적 문구(들)를 무시하고 나머지 발화 부분을 처리한다면, 전체 발화 내용은 거부될 수 있다. 특히, 개발자 기호에 따라 처리하기 위해서 임의의 반복된 문구의 특정한 예시 중 어느 하나를 선택할 수 있다.

도 6은 사용자가 생성되는 혼합 주도형 문법 내에 포함될 수 있는 지시적 담화 문법과, 각각의 지시적 담화 문법과 연관된 필드를 선택 및/또는 식별할 수 있게 하는 하나의 방식을 나타내는 예시적인 코드를 도시한다. 도 6에 도시된 바와 같은 코드는 예를 들면 파일 선택 대화창을 통해, 또는 이러한 코드를 포함하는 텍스트 파일을 GUI의 지정된 영역 또는 아이콘으로 드래그 앤드 드롭(dragging and dropping)하는 것에 의해 문법 생성 도구로 도입될 수 있다. 다른 실시예에서, 사용자는 혼합 주도형 문법 내에 포함될 각각의 개별 지시적 담화 문법을 도구 내에 드래그 앤드 드롭할 수 있다. 어떠한 경우에도, 지시적 담화 문법이 명시 또는 식별되는 특정한 방식은 본 발명을 한정하는 것으로 의도되어서는 안 된다.

도 7은 본 발명의 또 다른 실시예에 따라서 혼합 주도형 문법을 생성하는 방 법(700)을 도시하는 흐름도이다. 방법(700)은 단계(705)에서 시작될 수 있는데, 이 단계에서 사용자는 혼합 주도형 화법 기반 시스템에서 사용되는 혼합 주도형 문법을 생성하는 데 이용될 하나 이상의 지시적 담화 문법을 선택적으로 생성할 수 있다.

단계(710)에서, 사용자는 혼합 주도형 문법을 생성하는 데 이용될 하나 이상의 지시적 담화 문법을 선택할 수 있다. 단계(705)는 본질적으로 선택 사항이므로, 단계(710)에서 식별된 지시적 담화 문법은 사용자에 의해 생성될 필요가 없고, 다른 개발자에 의해 생성될 수 있다. 따라서, 단계(710)에서, 사용자는 사용자가 지시적 담화 문법을 생성했는지 여부에 무관하게 존재하고 있는 하나 이상의 지시적 담화 문법을 선택할 수 있다.

단계(715)에서, 사용자는 하나 이상의 연접 문구를 프롬프트할 수 있다. 단계(720)에서, 하나 이상의 연접 문구를 명시하는 사용자 입력을 수신할 수 있다. 사용자 입력은 하나 이상의 연접 문구를 명시하는 방식뿐만 아니라 연접 문구를 사용자가 지정한 지시적 담화 문법, 즉 단계(710)에서 식별된 것 중에서 선택된 지시적 담화 문법과 연관되게 하는 방식으로 제공될 수 있다는 것을 이해할 것이다. 어떠한 경우에도, 연접 문구가 선택된 특정한 문법 생성 기법에 기초하여 혼합 주도형 문법으로부터 배제될 수 있기 때문에 기본적으로 단계(715) 및 단계(720)는 선택 사항일 수 있다.

단계(725)에서, 문법 생성 도구는 사용자에게 특정한 문법 생성 기법에 대해 프롬프트할 수 있다. 단계(730)에서, 사용자가 지정한 문법 생성 기법은 사용자로 부터의 입력으로서 수신될 수 있다. 단계(735)에서, 문법 생성 도구는 최종 사용자로부터 정보를 요청하기 위해 이용될 초기 프롬프트를 사용자에게 프롬프트할 수 있다. 단계(740)에서, 사용자가 지정한 초기 프롬프트를 사용자로부터 획득 또는 수신할 수 있다. 단계(745)에서, 문법 생성 도구는 사용자에 의해 제공된 입력 및/또는 선택에 기초하여 혼합 주도형 문법을 생성할 수 있다. 언급된 바와 같이, 혼합 주도형 문법에 의해 지정된 지시적 담화 문법의 순차화에 의해 결정되어 있는 바와 같이 사용자가 특정 문구를 발언하도록 허용되는 순서는 사용자에 의해 선택된 문법 생성 기법에 따라서 결정될 수 있다.

본 명세서에 개시된 여러 GUI, 흐름도 및 예시적인 코드 부분은 오로지 예시를 목적으로 제공되었고, 이들은 어떠한 방식으로도 본 발명의 범주를 한정하도록 의도되지 않았다는 것을 이해할 것이다. 예를 들면, GUI에 있어서, 도시 및/또는 설명된 것에 대체하여 다른 제어, 시각적 표시자 등을 이용할 수 있다. 마찬가지로, 흐름도에 있어서 본 발명의 사상을 벗어나지 않으면서 여러 단계를 생략하거나 설명된 것과는 상이한 순서로 실행할 수 있다.

본 발명은 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다. 본 발명은 하나의 컴퓨터 시스템 내에서 집중된 방식으로 구현되거나 서로 다른 구성 요소가 여러 상호 접속된 컴퓨터 시스템에 걸쳐 분산된 분산형 방식으로 구현될 수 있다. 본 발명에 개시된 방법을 실행할 수 있는 어떠한 종류의 컴퓨터 시스템 또는 다른 장치도 적합하게 적용 가능하다. 하드웨어와 소프트웨어의 전형적인 조합은, 로딩되고 실행될 때 본 명세서에 개시된 방법을 실행하도 록 컴퓨터 시스템을 제어하는 컴퓨터 프로그램을 구비한 범용 컴퓨터 시스템일 수 있다. 본 발명은 또한 본 명세서에 개시된 방법의 구현을 가능하게 하는 모든 피처를 포함하고, 컴퓨터 시스템 내에 로딩될 때 이러한 방법을 실행할 수 있는 컴퓨터 프로그램 제품으로 구현될 수 있다.

본 발명과 관련하여 "컴퓨터 프로그램", "소프트웨어", "적용 분야"라는 용어와, 그 변경 및/또는 조합은 임의의 언어, 코드 또는 표기법으로 된 임의의 표현을 의미하는데, 이 임의의 표현은 정보 처리 능력을 갖는 시스템이 직접적으로, 또는 a) 다른 언어, 코드 또는 표기법으로의 변환 및 b) 다른 자료 형태로의 재생산 중 어느 하나 또는 모두를 수행한 후에, 특정한 기능을 수행하도록 의도된 인스트럭션의 세트에 대한 표현일 수 있다. 예를 들면, 컴퓨터 시스템은 서브루틴, 함수, 절차, 대상 방법, 대상 구현, 실행 가능 적용 분야, 애플릿(applet), 서블릿(servlet), 소스 코드, 객체 코드, 공유 라이브러리/동적 로드 라이브러리 및/또는 다른 컴퓨터 시스템 상에서 실행되도록 설계된 인스트럭션의 다른 시퀀스를 포함할 수 있지만 이것으로 한정되지는 않는다.

본 명세서에 이용된 단수로 표현된 용어는 하나 이상을 의미하는 것으로 정의된다. 본 명세서에 이용된 "복수의"라는 용어는 적어도 2개 이상으로서 정의된다. 본 명세서에 이용된 "포함한다" 및/또는 "가진다"라는 용어는 포괄적인 것(즉, 개방적 의미의 언어)으로서 정의된다. 본 명세서에 이용된 "결합된다"라는 용어는 반드시 직접적이어야 하거나 반드시 기계적이어야 한다는 것이 아니라 단지 접속된 것, 즉 통신 채널 또는 경로를 통해 통신 가능하게 연결된 것으로서 정의된 다.

본 발명은 본 발명의 정신 및 기본적인 속성을 벗어나지 않으면서 다른 형태로 구현될 수 있다. 따라서, 상기 명세서가 아니라 본 발명의 범주를 나타내는 이하의 청구항을 참조하여야 한다.

본 발명에 따르면, 혼합 주도형 컴퓨터 시스템 내에서 사용될 문법을 개발하는 데 있어서 혼합 주도형 문법의 수동 생성과 연관되었던 여러 복잡성을 감소 및/또는 제거하는 해결책을 제공한다.

Claims

혼합 주도형 문법(mixed-initiative grammar)을 생성하는 방법으로서,

상기 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법(directed dialog grammars)을 식별하는 단계와,

상기 혼합 주도형 문법이 상기 복수의 지시적 담화 문법을 명시하도록, 선택된 문법 생성 기법에 따라서 상기 혼합 주도형 문법을 자동으로 생성하는 단계를 포함하는

혼합 주도형 문법의 생성 방법.
제 1 항에 있어서,

적어도 하나의 연접 문구(conjoin phrase)를 수신하는 단계를 더 포함하되,

상기 각 연접 문구는 상기 복수의 지시적 담화 문법 중 선택된 지시적 담화 문법과 연관되고,

상기 연접 문구는, 사용자가 발언한 발화 내용(user spoken utterance) 내에서 인식될 때, 상기 사용자가 발언한 발화 내용의 특정 부분을 처리하기 위해 상기 연관된 지시적 담화 문법이 사용된다는 것을 나타내는

혼합 주도형 문법의 생성 방법.
제 2 항에 있어서,

상기 생성 단계는 상기 혼합 주도형 문법 내에 복수의 세트를 포함하는 단계를 더 포함하되,

상기 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시하고, 상기 선택된 문법 생성 기법은 사용자가 발언한 발화 내용을 해석하기 위해 상기 혼합 주도형 문법의 세트가 고정된 순서로 사용된다는 것을 명시하는

혼합 주도형 문법의 생성 방법.
제 2 항에 있어서,

상기 생성 단계는 상기 혼합 주도형 문법 내에 복수의 세트를 포함하는 단계를 더 포함하고,

상기 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시하고,

상기 선택된 문법 생성 기법은 사용자가 발언한 발화 내용을 해석하기 위해 상기 혼합 주도형 문법의 세트가 임의의 순서로 사용된다는 것을 명시하며,

상기 선택된 문법 생성 기법은 비의도적 문구(unintentional phrases)를 허용하는

혼합 주도형 문법의 생성 방법.
제 1 항에 있어서,

상기 선택된 문법 생성 기법은 상기 혼합 주도형 문법에 의해 명시된 상기 복수의 지시적 담화 문법이 비의도적 문구가 무시되도록, 사용자가 발언한 발화 내용을 해석하기 위해 임의의 순서로 사용 가능하다는 것을 나타내는

혼합 주도형 문법의 생성 방법.
제 2 항에 있어서,

상기 수신 단계는 적어도 하나의 사용자 지정형 연접 문구를 수신하기 위한 입력 영역을 갖는 그래픽 사용자 인터페이스(graphical user interface)를 제시함으로써 사용자에게 먼저 프롬프트(prompting)하는 단계를 더 포함하는

혼합 주도형 문법의 생성 방법.
제 6 항에 있어서,

상기 그래픽 사용자 인터페이스는 적어도 하나의 접두사 연접 문구를 수신하기 위한 입력 영역과 적어도 하나의 접미사 연접 문구를 수신하기 위한 입력 영역을 포함하는

혼합 주도형 문법의 생성 방법.
복수의 지시적 담화 문법으로부터 혼합 주도형 문법을 자동으로 생성하는 방법으로서,

상기 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법을 식별하는 단계와,

사용자 프롬프트에 응답하여, 선택된 문법 생성 기법을 명시하는 사용자 입력을 수신하는 단계와,

상기 복수의 지시적 담화 문법을 명시하는 상기 혼합 주도형 문법을 자동으로 생성하는 단계를 포함하되,

상기 복수의 지시적 담화 문법은 적어도 부분적으로 상기 선택된 문법 생성 기법에 따라서 결정되는 사용자가 발언한 발화 내용을 처리하기 위해 서로에 대해 순차화된 관계를 갖는

혼합 주도형 문법의 자동 생성 방법.
제 8 항에 있어서,

사용자 프롬프트에 응답하여, 상기 사용자가 발언한 발화 내용 중 선택된 부분을 처리하는 데 이용되는 상기 복수의 지시적 담화 문법 중 적어도 하나를 식별하는 적어도 하나의 연접 문구를 명시하는 사용자 입력을 수신하는 단계를 더 포함하되,

상기 적어도 하나의 연접 문구는 상기 혼합 주도형 문법에 의해 명시되는

혼합 주도형 문법의 자동 생성 방법.
제 9 항에 있어서,

상기 혼합 주도형 문법은 복수의 세트 - 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시함- 로 구성되고,

상기 선택된 문법 생성 기법은 상기 세트가 사용자가 발언한 발화 내용을 해석하기 위해 고정된 순서로 사용 가능하다는 것을 나타내는

혼합 주도형 문법의 자동 생성 방법.
제 9 항에 있어서,

상기 혼합 주도형 문법은 복수의 세트 - 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시함- 로 구성되고,

상기 선택된 문법 생성 기법은 상기 세트가 사용자가 발언한 발화 내용을 해석하기 위해 임의의 순서로 사용 가능하다는 것을 나타내며,

상기 선택된 문법 생성 기법은 비의도적 문구를 허용하는

혼합 주도형 문법의 자동 생성 방법.
제 8 항에 있어서,

상기 혼합 주도형 문법은 상기 혼합 주도형 문법을 생성하기 위해 이용되는 상기 지시적 담화 문법이 비의도적 문구에 무관하게 사용자가 발언한 발화 내용을 해석하기 위해 임의의 순서로 사용 가능하다는 것을 나타내는

혼합 주도형 문법의 자동 생성 방법.
제 8 항에 있어서,

프롬프트에 응답하여, 혼합 주도형 시스템에 의해 실행될 초기 프롬프트를 지정하는 사용자 입력을 수신하는 단계를 더 포함하되,

상기 초기 프롬프트는 상기 생성 단계에서 생성된 상기 혼합 주도형 문법을 이용하여 처리되는 사용자가 발언한 발화 내용을 도출하기 위해 이용되는

혼합 주도형 문법의 자동 생성 방법.
복수의 코드 섹션을 갖는 컴퓨터 프로그램을 저장하는 머신 판독 가능 저장 장치로서,

상기 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법을 식별하는 식별 코드와,

상기 혼합 주도형 문법이 상기 복수의 지시적 담화 문법을 명시하도록, 선택된 문법 생성 기법에 따라서 상기 혼합 주도형 문법을 자동으로 생성하는 생성 코드를 포함하는

머신 판독 가능 저장 장치.
제 14 항에 있어서,

적어도 하나의 연접 문구를 수신하는 수신 코드를 더 포함하되,

상기 각 연접 문구는 상기 복수의 지시적 담화 문법 중 선택된 지시적 담화 문법과 연관되고,

상기 연접 문구는 사용자가 발언한 발화 내용 내에서 인식될 때, 상기 연관된 지시적 담화 문법이 상기 사용자가 발언한 발화 내용의 특정 부분을 처리하기 위해 이용된다는 것을 나타내는

머신 판독 가능 저장 장치.
제 15 항에 있어서,

상기 생성 코드는 상기 혼합 주도형 문법 내에 복수의 세트를 포함하는 코드를 더 포함하되,

상기 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시하고,

상기 선택된 문법 생성 기법은 상기 혼합 주도형 문법의 세트가 사용자가 발언한 발화 내용을 해석하기 위해 고정된 순서로 사용된다는 것을 명시하는

머신 판독 가능 저장 장치.
제 15 항에 있어서,

상기 생성 코드는 상기 혼합 주도형 문법 내에 복수의 세트를 포함하는 코드를 더 포함하되,

상기 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시하고,

상기 선택된 문법 생성 기법은 상기 혼합 주도형 문법의 세트가 사용자가 발언한 발화 내용을 해석하기 위해 임의의 순서로 사용된다는 것을 명시하며,

상기 선택된 문법 생성 기법은 비의도적 문구를 허용하는

머신 판독 가능 저장 장치.
제 14 항에 있어서,

상기 선택된 문법 생성 기법은 상기 혼합 주도형 문법에 의해 명시된 상기 복수의 지시적 담화 문법이 비의도적 문구가 무시되도록, 사용자가 발언한 발화 내용을 해석하기 위해 임의의 순서로 이용 가능하다는 것을 나타내는

머신 판독 가능 저장 장치.
제 15 항에 있어서,

상기 수신 코드는 적어도 하나의 사용자가 지정한 연접 문구를 수신하기 위한 입력 영역을 갖는 그래픽 사용자 인터페이스를 제시함으로써 사용자를 먼저 프롬프트하는 코드를 더 포함하는

머신 판독 가능 저장 장치.
제 19 항에 있어서,

상기 그래픽 사용자 인터페이스는 적어도 하나의 접두사 연접 문구를 수신하기 위한 입력 영역과 적어도 하나의 접미사 연접 문구를 수신하기 위한 입력 영역을 포함하는

머신 판독 가능 저장 장치.