WO2019124631A1

WO2019124631A1 - 어플리케이션 실행 방법 및 이를 위한 장치

Info

Publication number: WO2019124631A1
Application number: PCT/KR2018/002467
Authority: WO
Inventors: 이동현; 강세천; 서유빈; 양희정
Original assignee: 삼성전자 주식회사
Priority date: 2017-12-22
Filing date: 2018-02-28
Publication date: 2019-06-27
Also published as: CN111512282A; KR20190076568A; KR102532300B1; CN111512282B; EP3699750A1; EP3699750A4; US20220113934A1

Abstract

입력 필드의 입력값을 수신하기 위한 그래픽 사용자 인터페이스(GUI)를 포함하는 어플리케이션을 실행하는 디바이스에 있어서, 음향 출력부, 어플리케이션의 실행을 요청하는 사용자 입력을 수신하는 사용자 입력부, 및 사용자 입력이 음성 입력인지 여부에 기초하여, 음향 출력부를 통해, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하고, 유도 질의에 대한 응답을 나타내는 음성 입력을 수신하고, 유도 질의에 대한 응답을 나타내는 음성 입력에 기초하여 입력 필드에 대한 입력값을 설정함으로써, 어플리케이션을 실행하는 제어부를 포함하는, 일 실시예에 따른 디바이스가 개시된다.

Description

어플리케이션 실행 방법 및 이를 위한 장치

본 발명은, 사용자의 음성 입력에 기초하여 어플리케이션을 실행하는 방법 및 이를 위한 장치에 관한 것이다.

음성 인식 기술이 발전함에 따라, 음성 인식 스피커로부터 모바일 디바이스까지 다양한 디바이스가 음성 인식을 이용하여 서비스를 제공하고 있다.

디바이스는 음성 인식 장치를 이용하여 사용자 입력을 수신할 수 있으며, 터치 패널이나, 마우스와 같은 입력 장치를 이용하여 사용자 입력을 수신할 수 있다.

이 경우, 사용자의 상황에 따라, 사용자는 다른 입력 방법을 선택할 수 있다. 예를 들어, 사용자의 손이 자유로운 경우, 사용자는 화면 터치 또는 마우스를 이용하여 디바이스를 제어할 수 있으며, 디바이스를 볼 수 있는 상황이 아니거나, 손으로 조작할 수 없는 상황인 경우, 사용자는 음성 입력으로 디바이스를 제어할 수 있다.

그러나, 사용자가 디바이스의 화면을 보지 않고, 음성 입력으로 디바이스를 제어하는 경우, 디바이스를 제어하기 위해 어떠한 입력이 필요한지 알 수 없다.

특히, 디바이스에서 실행되는 어플리케이션 마다 다양한 사용자 인터페이스를 가지며, 사용자 인터페이스를 통해 선택될 수 있는 값 또한 다양하므로, 사용자가 화면을 보지 않고 어플리케이션을 제어하는 것은 쉽지 않다.

또한, 사용자가 화면을 볼 수 있더라도, 디바이스를 손으로 조작할 수 없는 경우에도, 사용자 인터페이스 각각을 음성 입력을 이용하여 제어해야 하므로, 어플리케이션을 제어하는데 사용되는 시간이 길어질 수 있다.

사용자의 음성 입력에 기초하여 어플리케이션을 실행하는 다양한 실시예가 제공된다.

도 1a, 1b, 2a 및 도 2b는 일부 실시예에 따른, 디바이스가 어플리케이션을 실행하는 방법을 도시한다.

도 3은 일부 실시예에 따른, 디바이스가 어플리케이션을 실행하는 방법의 흐름도이다.

도 4, 5a, 5b, 및 5c는 일부 실시예에 따른, 디바이스가 페이지의 순서에 따라, 입력 필드에 대한 유도 질의를 출력하는 방법을 도시한다.

도 6a 및 6b는 일부 실시예에 따른, 디바이스가 입력 필드에 입력될 수 있는 값들에 기초하여 음성 인식을 수행하는 방법을 도시한다.

도 7은 일부 실시예에 따른, 디바이스가 인공 지능을 이용하여, 입력 필드의 입력값을 결정하는 방법을 도시한다.

도 8, 9a, 9b는 일부 실시예에 따른, 사용자가 유도 질의에 상관없이, 유도 질의에 대응하는 입력 필드 이외의 다른 입력 필드에 대한 입력값에 대해 응답한 경우, 디바이스가 복수의 입력 필드에 대응하는 입력값을 결정하는 방법을 도시한다.

도 10a 및 10b는 일부 실시예에 따른, 디바이스가 중요도가 낮은 입력 필드에 대한 입력값을 설정하는 방법을 도시한다.

도 11a 및 11b는 일부 실시예에 따른, 디바이스가 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하면서, 입력 필드에 입력될 수 있는 값들을 디스플레이하는 방법을 도시한다.

도 12a 및 12b는 일부 실시예에 따른, 어플리케이션의 페이지가 이동됨에 따라, 디바이스가 유도 질의를 출력하는 방법을 도시한다.

도 13a 및 13b는 일부 실시예에 따른, 입력 필드의 입력값을 변경하는 음성 입력을 수신함에 따라, 디바이스가 유도 질의를 출력하는 방법을 도시한다.

도 14a, 14b, 15a, 15b는 일부 실시예에 따른, 디바이스가 사용자의 선택에 따라, 입력 필드에 대한 입력값을 수신하는 방법을 전환하는 실시예를 도시한다.

도 16은 일부 실시예에 따른, 디바이스가 서버와 연동하여, 어플리케이션의 입력 필드에 대한 입력값을 결정하는 방법의 흐름도이다.

도 17 및 도 18은 일부 실시예에 따른 디바이스의 블록도이다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 개시의 제 1 측면은, 입력 필드의 입력값을 수신하기 위한 그래픽 사용자 인터페이스(GUI)를 포함하는 어플리케이션을 실행하는 디바이스에 있어서, 음향 출력부, 어플리케이션의 실행을 요청하는 사용자 입력을 수신하는 사용자 입력부, 및 사용자 입력이 음성 입력인지 여부에 기초하여, 음향 출력부를 통해, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하고, 유도 질의에 대한 응답을 나타내는 음성 입력을 수신하고, 유도 질의에 대한 응답을 나타내는 음성 입력에 기초하여 입력 필드에 대한 입력값을 설정함으로써, 어플리케이션을 실행하는 제어부를 포함하는, 디바이스를 제공할 수 있다.

또한, 제어부는, 어플리케이션의 실행을 요청하는 사용자 입력이 음성 입력인 경우, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하고, 어플리케이션의 아이콘을 통한 입력인 경우, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하지 않을 수 있다.

또한, 디바이스는 디스플레이부를 더 포함하고, 제어부는, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하는 것에 더하여, 입력 필드를 포함하는 GUI를 디스플레이하도록 디스플레이부를 제어할 수 있다.

또한, 어플리케이션은 순서에 따라 디스플레이되는 복수의 페이지로 구성되고, 입력 필드는 제 1 입력 필드 및 제 2 입력 필드를 포함하고, 제어부는, 어플리케이션을 실행할 것을 요청하는 음성 입력을 수신함에 따라, 복수의 페이지 중 제 1 페이지를 디스플레이하고, 제 1 페이지에 포함된 입력 필드에 대응되는 유도 질의를 나타내는 음향 신호를 출력하고, 제 1 페이지에 포함된 입력 필드의 입력값이 결정됨에 따라, 제 1 페이지 다음의 제 2 페이지를 디스플레이하고, 제 2 페이지에 포함된 입력 필드에 대응되는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

또한, GUI는 입력 필드를 포함하는 복수의 입력 필드를 포함하고, 제어부는, 유도 질의에 대한 응답을 나타내는 음성 입력이 복수의 입력 필드 중 입력 필드에 대한 응답 이외의, 다른 입력 필드에 대한 응답을 포함하는 경우, 음성 입력에 기초하여 다른 입력 필드에 입력값을 설정할 수 있다.

또한, 제어부는, 다른 입력 필드에 입력값을 설정함에 따라, 복수의 입력 필드 중 다른 입력 필드를 제외한 나머지 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하도록, 음향 출력부를 제어할 수 있다.

또한, 디바이스는, 통신부를 더 포함하고, 통신부는, 입력 필드의 입력값으로 선택될 수 있는 적어도 하나의 값을 외부 서버로부터 수신하고, 제어부는, 수신된 적어도 하나의 값에 기초하여, 입력 필드의 입력값을 결정할 수 있다.

또한, 제어부는, 어플리케이션을 실행할 것을 요청하는 음성 입력을 수신함에 따라, 입력 필드를 포함하는 GUI를 디스플레이하지 않고, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

또한, 어플리케이션은 입력 필드와 함께 복수의 입력 필드를 포함하고, 제어부는, 복수의 입력 필드는 어플리케이션이 수행하는 서비스를 제공받기 위해 필수적으로 필요한 입력 필드인 적어도 하나의 필수 입력 필드를 포함하고, 복수의 입력 필드 중 적어도 하나의 필수 입력 필드를 제외한 나머지 입력 필드에 관한 유도 질의를 하지 않고, 나머지 입력 필드의 입력값을 기 설정된 디폴트값으로 설정할 수 있다.

또한, 제어부는, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하면서, 입력 필드에 입력될 수 있는 적어도 하나의 값을 디스플레이하고, 적어도 하나의 값에 대응하는 음성 키워드를 나타내는 텍스트를 표시할 수 있다.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.

본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.

도 1a, 1b, 2a 및 2b는 일부 실시예에 따른, 디바이스(1000)가 어플리케이션을 실행하는 방법을 도시한다.

어플리케이션은 입력 필드의 입력값을 수신하기 위한 GUI를 포함할 수 있다. 이에 따라, 디바이스(1000)는 GUI를 통해 수신된 사용자 입력에 기초하여, 입력 필드의 입력값을 결정할 수 있다.

입력 필드는 사용자에 의해 결정되는 어플리케이션의 변수를 의미할 수 있다. 디바이스는 입력 필드의 입력값을 입력하는 사용자 입력을 수신하고, 입력된 입력값에 기초하여 어플리케이션을 실행함으로써, 어플리케이션의 서비스를 제공할 수 있다.

예를 들어, 영화 예매 어플리케이션에서 입력 필드는 영화 선택 필드, 극장 선택 필드, 날짜 및 시간 선택 필드, 좌석 선택 필드 및 결재 정보 입력 필드일 수 있으며, 검색 어플리케이션에 입력 필드는 검색어 입력 필드일 수 있고, 인터넷 쇼핑몰 어플리케이션에서 입력 필드는 상품명 입력 필드, 옵션 선택 필드, 배송 정보 입력 필드 및 결재 정보 입력 필드일 수 있다.

입력 필드의 입력값은 입력 필드에 대응하여 저장된 복수의 값 중 하나 일 수 있다. 예를 들어, 디바이스는 입력 필드에 대응하여 저장된 복수의 값 중 하나를 선택하기 위한 드랍 다운 메뉴를 디스플레이하고, 드랍 다운 메뉴 상에 디스플레이된 복수의 값 중 하나를 선택하는 사용자 입력을 수신함에 따라, 입력 필드의 입력값을 결정할 수 있다.

또한, 입력 필드의 입력값은 사용자에 의해 직접 텍스트 형식으로 입력될 수도 있다.

도 1a를 참조하면, 디바이스(1000)는, 어플리케이션을 실행할 것을 명령하는 음성 입력을 수신할 수 있다.

예를 들어, 디바이스(1000)는 영화 예매 어플리케이션이 실행되지 않은 상태에서, "영화 예매 어플 실행해!"라는 음성 입력을 수신할 수 있다.

도 1b를 참조하면, 어플리케이션을 실행할 것을 명령하는 음성 입력을 수신함에 따라, 디바이스(1000)는 어플리케이션의 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

예를 들어, 디바이스(1000)는 "영화 예매 어플 실행해!"라는 음성 입력을 수신함에 따라, "어떤 영화를 보시겠습니까"라는 영화 선택 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

디바이스(1000)는 유도 질의에 대한 응답으로써, 사용자로부터 영화명을 포함하는 음성 입력을 수신함에 따라, 수신된 영화명을 영화 선택 필드의 입력값으로 결정할 수 있다.

사용자가 음성 입력으로 어플리케이션을 실행하는 상황은, 사용자가 디바이스(1000)와 거리가 떨어져 있거나, 손으로 디바이스(1000)를 조작하기 어려운 상황이므로, 사용자가 음성 입력으로 어플리케이션을 실행했을 때, 어플리케이션을 조작하기 위한 유도 질의를 제공함으로써, 디바이스(1000)는 사용자가 디바이스(1000)를 조작할 수 없는 상황에서도 사용자에게 서비스를 제공할 수 있다.

도 2의 (a)를 참조하면, 디바이스(1000)는 어플리케이션을 실행하기 위한 사용자 입력을 수신할 수 있다.

예를 들어, 디바이스(1000)는 영화 예매 어플리케이션을 터치 또는 클릭하는 사용자 입력을 수신할 수 있다.

도 2b를 참조하면, 어플리케이션을 실행하기 위한 사용자 입력을 수신함에 따라, 디바이스(1000)는 어플리케이션의 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하지 않고, 어플리케이션의 GUI만을 디스플레이할 수 있다.

사용자가 터치 입력으로 어플리케이션을 실행하는 상황은, 사용자가 손으로 직접 디바이스(1000)를 조작할 수 있는 상황이므로, 유도 질의를 나타내는 음향 신호를 출력하지 않을 수 있다.

도 3은 일부 실시예에 따른, 디바이스(1000)가 어플리케이션을 실행하는 방법의 흐름도이다.

단계 S310에서, 디바이스(1000)는 어플리케이션의 실행을 요청하는 사용자 입력을 수신할 수 있다.

디바이스(1000)는 어플리케이션의 실행을 요청하는 음성 입력을 수신할 수 있다. 디바이스(1000)는 어플리케이션이 실행되지 않은 상태에서, 어플리케이션의 실행을 요청하는 음성 입력을 수신할 수 있으며, 어플리케이션이 실행중인 상태에서, 어플리케이션을 실행할 것을 요청하는 음성 입력을 수신할 수도 있다.

음성 입력은, 예를 들어, 어플리케이션이 영화 예매 어플리케이션인 경우, "영화 예매 어플리케이션을 실행해!" 일 수 있으며, 어플리케이션 실행 요청을 나타내지 않는 "영화 예매 해줘!"일 수도 있다.

또한, 디바이스(1000)는 홈 화면에 어플리케이션의 아이콘을 디스플레이하고, 아이콘을 선택하는 사용자 입력을 수신함에 따라, 어플리케이션의 실행을 시작할 수도 있다.

단계 S320에서, 디바이스(1000)는 사용자 입력이 음성 입력인지 여부에 기초하여, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

디바이스(1000)는 어플리케이션의 실행을 요청하는 사용자 입력이 음성 입력인 경우, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

유도 질의는 입력 필드에 대응하는 데이터로써 디바이스(1000)에 저장되어 있을 수 있다. 또한, 하나의 입력 필드에 대응하여 하나의 유도 질의가 저장되어 있을 수 있으며, 복수개의 입력 필드에 대응하여 하나의 유도 질의가 저장되어 있을 수 있다. 예를 들어, 날짜 및 시간에 관한 입력 필드에 대응하여 "언제 영화를 보시겠습니까? "라는 하나의 유도 질의가 저장되어 있을 수도 있다.

유도 질의는 의문사를 포함하는 의문문 일 수 있다. 의문사를 포함하는 의문문은, 누가(who), 언제(when), 어디서(where), 무엇을(what), 어떻게(how, how much,how many) 및 왜(Why)를 포함하는 의문문을 의미할 수 있다.

이에 따라, 입력 필드에 입력될 수 있는 값들이 많을 때, 입력될 수 있는 값들을 전부 열거하지 않더라도, 간단한 질문만으로 사용자로부터 응답을 수신할 수 있다.

실시예에 따라, 디바이스(1000)는 입력 필드에 대응되는 유도 질의와 함께, 입력 필드에 입력될 수 있는 값들을 나타내는 음향 신호를 출력할 수도 있다.

또한, 어플리케이션은 복수의 입력 필드를 포함할 수 있다. 복수의 입력 필드는 어플리케이션이 서비스를 제공하기 위해 필수적으로 필요한 입력 필드인 필수 입력 필드와 어플리케이션이 서비스를 제공하기 위해 필수적으로 필요하진 않지만 부가적인 서비스를 위한 부가 입력 필드를 포함할 수 있다. 예를 들어, 영화 예매 어플리케이션에서 필수 입력 필드는, 영화 선택 필드, 극장 선택 필드, 날짜 및 시간 선택 필드, 좌석 선택 필드 및 결재 정보 입력 필드일 수 있으며, 부가 입력 필드는, 음료를 함께 구매할지 여부에 관한 입력 필드일 수 있다. 이 경우, 디바이스(1000)는 필수 입력 필드에 대해서만 유도 질의를 하고, 부가 입력 필드에 대해서는 입력값으로써 디폴트값을 설정할 수 있다.

디바이스(1000)는 입력 필드의 입력값을 수신하기 위한 GUI를 디스플레이하고, 더불어 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다. 또한, 디바이스(1000)는 입력 필드의 입력값을 수신하기 위한 GUI를 디스플레이하지 않고 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호만을 출력할 수도 있다.

또한, 어플리케이션이 복수의 페이지로 구성되고, 복수의 페이지의 디스플레이 순서가 기 설정된 경우, 디바이스(1000)는 디스플레이 순서에 따라 복수의 페이지를 순차적으로 디스플레이하면서, 디스플레이된 페이지에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

예를 들어, 디바이스(1000)는 복수의 페이지 중 제 1 페이지를 디스플레이하고, 제 1 페이지에 포함된 입력 필드에 대응되는 유도 질의를 나타내는 음향 신호를 출력하고, 사용자의 응답에 기초하여 제 1 페이지 내의 입력 필드의 입력값이 결정됨에 따라, 제 1 페이지 다음의 제 2 페이지를 디스플레이하고, 제 2 페이지에 포함된 입력 필드에 대응되는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

이에 따라, 사용자는 음성 입력으로 디바이스(1000)를 제어하는 중에 다시 터치나 클릭으로 디바이스(1000)를 제어하더라도, 현재 페이지를 찾을 필요 없이 입력 필드의 입력값을 설정할 수 있다. 또한, 사용자가 디바이스(1000)를 볼 수는 있지만, 손으로 조작할 수 없는 상황이라면, 현재 입력값이 설정되는 입력 필드에 관한 정보를 볼 수 있으므로, 보다 쉽고, 정확하게 입력값을 선택할 수 있다. 이러한 실시예에 대해서는 도 4 및 5를 참조하여 후술된다.

또한, 디바이스(1000)는 어플리케이션의 실행을 요청하는 사용자 입력이 어플리케이션의 아이콘을 통한 입력인 경우, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하지 않고, 어플리케이션의 GUI를 디스플레이할 수 있다.

사용자가 터치 또는 마우스를 이용하여 어플리케이션을 실행한 경우, 사용자가 손으로 디바이스(1000)를 제어할 수 있는 상황이므로, 디바이스(1000)는 유도 질의를 출력하지 않고, 어플리케이션의 GUI만을 디스플레이할 수 있다.

단계 S330에서, 디바이스(1000)는 유도 질의에 대한 응답을 나타내는 음성 입력을 수신할 수 있다.

유도 질의에 대한 응답을 나타내는 음성 입력은 출력된 유도 질의에 대응하는 입력 필드의 입력값을 포함할 수 있으며, 출력된 유도 질의에 대응하는 입력 필드가 아닌 다른 입력 필드의 입력값을 포함할 수도 있다.

단계 S340에서, 디바이스(1000)는 유도 질의에 대한 응답을 나타내는 음성 입력에 기초하여 입력 필드에 대한 입력값을 설정함으로써, 어플리케이션을 실행할 수 있다.

디바이스(1000)는 유도 질의에 대한 응답을 나타내는 음성 입력에 대해 음성 인식을 수행함으로써 음성 입력이 나타내는 텍스트를 결정하고, 결정된 텍스트로부터 입력 필드에 설정될 입력값을 검출함으로써, 입력 필드에 대응하는 입력값을 결정할 수 있다.

또한, 디바이스(1000)는 유도 질의에 대한 응답을 나타내는 음성 입력에 대해 음성 인식을 수행함으로써 음성 입력이 나타내는 텍스를 결정할 때, 입력 필드에 입력될 수 있는 값들에 기초하여 음성 인식을 수행할 수 있다. 예를 들어, 입력 필드에 입력될 수 있는 값이 '7호실', '범죄도시' 및 '침묵'인 경우, 디바이스(1000)는 유도 질의에 대한 응답을 나타내는 음성 입력은 다른 단어 보다 '7호실', '범죄도시' 및 '침묵' 중 하나를 포함할 확률이 높다는 가정하에 음성 인식을 수행할 수 있다.

또한, 디바이스(1000)는 입력 필드에 입력될 수 있는 값을 실시간으로 외부 서버로부터 수신하고, 수신된 값에 기초하여 유도 질의에 대한 응답을 나타내는 음성 입력에 대해 음성 인식을 수행함으로써, 입력 필드에 대응하는 입력값을 결정할 수 있다.

또한, 실시예에 따라, 디바이스(1000)는 음성 입력이, 출력된 유도 질의에 대응하는 입력 필드의 입력값 이외에 다른 입력 필드의 입력값을 포함하는지 여부를 결정할 수 있다. 예를 들어, 디바이스(1000)는 하나의 입력 필드에 대응하는 유도 질의만을 출력하였더라도, 음성 입력으로부터 어플리케이션이 포함하는 복수개의 입력 필드에 대한 입력값들을 검출할 수 있으며, 검출된 각각의 입력값들을 각각의 입력값들에 대응하는 입력 필드에 설정할 수 있다.

이에 따라, 사용자가 유도 질의에 대한 응답이 아닌 생각나는 데로 발화한 경우라도, 디바이스(1000)는 사용자의 응답으로부터 사용자가 의도한 입력값들을 검출할 수 있다. 이러한 실시예에 대해서는 도 8a 및 8b를 참조하여 후술한다.

또한, 디바이스(1000)는 출력된 유도 질의에 대응하는 입력 필드의 입력값 이외에 다른 입력 필드의 입력값을 수신한 경우, 어플리케이션의 복수의 입력 필드 중 설정되지 않은 나머지 입력 필드에 대응하는 유도 질의만을 출력할 수 있다.

도 4 및 5a, 5b, 5c는 일부 실시예에 따른, 디바이스(1000)가 페이지의 순서에 따라, 입력 필드에 대한 유도 질의를 출력하는 방법을 도시한다.

도 4의 단계 S410에서, 디바이스(1000)는 어플리케이션의 복수의 페이지 중 제 1 페이지를 디스플레이할 수 있다.

어플리케이션은 복수의 페이지로 구성될 수 있다. 예를 들어, 도 5를 참조하면, 영화 예매 어플리케이션에서 제 1 페이지(510)는 영화를 선택하는 페이지, 제 2 페이지(520)는 극장을 선택하는 페이지, 제 3 페이지(530)는 날짜와 시간을 선택하는 페이지 및 제 4 페이지는 결재 정보를 입력하는 페이지일 수 있다.

단계 S420에서, 디바이스(1000)는 제 1 페이지를 디스플레이함에따라, 제 1 페이지에 포함된 입력 필드에 대응되는 유도 질의를 출력할 수 있다.

디바이스(1000)는 어플리케이션의 제 1 페이지(510)를 디스플레이하고, 제 1 페이지(510)에 포함된 영화 선택 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다. 예를 들어, 영화 선택 필드에 대응하여 "어떤 영화를 보시겠습니까?"라는 유도 질의가 저장되어 있는 경우, 디바이스(1000)는 "어떤 영화를 보시겠습니까?"라는 유도 질의를 출력할 수 있다.

단계 S430에서, 디바이스(1000)는 제 1 페이지에 포함된 입력 필드의 입력값이 결정됨에 따라, 제 1 페이지 다음의 제 2 페이지를 디스플레이하고, 제 2 페이지에 포함된 입력 필드에 대응되는 유도 질의를 출력할 수 있다.

예를 들어, 도 5a를 참조하면, "7호실!"이라는 제 1 응답을 수신함에 따라, 디바이스(1000)는 복수의 영화 중 "7호실"을 영화 선택 필드의 입력값으로 결정할 수 있다.

또한, 도 5b를 참조하면, 제 1 페이지(510)에 포함된 입력 필드의 입력값이 결정됨에 따라, 디바이스(1000)는 제 2 페이지(520)를 디스플레이하고, 제 2 페이지(520)에 포함된 극장 선택 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다. 예를 들어, 극장 선택 필드에 대응하여 "어느 극장에서 보시겠습니까?"라는 유도 질의가 저장되어 있는 경우, 디바이스(1000)는 "어느 극장에서 보시겠습니까?"라는 유도 질의를 출력할 수 있다.

극장 선택 필드에 대응하는 유도 질의에 대한 응답으로써, "CGV 강남"이라는 제 2 응답을 수신함에 따라, 디바이스(1000)는 복수의 극장 중 "CGV 강남"을 극장 선택 필드의 입력값으로 결정할 수 있다.

또한, 도 5c를 참조하면, 제 2 페이지(520)에 포함된 입력 필드의 입력값이 결정됨에 따라, 디바이스(1000)는 제 3 페이지(530)를 디스플레이하고, 제 3 페이지(530)에 포함된 날짜 및 시간 선택 필드에 대응하는 음향 신호를 출력할 수 있다.

복수의 페이지(510 내지 530)에 포함된 입력 필드들의 입력값들을 모두 결정함에 따라, 디바이스(1000)는 입력값들에 기초하여 영화 예매 서비스를 제공할 수 있다.

이에 따라, 사용자는 음성 입력으로 디바이스(1000)를 제어하는 중에 다시 터치나 클릭으로 디바이스(1000)를 제어하더라도, 또한, 사용자가 디바이스(1000)를 볼 수는 있지만, 손으로 조작할 수 없는 상황이라도, 보다 쉽고, 정확하게 입력값을 선택할 수 있다.

도 6a 및 6b는 일부 실시예에 따른, 디바이스(1000)가 입력 필드에 입력될 수 있는 값들에 기초하여 음성 인식을 수행하는 방법을 도시한다.

도 6a의 단계 S610에서, 디바이스(1000)는 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다. 단계 S620에서, 디바이스(1000)는 유도 질의에 대한 응답을 나타내는 음성 입력을 수신할 수 있다. 단계 S610 및 S620은 도 3의 S320 및 S330을 참조하여 설명될 수 있다.

단계 S630에서, 디바이스(1000)는 입력 필드의 입력값으로 선택될 수 있는 적어도 하나의 값에 기초하여, 입력 필드의 입력값을 결정할 수 있다.

디바이스(1000)는 각각의 입력 필드에 대응하여, 입력값으로 선택될 수 있는 적어도 하나의 값을 저장하고 있을 수 있다. 예를 들어, 드랍 다운(Drop down) 메뉴를 이용하여 입력값이 선택되는 입력 필드의 경우, 디바이스(1000)는 드랍 다운 메뉴를 클릭했을 때 디스플레이되는 복수의 값들을 저장하고 있을 수 있다.

또한, 도 6b를 참조하면, 디바이스(1000)는 각각의 입력 필드에 대응하여, 입력값으로 선택될 수 있는 적어도 하나의 값을 외부 디바이스로부터 수신할 수도 있다. 예를 들어, 디바이스(1000)는 데이터베이스(2000)에게 입력 필드에 입력될 수 있는 값을 요청할 수 있다. 데이터베이스(2000)는 외부 서버일 수 있다. 또한, 데이터베이스(2000)는 인터넷과 같은 광대역 네트워크를 통해 디바이스(1000)와 통신할 수 있으며, LAN(Local Area Network)을 통해 통신할 수도 있다. 디바이스(1000)는 입력 필드에 대응하여 데이터베이스(2000)의 링크 주소를 저장하고 있을 수 있다.

디바이스(1000)는 입력 필드에 대응하는 데이터베이스(2000)에게, 입력 필드에 입력될 수 있는 값을 요청할 수 있다. 예를 들어, 영화 예매 어플리케이션인 경우, 데이터베이스(2000)는 영화 정보 데이터베이스(2000)일 수 있다. 이 경우, 디바이스(1000)는 영화 정보 데이터베이스(2000)에게 영화 선택 필드의 선택값으로 선택될 수 있는 값들을 요청할 수 있다. 디바이스(1000)는 영화 정보 데이터베이스(2000)로부터 영화 선택 필드의 선택값으로 선택될 수 있는 값들을 수신할 수 있다.

디바이스(1000)는 입력 필드에 입력될 수 있는 값들에 기초하여 음성 입력에 대한 음성 인식을 수행함으로써, 입력 필드의 입력값을 결정할 수 있다.

예를 들어, 디바이스(1000)는 유도 질의에 대한 응답에 대해 음성 인식을 수행하여 응답이 나타내는 텍스트를 결정할 때, 입력 필드에 입력될 수 있는 값들에 기초하여 음성 인식을 수행할 수 있다. 예를 들어, 디바이스(1000)는 응답으로부터 단어를 검출할 때, 다른 단어들 보다, 수신된 값들이 검출될 확률을 높게 설정할 수 있다.

예를 들어, 도 6b를 참조하면, 영화 데이터베이스로부터 수신된 영화 목록이 "저스티스 리그", "7호실", "해피 데스데이", "토르 라그나로크" 및 "러빙 빈센트"이고, 영화 선택 필드에 대응하는 유도 질의인 "어떤 영화를 보시겠습니까?" 에 대한 사용자의 응답이 "해피 벌뜨데이" 인 경우, 디바이스(1000)는 응답이 나타내는 텍스트가 "해피 벌뜨데이"가 아닌 "해피 데스데이"인 것으로 결정할 수 있다.

또한, 디바이스(1000)는 응답이 나타내는 텍스트가 "해피 벌뜨데이"인 것으로 결정한 후, "해피 벌뜨데이"를 영화 선택 필드의 입력값으로 선택될 수 있는 복수의 값들과 비교함으로써, 가장 유사한 값인 "해피 데쓰데이"를 영화 선택 필드의 입력값으로써 결정할 수도 있다.

실시예에 따라, 디바이스(1000)는 결정된 입력값이 사용자가 의도한 입력값과 일치하는지 여부를 확인하기 위한 음성 신호를 출력할 수 있다. 예를 들어, 디바이스(1000)는 "해피 데쓰데이를 예매할까요"라는 음성 신호를 출력할 수 있다.

또한, 예를 들어, 영화 예매 어플리케이션에서, "언제 보시겠습니까?"라는 유도 질의에 대한 응답으로써 "오늘 2시 반"이라는 음성 입력을 수신할 수 있다. 또한, 디바이스(1000)는 "오늘"이라는 단어에 기초하여 날짜 선택 필드의 입력값으로 11월 15일을 결정하고, "두시 반"이라는 단어에 기초하여, 시간 선택 필드의 입력값으로 2시 30분을 결정할 수 있다.

입력 필드의 입력값이 결정됨에 따라, 디바이스(1000)는 "15일 수요일 2 시 30분 영화가 선택되었습니다"를 나타내는 음향 신호를 출력할 수 있다. 또한, 디바이스(1000)는 디스플레이 화면 상에, 날짜 선택 필드의 식별 정보 및 선택된 날짜인 15일을 디스플레이하고, 시간 선택 필드의 식별 정보 및 선택된 시간인 2시 30분을 디스플레이할 수 있다. 또한, 복수의 페이지에 포함된 복수의 입력 필드에 대한 입력값들을 포함하는 하나의 응답을 수신함에 따라, 디바이스(1000)는 각각의 페이지 및 각각의 페이지에 포함된 입력 필드에 대한 입력값을 순차적으로 디스플레이할 수 있다.

이에 따라, 디바이스(1000)는 보다 정확하게 사용자의 의도를 파악할 수 있으며, 경우에 따라, 응답이 나타내는 텍스트를 입력 필드에 입력될 수 있는 값으로 한정 함으로써, 빠르고 정확한 서비스를 제공할 수 있다.

도 7은 일부 실시예에 따른, 디바이스(1000)가 인공 지능을 이용하여, 입력 필드의 입력값을 결정하는 방법을 도시한다.

도 7을 참조하면, 디바이스(1000)는 신경망 알고리즘을 이용하여 입력 필드의 입력값을 결정할 수 있다.

하나의 입력 필드에 입력될 수 있는 값들이 정해진 경우, 디바이스(1000)는 사용자의 유도 질의에 대한 응답을 신경망의 입력으로 설정했을 때, 입력 필드에 입력될 입력값을 출력하도록 신경망을 학습시킬 수 있다.

유도 질의에 대한 사용자의 응답을 나타내는 음성 입력을 수신함에 따라, 디바이스(1000)는 음성 입력을 텍스트로 변환할 수 있다. 디바이스(1000)는 변환된 사용자의 응답으로부터 입력 필드의 입력값으로 입력될 수 있는 값들과 유사한 텍스트를 검출할 수 있다. 예를 들어, 영화 선택 필드에 입력될 수 있는 값이 "저스티스 리그", "7 호실", "해피 데스데이", "토르 라그나로크" 및 "러빙 빈센트"이고, 사용자로부터 수신된 응답이 "해피 벌뜨데이 예매해줘"인 경우, 디바이스(1000)는 사용자의 응답을 각각의 영화명과 비교하여 임계값 이상 유사한 텍스트로써 "해피 벌뜨데이"를 검출할 수 있다.

디바이스(1000)는 "해피 벌뜨데이"를 신경망의 입력으로 입력하였을 때 출력되는 출력값을 입력 필드에 대한 입력값으로 결정할 수 있다.

결정된 입력값이 사용자가 의도한 입력값과 일치하는지 여부를 확인하기 위한 질문을 나타내는 음성 신호를 출력하고, 질문에 대한 응답을 수신함에 따라, 디바이스(1000)는 사용자의 응답에 기초하여, 신경망을 학습시킬 수 있다. 예를 들어, 신경망의 출력값이 "해피 데쓰데이"이고 "해피 데쓰데이"가 사용자가 의도한 영화가 아님을 확인한 경우, "해피 벌뜨데이 예매해줘"라는 음성 입력이 신경망의 입력으로 입력되었을 때, "해피 데쓰데이"가 신경망의 출력값으로 출력되지 않도록 신경망을 학습시킬 수 있다.

인공 지능을 이용하여 입력 필드의 입력값을 결정하는 기능은 디바이스(1000)와 연결된 서버에서 수행될 수 있으며, 서버는 유도 질의에 대한 복수의 사용자들의 다양한 응답을 수신할 수 있으며, 이에 따라 디바이스(1000)는 보다 정확하게 서비스를 제공할 수 있다.

도 8 및 도 9a, 9b는 일부 실시예에 따른, 사용자가 유도 질의에 상관없이, 유도 질의에 대응하는 입력 필드 이외의 다른 입력 필드에 대한 입력값에 대해 응답한 경우, 디바이스(1000)가 복수의 입력 필드에 대응하는 입력값을 결정하는 방법을 도시한다.

단계 S810에서, 디바이스(1000)는 복수의 입력 필드 중 제 1 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

디바이스(1000)는 복수의 입력 필드를 포함하는 어플리케이션을 실행할 수 있다. 디바이스(1000)는, 어플리케이션을 실행할 것을 요청하는 음성 입력을 수신했을 때, 또는 어플리케이션을 실행 중에, 제 1 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

단계 S820에서, 디바이스(1000)는 유도 질의에 대한 응답을 나타내는 음성 입력을 수신할 수 있다.

사용자가 어플리케이션의 입력 필드에 대해 미리 알고 있는 경우, 사용자는 미리 알고 있는 입력 필드들에 대한 입력값들을 무작위로 발화할 수 있다.

예를 들어, 도 9a를 참조하면, 디바이스(1000)가 영화 선택 필드에 대응하는 "어떤 영화를 보시겠습니까?"라는 유도 질의를 출력했을 때, "7호실 토요일 2시 2자리 예약해줘!"라는 응답을 수신할 수 있다.

단계 S830에서, 디바이스(1000)는 복수의 입력 필드 중, 수신된 음성 입력으로부터 제 2 입력 필드에 대한 값을 검출할 수 있다.

디바이스(1000)는 유도 질의에 대응하는 제 1 입력 필드가 아닌 다른 제 2 입력 필드에 대한 값을 검출할 수 있다. 또한, 디바이스(1000)는 유도 질의에 대응하는 제 1 입력 필드에 대한 값과 함께 다른 제 2 입력 필드에 대한 값을 검출할 수도 있다.

예를 들어, 디바이스(1000)는 제 1 입력 필드인 영화 선택 필드에 대한 값인 "7호실"이외에, 시간 선택 필드에 대한 값인 "토요일 2시" 및 좌석 선택 필드에 대한 값인 "2 자리"를 검출할 수 있다.

디바이스(1000)는 복수의 입력 필드 각각에 대응하여 입력될 수 있는 값들을 수신된 음성 입력과 비교함으로써, 음성 입력으로부터 제 1 입력 필드 이외의 제 2 입력 필드에 대한 값 또한 검출할 수 있다.

단계 S840에서, 디바이스(1000)는 검출된 값을 제 2 입력 필드에 대한 입력값으로 설정할 수 있다.

예를 들어, 디바이스(1000)는 제 1 입력 필드인 영화 선택 필드에 대한 값인 "7호실"을 영화 선택 필드의 입력값으로 설정할 수 있을 뿐만 아니라, "토요일 2 시"를 시간 선택 필드에 대한 입력값으로 설정하고, "2 자리"를 좌석 선택 필드에 대한 입력값으로 설정할 수 있다.

단계 S850에서, 디바이스(1000)는 복수의 입력 필드 중 입력값이 설정되지 않은 나머지 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

제 1 입력 필드 및 제 2 입력 필드에 대한 입력값이 설정된 경우, 디바이스(1000)는 복수의 입력 필드 중 제 1 입력 필드 및 제 2 입력 필드를 제외한 나머지 입력 필드들 중 적어도 하나에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

예를 들어 도 9b를 참조하면, 디바이스(1000)는 복수의 입력 필드 중 영화 선택 필드, 시간 선택 필드 및 좌석 선택 필드를 제외한 나머지 입력 필드 중 극장 선택 필드에 대응하는 유도 질의인 "어느 극장에서 보시겠습니까?"를 출력할 수 있다.

이에 따라, 사용자는 어플리케이션의 입력 필드 또는 페이지 순서에 따라 순차적으로 입력값을 입력하지 않더라도, 알고 있는 입력 필드에 대해 원하는 값을 한꺼번에 랜덤하게 입력할 수 있다.

도 10a 및 10b는 일부 실시예에 따른, 디바이스(1000)가 중요도가 낮은 입력 필드에 대한 입력값을 설정하는 방법을 도시한다.

도 10a의 단계 S1010을 참조하면, 디바이스(1000)는 복수의 입력 필드 중 필수 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

어플리케이션의 복수의 입력 필드는 어플리케이션의 서비스를 제공하기 위해 필수적으로 필요한 입력 필드인 필수 입력 필드와 필수 입력 필드는 아니지만 부수적인 정보를 획득하기 위한 부가 입력 필드로 구성될 수 있다.

예를 들어, 도 10b을 참조하면, 어플리케이션은 회원 가입 기능을 포함할 수 있다. 이 경우, 아이디 입력 필드(1010), 패스워드 입력 필드(1020) 및 연락처 입력 필드(1030)는 회원 가입 서비스를 위한 필수 입력 필드일 수 있다. 그러나, 이메일 주소는 회원 가입 서비스를 위해 필수적으로 필요하지 않으므로, 이메일 주소 입력 필드(1040)는 부가 입력 필드일 수 있다.

단계 S1020에서, 디바이스(1000)는 유도 질의에 대한 응답으로써 음성 입력을 수신함에 따라, 수신된 음성 입력에 기초하여 필수 입력 필드에 대한 입력값을 결정할 수 있다.

단계 S1030에서, 디바이스(1000)는 복수의 입력 필드 중 필수 입력 필드를 제외한 나머지 입력 필드의 입력값을 기 설정된 디폴트값으로 결정할 수 있다.

예를 들어, 디바이스(1000)는 어플리케이션의 복수의 입력 필드 중 필수 입력 필드가 아닌 부가 입력 필드에 대응하는 유도 질의를 출력하지 않고, 부가 입력 필드에 대응하는 디폴트 값을 부가 입력 필드의 입력값으로 결정할 수 있다.

예를 들어, 도 10b를 참조하면, 디바이스(1000)는 이메일 주소 입력 필드(1040)에 대응하는 입력값으로 "입력없음"을 결정할 수 있다.

도 11a 및 11b는 일부 실시예에 따른, 디바이스(1000)가 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하면서, 입력 필드에 입력될 수 있는 값들을 디스플레이하는 방법을 도시한다.

도 11a의 단계 S1110을 참조하면, 디바이스(1000)는 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

예를 들어, 도 11b를 참조하면, 디바이스(1000)는 인터넷 쇼핑 어플리케이션을 실행할 수 있다. 또한, 디바이스(1000)는 운동화를 선택하고, 선택된 운동화를 구매하기 위한 사용자 입력을 수신할 수 있다. 선택된 운동화를 구매하기 위한 사용자 입력을 수신함에 따라, 디바이스(1000)는 선택된 운동화에 관한 옵션을 선택하기 위한 옵션 선택 필드에 대응하는 유도 질의 나타내는 음향신호를 출력할 수 있다. 예를 들어, 디바이스(1000)는 "어떤 옵션을 선택하시겠습니까?"라는 음향 신호를 출력할 수 있다.

단계 S1120을 참조하면, 디바이스(1000)는 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하면서, 입력 필드에 입력될 수 있는 적어도 하나의 값을 디스플레이할 수 있다.

예를 들어, 도 11b를 참조하면, 디바이스(1000)는 옵션 선택 필드에 대응하는 유도 질의 나타내는 음향신호의 출력과 함께, 옵션 선택 필드에 입력될 수 있는 적어도 하나의 값(1140)을 디스플레이할 수 있다. 옵션 선택 필드에 입력될 수 있는 적어도 하나의 값(1140)은, 옵션 선택 필드에 대응하여 기 설정된 적어도 하나의 선택 항목일 수 있다. 예를 들어, 디바이스(1000)는 옵션 선택 필드에 대응하는 유도 질의 나타내는 음향신호의 출력과 함께, 옵션 선택 필드에 입력될 수 있는 값(1140)으로써 적어도 하나의 색 또는 적어도 하나의 사이즈를 디스플레이할 수 있다.

이에 따라, 사용자가 디바이스(1000)의 화면을 볼 수는 있으나, 손으로 조작할 수 없는 상황일 때, 화면 상에 입력 필드에 입력될 수 있는 값(1140)들을 디스플레이함으로써, 사용자는 쉽고 빠르게 입력 필드의 입력값을 결정할 수 있다.

단계 S1130에서, 디바이스(1000)는 입력 필드에 입력될 수 있는 적어도 하나의 값에 대응하는 음성 키워드를 나타내는 텍스트를 표시할 수 있다.

예를 들어, 도 11b를 참조하면, 디바이스(1000)는 옵션 선택 필드에 입력될 수 있는 적어도 하나의 값으로써, "01_F1XKY00132_WHT", "02_F1XKX0102_BLK", "03_F1XKZ5311_BLK" 및 "04_F1XKZ5312_GRY"를 디스플레이할 수 있다.

이 경우, 디바이스(1000)는 적어도 하나의 값에 대응하는 음성 키워드(1112 내지 1118)를 나타내는 텍스트를 표시할 수 있다. 예를 들어, "01_F1XKY00132_WHT"에 대응하는 음성 키워드로써 "01"을 나타내는 텍스트(1112)를 표시하고, "02_F1XKX0102_BLK"에 대응하는 음성 키워드로써 "02"를 나타내는 텍스트(1114)를 표시할 수 있다.

적어도 하나의 음성 키워드(1112 내지 1118)들 중 하나의 음성 키워드를 나타내는 음성 입력을 수신함에 따라, 디바이스(1000)는 수신된 음성 키워드에 대응하는 값을 입력 필드의 입력값으로써 결정할 수 있다.

예를 들어, "02"라는 음성 키워드(1114)를 나타내는 음성 입력을 수신함에 따라, 디바이스(1000)는 "02"에 대응하는 값인 "02_F1XKX0102_BLK"를 옵션 선택 필드에 대한 입력값으로써 결정할 수 있다.

또한, "02_블랙"을 나타내는 음성 입력을 수신함에 따라, 디바이스(1000)는 음성 입력으로부터 "02"라는 음성 키워드(1114)를 검출하고, 검출된 음성 키워드에 기초하여, "02_F1XKX0102_BLK"를 옵션 선택 필드에 대한 입력값으로써 결정할 수 있다.

이에 따라, 사용자는 입력 필드에 입력될 수 있는 값의 음절 전부를 발화하지 않더라도, 간단한 음성 키워드를 발화함으로써, 쉽고 빠르게 입력 필드에 대한 입력값을 설정할 수 있다.

또한, 디바이스(1000)는 어플리케이션을 제어하기 위한 음성 키워드(1121, 1123)를 디스플레이할 수 있다. 예를 들어, 디바이스(1000)는 어플리케이션의 페이지를 이동하기 위한 명령어로써 "앞으로" 및 "뒤로"라는 음성 키워드(1121, 1123)를 디스플레이하고, "앞으로"라는 음성 키워드(1121)를 수신함에 따라, 현재 디스플레이된 페이지의 이전 페이지를 디스플레이할 수 있다.

또한, 디바이스(1000)는 음성 키워드를 페이지에 기 포함된 텍스트와 구별되도록 디스플레이할 수 있다.

도 12a 및 12b는 일부 실시예에 따른, 어플리케이션의 페이지가 이동됨에 따라, 디바이스(1000)가 유도 질의를 출력하는 방법을 도시한다.

도 12 (a)를 참조하면, 디바이스(1000)는 어플리케이션의 페이지를 이동하기 위한 음성 입력을 수신할 수 있다. "앞으로"라는 음성 입력을 수신함에 따라, 디바이스(1000)는 현재 디스플레이된 페이지의 이전 페이지를 디스플레이할 수 있다.

도 12 (b)를 참조하면, 디바이스(1000)는 페이지를 이동함에 따라 이동된 페이지 내의 입력 필드에 대응하는 유도 질의를 출력할 수 있다. 예를 들어, 극장 선택 필드가 포함된 페이지로 이동됨에 따라, 디바이스(1000)는 극장 선택 필드에 대응하여 저장된 "어느 극장에서 보시겠습니까?"를 나타내는 음향 신호를 출력할 수 있다.

도 13a 및 13b는 일부 실시예에 따른, 입력 필드의 입력값을 변경하는 음성 입력을 수신함에 따라, 디바이스(1000)가 유도 질의를 출력하는 방법을 도시한다.

도 13(a)를 참조하면, 디바이스(1000)는 입력 필드의 입력값을 변경하기 위한 음성 입력을 수신할 수 있다. 예를 들어, 디바이스(1000)는 영화 예매 어플리케이션 실행 중에 "극장 변경!"이라는 극장 선택 필드의 입력값을 변경하기 위한 음성 입력을 수신할 수 있다.

디바이스(1000)는 극장 선택 필드에 대응하여 기 저장된 "극장"이라는 키워드 및 입력 필드의 입력값을 변경하는 동작에 대응하여 저장된 "변경"이라는 키워드에 기초하여, 수신된 음성 입력이 극장 선택 필드를 변경하기 위한 음성 입력임을 결정할 수 있다.

도 13(b)를 참조하면, 디바이스(1000)는 사용자가 변경하고자 하는 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

또한, 디바이스(1000)는 음향 신호 출력과 함께, 사용자가 변경하고자 하는 입력 필드를 포함하는 페이지를 디스플레이할 수 있다.

도 14a, 14b, 15a, 및 15b는 일부 실시예에 따른, 디바이스(1000)가 사용자의 선택에 따라, 입력 필드에 대한 입력값을 수신하는 방법을 전환하는 실시예를 도시한다.

도 14a를 참조하면 디바이스(1000)는, 유도 질의를 나타내는 음향 신호를 출력하고, 사용자로부터 음성 입력을 수신함으로써 어플리케이션을 제어하는 음성 모드를 실행할 수 있다. 또한, 디바이스(1000)는 음성 모드 실행 중에, 화면을 터치하는 사용자 입력을 수신할 수 있다.

도 14b를 참조하면, 디바이스(1000)는, 음성 모드 실행 중에, 화면을 터치하는 사용자 입력을 수신함에 따라, 어플리케이션의 GUI를 통해 사용자 입력을 수신함으로써 어플리케이션을 제어하는 GUI 모드를 실행할 수 있다. 이에 따라, 디바이스(1000)는 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 더 이상 출력하지 않을 수 있다.

도 15a를 참조하면, 디바이스(1000)는 GUI 모드 실행 중에, 음성 모드 실행을 요청하는 사용자 입력을 수신할 수 있다.

예를 들어, 디바이스(1000)는 "빅스비! 음성으로 실행해줘!"라는 음성 모드 실행을 요청하는 사용자 입력을 수신할 수 있다. "빅스비!"는 디바이스(1000)에게 다음에 입력될 음성을 인식할 것을 요청하기 위한 웨이크업 키워드일 수 있다. 디*牡決*j*(1000)는 음성 입력으로부터 "음성 모드 실행"이라는 키워드를 검출함에 라, GUI 모드를 음성 모드로 변경할 수 있다.

도 15b를 참조하면, 음성 모드로 변경함에 따라, 디바이스(1000)는 복수의 입력 필드 중 입력값이 설정되지 않은 적어도 하나의 입력 필드를 검출하고, 검출된 적어도 하나의 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

예를 들어, 시간 선택 필드에 대한 입력값이 설정되지 않은 경우, 디바이스(1000)는 "언제 보시겠습니까?"라는 시간 선택 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

도 16은 일부 실시예에 따른, 디바이스(1000)가 서버와 연동하여, 어플리케이션의 입력 필드에 대한 입력값을 결정하는 방법의 흐름도이다.

단계 S1610에서, 디바이스(1000)는 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다. 단계 S1620에서, 디바이스(1000)는 유도 질의에 대한 응답을 나타내는 음성 입력을 수신할 수 있다.

단계 S1630에서, 디바이스(1000)는 음성 데이터를 서버(3000)에게 전송할 수 있다.

디바이스(1000)는 수신된 음성 입력을 음성 데이터로 변환하고, 음성 데이터를 서버(3000)에게 전송함으로써, 디바이스(1000)가 직접 음성 인식을 수행하지 않고, 서버(3000)로부터 입력 필드에 대응하는 입력값을 수신할 수 있다.

또한, 디바이스(1000)는 어플리케이션의 식별 정보 및 어플리케이션의 입력 필드에 관한 정보를 서버에게 전송할 수도 있다. 입력 필드에 관한 정보는 입력 필드의 식별 정보, 입력 필드에 입력될 수 있는 적어도 하나의 값 및 입력 필드가 포함된 페이지의 식별 정보일 수 있다.

예를 들어, 어플리케이션이 영화 예매 어플리케이션인 경우, 입력 필드의 식별 정보는 "영화 선택 필드"일 수 있으며, 입력 필드에 입력될 수 있는 적어도 하나의 값은 적어도 하나의 영화명일 수 있다.

또한, 예를 들어, 어플리케이션이 인터넷 쇼핑 어플리케이션인 경우, 입력 필드의 식별 정보는 "옵션 선택 필드"일 수 있으며, 입력 필드에 입력될 수 있는 적어도 하나의 값은 입력 필드에 대응하여 기 저장된 옵션값일 수 있다.

실시예에 따라, 서버(3000)는 디바이스(1000)로부터 수신된 어플리케이션의 식별 정보에 기초하여, 서버(3000)에 기 저장된 어플리케이션의 입력 필드에 관한 정보를 획득할 수 있다.

또한, 디바이스(1000)는 현재 디스플레이된 페이지의 식별 정보 또는 현재 유도 질의가 출력된 입력 필드의 식별 정보를 서버(3000)에게 전송할 수도 있다.

단계 S1640에서, 서버(3000)는 음성 데이터에 대한 자연어 처리를 수행함으로써, 음성 데이터가 나타내는 입력값을 결정할 수 있다.

예를 들어, 디바이스(1000)로부터 "7호실 토요일 2시 2자리 예약해줘!"를 나타내는 음성 데이터를 수신함에 따라, 서버(3000)는 음성 데이터로부터 "7호실", "토요일", "2시", "2 자리" 및 "예약해줘"라는 단어를 검출할 수 있다.

서버(3000)는 디바이스(1000)로부터 수신된 어플리케이션 식별 정보에 기초하여, 현재 실행되는 어플리케이션이 영화 예매 어플리케이션임을 결정할 수 있다. 또한, 서버(3000)에는 영화 예매 어플리케이션의 입력 필드로써, 영화 선택 필드, 극장 선택 필드, 시간 선택 필드 및 좌석 선택 필드가 저장되어 있으며, 영화 선택 필드에 입력될 수 있는 값으로써 "7호실", "저스티스 리그", "7호실", 해피 데스데이" 및 "토르 라그나로크"가 저장되어 있고, 극장 선택 필드에 입력될 수 있는 값으로써 "강남 CGV", "도곡 CGV", "구로 CGV"가 저장되어 있고, 시간 선택 필드에 입력될 수 있는 값으로써 각각의 극장에서의 상영 시간이 저장되어 있고, 좌석 선택 필드에 입력될 수 있는 값으로써 "한자리", "두자리", "세자리" 등이 저장되어 있을 수 있다.

서버(3000)는 음성 데이터로부터 검출된 단어를 입력 필드에 입력될 수 있는 값들과 비교함으로써, 입력 필드의 입력값을 결정할 수 있다. 예를 들어, "범죄 도시"는 영화 선택 필드에 대응하는 값들 중 하나이므로, 디바이스(1000)는 "범죄 도시"를 영화 선택 필드의 입력값으로 결정할 수 있다. 또한, 시간 선택 필드에 대응하는 값들 중 "2시 30분"이 "2시"를 포함하고 있으므로, 디바이스(1000)는 "2시 30분"을 시간 선택 필드 대응하는 입력값으로써 결정할 수 있다. 또한, "2자리"는 좌석 선택 필드에 대응하는 값들 중 하나이므로, 디바이스(1000)는 "2자리"를 좌석 선택 필드의 입력값으로써 결정할 수 있다.

단계 S1650에서, 서버(3000)는, 음성 데이터가 나타내는 입력값을 디바이스(1000)에게 전송할 수 있다.

서버(3000)는 결정된 적어도 하나의 입력 필드의 식별 정보와 함께, 입력 필드의 입력값들을 디바이스(1000)에게 전송할 수 있다.

단계 S1660에서, 디바이스(1000)는 입력 필드에 대한 입력값을 결정할 수 있다.

디바이스(1000)는 서버(3000)로부터 수신된 적어도 하나의 입력 필드의 식별 정보 및 입력값들에 기초하여, 입력 필드에 대한 입력값을 결정할 수 있다.

도 17 및 도 18은 일부 실시예에 따른 디바이스(1000)의 블록도이다.

도 17에 도시된 바와 같이, 일부 실시예에 따른 디바이스(1000)는, 사용자 입력부(1100), 디스플레이부(1210), 음향 출력부(1220) 및 제어부(1300)를 포함할 수 있다. 그러나, 도 17에 도시된 구성 요소 모두가 디바이스(1000)의 필수 구성 요소인 것은 아니다. 도 17에 도시된 구성 요소보다 많은 구성 요소에 의해 디바이스(1000)가 구현될 수도 있고, 도 17에 도시된 구성 요소보다 적은 구성 요소에 의해 디바이스(1000)가 구현될 수도 있다.

예를 들어, 일부 실시예에 따른 디바이스(1000)는 제어부(1300)만으로 구현될 수 있으며, 사용자 입력부(1100) 및 제어부(13000)만으로 구현될 수도 있다.

또한, 예를 들어, 도 18에 도시된 바와 같이, 일부 실시예에 따른 디바이스(1000)는, 사용자 입력부(1100), 디스플레이부(1210), 음향 출력부(1220) 및 제어부(1300) 이외에 출력부(1200), 통신부(1500), 센싱부(1400), A/V 입력부(1600) 및 메모리(1700)를 더 포함할 수도 있다.

사용자 입력부(1100)는, 사용자가 디바이스(1000)를 제어하기 위한 데이터를 입력하는 수단을 의미한다. 예를 들어, 사용자 입력부(1100)에는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(접촉식 정전 용량 방식, 압력식 저항막 방식, 적외선 감지 방식, 표면 초음파 전도 방식, 적분식 장력 측정 방식, 피에조 효과 방식 등), 조그 휠, 조그 스위치 등이 있을 수 있으나 이에 한정되는 것은 아니다.

또한, 예를 들어, 사용자 입력부(1100)는, 마이크로폰(1620)을 포함할 수 있다. 도 18에는 마이크로폰(1620)이 A/V 입력부(1600)의 일부로써 도시되어 있으나, 마이크로폰(1620)이 디바이스를 제어하기 위한 음성 입력을 수신하는 경우, 마이크로폰(1620)은 사용자 입력부(1100)로써 기능할 수 있다.

사용자 입력부(1100)는, 어플리케이션의 실행을 요청하는 사용자 입력을 수신할 수 있다. 예를 들어, 터치 패드는 어플리케이션의 아이콘을 터치하는 사용자 입력을 수신할 수 있다. 또한, 예를 들어, 마이크로폰(1620)은 어플리케이션을 실행할 것을 명령하는 음성 입력을 수신할 수 있다.

또한, 마이크로폰(1620)은, 유도 질의에 대한 사용자의 응답을 수신할 수 있다. 또한, 마이크로폰(1620)은, 디바이스(1000)를 제어하기 위한 사용자의 음성 입력을 수신할 수 있다.

출력부(1200)는, 오디오 신호 또는 비디오 신호 또는 진동 신호를 출력할 수 있으며, 출력부(1200)는 디스플레이부(1210), 음향 출력부(1220), 및 진동 모터(1230)를 포함할 수 있다.

음향 출력부(1220)는 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다. 또한, 음향 출력부(1220)는 통신부(1500)로부터 수신되거나 메모리(1700)에 저장된 오디오 데이터를 출력한다. 진동 모터(1230)는 진동 신호를 출력할 수 있다.

디스플레이부(1210)는 디바이스(1000)에서 처리되는 정보를 표시 출력한다. 예를 들어, 디스플레이부(1210)는, 어플리케이션의 GUI를 디스플레이할 수 있다. *피*j*, 디스플레이부(1210)는, 어플리케이션의 아이콘을 디스플레이할 수 있다.한편, 디스플레이부(1210)와 터치패드가 레이어 구조를 이루어 터치 스크린으로 구성되는 경우, 디스플레이부(1210)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 디스플레이부(1210)는 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 전기영동 디스플레이(electrophoretic display) 중에서 적어도 하나를 포함할 수 있다.

제어부(1300)는, 통상적으로 디바이스(1000)의 전반적인 동작을 제어한다. 예를 들어, 제어부(1300)는, 메모리(1700)에 저장된 프로그램들을 실행함으로써, 사용자 입력부(1100), 출력부(1200), 센싱부(1400), 통신부(1500), A/V 입력부(1600) 등을 전반적으로 제어할 수 있다. 제어부(1300)는, 도 1 내지 도 16에 설시된 디바이스(1000)의 기능을 수행하기 위하여, 디바이스(1000)의 동작을 제어할 수 있다.

센싱부(1400)는, 지자기 센서(Magnetic sensor)(1410), 가속도 센서(Acceleration sensor)(1420), 온/습도 센서(1430), 적외선 센서(1440), 자이로스코프 센서(1450), 위치 센서(예컨대, GPS)(1460), 조도 센서(1495), 근접 센서(1480), 및 RGB 센서(illuminance sensor)(1490) 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다. 각 센서들의 기능은 그 명칭으로부터 당업자가 직관적으로 추론할 수 있으므로, 구체적인 설명은 생략하기로 한다.

통신부(1500)는, 디바이스(1000)가 외부와 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 예를 들어, 통신부(1500)는, 근거리 통신부(1510), 이동 통신부(1520), 방송 수신부(1530)를 포함할 수 있다.

근거리 통신부(short-range wireless communication unit)(151)는, 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, Ant+ 통신부 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.

이동 통신부(1520)는, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 여기에서, 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.

방송 수신부(1530)는, 방송 채널을 통하여 외부로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 구현 예에 따라서 디바이스(1000)가 방송 수신부(1530)를 포함하지 않을 수도 있다.

A/V(Audio/Video) 입력부(1600)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(1610)와 마이크로폰(1620) 등이 포함될 수 있다.

메모리(1700)는, 제어부(1300)의 처리 및 제어를 위한 프로그램을 저장할 수 있고, 디바이스(1000)로 입력되거나 디바이스(1000)로부터 출력되는 데이터를 저장할 수도 있다.

메모리(1700)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.

메모리(1700)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류할 수 있는데, 예를 들어, UI 모듈(1710), 터치 스크린 모듈(1720), 알림 모듈(1730), 이미지 필터 모듈(1740) 등으로 분류될 수 있다.

메모리(1700)는 어플리케이션의 입력 필드에 관한 정보를 저장할 수 있다. 예를 들어, 메모리(1700)는 어플리케이션의 입력 필드의 식별 정보, 입력 필드가 포함된 페이지 정보 및 입력 필드에 입력될 수 있는 값에 대한 정보를 저장할 수 있다.

UI 모듈(1710)은, 애플리케이션 별로 디바이스(1000)와 연동되는 특화된 UI, GUI 등을 제공할 수 있다. 터치 스크린 모듈(1720)은 사용자의 터치 스크린 상의 터치 제스처를 감지하고, 터치 제스처에 관한 정보를 제어부(1300)로 전달할 수 있다. 일부 실시예에 따른 터치 스크린 모듈(1720)은 터치 코드를 인식하고 분석할 수 있다. 터치 스크린 모듈(1720)은 컨트롤러를 포함하는 별도의 하드웨어로 구성될 수도 있다.

제어부(1300)는, 입력 필드의 입력값을 수신하기 위한 그래픽 사용자 인터페이스(GUI)를 포함하는 어플리케이션을 실행할 수 있다.

또한 제어부(1300)는, 어플리케이션의 실행을 요청하는 사용자 입력을 수신함에 따라, 사용자 입력이 음성 입력인지 여부에 기초하여, 음향 출력부(1220)를 통해, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

또한, 제어부(1300)는, 마이크로폰(1620)을 통해, 유도 질의에 대한 응답을 나타내는 음성 입력을 수신할 수 있다.

또한, 제어부(1300)는, 유도 질의에 대한 응답을 나타내는 음성 입력에 기초하여 입력 필드에 대한 입력값을 설정함으로써, 어플리케이션을 실행할 수 있다.

예를 들어, 제어부(1300)는, 어플리케이션의 실행을 요청하는 사용자 입력이 음성 입력인 경우, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력할 수 있다.

또한, 제어부(1300)는, 어플리케이션의 실행을 요청하는 사용자 입력이 어플리케이션의 아이콘을 통한 입력인 경우, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하지 않고, 어플리케이션의 GUI만을 디스플레이할 수 있다.

또한, 제어부(1300)는, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하는 것에 더하여, 입력 필드를 포함하는 GUI를 디스플레이하도록 디스플레이부(1210)를 제어할 수 있다.

또한, 제어부(1300)는, 어플리케이션을 실행할 것을 요청하는 음성 입력을 수신함에 따라, 복수의 페이지 중 제 1 페이지를 디스플레이하고, 제 1 페이지에 포함된 입력 필드에 대응되는 유도 질의를 나타내는 음향 신호를 출력하고, 제 1 페이지에 포함된 입력 필드의 입력값이 결정됨에 따라, 제 1 페이지 다음의 제 2 페이지를 디스플레이하고, 제 2 페이지에 포함된 입력 필드에 대응되는 유도 질의를 나타내는 음향 신호를 출력하도록 디스플레이부(1210) 및 음향 출력부(1220)를 제어할 수 있다.

또한, 제어부(1300)는, 유도 질의에 대한 응답을 나타내는 음성 입력이 복수의 입력 필드 중 입력 필드에 대한 응답 이외의, 다른 입력 필드에 대한 응답을 포함하는 경우, 음성 입력에 기초하여 다른 입력 필드에 입력값을 설정할 수 있다.

또한, 제어부(1300)는, 다른 입력 필드에 입력값을 설정함에 따라, 복수의 입력 필드 중 다른 입력 필드를 제외한 나머지 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하도록, 음향 출력부(1220)를 제어할 수 있다.

또한, 통신부(15000)는, 입력 필드의 입력값으로 선택될 수 있는 적어도 하나의 값을 외부 서버로부터 수신할 수 있다.

또한, 제어부(1300)는, 수신된 적어도 하나의 값에 기초하여, 입력 필드의 입력값을 결정할 수 있다.

또한, 제어부(1300)는, 어플리케이션을 실행할 것을 요청하는 음성 입력을 수신함에 따라, 입력 필드를 포함하는 GUI를 디스플레이하지 않고, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하도록 디스플레이부(1210) 및 음향 출력부(1220)를 제어할 수 있다.

또한, 제어부(1300)는, 복수의 입력 필드 중 적어도 하나의 필수 입력 필드를 제외한 나머지 입력 필드에 관한 유도 질의를 하지 않고, 나머지 입력 필드의 입력값을 기 설정된 디폴트값으로 설정할 수 있다.

또한, 제어부(1300)는, 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하면서, 입력 필드에 입력될 수 있는 적어도 하나의 값을 디스플레이하고, 적어도 하나의 값에 대응하는 음성 키워드를 나타내는 텍스트를 표시할 수 있다.

일부 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.

또한, 본 명세서에서, “부”는 프로세서 또는 회로와 같은 하드웨어 구성(hardware component), 및/또는 프로세서와 같은 하드웨어 구성에 의해 실행되는 소프트웨어 구성(software component)일 수 있다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims

입력 필드의 입력값을 수신하기 위한 그래픽 사용자 인터페이스(GUI)를 포함하는 어플리케이션을 실행하는 디바이스에 있어서,

음향 출력부;

상기 어플리케이션의 실행을 요청하는 사용자 입력을 수신하는 사용자 입력부; 및

상기 사용자 입력이 음성 입력인지 여부에 기초하여, 상기 음향 출력부를 통해, 상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하고, 상기 유도 질의에 대한 응답을 나타내는 음성 입력을 수신하고, 상기 유도 질의에 대한 응답을 나타내는 음성 입력에 기초하여 상기 입력 필드에 대한 입력값을 설정함으로써, 상기 어플리케이션을 실행하는 제어부를 포함하는, 디바이스.
제 1 항에 있어서,

제어부는, 상기 어플리케이션의 실행을 요청하는 사용자 입력이 음성 입력인 경우, 상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하고, 상기 어플리케이션의 아이콘을 통한 입력인 경우, 상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하지 않는, 디바이스.
제 1 항에 있어서,

상기 디바이스는 디스플레이부를 더 포함하고,

상기 제어부는, 상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하는 것에 더하여, 상기 입력 필드를 포함하는 GUI를 디스플레이하도록 상기 디스플레이부를 제어하는, 디바이스.
제 1 항에 있어서,

상기 어플리케이션은 순서에 따라 디스플레이되는 복수의 페이지로 구성되고, 상기 입력 필드는 제 1 입력 필드 및 제 2 입력 필드를 포함하고,

상기 제어부는, 상기 어플리케이션을 실행할 것을 요청하는 음성 입력을 수신함에 따라, 상기 복수의 페이지 중 제 1 페이지를 디스플레이하고, 상기 제 1 페이지에 포함된 입력 필드에 대응되는 유도 질의를 나타내는 음향 신호를 출력하고,

상기 제 1 페이지에 포함된 입력 필드의 입력값이 결정됨에 따라, 상기 제 1 페이지 다음의 제 2 페이지를 디스플레이하고, 상기 제 2 페이지에 포함된 입력 필드에 대응되는 유도 질의를 나타내는 음향 신호를 출력하는, 디바이스.
제 1 항에 있어서,

상기 GUI는 상기 입력 필드를 포함하는 복수의 입력 필드를 포함하고,

상기 제어부는, 상기 유도 질의에 대한 응답을 나타내는 음성 입력이 상기 복수의 입력 필드 중 상기 입력 필드에 대한 응답 이외의, 다른 입력 필드에 대한 응답을 포함하는 경우, 상기 음성 입력에 기초하여 상기 다른 입력 필드에 입력값을 설정하는, 디바이스.
제 5 항에 있어서,

상기 제어부는,

상기 다른 입력 필드에 입력값을 설정함에 따라, 상기 복수의 입력 필드 중 상기 다른 입력 필드를 제외한 나머지 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하도록, 상기 음향 출력부를 제어하는, 디바이스.
제 1 항에 있어서,

상기 디바이스는, 통신부를 더 포함하고,

상기 통신부는, 상기 입력 필드의 입력값으로 선택될 수 있는 적어도 하나의 값을 외부 서버로부터 수신하고,

상기 제어부는, 상기 수신된 적어도 하나의 값에 기초하여, 상기 입력 필드의 입력값을 결정하는, 디바이스.
제 1 항에 있어서,

상기 제어부는, 상기 어플리케이션을 실행할 것을 요청하는 음성 입력을 수신함에 따라, 상기 입력 필드를 포함하는 GUI를 디스플레이하지 않고, 상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하는, 디바이스.
제 1 항에 있어서,

상기 어플리케이션은 상기 입력 필드와 함께 복수의 입력 필드를 포함하고,

상기 복수의 입력 필드는 상기 어플리케이션이 수행하는 서비스를 제공받기 위해 필수적으로 필요한 입력 필드인 적어도 하나의 필수 입력 필드를 포함하고,

상기 제어부는, 상기 복수의 입력 필드 중 상기 적어도 하나의 필수 입력 필드를 제외한 나머지 입력 필드에 관한 유도 질의를 하지 않고, 나머지 입력 필드의 입력값을 기 설정된 디폴트값으로 설정하는, 디바이스.
제 1 항에 있어서,

상기 제어부는,

상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하면서, 상기 입력 필드에 입력될 수 있는 적어도 하나의 값을 디스플레이하고, 상기 적어도 하나의 값에 대응하는 음성 키워드를 나타내는 텍스트를 표시하는, 디바이스.
입력 필드의 입력값을 수신하기 위한 그래픽 사용자 인터페이스(GUI)를 포함하는 어플리케이션을 실행하는 방법에 있어서,

상기 어플리케이션의 실행을 요청하는 사용자 입력을 수신하는 단계;

상기 사용자 입력이 음성 입력인지 여부에 기초하여, 상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하는 단계;

상기 유도 질의에 대한 응답을 나타내는 음성 입력을 수신하는 단계; 및

상기 유도 질의에 대한 응답을 나타내는 음성 입력에 기초하여 상기 입력 필드에 대한 입력값을 설정함으로써, 상기 어플리케이션을 실행하는 단계를 포함하는, 방법.
제 11 항에 있어서,

상기 사용자 입력이 음성 입력인지 여부에 기초하여, 상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하는 단계는,

상기 어플리케이션의 실행을 요청하는 사용자 입력이 음성 입력인 경우, 상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하고, 상기 어플리케이션의 아이콘을 통한 입력인 경우, 상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하지 않는 단계를 포함하는, 방법.
제 11 항에 있어서,

상기 사용자 입력이 음성 입력인지 여부에 기초하여, 상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하는 단계는,

상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하는 것에 더하여, 상기 입력 필드를 포함하는 GUI를 디스플레이하는 단계를 포함하는, 방법.
제 11 항에 있어서,

상기 어플리케이션은 순서에 따라 디스플레이되는 복수의 페이지로 구성되고, 상기 입력 필드는 제 1 입력 필드 및 제 2 입력 필드를 포함하고,

상기 입력 필드에 대응하는 유도 질의를 나타내는 음향 신호를 출력하는 단계는,

상기 어플리케이션을 실행할 것을 요청하는 음성 입력을 수신함에 따라, 상기 복수의 페이지 중 제 1 페이지를 디스플레이하고, 상기 제 1 페이지에 포함된 입력 필드에 대응되는 유도 질의를 나타내는 음향 신호를 출력하는 단계; 및

상기 제 1 페이지에 포함된 입력 필드의 입력값이 결정됨에 따라, 상기 제 1 페이지 다음의 제 2 페이지를 디스플레이하고, 상기 제 2 페이지에 포함된 입력 필드에 대응되는 유도 질의를 나타내는 음향 신호를 출력하는 단계를 포함하는, 방법.
제 11 항에 있어서,

상기 GUI는 상기 입력 필드를 포함하는 복수의 입력 필드를 포함하고,

상기 유도 질의에 대한 응답을 나타내는 음성 입력에 기초하여 상기 입력 필드에 대한 입력값을 설정함으로써, 상기 어플리케이션을 실행하는 단계는,

상기 유도 질의에 대한 응답을 나타내는 음성 입력이 상기 복수의 입력 필드 중 상기 입력 필드에 대한 응답 이외의, 다른 입력 필드에 대한 응답을 포함하는 경우, 상기 음성 입력에 기초하여 상기 다른 입력 필드에 입력값을 설정하는 단계를 포함하는, 방법.