KR20190065821A

KR20190065821A - 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체

Info

Publication number: KR20190065821A
Application number: KR1020170165364A
Authority: KR
Inventors: 박귀랑
Original assignee: 삼성전자주식회사
Priority date: 2017-12-04
Filing date: 2017-12-04
Publication date: 2019-06-12
Also published as: US20210166694A1; EP3493550A1; KR102527278B1; US10957316B2; US20190172455A1

Abstract

전자 장치가 개시된다. 본 전자 장치는, 전자 장치가 위치한 공간의 크기에 대응되는 기준 음성 크기가 저장된 메모리, 마이크 및 마이크를 통해 입력된 음성의 크기와 기준 음성 크기를 비교하여 입력된 음성에 대한 음성 인식 여부를 결정하는 프로세서를 포함한다.

Description

전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체{ ELECTRONIC APPARATUS, METHOD FOR CONTROLLING THEREOF AND THE COMPUTER READABLE RECORDING MEDIUM }

본 개시는 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체에 대한 것으로, 보다 상세하게는, 음성 인식 가능한 복수의 전자 장치 중 음성 인식으로 제어할 전자 장치를 자동으로 결정하는 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체에 관한 것이다.

사람들의 생활 수준이 향상되고 각종 매체가 발전함에 따라 여러 대의 TV를 방마다 설치하는 가정이 증가하고 있다.

이때 각 TV를 제어함에 있어서, TV에 구비된 버튼을 사용자가 직접 조작하는 불편함을 해소하기 위해 다양한 원격 제어 방법을 사용해 왔다. 그러나, 여러 대의 TV가 설치된 환경에서 특정 TV를 원격 제어하는 경우에는 다음과 같은 문제점이 발생해왔다.

구체적으로, 적외선(Infrared Ray, IR) 신호를 이용하여 원격 제어하는 경우는, 송신 범위가 매우 넓으므로, 여러 대의 TV가 설치된 환경에서 특정 TV에만 신호를 선택적으로 송신하기가 어렵다. 이에 따라 리모컨의 동작범위 내에 있는 여러 대의 TV가 동시에 동작하게 되는 불편함이 있다.

그리고, 블루투스를 이용하여 원격 제어하는 경우는 여러 대의 TV에 각각 페어링된 여러 개의 블루투스 리모컨이 필요하다. 따라서 제어를 원하는 TV와 페어링된 리모컨을 찾아서 동작시켜야 하는 번거로움이 있다..

그리고, 음성 신호를 사용하는 경우는, 음성이 인식되는 모든 TV가 반응하는 문제점이 있다.

이에 따라, 여러 대의 TV 중 사용자가 원하는 TV 만을 제어하기 위한 기술의 필요성이 대두되었다.

본 개시는 상술한 필요성에 따라 안출된 것으로, 본 개시의 목적은 음성 인식 가능한 복수의 전자 장치 중 음성 인식으로 제어할 전자 장치를 자동으로 결정하는 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체를 제공하는 데 있다.

본 개시의 일 실시 예에 따른 전자 장치는, 상기 전자 장치가 위치한 공간의 크기에 대응되는 기준 음성 크기가 저장된 메모리, 마이크 및 상기 마이크를 통해 입력된 음성의 크기와 상기 기준 음성 크기를 비교하여 상기 입력된 음성에 대한 음성 인식 여부를 결정하는 프로세서를 포함한다.

이 경우, 상기 프로세서는, 상기 입력된 음성의 크기가 상기 기준 음성 크기보다 크면 상기 입력된 음성을 인식할 수 있다.

한편, 통신부를 더 포함하고, 상기 프로세서는, 상기 통신부를 통해 연결된 타 전자 장치에서도 상기 음성에 대한 음성 인식이 가능하다고 판단되면, 기설정된 우선 순위에 기초하여 상기 전자 장치의 음성 인식 수행 여부를 결정할 수 있다.

이 경우, 상기 기설정된 우선 순위는, 상기 전자 장치 및 상기 타 전자 장치의 배치 위치, 입력된 음성에 대한 인식 결과 및 사용자의 조작 중 적어도 하나에 의해 설정될 수 있다.

한편, 상기 프로세서는, 대기 모드에서 상기 마이크를 통해 음성이 입력되면, 상기 통신부를 활성화하고, 상기 마이크를 통해 입력된 음성에 대한 음성 인식을 수행하는 것으로 결정하면, 상기 전자 장치의 모든 구성이 활성화된 일반 모드로 전환하고, 상기 마이크를 통해 입력된 음성에 대한 음성 인식을 수행하지 않는 것으로 결정하면, 상기 활성화된 통신부를 비활성화할 수 있다.

한편, 상기 전자 장치가 위치한 공간의 크기를 센싱하는 센서를 더 포함할 수 있다.

한편, 상기 결정된 음성 인식 여부를 표시하는 디스플레이를 더 포함하고, 상기 프로세서는, 상기 마이크를 통해 입력된 음성에 대한 음성 인식을 수행하는 것으로 결정하면, 사용자로부터 음성 인식 수행 여부를 확인받기 위한 UI 화면을 표시하도록 상기 디스플레이를 제어할 수 있다.

이 경우, 상기 프로세서는, 상기 UI 화면을 표시한 후 기설정된 시간 이내에 상기 사용자로부터 응답이 입력되지 않으면, 상기 마이크를 통해 입력된 음성에 대한 음성 인식을 수행하지 않고, 상기 응답에 대한 정보를 상기 타 전자 장치에 전송하도록 상기 통신부를 제어할 수 있다.

한편, 센서, 통신부를 더 포함하고, 상기 프로세서는, 상기 통신부를 통해 연결된 타 전자 장치에서도 상기 음성에 대한 음성 인식이 가능하다고 판단되면, 상기 센서를 이용하여 사용자의 발화 방향을 판단하고, 상기 발화 방향에 기초하여 상기 전자 장치의 음성 인식 수행 여부를 결정할 수 있다.

한편, 상기 전자 장치가 위치한 공간의 크기를 센싱하는 센서로부터 크기 정보를 수신하기 위한 통신부를 더 포함할 수 있다.

한편, 상기 프로세서는, 상기 음성 인식이 결정된 음성이 트리거 음성이면, 상기 마이크를 통해 입력되는 후속 음성에 대해서는 상기 기준 음성 크기와 비교하지 않고 음성 인식을 수행할 수 있다.

한편, 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법은, 상기 전자 장치가 위치한 공간의 크기에 대응되는 기준 음성 크기를 저장하는 단계, 음성을 입력받는 단계 및 상기 입력된 음성의 크기와 상기 기준 음성 크기를 비교하여 입력된 음성에 대한 음성 인식 여부를 결정하는 단계를 포함할 수 있다.

이 경우, 상기 결정하는 단계는, 상기 입력된 음성의 크기가 상기 기준 음성 크기보다 크면 상기 입력된 음성을 인식할 수 있다.

한편, 상기 결정하는 단계는, 타 전자 장치에서도 상기 음성에 대한 음성 인식이 가능하다고 판단되면, 기설정된 우선 순위에 기초하여 상기 전자 장치의 음성 인식 수행 여부를 결정할 수 있다.

한편, 상기 전자 장치가 위치한 공간의 크기를 센싱하는 단계를 더 포함할 수 있다.

한편, 상기 결정하는 단계는, 타 전자 장치에서도 상기 음성에 대한 음성 인식이 가능하다고 판단되면, 사용자의 발화 방향을 판단하고, 상기 발화 방향에 기초하여 상기 전자 장치의 음성 인식 수행 여부를 결정할 수 있다.

한편, 상기 전자 장치가 위치한 공간의 크기를 센싱하는 센서로부터 크기 정보를 수신하는 단계를 더 포함할 수 있다.

한편, 상기 결정하는 단계는, 상기 음성 인식이 결정된 음성이 트리거 음성이면, 입력되는 후속 음성에 대해서는 상기 기준 음성 크기와 비교하지 않고 음성 인식을 수행할 수 있다.

한편, 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 실행하기 위한 프로그램을 포함하는 컴퓨터 판독가능 기록 매체에 있어서, 상기 제어 방법은, 상기 전자 장치가 위치한 공간의 크기에 대응되는 기준 음성 크기를 저장하는 단계, 음성을 입력받는 단계 및 상기 입력된 음성의 크기와 상기 기준 음성 크기를 비교하여 입력된 음성에 대한 음성 인식 여부를 결정하는 단계를 포함한다.

도 1은 본 개시의 일 실시 예에 따른 전자 장치의 간략한 구성을 설명하기 위한 블럭도,
도 2는 도 1의 전자 장치의 구성을 구체적으로 나타낸 블럭도,
도 3은 전자 장치가 공간의 구조를 파악하는 일 실시 예를 설명하기 위한 도면,
도 4는 전자 장치에 음성이 입력된 경우의 구동을 설명하기 위한 도면,
도 5는 음성 인식으로 제어될 전자 장치를 결정하는 일 실시 예를 설명하기 위한 도면,
도 6 내지 도 8은 음성 인식으로 제어될 전자 장치를 결정하는 다른 실시 예를 설명하기 위한 도면, 그리고,
도 9는 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 블럭도이다.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다.

본 개시의 실시 예에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 개시의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.

본 개시의 실시 예들은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 특정한 실시 형태에 대해 범위를 한정하려는 것이 아니며, 발명된 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 실시 예들을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구성되다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

본 개시의 실시 예에서 '모듈' 혹은 '부'는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 '모듈' 혹은 복수의 '부'는 특정한 하드웨어로 구현될 필요가 있는 '모듈' 혹은 '부'를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.

아래에서는 첨부한 도면을 참고하여 본 개시의 실시 예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

이하에서는 도면을 참조하여 본 개시에 대해 더욱 상세히 설명하기로 한다.

도 1은 본 개시의 일 실시 예에 따른 전자 장치의 간략한 구성을 설명하기 위한 블럭도이다.

도 1을 참조하면, 전자 장치(100)는 메모리(110), 마이크(120) 및 프로세서(130)를 포함한다.

전자 장치(100)는 PC, TV, 모바일 장치 등의 디스플레이 장치를 포함할 수 있다. 만약, 전자 장치(100)에 디스플레이가 구비되어 있지 않은 경우, 전자 장치(100)는 셋탑 박스를 포함할 수 있다.

메모리(110)는 전자 장치(100) 내의 저장 매체 및 외부 저장 매체, 예를 들어, USB 메모리를 포함한 Removable Disk, 네트워크를 통한 웹서버(Web server) 등으로 구현될 수 있다. 구체적으로, 메모리(110)는 하드 디스크, SSD, 메모리 카드, ROM, USB 메모리 등을 포함할 수 있다.

메모리(110)에는 전자 장치(100)가 위치한 공간의 구조에 대응되는 기준 음성 크기에 대한 정보가 저장될 수 있다. 여기서, 공간의 구조는 전자 장치(100)가 위치한 공간의 크기 및 형태 등을 포함할 수 있다.

이때, 기준 음성 크기는 전자 장치(100)를 설치할 때 사용자 또는 설치 기사 등에 의해 입력된 것일 수 있다. 한편, 기준 음성 크기는 센서(미도시)에 의해 감지된 공간의 구조에 기초하여 결정된 것일 수 있다.

한편, 메모리(110)에는 센서(미도시)에 의해 감지된 공간의 구조에 대한 정보가 저장될 수 있다. 구체적으로, 메모리(110)에는 감지된 전자 장치(100)가 위치한 공간의 크기 및 형태 등에 대한 정보가 저장될 수 있다. 여기서, 공간의 크기란 전자 장치(100)와 공간의 경계와의 거리를 의미할 수 있다.

그리고, 메모리(110)에는 통신부(140)를 통해 수신된 타 전자 장치의 음성에 대한 정보 또는 마이크(120)를 통해 입력된 음성에 대한 정보가 저장될 수 있다.

마이크(120)는 음성을 입력받을 수 있다. 구체적으로, 마이크(120)는 외부로부터 음성을 입력받아 전자 장치(100)에서 처리할 수 있는 음성 신호로 변환할 수 있다.

이때, 마이크(120)는 전자 장치(100)에 구비될 수 있지만, 별도의 마이크 장치가 전자 장치(100)에 연결된 형태로 구현될 수 있다. 구체적으로, 별도의 마이크는 전자 장치(100)와 유선 또는 무선으로 연결될 수 있다. 특히, 무선으로 연결되는 경우, 마이크(120)는 리모컨 또는 스마트폰 등 전자 장치(100)에 연결된 모바일 장치에 구비된 마이크일 수 있다.

프로세서(130)는 마이크(120)를 통해 입력된 음성에 대한 음성 인식 여부를 결정할 수 있다. 여기서, 음성 인식이란 마이크(120)를 통해 입력된 음성의 음향학적 신호를 단어나 문장으로 변환시키는 기술을 의미할 수 있다.

구체적으로, 프로세서(130)는 마이크(120)를 통해 입력된 음성의 크기와 메모리(110)에 저장된 기준 음성 크기를 비교하여, 마이크(120)를 통해 입력된 음성에 대한 음성 인식 여부를 결정할 수 있다.

한편, 마이크(120)가 리모컨 또는 스마트폰 등 전자 장치(100)에 연결된 모바일 장치에 구비된 마이크인 경우, 사용자가 전자 장치(100)에 연결된 모바일 장치에 구비된 마이크를 통해 입력하고자 하는 의도가 있는 것으로 판단되면, 프로세서(130)는 입력된 음성에 대한 음성 인식을 수행하는 것으로 결정할 수 있다.

예를 들어, 사용자가 전자 장치(100)와 연결된 리모컨 또는 스마트폰의 마이크 버튼을 누르고 음성을 입력하면, 프로세서(130)는 사용자가 전자 장치(100)를 조작하고자 하는 것으로 판단하고, 타 전자 장치에 우선하여 입력된 음성을 인식하는 것으로 결정할 수 있다. 즉, 사용자가 전자 장치(100)와 연결된 리모컨 또는 스마트폰의 마이크 버튼을 누르고 음성을 입력하면, 프로세서(130)는 사용자의 위치가 사용자가 제어하고자 하는 전자 장치(100)가 위치한 공간을 벗어나는 경우에도 전자 장치(100)에서 음성 인식을 수행하는 것으로 판단할 수 있다. 이와 같은 우선권을 부여할지 여부는 사용자의 설정에 의해 변경될 수 있다.

그리고, 프로세서(130)는 입력된 음성에 대한 음성 인식을 수행하는 것으로 결정하면, 입력된 음성에 대한 음성 인식을 수행할 수 있다. 그리고, 프로세서(130)는 음성 인식된 결과에 대응되는 이벤트를 수행할 수 있다. 구체적으로, 음성을 인식한 결과, 마이크(120)를 통해 입력된 음성이 제어 명령이면, 프로세서(130)는 제어 명령에 대응되는 동작을 수행할 수 있다.

한편, 프로세서(130)는 마이크(120)를 통해 기설정된 트리거 음성이 입력된 경우에만 음성 인식된 결과에 대응되는 이벤트를 수행할 수도 있다. 구체적으로, 프로세서(130)는 입력된 음성에 대한 음성 인식 수행 결과, 입력된 음성이 트리거 음성인 경우에만, 전자 장치(100)를 활성화하는 등 음성 인식 결과에 대응되는 이벤트를 수행할 수 있다.

한편, 프로세서(130)는 입력된 트리거 음성에 대한 음성 인식을 수행하는 것으로 결정하면, 이후 마이크(120)를 통해 입력되는 후속 음성에 대해서는 기준 음성 크기와의 비교 과정 없이 음성 인식을 수행할 수도 있다.

도 2는 도 1의 전자 장치의 구성을 구체적으로 나타낸 블럭도이다.

도 2를 참조하면, 전자 장치(100)는 메모리(110), 마이크(120), 프로세서(130), 통신부(140), 센서(150) 및 디스플레이(160)를 포함할 수 있다.

메모리(110) 및 마이크(120)는 도 1에 도시된 마이크(120)와 동일한 구성인 바, 중복된 설명은 생략한다.

프로세서(130)는 프로세서(130)는 RAM(131), ROM(132), CPU(133), GPU(Graphic Processing Unit)(134), 버스(135)를 포함할 수 있다. RAM(131), ROM(132), CPU(133), GPU(Graphic Processing Unit)(134) 등은 버스(135)를 통해 서로 연결될 수 있다.

CPU(133)는 메모리(110)에 액세스하여, 메모리(110)에 저장된 O/S를 이용하여 부팅을 수행한다. 그리고 메모리(110)에 저장된 각종 프로그램, 컨텐츠, 데이터 등을 이용하여 다양한 동작을 수행한다.

ROM(132)에는 시스템 부팅을 위한 명령어 세트 등이 저장된다. 턴-온 명령이 입력되어 전원이 공급되면, CPU(133)는 ROM(132)에 저장된 명령어에 따라 메모리(110)에 저장된 O/S를 RAM(131)에 복사하고, O/S를 실행시켜 시스템을 부팅시킨다. 부팅이 완료되면, CPU(133)는 메모리(110)에 저장된 각종 프로그램을 RAM(131)에 복사하고, RAM(131)에 복사된 프로그램을 실행시켜 각종 동작을 수행한다.

GPU(134)는 전자 장치(100)의 부팅이 완료되면, 디스플레이(160)에 UI를 디스플레이한다. 구체적으로는, GPU(134)는 연산부(미도시) 및 렌더링부(미도시)를 이용하여 아이콘, 이미지, 텍스트 등과 같은 다양한 객체를 포함하는 화면을 생성할 수 있다. 연산부는 화면의 레이아웃에 따라 각 객체들이 표시될 좌표값, 형태, 크기, 컬러 등과 같은 속성값을 연산한다. 렌더링부는 연산부에서 연산한 속성값에 기초하여 객체를 포함하는 다양한 레이아웃의 화면을 생성한다. 렌더링부에서 생성된 화면(또는 사용자 인터페이스 창)은 디스플레이로 제공되어, 메인 표시 영역 및 서브 표시 영역에 각각 표시된다. 한편, 이상에서는 본 개시에 따른 영상 처리 동작이 GPU(134)에 의해 수행되는 것으로 설명하였지만, 실제 구현시에는 CPU(133) 또는 GPU(134)에서 수행될 수 있다.

통신부(140)는 다양한 유형의 통신 방식에 따라 다양한 유형의 외부 기기와 통신을 수행하는 구성이다. 구체적으로, 통신부(140)는 원격 제어 장치, 외부 서버, 외부 스피커 장치, 타 전자 장치 등과 같은 외부 장치와 통신을 수행할 수 있다. 여기서, 타 전자 장치는 전자 장치(100)가 위치된 공간과는 구분된 공간에 위치된 것일 수 있다. 예를 들어, 전자 장치(100)가 거실에 위치되었다면, 타 전자 장치는 안방에 위치된 것일 수 있다. 한편, 타 전자 장치는 하나 이상일 수 있다.

이때, 통신부(140)는 마이크(120) 및 프로세서(130)만 활성화된 대기 모드에서는 비활성화 상태이다가, 마이크(120)를 통해 음성이 입력되면, 프로세서(130)의 제어에 의해 활성화될 수 있다. 이후, 전자 장치(100)가 입력된 음성에 대한 음성 인식을 수행하지 않는 것으로 결정되면, 통신부(140)는 프로세서(130)의 제어에 의해 다시 비활성화될 수 있다. 이와 같은 전자 장치(100)의 다양한 구성들의 구동에 대해서는 이하 도 4를 참조하여 자세히 설명하기로 한다.

구체적으로, 통신부(140)는 외부 장치로부터 안테나, 케이블 또는 포트와 같은 유선 방식을 통하여 영상 신호, 오디오 신호 및 입력된 음성에 대한 정보를 수신하거나, 와이파이(Wi-Fi), 블루투스와 같은 무선 방식을 통하여 영상 신호, 오디오 신호 및 기타 입력된 음성에 대한 정보를 수신할 수 있다. 여기서, 수신된 입력된 음성에 대한 정보는, 타 전자 장치에서 입력된 음성에 대한 타 전자 장치의 음성 인식 여부에 대한 정보일 수 있다. 구체적으로, 수신된 음성에 대한 정보는 타 전자 장치가 위치한 공간의 구조에 기초한 기준 음성 크기 정보, 타 전자 장치에 의해 입력된 음성의 크기 정보, 사용자의 발화 방향에 대한 정보 및 이러한 정보에 기초하여 결정된 음성 인식 여부에 대한 정보 중 적어도 하나를 포함할 수 있다.

구체적으로, 타 전자 장치 또한 전자 장치(100)에서 입력된 음성과 동일한 음성을 입력받을 수 있다(다만, 음성의 크기 등과 같이 각 전자 장치에서 입력된 음성의 특성은 다를 수 있다.). 타 전자 장치는 타 전자 장치가 위치한 공간의 구조에 기초하여 타 전자 장치에서 입력된 음성에 대한 음성 인식 여부를 판단하고, 이에 대한 정보를 전자 장치(100)에 전송할 수 있다.

또한, 통신부(140)는 타 전자 장치로부터 타 전자 장치에서 입력된 음성에 대한 정보를 수신하고, 전자 장치(100)에서 마이크(120)를 통해 입력된 음성에 대한 정보를 타 전자 장치에 전송할 수 있다. 이때, 타 전자 장치에 전송되는 정보는 전자 장치(100)가 위치한 공간의 구조에 기초한 기준 음성 크기 정보, 전자 장치(100)에 의해 입력된 음성의 크기 정보, 사용자의 발화 방향에 대한 정보 및 이러한 정보에 기초하여 결정된 음성 인식 여부에 대한 정보 중 적어도 하나를 포함할 수 있다. 이를 위해 전자 장치(100) 및 타 전자 장치는 동일한 액세스 포인트(Access Point, AP)와 연결될 수 있다. 한편, 전자 장치(100) 및 타 전자 장치는 서버와 연결될 수도 있으며, 이 경우에는 통신부(140)는 서버와 연결되며, 별도의 액세스 포인트를 통하지 않고도 연결된 서버를 통해 타 전자 장치와 정보가 공유될 수 있다.

센서(150)는 전자 장치(100)가 위치한 공간의 구조를 감지할 수 있다. 구체적으로, 센서(150)는 전자 장치(100)가 위치한 공간의 크기 및 형태 등을 감지할 수 있다. 여기서, 공간의 크기란 전자 장치(100)와 공간의 경계와의 거리를 의미할 수 있다.

센서(150)는 초음파 센서, 적외선 센서, 컬러 센서, 카메라 및 모션 센서 중 적어도 하나를 포함할 수 있다. 구체적으로, 센서(150)가 초음파 센서 또는 적외선 센서이면, 센서(150)는 전자 장치(100)에서 사방으로 방출되고 공간의 경계에서 반사되어 돌아오는 초음파 또는 적외선 신호를 감지할 수 있다. 이때, 프로세서(130)는 초음파 또는 적외선 신호의 방출 및 반사된 신호의 감지 사이의 시간을 측정하여, 전자 장치(100)가 위치한 공간의 구조를 판단할 수 있다.

한편, 센서(150)는 전자 장치(100)에 구비되지 않은 외부 센서일 수도 있으며, 전자 장치(100)는 통신부(140)를 통해 외부 센서로부터 센싱된 값 또는, 외부 센서에서 센싱된 값에 기초하여 산출된 기준 음성 크기에 대한 정보를 수신할 수 있다.

그리고, 센서(150)는 전자 장치(100) 앞에 사용자가 존재하는지 여부 또는 사용자의 발화 방향을 판단하는데 사용될 수 있다. 구체적으로, 사용자 이외의 방의 물건들은 움직임이 거의 없을 것이므로, 센서(150)가 모션 센서이면, 프로세서(130)는 움직임을 감지하여 사용자가 전자 장치(100) 앞에 위치하였는지 여부를 파악할 수 있다. 또는, 센서(150)가 카메라이면, 프로세서(130)는 공간을 촬상한 영상을 분석하여 사용자가 전자 장치(100)를 향해 음성을 발화하였는지 여부를 파악할 수 있다. 또는, 센서(150)가 초음파 센서이면, 방출되는 초음파 센서는 사용자가 발화한 음성의 파동에 의해 간섭될 것이므로, 프로세서(130)는 방출된 초음파의 진폭 및 방출된 초음파가 반사된 후 센서(150)에 의해 감지된 초음파의 진폭의 변화에 따라 사용자의 발화 방향을 판단할 수 있다.

프로세서(130)는 센서(150)에서 감지된 신호에 기초하여 전자 장치(100)가 위치한 공간의 구조를 파악할 수 있다. 이때, 프로세서(130)는 전자 장치(100)가 최초 설치된 경우 전자 장치(100)가 위치한 공간의 구조를 파악하여 이를 메모리(110)에 저장할 수 있다. 한편, 프로세서(130)는 기설정된 주기 또는 마이크(120)를 통해 음성이 입력될 때마다 전자 장치(100)가 위치한 공간의 구조를 파악할 수 있다.

한편, 프로세서(130)는 센서(150)에 의해 감지된 공간의 구조에 기초하여 기준 음성 크기를 결정할 수 있다. 이때, 기준 음성 크기는 감지된 공간의 크기에 따라 특정 데시벨(dB)로 결정될 수 있다. 한편, 기준 음성 크기는 전자 장치(100)의 설치 과정에서 설치 기사 또는 사용자에 의해 미리 입력된 값일 수도 있다.

한편, 프로세서(130)는 센서(150)에 의해 감지된 공간의 구조에 기초하여 음성 인식을 수행할지 여부를 결정할 수 있다. 구체적으로, 프로세서(130)는 마이크(120)를 통해 입력된 음성이 전자 장치(100)가 위치한 공간에서 발화된 것으로 판단되면, 입력된 음성에 대한 음성 인식을 수행할 수 있다. 예를 들어, 프로세서(130)는 마이크(120)를 통해 입력된 음성의 크기가, 공간의 크기에 대응되는 기준 음성 크기보다 크면, 전자 장치(100)가 위치한 공간에서 발화된 것으로 판단하고, 입력된 음성을 인식할 수 있다.

한편, 전자 장치(100)가 위치하는 공간의 구조에 대한 정보를 메모리(110)에 저장한 경우, 프로세서(130)는 저장된 정보를 이용하여 마이크(120)를 통해 입력된 음성에 대한 음성 인식 여부를 결정할 수 있다.

한편, 프로세서(130)는 센서(150)에 의해 감지된 공간의 구조에 기초하여 마이크(120)를 통해 입력된 음성을 오디오 처리할 수 있다. 구체적으로, 프로세서(130)는 전자 장치(100)가 위치한 공간의 크기 및 형태에 기초하여, 발화된 음성 뿐만 아니라 공간 내에서의 울림 또는 공간의 경계에서 반사된 음성 등을 고려하여 입력된 음성을 오디오 처리할 수 있다.

한편, 이상에서는 음성 크기인 소리의 세기에 기초하여 음성 인식 여부를 결정하는 것으로 기재하였으나, 실제 구현시에는 소리의 세기에 한정되지 않고, 음성의 다양한 특징을 더 고려하여 음성 인식 여부를 결정하는 기준을 설정할 수 있다. 구체적으로, 프로세서(130)는 소리의 세기를 나타내는 음성의 진폭 이외에도 음성의 파형, 진동수 등을 이용하여 음성 인식 여부를 결정할 수 있다.

프로세서(130)는 통신부(140)에 의해 수신된 타 전자 장치의 정보를 더 고려하여 마이크(120)에 의해 입력된 음성에 대한 음성 인식 여부를 결정할 수 있다. 구체적으로, 전자 장치(100) 및 타 전자 장치 중 어느 하나만 음성 인식을 수행하는 것으로 결정된 경우에는 문제가 없지만, 2 이상의 전자 장치에서 음성 인식을 수행하는 것으로 결정된 경우에는 하나의 전자 장치를 결정하는 추가적인 동작이 필요할 수 있다. 예를 들어, 동일한 음성에 대하여, 마이크(120)를 통해 입력된 음성의 크기가 전자 장치(100)의 기준 음성 크기보다 크고, 타 전자 장치를 통해 입력된 음성의 크기가 타 전자 장치의 기준 음성 크기보다 커서, 전자 장치(100) 및 타 전자 장치 모두 음성 인식이 가능한 경우일 수 있다.

이때, 전자 장치(100) 및 타 전자 장치 모두 음성 인식이 가능하면, 프로세서(130)는 기설정된 우선 순위에 기초하여 음성 인식 결과에 대한 처리 여부를 결정할 수 있다. 구체적으로, 전자 장치(100) 및 타 전자 장치 모두 음성 인식이 가능하고, 전자 장치(100)가 우선 순위를 가지면, 프로세서(130)는 음성 인식 결과에 따라 대응되는 이벤트를 수행할 수 있다. 이때, 타 전자 장치는 입력된 음성에 대한 음성 인식 자체를 수행하지 않거나, 음성 인식은 수행하였으나, 인식 결과에 따른 동작은 수행하지 않을 수 있다.

한편, 전자 장치(100) 및 타 전자 장치 모두 음성 인식이 가능하고, 타 전자 장치(100)가 우선 순위를 가지는 경우에는, 프로세서(130)는 입력된 음성 인식 자체를 수행하지 않거나, 입력된 음성에 대한 음성 인식은 수행하지만, 인식 결과에 따른 처리는 수행하지 않을 수 있다.

이때, 기설정된 우선 순위는 전자 장치(100) 및 타 전자 장치의 배치 위치, 입력된 음성에 대한 인식 결과 및 사용자의 조작 중 적어도 하나일 수 있다. 구체적으로, 일반적인 음성 제어 명령인 경우 방에 있는 전자 장치보다는 거실에 있는 전자 장치가 우선 순위를 가질 수 있다. 한편, 음악 재생 관련 음성 명령인 경우에는 스피커의 성능이 더 좋은 전자 장치가 우선 순위를 가질 수 있다. 한편, 영상 재생 관련 음성 명령인 경우에는 화면의 크기가 더 크거나 해상도가 더 좋은 전자 장치가 우선 순위를 가질 수 있다. 한편, 사용자가 미리 우선 순위를 갖도록 설정한 전자 장치가 음성 인식 결과에 대한 처리를 수행할 수 있다.

한편, 전자 장치(100) 및 타 전자 장치 모두 음성 인식이 가능하면, 프로세서(130)는 사용자의 발화 방향에 기초하여 음성 인식 결과에 대한 처리 여부를 결정할 수 있다. 구체적으로, 전자 장치(100) 및 타 전자 장치 모두 음성 인식이 가능하면, 프로세서(130)는 센서(150)에 의해 사용자의 발화 방향을 판단할 수 있다. 여기서, 센서(150)는 카메라, 초음파 센서, 적외선 센서, 컬러 센서 및 모션 센서 중 적어도 하나일 수 있다.

그리고, 프로세서(130)는 사용자의 발화 방향이 전자 장치(100)를 향하는 것으로 판단되면, 마이크(120)를 통해 입력된 음성에 대한 음성 인식을 수행할 수 있다.

한편, 대기 모드에서 마이크(120)를 통한 음성 입력에 따라 통신부(140)만 활성화된 상태에서, 입력된 음성에 대한 음성 인식을 수행하는 것으로 결정되면, 프로세서(130)는 전자 장치(100)의 모든 구성을 활성화하는 일반 모드로 전환할 수 있다. 한편, 대기 모드에서 마이크(120)를 통한 음성 입력에 따라 통신부(140)만 활성화된 상태에서, 입력된 음성에 대한 음성 인식을 수행하지 않는 것으로 결정되면, 프로세서(130)는 활성화된 통신부(140)를 다시 비활성화하여 대기 모드로 진입할 수 있다.

디스플레이(160)는 마이크(120)를 통해 입력된 음성에 대하여 결정된 음성 인식 여부를 표시할 수 있다. 구체적으로, 디스플레이(160)는 마이크(120)를 통해 입력된 음성에 대한 음성 인식을 수행하는 것으로 결정되면, 프로세서(130)의 제어에 의해 사용자로부터 음성 인식 수행 여부를 확인받기 위한 UI 화면을 표시할 수 있다. 이때, 음성 인식 수행 여부를 확인받는다는 것은, 음성 명령으로 제어할 전자 장치가 UI 화면을 표시한 전자 장치(100)인지 확인받는 것과 동일한 의미일 수 있다.

이때, 디스플레이(160)는 LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes) 디스플레이, PDP(Plasma Display Panel) 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 디스플레이 내에는 a-si TFT, LTPS(low temperature poly silicon) TFT, OTFT(organic TFT) 등과 같은 형태로 구현될 수 있는 구동 회로, 백라이트 유닛 등도 함께 포함될 수 있다. 또한, 디스플레이는 플렉서블 디스플레이로 구현될 수도 있다.

한편, 음성 인식 수행 여부를 확인받기 위한 UI 화면을 표시한 후, 기설정된 시간 이내에 사용자로부터 응답이 입력되지 않으면, 프로세서(130)는 입력된 음성에 대한 음성 인식을 수행하지 않거나, 음성 인식을 수행하였더라도 인식 결과에 대응되는 동작은 수행하지 않을 수 있다. 구체적으로, 프로세서(130)는 사용자로부터 응답이 입력되지 않으면, 우선 순위 등에도 불구하고 사용자가 음성 명령을 제어하고자 하는 전자 장치가 UI 화면을 표시한 전자 장치(100)가 아닌 것으로 판단할 수 있다.

이에 따라, 프로세서(130)는 사용자로부터 응답에 대한 정보를 타 전자 장치로 전송하도록 통신부(140)를 제어할 수 있다. 이에 따라, 사용자가 음성 명령으로 제어하고자 하는 전자 장치와 우선 순위를 갖는 전자 장치가 일치하지 않더라도, 사용자가 음성 명령으로 제어하고자 하는 전자 장치를 결정할 수 있다.

한편, 이상에서는 디스플레이(160)가 필수적인 구성인 것으로 기재되어 있으나, 전자 장치(100)가 셋탑 박스 등 신호 처리만 수행하는 경우에는 디스플레이(160)는 생략될 수 있으며, 프로세서(130)는 UI 화면을 외부 디스플레이 장치가 표시하도록 UI 화면에 대한 정보를 외부 디스플레이 장치에 전송할 수 있다.

상술한 바와 같이 본 개시의 다양한 실시 예에 따르면, 복수의 전자 장치가 설치된 환경에서 별도의 설정 없이 사용자가 음성 명령으로 제어하고자 하는 전자 장치를 결정할 수 있다. 이와 같이 음성 명령으로 제어될 전자 장치가 자동으로 결정되는 바, 사용자의 편의가 크게 향상될 수 있다.

도 3은 전자 장치가 공간의 구조를 파악하는 일 실시 예를 설명하기 위한 도면이다.

도 3을 참조하면, 제1 전자 장치(100-1)는 제1 공간(31)에 위치하고, 제2 전자 장치(100-2)는 제1 공간(31)과 구분되는 제2 공간(32)에 위치하고 있다. 이때, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 TV와 같은 디스플레이 장치일 수 있으며, 디스플레이를 포함하지 않은 셋탑 박스일 수 있다. 이하에서는 설명의 편의를 위하여 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)가 TV인 것으로 가정하고 설명하기로 한다.

우선, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 각각이 위치하는 제1 공간(31) 및 제2 공간(32)에 대한 구조를 감지할 수 있다. 구체적으로, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2) 각각에 구비된 센서를 이용할 수 있다. 이때, 센서는 초음파 센서, 적외선 센서, 카메라, 컬러 센서, 모션 센서 등일 수 있다.

구체적으로, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 센서를 이용하여 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)와 제1 공간(31) 및 제2 공간(32)의 경계와의 거리를 측정하고, 제1 공간(31) 및 제2 공간(32)의 형태를 파악할 수 있다.

그리고, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 감지된 결과를 각각 구비된 메모리에 저장하고, 음성이 입력되면, 음성 인식 여부를 결정할 때 사용할 수 있다.

도 4는 전자 장치에 대기 모드일 때, 음성이 입력된 경우의 구동을 설명하기 위한 도면이다.

도 4a는 전자 장치(100)가 대기 모드일 때, 도 4b는 전자 장치(100)가 대기 모드인 상태에서 음성이 입력될 때, 도 4c는 전자 장치(100)가 일반 모드일 때의 구동을 설명하기 위한 도면이다.

구체적으로, 도 4a 내지 도 4c를 참조하면, 전자 장치(100)는 마이크(120), 프로세서(130), 통신부(140) 및 나머지 구성(101)을 포함할 수 있다. 여기서, 나머지 구성(101)은 설명의 편의를 위하여 도입한 용어로, 전자 장치(100)를 구성하는 모든 구성 중 마이크(120), 프로세서(130), 통신부(140)를 제외한 구성을 의미하는 것일 수 있다.

도 4a를 참조하면, 전자 장치(100)가 대기 모드일 때에는 마이크(120) 및 프로세서(130)만 활성화되어 있고, 통신부(140) 및 나머지 구성(101)은 비활성화 상태일 수 있다.

이때, 도 4b에 도시된 바와 같이, 전자 장치(100)가 대기 모드인 상태에서 마이크(120)를 통해 음성이 입력되면, 프로세서(130)는 통신부(140)를 활성화시킬 수 있다. 이는 타 전자 장치와 정보를 송수신하기 위함이다. 한편, 대기 모드에서 음성이 입력되어도 나머지 구성(101)은 여전히 비활성화 상태일 수 있다.

한편, 프로세서(130)가 마이크(120)를 통해 입력된 음성에 대해 음성 인식 여부를 결정하고, 음성 인식 결과에 따른 처리를 수행하는 것으로 결정하면, 도 4c에 도시된 바와 같이, 전자 장치(100)의 나머지 구성(101)도 활성화되어 모든 구성이 활성화되는 일반 모드로 전환될 수 있다.

한편, 도 4에 도시되지는 않았지만, 마이크(120)를 통해 입력된 음성에 대해 음성 인식 여부를 결정하기 위해 나머지 구성(101) 중 센서가 활성화될 수 있다. 또한, 프로세서(130)가 마이크(120)를 통해 입력된 음성에 대해 음성 인식을 수행하는 것으로 결정한 경우, 일반 모드로 진입하기 전에 사용자로부터 음성 인식 수행 여부를 확인받기 위한 UI 화면을 표시하기 위해 나머지 구성(101) 중 디스플레이가 활성화될 수 있다.

한편, 프로세서(130)가 마이크(120)를 통해 입력된 음성에 대해 음성 인식을 수행하지 않는 것으로 결정한 경우, 통신부(140)가 비활성화되어, 전자 장치(100)는 도 4a에 도시된 바와 같이 대기 모드로 다시 진입할 수 있다.

상술한 바와 같이, 음성 인식 여부 및 음성 인식 결과에 대한 처리 여부를 결정함으로써, 사용자가 음성 명령으로 제어하기 원하는 전자 장치만 음성에 대하여 반응하는 바, 사용자의 편의가 크게 향상될 수 있다.

또한, 음성 인식 여부 결정 및 음성 인식 결과에 대한 처리 여부에 대한 결정에 따라 순차적으로 구성이 활성화되는 바, 소모되는 전력이 절약될 수 있다.

도 5는 음성 인식으로 제어될 전자 장치를 결정하는 일 실시 예를 설명하기 위한 도면이다.

도 5를 참조하면, 제1 전자 장치(100-1)는 제1 공간(31)에 위치하고, 제2 전자 장치(100-2)는 제1 공간(31)과 구분되는 제2 공간(32)에 위치하고 있다. 이때, 사용자(10)는 제1 전자 장치(100-1)가 위치한 제1 공간(31)에 위치하고 있으나, 제2 공간(32)에 위치한 제2 전자 장치(100-2)를 음성으로 제어하고자 할 수 있다.

이때, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 각각 사용자(10)의 발화 방향을 판단하여, 사용자(10)의 음성에 따라 제어를 수행할지 여부에 대해 결정할 수 있다.

구체적으로, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2) 각각은 구비된 센서를 이용하여 사용자의 발화 방향을 판단할 수 있다. 예를 들어, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)가 각각 센서로서 카메라를 구비한 경우, 사용자(10)가 음성을 발화하였을 때, 전방 영상을 촬상할 수 있다. 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 각각 촬상된 전방 영상을 분석하여, 사용자(10)가 바라보고 있는 방향을 판단할 수 있다. 이와 같이 사용자(10)가 바라보고 있는 방향을 판단함에 기초하여, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 사용자(10)가 발화한 방향을 판단할 수 있다.

한편, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)가 각각 센서로서 초음파 센서를 구비한 경우, 기설정된 주기로 기설정된 진폭의 크기를 갖는 초음파를 사방으로 방출할 수 있다. 이때, 사용자(10)의 음성과 방출된 초음파는 간섭이 일어날 것이다. 따라서, 반사되어 돌아오는 초음파를 감지하는 제1 전자 장치(100-1) 및 제2 전자 장치(100-2) 중 방출된 초음파의 진폭의 크기와 상이한 진폭을 갖는 초음파를 감지한 전자 장치는 사용자(10)가 자신을 바라보고 있는 것으로 판단하고, 음성 인식을 수행할 수 있다.

상술한 바와 같이, 전자 장치가 위치한 공간의 구조 뿐만 아니라, 사용자의 발화 방향에 기초하여 음성 인식 수행 여부를 결정함으로써, 사용자가 음성으로 제어하고자 하는 전자 장치를 보다 정확하게 결정할 수 있다.

도 6 내지 도 8은 음성 인식으로 제어될 전자 장치를 결정하는 다른 실시 예를 설명하기 위한 도면이다.

도 6은 감지된 공간의 구조에 따라 기준 음성 크기를 결정하는 실시 예를 도시한 것이다.

도 6을 참조하면, 제1 전자 장치(100-1)는 제1 전자 장치(100-1)가 위치한 제1 공간(31)의 구조를 감지하고, 감지된 제1 공간(31)의 구조에 기초하여 기준 음성 크기를 결정할 수 있다. 구체적으로, 제1 전자 장치(100-1)는 제1 공간(31)의 크기에 기초하여 기준 음성 크기를 결정할 수 있다. 이때, 기준 음성 크기는 제1 공간(31) 내에서 발생한 음성인 것으로 판단하기 위한 기준이 되는 음성 크기일 수 있다. 그리고, 제1 전자 장치(100-1)는 결정된 기준 음성 크기에 기초하여 음성 인식 가능한 영역(61)을 설정할 수 있다.

도 6에서는 제1 공간(31) 중 제1 전자 장치(100-1)와 가장 멀리 떨어진 지점을 기준으로 기준 음성 크기를 결정하여, 제1 전자 장치(100-1)에서 음성 인식 가능한 영역(61)에 제1 공간(31) 및 제1 공간(31)을 넘어선 공간도 포함될 수 있다. 그러나 이에 한정되지 않고, 다양한 기준으로 기준 음성 크기를 결정하여, 음성 인식 가능한 영역의 크기를 조정할 수 있다.

그리고, 상술한 제1 전자 장치(100-1)와 동일한 동작으로, 제2 전자 장치(100-2)는 제2 전자 장치(100-2)가 위치한 제2 공간(32)의 구조를 감지하고, 감지된 제2 공간(32)의 구조에 기초하여 기준 음성 크기를 결정할 수 있다. 구체적으로, 제2 전자 장치(100-2)는 제2 공간(32)의 크기에 기초하여 기준 음성 크기를 결정할 수 있다. 이때, 기준 음성 크기는 제2 공간(32) 내에서 발생한 음성인 것으로 판단하기 위한 기준이 되는 음성 크기일 수 있다. 그리고, 제2 전자 장치(100-2)는 결정된 기준 음성 크기에 기초하여 음성 인식 가능한 영역(62)을 설정할 수 있다.

도 6에서는 제2 공간(32) 중 제2 전자 장치(100-2)와 가장 멀리 떨어진 지점을 기준으로 기준 음성 크기를 결정하여, 제2 전자 장치(100-2)에서 음성 인식 가능한 영역(62)에 제1 공간(32) 및 제2 공간(32)을 넘어선 공간도 포함될 수 있다. 그러나 이에 한정되지 않고, 다양한 기준으로 기준 음성 크기를 결정하여, 음성 인식 가능한 영역의 크기를 조정할 수 있다.

이때, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 음성 인식 가능한 영역에 대한 정보를 서로 공유할 수 있다. 구체적으로, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 기준 음성 크기에 대한 정보를 공유할 수 있다.

한편, 제1 전자 장치(100-1)에서 음성 인식이 가능한 영역(61) 및 제2 전자 장치(100-2)에서 음성 인식이 가능한 영역(62)이 중첩되는 영역(63)이 존재할 수 있다. 만약 사용자가 중첩되는 영역(63)에서 음성을 발화하면, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2) 모두 음성 인식을 수행할 수 있게 된다. 이에 대해서는 이하 도 8을 참조하여 자세히 설명하기로 한다.

도 7은 도 6에 도시된 바와 같이, 제1 전자 장치(100-1)에서 음성 인식이 가능한 영역(61) 및 제2 전자 장치(100-2)에서 음성 인식이 가능한 영역(62)이 설정된 경우 음성 인식을 수행할 전자 장치를 결정하는 일 실시 예를 도시한 것이다.

이때, 제1 전자 장치(100-1)에서 음성 인식이 가능한 영역(61)은 제1 전자 장치(100-1)가 위치한 제1 공간(31)의 구조에 기초하여 결정되고, 제2 전자 장치(100-2)에서 음성 인식이 가능한 영역(62)은 제2 전자 장치(100-2)가 위치한 제2 공간(32)의 구조에 기초하여 결정될 수 있다.

도 7을 참조하면, 사용자(10)는 제1 전자 장치(100-1)에서 음성 인식이 가능한 영역(61) 내이지만, 제2 전자 장치(100-2)에서 음성 인식이 가능한 영역(62)은 벗어난 영역에서 발화할 수 있다. 구체적으로, 사용자(10)가 제1 전자 장치(100-1)에서 음성 인식이 가능한 영역(61) 내에서 발화하였다는 것은, 사용자(10)가 발화한 음성의 크기가 제1 전자 장치(100-1)에서 결정된 기준 음성 크기보다 크다는 것을 의미할 수 있다. 이때, 제1 전자 장치(100-1)는 입력된 사용자(10)의 음성에 대하여 음성 인식을 수행하는 것으로 판단할 수 있다.

한편, 사용자(10)가 제2 전자 장치(100-2)에서 음성 인식이 가능한 영역(62)을 벗어나는 영역에서 발화하였다는 것은, 사용자(10)가 발화한 음성의 크기가 제2 전자 장치(100-2)에서 결정된 기준 음성 크기보다 작다는 것을 의미할 수 있다. 이때, 제2 전자 장치(100-2)는 사용자(10)의 음성이 입력되어도 입력된 사용자(10)의 음성에 대하여 음성 인식을 수행하지 않는 것으로 판단할 수 있다.

이때, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 음성 인식 여부 결정에 대한 결과를 서로 공유할 수 있다.

한편, 제1 전자 장치(100-1)는 입력된 사용자(10)의 음성에 대하여 음성 인식을 수행하는 것으로 판단하고, 판단 결과에 대해 사용자에게 확인받기 위한 UI 화면을 표시할 수 있다. 이때, 사용자가 제1 전자 장치(100-1)를 음성으로 제어할 것임을 확인하면, 제1 전자 장치(100-1)는 사용자(10)가 발화한 음성을 인식하여, 인식 결과에 대응되는 이벤트를 수행할 수 있다.

한편, UI 화면을 표시한 후 기설정된 시간 동안 사용자(10)의 응답이 없으면, 제1 전자 장치(100-1)는 사용자(10)의 음성에 대한 음성 인식을 수행하지 않고, 응답이 없었다는 정보를 제2 전자 장치(100-2)에 전송하여 제2 전자 장치(100-2)가 음성 인식 수행 여부를 사용자에게 확인받기 위한 UI를 표시하게 할 수 있다.

이에 따라, 음성 인식 수행할 것으로 결정된 전자 장치와 사용자(10)가 음성으로 제어하고자 하는 전자 장치가 일치하지 않더라도, 사용자(10)가 음성 인식으로 제어하고자 하는 전자 장치를 다시 결정할 수 있어, 사용자의 편의가 향상될 수 있다.

한편, 도 8을 참조하면, 사용자(10)는 제1 전자 장치(100-1)에서 음성 인식이 가능한 영역 및 제2 전자 장치(100-2)에서 음성 인식이 가능한 영역이 중첩되는 영역(63)에서 발화할 수 있다. 구체적으로, 사용자(10)가 중첩되는 영역(63)에서 발화하였다는 것은, 사용자(10)가 발화한 음성의 크기가 제1 전자 장치(100-1)에서 결정된 기준 음성 크기 및 제2 전자 장치(100-2)에서 결정된 기준 음성 크기보다 크다는 것을 의미할 수 있다.

이와 같이, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2) 모두 음성 인식이 가능하면, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 각각 기설정된 우선 순위에 따라 음성 인식 여부 또는 음성 인식 결과에 따른 처리 여부를 결정할 수 있다.

이때, 기설정된 우선 순위는 제1 전자 장치(100-1) 및 제2 전자 장치(200-2)의 배치 위치, 입력된 음성에 대한 인식 결과 및 사용자의 조작 중 적어도 하나일 수 있다. 구체적으로, 일반적인 음성 제어 명령인 경우 방에 있는 전자 장치보다는 거실에 있는 전자 장치가 우선 순위를 가질 수 있다. 한편, 음악 재생 관련 음성 명령인 경우에는 스피커의 성능이 더 좋은 전자 장치가 우선 순위를 가질 수 있다. 한편, 영상 재생 관련 음성 명령인 경우에는 화면의 크기가 더 크거나 해상도가 더 좋은 전자 장치가 우선 순위를 가질 수 있다. 한편, 사용자가 미리 우선 순위를 갖도록 설정한 전자 장치가 음성 인식 결과에 대한 처리를 수행할 수 있다.

한편, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2) 모두 음성 인식이 가능하면, 제1 전자 장치(100-1) 및 제2 전자 장치(100-2)는 사용자(10)의 발화 방향에 따라 음성 인식 여부 또는 음성 인식 결과에 따른 처리 여부를 결정할 수 있다.

사용자(10)의 발화 방향을 판단하는 내용은 도 5에 대한 설명에 기재되었는 바, 중복된 내용은 생략하기로 한다.

한편, 도 3, 도 5 내지 도 8에서는 두 대의 전자 장치만을 도시하여 설명하였으나, 전자 장치가 세 대 이상인 경우에도 본 명세서에 기재된 기술이 적용 가능함은 물론이다.

도 9는 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 블럭도이다.

도 9를 참조하면, 우선 전자 장치는 공간의 구조를 감지할 수 있다(S910). 이때, 감지되는 공간의 구조는 전자 장치가 위치한 공간의 구조일 수 있다. 그리고, 전자 장치는 감지된 공간의 구조에 대한 정보를 저장할 수 있다.

그 다음, 전자 장치는 음성을 입력받을 수 있다(S920). 구체적으로, 전자 장치는 구비된 마이크를 통해 사용자가 발화하는 음성을 입력받을 수 있다. 이때, 전자 대기 모드인 상태에서 음성을 입력받은 경우, 전자 장치는 타 전자 장치와 통신을 수행하기 위한 통신부를 활성화할 수 있다.

그 다음, 전자 장치는 음성 인식 여부를 결정할 수 있다(S930). 구체적으로, 전자 장치는 감지된 공간의 구조에 기초하여, 마이크를 통해 입력된 음성에 대한 음성 인식 여부를 결정할 수 있다. 구체적으로, 전자 장치는 감지된 공간의 구조에 기초하여 기준 음성 크기를 결정하고, 마이크를 통해 입력된 음성의 크기가 기준 음성 크기보다 크면 입력된 음성에 대한 음성 인식을 수행하는 것으로 결정할 수 있다.

이때, 전자 장치는 활성화된 통신부를 통해 타 전자 장치로부터 타 전자 장치에서 입력된 음성에 대한 정보를 수신하고, 수신된 음성에 대한 정보를 더 고려하여 음성 인식 여부를 결정할 수 있다. 구체적으로, 전자 장치 및 타 전자 장치 모두 입력된 음성에 대한 음성 인식이 가능한 것으로 판단되면, 기설정된 우선 순위 또는 사용자의 발화 방향에 기초하여, 사용자가 음성으로 제어할 전자 장치가 결정될 수 있다.

한편, 마이크를 통해 입력된 음성의 크기가 기준 음성 크기보다 작으면, 전자 장치는 입력된 음성에 대한 음성 인식은 수행하지 않는 것으로 결정할 수 있다. 이와 같이, 음성 인식을 수행하지 않는 것으로 결정되면, 전자 장치는 활성화되었던 통신부를 다시 비활성화하여 대기 모드로 진입할 수 있다.

한편, 이상에서 설명된 다양한 실시 예들은 소프트웨어(software), 하드웨어(hardware) 또는 이들의 조합된 것을 이용하여 컴퓨터(computer) 또는 이와 유사한 장치로 읽을 수 있는 기록 매체 내에서 구현될 수 있다. 하드웨어적인 구현에 의하면, 본 개시에서 설명되는 실시 예들은 ASICs(Application Specific Integrated Circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛(unit) 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시 예들이 프로세서 자체로 구현될 수 있다. 소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시 예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다.

한편, 상술한 본 개시의 다양한 실시 예들에 따른 전자 장치의 제어 방법은 비일시적 판독 가능 매체(non-transitory readable medium) 에 저장될 수 있다. 이러한 비일시적 판독 가능 매체는 다양한 장치에 탑재되어 사용될 수 있다.

비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 방법을 수행하기 위한 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.

또한, 이상에서는 본 개시의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 개시는 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 개시의 요지를 벗어남이 없이 당해 개시가 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 개시의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.

100 : 전자 장치 110 : 메모리
120 : 마이크 130 : 프로세서

Claims

전자 장치에 있어서,
상기 전자 장치가 위치한 공간의 크기에 대응되는 기준 음성 크기가 저장된 메모리;
마이크; 및
상기 마이크를 통해 입력된 음성의 크기와 상기 기준 음성 크기를 비교하여 상기 입력된 음성에 대한 음성 인식 여부를 결정하는 프로세서;를 포함하는 전자 장치.
제1항에 있어서,
상기 프로세서는,
상기 입력된 음성의 크기가 상기 기준 음성 크기보다 크면 상기 입력된 음성을 인식하는 전자 장치.
제1항에 있어서,
통신부;를 더 포함하고,
상기 프로세서는,
상기 통신부를 통해 연결된 타 전자 장치에서도 상기 음성에 대한 음성 인식이 가능하다고 판단되면, 기설정된 우선 순위에 기초하여 상기 전자 장치의 음성 인식 수행 여부를 결정하는 전자 장치.
제3항에 있어서,
상기 기설정된 우선 순위는,
상기 전자 장치 및 상기 타 전자 장치의 배치 위치, 입력된 음성에 대한 인식 결과 및 사용자의 조작 중 적어도 하나에 의해 설정되는 전자 장치.
제3항에 있어서,
상기 프로세서는,
대기 모드에서 상기 마이크를 통해 음성이 입력되면, 상기 통신부를 활성화하고, 상기 마이크를 통해 입력된 음성에 대한 음성 인식을 수행하는 것으로 결정하면, 상기 전자 장치의 모든 구성이 활성화된 일반 모드로 전환하고, 상기 마이크를 통해 입력된 음성에 대한 음성 인식을 수행하지 않는 것으로 결정하면, 상기 활성화된 통신부를 비활성화하는 전자 장치.
제3항에 있어서,
상기 전자 장치가 위치한 공간의 크기를 센싱하는 센서;를 더 포함하는 전자 장치.
제3항에 있어서,
상기 결정된 음성 인식 여부를 표시하는 디스플레이;를 더 포함하고,
상기 프로세서는,
상기 마이크를 통해 입력된 음성에 대한 음성 인식을 수행하는 것으로 결정하면, 사용자로부터 음성 인식 수행 여부를 확인받기 위한 UI 화면을 표시하도록 상기 디스플레이를 제어하는 전자 장치.
제7항에 있어서,
상기 프로세서는,
상기 UI 화면을 표시한 후 기설정된 시간 이내에 상기 사용자로부터 응답이 입력되지 않으면, 상기 마이크를 통해 입력된 음성에 대한 음성 인식을 수행하지 않고, 상기 응답에 대한 정보를 상기 타 전자 장치에 전송하도록 상기 통신부를 제어하는 전자 장치.
제1항에 있어서,
센서;
통신부;를 더 포함하고,
상기 프로세서는,
상기 통신부를 통해 연결된 타 전자 장치에서도 상기 음성에 대한 음성 인식이 가능하다고 판단되면, 상기 센서를 이용하여 사용자의 발화 방향을 판단하고, 상기 발화 방향에 기초하여 상기 전자 장치의 음성 인식 수행 여부를 결정하는 전자 장치.
제1항에 있어서,
상기 전자 장치가 위치한 공간의 크기를 센싱하는 센서로부터 크기 정보를 수신하기 위한 통신부;를 더 포함하는 전자 장치.
제1항에 있어서,
상기 프로세서는,
상기 음성 인식이 결정된 음성이 트리거 음성이면, 상기 마이크를 통해 입력되는 후속 음성에 대해서는 상기 기준 음성 크기와 비교하지 않고 음성 인식을 수행하는 전자 장치.
전자 장치의 제어 방법에 있어서,
상기 전자 장치가 위치한 공간의 크기에 대응되는 기준 음성 크기를 저장하는 단계;
음성을 입력받는 단계; 및
상기 입력된 음성의 크기와 상기 기준 음성 크기를 비교하여 입력된 음성에 대한 음성 인식 여부를 결정하는 단계;를 포함하는 전자 장치의 제어 방법.
제12항에 있어서,
상기 결정하는 단계는,
상기 입력된 음성의 크기가 상기 기준 음성 크기보다 크면 상기 입력된 음성을 인식하는 방법.
제12항에 있어서,
상기 결정하는 단계는,
타 전자 장치에서도 상기 음성에 대한 음성 인식이 가능하다고 판단되면, 기설정된 우선 순위에 기초하여 상기 전자 장치의 음성 인식 수행 여부를 결정하는 방법.
제14항에 있어서,
상기 기설정된 우선 순위는,
상기 전자 장치 및 상기 타 전자 장치의 배치 위치, 입력된 음성에 대한 인식 결과 및 사용자의 조작 중 적어도 하나에 의해 설정되는 방법.
제14항에 있어서,
상기 전자 장치가 위치한 공간의 크기를 센싱하는 단계;를 더 포함하는 방법.
제12항에 있어서,
상기 결정하는 단계는,
타 전자 장치에서도 상기 음성에 대한 음성 인식이 가능하다고 판단되면, 사용자의 발화 방향을 판단하고, 상기 발화 방향에 기초하여 상기 전자 장치의 음성 인식 수행 여부를 결정하는 방법.
제12항에 있어서,
상기 전자 장치가 위치한 공간의 크기를 센싱하는 센서로부터 크기 정보를 수신하는 단계;를 더 포함하는 방법.
제12항에 있어서,
상기 결정하는 단계는,
상기 음성 인식이 결정된 음성이 트리거 음성이면, 입력되는 후속 음성에 대해서는 상기 기준 음성 크기와 비교하지 않고 음성 인식을 수행하는 방법.
전자 장치의 제어 방법을 실행하기 위한 프로그램을 포함하는 컴퓨터 판독가능 기록 매체에 있어서,
상기 제어 방법은,
상기 전자 장치가 위치한 공간의 크기에 대응되는 기준 음성 크기를 저장하는 단계;
음성을 입력받는 단계; 및
상기 입력된 음성의 크기와 상기 기준 음성 크기를 비교하여 입력된 음성에 대한 음성 인식 여부를 결정하는 단계;를 포함하는 컴퓨터 판독가능 기록 매체.