KR101590332B1

KR101590332B1 - 영상장치 및 그 제어방법

Info

Publication number: KR101590332B1
Application number: KR1020120143590A
Authority: KR
Inventors: 배대규; 차태환; 유호정
Original assignee: 삼성전자주식회사
Priority date: 2012-01-09
Filing date: 2012-12-11
Publication date: 2016-02-18
Also published as: US10957323B2; EP2894633B1; US20150213802A1; CN105847921A; CN103198832A; US20170069323A1; EP4220632A1; US20200005790A1; IN2013DE00063A; EP2613313B1; US11763812B2; US20210158821A1; CN105847921B; US20230245653A1; AU2013200132B2; EP2613313A1; US9401149B2; KR20130083371A; JP6342118B2; US20180025728A1

Abstract

본 발명은 영상장치에서 사용자의 음성을 인식하는 경우에는 영상장치에서 출력되는 음향의 볼륨을 일정 수준으로 낮춤으로써 음성 인식 성능을 향상시키는 영상장치 및 그 제어방법을 제공한다.
이를 위해, 본 발명의 일 측면에 따른 음성인식이 가능한 영상장치는, 사용자측 음향신호를 입력받는 음성 입력부; 상기 영상장치에서 처리되는 음향신호를 출력하는 음향 출력부; 상기 음성 입력부에 입력된 사용자측 음향신호를 분석하는 음성 인식부; 및 음성인식 시작 명령이 입력된 경우 상기 음향 출력부를 통해 출력되는 음향의 크기를 미리 설정된 레벨로 낮추는 제어부를 포함한다.

Description

영상장치 및 그 제어방법{IMAGING APPARATUS AND CONTROLLING METHOD THEREOF}

본 발명은 음성인식을 통한 명령 수행이 가능한 영상장치 및 그 제어방법에 관한 것이다.

일반적으로 영상장치란 영상신호를 처리하여 다양한 형태로 출력하는 장치로서, 대표적인 영상장치로는 TV를 들 수 있다. 최근에는 기존의 아날로그 TV보다 우수한 신호 처리 및 저장 능력을 가진 디지털 TV가 개발되고 상용화되면서 각 가정에 연결되어 있는 인터넷 망을 이용하여 실시간 방송, COD(Contents on Demand), 게임, 화상 통신 등 다양한 종류의 컨텐츠 서비스를 사용자에게 제공할 수 있게 되었다.

또한, 영상장치가 상기 다양한 서비스들을 포함한 여러 기능을 수행하기 위해 사용자로부터 명령을 입력받는데 있어, 마이크를 통해 사용자의 음성을 입력받고 입력된 음성을 인식하여 대응되는 명령을 수행하는 음성인식 방식이 적용되고 있다.

그러나, 마이크를 통해 사용자의 음성이 입력될 때에 사용자의 음성 외에 다른 배경음들이 함께 입력되는 바, 특히 영상장치에서 출력되는 음향이 함께 입력될 수 있고 이 음향의 볼륨이 일정 수준을 넘어서면 영상장치에서의 사용자 음성 인식률이 떨어지게 된다.

상술한 문제를 해결하기 위하여 본 발명의 일 측면은 영상장치에서 사용자의 음성을 인식하는 경우에는 영상장치에서 출력되는 음향의 볼륨을 일정 수준으로 낮춤으로써 음성 인식 성능을 향상시키는 영상장치 및 그 제어방법을 제공하는 것을 목적으로 한다.

본 발명의 일 측면에 의한 음성인식 가능한 영상장치는 사용자측 음향신호를 입력받는 제1음성 입력부, 상기 영상장치에서 처리되는 음향신호를 출력하는 음향 출력부, 상기 음성 입력부에 입력된 사용자측 음향신호를 분석하는 제1음성 인식부; 및 음성인식 개시명령이 입력되면 상기 음향 출력부를 통해 출력되는 음향의 크기를 미리 설정된 레벨로 낮추는 제어부를 포함할 수 있다.

또한, 상기 음성인식 개시명령은 상기 제1음성 입력부를 통해 사용자의 음성신호로 입력될 수 있다.

또한, 상기 제어부는 상기 제1음성 입력부를 통하여 음성인식 개시명령어가 입력되면 상기 음성인식 개시명령이 입력된 것으로 판단할 수 있다.

또한, 상기 제어부는 상기 제1음성 입력부를 통하여 미리 설정된 음량 이상의 음성이 입력되면 상기 음성인식 개시명령이 입력된 것으로 판단할 수 있다.

상기 영상장치는 상기 제1음성 입력부를 통해 입력된 상기 사용자측 음향신호에서 상기 사용자의 음성신호 외의 배경음을 제거하는 배경음 제거부를 더 포함할 수 있다.

또한, 상기 배경음 제거부는 상기 제1음성 입력부를 통해 입력된 상기 사용자측 음향신호에서 상기 음향 출력부를 통해 출력되는 음향신호를 제거할 수 있다.

상기 영상장치에 포함된 상기 제어부는 음성인식이 종료되면 상기 음향 출력부를 통해 출력되는 음향의 크기를 음성인식 개시 시의 레벨로 복귀시킬 수 있다.

또한, 상기 제어부는 미리 정해진 음성인식 종료시간 이상 상기 제1음성 입력부를 통해 상기 사용자의 제어명령이 입력되지 않으면 상기 음성인식이 종료된 것으로 판단할 수 있다.

또한, 상기 제어부는 미리 정해진 명령요청시간 이상 상기 제1음성 입력부를 통하여 상기 사용자의 제어명령이 입력되지 않으면 상기 사용자에게 제어명령을 입력할 것을 요청할 수 있다.

또한, 상기 제어부는 상기 제1음성 입력부를 통해 음성인식 종료명령이 입력되면 상기 음성인식이 종료된 것으로 판단할 수 있다.

상기 영상장치는 상기 음성인식 개시명령에 대응되는 음성인식 개시명령어를 생성하는 명령어 생성부를 더 포함할 수 있다.

또한, 상기 명령어 생성부는 상기 제1음성 입력부를 통해 후보 명령어가 입력되면 상기 후보 명령어가 상기 음성인식 개시명령어로서 적합한지 여부를 테스트하고, 테스트 결과 상기 후보 명령어가 상기 음성인식 개시명령어로서 적합하면 상기 음성인식 개시명령어로 등록할 수 있다.

또한, 상기 명령어 생성부는 상기 등록된 음성인식 명령어가 둘 이상인 경우, 상기 사용자로부터 선택 명령을 입력받아 상기 입력된 선택 명령에 따라 상기 음성인식 개시명령어를 선택하여 설정하는 영상장치.

상기 영상장치는 상기 영상장치를 원격에서 제어하는 원격 제어기를 더 포함하되, 상기 원격 제어기는 상기 사용자의 제어명령을 입력받는 입력버튼, 상기 사용자측 음향신호를 입력받는 제2음성 입력부, 상기 제2음성 입력부에 입력된 상기 사용자측 음향신호를 분석하는 제2음성 인식부를 포함할 수 있다.

또한, 상기 제어부는 상기 제2음성 입력부를 통하여 미리 설정된 음량 이상의 음성이 입력되면 상기 음성인식 개시명령이 입력된 것으로 판단할 수 있다.

또한, 상기 제어부는 음성인식이 종료되면 상기 음향 출력부를 통해 출력되는 음향의 크기를 음성인식 개시 시의 레벨로 복귀시킬 수 있다.

또한, 상기 제어부는 미리 정해진 음성인식 종료시간 이상 상기 제2음성 입력부를 통해 사용자의 제어명령이 입력되지 않으면 상기 음성인식이 종료된 것으로 판단할 수 있다.

또한, 상기 제어부는 미리 정해진 명령요청시간 이상 상기 제2음성 입력부를 통해 사용자의 제어명령이 입력되지 않으면 상기 사용자에게 제어명령을 입력할 것을 요청할 수 있다.

또한, 상기 제어부는 상기 입력버튼 또는 상기 제2음성 입력부를 통해 음성인식 종료 명령이 입력되면 상기 음성인식이 종료된 것으로 판단할 수 있다.

본 발명의 다른 일 측면에 의한 음성인식 가능한 영상장치는 사용자로부터 제어명령어를 입력받는 음성 입력부, 복수의 제어명령어에 대응되는 하나의 아이콘을 표시하고, 상기 음성 입력부를 통해 사용자로부터 제어명령어가 입력되면 상기 입력된 제어명령어에 대응되는 아이콘을 변화시키는 디스플레이부를 포함할 수 있다.

본 발명의 일 측면에 의한 음성인식 가능한 영상장치의 제어방법은 음성 입력부 및 음향 출력부를 포함하는 영상장치의 제어방법에 있어서, 상기 음성 입력부를 통해 사용자로부터 사용자측 음향신호를 입력받고, 상기 입력된 사용자측 음향신호가 음성인식 개시명령어에 대응되는지 여부를 판단하고, 상기 입력된 사용자측 음향신호가 음성인식 개시명령어에 대응되면, 상기 음향 출력부를 통해 출력되는 음향의 크기를 미리 정해진 레벨로 낮추는 것을 포함할 수 있다.

또한, 상기 음성 입력부를 통해 사용자측 음향신호가 입력되면 상기 사용자측 음향신호에서 사용자의 음성신호 외의 배경음 신호를 제거하는 것을 더 포함할 수 있다.

또한, 상기 배경음 신호는 상기 음향 출력부를 통해 출력되는 음향신호일 수 할 수 있다.

또한, 음성 인식이 종료되면 상기 음향 출력부를 통해 출력되는 음향의 크기를 음성 인식 시작 시의 레벨로 복귀시키는 것을 더 포함할 수 있다.

또한, 상기 음성인식이 종료되는 것은 미리 정해진 음성인식 종료시간 이상 상기 음성 입력부를 통해 사용자의 제어명령이 입력되지 않으면 음성인식이 종료된 것으로 판단하는 것을 포함할 수 있다.

또한, 상기 음성인식이 종료되는 것은 상기 음성 입력부를 통해 음성인식 종료 명령이 입력되면 음성인식이 종료된 것으로 판단하는 것을 포함할 수 있다.

본 발명의 다른 일 측면에 의한 음성인식 가능한 영상장치의 제어방법은 음성 입력부를 통해 사용자로부터 후보 명령어를 입력받고, 상기 후보 명령어가 음성인식 대상이 되는 제어명령어로서 적합한지 여부를 테스트하고, 상기 테스트 결과, 상기 후보 명령어가 상기 제어명령어로서 적합하면 상기 후보 명령어를 상기 제어명령어로 등록하는 것을 포함할 수 있다.

본 발명의 또 다른 일 측면에 의한 음성인식 가능한 영상장치의 제어방법은 사용자로부터 음향신호를 입력받는 음성 입력부 및 상기 사용자로부터 원격에서 제어명령을 입력받은 원격 제어기를 포함하는 영상장치의 제어방법에 있어서, 상기 음성 입력부 또는 상기 원격 제어기를 통하여 사용자로부터 음성인식 개시명령이 입력되면 상기 영상장치로부터 출력되는 음향의 크기를 미리 정해진 볼륨레벨로 낮추고, 상기 사용자로부터 음성인식 종료명령이 입력되면 상기 영상장치로부터 출력되는 음향의 크기를 원상 복귀시키는 것을 포함할 수 있다.

또한, 상기 음성인식 개시명령을 입력받는 것은 상기 음성 입력부를 통하여 사용자의 음성인식 개시명령어를 입력받는 것을 포함할 수 있다.

또한, 상기 음성인식 개시명령을 입력받는 것은 상기 음성 입력부를 통하여 미리 설정된 음량 이상의 음성을 입력받는 것을 포함할 수 있다.

또한, 상기 음성인식 종료명령을 입력받는 것은 상기 음성 입력부를 통하여 사용자의 음성인식 종료명령어를 입력받는 것을 포함할 수 있다.

또한, 상기 음성인식 종료명령을 입력받는 것은 상기 음성 입력부를 통하여 미리 설정된 음성인식 종료시간 이상 제어명령이 입력되지 않는 것을 포함할 수 있다.

본 발명의 일 측면에 따르면, 영상장치의 사용자 음성 인식 성능이 향상되어 음성인식 오류로 인한 영상장치의 오동작을 방지할 수 있다.

도 1은 본 발명의 일 실시예에 의한 영상장치의 외관을 도시한 도면이다.
도 2는 본 발명의 일 실시예에 의한 영상장치 본체의 제어흐름을 도시한 블럭도이다.
도 3은 본 발명의 일 실시예에 의한 영상장치에 있어서, 배경음 제거부를 더 포함하는 영상장치의 제어흐름을 도시한 블럭도이다.
도 4는 본 발명의 일 실시예에 의한 영상장치에 있어서, 제어명령어 생성부를 더 포함하는 영상장치의 제어흐름을 도시한 블럭도이다.
도 5는 본 발명의 일 실시예에 의한 영상장치에 포함된 원격 제어기의 외관을 도시한 도면이다.
도 6은 본 발명의 일 실시예에 의한 영상장치에 포함된 원격 제어기의 제어흐름을 도시한 블럭도이다.
도 7은 본 발명의 일 실시예에 따른 영상장치의 제1제어방법을 도시한 순서도이다.
도 8은 도 7의 실시예를 더 구체화한 순서도이다.
도 9은 본 발명의 일 실시예에 의한 영상장치의 제2제어방법을 도시한 순서도이다.
도 10는 도 9에 있어서 소정의 시간 동안 사용자로부터 음성을 통한 제어명령이 입력되지 않은 경우 음성인식을 종료하는 방법을 도시한 순서도이다.
도 12는 본 발명의 일 실시예에 의한 영상장치가 음성인식 모드인 경우 영상 출력부에 표시되는 화면을 도시한 도면이다.
도 13은 본 발명의 일 실시예에 의한 영상장치에 있어서, 사용자에 의하여 명령어를 생성하는 방법을 도시한 순서도이다.
도 14는 본 발명의 일 실시예에 의한 영상장치가 사용자에 의하여 명령어를 생성하는 경우 영상 출력부에 표시되는 화면을 도시한 도면이다.

본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 바람직한 예에 불과할 뿐이며, 본 명세서의 실시예와 도면을 대체할 수 있는 다양한 변형예가 있음을 밝혀 둔다.

이하에서는 첨부한 도면을 참조하여 본 발명의 실시예에 대하여 상세하게 설명한다.

도 1은 본 발명의 일 실시예에 의한 영상장치(1)의 외관을 도시한 도면이다.

도 1을 참조하면, 본 발명의 일 실시예에 따른 영상장치(1)는 사용자의 제어명령에 따라 영상 또는 음향을 출력하는 영상장치 본체(100)와 원격에서 영상장치 본체(100)를 제어하는 원격 제어기(300)를 포함한다.

영상장치 본체(100)는 디지털 TV로 구현될 수 있으며, 방송 프로그램의 영상 신호 및 각종 컨텐츠의 영상신호를 출력하는 영상 출력부(121), 방송 프로그램의 음향 신호 및 각종 컨텐츠의 음향 신호를 출력하는 음향 출력부(122), 사용자의 음성 또는 동작을 통하여 제어명령을 획득하는 사용자 입력부(110)를 포함한다.

본 발명의 일 실시예에 따른 영상장치(1)는 유무선 네트워크를 통한 화상통화도 가능하다. 영상장치(1)가 화상통화 서비스를 제공하는 경우에는 영상 출력부(121)를 통해 화상통화 상대방의 영상신호를 출력할 수 있으며, 음향 출력부(122)를 통해 화상통화 상대방의 음성신호를 출력할 수 있다. 또한, 이 경우에는 사용자 입력부(110)를 통해 사용자의 영상신호와 음성신호를 획득하여 화상통화 상대방에게 전송할 수 있다.

음향 출력부(122)는 스피커(speaker) 등으로 구현될 수 있으며, 영상장치(1)에서 처리되는 음향신호를 출력한다. 구체적으로, 방송 프로그램 신호에 포함된 음향신호를 출력하거나, 영상장치(1)에서 실행되는 컨텐츠에 포함되는 음향신호를 출력한다. 또한, 앞서 언급한 바와 같이 영상장치(1)가 화상통화 기능을 실행하는 경우에는 상대방의 음성신호도 출력할 수 있다. 당해 실시예의 영상장치(1)는 그 후면에 음향 출력부(122)가 구비되어 있으나, 본 발명의 실시예가 이에 한정되는 것은 아니고 사용자에게 음향을 출력할 수 있는 곳이면 그 위치에 제한이 없다.

영상 출력부(121)는 영상장치(1)에서 처리되는 영상신호를 출력한다. 구체적으로, 방송 프로그램 신호에 포함된 영상신호를 출력하거나 영상장치(1)에서 실행되는 컨텐츠에 포함되는 영상신호를 출력한다. 또한, 영상장치(1)가 화상통화 기능을 실행하는 경우에는 상대방의 영상신호도 출력할 수 있다.

사용자 입력부(110)는 사용자의 영상을 입력하는 영상 입력부(111)와 사용자의 음성을 입력하는 제1음성 입력부(112)를 포함한다.

영상 입력부(111)는 사용자의 영상을 받아들이는 렌즈, 렌즈를 통해 들어온 사용자의 영상을 촬상하기 위한 CCD 센서, CMOS 센서 등의 촬상소자, 촬상소자에 의해 촬상된 영상을 처리하기 위한 영상신호처리기(Image Signal Processor: ISP)를 포함한다.

제1음성 입력부(112)는 마이크(microphone) 등으로 구현될 수 있으며, 사용자의 음성을 취음하는 것이 목적이나 사용자의 음성 외에 배경음 특히, 영상장치의 음향 출력부(122)에서 출력되는 음향이 함께 취음될 수 있다. 따라서, 이하 상술할 실시예에서는 제1음성 입력부(112)를 통해 입력되는 신호를 '사용자측 음향신호'라 하기로 한다. 사용자측 음향신호에는 사용자의 음성신호 외에 다른 배경음 신호가 포함될 수 있다.

도 1에 도시된 바에 의하면 영상장치가 영상 입력부와 음성 입력부가 일체형으로 구비된 MoIP(Multimedia over IP)를 구비하는 것으로 하였으나, 본 발명의 실시예가 이에 한정되는 것은 아니고 영상 입력부(111) 없이 제1음성 입력부(112)만 구비하는 것도 가능하다.

본 발명의 실시예에 의한 영상장치(1)는 그 동작을 제어함에 있어 사용자가 원격 제어기(300) 또는 영상장치 본체(100)에 구비된 입력버튼을 누르지 않고 제1음성 입력부(112)를 통해 제어명령을 음성신호로 입력하는 것이 가능하다. 예를 들어, 도 1에 도시된 바와 같이 영상 출력부(121)에 다양한 컨텐츠 메뉴가 표시되면, 사용자는 원하는 메뉴에 대응되는 명령어를 제1음성 입력부(112)에 음성신호로 입력함으로써 메뉴를 선택할 수 있다.

사용자 입력부(110)는 도 1에 도시된 바와 같이, 영상장치 본체(100)와 별도로 구현될 수도 있으나 영상장치 본체(100)와 일체형으로 구현되는 것도 가능하다.

도 2는 본 발명의 일 실시예에 의한 영상장치 본체(100)의 제어흐름을 도시한 블럭도이다.

도 2를 참조하면, 본 발명의 일 실시예에 따른 영상장치 본체(100)는 방송신호를 수신하는 방송신호 수신부(230), 컨텐츠를 실행하는 컨텐츠 실행부(240), 수신한 방송의 음향 또는 컨텐츠에 포함된 영상을 처리하는 영상 처리부(251), 수신한 방송의 음향 또는 컨텐츠에 포함된 음향을 처리하는 음향 처리부(252), 영상 처리부(251)에 의하여 처리된 영상을 출력하는 영상 출력부(121), 음향 처리부(252)에 의하여 처리된 음향을 출력하는 음향 출력부(122), 사용자로부터 음성신호를 수신하는 제1음성 입력부(112), 사용자로부터 수신한 음성신호를 기초로 제어명령을 인식하는 제1음성 인식부(210), 원격 제어기(300)로부터 제어신호를 수신하는 제1통신부(260) 및 영상장치 본체(100)의 동작 전반을 제어하는 제1제어부(220)를 포함한다.

방송신호 수신부(230)는 영상신호 및 음성신호를 포함하는 방송신호를 수신한다. 방송신호 수신부(230)는 안테나 및 튜너 등으로 구성되며, 영상신호는 영상 출력부(121)를 통해 영상으로 출력하고, 음향신호는 음향 출력부(122)를 통해 음향으로 출력한다.

컨텐츠 실행부(240)는 멀티미디어 컨텐츠를 실행한다. 컨텐츠 실행부(240)에서 실행하는 멀티미디어 컨텐츠는 영상장치 내에 저장되어 있는 게임, 동영상 파일 또는 음악 파일 등일 수도 있고, 영상장치(1)가 유선 또는 무선으로 인터넷에 연결되어 있는 경우에는 인터넷 상에서 제공되는 다양한 멀티미디어 컨텐츠일 수도 있다. 또한, 영상장치가 이동통신기기나 컴퓨터 등의 다른 외부기기와 연결되어 있는 경우에는 연결된 외부기기에서 제공하는 멀티미디어 컨텐츠일 수도 있는 바, 컨텐츠 실행부(240)에서 실행하는 멀티미디어 컨텐츠의 종류에는 제한이 없다.

음향 처리부(252)는 방송신호 수신부(230) 및 컨텐츠 실행부(240)로부터 전송되는 음향신호를 음향 출력부(122)를 통해 출력할 수 있도록 음향 처리를 수행한다. 음향 처리부(252)는 디코더를 구비하여 방송 음향신호와 같이 일정 포맷으로 압축되어 있는 신호를 디코딩하고, D/A 컨버터를 구비하여 디지털 신호를 아날로그 신호로 변환한 후에 음향 출력부(122)로 전송한다.

영상 처리부(251)는 방송신호 수신부(230) 및 컨텐츠 실행부(240)로부터 전송되는 영상신호를 영상 출력부(121)를 통해 출력할 수 있도록 영상 처리를 수행한다. 영상 처리부(251)는 디코더를 구비하여 방송 영상신호와 같이 일정 포맷으로 압축되어 있는 신호를 디코딩하고, D/A 컨버터를 구비하여 디지털 신호를 아날로그 신호로 변환한 후에 영상 출력부(121)로 전송한다.

제1음성 입력부(112)는 사용자로부터 제어명령에 관한 음성신호를 입력받는다. 제1음성 입력부(112)는 마이크로 구현될 수 있으며, 도 1에 도시된 실시예와 같이 마이크와 카메라가 일체형으로 구비된 MoIp로 구현되는 것도 가능하다. 또한, 제1음성 입력부(112)는 입력된 사용자 측 음향신호를 증폭하고, 증폭된 사용자 측 음향신호를 아날로그 신호에서 디지털 신호로 변환하여 음성 인식부로 전송할 수 있다.

도면에 도시하지는 않았으나 제1음성 입력부(112)는 음성 엔코더를 포함할 수도 있는 바, 음성 엔코더는 제1음성 입력부(112)가 영상장치 본체(100)와 데이터 인터페이스를 통해 연결된 경우, 사용자 측 음향신호를 데이터 인터페이스의 밴드폭(bandwidth)에 맞는 적절한 포맷으로 압축하거나, 화상통화를 실행하는 경우 화상통화 상대방에게 송신할 수 있는 포맷으로 압축할 수 있다. 이 경우, 영상장치 본체(100)에는 음성 디코더가 구비되어, 음성 인식 등을 수행하기 전에 압축된 사용자측 음향신호를 디코딩한다.

앞서 언급한 바와 같이 제1음성 입력부(112)를 통해 사용자의 음성이 입력될 때에 사용자의 음성 외에 다른 배경음도 함께 입력될 수 있으므로, 제1음성 입력부(112)를 통해 입력되는 것은 사용자의 음성신호를 포함하는 사용자측 음향신호이다. 사용자가 제1음성 입력부(112)를 통해 제어명령을 입력할 때에는 영상장치(1)가 동작 중이므로 사용자 측 음향신호에는 사용자의 음성신호와 함께 음향 출력부(122)를 통해 출력된 음향신호가 포함될 수 있다.

제1음성 인식부(210)는 제1음성 입력부(112)를 통해 입력된 사용자 음성신호를 분석하여 사용자가 입력한 제어명령을 인식한다. 음성 인식의 방식으로는 미리 저장된 표준패턴과 입력된 음성신호를 비교하여 입력된 음성신호와 가장 가까운 음성패턴을 검출하는 패턴 매칭방식, 하나의 단어와 다른 단어를 구별하기 위한 함수를 미리 설정하고 설정된 함수를 사용자 음성신호에 적용시켜 판정하는 식별 함수방식 등이 있다. 또한, 음성 인식을 단어 단위로 할 수도 있고 음소 단위로 할 수도 있다. 음성 인식부의 음성 인식 방식은 공지된 기술 중 어느 것을 채용해도 무방하며 상술한 방식에 한정되지 않는다.

제1통신부(260)는 후술할 원격 제어기(300)로부터 제어신호를 수신하여 제1제어부(220)에 제공한다. 제1통신부(260)는 Wi-Fi 통신방식, 블루투스(bluetooth) 통신방식, 지그비(Zigbee) 통신방식 등의 무선통신방식을 채용할 수 있을 뿐만 아니라 구성이 비교적 간단한 적외선 통신방식을 채용할 수도 있다.

제1제어부(220)는 제1음성 인식부(210)로부터 인식 결과를 전송받아 그 결과에 따른 제어를 실행한다. 예를 들어, 인식 결과에 따른 제어명령이 방송 채널의 변경인 경우에는 방송신호 수신부(230)에 제어신호를 보내 제어명령에 따른 채널 변경을 수행하도록 하고, 인식 결과에 따른 제어명령이 컨텐츠의 선택인 경우에는 컨텐츠 실행부(240)에 제어신호를 보내 제어명령에 따른 컨텐츠를 실행하도록 할 수 있다.

또한, 제1제어부(220)는 제1음성 인식부(210)에서 전송된 제어명령이 음성인식 개시명령인 경우에는 음향 출력부(122)에서 출력되는 음향의 볼륨을 미리 설정된 레벨로 낮춘다. 제1음성 입력부(112)를 통하여 미리 설정된 음성인식 개시명령어가 입력되거나 미리 설정된 기준 음량 이상의 음성이 입력되면 제1음성 인식부(210)가 이를 음성인식 개시명령으로 인식하고 제1제어부(220)에 음성인식 개시명령이 입력되었음을 전송한다. 음성인식 개시명령이 입력되면 제1제어부(220)는 영상장치(1)를 음성인식모드로 전환하고 음향 출력부(122)의 볼륨 레벨을 미리 설정된 레벨로 낮출 수 있다.

음성인식 개시명령어를 통하여 음성인식 개시명령이 입력되는 경우 음성인식을 개시하는 개시명령어는 비교적 음성인식이 용이한 간단한 단어로 설정하는 것이 바람직하며 "Hi TV", "티비야" 등을 예로 들을 수 있다. 뿐만 아니라 후술하는 바와 같이 원격 제어기(300)나 영상장치 본체(100) 등에 구비된 입력 버튼을 통하여 사용자가 음성인식 개시명령을 입력하는 것도 가능하다.

앞서 설명한 바와 같이, 사용자측 음향신호에는 사용자 음성신호 뿐만 아니라 음향 출력부(122)를 통해 출력된 음향신호도 포함될 수 있다. 사용자측 음향신호에 이러한 배경음이 포함되어 있는 경우에는 제1음성 인식부(210)에서의 음성 인식률이 저하될 수 있다. 음성인식이 진행되는 동안에 제1제어부(220)가 음향 출력부(122)를 통해 출력되는 음향의 볼륨을 미리 설정된 일정 레벨로 낮추게 되면, 사용자측 음향신호에 배경음이 포함되더라도 사용자의 음성신호만을 추출하여 제어명령을 인식하는 것이 더 용이해진다.

여기서, 미리 설정된 볼륨 레벨은 배경음이 포함되더라도 일정 수준 이상의 음성 인식률을 확보할 수 있는 수준의 레벨인 것으로 한다. 예를 들어, 음성 인식률을 80% 이상 확보할 수 있는 볼륨 레벨이 5인 경우에는, 음성인식 개시명령이 입력되면 음향 출력부(122)에서 출력되는 음향의 볼륨 레벨을 5로 낮추도록 설정할 수 있다. 미리 설정되는 볼륨 레벨은 실험 또는 통계에 의해 제조과정에서 미리 설정될 수도 있고, 사용자에 의해 미리 설정될 수도 있다.

다만, 미리 설정되는 볼륨 레벨은 0이 아닌 것으로 한다. 예를 들어, 사용자가 영상장치를 통해 음악을 감상하던 중 영상장치에 저장되어 있는 앨범을 보기 위해 음성인식을 통해 컨텐츠 선택에 관한 제어명령을 입력할 수 있다. 이 때 음향 출력부(122)에서 출력되는 음향의 볼륨이 0이 되어 음소거가 된다면, 작업의 연속성이 저해되고, 동시에 여러 가지 작업을 수행하고자 하는 사용자의 의도와도 부합되지 않게 된다. 따라서, 미리 설정되는 볼륨 레벨은 수행중이던 작업의 연속적인 수행과 음성인식률을 모두 고려하여 적절히 선택될 수 있도록 한다.

또한, 제1제어부(220)는 현재의 볼륨 레벨이 미리 설정된 볼륨 레벨보다 낮거나 같은 경우에는 현재의 볼륨 레벨을 그대로 유지하도록 한다.

음성인식이 종료되면 제1제어부(220)는 음향 출력부(122)를 통해 출력되는 음향의 볼륨 레벨을 원상 복귀시킨다. 제1음성 입력부(112)를 통해 음성인식 종료 명령이 입력되거나, 미리 정해진 기준 시간 동안 음성인식 대상이 되는 제어명령이 입력되지 않거나, 원격 제어기(300), 영상장치 본체(100) 등에 구비된 입력 버튼을 통해 음성인식 종료 명령이 입력되면 음성인식이 종료된 것으로 판단할 수 있다.

도 3은 본 발명의 일 실시예에 따른 영상장치(1)에 있어서, 배경음 제거부(270)를 더 포함하는 영상장치(1)의 제어흐름을 도시한 도면이다.

도 3의 실시예에서는 도 2에서 설명한 내용과 중복되는 내용은 생략하고, 배경음 제거부(270)를 중점적으로 설명하도록 한다.

앞서 설명한 바와 같이, 사용자측 음향신호에 배경음이 포함되어 있는 경우에는 제1음성 인식부(210)에서의 음성 인식률이 저하될 뿐만 아니라 화상 통화를 수행하는 경우 화상 통화 상대방에게 우수한 품질의 음성신호를 전달할 수가 없다. 따라서, 본 발명의 일 실시예에 따른 영상장치(1)는 사용자측 음향신호에서 배경음을 제거하는 배경음 제거부(270)를 더 포함할 수 있다.

배경음 제거부(270)는 음향 에코 제거기(Acoustic Echo Canceller)로 구현될 수 있다. 음향 에코 제거기는 음향신호와 레퍼런스 신호(reference signal)를 입력받고, 입력된 음향신호에서 레퍼런스 신호를 제거한다. 본 발명의 일 실시예에 의한 영상장치(1)에서는 음향 출력부(122)를 통해 출력되는 음향신호를 레퍼런스 신호로 하여, 배경음 제거부(270)에 입력된 사용자측 음향신호에서 음향 출력부(122)를 통해 출력되는 음향신호를 제거할 수 있다. 또한, 사용자가 방송 프로그램을 시청 중인 경우에는 방송신호 수신부(230)에서 수신한 음향신호를 직접 레퍼런스 신호로 할 수도 있고, 컨텐츠를 실행 중인 경우에는 컨텐츠 실행부(240)에서 생성된 음향신호를 직접 레퍼런스 신호로 할 수도 있다.

배경음 제거부(270)에서 배경음이 제거된 사용자측 음향신호는 제1음성 인식부(210)로 전송된다. 사용자가 음성인식 개시명령을 음성신호로 입력하는 경우에는, 음향 출력부(122)의 볼륨 레벨이 낮춰지지 않은 상태에서 제1음성 인식부(210)로 사용자측 음향신호가 전송된다. 따라서, 배경음 제거부(270)에서 배경음을 제거하면 음성 인식부에서 음성인식 개시명령을 인식하기가 더 용이해진다.

그러나, 배경음 제거부(270)에서 배경음을 제거하더라도 음향 출력부(122)를 통해 출력되는 음향의 볼륨이 일정 수준 이상이면 사용자 음성신호와 배경음 신호를 분리하여 배경음 신호만을 제거하기가 용이하지 않고, 배경음 제거부(270)에서 배경음 신호를 어느 정도 제거하더라도 배경음의 잔상이 남아 있어 제1음성 인식부(210)에서의 음성 인식률이 떨어질 수 있다.

또한, 음성인식 개시명령어는 주로 음성인식이 용이한 간단한 단어로 설정하여 배경음 제거(270)만으로 음성인식 오류가 많이 감소하는데 비하여 다른 제어명령어들은 음성인식 개시명령어보다 길고 복잡한 경우가 많아 배경음 제거만으로는 원하는 음성 인식률을 얻기가 어렵다. 따라서, 제1음성 인식부(210)에서 음성인식 개시명령이 입력된 것으로 판단한 후 제1제어부(220)에서 음향 출력부(122)의 볼륨 레벨을 미리 설정된 레벨로 낮추어 음성인식 성능을 더욱 향상시킨다.

도 4는 본 발명의 일 실시예에 따른 영상장치(10)에 있어서, 제어명령어 생성부(280)를 더 포함하는 영상장치(1)의 제어흐름을 도시한 도면이다.

도 4에 도시된 바와 같이 영상장치(1)는 사용자로 하여금 명령어를 생성하게 할 수 있는 명령어 생성부(280)를 더 포함할 수 있다.

명령어 생성부(280)는 사용자로부터 후보 명령어를 수신하는 명령어 수신부(281), 수신된 후보 명령어가 명령어로서 적합한지 테스트하는 테스트부(282) 및 테스트부(282)의 테스트 결과에 따라 후보 명령어의 등록 여부를 결정하는 설정부(283)를 포함한다.

명령어 생성부(280)는 영상장치(1)의 음성인식 대상이 되는 명령어를 모두 생성할 수 있으며, 특히 음성인식 개시명령어를 생성하는데 유용하게 사용될 수 있다.

앞서 설명한 바와 같이, 사용자측 음향신호에 배경음이 포함되어 있으면 음성인식 성능이 저하되고 특히, 배경음의 볼륨 레벨이 너무 크면 배경음 제거부(270)를 거치더라도 음성인식에 오류가 생길 가능성이 높다. 제1음성 인식부(210)에서 음성인식 개시명령이 입력된 것으로 판단하면 음향 출력부(122)의 볼륨 레벨을 미리 설정된 레벨로 낮추어 주지만, 음성인식 개시명령어는 음향 출력부(122)의 볼륨 레벨이 조절되지 않은 상태에서 입력되기 때문에 배경음의 음향이 높더라도 음성 인식부에서 쉽게 인식할 수 있는 단어로 하는 것이 유리하다.

구체적으로, 사용자는 영상장치에 미리 설정되어 있는 명령어 외에 자신이 원하는 새로운 명령어를 등록하여 사용할 수 있는 바, 사용자가 제1음성 입력부(112)를 통해 새로운 명령어를 후보 명령어로 입력하면 명령어 수신부(281)에서 후보 명령어에 관한 음성신호를 수신한다.

그리고, 테스트부(282)는 명령어 수신부(281)에서 수신한 후보 명령어가 음성인식 개시명령어로 사용되기에 적합한 단어인지 여부를 테스트한다. 다시 말해, 테스트부(282)는 후보 명령어가 음성 인식부에서 용이하게 음성인식을 할 수 있는 단어인지, 볼륨 레벨이 큰 배경음과 함께 입력되더라도 일정 수준의 음성 인식률을 유지할 수 있는 단어인지 여부 등을 판단한다.

설정부(283)는 테스트부(282)의 테스트 결과에 따라 후보 명령어의 등록 여부를 결정한다. 일 예로, 테스트부(282)의 테스트 결과 후보 명령어의 음성 인식률이 80% 이상이면 음성인식 개시명령어로 등록하고 후보 명령어를 제1음성 인식부(210)로 전송할 수 있다. 이후에, 제1음성 입력부(112)를 통해 해당 명령어가 입력되면 제1음성 인식부(210)는 음성인식 개시명령어로 인식하고 제1제어부(220)에 신호를 보낸다.

사용자가 복수의 후보 명령어를 입력하여 복수의 명령어가 등록된 경우, 사용자로 하여금 명령어 선택에 관한 명령을 입력받아 사용자의 선택 명령에 따른 명령어를 음성인식 개시명령어로 설정할 수 있으며, 복수의 명령어 모두를 음성인식 개시명령어로 설정할 수도 있다. 복수의 명령어가 음성인식 개시명령어로 등록된 경우 제1음성 인식부(210)는 제1음성 입력부(112)를 통해 복수의 명령어 중 어느 하나가 입력되면 음성인식 개시명령이 입력된 것으로 판단한다.

도 5는 본 발명의 일 실시예에 의한 영상장치(1)에 포함된 원격 제어기(300)의 외관을 도시한 도면이다.

도 5를 참조하면, 원격 제어기(300)는 터치 또는 버튼을 통하여 사용자의 제어명령을 입력하는 입력버튼(320), 음성을 통하여 사용자의 제어명령을 입력하는 제2음성 입력부(312)를 포함한다.

입력버튼(320)은 영상장치(1)의 전원을 온 또는 오프하기 위한 전원버튼(321), 영상장치(1)의 음향 출력의 크기를 조절하기 위한 음량조절버튼(323), 영상장치(1)를 통하여 표시되는 방송의 채널을 조절하는 채널조절버튼(325), 음성인식 개시명령을 입력하기 위한 음성인식버튼(327)을 포함한다.

입력버튼(320)은 버튼식 스위치, 멤브레인(membrane) 스위치 등의 스위치 또는 사용자의 신체 일부의 접촉을 감지하는 터치패드(touch pad)를 채용할 수 있다. 뿐만 아니라 스위치와 터치패드를 혼용할 수도 있다. 예를 들어, 통상 사용자가 자주 사용하는 전원버튼(321), 음량조절버튼(323), 채널조절버튼(325)는 터치패드를 채용하고, 음성인식버튼(327)는 멤브레인 스위치를 채용할 수 있다.

제2음성 입력부(312)는 사용자로부터 제어명령에 관한 음성신호를 입력받는다. 제2음성 입력부(312)는 음파를 전기적 신호를 변환하는 마이크를 포함할 수 있으며, 입력된 음성신호를 증폭하는 증폭기, 음성신호를 디지털 신호로 변환하는 아날로그-디지털 변환기(A/D Converter)를 더 포함할 수 있다.

도 6은 본 발명의 일 실시예에 의한 영상장치(1)에 포함된 원격 제어기(300)의 제어흐름을 도시한 블럭도이다.

도 6을 참조하면, 원격 제어기(300)는 그 기능을 수행하기 위하여 터치 또는 버튼을 통하여 사용자로부터 제어명령을 입력받는 입력버튼(320), 음성신호를 통하여 사용자로부터 제어명령을 입력받는 제2음성 입력부(312), 제2음성 입력신호(312)를 통하여 입력된 음성신호로부터 제어명령을 식별하는 제2음성 인식부(410), 영상장치 본체(100)로 제어신호를 송신하는 제2통신부(460) 및 원격 제어기(300)의 동작 전반을 제어하는 제2제어부(420)를 포함한다.

입력버튼(320) 및 제2음성 입력부(312)는 도 5와 관련하여 이미 설명하였으므로 그 설명을 생략한다.

제2통신부(460)는 영상장치 본체(100)로 제어신호를 송신한다. 제2통신부(460)는 Wi-Fi 통신방식, 블루투스 통신방식, 지그비 통신방식 등의 무선통신방식을 채용할 수 있을 뿐만 아니라 구성이 비교적 간단한 적외선 통신방식을 채용할 수도 있다.

제2제어부(420)는 입력버튼(320) 또는 제2음성 인식부(410)를 통하여 제공받은 제어명령에 따라 제2통신부(460)를 제어하여 영상장치 본체(100)에 제어신호를 송신한다. 구체적으로, 입력버튼(320)를 통하여 음향 증감 명령 또는 채널 변경 명령이 입력되면 이를 제2통신부(460)를 통하여 영상장치 본체(100)에 송신한다.

또한, 입력버튼(320)에 마련된 음성인식버튼(327)를 통하여 음성인식 개시명령이 입력되면 음성인식 개시명령을 영상장치 본체(100)에 송신하고, 제2음성 인식부(410)에 의하여 식별된 제어명령을 제2통신부(460)를 통하여 영상장치 본체(100)에 송신한다. 또한, 이와 같이 사용자로부터 음성인식 개시명령을 입력받는 음성인식버튼은 영상장치 본체(100)에 마련될 수 있다. 또한, 음성인식 개시명령은 영상장치 본체(100)에서 제공하는 메뉴를 통해서도 입력될 수 있다.

영상장치 본체(100)에 마련된 제1제어부(220)는 원격 제어기(300)로부터 음성인식 개시명령이 송신되면 음향 출력부(122)에서 출력되는 음향의 볼륨을 미리 설정된 레벨로 낮추거나, 원격 제어기(300)로부터 음성을 통한 제어명령이 송신되면 음향 출력부(122)의 음향 볼륨을 미리 설정된 레벨로 낮출 수 있다.

또한, 제2제어부(420)는 음성인식 종료되면 음성인식 종료명령을 제2통신부(460)를 통하여 영상장치 본체(100)로 송신하고, 이를 수신한 영상장치 본체(100)는 음향 출력부(122)에서 출력되는 음향의 볼륨을 원상 복귀시킨다. 음성인식 종료는 사용자가 음성인식버튼(327)을 통하여 음성인식 종료명령을 입력하거나 미리 정해진 기준 시간 동안 음성인식 대상이 되는 제어명령이 입력되지 않으면 수행된다.

영상장치 본체(100)와 달리 원격 제어기(300)는 사용자가 비교적 근거리에서 음성명령을 입력하므로, 본 발명의 일 실시예에 의한 원격 제어기(300)는 배경음을 제거하기 위한 배경음 제거부를 포함하지 않지만, 이에 한정되는 것은 아니며 원격 제어기(300)도 배경음 제거부를 포함할 수 있다.

이하, 본 발명의 일 측면에 따른 영상장치의 제어방법에 관한 실시예를 설명하도록 한다.

도 7은 본 발명의 일 실시예에 따른 영상장치(1)의 제1제어방법을 도시한 순서도이다.

도 7을 참조하면, 먼저 제1음성 입력부(112)를 통해 사용자로부터 사용자측 음향신호를 입력받는다(511). 사용자측 음향신호에는 사용자의 음성신호 외에 영상장치의 음향 출력부(122)에서 출력된 음향신호가 포함되어 있을 수 있다.

입력된 사용자측 음향신호가 음성인식 개시명령을 나타내는지 여부를 판단한다(513). 즉, 음성인식 개시명령이 입력된 것인지 여부를 판단한다. 구체적으로 음성 인식부에서 미리 저장된 음성인식 개시명령어와 입력된 사용자측 음향신호가 일치하는지 여부를 판단하여 음성인식 개시명령이 입력된 것인지 여부를 판단한다.

판단 결과, 입력된 사용자측 음향신호가 음성인식 개시명령을 나타내는 것이면(513의 예), 음향 출력부(122)의 볼륨 레벨을 미리 설정된 레벨로 낮춘다(515). 여기서, 미리 설정된 레벨은 음성 인식률을 고려하여 실험적 또는 통계적으로 정해질 수 있으며, 사용자가 설정 및 변경할 수 있도록 하는 것도 가능하다.

그리고, 음성인식이 종료되었는지 여부를 판단하고(517), 음성인식이 종료된 경우(517의 예)에는 음향 출력부(122)의 볼륨 레벨을 원상태로 복귀시킨다(519).

도 8은 도 7의 실시예를 더 구체화한 순서도이다.

도 8를 참조하면, 먼저 제1음성 입력부(112)를 통해 사용자로부터 사용자측 음향신호를 입력받고(521), 입력된 사용자측 음향신호에서 배경음 신호를 제거한다(523). 여기서, 배경음 신호는 음향출력부를 통해 출력되는 음향신호일 수 있다. 배경음 제거에 음향 에코 제거기(AEC)를 이용할 수 있는 바, 사용자측 음향신호를 입력신호로 입력하고, 음향 출력부(122)를 통해 출력되는 음향신호를 레퍼런스 신호로 입력한다.

그리고 음성인식 개시명령이 입력되었는지 여부를 판단(525)하는 것은 도 7에서와 동일하다.

판단 결과, 음성인식 개시명령이 입력된 것이면(525의 예) 즉, 사용자측 음향신호가 음성인식 개시명령을 나타내는 것이면, 현재 음향 출력부(122)의 볼륨 레벨이 미리 설정된 레벨을 초과하는지 여부를 판단한다(527).

판단 결과, 현재 음향 출력부(122)의 볼륨 레벨이 미리 설정된 레벨을 초과하면(527의 예), 음향 출력부(122)의 볼륨 레벨을 미리 설정된 레벨로 낮추고(529), 그렇지 않으면 현재 음향 출력부(122)의 볼륨 레벨을 그대로 유지한다.

그리고, 음성인식이 종료되었는지 여부를 판단한다(531). 음성인식의 종료 여부는, 사용자로부터 음성인식 종료 명령이 입력되었는지 여부 또는 미리 정해진 기준시간 동안 사용자의 제어명령이 입력되지 않았는지 여부 등으로 판단할 수 있다. 음성인식 종료 명령은 음성신호로 입력될 수도 있고 원격 제어기(300)나 영상장치 본체(100)에 구비된 입력버튼을 누름으로써 입력되거나 모션 인식을 통해 입력될 수도 있다.

음성인식이 종료된 것으로 판단되면(532의 예), 음향 출력부(122)의 볼륨 레벨을 원상태로 복귀시킨다(533). 다만, 음성인식 시작 시에 음향 출력부(122)의 볼륨 레벨이 미리 설정된 레벨보다 작거나 같아서 그대로 유지된 경우에는 음성인식이 종료되어도 음향 출력부(122)의 볼륨 레벨은 그대로 유지된다.

도 9은 본 발명의 일 실시예에 의한 영상장치(1)의 제2제어방법을 도시한 순서도이다.

도 9을 참조하면, 영상장치(1)는 음성인식 개시명령의 입력 여부를 판단한다(611). 구체적으로, 영상장치 본체(100)에 마련된 제1음성 입력부(112)를 통하여 사전에 정의된 음성인식 개시명령어(예를 들어, "Hi TV", "티비야" 등)이 입력되거나 영상장치 본체(100)에 마련된 음성인식버튼(미도시) 또는 원격 제어기(300)에 마련된 음성인식버튼(327)를 통하여 음성인식 개시명령이 입력되면 영상장치(1)는 음성인식 개시명령이 입력된 것으로 판단하고, 영상장치(1)는 음성인식모드로 진입한다. 또한, 영상장치(1)는 영상장치 본체(100)에 마련된 제1음성 입력부(112) 또는 원격 제어기(300)에 마련된 제2음성 입력부(312)를 통하여 미리 설정된 음량 이상의 음성이 입력되면 음성인식 개시명령이 입력된 것으로 인식하고, 음성인신모드로 진입할 수 있다.

뿐만 아니라, 영상장치 본체(100)에 마련된 음성 입력부(112)를 통하여 음성인식 개시명령어가 입력되는 경우, 영상장치(1)는 배경음 제거부(270)를 통하여 음성인식 개시명령어 이외의 배경음 신호를 제거함으로써 음성 입력부(112)를 통하여 입력되는 음성인식 개시명령어를 더욱 정확하게 인식할 수 있다.

음성인식 개시명령이 입력되면, 영상장치(1)는 음향 출력부(122)의 볼륨레벨을 미리 설정된 볼륨레벨로 낮춘다(613). 이때 음향 출력부(122)의 볼륨레벨이 미리 설정된 볼륨레벨 이하이면 영상장치(1)의 음향 출력부(122)의 볼륨레벨을 낮추는 동작을 수행하지 않을 수 있다.

다음으로, 영상장치(1)는 음성 입력부(121)를 통하여 입력되는 사용자의 음성 제어명령에 따라 방송신호 수신부(230), 컨텐츠 실행부(240), 음향 출력부(122) 등을 제어한다(615). 사용자의 음성 제어명령에 따른 영상장치(1)의 제어는 도 12와 함께 아래에서 자세하게 설명한다.

다음으로, 영상장치(1)는 음성인식 종료 여부를 판단한다(617). 구체적으로, 음성인식모드에서 영상장치 본체(100)에 마련된 음성 입력부(112)를 통하여 사전에 정의된 음성인식 개시명령어(예를 들어, "Hi TV", "티비야" 등)을 다시 입력되거나 음성인식모드에서 영상장치 본체(100)에 마련된 음성인식버튼(미도시) 또는 원격 제어기(300)에 마련된 음성인식버튼(327)이 선택되면 영상장치(1)는 음성인식 종료명령이 입력된 것으로 판단한다. 뿐만 아니라, 미리 설정된 소정의 시간 동안 사용자로부터 음성을 통한 제어명령이 입력되지 않으면 음성인식을 종료한다. 소정의 시간 동안 사용자로부터 음성을 통한 제어명령이 입력되지 않아 음성인식을 종료하는 것에 대하여는 도 10과 함께 아래에서 자세히 설명한다.

음성인식 종료가 판단되면, 영상장치(1)는 음성인식모드에서 벗어나고 음향 출력부(122)의 볼륨 레벨을 원상 복귀시킨다(619).

도 10은 본 발명의 일 실시예에 의한 영상장치(1)의 제3제어방법을 도시한 순서도이다.

도 10을 참조하면, 영상장치(1)는 음성인식 개시명령의 입력 여부를 판단한다(711). 구체적으로, 영상장치 본체(100)에 마련된 제1음성 입력부(112)를 통하여 음성인식 개시명령어가 입력되거나, 영상장치 본체(100)에 마련된 음성인식버튼(미도시) 또는 원격 제어기(300)에 마련된 음성인식버튼(327)를 통하여 음성인식 개시명령이 입력되거나, 영상장치 본체(100)에 마련된 제1음성 입력부(112) 또는 원격 제어기(300)에 마련된 제2음성 입력부(312)를 통하여 미리 설정된 음량 이상의 음성이 입력되면 영상장치(1)는 음성인식 개시명령이 입력된 것으로 판단한다.

음성인식 개시명령이 입력되면, 영상장치(1)는 제1음성 입력부(112) 또는 제2음성 입력부(312)를 통하여 미리 설정된 음량 이상의 음성이 입력되는지 여부를 판단한다(713).

미리 설정된 음량 이상의 음성이 입력되면, 영상장치(1)는 음향 출력부(122)의 볼륨레벨을 미리 설정된 볼륨레벨로 낮춘다(715). 즉, 도 9에서 설명한 제2제어방법은 음성인식이 개시되면 즉시 음향 출력부(122)의 볼륨레벨을 낮추는데 비하여 제3제어방법은 음성인식이 개시된 후 사용자가 음성을 통해 제어명령을 입력할 때에 비로소 음향 출력부(122)의 볼륨레벨을 낮춘다. 이와 같이, 제어함으로써 사용자가 수행 중인 작업의 연속성을 더욱 확보할 수 있다.

다음으로, 영상장치(1)는 음성을 통한 사용자의 제어명령에 따라 영상장치(1)에 포함된 각 구성을 제어한다(717).

다음으로, 영상장치(1)는 다시 제1음성 입력부(112) 또는 제2음성 입력부(312)를 통하여 미리 설정된 음량 이상의 음성이 입력되는지 여부를 판단한다(719).

미리 설정된 음량 이상의 음성이 입력되면, 영상장치(1)는 다시 음성을 통한 사용자의 제어명령에 따라 영상장치(1)에 포함된 각 구성을 제어한다(717). 그러나, 미리 설정된 기준 볼륨 낮춤 시간 이상 미리 설정된 음량 이상의 음성이 입력되지 않으면(721), 영상장치(1)는 음향 출력부(122)의 볼륨 레벨을 원상 복귀시킨다(723).

즉, 영상장치(1)는 음성인식모드로 진입한 후 미리 설정된 음량 이상의 음성이 입력되면 음향 출력부(122)의 볼륨 레벨을 낮추고, 소정의 기준 볼륨 낮춤 시간 동안 음성을 통한 제어명령이 입력되지 않으면 영상장치(1)는 음향 출력부(122)의 볼륨 레벨을 원상 복귀시킨다.

다음으로, 영상장치(1)는 음성인식 종료 여부를 판단한다(725).

도 11은 소정의 시간 동안 사용자로부터 음성을 통한 제어명령이 입력되지 않은 경우 음성인식을 종료하는 방법을 도시한 순서도이다.

도 11에 도시된 바와 같이 음성인식모드에 진입하면 영상장치(1)는 대기시간을 초기화하고(621), 음성인식 종료시간을 제1기준시간으로 설정한다(623). 여기서, 대기시간은 음성인식모드에서 사용자가 음성을 통한 제어명령을 입력하지 않아 영상장치(1)가 대기한 시간을 의미하며, 음성인식 종료시간은 사용자가 음성을 통한 제어명령을 입력하지 않아 음성인식을 종료하기 위한 소정의 시간을 의미한다. 또한, 제1기준시간은 음성인식모드에 진입한 이후 사용자가 음성을 통한 제어명령을 입력하지 않은 경우 영상장치(1)가 대기하는 시간을 의미한다.

이후, 영상장치(1)는 음성을 통한 사용자의 제어명령이 입력되는지 여부를 판단한다(625).

만일 음성을 통한 사용자의 제어명령이 입력되면, 영상장치(1)는 사용자의 제어명령에 따라 방송신호 수신부(230), 컨텐츠 실행부(240), 음향 출력부(122) 등을 제어한다(627).

이후, 영상장치(1)는 대기시간을 초기화하고(631), 음성인식 종료시간을 제2기준시간으로 설정한다(633). 여기서 제2기준시간은 음성인식모드에 진입하고 사용자가 음성을 통하여 제어명령을 입력한 후 사용자의 다음 제어명령까지 영상장치(1)가 대기하는 시간을 의미한다. 통상 사용자가 제어명령을 입력하고 이에 따른 영상장치(1)의 동작을 확인하는데 시간이 요구되므로 제2기준시간은 제1기준시간에 비하여 더 긴 시간으로 하는 것이 바람직하다. 예를 들어, 제1기준시간을 30초로 정하는 경우, 제2기준시간은 사용자가 제어명령에 따른 영상장치(1)의 동작을 확인하는데 요구되는 시간을 고려하여 60초로 정할 수 있다.

이후, 영상장치(1)는 다시 음성을 통한 사용자의 제어명령이 입력되는지 여부를 판단한다(625).

만일 음성을 통한 사용자의 제어명령이 입력되지 않으면, 영상장치(1)는 대기시간이 명령요청시간을 경과하였는지 여부를 판단한다(635). 명령요청시간이란, 사용자가 음성을 통하여 제어명령을 입력하지 않는 경우 사용자에게 제어명령을 요청하기 위한 소정의 시간 간격을 의미하며, 음성인식이 종료되기 전에 적어도 한 번 이상 사용자에게 제어명령 요청을 하기 위하여 명령요청시간은 음성인식 종료시간보다 짧은 것이 바람직하다.

명령요청시간동안 사용자가 음성을 통한 제어명령을 입력하지 않으면 영상장치(1)는 영상 출력부(121) 또는 음향 출력부(122)를 통하여 "기능을 말하세요.", "채널을 변경할까요?", "음량을 조정할까요?" 등 사용자에게 제어명령을 입력할 것을 요청한다(637).

이후, 영상장치(1)는 대기시간이 음성인식 종료시간을 경과하였는지 여부를 판단한다(639).

영상장치(1)의 대기시간 즉 사용자가 음성을 통한 제어명령을 입력하지 않은 시간이 음성인식 종료시간 이상이면 영상장치(1)는 음성인식을 종료한다(641).

도 12은 본 발명의 일 실시예에 의한 영상장치(1)가 음성인식 모드인 경우 영상 출력부(121)에 표시되는 화면을 도시한 도면이다.

도 12a를 참조하면, 영상 출력부(121)의 하단에만 제어관련 아이콘들이 표시되고 나머지 영역에는 메인 화면이 표시된다. 하단에 표시된 아이콘 중 '전원 온/오프' 아이콘(121a)은 전원 온(on)에 대한 제어명령 및 전원 오프(off)에 대한 제어명령에 대응되고, '볼륨 업/다운' 아이콘(121b)은 볼륨 업에 대한 제어명령 및 볼륨 다운에 대한 제어명령에 대응되며, '채널 업/다운' 아이콘(121c)은 채널 업에 대한 제어명령 및 채널 다운에 대한 제어명령에 대응된다.

기존에는 상기 제어명령에 대응되는 6개의 아이콘을 표시해야 했으나 본 발명의 일 실시예에 따른 영상장치(1)는 3개의 아이콘만을 표시함으로써 6개의 제어명령을 실행할 수 있다.

사용자가 전원 온 또는 전원 오프에 대응되는 제어명령을 입력하면 영상 출력부(121) 상의 커서(121d)가 '전원 온/오프' 아이콘(121a)으로 이동하고 제어명령에 따라 전원이 온 되거나 오프된다. 나머지 아이콘(121b, 121c)도 이와 마찬가지로 동작한다.

도 12a에 도시된 바에 의하면 하나의 아이콘에 그에 대응되는 제어내용을 모두 기재하는 것으로 하였으나, 볼륨 제어에 관한 아이콘에 '볼륨' 만을 표시하고, 채널 제어에 관한 아이콘에 '채널'만을 표시하고, 전원 제어에 관한 아이콘에 '전원' 만을 표시하는 것도 가능하다. 사용자가 어떤 제어에 관한 아이콘인지 인지할 수 있으면 되고 아이콘에 표시되는 내용에는 제한이 없다.

전원 온과 전원 오프, 볼륨 업과 볼륨 다운 및 채널 업과 채널 다운은 모두 토글(toggle)되는 형태로 실행될 수 있다. 예를 들어, 사용자가 제1음성 입력부(112)를 통해 '채널 업'에 대응되는 제어명령어를 입력한 경우 도 12b에 도시된 바와 같이 커서(121d)를 '채널 업/다운' 아이콘(121c)으로 이동시키고, 업 명령과 다운 명령을 구별하기 위해 '채널 업/다운' 아이콘(121c)을 붉은색으로 변화시킬 수 있다. '채널 다운'에 대응되는 제어명령어를 입력한 경우에는 도 12c에 도시된 바와 같이 커서(121d)를 '채널 업/다운' 아이콘(121c)으로 이동시키고 '채널 업/다운' 아이콘(121c)이 푸른색으로 바뀌도록 할 수 있다.

다른 실시예로서, 대응되는 제어명령어가 입력되면 해당 아이콘이 깜빡거리게 하거나, 채널 업/다운에 대응되는 제어명령어 또는 볼륨 업/다운에 대응되는 제어명령어가 입력되면 해당 아이콘 내에 세로 바(bar)가 생성되어 채널 조절량 또는 볼륨 조절량을 표시할 수도 있다.

또한, 도 12에 도시된 바에 의하면 영상 출력부(121)에 커서(121d)가 표시되는 것으로 하였으나, 이에 한정되는 것은 아니며 커서가 표시되지 않고 아이콘에만 변화를 주는 것도 가능하다.

본 발명의 일 실시예에 의한 영상장치(1)는 해당 아이콘에 대응되는 제어명령어가 입력되었음을 나타내기 위해 다양한 방식으로 해당 아이콘을 변화시킬 수 있고, 아이콘의 변화에는 아이콘 내에 커서가 들어오는 것도 포함된다. 다만, 본 발명의 실시 형태가 상술한 예시에 한정되는 것은 아니다.

도 12에 도시된 바에 의하면 전원, 채널 및 볼륨 제어에 관한 아이콘 만을 도시하였으나, 이 외에도 웹 브라우저 온/오프, 음소거 온/오프 등 다양한 제어명령에 대응되는 아이콘을 표시할 수 있다.

도 13은 본 발명의 일 실시예에 의한 영상장치(1)에 있어서, 사용자에 의하여 명령어를 생성하는 방법을 도시한 순서도이고, 도 14는 본 발명의 일 실시예에 의한 영상장치(1)가 사용자에 의하여 명령어를 생성하는 경우 영상 출력부(121)에 표시되는 화면을 도시한 도면이다. 당해 실시예에서는 음성인식 개시명령어를 생성하는 것으로 한다.

도 13을 참조하면, 먼저 사용자로부터 명령어 생성 명령을 입력받는다(711). 명령어 생성 명령은 음성신호로 입력될 수도 있고, 원격 제어기(300)나 영상장치 본체(100)에 구비된 입력버튼을 통해 입력될 수도 있으며, 모션 인식을 통해 입력될 수도 있다. 명령어 생성 명령 입력 방식에는 제한이 없다.

구체적으로 도 14a에 도시된 바와 같이 사용자는 먼저 환경설정에 관한 메뉴 항목 중 '명령어 생성' 항목을 선택한다. 이 선택 역시 음성 인식으로 할 수도 있고, 원격 제어기(300) 또는 영상장치 본체(100)에 구비된 입력버튼을 누르거나 모션 인식에 의할 수도 있다.

그리고 사용자로부터 후보 명령어를 입력받는다(713). 후보 명령어는 제1음성 입력부(112)를 통해 음성신호로 입력받을 수 있다.

구체적으로, 도 14b에 도시된 바와 같이 영상장치의 영상 출력부(121)에 후보 명령어를 입력하라는 문구가 표시되면 사용자는 제1음성 입력부(112)를 통해 명령어로 등록하고자 하는 후보 명령어를 입력한다. 예를 들어, 사용자는 받침이 없고 짧은 단어인 '마이크'를 후보 명령어로 입력할 수 있다.

후보 명령어가 입력되면, 입력된 후보 명령어가 음성인식 개시명령어로서 적합한지 여부를 테스트한다(715). 음성인식 개시명령어는 음성인식이 용이한 ??고 받침이 없는 단어로 하는 것이 적합한 바, 이 외에도 다양한 기준을 이용하여 후보 명령어의 적합성 여부를 테스트할 수 있고, 후보 명령어의 음성 인식률을 측정할 수도 있다.

구체적으로, 도 14c에 도시된 바와 같이 영상 출력부(121)에 현재 테스트 중이라는 문구가 표시된다.

테스트 결과, 후보 명령어가 음성인식 개시명령어로서 적합하다는 결과가 나오면(717의 예) 후보 명령어를 음성인식 개시명령어로 등록하여(719) 음성 인식부로 전송한다. 일 실시예로서, 후보 명령어의 음성 인식률이 소정의 기준값(예: 80%) 이상이면 음성인식 개시명령어로서 적합한 것으로 판단할 수 있다.

테스트 결과, 후보 명령어가 음성인식 개시명령어로서 적합하지 않다는 결과가 나오면(717의 아니오), 도 13에 도시된 바와 같이 사용자로부터 후보 명령어를 다시 입력받을 수도 있고, 사용자의 선택에 따라 명령어 생성을 종료할 수도 있다.

구체적으로, 테스트부의 테스트가 끝나면 도 14d에 도시된 바와 같이, 테스트 결과가 표시되고, 예를 들어 후보 명령어가 음성인식 개시명령어로서 등록이 가능하면 영상 출력부(121)에 '등록 가능'이라는 문구가 표시된다. 후보 명령어가 음성인식 개시명령어로 적합하지 않아 영상 출력부(121)에 '등록 불가능'이라는 문구가 표시되면 사용자는 새로운 후보 명령어를 다시 입력할 수 있다.

도 13 및 도 14는 음성인식 개시명령어의 생성에 관해 설명하였으나, 본 발명의 실시예는 이에 한정되지 않고 다른 제어명령의 생성에도 적용될 수 있으며, 영상장치(1)의 영상 출력부(121)는 명령어 생성을 진행시킬 수 있는 다양한 문구가 표시될 수 있다.

본 발명의 실시예에서와 같이 음성인식을 통해 사용자의 제어명령을 입력하게 되면, 사용자 입장에서는 입력버튼을 누르는 등의 동작을 취하지 않고 제어명령을 말하면 되기 때문에 편리하게 원하는 작업을 실행할 수 있다.

또한, 영상 출력부(121) 상에는 제어명령에 대응되는 아이콘이 표시된다. 예를 들어, '채널 업(channel up)' 아이콘, '채널 다운(channel down)' 아이콘, '볼륨 업(volume up)' 아이콘 및 '볼륨 다운(volume down)' 아이콘 등이 표시될 수 있다. 특히, 상기 아이콘들은 영상장치의 동작 중에 기본적으로 필요한 아이콘이기 때문에 영상 출력부(121)에 메인 화면이 표시될 때 영상 출력부(121)의 일부 영역에 표시된다.

영상 출력부(121)의 크기는 제한적이므로, 표시될 수 있는 아이콘의 개수에도 한계가 있는 바, 본 발명의 다른 측면에 따른 영상장치는 아이콘이 차지하는 면적을 효율적으로 관리하기 위해 복수의 제어명령어에 대응되는 하나의 아이콘을 표시한다.

이상에서는 본 발명의 일 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며 청구범위에서 청구하는 본 발명의 요지를 벗어남 없이 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의하여 다양한 변형실시가 가능함을 물론이고 이러한 변형실시들은 본 발명의 기술적 사상으로부터 개별적으로 이해되어져서는 아니될 것이다.

1: 영상장치 100: 사용자 입력부
110: 음성 입력부 220: 제어부
210: 음성 인식부 270: 명령어 생성부

Claims

음성 인식이 가능한 영상 표시 장치에 있어서,
컨텐츠를 표시하는 표시부;
외부 장치와 통신하는 통신부;
음향 신호를 출력하는 음향 출력부; 및
상기 외부 장치의 제어 신호의 수신에 응답하여, 상기 음성 인식을 시작하고 상기 음향 출력부를 통하여 출력되는 음향 신호의 출력 볼륨을 미리 정해진 레벨 이하로 감소시키는 제어부를 포함하고,
상기 음성 인식의 시작 이후 미리 정해진 제1 시간 동안 상기 외부 장치로부터 음성 제어 명령으로서의 음향 입력이 수신되지 않으면, 상기 제어부는 상기 음성 인식을 위한 음향 입력을 요청하는 메시지를 출력하고,
상기 음성 인식의 시작 이후 미리 정해진 제2 시간 동안 상기 외부 장치로부터 음성 제어 명령으로서의 음향 입력이 수신되지 않으면, 상기 제어부는 상기 음성 인식을 종료하고 상기 음향 출력부를 통하여 출력되는 음향 신호의 출력 볼륨을 상기 음성 인식의 시작 이전의 출력 볼륨으로 복원하는 영상 표시 장치.
제1항에 있어서,
상기 외부 장치는 원격 제어 장치를 포함하고,
상기 원격 제어 장치로부터 상기 제어 신호 및 상기 음성 제어 명령으로서의 음향 입력 중 적어도 하나를 수신하는 영상 표시 장치.
제1항에 있어서,
상기 제어부에 의하여 출력되는 상기 메시지는 상기 표시부에 표시되는 메시지 영상을 포함하는 영상 표시 장치.
제1항에 있어서,
상기 제어부에 의하여 출력되는 상기 메시지는 상기 음향 출력부에 의하여 출력되는 음향 메시지를 포함하는 영상 표시 장치.
제1항에 있어서,
상기 외부 장치로부터 상기 제어 신호의 수신에 응답하여, 상기 제어부는 상기 컨텐츠 상에 적어도 하나의 아이콘을 표시하도록 상기 표시부를 제어하고, 상기 적어도 하나의 아이콘 각각은 1 또는 2 이상의 음성 제어 명령에 대응될 수 있는 영상 표시 장치.
제5항에 있어서,
상기 외부 장치로부터 상기 음성 제어 명령으로서의 음향 입력의 수신에 응답하여, 상기 제어부는 상기 수신된 음성 제어 명령에 기초하여 상기 적어도 아이콘 중에 상기 수신된 음성 제어 명령에 대응하는 아이콘을 변경하도록 상기 표시부를 제어하는 영상 표시 장치.
제1항에 있어서,
상기 외부 장치로부터 상기 제어 신호의 재수신 또는 상기 음성 인식의 시작 이후 상기 외부 장치로부터 다른 제어 신호의 수신에 응답하여 상기 제어부는 상기 음성 인식을 종료하는 영상 표시 장치.
제1항에 있어서,
상기 외부 장치에 의하여 수신되는 미리 정해진 볼륨 이상의 음성에 응답하여 상기 제어부는 상기 제어 신호가 수신된 것으로 판단하는 영상 표시 장치.
제1항에 있어서,
상기 외부 장치로부터 후보 음성 제어 명령어의 수신에 응답하여, 상기 제어부는 상기 후보 음성 제어 명령어를 시험하고,
상기 시험 결과에 따라 상기 제어부는 상기 음성 제어 명령으로서 상기 후보 음성 제어 명령어를 등록하는 영상 표시 장치.
음성 인식이 가능한 영상 표시 장치의 제어 방법에 있어서,
상기 영상 표시 장치와 통신하는 외부 장치의 제어 신호의 수신에 응답하여, 상기 음성 인식을 시작하고 상기 영상 표시 장치의 음향 신호의 출력 볼륨을 미리 정해진 레벨 이하로 감소시키는 단계;
상기 음성 인식의 시작 이후 미리 정해진 제1 시간 동안 상기 외부 장치로부터 음성 제어 명령으로서의 음향 입력이 수신되지 않으면, 상기 음성 인식을 위한 음향 입력을 요청하는 메시지를 출력하는 단계; 및
상기 음성 인식의 시작 이후 미리 정해진 제2 시간 동안 상기 외부 장치로부터 음성 제어 명령으로서의 음향 입력이 수신되지 않으면, 상기 음성 인식을 종료하고 상기 음향 신호의 출력 볼륨을 상기 음성 인식의 시작 이전의 출력 볼륨으로 복원하는 단계를 포함하는 영상 표시 장치의 제어 방법.
제10항에 있어서,
상기 외부 장치는 원격 제어 장치를 포함하고,
상기 제어 신호의 수신은 상기 원격 제어 장치로부터 상기 제어 신호 및 음성 제어 명령으로서의 음향 입력 중 적어도 하나를 수신하는 것을 포함하는 영상 표시 장치의 제어 방법.
제10항에 있어서,
상기 메시지는 상기 영상 표시 장치에 표시되는 메시지 영상을 포함하는 영상 표시 장치의 제어 방법.
제10항에 있어서,
상기 메시지는 상기 영상 표시 장치에 의하여 출력되는 음향 메시지를 포함하는 영상 표시 장치의 제어 방법.
제10항에 있어서,
상기 외부 장치로부터 상기 제어 신호의 수신에 응답하여, 상기 영상 표시 장치에 표시되는 컨텐츠 상에 적어도 하나의 아이콘을 표시하는 단계를 더 포함하고,
상기 적어도 하나의 아이콘 각각은 1 또는 2 이상의 음성 제어 명령에 대응되는 영상 표시 장치의 제어 방법.
제14항에 있어서,
상기 외부 장치로부터 상기 음성 제어 명령으로서의 음향 입력의 수신에 응답하여, 상기 수신된 음성 제어 명령에 기초하여 상기 적어도 아이콘 중에 상기 수신된 음성 제어 명령에 대응하는 아이콘을 변경하는 단계를 더 포함하는 영상 표시 장치의 제어 방법.
제10항에 있어서,
상기 외부 장치로부터 상기 제어 신호의 재수신 또는 상기 음성 인식의 시작 이후 상기 외부 장치로부터 다른 제어 신호의 수신에 응답하여 상기 음성 인식을 종료하는 단계를 더 포함하는 영상 표시 장치의 제어 방법.
제10항에 있어서,
상기 제어 신호의 수신은 상기 외부 장치에 의하여 수신되는 미리 정해진 볼륨 이상의 음성에 응답하여 상기 제어 신호가 수신된 것으로 판단하는 것을 포함하는 영상 표시 장치의 제어 방법.
제10항에 있어서,
상기 외부 장치로부터 후보 음성 제어 명령어의 수신에 응답하여, 상기 후보 음성 제어 명령어를 시험하는 단계; 및
상기 시험 결과에 따라 상기 음성 제어 명령으로서 상기 후보 음성 제어 명령어를 등록하는 단계를 더 포함하는 영상 표시 장치의 제어 방법.
제1항에 있어서,
상기 음성 인식의 시작 시에 상기 음향 출력부를 통하여 출력되는 음향 신호의 출력 볼륨이 상기 미리 정해진 레벨보다 작으면 상기 제어부는 상기 음향 신호의 출력 볼륨을 유지하는 영상 표시 장치.
제10항에 있어서,
상기 음성 인식의 시작 시에 상기 음향 출력부를 통하여 출력되는 음향 신호의 출력 볼륨이 상기 미리 정해진 레벨보다 작으면 상기 음향 신호의 출력 볼륨을 유지하는 단계를 더 포함하는 영상 표시 장치의 제어 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제