KR20150144547A

KR20150144547A - 영상 표시 기기 및 그의 동작 방법

Info

Publication number: KR20150144547A
Application number: KR1020140073438A
Authority: KR
Inventors: 허승현
Original assignee: 엘지전자 주식회사
Priority date: 2014-06-17
Filing date: 2014-06-17
Publication date: 2015-12-28
Also published as: US10115395B2; EP3160151A4; US20170154625A1; EP3160151A1; EP3160151B1; KR102147329B1; WO2015194693A1

Abstract

본 발명의 실시 예에 따른 영상 표시 기기의 동작 방법은 영상 표시 기기에 연계된 하나 이상의 주변 기기에 음성 획득 명령 신호를 전송하는 단계; 상기 음성 획득 명령 신호를 수신한 하나 이상의 주변 기기가 획득한 사용자의 음성에 대한 하나 이상의 음성 신호 및 상기 영상 표시 기기가 획득한 상기 사용자의 음성에 대한 음성 신호를 수신하는 단계; 획득된 복수의 음성 신호를 비교하는 단계; 비교 결과를 기초로 음성 인식의 대상이 되는 음성 신호를 결정하는 단계; 결정된 음성 신호를 기초로 상기 사용자의 음성을 인식하는 단계; 및 인식된 음성에 대응하는 제어 동작을 수행하는 단계를 포함한다.

Description

영상 표시 기기 및 그의 동작 방법{VIDEO DISPLAY DEVICE AND OPERATING METHOD THEREOF}

본 발명은 영상 표시 기기 및 그의 동작 방법에 관한 것으로, 보다 상세하게는 사용자의 음성을 인식하고, 인식된 음성에 대응하는 제어 동작을 수행하는 영상 표시 기기 및 그의 동작 방법에 관한 것이다.

최근 들어, 유선 또는 무선 통신망을 이용한 디지털 TV 서비스가 보편화되고 있다. 디지털 TV 서비스는 기존의 아날로그 방송 서비스에서는 제공할 수 없었던 다양한 서비스를 제공할 수 있다.

예를 들어 디지털 TV 서비스의 한 종류인 IPTV(Internet Protocol Television) 서비스의 경우 사용자로 하여금 시청 프로그램의 종류, 시청 시간 등을 능동적으로 선택할 수 있도록 하는 양방향성을 제공한다. IPTV 서비스는 이러한 양방향성을 기반으로 하여 다양한 부가 서비스, 예컨대 인터넷 검색, 홈쇼핑, 온라인 게임 등을 제공할 수도 있다.

한편, 최근에는 음성 인식 기술이 TV에 적용되어, 사용자가 음성을 통해 TV의 동작을 제어할 수 있다. 하지만, 사용자가 음성 명령을 하는 위치가 TV와 멀게 되면, TV의 사용자의 음성을 제대로 인식하지 못할 수 있다. 이러한 문제를 해결하기 위해 TV의 리모컨에 마이크를 구비하여, 사용자가 리모컨에 구비된 마이크를 통해 음성 명령을 입력할 수 있으나, 사용자가 일일이 리모컨을 들고 음성 명령을 해야 하는 한계가 있다.

본 발명은 영상 표시 기기에 연계된 주변 기기로부터 사용자의 음성에 대한 복수의 음성 신호를 수신하여, 음성 인식률을 향상시키는데 목적이 있다.

또한, 본 발명은 복수의 주변 기기로부터 수신된 음성 신호 중에서 가장 품질 좋은 음성 신호를 기초로 사용자의 음성을 인식하는데 목적이 있다.

본 발명의 실시 예에 따른 영상 표시 기기는 사용자의 음성을 획득하는 음성 획득부; 상기 영상 표시 기기에 연계된 하나 이상의 주변 기기와 통신하는 통신부; 및 상기 주변 기기에 음성 획득 명령 신호를 전송하고, 상기 주변 기기가 획득한 사용자의 음성에 대한 하나 이상의 음성 신호 및 상기 음성 획득부가 획득한 음성 신호를 비교하고, 비교 결과를 기초로 음성 인식의 대상이 되는 음성 신호를 결정하고, 결정된 음성 신호를 기초로 상기 사용자의 음성을 인식하여, 인식된 음성에 대응하는 제어 동작을 수행하는 제어부를 포함한다.

본 발명의 다양한 실시 예에 따르면, 본 발명은 사용자 음성에 대한 복수의 음성 신호를 획득하고, 획득된 복수의 음성 신호를 기초로 사용자의 음성을 인식할 수 있다.

또한, 본 발명은 영상 표시 기기에 연계된 주변 기기로부터 사용자의 음성에 대한 음성 신호를 획득할 수 있어서, 원거리에 위치하는 사용자가 발화한 음성에 대한 음성 인식률을 향상시킬 수 있다.

도 1은 본 발명의 일 실시 예에 따른 영상 표시 기기의 구성을 블록도로 도시한 것이다.
도 2은 본 발명의 일 실시 예에 따른 원격제어장치의 블록도이다.
도 3은 본 발명의 일 실시 예에 따른 원격제어장치의 실제 구성 예를 보여준다.
도 4는 본 발명의 일 실시 예에 따른 단말기의 블록도이다.
도 5는 본 발명의 일 실시 예에 따른 영상 표시 기기의 동작 방법을 나타내는 흐름도이다.
도 6은 본 발명의 일 실시예에 따른 영상 표시 기기의 동작 방법을 나타내는 예시도이다.
도 7은 본 발명의 일 실시예에 따른 영상 표시 기기의 사용자 음성에 대한 음성 신호 획득을 나타내는 예시도이다.
도 8은 본 발명의 일 실시예에 따른 영상 표시 기기의 사용자 음성 획득에 대한 정보 표시를 나타낸다.
도 9 내지 도 10은 본 발명의 일 실시예에 따른 영상 표시 기기의 사용자 음성 획득에 대한 정보 표시를 나타낸다.
도 11a 내지 도 11c는 본 발명의 일 실시예에 따른 획득된 음성 신호의 파형을 나타낸다.
도 12는 본 발명의 일 실시예에 따른 발화자에 대한 표시를 나타낸다.
도 13은 본 발명의 일 실시예에 따른 복수의 발화자에 대한 표시를 나타낸다.
도 14는 본 발명의 일 실시예에 따른 사용자의 음성 신호 획득을 나타내는 예시도이다.

이하, 본 발명과 관련된 실시 예에 대하여 도면을 참조하여 보다 상세하게 설명한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.

이하, 첨부된 도면을 참조하여 본 발명의 실시 예에 따른 화면 표시 제어 방법 및 그를 이용한 영상 표시 기기에 관하여 상세히 설명한다.

본 발명의 실시 예에 따른 영상 표시 기기는, 예를 들어 방송 수신 기능에 컴퓨터 지원 기능을 추가한 지능형 영상 표시 기기로서, 방송 수신 기능에 충실하면서도 인터넷 기능 등이 추가되어, 수기 방식의 입력 장치, 터치 스크린 또는 공간 리모콘 등 보다 사용에 편리한 인터페이스를 갖출 수 있다. 그리고, 유선 또는 무선 인터넷 기능의 지원으로 인터넷 및 컴퓨터에 접속되어, 이메일, 웹브라우징, 뱅킹 또는 게임 등의 기능도 수행 가능하다. 이러한 다양한 기능을 위해 표준화된 범용 OS가 사용될 수 있다.

따라서, 본 발명에서 기술되는 영상 표시 기기는, 예를 들어 범용의 OS 커널 상에, 다양한 애플리케이션이 자유롭게 추가되거나 삭제 가능하므로, 사용자 친화적인 다양한 기능이 수행될 수 있다. 상기 영상 표시 기기는, 보다 구체적으로 예를 들면, 네트워크 TV, HBBTV, 스마트 TV, LED TV, OLED TV 등이 될 수 있으며, 경우에 따라 스마트폰에도 적용 가능하다.

도 1은 본 발명의 일 실시예에 따른 영상 표시 기기의 구성을 블록도로 도시한 것이다.

도 1을 참조하면, 영상 표시 기기(100)는 음성 획득부(110), 영상 획득부(120), 방송 수신부(130), 외부 장치 인터페이스부(135), 저장부(140), 사용자입력 인터페이스부(150), 통신부(160), 제어부(170), 디스플레이부(180), 오디오 출력부(185), 전원공급부(190)를 포함할 수 있다.

음성 획득부(110)는 음성을 획득할 수 있다.

음성 획득부(110)는 적어도 하나 이상의 마이크를 포함할 수 있어서, 포함된 마이크를 통해 음성을 획득할 수 있다.

그리고 음성 획득부(110)는 획득된 음성을 제어부(170)에 전달할 수 있다.

영상 획득부(120)는 영상을 획득할 수 있다.

영상 획득부(120)는 적어도 하나 이상의 카메라를 포함할 수 있어서, 포함된 카메라를 통해 영상을 획득할 수 있다.

그리고 영상 획득부(120)는 획득한 영상을 제어부(170)에 전달할 수 있다.

한편, 방송 수신부(130)는 튜너(131), 복조부(132) 및 네트워크 인터페이스부(133)를 포함할 수 있다.

외부 장치 인터페이스부(135)는 인접하는 외부 장치 내의 애플리케이션 또는 애플리케이션 목록을 수신하여, 제어부(170) 또는 저장부(140)로 전달할 수 있다.

외부 장치 인터페이스부(135)는 외부 장치와 연결하기 위한 단자(terminal)를 포함할 수 있어서, 외부 장치의 커넥터(connecter)와 연결될 수 있다.

외부 장치 인터페이스부(135)는 전원 공급부(190)로부터 공급받은 전원을 연결된 외부 장치에 구동 전원으로 공급할 수 있다.

또한, 외부 장치 인터페이스부(135)는 외부 장치가 송신한 동작 신호를 제어부(170)에 전달할 수 있다.

이와 반대로, 외부 장치 인터페이스부(135)는 제어부(170)가 송신한 음성 신호를 연결된 외부 장치에 전달할 수 있다.

한편, 외부 장치 인터페이스부(135)는 외부 장치의 연결을 감지할 수 있는 센서가 포함될 수 있어서, 외부 장치의 연결을 인식할 수 있다.

네트워크 인터페이스부(133)는 영상 표시 기기(100)를 인터넷망을 포함하는 유/무선 네트워크와 연결하기 위한 인터페이스를 제공할 수 있다. 네트워크 인터페이스부(133)는 접속된 네트워크 또는 접속된 네트워크에 링크된 다른 네트워크를 통해, 다른 사용자 또는 다른 전자 기기와 데이터를 송신 또는 수신할 수 있다.

또한, 영상 표시 기기(100)에 미리 등록된 다른 사용자 또는 다른 전자 기기 중 선택된 사용자 또는 선택된 전자기기에, 영상 표시 기기(100)에 저장된 일부의 컨텐츠 데이터를 송신할 수 있다.

네트워크 인터페이스부(133)는 접속된 네트워크 또는 접속된 네트워크에 링크된 다른 네트워크를 통해, 소정 웹 페이지에 접속할 수 있다. 즉, 네트워크를 통해 소정 웹 페이지에 접속하여, 해당 서버와 데이터를 송신 또는 수신할 수 있다.

그리고 네트워크 인터페이스부(133)는 컨텐츠 제공자 또는 네트워크 운영자가 제공하는 컨텐츠 또는 데이터들을 수신할 수 있다. 즉, 네트워크 인터페이스부(133)는 네트워크를 통하여 컨텐츠 제공자 또는 네트워크 제공자로부터 제공되는 영화, 광고, 게임, VOD, 방송 신호 등의 컨텐츠 및 그와 관련된 정보를 수신할 수 있다.

또한, 네트워크 인터페이스부(133)는 네트워크 운영자가 제공하는 펌웨어의 업데이트 정보 및 업데이트 파일을 수신할 수 있으며, 인터넷 또는 컨텐츠 제공자 또는 네트워크 운영자에게 데이터들을 송신할 수 있다.

네트워크 인터페이스부(133)는 네트워크를 통해, 공중에 공개(open)된 애플리케이션들 중 원하는 애플리케이션을 선택하여 수신할 수 있다.

저장부(140)는 제어부(170) 내의 각 신호 처리 및 제어를 위한 프로그램이 저장하고, 신호 처리된 영상, 음성 또는 데이터신호를 저장할 수 있다.

또한, 저장부(140)는 외부 장치 인터페이스부(135) 또는 네트워크 인터페이스부(133)로부터 입력되는 영상, 음성, 또는 데이터 신호의 임시 저장을 위한 기능을 수행할 수도 있으며, 채널 기억 기능을 통하여 소정 이미지에 관한 정보를 저장할 수도 있다.

저장부(140)는 외부 장치 인터페이스부(135) 또는 네트워크 인터페이스부(133)로부터 입력되는 애플리케이션 또는 애플리케이션 목록을 저장할 수 있다.

영상 표시 기기(100)는 저장부(140) 내에 저장되어 있는 컨텐츠 파일(동영상 파일, 정지영상 파일, 음악 파일, 문서 파일, 애플리케이션 파일 등)을 재생하여 사용자에게 제공할 수 있다.

사용자입력 인터페이스부(150)는 사용자가 입력한 신호를 제어부(170)로 전달하거나, 제어부(170)로부터의 신호를 사용자에게 전달할 수 있다. 예를 들어, 사용자입력 인터페이스부(150)는 블루투스(Bluetooth), WB(Ultra Wideband), 지그비(ZigBee) 방식, RF(Radio Frequency) 통신 방식 또는 적외선(IR) 통신 방식 등 다양한 통신 방식에 따라, 원격제어장치(200)로부터 전원 온/오프, 채널 선택, 화면 설정 등의 제어 신호를 수신하여 처리하거나, 제어부(170)로부터의 제어 신호를 원격제어장치(200)로 송신하도록 처리할 수 있다.

또한, 사용자입력 인터페이스부(150)는, 전원키, 채널키, 볼륨키, 설정치 등의 로컬키(미도시)에서 입력되는 제어 신호를 제어부(170)에 전달할 수 있다.

통신부(160)는 영상 표시 기기(100)와 네트워크 또는 영상 표시 기기(100)와 주변 기기가 유선 통신 또는 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 여기서 주변 기기는 후술할 원격제어장치(200), 단말기(300) 중 하나 이상을 포함할 수 있다.

예를 들면, 통신부(160)는 인터넷 접속을 위한 인터넷 모듈을 포함할 수 있으며, 인터넷 모듈을 통해 유선 또는 무선 통신을 통해 영상 표시 기기(100)가 인터넷에 접속할 수 있도록 할 수 있다.

다른 예를 들면, 통신부(160)는 영상 표시 기기(100)와 다른 기기가 무선 통신할 수 있도록 근거리 통신 모듈을 포함할 수 있다. 일 실시예로 통신부(160)에 포함된 근거리 통신 모듈은 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), ZigBee, AN(Wireless LAN)(Wi-Fi) 등을 이용할 수 있다.

제어부(170)에서 영상 처리된 영상 신호는 디스플레이부(180)로 입력되어 해당 영상 신호에 대응하는 영상으로 표시될 수 있다. 또한, 제어부(170)에서 영상 처리된 영상 신호는 외부 장치 인터페이스부(135)를 통하여 외부 출력장치로 입력될 수 있다.

제어부(170)에서 처리된 음성 신호는 오디오 출력부(185)로 오디오 출력될 수 있다. 또한, 제어부(170)에서 처리된 음성 신호는 외부 장치 인터페이스부(135)를 통하여 외부 장치로 입력될 수 있다.

그 외, 제어부(170)는, 영상 표시 기기(100) 내의 전반적인 동작을 제어할 수 있다.

제어부(170)는 외부 장치 인터페이스부(135)로부터 외부 장치의 연결에 대한 감지 신호를 입력받아, 외부 장치 인터페이스부(135)를 통해 연결된 외부 장치에 구동 전원이 전달되도록 전원 공급부(190)를 제어할 수 있다.

또한, 제어부(170)는 음성 획득부(110)를 통해 획득한 음성을 인식하여, 인식된 음성에 대응하는 제어 동작을 수행할 수 있다.

그리고 제어부(170)는 사용자의 음성에 대한 복수의 음성 신호를 비교하고, 가장 품질 좋은 음성 신호의 음성을 인식하여, 인식된 음성에 대응하는 제어 동작을 수행할 수 있다.

제어부(170)는 복수의 마이크가 구비된 음성 획득부(110)로부터 획득된 복수의 음성을 비교하여 사용자의 위치를 판단할 수 있다. 구체적으로 제어부(170)는 복수의 마이크 각각이 획득한 음성을 비교하여, 음성을 발화한 사용자의 위치를 판단할 수 있다.

한편, 제어부(170)는 사용자입력 인터페이스부(150)를 통하여 입력된 사용자 명령 또는 내부 프로그램에 의하여 영상 표시 기기(100)를 제어할 수 있으며, 네트워크에 접속하여 사용자가 원하는 애플리케이션 또는 애플리케이션 목록을 영상 표시 기기(100) 내로 다운받을 수 있도록 할 수 있다.

제어부(170)는 사용자가 선택한 채널 정보 등이 처리한 영상 또는 음성신호와 함께 디스플레이부(180) 또는 오디오 출력부(185)를 통하여 출력될 수 있도록 한다.

또한, 제어부(170)는 사용자입력 인터페이스부(150)를 통하여 수신한 외부 장치 영상 재생 명령에 따라, 외부 장치 인터페이스부(135)를 통하여 입력되는 외부 장치, 예를 들어, 카메라 또는 캠코더로부터의, 영상 신호 또는 음성 신호가 디스플레이부(180) 또는 오디오 출력부(185)를 통해 출력될 수 있도록 한다.

한편, 제어부(170)는 영상을 표시하도록 디스플레이부(180)를 제어할 수 있으며, 예를 들어 튜너(131)를 통해 입력되는 방송 영상, 또는 외부 장치 인터페이스부(135)를 통해 입력되는 외부 입력 영상, 또는 네트워크 인터페이스부를 통해 입력되는 영상, 또는 저장부(140)에 저장된 영상이 디스플레이부(180)에서 표시되도록 제어할 수 있다. 이 경우, 디스플레이부(180)에 표시되는 영상은 정지 영상 또는 동영상일 수 있으며, 2D 영상 또는 3D 영상일 수 있다.

또한, 제어부(170)는 영상 표시 기기(100) 내에 저장된 컨텐츠, 또는 수신된 방송 컨텐츠, 외부로 부터 입력되는 외부 입력 컨텐츠가 재생되도록 제어할 수 있으며, 상기 컨텐츠는 방송 영상, 외부 입력 영상, 오디오 파일, 정지 영상, 접속된 웹 화면, 및 문서 파일 등 다양한 형태일 수 있다.

디스플레이부(180)는 제어부(170)에서 처리된 영상 신호, 데이터 신호, OSD 신호 또는 외부 장치 인터페이스부(135)에서 수신되는 영상 신호, 데이터 신호 등을 각각 R,G,B 신호로 변환하여 구동 신호를 생성할 수 있다.

한편, 도 1에 도시된 영상 표시 기기(100)는 본 발명의 일실시예에 불과하므로. 도시된 구성요소들 중 일부는 실제 구현되는 영상 표시 기기(100)의 사양에 따라 통합, 추가, 또는 생략될 수 있다.

즉, 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분되어 구성될 수 있다. 또한, 각 블록에서 수행하는 기능은 본 발명의 실시예를 설명하기 위한 것이며, 그 구체적인 동작이나 장치는 본 발명의 권리범위를 제한하지 아니한다.

본 발명의 또 다른 실시예에 따르면, 영상 표시 기기(100)는 도 1에 도시된 바와 달리, 튜너(131)와 복조부(132)를 구비하지 않고 네트워크 인터페이스부(133) 또는 외부 장치 인터페이스부(135)를 통해서 영상을 수신하여 재생할 수도 있다.

예를 들어, 영상 표시 기기(100)는 방송 신호 또는 다양한 네트워크 서비스에 따른 컨텐츠들을 수신하기 위한 등과 같은 셋탑 박스 등과 같은 영상 처리 장치와 상기 영상 처리 장치로부터 입력되는 컨텐츠를 재생하는 컨텐츠 재생 장치로 분리되어 구현될 수 있다.

이 경우, 이하에서 설명할 본 발명의 실시예에 따른 이미지 표시 방법은 도 1을 참조하여 설명한 바와 같은 영상 표시 기기(100)뿐 아니라, 상기 분리된 셋탑 박스 등과 같은 영상 처리 장치 또는 디스플레이부(180) 및 오디오출력부(185)를 구비하는 컨텐츠 재생 장치 중 어느 하나에 의해 수행될 수도 있다.

다음으로, 도 2 내지 도 3을 참조하여, 본 발명의 일 실시 예에 따른 원격제어장치에 대해 설명한다.

도 2는 본 발명의 일 실시 예에 따른 원격제어장치의 블록도이고, 도 3은 본 발명의 일 실시 예에 따른 원격제어장치(200)의 실제 구성 예를 보여준다.

먼저, 도 2를 참조하면, 원격제어장치(200)는 무선통신부(220), 사용자 입력부(230), 센서부(240), 출력부(250), 전원공급부(260), 저장부(270), 제어부(280), 음성 획득부(290)를 포함할 수 있다.

도 2를 참조하면, 무선통신부(220)는 전술하여 설명한 본 발명의 실시 예들에 따른 영상표시기기 중 임의의 어느 하나와 신호를 송수신한다.

원격제어장치(200)는 RF 통신규격에 따라 영상표시기기(100)와 신호를 송수신할 수 있는 RF 모듈(221)을 구비하며, IR 통신규격에 따라 영상표시기기(100)와 신호를 송수신할 수 있는 IR 모듈(223)을 구비할 수 있다. 또한, 원격제어장치(200)는 블루투스 통신규격에 따라 영상표시기기(100)와 신호를 송수신할 수 있는 블루투스 모듈(225)를 구비할 수 있다.

또한, 원격제어장치(200)는 영상표시기기(100)로 원격제어장치(200)의 움직임 등에 관한 정보가 담긴 신호를 RF 모듈(221) 또는 블루투스 모듈(225)를 통하여 전송한다.

한편, 원격제어장치(200)는 영상표시기기(100)가 전송한 신호를 RF 모듈(221) 또는 블루투스 모듈(225)를 통하여 수신할 수 있으며, 필요에 따라 IR 모듈(223) 또는 블루투스 모듈(225)를 통하여 영상표시기기(100)로 전원 온/오프, 채널 변경, 볼륨 변경 등에 관한 명령을 전송할 수 있다.

사용자 입력부(230)는 키패드, 버튼, 터치 패드, 또는 터치 스크린 등으로 구성될 수 있다. 사용자는 사용자 입력부(230)를 조작하여 원격제어장치(200)으로 영상표시기기(100)와 관련된 명령을 입력할 수 있다. 사용자 입력부(230)가 하드키 버튼을 구비할 경우 사용자는 하드키 버튼의 푸쉬 동작을 통하여 원격제어장치(200)으로 영상표시기기(100)와 관련된 명령을 입력할 수 있다. 이에 대해서는 도 3을 참조하여 설명한다.

도 3을 참조하면, 원격제어장치(200)는 복수의 버튼을 포함할 수 있다. 복수의 버튼은 전원 버튼(231), 채널 버튼(233), 음성 인식 버튼(235) 및 LIVE 버튼(237)을 포함할 수 있다.

전원 버튼(231)은 영상 표시 기기(100)의 전원을 온/오프 하기 위한 버튼일 수 있다.

채널 버튼(233)은 특정 방송 채널의 방송 신호를 수신하기 위한 버튼일 수 있다.

음성 인식 버튼(235)은 사용자의 음성을 인식하기 위한 버튼일 수 있다.

LIVE 버튼(297)은 실시간 방송 프로그램을 디스플레이 하기 위한 버튼일 수 있다.

다시 도 2를 설명한다.

사용자 입력부(230)가 터치스크린을 구비할 경우 사용자는 터치스크린의 소프트키를 터치하여 원격제어장치(200)로 영상표시기기(100)와 관련된 명령을 입력할 수 있다. 또한, 사용자 입력부(230)는 스크롤 키나, 조그 키 등 사용자가 조작할 수 있는 다양한 종류의 입력수단을 구비할 수 있으며 본 실시예는 본 발명의 권리범위를 제한하지 아니한다.

센서부(240)는 자이로 센서(241) 또는 가속도 센서(243)를 구비할 수 있으며, 자이로 센서(241)는 원격제어장치(200)의 움직임에 관한 정보를 센싱할 수 있다.

예를 들어, 자이로 센서(241)는 원격제어장치(200)의 동작에 관한 정보를 x,y,z 축을 기준으로 센싱할 수 있으며, 가속도 센서(243)는 원격제어장치(200)의 이동속도 등에 관한 정보를 센싱할 수 있다. 한편, 원격제어장치(200)는 거리측정센서를 더 구비할 수 있어, 영상 표시 기기(100)의 디스플레이부(180)와의 거리를 센싱할 수 있다.

출력부(250)는 사용자 입력부(235)의 조작에 대응하거나 영상표시기기(100)에서 전송한 신호에 대응하는 영상 또는 음성 신호를 출력할 수 있다. 출력부(250)를 통하여 사용자는 사용자 입력부(235)의 조작 여부 또는 영상표시기기(100)의 제어 여부를 인지할 수 있다.

예를 들어, 출력부(250)는 사용자 입력부(230)가 조작되거나 무선 통신부(220)를 통하여 영상표시기기(100)와 신호가 송수신되면 점등되는 LED 모듈(251), 진동을 발생하는 진동 모듈(253), 음향을 출력하는 음향 출력 모듈(255), 또는 영상을 출력하는 디스플레이 모듈(257)을 구비할 수 있다.

또한, 전원공급부(260)는 원격제어장치(200)으로 전원을 공급하며, 원격제어장치(200)이 소정 시간 동안 움직이지 않은 경우 전원 공급을 중단함으로서 전원 낭비를 줄일 수 있다. 전원공급부(260)는 원격제어장치(200)에 구비된 소정 키가 조작된 경우에 전원 공급을 재개할 수 있다.

저장부(270)는 원격제어장치(200)의 제어 또는 동작에 필요한 여러 종류의 프로그램, 애플리케이션 데이터 등이 저장될 수 있다. 만일 원격제어장치(200)가 영상표시기기(100)와 RF 모듈(221)을 통하여 무선으로 신호를 송수신할 경우 원격제어장치(200)과 영상표시기기(100)는 소정 주파수 대역을 통하여 신호를 송수신한다.

원격제어장치(200)의 제어부(280)는 원격제어장치(200)과 페어링된 영상표시기기(100)와 신호를 무선으로 송수신할 수 있는 주파수 대역 등에 관한 정보를 저장부(270)에 저장하고 참조할 수 있다.

제어부(280)는 원격제어장치(200)의 제어에 관련된 제반사항을 제어한다. 제어부(280)는 사용자 입력부(230)의 소정 키 조작에 대응하는 신호 또는 센서부(240)에서 센싱한 원격제어장치(200)의 움직임에 대응하는 신호를 무선 통신부(220)를 통하여 영상표시기기(100)로 전송할 수 있다.

또한, 원격제어장치(200)의 음성 획득부(290)는 음성을 획득할 수 있다.

음성 획득부(290)는 적어도 하나 이상의 마이크(291)을 포함할 수 있어서, 포함된 마이크(291)를 통해 음성을 획득할 수 있다.

그리고 음성 획득부(290)는 획득된 음성을 제어부(280)에 전달할 수 있다.

도 3을 참조하면, 음성 획득부(290)는 원격제어장치(200)의 전면에 구비된 마이크(291)를 포함할 수 있어서, 마이크(291)를 통해 음성을 획득할 수 있다.

또한 음성 획득부(290)는 복수의 마이크(291)를 포함할 수 있어서, 복수의 마이크(291) 각각을 통해 음성을 획득할 수도 있다.

일 실시예로, 원격제어장치(200)의 전면, 측면, 후면 중 하나 이상에 마이크(291)가 구비되어, 음성 획득부(290)는 구비된 하나 이상의 마이크(291)를 통해 음성을 획득할 수 있다.

다음으로, 도 4를 참조하여, 본 발명의 일 실시 예에 따른 단말기(300)에 대해 설명한다.

도 4는 본 발명의 일 실시 예에 따른 단말기(300)의 블록도이다.

도 4를 참조하면, 단말기(300)는 무선 통신부(310), A/V(Audio/Video) 입력부(320), 사용자 입력부(330), 센싱부(340), 출력부(350), 메모리(360), 인터페이스부(370), 제어부(380) 및 전원 공급부(390) 등을 포함할 수 있다. 도 4에 도시된 구성요소들이 필수적인 것은 아니어서, 그보다 많은 구성요소들을 갖거나 그보다 적은 구성요소들을 갖는 단말기가 구현될 수도 있다.

이하, 상기 구성요소들에 대해 차례로 살펴본다.

무선 통신부(310)는 단말기(300)와 네트워크 사이 또는 단말기(300)와 영상 표시 기기(100) 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 예를 들면 무선 통신부(310)는 방송 수신 모듈, 이동통신 모듈, 무선 인터넷 모듈, 근거리 통신 모듈, 위치정보 모듈 중 하나 이상을 포함할 수 있다.

A/V(Audio/Video) 입력부(320)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(321)와 마이크(322) 등이 포함될 수 있다. 카메라(321)는 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(351)에 표시될 수 있다.

카메라(321)에서 처리된 화상 프레임은 메모리(360)에 저장되거나 무선 통신부(310)를 통하여 외부로 전송될 수 있다. 카메라(321)는 사용 환경에 따라 2개 이상이 구비될 수도 있다.

마이크(322)는 통화모드 또는 녹음모드, 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 음향 신호를 입력받아 전기적인 음성 데이터로 처리한다. 처리된 음성 데이터는 통화 모드인 경우 무선 통신부(310)를 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크(322)에는 외부의 음향 신호를 입력받는 과정에서 발생되는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다. 마이크(322)는 사용 환경에 따라 2개 이상이 구비될 수도 있다.

사용자 입력부(330)는 사용자가 단말기(300)의 동작 제어를 위한 입력 데이터를 발생시킨다. 사용자 입력부(330)는 키 패드(key pad) 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠, 조그 스위치 등으로 구성될 수 있다.

센싱부(340)는 단말기(300)의 개폐 상태, 단말기(300)의 위치, 사용자 접촉 유무, 이동 단말기의 방위, 이동 단말기의 가속/감속 등과 같이 단말기(300)의 현 상태를 감지하여 단말기(300)의 동작을 제어하기 위한 센싱 신호를 발생시킨다. 예를 들어 단말기(300)가 슬라이드 폰 형태인 경우 슬라이드 폰의 개폐 여부를 센싱할 수 있다. 또한, 전원 공급부(390)의 전원 공급 여부, 인터페이스부(370)의 외부 기기 결합 여부 등을 센싱할 수도 있다.

한편, 상기 센싱부(340)는 근접 센서(341)를 포함할 수 있다.

출력부(350)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 이에는 디스플레이부(351), 음향 출력 모듈(352), 알람부(353), 및 햅틱 모듈(354) 등이 포함될 수 있다.

디스플레이부(351)는 단말기(300)에서 처리되는 정보를 표시(출력)한다. 예를 들어, 이동 단말기가 통화 모드인 경우 통화와 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다. 단말기(300)가 화상 통화 모드 또는 촬영 모드인 경우에는 촬영 또는/및 수신된 영상 또는 UI, GUI를 표시한다.

디스플레이부(351)는 액정 디스플레이(liquid crystal display, LCD), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display, TFT LCD), 유기 발광 다이오드(organic light-emitting diode, OLED), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 중에서 적어도 하나를 포함할 수 있다.

디스플레이부(351)와 터치 동작을 감지하는 센서(이하, '터치 센서'라 함)(344)가 상호 레이어 구조를 이루는 경우(이하, '터치 스크린'이라 함)에, 디스플레이부(351)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 터치 센서(344)는, 예를 들어, 터치 필름, 터치 시트, 터치 패드 등의 형태를 가질 수 있다.

터치 센서(344)는 디스플레이부(351)의 특정 부위에 가해진 압력 또는 디스플레이부(351)의 특정 부위에 발생하는 정전 용량 등의 변화를 전기적인 입력신호로 변환하도록 구성될 수 있다. 터치 센서(344)는 터치 되는 위치 및 면적뿐만 아니라, 터치 시의 압력까지도 검출할 수 있도록 구성될 수 있다.

터치 센서(344)에 대한 터치 입력이 있는 경우, 그에 대응하는 신호(들)는 터치 제어기로 보내진다. 터치 제어기는 그 신호(들)를 처리한 다음 대응하는 데이터를 제어부(380)로 전송한다. 이로써, 제어부(380)는 디스플레이부(351)의 어느 영역이 터치 되었는지 여부 등을 알 수 있게 된다.

음향 출력 모듈(352)은 호신호 수신, 통화모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(310)로부터 수신되거나 메모리(360)에 저장된 오디오 데이터를 출력할 수 있다. 음향 출력 모듈(352)은 단말기(300)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력하기도 한다. 이러한 음향 출력 모듈(352)에는 리시버(Receiver), 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다.

알람부(353)는 단말기(300)의 이벤트 발생을 알리기 위한 신호를 출력한다. 이동 단말기에서 발생 되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력, 터치 입력 등이 있다. 알람부(353)는 비디오 신호나 오디오 신호 이외에 다른 형태, 예를 들어 진동으로 이벤트 발생을 알리기 위한 신호를 출력할 수도 있다. 상기 비디오 신호나 오디오 신호는 디스플레이부(351)나 음성 출력 모듈(352)을 통해서도 출력될 수 있어서, 그들(351,352)은 알람부(353)의 일부로 분류될 수도 있다.

햅틱 모듈(haptic module)(354)은 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(354)이 발생시키는 촉각 효과의 대표적인 예로는 진동이 있다. 햅택 모듈(354)이 발생하는 진동의 세기와 패턴 등은 제어가능하다. 예를 들어, 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다.

메모리(360)는 제어부(380)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)을 임시 저장할 수도 있다. 상기 메모리(360)는 상기 터치스크린 상의 터치 입력시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.

메모리(360)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 단말기(300)는 인터넷(internet)상에서 상기 메모리(360)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다.

인터페이스부(370)는 단말기(300)에 연결되는 모든 외부기기와의 통로 역할을 한다. 인터페이스부(370)는 외부 기기로부터 데이터를 전송받거나, 전원을 공급받아 단말기(300) 내부의 각 구성 요소에 전달하거나, 단말기(300) 내부의 데이터가 외부 기기로 전송되도록 한다. 예를 들어, 유/무선 헤드셋 포트, 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 식별 모듈이 구비된 장치를 연결하는 포트, 오디오 I/O(Input/Output) 포트, 비디오 I/O(Input/Output) 포트, 이어폰 포트 등이 인터페이스부(370)에 포함될 수 있다.

식별 모듈은 단말기(300)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(User Identify Module, UIM), 가입자 인증 모듈(Subscriber Identity Module, SIM), 범용 사용자 인증 모듈(Universal Subscriber Identity Module, USIM) 등을 포함할 수 있다. 식별 모듈이 구비된 장치(이하 '식별 장치')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 장치는 포트를 통하여 단말기(300)와 연결될 수 있다.

제어부(controller, 380)는 통상적으로 단말기(300)의 전반적인 동작을 제어한다. 예를 들어 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 제어부(380)는 멀티 미디어 재생을 위한 멀티미디어 모듈(381)을 구비할 수도 있다. 멀티미디어 모듈(381)은 제어부(380) 내에 구현될 수도 있고, 제어부(380)와 별도로 구현될 수도 있다.

상기 제어부(380)는 상기 터치스크린 상에서 행해지는 필기 입력 또는 그림 그리기 입력을 각각 문자 및 이미지로 인식할 수 있는 패턴 인식 처리를 행할 수 있다.

전원 공급부(390)는 제어부(380)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.

이하, 도 5 및 도 6을 참조하여, 영상 표시 기기(100)의 동작 방법을 설명한다.

도 5는 본 발명의 일 실시 예에 따른 영상 표시 기기(100)의 동작 방법을 나타내는 흐름도이다.

도 6은 본 발명의 일 실시 예에 따른 영상 표시 기기(100)의 동작 방법을 나타내는 예시도이다.

도 5를 참조하면, 영상 표시 기기(100)는 사용자의 음성을 인식하기 위한 트리거 음성을 인식한다(S101).

영상 표시 기기(100)는 음성 획득부(110)를 통해 사용자의 음성을 획득하여, 획득된 사용자의 음성에서 사용자의 음성을 인식하기 위한 트리거 음성을 인식할 수 있다.

여기서 트리거 음성이란, 영상 표시 기기(100)가 특정한 동작 또는 특정한 모드로 진입하기 위한 음성일 수 있다.

일 실시예로, 영상 표시 기기(100)는 기 설정된 트리거 음성인 "Ok, TV"가 포함된 음성을 획득할 수 있고, 획득된 음성을 트리거 음성으로 인식할 수 있다.

구체적으로, 영상 표시 기기(100)는 음성 획득부(110)를 통해 사용자가 발화한 음성을 획득할 수 있다. 영상 표시 기기(100)의 음성 획득부(110)는 획득된 음성을 제어부(170)에 전달할 수 있다. 제어부(170)는 획득된 음성을 인식하여, 인식된 음성을 기 저장된 트리거 음성과 비교할 수 있다. 제어부(170)는 인식된 음성이 기 저장된 트리거 음성과 동일하면, 획득된 음성을 트리거 음성으로 판단할 수 있다. 이에 따라, 영상 표시 기기(100)는 획득한 음성에서 트리거 음성을 인식할 수 있다.

도 6을 참조하여, 상술한 영상 표시 기기(100)의 트리거 음성 인식에 대해 상세히 설명한다.

도 6을 참조하면, 영상 표시 기기(100)의 음성 획득부(110)는 사용자의 "Ok, TV"라는 트리거 음성을 획득할 수 있다. 음성 획득부(110)는 영상 표시 기기(100)의 제어부(170)에 포함된 키 핸들러(171)에 획득된 트리거 음성을 전달할 수 있다. 키 핸들러(171)는 전달받은 트리거 음성인 "Ok, TV"라는 트리거 음성을 인식할 수 있다. 여기서 트리거 음성은 기 설정된 음성일 수 있다.한편, 영상 표시 기기(100)가 트리거 음성을 인식하는 단계 S101은 필요에 따라 생략될 수 있다.

다시 도 5를 참조한다.

영상 표시 기기(100)는 연계된 원격제어장치(200), 단말기(300) 중 하나 이상으로부터 음성 획득 명령 신호를 전송한다(S103).

영상 표시 기기(100)는 연계된 주변 기기인 원격제어장치(200), 단말기(300) 중 하나 이상의 기기가 사용자의 음성을 획득하도록 하는 신호인 음성 획득 명령 신호를 전송할 수 있다.

구체적으로, 영상 표시 기기(100)의 제어부(170)는 인식된 트리거 음성을 기초로, 음성 획득 명령 신호를 생성할 수 있다. 영상 표시 기기(100)의 통신부(160)는 생성된 음성 획득 명령 신호를 연계된 주변 기기인 원격제어장치(200), 단말기(300) 중 하나 이상에 전송할 수 있다. 이에 따라, 음성 획득 명령 신호를 수신한 원격제어장치(200), 단말기(300) 중 하나 이상의 주변 기기는 사용자의 음성을 획득할 수 있다.

도 6을 참조하여, 상술한 영상 표시 기기(100)의 음성 획득 명령 신호 전송에 대해 상세히 설명한다.

도 6을 참조하면, 키 핸들러(171)는 제어부(170)에 포함된 컨트롤 매니저(173)에 트리거 음성 인식 신호를 전달할 수 있다. 여기서 트리거 음성 인식 신호는 트리거 음성이 인식되었음을 알리는 신호일 수 있다. 컨트롤 매니저(173)는 트리거 음성 인식 신호를 기초로, 음성 획득부(110) 및 원격제어장치(200)에 사용자의 음성을 획득하도록 하는 신호인 음성 획득 명령 신호를 전송할 수 있다. 이에 따라 영상 표시 기기(100)는 통신부(160)를 통해 원격제어장치(200)에 음성 획득 명령 신호를 전송할 수 있다. 원격제어장치(200)의 블루투스 모듈(225)은 영상 표시 기기(100)의 통신부(160)로부터 음성 획득 명령 신호를 전달받을 수 있다. 블루투스 모듈(225)는 음성 획득 명령 신호를 제어부(280)에 전달할 수 있다. 그리고 제어부(280)는 음성 획득부(290)에 음성 획득 명령 신호를 전달하여, 음성 획득부(290)가 사용자의 음성을 획득하도록 할 수 있다.

또한, 영상 표시 기기(100)는 복수의 원격제어장치(200), 복수의 단말기(300) 중 하나 이상의 주변 기기에 음성 획득 명령 신호를 각각 전송할 수 있다.

한편, 영상 표시 기기(100)와 연계된 주변 기기인 원격제어장치(200), 단말기(300) 중 하나 이상은 필요에 따라 영상 표시 기기(100)와 연계되기 위한 연계 과정을 거칠 수 있다. 영상 표시 기기(100)와 원격제어장치(200) 또는 단말기(300)가 연계되는 과정은 공지된 기술로써, 자세한 설명은 생략한다.

또한, 영상 표시 기기(100)는 연계된 주변 기기인 원격제어장치(200), 단말기(300) 중 하나 이상의 동작 상태를 확인하는 확인 신호를 전송하고, 전송된 확인 신호에 대한 응답 신호를 수신할 수 있다. 이에 따라 영상 표시 기기(100)는 연계된 주변 기기인 원격제어장치(200), 단말기(300) 중 하나 이상의 동작 상태를 확인할 수 있다. 예를 들면, 영상 표시 기기(100)는 원격제어장치(200), 단말기(300) 중 하나 이상의 음성 획득 동작 여부를 확인할 수 있다.

다시 도 5를 참조한다.

영상 표시 기기(100)는 사용자의 음성에 대한 복수의 음성 신호를 획득한다(S105).

영상 표시 기기(100)는 사용자가 발화한 음성에 대한 복수의 음성 신호를 획득할 수 있다. 여기서 복수의 음성 신호는 영상 표시 기기(100), 원격제어장치(200), 단말기(300) 중 하나 이상으로부터 획득한 음성 신호를 의미할 수 있다.

구체적으로, 영상 표시 기기(100)는 영상 표시 기기(100)에 포함된 음성 획득부(110)를 통해 사용자의 음성을 획득하고, 획득된 음성에 대한 음성 신호를 획득할 수 있다. 일 실시예로 영상 표시 기기(100)의 음성 획득부(110)에 포함된 마이크를 통해 사용자의 음성을 획득할 수 있고, 획득된 음성에 대한 음성 신호를 획득할 수 있다.

다른 실시예로, 영상 표시 기기(100)는 음성 획득부(110)에 포함된 복수의 마이크를 통해 사용자의 음성에 대한 복수의 음성 신호를 획득할 수도 있다. 그리고 복수의 마이크는 영상 표시 기기(100)의 서로 다른 영역에 위치할 수 있다.

또한, 영상 표시 기기(100)는 사용자의 음성을 획득한 주변 기기로부터 사용자의 음성에 대한 음성 신호를 수신하여, 사용자의 음성에 대한 음성 신호를 획득할 수 있다.

이에 대해 도 6 내지 도 8을 참조하여 설명한다.도 7은 본 발명의 일 실시예에 따른 영상 표시 기기(100)의 사용자 음성에 대한 음성 신호 획득을 나타내는 예시도이다.

도 7을 참조하면, 영상 표시 기기(100)는 단계 S103에서 영상 표시 기기(100)에 연계된 주변 기기인 원격제어장치(200), 단말기(300) 중 하나 이상에 사용자의 음성을 획득하도록 하는 음성 획득 명령 신호를 전송할 수 있다. 음성 획득 명령 신호를 수신한 원격제어장치(200), 단말기(300) 중 하나 이상은 사용자의 음성을 획득할 수 있다. 사용자의 음성을 획득한 원격제어장치(200), 단말기(300) 중 하나 이상은 획득된 사용자의 음성에 대한 음성 신호를 영상 표시 기기(100)에 전송한다. 영상 표시 기기(100)는 원격제어장치(200), 단말기(300) 중 하나 이상이 전송한 음성 신호를 수신한다. 영상 표시 기기(100)는 원격제어장치(200), 단말기(300) 중 하나 이상이 전송한 음성 신호를 통해 사용자의 음성 신호를 획득할 수 있다.

이에 따라 영상 표시 기기(100)는 영상 표시 기기(100), 원격제어장치(200), 단말기(300) 중 하나 이상을 통해 사용자의 음성에 대한 복수의 음성 신호를 획득할 수 있다.

도 6을 참조하여, 영상 표시 기기(100) 및 원격제어장치(200)의 사용자의 음성에 대한 복수의 음성 신호 획득에 대해 상세히 설명한다.

도 6을 참조하면, 영상 표시 기기(100)의 음성 획득부(110) 및 원격제어장치(200)의 음성 획득부(290)는 사용자의 "볼륨 높여"라는 음성을 획득할 수 있다. 그리고 영상 표시 기기(100)의 음성 획득부(110)는 획득된 "볼륨 높여"라는 음성을 제어부(170)의 음성 인식 모듈(174)에 전달할 수 있다. 여기서 제어부(170)의 음성 인식 모듈(174)은 STT(Speech To Text, 175), NLP(Natural Language Processing, 177)을 포함할 수 있다. 그리고 원격제어장치(200)의 음성 획득부(290)는 사용자의 "볼륨 높여"라는 음성을 획득할 수 있다. 음성 획득부(290)는 획득된 "볼륨 높여"라는 음성을 제어부(280)에 전달할 수 있다. 제어부(280)는 블루투스 모듈(225)를 통해 영상 표시 장치(100)에 전달할 수 있다. 이에 따라 원격제어장치(200)의 음성 획득부(290)가 획득한 사용자의 "볼륨 높여"라는 음성도 영상 표시 기기(100)의 음성 인식 모듈(174)에 전달될 수 있다.

한편, 영상 표시 기기(100), 원격제어장치(200), 단말기(300) 중 하나 이상은 노이즈 캔슬링을 통해 사용자 음성을 획득할 수 있다.

일 실시예로, 영상 표시 기기(100)는 획득된 음성에서 영상 표시 기기(100)의 오디오 출력부(185)에서 출력되는 오디오와 중첩되는 영역을 제거하여, 노이즈 캔슬링 동작을 수행할 수 있다.

다른 실시예로, 영상 표시 기기(100)는 획득된 음성에서 일정 레벨 이하의 영역을 제거하여, 노이즈 캔슬링 동작을 수행할 수 있다.

그리고 원격제어장치(200)도 상술한 영상 표시 기기(100)와 동일한 동작을 통해 노이즈 캔슬링 동작을 수행할 수 있다. 이에 따라, 원격제어장치(200)는 획득된 음성에서 영상 표시 기기(100)의 오디오 출력부(185)에서 출력되는 오디오와 중첩되는 영역을 제거하거나, 일정 레벨 이하의 영역을 제거하여 노이즈 캔슬링 동작을 수행할 수 있다.

또한, 영상 표시 기기(100)가 원격제어장치(200)가 획득한 음성을 수신하고, 수신된 음성에 대해 상술한 노이즈 캔슬링 동작을 수행할 수도 있다.

또한, 원격제어장치(200)는 복수의 마이크를 통해 획득한 음성의 비교를 통해 노이즈 캔슬링 동작을 수행할 수도 있다. 복수의 마이크를 통한 노이즈 캔슬링 기술은 공지된 기술이므로 자세한 설명은 생략한다.

한편, 단말기(300)도 상술한 노이즈 캔슬링 동작을 수행할 수 있으며, 원격제어장치(200)와 동일한 동작을 통해 노이즈 캔슬링 동작을 수행할 수 있다.

한편, 영상 표시 기기(100)는 사용자의 음성을 획득하는 기기에 대한 정보를 표시할 수 있다.

일 실시예로, 영상 표시 기기(100)는 사용자의 음성을 획득 중인 영상 표시 기기(100), 원격제어장치(200), 단말기(300) 중 하나 이상에 대한 아이콘을 디스플레이부(180)에 표시할 수 있다.

이를 도 8을 참고하여 설명한다

도 8은 본 발명의 일 실시예에 따른 영상 표시 기기(100)의 사용자 음성 획득에 대한 정보 표시를 나타낸다.

도 8을 참조하면, 영상 표시 기기(100)는 사용자의 음성을 획득하는 기기에 대한 정보를 아이콘으로 표시할 수 있다. 이에 따라, 영상 표시 기기(100)는 사용자의 음성을 획득하고 있음을 알리는 음성 획득 아이콘(410), 사용자의 음성을 획득 중인 복수의 기기인 영상 표시 장치에 대한 아이콘(431), 원격제어장치에 대한 아이콘(432) 및 단말기에 대한 아이콘(433) 중 하나 이상을 표시할 수 있다.

다시 도 5를 참조한다.

영상 표시 기기(100)는 획득된 복수의 음성 신호를 비교한다(S107).

영상 표시 기기(100)의 제어부(170)는 획득된 복수의 음성 신호 각각의 사용자 음역 레벨, 노이즈 레벨 중 하나 이상을 기초로, 획득된 복수의 음성 신호 각각의 품질을 비교할 수 있다.

일 실시예로, 제어부(170)는 획득된 복수의 음성 신호 각각에서 사용자 음성에 대응하는 음역 레벨(이하, "사용자 음역 레벨"이라고 한다.)을 구분하고, 획득된 복수의 음성 신호 각각의 사용자 음역 레벨을 비교할 수 있다.

다른 실시예로, 제어부(170)는 획득된 복수의 음성 신호 각각에서 노이즈에 대응하는 음역 레벨(이하, "노이즈 레벨"이라고 한다.)을 구분하고, 획득된 복수의 음성 신호 각각의 노이즈 레벨을 비교할 수 있다.

또 다른 실시예로, 제어부(170)는 획득된 복수의 음성 신호 각각에서 사용자 음역 레벨 및 노이즈 레벨을 구분하고, 획득된 복수의 음성 신호 각각의 사용자 음역 레벨 및 노이즈 레벨을 비교할 수 있다.

또한, 제어부(170)는 획득된 복수의 음성 신호 각각을 일정 구간으로 분할할 수 있고, 획득된 복수의 음성 신호를 분할된 구간별로 비교할 수도 있다.

영상 표시 기기(100)는 비교 결과를 기초로 음성 인식의 대상이 되는 음성 신호를 결정한다(S109).

영상 표시 기기(100)의 제어부(170)는 단계 S107의 비교 결과를 기초로, 음성 인식의 대상이 되는 음성 신호를 결정할 수 있다.

구체적으로, 제어부(170)는 복수의 음성 신호 각각의 사용자 음역 레벨, 노이즈 레벨 중 하나 이상을 기초로, 음성 인식의 대상이 되는 음성 신호를 결정할 수 있다.

일 실시예로, 제어부(170)는 복수의 음성 신호 중 사용자 음역 레벨이 가장 높은 음성 신호를 음성 인식의 대상이 되는 음성 신호로 결정할 수 있다.

다른 실시예로, 제어부(170)는 복수의 음성 신호 중 노이즈 레벨이 가장 낮은 음성 신호를 음성 인식의 대상이 되는 음성 신호로 결정할 수 있다.

또 다른 실시예로, 제어부(170)는 복수의 음성 신호 중 사용자 음역 레벨은 높고, 노이즈 레벨은 낮은 음성 신호를 음성 인식의 대상이 되는 음성 신호로 결정할 수 있다.

한편, 영상 표시 기기(100)는 음성 인식의 대상이 되는 사용자 음성을 획득하는 기기에 대한 정보를 표시할 수 있다.

일 실시예로, 영상 표시 기기(100)는 복수의 음성 신호 중 음성 인식의 대상이 되는 음성을 획득 중인 기기에 대한 아이콘을 디스플레이부(180)에 표시할 수 있다.

이를 도 9 내지 도 10을 참고하여 설명한다.

도 9 내지 도 10은 본 발명의 일 실시예에 따른 영상 표시 기기(100)의 사용자 음성 획득에 대한 정보 표시를 나타낸다.

이하, 영상 표시 기기(100)가 획득한 복수의 음성 신호 중 원격제어장치(200)가 획득하는 음성 신호가 음성 인식의 대상이 되는 경우를 예시로 한다.

일 실시예로 도 9를 참조하면, 영상 표시 기기(100)는 사용자의 음성을 획득하고 있음을 알리는 음성 획득 아이콘(410)과 음성 인식의 대상이 되는 사용자 음성을 획득하는 원격제어장치에 대한 아이콘(432)를 표시할 수 있다.

다른 실시예로 도 10을 참조하면, 영상 표시 기기(100)는 사용자의 음성을 획득하고 있음을 알리는 음성 획득 아이콘(410)과 사용자의 음성을 획득 중인 복수의 기기 각각에 대한 아이콘인 영상 표시 기기에 대한 아이콘(431), 원격제어장치에 대한 아이콘(432) 및 단말기에 대한 아이콘(433)을 표시할 수 있다. 그리고 영상 표시 기기(100)는 음성 인식의 대상이 되는 사용자의 음성을 획득하는 원격제어기기에 대한 아이콘(432)을 다른 기기에 대한 아이콘들(431, 433)과 다르게 표시할 수 있다. 일 실시예로, 영상 표시 기기(100)는 원격제어장치에 대한 아이콘(432)의 외곽선을 다른 기기에 대한 아이콘들(431, 433)과 다르게 표시할 수 있다. 이외에도, 영상 표시 기기(100)는 다양한 방법을 통해 음성 인식의 대상이 되는 기기에 대한 아이콘을 다른 기기에 대한 아이콘들과 구분하여 표시할 수 있다.

또한, 영상 표시 기기(100)는 획득된 복수의 음성 신호 각각의 일부 구간을 기초로 새로운 음성 신호를 생성할 수 있다. 그리고 영상 표시 기기(100)는 생성된 새로운 음성 신호를 음성 인식의 대상이 되는 음성 신호로 결정할 수 있다.

구체적으로, 영상 표시 기기(100)는 복수의 음성 신호 각각의 전체 구간을 일정 구간 별로 분할할 수 있다. 영상 표시 기기(100)는 분할된 복수의 음성 신호 각각을 동일한 구간에 대해 비교할 수 있다. 그리고 영상 표시 기기(100)는 비교 결과를 기초로, 복수의 음성 신호 각각의 일부 구간을 조합하여 새로운 음성 신호를 생성할 수 있다.

이에 대해 도 11a 내지 도 11c를 참조하여 설명한다.

도 11a 내지 도 11c는 본 발명의 일 실시예에 따른 획득된 음성 신호의 파형을 나타낸다.

일 실시예로, 도 11a는 사용자가 발화한 음성에 대한 음성 신호를 나타낸다. 도 11b는 영상 표시 기기(100)가 획득한 사용자의 음성에 대한 음성 신호를 나타내며, 구간 A 및 구간 C는 도 11a의 사용자가 발화한 음성에 대한 음성 신호와 동일하나, 사용자 음역 레벨이 낮은 구간 B는 도 11a의 사용자가 발화한 음성에 대한 음성 신호와 동일하지 않다. 그리고 도 11c는 원격제어장치(200)가 획득한 사용자의 음성에 대한 음성 신호를 나타내며, 구간 D 및 구간 F는 도 11a의 사용자가 발화한 음성에 대한 음성 신호와 동일하나, 노이즈 레벨이 높은 구간 E는 사용자가 발화한 음성에 대한 음성 신호와 동일하지 않다.

영상 표시 기기(100)는 도 11b 및 도 11c에 도시된 바와 같은 복수의 음성 신호를 획득할 수 있다. 영상 표시 기기(100)는 복수의 음성 신호 각각을 일정 구간별로 비교할 수 있다. 이에 따라, 영상 표시 기기(100)는 영상 표시 기기(100)가 획득한 음성 신호 및 원격제어장치(200)가 획득한 음성 신호 각각에서 사용자 음역 레벨이 높거나 노이즈 레벨이 낮은 구간을 획득할 수 있다. 그래서 영상 표시 기기(100)는 도 11b의 영상 표시 기기(100)가 획득한 음성 신호 중에서 구간 A를 획득하고, 도 11c의 원격제어장치(200)가 획득한 음성 신호 중에서 구간 F를 획득할 수 있다. 그리고 영상 표시 기기(100)는 획득된 구간 A와 구간 F를 기초로 새로운 음성 신호를 생성할 수 있다. 이에 따라, 영상 표시 기기(100)가 생성한 새로운 음성 신호는 도 11a와 동일한 파형의 음성 신호일 수 있다. 그리고 영상 표시 기기(100)는 생성된 새로운 음성 신호를 음성 인식의 대상이 되는 음성 신호로 결정할 수 있다.

다시 도 5를 참조한다.

영상 표시 기기(100)는 음성 인식의 대상이 되는 음성 신호를 기초로 사용자가 발화한 음성을 인식한다(S111).

영상 표시 기기(100)의 제어부(170)는 단계 S109에서 획득된 음성 인식의 대상이 되는 음성 신호를 기초로 사용자가 발화한 음성을 인식할 수 있다.

일 실시예로, 제어부(170)는 획득된 음성 인식의 대상이 되는 음성 신호를 기초로, 사용자가 발화한 음성을 텍스트로 변환할 수 있다. 제어부(170)는 획득한 음성 신호를 STT(Speech To Text) 방식을 통해 텍스트로 변환할 수 있다. 그리고 제어부(170)는 변환된 텍스트를 기초로 사용자가 발화한 음성을 인식할 수 있다. 여기서 STT 방식은 공지된 기술이므로 자세한 설명은 생략한다.

다른 실시예로, 제어부(170)는 획득된 음성 인식의 대상이 되는 음성 신호에 매칭되는 음성 신호를 검색하여, 획득된 음성 인식의 대상이 되는 음성 신호를 인식할 수 있다. 구체적으로, 제어부(170)는 획득된 음성 인식의 대상이 되는 음성 신호를 기 저장된 음성 신호와 비교하여, 매칭되는 음성 신호를 검색할 수 있다. 그리고 제어부(170)는 검색된 음성 신호를 기초로, 사용자가 발화한 음성을 인식할 수 있다.

도 6을 참조하여, 상술한 영상 표시 기기(100)의 사용자가 발화한 음성을 인식에 대해 상세히 설명한다. 여기서 사용자가 발화한 음성은 상술한 "볼륨 높여"인 경우로 설명한다.

도 6을 참조하면, 영상 표시 기기(100)의 음성 인식 모듈(174)은 음성 획득부(110)가 획득한 사용자의 음성, 원격제어장치(200)가 획득한 사용자의 음성, 생성된 음성 신호 중 하나 이상을 수신할 수 있다. 영상 표시 기기(100)의 STT(175)는 전달된 "볼륨 높여"라는 음성을 문자로 변환할 수 있다. STT(175)는 변환된 문자를 NLP(177)에 전달할 수 있다. NLP(177)은 전달받은 문자를 영상 표시 기기(100)가 처리할 수 있는 명령어 체계로 변환할 수 있다. 제어부(170)는 변환된 명령어를 기초로 사용자가 발화한 음성을 인식할 수 있다.

다시 도 5를 참조한다.

영상 표시 기기(100)는 인식된 음성에 대응하는 제어 동작을 검색한다(S113).

영상 표시 기기(100)의 제어부(170)는 인식된 음성에 대응하는 제어 동작을 저장부(140), 네트워크 인터페이스(133)를 통해 접속된 네트워크의 서버 중 하나 이상에서 검색할 수 있다.

일 실시예로, 제어부(170)는 단계 S111에서 변환된 텍스트에 대응되는 제어 동작을 저장부(140)에 저장된 데이터 베이스, 네트워크 인터페이스(133)를 통해 접속된 네트워크의 서버의 데이터 베이스 중 하나 이상에서 검색할 수 있다. 그리고 제어부(170)는 변환된 텍스트에 대응되는 제어 동작을 획득할 수 있다.

다른 실시예로, 제어부(170)는 단계 S111에서 검색된 음성 신호에 대응되는 제어 동작을 저장부(140)에 저장된 데이터 베이스, 네트워크 인터페이스(133)를 통해 접속된 네트워크의 서버의 데이터 베이스 중 하나 이상에서 검색할 수 있다. 그리고 제어부(170)는 검색된 음성 신호에 대응되는 제어 동작을 획득할 수 있다.

또 다른 실시예로, 제어부(170)는 단계 S111의 음성 인식 단계를 거치지 않고, 획득된 음성 신호에 대응되는 제어 동작을 저장부(140)에 저장된 데이터 베이스, 네트워크 인터페이스(133)를 통해 접속된 네트워크의 서버의 데이터 베이스 중 하나 이상에서 검색할 수도 있다. 구체적으로, 제어부(170)는 획득된 음성 신호에 매칭되는 음성 신호를 저장부(140)에 저장된 데이터 베이스, 네트워크 인터페이스(133)를 통해 접속된 네트워크의 서버의 데이터 베이스 중 하나 이상에서 검색하고, 검색된 음성 신호에 대응되는 제어 동작을 획득할 수 있다.

도 6을 참조하여, 상술한 영상 표시 기기(100)의 제어 동작 검색에 대해 상세히 설명한다.

도 6을 참조하면, 영상 표시 기기(100)의 제어부(170)는 변환된 명령어인 "볼륨 높여"에 대응되는 제어 동작을 검색할 수 있다. 이에 따라 제어부(170)는 "볼륨 높여"에 대응되는 제어 동작인 오디오 볼륨 업 동작을 획득할 수 있다.

한편, 상술한 단계 S113은 단계 S111 또는 후술한 단계 S115에 포함될 수 있다.

다시 도 5를 참조한다.

영상 표시 기기(100)는 검색된 제어 동작을 수행한다(S115).

영상 표시 기기(100)의 제어부(170)는 단계 S113의 검색을 통해 획득된 제어 동작을 수행할 수 있다. 여기서 제어부(170)가 수행하는 제어 동작은 영상 표시 기기(100)의 전반적인 제어 동작을 포함한다.

예를 들면, 영상 표시 기기(100)의 제어부(170)는 검색된 제어 동작으로 영상 표시 기기(100)의 전원 온/오프 동작, 채널 전환 동작, 음량 조정 동작, 화면 설정 동작, 음향 설정 동작, 프로그램 정보 표시 동작, 방송 정보 표시 동작, 애플리케이션 실행 동작, 애플리케이션 조작 동작, 웹서핑 동작, 키워드 검색 동작, 컨텐츠 검색 동작 및 컨텐츠 조작 동작 중 하나 이상을 수행할 수 있다.

일 실시예로, 인식된 음성이 "오늘 날씨 어때?"인 경우, 제어부(170)는 인식된 음성에 대응하는 제어 동작으로, 오늘의 날씨 정보를 디스플레이부(180)에 디스플레이 할 수 있다.

다른 실시예로, 인식된 음성이 "뉴스 채널 보여줘."인 경우, 제어부(170)는 인식된 음성에 대응하는 제어 동작으로, 표시중인 채널을 뉴스 채널로 전환할 수 있다.

또 다른 실시예로, 인식된 음성이 "재밌는거 보여줘,"인 경우, 제어부(170)는 인식된 음성에 대응하는 제어 동작으로, 인기 VOD 컨텐츠 목록, 선호 채널 목록을 디스플레이 할 수 있다.

도 6을 참조하여, 상술한 영상 표시 기기(100)의 제어 동작 수행에 대해 상세히 설명한다.

도 6을 참조하면, 영상 표시 기기(100)의 컨트롤 매니저(175)는 획득된 오디오 볼륨 업 동작을 수행할 수 있다. 이에 따라, 영상 표시 기기(100)는 오디오 볼륨을 높일 수 있다. 상술한 제어부(170)의 제어 동작 수행에 대한 내용은 설명을 위한 예시로써, 기재된 내용 이외에도 제어부(170)는 인식된 음성을 기초로 영상 표시 기기(100)에서 수행될 수 있는 다양한 제어 동작을 수행할 수 있다.

본 발명의 다른 실시예에 따르면, 영상 표시 기기(100)는 발화하는 사용자인 발화자에 대한 표시를 디스플레이부(180)에 디스플레이할 수 있다.

여기서 영상 표시 기기(100)가 표시하는 발화자에 대한 표시는 문자, 사진 및 기호 중 하나 이상을 포함할 수 있다.

이를 도 12를 참조하여 설명한다.

도 12는 본 발명의 일 실시예에 따른 발화자에 대한 표시를 나타낸다.

도 12를 참조하면, 영상 표시 기기(100)는 발화자에 대한 영상을 디스플레이 할 수 있다. 일 실시예로, 영상 표시 기기(100)는 획득된 음성 신호를 기초로 발화자의 위치를 판단할 수 있다. 영상 표시 기기(100)는 판단된 발화자의 위치를 기초로, 발화자에 대한 영상을 영상 획득부(120)를 통해 획득할 수 있다. 제어부(170)는 획득된 발화자에 대한 영상을 디스플레이부(170)의 전체 화면의 일부 화면에 표시할 수 있다.

또한, 영상 표시 기기(100)는 복수의 사용자 각각에 대해 최적의 음성을 획득할 수 있는 기기에 대한 정보를 표시할 수 있다.

도 13을 참조하여 설명한다.

도 13은 본 발명의 일 실시예에 따른 복수의 발화자에 대한 표시를 나타낸다.

도 13을 참조하면, 영상 표시 기기(100)는 복수의 사용자 각각의 음성을 최적으로 획득할 수 있는 기기에 대한 정보를 표시할 수 있다. 일 실시예로, 영상 표시 기기(100)는 복수의 사용자 각각이 발화한 음성을 음성 획득부(110), 원격제어장치(200), 단말기(300) 중 하나 이상을 통해 획득할 수 있다. 영상 표시 기기(100)는 획득된 음성에 대한 적어도 하나 이상의 음성 신호를 비교하고, 비교 결과를 기초로 복수의 사용자 각각에 대한 음성을 최적으로 획득할 수 있는 기기를 판단할 수 있다. 그리고 영상 표시 기기(100)는 판단된 기기에 대한 아이콘을 전체 화면의 일부 화면에 표시할 수 있다. 이에 따라 도 13에 도시된 바와 같이, 복수의 사용자 각각의 음성을 최적으로 획득할 수 있는 기기에 대한 아이콘을 사용자에 대한 화상과 함께 표시할 수 있다. 이에 따라, 복수의 사용자 각각은 자신의 음성이 최적으로 획득될 수 있는 기기를 인식할 수 있다.

본 발명의 또 다른 실시예에 따르면, 영상 표시 기기(100)는 음성 인식 애플리케이션이 설치된 단말기(300)를 통해 사용자의 음성 신호를 획득할 수 있다.

이를 도 14를 참조하여 설명한다.

도 14는 본 발명의 일 실시예에 따른 사용자의 음성 신호 획득을 나타내는 예시도이다.

도 14를 참조하면, 영상 표시 기기(100)는 음성 인식 애플리케이션이 설치된 단말기(300)를 통해 사용자의 음성 신호를 획득할 수 있다. 일 실시예로, 영상 표시 기기(100)는 사용자가 음성 인식 애플리케이션이 설치된 단말기(300)에 발화한 음성을 단말기(300)로부터 수신할 수 있다. 구체적으로, 단말기(300)는 음성 인식 애플리케이션이 실행된 상태에서 사용자의 음성을 획득할 수 있다. 그리고 단말기(300)는 실행된 어플리케이션에 음성 인식에 대한 아이콘(410)을 표시할 수 있다. 단말기(300)는 획득된 사용자의 음성에 대한 음성 신호를 영상 표시 기기(100)에 전송할 수 있다. 그리고, 영상 표시 기기(100)는 단말기(300)로부터 수신한 음성 신호에 대응하는 제어 동작을 수행할 수 있다.

본 발명의 일실시예에 의하면, 전술한 방법은, 프로그램이 기록된 매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 매체의 예로는, ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.

상기와 같이 설명된 영상 표시 기기는 상기 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

Claims

영상 표시 기기의 동작 방법에 있어서,
상기 영상 표시 기기에 연계된 하나 이상의 주변 기기에 음성 획득 명령 신호를 전송하는 단계;
상기 음성 획득 명령 신호를 수신한 하나 이상의 주변 기기가 획득한 사용자의 음성에 대한 하나 이상의 음성 신호 및 상기 영상 표시 기기가 획득한 상기 사용자의 음성에 대한 음성 신호를 수신하는 단계;
획득된 복수의 음성 신호를 비교하는 단계;
비교 결과를 기초로 음성 인식의 대상이 되는 음성 신호를 결정하는 단계;
결정된 음성 신호를 기초로 상기 사용자의 음성을 인식하는 단계; 및
인식된 음성에 대응하는 제어 동작을 수행하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제1항에 있어서,
상기 음성 신호를 비교하는 단계는
상기 획득된 복수의 음성 신호의 사용자 음역 레벨, 노이즈 레벨 중 하나 이상을 기초로 상기 획득된 복수의 음성 신호를 비교하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제2항에 있어서,
상기 음성 신호를 결정하는 단계는
상기 획득된 복수의 음성 신호 중 상기 사용자 음역 레벨이 가장 높은 음성 신호를 상기 음성 인식의 대상이 되는 음성 신호로 결정하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제2항에 있어서,
상기 음성 신호를 결정하는 단계는
상기 획득된 복수의 음성 신호 중 상기 노이즈 레벨이 가장 낮은 음성 신호를 상기 음성 인식의 대상이 되는 음성 신호로 결정하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제1항에 있어서,
상기 제어 동작을 수행하는 단계는
상기 인식된 음성에 대응하는 제어 동작을 검색하는 단계와,
검색된 제어 동작을 수행하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제5항에 있어서,
상기 인식된 음성에 대응하는 제어 동작을 검색하는 단계는
기 저장된 하나 이상의 음성 신호에서 상기 인식된 음성의 음성 신호와 매칭되는 음성 신호를 검색하는 단계와,
검색된 음성 신호에 대응되는 제어 동작을 검색하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제1항에 있어서,
상기 사용자의 음성을 인식하는 단계는
상기 결정된 음성 신호를 텍스트로 변환하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제7항에 있어서,
상기 제어 동작을 수행하는 단계는
상기 변환된 텍스트에 대응하는 제어 동작을 수행하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제1항에 있어서,
상기 음성 신호를 결정하는 단계는
상기 획득된 복수의 음성 신호 각각을 복수의 구간으로 분할하는 단계와,
분할된 복수의 음성 신호 각각을 동일한 구간에 대해 비교하는 단계와,
비교 결과를 기초로 상기 음성 인식을 위한 음성 신호를 생성하는 단계와,
생성된 음성 신호를 상기 음성 인식을 위한 음성 신호로 결정하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제9항에 있어서,
상기 동일한 구간에 대해 비교하는 단계는
상기 분할된 복수의 음성 신호 각각의 동일한 구간을 사용자 음역 레벨, 노이즈 레벨 중 하나 이상을 기초로 비교하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제9항에 있어서,
상기 음성 신호를 생성하는 단계는
상기 복수의 음성 신호 각각의 일부 구간을 합성하여, 상기 음성 인식을 위한 음성 신호를 생성하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제1항에 있어서,
상기 사용자의 음성을 인식하기 위한 트리거 음성을 인식하는 단계를 더 포함하고,
상기 음성 획득 명령 신호를 전송하는 단계는
인식된 트리거 음성을 기초로 상기 음성 획득 명령 신호를 전송하는 단계를 포함하는
영상 표시 기기의 동작 방법.
제1항에 있어서,
상기 음성 신호를 결정하는 단계는
상기 음성 인식의 대상이 되는 음성 신호로 결정된 음성 신호를 획득한 기기에 대한 정보를 표시하는 단계를 포함하는
영상 표시 기기의 동작 방법.
영상 표시 기기에 있어서,
사용자의 음성을 획득하는 음성 획득부;
상기 영상 표시 기기에 연계된 하나 이상의 주변 기기와 통신하는 통신부; 및
상기 주변 기기에 음성 획득 명령 신호를 전송하고, 상기 주변 기기가 획득한 사용자의 음성에 대한 하나 이상의 음성 신호 및 상기 음성 획득부가 획득한 음성 신호를 비교하고, 비교 결과를 기초로 음성 인식의 대상이 되는 음성 신호를 결정하고, 결정된 음성 신호를 기초로 상기 사용자의 음성을 인식하여, 인식된 음성에 대응하는 제어 동작을 수행하는 제어부를 포함하는
영상 표시 기기.
제14항에 있어서,
상기 제어부는
상기 획득된 복수의 음성 신호의 사용자 음역 레벨, 노이즈 레벨 중 하나 이상을 기초로 상기 획득된 복수의 음성 신호를 비교하는
영상 표시 기기.
제15항에 있어서,
상기 제어부는
상기 획득된 복수의 음성 신호 각각을 복수의 구간으로 분할하고, 분할된 복수의 음성 신호 각각을 동일한 구간에 대해 비교하여, 비교 결과를 기초로 상기 음성 인식을 위한 음성 신호를 생성하는
영상 표시 기기.
제16항에 있어서,
상기 제어부는
상기 복수의 음성 신호 각각의 일부 구간을 합성하여, 상기 음성 인식을 위한 음성 신호를 생성하는
영상 표시 기기.
제14항에 있어서,
상기 음성 획득부는
복수의 마이크를 포함하고,
상기 제어부는
상기 음성 획득부의 복수의 마이크가 획득한 사용자의 음성 신호를 비교하여, 상기 사용자의 위치를 판단하는
영상 표시 기기.
제18항에 있어서,
디스플레이부; 및
상기 사용자의 영상을 획득하는 영상 획득부를 더 포함하고,
상기 제어부는
판단된 사용자의 위치를 기초로 상기 사용자에 대한 영상을 획득하여, 획득된 사용자에 대한 영상을 상기 디스플레이부에 디스플레이하는
영상 표시 기기.
제14항에 있어서,
디스플레이부를 더 포함하고,
상기 제어부는
상기 음성 인식의 대상이 되는 음성 신호로 결정된 음성 신호를 획득한 기기에 대한 정보를 상기 디스플레이부에 디스플레이하는
영상 표시 기기.