KR20200055365A - Display device, and controlling method thereof - Google Patents
Display device, and controlling method thereof Download PDFInfo
- Publication number
- KR20200055365A KR20200055365A KR1020180138955A KR20180138955A KR20200055365A KR 20200055365 A KR20200055365 A KR 20200055365A KR 1020180138955 A KR1020180138955 A KR 1020180138955A KR 20180138955 A KR20180138955 A KR 20180138955A KR 20200055365 A KR20200055365 A KR 20200055365A
- Authority
- KR
- South Korea
- Prior art keywords
- gain
- sound
- display device
- volume
- size
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/002—Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
Abstract
Description
본 발명은 디스플레이 디바이스 및 그 제어 방법에 관한 것으로, 더욱 상세하게는 스마트 TV와 같은 디스플레이 디바이스에서, 빌트인 마이크로 수신한 TV 사운드의 볼륨 크기를 기초로 게인의 크기를 조절하여 원거리 음성 인식 성능을 향상 시킬 수 있는 디스플레이 디바이스 및 그 제어 방법에 관한 발명이다. The present invention relates to a display device and a control method thereof, and more specifically, in a display device such as a smart TV, it is possible to improve the remote speech recognition performance by adjusting the size of the gain based on the volume level of the TV sound received by the built-in microphone. The present invention relates to a display device and a control method.
최근 많은 사용자들이, 스마트 TV와 같은 디스플레이 디바이스를 이용하고 있다. 종래 기술에서, 빌트인 마이크를 이용한 TV로 원거리 음성 인식을 수행하는 경우, 성능 저해 요소로 여러 가지가 있다. 먼저, 스피커와 마이크 사이의 거리가 매우 가깝다. 다음으로, TV 볼륨 소리의 크기가 가변적이다. 큰 출력의 스피커를 사용하기 때문에, TV 사운드의 게인이 매우 크다. 사용자와 TV 사이의 거리가 멀기 때문에, TV의 STT의 인식률이 떨어지고, 또한, 기동어(Trigger word)의 오인식에 의하여 사용자의 의도와 다르게 TV 가 켜지거나, 원거리 음성 인식을 시작할 수 있다. Recently, many users are using display devices such as smart TVs. In the related art, when remote voice recognition is performed on a TV using a built-in microphone, there are various factors that inhibit performance. First, the distance between the speaker and the microphone is very close. Next, the volume of the TV volume is variable. Because of the large output speaker, the TV sound gain is very large. Since the distance between the user and the TV is far, the recognition rate of the STT of the TV decreases, and the TV may be turned on or start remote speech recognition differently from the user's intention due to a misrecognition of the trigger word.
따라서, 종래 기술의 경우, TV 소리를 제거하고 사용자의 음성 크기를 크게 하기 위한 전처리 과정을 적용하더라도 음성 인식 성능이 매우 저하되는 문제점이 있었다. Therefore, in the case of the prior art, even if a pre-processing process for removing TV sound and increasing a user's voice size is applied, there is a problem in that voice recognition performance is very deteriorated.
본 발명의 일 실시 예는 TV 사운드의 볼륨 크기에 따라서, 마이크에서 수신한 사용자 음성과 마이크에서 수신한 TV 사운드의 게인의 합, TV 사운드 게인 및 음향 에코 제거를 실행한 앞의 두 게인의 합의 크기를 조정하는 디스플레이 디바이스 및 그 제어 방법을 제공하는 것을 목적으로 한다.According to an embodiment of the present invention, according to the volume of the TV sound, the sum of the user voice received from the microphone and the gain of the TV sound received from the microphone, the size of the sum of the two gains before the TV sound gain and acoustic echo cancellation are performed An object of the present invention is to provide a display device for adjusting the control method and a control method thereof.
본 발명의 다른 실시 예는 기동어가 인식되어 STT를 수행하는 경우, 마이크에서 수신한 사용자 음성과 마이크에서 수신한 TV 사운드의 게인의 합, TV 사운드 게인 및 음향 에코 제거를 실행한 앞의 두 게인의 합의 크기를 조정하는 디스플레이 디바이스 및 그 제어 방법을 제공하는 것을 목적으로 한다.According to another embodiment of the present invention, when the starter word is recognized and the STT is performed, the sum of the gain of the user voice received from the microphone and the TV sound received from the microphone, the TV sound gain and the acoustic echo cancellation of the preceding two gains It is an object of the present invention to provide a display device for adjusting the size of an agreement and a control method therefor.
본 발명의 또 다른 실시 예는 기동어를 인식한 경우, 사용자 음성의 볼륨 크기를 반영한 그래픽 이미지를 디스플레이를 통하여 디스플레이하도록 제어하는 디스플레이 디바이스 및 그 제어 방법을 제공하는 것을 목적으로 한다.Another embodiment of the present invention is to provide a display device and a control method for controlling to display a graphic image reflecting the volume of a user's voice through a display when the starter word is recognized.
본 발명의 일 실시 예는 기동어 인식이 필요한 시점에는 이에 맞게 게인의 크기를 조정하고, STT를 수행해야 하는 시점에는 이에 맞게 게인의 크기를 조정할 수 있는 디스플레이 디바이스 및 그 제어 방법을 제공하는 것을 목적으로 한다.One embodiment of the present invention is to provide a display device and a control method for controlling the size of the gain according to the time when it is necessary to recognize the starting word, and to adjust the size of the gain accordingly when the STT needs to be performed Is done.
본 발명의 일 실시 예에 따른, 디스플레이 디바이스는, 방송 신호를 방송국으로부터 수신하는 튜너; 외부 서버 및 외부 리모컨 중 적어도 하나와 통신을 수행하는 통신부; 상기 수신된 방송 신호에 포함된 컨텐트를 화면에 디스플레이하는 디스플레이 - 상기 컨텐트는 외부 서버로부터 수신하거나 또는 내부 메모리에 저장되어 있음 -; 상기 컨텐트를 재생할 때 생성되는 제 1 사운드를 출력하는 스피커; 기동어를 포함하는 제 2 사운드를 사용자로부터 수신하고, 상기 제 1 사운드를 상기 스피커로부터 수신하는 마이크; 및 상기 튜너, 상기 통신부, 디스플레이, 상기 마이크 및 상기 스피커 중 적어도 하나를 제어하는 컨트롤러를 포함하되, 상기 컨트롤러는, 상기 제 1 사운드의 볼륨 크기가 기설정된 기준값보다 큰 경우, 상기 제 1 게인의 크기를 증가시키고, 상기 제 2 게인의 크기를 감소시키고, 상기 제 3 게인의 크기를 증가시키고, 상기 제 1 사운드의 볼륨 크기가 기설정된 기준값보다 작은 경우, 상기 제 1 게인을 증가시키고, 상기 제 2 게인을 증가시키고, 상기 제 3 게인을 증가시키되, 상기 제 1 게인은 상기 제 1 사운드의 게인과 상기 제 2 사운드의 게인의 합을 의미하고, 상기 제 2 게인은 상기 제 1 사운드의 게인을 의미하고, 상기 제 3 게인은 음향 에코 제거를 실행한 상기 제 1 게인과 상기 제 2 게인의 합을 의미한다. According to an embodiment of the present invention, a display device includes: a tuner that receives a broadcast signal from a broadcasting station; A communication unit performing communication with at least one of an external server and an external remote control; A display for displaying content included in the received broadcast signal on a screen, the content being received from an external server or stored in an internal memory; A speaker that outputs a first sound generated when playing the content; A microphone that receives a second sound including a starting word from a user and receives the first sound from the speaker; And a controller that controls at least one of the tuner, the communication unit, the display, the microphone, and the speaker, wherein the controller, when the volume level of the first sound is greater than a preset reference value, the size of the first gain To increase, decrease the size of the second gain, increase the size of the third gain, and increase the first gain when the volume level of the first sound is smaller than a preset reference value, and increase the second gain. Increase the gain, increase the third gain, the first gain means the sum of the gain of the first sound and the gain of the second sound, and the second gain means the gain of the first sound And, the third gain means the sum of the first gain and the second gain that have performed acoustic echo cancellation.
본 발명의 다른 실시 예에 따른, 디스플레이 디바이스의 제어 방법은, 방송 신호를 방송국으로부터 튜너를 통하여 수신하는 단계; 상기 수신된 방송 신호에 포함된 컨텐트를 화면에 디스플레이하는 단계; 상기 컨텐트를 재생할 때 생성되는 제 1 사운드를 스피커를 통하여, 출력하는 단계; 기동어를 포함하는 제 2 사운드를 사용자로부터 수신하고, 상기 제 1 사운드를 상기 스피커로부터 상기 마이크를 통하여 수신하는 단계; 상기 제 1 사운드의 볼륨 크기가 기설정된 기준값보다 큰 경우, 상기 제 1 게인의 크기를 증가시키고, 상기 제 2 게인의 크기를 감소시키고, 상기 제 3 게인의 크기를 증가시키는 단계; 및 상기 제 1 사운드의 볼륨 크기가 기설정된 기준값보다 작은 경우, 상기 제 1 게인의 크기를 증가시키고, 상기 제 2 게인의 크기를 증가시키고, 상기 제 3 게인의 크기를 증가시키는 단계를 포함하되, 상기 제 1 게인은 상기 제 1 사운드의 게인과 상기 제 2 사운드의 게인의 합을 의미하고,상기 제 2 게인은 상기 제 1 사운드의 게인을 의미하고, 상기 제 3 게인은 음향 에코 제거를 실행한 상기 제 1 게인과 상기 제 2 게인의 합을 의미한다. According to another embodiment of the present invention, a control method of a display device includes: receiving a broadcast signal from a broadcasting station through a tuner; Displaying content included in the received broadcast signal on a screen; Outputting, through a speaker, a first sound generated when playing the content; Receiving a second sound including a starting word from a user, and receiving the first sound from the speaker through the microphone; If the volume level of the first sound is larger than a preset reference value, increasing the size of the first gain, decreasing the size of the second gain, and increasing the size of the third gain; And when the volume level of the first sound is smaller than a preset reference value, increasing the size of the first gain, increasing the size of the second gain, and increasing the size of the third gain, The first gain means the sum of the gain of the first sound and the gain of the second sound, the second gain means the gain of the first sound, and the third gain performs acoustic echo cancellation. It means the sum of the first gain and the second gain.
본 발명의 일 실시 예에 따르면, TV 사운드의 볼륨 크기에 따라서, 마이크에서 수신한 사용자 음성과 마이크에서 수신한 TV 사운드의 게인의 합, TV 사운드 게인 및 음향 에코 제거를 실행한 앞의 두 게인의 합의 크기를 조정하여 원거리 음성 인식 성능을 향상할 수 있으므로, 사용자 편의성을 향상 시킬 수 있다.According to an embodiment of the present invention, according to the volume of the TV sound, the sum of the gain of the user voice received from the microphone and the TV sound received from the microphone, TV sound gain and acoustic echo cancellation of the preceding two gains By adjusting the size of the agreement, the performance of remote speech recognition can be improved, and user convenience can be improved.
본 발명의 다른 실시 예에 따르면, 기동어가 인식되어 STT를 수행하는 경우, 마이크에서 수신한 사용자 음성과 마이크에서 수신한 TV 사운드의 게인의 합, TV 사운드 게인 및 음향 에코 제거를 실행한 앞의 두 게인의 합의 크기를 조정할 수 있어서, 원거리 음성 인식 성능을 향상 시킬 수 있으므로 사용자 편의성을 향상 시킬 수 있다.According to another embodiment of the present invention, when the start word is recognized and the STT is performed, the sum of the gain of the user voice received from the microphone and the TV sound received from the microphone, TV sound gain, and acoustic echo cancellation are performed. Since the size of the gain sum can be adjusted, the performance of remote speech recognition can be improved, and user convenience can be improved.
본 발명의 또 다른 실시 예에 따르면, 기동어를 인식한 경우, 사용자 음성의 볼륨 크기를 반영한 그래픽 이미지를 디스플레이를 통하여 디스플레이하도록 제어할 수 있어서, 원거리 음성 인식 성능을 향상 시킬 수 있으므로 사용자 편의성을 향상 시킬 수 있다.According to another embodiment of the present invention, when a maneuver word is recognized, a graphic image reflecting the volume size of a user's voice can be controlled to be displayed through a display, thereby improving remote voice recognition performance, thereby improving user convenience. I can do it.
본 발명의 일 실시 예에 따르면, 기동어 인식이 필요한 시점에는 이에 맞게 게인의 크기를 조정하고, STT를 수행해야 하는 시점에는 이에 맞게 게인의 크기를 조정할 수 있어서, 원거리 음성 인식 성능을 향상 시킬 수 있으므로 사용자 편의성을 향상 시킬 수 있다. According to an embodiment of the present invention, when the need for recognition of a starting word is adjusted, the size of the gain is adjusted accordingly, and when the STT needs to be performed, the size of the gain can be adjusted accordingly, thereby improving the performance of remote speech recognition. Therefore, user convenience can be improved.
도 1은 본 발명의 일 실시 예에 따른 디지털 디바이스를 포함한 서비스 시스템을 개략적으로 설명하기 위해 도시한 도면이다.
도 2는 본 발명의 일 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다.
도 3은 본 발명의 다른 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다.
도 4는 본 발명의 또 다른 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다.
도 5는 본 발명의 일 실시 예에 따라 도 2 내지 4의 제어부의 상세 구성을 설명하기 위해 도시한 구성 블록도이다.
도 6은 본 발명의 일 실시 예에 따른 도 2 내지 4의 디지털 디바이스와 연결된 인풋 수단을 도시한 도면이다.
도 7은 본 발명의 일 실시 예에 따른 웹OS 아키텍처를 설명하기 위해 도시한 도면이다.
도 8은 본 발명의 일 실시 예에 따른 웹OS 디바이스의 아키텍처를 설명하기 위해 도시한 도면이다.
도 9는 본 발명의 일 실시 예에 따른 웹OS 디바이스에서 그래픽 컴포지션 플로우를 설명하기 위해 도시한 도면이다.
도 10은 본 발명의 일 실시 예에 따른 미디어 서버를 설명하기 위해 도시한 도면이다.
도 11은 본 발명의 일 실시 예에 따른 미디어 서버의 구성 블록도를 설명하기 위해 도시한 도면이다.
도 12는 본 발명의 일 실시 예에 따른 미디어 서버와 TV 서비스의 관계를 설명하기 위해 도시한 도면이다.
도 13은 본 발명의 실시 예들에 따른 영상표시기기 중 임의의 어느 하나를 제어하는 원격제어장치의 제어 방법을 도시한 도면이다.
도 14는 본 발명의 실시 예들에 따른 영상표시기기 중 임의의 어느 하나를 제어하는 원격제어장치의 내부 블록도이다.
도 15는 본 발명의 일 실시 예에 따른 디스플레이 디바이스의 구성도이다.
도 16은 본 발명의 일 실시 예에 따른, 디스플레이 디바이스의 제어 방법을 도시한 도면이다.
도 17은 본 발명의 일 실시 예에 따른, 디스플레이 디바이스의 원거리 음성인식 방법을 도시한 도면이다.
도 18은 본 발명의 일 실시 예에 따른, TV 볼륨 크기에 따라 게인 크기를 조절하는 것을 도시한 도면이다.
도 19는 본 발명의 일 실시 예에 따른, STT 수행에 따라 게인 크기를 조절하는 것을 도시한 도면이다.
도 20은 본 발명의 일 실시 예에 따른, 사운드가 발생한 경우, 사운드 발생방향으로 마이크의 사운드 수신 방향을 조정하는 것을 도시한 도면이다.
도 21은 본 발명의 일 실시 예에 따른, TV 볼륨 크기에 따른 게인 크기를 도시한 도시한 도면이다.
도 22는 본 발명의 일 실시 예에 따른, TV 볼륨 크기에 따라 게인 크기를 조정하는 것을 도시한 도면이다.
도 23은 본 발명의 일 실시 예에 따른, 기동어를 인식한 경우, 화면 UX 변화를 도시한 도면이다.
도 24는 본 발명의 일 실시 예에 따른, 기동어를 인식한 경우, TV 볼륨 소리를 감소시키는 그래픽 이미지를 도시한 도면이다.
도 25는 본 발명의 일 실시 예에 따른, 기동어를 인식하기 전과 후에 음성 의 크기 차이가 없이 연속된 발화를 하는 경우를 도시한 도면이다.
도 26은 본 발명의 일 실시 예에 따른, 카메라로 사용자를 인지하고, 마이크의 사운드 수신 방향을 사용자가 있는 곳으로 조정하는 경우를 도시한 도면이다. 1 is a view schematically illustrating a service system including a digital device according to an embodiment of the present invention.
2 is a block diagram illustrating a digital device according to an embodiment of the present invention.
3 is a block diagram illustrating a digital device according to another embodiment of the present invention.
4 is a block diagram illustrating a digital device according to another embodiment of the present invention.
5 is a block diagram illustrating a detailed configuration of the control unit of FIGS. 2 to 4 according to an embodiment of the present invention.
6 is a diagram illustrating input means connected to the digital devices of FIGS. 2 to 4 according to an embodiment of the present invention.
7 is a diagram illustrating a web OS architecture according to an embodiment of the present invention.
8 is a diagram illustrating an architecture of a web OS device according to an embodiment of the present invention.
9 is a diagram illustrating a graphic composition flow in a web OS device according to an embodiment of the present invention.
10 is a diagram illustrating a media server according to an embodiment of the present invention.
11 is a diagram illustrating a configuration block diagram of a media server according to an embodiment of the present invention.
12 is a diagram illustrating a relationship between a media server and a TV service according to an embodiment of the present invention.
13 is a diagram illustrating a control method of a remote control device that controls any one of video display devices according to embodiments of the present invention.
14 is an internal block diagram of a remote control device controlling any one of video display devices according to embodiments of the present invention.
15 is a configuration diagram of a display device according to an embodiment of the present invention.
16 is a diagram illustrating a control method of a display device according to an embodiment of the present invention.
17 is a diagram illustrating a remote voice recognition method of a display device according to an embodiment of the present invention.
18 is a diagram for adjusting a gain size according to a TV volume size according to an embodiment of the present invention.
19 is a diagram for adjusting gain size according to STT performance according to an embodiment of the present invention.
20 is a diagram for adjusting a sound reception direction of a microphone in a sound generation direction when sound is generated according to an embodiment of the present invention.
21 is a diagram illustrating a gain size according to a TV volume size according to an embodiment of the present invention.
22 is a diagram for adjusting a gain size according to a TV volume size, according to an embodiment of the present invention.
23 is a diagram illustrating a change in screen UX when a start word is recognized according to an embodiment of the present invention.
24 is a diagram illustrating a graphic image for reducing TV volume sound when a spoken word is recognized according to an embodiment of the present invention.
25 is a diagram illustrating a case in which continuous speech is performed without a difference in voice size before and after recognizing a starting word according to an embodiment of the present invention.
26 is a diagram illustrating a case in which a user is recognized by a camera and a sound reception direction of a microphone is adjusted to a user's location according to an embodiment of the present invention.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다. Hereinafter, the present invention will be described in more detail with reference to the drawings.
이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 단순히 본 명세서 작성의 용이함을 고려하여 부여되는 것으로서, 상기 "모듈" 및 "부"는 서로 혼용되어 사용될 수도 있다.The suffixes "modules" and "parts" for components used in the following description are simply given in consideration of the ease of writing this specification, and the "modules" and "parts" may be used interchangeably.
한편, 본 명세서에서 기술되는 영상표시기기는, 예컨대 방송 수신 기능에 컴퓨터 지원 기능을 추가한 지능형 영상표시기기로서, 방송 수신 기능에 충실하면서도 인터넷 기능 등이 추가되어, 수기 방식의 입력 장치, 터치 스크린 또는 공간 리모콘 등 보다 사용에 편리한 인터페이스를 갖출 수 있다. 그리고, 유선 또는 무선 인터넷 기능의 지원으로 인터넷 및 컴퓨터에 접속되어, 이메일, 웹브라우징, 뱅킹 또는 게임 등의 기능도 수행 가능하다. 이러한 다양한 기능을 위해 표준화된 범용 OS가 사용될 수 있다.Meanwhile, the video display device described in the present specification is, for example, an intelligent video display device in which a computer support function is added to a broadcast reception function, while an Internet function or the like is added while faithful to the broadcast reception function, a handwritten input device, a touch screen Alternatively, a more convenient interface such as a space remote control may be provided. And, with the support of wired or wireless Internet functions, it is possible to perform functions such as email, web browsing, banking, or games by accessing the Internet and computers. A standardized general-purpose OS can be used for these various functions.
따라서, 본 발명에서 기술되는 영상표시기기는, 예를 들어 범용의 OS 커널 상에, 다양한 애플리케이션이 자유롭게 추가되거나 삭제 가능하므로, 사용자 친화적인 다양한 기능이 수행될 수 있다. 상기 영상표시기기는, 보다 구체적으로 예를 들면, 네트워크 TV, HBBTV, 스마트 TV 등이 될 수 있으며, 경우에 따라 스마트폰에도 적용 가능하다.Accordingly, in the video display device described in the present invention, various applications can be freely added or deleted, for example, on a general-purpose OS kernel, so that various user-friendly functions can be performed. The video display device may be, for example, a network TV, an HBBTV, a smart TV, and the like, and may be applied to a smartphone in some cases.
나아가, 이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 실시 예를 상세하게 설명하지만, 본 발명이 실시 예들에 의해 제한되거나 한정되는 것은 아니다. Furthermore, the embodiments of the present invention will be described in detail with reference to the accompanying drawings and the contents described in the accompanying drawings, but the present invention is not limited or limited by the embodiments.
본 명세서에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 관례 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 그 의미를 기재할 것이다. 따라서 본 명세서에서 사용되는 용어는, 단순한 용어의 명칭이 아닌 그 용어가 가지는 실질적인 의미와 본 명세서의 전반에 걸친 내용을 토대로 해석되어야 함을 밝혀두고자 한다.The terminology used in the present specification is a general terminology that is currently widely used while considering functions in the present invention, but this may vary according to the intention or custom of a person skilled in the art or the appearance of a new technology. Also, in certain cases, some terms are arbitrarily selected by the applicant, and in this case, their meaning will be described in the description of the applicable invention. Therefore, it is intended to clarify that the terms used in the present specification are to be interpreted based on the actual meaning of the terms and the contents of the present specification, not simply the names of the terms.
이하 본 명세서에서 기술되는 “디지털 디바이스(digital device)”라 함은 예를 들어, 데이터(data), 컨텐트(content), 서비스(service), 애플리케이션(application) 등을 송신, 수신, 처리 및 출력 중 적어도 하나 이상을 수행하는 모든 디바이스를 포함한다. 상기 디지털 디바이스는, 유/무선 네트워크(wire/wireless network)를 통하여 다른 디지털 디바이스, 외부 서버(external server) 등과 페어링 또는 연결(pairing or connecting)(이하 '페어링') 가능하며, 그를 통해 소정 데이터를 송/수신할 수 있다. 이때, 필요에 따라, 상기 데이터는 그 송/수신 전에 적절히 변환(converting)될 수 있다. 상기 디지털 디바이스에는 예를 들어, 네트워크 TV(Network TV), HBBTV(Hybrid Broadcast Broadband TV), 스마트 TV(Smart TV), IPTV(Internet Protocol TV), PC(Personal Computer) 등과 같은 고정형 디바이스(standing device)와, PDA(Personal Digital Assistant), 스마트 폰(Smart Phone), 태블릿 PC(Tablet PC), 노트북(Notebook) 등과 같은 모바일 디바이스(mobile device or handheld device)가 모두 포함될 수 있다. 본 명세서에서는 본 발명의 이해를 돕고 출원인의 설명의 편의상 후술하는 도 2에서는 디지털 TV(Digital TV)를 그리고, 도 3에서는 모바일 디바이스를 디지털 디바이스의 일 실시 예로 도시하고 설명한다. 또한, 본 명세서에서 기술되는 디지털 디바이스는, 패널(panel)만을 가진 구성일 수도 있고, 셋톱 박스(STB: Set-Top Box) 등과 같은 구성, 디바이스, 시스템 등과 하나의 세트(SET) 구성일 수도 있다.Hereinafter, the term “digital device” described herein is, for example, transmitting, receiving, processing, and outputting data, content, service, application, and the like. All devices that perform at least one or more are included. The digital device can be paired or connected (hereinafter referred to as 'pairing') with another digital device, an external server, etc. through a wire / wireless network, through which a predetermined data is transmitted. You can send / receive. At this time, if necessary, the data can be converted appropriately before the transmission / reception. The digital device includes, for example, a fixed device such as a network TV, a HBBTV (Hybrid Broadcast Broadband TV), a smart TV, an IPTV (Internet Protocol TV), or a personal computer (PC). In addition, a mobile device (mobile device or handheld device) such as a PDA (Personal Digital Assistant), a smart phone (Smart Phone), a tablet PC (Tablet PC), a notebook (Notebook), etc. may be all included. In this specification, for convenience of understanding of the present invention and for convenience of the applicant's explanation, FIG. 2, which will be described later, illustrates and describes a digital TV, and FIG. 3 illustrates a mobile device as an example of a digital device. In addition, the digital device described in this specification may be a configuration having only a panel, or a configuration such as a set-top box (STB), a device, a system, etc., and a single SET configuration. .
한편, 본 명세서에서 기술되는 “유/무선 네트워크”라 함은, 디지털 디바이스들 또는 디지털 디바이스와 외부 서버 사이에서 페어링 또는/및 데이터 송수신을 위해 다양한 통신 규격 내지 프로토콜을 지원하는 통신 네트워크를 통칭한다. 이러한 유/무선 네트워크는, 규격에 의해 현재 또는 향후 지원될 통신 네트워크를 모두 포함하며, 그를 위한 하나 또는 그 이상의 통신 프로토콜들을 모두 지원 가능하다. 이러한 유/무선 네트워크에는 예컨대, USB(Universal Serial Bus), CVBS(Composite Video Banking Sync), 컴포넌트(Component), S-비디오(아날로그), DVI(Digital Visual Interface), HDMI(High Definition Multimedia Interface), RGB, D-SUB와 같은 유선 연결을 위한 네트워크와 그를 위한 통신 규격 내지 프로토콜과, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA: infrared Data Association), UWB(Ultra Wideband), 지그비(ZigBee), DLNA(Digital Living Network Alliance), WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access), LTE/LTE-A(Long Term Evolution/LTE-Advanced), Wi-Fi 다이렉트(direct)와 같은 무선 연결을 위한 네트워크와 그를 위한 통신 규격 내지 프로토콜에 의하여 형성될 수 있다. Meanwhile, the term “wired / wireless network” described herein refers to a communication network that supports various communication standards or protocols for pairing and / or data transmission and reception between digital devices or digital devices and external servers. Such a wired / wireless network includes all communication networks to be supported in the current or future by a standard, and can support all one or more communication protocols therefor. Such wired / wireless networks include, for example, Universal Serial Bus (USB), Composite Video Banking Sync (CVBS), Component, S-Video (analog), Digital Visual Interface (DVI), High Definition Multimedia Interface (HDMI), Network for wired connection such as RGB, D-SUB and communication standards or protocols therefor, Bluetooth, Radio Frequency Identification (RFID), Infrared Data Association (IrDA), Ultra Wideband (UWB), Zigbee (ZigBee), Digital Living Network Alliance (DLNA), Wireless LAN (WLAN) (Wi-Fi), Wireless broadband (Wibro), World Interoperability for Microwave Access (Wimax), High Speed Downlink Packet Access (HSDPA), LTE / LTE -A (Long Term Evolution / LTE-Advanced), can be formed by a network for wireless connection, such as Wi-Fi direct (direct) and communication standards or protocols therefor.
그 밖에, 본 명세서에서 단지 디지털 디바이스로 명명하는 경우, 그 의미는 문맥에 따라 고정형 디바이스 또는 모바일 디바이스를 의미할 수도 있고 특별히 언급하지 않는다면 양자를 모두 포함하는 의미로 사용될 수 있다.In addition, in the case of merely referring to a digital device in the present specification, the meaning may mean a fixed device or a mobile device depending on the context, and may be used to include both unless otherwise specified.
한편, 디지털 디바이스는 예컨대, 방송 수신 기능, 컴퓨터 기능 내지 지원, 적어도 하나의 외부 인풋 등을 지원하는 지능형 디바이스로서, 상술한 유/무선 네트워크를 통해 이메일(e-mail), 웹 브라우징(web browsing), 뱅킹(banking), 게임(game), 애플리케이션(application) 등을 지원할 수 있다. 더불어, 상기 디지털 디바이스는, 수기 방식의 인풋 디바이스, 터치-스크린(touch-screen), 공간 리모콘 등 적어도 하나의 인풋 또는 제어 수단(이하 '인풋 수단'을 지원하기 위한 인터페이스(interface)를 구비할 수 있다. Meanwhile, the digital device is an intelligent device that supports, for example, a broadcast reception function, a computer function or support, at least one external input, and the like, e-mail, web browsing through a wired / wireless network described above. , Banking, games, applications, and the like. In addition, the digital device may include an interface for supporting at least one input or control means (hereinafter referred to as an 'input means') such as a handwritten input device, a touch-screen, and a space remote control. have.
그 밖에, 디지털 디바이스는, 표준화된 범용 OS(Operating System)를 이용할 수 있으나 특히, 본 명세에서 기술되는 디지털 디바이스는, 웹OS를 이용하는 것을 일 실시 예로 한다. 따라서, 디지털 디바이스는 범용의 OS 커널(OS kernel) 또는 리눅스 커널(Linux kernel) 상에 다양한 서비스나 애플리케이션을 추가(adding), 삭제(deleting), 수정(amending), 업데이트(updating) 등을 처리가 가능하며, 그를 통해 더욱 사용자 친화적인(user-friendly) 환경을 구성하여 제공할 수 있다.In addition, the digital device may use a standardized general-purpose operating system (OS), but particularly, the digital device described in this specification uses an web OS as an embodiment. Therefore, the digital device can process various services or applications such as adding, deleting, amending, and updating various services or applications on the general-purpose OS kernel or Linux kernel. It is possible, through which a more user-friendly environment can be configured and provided.
한편, 상술한 디지털 디바이스는 외부 인풋을 수신하여 처리할 수 있는데 이때, 상기 외부 인풋은, 외부 인풋 디바이스 즉, 상술한 디지털 디바이스와 유/무선 네트워크를 통해 연결되어 데이터를 송/수신하여 처리 가능한 모든 인풋 수단 내지 디지털 디바이스를 포함한다. 예를 들어, 상기 외부 인풋으로 HDMI(High-Definition Multimedia Interface), 플레이스테이션(playstation)이나 엑스-박스(X-Box) 등과 같은 게임 디바이스(game device), 스마트 폰, 태블릿 PC, 포켓 포토(pocket photo) 등과 같은 프린터기(printing device), 스마트 TV, 블루-레이(Blu-ray device) 디바이스 등과 같은 디지털 디바이스들을 모두 포함한다.On the other hand, the above-described digital device can receive and process an external input. At this time, the external input is connected to an external input device, that is, the above-mentioned digital device through a wired / wireless network to transmit / receive data. Input means to digital devices. For example, as the external input, a high-definition multimedia interface (HDMI), a game device such as a Playstation or X-Box, a smart phone, a tablet PC, or a pocket photo photo) and other digital devices such as a printing device, a smart TV, and a Blu-ray device.
그 밖에, 본 명세서에서 기술되는 “서버”라 함은, 상술한 디지털 디바이스 즉, 클라이언트(client)로 데이터를 공급 또는 그로부터 데이터를 수신하는 디지털 디바이스 혹은 시스템을 의미하며, 프로세서(processor)로 불리기도 한다. 상기 서버로 예컨대, 웹 페이지(web page), 웹 컨텐트 또는 웹 서비스(web content or web service)를 제공하는 웹 서버(Web server)나 포털 서버(portal server), 광고 데이터(advertising data)를 제공하는 광고 서버(advertising server), 컨텐트를 제공하는 컨텐트 서버(content server), SNS(Social Network Service)를 제공하는 SNS 서버, 제조업체(manufacturer)에서 제공하는 서비스 서버(service server), VoD(Video on Demand)나 스트리밍(streaminng) 서비스 제공을 위한 MVPD(Multichannel Video Programming Distributor), 유료 서비스(pay service) 등을 제공하는 서비스 서버 등이 포함될 수 있다.In addition, the term “server” described herein refers to a digital device, that is, a digital device or system that supplies data to or receives data from a client, and is also called a processor. do. To the server, for example, a web server (Web server) or a portal server (portal server) that provides a web page (web page), web content or web service (web content or web service), providing advertising data (advertising data) Advertising server, content server providing content, SNS server providing social network service (SNS), service server provided by manufacturer, video on demand (VoD) B. A service server that provides a multichannel video programming distributor (MVPD) for providing a streaming service and a pay service may be included.
또한, 이하 본 명세서에서 설명의 편의를 위하여 애플리케이션으로만 기술한 경우에도 그 문맥 등을 기초하여 그 의미는 애플리케이션뿐만 아니라 서비스까지 포함하는 의미일 수 있다. 또한, 애플리케이션은 웹OS 프랫폼에 따른 웹 애플리케이션을 의미할 수 있다.In addition, in the following description, even when only described as an application for convenience of description, based on the context and the like, the meaning may include not only an application but also a service. Further, the application may refer to a web application according to the web OS platform.
이하 첨부된 도면을 참조하면 본 발명을 더욱 상세하게 설명하면, 다음과 같다.Hereinafter, the present invention will be described in more detail with reference to the accompanying drawings.
도 1은 본 발명의 일 실시 예에 따른 디지털 디바이스를 포함한 서비스 시스템을 개략적으로 설명하기 위해 도시한 도면이다.1 is a view schematically illustrating a service system including a digital device according to an embodiment of the present invention.
도 1에 도시한 바와 같이, 서비스 시스템은, 컨텐트 프로바이더(content provider)(10), 서비스 프로바이더(service provider)(20), 네트워크 프로바이더(network provider)(30) 및 HNED(Home Network End User)(Customer)(40)를 포함한다. 여기서, HNED(40)는 예를 들어, 클라이언트(100) 즉, 본 발명에 따른 디지털 디바이스를 포함한다.As shown in FIG. 1, the service system includes a
컨텐트 프로바이더(10)는, 각종 컨텐트를 제작하여 제공한다. 도 1에 도시된 바와 같이, 이러한 컨텐트 프로바이더(10)로 지상파 방송 송출자, 케이블 방송 사업자(cable SO(System Operator)) 또는 MSO(Multiple SO), 위성 방송 송출자, 다양한 인터넷 방송 송출자, 개인 컨텐트 프로바이더들 등을 예시할 수 있다. 한편, 컨텐트 프로바이더(10)는, 방송 컨텐트 외에도 다양한 서비스나 애플리케이션 등을 제작하여 제공할 수 있다.The
서비스 프로바이더(20)는, 컨텐트 프로바이더(10)에 의해 제작된 컨텐트를 서비스 패키지화(service packetizing)하여 HNED(40)로 제공한다. 예컨대, 서비스 프로바이더(20)는, 제1 지상파 방송, 제2 지상파 방송, 케이블 MSO, 위성 방송, 다양한 인터넷 방송, 애플리케이션 등에 의해 제작된 컨텐트들 중 적어도 하나 이상을 서비스를 위해 패키지화하고, 이를 HNED(40)에게 제공한다.The
서비스 프로바이더(20)는, 유니-캐스트(uni-cast) 또는 멀티-캐스트(multi-cast) 방식으로 클라이언트(100)에 서비스를 제공한다. 한편, 서비스 프로바이더(20)는 데이터를 미리 등록된 다수의 클라이언트(100)로 한꺼번에 전송할 수 있는데, 이를 위해 IGMP(Internet Group Management Protocol) 프로토콜 등을 이용할 수 있다.The
상술한 컨텐트 프로바이더(10)와 서비스 프로바이더(20)는, 동일한 개체(entity)일 수 있다. 예를 들어, 컨텐트 프로바이더(10)가 제작한 컨텐트를 서비스 패키지화하여 HNED(40)로 제공함으로써 서비스 프로바이더(20)의 기능도 함께 수행하거나 그 반대일 수도 있다.The above-described
네트워크 프로바이더(30)는, 컨텐트 프로바이더(10) 또는/및 서비스 프로바이더(20)와 클라이언트(100) 사이의 데이터 교환을 위한 네트워크 망을 제공한다.The
클라이언트(100)는, HNED(40)에 속한 소비자로서, 네트워크 프로바이더(30)를 통해 예컨대, 홈 네트워크(home network)를 구축하여 데이터를 수신하며, VoD, 스트리밍 등 다양한 서비스나 애플리케이션 등에 관한 데이터를 송/수신할 수도 있다.As a consumer belonging to the
한편, 서비스 시스템 내 컨텐트 프로바이더(10) 또는/및 서비스 프로바이더(20)는 전송되는 컨텐트의 보호를 위해 제한 수신(conditional access) 또는 컨텐트 보호(content protection) 수단을 이용할 수 있다. 따라서, 클라이언트(100)는 상기 제한 수신이나 컨텐트 보호에 대응하여 케이블카드(CableCARD)(또는 POD: Point of Deployment), DCAS(Downloadable CAS) 등과 같은 처리 수단을 이용할 수 있다.Meanwhile, the
그 밖에, 클라이언트(100)도 네트워크를 통해, 양방향 서비스를 이용할 수 있다. 따라서, 클라이언트(100)가 오히려 컨텐트 프로바이더의 역할 내지 기능을 수행할 수도 있으며, 서비스 프로바이더(20)는 이를 수신하여 다시 다른 클라이언트 등으로 전송할 수도 있다.In addition, the
도 1에서 컨텐트 프로바이더(10) 또는/및 서비스 프로바이더(20)는 본 명세서에서 후술하는 서비스를 제공하는 서버일 수 있다. 이 경우, 상기 서버는 필요에 따라 네트워크 프로바이더(30)도 소유 내지 포함하는 의미일 수 있다. 이하 특별히 언급하지 않더라도 서비스 또는 서비스 데이터는, 전술한 외부로부터 수신되는 서비스 내지 애플리케이션뿐만 아니라 내부 서비스 내지 애플리케이션을 포함하며, 이러한 서비스 내지 애플리케이션은 웹OS(Web OS) 기반의 클라이언트(100)를 위한 서비스 내지 애플리케이션 데이터를 의미할 수 있다.In FIG. 1, the
도 2는 본 발명의 일 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다. 2 is a block diagram illustrating a digital device according to an embodiment of the present invention.
이하 본 명세서에서 기술되는 디지털 디바이스는 전술한 도 1의 클라이언트(100)에 해당한다.Hereinafter, the digital device described in this specification corresponds to the
디지털 디바이스(200)는, 네트워크 인터페이스부(network interface)(201), TCP/IP 매니저(TCP/IP manager)(202), 서비스 전달 매니저(service delivery manager)(203), SI 디코더(204), 역다중화부(demux or demultiplexer)(205), 오디오 디코더(audio decoder)(206), 비디오 디코더(video decoder)(207), 디스플레이부(display A/V and OSD module)(208), 서비스 제어 매니저(service control manager)(209), 서비스 디스커버리 매니저(service discovery manager)(210), SI&메타데이터 데이터베이스(SI&metadata DB)(211), 메타데이터 매니저(metadata manager)(212), 서비스 매니저(213), UI 매니저(214) 등을 포함하여 구성된다.The
네트워크 인터페이스부(201)는, 액세스하는 네트워크 망을 통하여 IP 패킷(들)(Internet Protocol(IP) packet(s)) 또는 IP 데이터그램(들)(IP datagram(s))(이하 IP 패킷(들)이라 한다)을 송/수신한다. 일 예로, 네트워크 인터페이스부(201)는 네트워크 망을 통해 도 1의 서비스 프로바이더(20)로부터 서비스, 애플리케이션, 컨텐트 등을 수신할 수 있다.The
TCP/IP 매니저(202)는, 디지털 디바이스(200)로 수신되는 IP 패킷들과 디지털 디바이스(200)가 전송하는 IP 패킷들에 대하여 즉, 소스(source)와 목적지(destination) 사이의 패킷 전달(packet delivery)에 관여한다. 상기 TCP/IP 매니저(202)는 수신된 패킷(들)을 적절한 프로토콜에 대응하도록 분류하고, 서비스 전달 매니저(205), 서비스 디스커버리 매니저(210), 서비스 제어 매니저(209), 메타데이터 매니저(212) 등으로 상기 분류된 패킷(들)을 출력한다.The TCP /
서비스 전달 매니저(203)는, 수신되는 서비스 데이터의 제어를 담당한다. 예를 들어, 서비스 전달 매니저(203)는 실시간 스트리밍(real-time streaming) 데이터를 제어하는 경우에는 RTP/RTCP를 사용할 수 있다. 상기 실시간 스트리밍 데이터를 RTP를 사용하여 전송하는 경우, 서비스 전달 매니저(203)는 상기 수신된 데이터 패킷을 RTP에 따라 파싱(parsing)하여 역다중화부(205)로 전송하거나 서비스 매니저(213)의 제어에 따라 SI&메타데이터 데이터베이스(211)에 저장한다. 그리고, 서비스 전달 매니저(203)는 RTCP를 이용하여 상기 네트워크 수신 정보를 서비스를 제공하는 서버 측에 피드백(feedback)한다.The
역다중화부(205)는, 수신된 패킷을 오디오, 비디오, SI(System Information) 데이터 등으로 역다중화하여 각각 오디오/비디오 디코더(206/207), SI 디코더(204)에 전송한다.The
SI 디코더(204)는, 역다중화된 SI 데이터 즉, PSI(Program Specific Information), PSIP(Program and System Information Protocol), DVB-SI(Digital Video Broadcasting-Service Information), DTMB/CMMB(Digital Television Terrestrial Multimedia Broadcasting/Coding Mobile Multimedia Broadcasting) 등의 서비스 정보를 디코딩한다. 또한, SI 디코더(204)는, 디코딩된 서비스 정보들을 SI&메타데이터 데이터베이스(211)에 저장할 수 있다. 저장된 서비스 정보는 예를 들어, 사용자의 요청 등에 의해 해당 구성에 의해 독출되어 이용될 수 있다. The
오디오/비디오 디코더(206/207)는, 역다중화된 각 오디오 데이터와 비디오 데이터를 디코딩한다. 이렇게 디코딩된 오디오 데이터 및 비디오 데이터는 디스플레이부(208)를 통하여 사용자에게 제공된다.The audio /
애플리케이션 매니저는 예를 들어, UI 매니저(214)와 서비스 매니저(213)를 포함하며 디지털 디바이스(200)의 제어부 기능을 수행할 수 있다. 다시 말해, 애플리케이션 매니저는, 디지털 디바이스(200)의 전반적인 상태를 관리하고 사용자 인터페이스(UI: User Interface)를 제공하며, 다른 매니저를 관리할 수 있다.The application manager includes, for example, a
UI 매니저(214)는, 사용자를 위한 GUI(Graphic User Interface)/UI를 OSD(On Screen Display) 등을 이용하여 제공하며, 사용자로부터 키 인풋을 받아 상기 인풋에 따른 디바이스 동작을 수행한다. 예를 들어, UI 매니저(214)는 사용자로부터 채널 선택에 관한 키 인풋을 받으면 상기 키 인풋 신호를 서비스 매니저(213)에 전송한다.The
서비스 매니저(213)는, 서비스 전달 매니저(203), 서비스 디스커버리 매니저(210), 서비스 제어 매니저(209), 메타데이터 매니저(212) 등 서비스와 연관된 매니저를 제어한다.The
또한, 서비스 매니저(213)는, 채널 맵(channel map)을 생성하고 UI 매니저(214)로부터 수신한 키 인풋에 따라 상기 생성된 채널 맵을 이용하여 채널을 선택 등을 제어한다. 상기 서비스 매니저(213)는 SI 디코더(204)로부터 서비스 정보를 전송받아 선택된 채널의 오디오/비디오 PID(Packet Identifier)를 역다중화부(205)에 설정한다. 이렇게 설정되는 PID는 상술한 역다중화 과정에 이용될 수 있다. 따라서, 역다중화부(205)는 상기 PID를 이용하여 오디오 데이터, 비디오 데이터 및 SI 데이터를 필터링(PID or section filtering) 한다.In addition, the
서비스 디스커버리 매니저(210)는, 서비스를 제공하는 서비스 프로바이더를 선택하는데 필요한 정보를 제공한다. 상기 서비스 매니저(213)로부터 채널 선택에 관한 신호를 수신하면, 서비스 디스커버리 매니저(210)는 상기 정보를 이용하여 서비스를 찾는다.The
서비스 제어 매니저(209)는, 서비스의 선택과 제어를 담당한다. 예를 들어, 서비스 제어 매니저(209)는 사용자가 기존의 방송 방식과 같은 생방송(live broadcasting) 서비스를 선택하는 경우 IGMP 또는 RTSP 등을 사용하고, VOD(Video on Demand)와 같은 서비스를 선택하는 경우에는 RTSP를 사용하여 서비스의 선택, 제어를 수행한다. 상기 RTSP 프로토콜은 실시간 스트리밍에 대해 트릭 모드(trick mode)를 제공할 수 있다. 또한, 서비스 제어 매니저(209)는 IMS(IP Multimedia Subsystem), SIP(Session Initiation Protocol)를 이용하여 IMS 게이트웨이(250)를 통하는 세션을 초기화하고 관리할 수 있다. 상기 프로토콜들은 일 실시 예이며, 구현 예에 따라 다른 프로토콜을 사용할 수도 있다.The
메타데이터 매니저(212)는, 서비스와 연관된 메타데이터를 관리하고 상기 메타데이터를 SI&메타데이터 데이터베이스(211)에 저장한다.The
SI&메타데이터 데이터베이스(211)는, SI 디코더(204)가 디코딩한 서비스 정보, 메타데이터 매니저(212)가 관리하는 메타데이터 및 서비스 디스커버리 매니저(210)가 제공하는 서비스 프로바이더를 선택하는데 필요한 정보를 저장한다. 또한, SI&메타데이터 데이터베이스(211)는 시스템에 대한 세트-업 데이터 등을 저장할 수 있다.The SI &
SI&메타데이터 데이터베이스(211)는, 비휘발성 메모리(Non-Volatile RAM: NVRAM) 또는 플래시 메모리(flash memory) 등을 사용하여 구현될 수도 있다.The SI &
한편, IMS 게이트웨이(250)는, IMS 기반의 IPTV 서비스에 접근하기 위해 필요한 기능들을 모아 놓은 게이트웨이이다.Meanwhile, the
도 3은 본 발명의 다른 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다. 3 is a block diagram illustrating a digital device according to another embodiment of the present invention.
전술한 도 2가 고정 디바이스를 디지털 디바이스의 일 실시 예로 하여 설명하였다면, 도 3은 모바일 디바이스를 디지털 디바이스의 다른 실시 예로 한다.If the above-described FIG. 2 described a fixed device as an example of a digital device, FIG. 3 illustrates a mobile device as another example of a digital device.
도 3을 참조하면, 모바일 디바이스(300)는 무선 통신부(310), A/V(Audio/Video) 입력부(320), 사용자 입력부(330), 센싱부(340), 출력부(350), 메모리(360), 인터페이스부(370), 제어부(380) 및 전원 공급부(390) 등을 포함할 수 있다. Referring to FIG. 3, the
이하 각 구성요소에 대해 상세히 설명하면, 다음과 같다.Hereinafter, each component will be described in detail as follows.
무선 통신부(310)는, 모바일 디바이스(300)와 무선 통신 시스템 사이 또는 모바일 디바이스와, 모바일 디바이스가 위치한 네트워크 사이의 무선 통신을 가능하게 하는 하나 또는 그 이상의 모듈을 포함할 수 있다. 예를 들어, 무선 통신부(310)는 방송 수신 모듈(311), 이동통신 모듈(312), 무선 인터넷 모듈(313), 근거리 통신 모듈(314) 및 위치정보 모듈(315) 등을 포함할 수 있다.The
방송 수신 모듈(311)은, 방송 채널을 통하여 외부의 방송 관리 서버로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 여기서, 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 상기 방송 관리 서버는, 방송 신호 및/또는 방송 관련 정보를 생성하여 송신하는 서버 또는 기 생성된 방송 신호 및/또는 방송 관련 정보를 제공받아 단말기에 송신하는 서버를 의미할 수 있다. 상기 방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다. The
방송 관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 프로바이더에 관련한 정보를 의미할 수 있다. 상기 방송 관련 정보는, 이동통신망을 통하여도 제공될 수 있다. 이러한 경우에는 상기 이동통신 모듈(312)에 의해 수신될 수 있다.The broadcasting related information may mean information related to a broadcasting channel, a broadcasting program, or a broadcasting service provider. The broadcast-related information may also be provided through a mobile communication network. In this case, it may be received by the
방송 관련 정보는 다양한 형태 예를 들어, EPG(Electronic Program Guide) 또는 ESG(Electronic Service Guide) 등의 형태로 존재할 수 있다.Broadcast-related information may exist in various forms, for example, an electronic program guide (EPG) or an electronic service guide (ESG).
방송수신 모듈(311)은 예를 들어, ATSC, DVB-T(Digital Video Broadcasting-Terrestrial), DVB-S(Satellite), MediaFLO(Media Forward Link Only), DVB-H(Handheld), ISDB-T(Integrated Services Digital Broadcast-Terrestrial) 등 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 물론, 방송수신 모듈(311)은, 상술한 디지털 방송 시스템뿐만 아니라 다른 방송 시스템에 적합하도록 구성될 수도 있다.The
방송수신 모듈(311)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는, 메모리(360)에 저장될 수 있다.The broadcast signal and / or broadcast-related information received through the
이동통신 모듈(312)은, 이동 통신망 상에서 기지국, 외부 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 무선 신호는, 음성 신호, 화상 통화 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다. The
무선인터넷 모듈(313)은, 무선 인터넷 접속을 위한 모듈을 포함하여, 모바일 디바이스(300)에 내장되거나 외장될 수 있다. 무선 인터넷 기술로는 WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등이 이용될 수 있다. The
근거리통신 모듈(314)은, 근거리 통신을 위한 모듈을 말한다. 근거리 통신(short range communication) 기술로 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), ZigBee, RS-232, RS-485 등이 이용될 수 있다.The short-
위치정보 모듈(315)은, 모바일 디바이스(300)의 위치 정보 획득을 위한 모듈로서, GPS(Global Position System) 모듈을 예로 할 수 있다.The
A/V 입력부(320)는, 오디오 또는/및 비디오 신호 인풋을 위한 것으로, 이에는 카메라(321)와 마이크(322) 등이 포함될 수 있다. 카메라(321)는, 화상통화 모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(351)에 표시될 수 있다.The A /
카메라(321)에서 처리된 화상 프레임은, 메모리(360)에 저장되거나 무선 통신부(310)를 통하여 외부로 전송될 수 있다. 카메라(321)는, 사용 환경에 따라 2개 이상이 구비될 수도 있다.The image frames processed by the
마이크(322)는, 통화 모드 또는 녹음 모드, 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 음향 신호를 입력받아 전기적인 음성 데이터로 처리한다. 처리된 음성 데이터는, 통화 모드인 경우 이동통신 모듈(312)을 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크(322)에는 외부의 음향 신호를 입력받는 과정에서 발생하는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다.The
사용자 입력부(330)는, 사용자가 단말기의 동작 제어를 위한 인풋 데이터를 발생시킨다. 사용자 입력부(330)는, 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠(jog wheel), 조그 스위치(jog switch) 등으로 구성될 수 있다. The user input unit 330 generates input data for the user to control the operation of the terminal. The user input unit 330 may be configured with a key pad, a dome switch, a touch pad (static pressure / power outage), a jog wheel, a jog switch, or the like.
센싱부(340)는, 모바일 디바이스(300)의 개폐 상태, 모바일 디바이스(300)의 위치, 사용자 접촉 유무, 모바일 디바이스의 방위, 모바일 디바이스의 가속/감속 등과 같이 모바일 디바이스(300)의 현재 상태를 감지하여 모바일 디바이스(300)의 동작 제어를 위한 센싱 신호를 발생시킨다. 예를 들어, 모바일 디바이스(300)가 이동되거나 기울어진 경우 모바일 디바이스의 위치 내지 기울기 등을 센싱할 수 있다. 또한, 전원 공급부(390)의 전원 공급 여부, 인터페이스부(370)의 외부 디바이스 결합 여부 등도 센싱할 수도 있다. 한편, 센싱부(240)는, NFC(Near Field Communication) 등을 포함한 근접 센서(341)를 포함할 수 있다.The
출력부(350)는, 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 디스플레이부(351), 음향 출력 모듈(352), 알람부(353), 및 햅틱 모듈(354) 등이 포함될 수 있다.The
디스플레이부(351)는, 모바일 디바이스(300)에서 처리되는 정보를 표시(출력)한다. 예를 들어, 모바일 디바이스가 통화 모드인 경우 통화와 관련된 UI 또는 GUI를 표시한다. 모바일 디바이스(300)가 화상 통화 모드 또는 촬영 모드인 경우에는, 촬영 또는/및 수신된 영상 또는 UI, GUI를 표시한다. The
디스플레이부(351)는, 액정 디스플레이(liquid crystal display, LCD), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display, TFT LCD), 유기 발광 다이오드(organic light-emitting diode, OLED), 플렉시블 디스플레이(flexible display), 3차원 디스플레이 중에서 적어도 하나를 포함할 수 있다. The
이들 중 일부 디스플레이는 그를 통해 외부를 볼 수 있도록 투명형 또는 광투과형으로 구성될 수 있다. 이는 투명 디스플레이라 호칭될 수 있는데, 상기 투명 디스플레이의 대표적인 예로는 TOLED(Transparant OLED) 등이 있다. 디스플레이부(351)의 후방 구조 또한 광 투과형 구조로 구성될 수 있다. 이러한 구조에 의하여, 사용자는 단말기 바디의 디스플레이부(351)가 차지하는 영역을 통해 단말기 바디(body)의 후방에 위치한 사물을 볼 수 있다.Some of these displays may be of a transparent type or a light transmissive type so that the outside can be seen through them. This may be referred to as a transparent display, and a typical example of the transparent display is TOLED (Transparant OLED). The rear structure of the
모바일 디바이스(300)의 구현 형태에 따라 디스플레이부(351)가 2개 이상 존재할 수 있다. 예를 들어, 모바일 디바이스(300)에는 복수의 디스플레이부들이 하나의 면에 이격되거나 일체로 배치될 수 있고, 또한 서로 다른 면에 각각 배치될 수도 있다. Two or
디스플레이부(351)와 터치 동작을 감지하는 센서(이하 '터치 센서'라 함)가 상호 레이어 구조를 이루는 경우(이하, '터치 스크린'이라 함)에, 디스플레이부(351)는 출력 디바이스 이외에 인풋 디바이스로도 사용될 수 있다. 터치 센서는, 예를 들어, 터치 필름, 터치 시트, 터치 패드 등의 형태를 가질 수 있다.When the
터치 센서는 디스플레이부(351)의 특정 부위에 가해진 압력 또는 디스플레이부(351)의 특정 부위에 발생하는 정전 용량 등의 변화를 전기적인 입력신호로 변환하도록 구성될 수 있다. 터치 센서는 터치 되는 위치 및 면적뿐만 아니라, 터치 시의 압력까지도 검출할 수 있도록 구성될 수 있다. The touch sensor may be configured to convert changes in pressure applied to a specific portion of the
터치 센서에 대한 터치 인풋이 있는 경우, 그에 대응하는 신호(들)는 터치 제어기로 보내진다. 터치 제어기는 그 신호(들)를 처리한 다음 대응하는 데이터를 제어부(380)로 전송한다. 이로써, 제어부(380)는 디스플레이부(351)의 어느 영역이 터치 되었는지 여부 등을 알 수 있게 된다.If there is a touch input to the touch sensor, the corresponding signal (s) is sent to the touch controller. The touch controller processes the signal (s) and then transmits corresponding data to the
터치스크린에 의해 감싸지는 모바일 디바이스의 내부 영역 또는 상기 터치 스크린의 근처에 근접 센서(341)가 배치될 수 있다. 상기 근접 센서는 소정의 검출면에 접근하는 물체, 혹은 근방에 존재하는 물체의 유무를 전자계의 힘 또는 적외선을 이용하여 기계적 접촉이 없이 검출하는 센서를 말한다. 근접 센서는 접촉식 센서보다는 그 수명이 길며 그 활용도 또한 높다. A
상기 근접 센서의 예로는 투과형 광전 센서, 직접 반사형 광전 센서, 미러 반사형 광전 센서, 고주파 발진형 근접 센서, 정전용량형 근접 센서, 자기형 근접 센서, 적외선 근접 센서 등이 있다. 상기 터치스크린이 정전식인 경우에는 상기 포인터의 근접에 따른 전계의 변화로 상기 포인터의 근접을 검출하도록 구성된다. 이 경우 상기 터치 스크린(터치 센서)은 근접 센서로 분류될 수도 있다.Examples of the proximity sensor include a transmission type photoelectric sensor, a direct reflection type photoelectric sensor, a mirror reflection type photoelectric sensor, a high frequency oscillation type proximity sensor, a capacitive type proximity sensor, a magnetic type proximity sensor, and an infrared proximity sensor. When the touch screen is capacitive, it is configured to detect the proximity of the pointer due to a change in electric field according to the proximity of the pointer. In this case, the touch screen (touch sensor) may be classified as a proximity sensor.
이하에서는 설명의 편의를 위해, 상기 터치스크린 상에 포인터가 접촉되지 않으면서 근접되어 상기 포인터가 상기 터치스크린 상에 위치함이 인식되도록 하는 행위를 "근접 터치(proximity touch)"라고 칭하고, 상기 터치스크린 상에 포인터가 실제로 접촉되는 행위를 "접촉 터치(contact touch)"라고 칭한다. 상기 터치스크린 상에서 포인터로 근접 터치가 되는 위치라 함은, 상기 포인터가 근접 터치될 때 상기 포인터가 상기 터치스크린에 대해 수직으로 대응되는 위치를 의미한다.Hereinafter, for convenience of description, an act of causing the pointer to be recognized as being located on the touch screen without being touched by the pointer on the touch screen is referred to as a “proximity touch”, and the touch The act of actually touching the pointer on the screen is referred to as "contact touch". The location on the touch screen that is a proximity touch with a pointer refers to a location where the pointer corresponds vertically to the touch screen when the pointer is touched close.
상기 근접 센서는, 근접 터치와, 근접 터치 패턴(예를 들어, 근접 터치 거리, 근접 터치 방향, 근접 터치 속도, 근접 터치 시간, 근접 터치 위치, 근접 터치 이동 상태 등)을 감지한다. 상기 감지된 근접 터치 동작 및 근접 터치 패턴에 상응하는 정보는 터치 스크린상에 출력될 수 있다. The proximity sensor detects a proximity touch and a proximity touch pattern (eg, proximity touch distance, proximity touch direction, proximity touch speed, proximity touch time, proximity touch position, proximity touch movement state, etc.). Information corresponding to the sensed proximity touch operation and proximity touch pattern may be output on the touch screen.
음향출력모듈(352)은, 호신호 수신, 통화 모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(310)로부터 수신되거나 메모리(360)에 저장된 오디오 데이터를 출력할 수 있다. 음향 출력 모듈(352)은 모바일 디바이스(300)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력하기도 한다. 이러한 음향 출력 모듈(352)에는 리시버(receiver), 스피커(speaker), 버저(buzzer) 등이 포함될 수 있다.The
알람부(353)는, 모바일 디바이스(300)의 이벤트 발생을 알리기 위한 신호를 출력한다. 모바일 디바이스에서 발생 되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력, 터치 입력 등이 있다. 알람부(353)는, 비디오 신호나 오디오 신호 이외에 다른 형태, 예를 들어 진동으로 이벤트 발생을 알리기 위한 신호를 출력할 수도 있다. 상기 비디오 신호나 오디오 신호는 디스플레이부(351)나 음성 출력 모듈(352)을 통해서도 출력될 수 있어서, 그들(351,352)은 알람부(353)의 일부로 분류될 수도 있다.The
햅틱 모듈(haptic module)(354)은, 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(354)이 발생시키는 촉각 효과의 대표적인 예로는 진동이 있다. 햅택 모듈(354)이 발생하는 진동의 세기와 패턴 등은 제어 가능하다. 예를 들어, 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다. 햅틱 모듈(354)은, 진동 외에도, 접촉 피부면에 대해 수직 운동하는 핀 배열, 분사구나 흡입구를 통한 공기의 분사력이나 흡입력, 피부 표면에 대한 스침, 전극(eletrode)의 접촉, 정전기력 등의 자극에 의한 효과와, 흡열이나 발열 가능한 소자를 이용한 냉/온감 재현에 의한 효과 등 다양한 촉각 효과를 발생시킬 수 있다. 햅틱 모듈(354)은, 직접적인 접촉을 통해 촉각 효과의 전달할 수 있을 뿐만 아니라, 사용자가 손가락이나 팔 등의 근 감각을 통해 촉각 효과를 느낄 수 있도록 구현할 수도 있다. 햅틱 모듈(354)은, 모바일 디바이스(300)의 구성 태양에 따라 2개 이상이 구비될 수 있다.The
메모리(360)는, 제어부(380)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 폰 북, 메시지, 정지영상, 동영상 등)을 임시 저장할 수도 있다. 상기 메모리(360)는 상기 터치스크린 상의 터치 인풋 시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.The
메모리(360)는, 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 모바일 디바이스(300)는 인터넷(internet) 상에서 상기 메모리(360)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다.The
인터페이스부(370)는, 모바일 디바이스(300)에 연결되는 모든 외부 디바이스와의 통로 역할을 한다. 인터페이스부(370)는 외부 디바이스로부터 데이터를 전송 받거나, 전원을 공급받아 모바일 디바이스(300) 내부의 각 구성 요소에 전달하거나, 모바일 디바이스(300) 내부의 데이터가 외부 디바이스로 전송되도록 한다. 예를 들어, 유/무선 헤드셋 포트, 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 식별 모듈이 구비된 디바이스를 연결하는 포트, 오디오 I/O(Input/Output) 포트, 비디오 I/O 포트, 이어폰 포트 등이 인터페이스부(370)에 포함될 수 있다. The
식별 모듈은 모바일 디바이스(300)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(User Identify Module, UIM), 가입자 인증 모듈(Subscriber Identify Module, SIM), 범용 사용자 인증 모듈(Universal Subscriber Identity Module, USIM) 등을 포함할 수 있다. 식별 모듈이 구비된 디바이스(이하 '식별 디바이스')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 디바이스는 포트를 통하여 단말기(200)와 연결될 수 있다. The identification module is a chip that stores various information for authenticating the usage rights of the
인터페이스부(370)는, 모바일 디바이스(300)가 외부 크래들(cradle)과 연결될 때, 상기 크래들로부터의 전원이 상기 모바일 디바이스(300)에 공급되는 통로가 되거나, 사용자에 의해 상기 크래들에서 입력되는 각종 명령 신호가 상기 모바일 디바이스로 전달되는 통로가 될 수 있다. 크래들로부터 입력되는 각종 명령 신호 또는 상기 전원은, 모바일 디바이스가 상기 크래들에 정확히 장착되었음을 인지하기 위한 신호로 동작될 수도 있다.When the
제어부(380)는, 통상적으로 모바일 디바이스(300)의 전반적인 동작을 제어한다. 제어부(380)는 예를 들어, 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 제어부(380)는, 멀티미디어 재생을 위한 멀티미디어 모듈(381)을 구비할 수도 있다. 멀티미디어 모듈(381)은, 제어부(380) 내에 구현될 수도 있고, 제어부(380)와 별도로 구현될 수도 있다. 제어부(380)는, 터치-스크린상에서 행해지는 필기 인풋 또는 그림 그리기 인풋을 각각 문자 및 이미지로 인식할 수 있는 패턴 인식(pattern recognition) 처리를 행할 수 있다. The
전원 공급부(390)는, 제어부(380)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.The
여기에 설명되는 다양한 실시예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 디바이스로 읽을 수 있는 기록매체 내에서 구현될 수 있다.The various embodiments described herein can be implemented in a computer- or similar device-readable recording medium using, for example, software, hardware, or a combination thereof.
하드웨어적인 구현에 의하면, 여기에 설명되는 실시예는 ASICs(application specific integrated circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays, 프로세서, 제어기, 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛(unit) 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시 예들이 제어부(380) 자체로 구현될 수 있다.According to a hardware implementation, embodiments described herein include application specific integrated circuits (ASICs), digital signal processors (DSPs), digital signal processing devices (DSPDs), programmable logic devices (PLDs), field programmable gate arrays (FPGAs), It may be implemented using at least one of a processor, a controller, micro-controllers, microprocessors, and electrical units for performing other functions. Examples may be implemented by the
소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시 예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다. 적절한 프로그램 언어로 쓰여진 소프트웨어 애플리케이션으로 소프트웨어 코드(software code)가 구현될 수 있다. 여기서, 소프트웨어 코드는, 메모리(360)에 저장되고, 제어부(380)에 의해 실행될 수 있다.According to the software implementation, embodiments such as procedures and functions described herein may be implemented as separate software modules. Each of the software modules can perform one or more functions and operations described herein. Software code can be implemented in a software application written in an appropriate programming language. Here, the software code is stored in the
도 4는 본 발명의 또 다른 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다.4 is a block diagram illustrating a digital device according to another embodiment of the present invention.
디지털 디바이스(400)의 다른 예는, 방송 수신부(405), 외부 디바이스 인터페이스부(435), 저장부(440), 사용자입력 인터페이스부(450), 제어부(470), 디스플레이부(480), 오디오 출력부(485), 전원 공급부(490) 및 촬영부(미도시)를 포함할 수 있다. 여기서, 상기 방송 수신부(405)는, 적어도 하나의 튜너(410), 복조부(420) 및 네트워크 인터페이스부(430)를 포함할 수 있다. 다만, 경우에 따라, 상기 방송 수신부(405)는 튜너(410)와 복조부(420)는 구비하나 네트워크 인터페이스부(430)는 포함하지 않을 수 있으며 그 반대의 경우일 수도 있다. 또한, 상기 방송 수신부(405)는 도시되진 않았으나, 다중화부(multiplexer)를 구비하여 상기 튜너(410)를 거쳐 복조부(420)에서 복조된 신호와 상기 네트워크 인터페이스부(430)를 거쳐 수신된 신호를 다중화할 수도 있다. 그 밖에 상기 방송 수신부(425)는 역시 도시되진 않았으나, 역다중화부(demultiplexer)를 구비하여 상기 다중화된 신호를 역다중화하거나 상기 복조된 신호 또는 상기 네트워크 인터페이스부(430)를 거친 신호를 역다중화할 수 있다.Other examples of the
튜너(410)는, 안테나를 통해 수신되는 RF(Radio Frequency) 방송 신호 중 사용자에 의해 선택된 채널 또는 기 저장된 모든 채널을 튜닝하여 RF 방송 신호를 수신한다. 또한, 튜너(410)는, 수신된 RF 방송 신호를 중간 주파수(Intermediate Frequency; IF) 신호 혹은 베이스밴드(baseband) 신호로 변환한다.The
예를 들어, 수신된 RF 방송 신호가 디지털 방송 신호이면 디지털 IF 신호(DIF)로 변환하고, 아날로그 방송 신호이면 아날로그 베이스밴드 영상 또는 음성 신호(CVBS/SIF)로 변환한다. 즉, 튜너(410)는 디지털 방송 신호 또는 아날로그 방송 신호를 모두 처리할 수 있다. 튜너(410)에서 출력되는 아날로그 베이스 밴드 영상 또는 음성 신호(CVBS/SIF)는 제어부(470)로 직접 입력될 수 있다.For example, if the received RF broadcast signal is a digital broadcast signal, it is converted into a digital IF signal (DIF), and if it is an analog broadcast signal, it is converted into an analog baseband video or audio signal (CVBS / SIF). That is, the
또한, 튜너(410)는, 싱글 캐리어(single carrier) 또는 멀티플 캐리어(multiple carrier)의 RF 방송 신호를 수신할 수 있다. 한편, 튜너(410)는, 안테나를 통해 수신되는 RF 방송 신호 중 채널 기억 기능을 통하여 저장된 모든 방송 채널의 RF 방송 신호를 순차로 튜닝 및 수신하여 이를 중간 주파수 신호 혹은 베이스 밴드 신호(DIF: Digital Intermediate Frequency or baseband signal)로 변환할 수 있다.In addition, the
복조부(420)는, 튜너(410)에서 변환된 디지털 IF 신호(DIF)를 수신하여 복조하고, 채널 복호화 등을 수행할 수도 있다. 이를 위해 복조부(420)는 트렐리스 디코더(Trellis Decoder), 디인터리버(De-interleaver), 리드 솔로먼 디코더(Reed-Solomon Decoder) 등을 구비하거나 컨벌루션 디코더(convolution decoder), 디인터리버 및 리드-솔로먼 디코더 등을 구비할 수 있다.The
복조부(420)는, 복조 및 채널 복호화를 수행한 후 스트림 신호(TS)를 출력할 수 있다. 이때, 스트림 신호는 영상 신호, 음성 신호 또는 데이터 신호가 다중화된 신호일 수 있다. 일 예로, 스트림 신호는 MPEG-2 규격의 영상 신호, 돌비(Dolby) AC-3 규격의 음성 신호 등이 다중화된 MPEG-2 TS(Transport Stream)일 수 있다.The
복조부(420)에서 출력한 스트림 신호는 제어부(470)로 입력될 수 있다. 제어부(470)는 역다중화, 영상/음성 신호 처리 등을 제어하고, 디스플레이부(480)를 통해 영상을, 오디오 출력부(485)를 통해 음성의 출력을 제어할 수 있다.The stream signal output from the
외부 디바이스 인터페이스부(435)는 디지털 디바이스(300)와 다양한 외부 디바이스 사이의 인터페이싱 환경을 제공한다. 이를 위해, 외부 디바이스 인터페이스부(335)는, A/V 입/출력부(미도시) 또는 무선 통신부(미도시)를 포함할 수 있다.The external
외부 디바이스 인터페이스부(435)는, DVD(Digital Versatile Disk), 블루-레이(Blu-ray), 게임 디바이스, 카메라, 캠코더(Camcorder), 컴퓨터(노트북), 태블릿 PC, 스마트 폰, 블루투스 디바이스(Bluetooth device), 클라우드(Cloud) 등과 같은 외부 디바이스 등과 유/무선으로 접속될 수 있다. 외부 디바이스 인터페이스부(435)는 연결된 외부 디바이스를 통하여 입력되는 이미지, 영상, 음성 등 데이터를 포함한 신호를 디지털 디바이스의 제어부(470)로 전달한다. 제어부(470)는 처리된 이미지, 영상, 음성 등을 데이터 신호를 연결된 외부 디바이스로 출력되도록 제어할 수 있다. 이를 위해, 외부 디바이스 인터페이스부(435)는, A/V 입/출력부(미도시) 또는 무선 통신부(미도시)를 더 포함할 수 있다.The external
A/V 입/출력부는, 외부 디바이스의 영상 및 음성 신호를 디지털 디바이스(400)로 입력할 수 있도록, USB 단자, CVBS(Composite Video Banking Sync) 단자, 컴포넌트 단자, S-비디오 단자(아날로그), DVI(Digital Visual Interface) 단자, HDMI(High Definition Multimedia Interface) 단자, RGB 단자, D-SUB 단자 등을 포함할 수 있다.The A / V input / output unit allows a USB terminal, a CVBS (Composite Video Banking Sync) terminal, a component terminal, and an S-video terminal (analog) to input video and audio signals from an external device to the
무선 통신부는, 다른 디지털 디바이스와 근거리 무선 통신을 수행할 수 있다. 디지털 디바이스(400)는 예를 들어, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), 지그비(ZigBee), DLNA(Digital Living Network Alliance) 등의 통신 프로토콜에 따라 다른 디지털 디바이스와 네트워크 연결될 수 있다.The wireless communication unit may perform short-range wireless communication with other digital devices. The
또한, 외부 디바이스 인터페이스부(435)는, 셋톱-박스(STB)와 상술한 각종 단자 중 적어도 하나를 통해 접속되어, 셋톱-박스(STB)와 입력/출력 동작을 수행할 수도 있다.Also, the external
한편, 외부 디바이스 인터페이스부(435)는, 인접하는 외부 디바이스 내의 애플리케이션 또는 애플리케이션 목록(application list)을 수신하여, 제어부(470) 또는 저장부(440)로 전달할 수 있다.Meanwhile, the external
네트워크 인터페이스부(430)는, 디지털 디바이스(400)를 인터넷 망을 포함하는 유/무선 네트워크와 연결하기 위한 인터페이스를 제공한다. 네트워크 인터페이스부(430)는, 유선 네트워크와의 접속을 위해 예를 들어, 이더넷(Ethernet) 단자 등을 구비할 수 있으며, 무선 네트워크와의 접속을 위해 예를 들어, WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 통신 규격 등을 이용할 수 있다.The
네트워크 인터페이스부(430)는, 접속된 네트워크 또는 접속된 네트워크에 링크된 다른 네트워크를 통해, 다른 사용자 또는 다른 디지털 디바이스와 데이터를 송신 또는 수신할 수 있다. 특히, 디지털 디바이스(400)에 미리 등록된 다른 사용자 또는 다른 디지털 디바이스 중 선택된 사용자 또는 선택된 디지털 디바이스에, 상기 디지털 디바이스(400)에 저장된 일부의 컨텐트 데이터를 송신할 수 있다.The
한편, 네트워크 인터페이스부(430)는, 접속된 네트워크 또는 접속된 네트워크에 링크된 다른 네트워크를 통해, 소정 웹 페이지에 접속할 수 있다. 즉, 네트워크를 통해 소정 웹 페이지에 접속하여, 해당 서버와 데이터를 송신 또는 수신할 수 있다. 그 외, 컨텐트 프로바이더 또는 네트워크 운영자가 제공하는 컨텐트 또는 데이터들을 수신할 수 있다. 즉, 네트워크를 통하여 컨텐트 프로바이더 또는 네트워크 프로바이더로부터 제공되는 영화, 광고, 게임, VOD, 방송 신호 등의 컨텐트 및 그와 관련된 정보를 수신할 수 있다. 또한, 네트워크 운영자가 제공하는 펌웨어(firmware)의 업데이트 정보 및 업데이트 파일을 수신할 수 있다. 또한, 인터넷 또는 컨텐트 프로바이더 또는 네트워크 운영자에게 데이터들을 송신할 수 있다.Meanwhile, the
또한, 네트워크 인터페이스부(430)는, 네트워크를 통해 공개(open)된 애플리케이션들 중 원하는 애플리케이션을 선택하여 수신할 수 있다.Also, the
저장부(440)는, 제어부(470) 내의 각 신호 처리 및 제어를 위한 프로그램을 저장할 수도 있고, 신호 처리된 영상, 음성 또는 데이터 신호를 저장할 수도 있다.The
또한, 저장부(440)는 외부 디바이스 인터페이스부(435) 또는 네트워크 인터페이스부(430)로부터 입력되는 영상, 음성, 또는 데이터 신호의 임시 저장을 위한 기능을 수행할 수도 있다. 저장부(440)는, 채널 기억 기능을 통하여 소정 방송 채널에 관한 정보를 저장할 수 있다.Also, the
저장부(440)는, 외부 디바이스 인터페이스부(435) 또는 네트워크 인터페이스부(330)로부터 입력되는 애플리케이션 또는 애플리케이션 목록을 저장할 수 있다.The
또한, 저장부(440)는, 후술하여 설명하는 다양한 플랫폼(platform)을 저장할 수도 있다.Also, the
저장부(440)는, 예를 들어 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM), 롬(EEPROM 등) 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 디지털 디바이스(400)는, 저장부(440) 내에 저장되어 있는 컨텐트 파일(동영상 파일, 정지영상 파일, 음악 파일, 문서 파일, 애플리케이션 파일 등)을 재생하여 사용자에게 제공할 수 있다.The
도 4는 저장부(440)가 제어부(470)와 별도로 구비된 실시 예를 도시하고 있으나, 본 발명은 이에 한정되지 않는다. 다시 말해, 저장부(440)는 제어부(470) 내에 포함될 수도 있다.4 illustrates an embodiment in which the
사용자 입력 인터페이스부(450)는, 사용자가 입력한 신호를 제어부(470)로 전달하거나 제어부(470)의 신호를 사용자에게 전달한다.The
예를 들어, 사용자 입력 인터페이스부(450)는, RF 통신 방식, 적외선(IR) 통신 방식 등 다양한 통신 방식에 따라, 원격제어 디바이스(500)로부터 전원 온/오프, 채널 선택, 화면 설정 등의 제어 신호를 수신하여 처리하거나, 제어부(470)의 제어 신호를 원격제어 디바이스(500)로 송신하도록 처리할 수 있다.For example, the user
또한, 사용자 입력 인터페이스부(450)는, 전원 키, 채널 키, 볼륨 키, 설정치 등의 로컬 키(미도시)에서 입력되는 제어 신호를 제어부(470)에 전달할 수 있다.In addition, the user
사용자 입력 인터페이스부(450)는, 사용자의 제스처(gesture)를 센싱(sensing)하는 센싱부(미도시)로부터 입력되는 제어 신호를 제어부(470)에 전달하거나, 제어부(470)의 신호를 센싱부(미도시)로 송신할 수 있다. 여기서, 센싱부(미도시)는, 터치 센서, 음성 센서, 위치 센서, 동작 센서 등을 포함할 수 있다.The user
제어부(470)는, 튜너(410), 복조부(420) 또는 외부 디바이스 인터페이스부(435)를 통하여 입력되는 스트림을 역다중화하거나 역다중화된 신호들을 처리하여, 영상 또는 음성 출력을 위한 신호를 생성 및 출력할 수 있다.The
제어부(470)에서 처리된 영상 신호는, 디스플레이부(480)로 입력되어 해당 영상 신호에 대응하는 영상으로 표시될 수 있다. 또한, 제어부(470)에서 영상 처리된 영상 신호는 외부 디바이스 인터페이스부(435)를 통하여 외부 출력 디바이스로 입력될 수 있다. The image signal processed by the
제어부(470)에서 처리된 음성 신호는 오디오 출력부(485)로 오디오 출력될 수 있다. 또한, 제어부(470)에서 처리된 음성 신호는 외부 디바이스 인터페이스부(435)를 통하여 외부 출력 디바이스로 입력될 수 있다.The audio signal processed by the
도 4에서는 도시되어 있지 않으나, 제어부(470)는 역다중화부, 영상 처리부 등을 포함할 수 있다.Although not illustrated in FIG. 4, the
제어부(470)는, 디지털 디바이스(400)의 전반적인 동작을 제어할 수 있다. 예를 들어, 제어부(470)는, 튜너(410)를 제어하여, 사용자가 선택한 채널 또는 기 저장된 채널에 해당하는 RF 방송을 튜닝(tuning)하도록 제어할 수 있다.The
제어부(470)는, 사용자 입력 인터페이스부(450)를 통하여 입력된 사용자 명령 또는 내부 프로그램에 의하여 디지털 디바이스(400)를 제어할 수 있다. 특히, 네트워크에 접속하여 사용자가 원하는 애플리케이션 또는 애플리케이션 목록을 디지털 디바이스(400) 내로 다운로드 받을 수 있도록 할 수 있다.The
예를 들어, 제어부(470)는, 사용자 입력 인터페이스부(450)를 통하여 수신한 소정 채널 선택 명령에 따라 선택한 채널의 신호가 입력되도록 튜너(410)를 제어한다. 그리고 선택한 채널의 영상, 음성 또는 데이터 신호를 처리한다. 제어부(470)는, 사용자가 선택한 채널 정보 등이 처리한 영상 또는 음성신호와 함께 디스플레이부(480) 또는 오디오 출력부(485)를 통하여 출력될 수 있도록 한다.For example, the
다른 예로, 제어부(470)는, 사용자 입력 인터페이스부(450)를 통하여 수신한 외부 디바이스 영상 재생 명령에 따라, 외부 디바이스 인터페이스부(435)를 통하여 입력되는 외부 디바이스, 예를 들어, 카메라 또는 캠코더로부터의, 영상 신호 또는 음성 신호가 디스플레이부(480) 또는 오디오 출력부(485)를 통해 출력될 수 있도록 한다.As another example, the
한편, 제어부(470)는, 영상을 표시하도록 디스플레이부(480)를 제어할 수 있다. 예를 들어, 튜너(410)를 통해 입력되는 방송 영상, 또는 외부 디바이스 인터페이스부(435)를 통해 입력되는 외부 입력 영상, 또는 네트워크 인터페이스부를 통해 입력되는 영상, 또는 저장부(440)에 저장된 영상을, 디스플레이부(480)에 표시하도록 제어할 수 있다. 이때, 디스플레이부(480)에 표시되는 영상은, 정지영상 또는 동영상일 수 있으며, 2D 영상 또는 3D 영상일 수 있다.Meanwhile, the
또한, 제어부(470)는, 컨텐트를 재생하도록 제어할 수 있다. 이때의 컨텐트는, 디지털 디바이스(400) 내에 저장된 컨텐트, 또는 수신된 방송 컨텐트, 외부로부터 입력되는 외부 입력 컨텐트일 수 있다. 컨텐트는, 방송 영상, 외부 입력 영상, 오디오 파일, 정지 영상, 접속된 웹 화면, 및 문서 파일 중 적어도 하나일 수 있다.In addition, the
한편, 제어부(470)는, 애플리케이션 보기 항목에 진입하는 경우, 디지털 디바이스(300) 내 또는 외부 네트워크로부터 다운로드 가능한 애플리케이션 또는 애플리케이션 목록을 표시하도록 제어할 수 있다. On the other hand, when entering the application view item, the
제어부(470)는, 다양한 사용자 인터페이스와 더불어, 외부 네트워크로부터 다운로드 되는 애플리케이션을 설치 및 구동하도록 제어할 수 있다. 또한, 사용자의 선택에 의해, 실행되는 애플리케이션에 관련된 영상이 디스플레이부(480)에 표시 되도록 제어할 수 있다.The
한편, 도면에 도시하지 않았지만, 채널 신호 또는 외부 입력 신호에 대응하는 썸네일 이미지를 생성하는 채널 브라우징 처리부가 더 구비되는 것도 가능하다.On the other hand, although not shown in the drawing, it is also possible to further include a channel browsing processing unit for generating a thumbnail image corresponding to a channel signal or an external input signal.
채널 브라우징 처리부는, 복조부(320)에서 출력한 스트림 신호(TS) 또는 외부 디바이스 인터페이스부(335)에서 출력한 스트림 신호 등을 입력받아, 입력되는 스트림 신호로부터 영상을 추출하여 썸네일 영상을 생성할 수 있다. 생성된 썸네일 영상은 그대로 또는 부호화되어 제어부(470)로 입력될 수 있다. 또한, 생성된 썸네일 영상은 스트림 형태로 부호화되어 제어부(470)로 입력되는 것도 가능하다. 제어부(470)는 입력된 썸네일 영상을 이용하여 복수의 썸네일 영상을 구비하는 썸네일 리스트를 디스플레이부(480)에 표시할 수 있다. 한편, 이러한 썸네일 리스트 내의 썸네일 영상들은 차례로 또는 동시에 업데이트 될 수 있다. 이에 따라 사용자는 복수의 방송 채널의 내용을 간편하게 파악할 수 있게 된다. The channel browsing processing unit receives a stream signal (TS) output from the
디스플레이부(480)는, 제어부(470)에서 처리된 영상 신호, 데이터 신호, OSD 신호 또는 외부 디바이스 인터페이스부(435)에서 수신되는 영상 신호, 데이터 신호 등을 각각 R, G, B 신호로 변환하여 구동 신호를 생성한다.The
디스플레이부(480)는 PDP, LCD, OLED, 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 등이 가능할 수 있다.The
한편, 디스플레이부(480)는, 터치 스크린으로 구성되어 출력 디바이스 이외에 입력 디바이스로 사용되는 것도 가능하다.Meanwhile, the
오디오 출력부(485)는, 제어부(470)에서 음성 처리된 신호, 예를 들어, 스테레오 신호, 3.1 채널 신호 또는 5.1 채널 신호를 입력받아 음성으로 출력한다. 음성 출력부(485)는 다양한 형태의 스피커로 구현될 수 있다.The audio output unit 485 receives a signal processed by the
한편, 사용자의 제스처를 감지하기 위해, 상술한 바와 같이, 터치 센서, 음성 센서, 위치 센서, 동작 센서 중 적어도 하나를 구비하는 센싱부(미도시)가 디지털 디바이스(400)에 더 구비될 수 있다. 센싱부(미도시)에서 감지된 신호는 사용자입력 인터페이스부(450)를 통해 제어부(3470)로 전달될 수 있다.Meanwhile, in order to sense a user's gesture, as described above, a sensing unit (not shown) having at least one of a touch sensor, a voice sensor, a position sensor, and a motion sensor may be further provided in the
한편, 사용자를 촬영하는 촬영부(미도시)가 더 구비될 수 있다. 촬영부(미도시)에서 촬영된 영상 정보는 제어부(470)에 입력될 수 있다.Meanwhile, a photographing unit (not shown) for photographing a user may be further provided. Image information photographed by the photographing unit (not shown) may be input to the
제어부(470)는, 촬영부(미도시)로부터 촬영된 영상, 또는 센싱부(미도시)로부터의 감지된 신호를 각각 또는 조합하여 사용자의 제스처를 감지할 수도 있다. The
전원 공급부(490)는, 디지털 디바이스(400) 전반에 걸쳐 해당 전원을 공급한다.The power supply unit 490 supplies corresponding power throughout the
특히, 시스템 온 칩(System on Chip; SoC)의 형태로 구현될 수 있는 제어부(470)와, 영상 표시를 위한 디스플레이부(480), 및 오디오 출력을 위한 오디오 출력부(485)에 전원을 공급할 수 있다.In particular, the
이를 위해, 전원 공급부(490)는, 교류 전원을 직류 전원으로 변환하는 컨버터(미도시)를 구비할 수 있다. 한편, 예를 들어, 디스플레이부(480)가 다수의 백라이트 램프(backlight lamp)를 구비하는 액정 패널로서 구현되는 경우, 휘도 가변 또는 디밍(dimming) 구동을 위해, PWM(Pulse Width Modulation) 동작 가능한 인버터(inverter)(미도시)를 더 구비할 수도 있다.To this end, the power supply unit 490 may include a converter (not shown) that converts AC power into DC power. Meanwhile, for example, when the
원격제어 디바이스(500)는, 사용자 입력을 사용자입력 인터페이스부(450)로 송신한다. 이를 위해, 원격제어 디바이스(500)는, 블루투스(Bluetooth), RF(Radio Frequency) 통신, 적외선(IR) 통신, UWB(Ultra Wideband), 지그비(ZigBee) 방식 등을 사용할 수 있다. The
또한, 원격제어 디바이스(500)는, 사용자입력 인터페이스부(450)에서 출력한 영상, 음성 또는 데이터 신호 등을 수신하여, 이를 원격제어 디바이스(500)에서 표시하거나 음성 또는 진동을 출력할 수 있다.In addition, the
상술한 디지털 디바이스(400)는, 고정형 또는 이동형의 ATSC 방식 또는 DVB 방식의 디지털 방송 신호의 처리가 가능한 디지털 방송 수신기일 수 있다. The above-described
그 밖에 본 발명에 따른 디지털 디바이스는 도시된 구성 중 필요에 따라 일부 구성을 생략하거나 반대로 도시되진 않은 구성을 더 포함할 수도 있다. 한편, 디지털 디바이스는 상술한 바와 달리, 튜너와 복조부를 구비하지 않고, 네트워크 인터페이스부 또는 외부 디바이스 인터페이스부를 통해서 컨텐트를 수신하여 재생할 수도 있다.In addition, the digital device according to the present invention may further omit some components or further include components that are not shown on the contrary, if necessary. On the other hand, as described above, the digital device does not have a tuner and a demodulator, and can also receive and play content through a network interface unit or an external device interface unit.
도 5는 본 발명의 일 실시 예에 따라 도 2 내지 4의 제어부의 상세 구성을 설명하기 위해 도시한 구성 블록도이다. 5 is a block diagram illustrating a detailed configuration of the control unit of FIGS. 2 to 4 according to an embodiment of the present invention.
제어부의 일 예는, 역다중화부(510), 영상 처리부(5520), OSD 생성부(540), 믹서(mixer)(550), 프레임 레이트 변환부(FRC: Frame Rate Converter)(555), 및 포맷터(formatter)(560)를 포함할 수 있다. 그 외 상기 제어부는 도시되진 않았으나 음성 처리부와 데이터 처리부를 더 포함할 수 있다.Examples of the control unit, the
역다중화부(510)는, 입력되는 스트림을 역다중화한다. 예를 들어, 역다중화부(510)는 입력되는 MPEG-2 TS 영상, 음성 및 데이터 신호로 역다중화할 수 있다. 여기서, 역다중화부(510)에 입력되는 스트림 신호는, 튜너 또는 복조부 또는 외부디바이스 인터페이스부에서 출력되는 스트림 신호일 수 있다.The
영상 처리부(420)는, 역다중화된 영상 신호의 영상 처리를 수행한다. 이를 위해, 영상 처리부(420)는, 영상 디코더(425) 및 스케일러(435)를 구비할 수 있다.The
영상 디코더(425)는 역다중화된 영상 신호를 복호하며, 스케일러(435)는 복호된 영상 신호의 해상도를 디스플레이부에서 출력 가능하도록 스케일링(scaling)한다.The video decoder 425 decodes the demultiplexed video signal, and the
영상 디코더(525)는 다양한 규격을 지원할 수 있다. 예를 들어, 영상 디코더(525)는 영상 신호가 MPEG-2 규격으로 부호화된 경우에는 MPEG-2 디코더의 기능을 수행하고, 영상 신호가 DMB(Digital Multimedia Broadcasting) 방식 또는 H.264 규격으로 부호화된 경우에는 H.264 디코더의 기능을 수행할 수 있다.The
한편, 영상 처리부(520)에서 복호된 영상 신호는, 믹서(450)로 입력된다.Meanwhile, the video signal decoded by the
OSD 생성부(540)는, 사용자 입력에 따라 또는 자체적으로 OSD 데이터를 생성한다. 예를 들어, OSD 생성부(440)는 사용자입력 인터페이스부의 제어 신호에 기초하여 디스플레이부(380)의 화면에 각종 데이터를 그래픽(Graphic)이나 텍스트(Text) 형태로 표시하기 위한 데이터를 생성한다. 생성되는 OSD 데이터는, 디지털 디바이스의 사용자 인터페이스 화면, 다양한 메뉴 화면, 위젯(widget), 아이콘(icon), 시청률 정보(viewing rate information) 등의 다양한 데이터를 포함한다. OSD 생성부(540)는, 방송 영상의 자막 또는 EPG에 기반한 방송 정보를 표시하기 위한 데이터를 생성할 수도 있다.The
믹서(550)는, OSD 생성부(540)에서 생성된 OSD 데이터와 영상 처리부에서 영상 처리된 영상 신호를 믹싱(mixing)하여 포맷터(560)로 제공한다. 복호된 영상 신호와 OSD 데이터가 믹싱됨으로 인하여, 방송 영상 또는 외부 입력 영상 상에 OSD가 오버레이(overlay) 되어 표시된다.The
프레임 레이트 변환부(FRC)(555)는, 입력되는 영상의 프레임 레이트(frame rate)를 변환한다. 예를 들어, 프레임 레이트 변환부(555)는 입력되는 60Hz 영상의 프레임 레이트를 디스플레이부의 출력 주파수에 따라 예를 들어, 120Hz 또는 240Hz의 프레임 레이트를 가지도록 변환할 수 있다. 상기와 같이, 프레임 레이트를 변환하는 방법에는 다양한 방법이 존재할 수 있다. 일 예로, 프레임 레이트 변환부(555)는 프레임 레이트를 60Hz에서 120Hz로 변환하는 경우, 제1 프레임과 제2 프레임 사이에 동일한 제1 프레임을 삽입하거나, 제1 프레임과 제2 프레임으로부터 예측된 제3 프레임을 삽입함으로써 변환할 수 있다. 다른 예로, 프레임 레이트 변환부(555)는 프레임 레이트를 60Hz에서 240Hz로 변환하는 경우, 기존 프레임 사이에 동일한 프레임 또는 예측된 프레임을 3개 더 삽입하여 변환할 수 있다. 한편, 별도의 프레임 변환을 수행하지 않는 경우에는 프레임 레이트 변환부(555)를 바이패스(bypass) 할 수도 있다.The frame rate converter (FRC) 555 converts a frame rate of an input video. For example, the
포맷터(560)는, 입력되는 프레임 레이트 변환부(555)의 출력을 디스플레이부의 출력 포맷에 맞게 변경한다. 예를 들어, 포맷터(560)는 R, G, B 데이터 신호를 출력할 수 있으며, 이러한 R, G, B 데이터 신호는, 낮은 전압 차분 신호(LVDS: Low voltage differential signal) 또는 mini-LVDS로 출력될 수 있다. 또한, 포맷터(560)는 입력되는 프레임 레이트 변환부(555)의 출력이 3D 영상 신호인 경우에는 디스플레이부의 출력 포맷에 맞게 3D 형태로 구성하여 출력함으로써, 상기 디스플레이부를 통해 3D 서비스를 지원할 수도 있다.The
한편, 제어부 내 음성 처리부(미도시)는, 역다중화된 음성 신호의 음성 처리를 수행할 수 있다. 이러한 음성 처리부(미도시)는 다양한 오디오 포맷을 처리하도록 지원할 수 있다. 일 예로, 음성 신호가 MPEG-2, MPEG-4, AAC, HE-AAC, AC-3, BSAC 등의 포맷으로 부호화된 경우에도 이에 대응되는 디코더를 구비하여 처리할 수 있다.Meanwhile, a voice processing unit (not shown) in the control unit may perform voice processing of a demultiplexed voice signal. The voice processing unit (not shown) may support various audio formats. For example, even when a voice signal is encoded in formats such as MPEG-2, MPEG-4, AAC, HE-AAC, AC-3, BSAC, a decoder corresponding thereto may be provided and processed.
또한, 제어부 내 음성 처리부(미도시)는, 베이스(Base), 트레블(Treble), 음량 조절 등을 처리할 수 있다.In addition, the voice processing unit (not shown) in the control unit may process a base, treble, volume control, and the like.
제어부 내 데이터 처리부(미도시)는, 역다중화된 데이터 신호의 데이터 처리를 수행할 수 있다. 예를 들어, 데이터 처리부는 역다중화된 데이터 신호가 부호화된 경우에도 이를 복호할 수 있다. 여기서, 부호화된 데이터 신호로는, 각 채널에서 방영되는 방송 프로그램의 시작시각, 종료시각 등의 방송 정보가 포함된 EPG 정보일 수 있다. The data processing unit (not shown) in the control unit may perform data processing of the demultiplexed data signal. For example, the data processing unit can decode the demultiplexed data signal even when it is encoded. Here, the encoded data signal may be EPG information including broadcast information such as start time and end time of a broadcast program broadcast on each channel.
한편, 상술한 디지털 디바이스는 본 발명에 따른 예시로서, 각 구성요소는 실제 구현되는 디지털 디바이스의 사양에 따라 통합, 추가, 또는 생략될 수 있다. 즉, 필요에 따라, 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나 하나의 구성요소가 2 이상의 구성요소로 세분화될 수 있다. 또한, 각 블록에서 수행하는 기능은 본 발명의 실시 예를 설명하기 위한 것이며, 그 구체적인 동작이나 디바이스는 본 발명의 권리범위를 제한하지 아니한다.Meanwhile, the above-described digital device is an example according to the present invention, and each component may be integrated, added, or omitted depending on the specification of the actual digital device. That is, if necessary, two or more components may be combined into one component, or one component may be subdivided into two or more components. In addition, the function performed in each block is for explaining an embodiment of the present invention, the specific operation or device does not limit the scope of the present invention.
한편, 디지털 디바이스는, 디바이스 내에 저장된 영상 또는 입력되는 영상의 신호 처리를 수행하는 영상신호 처리 디바이스일 수 있다. 영상신호 처리 디바이스의 다른 예로는, 도 4에서 도시된 디스플레이부(480)와 오디오 출력부(485)가 제외된 셋톱-박스(STB), 상술한 DVD 플레이어, 블루-레이 플레이어, 게임 디바이스, 컴퓨터 등이 더 예시될 수 있다.Meanwhile, the digital device may be an image signal processing device that performs signal processing of an image stored in the device or an input image. As another example of the video signal processing device, the
도 6은 본 발명의 일 실시 예에 따른 도 2 내지 4의 디지털 디바이스와 연결된 입력 수단을 도시한 도면이다.6 is a diagram illustrating input means connected to the digital devices of FIGS. 2 to 4 according to an embodiment of the present invention.
디지털 디바이스(600)를 제어하기 위해 상기 디지털 디바이스(600) 상에 구비된 프론트 패널(front panel)(미도시)이나 제어 수단(입력 수단)이 이용된다.A front panel (not shown) or control means (input means) provided on the
한편, 제어 수단은 유, 무선 통신 가능한 사용자 인터페이스 디바이스(UID; User Interface Device)로써, 주로 디지털 디바이스(600)의 제어 목적으로 구현된 리모컨(610), 키보드(630), 포인팅 디바이스(620), 터치패드(touch-pad) 등이 포함되나, 상기 디지털 디바이스(600)에 연결된 외부 입력 전용의 제어 수단 역시 포함될 수 있다. 그 밖에, 디지털 디바이스(600) 제어 목적이 아니나 모드 전환 등을 통해 상기 디지털 디바이스(600)를 제어하는 스마트 폰, 태블릿 PC 등 모바일 디바이스 등도 제어 수단에 포함된다. 다만, 본 명세서에서는 편의상 포인팅 디바이스(pointing device)를 일 실시 예로 하여 설명하나, 이에 한정되는 것은 아니다.On the other hand, the control means is a user interface device (UID; User Interface Device) capable of wired and wireless communication, and is mainly implemented for the control purpose of the
입력 수단은, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), 지그비(ZigBee), DLNA(Digital Living Network Alliance), RS 등의 통신 프로토콜을 필요에 따라 적어도 하나 이상 채용하여 디지털 디바이스와 통신 가능하다.The input means are communication protocols such as Bluetooth, Radio Frequency Identification (RFID), Infrared Data Association (IrDA), Ultra Wideband (UWB), ZigBee, Digital Living Network Alliance (DLNA), RS, etc. If necessary, at least one is employed to communicate with the digital device.
리모컨(610)은, 디지털 디바이스(600) 제어를 위해 필요한 다양한 키 버튼들이 구비된 통상의 입력 수단을 말한다.The
포인팅 디바이스(620)는, 자이로 센서(Gyro Sensor) 등을 탑재하여 사용자의 움직임, 압력, 회전 등에 기초하여 디지털 디바이스(600)의 화면상에 대응되는 포인터(pointer)를 구현하여 상기 디지털 디바이스(600)에 소정 제어 명령을 전달한다. 이러한 포인팅 디바이스(620)는, 매직 리모컨, 매직 컨트롤러 등 다양한 이름으로 명명될 수 있다.The
키보드(630)는, 디지털 디바이스(600)가 종래 방송만을 제공하던 것을 넘어 지능형 통합 디지털 디바이스로서 웹 브라우저, 애플리케이션, SNS(Social Network Service) 등 다양한 서비스를 제공함에 따라 종래 리모컨(610)만으로는 제어가 쉽지 않아 이를 보완하여 PC의 키보드와 유사하게 구현하여 텍스트 등의 입력 편의를 도모하기 위해 구현되었다.The
한편, 리모컨(610), 포인팅 디바이스(620), 키보드(630) 등 제어수단은, 필요에 따라 터치패드를 구비함으로써 텍스트 인풋, 포인터 이동, 사진 내지 동영상의 확대/축소 등 더욱 편리하고 다양한 제어 목적에 이용할 수 있다. On the other hand, the control means such as the
본 명세서에서 설명하는 디지털 디바이스는, OS 및/또는 플랫폼(platform)으로 웹OS를 이용한다. 이하 웹OS 기반의 구성 내지 알고리즘 등 처리 과정은, 전술한 디지털 디바이스의 제어부 등에서 수행될 수 있다. 여기서, 상기 제어부는 전술한 도 2 내지 5에서의 제어부를 포함하여 광의의 개념으로 사용한다. 따라서, 이하에서는 디지털 디바이스 내 웹OS 기반의 또는 그와 관련된 서비스, 애플리케이션, 컨텐트 등의 처리를 위해 구성은 관련 소프트웨어(software), 펌웨어(firmware) 등을 포함한 하드웨어 내지 구성요소는 제어부(controller)로 명명하여 설명한다.The digital device described in this specification uses a web OS as an OS and / or platform. Hereinafter, a processing procedure such as a configuration or algorithm based on WebOS may be performed by the control unit of the above-described digital device. Here, the control unit includes the control unit in FIGS. 2 to 5 described above and is used as a broad concept. Therefore, hereinafter, for processing webOS-based or related services, applications, and content in a digital device, hardware or components including related software, firmware, and the like are configured as a controller. Explain by name.
이러한 웹OS 기반 플랫폼은 예컨대, 루나-서비스 버스(Luna-service Bus)에 기반하여 서비스, 애플리케이션 등을 통합함으로써, 개발 독립성과 기능 확장성을 제고하기 위한 것으로, 웹 애플리케이션 프레임워크에 기반하여 애플리케이션 개발 생산성도 높일 수 있다. 또한, 웹OS 프로세스와 리소스 관리(resource management)를 통해 시스템 리소스(system resource) 등을 효율적으로 활용하여 멀티-태스킹(multi-tasking)도 지원할 수 있다.The webOS-based platform is intended to improve development independence and functional scalability by integrating services, applications, etc., for example, based on a Luna-service bus, and developing applications based on the web application framework. Productivity can also be increased. In addition, multi-tasking can be supported by efficiently utilizing system resources and the like through web OS processes and resource management.
한편, 본 명세서에서 기술하는 웹OS 플랫폼은 PC, TV, 셋톱박스(STB)와 같은 고정 디바이스뿐만 아니라 휴대폰, 스마트 폰, 태블릿 pc, 노트북, 웨어러블 디바이스(wearable device) 등과 같은 모바일 디바이스에서도 이용 가능하다.On the other hand, the web OS platform described in this specification can be used in mobile devices such as mobile phones, smart phones, tablet pcs, notebooks, wearable devices, as well as fixed devices such as PCs, TVs, and set-top boxes (STBs). .
디지털 디바이스를 위한 소프트웨어의 구조는, 종래 문제 해결과 시장에 의존적인 모놀리틱 구조(monolithic structure)로 멀티쓰레딩 기술(multi-threading)에 기반한 단일 프로세스(single process)와 클로우즈드 제품(closed product)으로 외부 응용에 어려움이 있었고, 그 이후 새로운 플랫폼 기반 개발을 지향하고 칩-셋(chip-set) 교체를 통한 비용 혁신과 UI 응용 및 외부 응용 개발 효율화를 추구하여 레이어링 및 콤포넌티제이션(layering & componentization)이 이루어져 3-레이어드 구조와 애드-온(add-on), 싱글 소스(single source) 제품, 오픈 애플리케이션(open application)을 위한 애드-온 구조를 가졌었다. 최근에는 더 나아가 소프트웨어 구조가 기능 단위의 모듈화 아키텍처(modulating architecture), 에코-시스템(echo-system)을 위한 웹 오픈 API(Web Open API (Application Programming Interface)) 제공, 게임 엔진(game engine)을 위한 네이티브 오픈 API(Native Open API) 등을 위한 모듈화 디자인이 이루어지고 있으며, 이에 따라 서비스 구조 기반의 멀티-프로세스 구조(multi-process structure)로 생성되고 있다.The structure of software for digital devices is a single process and a closed product based on multi-threading with a conventional problem solving and market-dependent monolithic structure. As a result, there were difficulties in external applications, and after that, aimed at new platform-based development, and pursued cost innovation through chip-set replacement and efficiency in UI application and external application development. Layering & componentization ), And had a three-layer structure, an add-on structure for add-on, single source product, and open application. In recent years, the software structure has been further improved to provide a modular architecture of functional units, a Web Open API (Application Programming Interface) for an eco-system, and a game engine. A modular design for a native open API or the like has been made, and accordingly, it has been created as a multi-process structure based on a service structure.
도 7은 본 발명의 일 실시 예에 따른 웹OS 아키텍처를 설명하기 위해 도시한 도면이다.7 is a diagram illustrating a web OS architecture according to an embodiment of the present invention.
도 7을 참조하여, 웹OS 플랫폼의 아키텍처에 대해 설명하면, 다음과 같다. Referring to FIG. 7, the architecture of the web OS platform will be described as follows.
상기 플랫폼은 크게 커널, 시스템 라이브러리(system library) 기반의 웹OS 코어 플랫폼(Web OS core platform), 애플리케이션, 서비스 등으로 구분할 수 있다.The platform can be roughly divided into a kernel, a system library-based Web OS core platform, an application, and a service.
웹OS 플랫폼의 아키텍처는, 레이어드 구조(layered structure)로 최하위의 레이어에는 OS, 다음 레이어에는 시스템 라이브러리(들) 그리고 최상위에는 애플리케이션들(applications)이 존재한다.The architecture of the WebOS platform is a layered structure, with the OS at the lowest layer, system library (s) at the next layer, and applications at the top.
먼저, 최하위 레이어는, OS 레이어로 리눅스 커널(Linux Kernel)이 포함되어 상기 디지털 디바이스의 OS로 리눅스를 포함할 수 있다.First, the lowest layer may include a Linux kernel as an OS layer and include Linux as an OS of the digital device.
상기 OS 레이어 상위에는, BSP(Board Support Package)/HAL(Hardware Abstraction Layer) 레이어, 웹OS 코어 모듈 레이어(Web OS core modules layer), 서비스 레이어(service layer), 루나-서비스 버스 레이어(Luna-Service Bus layer), 엔요 프레임워크/NDK(Native Developer◎ Kit)/QT 레이어(Enyo framework/NDK/QT layer) 그리고 최상위 레이어에는 애플리케이션 레이어(Application layer)가 순차로 존재한다. Above the OS layer, a BSP (Board Support Package) / HAL (Hardware Abstraction Layer) layer, a Web OS core modules layer, a service layer, and a Luna-Service bus layer (Luna-Service) Bus layer), Nyo framework / NDK (Native Developer ◎ Kit) / QT layer (Enyo framework / NDK / QT layer) and the application layer are sequentially present in the top layer.
한편, 상술한 웹OS 레이어 구조 중 일부 레이어는 생략 가능하며, 복수의 레이어가 하나의 레이어화 되거나 반대로 하나의 레이어가 복수의 레이어 구조가 될 수도 있다.Meanwhile, some of the above-described web OS layer structures may be omitted, and a plurality of layers may be layered or a layer may be a plurality of layer structures.
상기 웹OS 코어 모듈 레이어는, 서피스 윈도우(surface window) 등을 관리하는 LSM(Luna Surface Manager), 애플리케이션의 실행과 수행 상태 등을 관리하는 SAM(System & Application Manage), 웹키트(WebKit)에 기반하여 웹 애플리케이션 등을 관리하는 WAM(Web Application Manager) 등을 포함할 수 있다.The webOS core module layer is based on a Luna Surface Manager (LSM) that manages surface windows, SAM (System & Application Manage) that manages execution and execution status of applications, and a WebKit. It may include a Web Application Manager (WAM) for managing web applications.
상기 LSM은, 화면에 보이는 애플리케이션 윈도우(application window)를 관리한다. 상기 LSM은, 디스플레이 하드웨어(Display HW)를 관장하며, 애플리케이션들에게 필요한 내용을 렌더링(rendering)할 수 있는 버퍼(buffer)를 제공하며, 복수의 애플리케이션들이 렌더링한 결과를 합성(Composition)하여 화면에 출력할 수 있다.The LSM manages an application window displayed on the screen. The LSM controls the display hardware (Display HW), provides a buffer for applications to render necessary content, and composes the results rendered by a plurality of applications on the screen. Can print
상기 SAM은, 시스템과 애플리케이션의 여러 조건별 수행 폴리시(policy)를 관리한다. The SAM manages execution policies for various conditions of systems and applications.
한편, WAM은, 웹OS는 웹 애플리케이션(Web App)을 기본 애플리케이션으로 볼 수 있는바, 엔요 프레임워크(Enyo Framework)에 기반한다. On the other hand, WAM, the web OS can view the web application (Web App) as a basic application, and is based on the Enyo Framework.
애플리케이션의 서비스 사용은, 루나-서비스 버스(Luna-service Bus)를 통해 이루어지며, 신규로 서비스를 버스에 등록할 수 있고, 애플리케이션은 자신이 필요로 하는 서비스를 찾아서 사용할 수도 있다.The service use of the application is performed through a Luna-service bus, and a service can be newly registered on the bus, and the application can also find and use a service that it needs.
상기 서비스 레이어는, TV 서비스, 웹OS 서비스 등 다양한 서비스 레벨(service level)의 서비스들이 포함될 수 있다. 한편, 상기 웹OS 서비스에는, 미디어 서버, Node.JS 등이 포함될 수 있으며 특히, Node.JS 서비스는 예컨대, 자바스크립트(javascript)를 지원한다.The service layer may include various service level services such as TV service and WebOS service. Meanwhile, the web OS service may include a media server, Node.JS, etc. In particular, the Node.JS service supports, for example, JavaScript.
웹OS 서비스는, 기능 로직(function logic)을 구현한 리눅스 프로세스(Linux process)로 버스를 통해 커뮤니케이션 할 수 있다. 이는 크게 네 파트로 구분될 수 있으며, TV 프로세스와 기존 TV로부터 웹OS에 미티그레이션(Migration)되거나 제조사 차별화 서비스인 서비스들, 웹OS 공통 서비스와 자바스크립트로 개발되고 Node.js를 통해 사용되는 Node.js 서비스로 구성된다.The WebOS service is a Linux process that implements function logic and can communicate over the bus. It can be largely divided into four parts, TV processes and services that are migrated to WebOS from existing TVs or services that are manufacturer differentiated services, webOS common services and JavaScript, and used through Node.js. It consists of Node.js services.
상기 애플리케이션 레이어는, TV 애플리케이션, 쇼케이스(showcase) 애플리케이션, 네이티브 애플리케이션(native application), 웹 애플리케이션 등 디지털 디바이스에서 지원 가능한 모든 애플리케이션들을 포함할 수 있다.The application layer may include all applications that can be supported by a digital device, such as a TV application, a showcase application, a native application, and a web application.
웹OS 상의 애플리케이션은, 구현 방법에 따라 웹 애플리케이션(Web Application), PDK(Palm Development Kit) 애플리케이션, QML(Qt Meta Language or Qt Modeling Language) 애플리케이션 등으로 구분될 수 있다. The application on the web OS may be classified into a web application, a PDK (Palm Development Kit) application, and a Qt Meta Language or Qt Modeling Language (QML) application depending on the implementation method.
상기 웹 애플리케이션은, 웹키트 엔진(WebKit engine)에 기반하고, WAM 런타임(Runtime) 상에서 수행된다. 이러한 웹 애플리케이션은 엔요 프레임워크에 기반하거나, 일반 HTML5, CSS(Cascading Style Sheets), 자바스크립트 기반으로 개발되어 수행될 수 있다. The web application is based on a WebKit engine and is executed on the WAM runtime. These web applications can be developed and executed based on the Enyo framework or based on general HTML5, Cascading Style Sheets (CSS), and JavaScript.
상기 PDK 애플리케이션은, 써드-파티(3rd-Party) 또는 외부 개발자를 위해 제공된 PDK에 기반하여 C/C++로 개발되는 네이티브 애플리케이션 등을 포함한다. 상기 PDK는, 게임 등 써드 파티가 네이티브 애플리케이션(C/C++)을 개발할 수 있도록 제공된 개발 라이브러리 및 도구 집합을 말한다. 예를 들어, PDK 애플리케이션은, 그 성능이 중요한 애플리케이션의 개발에 이용될 수 있다.The PDK application includes a native application developed in C / C ++ based on a PDK provided for a third-party or external developer. The PDK refers to a set of development libraries and tools provided for third parties such as games to develop native applications (C / C ++). For example, PDK applications can be used to develop applications where performance is important.
상기 QML 애플리케이션은, Qt 기반의 네이티브 애플리케이션으로, 카드 뷰(card view), 홈 대시보드(Home dashboard), 가상 키보드(virtual keyboard) 등 웹OS 플랫폼과 함께 제공되는 기본 애플리케이션 등을 포함한다. 여기서, QML은, C++ 대신 스크립트 형태의 마크-업 언어(mark-up language)이다. The QML application is a native application based on Qt, and includes a basic application provided with a web OS platform, such as a card view, a home dashboard, and a virtual keyboard. Here, QML is a script-type mark-up language instead of C ++.
한편, 상기에서, 네이티브 애플리케이션은, C/C++로 개발되고 컴파일(compile)되어 바이너리(binary) 형태로 수행되는 애플리케이션을 말하는 것으로, 이러한 네이티브 애플리케이션은 그 수행 속도가 빠른 장점이 있다.Meanwhile, in the above, the native application refers to an application developed and compiled in C / C ++ and executed in a binary form, and such a native application has an advantage of fast execution speed.
도 8은 본 발명의 일 실시 예에 따른 웹OS 디바이스의 아키텍처를 설명하기 위해 도시한 도면이다. 8 is a diagram illustrating an architecture of a web OS device according to an embodiment of the present invention.
도 8은 웹OS 디바이스의 런타임(Runtime)에 기반한 블록도로서, 이는 도 7의 레이어드 구조를 참조하여 이해할 수 있다.8 is a block diagram based on a runtime of a web OS device, which can be understood by referring to the layered structure of FIG. 7.
이하, 도 7과 8을 참조하여 설명하면, 다음과 같다.Hereinafter, description will be given with reference to FIGS. 7 and 8.
도 8을 참조하면, 시스템 OS(Linux)와 시스템 라이브러리들 상에 서비스들과 애플리케이션들 그리고 웹OS 코어 모듈들이 포함되고 그들 사이의 커뮤니케이션은 루나-서비스 버스를 통해 이루어질 수 있다.Referring to FIG. 8, services and applications and WebOS core modules are included on a system OS (Linux) and system libraries, and communication between them may be performed through a Luna-service bus.
이메일(e-mail), 연락처(contact), 캘린더(calendar) 등 HTML5, CSS, 자바스크립트(java script)에 기초한 Node.js 서비스들, 로깅(Logging), 백업(backup), 파일 노티파이(file notify), 데이터베이스(DB), 액티비티 매니저(activity manager), 시스템 폴리시(system policy), 오디오 데몬(AudioD: Audio Daemon), 업데이트(update), 미디어 서버(media server) 등과 같이 웹OS 서비스들, EPG(Electronic Program Guide), PVR(Personal Video Recorder), 데이터 방송(data broadcasting) 등과 같은 TV 서비스들, 음성 인식(voice recognition), 나우 온(Now on), 노티피케이션(Notification), 검색(search), ACR(Auto Content Recognition), CBOX(Contents List Broswer), wfdd, DMR, 리모트 애플리케이션(Remote Application), 다운로드, SDPIF(Sony Philips Digital Interface Format) 등과 같은 CP 서비스들, PDK 애플리케이션들, 브라우저(browser), QML 애플리케이션 등과 같은 네이티브 애플리케이션들 그리고, 엔요 프레임워크 기반의 UI 관련 TV 애플리케이션들과 웹 애플리케이션들은, 루나-서비스 버스를 통하여 전술한 SAM, WAM, LSM과 같은 웹OS 코어 모듈을 통해 처리가 이루어진다. 한편, 상기에서, TV 애플리케이션들과 웹 애플리케이션들은 반드시 엔요 프레임워크 기반 또는 UI 관련이 아닐 수도 있다.Node.js services based on HTML5, CSS, and JavaScript, including e-mail, contact, and calendar, logging, backup, and file notify webOS services such as notify, database (DB), activity manager, system policy, audio daemon (AudioD), update, media server, etc., EPG TV services such as (Electronic Program Guide), PVR (Personal Video Recorder), data broadcasting, voice recognition, Now on, Notification, search , CP services such as ACR (Auto Content Recognition), CBOX (Contents List Broswer), wfdd, DMR, Remote Application, Download, SDPIF (Sony Philips Digital Interface Format), PDK applications, browser , Native applications such as QML applications, and UI-related TV applications and web applications based on the Enyo framework are processed through web OS core modules such as SAM, WAM, and LSM described above through the Luna-service bus. Meanwhile, in the above, TV applications and web applications may not necessarily be based on the Enyo framework or UI.
CBOX는 TV에 연결된 USB, DLNA, 클라우드 등과 같은 외부 디바이스의 컨텐트에 대한 리스트와 메타데이터 등을 관리할 수 있다. 한편, CBOX는 USB, DMS, DVR, 클라우드 등과 같은 다양한 컨텐트 컨테이너들(content containers)의 컨텐트 리스팅을 통합된 뷰(View)로 출력할 수 있다. 또한, CBOX는 픽쳐, 음악, 비디오 등 다양한 타입들의 컨텐트 리스팅을 보여주고, 그 메타데이터를 관리할 수 있다. 그 밖에, CBOX는, 어태치된 저장장치(attached storage)의 컨텐츠를 리얼-타임(Real-time)으로 출력할 수 있다. 예컨대, CBOX는, USB 등의 저장 디바이스가 플러그-인되면, 해당 저장 디바이스의 컨텐츠 리스트를 즉시 출력할 수 있어야 한다. 이때, 상기 컨텐트 리스팅 처리를 위한 표준화된 방식을 정의할 수도 있다. 또한, CBOX는 다양한 연결 프로토콜을 수용할 수 있다.CBOX can manage the list and metadata of the contents of external devices such as USB, DLNA, and cloud connected to the TV. Meanwhile, CBOX can output content listings of various content containers, such as USB, DMS, DVR, cloud, etc., as an integrated view. In addition, CBOX can display various types of content listings such as pictures, music, and videos, and manage their metadata. In addition, the CBOX can output the contents of the attached storage in real-time. For example, when a storage device such as USB is plugged in, the CBOX should be able to immediately output the content list of the storage device. At this time, a standardized method for processing the content listing may be defined. In addition, CBOX can accommodate a variety of connection protocols.
SAM은, 모듈 복잡도의 개선 및 확장성을 제고하기 위한 것이다. 이는 예컨대, 기존 시스템 매니저(System Manager)는 시스템 UI, 윈도우 관리, 웹 애플리케이션 런타임, UX 상의 제약 조건 처리 등의 여러 기능을 하나의 프로세스에서 처리하여 구현 복잡도가 커 이를 해소하고자 주요 기능을 분리하고 기능 간 인터페이스를 명확히 함으로써 구현 복잡도를 낮춘다.The SAM is intended to improve module complexity and improve scalability. For example, the existing system manager handles several functions such as system UI, window management, web application runtime, and constraint processing on UX in a single process. By clarifying the inter-interface, the implementation complexity is reduced.
LSM은, 카드 뷰, 런처(launcher) 등 시스템 UX 구현이 독립적으로 개발 통합될 수 있도록 지원하고, 제품 요구사항 변경 등에 쉽게 대응할 수 있도록 지원한다. 한편, LSM은, 앱온앱 등과 같이 복수의 애플리케이션 화면을 합성하는 경우에 하드웨어 리소스(HW resource)를 최대한 활용하여 멀티-태스킹이 가능하도록 하는데, 멀티-윈도우(multi-window)와 21:9 등을 위한 윈도우 매니지먼트 메커니즘(window management mechanism)을 제공할 수 있다. LSM supports the system UX implementation such as card view and launcher to be independently developed and integrated, and supports easy response to changes in product requirements. On the other hand, LSM allows multi-tasking by making full use of hardware resources (HW resource) when synthesizing multiple application screens such as app-on-app, multi-window and 21: 9. It can provide a window management mechanism (window management mechanism) for.
LSM은, QML에 기반하여 시스템 UI의 구현을 지원하며, 그 개발 생산성을 제고한다. QML UX는 MVC에 기반하여, 화면 레이아웃(Layout) 및 UI 컴포넌트를 쉽게 뷰를 구성할 수 있고, 사용자 입력을 처리하기 위한 코드를 쉽게 개발할 수도 있다. 한편, QML과 웹OS 컴포넌트 간의 인터페이스는 QML 확장 플러그-인을 통해 이루어지며, 애플리케이션의 그래픽 오퍼레이션(graphic operation)은 웨이랜드 프로토콜(wayland protocol), 루나 서비스 콜(luna-service call) 등에 기반할 수 있다. LSM supports the implementation of system UI based on QML, and improves the development productivity. QML UX is based on MVC, so it is easy to construct views for screen layout and UI components, and it is also easy to develop code for processing user input. On the other hand, the interface between the QML and the webOS component is made through the QML extension plug-in, and the graphic operation of the application can be based on the wayland protocol, luna-service call, etc. have.
LSM은 전술한 바와 같이, Luna Surface Manager의 약어로서, 애플리케이션 윈도우 컴포지터(Application Window Compositor)의 기능을 한다.LSM is an abbreviation of Luna Surface Manager, as described above, and functions as an application window compositor.
LSM은 독립적으로 개발된 애플리케이션, UI 컴포넌트 등을 화면에 합성하여 출력하도록 한다. 관련하여, 리센츠(Recents) 애플리케이션, 쇼케이스 애플리케이션, 런처 애플리케이션 등과 같은 컴포넌트(component)들이 각자 자신의 내용을 렌더링(rendering)하면, LSM은 컴포지터로서 출력 영역, 연동 방법 등에 대해 정의한다. 다시 말해, 컴포지터인 LSM은 그래픽 합성, 포커스 관리(focus management), 인풋 이벤트(input event) 등을 처리한다. 이때, LSM은 인풋 매니저(input manager)로부터 이벤트, 포커스 등을 수신하는데 이러한 인풋 매니저로 리모트 컨트롤러, 마우스 & 키보드와 같은 HID, 조이스틱, 게임 패드, 애플리케이션 리모트, 펜 터치 등이 포함될 수 있다.LSM composes and outputs independently developed applications and UI components on the screen. In relation, when components such as a Recents application, a showcase application, and a launcher application respectively render their own contents, the LSM defines an output area, an interworking method, etc. as a compositor. In other words, the compositor LSM handles graphic composition, focus management, and input events. At this time, the LSM receives events, focus, and the like from an input manager. Such input managers may include a HID such as a remote controller, mouse & keyboard, joystick, game pad, application remote, pen touch, and the like.
이와 같이, LSM은 멀티플 윈도우 모델(multiple window model)을 지원하는데 시스템 UI 성격으로 모든 애플리케이션에서 동시에 수행 가능하다. 관련하여, 런쳐, 리센츠, 세팅(setting), 노티피케이션, 시스템 키보드, 볼륨 UI, 검색, 핑거 제스쳐(finger gesture), 음성인식(Voice Recognition)(STT(Sound to Text), TTS(Text to Sound), NLP(Natural Language Processing) 등), 패턴 제스쳐(pattern gesture)(카메라, MRCU(Mobile Radio Control Unit)), 라이브 메뉴(Live menu), ACR(Auto Content Recognition) 등을 LSM이 지원할 수 있다.As such, LSM supports multiple window models, which can be performed simultaneously in all applications due to the system UI characteristics. Related to: Launcher, Recents, Settings, Notifications, System Keyboard, Volume UI, Search, Finger gesture, Voice Recognition (STT (Sound to Text), TTS (Text to) LSM can support Sound, NLP (Natural Language Processing), etc., pattern gesture (camera, Mobile Radio Control Unit (MRCU)), Live menu, ACR (Auto Content Recognition), etc. .
도 9는 본 발명의 일 실시 예에 따른 웹OS 디바이스에서 그래픽 컴포지션 플로우(graphic composition flow)를 설명하기 위해 도시한 도면이다.9 is a diagram illustrating a graphic composition flow in a web OS device according to an embodiment of the present invention.
도 9를 참조하면, 그래픽 컴포지션 처리는, UI 프로세스를 담당하는 웹 애플리케이션 매니저(910), 웹 프로세스를 담당하는 웹키트(Webkit)(920), LSM(930) 그리고 그래픽 매니저(GM: Graphic Manager)(940)를 통해 이루어질 수 있다.Referring to FIG. 9, the graphic composition processing includes a
웹 애플리케이션 매니저(910)에서 UI 프로세스로서 웹 애플리케이션 기반의 그래픽 데이터(또는 애플리케이션)가 생성이 되면, 생성된 그래픽 데이터가 풀-스크린 애플리케이션이 아니면 LSM(930)으로 전달한다. 한편, 웹 애플리케이션 매니저(910)는 UI 프로세스와 웹 프로세스 사이에 그래픽 매니징을 위한 GPU(Graphic Processing Unit) 메모리 공유를 위하여 웹키트(920)에서 생성된 애플리케이션을 수신하여 이를 상기와 같이 풀-스크린 애플리케이션이 아닌 경우에는 LSM(930)으로 전달한다. 상기에서 풀-스크린 애플리케이션인 경우에는, LSM(930)을 바이패스(bypass)할 수 있으며, 이 경우 직접 그래픽 매니저(940)로 전달될 수 있다.When the web application-based graphic data (or application) is generated as a UI process in the
LSM(930)은 수신되는 UI 애플리케이션을 웨이랜드 서피스를 거쳐 웨이랜드 컴포지터(Wayland Compositor)로 전송하고, 웨이랜드 컴포지터에서 이를 적절히 처리하여 그래픽 매니저로 전달한다. 이렇게 LSM(930)에서 전달되는 그래픽 데이터는 예컨대, 그래픽 매니저(940)의 LSM GM 서피스를 거쳐 그래픽 매니저 컴포지터를 전달된다.The
한편, 풀-스크린 애플리케이션은 전술한 바와 같이, LSM(930)을 거치지 않고 바로 그래픽 매니저(940)로 전달이 되는데 이러한 애플리케이션은 WAM GM 서피스로 거쳐 그래픽 매니저 컴포지터에서 처리된다.Meanwhile, as described above, the full-screen application is delivered directly to the
그래픽 매니저는 웹OS 디바이스 내의 모든 그래픽 데이터를 처리하는데, 전술한 LSM GM 서피스를 거친 데이터, WAM GM 서피스를 거친 데이터뿐 아니라 데이터 방송 애플리케이션(Data Broadcasting application), 캡션 애플리케이션(caption application) 등과 같이 GM 서피스를 거친 그래픽 데이터를 모두 수신하여 화면상에 적절히 출력되도록 처리한다. 여기서, GM 컴포지터의 기능은 전술한 컴포지터와 동일 또는 유사한 기능이다.The graphic manager processes all graphic data in the web OS device, such as the data through the LSM GM surface described above, the data through the WAM GM surface, as well as the GM surface, such as a data broadcasting application and a caption application. All graphic data passed through is received and processed to be properly displayed on the screen. Here, the function of the GM compositor is the same or similar function to the compositor described above.
도 10은 본 발명의 일 실시 예에 따른 미디어 서버를 설명하기 위해 도시한 도면이고, 도 11은 본 발명의 일 실시 예에 따른 미디어 서버의 구성 블록도를 설명하기 위해 도시한 도면이고, 도 12는 본 발명의 일 실시 예에 따른 미디어 서버와 TV 서비스의 관계를 설명하기 위해 도시한 도면이다.10 is a view illustrating a media server according to an embodiment of the present invention, and FIG. 11 is a diagram illustrating a configuration block diagram of a media server according to an embodiment of the present invention, and FIG. 12 Is a diagram illustrating a relationship between a media server and a TV service according to an embodiment of the present invention.
미디어 서버는, 디지털 디바이스 내 다양한 멀티미디어의 실행을 지원 및 필요한 리소스를 관리한다. 미디어 서버는, 미디어 플레이(media play)에 필요한 하드웨어 리소스를 효율적으로 사용할 수 있다. 예컨대, 미디어 서버는, 멀티미디어의 실행을 위해서는 오디오/비디오 하드웨어 리소스가 필요하며, 리소스 사용 현황을 관리하여 효율적으로 활용할 수 있다. 일반적으로 모바일 디바이스보다 큰 화면을 가진 고정 디바이스는, 멀티미디어 실행 시 하드웨어 리소스가 더 필요하고, 많은 데이터 양으로 인해 인코딩/디코딩 및 그래픽 데이터 전달 속도도 빨라야 한다. 한편, 미디어 서버는, 스트리밍, 파일 기반 재생 이외에, 브로드캐스팅(Broadcasting), 레코딩(Recording) 및 튜닝(Tuning) 태스크, 시청과 동시에 녹화를 한다거나, 영상 통화 시 송신자와 수신자 화면을 동시에 보여준다거나 하는 태스크 등을 처리할 수 있어야 한다. 다만, 미디어 서버는, 인코더, 디코더, 튜너, 디스플레이 엔진(display engine) 등 하드웨어 리소스가 칩-셋 단위로 제한이 있어, 동시에 여러 태스크를 실행하는 것이 어려워 예를 들어, 사용 시나리오를 제약하거나 사용자 선택을 입력받아 처리한다.The media server supports the execution of various multimedia in the digital device and manages necessary resources. The media server can efficiently use hardware resources required for media play. For example, the media server requires audio / video hardware resources to execute multimedia, and can efficiently utilize the resource usage status. In general, a fixed device having a larger screen than a mobile device requires more hardware resources when executing multimedia, and the encoding / decoding and graphic data transfer speeds are also fast due to a large amount of data. On the other hand, the media server, in addition to streaming and file-based playback, broadcasting, recording and tuning tasks, recording at the same time as viewing, or simultaneously showing a sender and a receiver screen during a video call It should be able to handle the back. However, in the media server, hardware resources such as an encoder, a decoder, a tuner, and a display engine are limited in a chip-set unit, so it is difficult to execute multiple tasks at the same time. Process the input.
미디어 서버는, 시스템 안정성을 강화(robustness)할 수 있는데 이는 예컨대, 미디어 재생 중 에러(error)가 발생한 재생 파이프라인(pipeline)을 파이프라인별로 제거 가능하고 재 기동함으로써, 상기와 같이 에러가 발생하는 경우에도 다른 미디어 플레이에 영향을 주지 않을 수 있다. 이러한 파이프라인은, 미디어 재생 요청 시, 디코딩, 분석, 출력 등 각 단위 기능들을 연결한 체인(chain)으로, 미디어 타입(media type) 등에 따라, 필요 단위 기능들이 달라질 수 있다.The media server may enhance system stability, for example, by removing and restarting a playback pipeline for which an error occurred during media playback for each pipeline, and thus generating an error as described above. This may not affect other media play. The pipeline is a chain that connects each unit functions such as decoding, analysis, and output when requesting media playback, and required unit functions may be changed according to a media type.
미디어 서버는, 확장성(extensibility)를 가질 수 있는데 예컨대, 새로운 타입의 파이프라인을 기존 구현 방식에 영향을 주지 않고 추가할 수 있다. 일 예로, 미디어 서버는, 카메라 파이프라인, 화상 회의(Skype) 파이프라인, 써드-파티 파이프라인 등을 수용할 수 있다.The media server may have extensibility, for example, a new type of pipeline may be added without affecting the existing implementation. As an example, the media server may accommodate a camera pipeline, a video conference (Skype) pipeline, a third-party pipeline, and the like.
미디어 서버는, 일반 미디어 재생과 TV 태스크 실행을 별개의 서비스로 처리할 수 있는데, 이는 TV 서비스의 인터페이스가 미디어 재생 경우와는 다르기 때문이다. 상기에서, 미디어 서버는, TV 서비스와 관련하여 setchannel, channelup, channeldown, channeltuning, recordstart 등의 오퍼레이션을 지원하고, 일반 미디어 재생과 관련하여 play, pause, stop 등의 오퍼레이션을 지원하여 양자에 대해 서로 다른 오퍼레이션을 지원하고, 별개의 서비스로 처리할 수 있다.The media server can process normal media playback and TV task execution as separate services because the interface of the TV service is different from the media playback case. In the above, the media server supports operations such as setchannel, channelup, channeldown, channeltuning, recordstart, etc. in relation to the TV service, and supports operations such as play, pause, stop, etc. in relation to general media playback, and is different for both. It supports operations and can be processed as a separate service.
미디어 서버는 자원 관리 기능을 통제 또는 통합 관리할 수 있다. 디바이스 내 하드웨어 리소스 할당, 회수 등은, 미디어 서버에서 통합적으로 이루어지며 특히, TV 서비스 프로세스는 실행 중인 태스크와 리소스 할당 현황 등을 미디어 서버로 전달한다. 미디어 서버는, 각 미디어가 실행될 때마다 리소스를 확보하고 파이프라인이 실행되며, 각 파이프라인이 점유한 리소스 현황에 기반하여, 미디어 실행 요청 시 우선 순위(예를 들어, 폴리시)에 의한 실행 허용 및 다른 파이프라인의 리소스 회수 등을 수행한다. 여기서, 미리 정의된 실행 우선 순위와 특정 요청에 대한 필요 리소스 정보가 폴리시 매니저(policy manager)에 의해 관리되고, 리소스 매니저는 상기 폴리시 매니저와 커뮤니케이션하여 리소스 할당, 회수 등을 처리할 수 있다.The media server can control or integrate resource management functions. The hardware resource allocation and retrieval in the device are integrated in the media server, and in particular, the TV service process delivers the running task and resource allocation status to the media server. The media server secures resources each time each media is executed and the pipeline is executed. Based on the resource status occupied by each pipeline, the media server allows execution by priority (for example, policy) when requesting media execution and Resource recovery of other pipelines is performed. Here, predefined execution priority and required resource information for a specific request are managed by a policy manager, and the resource manager can communicate with the policy manager to process resource allocation, recovery, and the like.
미디어 서버는 재생 관련 모든 오퍼레이션에 관한 식별 인자(ID: identifier)를 보유할 수 있다. 예컨대, 미디어 서버는 식별자에 근거하여 특정 파이프라인을 지시하여 명령을 내릴 수 있다. 미디어 서버는, 둘 이상의 미디어 재생을 위하여, 파이프라인들에 둘을 구분하여 명령을 내릴 수 있다.The media server may have an identifier (ID) for all operations related to playback. For example, the media server may issue a command by instructing a specific pipeline based on the identifier. The media server may issue commands to the pipelines by dividing the two into two or more media.
미디어 서버는 HTML 5 표준 미디어의 재생을 담당할 수 있다.The media server may be responsible for playing
그 밖에, 미디어 서버는 TV 파이프라인의 별도 서비스 프로세스화는 TV 재구조화 범위에 따를 수 있다. 미디어 서버는, TV 재구조화 범위와 무관하게 설계 구현될 수 있는데, TV가 별도 서비스 프로세스화가 되지 않으면, 특정 태스크에 문제가 생길 때 TV 전체를 재실행해야 할 수도 있다.In addition, the media server may follow the TV restructuring scope for the separate service process of the TV pipeline. The media server may be designed and implemented regardless of the TV restructuring range. If the TV is not serviced separately, the entire TV may need to be re-run when a problem occurs in a specific task.
미디어 서버는, uMS 즉, 마이크로 미디어 서버(micro media server)라고도 한다. 여기서, 미디어 플레이어(media player)가 미디어 클라이언트(media client)인데, 이는 예컨대, HTML5 비디오 태그(video tag), 카메라(Camera), TV, 스카이프(Skype), 세컨드 스크린(2nd Screen) 등을 위한 웹키트(Webkit)을 의미할 수 있다.The media server is also called a uMS, that is, a micro media server. Here, the media player is a media client, which is, for example, the web for HTML5 video tags, cameras, TVs, Skype, second screens, and the like. It can mean a kit (Webkit).
미디어 서버는, 리소스 매니저(resource manager), 폴리시 매니저(policy manager) 등과 같은 마이크로 리소스(micro resource)의 관리가 핵심 기능이다. 관련하여, 미디어 서버는, 웹 표준 미디어 컨텐트에 대한 재생(playback) 제어 역할도 제어한다. 이와 관련하여, 미디어 서버는 파이프라인 컨트롤러 리소스(pipeline controller resource)도 관리할 수 있다.In the media server, management of micro resources such as a resource manager and a policy manager is a key function. In relation to this, the media server also controls a playback control role for web standard media content. In this regard, the media server can also manage pipeline controller resources.
이러한 미디어 서버는 예컨대, 확장성(extensibility), 신뢰성(reliability), 리소스의 효율적 사용(efficient resource usage) 등을 지원한다.The media server supports, for example, extensibility, reliability, and efficient resource usage.
다시 말해, uMS 즉, 미디어 서버는, 클라우드 게임(cloud game), MVPD(pay service 등), 카메라 프리뷰(camera preview), 세컨드 스크린(2nd screen), 스카이프 등과 같은 리소스와 TV 리소스 등의 웹OS 디바이스 내에서 적절한 처리를 위한 리소스 사용을 전반적으로 관리하고 제어하여 효율적인 사용이 가능하도록 관리 제어하는 기능을 한다. 한편, 각 리소스는 그 이용 시에 예컨대, 파이프라인을 이용하는데 미디어 서버는 리소스 관리를 위한 파이프라인의 생성, 삭제, 이용 등을 전반적으로 관리 제어할 수 있다.In other words, uMS, that is, the media server is a cloud game (cloud game), MVPD (pay service, etc.), camera preview (camera preview), second screen (2nd screen), skyOS, and other resources such as web OS devices such as TV resources It manages and controls the use of resources for proper processing in general, and functions to manage and control for efficient use. Meanwhile, each resource uses a pipeline, for example, when used, and the media server can overall manage and control the creation, deletion, and use of the pipeline for resource management.
여기서, 파이프라인이라 함은 예컨대, 태스크(task)와 관련된 미디어가 요청(request), 디코딩 스트림(decoding stream), 비디오 출력(video output) 등의 파싱(parsing)과 같은 작업의 연속을 시작하면 생성될 수 있다. 예컨대, TV 서비스 내지 애플리케이션과 관련하여, 시청(watching), 녹화(recording), 채널 튜닝(channel tuning) 등은 각각 개별적으로 그 요청에 따라 생성된 파이프라인을 통하여 리소스 이용 등에 대해 제어를 받아 처리된다.Here, a pipeline is generated when, for example, a media related to a task starts continuation of operations such as request, decoding stream, and video output. Can be. For example, in relation to TV services or applications, watching, recording, channel tuning, etc. are individually controlled under the control of resource usage through a pipeline generated according to the request. .
도 10을 참조하여, 미디어 서버의 처리 구조 등에 대해 더욱 상세하게 설명하면, 다음과 같다.Referring to FIG. 10, the processing structure and the like of the media server will be described in more detail as follows.
도 10에서는, 애플리케이션 또는 서비스는 미디어 서버(1020)와 루나-서비스 버스(1010)를 통해 연결되고, 상기 미디어 서버(1020)는 상기 루나-서비스 버스(1010)를 통해 다시 생성된 파이프라인들과 연결되고 관리한다.In FIG. 10, an application or service is connected to a media server 1020 and a Luna-service bus 1010, and the media server 1020 communicates with pipelines regenerated through the Luna-service bus 1010. Connected and managed.
애플리케이션 또는 서비스는 그 특성에 따라 다양한 클라이언트(client)를 구비하고 그를 통해 미디어 서버(1020) 또는 파이프라인과 데이터를 주고 받을 수 있다.The application or service has various clients according to its characteristics, and through which data can be exchanged with the media server 1020 or the pipeline.
상기 클라이언트에는 예컨대, 미디어 서버(1020)와 연결을 위한 uMedia 클라이언트(웹키트)와 RM(resource manager) 클라이언트(C/C++) 등이 포함된다. The client includes, for example, a uMedia client (web kit) and a resource manager (RM) client (C / C ++) for connecting with the media server 1020.
상기 uMedia 클라이언트를 포함한 애플리케이션은, 전술한 바와 같이, 미디어 서버(1020)와 연결된다. 더욱 상세하게는, uMedia 클라이언트는 예컨대, 후술할 비디오 오브젝트와 대응되고, 이러한 클라이언트는 요청 등에 의해 비디오의 동작을 위하여 미디어 서버(1020)를 이용한다. The application including the uMedia client is connected to the media server 1020 as described above. More specifically, the uMedia client corresponds to, for example, a video object, which will be described later, and the client uses the media server 1020 to operate the video by request or the like.
여기서, 상기 비디오 동작은 비디오 상태에 관한 것으로, 로딩(loading), 언로딩(unloading), 재생(play, playback, or reproduce), 포즈(pause), 중단(stop) 등은 비디오 동작과 관련된 모든 상태 데이터를 포함할 수 있다. 이러한 비디오의 각 동작 내지 상태는 개별 파이프라인 생성을 통해 처리될 수 있다. 따라서, uMedia 클라이언트는 상기 비디오 동작과 관련된 상태 데이터를 미디어 서버 내 파이프라인 매니저(1022)로 전송한다.Here, the video operation relates to a video state, and loading, unloading, play, playback, reproduce, pause, stop, etc. are all states related to the video operation. Data. Each operation or state of this video can be processed through individual pipeline creation. Accordingly, the uMedia client transmits state data related to the video operation to the
파이프라인 매니저(1022)는, 리소스 매니저(1024)와 데이터 커뮤니케이션을 통해 현재 디바이스의 리소스에 대한 정보를 획득하고, 상기 uMedia 클라이언트의 상태 데이터에 대응되는 리소스의 할당을 요청한다. 이때, 파이프라인 매니저(1022) 또는 리소스 매니저(1024)는 상기 리소스 할당 등과 관련하여, 필요한 경우에 폴리시 매니저(1026)과 데이터 커뮤니케이션을 통해 리소스 할당에 대한 제어를 한다. 예컨대, 리소스 매니저(1024)에서 파이프라인 매니저(1022)의 요청에 따라 할당할 리소스가 없거나 부족한 경우에, 폴리시 매니저(1026)의 우선순위 비교 등에 따라 상기 요청에 따라 적절한 리소스 할당 등이 이루어지도록 할 수 있다.The
한편, 파이프라인 매니저(1022)는, 상기 리소스 매니저(1024)의 리소스 할당에 따라 할당된 리소스에 대하여 상기 uMedia 클라이언트의 요청에 따른 동작을 위한 파이프라인 생성을 미디어 파이프라인 컨트롤러(1028)에 요청한다.On the other hand, the
미디어 파이프라인 컨트롤러(1028)는 상기 파이프라인 매니저(1022)의 제어에 따라 필요한 파이프라인을 생성한다. 이렇게 생성된 파이프라인에는 도시된 바와 같이, 미디어 파이프라인, 카메라 파이프라인뿐만 아니라, 재생, 포즈, 중단 등과 관련된 파이프라인이 생성될 수 있다. 한편, 상기 파이프라인에는 HTML5, 웹 CP, 스마트쉐어(smartshare) 재생, 썸네일 추출, NDK, 시네마, MHEG(Multimedia and Hypermedia Information coding Experts Group) 등에 대한 파이프라인 등이 포함될 수 있다.The
그 밖에, 파이프라인에는 예를 들어, 서비스 기반의 파이프라인(자체 파이프라인)과 URI 기반의 파이프라인(미디어 파이프라인)이 있을 수 있다.In addition, the pipeline may include, for example, a service-based pipeline (own pipeline) and a URI-based pipeline (media pipeline).
도 10을 참조하면, RM 클라이언트를 포함한 애플리케이션 또는 서비스는 직접적으로 미디어 서버(1020)와 연결되지 않을 수 있다. 이는 애플리케이션 또는 서비스가 직접 미디어를 처리할 수도 있기 때문이다. 다시 말해, 애플리케이션 또는 서비스가 직접 미디어 처리하는 경우에는 미디어 서버를 통하지 않을 수 있다. 다만, 이때, 파이프라인 생성 및 그 이용을 위해 리소스 관리가 필요한바 이를 위해 uMS 커넥터가 기능한다. 한편, 상기 uMS 커넥터는 상기 애플리케이션 또는 서비스의 직접적인 미디어 처리를 위한 리소스 관리 요청이 수신되면, 리소스 매니저(1024)를 포함한 미디어 서버(1020) 통신한다. 이를 위하여 미디어 서버(1020) 역시 uMS 커넥터가 구비되어야 한다.Referring to FIG. 10, an application or service including an RM client may not be directly connected to the media server 1020. This is because the application or service may directly handle the media. In other words, when an application or service directly processes media, it may not go through a media server. However, at this time, resource management is required for pipeline creation and its use. For this, the uMS connector functions. Meanwhile, when a resource management request for direct media processing of the application or service is received, the uMS connector communicates with the media server 1020 including the
따라서, uMS 커넥터를 통해 리소스 매니저(1024)의 리소스 관리를 받아 애플리케이션 또는 서비스는 RM 클라이언트의 요청에 대응할 수 있다. 이러한 RM 클라이언트는 네이티브 CP, TV 서비스, 세컨드 스크린, 플래시 플레이어, 유투브 MSE(Medai Source Extensions), 클라우드 게임, 스카이프 등의 서비스를 처리할 수 있다. 이 경우, 전술한 바와 같이, 리소스 매니저(1024)는 리소스 관리에 필요한 경우에 폴리시 매니저(1026)와 적절하게 데이터 커뮤니케이션을 통해 리소스를 관리할 수 있다.Accordingly, the application or service can respond to the request of the RM client by receiving the resource management of the
한편, URI 기반의 파이프라인은 전술한 RM 클라이언트와 같이 미디어를 직접 처리하는 경우가 아니라, 미디어 서버(1020)를 통해 이루어진다. 이러한 URI 기반 파이프라인에는, 플레이어 팩토리(player factory), G스트리머(Gstreamer), 스트리밍 플러그-인(streaming plug-in), DRM(Digital Rights Management) 플러그인 파이프라인 등이 포함될 수 있다.On the other hand, the URI-based pipeline is made through the media server 1020, not in the case of directly processing media like the RM client described above. The URI-based pipeline may include a player factory, a Gstreamer, a streaming plug-in, and a Digital Rights Management (DRM) plugin pipeline.
한편, 애플리케이션과 미디어 서비스들 사이에 인터페이스 방법은 다음과 같을 수 있다.Meanwhile, an interface method between an application and media services may be as follows.
웹 애플리케이션에서 서비스를 이용하여 인터페이스하는 방법이다. 이는 PSB(Palm Service Bridge)를 이용하여 루나 콜(Luna Call)하는 방법, 코르도바(Cordova)를 이용하는 방법인데 이는 디스플레이를 비디오 태그로 확장하는 것이다. 그 밖에, 비디오 태그나 미디어 엘리먼트(media element)에 관한 HTML5 표준을 이용하는 방법도 있을 수 있다.This is a method of interfacing with services in web applications. This is a method of making a Luna Call using a PSB (Palm Service Bridge) and a method of using Cordova, which extends the display to a video tag. In addition, there may be a way to use the HTML5 standard for video tags or media elements.
그리고, PDK에서 서비스를 이용하여 인터페이스하는 방법이다. And, it is a method of interfacing by using a service in the PDK.
또는, 기존 CP에서 서비스를 이용하는 방법이다. 이는 호환성(backward compatibility)를 위해 기존 플랫폼의 플러그-인을 루나 기반으로 확장하여 이용할 수 있다.Or, it is a method of using the service in the existing CP. This can be used by extending the plug-in of the existing platform based on Luna for backward compatibility.
마지막으로, non-웹OS인 경우에 인터페이스하는 방법이다. 이 경우에는 직접 루나 버스를 호출하여 인터페이스할 수 있다.Lastly, in case of non-webOS, it is a way to interface. In this case, the Luna bus can be called directly to interface.
씸리스 체인지(Seamless change)는 별도의 모듈(예를 들어, TVWIN)에 의해 처리되는데, 이는 웹OS 부팅 전 또는 부팅 동안에, 웹OS 없이 TV를 화면에 먼저 보여주고 씸리스하게 처리하기 위한 프로세스이다. 이는 웹OS의 부팅 시간이 늦기 때문에 사용자의 파워 온(Power On) 요청에 빠른 응답을 위해 TV 서비스의 기본 기능을 우선 제공할 목적으로 이용된다. 또한, 상기 모듈은 TV 서비스 프로세스의 일부로, 빠른 부팅과 기본 TV 기능을 제공하는 씸리스 체인지, 공장 모드 등을 지원한다. 또한, 상기 모듈은, Non-웹OS 모드에서 웹OS 모드로 전환도 담당할 수 있다.Seamless change is processed by a separate module (for example, TVWIN), which is a process for displaying and displaying the TV on the screen without webOS first and smoothly before or during booting of the webOS. . This is used for the purpose of first providing the basic function of the TV service for quick response to a user's Power On request because the booting time of the WebOS is late. In addition, the module supports the seamless change, factory mode, etc. that provide fast boot and basic TV functions as part of the TV service process. In addition, the module may be in charge of switching from Non-WebOS mode to WebOS mode.
도 11을 참조하면, 미디어 서버의 처리 구조를 도시하고 있다.Referring to Fig. 11, a processing structure of a media server is shown.
이때, 도 11에서, 실선 박스는 프로세스 처리 구성을 나타내고, 점선 박스는 프로세스 중 내부 처리 모듈을 나타낼 수 있다. 또한, 실선 화살표는 인터-프로세스 콜 즉, 루나 서비스 콜을 나타내고, 점선 화살표는 등록/알림(register/notify)와 같은 노티피케이션이나 데이터 플로우(data flow)를 나타낼 수 있다.In this case, in FIG. 11, the solid line box indicates a process processing configuration, and the dotted line box indicates an internal processing module during the process. In addition, a solid arrow indicates an inter-process call, that is, a Luna service call, and a dotted arrow indicates a notification or data flow such as register / notify.
서비스 또는 웹 애플리케이션 또는 PDK 애플리케이션(이하 애플리케이션)은, 루나-서비스 버스를 통하여 각종 서비스 처리 구성들과 연결되고, 그를 통해 애플리케이션이 동작하거나 동작 제어된다.The service or web application or PDK application (hereinafter referred to as an application) is connected to various service processing components through a Luna-service bus, through which the application operates or is controlled.
애플리케이션의 타입에 따라 그 데이터 처리 경로는 달라진다. 예컨대, 애플리케이션이 카메라 센서와 관련된 이미지 데이터인 경우에는 카메라 처리부(1130)로 전송이 되어 처리된다. 이때, 카메라 처리부(1130)는 제스처(gesture), 안면 인식(face detection) 모듈 등을 포함하여 수신되는 애플리케이션의 이미지 데이터를 처리한다. 여기서, 카메라 처리부(1130)는 예컨대, 사용자의 선택이나 자동으로 파이프라인 등의 이용이 요구되는 데이터인 경우에는 미디어 서버 처리부(1110)를 통하여 파이프라인을 생성하여 해당 데이터를 처리할 수 있다.The data processing path varies depending on the type of application. For example, when the application is image data related to a camera sensor, it is transmitted to the
또는, 애플리케이션이 오디오 데이터를 포함한 경우에는 오디오 처리부(AudioD)(1140)과 오디오 모듈(PulseAudio)(1150)을 통하여 해당 오디오를 처리할 수 있다. 예컨대, 오디오 처리부(1140)는 애플리케이션으로부터 수신되는 오디오 데이터를 처리하여 오디오 모듈(1150)로 전송한다. 이때, 오디오 처리부(1140)는 오디오 폴리시 매니저(audio policy manager)를 포함하여 오디오 데이터의 처리를 결정할 수 있다. 이렇게 처리된 오디오 데이터는 오디오 모듈(1160)에서 가공 처리된다. 한편, 상기 애플리케이션은, 오디오 데이터 처리와 관련된 데이터를 오디오 모듈(1160)로 노티피케이션할 수 있고, 이는 관련 파이프라인에서도 상기 오디오 모듈(1160)로 노피티케이션할 수 있다. 상기 오디오 모듈(1150)은 ALSA(Advanced Linux Sound Architecture)를 포함한다.Alternatively, when the application includes audio data, the corresponding audio may be processed through the audio processing unit (AudioD) 1140 and the audio module (PulseAudio) 1150. For example, the audio processing unit 1140 processes audio data received from an application and transmits it to the
또는, 애플리케이션이 DRM이 걸려있는 컨텐트를 포함 또는 처리(이하 포함)하는 경우에는, 해당 컨텐트 데이터를 DRM 서비스 처리부(1160)로 전송하고, 상기 DRM 서비스 처리부(1170)는 DRM 인스턴스(instance)를 생성하여 DRM이 걸려 있는 컨텐트 데이터를 처리한다. 한편, DRM 서비스 처리부(1160)는 상기 DRM이 걸려 있는 컨텐트 데이터의 처리를 위하여, 미디어 파이프라인 내 DRM 파이프라인과 루나-서비스 버스를 통해 연결되어 처리할 수 있다.Alternatively, when the application includes or processes (hereinafter included) DRM-hung content, the corresponding content data is transmitted to the DRM
이하에서는, 애플리케이션이 미디어 데이터이거나 TV 서비스 데이터(예컨대, 방송 데이터)인 경우의 처리에 관해 설명한다.Hereinafter, processing in the case where the application is media data or TV service data (eg, broadcast data) will be described.
도 12는, 전술한 도 11에서 미디어 서버 처리부와 TV 서비스 처리부만을 더욱 상세하게 설명하기 위해 도시한 것이다.FIG. 12 is a view for explaining in more detail only the media server processing unit and the TV service processing unit in FIG. 11 described above.
따라서, 이하에서는, 도 11과 12를 함께 참고하여 설명한다.Therefore, hereinafter, it will be described with reference to Figures 11 and 12 together.
먼저, 애플리케이션이 TV 서비스 데이터를 포함한 경우에는 TV 서비스 처리부(1120/1220)에서 처리된다.First, when the application includes TV service data, it is processed by the TV service processor 1120/1220.
여기서, TV 서비스 처리부(1120)는 예컨대, DVR/채널 매니저, 방송 모듈, TV 파이프라인 매니저, TV 리소스 매니저, 데이터 방송 모듈, 오디오 설정 모듈, 경로 매니저 등 중 적어도 하나 이상을 포함한다. 또는, 도 12에서 TV 서비스 처리부(1220)는, TV 방송 핸들러(TV broadcast handler), TV 방송 인터페이스부(TV Broadcast Interface), 서비스 처리부, TV 미들웨어(TV MW(middleware)), 경로 매니저, BSP(예를 들어, NetCast)를 포함할 수 있다. 여기서, 상기 서비스 처리부는 예를 들어, TV 파이프라인 매니저, TV 리소스 매니저, TV 폴리시 매니저, USM 커넥터 등을 포함한 모듈을 의미할 수 있다.Here, the TV service processing unit 1120 includes, for example, at least one of a DVR / channel manager, a broadcasting module, a TV pipeline manager, a TV resource manager, a data broadcasting module, an audio configuration module, and a route manager. Alternatively, the TV service processing unit 1220 in FIG. 12 includes a TV broadcast handler, a TV broadcast interface, a service processing unit, a TV middleware (TV middleware), a route manager, and a BSP ( For example, NetCast). Here, the service processing unit may mean, for example, a module including a TV pipeline manager, a TV resource manager, a TV policy manager, and a USM connector.
본 명세서에서, TV 서비스 처리부는, 도 11 또는 12와 같은 구성을 가지거나 양자의 조합으로 구현될 수 있으며, 상기에서 일부 구성은 생략되거나 도시되지 않은 일부 구성이 추가될 수도 있다.In the present specification, the TV service processing unit may have a configuration as shown in FIG. 11 or 12 or may be implemented in a combination of both, and some components may be omitted or some components not shown may be added.
TV 서비스 처리부(1120/1220)는 애플리케이션으로부터 수신된 TV 서비스 데이터의 속성 내지 타입에 기초하여, DVR(Digital Video Recorder)이나 채널 관련 데이터인 경우에는 DVR/채널 매니저로 전송하고, 다시 TV 파이프라인 매니저로 전송하여 TV 파이프라인을 생성하여 처리한다. 한편, 상기 TV 서비스 데이터의 속성 내지 타입이 방송 컨텐트 데이터인 경우에는, TV 서비스 처리부(1120)는 방송 모듈을 거쳐 해당 데이터의 처리를 위하여 TV 파이프라인 매니저를 거쳐 TV 파이프라인을 생성하여 처리한다.The TV service processing unit 1120/1220 transmits to a DVR / channel manager in case of digital video recorder (DVR) or channel-related data based on the attribute or type of TV service data received from the application, and then back to the TV pipeline manager To the TV pipeline and process it. On the other hand, when the attribute or type of the TV service data is broadcast content data, the TV service processor 1120 generates and processes the TV pipeline through the TV pipeline manager to process the data through the broadcast module.
또는, json(Javascript standard object notation) 파일이나 c로 작성된 파일은 TV 방송 핸들러에서 처리되어 TV 방송 인터페이스부를 거쳐 TV 파이프라인 매니저로 전송하여 TV 파이프라인을 생성하여 처리한다. 이 경우, TV 방송 인터페이스부는, TV 방송 핸들러를 거친 데이터 또는 파일을 TV 서비스 폴리시에 기초하여 TV 파이프라인 매니저로 전송하여 파이프라인 생성시 참고할 수 있다.Alternatively, a json (Javascript standard object notation) file or a file written in c is processed by the TV broadcast handler and transmitted to the TV pipeline manager through the TV broadcast interface to generate and process the TV pipeline. In this case, the TV broadcast interface unit may transmit data or files that have passed through the TV broadcast handler to the TV pipeline manager based on the TV service policy for reference when creating the pipeline.
한편, TV 파이프라인 매니저는, TV 서비스 내 처리 모듈 내지 매니저 등으로부터 TV 파이프라인 생성 요청에 따라 하나 또는 그 이상의 파이프라인 생성함에 있어서, TV 리소스 매니저의 제어를 받을 수 있다. 한편, TV 리소스 매니저는, TV 파이프라인 매니저의 TV 파이프라인 생성 요청에 따라 TV 서비스를 위해 할당된 리소스의 상태와 할당을 요청하기 위해, TV 폴리시 매니저의 제어를 받을 수 있으며, 미디어 서버 처리부(1110/1210)와 uMS 커넥터를 통해 데이터 커뮤니케이션을 한다. 미디어 서버 처리부(1110/1210) 내 리소스 매니저는 상기 TV 리소스 매니저의 요청에 따라 현재 TV 서비스를 위한 리소스의 상태와 할당 가부 등에 대해 전달한다. 예컨대, 미디어 서버 처리부(1110/1210) 내 리소스 매니저의 확인 결과 만약 TV 서비스를 위한 리소스가 이미 모두 할당된 경우에는, TV 리소스 매니저로 현재 모든 리소스가 할당 완료되었음을 노티파이할 수 있다. 이때, 미디어 서버 처리부 내 리소스 매니저는 상기 노티파이와 함께, TV 서비스를 위해 기할당된 TV 파이프라인들 중 우선순위나 소정 기준에 따라 소정 TV 파이프라인을 제거하고 요청된 TV 서비스를 위한 TV 파이프라인 생성을 요청 내지 할당할 수도 있다. 또는, TV 리소스 매니저에서 상기 미디어 서버 처리부(1110/1210) 내 리소스 매니저의 상태 보고에 따라 TV 리소스 매니저에서 적절히 TV 파이프라인을 제거, 추가, 신설 등 제어를 할 수 있다.Meanwhile, the TV pipeline manager may be under the control of the TV resource manager in generating one or more pipelines according to a TV pipeline generation request from a processing module or a manager in the TV service. Meanwhile, the TV resource manager may be under the control of the TV policy manager to request the status and allocation of resources allocated for the TV service according to the TV pipeline manager's request to create a TV pipeline, and the media server processor 1110 / 1210) and uMS connector. The resource manager in the media server processing unit 1110/1210 transmits the status and allocation of resources for the current TV service at the request of the TV resource manager. For example, as a result of checking the resource manager in the media server processing unit 1110/1210, if all the resources for the TV service are already allocated, the TV resource manager may notify that all resources are currently allocated. At this time, the resource manager in the media server processing unit, together with the notify, removes a predetermined TV pipeline according to a priority or a predetermined criterion among TV pipelines previously allocated for TV service, and the TV pipeline for the requested TV service. You can also request or allocate creation. Alternatively, the TV resource manager may appropriately remove, add, or establish a TV pipeline in the TV resource manager according to the status report of the resource manager in the media server processing unit 1110/1210.
한편, BSP는 예컨대, 기존 디지털 디바이스와의 호환성(backward compatibility)를 지원한다.Meanwhile, the BSP supports backward compatibility with, for example, existing digital devices.
이렇게 생성된 TV 파이프라인들은 그 처리 과정에서 경로 매니저의 제어에 따라 적절히 동작될 수 있다. 경로 매니저는 상기 처리 과정에서 TV 파이프라인만이 아니라 미디어 서버 처리부(1110/1210)에 의해 생성된 파이프라인의 동작까지 고려하여 파이프라인들의 처리 경로 내지 과정을 결정 내지 제어할 수 있다.The TV pipelines thus generated can be properly operated under the control of the route manager in the process. The route manager may determine or control the processing route or process of the pipelines in consideration of not only the TV pipeline but also the operation of the pipeline generated by the media server processor 1110/1210 in the process.
다음으로, 애플리케이션이 TV 서비스 데이터가 아니라 미디어 데이터를 포함한 경우에는, 미디어 서버 처리부(1110/1210)에서 처리된다. 여기서, 미디어 서버 처리부(1110/1210)는, 리소스 매니저, 폴리시 매니저, 미디어 파이프라인 매니저, 미디어 파이프라인 컨트롤러 등을 포함한다. 한편, 미디어 파이프라인 매니저와 미디어 파이프라인 컨트롤러의 제어에 따라 생성되는 파이프라인에는 카메라 프리뷰 파이프라인, 클라우드 게임 파이프라인, 미디어 파이프라인 등 다양하게 생성 가능하다. 한편, 미디어 파이프라인에는 스트리밍 프로토콜, 오토/스테이틱 gstreamer, DRM 등이 포함될 수 있는데, 이는 경로 매니저의 제어에 따라 그 처리 플로우가 결정될 수 있다. 상기 미디어 서버 처리부(1110/1210) 내 구체적인 처리 과정은 전술한 도 10의 설명을 원용하고, 여기서 중복 설명하지 않는다.Next, when the application includes media data rather than TV service data, the media server processing unit 1110/1210 processes it. Here, the media server processing unit 1110/1210 includes a resource manager, a policy manager, a media pipeline manager, a media pipeline controller, and the like. Meanwhile, the pipeline created under the control of the media pipeline manager and the media pipeline controller can be variously generated, such as a camera preview pipeline, a cloud game pipeline, and a media pipeline. Meanwhile, the media pipeline may include a streaming protocol, an auto / static gstreamer, DRM, etc., and the processing flow may be determined under the control of the route manager. The detailed processing process in the media server processing unit 1110/1210 uses the above-described description of FIG. 10, and is not repeated herein.
본 명세서에서 미디어 서버 처리부(1110/1210) 내 리소스 매니저는 예를 들어, 카운터 베이스로 리소스 매니징을 할 수 있다.In the present specification, the resource manager in the media server processing unit 1110/1210 may manage resources on a counter basis, for example.
도 13은 본 발명의 실시 예들에 따른 영상표시기기 중 임의의 어느 하나를 제어하는 원격제어장치의 제어 방법을 도시한 도면이다.13 is a diagram illustrating a control method of a remote control device that controls any one of video display devices according to embodiments of the present invention.
도 13의 (a)에 도시된 바와 같이, 디스플레이부(180)에 원격제어장치(200)에 대응하는 포인터(205)가 표시되는 것을 예시한다. As illustrated in FIG. 13A, a
사용자는 원격제어장치(200)를 상하, 좌우(도 13의 (b)), 앞뒤(도 13의 (c))로 움직이거나 회전할 수 있다. 영상표시기기의 디스플레이부(180)에 표시된 포인터(205)는 원격제어장치(200)의 움직임에 대응한다. 이러한 원격제어장치(200)는, 도면과 같이, 3D 공간 상의 움직임에 따라 해당 포인터(205)가 이동되어 표시되므로, 공간 리모콘이라 명명할 수 있다. The user can move or rotate the
도 13의 (b)는 사용자가 원격제어장치(200)를 왼쪽으로 이동하면, 영상표시기기의 디스플레이부(180)에 표시된 포인터(205)도 이에 대응하여 왼쪽으로 이동하는 것을 예시한다. 13B illustrates that when the user moves the
원격제어장치(200)의 센서를 통하여 감지된 원격제어장치(200)의 움직임에 관한 정보는 영상표시기기로 전송된다. 영상표시기기는 원격제어장치(200)의 움직임에 관한 정보로부터 포인터(205)의 좌표를 산출할 수 있다. 영상표시기기는 산출한 좌표에 대응하도록 포인터(205)를 표시할 수 있다.Information on the movement of the
도 13의 (c)는, 원격제어장치(200) 내의 특정 버튼을 누른 상태에서, 사용자가 원격제어장치(200)를 디스플레이부(180)에서 멀어지도록 이동하는 경우를 예시한다. 이에 의해, 포인터(205)에 대응하는 디스플레이부(180) 내의 선택 영역이 줌인되어 확대 표시될 수 있다. 이와 반대로, 사용자가 원격제어장치(200)를 디스플레이부(180)에 가까워지도록 이동하는 경우, 포인터(205)에 대응하는 디스플레이부(180) 내의 선택 영역이 줌아웃되어 축소 표시될 수 있다. 한편, 원격제어장치(200)가 디스플레이부(180)에서 멀어지는 경우, 선택 영역이 줌아웃되고, 원격제어장치(200)가 디스플레이부(180)에 가까워지는 경우, 선택 영역이 줌인될 수도 있다.FIG. 13C illustrates a case in which a user moves the
한편, 원격제어장치(200) 내의 특정 버튼을 누른 상태에서는 상하, 좌우 이동의 인식이 배제될 수 있다. 즉, 원격제어장치(200)가 디스플레이부(180)에서 멀어지거나 접근하도록 이동하는 경우, 상,하,좌,우 이동은 인식되지 않고, 앞뒤 이동만 인식되도록 할 수 있다. 원격제어장치(200) 내의 특정 버튼을 누르지 않은 상태에서는, 원격제어장치(200)의 상,하, 좌,우 이동에 따라 포인터(205)만 이동하게 된다. Meanwhile, in a state in which a specific button in the
한편, 포인터(205)의 이동속도나 이동방향은 원격제어장치(200)의 이동속도나 이동방향에 대응할 수 있다. Meanwhile, the moving speed or the moving direction of the
한편, 본 명세서에서의 포인터는, 원격제어장치(200)의 동작에 대응하여, 디스플레이부(180)에 표시되는 오브젝트를 의미한다. 따라서, 포인터(205)로 도면에 도시된 화살표 형상 외에 다양한 형상의 오브젝트가 가능하다. 예를 들어, 점, 커서, 프롬프트, 두꺼운 외곽선 등을 포함하는 개념일 수 있다. 그리고, 포인터(205)가 디스플레이부(180) 상의 가로축과 세로축 중 어느 한 지점(point)에 대응하여 표시되는 것은 물론, 선(line), 면(surface) 등 복수 지점에 대응하여 표시되는 것도 가능하다.Meanwhile, the pointer in the present specification refers to an object displayed on the
도 14는 본 발명의 실시예들에 따른 영상표시기기 중 임의의 어느 하나를 제어하는 원격제어장치의 내부 블록도이다.14 is an internal block diagram of a remote control device controlling any one of video display devices according to embodiments of the present invention.
도 14에 도시한 바와 같이, 원격제어장치(200)는 무선통신부(225), 사용자 입력부(235), 센서부(240), 출력부(250), 전원공급부(260), 저장부(270), 제어부(280)를 포함할 수 있다. As shown in FIG. 14, the
무선통신부(225)는 전술하여 설명한 본 발명의 실시예들에 따른 영상표시기기 중 임의의 어느 하나와 신호를 송수신한다. 본 발명의 실시예들에 따른 영상표시기기들 중에서, 하나의 영상표시기기(100)를 일예로 설명하도록 하겠다.The
본 실시 예에서, 원격제어장치(200)는 RF 통신규격에 따라 영상표시기기(100)와 신호를 송수신할 수 있는 RF 모듈(221)을 구비할 수 있다. 또한 원격제어장치(200)는 IR 통신규격에 따라 영상표시기기(100)와 신호를 송수신할 수 있는 IR 모듈(223)을 구비할 수 있다. In this embodiment, the
본 실시 예에서, 원격제어장치(200)는 영상표시기기(100)로 원격제어장치(200)의 움직임 등에 관한 정보가 담긴 신호를 RF 모듈(221)을 통하여 전송한다. In this embodiment, the
또한, 원격제어장치(200)는 영상표시기기(100)가 전송한 신호를 RF 모듈(221)을 통하여 수신할 수 있다. 또한, 원격제어장치(200)는 필요에 따라 IR 모듈(223)을 통하여 영상표시기기(100)로 전원 온/오프, 채널 변경, 볼륨 변경 등에 관한 명령을 전송할 수 있다. In addition, the
사용자 입력부(235)는 키패드, 버튼, 터치 패드, 또는 터치 스크린 등으로 구성될 수 있다. 사용자는 사용자 입력부(235)를 조작하여 원격제어장치(200)으로 영상표시기기(100)와 관련된 명령을 입력할 수 있다. 사용자 입력부(235)가 하드키 버튼을 구비할 경우 사용자는 하드키 버튼의 푸쉬 동작을 통하여 원격제어장치(200)으로 영상표시기기(100)와 관련된 명령을 입력할 수 있다. 사용자 입력부(235)가 터치스크린을 구비할 경우 사용자는 터치스크린의 소프트키를 터치하여 원격제어장치(200)으로 영상표시기기(100)와 관련된 명령을 입력할 수 있다. 또한, 사용자 입력부(235)는 스크롤 키나, 조그 키 등 사용자가 조작할 수 있는 다양한 종류의 입력수단을 구비할 수 있으며 본 실시예는 본 발명의 권리범위를 제한하지 아니한다.The
센서부(240)는 자이로 센서(241) 또는 가속도 센서(243)를 구비할 수 있다. The
자이로 센서(241)는 원격제어장치(200)의 움직임에 관한 정보를 센싱할 수 있다. The
일예로, 자이로 센서(241)는 원격제어장치(200)의 동작에 관한 정보를 x,y,z 축을 기준으로 센싱할 수 있다. 가속도 센서(243)는 원격제어장치(200)의 이동속도 등에 관한 정보를 센싱할 수 있다. 한편, 거리측정센서를 더 구비할 수 있으며, 이에 의해, 디스플레이부(180)와의 거리를 센싱할 수 있다.For example, the
출력부(250)는 사용자 입력부(235)의 조작에 대응하거나 영상표시기기(100)에서 전송한 신호에 대응하는 영상 또는 음성 신호를 출력할 수 있다. 출력부(250)를 통하여 사용자는 사용자 입력부(235)의 조작 여부 또는 영상표시기기(100)의 제어 여부를 인지할 수 있다. The
일예로, 출력부(250)는 사용자 입력부(235)가 조작되거나 무선 통신부(225)을 통하여 영상표시기기(100)와 신호가 송수신되면 점등되는 LED 모듈(251), 진동을 발생하는 진동 모듈(253), 음향을 출력하는 음향 출력 모듈(255), 또는 영상을 출력하는 디스플레이 모듈(257)을 구비할 수 있다. For example, the
전원공급부(260)는 원격제어장치(200)으로 전원을 공급한다. 전원공급부(260)는 원격제어장치(200)이 소정 시간 동안 움직이지 않은 경우 전원 공급을 중단함으로서 전원 낭비를 줄일 수 있다. 전원공급부(260)는 원격제어장치(200)에 구비된 소정 키가 조작된 경우에 전원 공급을 재개할 수 있다.The
저장부(270)는 원격제어장치(200)의 제어 또는 동작에 필요한 여러 종류의 프로그램, 애플리케이션 데이터 등이 저장될 수 있다. 만일 원격제어장치(200)가 영상표시기기(100)와 RF 모듈(221)을 통하여 무선으로 신호를 송수신할 경우 원격제어장치(200)과 영상표시기기(100)는 소정 주파수 대역을 통하여 신호를 송수신한다. 원격제어장치(200)의 제어부(280)는 원격제어장치(200)과 페어링된 영상표시기기(100)와 신호를 무선으로 송수신할 수 있는 주파수 대역 등에 관한 정보를 저장부(270)에 저장하고 참조할 수 있다.The
제어부(280)는 원격제어장치(200)의 제어에 관련된 제반 사항을 제어한다. 제어부(280)는 사용자 입력부(235)의 소정 키 조작에 대응하는 신호 또는 센서부(240)에서 센싱한 원격제어장치(200)의 움직임에 대응하는 신호를 무선 통신부(225)를 통하여 영상표시기기(100)로 전송할 수 있다.The
이하에서는, 이와 같이 구성된 디스플레이 디바이스에서 구현될 수 있는 제어 방법과 관련된 실시 예들에 대해 첨부된 도면을 참조하여 살펴보겠다. 본 발명은 본 발명의 정신 및 필수적 특정을 벗어나지 않는 범위에서 다른 특정한 형태로 구체화될 수 있음은 당업자에게 자명하다.Hereinafter, embodiments related to a control method that can be implemented in the display device configured as described above will be described with reference to the accompanying drawings. It will be apparent to those skilled in the art that the present invention may be embodied in other specific forms without departing from the spirit and essential characteristics of the present invention.
또한, 이하에서는,디스플레이 디바이스로서 도 15에 도시된 디스플레이 디바이스를 예로 들어 본 발명의 실시 예들을 설명하기로 한다. 그러나, 본 발명의 일 실시 예에 의한 디스플레이 디바이스가 도 1 내지 도 14에 도시된 디스플레이 디바이스로 구현될 수도 있음은 물론이다.In addition, hereinafter, the display device illustrated in FIG. 15 as a display device will be described as an example. However, it is needless to say that the display device according to an embodiment of the present invention may be implemented as the display device shown in FIGS. 1 to 14.
또한,이하에서는,도 15 내지 도 26을 참조하여,디스플레이 디바이스 및 그 제어 방법에 대하여 상세히 설명하기로 한다. 다만,당업자는 이전에 설명한 도 1 내지 도 14를 참조하여,이하 도 15 내지 도 26을 보충 해석하거나 실시 예를 변형하는 것도 가능하다.In addition, hereinafter, with reference to FIGS. 15 to 26, the display device and its control method will be described in detail. However, a person skilled in the art may refer to FIGS. 1 to 14 previously described, and supplement or interpret the embodiments of FIGS. 15 to 26 or modify embodiments.
도 15는 본 발명의 일 실시 예에 따른 디스플레이 디바이스의 구성도이다. 15 is a configuration diagram of a display device according to an embodiment of the present invention.
도 15를 참조하면, 디스플레이 디바이스(1500)는 튜너(1510), 통신부(1520), 컨트롤러(1530), 디스플레이(1540), 스피커(1550), 마이크(1560), 메모리(1570), 카메라(1580)를 포함한다. Referring to FIG. 15, the
튜너(1510)는 방송 신호를 방송국으로부터 수신한다. The
통신부(1520)는 외부 서버 및 외부 리모컨 중 적어도 하나와 통신을 수행한다. The
디스플레이(1540)는 수신된 방송 신호에 포함된 컨텐트를 화면에 디스플레이한다. 여기서, 컨텐트는 외부 서버로부터 수신하거나 또는 내부 메모리에 저장되어 있다. The
스피커(1550)는 컨텐트를 재생할 때 생성되는 제 1 사운드를 출력한다. 예를 들어, 제 1 사운드는 TV 사운드가 될 수 있다. The
마이크(1560)는 기동어를 포함하는 제 2 사운드를 사용자로부터 수신하고, 제 1 사운드를 스피커(1550)로부터 수신한다. 예를 들어, 제 2 사운드는 사용자의 음성이 될 수 있다. 본 발명의 일 실시 예에 따르면, 마이크(1560)는 TV 사운드와 사용자의 음성을 수신할 수 있다. The
메모리(1570)는 복수의 사람 이미지를 저장한다. The
카메라(1580)는 컨트롤러(1530)의 제어 명령에 따라 디스플레이 디바이스(1500)의 전방 이미지를 캡쳐한다. The
컨트롤러(1530)는 튜너(1510), 통신부(1520), 디스플레이(1540), 스피커(1550), 마이크(1560), 메모리(1570), 카메라(1580) 중 적어도 하나를 제어한다. The
도 16은 본 발명의 일 실시 예에 따른, 디스플레이 디바이스의 제어 방법을 도시한 도면이다. 본 발명은 컨트롤러 (1530)에 의하여 수행된다. 16 is a diagram illustrating a control method of a display device according to an embodiment of the present invention. The invention is performed by a
도 16을 참조하면, 먼저, 방송 신호를 방송국으로부터 튜너를 통하여 수신한다(S1610).Referring to FIG. 16, first, a broadcast signal is received from a broadcasting station through a tuner (S1610).
수신된 방송 신호에 포함된 컨텐트를 화면에 디스플레이한다(S1620).The content included in the received broadcast signal is displayed on the screen (S1620).
컨텐트를 재생할 때 생성되는 제 1 사운드를 스피커를 통하여, 출력한다 (S1630). 제 1 사운드는 TV 사운드가 될 수 있다. The first sound generated when playing the content is output through the speaker (S1630). The first sound may be a TV sound.
기동어를 포함하는 제 2 사운드를 사용자로부터 수신하고, 제 1 사운드를 스피커로부터 마이크(1560)를 통하여 수신한다(S1640). 예를 들어, 제 2 사운드는 사용자의 음성이 될 수 있다. 본 발명의 일 실시 예에 따르면, 마이크(1560)를 통하여, TV 사운드와 사용자의 음성을 수신할 수 있다. The second sound including the starting word is received from the user, and the first sound is received from the speaker through the microphone 1560 (S1640). For example, the second sound may be the user's voice. According to an embodiment of the present invention, a TV sound and a user's voice may be received through the
제 1 사운드의 볼륨 크기가 기설정된 기준값보다 큰 경우(S1650), 제 1 게인의 크기를 감소시키고, 제 2 게인의 크기를 감소시키고, 제 3 게인의 크기를 증가시킨다(S1660).When the volume level of the first sound is larger than a preset reference value (S1650), the size of the first gain is reduced, the size of the second gain is reduced, and the size of the third gain is increased (S1660).
제 1 사운드의 볼륨 크기가 기설정된 기준값보다 작은 경우(S1650), 제 1 게인의 크기를 증가시키고, 상기 제 2 게인의 크기를 증가시키고, 상기 제 3 게인의 크기를 증가시킨다(S1670). When the volume of the first sound is smaller than a preset reference value (S1650), the size of the first gain is increased, the size of the second gain is increased, and the size of the third gain is increased (S1670).
여기서, 제 1 게인은 제 1 사운드의 게인과 제 2 사운드의 게인의 합을 의미하고, 제 2 게인은 제 1 사운드의 게인을 의미한다. 제 3 게인은 음향 에코 제거를 실행한 제 1 게인과 제 2 게인의 합을 의미한다. Here, the first gain means the sum of the gain of the first sound and the gain of the second sound, and the second gain means the gain of the first sound. The third gain means the sum of the first gain and the second gain that have performed acoustic echo cancellation.
제 1 사운드는 컨텐트를 재생할 때 생성되는 사운드를 의미한다. 제 1 사운드는 TV 사운드가 될 수 있다. 제 2 사운드는 사용자의 음성이 될 수 있다. 제 2 사운드는 기동어를 포함한다. The first sound means a sound generated when playing content. The first sound may be a TV sound. The second sound may be the user's voice. The second sound includes a starting word.
도 17은 본 발명의 일 실시 예에 따른, 디스플레이 디바이스의 원거리 음성인식 방법을 도시한 도면이다.17 is a diagram illustrating a remote voice recognition method of a display device according to an embodiment of the present invention.
도 17을 참조하면, 컨트롤러(1530)는 음성 인식부(1532), STT부(1534), 의도 분석부(1536)을 포함한다. Referring to FIG. 17, the
음성 인식부(1532)는 음성 데이터를 입력으로 받는다. 여기서, 음성 데이터는 기동어 데이터를 포함할 수 있다. STT 부(1534)는 음성 데이터를 입력으로 받는다. 여기서, STT 는 Speech-to-Text를 의미한다. The
이에 반하여, 의도 분석부(1536)는 텍스트를 입력으로 받는다. 여기서, 기동어 인식부(1532)와 STT부(1534)는 필요로 하는 음성 데이터의 성질이 다르다.In contrast, the
먼저, 음성 인식부(1532)는 전처리 과정을 수행한다. 전처리 과정은 TV 소리를 제거하고 사용자의 음성 크기를 크게 하기 위한 프로세스를 의미한다. 만약 마이크(1560)의 게인이 클 경우 음향 에코 제거부(1562)의 음향 에코 제거(AEC, Acoustic Echo Cancellation) 엔진이 정상적으로 동작하지 않는다. 따라서, 음향 에코 제거 엔진을 정상 동작시키기 위해 게인의 크기를 작게 해야 한다. First, the
다음으로, STT부(1534)는 뉘앙스 엔진(Nuance Engine)을 이용한다. STT부(1534)의 경우, 원거리에서 사용자가 말을 하기 때문에 소리의 크기가 작게 들어올 것이므로, 마이크(1560)의 게인의 크기를 높여야 음성 인식율이 올라가게 된다. 즉, 두 음성 인식 엔진이 요구하는 게인 크기가 완전히 상반되므로 이에 대한 해결책이 필요하다. 이에 대한 자세한 설명은 도 18에서 후술한다. Next, the
도 18은 본 발명의 일 실시 예에 따른, TV 볼륨 크기에 따라 게인 크기를 조절하는 것을 도시한 도면이다. 도 18은 도 18(a)와 도 18(b)를 포함한다. 18 is a diagram for adjusting a gain size according to a TV volume size according to an embodiment of the present invention. 18 includes FIGS. 18 (a) and 18 (b).
도 18(a)는 음성 인식 프로세스를 도시한 도면이다. 도 18(a)을 참조하면, 마이크(1560)는 사용자의 음성과 TV 사운드를 수신한다. 음향 에코 제거부(AEC, Acoustic Echo Cancellation Unit, 1562)는 마이크(1560)를 통해 수신된 사람의 음성과 TV 사운드, 그리고, 직접 수신한 TV 사운드의 에코를 제거한다. 18 (a) is a diagram illustrating a speech recognition process. Referring to FIG. 18 (a), the
음성 인식부(1532)는 마이크(1560)를 통해 수신한 에코를 제거한 음성과 에코를 제거한 TV 사운드, 그리고, 에코 음향 제거부(1562)가 직접 수신한 에코를 제거한 TV 사운드를 수신한다. The
여기서, 제 1 게인은 마이크(1560)를 통해 수신한, 제 1 사운드의 게인과 제 2 사운드의 게인의 합을 의미하고, 예를 들어, 제 1 게인은 TV 사운드의 게인과 사용자 음성의 게인의 합을 의미한다. Here, the first gain means the sum of the gain of the first sound and the gain of the second sound received through the
제 2 게인은 음향 에코 제거부(1562)가 수신한 제 1 사운드의 게인을 의미한다. 예를 들어, 제 2 게인은 음향 에코 제거부(1562)가 수신한 TV 사운드의 게인이 될 수 있다. The second gain means the gain of the first sound received by the
제 3 게인은 음향 에코 제거부(1562)가 음향 에코 제거를 실행한 제 1 게인과 제 2 게인의 합을 의미한다. The third gain means the sum of the first gain and the second gain in which the acoustic
제 1 사운드는 컨텐트를 재생할 때 생성되는 사운드를 의미한다. 제 1 사운드는 TV 소리를 포함한다. 제 2 사운드는 사용자의 음성을 의미한다. 사용자의 음성은 기동어를 포함할 수 있다. 여기서, 기동어(Trigger word)는 시스템이 특정 액션을 하게하는 단어를 의미한다The first sound means a sound generated when playing content. The first sound includes TV sound. The second sound means the user's voice. The user's voice may include a starting word. Here, the trigger word means a word that causes the system to perform a specific action.
도 18(b)는 TV 볼륨의 크기에 따라 게인의 크기를 조절하는 것을 도시한 도면이다. 기동어를 사용자로부터 수신해야 하는 상황이면, 전처리를 이용한 기동어 인식이 잘 되어야 한다. FIG. 18 (b) is a diagram illustrating adjusting the size of the gain according to the size of the TV volume. If a starter word needs to be received from the user, the starter word must be well recognized using preprocessing.
이를 위해서 컨트롤러(1530)는 음성 인식 동작이 진행 중이지 않은 일반적인 TV 시청 상황에서는 TV 볼륨 값을 전달 받아, TV 스피커에서 출력될 소리를 인식한다. To this end, the
컨트롤러(1530)는 제 1 사운드의 볼륨 크기가 기설정된 기준값보다 큰 경우, 제 1 게인의 크기를 감소시키고, 제 2 게인의 크기를 감소시키고, 제 3 게인의 크기를 증가시킨다. The
도 18(b)를 참조하면, 예를 들어, TV 소리가 너무 큰 경우, 제 1 게인의 크기를 감소시켜서 TV 소리가 클리핑(clipping)이 발생하지 않도록 조절한다. 이때, 제 2 게인의 크기를 감소시켜서 음향 에코 제거 엔진이 최적으로 동작할 수 있는 값으로 조정한다. 그리고 제 3 게인의 크기를 증가시켜 기동어가 잘 인식될 수 있도록 한다. Referring to FIG. 18 (b), for example, when the TV sound is too loud, the size of the first gain is reduced to control the TV sound from clipping. At this time, the size of the second gain is reduced to adjust the value so that the acoustic echo cancellation engine can operate optimally. In addition, the size of the third gain is increased so that the maneuver word can be recognized well.
다음으로, 컨트롤러(1530)는 제 1 사운드의 볼륨 크기가 기설정된 기준값보다 작은 경우, 제 1 게인의 크기를 증가시키고, 제 2 게인의 크기를 증가시키고, 제 3 게인의 크기를 증가시킨다. Next, the
도 18(b)를 참조하면, 예를 들어, TV 소리가 너무 작은 경우, 제 1 게인의 크기를 증가시키고, 제 2 게인의 크기를 증가시키고, 제 3 게인의 크기를 증가시켜, TV의 소리와 관계 없이 기동어 인식이 잘 되도록 한다. 여기서, TV 소리가 너무 작은 경우, 제 2 게인의 크기를 증가시키고, 제 3 게인의 크기를 유지할 수 있다. TV 소리가 너무 작은 경우에는 제 2 게인의 크기만 증가시켜도 충분히 음성 인식 성능을 향상 시킬 수 있기 때문이다. Referring to FIG. 18 (b), for example, when the TV sound is too low, the size of the first gain is increased, the size of the second gain is increased, the size of the third gain is increased, and the sound of the TV is Regardless of whether or not the word is recognized well. Here, when the TV sound is too low, the size of the second gain may be increased and the size of the third gain may be maintained. This is because, if the TV sound is too low, increasing the size of the second gain can sufficiently improve speech recognition performance.
또한, 게인은 디스플레이 디바이스(1500) 내부로 들어오는 신호 양을 조절하는 것을 의미하고, 볼륨은 디스플레이 디바이스(1500) 외부로 나가는 신호의 양을 조절하는 것을 의미한다. In addition, the gain means adjusting the amount of signal that enters the
도 19는 본 발명의 일 실시 예에 따른, STT 수행에 따라 게인 크기를 조절하는 것을 도시한 도면이다. 도 19는 도 19(a)와 도 19(b)를 포함한다. 19 is a diagram for adjusting gain size according to STT performance according to an embodiment of the present invention. 19 includes FIGS. 19 (a) and 19 (b).
도 19(a)는 음성 인식 프로세스를 도시한 도면이다. 도 19(a)에 대해서는 앞에서, 설명하였으므로 이에 대한 설명은 생략한다. 19 (a) is a diagram illustrating a speech recognition process. Since FIG. 19 (a) has been described above, a description thereof will be omitted.
도 19(b)는 STT를 수행할 때, 제 1 게인, 제 2 게인, 제 3 게인의 크기 변화를 설명한 도면이다. 19 (b) is a diagram illustrating a change in size of a first gain, a second gain, and a third gain when performing STT.
도 19(b)를 참조하면, 컨트롤러(1530)는 기동어를 인식하고, STT(Speech to text)를 수행하는 경우, 제 1 게인을 감소시키고, 제 2 게인을 감소시키고, 제 3 게인을 증가시킨다. Referring to FIG. 19 (b), when the
구체적으로, 컨트롤러(1530)는 기동어가 인식되어 STT 수행 상황이 되면, 게인의 크기를 다시 한번 다른 상태로 변경한다. STT를 위해서는 노이즈는 줄여야 하고, 사용자의 음성은 크게 들어와야 하므로 이와 같은 상태를 위해, 컨트롤러(1530)는 TV 볼륨의 크기를 최대한 줄인다. 또는 컨트롤러(1530)는 음소거 기능을 실행할 수 있다. 컨트롤러(1530)는 제 1 게인을 감소시키고, 제 2 게인을 감소시키고, 제 3 게인을 증가시킨다. Specifically, the
다음으로, 제 3 게인을 어느 정도까지 증가시키는지에 대하여 설명한다. 컨트롤러(1530)는 기본 노이즈의 영향을 고려하여 STT를 수행할 수 있는 정도까지 제 3 게인을 증가시킨다. 즉, 컨트롤러(1530)는 제 3 게인을 증가시킬 때 기본 노이즈가 STT 수행을 저해하지 않을 정도까지 제 3 게인을 증가시킨다. Next, the extent to which the third gain is increased will be described. The
본 발명에 따르면, 기동어가 인식되어 STT 수행 상황에서, 제 1 게인, 제 2 게인, 제 3 게인의 크기를 적절히 조정하여, 음성 인식 성능을 향상 시킬 수 있으므로 사용자 편의성을 향상 시킬 수 있다. According to the present invention, in a situation in which STT is performed by recognizing the starting word, the size of the first gain, the second gain, and the third gain can be appropriately adjusted to improve speech recognition performance, thereby improving user convenience.
도 20은 본 발명의 일 실시 예에 따른, 사운드가 발생한 경우, 사운드 발생방향으로 마이크의 사운드 수신 방향을 조정하는 것을 도시한 도면이다. 도 20은 도 20(a), 도 20(b)를 포함한다. 20 is a diagram for adjusting a sound reception direction of a microphone in a sound generation direction when sound is generated according to an embodiment of the present invention. 20 includes FIGS. 20 (a) and 20 (b).
도 20(a)를 참조하면, 컨트롤러(1530)는 사운드가 발생한 경우, 사운드를 마이크(1560)를 통하여 수신하고, 마이크(1560)의 사운드 수신 방향을 사운드가 발생한 방향으로 조정한다. Referring to FIG. 20 (a), when a sound is generated, the
예를 들어, 왼쪽에 위치한 사용자가 하이 엘지! 라고 발화하여, 사운드(2010)가 왼쪽에서 발생한 경우, 컨트롤러(1530)는 발생한 사운드(2010)를 마이크(1560)를 통하여 수신하고, 마이크의 사운드 수신 방향을 왼쪽으로 조정한다. For example, the user located on the left is High LG! When the
도 20(b)를 참조하면, 예를 들어, 오른쪽에 위치한 사용자가 하이 엘지! 라고 발화하여, 사운드(2010)가 오른쪽에서 발생한 경우, 컨트롤러(1530)는 사운드(2010)를 마이크(1560)를 통하여 수신하고, 마이크의 사운드 수신 방향을 오른쪽으로 조정한다. Referring to FIG. 20 (b), for example, a user located on the right side has high LG! When the
본 발명에 따르면, 사운드가 발생한 경우, 컨트롤러는 사운드 발생 방향으로 마이크의 사운드 수신 방향을 조정할 수 있어서, 기동어를 포함한 사운드를 보다 정확하게 수신할 수 있으므로 음성 인식 성능을 향상 시킬 수 있다. According to the present invention, when sound is generated, the controller can adjust the sound receiving direction of the microphone in the direction in which the sound is generated, so that sound including the starting words can be more accurately received, thereby improving speech recognition performance.
도 21은 본 발명의 일 실시 예에 따른, TV 볼륨 크기에 따른 게인 크기를 도시한 도시한 도면이다.21 is a diagram illustrating a gain size according to a TV volume size according to an embodiment of the present invention.
도 21을 참조하면, 가로축은 TV 볼륨 크기를 의미하고, 세로축은 TV 볼륨 크기에 대응하는 게인 크기를 의미한다. 여기서, 게인 크기의 단위는 데시벨(dB)이다. TV 볼륨 크기는 0 내지 100 으로 나눌 수 있고, TV 볼륨 크기 0은 스피커 출력이 0인 상태를 의미하고, TV 볼륨 크기 100은 스피커 출력이 최대 출력인 상태를 의미한다. Referring to FIG. 21, the horizontal axis means the TV volume size, and the vertical axis means the gain size corresponding to the TV volume size. Here, the unit of the gain size is decibel (dB). The TV volume size can be divided into 0 to 100, the
도 21을 참조하면, 그래프의 파형과 관련하여, TV 볼륨의 크기가 증가할 수록 게인 크기는 특정 값에 수렴함을 알 수 있다. 따라서, TV 볼륨 구간이 저음일수록 TV 볼륨 크기에 대응하는 게인 크기가 급격히 커지고, TV 볼륨 구간이 고음일수록 소리에 TV 볼륨 크기에 대응하는 게인 크기가 서서히 증가한다. 따라서, 컨트롤러(1530)는 낮은 볼륨에서는 구간을 더 세밀하게 나누고 높음 볼륨에서는 구간을 크게 나눈다. Referring to FIG. 21, it can be seen that with respect to the waveform of the graph, as the size of the TV volume increases, the gain size converges to a specific value. Accordingly, the gain volume corresponding to the TV volume level increases rapidly as the TV volume section is low, and the gain size corresponding to the TV volume level to sound gradually increases as the TV volume section is high. Accordingly, the
본 발명의 일 실시 예에 따르면, 디스플레이 디바이스가 TV인 경우, TV 볼륨 크기가 특정 값인 경우를 기준으로 하여, 이에 대응하는 게인 크기 값을 연동하여 사용한다. 예를 들어, TV 볼륨 크기가 10이고, 이에 대응하는 게인 크기가 60 데시벨인 경우, 60 데시벨을 기준으로 하여, TV 볼륨 크기에 대응하는 게인 크기를 조정한다. According to an embodiment of the present invention, when the display device is a TV, based on a case where the TV volume size is a specific value, a corresponding gain size value is used in conjunction. For example, if the TV volume size is 10 and the corresponding gain size is 60 decibels, the gain size corresponding to the TV volume size is adjusted based on 60 decibels.
도 22는 본 발명의 일 실시 예에 따른, TV 볼륨 크기에 따라 게인 크기를 조정하는 것을 도시한 도면이다. 도 22는 도 22(a)와 도 22(b)를 포함한다. 22 is a diagram for adjusting a gain size according to a TV volume size, according to an embodiment of the present invention. 22 includes FIGS. 22 (a) and 22 (b).
도 22(a)는 음성 인식 프로세스를 도시한 도면이다. 도 22(a)에 대해서는 앞에서 설명하였으므로 이에 대한 자세한 설명은 생략한다. 22 (a) is a diagram illustrating a speech recognition process. 22 (a) has been described above, a detailed description thereof will be omitted.
도 22(b)는 TV 볼륨 구간 별로, 제 1 게인, 제 2 게인, 제 3 게인의 크기 변화를 설명한 도면이다. 예를 들어, TV 볼륨 크기를 기준으로, 컨트롤러(1530)는 전체 구간을 5 개의 구간으로 나눌 수 있다. 제 1 구간은 TV 볼륨 크기가 0 내지 10 다. 제 2 구간은 TV 볼륨 크기가 10 내지 25 이다. 제 3 구간은 TV 볼륨 크기가 25 내지 45 이다. 제 4 구간은 TV 볼륨 크기가 45 내지 70 이다. 제 5 구간은 TV 볼륨 크기가 10 내지 25 이다.22 (b) is a view for explaining a change in size of the first gain, the second gain, and the third gain for each TV volume section. For example, based on the TV volume size, the
도 22(b)를 참조하면, 제 1 게인, 제 2 게인, 제 3 게인에서 설정 가능한 게인 레벨을 5라고 하면, TV의 볼륨 크기에 따라, 다음과 같이 매핑할 수 있다. Referring to FIG. 22 (b), if the gain level that can be set in the first gain, the second gain, and the third gain is 5, it can be mapped as follows according to the volume size of the TV.
제 1 게인의 경우, 게인 크기가 레벨 5인 경우 최대값을 의미하고, 게인 크기가 레벨 1인 경우, 최저값을 의미한다. 제 2 게인, 제 3 게인도 마찬가지이다. In the case of the first gain, when the gain size is
컨트롤러(1530)는 제 1 사운드의 볼륨 크기가 제 1 기준 볼륨보다 낮은 경우, 즉, TV 볼륨 크기가 작은 경우, 제 1 사운드의 볼륨 구간을 기준 구간보다 좁게 나눈다. 컨트롤러(1530)는 제 1 사운드의 볼륨 크기가 제 2 기준 볼륨보다 큰 경우, 즉, TV 볼륨 크기가 큰 경우, 제 1 사운드의 볼륨 구간을 기준 구간보다 넓게 나눈다. The
TV 소리 크기가 작을 때, 예를 들어, TV 볼륨 크기가 제 1 구간의 경우, 컨트롤러(1530)는 제 1 게인 크기를 최대 값으로 설정하여, 컨트롤러(1530)는 멀리 있는 사용자의 음성을 크게 인식할 수 있다. 또한, TV 소리 크기가 작을 때, 게인을 크게 하더라도 클리핑이 발생하지 않으므로, 제 1 게인의 크기를 최대로 한다. 제 1 게인의 크기를 최대로 설정하였으므로, 마이크(1560)를 통해 수신하는 TV의 소리가 평소보다 다소 크게 입력된다. 따라서, 컨트롤러(1530)는 제 2 게인의 크기를 최대로 올려 상대적으로 작은 TV의 레퍼런스 소리를 증폭시켜 에코 음향 제거부(1562)가 잘 동작하도록 보정한다. When the TV sound level is small, for example, when the TV volume level is the first section, the
마지막으로, 컨트롤러(1530)는 제 3 게인의 크기를 최소로 한다. 왜냐하면, 제 1 게인의 크기를 크게 하였으므로, 멀리 있는 사용자의 말하는 소리 역시 증폭된다. 따라서, 제 3 게인의 크기를 최소로 하여도 음성 인식은 잘 수행된다. Finally, the
다음으로, TV 소리 크기가 큰 경우를 살펴본다. 예를 들어, TV 볼륨 크기가 제 5 구간인 경우, 컨트롤러(1530)는 제 1 게인의 크기를 최소로 설정하여, TV 소리가 클리핑이 나지 않도록 한다. 그리고 제 1 게인에 의해 TV 소리도 상대적으로 작게 입력되므로, 컨트롤러(1530)는 제 2 게인의 크기를 최소로 설정하여 음향 에코 제거부(1562)가 잘 동작되도록 한다. Next, a case in which the sound level of the TV is large is described. For example, when the TV volume size is the fifth section, the
마지막으로 컨트롤러(1530)는 제 3 게인의 크기를 최대로 설정한다. 왜냐하면, 이 경우, 제 1 게인의 크기가 작기 때문에, 마이크(1560)를 통하여 수신되는 사용자의 목소리 크기 또한 감소하게 된다. 따라서, 컨트롤러(1530)는 제 3 게인의 크기를 증가시켜 음성 인식이 잘 동작되도록 한다.Finally, the
도 23은 본 발명의 일 실시 예에 따른, 기동어를 인식한 경우, 화면 UX 변화를 도시한 도면이다. 도 23은 도 23(a)와 도 23(b)를 포함한다.23 is a diagram illustrating a change in screen UX when a start word is recognized according to an embodiment of the present invention. 23 includes FIGS. 23 (a) and 23 (b).
도 23(a)은 기동어를 인식하기 전의 화면을 도시한 도면이다. 도 23(a)를 참조하면, 사용자가 하이 엘지(20)라고 말해도 기동어를 인식하지 못한 경우, 컨트롤러(1530)는 사용자 음성의 볼륨 크기를 반영한 이미지를 디스플레이 하지 않는다. 디스플레이 디바이스(1500)의 실행 화면은 TV 볼륨 크기 10을 의미하는 그래픽 이미지(10)를 포함한다. 23 (a) is a diagram showing a screen before recognizing a starting word. Referring to FIG. 23 (a), if the user does not recognize the starting word even when the user speaks of the
도 23(b)는 기동어를 인식한 후의 화면을 도시한 도면이다. 도 23(b)를 참조하면, 사용자가 하이 엘지(20)라고 말하고, 컨트롤러(1530)가 기동어를 인식한 경우, 컨트롤러(1530)는 사용자 음성의 볼륨 크기를 반영한 그래픽 이미지(2310)를 디스플레이를 통하여, 디스플레이하도록 제어한다. 예를 들어, 사용자 음성의 볼륨 크기를 반영한 그래픽 이미지(2310)는 이퀄라이저 타입의 그래픽 이미지가 될 수 있다. 여기서, 기동어는 시스템이 특정 액션을 하게하는 단어를 의미한다. 본 발명의 일 실시 예에 따르면, 기동어는 하이 엘지가 될 수 있다. Fig. 23 (b) is a diagram showing a screen after recognizing a starting word. Referring to FIG. 23 (b), when the user says that the high LG is 20, and the
본 발명의 다른 일 실시 예에 따르면, 컨트롤러(1530)는 기동어를 인식한 경우, 음성 메시지를 출력할 수 있다. 예를 들어, 컨트롤러(1530)는 스피커(1550)를 통해, 지금 말하세요라는 음성 메시지를 출력할 수 있다. According to another embodiment of the present invention, the
본 발명의 일 실시 예에 따르면, 컨트롤러(1530)는 기동어를 인식한 경우, 기동어를 인식했음을 암시하는 발광등(미도시)을 On 시킬 수 있다. 예를 들어, 컨트롤러(1530)는 디스플레이 디바이스(1500)에 내장된 LED 등을 ON 시킬 수 있다. 따라서, 사용자는 ON 상태가된 LED 등을 보고, 컨트롤러(1530)가 기동어를 인식하였음을 알 수 있다. According to an embodiment of the present invention, when the
본 발명에 따르면, 기동어를 인식한 경우, 사용자 음성의 볼륨 크기를 반영한 그래픽 이미지를 디스플레이를 통하여, 디스플레이하므로 사용자는 시스템이 기동어를 인식하였음을 용이하게 알 수 있다. According to the present invention, when the starting word is recognized, the graphic image reflecting the volume size of the user's voice is displayed on the display, so that the user can easily know that the system recognizes the starting word.
도 24는 본 발명의 일 실시 예에 따른, 기동어를 인식한 경우, TV 볼륨 소리를 감소시키는 그래픽 이미지를 도시한 도면이다. 도 24는 도 24(a)와 도 24(b)를 포함한다.24 is a diagram illustrating a graphic image for reducing TV volume sound when a spoken word is recognized according to an embodiment of the present invention. 24 includes FIGS. 24 (a) and 24 (b).
도 24(a)는 기동어를 인식하기 전의 화면 상태를 도시한 도면이다. 컨트롤러(1530)는 기동어를 인식하기 전에는 제 1 사운드의 볼륨 크기를 나타내는 그래픽 이미지(2410)를 디스플레이한다. Fig. 24 (a) is a diagram showing a screen state before recognizing a start word. The
도 24(b)는 기동어를 인식한 후의 화면 상태를 도시한 도면이다. 도 24(b)를 참조하면, 사용자가 하이 엘지(10)라고 말하면, 컨트롤러(1530)는 사용자의 음성을 마이크를 통하여 수신하고, 기동어인 하이 엘지(10)를 인식한다. 컨트롤러(1530)는 기동어를 인식한 후, TV 볼륨 사운드의 크기를 감소시키는 것을 나타내는 그래픽 이미지(2420)을 디스플레이한다. 그리고, 마이크(1550)를 통해 다음 명령어인 채널 올려줘(20)를 수신하고, 컨트롤러(1530)는 수신한 명령어에 대응하는 기능을 실행한다. Fig. 24 (b) is a diagram showing a screen state after recognizing a start word. Referring to FIG. 24 (b), when the user says that the high LG is 10, the
본 발명에 따르면, 사용자는 그래픽 이미지(2420)를 보고, TV 볼륨 사운드의 크기가 20에서 10으로 감소하였음을 직관적으로 알 수 있으므로, 사용자 편의성을 향상 시킬 수 있다. According to the present invention, the user can intuitively know that the volume of the TV volume sound is reduced from 20 to 10 by viewing the
다음으로, 기동어를 인식하기 전과 기동어를 인식한 후의 게인 조절에 대하여 설명한다. Next, gain adjustment before and after recognizing the starting word will be described.
컨트롤러(1530)는 기동어를 인식하기 전에는, 제 1 사운드에 대응하는 게인 테이블에 기초하여 제 1 게인, 제 2 게인 및 제 3 게인을 조정한다. 예를 들어, 기동어를 인식하기 전인 경우, 컨트롤러(1530)는 TV 볼륨 크기 20에 대응하는 게인 테이블에 기초하여, 제 1 게인, 제 2 게인, 제 3 게인을 조정한다. Before recognizing the starting word, the
기동어를 인식한 후에는, 제 1 사운드의 볼륨을 감소시킨 제 3 사운드에 대응하는 게인 테이블에 기초하여 제 1 게인, 제 2 게인 및 제 3 게인을 조정한다. 예를 들어, 기동어를 인식한 경우, 컨트롤러는 TV 볼륨 크기 10에 대응하는 게인 테이블에 기초하여 제 1 게인, 제 2 게인, 제 3 게인을 조정한다. After recognizing the starting word, the first gain, the second gain and the third gain are adjusted based on the gain table corresponding to the third sound in which the volume of the first sound is reduced. For example, when the start word is recognized, the controller adjusts the first gain, the second gain, and the third gain based on the gain table corresponding to the
여기서, 게인 테이블은 제 1 사운드의 볼륨 크기에 각각 대응하는 제 1 게인, 제 2 게인, 제 3 게인을 정리한 테이블을 의미한다. Here, the gain table means a table in which the first gain, the second gain, and the third gain respectively corresponding to the volume of the first sound are arranged.
도 25는 본 발명의 일 실시 예에 따른, 기동어를 인식하기 전과 후에 음성 의 크기 차이가 없이 연속된 발화를 하는 경우를 도시한 도면이다. 도 25는 도 25(a)와 도 25(b)를 포함한다.25 is a diagram illustrating a case in which continuous speech is performed without a difference in voice size before and after recognizing a starting word according to an embodiment of the present invention. 25 includes FIGS. 25 (a) and 25 (b).
도 25(a)는 사용자가 말하기 전의 디스플레이 디바이스(1500)의 화면 상태를 도시한 도면이다. 컨트롤러(1530)는 사용자가 말하기 전에는, 제 1 사운드의 볼륨 크기를 나타내는 그래픽 이미지(2510)를 디스플레이한다. 이 경우, TV 사운드의 볼륨 크기는 20 이 될 수 있다. 25A is a diagram illustrating a screen state of the
도 25(b)는 사용자가 말한 후, 디스플레이 디바이스(1500)의 화면 상태를 도시한 도면이다. 컨트롤러(1530)는 사용자가 기동어를 포함하는 음성을 발화하는 동안, 기동어를 인식하지 못한 경우, 제 1 사운드의 볼륨 크기를 나타내는 그래픽 이미지(2520)를 디스플레이한다. 이 경우, TV 사운드의 볼륨 크기는 20이 될 수 있다. 25B is a diagram illustrating a screen state of the
즉, 사용자가 말하기 전의 TV 볼륨 크기가 20 이고, 사용자가 말 한 후의 TV 볼륨 크기가 20 이 되어, TV 볼륨 크기가 변화하지 않았으므로, 컨트롤러(1530)는 기동어를 인식하지 못한 것으로 파악된다. That is, since the TV volume size before the user speaks is 20 and the TV volume size after the user speaks becomes 20, and the TV volume size has not changed, the
예를 들어, 사용자가 하이 엘지! 채널 올려줘(40)라고 말하는 동안 컨트롤러(1530)가 기동어인 하이 엘지!를 인식하지 못한 경우, 컨트롤러는(1530)는 기동어를 인식하기 전과 기동어를 인식한 후의 음성 차이가 없이, 연속된 발화로 인식한다. For example, the user is High LG! If the
컨트롤러(1530)는 사용자가 기동어를 포함하는 음성을 발화하는 동안, 기동어를 인식하지 못한 경우, 현재 출력되는 사운드의 크기에 대응하는 게인 테이블을 기초로, 제 1 게인, 제 2 게인, 제 3 게인을 조정한다. 따라서, 기동어를 인식하지 못한 경우, 컨트롤러(1530)는 현재 출력되는 TV 사운드 볼륨 크기 20 에 대응하는 게인 테이불을 기초로, 제 1 게인, 제 2 게인, 제 3 게인을 조정한다. The
본 발명에 따르면, 사용자가 기동어를 포함하는 음성을 발화하는 동안, 기동어를 인식하지 못하더라도, 현재 출력되는 사운드의 크기에 대응하는 게인 테이블을 기초로 게인의 크기를 조정할 수 있어서 원거리 음성 인식 성능을 향상 시킬 수 있므로, 사용자 편의성을 향상 시킬 수 있다. According to the present invention, while the user speaks a voice including the starting word, even if the starting word is not recognized, the distance of the voice is recognized because the gain can be adjusted based on the gain table corresponding to the size of the sound currently output. Since the performance can be improved, user convenience can be improved.
도 26은 본 발명의 일 실시 예에 따른, 카메라로 사용자를 인지하고, 마이크의 사운드 수신 방향을 사용자가 있는 곳으로 조정하는 경우를 도시한 도면이다. 26 is a diagram illustrating a case in which a user is recognized by a camera and a sound reception direction of a microphone is adjusted to a user's location according to an embodiment of the present invention.
도 26을 참조하면, 디스플레이 디바이스(1500)는 구성 요소로서 카메라(1580)를 더 포함한다. Referring to FIG. 26, the
카메라(1580)는 컨트롤러(1530)의 제어 명령에 따라 디스플레이 디바이스(1500)의 전방 이미지를 캡쳐한다. 컨트롤러(1530)는 캡쳐된 전방 이미지가 사람 오브젝트 이미지를 포함하면, 마이크(1560)의 사운드 수신 방향을 사운드가 발생한 방향으로 조정한다. The
예를 들면, 카메라(1580)는 컨트롤러(1530)의 제어 명령에 따라 디스플레이 디바이스(1500)의 전방에 있는 오브젝트(10)를 촬영하여, 전방 이미지(2610)를 캡쳐한다. 카메라(1580)는 소정 주기로 회전하여 디스플레이 디바이스(1500)의 주변을 촬영할 수 있다.For example, the
컨트롤러는 캡쳐된 전방 이미지를 분석하여, 캡쳐된 전방 이미지(2610)가 사람 오브젝트 이미지를 포함하면, 마이크(1560)의 사운드 수신 방향을 사운드가 발생할 가능성이 높은 방향, 즉 오브젝트(10)가 있는 방향으로 조정한다. The controller analyzes the captured front image, and when the captured
메모리(1570)는 복수의 사람 이미지를 저장한다. 컨트롤러(1530)는 메모리(1570)를 참조하여, 캡쳐된 전방 이미지(2610)에 포함된 오브젝트 이미지가 메모리(1570)에 저장된 사람 이미지와의 유사율이 기설정된 값 이상이면, 캡쳐된 이미지가 사람 오브젝트 이미지를 포함한다고 결정한다. The
본 발명에 따르면, 카메라로 전방 이미지를 캡쳐하고, 캡쳐된 전방 이미지가 사람 오브젝트 이미지를 포함한 경우, 마이크의 사운드 수신 방향을 오브젝트가 있는 방향으로 조정할 수 있으므로, 원거리 음성 인식률을 더 향상 시킬 수 있다. According to the present invention, when the front image is captured by the camera and the captured front image includes a human object image, the direction of sound reception of the microphone can be adjusted to the direction in which the object is located, thereby further improving the remote speech recognition rate.
본 발명의 일 실시 예에 따르면, TV 사운드의 볼륨 크기에 따라서, 마이크에서 수신한 사용자 음성과 마이크에서 수신한 TV 사운드의 게인의 합, TV 사운드 게인 및 음향 에코 제거를 실행한 앞의 두 게인의 합의 크기를 조정하여 원거리 음성 인식 성능을 향상할 수 있으므로, 사용자 편의성을 향상 시킬 수 있다.According to an embodiment of the present invention, according to the volume of the TV sound, the sum of the gain of the user voice received from the microphone and the TV sound received from the microphone, TV sound gain and acoustic echo cancellation of the preceding two gains By adjusting the size of the agreement, the performance of remote speech recognition can be improved, and user convenience can be improved.
본 발명의 다른 실시 예에 따르면, 기동어가 인식되어 STT를 수행하는 경우, 마이크에서 수신한 사용자 음성과 마이크에서 수신한 TV 사운드의 게인의 합, TV 사운드 게인 및 음향 에코 제거를 실행한 앞의 두 게인의 합의 크기를 조정할 수 있어서, 원거리 음성 인식 성능을 향상 시킬 수 있으므로 사용자 편의성을 향상 시킬 수 있다.According to another embodiment of the present invention, when the start word is recognized and the STT is performed, the sum of the gain of the user voice received from the microphone and the TV sound received from the microphone, TV sound gain, and acoustic echo cancellation are performed. Since the size of the gain sum can be adjusted, the performance of remote speech recognition can be improved, and user convenience can be improved.
본 발명의 또 다른 실시 예에 따르면, 기동어를 인식한 경우, 사용자 음성의 볼륨 크기를 반영한 그래픽 이미지를 디스플레이를 통하여 디스플레이하도록 제어할 수 있어서, 원거리 음성 인식 성능을 향상 시킬 수 있으므로 사용자 편의성을 향상 시킬 수 있다.According to another embodiment of the present invention, when a maneuver word is recognized, a graphic image reflecting the volume size of a user's voice can be controlled to be displayed through a display, thereby improving remote voice recognition performance, thereby improving user convenience. I can do it.
본 발명에 따른 영상표시기기 및 그 동작 방법은 상기한 바와 같이 설명된 실시 예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시 예들은 다양한 변형이 이루어질 수 있도록 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.The image display device and the operation method according to the present invention are not limited to the configuration and method of the above-described embodiments, and the above embodiments are all or part of each embodiment so that various modifications can be made. May be selectively combined.
한편, 본 발명의 영상표시기기의 동작방법은 영상표시기기에 구비된 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.On the other hand, the operation method of the video display device of the present invention can be implemented as a code that can be read by the processor on a recording medium that can be read by the processor provided in the video display device. The processor-readable recording medium includes all kinds of recording devices in which data that can be read by the processor are stored. Examples of the recording medium readable by the processor include a ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, and the like, and also implemented in the form of a carrier wave such as transmission through the Internet. . In addition, the processor readable recording medium may be distributed over network coupled computer systems so that the processor readable code is stored and executed in a distributed fashion.
또한, 이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.In addition, although the preferred embodiments of the present invention have been illustrated and described above, the present invention is not limited to the specific embodiments described above, and the technical field to which the present invention pertains without departing from the gist of the present invention claimed in the claims. In addition, various modifications can be implemented by those skilled in the art, and these modifications should not be individually understood from the technical idea or prospect of the present invention.
1500: 디스플레이 디바이스
1510: 튜너 1520: 통신부
1530: 컨트롤러 1540: 디스플레이
1550: 스피커 1560: 마이크
1570: 메모리1500: display device
1510: tuner 1520: communication unit
1530: controller 1540: display
1550: speaker 1560: microphone
1570: memory
Claims (20)
방송 신호를 방송국으로부터 수신하는 튜너;
외부 서버 및 외부 리모컨 중 적어도 하나와 통신을 수행하는 통신부;
상기 수신된 방송 신호에 포함된 컨텐트를 화면에 디스플레이하는 디스플레이 - 상기 컨텐트는 외부 서버로부터 수신하거나 또는 내부 메모리에 저장되어 있음 -;
상기 컨텐트를 재생할 때 생성되는 제 1 사운드를 출력하는 스피커;
기동어를 포함하는 제 2 사운드를 사용자로부터 수신하고, 상기 제 1 사운드를 상기 스피커로부터 수신하는 마이크; 및
상기 튜너, 상기 통신부, 디스플레이, 상기 마이크 및 상기 스피커 중 적어도 하나를 제어하는 컨트롤러를 포함하되,
상기 컨트롤러는,
상기 제 1 사운드의 볼륨 크기가 기설정된 기준값보다 큰 경우, 상기 제 1 게인의 크기를 감소시키고, 상기 제 2 게인의 크기를 감소시키고, 상기 제 3 게인의 크기를 증가시키고,
상기 제 1 사운드의 볼륨 크기가 기설정된 기준값보다 작은 경우, 상기 제 1 게인의 크기를 증가시키고, 상기 제 2 게인의 크기를 증가시키고, 상기 제 3 게인의 크기를 증가시키되,
상기 제 1 게인은 상기 제 1 사운드의 게인과 상기 제 2 사운드의 게인의 합을 의미하고,
상기 제 2 게인은 상기 제 1 사운드의 게인을 의미하고,
상기 제 3 게인은 음향 에코 제거를 실행한 상기 제 1 게인과 상기 제 2 게인의 합을 의미하는,
디스플레이 디바이스.In the display device,
A tuner that receives a broadcast signal from a broadcasting station;
A communication unit performing communication with at least one of an external server and an external remote control;
A display for displaying content included in the received broadcast signal on a screen, the content being received from an external server or stored in an internal memory;
A speaker that outputs a first sound generated when playing the content;
A microphone that receives a second sound including a starting word from a user and receives the first sound from the speaker; And
A controller that controls at least one of the tuner, the communication unit, the display, the microphone, and the speaker,
The controller,
When the volume level of the first sound is greater than a preset reference value, the size of the first gain is reduced, the size of the second gain is decreased, and the size of the third gain is increased,
When the volume level of the first sound is smaller than a preset reference value, the size of the first gain is increased, the size of the second gain is increased, and the size of the third gain is increased,
The first gain means the sum of the gain of the first sound and the gain of the second sound,
The second gain means the gain of the first sound,
The third gain means the sum of the first gain and the second gain that have performed acoustic echo cancellation,
Display device.
기동어를 인식하고, STT(Speech to text)를 수행하는 경우, 상기 제 1 게인을 감소시키고, 상기 제 2 게인을 감소시키고, 상기 제 3 게인을 증가시키는,
디스플레이 디바이스.The method of claim 1, wherein the controller
When recognizing a starting word and performing speech to text (STT), the first gain is reduced, the second gain is decreased, and the third gain is increased.
Display device.
기본 노이즈의 영향을 고려하여 STT를 수행할 수 있는 정도까지 제 3 게인을 증가시키는,
디스플레이 디바이스.The method of claim 2, wherein the controller
Considering the effect of the basic noise, increase the third gain to the extent that STT can be performed,
Display device.
사운드가 발생한 경우, 상기 사운드를 상기 마이크를 통하여 수신하고,
상기 마이크의 사운드 수신 방향을 상기 사운드가 발생한 방향으로 조정하는,
디스플레이 디바이스.The method of claim 1, wherein the controller
When sound is generated, the sound is received through the microphone,
Adjusting the sound reception direction of the microphone to the direction in which the sound occurred,
Display device.
상기 제 1 사운드의 볼륨 크기가 제 1 기준 볼륨보다 낮은 경우, 상기 제 1 사운드의 볼륨 구간을 기준 구간보다 좁게 나누고,
상기 제 1 사운드의 볼륨 크기가 제 2 기준 볼륨보다 큰 경우, 상기 제 1 사운드의 볼륨 구간을 기준 구간보다 넓게 나누는,
디스플레이 디바이스. The method of claim 1, wherein the controller
When the volume level of the first sound is lower than the first reference volume, the volume section of the first sound is divided more narrowly than the reference section,
When the volume level of the first sound is larger than the second reference volume, the volume section of the first sound is broadly divided than the reference section,
Display device.
상기 기동어를 인식한 경우, 사용자 음성의 볼륨 크기를 반영한 그래픽 이미지를 상기 디스플레이를 통하여, 디스플레이하도록 제어하는,
디스플레이 디바이스.The method of claim 1, wherein the controller
When the start word is recognized, a graphic image reflecting the volume of the user's voice is controlled to be displayed through the display,
Display device.
상기 기동어를 인식한 후에는, 상기 제 1 사운드의 볼륨 크기를 감소시키는 것을 나타내는 그래픽 이미지를 디스플레이하는,
디스플레이 디바이스.The method of claim 6, wherein the controller
After recognizing the spoken word, displaying a graphic image indicating that the volume of the first sound is reduced,
Display device.
상기 기동어를 인식하기 전에는, 상기 제 1 사운드에 대응하는 게인 테이블에 기초하여 상기 제 1 게인, 상기 제 2 게인 및 상기 제 3 게인을 조정하고,
상기 기동어를 인식한 후에는, 상기 제 1 사운드의 볼륨을 감소시킨 제 3 사운드에 대응하는 게인 테이블에 기초하여 상기 제 1 게인, 상기 제 2 게인, 상기 제 3 게인을 조정하되,
상기 게인 테이블은 제 1 사운드의 볼륨 크기에 각각 대응하는 상기 제 1 게인, 상기 제 2 게인, 상기 제 3 게인을 정리한 테이블을 의미하는,
디스플레이 디바이스.The method of claim 1, wherein the controller
Before recognizing the starting word, the first gain, the second gain, and the third gain are adjusted based on a gain table corresponding to the first sound,
After recognizing the starting word, the first gain, the second gain, and the third gain are adjusted based on a gain table corresponding to a third sound in which the volume of the first sound is reduced.
The gain table refers to a table in which the first gain, the second gain, and the third gain respectively correspond to the volume of the first sound,
Display device.
사용자가 기동어를 포함하는 음성을 발화하는 동안 상기 기동어를 인식하지 못한 경우, 현재 출력되는 사운드의 크기에 대응하는 게인 테이블을 기초로, 상기 제 1 게인, 상기 제 2 게인, 상기 제 3 게인을 조정하는,
디스플레이 디바이스.The method of claim 1, wherein the controller
When the user does not recognize the spoken word while uttering the voice including the spoken word, based on the gain table corresponding to the size of the sound currently output, the first gain, the second gain, and the third gain To adjust,
Display device.
상기 컨트롤러는
캡쳐된 상기 이미지가 사람 오브젝트를 포함하면, 상기 마이크의 사운드 수신 방향을 상기 사운드가 발생한 방향으로 조정하는,
디스플레이 디바이스. The method of claim 1, further comprising a camera for capturing the front image of the display device,
The controller
If the captured image includes a human object, adjusting the sound reception direction of the microphone to the direction in which the sound occurred,
Display device.
방송 신호를 방송국으로부터 튜너를 통하여 수신하는 단계;
상기 수신된 방송 신호에 포함된 컨텐트를 화면에 디스플레이하는 단계;
상기 컨텐트를 재생할 때 생성되는 제 1 사운드를 스피커를 통하여, 출력하는 단계;
기동어를 포함하는 제 2 사운드를 사용자로부터 수신하고, 상기 제 1 사운드를 상기 스피커로부터 상기 마이크를 통하여 수신하는 단계;
상기 제 1 사운드의 볼륨 크기가 기설정된 기준값보다 큰 경우, 상기 제 1 게인의 크기를 감소시키고, 상기 제 2 게인의 크기를 감소시키고, 상기 제 3 게인의 크기를 증가시키는 단계; 및
상기 제 1 사운드의 볼륨 크기가 기설정된 기준값보다 작은 경우, 상기 제 1 게인의 크기를 증가시키고, 상기 제 2 게인의 크기를 증가시키고, 상기 제 3 게인의 크기를 증가시키는 단계를 포함하되,
상기 제 1 게인은 상기 제 1 사운드의 게인과 상기 제 2 사운드의 게인의 합을 의미하고,
상기 제 2 게인은 상기 제 1 사운드의 게인을 의미하고,
상기 제 3 게인은 음향 에코 제거를 실행한 상기 제 1 게인과 상기 제 2 게인의 합을 의미하는,
디스플레이 디바이스의 제어 방법.In the control method of the display device,
Receiving a broadcast signal from a broadcasting station through a tuner;
Displaying content included in the received broadcast signal on a screen;
Outputting, through a speaker, a first sound generated when playing the content;
Receiving a second sound including a starting word from a user, and receiving the first sound from the speaker through the microphone;
If the volume of the first sound is larger than a preset reference value, reducing the size of the first gain, decreasing the size of the second gain, and increasing the size of the third gain; And
If the volume level of the first sound is smaller than a preset reference value, increasing the size of the first gain, increasing the size of the second gain, and increasing the size of the third gain,
The first gain means the sum of the gain of the first sound and the gain of the second sound,
The second gain means the gain of the first sound,
The third gain means the sum of the first gain and the second gain that have performed acoustic echo cancellation,
Method for controlling display device.
상기 기동어를 인식하고, STT(Speech to text)를 수행하는 경우, 상기 제 1 게인을 감소시키고, 상기 제 2 게인을 감소시키고, 상기 제 3 게인을 증가시키는 단계를 더 포함하는,
디스플레이 디바이스의 제어 방법. The method of claim 11,
Further comprising the step of recognizing the starting word and performing STT (Speech to text), reducing the first gain, decreasing the second gain, and increasing the third gain,
Method for controlling display device.
디스플레이 디바이스의 제어 방법. The method of claim 12, further comprising increasing the third gain to a degree capable of performing STT in consideration of the effect of the basic noise,
Method for controlling display device.
사운드가 발생한 경우, 상기 사운드를 상기 마이크를 통하여 수신하는 단계; 및
상기 마이크의 사운드 수신 방향을 상기 사운드가 발생한 방향으로 조정하는 단계를 더 포함하는,
디스플레이 디바이스의 제어 방법.The method of claim 11,
When sound is generated, receiving the sound through the microphone; And
Further comprising the step of adjusting the sound receiving direction of the microphone to the direction in which the sound occurred,
Method for controlling display device.
상기 제 1 사운드의 볼륨 크기가 제 1 기준 볼륨보다 낮은 경우, 상기 제 1 사운드의 볼륨 구간을 기준 구간보다 좁게 나누고 단계; 및
상기 제 1 사운드의 볼륨 크기가 제 2 기준 볼륨보다 큰 경우, 상기 제 1 사운드의 볼륨 구간을 기군 구간보다 넓게 나누는 단계를 더 포함하는,
디스플레이 디바이스의 제어 방법. The method of claim 11,
Dividing the volume section of the first sound narrower than the reference section when the volume level of the first sound is lower than the first reference volume; And
When the volume size of the first sound is greater than the second reference volume, further comprising dividing the volume section of the first sound wider than the base group section,
Method for controlling display device.
상기 기동어를 인식한 경우, 사용자 음성의 볼륨 크기를 반영한 그래픽 이미지를 상기 디스플레이를 통하여, 디스플레이하도록 제어하는 단계를 더 포함하는,
디스플레이 디바이스의 제어 방법.The method of claim 11,
Further comprising the step of controlling to display, through the display, a graphic image reflecting the volume of the user's voice when the start word is recognized,
Method for controlling display device.
상기 기동어를 인식한 후에는, 상기 제 1 사운드의 볼륨 크기를 감소시키는 것을 나타내는 그래픽 이미지를 디스플레이하는 단계를 더 포함하는,
디스플레이 디바이스의 제어 방법.The method of claim 16,
After recognizing the spoken word, further comprising displaying a graphic image indicating that the volume of the first sound is reduced,
Method for controlling display device.
상기 기동어를 인식하기 전에는, 상기 제 1 사운드에 대응하는 게인 테이블에 기초하여 상기 제 1 게인, 상기 제 2 게인 및 상기 제 3 게인을 조정하는 단계; 및
상기 기동어를 인식한 후에는, 상기 제 1 사운드의 볼륨을 감소시킨 제 3 사운드에 대응하는 게인 테이블에 기초하여 상기 제 1 게인, 상기 제 2 게인, 상기 제 3 게인을 조정하는 단계를 더 포함하되,
상기 게인 테이블은 제 1 사운드의 볼륨 크기에 각각 대응하는 상기 제 1 게인, 상기 제 2 게인, 상기 제 3 게인을 정리한 테이블을 의미하는,
디스플레이 디바이스의 제어 방법.The method of claim 11,
Adjusting the first gain, the second gain, and the third gain based on a gain table corresponding to the first sound before recognizing the starting word; And
After recognizing the maneuver, further comprising adjusting the first gain, the second gain, and the third gain based on a gain table corresponding to a third sound in which the volume of the first sound is reduced. Ha,
The gain table refers to a table in which the first gain, the second gain, and the third gain respectively correspond to the volume of the first sound,
Method for controlling display device.
사용자가 기동어를 포함하는 음성을 발화하는 동안 상기 기동어를 인식하지 못한 경우, 현재 출력되는 사운드의 크기에 대응하는 게인 테이블을 기초로, 상기 제 1 게인, 상기 제 2 게인, 상기 제 3 게인을 조정하는 단계를 더 포함하는,
디스플레이 디바이스의 제어 방법. The method of claim 11,
When the user does not recognize the spoken word while uttering the voice including the spoken word, based on the gain table corresponding to the size of the sound currently output, the first gain, the second gain, and the third gain Further comprising the step of adjusting,
Method for controlling display device.
상기 디스플레이 디바이스의 전방 이미지를 캡쳐하는 단계; 및
캡쳐된 상기 이미지가 사람 오브젝트를 포함하면, 상기 마이크의 사운드 수신 방향을 상기 사운드가 발생한 방향으로 조정하는 단계를 더 포함하는,
인 디스플레이 디바이스 제어 방법.
The method of claim 11,
Capturing a front image of the display device; And
If the captured image includes a human object, further comprising the step of adjusting the sound receiving direction of the microphone to the direction in which the sound occurred,
In-display device control method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180138955A KR20200055365A (en) | 2018-11-13 | 2018-11-13 | Display device, and controlling method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180138955A KR20200055365A (en) | 2018-11-13 | 2018-11-13 | Display device, and controlling method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200055365A true KR20200055365A (en) | 2020-05-21 |
Family
ID=70910504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180138955A KR20200055365A (en) | 2018-11-13 | 2018-11-13 | Display device, and controlling method thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20200055365A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102293476B1 (en) * | 2020-05-26 | 2021-08-26 | 엘지전자 주식회사 | Display device |
-
2018
- 2018-11-13 KR KR1020180138955A patent/KR20200055365A/en active Search and Examination
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102293476B1 (en) * | 2020-05-26 | 2021-08-26 | 엘지전자 주식회사 | Display device |
US11347473B2 (en) | 2020-05-26 | 2022-05-31 | Lg Electronics Inc. | Display device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102396034B1 (en) | Digital device and method for controlling the same | |
KR102288087B1 (en) | Multimedia device and method for controlling the same | |
KR102246556B1 (en) | Multimedia device and method for controlling the same | |
KR102355624B1 (en) | Mobile terminal and method for controlling the same | |
KR102413328B1 (en) | Main speaker, sub speaker and system comprising main speaker and sub speaker | |
KR102364674B1 (en) | Display device, and controlling method thereof | |
KR102393510B1 (en) | Display device and controlling method thereof | |
KR101632221B1 (en) | Digital device and method for processing service thereof | |
KR102381141B1 (en) | Display device and method for controlling the same | |
KR102367882B1 (en) | Digital device and method of processing application data thereof | |
KR102557574B1 (en) | Digital device and controlling method thereof | |
KR102238549B1 (en) | Digital device and method of processing a screen saver thereof | |
KR20170090102A (en) | Digital device and method for controlling the same | |
KR102396035B1 (en) | Digital device and method for processing stt thereof | |
KR20170087307A (en) | Display device and method for controlling the same | |
KR102384520B1 (en) | Display device and controlling method thereof | |
KR102356780B1 (en) | Display device and method for controlling the same | |
KR102311249B1 (en) | Display device and controlling method thereof | |
KR102603458B1 (en) | A digital device and method for controlling the same | |
KR20200055365A (en) | Display device, and controlling method thereof | |
KR20170126645A (en) | Digital device and controlling method thereof | |
KR20170138788A (en) | Digital device and controlling method thereof | |
KR20220003120A (en) | Display device and its control method | |
KR20170092408A (en) | Digital device and method for controlling the same | |
KR102439464B1 (en) | Digital device and method for controlling the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |