KR102429556B1 - 디스플레이 장치 및 음향 출력 방법 - Google Patents

디스플레이 장치 및 음향 출력 방법 Download PDF

Info

Publication number
KR102429556B1
KR102429556B1 KR1020170165665A KR20170165665A KR102429556B1 KR 102429556 B1 KR102429556 B1 KR 102429556B1 KR 1020170165665 A KR1020170165665 A KR 1020170165665A KR 20170165665 A KR20170165665 A KR 20170165665A KR 102429556 B1 KR102429556 B1 KR 102429556B1
Authority
KR
South Korea
Prior art keywords
sound
user input
parameter
acoustic
content
Prior art date
Application number
KR1020170165665A
Other languages
English (en)
Other versions
KR20190066175A (ko
Inventor
김기범
김선민
조재연
황인우
강기웅
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020170165665A priority Critical patent/KR102429556B1/ko
Priority to PCT/KR2018/013208 priority patent/WO2019112182A1/ko
Priority to CN201880086508.4A priority patent/CN111587578B/zh
Priority to US16/770,422 priority patent/US11494162B2/en
Priority to EP18886455.7A priority patent/EP3703383B1/en
Publication of KR20190066175A publication Critical patent/KR20190066175A/ko
Application granted granted Critical
Publication of KR102429556B1 publication Critical patent/KR102429556B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1601Constructional details related to the housing of computer displays, e.g. of CRT monitors, of flat displays
    • G06F1/1605Multimedia displays, e.g. with integrated or attached speakers, cameras, microphones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4852End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • H04N5/607Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for more than one sound signal, e.g. stereo, multilanguages

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Hardware Design (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

디스플레이 장치는 사용자 입력을 수신하는 사용자 입력부; 컨텐츠 소스로부터 컨텐츠 데이터를 수신하는 컨텐츠 수신부; 컨텐츠 데이터에 포함된 영상을 표시하는 표시부; 컨텐츠 데이터에 포함된 음향을 출력하는 음향부; 컨텐츠 데이터를 음향 데이터로 디코딩하고, 사용자 입력을 기초로 음향 파라미터에 관한 강화 학습의 결과에 따라 음향 파라미터를 설정하고, 설정된 음향 파라미터에 따라 음향 데이터를 음향 신호로 변환하고, 음향 신호에 대응하는 음향을 출력하도록 음향부를 제어하는 프로세서를 포함할 수 있다.

Description

디스플레이 장치 및 음향 출력 방법{DISPLAY APPARATUS AND AUDIO OUTPUTTING METHOD}
개시된 발명은 디스플레이 장치 및 음향 출력 방법에 관한 것으로, 더욱 상세하게는 사용자 입력 및 컨텐츠의 음향 특성에 따라 음향 출력을 제어하는 디스플레이 장치 및 음향 출력 방법에 관하 발명이다.
일반적으로, 디스플레이 장치는 수신되거나 또는 저장된 영상 정보를 사용자에게 시각적으로 표시하는 출력 장치이며, 가정이나 사업장 등 다양한 분야에서 이용되고 있다. 예를 들어, 디스플레이 장치로는 개인용 컴퓨터 또는 서버용 컴퓨터 등에 연결된 모니터 장치나, 휴대용 컴퓨터 장치나, 내비게이션 단말 장치나, 일반 텔레비전 장치나, 인터넷 프로토콜 텔레비전(IPTV, Internet Protocol television) 장치나, 스마트 폰, 태블릿 피씨, 개인용 디지털 보조 장치(PDA, Personal Digital Assistant), 또는 셀룰러 폰 등의 휴대용 단말 장치나, 산업 현장에서 광고나 영화 같은 화상을 재생하기 위해 이용되는 각종 디스플레이 장치나, 또는 이외 다양한 종류의 오디오/비디오 시스템 등이 있다.
디스플레이 장치는 또한 방송국, 인터넷 서버, 영상 재생 장치, 게임 장치 및/또는 휴대용 단말기 등 다양한 컨텐츠 소스로부터 컨텐츠를 수신할 수 있다. 또한, 디스플레이 장치는 컨텐츠로부터 영상과 음향을 복원(또는 디코딩)하고, 복원된 영상과 음향을 출력할 수 있다.
최근에는, 디스플레이 장치의 영상 처리 뿐만 아니라 음향 처리에 관한 연구가 활발히 진행되고 있으며, 사용자의 취향 및 컨텐츠의 음향 특성에 따른 맞춤형(적응형) 음향 처리 기술이 개발되고 있다.
개시된 발명의 일 측면은 사용자의 취향 및 컨텐츠의 음향 특성에 따라 음향 출력을 제어할 수 있는 디스플레이 장치 및 음향 출력 방법을 제공하고자 한다.
개시된 발명의 일 측면은 강화 학습을 이용한 음향 처리가 가능한 디스플레이 장치 및 음향 출력 방법을 제공하고자 한다.
개시된 발명의 일 측면은 음향에 관한 사용자 입력 없이 자동으로 음향 볼륨 및 음향 모드를 조절할 수 있는 디스플레이 장치 및 음향 출력 방법을 제공하고자 한다.
개시된 발병의 일 측면에 의한 디스플레이 장치는 사용자 입력을 수신하는 사용자 입력부; 컨텐츠 소스로부터 컨텐츠 데이터를 수신하는 컨텐츠 수신부; 상기 컨텐츠 데이터에 포함된 영상을 표시하는 표시부; 상기 컨텐츠 데이터에 포함된 음향을 출력하는 음향부; 상기 컨텐츠 데이터를 음향 데이터로 디코딩하고, 상기 사용자 입력을 기초로 음향 파라미터에 관한 강화 학습의 결과에 따라 상기 음향 파라미터를 설정하고, 상기 설정된 음향 파라미터에 따라 상기 음향 데이터를 음향 신호로 변환하고, 상기 음향 신호에 대응하는 음향을 출력하도록 상기 음향부를 제어하는 프로세서를 포함할 수 있다.
상기 프로세서는 환경 정보를 기초로 상기 음향 파라미터를 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 파라미터를 변경할 수 있다.
상기 음향을 출력한 이후 음향에 관한 사용자 입력이 입력되면 상기 프로세서는 상기 사용자 입력에 의하여 획득된 제1 보상을 처리하고, 상기 음향을 출력한 이후 미리 정해진 시간 동안 상기 음향에 관한 사용자 입력이 입력되지 아니하면 상기 프로세서는 상기 사용자 입력에 의하여 획득된 제2 보상을 처리할 수 있다. 또한, 상기 제2 보상은 상기 제1 보상보다 클 수 있다.
상기 프로세서는 상기 강화 학습을 이용하여 상기 음향 파라미터의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 음향 파라미터를 변경할 수 있다.
상기 프로세서는 상기 사용자 입력부를 통하여 사용자 입력이 입력된 직후 상기 음향 파라미터를 변경할 수 있다.
상기 프로세서는 상기 디스플레이 장치가 턴온된 직후 상기 음향 파라미터를 변경할 수 있다.
상기 음향 파라미터는 음향 볼륨 값을 포함할 수 있다. 또한, 상기 프로세서는 상기 컨텐츠의 음향 특성을 기초로 상기 음향 볼륨 값을 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 볼륨 값을 변경할 수 있다.
상기 프로세서는 상기 강화 학습을 이용하여 상기 음향 볼륨 값의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 음향 볼륨 값을 변경할 수 있다.
상기 음향 파라미터는 음향 렌더링을 위한 보이스의 증폭률과 배경음의 증폭률을 포함할 수 있다. 또한, 상기 프로세서는 상기 컨텐츠의 음향 특성을 기초로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경할 수 있다.
상기 프로세서는 상기 강화 학습을 이용하여 상기 보이스의 증폭률의 변경과 상기 배경음의 증폭률의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경할 수 있다.
개시된 발병의 일 측면에 의한 음향 출력 방법은 컨텐츠 소스로부터 컨텐츠를 수신하고; 상기 컨텐츠를 디코딩하여 음향 데이터를 생성하고; 음향 파라미터를 설정하고; 사용자 입력을 기초로 상기 음향 파라미터에 관한 강화 학습의 결과에 따라 상기 음향 파라미터를 변경하고; 상기 변경된 음향 파라미터에 따라 상기 음향 데이터를 음향 신호로 변환하고; 상기 음향 신호에 대응하는 음향을 출력하는 것을 포함할 수 있다.
상기 음향 파라미터를 변경하는 것은, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 파라미터를 변경하는 것을 포함할 수 있다.
상기 보상은 상기 음향을 출력한 이후 음향에 관한 사용자 입력이 입력되면 획득되는 제1 보상과 상기 음향을 출력한 이후 미리 정해진 시간 동안 상기 음향에 관한 사용자 입력이 입력되지 아니하면 획득되는 제2 보상을 포함할 수 있다. 또한, 상기 제2 보상은 상기 제1 보상보다 클 수 있다.
상기 음향 파라미터를 변경하는 것은, 상기 강화 학습을 이용하여 상기 음향 파라미터의 변경에 의한 보상을 예측하고; 상기 예측된 보상이 최대가 되는 값으로 상기 음향 파라미터를 변경하는 것을 포함할 수 있다.
상기 음향 파라미터를 변경하는 것은, 상기 사용자 입력이 입력된 직후 상기 음향 파라미터를 변경하는 것을 포함할 수 있다.
상기 음향 파라미터를 변경하는 것은, 디스플레이 장치가 턴온된 직후 상기 음향 파라미터를 변경하는 것을 포함할 수 있다.
상기 음향 파라미터는 음향 볼륨 값을 포함할 수 있다. 또한, 상기 음향 파라미터를 설정하는 것은 상기 컨텐츠의 음향 특성을 기초로 상기 음향 볼륨 값을 설정하는 것을 포함하고, 상기 음향 파라미터를 변경하는 것은 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 볼륨 값을 변경하는 것을 포함할 수 있다.
상기 음향 파라미터를 변경하는 것은, 상기 강화 학습을 이용하여 상기 음향 볼륨 값의 변경에 의한 보상을 예측하고; 상기 예측된 보상이 최대가 되는 값으로 상기 음향 볼륨 값을 변경하는 것을 포함할 수 있다.
상기 음향 파라미터는 음향 렌더링을 위한 보이스의 증폭률과 배경음의 증폭률을 포함할 수 있다. 또한, 상기 음향 파라미터를 설정하는 것은 상기 컨텐츠의 음향 특성을 기초로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 설정하는 것을 포함하고, 상기 음향 파라미터를 변경하는 것은 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 것을 포함할 수 있다.
상기 음향 파라미터를 변경하는 것은, 상기 강화 학습을 이용하여 상기 보이스의 증폭률의 변경과 상기 배경음의 증폭률의 변경에 의한 보상을 예측하고; 상기 예측된 보상이 최대가 되는 값으로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 것을 포함할 수 있다.
개시된 발명의 일 측면에 따르면, 사용자의 취향 및 컨텐츠의 음향 특성에 따라 음향 출력을 제어할 수 있는 디스플레이 장치 및 음향 출력 방법을 제공할 수 있다.
개시된 발명의 일 측면에 따르면, 강화 학습을 이용한 음향 처리가 가능한 디스플레이 장치 및 음향 출력 방법을 제공할 수 있다.
개시된 발명의 일 측면에 따르면, 음향에 관한 사용자 입력 없이 자동으로 음향 볼륨 및 음향 모드를 조절할 수 있는 디스플레이 장치 및 음향 출력 방법을 제공할 수 있다.
도 1은 일 실시예에 의한 디스플레이 장치의 외관을 도시한다.
도 2는 일 실시예에 의한 디스플레이 장치의 구성을 도시한다.
도 3은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 일 예를 도시한다.
도 4 및 도 5는 강화 학습을 설명하기 위한 도면이다.
도 6, 도 7 및 도 8는 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.
도 9는 일 실시예에 의한 디스플레이 장치의 음향 처리 방법을 도시한다.
도 10은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 다른 일 예를 도시한다.
도 11은 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.
도 12은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 다른 일 예를 도시한다.
도 13는 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.
명세서 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 명세서가 실시예들의 모든 요소들을 설명하는 것은 아니며, 본 발명이 속하는 기술분야에서 일반적인 내용 또는 실시예들 간에 중복되는 내용은 생략한다. 명세서에서 사용되는 '부, 모듈, 부재, 블록'이라는 용어는 소프트웨어 또는 하드웨어로 구현될 수 있으며, 실시예들에 따라 복수의 '부, 모듈, 부재, 블록'이 하나의 구성요소로 구현되거나, 하나의 '부, 모듈, 부재, 블록'이 복수의 구성요소들을 포함하는 것도 가능하다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 간접적으로 연결되어 있는 경우를 포함하고, 간접적인 연결은 무선 통신망을 통해 연결되는 것을 포함한다.
또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
명세서 전체에서, 어떤 부재가 다른 부재 "상에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.
제 1, 제 2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 전술된 용어들에 의해 제한되는 것은 아니다.
단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함한다.
각 단계들에 있어 식별부호는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다.
이하 첨부된 도면들을 참고하여 본 발명의 작용 원리 및 실시예들에 대해 설명한다.
도 1은 일 실시예에 의한 디스플레이 장치의 외관을 도시한다.
디스플레이 장치(100)는 외부로부터 수신되는 영상 신호를 처리하고, 처리된 영상을 시각적으로 표시할 수 있는 장치이다. 예를 들어, 디스플레이 장치(100)는 텔레비전(Television, TV), 모니터(Monitor), 휴대용 멀티미디어 장치, 휴대용 통신장치, 휴대용 연산장치 등 다양한 제품 형태로 구현할 수 있으며, 디스플레이 장치(100)는 영상 신호를 시각적으로 재현(reproduce)하고 음향 신호를 청각적으로 재현하는 장치라면 그 형태가 한정되지 않는다.
뿐만 아니라, 디스플레이 장치(100)는 건물 옥상이나 버스 정류장과 같은 옥외에 설치되는 대형 디스플레이 장치(Large Format Display, LFD)일 수 있다. 여기서, 옥외는 반드시 야외로 한정되는 것은 아니며, 지하철역, 쇼핑몰, 영화관, 회사, 상점 등 실내이더라도 다수의 사람들이 드나들 수 있는 곳이면 일 실시예에 따른 디스플레이 장치(100)가 설치될 수 있다.
디스플레이 장치(100)는 다양한 컨텐츠 소스들로부터 비디오와 오디오를 포함하는 컨텐츠를 수신하고, 컨텐츠에 포함된 비디오와 오디오를 출력할 수 있다. 예를 들어, 디스플레이 장치(100)는 방송 수신 안테나 또는 유선 케이블을 통하여 텔레비전 방송 컨텐츠를 수신하거나, 컨텐츠 재생 장치로부터 멀티미디어 케이블을 통하여 멀티미디어 컨텐츠를 수신하거나, 컨텐츠 스트리밍 서버로부터 통신망을 스트리밍 컨텐츠를 수신할 수 있다.
디스플레이 장치(100)는 강화 학습을 이용하여 사용자의 취향에 맞춘 음향 처리를 학습하고, 학습 결과를 기초로 음향 데이터를 처리할 수 있다. 예를 들어, 디스플레이 장치(100)는 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 시청 시간 등의 환경 정보와 사용자 입력을 기반으로 음향 처리를 학습하고, 변화하는 환경 정보에 대응하여 사용자의 취향에 맞춘 음향을 제공할 수 있다. 디스플레이 장치(100)는 최종적으로 사용자가 음향에 관한 입력 없이 컨텐츠를 시청할 수 있도록 하고자 한다.
도 1에 도시된 바와 같이, 디스플레이 장치(100)는 영상을 표시하기 위한 복수의 부품들을 수용하는 본체(101)와, 본체(101)의 일측에 마련되어 영상(I)을 표시하는 스트린(102)을 포함할 수 있다.
본체(101)는 디스플레이 장치(100)의 외형을 형성하며, 본체(101)의 내부에는 디스플레이 장치(100)가 영상(I)과 음향(A)을 출력 위한 부품이 마련될 수 있다. 도 1에 도시된 본체(101)는 평평한 판 형상이나, 본체(101)의 형상이 도 1에 도시된 바에 한정되는 것은 아니며, 본체(101)는 예를 들어 좌우 양단이 전방으로 돌출되고 중심부가 오목하도록 휘어진 형상일 수 있다.
스트린(102)은 본체(101)의 전면에 형성되며, 스트린(102)에는 시각 정보인 영상(I)이 표시될 수 있다. 예를 들어, 스트린(102)에는 정지 영상 또는 동영상을 표시될 수 있으며, 2차원 평면 영상 또는 3차원 입체 영상이 표시될 수 있다.
스트린(102)에는 복수의 픽셀(P)가 형성되며, 스트린(102)에 표시되는 영상(I)은 복수의 픽셀(P)로부터 출사된 광의 조합에 의하여 형성될 수 있다. 예를 들어, 복수의 픽셀(P)가 방출하는 광이 모자이크(mosaic)와 같이 조합됨으로써 스트린(102) 상에 하나의 영상(I)이 형성될 수 있다.
복수의 픽셀(P) 각각은 다양한 밝기 및 다양한 색상의 광을 방출할 수 있다.
다양한 밝기의 광을 방출하기 위하여, 복수의 픽셀(P) 각각은 직접 광을 방출할 수 있는 구성(예를 들어, 유기 발광 다이오드)을 포함하거나 백 라이트 유닛 등에 의하여 방출된 광을 투과하거나 차단할 수 있는 구성(예를 들어, 액정 패널)을 포함할 수 있다.
다양한 색상의 광을 방출하기 위하여, 복수의 픽셀(P) 각각은 서브 픽셀들(PR, PG, PB)을 포함할 수 있다. 서브 픽셀들(PR, PG, PB)은 적색 광을 방출할 수 있는 적색 서브 픽셀(PR)과, 녹색 광을 방출할 수 있는 녹색 서브 픽셀(PG)과, 청색 광을 방출할 수 있는 청색 서브 픽셀(PB)을 포함할 수 있다. 예를 들어, 적색 서브 픽셀(PR)은 파장이 대략 620nm (nanometer, 10억분의 1미터)에서 750nm까지의 적색 광을 방출할 수 있고, 녹색 서브 픽셀(PG)은 파장이 대략 495nm에서 570nm까지의 녹색 광을 방출할 수 있으며, 청색 서브 픽셀(PB)은 파장이 대략 450nm에서 495nm까지의 청색 광을 방출할 수 있다.
적색 서브 픽셀(PR)의 적색 광, 녹색 서브 픽셀(PG)의 녹색 광 및 청색 서브 픽셀(PB)의 청색 광의 조합에 의하여, 복수의 픽셀(P) 각각은 다양한 밝기와 다양한 색상의 광을 출사할 수 있다.
도 1에 도시된 스트린(102)은 평평한 판 형상이나, 스트린(102)의 형상이 도 1에 도시된 바에 한정되는 것은 아니며, 스트린(102)은 예를 들어 좌우 양단이 전방으로 돌출되고 중심부가 오목하도록 휘어진 형상일 수 있다.
또한, 본체(101)의 후면 또는 측면에는 음향(A)을 출력할 수 있는 스피커가 마련될 수 있다. 스피커는 디스플레이 장치(100)가 컨텐츠 소스로부터 수신된 컨텐츠에 포함된 음향(A)을 출력할 수 있다.
도 2는 일 실시예에 의한 디스플레이 장치의 구성을 도시한다.
디스플레이 장치(100)는 사용자로부터 사용자 입력을 수신하는 사용자 입력부(110)와, 컨텐츠 소스로부터 비디오/오디오 컨텐츠를 수신하는 컨텐츠 수신부(120)와, 컨텐츠 소스와 통신하는 통신부(130)와, 컨텐츠 수신부(120) 및/또는 통신부(130)에 의하여 수신된 비디오/오디오 컨텐츠를 처리하는 제어부(140)와, 제어부(140)에 의하여 처리된 영상을 표시하는 표시부(150)와, 제어부(140)에 의하여 처리된 음향을 출력하는 음향부(160)를 포함한다.
사용자 입력부(110)는 사용자 입력을 수신하는 입력 버튼(111)을 포함할 수 있다. 예를 들어, 사용자 입력부(110)는 디스플레이 장치(100)를 턴온 또는 턴오프시키기 위한 전원 버튼, 디스플레이 장치(100)에 표시되는 방송 컨텐츠를 선택하기 위한 채널 선택 버튼, 디스플레이 장치(100)가 출력하는 음향 볼륨을 조절하기 위한 음향 조절 버튼, 컨텐츠 소스를 선택하기 위한 소스 선택 버튼 등을 포함할 수 있다.
입력 버튼(111)은 각각 사용자 입력을 수신하고 사용자 입력에 대응하는 전기적 신호를 제어부(140)로 출력할 수 있으며, 푸시 스위치, 터치 스위치, 다이얼, 슬라이드 스위치, 토글 스위치 등 다양한 입력 수단에 의하여 구현될 수 있다.
사용자 입력부(110)는 또한 리모트 컨트롤러(112a)의 원격 제어 신호를 수신하는 신호 수신기(112)를 포함한다. 사용자 입력을 수신하는 리모트 컨트롤러(112a)는 디스플레이 장치(100)와 분리되어 마련될 수 있으며, 사용자 입력을 수신하고, 사용자 입력에 대응하는 무선 신호를 디스플레이 장치(100)로 전송할 수 있다. 신호 수신기(112)는 리모트 컨트롤러(112a)로부터 사용자 입력에 대응하는 무선 신호를 수신하고, 사용자 입력에 대응하는 전기적 신호를 제어부(140)로 출력할 수 있다.
컨텐츠 수신부(120)는 컨텐츠 소스로부터 영상 데이터와 음향 데이터를 포함하는 비디오/오디오 컨텐츠를 수신하는 수신 단자(121)와, 텔레비전 방송 컨텐츠를 포함하는 방송 신호를 수신하고 수신된 방송 신호를 튜닝하는 튜너(122)를 포함할 수 있다.
수신 단자(121)는 케이블을 통하여 컨텐츠 소스와 연결될 수 있으며, 컨텐츠 소스로부터 영상 데이터와 음향 데이터를 포함하는 비디오/오디오 컨텐츠를 수신할 수 있다. 비디오/오디오 컨텐츠는 데이터 스트림의 형태로 수신되며, 비디오/오디오 컨텐츠의 데이터 스트림(이하에서 '컨텐츠 데이터'이라 한다)은 영상 데이터와 음향 데이터가 인코딩되어 생성될 수 있다.
수신 단자(121)는 아날로그 영상 프레임 데이터를 수신하는 컴포넌트(component, YPbPr/RGB) 단자와 컴포지트 (composite video blanking and sync, CVBS) 단자를 포함할 수 있다. 수신 단자(121)는 디지털 영상 프레임 데이터를 수신하는 고화질 멀티미디어 인터페이스 (High Definition Multimedia Interface, HDMI) 단자를 포함할 수 있다. 수신 단자(121)는 또한 외부 저장 매체(예를 들어, USB 드라이브)로부터 영상 데이터를 수신하는 범용 직렬 버스(Universal Serial Bus, USB) 단자를 포함할 수 있다.
튜너(122)는 방송 수신 안테나 또는 유선 케이블로부터 방송 신호를 수신하고, 방송 신호 중에 사용자에 의하여 선택된 채널의 방송 신호를 추출할 수 있다. 예를 들어, 튜너(122)는 방송 수신 안테나(2)를 통하여 수신된 여러 주파수의 텔레비전 방송 신호 중에 사용자에 의하여 선택된 채널에 해당하는 주파수를 가지는 텔레비전 방송 신호를 통과시키고, 다른 주파수를 가지는 텔레비전 방송 신호를 차단할 수 있다. 텔레비전 방송 신호는 컨텐츠의 데이터 스트림이 변조되어 생성될 수 있으며, 디스플레이 장치(100)는 텔레비전 방송 신호를 복조하여 컨텐츠 데이터를 생성할 수 있다.
이처럼, 컨텐츠 수신부(120)는 컨텐츠 소스로부터 비디오/오디오 컨텐츠를 수신할 수 있으며, 비디오/오디오 컨텐츠를 제어부(140)로 출력할 수 있다.
통신부(130)는 통신망을 통하여 컨텐츠 소스 및/또는 외부 장치와 데이터를 주고받을 수 있다. 예를 들어, 통신부(130)는 컨텐츠 소스로부터 비디오/오디오 컨텐츠를 수신하거나, 외부 장치로부터 비디오/오디오 컨텐츠에 관한 정보를 수신할 수 있다. 비디오/오디오 컨텐츠에 관한 정보는 컨텐츠 자체에 관한 정보로서 컨텐츠의 제목, 컨텐츠의 타입, 컨텐츠의 장르 등을 포함할 수 있다.
이때, 통신망은 유무선 통신망을 모두 포함할 수 있다. 유선 통신망은 케이블망이나 전화망 등의 통신망을 포함하며, 무선 통신망은 전파를 통하여 신호를 송수신하는 통신망을 포함할 수 있다. 무선 통신망은 또한 액세스 포인트(Access Point, AP)를 포함할 수 있으며, 액세스 포인트는 무선으로 영상 처리 장치(100)와 연결되고 유선으로 유선 통신망에 접속될 수 있다.
통신부(130)는 컨텐츠 소스 및/또는 외부 장치와 유선으로 데이터를 주고받는 유선 통신 모듈(131)과, 컨텐츠 소스 및/또는 외부 장치와 무선으로 데이터를 주고받는 무선 통신 모듈(132)을 포함할 수 있다.
유선 통신 모듈(131)은 유선 통신망에 접속하고 유선 통신망을 통하여 컨텐츠 소스와 통신할 수 있다. 예를 들어, 유선 통신 모듈(131)은 이더넷(Ethernet, IEEE 802.3 기술 표준)을 통하여 유선 통신망에 접속하고, 유선 통신망을 통하여 컨텐츠 소스 및/또는 외부 장치로부터 데이터를 수신할 수 있다.
무선 통신 모듈(132)은 기지국(base station) 또는 액세스 포인트(AP)와 무선으로 통신할 수 있으며, 기지국 또는 액세스 포인트를 통하여 유선 통신망에 접속할 수 있다. 무선 통신 모듈(132)은 또한 기지국 또는 액세스 포인트를 거쳐 유선 통신망에 접속된 컨텐츠 소스 및/또는 외부 장치와 통신할 수 있다. 예를 들어, 무선 통신 모듈(132)은 와이파이(WiFi™, IEEE 802.11 기술 표준)을 이용하여 액세스 포인트(AP)와 무선으로 통신하거나, CDMA, WCDMA, GSM, LET(Long Term Evolution), 와이브로 등을 이용하여 기지국과 통신할 수 있다. 무선 통신 모듈(132)은 또한 기지국 또는 액세스 포인트를 거쳐 컨텐츠 소스 및/또는 외부 장치로부터 데이터를 수신할 수 있다.
뿐만 아니라, 무선 통신 모듈(132)은 컨텐츠 소스 및/또는 외부 장치와 무선으로 직접 통신할 수 있다. 예를 들어, 무선 통신 모듈(132)은 와이파이, 블루투스 (Bluetooth™, IEEE 802.15.1 기술 표준), 지그비(ZigBee™, IEEE 802.15.4 기술 표준) 등을 이용하여 컨텐츠 소스 및/또는 외부 장치로부터 무선으로 데이터를 수신할 수 있다.
이처럼, 통신부(130)는 유선 통신 모듈(131) 및/또는 무선 통신 모듈(132)을 통하여 컨텐츠 소스 및/또는 외부 장치로부터 비디오/오디오 컨텐츠 및/또는 비디오/오디오 컨텐츠에 관한 정보를 수신할 수 있으며, 유선 통신 모듈(131) 및/또는 무선 통신 모듈(132)를 통하여 수신된 비디오/오디오 컨텐츠 및/또는 비디오/오디오 컨텐츠에 관한 정보를 제어부(140)로 출력할 수 있다.
제어부(140)는 사용자 입력부(110)를 통하여 수신된 사용자 입력에 따라 컨텐츠 수신부(120), 통신부(130), 표시부(150) 및/또는 음향부(160)를 제어할 수 있다. 예를 들어, 컨텐츠 소스의 선택을 위한 사용자 입력이 수신되면 제어부(140)는 선택된 컨텐츠 소스로부터 컨텐츠 데이터를 수신하도록 컨텐츠 수신부(120) 및/또는 통신부(130)를 제어할 수 있다. 또한, 영상 조절 및/또는 음향 조절을 위한 사용자 입력이 수신되면 제어부(140)는 영상 및/또는 음향을 조절하기 위하여 표시부(150) 및/또는 음향부(160)를 제어할 수 있다.
제어부(140)는 컨텐츠 수신부(120) 및/또는 통신부(130)에 의하여 수신된 영상 데이터 및/또는 음향 데이터를 처리할 수 있다. 예를 들어, 제어부(140)는 컨텐츠 데이터를 디코딩하여 영상 데이터를 복원할 수 있으며, 복원된 영상 데이터를 표시부(150)로 출력할 수 있다. 또한, 제어부(140)는 컨텐츠 데이터를 디코딩하여 음향 데이터를 복원할 수 있으며, 음향 데이터를 처리하여 아날로그 음향 신호(이하 '음향 신호'라 한다)를 생성할 수 있다.
특히, 제어부(140)는 강화 학습을 이용하여 음향 데이터를 처리할 수 있다. 예를 들어, 제어부(140)는 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 시청 시간 등의 환경 정보와 사용자 입력을 기반으로 음향 데이터의 처리를 학습하고, 학습 결과에 따라 음향 데이터를 처리할 수 있다.
이러한 제어부(140)는 마이크로 프로세서(141)와, 메모리(142)를 포함할 수 있다.
메모리(142)는 디스플레이 장치(100)에 포함된 구성들을 제어하기 위한 프로그램 및 데이터를 저장하고, 디스플레이 장치(100)에 포함된 구성들을 제어하는 중에 발행하는 제어 데이터를 임시로 기억할 수 있다.
또한, 메모리(142)는 컨텐츠 수신부(120) 및/또는 통신부(130)에 의하여 수신된 컨텐츠 데이터를 디코딩하기 위한 프로그램 및 데이터를 저장하고, 컨텐츠 데이터를 디코딩하는 중에 발행하는 영상 데이터 및/또는 음향 데이터를 임시로 기억할 수 있다.
이러한 메모리(142)는 데이터를 장기간 저장하기 위한 롬(Read Only Memory), 플래시 메모리 등의 비휘발성 메모리와, 데이터를 일시적으로 기억하기 위한 S-램(Static Random Access Memory, S-RAM), D-램(Dynamic Random Access Memory) 등의 휘발성 메모리를 포함할 수 있다.
마이크로 프로세서(141)는 사용자 입력부(110)로부터 사용자 입력을 수신할 수 있다. 마이크로 프로세서(231)는 사용자 입력에 따라 컨텐츠 수신부(120), 통신부(130), 표시부(150) 및/또는 음향부(160)를 제어하기 위한 제어 신호를 생성할 수 있다.
마이크로 프로세서(141)는 컨텐츠 수신부(120) 및/또는 통신부(130)로부터 컨텐츠 데이터를 수신할 수 있다. 마이크로 프로세서(141)는 메모리(142)에 저장된 프로그램 및 데이터에 따라 컨텐츠 데이터를 디코딩하고, 영상 데이터와 음향 데이터를 복원할 수 있다.
또한, 마이크로 프로세서(141)는 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 시청 시간 등의 환경 정보와 사용자 입력을 기반으로 음향 데이터의 처리를 학습하고, 학습 결과에 따라 음향 데이터를 처리하여 아날로그 음향 신호를 생성할 수 있다.
이러한 마이크로 프로세서(231)는 논리 연산 및 산술 연산 등을 수행하는 연산 회로와, 연산된 데이터를 기억하는 기억 회로 등을 포함할 수 있다.
표시부(150)는 영상을 시각적으로 표시하는 디스플레이 패널(152)과, 디스플레이 패널(152)을 구동하는 디스플레이 드라이버(151)를 포함한다.
디스플레이 패널(152)은 영상을 표시하는 단위가 되는 픽셀을 포함할 수 있다. 각각의 픽셀은 디스플레이 드라이버(151)로부터 영상을 나타내는 전기적 신호를 수신하고, 수신된 전기적 신호에 대응하는 광학 신호를 출력할 수 있다. 이처럼, 복수의 픽셀이 출력하는 광학 신호가 조합됨으로써 하나의 영상이 디스플레이 패널(152)에 표시될 수 있다.
예를 들어, 디스플레이 패널(152)에는 복수의 픽셀들이 마련되며, 디스플레이 패널(152)에 표시되는 영상은 복수의 픽셀들로부터 방출된 광의 조합에 의하여 형성될 수 있다. 예를 들어, 복수의 픽셀들이 방출하는 광이 모자이크(mosaic)와 같이 조합됨으로써 디스플레이 패널(152) 상에 하나의 영상이 형성될 수 있다. 앞서 설명된 바와 같이, 복수의 픽셀들 각각은 다양한 밝기 및 다양한 색상의 광을 방출할 수 있으며, 다양한 색상의 광을 방출하기 위하여 복수의 픽셀들 각각은 적색 서브 픽셀, 녹색 서브 픽셀 및 청색 서브 픽셀을 포함할 수 있다.
디스플레이 패널(152)은 액정 디스플레이 패널(Liquid Crystal Display Panel, LCD Panel), 발광 다이오드 패널(Light Emitting Diode Panel, LED Panel) 또는 유기 발광 다이오드 패널(Organic Light Emitting Diode Panel, OLED Panel)을 등 다양한 타입의 패널에 의하여 구현될 수 있다.
디스플레이 드라이버(151)는 제어부(140)로부터 영상 데이터를 수신하고, 수신된 영상 데이터에 대응하는 영상을 표시하도록 디스플레이 패널(152)을 구동할 수 있다. 구체적으로, 디스플레이 드라이버(151)는 디스플레이 패널(152)을 구성하는 복수의 픽셀 각각에 영상 데이터에 대응하는 전기적 신호를 전달할 수 있다.
디스플레이 드라이버(151)가 디스플레이 패널(152)을 구성하는 각각의 픽셀에 영상 데이터에 대응하는 전기적 신호를 전달하면 각각의 픽셀은 수신된 전기적 신호에 대응하는 광을 출력하고, 각각의 픽셀이 출력하는 광들이 조합되어 하나의 영상을 형성할 수 있다.
음향부(160)는 음향을 증폭하는 오디오 앰프(161)와, 증폭된 음향을 청각적으로 출력하는 스피커(162)와, 주변의 음향을 수집하는 마이크(163)를 포함한다.
제어부(140)는 음향 데이터를 처리하여 음향 신호로 변환할 수 있으며, 오디오 앰프(161)는 제어부(140)로부터 출력된 음향 신호를 증폭할 수 있다.
스피커(162)는 오디오 앰프(161)에 의하여 증폭된 음향 신호를 음향(음파)으로 변환할 수 있다. 예를 들어, 스피커(162)는 전기적 음향 신호에 따라 진동하는 박막을 포함할 수 있으며, 박막의 진동에 의하여 음파가 생성될 수 있다.
마이크(163)는 디스플레이 장치(100)의 주변 음향을 수집하고, 수집된 음향을 전기적 음향 신호로 변환할 수 있다. 마이크(163)에 의하여 수집된 음향 신호는 제어부(140)로 출력될 수 있다.
이상에서 설명된 바와 같이, 디스플레이 장치(100)는 다양한 컨텐츠 소스들로부터 비디오와 오디오를 포함하는 컨텐츠를 수신하고, 컨텐츠에 포함된 비디오와 오디오를 출력할 수 있다. 또한, 디스플레이 장치(100)는 강화 학습을 이용하여 사용자의 취향에 맞춘 음향 처리를 학습하고, 학습 결과를 기초로 음향 데이터를 처리할 수 있다.
이하에서는 강화 학습을 이용하여 디스플레이 장치(100)의 음향 처리가 설명된다.
도 3은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 일 예를 도시한다. 도 4 및 도 5는 강화 학습을 설명하기 위한 도면이다. 도 6, 도 7 및 도 8은 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.
도 3, 도 4, 도 5, 도 6, 도 7 및 도 8을 참조하면, 제어부(140)는 사용자 입력부(110)로부터 사용자 입력을 수신하고 컨텐츠 수신부(120)로부터 컨텐츠 데이터를 수신할 수 있다. 제어부(140)는 강화 학습을 이용하여 컨텐츠 데이터를 처리하고 음향 신호를 생성할 수 있다. 또한, 제어부(140)는 컨텐츠 데이터로부터 생성된 음향 신호를 음향부(160)로 출력할 수 있다.
제어부(140)는 디코더(210)와, 데이터 수집부(220)와, 음향 파라미터 설정부(230)와, 음향 파라미터 학습부(240)와, 음향 처리부(250)를 포함한다. 디코더(210)와, 데이터 수집부(220)와, 음향 파라미터 설정부(230)와, 음향 파라미터 학습부(240)와, 음향 처리부(250)는 각각 메모리(142)에 저장되고 마이크로 프로세서(141)에 의하여 실행되는 어플리케이션(소프트웨어)로 구현되거나, 마이크로 프로세서(141) 내부에 실장된 디지털 회로(하드웨어)로 구현될 수 있다.
디코더(210)는 컨텐츠 데이터를 디코딩하여 영상 데이터와 음향 데이터를 복원할 수 있다. 컨텐츠 데이터는 다양한 압축/인코딩 표준에 의하여 압축/인코딩될 수 있다. 예를 들어, 컨텐츠 데이터 중 영상 데이터는 H.264/MPEG-4 AVC (Moving Picture Experts Group-4 Advance Vide Coding), H.265/HEVC (High Efficiency Video Coding) 등의 영상 압축 표준을 이용하여 압축/인코딩될 수 있다. 음향 데이터는 AAC (Advanced Audio Coding), MPEG-H 3D Audio 등의 음향 압축 표준을 이용하여 압축/인코딩될 수 있다.
디코더(210)는 영상 압축 표준을 이용하여 컨텐츠 데이터로부터 영상 데이터를 복원하고, 음향 압축 표준을 이용하여 컨텐츠 데이터로부터 음향 데이터를 복원할 수 있다.
또한, 디코더(210)는 음향 데이터를 데이터 수집부(220)와, 음향 파라미터 설정부(230)와 음향 처리부(250)로 출력할 수 있다.
데이터 수집부(220)는 강화 학습을 위한 환경 정보를 수집할 수 있다. 예를 들어, 데이터 수집부(220)는 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 현재 시각 및 시청 시간(time duration) 등을 수집할 수 있다.
데이터 수집부(220)는 컨텐츠의 음향 특성을 판단할 수 있다. 컨텐츠의 음향 특성은 컨텐츠의 장르에 의존할 수 있으며, 컨텐츠의 장르는 뉴스, 드라마, 오락, 스포츠, 다큐멘터리, 영화, 코메디, 음악 등을 포함할 수 있다.
데이터 수집부(220)는 컨텐츠와 관련된 메타 데이터를 분석하여 컨텐츠의 장르를 판단할 수 있다. 메타 데이터는 컨텐츠의 속성 정보로서 컨텐츠의 위치와 내용, 작성자에 관한 정보, 장르에 관한 정보 등 컨텐츠를 설명하는 다양한 정보를 포함할 수 있다. 따라서, 컨텐츠 데이터와 함께 컨텐츠 데이터의 메타 데이터가 수신되면 데이터 수집부(220)는 메타 데이터를 분석하여 컨텐츠의 장르를 판단할 수 있다. 또한, 데이터 수집부(220)는 컨텐츠의 장르를 기초로 컨텐츠의 음향 특성을 판단할 수 있다.
데이터 수집부(220)는 컨텐츠의 음향 데이터 자체를 분석하여 컨텐츠의 장르 및/또는 음향의 장르를 판단할 수 있다. 예를 들어, 데이터 수집부(220)는 장르 인식 모델을 이용하여 컨텐츠의 장르 및/또는 음향의 장르를 판단할 수 있다. 장르 인식 모델은 다수의 훈련용 음향 데이터를 기반으로 기계 학습을 통하여 미리 생성될 수 있다. 또한, 데이터 수집부(220)는 컨텐츠 일부의 음향 데이터를 기초로 컨텐츠의 장르 및/또는 음향의 장르를 판단할 수 있다.
데이터 수집부(220)는 현재 설정된 음향 모드를 판단할 수 있다. 음향 모드는 음향 처리에 관한 디스플레이 장치(100)의 동작 모드를 나타낼 수 있으며, 음향 모드에 따라 주파수 대역 별 음향 증폭률과, 보이스(voice sound)와 배경음(background sound)의 음향 증폭률이 상이할 수 있다.
디스플레이 장치(100)는 사용자 입력부(110)를 통하여 사용자로부터 음향 모드의 선택을 수신할 수 있다. 음향 파라미터 설정부(230)는 서로 다른 음향 모드에 따라 서로 음향 파라미터를 출력할 수 있으며, 음향 처리부(250)는 서로 다른 음향 모드에 따라 서로 다른 음향 파라미터를 이용하여 음향 데이터를 처리하여 음향 신호를 생성할 수 있다.
예를 들어, 표준 모드에서 음향 처리부(250)는 모든 주파수 대역에 대하여 동일한 증폭률을 적용하고, 전경음과 배경음에 대하여 동일한 증폭률을 적용하고, 보이스와 배경음에 대하여 동일한 증폭률을 적용할 수 있다. 음악 모드에서 음향 처리부(250)는 음악의 장르에 따라 주파수 대역에 대하여 다른 증폭률을 적용하고, 배경음의 증폭률을 보이스의 증폭률보다 높게 설정할 수 있다. 음성 모드에서 음향 처리부(250)는 모든 주파수 대역에 대하여 동일한 증폭률을 적용하고, 보이스의 증폭률을 배경음의 증폭률보다 높게 설정할 수 있다. 또한, 자동 모드에서 음향 처리부(250)는 컨텐츠의 장르에 따라 주파수 대역에 대하여 다른 증폭률을 적용하고, 컨텐츠의 장르에 따라 보이스와 배경음에 서로 다른 증폭률을 적용할 수 있다.
이처럼 음향 처리부(250)는 사용자 입력에 따라 다양한 음향 모드로 동작할 수 있으며, 데이터 수집부(220)는 사용자 입력을 기초로 음향 처리부(250)의 음향 모드에 관한 정보를 수집할 수 있다.
데이터 수집부(220)는 사용자 입력부(110)를 통한 사용자 입력을 기초로 음향 볼륨을 판단할 수 있다. 예를 들어, 입력 버튼(111) 또는 리모트 컨트롤러(112a)에 마련된 볼륨 업 버튼 또는 볼륨 다운 버튼을 통한 사용자 입력을 기초로 음향 볼륨을 판단할 수 있다.
데이터 수집부(220)는 마이크(163)를 통하여 수집된 음향 신호를 기초로 디스플레이 장치(100) 주변의 외부 잡음을 판단할 수 있다. 예를 들어, 데이터 수집부(220)는 마이크(163)를 통하여 수집된 음향 신호의 크기를 기초로 외부 잡음의 크기를 판단할 수 있다.
데이터 수집부(220)는 제어부(140)에 포함된 타이머의 출력을 기초로 현재의 시각 및 사용자의 시청 시간(time duration)을 판단할 수 있다. 제어부(140)는 통신부(130)를 통하여 외부 장치로부터 현재 시각에 대한 정보를 수신하거나, 사용자의 시각 설정을 기초로 타이머를 이용하여 현재 시각을 산출할 수 있다.
데이터 수집부(220)에 의하여 수집되는 환경 정보는 이상에서 설명된 바에 한정되는 것이며, 데이터 수집부(220)는 이상에서 설명된 것 이외에 추가적인 정보를 수집할 수 있다.
음향 파라미터 설정부(230)는 디코더(210)로부터 음향 데이터를 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신할 수 있다. 음향 파라미터 설정부(230)는 음향 데이터와 환경 정보를 기초로 음향 처리를 위한 음향 파라미터를 생성할 수 있다. 여기서, 음향 파라미터는 주파수 대역 별 음향 증폭률과 보이스/배경음의 음향 증폭률과 음향 볼륨 등을 포함할 수 있다. 또한, 음향 파라미터 설정부(230)는 생성된 음향 파라미터를 음향 파라미터 학습부(240)로 출력할 수 있다.
예를 들어, 음향 파라미터 설정부(230)는 음향 모드에 따라 음향 파라미터를 생성할 수 있다. 음향 파라미터 설정부(230)는 음향 모드에 따라 주파수 대역 별 음향 증폭률과 보이스/배경음의 음향 증폭률과 음향 볼륨을 포함하는 음향 파라미터를 생성할 수 있다. 음향 파라미터 설정부(230)는 음향 모드에 대응하여 사전에 설정된 음향 파라미터들을 저장할 수 있으며, 현재 음향 모드에 대응한 음향 파라미터를 음향 파라미터 학습부(240)로 출력할 수 있다. 특히, 자동 모드에서 음향 파라미터 설정부(230)는 컨텐츠의 음향 특성에 따라 서로 다른 음향 파라미터를 생성할 수 있다. 음향 파라미터 설정부(230)는 컨텐츠의 음향 특성에 대응하여 사전에 설정된 음향 파라미터들을 저장할 수 있으며, 현재 컨텐츠의 음향 특성에 대응한 음향 파라미터를 음향 파라미터 학습부(240)로 출력할 수 있다.
이처럼, 음향 파라미터 설정부(230)는 다양한 환경 정보에 대응하여 사전에 설정된 음향 파라미터들을 저장할 수 있다. 또한, 음향 파라미터 설정부(230)는 현재의 환경 정보에 대응한 음향 파라미터를 음향 파라미터 학습부(240)로 출력할 수 있다.
음향 파라미터 설정부(230)는 환경 정보에 따라 사전에 저장된 음향 파라미터를 출력하며, 사전에 저장된 음향 파라미터는 디스플레이 장치(100)의 소프트웨어가 업데이트되지 않는 이상 변경되지 아니한다. 따라서, 음향 파라미터 설정부(230)로부터 출력되는 음향 파라미터는 사용자의 취향 또는 성향을 반영하지 못할 수 있다.
음향 파라미터 학습부(240)는 음향 파라미터 설정부(230)로부터 음향 파라미터를 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신하고, 사용자 입력부(110)로부터 사용자 입력을 수신할 수 있다.
음향 파라미터 학습부(240)는 환경 정보와 사용자 입력을 기초로 음향 파라미터에 관하여 학습할 수 있다. 또한, 음향 파라미터 학습부(240)는 학습 결과를 기초로 음향 파라미터를 수정하고, 수정된 음향 파라미터를 음향 처리부(250)로 출력할 수 있다. 특히, 음향 파라미터 학습부(240)는 음향 파라미터에 관하여 학습하고, 음향에 관한 사용자 입력이 최소화되도록 음향 파라미터를 수정할 수 있다.
음향 파라미터 학습부(240)는 강화 학습(reinforcement learning)을 이용하여 환경 정보와 사용자 입력을 기초로 음향 파라미터에 관하여 학습할 수 있다.
강화 학습은 기계 학습(machine learning)의 한 종류로서, 행동(action)에 대한 보상(reward)을 기반으로 학습한다.
기계 학습은 크게 지도 학습(supervised learning), 비지도 학습(unsupervised learning), 강화 학습으로 구분할 수 있다.
지도 학습은 설계자 또는 사용자가 데이터에 대한 레이블(정답)을 제공하여 학습 장치(예를 들어, 컴퓨터, 마이크로 프로세서 등)를 학습시키는 것을 의미하며, 비지도 학습은 설계자 또는 사용자의 개입없이 학습 장치가 스스로 데이터를 분류하고 학습하는 것을 의미한다.
강화 학습은 지도 학습과 비지도 학습의 중간쯤의 학습 방법으로, 에이전트(학습 장치)가 주어진 환경에서 동작을 수행하고 환경으로부터 보상을 획득함으로써 학습하는 것을 의미한다.
도 4에 도시된 바와 같이 강화 학습은 에이전트(agent)와 환경(environment) (또는 상태)과 행동(action)과 보상(reward)를 구성 요소로 한다.
에이전트는 행동하고 학습하는 주체를 의미하며, 디스플레이 장치(100) 또는 음향 파라미터 학습부(240)가 강화 학습의 에이전트에 해당할 수 있다.
환경은 에이전트에게 주어진 상태를 의미하며, 데이터 수집부(220)에 의하여 수집된 환경 정보가 강화 학습의 환경에 해당할 수 있다.
행동은 에이전트가 주어진 환경에서 수행하는 동작을 의미하며, 음향 파라미터 학습부(240)가 음향 파라미터 설정부(230)로부터 수신된 음향 파라미터를 수정하는 것이 강화 학습의 행동에 해당할 수 있다.
또한, 보상은 행동에 대하여 에이전트에게 주어지는 대가를 의미하며, 사용자 입력부(110)를 통하여 입력되는 사용자 입력이 강화 학습의 보상에 해당할 수 있다.
강화 학습에서, 에이전트는 주어진 환경에서 특정한 행동을 취하고, 환경으로부터 보상을 얻을 수 있다. 에이전트는 환경과 행동과 보상 사이의 상관 관계를 분석하고, 주어진 환경에서 복수의 행동들에 대한 보상을 예측할 수 있다. 나아가, 에이전트는 주어진 환경에서 최대의 보상을 획득할 수 있는 행동을 취할 수 있다.
보다 구체적으로, 에이전트는 시각t에서 주어진 환경을 기반으로 상태 st와 수행 가능한 행동들 A(st)을 판단할 수 있다. 에이전트는 행동들 A(st) 중 어느 하나의 행동 at을 취할 수 있다. 그 결과, 환경이 새로운 상태 st+1로 변경되고, 에이전트는 보상 rt+1을 획득할 수 있다. 이러한 에이전트는 주어진 환경에서 행동과 보상 사이의 상호 작용을 기초로 누적 보상을 최대화하는 행동을 취하게 된다.
예를 들어, 도 5에 도시된 바와 같이 에이전트는 상태 S1, 상태 S2, 상태 S3 중 어느 하나의 상태에 놓일 있다. 각각의 상태에서 에이전트는 행동 A12와 행동 A13, 행동 A21와 행동 A23, 행동 A32와 행동 A31을 취할 수 있으며, 에이전트는 보상 R12와 보상 R13, 보상 R21와 보상 R23, 보상 R32와 보상 R31을 획득할 수 있다.
에이전트가 상태 S1에서 행동 A12를 취하면 에이전트의 상태는 상태 S1에서 상태 S2로 변경될 수 있으며, 에이전트는 상태 S2에서 보상 R12을 획득할 수 있다. 에이전트가 상태 S1에서 행동 A13를 취하면 에이전트의 상태는 상태 S1에서 상태 S3로 변경될 수 있으며, 에이전트는 상태 S3에서 보상 R13을 획득할 수 있다.
에이전트가 상태 S2에서 행동 A21를 취하면 에이전트의 상태는 상태 S2에서 상태 S1로 변경될 수 있으며, 에이전트는 상태 S1에서 보상 R21을 획득할 수 있다. 에이전트가 상태 S2에서 행동 A23를 취하면 에이전트의 상태는 상태 S2에서 상태 S3로 변경될 수 있으며, 에이전트는 상태 S3에서 보상 R23을 획득할 수 있다.
또한, 에이전트가 상태 S3에서 행동 A31를 취하면 에이전트의 상태는 상태 S3에서 상태 S1로 변경될 수 있으며, 에이전트는 상태 S1에서 보상 R31을 획득할 수 있다. 에이전트가 상태 S3에서 행동 A32를 취하면 에이전트의 상태는 상태 S3에서 상태 S2로 변경될 수 있으며, 에이전트는 상태 S2에서 보상 R32을 획득할 수 있다.
이처럼, 에이전트는 환경에 의하여 주어진 상태에서 여러 행동을 취할 수 있으며, 행동에 의하여 상태가 변환하고 에이전트에게 보상이 주어진다.
에이전트는 환경에 의하여 주어진 상태에서 행동을 선택하기 위하여 [수학식 1]과 같은 정책 함수 π를 가질 수 있다.
[수학식 1]
Figure 112017121078731-pat00001
단, π는 정책 함수를 나타내고, st는 시간 t에서의 상태를 나타내고, at는 시간 t에서의 에이전트의 행동을 나타낼 수 있다.
에이전트가 주어진 환경에서 행동을 취하면 [수학식 2]와 같은 보상이 주어질 수 있다.
[수학식 2]
Figure 112017121078731-pat00002
단, r은 보상 함수를 나타내고, st는 시간 t에서의 상태를 나타내고, at는 시간 t에서의 에이전트의 행동을 나타내고, st+1는 시간 t+1에서의 상태를 나타내고, rt+1은 시간 t+1에서 에이전트에 주어지는 보상을 나타낼 수 있다.
에이전트가 미래에 받을 보상은 [수학식 3]과 같이 주어질 수 있다.
[수학식 3]
Figure 112017121078731-pat00003
단, Rt는 시간 t 이후 에이전트가 받을 보상을 나타내고, rt+1은 시간 t+1에서 에이전트에 주어지는 보상을 나타내고, γ는 미래의 보상을 차감하기 위한 0과 1 사이의 차감 인자(discount factor)를 나타낼 수 있다.
강화 학습을 이용한 음향 파라미터 학습부(240)는 주어진 환경에서 특정한 행동을 취하고, 환경으로부터 보상을 획득할 수 있다. 예를 들어, 음향 파라미터 학습부(240)는 주어진 환경 정보를 기초로 음향 파라미터를 수정하고, 사용자로부터 사용자 입력을 수신할 수 있다. 또한, 음향 파라미터 학습부(240)는 사용자 입력에 의한 보상을 획득할 수 있다.
음향 파라미터 학습부(240)는 환경 정보(상태)와 음향 파라미터(행동)와 사용자 입력(보상) 사이의 상관 관계를 분석하고, 주어진 환경 정보에서 음향 파라미터에 의한 사용자 입력을 예측할 수 있다. 나아가, 음향 파라미터 학습부(240)는 주어진 환경 정보에서 최대의 보상(최소의 사용자 입력)을 획득할 수 있도록 음향 파라미터를 수정할 수 있다.
음향 파라미터 학습부(240)는 다양한 시점 및/또는 다양한 조건에서 행동을 취할 수 있다.
음향 파라미터의 변경을 사용자가 인지하지 못하도록 음향 파라미터 학습부(240)는 사용자 입력에 응답하여 행동을 취할 수 있다. 예를 들어, 사용자가 방송 채널을 변경하거나 컨텐츠를 변경할 때, 음향 파라미터 학습부(240)는 음향 파라미터 설정부(230)에 의하여 설정된 음향 파라미터를 변경할 수 있다.
예를 들어, 디스플레이 장치(100)는 아침 시간대에 표준 모드로 10의 음향 볼륨으로 영화를 재생할 수 있다. 이때 사용자 입력에 의하여 디스플레이 장치(100)에 의하여 재생되는 컨텐츠가 영화로부터 음악 공연으로 변경될 수 있다.
음향 파라미터 학습부(240)는 데이터 수집부(220)로부터 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 시청 시간 등 포함하는 환경 정보를 수신할 수 있으며, 음향 파라미터 학습부(240)는 현재 상태를 판단할 수 있다. 현재 상태에서 음향 파라미터 학습부(240)는 음향 파라미터를 수정할 수 있다. 구체적으로, 음향 파라미터 학습부(240)는 음향 모드를 변경하거나 음향 볼륨을 변경할 수 있다.
음향 파라미터 학습부(240)가 음향 모드를 변경하거나 음향 볼륨을 변경하면, 환경 정보가 변경되고 새로운 상태가 된다. 또한, 음향 파라미터 학습부(240)는 데이터 수집부(220)로부터 새로운 환경 정보를 수신할 수 있다.
이처럼, 사용자 입력은 음향 볼륨의 변경, 음향 모드의 변경 등에 의한 사용자 취향 또는 성향을 반영하며, 사용자는 변경된 음향 볼륨 또는 음향 모드에 만족하면 볼륨에 관한 사용자 입력을 입력하지 아니하고 변경된 음향 볼륨 또는 음향 모드에 만족하지 못하면 사용자 입력을 입력할 수 있다. 다시 말해, 사용자 입력은 주어진 환경 즉 주어진 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 시청 시간에서 사용자의 음향 만족도를 나타낼 수 있으며, 사용자 입력에 따라 보상이 주어질 수 있다.
만일, 새로운 상태에서 사용자 입력부(110)를 통하여 음향에 관한 사용자 입력이 수신되면 음향 파라미터 학습부(240)은 낮은 보상을 획득하거나, 음향 파라미터 학습부(240)의 누적 보상이 차감될 수 있다.
반면, 새로운 상태에서 사용자 입력부(110)를 통하여 음향에 관한 사용자 입력이 수신되지 아니하면, 음향 파라미터 학습부(240)는 높은 보상을 획득하거나 음향 파라미터 학습부(240)의 누적 보상을 증가될 수 있다.
도 6의 (a)에 도시된 바와 같이 음향 파라미터 학습부(240)가 표준 모드를 음악 모드로 변경한 경우, 사용자는 재생되는 음악에 만족감을 느끼고 음향 모드를 유지할 수 있다. 이처럼 음향 파라미터 학습부(240)의 행동(음향 모드를 표준 모드에서 음악 모드로 변경)에 의하여 사용자 입력이 입력되지 아니하였으므로, 음향 파라미터 학습부(240)는 높은 보상을 획득할 수 있다.
도 6의 (b)에 도시된 바와 같이 음향 파라미터 학습부(240)가 표준 모드를 음성 모드로 변경한 경우, 사용자는 재생되는 음악에 불만을 느끼고 음향 모드를 표준 모드로 되돌릴 수 있다. 이처럼, 음향 파라미터 학습부(240)의 행동(음향 모드를 표준 모드에서 음성 모드로 변경)에 의하여 사용자 입력이 입력되므로, 음향 파라미터 학습부(240)는 낮은 보상을 획득할 수 있다.
이러한 학습의 결과, 높은 보상을 획득하기 위하여 음향 파라미터 학습부(240)는 아침 시간대에 표준 모드로 10의 음향 볼륨으로 음악 공연을 재생하는 상태에서 음향 모드를 음악 모드로 변경하는 정책을 생성할 수 있다.
도 7의 (a)에 도시된 바와 같이, 음향 파라미터 학습부(240)가 음향 볼륨을 11로 높이는 경우, 사용자는 아침 시간대를 고려하여 음향 볼륨을 낮추기 위한 사용자 입력을 입력할 수 있다. 이처럼, 음향 파라미터 학습부(240)의 행동(음향 볼륨을 높임)에 의하여 사용자 입력이 입력되므로, 음향 파라미터 학습부(240)는 낮은 보상을 획득할 수 있다.
도 7의 (b)에 도시된 바와 같이, 음향 파라미터 학습부(240)가 음향 볼륨을 9로 낮추는 경우, 사용자는 아침 시간대를 고려하여 음향 볼륨을 낮춘 것에 만족할 수 있다. 이처럼, 음향 파라미터 학습부(240)의 행동(음향 볼륨을 낮춤)에 의하여 사용자 입력이 입력되지 아니하므로, 음향 파라미터 학습부(240)는 높은 보상을 획득할 수 있다.
이러한 학습의 결과, 높은 보상을 획득하기 위하여 음향 파라미터 학습부(240)는 아침 시간대에 표준 모드로 10의 음향 볼륨으로 음악 공연을 재생하는 상태에서 음향 볼륨을 낮추는 정책을 생성할 수 있다.
음향 파라미터 학습부(240)는 생성된 정책에 따라 음향 파라미터의 설정값을 변경하고, 변경된 음향 파라미터의 설정값을 기초로 음향 처리부(250)로 음향 파라미터를 출력할 수 있다.
또한, 음향 파라미터의 변경을 사용자가 인지하지 못하도록 음향 파라미터 학습부(240)는 디스플레이 장치(100)의 턴온에 응답하여 행동을 취할 수 있다. 또한, 디스플레이 장치(100)가 온 상태에서 동작하는 동안 음향 파라미터 학습부(240)는 보상을 획득할 수 있다.
예를 들어, 디스플레이 장치(100)가 오프 상태에서 사용자 입력에 의하여 턴온되면 음향 파라미터 학습부(240)는 그 동안의 학습 결과를 바탕으로 음향 파라미터 설정부(230)의 음향 파라미터를 변경할 수 있다. 또한, 디스플레이 장치(100)가 동작하는 동안 입력된 사용자 입력에 따라 음향 파라미터 학습부(240)는 보상을 획득할 수 있다.
디스플레이 장치(100)는 턴온된 이후 시간의 흐름에 따라 복수의 컨텐츠들을 순차적으로 재생할 수 있다. 디스플레이 장치(100)가 턴온될 때 음향 파라미터 학습부(240)는 학습 결과를 기초로 음향 파라미터의 수정값을 판단할 수 있다.
음향 파라미터 학습부(240)는 컨텐츠의 변경에 의한 컨텐츠 장르의 변화 여부에 따라 상태를 판단할 수 있다. 예를 들어, 도 8의 (a)에 도시된 바와 같이 컨텐츠 장르가 변경되는 상태 S1과 컨텐츠 장르가 변경되지 않는 상태 S2가 정의될 수 있으며, 음향 파라미터 학습부(240)는 컨텐츠 장르의 변경 여부에 따라 강화 학습의 상태를 판단할 수 있다. 디스플레이 장치(100)에 의하여 재생되는 컨텐츠의 장르가 이전 컨텐츠의 장르와 동일하면 음향 파라미터 학습부(240)는 상태 S1으로 판단하고, 디스플레이 장치(100)에 의하여 재생되는 컨텐츠의 장르가 이전 컨텐츠의 장르와 상이하면 음향 파라미터 학습부(240)는 상태 S2로 판단할 수 있다.
음향 파라미터 설정부(230)와 음향 파라미터 학습부(240)는 컨텐츠 장르에 따라 서로 다른 음향 파라미터를 설정할 수 있다. 예를 들어, 음향 파라미터 설정부(230)와 음향 파라미터 학습부(240)는 컨텐츠 장르에 따라 서로 다른 음향 모드를 설정하거나 서로 다른 음향 볼륨을 설정할 수 있다.
따라서, 컨텐츠 장르가 변경되는 상태 S1에서 음향 파라미터가 변경되며, 컨텐츠 장르가 변경되지 않는 상태 S2에서 음향 파라미터는 변경되지 아니할 수 있다.
사용자는 컨텐츠 및 음향에 따라 음향 모드 변경 및/또는 음향 볼륨 변경 등 의 사용자 입력을 입력할 수 있으며, 사용자 입력에 따라 음향 파라미터 학습부(240)는 보상을 획득할 수 있다. 예를 들어, 도 8의 (b)에 도시된 바와 같이, 음향 모드가 변경되면 음향 파라미터 학습부(240)는 '-10'의 보상을 획득할 수 있으며, 음향 모드가 유지되면 음향 파라미터 학습부(240)는 '+10'의 보상을 획득할 수 있다. 또한, 음향 볼륨이 변경되면 음향 파라미터 학습부(240)는 '-3'의 보상을 획득할 수 있으며, 음향 볼륨이 유지되면 음향 파라미터 학습부(240)는 '+3'의 보상을 획득할 수 있다.
이처럼, 음향 파라미터 학습부(240)는 디스플레이 장치(100)가 턴온된 동안 사용자 입력에 의하여 보상을 획득할 수 있다. 이후, 디스플레이 장치(100)가 턴오프된 이후 다시 턴온될 때, 음향 파라미터 학습부(240)는 획득된 보상을 기초로 보상을 최대화하기 위한 정책을 생성하고, 생성된 정책에 따라 음향 파라미터의 설정값을 변경할 수 있다. 또한, 음향 파라미터 학습부(240)는 변경된 음향 파라미터의 설정값을 기초로 음향 처리부(250)로 음향 파라미터를 출력할 수 있다.
음향 처리부(250)는 디코더(210)로부터 음향 데이터를 수신하고, 음향 파라미터 학습부(240)로부터 수정된 음향 파라미터를 수신할 수 있다. 음향 처리부(250)는 음향 파라미터에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다. 또한, 음향 처리부(250)는 음향 신호를 음향부(160)로 출력할 수 있다.
예를 들어, 음향 처리부(250)는 음향 파라미터 학습부(240)로부터 수신된 음향 볼륨에 따라 음향 데이터를 처리할 수 있다. 다시 말해, 음향 처리부(250)는 음향 파라미터 학습부(240)로부터 수신된 음향 볼륨에 따라 음향 신호의 세기를 조절할 수 있다.
또한, 음향 처리부(250)는 음향 데이터를 보이스와 배경음으로 구별하고, 음향 파라미터 학습부(240)로부터 수신된 음향 모드에 따라 보이스와 배경음을 각각 서로 다른 증폭률로 증폭할 수 있다. 음향 처리부(250)는 표준 모드에서 동일한 증폭률로 보이스와 배경음을 증폭할 수 있고, 음악 모드에서 배경음을 보이스보다 높은 증폭률로 증폭할 수 있으며, 음성 모드에서 보이스를 배경음보다 높은 증폭률로 증폭할 수 있다. 자동 모드에서 음향 처리부(250)는 음향 파라미터 학습부(240)로부터 수신된 증폭률에 따라 보이스와 배경음을 각각 증폭할 수 있다.
이상에서 설명된 바와 같이, 제어부(140)는 음향 압축 표준을 이용하여 컨텐츠 데이터로부터 음향 데이터를 복원할 수 있으며, 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 현재 시각 및 시청 시간(time duration) 등의 환경 정보를 수집할 수 있다. 제어부(140)는 음향 데이터를 처리하기 위한 음향 파라미터를 생성할 수 있으며, 환경 정보와 사용자 입력에 기초한 강화 학습을 이용하여 음향 파라미터를 수정할 수 있다. 또한, 제어부(140)는 강화 학습에 의하여 수정된 음향 파라미터에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다.
이처럼, 제어부(140)가 강화 학습을 이용하여 음향 파라미터를 수정함으로써, 디스플레이 장치(100)는 시청 시각 및 외부 잡음 등의 주변 환경 및 사용자의 취향/성향에 부합하는 최적의 음향을 제공할 수 있다.
도 9는 일 실시예에 의한 디스플레이 장치의 음향 처리 방법을 도시한다.
도 9과 함께, 디스플레이 장치(100)의 음향 처리 방법(1000)이 설명된다.
디스플레이 장치(100)는 음향 데이터를 획득한다(1010).
컨텐츠 수신부(120) 및/또는 통신부(130)는 컨텐츠 소스로부터 컨텐츠 데이터를 수신하고, 수신된 컨텐츠 데이터를 제어부(140)로 출력할 수 있다.
제어부(140)는 컨텐츠 수신부(120) 및/또는 통신부(130)로부터 컨텐츠 데이터를 수신하고, 영상 압축 표준 및 음향 압축 표준을 이용하여 컨텐츠 데이터를 디코딩하여 영상 데이터와 음향 데이터를 복원할 수 있다.
디스플레이 장치(100)는 환경 정보를 수집한다(1020).
제어부(140)는 강화 학습을 위한 환경 정보를 수집할 수 있다. 예를 들어, 제어부(140)는 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 현재 시각 및 시청 시간 등을 수집할 수 있다.
구체적으로, 제어부(140)는 음향 데이터 및/또는 음향의 메타 데이터를 기초로 컨텐츠 장르 및 음향 특성을 판단할 수 있으며, 음향 모드 및 음향 볼륨을 선택하는 사용자 입력을 기초로 음향 모드 및 음향 볼륨을 판단할 수 있다. 또한, 제어부(140)는 마이크(163)를 통하여 수집된 음향 신호의 크기를 기초로 외부 잡음을 판단할 수 있으며, 타이머의 출력을 기초로 현재 시각 및 사용자의 시청 시간을 판단할 수 있다.
디스플레이 장치(100)는 음향 파라미터를 설정한다(1030).
제어부(140)는 환경 정보를 기초로 음향 파라미터를 설정할 수 있다. 여기서, 음향 파라미터는 보이스/배경음의 음향 증폭률과 음향 볼륨을 포함할 수 있다. 예를 들어, 음향 모드에 따라 음향 파라미터를 설정할 수 있다. 구체적으로, 제어부(140)는 음향 모드에 대응하여 사전에 설정된 음향 파라미터를 저장할 수 있으며, 현재의 음향 모드 및/또는 현재의 컨텐츠의 음향 특성에 대응한 음향 파라미터를 설정할 수 있다.
디스플레이 장치(100)는 강화 학습을 기초로 음향 파라미터를 수정한다(1040).
제어부(140)는 강화 학습을 이용하여 환경 정보와 사용자 입력을 기초로 음향 파라미터에 관하여 학습할 수 있다.
구체적으로, 제어부(140)는 주어진 환경에서 특정한 행동을 취하고, 환경으로부터 보상을 얻을 수 있다. 예를 들어, 제어부(140)는 주어진 환경 정보를 기초로 음향 파라미터를 수정하고, 사용자로부터 사용자 입력을 수신할 수 있다. 또한, 제어부(140)는 사용자 입력을 기초로 보상을 획득할 수 있다.
또한, 제어부(140)는 환경 정보와 음향 파라미터와 사용자 입력 사이의 상관 관계를 분석하고, 주어진 환경 정보에서 음향 파라미터를 수정할 때 사용자 입력 즉 보상을 예측할 수 있다. 나아가, 제어부(140)는 주어진 환경 정보에서 최대의 보상 즉 최소의 사용자 입력을 획득할 수 있도록 음향 파라미터를 수정할 수 있다.
제어부(140)는 다양한 시점에 음향 파라미터를 설정 및 수정할 수 있다. 예를 들어, 음향 파라미터의 변경을 사용자가 인지하지 못하도록 제어부(140)는 사용자 입력(예를 들어, 채널 변경, 컨텐츠 변경 등)에 응답하여 음향 파라미터를 설정 및 수정하거나, 제어부(140)는 디스플레이 장치(100)가 오프 상태에서 턴온될 때 음향 파라미터를 설정 및 수정할 수 있다.
디스플레이 장치(100)는 음향 데이터를 처리하고, 음향을 출력한다(1050).
제어부(140)는 음향 파라미터에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다. 예를 들어, 제어부(140)는 음향 볼륨에 따라 음향 신호의 크기를 조절할 수 있다. 또한, 제어부(140)는 음향 데이터를 보이스와 배경음으로 구별하고, 음향 파라미터 학습부(240)로부터 수신된 음향 모드에 따라 보이스와 배경음을 각각 서로 다른 증폭률로 증폭할 수 있다.
또한, 제어부(140)는 음향 신호를 음향부(160)로 출력할 수 있으며, 음향부(160)는 음향 신호를 음향(음파)로 변환할 수 있다.
디스플레이 장치(100)는 음향과 관련된 사용자 입력이 수신되는지를 판단한다(1060).
사용자는 디스플레이 장치(100)의 음향을 청취하고, 음향 모드 및/또는 음향 볼륨을 수정하기 위한 사용자 입력을 입력할 수 있다. 제어부(140)는 사용자 입력부(110)를 통하여 음향 모드 및/또는 음향 볼륨을 수정하기 위한 사용자 입력을 수신할 수 있다.
사용자 입력이 수신되면(1060의 예), 디스플레이 장치(100)는 강화 학습과 관련하여 제1 보상을 획득한다(1070).
제어부(140)는 음향에 관한 사용자 입력이 최소화되도록 학습되므로, 사용자 입력이 수신되면 제어부(140)는 낮은 보상(예를 들어, 음의 보상)을 획득하거나 제어부(140)의 누적 보상이 차감될 수 있다.
사용자 입력이 수신되지 않으면(1060의 아니오), 디스플레이 장치(100)는 강화 학습과 관련하여 제2 보상을 획득한다(1080).
제어부(140)는 음향에 관한 사용자 입력이 최소화되도록 학습되므로, 사용자 입력이 수신되면 제어부(140)는 높은 보상(예를 들어, 양의 보상)을 획득하거나 제어부(140)의 누적 보상은 증가될 수 있다.
사용자 입력의 수신 여부에 따라 다른 보상을 획득함으로써 제어부(140)는 사용자 입력이 최소화되도록 음향 데이터를 처리할 수 있다.
이상에서 설명된 바와 같이 디스플레이 장치(100)는 강화 학습을 이용하여 사용자의 취향 및 성향에 맞춘 음향 데이터의 처리에 관하여 학습하고, 학습 결과에 따라 사용자의 취향 및 성향에 맞추어 음향 데이터를 처리할 수 있다.
이하에서는 디스플레이 장치의 강화 학습의 다른 일 예가 설명된다.
도 10은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 다른 일 예를 도시한다. 도 11은 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.
도 10 및 도 11을 참조하면, 제어부(140)는 디코더(210)와, 데이터 수집부(220)와, 음향 볼륨 설정부(231)와, 음향 볼륨 학습부(241)와, 음향 처리부(250)를 포함한다. 디코더(210)와, 데이터 수집부(220)와, 음향 볼륨 설정부(231)와, 음향 볼륨 학습부(241)와, 음향 처리부(250)는 각각 메모리(142)에 저장되고 마이크로 프로세서(141)에 의하여 실행되는 어플리케이션(소프트웨어)로 구현되거나, 마이크로 프로세서(141) 내부에 실장된 디지털 회로(하드웨어)로 구현될 수 있다.
디코더(210)와, 데이터 수집부(220)는 도 3에 도시된 것들과 동일할 수 있다.
음향 볼륨 설정부(231)는 디코더(210)로부터 음향 데이터를 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신할 수 있다. 음향 볼륨 설정부(231)는 음향 데이터와 환경 정보를 기초로 음향 볼륨 값을 생성할 수 있다. 예를 들어, 음향 볼륨 설정부(231)는 음향 모드에 따라 음향 볼륨 값을 생성할 수 있다. 또한, 음향 볼륨 설정부(231)는 생성된 음향 볼륨 값을 음향 볼륨 학습부(241)로 출력할 수 있다.
이처럼, 음향 볼륨 설정부(231)는 다양한 환경 정보에 대응하여 사전에 설정된 음향 볼륨 값을 저장할 수 있으며, 현재 환경 정보에 대응한 음향 볼륨 값을 음향 볼륨 학습부(241)로 출력할 수 있다.
음향 볼륨 학습부(241)는 음향 볼륨 설정부(231)로부터 음향 볼륨 값을 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신하고, 사용자 입력부(110)로부터 사용자 입력을 수신할 수 있다.
음향 볼륨 학습부(241)는 환경 정보와 사용자 입력을 기초로 음향 볼륨 값에 관하여 학습할 수 있다. 또한, 음향 볼륨 학습부(241)는 학습 결과를 기초로 음향 볼륨 값을 수정하고, 수정된 음향 볼륨 값을 음향 처리부(250)로 출력할 수 있다. 특히, 음향 볼륨 학습부(241)는 음향 볼륨 값에 관하여 학습하고, 음향에 관한 사용자 입력이 최소화되도록 음향 볼륨 값을 수정할 수 있다.
음향 볼륨 학습부(241)는 강화 학습을 이용하여 환경 정보와 사용자 입력을 기초로 음향 볼륨에 관하여 학습할 수 있다.
강화 학습을 이용한 음향 볼륨 학습부(241)는 주어진 환경에서 특정한 행동을 취하고, 환경으로부터 보상을 획득할 수 있다. 예를 들어, 음향 볼륨 학습부(241)는 주어진 환경 정보를 기초로 음향 볼륨 값을 수정하고, 사용자로부터 사용자 입력을 수신할 수 있다. 또한, 음향 볼륨 학습부(241)는 사용자 입력에 의한 보상을 획득할 수 있다.
음향 볼륨 학습부(241)는 환경 정보(상태)와 음향 볼륨 값(행동)과 사용자 입력(보상) 사이의 상관 관계를 분석하고, 주어진 환경 정보에서 음향 볼륨 값에 의한 사용자 입력을 예측할 수 있다. 나아가, 음향 볼륨 학습부(241)는 주어진 환경 정보에서 최대의 보상(최소의 사용자 입력)을 획득할 수 있도록 음향 볼륨 값을 수정할 수 있다.
예를 들어, 도 11에 도시된 바와 같이 음향 볼륨이 '7'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '6'으로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향 볼륨을 증가시키는 사용자 입력을 수신할 수 있다. 음향 볼륨이 '7'인 상태에서 음량 볼륨 다운에 의하여 음향 볼륨 학습부(241)는 '-3'의 보상을 획득할 수 있다.
음향 볼륨이 '7'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '8'로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향에 관한 사용자 입력을 수신하지 아니할 수 있다. 음향 볼륨이 '7'인 상태에서 음향 볼륨 업에 의하여 음향 볼륨 학습부(241)는 '+3'의 보상을 획득할 수 있다.
이상의 학습 결과, 음향 볼륨 학습부(241)는 보상을 최대화하기 위하여 음향 볼륨이 '7'인 상태에서 음향 볼륨을 증가시키는 정책을 생성할 수 있다.
또한, 음향 볼륨이 '8'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '7'으로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향 볼륨을 증가시키는 사용자 입력을 수신할 수 있다. 음향 볼륨이 '8'인 상태에서 음량 볼륨 다운에 의하여 음향 볼륨 학습부(241)는 '-3'의 보상을 획득할 수 있다.
음향 볼륨이 '8'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '9'로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향 볼륨을 감소시키는 사용자 입력을 수신할 수 있다. 음향 볼륨이 '8'인 상태에서 음량 볼륨 업에 의하여 음향 볼륨 학습부(241)는 '-3'의 보상을 획득할 수 있다.
이상의 학습 결과, 음향 볼륨 학습부(241)는 보상을 최대화하기 위하여 음향 볼륨이 '8'인 상태에서 음향 볼륨을 유지시키는 정책을 생성할 수 있다.
또한, 음향 볼륨이 '9'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '8'으로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향에 관한 사용자 입력을 수신하지 아니할 수 있다. 음향 볼륨이 '9'인 상태에서 음량 볼륨 다운에 의하여 음향 볼륨 학습부(241)는 '+3'의 보상을 획득할 수 있다.
음향 볼륨이 '9'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '10'으로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향 볼륨을 감소시키는 사용자 입력을 수신할 수 있다. 음향 볼륨이 '9'인 상태에서 음량 볼륨 업에 의하여 음향 볼륨 학습부(241)는 '-3'의 보상을 획득할 수 있다.
이상의 학습 결과, 음향 볼륨 학습부(241)는 보상을 최대화하기 위하여 음향 볼륨이 '9'인 상태에서 음향 볼륨을 감소시키는 정책을 생성할 수 있다.
음향 볼륨 학습부(241)는 생성된 정책에 따라 음향 볼륨의 설정값을 변경하고, 변경된 음향 볼륨의 설정값을 기초로 음향 처리부(250)로 음향 볼륨 값을 출력할 수 있다.
음향 처리부(250)는 디코더(210)로부터 음향 데이터를 수신하고, 음향 볼륨 학습부(241)로부터 수정된 음향 볼륨 값을 수신할 수 있다. 음향 처리부(250)는 음향 볼륨 값에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다. 구체적으로, 음향 처리부(250)는 음향 볼륨 값에 따라 음향 신호의 세기를 제어할 수 있다. 또한, 음향 처리부(250)는 음향 신호를 음향부(160)로 출력할 수 있다.
이상에서 설명된 바와 같이, 제어부(140)는 음향 데이터를 처리하기 위한 음향 볼륨 값을 생성할 수 있으며, 환경 정보와 사용자 입력에 기초한 강화 학습을 이용하여 음향 볼륨 값을 수정할 수 있다. 또한, 제어부(140)는 강화 학습에 의하여 수정된 음향 볼륨 값에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다.
이처럼, 제어부(140)가 강화 학습을 이용하여 음향 볼륨 값을 수정함으로써, 디스플레이 장치(100)는 시청 시각 및 외부 잡음 등의 주변 환경 및 사용자의 취향/성향에 부합하는 최적의 음향을 제공할 수 있다.
도 12은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 다른 일 예를 도시한다. 도 13는 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.
도 12 및 도 13을 참조하면, 제어부(140)는 디코더(210)와, 데이터 수집부(220)와, 음향 렌더링 설정부(232)와, 음향 렌더링 학습부(242)와, 음향 처리부(250)를 포함한다. 디코더(210)와, 데이터 수집부(220)와, 음향 렌더링 설정부(232)와, 음향 렌더링 학습부(242)와, 음향 처리부(250)는 각각 메모리(142)에 저장되고 마이크로 프로세서(141)에 의하여 실행되는 어플리케이션(소프트웨어)로 구현되거나, 마이크로 프로세서(141) 내부에 실장된 디지털 회로(하드웨어)로 구현될 수 있다.
디코더(210)와, 데이터 수집부(220)는 도 3에 도시된 것들과 동일할 수 있다.
음향 렌더링 설정부(232)는 디코더(210)로부터 음향 데이터를 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신할 수 있다. 음향 렌더링 설정부(232)는 음향 데이터와 환경 정보를 기초로 보이스/배경음의 증폭률을 생성할 수 있다. 예를 들어, 음향 렌더링 설정부(232)는 음향 모드에 따라 보이스/배경음의 증폭률을 생성할 수 있다. 또한, 음향 렌더링 설정부(232)는 생성된 보이스/배경음의 증폭률을 음향 렌더링 학습부(242)로 출력할 수 있다.
이처럼, 음향 렌더링 설정부(232)는 다양한 환경 정보에 대응하여 사전에 설정된 보이스/배경음의 증폭률을 저장할 수 있으며, 현재 환경 정보에 대응한 보이스/배경음의 증폭률을 음향 렌더링 학습부(242)로 출력할 수 있다.
음향 렌더링 학습부(242)는 음향 렌더링 설정부(232)로부터 보이스/배경음의 증폭률을 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신하고, 사용자 입력부(110)로부터 사용자 입력을 수신할 수 있다.
음향 렌더링 학습부(242)는 환경 정보와 사용자 입력을 기초로 보이스/배경음의 증폭률에 관하여 학습할 수 있다. 또한, 음향 렌더링 학습부(242)는 학습 결과를 기초로 보이스/배경음의 증폭률을 수정하고, 수정된 보이스/배경음의 증폭률을 음향 처리부(250)로 출력할 수 있다. 특히, 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률에 관하여 학습하고, 음향에 관한 사용자 입력이 최소화되도록 보이스/배경음의 증폭률을 수정할 수 있다.
음향 렌더링 학습부(242)는 강화 학습을 이용하여 환경 정보와 사용자 입력을 기초로 보이스/배경음의 증폭률에 관하여 학습할 수 있다.
강화 학습을 이용한 음향 렌더링 학습부(242)는 주어진 환경에서 특정한 행동을 취하고, 환경으로부터 보상을 획득할 수 있다. 예를 들어, 음향 렌더링 학습부(242)는 주어진 환경 정보를 기초로 보이스/배경음의 증폭률을 수정하고, 사용자로부터 사용자 입력을 수신할 수 있다. 또한, 음향 렌더링 학습부(242)는 사용자 입력에 의한 보상을 획득할 수 있다.
음향 렌더링 학습부(242)는 환경 정보(상태)와 보이스/배경음의 증폭률(행동)과 사용자 입력(보상) 사이의 상관 관계를 분석하고, 주어진 환경 정보에서 보이스/배경음의 증폭률에 의한 사용자 입력을 예측할 수 있다. 나아가, 음향 렌더링 학습부(242)는 주어진 환경 정보에서 최대의 보상(최소의 사용자 입력)을 획득할 수 있도록 보이스/배경음의 증폭률을 수정할 수 있다.
예를 들어, 도 13에 도시된 바와 같이 음향 모드가 '표준 모드'인 상태에서 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률을 변경하기 위하여 음향 모드를 '음악 모드'로 변경할 수 있다. 보이스/배경음의 증폭률은 음향 모드의 변경에 의하여 변경될 수 있다. 이후, 디스플레이 장치(100)는 음향 모드를 '자동 모드'로 변경하는 사용자 입력을 수신할 수 있다. 음향 모드가 '표준 모드'인 상태에서 '음악 모드'로의 수정에 의하여 음향 렌더링 학습부(242)는 '-10'의 보상을 획득할 수 있다.
음향 모드가 '표준 모드'인 상태에서 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률을 변경하기 위하여 음향 모드를 '음성 모드'로 변경할 수 있다. 이후, 디스플레이 장치(100)는 음향 모드를 '자동 모드'로 변경하는 사용자 입력을 수신할 수 있다. 음향 모드가 '표준 모드'인 상태에서 '음성 모드'로의 수정에 의하여 음향 렌더링 학습부(242)는 '-10'의 보상을 획득할 수 있다.
음향 모드가 '표준 모드'인 상태에서 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률을 변경하기 위하여 음향 모드를 '자동 모드'로 변경할 수 있다. 이후, 디스플레이 장치(100)는 음향에 관한 사용자 입력을 수신하지 아니할 수 있다. 음향 모드가 '표준 모드'인 상태에서 '자동 모드'로의 수정에 의하여 음향 렌더링 학습부(242)는 '+10'의 보상을 획득할 수 있다.
이상의 학습 결과, 음향 볼륨 학습부(241)는 보상을 최대화하기 위하여 음향 모드가 '표준 모드'인 상태에서 음향 모드를 '자동 모드'로 변경하는 정책을 생성할 수 있다.
음향 모드가 '음악 모드'인 상태에서 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률을 변경하기 위하여 음향 모드를 '자동 모드'로 변경할 수 있다. 이후, 디스플레이 장치(100)는 음향 모드를 '음악 모드'로 되돌리는 사용자 입력을 수신할 수 있다. 음향 모드가 '음악 모드'인 상태에서 '자동 모드'로의 수정에 의하여 음향 렌더링 학습부(242)는 '-10'의 보상을 획득할 수 있다.
음향 모드가 '음성 모드'인 상태에서 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률을 변경하기 위하여 음향 모드를 '자동 모드'로 변경할 수 있다. 이후, 디스플레이 장치(100)는 음향 모드를 '음성 모드'로 되돌리는 사용자 입력을 수신할 수 있다. 음향 모드가 '음성 모드'인 상태에서 '자동 모드'로의 수정에 의하여 음향 렌더링 학습부(242)는 '-10'의 보상을 획득할 수 있다.
이상의 학습 결과, 음향 볼륨 학습부(241)는 보상을 최대화하기 위하여 음향 모드가 '음악 모드' 또는 '음성 모드'인 상태에서 음향 모드를 변경하지 아니하는 정책을 생성할 수 있다.
음향 볼륨 학습부(241)는 생성된 정책에 따라 음향 모드의 설정값을 변경하고, 변경된 음향 모드의 설정값을 기초로 음향 처리부(250)로 보이스/배경음의 증폭률을 출력할 수 있다.
음향 처리부(250)는 디코더(210)로부터 음향 데이터를 수신하고, 음향 렌더링 학습부(242)로부터 수정된 보이스/배경음의 증폭률을 수신할 수 있다. 음향 처리부(250)는 보이스/배경음의 증폭률에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다. 구체적으로, 음향 처리부(250)는 음향 데이터를 보이스 데이터와 배경음 데이터로 분리하고, 보이스/배경음의 증폭률에 따라 보이스 신호와 배경음 신호를 증폭할 수 있다. 또한, 음향 처리부(250)는 생성된 음향 신호를 음향부(160)로 출력할 수 있다.
이상에서 설명된 바와 같이, 제어부(140)는 음향 데이터를 처리하기 위한 보이스/배경음의 증폭률을 생성할 수 있으며, 환경 정보와 사용자 입력에 기초한 강화 학습을 이용하여 보이스/배경음의 증폭률을 변경할 수 있다. 또한, 제어부(140)는 강화 학습에 의하여 수정된 보이스/배경음의 증폭률에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다.
이처럼, 제어부(140)가 강화 학습을 이용하여 보이스/배경음의 증폭률을 수정함으로써, 디스플레이 장치(100)는 시청 시각 및 외부 잡음 등의 주변 환경 및 사용자의 취향/성향에 부합하는 최적의 음향을 제공할 수 있다.
한편, 개시된 실시예들은 컴퓨터에 의해 실행 가능한 명령어를 저장하는 기록매체의 형태로 구현될 수 있다. 명령어는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 프로그램 모듈을 생성하여 개시된 실시예들의 동작을 수행할 수 있다. 기록매체는 컴퓨터로 읽을 수 있는 기록매체로 구현될 수 있다.
컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터에 의하여 해독될 수 있는 명령어가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다.
이상에서와 같이 첨부된 도면을 참조하여 개시된 실시예들을 설명하였다. 게시된 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 게시된 실시예의 기술적 사상이나 필수적인 특징을 변경하지 않고도, 개시된 실시예들과 다른 형태로 실시될 수 있음을 이해할 것이다. 개시된 실시예들은 예시적인 것이며, 한정적으로 해석되어서는 안 된다.
100: 디스플레이 시스템

Claims (20)

  1. 삭제
  2. 삭제
  3. 사용자 입력을 수신하는 사용자 입력부;
    컨텐츠 소스로부터 컨텐츠 데이터를 수신하는 컨텐츠 수신부;
    상기 컨텐츠 데이터에 포함된 영상을 표시하는 표시부;
    상기 컨텐츠 데이터에 포함된 음향을 출력하는 음향부;
    상기 컨텐츠 데이터를 음향 데이터로 디코딩하고, 상기 사용자 입력을 기초로 음향 파라미터에 관한 강화 학습의 결과에 따라 상기 음향 파라미터를 설정하고, 상기 설정된 음향 파라미터에 따라 상기 음향 데이터를 음향 신호로 변환하고, 상기 음향 신호에 대응하는 음향을 출력하도록 상기 음향부를 제어하는 프로세서를 포함하고,
    상기 프로세서는 환경 정보를 기초로 상기 음향 파라미터를 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 파라미터를 변경하고,
    상기 음향을 출력한 이후 음향에 관한 사용자 입력이 입력되면 상기 프로세서는 상기 사용자 입력에 의하여 획득된 제1 보상을 처리하고,
    상기 음향을 출력한 이후 미리 정해진 시간 동안 상기 음향에 관한 사용자 입력이 입력되지 아니하면 상기 프로세서는 상기 사용자 입력에 의하여 획득된 제2 보상을 처리하고,
    상기 제2 보상은 상기 제1 보상보다 큰 디스플레이 장치.
  4. 제3항에 있어서,
    상기 프로세서는 상기 강화 학습을 이용하여 상기 음향 파라미터의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 음향 파라미터를 변경하는 디스플레이 장치.
  5. 제3항에 있어서,
    상기 프로세서는 상기 사용자 입력부를 통하여 사용자 입력이 입력된 직후 상기 음향 파라미터를 변경하는 디스플레이 장치.
  6. 제3항에 있어서,
    상기 프로세서는 상기 디스플레이 장치가 턴온된 직후 상기 음향 파라미터를 변경하는 디스플레이 장치.
  7. 제3항에 있어서,
    상기 음향 파라미터는 음향 볼륨 값을 포함하고,
    상기 프로세서는 상기 컨텐츠의 음향 특성을 기초로 상기 음향 볼륨 값을 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 볼륨 값을 변경하는 디스플레이 장치.
  8. 제7항에 있어서,
    상기 프로세서는 상기 강화 학습을 이용하여 상기 음향 볼륨 값의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 음향 볼륨 값을 변경하는 디스플레이 장치.
  9. 제3항에 있어서,
    상기 음향 파라미터는 음향 렌더링을 위한 보이스의 증폭률과 배경음의 증폭률을 포함하고,
    상기 프로세서는 상기 컨텐츠의 음향 특성을 기초로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 디스플레이 장치.
  10. 제9항에 있어서,
    상기 프로세서는 상기 강화 학습을 이용하여 상기 보이스의 증폭률의 변경과 상기 배경음의 증폭률의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 디스플레이 장치.
  11. 삭제
  12. 삭제
  13. 컨텐츠 소스로부터 컨텐츠를 수신하고;
    상기 컨텐츠를 디코딩하여 음향 데이터를 생성하고;
    음향 파라미터를 설정하고;
    사용자 입력을 기초로 상기 음향 파라미터에 관한 강화 학습의 결과에 따라 상기 음향 파라미터를 변경하고;
    상기 변경된 음향 파라미터에 따라 상기 음향 데이터를 음향 신호로 변환하고;
    상기 음향 신호에 대응하는 음향을 출력하는 것을 포함하고,
    상기 음향 파라미터를 변경하는 것은, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 파라미터를 변경하는 것을 포함하고,
    상기 보상은 상기 음향을 출력한 이후 음향에 관한 사용자 입력이 입력되면 획득되는 제1 보상과 상기 음향을 출력한 이후 미리 정해진 시간 동안 상기 음향에 관한 사용자 입력이 입력되지 아니하면 획득되는 제2 보상을 포함하고;
    상기 제2 보상은 상기 제1 보상보다 큰 음향 출력 방법.
  14. 제13항에 있어서,
    상기 음향 파라미터를 변경하는 것은,
    상기 강화 학습을 이용하여 상기 음향 파라미터의 변경에 의한 보상을 예측하고;
    상기 예측된 보상이 최대가 되는 값으로 상기 음향 파라미터를 변경하는 것을 포함하는 음향 출력 방법.
  15. 제13항에 있어서,
    상기 음향 파라미터를 변경하는 것은,
    상기 사용자 입력이 입력된 직후 상기 음향 파라미터를 변경하는 것을 포함하는 음향 출력 방법.
  16. 제13항에 있어서,
    상기 음향 파라미터를 변경하는 것은,
    디스플레이 장치가 턴온된 직후 상기 음향 파라미터를 변경하는 것을 포함하는 음향 출력 방법.
  17. 제13항에 있어서,
    상기 음향 파라미터는 음향 볼륨 값을 포함하고,
    상기 음향 파라미터를 설정하는 것은 상기 컨텐츠의 음향 특성을 기초로 상기 음향 볼륨 값을 설정하는 것을 포함하고,
    상기 음향 파라미터를 변경하는 것은 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 볼륨 값을 변경하는 것을 포함하는 음향 출력 방법.
  18. 제17항에 있어서,
    상기 음향 파라미터를 변경하는 것은,
    상기 강화 학습을 이용하여 상기 음향 볼륨 값의 변경에 의한 보상을 예측하고;
    상기 예측된 보상이 최대가 되는 값으로 상기 음향 볼륨 값을 변경하는 것을 포함하는 음향 출력 방법.
  19. 제13항에 있어서,
    상기 음향 파라미터는 음향 렌더링을 위한 보이스의 증폭률과 배경음의 증폭률을 포함하고,
    상기 음향 파라미터를 설정하는 것은 상기 컨텐츠의 음향 특성을 기초로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 설정하는 것을 포함하고,
    상기 음향 파라미터를 변경하는 것은 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 것을 포함하는 음향 출력 방법.
  20. 제19항에 있어서,
    상기 음향 파라미터를 변경하는 것은,
    상기 강화 학습을 이용하여 상기 보이스의 증폭률의 변경과 상기 배경음의 증폭률의 변경에 의한 보상을 예측하고;
    상기 예측된 보상이 최대가 되는 값으로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 것을 포함하는 음향 출력 방법.
KR1020170165665A 2017-12-05 2017-12-05 디스플레이 장치 및 음향 출력 방법 KR102429556B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020170165665A KR102429556B1 (ko) 2017-12-05 2017-12-05 디스플레이 장치 및 음향 출력 방법
PCT/KR2018/013208 WO2019112182A1 (ko) 2017-12-05 2018-11-01 디스플레이 장치 및 음향 출력 방법
CN201880086508.4A CN111587578B (zh) 2017-12-05 2018-11-01 显示装置和音频输出方法
US16/770,422 US11494162B2 (en) 2017-12-05 2018-11-01 Display apparatus and audio outputting method
EP18886455.7A EP3703383B1 (en) 2017-12-05 2018-11-01 Display device and sound output method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170165665A KR102429556B1 (ko) 2017-12-05 2017-12-05 디스플레이 장치 및 음향 출력 방법

Publications (2)

Publication Number Publication Date
KR20190066175A KR20190066175A (ko) 2019-06-13
KR102429556B1 true KR102429556B1 (ko) 2022-08-04

Family

ID=66751026

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170165665A KR102429556B1 (ko) 2017-12-05 2017-12-05 디스플레이 장치 및 음향 출력 방법

Country Status (5)

Country Link
US (1) US11494162B2 (ko)
EP (1) EP3703383B1 (ko)
KR (1) KR102429556B1 (ko)
CN (1) CN111587578B (ko)
WO (1) WO2019112182A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021056030A1 (en) * 2019-09-22 2021-03-25 Mean Cat Entertainment, Llc Camera tracking system for live compositing
US11883746B2 (en) * 2021-02-23 2024-01-30 Electronic Arts Inc. Adversarial reinforcement learning for procedural content generation and improved generalization

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080153537A1 (en) 2006-12-21 2008-06-26 Charbel Khawand Dynamically learning a user's response via user-preferred audio settings in response to different noise environments

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100294073B1 (ko) 1998-08-04 2001-07-12 구자홍 방송프로그램정보를이용한장르별선호영상및음향자동조정방법
JP4101220B2 (ja) * 2003-09-18 2008-06-18 力 大橋 環境設定装置
JP2010041484A (ja) * 2008-08-06 2010-02-18 Pioneer Electronic Corp 映像音声出力装置
JP5568915B2 (ja) * 2009-07-29 2014-08-13 ヤマハ株式会社 外部機器制御装置
US20110095875A1 (en) * 2009-10-23 2011-04-28 Broadcom Corporation Adjustment of media delivery parameters based on automatically-learned user preferences
US9536197B1 (en) * 2011-04-22 2017-01-03 Angel A. Penilla Methods and systems for processing data streams from data producing objects of vehicle and home entities and generating recommendations and settings
KR101590332B1 (ko) * 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
US10455284B2 (en) * 2012-08-31 2019-10-22 Elwha Llc Dynamic customization and monetization of audio-visual content
KR101482945B1 (ko) * 2013-04-03 2015-01-16 인텔렉추얼디스커버리 주식회사 단말 장치 및 그의 오디오 신호 출력 방법
WO2014148844A1 (ko) * 2013-03-21 2014-09-25 인텔렉추얼디스커버리 주식회사 단말 장치 및 그의 오디오 신호 출력 방법
CN104080024B (zh) * 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
US20170187866A1 (en) * 2015-10-17 2017-06-29 Eric Qing Li Automatic Volume Control Based on Context and Location
KR20150018195A (ko) * 2013-08-09 2015-02-23 (주)휴맥스 사용자 단말기를 사용하여 컨텐츠 재생 장치를 제어하는 방법 및 장치
US9679258B2 (en) * 2013-10-08 2017-06-13 Google Inc. Methods and apparatus for reinforcement learning
CN104601130B (zh) * 2013-10-30 2018-02-23 腾讯科技(北京)有限公司 一种调节音量的方法及装置
KR20150115302A (ko) * 2014-04-03 2015-10-14 세종대학교산학협력단 컨텐츠 재생 및 저작 장치
KR102185702B1 (ko) * 2014-05-16 2020-12-02 삼성전자주식회사 컨텐츠 출력 장치, 모바일 장치 및 그 제어 방법
KR102224484B1 (ko) * 2014-08-05 2021-03-08 엘지전자 주식회사 멀티미디어 디바이스 및 이의 제어 방법
US20160149547A1 (en) * 2014-11-20 2016-05-26 Intel Corporation Automated audio adjustment
KR102221680B1 (ko) * 2014-12-11 2021-03-02 삼성전자주식회사 음향 출력 장치, 음향 출력 시스템 및 그 제어 방법
US9699580B2 (en) * 2015-09-28 2017-07-04 International Business Machines Corporation Electronic media volume control
US20190272477A1 (en) * 2016-11-29 2019-09-05 Sony Corporation Information processing apparatus and information processing method
CN106873936A (zh) * 2017-01-20 2017-06-20 努比亚技术有限公司 电子设备及信息处理方法
US10241749B1 (en) * 2017-09-14 2019-03-26 Lenovo (Singapore) Pte. Ltd. Dynamically changing sound settings of a device
KR20190107288A (ko) * 2019-08-30 2019-09-19 엘지전자 주식회사 화자인식 기반 차량 제어 방법 및 지능형 차량

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080153537A1 (en) 2006-12-21 2008-06-26 Charbel Khawand Dynamically learning a user's response via user-preferred audio settings in response to different noise environments

Also Published As

Publication number Publication date
US20210182017A1 (en) 2021-06-17
KR20190066175A (ko) 2019-06-13
EP3703383A1 (en) 2020-09-02
US11494162B2 (en) 2022-11-08
EP3703383A4 (en) 2020-09-02
EP3703383B1 (en) 2023-12-27
CN111587578A (zh) 2020-08-25
WO2019112182A1 (ko) 2019-06-13
CN111587578B (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
US10469891B2 (en) Playing multimedia content on multiple devices
US8307399B2 (en) Method of providing key frames of video in mobile terminal
US20190146557A1 (en) Image display apparatus
US20110181780A1 (en) Displaying Content on Detected Devices
US20220174340A1 (en) Display apparatus, display method, and display system
JP2018061255A (ja) ディスプレイ制御のためのビデオコンテンツを処理する装置及び方法
US11881139B2 (en) Electronic apparatus and control method thereof
KR102429556B1 (ko) 디스플레이 장치 및 음향 출력 방법
CN113039807B (zh) 图像和音频处理装置及其操作方法
CN113475091B (zh) 显示设备及其图像显示方法
CN114930864A (zh) 显示装置及控制其的方法
Miller My TV for Seniors
EP2600633A2 (en) Display apparatus and control method thereof
US20220215792A1 (en) Display device
KR20230126413A (ko) 디스플레이 장치
KR20140100123A (ko) 서비스 시스템, 디지털 기기 및 그 서비스 처리방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant