KR102429556B1

KR102429556B1 - 디스플레이 장치 및 음향 출력 방법

Info

Publication number: KR102429556B1
Application number: KR1020170165665A
Authority: KR
Inventors: 김기범; 김선민; 조재연; 황인우; 강기웅
Original assignee: 삼성전자주식회사
Priority date: 2017-12-05
Filing date: 2017-12-05
Publication date: 2022-08-04
Also published as: US20210182017A1; KR20190066175A; EP3703383A1; US11494162B2; EP3703383A4; EP3703383B1; CN111587578A; WO2019112182A1; CN111587578B

Abstract

디스플레이 장치는 사용자 입력을 수신하는 사용자 입력부; 컨텐츠 소스로부터 컨텐츠 데이터를 수신하는 컨텐츠 수신부; 컨텐츠 데이터에 포함된 영상을 표시하는 표시부; 컨텐츠 데이터에 포함된 음향을 출력하는 음향부; 컨텐츠 데이터를 음향 데이터로 디코딩하고, 사용자 입력을 기초로 음향 파라미터에 관한 강화 학습의 결과에 따라 음향 파라미터를 설정하고, 설정된 음향 파라미터에 따라 음향 데이터를 음향 신호로 변환하고, 음향 신호에 대응하는 음향을 출력하도록 음향부를 제어하는 프로세서를 포함할 수 있다.

Description

디스플레이 장치 및 음향 출력 방법{DISPLAY APPARATUS AND AUDIO OUTPUTTING METHOD}

개시된 발명은 디스플레이 장치 및 음향 출력 방법에 관한 것으로, 더욱 상세하게는 사용자 입력 및 컨텐츠의 음향 특성에 따라 음향 출력을 제어하는 디스플레이 장치 및 음향 출력 방법에 관하 발명이다.

일반적으로, 디스플레이 장치는 수신되거나 또는 저장된 영상 정보를 사용자에게 시각적으로 표시하는 출력 장치이며, 가정이나 사업장 등 다양한 분야에서 이용되고 있다. 예를 들어, 디스플레이 장치로는 개인용 컴퓨터 또는 서버용 컴퓨터 등에 연결된 모니터 장치나, 휴대용 컴퓨터 장치나, 내비게이션 단말 장치나, 일반 텔레비전 장치나, 인터넷 프로토콜 텔레비전(IPTV, Internet Protocol television) 장치나, 스마트 폰, 태블릿 피씨, 개인용 디지털 보조 장치(PDA, Personal Digital Assistant), 또는 셀룰러 폰 등의 휴대용 단말 장치나, 산업 현장에서 광고나 영화 같은 화상을 재생하기 위해 이용되는 각종 디스플레이 장치나, 또는 이외 다양한 종류의 오디오/비디오 시스템 등이 있다.

디스플레이 장치는 또한 방송국, 인터넷 서버, 영상 재생 장치, 게임 장치 및/또는 휴대용 단말기 등 다양한 컨텐츠 소스로부터 컨텐츠를 수신할 수 있다. 또한, 디스플레이 장치는 컨텐츠로부터 영상과 음향을 복원(또는 디코딩)하고, 복원된 영상과 음향을 출력할 수 있다.

최근에는, 디스플레이 장치의 영상 처리 뿐만 아니라 음향 처리에 관한 연구가 활발히 진행되고 있으며, 사용자의 취향 및 컨텐츠의 음향 특성에 따른 맞춤형(적응형) 음향 처리 기술이 개발되고 있다.

개시된 발명의 일 측면은 사용자의 취향 및 컨텐츠의 음향 특성에 따라 음향 출력을 제어할 수 있는 디스플레이 장치 및 음향 출력 방법을 제공하고자 한다.

개시된 발명의 일 측면은 강화 학습을 이용한 음향 처리가 가능한 디스플레이 장치 및 음향 출력 방법을 제공하고자 한다.

개시된 발명의 일 측면은 음향에 관한 사용자 입력 없이 자동으로 음향 볼륨 및 음향 모드를 조절할 수 있는 디스플레이 장치 및 음향 출력 방법을 제공하고자 한다.

개시된 발병의 일 측면에 의한 디스플레이 장치는 사용자 입력을 수신하는 사용자 입력부; 컨텐츠 소스로부터 컨텐츠 데이터를 수신하는 컨텐츠 수신부; 상기 컨텐츠 데이터에 포함된 영상을 표시하는 표시부; 상기 컨텐츠 데이터에 포함된 음향을 출력하는 음향부; 상기 컨텐츠 데이터를 음향 데이터로 디코딩하고, 상기 사용자 입력을 기초로 음향 파라미터에 관한 강화 학습의 결과에 따라 상기 음향 파라미터를 설정하고, 상기 설정된 음향 파라미터에 따라 상기 음향 데이터를 음향 신호로 변환하고, 상기 음향 신호에 대응하는 음향을 출력하도록 상기 음향부를 제어하는 프로세서를 포함할 수 있다.

상기 프로세서는 환경 정보를 기초로 상기 음향 파라미터를 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 파라미터를 변경할 수 있다.

상기 음향을 출력한 이후 음향에 관한 사용자 입력이 입력되면 상기 프로세서는 상기 사용자 입력에 의하여 획득된 제1 보상을 처리하고, 상기 음향을 출력한 이후 미리 정해진 시간 동안 상기 음향에 관한 사용자 입력이 입력되지 아니하면 상기 프로세서는 상기 사용자 입력에 의하여 획득된 제2 보상을 처리할 수 있다. 또한, 상기 제2 보상은 상기 제1 보상보다 클 수 있다.

상기 프로세서는 상기 강화 학습을 이용하여 상기 음향 파라미터의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 음향 파라미터를 변경할 수 있다.

상기 프로세서는 상기 사용자 입력부를 통하여 사용자 입력이 입력된 직후 상기 음향 파라미터를 변경할 수 있다.

상기 프로세서는 상기 디스플레이 장치가 턴온된 직후 상기 음향 파라미터를 변경할 수 있다.

상기 음향 파라미터는 음향 볼륨 값을 포함할 수 있다. 또한, 상기 프로세서는 상기 컨텐츠의 음향 특성을 기초로 상기 음향 볼륨 값을 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 볼륨 값을 변경할 수 있다.

상기 프로세서는 상기 강화 학습을 이용하여 상기 음향 볼륨 값의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 음향 볼륨 값을 변경할 수 있다.

상기 음향 파라미터는 음향 렌더링을 위한 보이스의 증폭률과 배경음의 증폭률을 포함할 수 있다. 또한, 상기 프로세서는 상기 컨텐츠의 음향 특성을 기초로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경할 수 있다.

상기 프로세서는 상기 강화 학습을 이용하여 상기 보이스의 증폭률의 변경과 상기 배경음의 증폭률의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경할 수 있다.

개시된 발병의 일 측면에 의한 음향 출력 방법은 컨텐츠 소스로부터 컨텐츠를 수신하고; 상기 컨텐츠를 디코딩하여 음향 데이터를 생성하고; 음향 파라미터를 설정하고; 사용자 입력을 기초로 상기 음향 파라미터에 관한 강화 학습의 결과에 따라 상기 음향 파라미터를 변경하고; 상기 변경된 음향 파라미터에 따라 상기 음향 데이터를 음향 신호로 변환하고; 상기 음향 신호에 대응하는 음향을 출력하는 것을 포함할 수 있다.

상기 음향 파라미터를 변경하는 것은, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 파라미터를 변경하는 것을 포함할 수 있다.

상기 보상은 상기 음향을 출력한 이후 음향에 관한 사용자 입력이 입력되면 획득되는 제1 보상과 상기 음향을 출력한 이후 미리 정해진 시간 동안 상기 음향에 관한 사용자 입력이 입력되지 아니하면 획득되는 제2 보상을 포함할 수 있다. 또한, 상기 제2 보상은 상기 제1 보상보다 클 수 있다.

상기 음향 파라미터를 변경하는 것은, 상기 강화 학습을 이용하여 상기 음향 파라미터의 변경에 의한 보상을 예측하고; 상기 예측된 보상이 최대가 되는 값으로 상기 음향 파라미터를 변경하는 것을 포함할 수 있다.

상기 음향 파라미터를 변경하는 것은, 상기 사용자 입력이 입력된 직후 상기 음향 파라미터를 변경하는 것을 포함할 수 있다.

상기 음향 파라미터를 변경하는 것은, 디스플레이 장치가 턴온된 직후 상기 음향 파라미터를 변경하는 것을 포함할 수 있다.

상기 음향 파라미터는 음향 볼륨 값을 포함할 수 있다. 또한, 상기 음향 파라미터를 설정하는 것은 상기 컨텐츠의 음향 특성을 기초로 상기 음향 볼륨 값을 설정하는 것을 포함하고, 상기 음향 파라미터를 변경하는 것은 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 볼륨 값을 변경하는 것을 포함할 수 있다.

상기 음향 파라미터를 변경하는 것은, 상기 강화 학습을 이용하여 상기 음향 볼륨 값의 변경에 의한 보상을 예측하고; 상기 예측된 보상이 최대가 되는 값으로 상기 음향 볼륨 값을 변경하는 것을 포함할 수 있다.

상기 음향 파라미터는 음향 렌더링을 위한 보이스의 증폭률과 배경음의 증폭률을 포함할 수 있다. 또한, 상기 음향 파라미터를 설정하는 것은 상기 컨텐츠의 음향 특성을 기초로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 설정하는 것을 포함하고, 상기 음향 파라미터를 변경하는 것은 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 것을 포함할 수 있다.

상기 음향 파라미터를 변경하는 것은, 상기 강화 학습을 이용하여 상기 보이스의 증폭률의 변경과 상기 배경음의 증폭률의 변경에 의한 보상을 예측하고; 상기 예측된 보상이 최대가 되는 값으로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 것을 포함할 수 있다.

개시된 발명의 일 측면에 따르면, 사용자의 취향 및 컨텐츠의 음향 특성에 따라 음향 출력을 제어할 수 있는 디스플레이 장치 및 음향 출력 방법을 제공할 수 있다.

개시된 발명의 일 측면에 따르면, 강화 학습을 이용한 음향 처리가 가능한 디스플레이 장치 및 음향 출력 방법을 제공할 수 있다.

개시된 발명의 일 측면에 따르면, 음향에 관한 사용자 입력 없이 자동으로 음향 볼륨 및 음향 모드를 조절할 수 있는 디스플레이 장치 및 음향 출력 방법을 제공할 수 있다.

도 1은 일 실시예에 의한 디스플레이 장치의 외관을 도시한다.
도 2는 일 실시예에 의한 디스플레이 장치의 구성을 도시한다.
도 3은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 일 예를 도시한다.
도 4 및 도 5는 강화 학습을 설명하기 위한 도면이다.
도 6, 도 7 및 도 8는 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.
도 9는 일 실시예에 의한 디스플레이 장치의 음향 처리 방법을 도시한다.
도 10은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 다른 일 예를 도시한다.
도 11은 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.
도 12은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 다른 일 예를 도시한다.
도 13는 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.

명세서 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 명세서가 실시예들의 모든 요소들을 설명하는 것은 아니며, 본 발명이 속하는 기술분야에서 일반적인 내용 또는 실시예들 간에 중복되는 내용은 생략한다. 명세서에서 사용되는 '부, 모듈, 부재, 블록'이라는 용어는 소프트웨어 또는 하드웨어로 구현될 수 있으며, 실시예들에 따라 복수의 '부, 모듈, 부재, 블록'이 하나의 구성요소로 구현되거나, 하나의 '부, 모듈, 부재, 블록'이 복수의 구성요소들을 포함하는 것도 가능하다.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 간접적으로 연결되어 있는 경우를 포함하고, 간접적인 연결은 무선 통신망을 통해 연결되는 것을 포함한다.

또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

명세서 전체에서, 어떤 부재가 다른 부재 "상에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.

제 1, 제 2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 전술된 용어들에 의해 제한되는 것은 아니다.

단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함한다.

각 단계들에 있어 식별부호는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다.

이하 첨부된 도면들을 참고하여 본 발명의 작용 원리 및 실시예들에 대해 설명한다.

도 1은 일 실시예에 의한 디스플레이 장치의 외관을 도시한다.

디스플레이 장치(100)는 외부로부터 수신되는 영상 신호를 처리하고, 처리된 영상을 시각적으로 표시할 수 있는 장치이다. 예를 들어, 디스플레이 장치(100)는 텔레비전(Television, TV), 모니터(Monitor), 휴대용 멀티미디어 장치, 휴대용 통신장치, 휴대용 연산장치 등 다양한 제품 형태로 구현할 수 있으며, 디스플레이 장치(100)는 영상 신호를 시각적으로 재현(reproduce)하고 음향 신호를 청각적으로 재현하는 장치라면 그 형태가 한정되지 않는다.

뿐만 아니라, 디스플레이 장치(100)는 건물 옥상이나 버스 정류장과 같은 옥외에 설치되는 대형 디스플레이 장치(Large Format Display, LFD)일 수 있다. 여기서, 옥외는 반드시 야외로 한정되는 것은 아니며, 지하철역, 쇼핑몰, 영화관, 회사, 상점 등 실내이더라도 다수의 사람들이 드나들 수 있는 곳이면 일 실시예에 따른 디스플레이 장치(100)가 설치될 수 있다.

디스플레이 장치(100)는 다양한 컨텐츠 소스들로부터 비디오와 오디오를 포함하는 컨텐츠를 수신하고, 컨텐츠에 포함된 비디오와 오디오를 출력할 수 있다. 예를 들어, 디스플레이 장치(100)는 방송 수신 안테나 또는 유선 케이블을 통하여 텔레비전 방송 컨텐츠를 수신하거나, 컨텐츠 재생 장치로부터 멀티미디어 케이블을 통하여 멀티미디어 컨텐츠를 수신하거나, 컨텐츠 스트리밍 서버로부터 통신망을 스트리밍 컨텐츠를 수신할 수 있다.

디스플레이 장치(100)는 강화 학습을 이용하여 사용자의 취향에 맞춘 음향 처리를 학습하고, 학습 결과를 기초로 음향 데이터를 처리할 수 있다. 예를 들어, 디스플레이 장치(100)는 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 시청 시간 등의 환경 정보와 사용자 입력을 기반으로 음향 처리를 학습하고, 변화하는 환경 정보에 대응하여 사용자의 취향에 맞춘 음향을 제공할 수 있다. 디스플레이 장치(100)는 최종적으로 사용자가 음향에 관한 입력 없이 컨텐츠를 시청할 수 있도록 하고자 한다.

도 1에 도시된 바와 같이, 디스플레이 장치(100)는 영상을 표시하기 위한 복수의 부품들을 수용하는 본체(101)와, 본체(101)의 일측에 마련되어 영상(I)을 표시하는 스트린(102)을 포함할 수 있다.

본체(101)는 디스플레이 장치(100)의 외형을 형성하며, 본체(101)의 내부에는 디스플레이 장치(100)가 영상(I)과 음향(A)을 출력 위한 부품이 마련될 수 있다. 도 1에 도시된 본체(101)는 평평한 판 형상이나, 본체(101)의 형상이 도 1에 도시된 바에 한정되는 것은 아니며, 본체(101)는 예를 들어 좌우 양단이 전방으로 돌출되고 중심부가 오목하도록 휘어진 형상일 수 있다.

스트린(102)은 본체(101)의 전면에 형성되며, 스트린(102)에는 시각 정보인 영상(I)이 표시될 수 있다. 예를 들어, 스트린(102)에는 정지 영상 또는 동영상을 표시될 수 있으며, 2차원 평면 영상 또는 3차원 입체 영상이 표시될 수 있다.

스트린(102)에는 복수의 픽셀(P)가 형성되며, 스트린(102)에 표시되는 영상(I)은 복수의 픽셀(P)로부터 출사된 광의 조합에 의하여 형성될 수 있다. 예를 들어, 복수의 픽셀(P)가 방출하는 광이 모자이크(mosaic)와 같이 조합됨으로써 스트린(102) 상에 하나의 영상(I)이 형성될 수 있다.

복수의 픽셀(P) 각각은 다양한 밝기 및 다양한 색상의 광을 방출할 수 있다.

다양한 밝기의 광을 방출하기 위하여, 복수의 픽셀(P) 각각은 직접 광을 방출할 수 있는 구성(예를 들어, 유기 발광 다이오드)을 포함하거나 백 라이트 유닛 등에 의하여 방출된 광을 투과하거나 차단할 수 있는 구성(예를 들어, 액정 패널)을 포함할 수 있다.

다양한 색상의 광을 방출하기 위하여, 복수의 픽셀(P) 각각은 서브 픽셀들(P_R, P_G, P_B)을 포함할 수 있다. 서브 픽셀들(P_R, P_G, P_B)은 적색 광을 방출할 수 있는 적색 서브 픽셀(P_R)과, 녹색 광을 방출할 수 있는 녹색 서브 픽셀(P_G)과, 청색 광을 방출할 수 있는 청색 서브 픽셀(P_B)을 포함할 수 있다. 예를 들어, 적색 서브 픽셀(P_R)은 파장이 대략 620nm (nanometer, 10억분의 1미터)에서 750nm까지의 적색 광을 방출할 수 있고, 녹색 서브 픽셀(P_G)은 파장이 대략 495nm에서 570nm까지의 녹색 광을 방출할 수 있으며, 청색 서브 픽셀(P_B)은 파장이 대략 450nm에서 495nm까지의 청색 광을 방출할 수 있다.

적색 서브 픽셀(P_R)의 적색 광, 녹색 서브 픽셀(P_G)의 녹색 광 및 청색 서브 픽셀(P_B)의 청색 광의 조합에 의하여, 복수의 픽셀(P) 각각은 다양한 밝기와 다양한 색상의 광을 출사할 수 있다.

도 1에 도시된 스트린(102)은 평평한 판 형상이나, 스트린(102)의 형상이 도 1에 도시된 바에 한정되는 것은 아니며, 스트린(102)은 예를 들어 좌우 양단이 전방으로 돌출되고 중심부가 오목하도록 휘어진 형상일 수 있다.

또한, 본체(101)의 후면 또는 측면에는 음향(A)을 출력할 수 있는 스피커가 마련될 수 있다. 스피커는 디스플레이 장치(100)가 컨텐츠 소스로부터 수신된 컨텐츠에 포함된 음향(A)을 출력할 수 있다.

도 2는 일 실시예에 의한 디스플레이 장치의 구성을 도시한다.

디스플레이 장치(100)는 사용자로부터 사용자 입력을 수신하는 사용자 입력부(110)와, 컨텐츠 소스로부터 비디오/오디오 컨텐츠를 수신하는 컨텐츠 수신부(120)와, 컨텐츠 소스와 통신하는 통신부(130)와, 컨텐츠 수신부(120) 및/또는 통신부(130)에 의하여 수신된 비디오/오디오 컨텐츠를 처리하는 제어부(140)와, 제어부(140)에 의하여 처리된 영상을 표시하는 표시부(150)와, 제어부(140)에 의하여 처리된 음향을 출력하는 음향부(160)를 포함한다.

사용자 입력부(110)는 사용자 입력을 수신하는 입력 버튼(111)을 포함할 수 있다. 예를 들어, 사용자 입력부(110)는 디스플레이 장치(100)를 턴온 또는 턴오프시키기 위한 전원 버튼, 디스플레이 장치(100)에 표시되는 방송 컨텐츠를 선택하기 위한 채널 선택 버튼, 디스플레이 장치(100)가 출력하는 음향 볼륨을 조절하기 위한 음향 조절 버튼, 컨텐츠 소스를 선택하기 위한 소스 선택 버튼 등을 포함할 수 있다.

입력 버튼(111)은 각각 사용자 입력을 수신하고 사용자 입력에 대응하는 전기적 신호를 제어부(140)로 출력할 수 있으며, 푸시 스위치, 터치 스위치, 다이얼, 슬라이드 스위치, 토글 스위치 등 다양한 입력 수단에 의하여 구현될 수 있다.

사용자 입력부(110)는 또한 리모트 컨트롤러(112a)의 원격 제어 신호를 수신하는 신호 수신기(112)를 포함한다. 사용자 입력을 수신하는 리모트 컨트롤러(112a)는 디스플레이 장치(100)와 분리되어 마련될 수 있으며, 사용자 입력을 수신하고, 사용자 입력에 대응하는 무선 신호를 디스플레이 장치(100)로 전송할 수 있다. 신호 수신기(112)는 리모트 컨트롤러(112a)로부터 사용자 입력에 대응하는 무선 신호를 수신하고, 사용자 입력에 대응하는 전기적 신호를 제어부(140)로 출력할 수 있다.

컨텐츠 수신부(120)는 컨텐츠 소스로부터 영상 데이터와 음향 데이터를 포함하는 비디오/오디오 컨텐츠를 수신하는 수신 단자(121)와, 텔레비전 방송 컨텐츠를 포함하는 방송 신호를 수신하고 수신된 방송 신호를 튜닝하는 튜너(122)를 포함할 수 있다.

수신 단자(121)는 케이블을 통하여 컨텐츠 소스와 연결될 수 있으며, 컨텐츠 소스로부터 영상 데이터와 음향 데이터를 포함하는 비디오/오디오 컨텐츠를 수신할 수 있다. 비디오/오디오 컨텐츠는 데이터 스트림의 형태로 수신되며, 비디오/오디오 컨텐츠의 데이터 스트림(이하에서 '컨텐츠 데이터'이라 한다)은 영상 데이터와 음향 데이터가 인코딩되어 생성될 수 있다.

수신 단자(121)는 아날로그 영상 프레임 데이터를 수신하는 컴포넌트(component, YPbPr/RGB) 단자와 컴포지트 (composite video blanking and sync, CVBS) 단자를 포함할 수 있다. 수신 단자(121)는 디지털 영상 프레임 데이터를 수신하는 고화질 멀티미디어 인터페이스 (High Definition Multimedia Interface, HDMI) 단자를 포함할 수 있다. 수신 단자(121)는 또한 외부 저장 매체(예를 들어, USB 드라이브)로부터 영상 데이터를 수신하는 범용 직렬 버스(Universal Serial Bus, USB) 단자를 포함할 수 있다.

튜너(122)는 방송 수신 안테나 또는 유선 케이블로부터 방송 신호를 수신하고, 방송 신호 중에 사용자에 의하여 선택된 채널의 방송 신호를 추출할 수 있다. 예를 들어, 튜너(122)는 방송 수신 안테나(2)를 통하여 수신된 여러 주파수의 텔레비전 방송 신호 중에 사용자에 의하여 선택된 채널에 해당하는 주파수를 가지는 텔레비전 방송 신호를 통과시키고, 다른 주파수를 가지는 텔레비전 방송 신호를 차단할 수 있다. 텔레비전 방송 신호는 컨텐츠의 데이터 스트림이 변조되어 생성될 수 있으며, 디스플레이 장치(100)는 텔레비전 방송 신호를 복조하여 컨텐츠 데이터를 생성할 수 있다.

이처럼, 컨텐츠 수신부(120)는 컨텐츠 소스로부터 비디오/오디오 컨텐츠를 수신할 수 있으며, 비디오/오디오 컨텐츠를 제어부(140)로 출력할 수 있다.

통신부(130)는 통신망을 통하여 컨텐츠 소스 및/또는 외부 장치와 데이터를 주고받을 수 있다. 예를 들어, 통신부(130)는 컨텐츠 소스로부터 비디오/오디오 컨텐츠를 수신하거나, 외부 장치로부터 비디오/오디오 컨텐츠에 관한 정보를 수신할 수 있다. 비디오/오디오 컨텐츠에 관한 정보는 컨텐츠 자체에 관한 정보로서 컨텐츠의 제목, 컨텐츠의 타입, 컨텐츠의 장르 등을 포함할 수 있다.

이때, 통신망은 유무선 통신망을 모두 포함할 수 있다. 유선 통신망은 케이블망이나 전화망 등의 통신망을 포함하며, 무선 통신망은 전파를 통하여 신호를 송수신하는 통신망을 포함할 수 있다. 무선 통신망은 또한 액세스 포인트(Access Point, AP)를 포함할 수 있으며, 액세스 포인트는 무선으로 영상 처리 장치(100)와 연결되고 유선으로 유선 통신망에 접속될 수 있다.

통신부(130)는 컨텐츠 소스 및/또는 외부 장치와 유선으로 데이터를 주고받는 유선 통신 모듈(131)과, 컨텐츠 소스 및/또는 외부 장치와 무선으로 데이터를 주고받는 무선 통신 모듈(132)을 포함할 수 있다.

유선 통신 모듈(131)은 유선 통신망에 접속하고 유선 통신망을 통하여 컨텐츠 소스와 통신할 수 있다. 예를 들어, 유선 통신 모듈(131)은 이더넷(Ethernet, IEEE 802.3 기술 표준)을 통하여 유선 통신망에 접속하고, 유선 통신망을 통하여 컨텐츠 소스 및/또는 외부 장치로부터 데이터를 수신할 수 있다.

무선 통신 모듈(132)은 기지국(base station) 또는 액세스 포인트(AP)와 무선으로 통신할 수 있으며, 기지국 또는 액세스 포인트를 통하여 유선 통신망에 접속할 수 있다. 무선 통신 모듈(132)은 또한 기지국 또는 액세스 포인트를 거쳐 유선 통신망에 접속된 컨텐츠 소스 및/또는 외부 장치와 통신할 수 있다. 예를 들어, 무선 통신 모듈(132)은 와이파이(WiFi™, IEEE 802.11 기술 표준)을 이용하여 액세스 포인트(AP)와 무선으로 통신하거나, CDMA, WCDMA, GSM, LET(Long Term Evolution), 와이브로 등을 이용하여 기지국과 통신할 수 있다. 무선 통신 모듈(132)은 또한 기지국 또는 액세스 포인트를 거쳐 컨텐츠 소스 및/또는 외부 장치로부터 데이터를 수신할 수 있다.

뿐만 아니라, 무선 통신 모듈(132)은 컨텐츠 소스 및/또는 외부 장치와 무선으로 직접 통신할 수 있다. 예를 들어, 무선 통신 모듈(132)은 와이파이, 블루투스 (Bluetooth™, IEEE 802.15.1 기술 표준), 지그비(ZigBee™, IEEE 802.15.4 기술 표준) 등을 이용하여 컨텐츠 소스 및/또는 외부 장치로부터 무선으로 데이터를 수신할 수 있다.

이처럼, 통신부(130)는 유선 통신 모듈(131) 및/또는 무선 통신 모듈(132)을 통하여 컨텐츠 소스 및/또는 외부 장치로부터 비디오/오디오 컨텐츠 및/또는 비디오/오디오 컨텐츠에 관한 정보를 수신할 수 있으며, 유선 통신 모듈(131) 및/또는 무선 통신 모듈(132)를 통하여 수신된 비디오/오디오 컨텐츠 및/또는 비디오/오디오 컨텐츠에 관한 정보를 제어부(140)로 출력할 수 있다.

제어부(140)는 사용자 입력부(110)를 통하여 수신된 사용자 입력에 따라 컨텐츠 수신부(120), 통신부(130), 표시부(150) 및/또는 음향부(160)를 제어할 수 있다. 예를 들어, 컨텐츠 소스의 선택을 위한 사용자 입력이 수신되면 제어부(140)는 선택된 컨텐츠 소스로부터 컨텐츠 데이터를 수신하도록 컨텐츠 수신부(120) 및/또는 통신부(130)를 제어할 수 있다. 또한, 영상 조절 및/또는 음향 조절을 위한 사용자 입력이 수신되면 제어부(140)는 영상 및/또는 음향을 조절하기 위하여 표시부(150) 및/또는 음향부(160)를 제어할 수 있다.

제어부(140)는 컨텐츠 수신부(120) 및/또는 통신부(130)에 의하여 수신된 영상 데이터 및/또는 음향 데이터를 처리할 수 있다. 예를 들어, 제어부(140)는 컨텐츠 데이터를 디코딩하여 영상 데이터를 복원할 수 있으며, 복원된 영상 데이터를 표시부(150)로 출력할 수 있다. 또한, 제어부(140)는 컨텐츠 데이터를 디코딩하여 음향 데이터를 복원할 수 있으며, 음향 데이터를 처리하여 아날로그 음향 신호(이하 '음향 신호'라 한다)를 생성할 수 있다.

특히, 제어부(140)는 강화 학습을 이용하여 음향 데이터를 처리할 수 있다. 예를 들어, 제어부(140)는 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 시청 시간 등의 환경 정보와 사용자 입력을 기반으로 음향 데이터의 처리를 학습하고, 학습 결과에 따라 음향 데이터를 처리할 수 있다.

이러한 제어부(140)는 마이크로 프로세서(141)와, 메모리(142)를 포함할 수 있다.

메모리(142)는 디스플레이 장치(100)에 포함된 구성들을 제어하기 위한 프로그램 및 데이터를 저장하고, 디스플레이 장치(100)에 포함된 구성들을 제어하는 중에 발행하는 제어 데이터를 임시로 기억할 수 있다.

또한, 메모리(142)는 컨텐츠 수신부(120) 및/또는 통신부(130)에 의하여 수신된 컨텐츠 데이터를 디코딩하기 위한 프로그램 및 데이터를 저장하고, 컨텐츠 데이터를 디코딩하는 중에 발행하는 영상 데이터 및/또는 음향 데이터를 임시로 기억할 수 있다.

이러한 메모리(142)는 데이터를 장기간 저장하기 위한 롬(Read Only Memory), 플래시 메모리 등의 비휘발성 메모리와, 데이터를 일시적으로 기억하기 위한 S-램(Static Random Access Memory, S-RAM), D-램(Dynamic Random Access Memory) 등의 휘발성 메모리를 포함할 수 있다.

마이크로 프로세서(141)는 사용자 입력부(110)로부터 사용자 입력을 수신할 수 있다. 마이크로 프로세서(231)는 사용자 입력에 따라 컨텐츠 수신부(120), 통신부(130), 표시부(150) 및/또는 음향부(160)를 제어하기 위한 제어 신호를 생성할 수 있다.

마이크로 프로세서(141)는 컨텐츠 수신부(120) 및/또는 통신부(130)로부터 컨텐츠 데이터를 수신할 수 있다. 마이크로 프로세서(141)는 메모리(142)에 저장된 프로그램 및 데이터에 따라 컨텐츠 데이터를 디코딩하고, 영상 데이터와 음향 데이터를 복원할 수 있다.

또한, 마이크로 프로세서(141)는 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 시청 시간 등의 환경 정보와 사용자 입력을 기반으로 음향 데이터의 처리를 학습하고, 학습 결과에 따라 음향 데이터를 처리하여 아날로그 음향 신호를 생성할 수 있다.

이러한 마이크로 프로세서(231)는 논리 연산 및 산술 연산 등을 수행하는 연산 회로와, 연산된 데이터를 기억하는 기억 회로 등을 포함할 수 있다.

표시부(150)는 영상을 시각적으로 표시하는 디스플레이 패널(152)과, 디스플레이 패널(152)을 구동하는 디스플레이 드라이버(151)를 포함한다.

디스플레이 패널(152)은 영상을 표시하는 단위가 되는 픽셀을 포함할 수 있다. 각각의 픽셀은 디스플레이 드라이버(151)로부터 영상을 나타내는 전기적 신호를 수신하고, 수신된 전기적 신호에 대응하는 광학 신호를 출력할 수 있다. 이처럼, 복수의 픽셀이 출력하는 광학 신호가 조합됨으로써 하나의 영상이 디스플레이 패널(152)에 표시될 수 있다.

예를 들어, 디스플레이 패널(152)에는 복수의 픽셀들이 마련되며, 디스플레이 패널(152)에 표시되는 영상은 복수의 픽셀들로부터 방출된 광의 조합에 의하여 형성될 수 있다. 예를 들어, 복수의 픽셀들이 방출하는 광이 모자이크(mosaic)와 같이 조합됨으로써 디스플레이 패널(152) 상에 하나의 영상이 형성될 수 있다. 앞서 설명된 바와 같이, 복수의 픽셀들 각각은 다양한 밝기 및 다양한 색상의 광을 방출할 수 있으며, 다양한 색상의 광을 방출하기 위하여 복수의 픽셀들 각각은 적색 서브 픽셀, 녹색 서브 픽셀 및 청색 서브 픽셀을 포함할 수 있다.

디스플레이 패널(152)은 액정 디스플레이 패널(Liquid Crystal Display Panel, LCD Panel), 발광 다이오드 패널(Light Emitting Diode Panel, LED Panel) 또는 유기 발광 다이오드 패널(Organic Light Emitting Diode Panel, OLED Panel)을 등 다양한 타입의 패널에 의하여 구현될 수 있다.

디스플레이 드라이버(151)는 제어부(140)로부터 영상 데이터를 수신하고, 수신된 영상 데이터에 대응하는 영상을 표시하도록 디스플레이 패널(152)을 구동할 수 있다. 구체적으로, 디스플레이 드라이버(151)는 디스플레이 패널(152)을 구성하는 복수의 픽셀 각각에 영상 데이터에 대응하는 전기적 신호를 전달할 수 있다.

디스플레이 드라이버(151)가 디스플레이 패널(152)을 구성하는 각각의 픽셀에 영상 데이터에 대응하는 전기적 신호를 전달하면 각각의 픽셀은 수신된 전기적 신호에 대응하는 광을 출력하고, 각각의 픽셀이 출력하는 광들이 조합되어 하나의 영상을 형성할 수 있다.

음향부(160)는 음향을 증폭하는 오디오 앰프(161)와, 증폭된 음향을 청각적으로 출력하는 스피커(162)와, 주변의 음향을 수집하는 마이크(163)를 포함한다.

제어부(140)는 음향 데이터를 처리하여 음향 신호로 변환할 수 있으며, 오디오 앰프(161)는 제어부(140)로부터 출력된 음향 신호를 증폭할 수 있다.

스피커(162)는 오디오 앰프(161)에 의하여 증폭된 음향 신호를 음향(음파)으로 변환할 수 있다. 예를 들어, 스피커(162)는 전기적 음향 신호에 따라 진동하는 박막을 포함할 수 있으며, 박막의 진동에 의하여 음파가 생성될 수 있다.

마이크(163)는 디스플레이 장치(100)의 주변 음향을 수집하고, 수집된 음향을 전기적 음향 신호로 변환할 수 있다. 마이크(163)에 의하여 수집된 음향 신호는 제어부(140)로 출력될 수 있다.

이상에서 설명된 바와 같이, 디스플레이 장치(100)는 다양한 컨텐츠 소스들로부터 비디오와 오디오를 포함하는 컨텐츠를 수신하고, 컨텐츠에 포함된 비디오와 오디오를 출력할 수 있다. 또한, 디스플레이 장치(100)는 강화 학습을 이용하여 사용자의 취향에 맞춘 음향 처리를 학습하고, 학습 결과를 기초로 음향 데이터를 처리할 수 있다.

이하에서는 강화 학습을 이용하여 디스플레이 장치(100)의 음향 처리가 설명된다.

도 3은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 일 예를 도시한다. 도 4 및 도 5는 강화 학습을 설명하기 위한 도면이다. 도 6, 도 7 및 도 8은 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.

도 3, 도 4, 도 5, 도 6, 도 7 및 도 8을 참조하면, 제어부(140)는 사용자 입력부(110)로부터 사용자 입력을 수신하고 컨텐츠 수신부(120)로부터 컨텐츠 데이터를 수신할 수 있다. 제어부(140)는 강화 학습을 이용하여 컨텐츠 데이터를 처리하고 음향 신호를 생성할 수 있다. 또한, 제어부(140)는 컨텐츠 데이터로부터 생성된 음향 신호를 음향부(160)로 출력할 수 있다.

제어부(140)는 디코더(210)와, 데이터 수집부(220)와, 음향 파라미터 설정부(230)와, 음향 파라미터 학습부(240)와, 음향 처리부(250)를 포함한다. 디코더(210)와, 데이터 수집부(220)와, 음향 파라미터 설정부(230)와, 음향 파라미터 학습부(240)와, 음향 처리부(250)는 각각 메모리(142)에 저장되고 마이크로 프로세서(141)에 의하여 실행되는 어플리케이션(소프트웨어)로 구현되거나, 마이크로 프로세서(141) 내부에 실장된 디지털 회로(하드웨어)로 구현될 수 있다.

디코더(210)는 컨텐츠 데이터를 디코딩하여 영상 데이터와 음향 데이터를 복원할 수 있다. 컨텐츠 데이터는 다양한 압축/인코딩 표준에 의하여 압축/인코딩될 수 있다. 예를 들어, 컨텐츠 데이터 중 영상 데이터는 H.264/MPEG-4 AVC (Moving Picture Experts Group-4 Advance Vide Coding), H.265/HEVC (High Efficiency Video Coding) 등의 영상 압축 표준을 이용하여 압축/인코딩될 수 있다. 음향 데이터는 AAC (Advanced Audio Coding), MPEG-H 3D Audio 등의 음향 압축 표준을 이용하여 압축/인코딩될 수 있다.

디코더(210)는 영상 압축 표준을 이용하여 컨텐츠 데이터로부터 영상 데이터를 복원하고, 음향 압축 표준을 이용하여 컨텐츠 데이터로부터 음향 데이터를 복원할 수 있다.

또한, 디코더(210)는 음향 데이터를 데이터 수집부(220)와, 음향 파라미터 설정부(230)와 음향 처리부(250)로 출력할 수 있다.

데이터 수집부(220)는 강화 학습을 위한 환경 정보를 수집할 수 있다. 예를 들어, 데이터 수집부(220)는 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 현재 시각 및 시청 시간(time duration) 등을 수집할 수 있다.

데이터 수집부(220)는 컨텐츠의 음향 특성을 판단할 수 있다. 컨텐츠의 음향 특성은 컨텐츠의 장르에 의존할 수 있으며, 컨텐츠의 장르는 뉴스, 드라마, 오락, 스포츠, 다큐멘터리, 영화, 코메디, 음악 등을 포함할 수 있다.

데이터 수집부(220)는 컨텐츠와 관련된 메타 데이터를 분석하여 컨텐츠의 장르를 판단할 수 있다. 메타 데이터는 컨텐츠의 속성 정보로서 컨텐츠의 위치와 내용, 작성자에 관한 정보, 장르에 관한 정보 등 컨텐츠를 설명하는 다양한 정보를 포함할 수 있다. 따라서, 컨텐츠 데이터와 함께 컨텐츠 데이터의 메타 데이터가 수신되면 데이터 수집부(220)는 메타 데이터를 분석하여 컨텐츠의 장르를 판단할 수 있다. 또한, 데이터 수집부(220)는 컨텐츠의 장르를 기초로 컨텐츠의 음향 특성을 판단할 수 있다.

데이터 수집부(220)는 컨텐츠의 음향 데이터 자체를 분석하여 컨텐츠의 장르 및/또는 음향의 장르를 판단할 수 있다. 예를 들어, 데이터 수집부(220)는 장르 인식 모델을 이용하여 컨텐츠의 장르 및/또는 음향의 장르를 판단할 수 있다. 장르 인식 모델은 다수의 훈련용 음향 데이터를 기반으로 기계 학습을 통하여 미리 생성될 수 있다. 또한, 데이터 수집부(220)는 컨텐츠 일부의 음향 데이터를 기초로 컨텐츠의 장르 및/또는 음향의 장르를 판단할 수 있다.

데이터 수집부(220)는 현재 설정된 음향 모드를 판단할 수 있다. 음향 모드는 음향 처리에 관한 디스플레이 장치(100)의 동작 모드를 나타낼 수 있으며, 음향 모드에 따라 주파수 대역 별 음향 증폭률과, 보이스(voice sound)와 배경음(background sound)의 음향 증폭률이 상이할 수 있다.

디스플레이 장치(100)는 사용자 입력부(110)를 통하여 사용자로부터 음향 모드의 선택을 수신할 수 있다. 음향 파라미터 설정부(230)는 서로 다른 음향 모드에 따라 서로 음향 파라미터를 출력할 수 있으며, 음향 처리부(250)는 서로 다른 음향 모드에 따라 서로 다른 음향 파라미터를 이용하여 음향 데이터를 처리하여 음향 신호를 생성할 수 있다.

예를 들어, 표준 모드에서 음향 처리부(250)는 모든 주파수 대역에 대하여 동일한 증폭률을 적용하고, 전경음과 배경음에 대하여 동일한 증폭률을 적용하고, 보이스와 배경음에 대하여 동일한 증폭률을 적용할 수 있다. 음악 모드에서 음향 처리부(250)는 음악의 장르에 따라 주파수 대역에 대하여 다른 증폭률을 적용하고, 배경음의 증폭률을 보이스의 증폭률보다 높게 설정할 수 있다. 음성 모드에서 음향 처리부(250)는 모든 주파수 대역에 대하여 동일한 증폭률을 적용하고, 보이스의 증폭률을 배경음의 증폭률보다 높게 설정할 수 있다. 또한, 자동 모드에서 음향 처리부(250)는 컨텐츠의 장르에 따라 주파수 대역에 대하여 다른 증폭률을 적용하고, 컨텐츠의 장르에 따라 보이스와 배경음에 서로 다른 증폭률을 적용할 수 있다.

이처럼 음향 처리부(250)는 사용자 입력에 따라 다양한 음향 모드로 동작할 수 있으며, 데이터 수집부(220)는 사용자 입력을 기초로 음향 처리부(250)의 음향 모드에 관한 정보를 수집할 수 있다.

데이터 수집부(220)는 사용자 입력부(110)를 통한 사용자 입력을 기초로 음향 볼륨을 판단할 수 있다. 예를 들어, 입력 버튼(111) 또는 리모트 컨트롤러(112a)에 마련된 볼륨 업 버튼 또는 볼륨 다운 버튼을 통한 사용자 입력을 기초로 음향 볼륨을 판단할 수 있다.

데이터 수집부(220)는 마이크(163)를 통하여 수집된 음향 신호를 기초로 디스플레이 장치(100) 주변의 외부 잡음을 판단할 수 있다. 예를 들어, 데이터 수집부(220)는 마이크(163)를 통하여 수집된 음향 신호의 크기를 기초로 외부 잡음의 크기를 판단할 수 있다.

데이터 수집부(220)는 제어부(140)에 포함된 타이머의 출력을 기초로 현재의 시각 및 사용자의 시청 시간(time duration)을 판단할 수 있다. 제어부(140)는 통신부(130)를 통하여 외부 장치로부터 현재 시각에 대한 정보를 수신하거나, 사용자의 시각 설정을 기초로 타이머를 이용하여 현재 시각을 산출할 수 있다.

데이터 수집부(220)에 의하여 수집되는 환경 정보는 이상에서 설명된 바에 한정되는 것이며, 데이터 수집부(220)는 이상에서 설명된 것 이외에 추가적인 정보를 수집할 수 있다.

음향 파라미터 설정부(230)는 디코더(210)로부터 음향 데이터를 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신할 수 있다. 음향 파라미터 설정부(230)는 음향 데이터와 환경 정보를 기초로 음향 처리를 위한 음향 파라미터를 생성할 수 있다. 여기서, 음향 파라미터는 주파수 대역 별 음향 증폭률과 보이스/배경음의 음향 증폭률과 음향 볼륨 등을 포함할 수 있다. 또한, 음향 파라미터 설정부(230)는 생성된 음향 파라미터를 음향 파라미터 학습부(240)로 출력할 수 있다.

예를 들어, 음향 파라미터 설정부(230)는 음향 모드에 따라 음향 파라미터를 생성할 수 있다. 음향 파라미터 설정부(230)는 음향 모드에 따라 주파수 대역 별 음향 증폭률과 보이스/배경음의 음향 증폭률과 음향 볼륨을 포함하는 음향 파라미터를 생성할 수 있다. 음향 파라미터 설정부(230)는 음향 모드에 대응하여 사전에 설정된 음향 파라미터들을 저장할 수 있으며, 현재 음향 모드에 대응한 음향 파라미터를 음향 파라미터 학습부(240)로 출력할 수 있다. 특히, 자동 모드에서 음향 파라미터 설정부(230)는 컨텐츠의 음향 특성에 따라 서로 다른 음향 파라미터를 생성할 수 있다. 음향 파라미터 설정부(230)는 컨텐츠의 음향 특성에 대응하여 사전에 설정된 음향 파라미터들을 저장할 수 있으며, 현재 컨텐츠의 음향 특성에 대응한 음향 파라미터를 음향 파라미터 학습부(240)로 출력할 수 있다.

이처럼, 음향 파라미터 설정부(230)는 다양한 환경 정보에 대응하여 사전에 설정된 음향 파라미터들을 저장할 수 있다. 또한, 음향 파라미터 설정부(230)는 현재의 환경 정보에 대응한 음향 파라미터를 음향 파라미터 학습부(240)로 출력할 수 있다.

음향 파라미터 설정부(230)는 환경 정보에 따라 사전에 저장된 음향 파라미터를 출력하며, 사전에 저장된 음향 파라미터는 디스플레이 장치(100)의 소프트웨어가 업데이트되지 않는 이상 변경되지 아니한다. 따라서, 음향 파라미터 설정부(230)로부터 출력되는 음향 파라미터는 사용자의 취향 또는 성향을 반영하지 못할 수 있다.

음향 파라미터 학습부(240)는 음향 파라미터 설정부(230)로부터 음향 파라미터를 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신하고, 사용자 입력부(110)로부터 사용자 입력을 수신할 수 있다.

음향 파라미터 학습부(240)는 환경 정보와 사용자 입력을 기초로 음향 파라미터에 관하여 학습할 수 있다. 또한, 음향 파라미터 학습부(240)는 학습 결과를 기초로 음향 파라미터를 수정하고, 수정된 음향 파라미터를 음향 처리부(250)로 출력할 수 있다. 특히, 음향 파라미터 학습부(240)는 음향 파라미터에 관하여 학습하고, 음향에 관한 사용자 입력이 최소화되도록 음향 파라미터를 수정할 수 있다.

음향 파라미터 학습부(240)는 강화 학습(reinforcement learning)을 이용하여 환경 정보와 사용자 입력을 기초로 음향 파라미터에 관하여 학습할 수 있다.

강화 학습은 기계 학습(machine learning)의 한 종류로서, 행동(action)에 대한 보상(reward)을 기반으로 학습한다.

기계 학습은 크게 지도 학습(supervised learning), 비지도 학습(unsupervised learning), 강화 학습으로 구분할 수 있다.

지도 학습은 설계자 또는 사용자가 데이터에 대한 레이블(정답)을 제공하여 학습 장치(예를 들어, 컴퓨터, 마이크로 프로세서 등)를 학습시키는 것을 의미하며, 비지도 학습은 설계자 또는 사용자의 개입없이 학습 장치가 스스로 데이터를 분류하고 학습하는 것을 의미한다.

강화 학습은 지도 학습과 비지도 학습의 중간쯤의 학습 방법으로, 에이전트(학습 장치)가 주어진 환경에서 동작을 수행하고 환경으로부터 보상을 획득함으로써 학습하는 것을 의미한다.

도 4에 도시된 바와 같이 강화 학습은 에이전트(agent)와 환경(environment) (또는 상태)과 행동(action)과 보상(reward)를 구성 요소로 한다.

에이전트는 행동하고 학습하는 주체를 의미하며, 디스플레이 장치(100) 또는 음향 파라미터 학습부(240)가 강화 학습의 에이전트에 해당할 수 있다.

환경은 에이전트에게 주어진 상태를 의미하며, 데이터 수집부(220)에 의하여 수집된 환경 정보가 강화 학습의 환경에 해당할 수 있다.

행동은 에이전트가 주어진 환경에서 수행하는 동작을 의미하며, 음향 파라미터 학습부(240)가 음향 파라미터 설정부(230)로부터 수신된 음향 파라미터를 수정하는 것이 강화 학습의 행동에 해당할 수 있다.

또한, 보상은 행동에 대하여 에이전트에게 주어지는 대가를 의미하며, 사용자 입력부(110)를 통하여 입력되는 사용자 입력이 강화 학습의 보상에 해당할 수 있다.

강화 학습에서, 에이전트는 주어진 환경에서 특정한 행동을 취하고, 환경으로부터 보상을 얻을 수 있다. 에이전트는 환경과 행동과 보상 사이의 상관 관계를 분석하고, 주어진 환경에서 복수의 행동들에 대한 보상을 예측할 수 있다. 나아가, 에이전트는 주어진 환경에서 최대의 보상을 획득할 수 있는 행동을 취할 수 있다.

보다 구체적으로, 에이전트는 시각t에서 주어진 환경을 기반으로 상태 s_t와 수행 가능한 행동들 A(s_t)을 판단할 수 있다. 에이전트는 행동들 A(s_t) 중 어느 하나의 행동 a_t을 취할 수 있다. 그 결과, 환경이 새로운 상태 s_t+1로 변경되고, 에이전트는 보상 r_t+1을 획득할 수 있다. 이러한 에이전트는 주어진 환경에서 행동과 보상 사이의 상호 작용을 기초로 누적 보상을 최대화하는 행동을 취하게 된다.

예를 들어, 도 5에 도시된 바와 같이 에이전트는 상태 S₁, 상태 S₂, 상태 S₃ 중 어느 하나의 상태에 놓일 있다. 각각의 상태에서 에이전트는 행동 A₁₂와 행동 A₁₃, 행동 A₂₁와 행동 A₂₃, 행동 A₃₂와 행동 A₃₁을 취할 수 있으며, 에이전트는 보상 R₁₂와 보상 R₁₃, 보상 R₂₁와 보상 R₂₃, 보상 R₃₂와 보상 R₃₁을 획득할 수 있다.

에이전트가 상태 S₁에서 행동 A₁₂를 취하면 에이전트의 상태는 상태 S₁에서 상태 S₂로 변경될 수 있으며, 에이전트는 상태 S₂에서 보상 R₁₂을 획득할 수 있다. 에이전트가 상태 S₁에서 행동 A₁₃를 취하면 에이전트의 상태는 상태 S₁에서 상태 S₃로 변경될 수 있으며, 에이전트는 상태 S₃에서 보상 R₁₃을 획득할 수 있다.

에이전트가 상태 S₂에서 행동 A₂₁를 취하면 에이전트의 상태는 상태 S₂에서 상태 S₁로 변경될 수 있으며, 에이전트는 상태 S₁에서 보상 R₂₁을 획득할 수 있다. 에이전트가 상태 S₂에서 행동 A₂₃를 취하면 에이전트의 상태는 상태 S₂에서 상태 S₃로 변경될 수 있으며, 에이전트는 상태 S₃에서 보상 R₂₃을 획득할 수 있다.

또한, 에이전트가 상태 S₃에서 행동 A₃₁를 취하면 에이전트의 상태는 상태 S₃에서 상태 S₁로 변경될 수 있으며, 에이전트는 상태 S₁에서 보상 R₃₁을 획득할 수 있다. 에이전트가 상태 S₃에서 행동 A₃₂를 취하면 에이전트의 상태는 상태 S₃에서 상태 S₂로 변경될 수 있으며, 에이전트는 상태 S₂에서 보상 R₃₂을 획득할 수 있다.

이처럼, 에이전트는 환경에 의하여 주어진 상태에서 여러 행동을 취할 수 있으며, 행동에 의하여 상태가 변환하고 에이전트에게 보상이 주어진다.

에이전트는 환경에 의하여 주어진 상태에서 행동을 선택하기 위하여 [수학식 1]과 같은 정책 함수 π를 가질 수 있다.

[수학식 1]

단, π는 정책 함수를 나타내고, s_t는 시간 t에서의 상태를 나타내고, a_t는 시간 t에서의 에이전트의 행동을 나타낼 수 있다.

에이전트가 주어진 환경에서 행동을 취하면 [수학식 2]와 같은 보상이 주어질 수 있다.

[수학식 2]

단, r은 보상 함수를 나타내고, s_t는 시간 t에서의 상태를 나타내고, a_t는 시간 t에서의 에이전트의 행동을 나타내고, s_t+1는 시간 t+1에서의 상태를 나타내고, r_t+1은 시간 t+1에서 에이전트에 주어지는 보상을 나타낼 수 있다.

에이전트가 미래에 받을 보상은 [수학식 3]과 같이 주어질 수 있다.

[수학식 3]

단, R_t는 시간 t 이후 에이전트가 받을 보상을 나타내고, r_t+1은 시간 t+1에서 에이전트에 주어지는 보상을 나타내고, γ는 미래의 보상을 차감하기 위한 0과 1 사이의 차감 인자(discount factor)를 나타낼 수 있다.

강화 학습을 이용한 음향 파라미터 학습부(240)는 주어진 환경에서 특정한 행동을 취하고, 환경으로부터 보상을 획득할 수 있다. 예를 들어, 음향 파라미터 학습부(240)는 주어진 환경 정보를 기초로 음향 파라미터를 수정하고, 사용자로부터 사용자 입력을 수신할 수 있다. 또한, 음향 파라미터 학습부(240)는 사용자 입력에 의한 보상을 획득할 수 있다.

음향 파라미터 학습부(240)는 환경 정보(상태)와 음향 파라미터(행동)와 사용자 입력(보상) 사이의 상관 관계를 분석하고, 주어진 환경 정보에서 음향 파라미터에 의한 사용자 입력을 예측할 수 있다. 나아가, 음향 파라미터 학습부(240)는 주어진 환경 정보에서 최대의 보상(최소의 사용자 입력)을 획득할 수 있도록 음향 파라미터를 수정할 수 있다.

음향 파라미터 학습부(240)는 다양한 시점 및/또는 다양한 조건에서 행동을 취할 수 있다.

음향 파라미터의 변경을 사용자가 인지하지 못하도록 음향 파라미터 학습부(240)는 사용자 입력에 응답하여 행동을 취할 수 있다. 예를 들어, 사용자가 방송 채널을 변경하거나 컨텐츠를 변경할 때, 음향 파라미터 학습부(240)는 음향 파라미터 설정부(230)에 의하여 설정된 음향 파라미터를 변경할 수 있다.

예를 들어, 디스플레이 장치(100)는 아침 시간대에 표준 모드로 10의 음향 볼륨으로 영화를 재생할 수 있다. 이때 사용자 입력에 의하여 디스플레이 장치(100)에 의하여 재생되는 컨텐츠가 영화로부터 음악 공연으로 변경될 수 있다.

음향 파라미터 학습부(240)는 데이터 수집부(220)로부터 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 시청 시간 등 포함하는 환경 정보를 수신할 수 있으며, 음향 파라미터 학습부(240)는 현재 상태를 판단할 수 있다. 현재 상태에서 음향 파라미터 학습부(240)는 음향 파라미터를 수정할 수 있다. 구체적으로, 음향 파라미터 학습부(240)는 음향 모드를 변경하거나 음향 볼륨을 변경할 수 있다.

음향 파라미터 학습부(240)가 음향 모드를 변경하거나 음향 볼륨을 변경하면, 환경 정보가 변경되고 새로운 상태가 된다. 또한, 음향 파라미터 학습부(240)는 데이터 수집부(220)로부터 새로운 환경 정보를 수신할 수 있다.

이처럼, 사용자 입력은 음향 볼륨의 변경, 음향 모드의 변경 등에 의한 사용자 취향 또는 성향을 반영하며, 사용자는 변경된 음향 볼륨 또는 음향 모드에 만족하면 볼륨에 관한 사용자 입력을 입력하지 아니하고 변경된 음향 볼륨 또는 음향 모드에 만족하지 못하면 사용자 입력을 입력할 수 있다. 다시 말해, 사용자 입력은 주어진 환경 즉 주어진 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 시청 시간에서 사용자의 음향 만족도를 나타낼 수 있으며, 사용자 입력에 따라 보상이 주어질 수 있다.

만일, 새로운 상태에서 사용자 입력부(110)를 통하여 음향에 관한 사용자 입력이 수신되면 음향 파라미터 학습부(240)은 낮은 보상을 획득하거나, 음향 파라미터 학습부(240)의 누적 보상이 차감될 수 있다.

반면, 새로운 상태에서 사용자 입력부(110)를 통하여 음향에 관한 사용자 입력이 수신되지 아니하면, 음향 파라미터 학습부(240)는 높은 보상을 획득하거나 음향 파라미터 학습부(240)의 누적 보상을 증가될 수 있다.

도 6의 (a)에 도시된 바와 같이 음향 파라미터 학습부(240)가 표준 모드를 음악 모드로 변경한 경우, 사용자는 재생되는 음악에 만족감을 느끼고 음향 모드를 유지할 수 있다. 이처럼 음향 파라미터 학습부(240)의 행동(음향 모드를 표준 모드에서 음악 모드로 변경)에 의하여 사용자 입력이 입력되지 아니하였으므로, 음향 파라미터 학습부(240)는 높은 보상을 획득할 수 있다.

도 6의 (b)에 도시된 바와 같이 음향 파라미터 학습부(240)가 표준 모드를 음성 모드로 변경한 경우, 사용자는 재생되는 음악에 불만을 느끼고 음향 모드를 표준 모드로 되돌릴 수 있다. 이처럼, 음향 파라미터 학습부(240)의 행동(음향 모드를 표준 모드에서 음성 모드로 변경)에 의하여 사용자 입력이 입력되므로, 음향 파라미터 학습부(240)는 낮은 보상을 획득할 수 있다.

이러한 학습의 결과, 높은 보상을 획득하기 위하여 음향 파라미터 학습부(240)는 아침 시간대에 표준 모드로 10의 음향 볼륨으로 음악 공연을 재생하는 상태에서 음향 모드를 음악 모드로 변경하는 정책을 생성할 수 있다.

도 7의 (a)에 도시된 바와 같이, 음향 파라미터 학습부(240)가 음향 볼륨을 11로 높이는 경우, 사용자는 아침 시간대를 고려하여 음향 볼륨을 낮추기 위한 사용자 입력을 입력할 수 있다. 이처럼, 음향 파라미터 학습부(240)의 행동(음향 볼륨을 높임)에 의하여 사용자 입력이 입력되므로, 음향 파라미터 학습부(240)는 낮은 보상을 획득할 수 있다.

도 7의 (b)에 도시된 바와 같이, 음향 파라미터 학습부(240)가 음향 볼륨을 9로 낮추는 경우, 사용자는 아침 시간대를 고려하여 음향 볼륨을 낮춘 것에 만족할 수 있다. 이처럼, 음향 파라미터 학습부(240)의 행동(음향 볼륨을 낮춤)에 의하여 사용자 입력이 입력되지 아니하므로, 음향 파라미터 학습부(240)는 높은 보상을 획득할 수 있다.

이러한 학습의 결과, 높은 보상을 획득하기 위하여 음향 파라미터 학습부(240)는 아침 시간대에 표준 모드로 10의 음향 볼륨으로 음악 공연을 재생하는 상태에서 음향 볼륨을 낮추는 정책을 생성할 수 있다.

음향 파라미터 학습부(240)는 생성된 정책에 따라 음향 파라미터의 설정값을 변경하고, 변경된 음향 파라미터의 설정값을 기초로 음향 처리부(250)로 음향 파라미터를 출력할 수 있다.

또한, 음향 파라미터의 변경을 사용자가 인지하지 못하도록 음향 파라미터 학습부(240)는 디스플레이 장치(100)의 턴온에 응답하여 행동을 취할 수 있다. 또한, 디스플레이 장치(100)가 온 상태에서 동작하는 동안 음향 파라미터 학습부(240)는 보상을 획득할 수 있다.

예를 들어, 디스플레이 장치(100)가 오프 상태에서 사용자 입력에 의하여 턴온되면 음향 파라미터 학습부(240)는 그 동안의 학습 결과를 바탕으로 음향 파라미터 설정부(230)의 음향 파라미터를 변경할 수 있다. 또한, 디스플레이 장치(100)가 동작하는 동안 입력된 사용자 입력에 따라 음향 파라미터 학습부(240)는 보상을 획득할 수 있다.

디스플레이 장치(100)는 턴온된 이후 시간의 흐름에 따라 복수의 컨텐츠들을 순차적으로 재생할 수 있다. 디스플레이 장치(100)가 턴온될 때 음향 파라미터 학습부(240)는 학습 결과를 기초로 음향 파라미터의 수정값을 판단할 수 있다.

음향 파라미터 학습부(240)는 컨텐츠의 변경에 의한 컨텐츠 장르의 변화 여부에 따라 상태를 판단할 수 있다. 예를 들어, 도 8의 (a)에 도시된 바와 같이 컨텐츠 장르가 변경되는 상태 S₁과 컨텐츠 장르가 변경되지 않는 상태 S₂가 정의될 수 있으며, 음향 파라미터 학습부(240)는 컨텐츠 장르의 변경 여부에 따라 강화 학습의 상태를 판단할 수 있다. 디스플레이 장치(100)에 의하여 재생되는 컨텐츠의 장르가 이전 컨텐츠의 장르와 동일하면 음향 파라미터 학습부(240)는 상태 S₁으로 판단하고, 디스플레이 장치(100)에 의하여 재생되는 컨텐츠의 장르가 이전 컨텐츠의 장르와 상이하면 음향 파라미터 학습부(240)는 상태 S₂로 판단할 수 있다.

음향 파라미터 설정부(230)와 음향 파라미터 학습부(240)는 컨텐츠 장르에 따라 서로 다른 음향 파라미터를 설정할 수 있다. 예를 들어, 음향 파라미터 설정부(230)와 음향 파라미터 학습부(240)는 컨텐츠 장르에 따라 서로 다른 음향 모드를 설정하거나 서로 다른 음향 볼륨을 설정할 수 있다.

따라서, 컨텐츠 장르가 변경되는 상태 S₁에서 음향 파라미터가 변경되며, 컨텐츠 장르가 변경되지 않는 상태 S₂에서 음향 파라미터는 변경되지 아니할 수 있다.

사용자는 컨텐츠 및 음향에 따라 음향 모드 변경 및/또는 음향 볼륨 변경 등 의 사용자 입력을 입력할 수 있으며, 사용자 입력에 따라 음향 파라미터 학습부(240)는 보상을 획득할 수 있다. 예를 들어, 도 8의 (b)에 도시된 바와 같이, 음향 모드가 변경되면 음향 파라미터 학습부(240)는 '-10'의 보상을 획득할 수 있으며, 음향 모드가 유지되면 음향 파라미터 학습부(240)는 '+10'의 보상을 획득할 수 있다. 또한, 음향 볼륨이 변경되면 음향 파라미터 학습부(240)는 '-3'의 보상을 획득할 수 있으며, 음향 볼륨이 유지되면 음향 파라미터 학습부(240)는 '+3'의 보상을 획득할 수 있다.

이처럼, 음향 파라미터 학습부(240)는 디스플레이 장치(100)가 턴온된 동안 사용자 입력에 의하여 보상을 획득할 수 있다. 이후, 디스플레이 장치(100)가 턴오프된 이후 다시 턴온될 때, 음향 파라미터 학습부(240)는 획득된 보상을 기초로 보상을 최대화하기 위한 정책을 생성하고, 생성된 정책에 따라 음향 파라미터의 설정값을 변경할 수 있다. 또한, 음향 파라미터 학습부(240)는 변경된 음향 파라미터의 설정값을 기초로 음향 처리부(250)로 음향 파라미터를 출력할 수 있다.

음향 처리부(250)는 디코더(210)로부터 음향 데이터를 수신하고, 음향 파라미터 학습부(240)로부터 수정된 음향 파라미터를 수신할 수 있다. 음향 처리부(250)는 음향 파라미터에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다. 또한, 음향 처리부(250)는 음향 신호를 음향부(160)로 출력할 수 있다.

예를 들어, 음향 처리부(250)는 음향 파라미터 학습부(240)로부터 수신된 음향 볼륨에 따라 음향 데이터를 처리할 수 있다. 다시 말해, 음향 처리부(250)는 음향 파라미터 학습부(240)로부터 수신된 음향 볼륨에 따라 음향 신호의 세기를 조절할 수 있다.

또한, 음향 처리부(250)는 음향 데이터를 보이스와 배경음으로 구별하고, 음향 파라미터 학습부(240)로부터 수신된 음향 모드에 따라 보이스와 배경음을 각각 서로 다른 증폭률로 증폭할 수 있다. 음향 처리부(250)는 표준 모드에서 동일한 증폭률로 보이스와 배경음을 증폭할 수 있고, 음악 모드에서 배경음을 보이스보다 높은 증폭률로 증폭할 수 있으며, 음성 모드에서 보이스를 배경음보다 높은 증폭률로 증폭할 수 있다. 자동 모드에서 음향 처리부(250)는 음향 파라미터 학습부(240)로부터 수신된 증폭률에 따라 보이스와 배경음을 각각 증폭할 수 있다.

이상에서 설명된 바와 같이, 제어부(140)는 음향 압축 표준을 이용하여 컨텐츠 데이터로부터 음향 데이터를 복원할 수 있으며, 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 현재 시각 및 시청 시간(time duration) 등의 환경 정보를 수집할 수 있다. 제어부(140)는 음향 데이터를 처리하기 위한 음향 파라미터를 생성할 수 있으며, 환경 정보와 사용자 입력에 기초한 강화 학습을 이용하여 음향 파라미터를 수정할 수 있다. 또한, 제어부(140)는 강화 학습에 의하여 수정된 음향 파라미터에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다.

이처럼, 제어부(140)가 강화 학습을 이용하여 음향 파라미터를 수정함으로써, 디스플레이 장치(100)는 시청 시각 및 외부 잡음 등의 주변 환경 및 사용자의 취향/성향에 부합하는 최적의 음향을 제공할 수 있다.

도 9는 일 실시예에 의한 디스플레이 장치의 음향 처리 방법을 도시한다.

도 9과 함께, 디스플레이 장치(100)의 음향 처리 방법(1000)이 설명된다.

디스플레이 장치(100)는 음향 데이터를 획득한다(1010).

컨텐츠 수신부(120) 및/또는 통신부(130)는 컨텐츠 소스로부터 컨텐츠 데이터를 수신하고, 수신된 컨텐츠 데이터를 제어부(140)로 출력할 수 있다.

제어부(140)는 컨텐츠 수신부(120) 및/또는 통신부(130)로부터 컨텐츠 데이터를 수신하고, 영상 압축 표준 및 음향 압축 표준을 이용하여 컨텐츠 데이터를 디코딩하여 영상 데이터와 음향 데이터를 복원할 수 있다.

디스플레이 장치(100)는 환경 정보를 수집한다(1020).

제어부(140)는 강화 학습을 위한 환경 정보를 수집할 수 있다. 예를 들어, 제어부(140)는 컨텐츠의 음향 특성, 음향 모드, 음향 볼륨, 외부 잡음, 현재 시각 및 시청 시간 등을 수집할 수 있다.

구체적으로, 제어부(140)는 음향 데이터 및/또는 음향의 메타 데이터를 기초로 컨텐츠 장르 및 음향 특성을 판단할 수 있으며, 음향 모드 및 음향 볼륨을 선택하는 사용자 입력을 기초로 음향 모드 및 음향 볼륨을 판단할 수 있다. 또한, 제어부(140)는 마이크(163)를 통하여 수집된 음향 신호의 크기를 기초로 외부 잡음을 판단할 수 있으며, 타이머의 출력을 기초로 현재 시각 및 사용자의 시청 시간을 판단할 수 있다.

디스플레이 장치(100)는 음향 파라미터를 설정한다(1030).

제어부(140)는 환경 정보를 기초로 음향 파라미터를 설정할 수 있다. 여기서, 음향 파라미터는 보이스/배경음의 음향 증폭률과 음향 볼륨을 포함할 수 있다. 예를 들어, 음향 모드에 따라 음향 파라미터를 설정할 수 있다. 구체적으로, 제어부(140)는 음향 모드에 대응하여 사전에 설정된 음향 파라미터를 저장할 수 있으며, 현재의 음향 모드 및/또는 현재의 컨텐츠의 음향 특성에 대응한 음향 파라미터를 설정할 수 있다.

디스플레이 장치(100)는 강화 학습을 기초로 음향 파라미터를 수정한다(1040).

제어부(140)는 강화 학습을 이용하여 환경 정보와 사용자 입력을 기초로 음향 파라미터에 관하여 학습할 수 있다.

구체적으로, 제어부(140)는 주어진 환경에서 특정한 행동을 취하고, 환경으로부터 보상을 얻을 수 있다. 예를 들어, 제어부(140)는 주어진 환경 정보를 기초로 음향 파라미터를 수정하고, 사용자로부터 사용자 입력을 수신할 수 있다. 또한, 제어부(140)는 사용자 입력을 기초로 보상을 획득할 수 있다.

또한, 제어부(140)는 환경 정보와 음향 파라미터와 사용자 입력 사이의 상관 관계를 분석하고, 주어진 환경 정보에서 음향 파라미터를 수정할 때 사용자 입력 즉 보상을 예측할 수 있다. 나아가, 제어부(140)는 주어진 환경 정보에서 최대의 보상 즉 최소의 사용자 입력을 획득할 수 있도록 음향 파라미터를 수정할 수 있다.

제어부(140)는 다양한 시점에 음향 파라미터를 설정 및 수정할 수 있다. 예를 들어, 음향 파라미터의 변경을 사용자가 인지하지 못하도록 제어부(140)는 사용자 입력(예를 들어, 채널 변경, 컨텐츠 변경 등)에 응답하여 음향 파라미터를 설정 및 수정하거나, 제어부(140)는 디스플레이 장치(100)가 오프 상태에서 턴온될 때 음향 파라미터를 설정 및 수정할 수 있다.

디스플레이 장치(100)는 음향 데이터를 처리하고, 음향을 출력한다(1050).

제어부(140)는 음향 파라미터에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다. 예를 들어, 제어부(140)는 음향 볼륨에 따라 음향 신호의 크기를 조절할 수 있다. 또한, 제어부(140)는 음향 데이터를 보이스와 배경음으로 구별하고, 음향 파라미터 학습부(240)로부터 수신된 음향 모드에 따라 보이스와 배경음을 각각 서로 다른 증폭률로 증폭할 수 있다.

또한, 제어부(140)는 음향 신호를 음향부(160)로 출력할 수 있으며, 음향부(160)는 음향 신호를 음향(음파)로 변환할 수 있다.

디스플레이 장치(100)는 음향과 관련된 사용자 입력이 수신되는지를 판단한다(1060).

사용자는 디스플레이 장치(100)의 음향을 청취하고, 음향 모드 및/또는 음향 볼륨을 수정하기 위한 사용자 입력을 입력할 수 있다. 제어부(140)는 사용자 입력부(110)를 통하여 음향 모드 및/또는 음향 볼륨을 수정하기 위한 사용자 입력을 수신할 수 있다.

사용자 입력이 수신되면(1060의 예), 디스플레이 장치(100)는 강화 학습과 관련하여 제1 보상을 획득한다(1070).

제어부(140)는 음향에 관한 사용자 입력이 최소화되도록 학습되므로, 사용자 입력이 수신되면 제어부(140)는 낮은 보상(예를 들어, 음의 보상)을 획득하거나 제어부(140)의 누적 보상이 차감될 수 있다.

사용자 입력이 수신되지 않으면(1060의 아니오), 디스플레이 장치(100)는 강화 학습과 관련하여 제2 보상을 획득한다(1080).

제어부(140)는 음향에 관한 사용자 입력이 최소화되도록 학습되므로, 사용자 입력이 수신되면 제어부(140)는 높은 보상(예를 들어, 양의 보상)을 획득하거나 제어부(140)의 누적 보상은 증가될 수 있다.

사용자 입력의 수신 여부에 따라 다른 보상을 획득함으로써 제어부(140)는 사용자 입력이 최소화되도록 음향 데이터를 처리할 수 있다.

이상에서 설명된 바와 같이 디스플레이 장치(100)는 강화 학습을 이용하여 사용자의 취향 및 성향에 맞춘 음향 데이터의 처리에 관하여 학습하고, 학습 결과에 따라 사용자의 취향 및 성향에 맞추어 음향 데이터를 처리할 수 있다.

이하에서는 디스플레이 장치의 강화 학습의 다른 일 예가 설명된다.

도 10은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 다른 일 예를 도시한다. 도 11은 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.

도 10 및 도 11을 참조하면, 제어부(140)는 디코더(210)와, 데이터 수집부(220)와, 음향 볼륨 설정부(231)와, 음향 볼륨 학습부(241)와, 음향 처리부(250)를 포함한다. 디코더(210)와, 데이터 수집부(220)와, 음향 볼륨 설정부(231)와, 음향 볼륨 학습부(241)와, 음향 처리부(250)는 각각 메모리(142)에 저장되고 마이크로 프로세서(141)에 의하여 실행되는 어플리케이션(소프트웨어)로 구현되거나, 마이크로 프로세서(141) 내부에 실장된 디지털 회로(하드웨어)로 구현될 수 있다.

디코더(210)와, 데이터 수집부(220)는 도 3에 도시된 것들과 동일할 수 있다.

음향 볼륨 설정부(231)는 디코더(210)로부터 음향 데이터를 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신할 수 있다. 음향 볼륨 설정부(231)는 음향 데이터와 환경 정보를 기초로 음향 볼륨 값을 생성할 수 있다. 예를 들어, 음향 볼륨 설정부(231)는 음향 모드에 따라 음향 볼륨 값을 생성할 수 있다. 또한, 음향 볼륨 설정부(231)는 생성된 음향 볼륨 값을 음향 볼륨 학습부(241)로 출력할 수 있다.

이처럼, 음향 볼륨 설정부(231)는 다양한 환경 정보에 대응하여 사전에 설정된 음향 볼륨 값을 저장할 수 있으며, 현재 환경 정보에 대응한 음향 볼륨 값을 음향 볼륨 학습부(241)로 출력할 수 있다.

음향 볼륨 학습부(241)는 음향 볼륨 설정부(231)로부터 음향 볼륨 값을 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신하고, 사용자 입력부(110)로부터 사용자 입력을 수신할 수 있다.

음향 볼륨 학습부(241)는 환경 정보와 사용자 입력을 기초로 음향 볼륨 값에 관하여 학습할 수 있다. 또한, 음향 볼륨 학습부(241)는 학습 결과를 기초로 음향 볼륨 값을 수정하고, 수정된 음향 볼륨 값을 음향 처리부(250)로 출력할 수 있다. 특히, 음향 볼륨 학습부(241)는 음향 볼륨 값에 관하여 학습하고, 음향에 관한 사용자 입력이 최소화되도록 음향 볼륨 값을 수정할 수 있다.

음향 볼륨 학습부(241)는 강화 학습을 이용하여 환경 정보와 사용자 입력을 기초로 음향 볼륨에 관하여 학습할 수 있다.

강화 학습을 이용한 음향 볼륨 학습부(241)는 주어진 환경에서 특정한 행동을 취하고, 환경으로부터 보상을 획득할 수 있다. 예를 들어, 음향 볼륨 학습부(241)는 주어진 환경 정보를 기초로 음향 볼륨 값을 수정하고, 사용자로부터 사용자 입력을 수신할 수 있다. 또한, 음향 볼륨 학습부(241)는 사용자 입력에 의한 보상을 획득할 수 있다.

음향 볼륨 학습부(241)는 환경 정보(상태)와 음향 볼륨 값(행동)과 사용자 입력(보상) 사이의 상관 관계를 분석하고, 주어진 환경 정보에서 음향 볼륨 값에 의한 사용자 입력을 예측할 수 있다. 나아가, 음향 볼륨 학습부(241)는 주어진 환경 정보에서 최대의 보상(최소의 사용자 입력)을 획득할 수 있도록 음향 볼륨 값을 수정할 수 있다.

예를 들어, 도 11에 도시된 바와 같이 음향 볼륨이 '7'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '6'으로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향 볼륨을 증가시키는 사용자 입력을 수신할 수 있다. 음향 볼륨이 '7'인 상태에서 음량 볼륨 다운에 의하여 음향 볼륨 학습부(241)는 '-3'의 보상을 획득할 수 있다.

음향 볼륨이 '7'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '8'로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향에 관한 사용자 입력을 수신하지 아니할 수 있다. 음향 볼륨이 '7'인 상태에서 음향 볼륨 업에 의하여 음향 볼륨 학습부(241)는 '+3'의 보상을 획득할 수 있다.

이상의 학습 결과, 음향 볼륨 학습부(241)는 보상을 최대화하기 위하여 음향 볼륨이 '7'인 상태에서 음향 볼륨을 증가시키는 정책을 생성할 수 있다.

또한, 음향 볼륨이 '8'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '7'으로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향 볼륨을 증가시키는 사용자 입력을 수신할 수 있다. 음향 볼륨이 '8'인 상태에서 음량 볼륨 다운에 의하여 음향 볼륨 학습부(241)는 '-3'의 보상을 획득할 수 있다.

음향 볼륨이 '8'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '9'로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향 볼륨을 감소시키는 사용자 입력을 수신할 수 있다. 음향 볼륨이 '8'인 상태에서 음량 볼륨 업에 의하여 음향 볼륨 학습부(241)는 '-3'의 보상을 획득할 수 있다.

이상의 학습 결과, 음향 볼륨 학습부(241)는 보상을 최대화하기 위하여 음향 볼륨이 '8'인 상태에서 음향 볼륨을 유지시키는 정책을 생성할 수 있다.

또한, 음향 볼륨이 '9'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '8'으로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향에 관한 사용자 입력을 수신하지 아니할 수 있다. 음향 볼륨이 '9'인 상태에서 음량 볼륨 다운에 의하여 음향 볼륨 학습부(241)는 '+3'의 보상을 획득할 수 있다.

음향 볼륨이 '9'인 상태에서 음향 볼륨 학습부(241)는 음향 볼륨 값을 '10'으로 수정할 수 있다. 이후, 디스플레이 장치(100)는 음향 볼륨을 감소시키는 사용자 입력을 수신할 수 있다. 음향 볼륨이 '9'인 상태에서 음량 볼륨 업에 의하여 음향 볼륨 학습부(241)는 '-3'의 보상을 획득할 수 있다.

이상의 학습 결과, 음향 볼륨 학습부(241)는 보상을 최대화하기 위하여 음향 볼륨이 '9'인 상태에서 음향 볼륨을 감소시키는 정책을 생성할 수 있다.

음향 볼륨 학습부(241)는 생성된 정책에 따라 음향 볼륨의 설정값을 변경하고, 변경된 음향 볼륨의 설정값을 기초로 음향 처리부(250)로 음향 볼륨 값을 출력할 수 있다.

음향 처리부(250)는 디코더(210)로부터 음향 데이터를 수신하고, 음향 볼륨 학습부(241)로부터 수정된 음향 볼륨 값을 수신할 수 있다. 음향 처리부(250)는 음향 볼륨 값에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다. 구체적으로, 음향 처리부(250)는 음향 볼륨 값에 따라 음향 신호의 세기를 제어할 수 있다. 또한, 음향 처리부(250)는 음향 신호를 음향부(160)로 출력할 수 있다.

이상에서 설명된 바와 같이, 제어부(140)는 음향 데이터를 처리하기 위한 음향 볼륨 값을 생성할 수 있으며, 환경 정보와 사용자 입력에 기초한 강화 학습을 이용하여 음향 볼륨 값을 수정할 수 있다. 또한, 제어부(140)는 강화 학습에 의하여 수정된 음향 볼륨 값에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다.

이처럼, 제어부(140)가 강화 학습을 이용하여 음향 볼륨 값을 수정함으로써, 디스플레이 장치(100)는 시청 시각 및 외부 잡음 등의 주변 환경 및 사용자의 취향/성향에 부합하는 최적의 음향을 제공할 수 있다.

도 12은 일 실시예에 의한 디스플레이 장치에 포함된 제어부의 다른 일 예를 도시한다. 도 13는 일 실시예에 의한 디스플레이 장치의 강화 학습을 설명하기 위한 도면이다.

도 12 및 도 13을 참조하면, 제어부(140)는 디코더(210)와, 데이터 수집부(220)와, 음향 렌더링 설정부(232)와, 음향 렌더링 학습부(242)와, 음향 처리부(250)를 포함한다. 디코더(210)와, 데이터 수집부(220)와, 음향 렌더링 설정부(232)와, 음향 렌더링 학습부(242)와, 음향 처리부(250)는 각각 메모리(142)에 저장되고 마이크로 프로세서(141)에 의하여 실행되는 어플리케이션(소프트웨어)로 구현되거나, 마이크로 프로세서(141) 내부에 실장된 디지털 회로(하드웨어)로 구현될 수 있다.

음향 렌더링 설정부(232)는 디코더(210)로부터 음향 데이터를 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신할 수 있다. 음향 렌더링 설정부(232)는 음향 데이터와 환경 정보를 기초로 보이스/배경음의 증폭률을 생성할 수 있다. 예를 들어, 음향 렌더링 설정부(232)는 음향 모드에 따라 보이스/배경음의 증폭률을 생성할 수 있다. 또한, 음향 렌더링 설정부(232)는 생성된 보이스/배경음의 증폭률을 음향 렌더링 학습부(242)로 출력할 수 있다.

이처럼, 음향 렌더링 설정부(232)는 다양한 환경 정보에 대응하여 사전에 설정된 보이스/배경음의 증폭률을 저장할 수 있으며, 현재 환경 정보에 대응한 보이스/배경음의 증폭률을 음향 렌더링 학습부(242)로 출력할 수 있다.

음향 렌더링 학습부(242)는 음향 렌더링 설정부(232)로부터 보이스/배경음의 증폭률을 수신하고, 데이터 수집부(220)로부터 환경 정보를 수신하고, 사용자 입력부(110)로부터 사용자 입력을 수신할 수 있다.

음향 렌더링 학습부(242)는 환경 정보와 사용자 입력을 기초로 보이스/배경음의 증폭률에 관하여 학습할 수 있다. 또한, 음향 렌더링 학습부(242)는 학습 결과를 기초로 보이스/배경음의 증폭률을 수정하고, 수정된 보이스/배경음의 증폭률을 음향 처리부(250)로 출력할 수 있다. 특히, 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률에 관하여 학습하고, 음향에 관한 사용자 입력이 최소화되도록 보이스/배경음의 증폭률을 수정할 수 있다.

음향 렌더링 학습부(242)는 강화 학습을 이용하여 환경 정보와 사용자 입력을 기초로 보이스/배경음의 증폭률에 관하여 학습할 수 있다.

강화 학습을 이용한 음향 렌더링 학습부(242)는 주어진 환경에서 특정한 행동을 취하고, 환경으로부터 보상을 획득할 수 있다. 예를 들어, 음향 렌더링 학습부(242)는 주어진 환경 정보를 기초로 보이스/배경음의 증폭률을 수정하고, 사용자로부터 사용자 입력을 수신할 수 있다. 또한, 음향 렌더링 학습부(242)는 사용자 입력에 의한 보상을 획득할 수 있다.

음향 렌더링 학습부(242)는 환경 정보(상태)와 보이스/배경음의 증폭률(행동)과 사용자 입력(보상) 사이의 상관 관계를 분석하고, 주어진 환경 정보에서 보이스/배경음의 증폭률에 의한 사용자 입력을 예측할 수 있다. 나아가, 음향 렌더링 학습부(242)는 주어진 환경 정보에서 최대의 보상(최소의 사용자 입력)을 획득할 수 있도록 보이스/배경음의 증폭률을 수정할 수 있다.

예를 들어, 도 13에 도시된 바와 같이 음향 모드가 '표준 모드'인 상태에서 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률을 변경하기 위하여 음향 모드를 '음악 모드'로 변경할 수 있다. 보이스/배경음의 증폭률은 음향 모드의 변경에 의하여 변경될 수 있다. 이후, 디스플레이 장치(100)는 음향 모드를 '자동 모드'로 변경하는 사용자 입력을 수신할 수 있다. 음향 모드가 '표준 모드'인 상태에서 '음악 모드'로의 수정에 의하여 음향 렌더링 학습부(242)는 '-10'의 보상을 획득할 수 있다.

음향 모드가 '표준 모드'인 상태에서 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률을 변경하기 위하여 음향 모드를 '음성 모드'로 변경할 수 있다. 이후, 디스플레이 장치(100)는 음향 모드를 '자동 모드'로 변경하는 사용자 입력을 수신할 수 있다. 음향 모드가 '표준 모드'인 상태에서 '음성 모드'로의 수정에 의하여 음향 렌더링 학습부(242)는 '-10'의 보상을 획득할 수 있다.

음향 모드가 '표준 모드'인 상태에서 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률을 변경하기 위하여 음향 모드를 '자동 모드'로 변경할 수 있다. 이후, 디스플레이 장치(100)는 음향에 관한 사용자 입력을 수신하지 아니할 수 있다. 음향 모드가 '표준 모드'인 상태에서 '자동 모드'로의 수정에 의하여 음향 렌더링 학습부(242)는 '+10'의 보상을 획득할 수 있다.

이상의 학습 결과, 음향 볼륨 학습부(241)는 보상을 최대화하기 위하여 음향 모드가 '표준 모드'인 상태에서 음향 모드를 '자동 모드'로 변경하는 정책을 생성할 수 있다.

음향 모드가 '음악 모드'인 상태에서 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률을 변경하기 위하여 음향 모드를 '자동 모드'로 변경할 수 있다. 이후, 디스플레이 장치(100)는 음향 모드를 '음악 모드'로 되돌리는 사용자 입력을 수신할 수 있다. 음향 모드가 '음악 모드'인 상태에서 '자동 모드'로의 수정에 의하여 음향 렌더링 학습부(242)는 '-10'의 보상을 획득할 수 있다.

음향 모드가 '음성 모드'인 상태에서 음향 렌더링 학습부(242)는 보이스/배경음의 증폭률을 변경하기 위하여 음향 모드를 '자동 모드'로 변경할 수 있다. 이후, 디스플레이 장치(100)는 음향 모드를 '음성 모드'로 되돌리는 사용자 입력을 수신할 수 있다. 음향 모드가 '음성 모드'인 상태에서 '자동 모드'로의 수정에 의하여 음향 렌더링 학습부(242)는 '-10'의 보상을 획득할 수 있다.

이상의 학습 결과, 음향 볼륨 학습부(241)는 보상을 최대화하기 위하여 음향 모드가 '음악 모드' 또는 '음성 모드'인 상태에서 음향 모드를 변경하지 아니하는 정책을 생성할 수 있다.

음향 볼륨 학습부(241)는 생성된 정책에 따라 음향 모드의 설정값을 변경하고, 변경된 음향 모드의 설정값을 기초로 음향 처리부(250)로 보이스/배경음의 증폭률을 출력할 수 있다.

음향 처리부(250)는 디코더(210)로부터 음향 데이터를 수신하고, 음향 렌더링 학습부(242)로부터 수정된 보이스/배경음의 증폭률을 수신할 수 있다. 음향 처리부(250)는 보이스/배경음의 증폭률에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다. 구체적으로, 음향 처리부(250)는 음향 데이터를 보이스 데이터와 배경음 데이터로 분리하고, 보이스/배경음의 증폭률에 따라 보이스 신호와 배경음 신호를 증폭할 수 있다. 또한, 음향 처리부(250)는 생성된 음향 신호를 음향부(160)로 출력할 수 있다.

이상에서 설명된 바와 같이, 제어부(140)는 음향 데이터를 처리하기 위한 보이스/배경음의 증폭률을 생성할 수 있으며, 환경 정보와 사용자 입력에 기초한 강화 학습을 이용하여 보이스/배경음의 증폭률을 변경할 수 있다. 또한, 제어부(140)는 강화 학습에 의하여 수정된 보이스/배경음의 증폭률에 따라 음향 데이터를 처리하고, 음향 신호를 생성할 수 있다.

이처럼, 제어부(140)가 강화 학습을 이용하여 보이스/배경음의 증폭률을 수정함으로써, 디스플레이 장치(100)는 시청 시각 및 외부 잡음 등의 주변 환경 및 사용자의 취향/성향에 부합하는 최적의 음향을 제공할 수 있다.

한편, 개시된 실시예들은 컴퓨터에 의해 실행 가능한 명령어를 저장하는 기록매체의 형태로 구현될 수 있다. 명령어는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 프로그램 모듈을 생성하여 개시된 실시예들의 동작을 수행할 수 있다. 기록매체는 컴퓨터로 읽을 수 있는 기록매체로 구현될 수 있다.

컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터에 의하여 해독될 수 있는 명령어가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다.

이상에서와 같이 첨부된 도면을 참조하여 개시된 실시예들을 설명하였다. 게시된 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 게시된 실시예의 기술적 사상이나 필수적인 특징을 변경하지 않고도, 개시된 실시예들과 다른 형태로 실시될 수 있음을 이해할 것이다. 개시된 실시예들은 예시적인 것이며, 한정적으로 해석되어서는 안 된다.

100: 디스플레이 시스템

Claims

삭제
삭제
사용자 입력을 수신하는 사용자 입력부;
컨텐츠 소스로부터 컨텐츠 데이터를 수신하는 컨텐츠 수신부;
상기 컨텐츠 데이터에 포함된 영상을 표시하는 표시부;
상기 컨텐츠 데이터에 포함된 음향을 출력하는 음향부;
상기 컨텐츠 데이터를 음향 데이터로 디코딩하고, 상기 사용자 입력을 기초로 음향 파라미터에 관한 강화 학습의 결과에 따라 상기 음향 파라미터를 설정하고, 상기 설정된 음향 파라미터에 따라 상기 음향 데이터를 음향 신호로 변환하고, 상기 음향 신호에 대응하는 음향을 출력하도록 상기 음향부를 제어하는 프로세서를 포함하고,
상기 프로세서는 환경 정보를 기초로 상기 음향 파라미터를 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 파라미터를 변경하고,
상기 음향을 출력한 이후 음향에 관한 사용자 입력이 입력되면 상기 프로세서는 상기 사용자 입력에 의하여 획득된 제1 보상을 처리하고,
상기 음향을 출력한 이후 미리 정해진 시간 동안 상기 음향에 관한 사용자 입력이 입력되지 아니하면 상기 프로세서는 상기 사용자 입력에 의하여 획득된 제2 보상을 처리하고,
상기 제2 보상은 상기 제1 보상보다 큰 디스플레이 장치.
제3항에 있어서,
상기 프로세서는 상기 강화 학습을 이용하여 상기 음향 파라미터의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 음향 파라미터를 변경하는 디스플레이 장치.
제3항에 있어서,
상기 프로세서는 상기 사용자 입력부를 통하여 사용자 입력이 입력된 직후 상기 음향 파라미터를 변경하는 디스플레이 장치.
제3항에 있어서,
상기 프로세서는 상기 디스플레이 장치가 턴온된 직후 상기 음향 파라미터를 변경하는 디스플레이 장치.
제3항에 있어서,
상기 음향 파라미터는 음향 볼륨 값을 포함하고,
상기 프로세서는 상기 컨텐츠의 음향 특성을 기초로 상기 음향 볼륨 값을 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 볼륨 값을 변경하는 디스플레이 장치.
제7항에 있어서,
상기 프로세서는 상기 강화 학습을 이용하여 상기 음향 볼륨 값의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 음향 볼륨 값을 변경하는 디스플레이 장치.
제3항에 있어서,
상기 음향 파라미터는 음향 렌더링을 위한 보이스의 증폭률과 배경음의 증폭률을 포함하고,
상기 프로세서는 상기 컨텐츠의 음향 특성을 기초로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 설정하고, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 디스플레이 장치.
제9항에 있어서,
상기 프로세서는 상기 강화 학습을 이용하여 상기 보이스의 증폭률의 변경과 상기 배경음의 증폭률의 변경에 의한 보상을 예측하고, 상기 예측된 보상이 최대가 되는 값으로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 디스플레이 장치.
삭제
삭제
컨텐츠 소스로부터 컨텐츠를 수신하고;
상기 컨텐츠를 디코딩하여 음향 데이터를 생성하고;
음향 파라미터를 설정하고;
사용자 입력을 기초로 상기 음향 파라미터에 관한 강화 학습의 결과에 따라 상기 음향 파라미터를 변경하고;
상기 변경된 음향 파라미터에 따라 상기 음향 데이터를 음향 신호로 변환하고;
상기 음향 신호에 대응하는 음향을 출력하는 것을 포함하고,
상기 음향 파라미터를 변경하는 것은, 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 파라미터를 변경하는 것을 포함하고,
상기 보상은 상기 음향을 출력한 이후 음향에 관한 사용자 입력이 입력되면 획득되는 제1 보상과 상기 음향을 출력한 이후 미리 정해진 시간 동안 상기 음향에 관한 사용자 입력이 입력되지 아니하면 획득되는 제2 보상을 포함하고;
상기 제2 보상은 상기 제1 보상보다 큰 음향 출력 방법.
제13항에 있어서,
상기 음향 파라미터를 변경하는 것은,
상기 강화 학습을 이용하여 상기 음향 파라미터의 변경에 의한 보상을 예측하고;
상기 예측된 보상이 최대가 되는 값으로 상기 음향 파라미터를 변경하는 것을 포함하는 음향 출력 방법.
제13항에 있어서,
상기 음향 파라미터를 변경하는 것은,
상기 사용자 입력이 입력된 직후 상기 음향 파라미터를 변경하는 것을 포함하는 음향 출력 방법.
제13항에 있어서,
상기 음향 파라미터를 변경하는 것은,
디스플레이 장치가 턴온된 직후 상기 음향 파라미터를 변경하는 것을 포함하는 음향 출력 방법.
제13항에 있어서,
상기 음향 파라미터는 음향 볼륨 값을 포함하고,
상기 음향 파라미터를 설정하는 것은 상기 컨텐츠의 음향 특성을 기초로 상기 음향 볼륨 값을 설정하는 것을 포함하고,
상기 음향 파라미터를 변경하는 것은 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 음향 볼륨 값을 변경하는 것을 포함하는 음향 출력 방법.
제17항에 있어서,
상기 음향 파라미터를 변경하는 것은,
상기 강화 학습을 이용하여 상기 음향 볼륨 값의 변경에 의한 보상을 예측하고;
상기 예측된 보상이 최대가 되는 값으로 상기 음향 볼륨 값을 변경하는 것을 포함하는 음향 출력 방법.
제13항에 있어서,
상기 음향 파라미터는 음향 렌더링을 위한 보이스의 증폭률과 배경음의 증폭률을 포함하고,
상기 음향 파라미터를 설정하는 것은 상기 컨텐츠의 음향 특성을 기초로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 설정하는 것을 포함하고,
상기 음향 파라미터를 변경하는 것은 상기 사용자 입력에 의하여 획득된 보상에 따라 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 것을 포함하는 음향 출력 방법.
제19항에 있어서,
상기 음향 파라미터를 변경하는 것은,
상기 강화 학습을 이용하여 상기 보이스의 증폭률의 변경과 상기 배경음의 증폭률의 변경에 의한 보상을 예측하고;
상기 예측된 보상이 최대가 되는 값으로 상기 보이스의 증폭률과 상기 배경음의 증폭률을 변경하는 것을 포함하는 음향 출력 방법.