KR102673322B1 - 영상 및 오디오 처리 장치 및 그 동작 방법 - Google Patents

영상 및 오디오 처리 장치 및 그 동작 방법 Download PDF

Info

Publication number
KR102673322B1
KR102673322B1 KR1020180140097A KR20180140097A KR102673322B1 KR 102673322 B1 KR102673322 B1 KR 102673322B1 KR 1020180140097 A KR1020180140097 A KR 1020180140097A KR 20180140097 A KR20180140097 A KR 20180140097A KR 102673322 B1 KR102673322 B1 KR 102673322B1
Authority
KR
South Korea
Prior art keywords
audio
characteristic information
information
video
video signal
Prior art date
Application number
KR1020180140097A
Other languages
English (en)
Other versions
KR20200056137A (ko
Inventor
조석환
김선민
황인우
강우석
조대성
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020180140097A priority Critical patent/KR102673322B1/ko
Priority to US16/599,932 priority patent/US11205391B2/en
Priority to CN201980075313.4A priority patent/CN113039807B/zh
Priority to EP19885176.8A priority patent/EP3824644A4/en
Priority to PCT/KR2019/013593 priority patent/WO2020101189A1/en
Publication of KR20200056137A publication Critical patent/KR20200056137A/ko
Application granted granted Critical
Publication of KR102673322B1 publication Critical patent/KR102673322B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G3/00Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes
    • G09G3/20Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters
    • G09G3/34Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters by control of light from an independent source
    • G09G3/3406Control of illumination source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/50Controlling the output signals based on the game progress
    • A63F13/54Controlling the output signals based on the game progress involving acoustic signals, e.g. for simulating revolutions per minute [RPM] dependent engine sounds in a driving game or reverberation against a virtual wall
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/30Interconnection arrangements between game servers and game devices; Interconnection arrangements between game devices; Interconnection arrangements between game servers
    • A63F13/35Details of game servers
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/50Controlling the output signals based on the game progress
    • A63F13/52Controlling the output signals based on the game progress involving aspects of the displayed game scene
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4852End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4854End-user interface for client configuration for modifying image parameters, e.g. image brightness, contrast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/90Constructional details or arrangements of video game devices not provided for in groups A63F13/20 or A63F13/25, e.g. housing, wiring, connections or cabinets
    • A63F13/98Accessories, i.e. detachable arrangements optional for the use of the video game device, e.g. grip supports of game controllers
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/50Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
    • A63F2300/55Details of game data or player data management
    • A63F2300/552Details of game data or player data management for downloading to client devices, e.g. using OS version, hardware or software profile of the client device
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2320/00Control of display operating conditions
    • G09G2320/06Adjustment of display parameters
    • G09G2320/0613The adjustment depending on the type of the information to be displayed
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2320/00Control of display operating conditions
    • G09G2320/06Adjustment of display parameters
    • G09G2320/066Adjustment of display parameters for control of contrast
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2360/00Aspects of the architecture of display systems
    • G09G2360/14Detecting light within display terminals, e.g. using a single or a plurality of photosensors
    • G09G2360/144Detecting light within display terminals, e.g. using a single or a plurality of photosensors the light being ambient light
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2360/00Aspects of the architecture of display systems
    • G09G2360/16Calculation or use of calculated indices related to luminance levels in display data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Acoustics & Sound (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Television Receiver Circuits (AREA)

Abstract

본 개시는 장면 단위로 컨텐트의 영상 신호와 오디오 신호를 각각 분석하여 얻은 특성 정보를 이용하여 장면의 화질 및 사운드를 동적으로 제어할 수 있는 영상 및 오디오 처리 장치 및 그 동작 방법에 관련된 것이다.
일 실시예에 따른 영상 및 오디오 처리 장치는, 디스플레이, 오디오 출력부, 하나 이상의 인스트럭션을 저장하는 메모리, 및 메모리에 저장된 하나 이상의 인스트럭션을 실행하는 프로세서를 포함하고, 프로세서는, 상기 하나 이상의 인스럭션을 실행함으로써, 장면 단위로 컨텐트의 영상 신호를 분석하여 영상 신호의 특성 정보를 검출하고, 장면 단위로 컨텐트의 오디오 신호를 분석하여 오디오 신호의 특성 정보를 검출하고, 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 장면 단위로 영상 신호를 제어하여 디스플레이로 출력하고, 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 장면 단위로 오디오 신호를 제어하여 오디오 출력부로 출력할 수 있다.

Description

영상 및 오디오 처리 장치 및 그 동작 방법{Image and audio processing apparatus and operating method thereof}
개시된 다양한 실시예들은 영상 및 오디오 처리 장치 및 그 동작 방법에 관한 것으로서, 보다 상세하게는, 컨텐트의 특성에 따라 화질과 사운드를 적응적으로 제공할 수 있는 영상 및 오디오 처리 장치 및 그 동작 방법에 관한 것이다.
티브이(TV)와 같은 영상 및 오디오 처리 장치의 기능이 스마트해지면서, 영상 및 오디오 처리 장치를 이용하여 다양한 컨텐트를 즐기려는 사용자가 증가하고 있다.
그러나, 게임과 같은 컨텐트를 즐기려는 사용자들은 게임을 보다 더 잘하기 위하여, 게임 컨텐트에 따라 화질 및 사운드를 적응적으로 지원할 수 있는 영상 및 오디오 처리 장치가 필요하다. 예를 들어, FPS(First Person Shooter) 게임의 경우에, 사용자는 어두운 영역에 숨어 있는 적이나 게임 아이템을 빨리 발견하기 위해 영상이 왜곡되더라고 시인성을 향상시키면서 미세한 발자국 사운드 등과 같은 효과음을 크게 들을 수 있는 기능을 제공하는 영상 및 오디오 처리 장치가 필요하다. 스포츠 게임의 경우에, FPS 게임에서와 같이 영상을 왜곡시켜 시인성을 향상시킬 경우에, 오히려 화질이 저하되기 때문에 사용자는 영상을 왜곡시키지 않으면서 제작자가 의도하는 사운드를 충실하게 전달할 수 있는 기능을 제공하는 영상 및 오디오 처리 장치가 필요하다. 이와 같이 게임 컨텐트에 따라 사용자가 원하는 화질과 사운드의 조건이 다른 것은 게임 컨텐트에 따라 사용자의 몰입감을 극대화할 수 있는 화질 및 사운드 조건이 상이하기 때문이다.
따라서, 컨텐트의 특성에 따라 화질 및 사운드를 동적으로 제공할 수 있는 영상 및 오디오 처리 장치가 요구되고 있다.
개시된 다양한 실시 예들은 장면(scene) 단위로 컨텐트의 영상 신호 및 오디오 신호를 분석한 결과를 이용하여 컨텐트의 영상 신호 및 오디오 신호를 동적으로 제어함으로써, 컨텐트에 대한 사용자의 몰입감을 극대화 할 수 있는 화질 및 사운드를 제공할 수 있는 영상 및 오디오 처리 장치와 그 동작 방법을 제공하기 위한 것이다.
개시된 다양한 실시 예들은 주변 환경 정보와 장면 단위로 컨텐트의 영상 신호 및 오디오 신호를 분석한 결과를 이용하여 컨텐트의 영상 신호 및 오디오 신호를 동적으로 제어함으로써, 컨텐트에 대한 사용자의 몰입감을 극대화 할 수 있는 화질 및 사운드를 제공할 수 있는 영상 및 오디오 처리 장치와 그 동작 방법을 제공하기 위한 것이다.
일 실시 예에 따른 영상 및 오디오 처리 장치는, 디스플레이; 오디오 출력부; 하나 이상의 인스트럭션을 저장하는 메모리; 및 메모리에 저장된 하나 이상의 인스트럭션을 실행하는 프로세서; 를 포함하고, 프로세서는, 하나 이상의 인스럭션을 실행함으로써, 장면 단위로 컨텐트의 영상 신호를 분석하여 영상 신호의 특성 정보를 검출하고, 장면 단위로 컨텐트의 오디오 신호를 분석하여 오디오 신호의 특성 정보를 검출하고, 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 장면 단위로 영상 신호를 제어하여 디스플레이로 출력하고, 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 장면 단위로 오디오 신호를 제어하여 오디오 출력부로 출력할 수 있다. i
일 실시 예에 따른 프로세서는, 하나 이상의 인스트럭션을 실행함으로써, 영상 신호의 특성 정보와 오디오 신호의 특성 정보에 기초하여 장면 단위로 영상 신호에 대한 블랙 이퀄라이저 기능, 명암비 및 색상 채도 기능중 적어도 하나를 제어하고, 영상 신호의 특성 정보와 오디오 신호의 특성 정보에 기초하여 장면 단위로 오디오 신호에 대한 고도감 생성 및 스테이지 확장 기능 및 사운드 이퀄라이저 적용 기능 중 적어도 하나를 제어할 수 있다.
일 실시 예에 따른 영상 신호의 특성 정보는 영상 신호의 밝기 정보, 색상 정보, 명암비 정보 및 모션 정보 중 적어도 하나를 포함하고, 일 실시 예에 따른 오디오 신호의 특성 정보는 오디오 객체의 위치 정보, 음성 정보, 음악 정보, 및 효과 음 정보 중 적어도 하나를 포함할 수 있다.
일 실시 예에 따른 영상 및 오디오 처리 장치는 영상 및 오디오 처리 장치의 외부의 조도 정보를 검출하는 조도 센서를 더 포함하고, 일 실시 예에 따른 프로세서는, 하나의 이상의 인스트럭션을 실행함으로써, 영상 신호의 특성 정보와 오디오 신호의 특성 정보에 따라 영상 신호를 제어할 때, 조도 정보를 더 이용하여 영상 신호의 밝기, 명암비 및 색상의 채도중 적어도 하나를 제어할 수 있다.
일 실시 예에 따른 프로세서는 하나 이상의 인스트럭션을 실행함으로써, 하나 이상의 뉴럴 네트워크를 이용한 학습 모델을 이용하여, 장면 단위로 컨텐트의 영상 신호와 오디오 신호를 각각 분석하고, 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 각각 검출하고, 영상 신호 및 오디오 신호를 제어할 수 있다.
일 실시 예에 따른 영상 및 오디오 처리 장치의 동작 방법은, 영상 및 오디오 처리 장치에 의해 하나 이상의 인스트럭션을 실행하여, 장면 단위로 컨텐트의 영상 신호를 분석하여 영상 신호의 특성 정보를 검출하는 단계; 영상 및 오디오 처리 장치에 의해 장면 단위로 컨텐트의 오디오 신호를 분석하여 오디오 신호의 특성 정보를 검출하는 단계; 영상 및 오디오 처리 장치에 의해 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 장면 단위로 영상 신호를 제어하여 영상 및 오디오 처리 장치의 디스플레이를 통해 출력하는 단계; 및 영상 및 오디오 처리 장치에 의해 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 장면 단위로 오디오 신호를 제어하여 영상 및 오디오 처리 장치의 오디오 출력부를 통해 출력하는 단계를 포함할 수 있다.
일 실시 예에 따른 컴퓨터로 판독 가능한 기록매체는, 상술된 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체일 수 있다.
도 1은 일 실시예에 따른 영상 및 오디오 처리 장치를 설명하기 위한 도면이다.
도 2는 일 실시예에 따른 영상 및 오디오 처리 장치의 구성을 나타내는 블록도이다.
도 3은 도 2에 도시된 프로세서의 구성을 나타내는 블록도이다.
도 4는 도 3에 도시된 영상 신호 제어부의 구성을 나타내는 블럭도이다.
도 5는 도 3에 도시된 오디오 신호 제어부의 구성을 나타내는 블록도이다.
도 6은 일 실시 예에 따른 영상 및 오디오 처리 장치의 동작 흐름도이다.
도 7은 다른 실시 예에 따른 영상 및 오디오 처리 장치의 구성을 나타내는 블록도이다.
도 8은 일 실시 예에 따른 블랙 이퀄라이저의 이득 값과 조도 정보에 기초한 블랙 이퀄라이저의 최종 이득 값에 대한 예시도이다.
도 9는 다른 실시 예에 따른 영상 및 오디오 처리 장치의 동작 흐름도이다.
도 10은 다른 실시예에 따른 영상 및 오디오 처리 장치의 구성을 나타내는 블록도이다.
아래에서는 첨부한 도면을 참조하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 개시의 실시예를 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 또한, 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본 개시에서 사용되는 용어는, 본 개시에서 언급되는 기능을 고려하여 현재 사용되는 일반적인 용어로 기재되었으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 다양한 다른 용어를 의미할 수 있다. 따라서 본 개시에서 사용되는 용어는 용어의 명칭만으로 해석되어서는 안되며, 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 해석되어야 한다.
또한, 본 개시에서 사용된 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것이며, 본 개시를 한정하려는 의도로 사용되는 것이 아니다. 단수의 표현은 문맥상 명백하게 단수를 뜻하지 않는 한, 복수의 의미를 포함한다. 또한, 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
본 명세서, 특히, 특허 청구 범위에서 사용된 “상기” 및 이와 유사한 지시어는 단수 및 복수 모두를 지시하는 것일 수 있다. 또한, 본 개시에 따른 방법을 설명하는 단계들의 순서를 명백하게 지정하는 기재가 없다면, 기재된 단계들은 적당한 순서로 행해질 수 있다. 기재된 단계들의 기재 순서에 따라 본 개시가 한정되는 것은 아니다.
본 명세서에서 다양한 곳에 등장하는 "일부 실시예에서" 또는 "일 실시예에서" 등의 어구는 반드시 모두 동일한 실시예를 가리키는 것은 아니다.
본 개시의 일부 실시예는 기능적인 블록 구성들 및 다양한 처리 단계들로 나타내어질 수 있다. 이러한 기능 블록들의 일부 또는 전부는, 특정 기능들을 실행하는 다양한 개수의 하드웨어 및/또는 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 본 개시의 기능 블록들은 하나 이상의 마이크로프로세서들에 의해 구현되거나, 소정의 기능을 위한 회로 구성들에 의해 구현될 수 있다. 또한, 예를 들어, 본 개시의 기능 블록들은 다양한 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능 블록들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 또한, 본 개시는 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. “매커니즘”, “요소”, “수단” 및 “구성”등과 같은 용어는 넓게 사용될 수 있으며, 기계적이고 물리적인 구성들로서 한정되는 것은 아니다.
또한, 도면에 도시된 구성 요소들 간의 연결 선 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것일 뿐이다. 실제 장치에서는 대체 가능하거나 추가된 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들에 의해 구성 요소들 간의 연결이 나타내어질 수 있다.
이하 첨부된 도면을 참고하여 본 개시를 상세히 설명하기로 한다.
도 1은 일 실시예에 따른 영상 및 오디오 처리 장치가 장면 단위로 컨텐트의 영상 신호 및 오디오 신호를 각각 분석하여 얻은 장면 특성에 따라 특화된 영상 신호와 오디오 신호를 출력하는 예시를 나타내는 도면이다.
도 1을 참조하면, 영상 및 오디오 처리 장치(100)는 대화면 TV일 수 있으나, 이에 한정되지 않으며, 디스플레이를 포함하는 전자 장치로 구현될 수 있다. 예를 들어, 영상 및 오디오 처리 장치(100)는 휴대폰, 태블릿 PC, 디지털 카메라, 캠코더, 노트북 컴퓨터(laptop computer), 태블릿 PC, 데스크탑, 전자책 단말기, 디지털 방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션, MP3 플레이어, 웨어러블 디바이스(wearable device), 게이밍 디스플레이 모니터 등과 같은 다양한 전자 장치로 구현될 수 있다. 또한, 영상 및 오디오 처리 장치(100)는 고정형 또는 이동형일 수 있으며, 디지털 방송 수신이 가능한 디지털 방송 수신기일 수 있다.
영상 및 오디오 처리 장치(100)는 평면(flat) 디스플레이 장치뿐만 아니라, 곡률을 가지는 화면인 곡면(curved) 디스플레이 장치 또는 곡률을 조정 가능한 가변형(flexible) 디스플레이 장치로 구현될 수 있다. 영상 및 오디오 처리 장치(100)의 출력 해상도는 예를 들어, HD(High Definition), Full HD, Ultra HD, 또는 Ultra HD 보다 더 선명한 해상도를 포함할 수 있다.
영상 및 오디오 처리 장치(100)는 제어 장치(101)에 의해 제어될 수 있다. 제어 장치(101)는 리모컨, 휴대폰, 또는 게임 패드와 같이 영상 및 오디오 처리 장치(100)를 제어하기 위한 다양한 형태의 장치로 구현될 수 있다.
또한, 제어 장치(101)는 적외선(infrared) 또는 블루투스(bluetooth)를 포함하는 근거리 무선 통신을 이용하여 영상 및 오디오 처리 장치(100)를 제어할 수 있다. 제어 장치(101)는 유선 통신을 이용하여 영상 및 오디오 처리 장치(100)를 제어할 수 있다.
제어 장치(101)는 구비된 키(버튼을 포함), 터치 패드(touchpad), 사용자의 음성을 수신할 수 있는 마이크(도시되지 아니함), 제어 장치(101)의 모션 인식이 가능한 센서(도시되지 아니함) 중 적어도 하나를 이용하여 영상 및 오디오 처리 장치(100)의 기능을 제어할 수 있다. 제어 장치(101)는 게임 전용 패드 형태로 구성될 수 있다.
제어 장치(101)는 영상 및 오디오 처리 장치(100)의 전원을 온(on)시키거나 오프(off)시키기 위한 전원 온/오프 버튼을 포함할 수 있다. 또한, 제어 장치(101)는 사용자 입력에 의해 영상 및 오디오 처리 장치(100)의 채널 변경, 음량 조정, 지상파 방송/케이블 방송/위성 방송 선택, 또는 환경 설정(setting)을 할 수 있다.
또한, 제어 장치(101)가 게임 전용 패드 또는 휴대폰인 경우에, 제어 장치(101)는 게임 컨텐트를 영상 및 오디오 처리 장치(100)로 전송할 수 있고, 영상 및 오디오 처리 장치(100)의 게임 컨텐트에 대한 재생 동작을 제어할 수 있다.
본 명세서의 실시예에서 “사용자”라는 용어는 제어 장치(101)를 이용하여 영상 및 오디오 처리 장치(100)의 기능 또는 동작을 제어하는 사람을 의미하며, 게이머, 시청자, 관리자 또는 설치 기사를 포함할 수 있으나 이로 제한되지 않는다.
일 실시예에 따른, 영상 및 오디오 처리 장치(100)는, 제어 장치(101)의 제어와 관계없이 장면(scene) 단위로 재생되고 있는 컨텐트의 영상 신호와 오디오 신호를 각각 분석하여 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 검출한다.
영상 및 오디오 처리 장치(100)에 의해 검출된 영상 신호의 특성 정보는 예를 들어, 밝기 정보, 색상 정보, 명암비 정보 및 모션 정보 중 적어도 하나를 포함할 수 있으나 이로 제한되지 않는다. 영상 및 오디오 처리 장치(100)에 의해 검출된 오디오 신호의 특성 정보는 오디오 객체의 위치 정보, 음성 정보, 음악 정보 및 효과음 정보 중 적어도 하나를 포함할 수 있으나 이로 제한되지 않는다.
영상 및 오디오 처리 장치(100)는 검출된 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 장면 단위로 영상 신호를 제어하고, 제어된 영상 신호를 영상 및 오디오 처리 장치(100)에 디스플레이한다. 상술한 처리에 의해 영상 및 오디오 처리 장치(100)에 디스플레이되는 영상 신호는 장면 특성에 따라 특화된 화질을 갖는 영상 신호를 의미한다.
영상 및 오디오 처리 장치(100)는 검출된 영상 신호와 오디오 정보를 이용하여 장면 단위로 오디오 신호를 제어하고, 제어된 오디오 신호를 영상 및 오디오 처리 장치(100)를 통해 출력한다. 상술한 처리에 의해 영상 및 오디오 처리 장치(100)를 통해 출력되는 오디오 신호는 장면 특성에 따라 특화된 사운드를 갖는 오디오 신호를 의미한다.
또한, 영상 및 오디오 처리 장치(100)는 영상 및 오디오 처리 장치(100)의 외부의 주변 조명(102)으로부터 검출된 조도 정보를 이용하여 장면 단위의 영상 신호의 밝기, 명암비 및 색상의 채도 중 적어도 하나를 제어할 수 있다. 이를 위하여, 영상 및 오디오 처리 장치(100)는 조도 센서를 포함할 수 있다.
도 2는 일 실시예에 따른 영상 및 오디오 처리 장치의 구성을 나타내는 블록도이다.
도 2에 도시된 영상 및 오디오 처리 장치(200)는 도 1에 도시된 영상 및 오디오 처리 장치(100)의 일 실시예일 수 있다. 도 2를 참조하면, 일 실시예에 따른 영상 및 오디오 처리 장치(200)는 메모리(210), 프로세서(220), 디스플레이(230), 및 오디오 출력부(240)를 포함할 수 있다. 그러나, 영상 및 오디오 처리 장치(200)는, 도시된 구성요소보다 많은 구성요소에 의해 구현될 수 있으며, 전술한 예에 한정되지 않는다. 예를 들어, 영상 및 오디오 처리 장치(200)는 컨텐트를 수신할 수 있는 컨텐트 수신부 또는/및 사용자의 입력을 수신할 수 있는 사용자 입력 수신부를 더 포함할 수 있다.
일 실시예에 따른 메모리(210)는, 프로세서(220)의 처리 및 제어를 위한 프로그램을 저장할 수 있다. 메모리(210)는 영상 및 오디오 처리 장치(200)로 입력되거나 영상 및 오디오 처리 장치(200)로부터 출력되는 데이터(예를 들어, 컨텐트)를 저장할 수 있다. 메모리(210)는 프로세서(220)의 처리 및 제어시 사용될 정보를 저장할 수 있다. 프로세서(220)의 처리 및 제어시 사용될 정보는, 예를 들어, 장면 단위로 특화된 화질 및 사운드를 제공하기 위한 영상 및 오디오 처리 장치(200)의 설정 정보(setting information)를 포함할 수 있다.
상술한 영상 및 오디오 처리 장치(200)의 설정 정보는, 예를 들어, 영상 신호의 밝기 정보, 영상 신호의 명암비 및 색상의 채도 정보, 및 영상 신호의 모션 정보와 오디오 신호에 포함되어 있는 오디오 객체의 위치 정보, 오디오 신호에 포함되어 있는 음성 정보, 오디오 신호에 포함되어 있는 음악 정보 및 오디오 신호에 포함되어 있는 효과음 정보 각각 또는/및 조합에 기초하여 장면의 영상 신호와 오디오 신호를 제어할 수 있는 정보를 포함할 수 있다.
영상 및 오디오 처리 장치(200)의 설정 정보는, 예를 들어, 장면의 오디오 신호에 포함되어 있는 효과음(예를 들어, 총소리, 관중 소리, 자동차 엔진 소리 등)의 종류를 판단할 수 있는 정보, 장면의 영상 신호의 밝기를 판단할 수 있는 정보(예를 들어, 어두운 영상으로 판단되는 픽셀 수의 문턱 값), 장면의 오디오 신호의 특성 정보와 영상 신호의 특성 정보에 기초하여 장면의 영상 신호와 오디오 신호를 제어하는 방법에 관한 정보를 포함할 수 있으나, 설정 정보는 이로 제한되지 않는다.
장면의 영상 신호와 오디오 신호를 제어하는 방법에 대한 정보는, 예를 들어, 장면의 영상 신호의 특성 정보가 영상 신호가 어둡다는 것을 나타내는 정보를 포함하고, 장면의 오디오 신호의 특성 정보가 총소리 효과음을 포함하는 경우에(예를 들어, FPS(First Person Shooters, 이하 FPS라고 약함) 게임의 장면으로 인식되는 경우에), 장면의 영상 신호의 시인성을 향상시키기 위하여 프로세서(220)가 영상 신호에 대한 블랙 이퀄라이저의 이득 함수의 이득을 높이면서 명암비 및 색상 채도를 부각시키도록 영상 신호를 제어하고, 사운드 이퀄라이저를 적용하여 주변 배경 소리를 더욱 크게 들리도록 오디오 신호를 제어할 수 있는 정보를 포함할 수 있다.
장면의 영상 신호와 오디오 신호를 제어하는 방법에 대한 정보는, 예를 들어, 장면의 영상 신호의 특성 정보가 영상 신호가 밝다는 것을 나타내는 정보를 포함하고, 장면의 오디오 신호의 특성 정보가 총소리 효과음을 포함하는 경우에(예를 들어, FPS 게임의 장면으로 인식되는 경우에), 프로세서(220)가 장면의 영상 신호에 대한 블랙 이퀄라이저의 이득 함수의 이득을 최소화시키면서 명암비 및 색상 채도만을 부각시키도록 영상 신호를 제어하고, 사운드 이퀄라이저를 적용하여 장면의 주변 배경 소리가 생생하게 들리도록 오디오 신호를 제어할 수 있는 정보를 포함할 수 있다.
장면의 영상 신호와 오디오 신호를 제어하는 방법에 대한 정보는, 예를 들어, 장면의 영상 신호의 특성 정보가 영상 신호가 밝다는 것을 나타내는 정보를 포함하고, 장면의 오디오 신호의 특성 정보가 1인의 음성 신호를 포함하는 경우에(예를 들어, 일반 게임의 장면으로 인식되는 경우에), 프로세서(220)가 장면의 영상 신호에 대한 블랙 이퀄라이저 기능을 수행하지 않고 명암비 및 색상 채도를 부각시키는 정도를 낮추도록 영상 신호를 제어하고, 사운드 이퀄라이저를 적용하여 효과음이나 배경 음을 강조할 수 있도록 오디오 신호를 제어하기 위한 정보를 포함할 수 있다.
장면의 영상 신호와 오디오 신호를 제어하는 방법에 대한 정보는, 예를 들어, 장면의 영상 신호의 특성 정보가 운동장 잔디 색깔을 나타내는 색상 정보를 포함하고, 장면의 오디오 신호의 특성 정보가 관중 소리를 포함하는 경우에(예를 들어, 스포츠 게임의 장면으로 인식되는 경우에), 프로세서(220)가 장면의 영상 신호에 대한 블랙 이퀄라이저 기능을 수행하지 않고 명암비 및 색상의 채도를 부각시켜 잔디 색깔을 생생하게 해주면서 유니폼 구분력을 키워줄 수 있도록 영상 신호를 제어하고, 관중들의 함성에 둘러싸인 듯한 사운드 경험을 제공할 수 있도록 수평면 음상 확장, 스테이지 확장, 및 사운드 이퀄라이저를 적용하여 오디오 신호를 제어하기 위한 정보를 포함할 수 있다.
장면의 영상 신호와 오디오 신호를 제어하는 방법에 대한 정보는, 예를 들어, 장면의 영상 신호의 특성 정보가 많은 모션 정보와 밝은 화면을 나타내는 정보를 포함하고, 장면의 오디오 신호의 특성 정보가 자동차 엔진 소리를 포함하는 경우에(예를 들어, 레이싱 게임의 장면으로 인식되는 경우에), 프로세서(220)가 장면의 영상 신호에 대한 블랙 이퀄라이저 기능을 수행하지 않고 명암비 및 색상 채도를 부각시켜 자동차와 트랙 배경이 생생하다고 느낄 수 있도록 영상 신호를 제어하고, 자동차 엔진 음과 같은 저대역 신호를 강화할 수 있도록 사운드 이퀄라이저를 적용하여 오디오 신호를 제어하기 위한 정보를 포함할 수 있다.
장면의 영상 신호와 오디오 신호를 제어하는 방법에 대한 정보는, 예를 들어, 장면의 영상 신호의 특성 정보가 많은 모션 정보와 어두운 화면(예를 들어, 터널을 통과하는 장면)을 나타내는 정보를 포함하고, 장면의 오디오 신호의 특성 정보가 자동차 엔진 소리를 포함하는 경우에(예를 들어, 레이싱 게임의 장면으로 인식되는 경우에), 프로세서(220)가 장면의 영상 신호에 대한 블랙 이퀄라이저 기능을 적용하여 화면을 밝게 해주면서(또는 시인성을 향상시키면서), 명암비 및 색상의 채도를 부각시켜 자동차와 트랙 배경이 생생하다고 느낄수 있도록 영상 신호를 제어하고, 자동차 엔진 음과 같은 저대역 신호를 강화할 수 있도록 사운드 이퀄라이저를 적용하여 오디오 신호를 제어하기 위한 정보를 포함할 수 있다.
메모리(210)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory), SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.
일 실시예에 따른 프로세서(220)는, 메모리(210)에 저장된 하나 이상의 인스트럭션을 실행하여, 디스플레이(230)와 오디오 출력부(240)를 통해 재생될 컨텐트에 대해 장면 단위로 컨텐트의 영상 신호와 오디오 신호를 각각 분석하여 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 검출한다. 영상 신호의 특성 정보와 오디오 신호의 특성 정보는 도 1에서 언급한 바와 같다.
프로세서(220)는 검출된 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 해당 장면의 영상 신호를 제어하여 특화된 영상 신호가 디스플레이(230)에 디스플레이 되도록 한다. 프로세서(220)는 검출된 영상 신호의 특성 정보와 오디오 특성 정보를 이용하여 해당 장면의 오디오 신호를 제어하여 특화된 오디오 신호가 오디오 출력부(240)를 통해 출력되도록 한다.
예를 들어, 프로세서(220)는 장면 단위로 분석된 오디오 신호에 총 소리가 포함되고, 분석된 영상 신호가 어두운 장면으로 판단되면, 장면의 영상 신호와 오디오 신호를 FPS 게임 컨텐트에 특화된 화질 및 사운드로 제어한다. 예를 들어, 장면에 포함된 게임 아이템의 높은 시인성을 제공하면서, 발자국 소리 같은 특정 효과음의 대역을 강화할 수 있도록, 프로세서(220)는 장면의 영상 신호와 오디오 신호를 제어할 수 있다.
프로세서(220)는 장면 단위로 분석된 오디오 신호에 자동차의 엔진 소리가 포함되고, 영상 신호에 많은 모션 정보가 검출된 것으로 판단되면, 장면의 영상 신호와 오디오 신호를 레이싱 게임 컨텐트에 특화된 화질 및 사운드로 제어한다. 예를 들어, 영상 신호의 색상의 채도를 향상시키면서 자동차의 엔진 소리에 대한 효과음 대역을 강화할 수 있도록 프로세서(220)는 장면의 영상 신호와 오디오 신호를 제어할 수 있다.
프로세서(220)는 장면 단위로 분석된 오디오 신호에 음성 신호가 포함되고, 영상 신호가 밝은 것으로 판단되면, 장면의 영상 신호와 오디오 신호를 일반 게임 컨텐트에 특화된 화질 및 사운드로 제어한다. 예를 들어, 장면의 영상 신호의 명암비와 색상의 채도를 제어하지 않고, 장면에 포함된 효과음 또는/및 배경음에 대한 대역을 강화하도록 프로세서(220)는 장면의 영상 신호와 오디오 신호를 제어할 수 있다.
본 개시의 실시예에서, 프로세서(220)는 내부적으로 구비되는 메모리(미도시)에 하나 이상의 인스트럭션을 저장하고, 내부적으로 구비되는 메모리(미도시)에 저장된 하나 이상의 인스트럭션을 실행하여 전술한 동작들을 수행할 수 있다. 즉, 프로세서(220)는 프로세서(220)의 내부에 구비되는 내부 메모리(미도시) 또는 메모리(210)에 저장된 적어도 하나의 인스트럭션 또는 프로그램을 실행하여 소정 동작을 수행할 수 있다.
또한, 본 개시의 실시예에서, 프로세서(220)는 영상에 대응되는 그래픽 처리를 위한 그래픽 프로세서(Graphic Processing Unit, 미도시)를 포함할 수 있다. 프로세서(미도시)는 코어(core, 미도시)와 GPU(미도시)를 통합한 SoC(System On Chip)로 구현될 수 있다. 프로세서(미도시)는 싱글 코어, 듀얼 코어, 트리플 코어, 쿼드 코어 및 그 배수의 코어를 포함할 수 있다.
프로세서(220)는 영상 및 오디오 처리 장치(200)의 전반적인 동작을 제어한다. 예를 들어, 프로세서(220)는, 메모리(210)에 저장된 하나 이상의 인스트럭션을 실행함으로써, 디스플레이(230)와 오디오 출력부(240)를 제어할 수 있다.
또한, 도 2에서는 하나의 프로세서(220)를 도시하였으나, 복수개의 프로세서(미도시)가 구비될 수도 있을 것이다. 이 경우, 본 개시의 실시예에 따른 영상 및 오디오 처리 장치(200)에서 수행되는 동작들 각각은 복수개의 프로세서(미도시) 중 적어도 하나를 통하여 수행될 수 있다.
프로세서(220)는, 메모리(210)에 저장된 하나 이상의 인스트럭션을 실행하여, 메모리(210)에 저장된 하나 이상의 뉴럴 네트워크(neural network)를 이용한 학습 모델을 이용하여 장면 단위의 컨텐트의 영상 신호와 오디오 신호를 각각 분석하여 영상 신호의 특징 정보와 오디오 신호의 특징 정보를 검출하고, 검출된 영상 신호의 특징 정보와 오디오 신호의 특징 정보를 이용하여 장면의 영상 신호와 오디오 신호를 제어할 수 있다.
뉴럴 네트워크는, 인공지능(Artificial Intelligence)에 기초하여 뉴럴 네트워크에 입력된 영상 신호와 오디오 신호로부터 각각의 특성 정보를 검출하고, 검출된 특성 정보에 기초하여 장면 단위로 영상 신호와 오디오 신호를 제어하는 방법을 학습하는 알고리즘의 집합일 수 있다. 예를 들어, 뉴럴 네트워크는, 장면 단위의 영상 신호와 오디오 신호를 입력 값으로 하는 지도 학습(supervised learning), 별다른 지도 없이 영상 신호와 오디오 신호로부터 각각 특성 정보를 검출하기 위해 필요한 데이터의 종류를 스스로 학습함으로써, 영상 신호와 오디오 신호로부터 특성 정보를 인식하기 위한 패턴을 발견하는 비지도 학습(unsupervised learning)에 기초하여, 영상 신호와 오디오 신호로부터 각각의 특성 정보를 인식하고, 제어하는 방법을 학습할 수 있다. 또한, 예를 들어, 뉴럴 네트워크는, 학습에 따라 검출된 영상 신호의 특성 정보와 오디오 신호의 특성 정보에 기초한 영상 신호와 오디오 신호의 제어가 올바른 지에 대한 피드백을 이용하는 강화 학습(reinforcement learning)을 이용하여, 장면 단위의 영상 신호와 오디오 신호로부터 각각의 특성 정보를 검출하고, 장면 단위의 영상 신호와 오디오 신호를 제어하는 방법을 학습할 수 있다.
또한, 뉴럴 네트워크는 인공 지능(AI) 기술에 따른 추론 및 예측을 위한 연산을 수행한다. 구체적으로, 뉴럴 네트워크는 복수의 계층들을 통한 연산을 수행하는 딥 뉴럴 네트워크(DNN: Deep Neural Network)가 될 수 있다. 뉴럴 네트워크는 연산을 수행하는 내부의 계층(layer)의 개수에 따라서 계층의 개수가 복수일 경우, 즉 연산을 수행하는 뉴럴 네트워크의 심도(depth)가 증가하는 경우, 딥 뉴럴 네트워크(DNN)로 분류될 수 있다. 또한, 딥 뉴럴 네트워크(DNN) 연산은 컨볼루션 뉴럴 네트워크(CNN: Convolution Neural Network) 연산 등을 포함할 수 있다. 즉, 프로세서(220)는 예시된 뉴럴 네트워크를 통하여 영상 신호와 오디오 신호의 특성 정보를 검출하기 위한 모델을 구현하고, 구현된 모델을 학습 데이터를 이용하여 학습시킬 수 있다. 그리고, 학습된 모델을 이용하여 재생될 컨텐트의 장면 단위의 영상 신호와 오디오 신호를 분석 또는 분류하여, 장면 내의 영상 신호와 오디오 신호의 특성 정보를 검출할 수 있다.
예를 들어, 프로세서(220)는, 하나 이상의 뉴럴 네트워크를 이용한 학습 모델을 이용하여, 장면 단위로 재생될 컨텐트의 영상 신호와 오디오 신호를 각각 분석하여 특성 정보를 검출할 수 있다. 예를 들어, 프로세서(220)는 딥 뉴럴 네트워크를 통한 연산을 수행하여, 하나의 장면의 영상 신호의 밝기 정보, 명암비 정보 및 색상 정보 중 적어도 하나를 검출하고, 오디오 신호의 오디오 객체의 위치 정보, 음성 정보, 음악 정보, 및 효과음 정보 중 적어도 하나를 검출할 수 있다.
프로세서(220)는 뉴럴 네트워크를 이용하여 검출된 영상 신호의 특성 정보와 검출된 오디오 신호의 특성 정보에 기초하여 장면 단위로 영상 신호와 오디오 신호를 제어할 수 있다. 예를 들어, 프로세서(220)는 뉴럴 네트워크를 이용하여 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 장면 단위로 영상 신호에 대한 블랙 이퀄라이저 기능, 명암비 및 색상의 채도 중 적어도 하나를 제어하고, 오디오 신호에 대한 고도감 생성 및 스테이지 확장 기능 및 사운드 이퀄라이저 기능 중 적어도 하나를 제어할 수 있다.
프로세서(220)는 장면 단위로 제어되는 영상 신호가 출력하도록 디스플레이(230)를 제어할 수 있다. 또한, 실시예에 따라, 프로세서(220)는, 장면 단위로 제어되는 오디오 신호가 출력되도록 오디오 출력부(240)를 제어할 수 있다.
일 실시예에 따른 디스플레이(230)는, 장면 단위로 제어되는 영상 신호를 디스플레이할 수 있다. 예를 들어, 장면이 FPS 게임의 장면으로서 어두운 영상 신호를 포함하는 경우에, 디스플레이(230)는 장면에 포함되어 있는 게임 아이템의 높은 시인성을 제공하는 영상 신호를 디스플레이 할 수 있다. 장면이 스포츠 게임의 장면인 경우에, 디스플레이(230)는 팀간의 유니폼이 명확하게 구분될 수 있도록 명암비와 색상의 채도를 강조하는 방향으로 제어된 영상 신호를 디스플레이 할 수 있다.
디스플레이(230)가 터치 스크린으로 구현되는 경우, 디스플레이(230)는 출력 장치 이외에 입력 장치로 사용될 수 있다. 예를 들어, 디스플레이(230)는 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉서블 디스플레이(flexible display), 3차원 디스플레이(3D display), 전기 영동 디스플레이(electrophoretic display) 중에서 적어도 하나를 포함할 수 있다. 그리고, 영상 및 오디오 처리 장치(200)의 구현 형태에 따라, 영상 및 오디오 처리 장치(200)는 디스플레이(230)를 2개 이상 포함할 수 있다.
오디오 출력부(240)는 프로세서(220)의 제어에 의해 장면 단위로 제어된 오디오 신호를 출력할 수 있다. 오디오 출력부(240)는 스피커, 헤드폰 출력 단자 또는 S/PDIF(Sony/Philips Digital Interface) 출력 단자 중 적어도 하나를 포함할 수 있으나 이로 제한되지 않는다.
일 실시예에 따른 오디오 출력부(240)는, 예를 들어, 장면이 FPS 게임의 장면으로서 어두운 영상 신호를 포함하는 경우에, 오디오 출력부(240)는 장면에 포함되어 있는 오디오 신호(예를 들어, 발자국 소리)의 고도감을 생성하거나 사운드 스테이지를 확장한 오디오 신호를 출력할 수 있다. 또한, 장면이 스포츠 게임의 장면인 경우에, 오디오 출력부(240)는 장면에 포함되어 있는 오디오 신호에 포함된 효과음(예를 들어, 함성 소리)의 고도감을 생성하고, 수평면 음상을 확장한(서라운드 이펙트를 강조하는 방향으로 제어한) 오디오 신호를 출력할 수 있다.
도 3은 도 2에 도시된 프로세서(220)의 구성을 나타내는 블록도이다.
도 3에 있어서, 도 2에 도시된 프로세서(220)는 영상 신호 분석부(310), 오디오 신호 분석부(320), 영상 신호 제어부(330), 및 오디오 신호 제어부(340)를 포함하나 프로세서(220)에 포함되는 구성 요소는 이로 제한되지 않는다.
영상 신호 분석부(310)는 장면 단위로 영상 신호를 분석한다. 예를 들어, 영상 신호 분석부(310)는 블랙 영역 히스토그램 분포에 따라 장면이 어두운 장면인지 밝은 장면인지를 판단하고, 판단 결과를 영상 신호 제어부(330)와 오디오 신호 제어부(340)로 제공할 수 있다. 영상 신호 분석부(310)는 블랙 영역 히스토그램 분포에 따라 장면이 어두운 장면인지 밝은 장면인지를 판단하기 위해 메모리(210)에 저장된 어두운 영역을 나타내는 픽셀 수의 문턱 값을 이용할 수 있다.
영상 신호 분석부(310)는 장면 단위로 영상 신호를 보다 더 정확하게 분석하기 위하여 상술한 하나의 장면에 대한 프레임 단위의 블랙 영역의 히스토그램 분석뿐 아니라 로컬 영역별 블랙 영역의 히스토그램 분석 및 디테일 분석을 수행할 수 있다.
오디오 신호 분석부(320)는 장면 단위로 오디오 신호를 분석한다. 예를 들어, 오디오 신호 분석부(320)는 장면 단위로 오디오 신호에 포함된 오디오 객체의 위치 정보, 음성 정보, 음악 정보, 및 효과음 중 적어도 하나를 검출한다. 오디오 신호 분석부(320)는 효과음을 검출하기 위하여 메모리(210)에 저장된 효과음에 관한 정보를 이용할 수 있다. 메모리(210)에 저장된 효과음에 관한 정보는 효과음의 종류를 판단할 수 있는 정보를 포함할 수 있다. 오디오 신호 분석부(320)는 오디오 신호에 대한 분석 결과를 영상 신호 제어부(330)와 오디오 신호 제어부(340)로 제공한다.
영상 신호 제어부(330)는 영상 신호 분석부(310)로부터 제공된 영상 신호 분석 결과와 오디오 신호 분석부(320)로부터 제공된 오디오 신호 분석 결과를 이용하여 장면 단위로 영상 신호에 대한 블랙 이퀄라이저 기능, 명암비 및 색상 채도 기능중 적어도 하나를 제어한다. 이에 따라 영상 신호 제어부(330)는 장면에 특화된 화질을 갖는 영상 신호를 출력한다.
도 4는 도 3에 도시된 영상 신호 제어부(330)의 구성을 나타내는 블럭도이다.
도 4를 참조하면, 영상 신호 제어부(330)는 블랙 이퀄라이저 동적 제어부(410), 및 명암비/색상 채도 제어부(420)를 포함한다.
블랙 이퀄라이저 동적 제어부(410)는 입력되는 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 입력되는 영상 신호의 어두운 영역의 블랙 시인성을 개선하기 위해 영상 신호의 밝기를 제어한다.
명암비/색상 채도 제어부(420)는 입력되는 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 입력되는 영상 신호의 명암비 및/또는 색상의 채도를 제어한다.
예를 들어, 오디오 신호 분석부(320)로부터 총소리에 대한 효과음을 나타내는 정보가 제공되고, 영상 신호 분석부(310)로부터 장면이 어두운 장면이라는 것을 나타내는 정보가 제공되면, 영상 신호 제어부(330)는 어두운 장면이 밝아지도록 블랙 이퀄라이저 동적 제어부(410)의 이득값(블랙 이퀄라이저의 이득 값)을 높여서 영상 신호의 밝기를 제어하고, 영상 신호의 명암비 및 색상의 채도가 부각되도록 명암비/색상 채도 제어부(420)를 이용하여 영상 신호를 제어한다.
오디오 신호 분석부(320)로부터 자동차 엔진 소리를 나타내는 효과음에 대한 정보가 제공되고, 영상 신호 분석부(310)로부터 빠르게 움직이는 장면을 나타내는 모션 정보(많은 량의 모션 정보) 및 밝은 장면을 나타내는 정보가 제공되면, 영상 신호 제어부(330)는 블랙 이퀄라이저 동적 제어부(410)를 사용하지 않고, 명암비/색상의 채도를 부각시키도록 명암비/색상 채도 제어부(420)를 사용하여 영상 신호를 제어한다.
오디오 신호 분석부(320)로부터 자동차 엔진 소리를 나타내는 효과음에 대한 정보가 제공되고, 영상 신호 분석부(310)로부터 빠르게 움직이는 장면을 나타내는 모션 정보 및 어두운 장면을 나타내는 정보가 제공되면, 영상 신호 제어부(330)는 블랙 이퀄라이저 동적 제어부(410)를 이용하여 화면이 밝아지도록 영상 신호를 제어하면서, 명암비/색상 채도 제어부(420)를 이용하여 영상 신호의 색상이 부각되도록 영상 신호를 제어한다.
오디오 신호 분석부(320)로부터 제공되는 효과음과 배경음이 일반 게임 컨텐트로 인식되고, 영상 신호 분석부(310)로부터 어두운 장면을 나타내는 정보가 제공되면, 영상 신호 제어부(330)는 블랙 이퀄라이저 기능을 사용하지 않고, 명암비 및 색상의 채도를 지나치게 강조하지 않도록 영상 신호를 제어한다.
도 3에 도시된 오디오 신호 제어부(340)는 영상 신호 분석부(310)로부터 제공된 영상 신호 분석 결과와 오디오 신호 분석부(320)로부터 제공된 오디오 신호 분석 결과를 이용하여 장면 단위로 오디오 신호에 대한 고도감 생성 및 스테이지 확장 기능 및 사운드 이퀄라이저 기능중 적어도 하나를 제어한다. 이에 따라 오디오 신호 제어부(340)는 장면에 특화된 사운드를 갖는 오디오 신호를 출력한다.
도 5는 도 3에 도시된 오디오 신호 제어부(340)의 구성을 나타내는 블록도이다.
도 5를 참조하면, 오디오 신호 제어부(340)는 고도감 생성 및 스테이지 확장부(510)와 사운드 이퀄라이저 적용부(520)를 포함하나 이로 제한되지 않는다.
고도감 생성 및 스테이지 확장부(510)는 오디오 객체의 움직임을 강화하거나 사운드 스테이지를 확장한다. 예를 들어, 장면의 오디오 신호에 효과음이 포함된 경우에, 고도감 생성 및 스테이지 확장부(510)는 효과음의 고도감을 생성하고, 수평면 음상을 확장한다. 예를 들어, 장면의 오디오 신호에 경기장에서의 함성 소리가 포함되어 있는 경우에, 고도감 생성 및 스테이지 확장부(510)는 함성 소리에 대해 수평음상 확장과 스테이지 확장을 수행하여 사용자에게 함성에 둘러싸인 듯한 사운드 경험을 제공한다. 고도감 생성과 수평면 음상 확장은 오디오 신호 처리에서 널리 사용되고 있는 HRTF(Head-Related Transfer Function)를 통해 구현할 수 있으나 이로 제한되지 않는다. 스테이지 확장은 서로 다른 오디오 채널의 정반대 위상 신호를 각 채널에 더해주는 방식으로 구현할 수 있으나 이로 제한되지 않는다.
사운드 이퀄라이저 적용부(520)는 입력된 오디오 신호를 이용하여 장면별로 차별적인 이퀄라이저를 적용하기 위한 것이다. 예를 들어, 장면의 오디오 신호에 자동차의 엔진 소리가 포함된 경우에, 저역 성분이 강화되도록 사운드 이퀄라이저 적용부(520)를 제어하여 보다 실감나게 자동차 엔진 소리를 사용자에게 전달한다. 예를 들어, 장면의 오디오 신호에 음악 소리가 포함된 경우에, 저역 성분과 고역 성분 모두 강화되도록 사운드 이퀄라이저 적용부(520)를 제어하여 사용자에게 전 대역에 †œ게 퍼져 있는 악기음을 전달한다.
또한, 예를 들어, 오디오 신호 분석부(320)로부터 총소리에 대한 효과음을 나타내는 정보가 제공되고, 영상 신호 분석부(310)로부터 장면이 어두운 장면이라는 것을 나타내는 정보가 제공되면, 오디오 신호 제어부(340)는 주변 배경 소리가 강화되도록 사운드 이퀄라이저 적용부(520)를 이용하여 오디오 신호를 제어한다.
오디오 신호 분석부(320)로부터 자동차 엔진 소리를 나타내는 효과음에 대한 정보가 제공되고, 영상 신호 분석부(310)로부터 빠르게 움직이는 장면을 나타내는 모션 정보 및 밝은 장면을 나타내는 정보가 제공되면, 오디오 신호 제어부(340)는 자동자 엔진 음과 같은 저역 성분이 강화되도록 사운드 이퀄라이저 적용부(520)를 이용하여 오디오 신호를 제어한다.
오디오 신호 분석부(320)로부터 자동차 엔진 소리를 나타내는 효과음에 대한 정보가 제공되고, 영상 신호 분석부(310)로부터 빠르게 움직이는 장면을 나타내는 모션 정보 및 어두운 장면을 나타내는 정보가 제공되면, 오디오 신호 제어부(340)는 엔진 음과 같은 저역 성분을 강화하기 위해 사운드 이퀄라이저 적용부(520)를 사용하여 오디오 신호를 제어한다.
오디오 신호 분석부(320)로부터 음성 소리 검출을 나타내는 정보가 제공되고, 영상 신호 분석부(310)로부터 어두운 장면을 나타내는 정보가 제공되면, 오디오 신호 제어부(340)는 고도감 생성 및 스테이지 확장부(510)를 이용하여 효과음과 배경음을 확장하여 효과음과 배경음을 강조하고, 저역 성분과 고역 성분을 모두 강화할 수 있도록 사운드 이퀄라이저 적용부(520)를 이용하여 오디오 신호를 제어한다.
또한, 예를 들어, 수신되는 영상 신호의 특성 정보가 어두운 장면을 나타내고, 수신되는 오디오 신호의 특성 정보에 발자국 소리가 포함되어 있으면, 사운드 이퀄라이저 적용부(520)는 발자국 소리 같은 특정 효과음의 대역을 강화하여 사용자에게 발자국 소리를 보다 명확하게 전달해 줄 수 있다.
예를 들어, 수신되는 영상 신호의 특성 정보에 많은 모션 정보가 포함되어 있을 경우에, 오디오 신호 제어부(340)는 고도감 생성 및 스테이지 확장부(510)를 이용하여 수신되는 오디오 신호에 포함된 오디오 객체의 음상을 확장하고, 사운드 이퀄라이저 적용부(520)를 이용하여 오디오 신호에 포함되어 있는 효과음이 강화되도록 오디오 신호를 제어할 수 있다.
도 6은 일 실시 예에 따른 영상 및 오디오 처리 장치의 동작 흐름도이다. 도 6에 도시된 영상 및 오디오 처리 장치의 동작 방법(600)은 도 1 및 도 2를 참조하여 설명한 본 개시의 일 실시예에 따른 영상 및 오디오 처리 장치(100, 200)에서 수행되는 동작들을 포함할 수 있다. 따라서 영상 및 오디오 처리 장치의 동작 방법(600)의 상세 동작들에 있어서, 본 개시의 일 실시 예에 따른 영상 및 오디오 처리 장치(100, 200)에서 수행되는 동작들과 중복되는 상세 설명은 생략한다. 도 6에 도시된 영상 및 오디오 처리 장치의 동작 방법(600)은 장면 단위로 컨텐트의 영상 신호와 오디오 신호를 각각 분석하여 영상 신호와 오디오 신호를 제어하는 경우이다.
도 6을 참조하면, S610 단계에서, 영상 및 오디오 처리 장치(100)는 장면 단위로 컨텐트의 영상 신호를 분석하여 영상 신호의 특성 정보를 검출한다. S610 단계에서 수행되는 영상 신호의 분석 처리 및 영상 신호의 특성 정보를 검출하는 처리는 상술한 도 1 내지 도 5에서 설명한 바와 같다. 영상 신호의 특성 정보는 도 1에서 설명한 바와 같다.
S620 단계에서, 영상 및 오디오 처리 장치(100)는 장면 단위로 컨텐트의 오디오 신호를 분석하여 오디오 신호의 특성 정보를 검출한다. S620 단계에서 수행되는 오디오 신호의 분석 처리 및 오디오 신호의 특성 정보를 검출하는 처리는 상술한 도 1 내지 도 5에서 설명한 바와 같다. 오디오 신호의 특성 정보는 도 1에서 설명한 바와 같다.
S630 단계에서, 영상 및 오디오 처리 장치(100)는 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 영상 신호를 제어한다. S630 단계에서 수행되는 영상 신호의 제어는 도 1 내지 도 5에서 설명한 바와 같다.
S640 단계에서, 영상 및 오디오 처리 장치(100)는 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 이용하여 오디오 신호를 제어한다. S640 단계에서 수행되는 오디오 신호의 제어는 도 1 내지 도 5에서 설명한 바와 같다.
도 7은 다른 실시 예에 따른 영상 및 오디오 처리 장치의 구성을 나타내는 블록도이다.
도 7에 있어서, 도 2에서와 동일한 구성은 동일한 도면 기호를 이용하여 도시하였다. 따라서 영상 및 오디오 처리 장치(700)를 설명하는데 있어서 도 1 내지 도 5에서와 중복되는 설명은 생략한다.
도 7를 참조하면, 영상 및 오디오 처리 장치(700)는 도 2에 도시된 영상 및 오디오 처리 장치(200)에 비하여 조도 센서(750)를 더 포함한다.
조도 센서(750)는 영상 및 오디오 처리 장치(700)의 외부의 주변 조도 정보를 검출한다. 주변 조도 정보는 영상 및 오디오 처리 장치(700)의 주변 환경 정보를 의미한다. 영상 및 오디오 처리 장치(700)의 주변 환경 정보는 조도 정보로 제한되지 않는다. 예를 들어, 영상 및 오디오 처리 장치(700)에서 사용되는 오디오 출력부(240)가 스피커인 경우에, 주변 환경 정보는 영상 및 오디오 처리 장치(700)의 주변 소리(예를 들어, 잡음)을 포함할 수 있다. 조도 센서(750)는 밝기 정보를 크기 값으로 나타내 주는 센서이므로, 검출된 주변 조도 정보는 영상 및 오디오 처리 장치(700)의 외부의 조명(102)의 밝기 정보를 크기 값으로 검출할 수 있다.
메모리(710)는 블랙 이퀄라이저의 이득 값과 조도 값의 관계 정보를 저장할 수 있다. 영상 및 오디오 처리 장치(700)는 메모리(710)에 저장된 블랙 이퀄라이저의 이득 값과 조도 값간의 관계 정보를 이용하여 영상 및 오디오 처리 장치(700)의 주변 조도에 따라 블랙 이퀄라이저 강도를 보정하여 컨텐트에 대해 일관된 시인성을 제공할 수 있다. 즉, 영상 및 오디오 처리 장치(700)는 영상 신호의 특성 정보 및 오디오 신호의 특성 정보에 의해 결정된 블랙 이퀄라이저의 이득 값, 검출된 조도 정보, 및 메모리(710)에 저장된 상술한 관계 정보를 이용하여 최종적으로 적용할 블랙 이퀄라이저의 이득 값을 결정할 수 있다.
도 8은 일 실시 예에 따른 블랙 이퀄라이저(Black Equalizer)의 이득 값(BE_GAIN, 또는 이득 조정 값)과 조도 정보에 기초한 블랙 이퀄라이저의 최종 이득 값에 대한 예시도이다. 도 8의 경우에, 조도 정보가 150룩스(Lux)시 블랙 이퀄라이저의 이득 값이 선형식으로 표현된다.
프로세서(720)는 컨텐트에 대해 장면 단위로 영상 신호와 오디오 신호를 각각 분석하여 검출된 영상 신호의 특성 정보 및 오디오 신호의 특성 정보에 기초하여 영상 신호를 제어할 때, 조도 센서(750)에서 검출된 조도 정보와 메모리(710)에 저장된 상술한 블랙 이퀄라이저의 이득 값와 조도 정보간의 관계에 기초한 블랙 이퀄라이저의 최종 이득 값을 이용하여 블랙 이퀄라이저를 제어할 수 있다.
또한, 프로세서(720)는 컨텐트에 대해 장면 단위로 영상 신호와 오디오 신호를 각각 분석하여 검출된 영상 신호의 특성 정보 및 오디오 신호의 특성 정보에 기초하여 오디오 신호를 제어할 때, 조도 센서(750)에서 검출된 조도 정보와 메모리(710)에 저장된 상술한 블랙 이퀄라이저의 이득 값와 조도 정보간의 관계에 기초한 블랙 이퀄라이저의 최종 이득 값을 이용하여 제어될 영상 신호의 밝기에 기초하여 오디오 신호를 제어할 수 있다.
도 9는 다른 실시 예에 따른 영상 및 오디오 처리 장치의 동작 흐름도이다. 도 9는 도시된 영상 및 오디오 처리 장치의 동작 방법(900)은 도 1 또는 도 7를 참조하여 설명한 본 개시의 다른 실시 예에 따른 영상 및 오디오 처리 장치(100, 700)에서 수행되는 동작들을 포함할 수 있다. 따라서 영상 및 오디오 처리 장치의 동작 방법(900)의 상세 동작에 있어서, 본 개시의 다른 실시 예에 따른 영상 및 오디오 처리 장치(100, 700)에서 수행되는 동작들과 중복되는 상세 설명은 생략한다.
S910 단계에서, 영상 및 오디오 처리 장치(700)는 장면 단위로 컨텐트의 영상 신호를 분석하여 영상 신호의 특성 정보를 검출한다. S910 단계에서 수행되는 컨텐트의 영상 신호를 분석하는 것과 영상 신호의 특성 정보를 검출하는 것은, S610 단계와 같이 수행될 수 있다. S910 단계에서 언급되는 영상 신호의 특성 정보는 도 1에서 언급한 바와 같다.
S920 단계에서, 영상 및 오디오 처리 장치(700)는 장면 단위로 컨텐트의 오디오 신호를 분석하여 오디오 신호의 특성 정보를 검출한다. S920 단계에서 수행되는 컨텐트의 오디오 신호를 분석하는 것과 오디오 신호의 특성 정보를 검출하는 것은 S620 단계와 같이 수행될 수 있다. S920 단계에서 언급되는 오디오 신호의 특성 정보는 도 1에서 언급한 바와 같다.
S930 단계에서, 영상 및 오디오 처리 장치(700)는 영상 및 오디오 처리 장치(700)의 주변 조도 정보를 검출한다. S930 단계에서 주변 조도 정보를 검출하는 것은 도 7에서 설명한 바와 같다.
S940 단계에서, 영상 및 오디오 처리 장치(700)는 영상 신호의 특성 정보, 오디오 신호의 특성 정보 및 조도 정보를 이용하여 영상 신호를 제어한다. S940 단계에서 수행되는 영상 신호를 제어하는 것은 도 7에서 설명한 바와 같다.
S950 단계에서, 영상 및 오디오 처리 장치(700)는 영상 신호의 특성 정보, 오디오 신호의 특성 정보 및 조도 정보를 이용하여 오디오 신호를 제어한다. S950 단계에서 수행되는 오디오 신호를 제어하는 것은 도 7에서 설명한 바와 같다.
도 10은 다른 실시예에 따른 영상 및 오디오 처리 장치의 구성을 나타내는 블록도이다.
도 10에 도시된 바와 같이, 영상 및 오디오 처리 장치(1000)는, 디스플레이(230), 오디오 출력부(240) 이외에, 튜너부(1010), 프로세서(1020), 통신부(1030), 감지부(1040), 입/출력부(1050), 영상 신호 처리부(1060), 오디오 신호 처리부(1070), 및 사용자 입력부(1080)를 더 포함할 수 있다.
디스플레이(230) 및 오디오 출력부(240)에 대하여, 도 2에서 설명한 내용과 동일한 내용은 도 10에서 생략한다.
튜너부(1010)는 유선 또는 무선으로 수신되는 방송 신호를 증폭(amplification), 혼합(mixing), 공진(resonance)등을 통하여 많은 전파 성분 중에서 영상 및 오디오 처리 장치(1000)에서 수신하고자 하는 채널의 주파수만을 튜닝(tuning)시켜 선택할 수 있다. 방송 신호는 오디오(audio), 비디오(video) 및 부가 정보(예를 들어, EPG(Electronic Program Guide))를 포함한다.
튜너부(1010)를 통해 수신된 방송 신호는 디코딩(decoding, 예를 들어, 오디오 디코딩, 비디오 디코딩 또는 부가 정보 디코딩)되어 오디오, 비디오 및/또는 부가 정보로 분리된다. 분리된 오디오, 비디오 및/또는 부가 정보는 프로세서(1020)에 의해 제어되어 메모리(1090)에 저장될 수 있다.
영상 및 오디오 처리 장치(1000)의 튜너부(1010)는 하나이거나 복수일 수 있다. 튜너부(1010)는 영상 및 오디오 처리 장치(1000)와 일체형(all-in-one)으로 구현되거나 또는 영상 및 오디오 처리 장치(1000)와 전기적으로 연결되는 튜너부를 가지는 별개의 장치(예를 들어, 셋탑박스(set-top box, 도시되지 아니함), 입/출력부(1050)에 연결되는 튜너부(도시되지 아니함))로 구현될 수 있다.
통신부(1030)는 프로세서(1020)의 제어에 의해 영상 및 오디오 처리 장치(1000)를 외부 장치(예를 들어, 오디오 장치, 서버, 컨텐트 제공 장치 등)와 연결할 수 있다. 프로세서(1020)는 통신부(1030)를 통해 연결된 외부 장치로 컨텐트를 송/수신, 외부 장치로부터 어플리케이션(application)을 다운로드하거나 또는 웹 브라우징을 할 수 있다.
통신부(1030)는 영상 및 오디오 처리 장치(1000)의 성능 및 구조에 대응하여 무선 랜, 블루투스, 및 유선 이더넷 중 하나를 포함할 수 있다. 또한, 통신부(1030)는 무선랜, 블루투스, 및 유선 이더넷(Ethernet)의 조합을 포함할 수 있다. 통신부(1030)는 프로세서(1020)의 제어에 의해 제어 장치(101)의 제어 신호를 수신할 수 있다. 제어 신호는 블루투스 타입, RF 신호 타입 또는 와이파이 타입으로 구현될 수 있다.
통신부(1030)는 블루투스 외에 다른 근거리 통신(예를 들어, NFC(Near Field Communication, 도시되지 아니함), BLE(Bluetooth Low Energy, 도시되지 아니함)를 더 포함할 수 있다.
일 실시예에 따른 통신부(1030)는, 외부 서버로부터 하나 이상의 뉴럴 네트워크를 이용한 학습 모델을 수신할 수 있다. 또한, 통신부(1030)는, 메모리(1090)에 저장된 영상 신호 및 오디오 신호를 분석하기 위해 사용되는 정보를 갱신하기 위하여, 외부 서버로부터 기설정된 주기마다 새로운 정보를 수신할 수 있다.
감지부(1040)는 사용자의 음성, 사용자의 영상, 사용자의 인터랙션 및 영상 및 오디오 처리 장치(1000)의 주변의 조도를 감지하며, 마이크(1041), 카메라부(1042), 광 수신부(1043) 및 조도 센서(1044)를 포함할 수 있다.
마이크(1041)는 사용자의 발화(utterance)된 음성을 수신한다. 마이크(1041)는 수신된 음성을 전기 신호로 변환하여 프로세서(1020)로 출력할 수 있다.
카메라부(1042)는 카메라 인식 범위에서 제스처를 포함하는 사용자의 모션에 대응되는 영상(예를 들어, 연속되는 프레임)을 수신할 수 있다.
광 수신부(1043)는, 제어 장치(101)에서부터 수신되는 광 신호(제어 신호를 포함)를 수신한다. 광 수신부(1043)는 제어 장치(101)로부터 사용자 입력(예를 들어, 터치, 눌림, 터치 제스처, 음성, 또는 모션)에 대응되는 광 신호를 수신할 수 있다. 수신된 광 신호로부터 프로세서(1020)는 제어 신호를 검출할 수 있다.
일 실시예에 따른 광 수신부(1043)는, 컨텐트 재생에 관련된 사용자 입력에 대응되는 광 신호를 제어 장치(101)로부터 수신할 수 있다.
조도 센서(1044)는 도 7의 조도 센서(750)와 같이 영상 및 오디오 처리 장치(1000)의 외부의 조명(102)의 밝기에 기초한 조도 정보를 검출할 수 있으나 조도 센서(1044)의 검출 범위는 이로 제한되지 않는다. 예를 들어, 조도 센서(1044)는 영상 및 오디오 처리 장치(1000)의 주변의 빛(예를 들어, 햇빛)의 밝기를 검출할 수 있다.
입/출력부(1050)는 프로세서(1020)에 의해 제어되어 영상 및 오디오 처리 장치(1000)의 외부에서부터 비디오(예를 들어, 동영상 등), 오디오(예를 들어, 음성, 음악 등) 및 부가 정보(예를 들어, EPG 등) 등을 수신한다. 입/출력부(1050)는 HDMI 포트(High-Definition Multimedia Interface port, 1051), 컴포넌트 잭(component jack, 1052), PC 포트(PC port, 1053), 및 USB 포트(USB port, 1054) 중 적어도 하나를 포함할 수 있다. 입/출력부(1050)는 HDMI 포트(1051), 컴포넌트 잭(1052), PC 포트(1053), 및 USB 포트(1054)의 조합을 포함할 수 있다.
일 실시예에 따른 메모리(1090)는, 프로세서(1020)의 처리 및 제어를 위한 프로그램을 저장할 수 있고, 영상 및 오디오 처리 장치(1000)로 입력되거나 영상 및 오디오 처리 장치(1000)로부터 출력되는 데이터를 저장할 수 있다. 또한, 메모리(1090)는 영상 및 오디오 처리 장치(1000)의 동작에 필요한 데이터들을 저장할 수 있다. 영상 및 오디오 처리 장치(1000)의 동작에 필요한 데이터들은 도 2에서 설명한 메모리(210)에 저장되어 있는 정보를 포함할 수 있다.
또한, 메모리(1090)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류할 수 있다. 구체적으로, 메모리(1090)는 뉴럴 네트워크를 이용하여 소정 동작을 수행하기 위한 하나 이상의 프로그램을 저장할 수 있다. 예를 들어, 메모리(1090)에 저장되는 하나 이상의 프로그램은 학습 모듈(1091)과 제어 모듈(1092) 등으로 분류될 수 있다.
학습 모듈(1091)은, 하나 이상의 뉴럴 네트워크에 컨텐트가 입력된 것에 응답하여 장면 단위로 컨텐트의 영상 신호와 오디오 신호를 분석하여 각각의 특성 정보를 검출하고, 검출된 특성 정보를 이용하여 장면의 영상 신호와 오디오 신호를 제어하는 방법을 학습하여 결정되는 학습 모델을 포함할 수 있다. 학습 모델은 외부 서버로부터 수신될 수 있으며, 수신된 학습 모델은 학습 모듈(1091)에 저장될 수 있다.
제어 모듈(1092)은, 프로세서(1020)가 하나 이상의 인스트럭션을 수행함으로써, 장면 단위의 컨텐트의 영상 신호와 오디오 신호를 분석할 때 사용되는 정보와 분석 결과에 따라 얻어진 영상 신호의 특성 정보 및 오디오 신호의 특성 정보에 따라 영상 신호와 오디오 신호의 제어를 수행하도록 하는 프로그램을 저장할 수 있다. 예를 들어, 제어 모듈(1092)은, 프로세서(1020)가 입력되는 컨텐트에 응답하여, 영상 신호와 오디오 신호를 각각 분석한 결과와 저장된 정보를 비교하여 영상 신호의 특성 정보와 오디오 신호의 특성 정보를 검출하고, 검출된 영상 신호의 특성 정보와 오디오 신호의 특성 정보에 따라 영상 신호를 제어하기 위한 동작 조건 정보 및 오디오 신호를 제어하기 위한 동작 조건 정보를 프로세서(1020)로 제공하여 프로세서(1020)가 장면 단위로 제어된 영상 신호가 출력되도록 영상 신호 처리부(1060)와 디스플레이(230)를 제어하고, 장면 단위로 제어된 오디오 신호가 출력되도록 오디오 신호 처리부(1070)와 오디오 출력부(240)를 제어하는 프로그램을 저장할 수 있다.
또한, 뉴럴 네트워크를 이용하여 소정 동작들을 수행하기 위한 하나 이상의 프로그램, 또는 뉴럴 네트워크를 이용하여 소정 동작들을 수행하기 위한 하나 이상의 인스트럭션은 프로세서(1020)에 포함되는 내부 메모리(미도시)에 저장될 수도 있을 것이다.
프로세서(1020)는 영상 및 오디오 처리 장치(1000)의 전반적인 동작 및 영상 및 오디오 처리 장치(1000)의 내부 구성 요소들 사이의 신호 흐름을 제어하고, 데이터를 처리하는 기능을 수행한다. 프로세서(1020)는 사용자의 입력이 있거나 기설정되어 저장된 조건을 만족하는 경우, 메모리(1090)에 저장된 OS(Operation System) 및 다양한 애플리케이션을 실행할 수 있다.
또한, 프로세서(1020)는 내부 메모리(미도시)를 포함할 수 있을 것이다. 이 경우, 메모리(1090)에 저장되는 데이터, 프로그램, 및 인스트럭션 중 적어도 하나가 프로세서(1020)의 내부 메모리(미도시)에 저장될 수 있다. 예를 들어, 프로세서(1020)의 내부 메모리(미도시)는 뉴럴 네트워크를 이용하여 소정 동작들을 수행하기 위한 하나 이상의 프로그램, 또는 뉴럴 네트워크를 이용하여 소정 동작들을 수행하기 위한 하나 이상의 인스트럭션을 저장할 수 있다.
영상 신호 처리부(1060)는, 디스플레이(230)에 의해 표시될 영상 데이터를 처리하며, 영상 데이터에 대한 디코딩, 렌더링, 스케일링, 노이즈 필터링, 프레임 레이트 변환, 및 해상도 변환 등과 같은 다양한 영상 처리 동작을 수행할 수 있다. 특히, 영상 신호 처리부(1060)는 프로세서(1020)에 의해 제어되어 도 4에 도시된 블랙 이퀄라이저 동적 제어부(410) 및 명암비 및 색상 채도 제어부(420)에 대응되는 기능을 수행할 수 있다.
디스플레이(230)는 프로세서(1020)에 의해 제어되어 튜너부(1010)를 통해 수신된 방송 신호에 포함된 비디오를 화면에 디스플레이 할 수 있다. 또한, 디스플레이(230)는 통신부(1030) 또는 입/출력부(1050)를 통해 입력되는 컨텐트(예를 들어, 동영상)를 표시할 수 있다. 디스플레이(230)는 프로세서(1020)의 제어에 의해 메모리(1090)에 저장된 영상을 출력할 수 있다. 디스플레이(230)는 프로세서(1020)에 의해 제어되어 영상 신호 처리부(1060)에서 처리된 영상 신호를 디스플레이 할 수 있다.
오디오 신호 처리부(1070)는 오디오 데이터에 대한 처리를 수행한다. 오디오 신호 처리부(1070)에서는 오디오 데이터에 대한 디코딩이나 증폭, 노이즈 필터링 등과 같은 다양한 처리가 수행될 수 있다. 또한, 오디오 신호 처리부(1070)는 프로세서(1020)에 의해 제어되어 도 5에 도시된 고감도 생성 및 스테이지 확장부(510) 및 사운드 이퀄라이저 적용부(520)에 대응되는 기능을 수행할 수 있다.
오디오 출력부(240)는 프로세서(1020)에 의해 제어되어 튜너부(1010)를 통해 수신된 방송 신호에 포함된 오디오 신호, 통신부(1030) 또는 입/출력부(1050)를 통해 입력되는 오디오 신호, 메모리(1090)에 저장된 오디오 신호를 출력할 수 있다. 오디오 출력부(240)는 스피커, 헤드폰 출력 단자 또는 S/PDIF(Sony/Philips Digital Interface) 출력 단자 중 적어도 하나를 포함할 수 있다. 오디오 출력부(240)는 프로세서(1020)에 의해 제어되어 오디오 신호 처리부(1070)에서 처리된 오디오 신호를 출력할 수 있다.
사용자 입력부(1080)는, 사용자가 영상 및 오디오 처리 장치(1000)를 제어하기 위한 데이터를 입력하는 수단을 의미한다. 예를 들어, 사용자 입력부(1080)는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드, 조그 휠, 조그 스위치 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.
또한, 사용자 입력부(1080)는, 전술한 제어 장치(101)의 구성요소일 수 있고, 영상 및 오디오 처리 장치(1000)의 구성요소일 수 있다. 사용자 입력부(1080)는 제어 장치(101)로부터 전송되는 사용자 입력을 수신할 수 있는 기능을 포함할 수 있다.
한편, 도 2, 도 7, 및 도 10에 도시된 영상 및 오디오 처리 장치(100, 700, 1000)의 블록도는 일 실시예를 위한 블록도이다. 블록도의 각 구성요소는 실제 구현되는 영상 및 오디오 처리 장치(100, 700, 1000)의 사양에 따라 통합, 추가, 또는 생략될 수 있다. 예를 들어, 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분화되어 구성될 수 있다. 또한, 각 블록에서 수행하는 기능은 실시예들을 설명하기 위한 것이며, 그 구체적인 동작이나 장치는 본 발명의 권리범위를 제한하지 아니한다.
전술한 바와 같이, 본 개시의 일 또는 다른 실시예는 사용자가 컨텐트를 재생할 때, 컨텐트의 화질과 사운드를 장면단위의 영상 신호와 오디오 신호를 모두 고려하여 자동적으로 제어함으로써, 컨텐트의 특성에 기초하여 시인성을 개선하고, 렌더링된 사운드를 제공하여 컨텐트에 대한 사용자의 몰임감을 높일 수 있다. 또한, 본 개시의 일 또는 다른 실시예는, 영상 신호와 오디오 신호에 대한 각각의 분석결과를 영상 신호와 오디오 신호를 제어할 때 서로 이용함으로써, 제작자가 의도한 컨텐트를 사용자에게 충실하게 전달할 수 있다. 또한, 본 개시의 일 또는 다른 실시예는, 주변 조도에 따라 일관된 컨텐트에 대한 시인성을 제공할 수 있다. 또한, 본 개시의 일 또는 다른 실시 예는, 주변 환경에 따라 일관된 컨텐트에 대한 시인성 및 사운드를 제공할 수 있다.
일부 실시예에 따른 영상 및 오디오 처리 장치 및 그 동작 방법은 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.
또한, 본 명세서에서, “부”는 프로세서 또는 회로와 같은 하드웨어 구성(hardware component), 및/또는 프로세서와 같은 하드웨어 구성에 의해 실행되는 소프트웨어 구성(software component)일 수 있다.
또한, 전술한 본 개시의 실시예에 따른 영상 및 오디오 처리 장치 및 그 동작 방법은 다중언어로 구성된 문장을 획득하는 동작; 및 다중언어 번역 모델을 이용하여, 상기 다중언어로 구성된 문장에 포함되는 단어들 각각에 대응하는 벡터 값들을 획득하고, 상기 획득한 벡터 값들을 목표 언어에 대응하는 벡터 값들로 변환하며, 상기 변환된 벡터 값들에 기초하여, 상기 목표 언어로 구성된 문장을 획득하는 동작을 수행하도록 하는 프로그램이 저장된 기록매체를 포함하는 컴퓨터 프로그램 제품으로 구현될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (10)

  1. 영상 및 오디오 처리 장치에 있어서,
    디스플레이;
    오디오 출력부;
    상기 영상 및 오디오 처리 장치의 주변 조도 정보를 획득하는 조도 센서;
    하나 이상의 인스트럭션을 저장하는 메모리; 및
    상기 메모리에 저장된 상기 하나 이상의 인스트럭션을 실행하는 프로세서; 를 포함하고,
    상기 프로세서는, 상기 하나 이상의 인스럭션을 실행함으로써,
    컨텐트에 포함되는 장면의 영상 신호를 분석하여 상기 컨텐트의 영상 신호의 특성 정보를 검출하고,
    상기 컨텐트에 포함되는 장면의 오디오 신호를 분석하여 상기 컨텐트의 오디오 신호의 특성 정보를 검출하고,
    상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보를 이용하여 상기 컨텐트에 포함되는 장면의 영상 신호를 제어하여 상기 디스플레이로 출력하고,
    상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보를 이용하여 상기 컨텐트에 포함되는 장면의 오디오 신호를 제어하여 상기 오디오 출력부로 출력하고, 및
    상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보에 따라 획득된 블랙 이퀄라이저의 이득 값과 상기 주변 조도 정보 간의 관계에 기초하여, 상기 영상 신호의 어두운 영역에 대한 블랙 이퀄라이저 기능을 제어하고,
    상기 오디오 신호의 특성 정보는 오디오 객체의 위치 정보를 포함하는, 영상 및 오디오 처리 장치.
  2. 제 1 항에 있어서, 상기 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써,
    상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보에 기초하여 상기 컨텐트에 포함되는 장면의 상기 영상 신호에 대한 명암비 및 색상 채도 기능 중 적어도 하나를 제어하고,
    상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보에 기초하여 상기 컨텐트에 포함되는 장면의 상기 오디오 신호에 대한 고도감 생성 및 스테이지 확장 기능, 및 사운드 이퀄라이저 적용 기능 중 적어도 하나를 제어하는,
    영상 및 오디오 처리 장치.
  3. 제 1 항에 있어서, 상기 영상 신호의 특성 정보는 상기 영상 신호의 밝기 정보, 색상 정보, 명암비 정보 및 모션 정보 중 적어도 하나를 포함하고, 상기 오디오 신호의 특성 정보는 상기 오디오 객체의 위치 정보, 음성 정보, 음악 정보, 및 효과 음 정보 중 적어도 하나를 포함하는 영상 및 오디오 처리 장치.
  4. 제 1 항에 있어서, 상기 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써,
    상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보에 따라 상기 영상 신호를 제어할 때, 상기 주변 조도 정보를 더 이용하여 상기 영상 신호의 밝기, 명암비 및 색상의 채도 중 적어도 하나를 제어하는 것을 특징으로 하는 영상 및 오디오 처리 장치.
  5. 제 1 항에 있어서, 상기 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써,
    하나 이상의 뉴럴 네트워크를 이용한 학습 모델을 이용하여, 상기 컨텐트에 포함되는 장면의 영상 신호와 오디오 신호를 각각 분석하고, 상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보를 각각 검출하고, 상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보를 기반으로 상기 영상 신호를 동적으로 디스플레이 하도록 상기 디스플레이를 제어하고, 상기 오디오 신호를 동적으로 출력하도록 상기 오디오 출력부를 제어하는 영상 및 오디오 처리 장치.
  6. 영상 및 오디오 처리 장치의 동작 방법에 있어서,
    상기 영상 및 오디오 처리 장치에 의해, 하나 이상의 인스트럭션을 실행하여, 컨텐트에 포함되는 장면의 영상 신호를 분석하여 상기 영상 신호의 특성 정보를 검출하는 단계;
    상기 영상 및 오디오 처리 장치에 의해, 상기 컨텐트에 포함되는 장면의 오디오 신호를 분석하여 상기 오디오 신호의 특성 정보를 검출하는 단계;
    상기 영상 및 오디오 처리 장치의 주변 조도 정보를 획득하는 단계;
    상기 영상 및 오디오 처리 장치에 의해, 상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보를 이용하여 상기 컨텐트에 포함되는 장면의 영상 신호를 제어하여 상기 영상 및 오디오 처리 장치의 디스플레이를 통해 출력하는 단계;
    상기 영상 및 오디오 처리 장치에 의해, 상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보를 이용하여 상기 컨텐트에 포함되는 장면의 오디오 신호를 제어하여 상기 영상 및 오디오 처리 장치의 오디오 출력부를 통해 출력하는 단계; 및
    상기 영상 및 오디오 처리 장치에 의해, 상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보에 따라 획득된 블랙 이퀄라이저의 이득 값과 상기 주변 조도 정보 간의 관계에 기초하여, 상기 영상 신호의 어두운 영역에 대한 블랙 이퀄라이저 기능을 제어하는 단계를 포함하고,
    상기 오디오 신호의 특성 정보는 오디오 객체의 위치 정보를 포함하는. 영상 및 오디오 처리 장치의 동작 방법.
  7. 제 6 항에 있어서, 상기 영상 및 오디오 처리 장치의 동작 방법은,
    상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보에 기초하여 상기 컨텐트에 포함되는 장면의 상기 영상 신호에 대한 명암비 및 색상 채도 기능 중 적어도 하나를 제어하는 단계; 및
    상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보에 기초하여 상기 컨텐트에 포함되는 장면의 상기 오디오 신호에 대한 고도감 생성 및 스테이지 확장 기능, 및 사운드 이퀄라이저 적용 기능 중 적어도 하나를 제어하는 단계를 더 포함하는,
    영상 및 오디오 처리 장치의 동작 방법.
  8. 제 6 항에 있어서, 상기 영상 신호의 특성 정보는 상기 영상 신호의 밝기 정보, 색상 정보, 명암비 정보 및 모션 정보 중 적어도 하나를 포함하고, 상기 오디오 신호의 특성 정보는 상기 오디오 객체의 위치 정보, 음성 정보, 음악 정보, 및 효과 음 정보 중 적어도 하나를 포함하는 영상 및 오디오 처리 장치의 동작 방법.
  9. 제 6 항에 있어서, 상기 영상 및 오디오 처리 장치의 동작 방법은,
    상기 영상 신호의 특성 정보와 상기 오디오 신호의 특성 정보에 따라 상기 영상 신호를 제어할 때, 상기 주변 조도 정보를 더 이용하여 상기 영상 신호의 밝기, 명암비 및 색상의 채도 중 적어도 하나를 제어하는 것을 특징으로 하는 영상 및 오디오 처리 장치의 동작 방법.
  10. 제 6 항에 기재된 영상 및 오디오 처리 장치의 동작 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체.




KR1020180140097A 2018-11-14 2018-11-14 영상 및 오디오 처리 장치 및 그 동작 방법 KR102673322B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020180140097A KR102673322B1 (ko) 2018-11-14 2018-11-14 영상 및 오디오 처리 장치 및 그 동작 방법
US16/599,932 US11205391B2 (en) 2018-11-14 2019-10-11 Image and audio processing apparatus and operating method of the same
CN201980075313.4A CN113039807B (zh) 2018-11-14 2019-10-16 图像和音频处理装置及其操作方法
EP19885176.8A EP3824644A4 (en) 2018-11-14 2019-10-16 AUDIO AND IMAGE PROCESSING EQUIPMENT AND ITS OPERATING PROCESS
PCT/KR2019/013593 WO2020101189A1 (en) 2018-11-14 2019-10-16 Image and audio processing apparatus and operating method of the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180140097A KR102673322B1 (ko) 2018-11-14 2018-11-14 영상 및 오디오 처리 장치 및 그 동작 방법

Publications (2)

Publication Number Publication Date
KR20200056137A KR20200056137A (ko) 2020-05-22
KR102673322B1 true KR102673322B1 (ko) 2024-06-10

Family

ID=70551762

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180140097A KR102673322B1 (ko) 2018-11-14 2018-11-14 영상 및 오디오 처리 장치 및 그 동작 방법

Country Status (5)

Country Link
US (1) US11205391B2 (ko)
EP (1) EP3824644A4 (ko)
KR (1) KR102673322B1 (ko)
CN (1) CN113039807B (ko)
WO (1) WO2020101189A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200114898A (ko) * 2019-03-29 2020-10-07 엘지전자 주식회사 영상표시장치
CN111814745B (zh) * 2020-07-31 2024-05-10 Oppo广东移动通信有限公司 手势识别方法、装置、电子设备及存储介质
CN115250375B (zh) * 2021-04-26 2024-01-26 北京中关村科金技术有限公司 一种基于固定话术的音视频内容合规性检测方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140132628A1 (en) * 2012-11-12 2014-05-15 Sony Computer Entertainment Inc. Real world acoustic and lighting modeling for improved immersion in virtual reality and augmented reality environments

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100550577B1 (ko) * 1998-01-14 2006-06-21 엘지전자 주식회사 음성 적응형 영상 보정 방법 및 그 장치
JP2000135377A (ja) 1998-10-30 2000-05-16 Namco Ltd ゲームシステム及び情報記憶媒体
CN101278495A (zh) * 2005-09-30 2008-10-01 富士通株式会社 过采样和横向均衡器
KR20090015455A (ko) * 2007-08-08 2009-02-12 삼성전자주식회사 오디오 신호 및 비디오 신호를 상호 의존적으로 제어하는방법과 그 장치
JP2009194550A (ja) 2008-02-13 2009-08-27 Sony Corp 画質調整装置、画質調整方法及びプログラム
US20110095875A1 (en) 2009-10-23 2011-04-28 Broadcom Corporation Adjustment of media delivery parameters based on automatically-learned user preferences
JP2011223325A (ja) 2010-04-09 2011-11-04 Sony Corp コンテンツ検索装置および方法、並びにプログラム
KR101473249B1 (ko) 2012-10-30 2014-12-17 주식회사 케이티 콘텐츠 재생 속도 테이블 생성 서버, 디바이스 및 방법
JP6266904B2 (ja) 2013-06-19 2018-01-24 株式会社カプコン ゲームプログラムおよびゲームシステム
KR102244918B1 (ko) * 2014-07-11 2021-04-27 삼성전자주식회사 시인성을 향상시키고 전력 소모를 줄일 수 있는 디스플레이 컨트롤러와 이를 포함하는 디스플레이 시스템
US9824278B2 (en) 2015-06-24 2017-11-21 Netflix, Inc. Determining native resolutions of video sequences
KR20170009037A (ko) * 2015-07-15 2017-01-25 삼성전자주식회사 영상 컨텐츠 제공 장치 및 영상 컨텐츠 제공 방법
US9432230B1 (en) * 2015-10-21 2016-08-30 Freescale Semiconductor, Inc. Passive equalizer capable of use in a receiver
TWI573126B (zh) 2016-01-08 2017-03-01 明基電通股份有限公司 可依據不同環境執行最佳化調整的影像調整方法及其顯示器

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140132628A1 (en) * 2012-11-12 2014-05-15 Sony Computer Entertainment Inc. Real world acoustic and lighting modeling for improved immersion in virtual reality and augmented reality environments

Also Published As

Publication number Publication date
EP3824644A1 (en) 2021-05-26
EP3824644A4 (en) 2021-12-22
WO2020101189A1 (en) 2020-05-22
CN113039807A (zh) 2021-06-25
US20200152138A1 (en) 2020-05-14
CN113039807B (zh) 2024-01-05
US11205391B2 (en) 2021-12-21
KR20200056137A (ko) 2020-05-22

Similar Documents

Publication Publication Date Title
KR102691543B1 (ko) 오디오 장면을 인식하는 전자 장치 및 그 방법
US11132775B2 (en) Image processing apparatus and method of operating the same
KR102673322B1 (ko) 영상 및 오디오 처리 장치 및 그 동작 방법
KR102622950B1 (ko) 디스플레이장치, 그 제어방법 및 기록매체
KR102603621B1 (ko) 신호 처리 장치 및 이를 구비하는 영상표시장치
US20160191841A1 (en) Display device and display method
US11514107B2 (en) Image display apparatus and operation method of the same
US20220036536A1 (en) Video quality assessing method and apparatus
KR20200036661A (ko) 디스플레이 장치의 제어 방법 및 그에 따른 디스플레이 장치
US11699289B2 (en) Display device for generating multimedia content, and operation method of the display device
US11373280B2 (en) Electronic device and method of training a learning model for contrast ratio of an image
US11627383B2 (en) Electronic device and operation method thereof
CN113475091B (zh) 显示设备及其图像显示方法
KR20220120303A (ko) 디스플레이 장치 및 그 동작방법
US10992273B2 (en) Electronic device and operation method thereof
KR102650138B1 (ko) 디스플레이장치, 그 제어방법 및 기록매체
US10089060B2 (en) Device for controlling sound reproducing device and method of controlling the device
EP3874765B1 (en) Electronic device and operation method thereof
KR102664197B1 (ko) 영상 표시 방법 및 그에 따른 디스플레이 장치
KR20210045227A (ko) 디스플레이 장치 및 그 동작방법
CN113448530A (zh) 显示设备和音量控制方法
CN117133296A (zh) 显示设备及多路语音信号的混音处理方法
KR20240026000A (ko) 전자 장치 및 그 동작 방법
KR20240037802A (ko) 프로젝션 장치 및 그 동작 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant