KR20200086064A - 신호 처리 장치 및 이를 구비하는 영상표시장치 - Google Patents

신호 처리 장치 및 이를 구비하는 영상표시장치 Download PDF

Info

Publication number
KR20200086064A
KR20200086064A KR1020190002219A KR20190002219A KR20200086064A KR 20200086064 A KR20200086064 A KR 20200086064A KR 1020190002219 A KR1020190002219 A KR 1020190002219A KR 20190002219 A KR20190002219 A KR 20190002219A KR 20200086064 A KR20200086064 A KR 20200086064A
Authority
KR
South Korea
Prior art keywords
signal
unit
channel
image
main component
Prior art date
Application number
KR1020190002219A
Other languages
English (en)
Other versions
KR102603621B1 (ko
Inventor
김기출
이준일
김종건
전선하
박종하
이동윤
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020190002219A priority Critical patent/KR102603621B1/ko
Priority to CN202010017313.3A priority patent/CN111432273B/zh
Priority to PCT/KR2020/000335 priority patent/WO2020145659A1/en
Priority to US16/737,646 priority patent/US11089423B2/en
Priority to EP20150690.4A priority patent/EP3680897B1/en
Publication of KR20200086064A publication Critical patent/KR20200086064A/ko
Application granted granted Critical
Publication of KR102603621B1 publication Critical patent/KR102603621B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

본 발명은 신호 처리 장치 및 이를 구비하는 영상표시장치에 관한 것이다. 본 발명의 일 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 입력되는 스테레오 오디오 신호를 주파수 변환하는 변환부와, 변환부로부터의 신호에 기초하여, 주성분 분석을 수행하는 주성분 분석부와, 주성분 분석부로부터의 신호에 기초하여 주성분 신호의 특징을 추출하는 특징 추출부와, 심층 신경망 모델 기반하에 수행된 예측에 기초하여, 포락선 조정을 수행하는 포락선 조정부와, 포락선 조정부로부터 신호를 역변환하여 멀티 채널의 업믹스 오디오 신호를 출력하는 역변환부를 포함한다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다.

Description

신호 처리 장치 및 이를 구비하는 영상표시장치{Signal processing device and image display apparatus including the same}
본 발명은 신호 처리 장치 및 이를 구비하는 영상표시장치에 관한 것이며, 더욱 상세하게는 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있는 신호 처리 장치 및 이를 구비하는 영상표시장치에 관한 것이다.
신호 처리 장치는, 영상 신호 처리 또는 음성 신호 처리를 수행할 수 있는 장치이다.
최근 ATSC 3.0의 MPEG-H 3D Audio와 Dolby AC4, Dolby ATMOS, DTS Virtual:X 등과 같은 오디오 코덱이 표준화되고 이를 렌더링 할 수 있는 기술이 모바일, 홈씨어터, 영상표시장치 등의 오디오 장치로 널리 보급되고 있다.
즉, 기존의 멀티 채널 오디오 코덱에서 이머시브(immersive) 오디오 코덱으로 패러다임이 변화하고 있다.
또한, 오디오 재생 장치는 효과적인 공간감을 재현하기 위하여 좌우 스피커 한쌍으로 구성한 2채널에서 5.1, 7.1채널 등으로 확장하여 2차원 평면상의 음장을 형성하였다.
그리고, 최근 UHDTV와 같은 초고화질에 부합한 실감 오디오를 위하여, 5.1.2, 22.2 채널과 같이 3차원 공간을 표현할 수 있는 멀티 채널로 더욱 심화하였다.
하지만 고비용의 컨텐츠 제작비용, 이를 소비자에게 송출할 수 있는 송출장비, 유무선 환경의 제약, 오디오 재생장치의 가격 경쟁력 등의 문제로 저품질의 스테레오 음원이나 멀티 채널을 다운믹스하여, 소비자에게 전달되고 있다.
이러한 다운믹스 2채널 스테레오 음원을, 멀티 채널 오디오 재생장치에서의 효과적인 재생을 위해, 멀티 채널 업믹스 방법이 요구되고 있다.
여러 채널 혹은 음원 소스가 합쳐진 신호에서, 개별 채널 혹은 소스로 다시 분리하는 방법을 Blind Upmix, Blind Source Separation 이라 한다.
Blind Upmix, Source Separation 방법으로, 오디오 소스들이 서로 독립적인 특성을 갖는다는 가정으로 분석하는 독립성분 분석 방법(Independent Componen Analysis, ICA), 주성분과 부성분 신호로 분석하는 주성분 분석 방법(Primary Component Analysis, PCA), 비지도 학습 기반의 비음수 행렬 분해 방법 (Nonnegative Matrix Factorization, NMF) 등이 있다.
한편, 주성분 분석 방법(PCA)에 따라, 주성분과 부성분으로 분리된 신호는, 원본 멀티 채널과는 다르기 때문에 주성분과 부성분을 원본의 멀티 채널 신호에 매칭하기는 불가능하다.
예를 들어, 멀티 채널 재생장치에서 주성분을 전방 채널에 배치하고 부성분은 전 채널에 고르게 배치하거나, 후방, 샹향 채널에 렌더링하면 실제 컨텐츠 제작자의 의도와는 다르게 전방에만 오디오 객체가 정위되는 등 왜곡된 공간 음향 특성이 나타난다.
한편, ICA, NMF 등에 기반한 방법 역시 독립성분, 기저성분을 기반으로 신호를 분해하므로, 실제의 전방, 중심, 우퍼, 후방, 상향등의 멀티 채널로 매칭시키는 것은 어렵다.
본 발명의 목적은, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있는 신호 처리 장치 및 이를 구비하는 영상표시장치를 제공함에 있다.
본 발명의 다른 목적은, 주성분 분석 방법과 심층 신경망 모델을 이용하여 멀티 채널 신호를 합성할 수 있는 신호 처리 장치 및 이를 구비하는 영상표시장치를 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 입력되는 스테레오 오디오 신호를 주파수 변환하는 변환부와, 변환부로부터의 신호에 기초하여, 주성분 분석을 수행하는 주성분 분석부와, 주성분 분석부로부터의 신호에 기초하여 주성분 신호의 특징을 추출하는 특징 추출부와, 심층 신경망 모델 기반하에 수행된 예측에 기초하여, 포락선 조정을 수행하는 포락선 조정부와, 포락선 조정부로부터 신호를 역변환하여 멀티 채널의 업믹스 오디오 신호를 출력하는 역변환부를 포함한다.
한편, 본 발명의 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 변환부로부터의 주파수 변환된 스테레오 오디오 신호를 복수의 대역통과필터에 의해 필터링을 수행하는 필터뱅크를 더 포함할 수 있다.
한편, 본 발명의 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 특징 추출부로부터의 특징에 기초하여, 심층 신경망 모델 기반하에 예측을 수행하는 모델 학습예측부를 더 포함할 수 있다.
한편, 본 발명의 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 모델 학습예측부로부터의 예측 결과에 마스킹을 수행하는 마스킹부를 더 포함할 수 있다.
한편, 마스킹부는, 멀티 채널의 각 채널이 시간과 주파수에 대해 독립인 경우, 모델 학습예측부로부터의 예측 결과에 기초하여, 시간 주파수 성분으로 마스킹을 수행하여, 채널 분리를 수행할 수 있다.
한편, 포락선 조정부는, 모델 학습예측부로부터의 예측 결과에 기초하여, 주파수 밴드에 대한 가중치 함수에 따라, 주파수 대역에서의 신호의 포락선을 보정하여, 채널을 분리할 수 있다.
한편, 포락선 조정부는, 각 주파수 주파수 밴드의 크기를 목표 채널에 포락선에 추종하도록 조정할 수 있다.
한편, 주성분 분석부는, 입력되는 스테레오 오디오 신호의 주성분 신호와 부성분 신호를 분리할 수 있다.
한편, 주성분 분석부는, 입력되는 스테레오 오디오 신호의 주성분 신호의 채널 간의 상관 관계 연산, 주성분 신호의 패닝 이득 연산, 주성분 신호의 파워 연산을 수행할 수 있다.
한편, 특징 추출부는, 입력되는 스테레오 오디오 신호의 주성분 신호의 패닝 이득, 주성분 신호의 파워를 특징으로 추출할 수 있다.
한편, 본 발명의 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 데이터 베이스로부터 수신되는 다운믹스 스테레오 오디오 신호 또는 멀티 채널 오디오 신호를 주파수 변환하는 제2 변환부와, 제2 변환부로부터의 신호에 기초하여, 주성분 분석을 수행하는 제2 주성분 분석부와, 제2 주성분 분석부로부터의 신호에 기초하여 주성분 신호의 특징을 추출하는 제2 특징 추출부를 더 포함하며, 제2 특징 추출부에서 추출된 특징에 기초하여, 심층 신경망 모델 기반하에 학습이 수행될 수 있다.
한편, 본 발명의 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 제2 특징 추출부에서 추출된 특징에 기초하여, 심층 신경망 모델 기반하에 학습을 수행하는 모델 학습예측부를 더 포함할 수 있다.
본 발명의 일 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 입력되는 스테레오 오디오 신호를 주파수 변환하는 변환부와, 변환부로부터의 신호에 기초하여, 주성분 분석을 수행하는 주성분 분석부와, 주성분 분석부로부터의 신호에 기초하여 주성분 신호의 특징을 추출하는 특징 추출부와, 심층 신경망 모델 기반하에 수행된 예측에 기초하여, 포락선 조정을 수행하는 포락선 조정부와, 포락선 조정부로부터 신호를 역변환하여 멀티 채널의 업믹스 오디오 신호를 출력하는 역변환부를 포함한다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다. 특히, 주성분 분석 방법과 심층 신경망 모델을 이용하여 멀티 채널 신호를 간단하게 합성할 수 있게 된다.
한편, 본 발명의 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 변환부로부터의 주파수 변환된 스테레오 오디오 신호를 복수의 대역통과필터에 의해 필터링을 수행하는 필터뱅크를 더 포함할 수 있다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다.
한편, 본 발명의 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 특징 추출부로부터의 특징에 기초하여, 심층 신경망 모델 기반하에 예측을 수행하는 모델 학습예측부를 더 포함할 수 있다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다.
한편, 본 발명의 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 모델 학습예측부로부터의 예측 결과에 마스킹을 수행하는 마스킹부를 더 포함할 수 있다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다.
한편, 마스킹부는, 멀티 채널의 각 채널이 시간과 주파수에 대해 독립인 경우, 모델 학습예측부로부터의 예측 결과에 기초하여, 시간 주파수 성분으로 마스킹을 수행하여, 채널 분리를 수행할 수 있다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다.
한편, 포락선 조정부는, 모델 학습예측부로부터의 예측 결과에 기초하여, 주파수 밴드에 대한 가중치 함수에 따라, 주파수 대역에서의 신호의 포락선을 보정하여, 채널을 분리할 수 있다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다.
한편, 포락선 조정부는, 각 주파수 주파수 밴드의 크기를 목표 채널에 포락선에 추종하도록 조정할 수 있다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다.
한편, 주성분 분석부는, 입력되는 스테레오 오디오 신호의 주성분 신호와 부성분 신호를 분리할 수 있다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다.
한편, 주성분 분석부는, 입력되는 스테레오 오디오 신호의 주성분 신호의 채널 간의 상관 관계 연산, 주성분 신호의 패닝 이득 연산, 주성분 신호의 파워 연산을 수행할 수 있다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다.
한편, 특징 추출부는, 입력되는 스테레오 오디오 신호의 주성분 신호의 패닝 이득, 주성분 신호의 파워를 특징으로 추출할 수 있다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다.
한편, 본 발명의 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 데이터 베이스로부터 수신되는 다운믹스 스테레오 오디오 신호 또는 멀티 채널 오디오 신호를 주파수 변환하는 제2 변환부와, 제2 변환부로부터의 신호에 기초하여, 주성분 분석을 수행하는 제2 주성분 분석부와, 제2 주성분 분석부로부터의 신호에 기초하여 주성분 신호의 특징을 추출하는 제2 특징 추출부를 더 포함하며, 제2 특징 추출부에서 추출된 특징에 기초하여, 심층 신경망 모델 기반하에 학습이 수행될 수 있다. 이에 따라, 심층 신경망 모델 기반하에 학습을 수행할 수 있게 된다.
한편, 본 발명의 실시예에 따른 신호 처리 장치 및 이를 구비하는 영상표시장치는, 제2 특징 추출부에서 추출된 특징에 기초하여, 심층 신경망 모델 기반하에 학습을 수행하는 모델 학습예측부를 더 포함할 수 있다. 이에 따라, 심층 신경망 모델 기반하에 학습을 수행할 수 있게 된다.
도 1은 본 발명의 일 실시예에 따른 영상표시 시스템을 도시한 도면이다.
도 2는 도 1의 영상표시장치의 내부 블록도의 일예이다.
도 3은 도 2의 신호 처리부의 내부 블록도의 일예이다.
도 4a는 도 2의 원격제어장치의 제어 방법을 도시한 도면이다.
도 4b는 도 2의 원격제어장치의 내부 블록도이다.
도 5는 도 2의 디스플레이의 내부 블록도이다.
도 6a 내지 도 6b는 도 5의 유기발광패널의 설명에 참조되는 도면이다.
도 7은 본 발명의 실시예에 따른 신호 처리부의 내부 블록도의 일예이다.
도 8 내지 도 9b는 도 7의 신호 처리부의 동작 설명에 참조되는 도면이다.
도 10은 본 발명의 일실시예에 따른 신호 처리부의 내부 블록도의 일예이다.
도 11은 본 발명의 일실시예에 따른 신호 처리부의 내부 블록도의 다른 예이다.
도 12는 도 10 내지 도 11의 설명에 참조되는 도면이다.
도 13은 본 발명의 일실시예에 따른 신호 처리부의 동작을 나타내는 순서도이다.
도 14는 본 발명의 다른 실시예에 따른 신호 처리부의 동작을 나타내는 순서도이다.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 단순히 본 명세서 작성의 용이함만이 고려되어 부여되는 것으로서, 그 자체로 특별히 중요한 의미 또는 역할을 부여하는 것은 아니다. 따라서, 상기 "모듈" 및 "부"는 서로 혼용되어 사용될 수도 있다.
도 1은 본 발명의 일 실시예에 따른 영상표시 시스템을 도시한 도면이다.
도면을 참조하면, 본 발명의 일 실시예에 따른 영상표시 시스템(10)은, 디스플레이(180)를 구비하는 영상표시장치(100), 셋탑 박스(300), 및 서버(600)를 포함할 수 잇다.
본 발명의 일 실시예에 따른 영상표시장치(100)는, 셋탑 박스(300), 또는 서버(600)로부터 영상을 수신할 수 있다.
예를 들어, 영상표시장치(100)는, 셋탑 박스(300)로부터의 영상 신호를 HDMI 단자를 통해 수신할 수 있다.
다른 예로, 영상표시장치(100)는, 서버(600)로부터 영상 신호를 네트워크 단자를 통해 수신할 수 있다.
한편, 영상표시장치(100)는, 외부의 셋탑 박스(300) 또는 네트워크를 통해 수신되는 영상 신호의 원본 퀄리티를 연산하고, 연산된 원본 퀄리티에 따라, 영상 신호의 화질을 설정하는 화질 설정부(634)와, 설정된 화질에 따라, 영상 신호의 화질 처리를 수행하고, 설정된 화질에 따라, 영상 신호의 화질 처리를 수행하는 화질 처리를 수행할 수 있다.
한편, 영상표시장치(100)는, 심층 신경망(Deep Neural Network; DNN)을 이용하여, 수신되는 영상 신호의 해상도와, 노이즈 수준을 연산할 수 있다. 이에 따라, 수신되는 영상 신호의 원본 퀄리티 연산을 정확하게 수행할 수 있게 된다.
한편, 영상표시장치(100)는, 서버(600)로부터 심층 신경망에 대한 파라미터를 업데이트하고, 업데이트된 파라미터에 기초하여, 수신되는 영상 신호의 해상도와, 노이즈 수준을 연산할 수 있다. 이에 따라, 학습 기반하에 영상 신호의 원본 퀄리티 연산을 정확하게 수행할 수 있게 된다.
한편, 디스플레이(180)는 다양한 패널 중 어느 하나로 구현될 수 있다. 예를 들어, 디스플레이(180)는, 액정표시패널(LCD 패널), 유기발광패널(OLED 패널), 무기발광패널(LED 패널) 등 중 어느 하나일 수 있다.
본 발명에서는, 디스플레이(180)가 유기발광패널(OLED 패널)을 구비하는 것을 중심으로 기술한다.
한편, 유기발광패널(OLED 패널)은, 액정표시패널 보다 패널 응답 속도가 빠르며, 색재현 효과가 뛰어나며, 색재현성이 뛰어나다는 장점이 있다.
이에 따라, 디스플레이(180)가 유기발광패널을 구비하는 경우, 영상표시장치(100) 내의 신호 처리부(도 2의 170)는, 유기발광패널에 대응하는 화질 처리를 수행하는 것이 바람직하다. 한편, 신호 처리부는, 신호 처리 장치로 명명할 수도 있다.
한편, 도 1의 영상표시장치(100)는, TV, 모니터, 태블릿 PC, 이동 단말기, 차량용 디스플레이 등이 가능하다.
한편, 영상표시장치(100)는, 심층 신경망(Deep Neural Network)을 이용하여, 입력되는 스테레오 채널의 오디오 신호를 멀티 채널의 오디오 신호로 업믹스할 수 있다.
이를 위해, 본 발명의 일 실시예에 따른 영상표시장치(100)는, 입력되는 스테레오 오디오 신호를 주파수 변환하는 변환부(1010)와, 변환부(1010)로부터의 신호에 기초하여, 주성분 분석을 수행하는 주성분 분석부(1030)와, 주성분 분석부(1030)로부터의 신호에 기초하여 주성분 신호의 특징을 추출하는 특징 추출부(1040)와, 심층 신경망 모델 기반하에 수행된 예측에 기초하여, 포락선 조정을 수행하는 포락선 조정부(1060)와, 포락선 조정부(1060)로부터 신호를 역변환하여 멀티 채널의 업믹스 오디오 신호를 출력하는 역변환부(1070)를 포함한다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다. 특히, 주성분 분석 방법과 심층 신경망 모델을 이용하여 멀티 채널 신호를 간단하게 합성할 수 있게 된다.
도 2는 도 1의 영상표시장치의 내부 블록도의 일예이다.
도 2를 참조하면, 본 발명의 일실시예에 의한 영상표시장치(100)는, 영상 수신부(105), 저장부(140), 사용자입력 인터페이스부(150), 센서부(미도시), 신호 처리부(170), 디스플레이(180), 오디오 출력부(185)를 포함할 수 있다.
영상 수신부(105)는, 튜너부(110), 복조부(120), 네트워크 인터페이스부(130), 외부장치 인터페이스부(130)를 포함할 수 있다.
한편, 영상 수신부(105)는, 도면과 달리, 튜너부(110), 복조부(120)와, 외부장치 인터페이스부(130)만을 포함하는 것도 가능하다. 즉, 네트워크 인터페이스부(130)를 포함하지 않을 수도 있다.
튜너부(110)는, 안테나(미도시)를 통해 수신되는 RF(Radio Frequency) 방송 신호 중 사용자에 의해 선택된 채널 또는 기저장된 모든 채널에 해당하는 RF 방송 신호를 선택한다. 또한, 선택된 RF 방송 신호를 중간 주파수 신호 혹은 베이스 밴드 영상 또는 음성신호로 변환한다.
예를 들어, 선택된 RF 방송 신호가 디지털 방송 신호이면 디지털 IF 신호(DIF)로 변환하고, 아날로그 방송 신호이면 아날로그 베이스 밴드 영상 또는 음성 신호(CVBS/SIF)로 변환한다. 즉, 튜너부(110)는 디지털 방송 신호 또는 아날로그 방송 신호를 처리할 수 있다. 튜너부(110)에서 출력되는 아날로그 베이스 밴드 영상 또는 음성 신호(CVBS/SIF)는 신호 처리부(170)로 직접 입력될 수 있다.
한편, 튜너부(110)는, 복수 채널의 방송 신호를 수신하기 위해, 복수의 튜너를 구비하는 것이 가능하다. 또는, 복수 채널의 방송 신호를 동시에 수신하는 단일 튜너도 가능하다.
복조부(120)는 튜너부(110)에서 변환된 디지털 IF 신호(DIF)를 수신하여 복조 동작을 수행한다.
복조부(120)는 복조 및 채널 복호화를 수행한 후 스트림 신호(TS)를 출력할 수 있다. 이때 스트림 신호는 영상 신호, 음성 신호 또는 데이터 신호가 다중화된 신호일 수 있다.
복조부(120)에서 출력한 스트림 신호는 신호 처리부(170)로 입력될 수 있다. 신호 처리부(170)는 역다중화, 영상/음성 신호 처리 등을 수행한 후, 디스플레이(180)에 영상을 출력하고, 오디오 출력부(185)로 음성을 출력한다.
외부장치 인터페이스부(130)는, 접속된 외부 장치(미도시), 예를 들어, 셋탑 박스(50)와 데이터를 송신 또는 수신할 수 있다. 이를 위해, 외부장치 인터페이스부(130)는, A/V 입출력부(미도시)를 포함할 수 있다.
외부장치 인터페이스부(130)는, DVD(Digital Versatile Disk), 블루레이(Blu ray), 게임기기, 카메라, 캠코더, 컴퓨터(노트북), 셋탑 박스 등과 같은 외부 장치와 유/무선으로 접속될 수 있으며, 외부 장치와 입력/출력 동작을 수행할 수도 있다.
A/V 입출력부는, 외부 장치의 영상 및 음성 신호를 입력받을 수 있다. 한편, 무선 통신부(미도시)는, 다른 전자기기와 근거리 무선 통신을 수행할 수 있다.
이러한 무선 통신부(미도시)를 통해, 외부장치 인터페이스부(130)는, 인접하는 이동 단말기(600)와 데이터를 교환할 수 있다. 특히, 외부장치 인터페이스부(130)는, 미러링 모드에서, 이동 단말기(600)로부터 디바이스 정보, 실행되는 애플리케이션 정보, 애플리케이션 이미지 등을 수신할 수 있다.
네트워크 인터페이스부(135)는, 영상표시장치(100)를 인터넷망을 포함하는 유/무선 네트워크와 연결하기 위한 인터페이스를 제공한다. 예를 들어, 네트워크 인터페이스부(135)는, 네트워크를 통해, 인터넷 또는 컨텐츠 제공자 또는 네트워크 운영자가 제공하는 컨텐츠 또는 데이터들을 수신할 수 있다.
한편, 네트워크 인터페이스부(135)는, 무선 통신부(미도시)를 포함할 수 있다.
저장부(140)는, 신호 처리부(170) 내의 각 신호 처리 및 제어를 위한 프로그램이 저장될 수도 있고, 신호 처리된 영상, 음성 또는 데이터 신호를 저장할 수도 있다.
또한, 저장부(140)는 외부장치 인터페이스부(130)로 입력되는 영상, 음성 또는 데이터 신호의 임시 저장을 위한 기능을 수행할 수도 있다. 또한, 저장부(140)는, 채널 맵 등의 채널 기억 기능을 통하여 소정 방송 채널에 관한 정보를 저장할 수 있다.
도 2의 저장부(140)가 신호 처리부(170)와 별도로 구비된 실시예를 도시하고 있으나, 본 발명의 범위는 이에 한정되지 않는다. 저장부(140)는 신호 처리부(170) 내에 포함될 수 있다.
사용자입력 인터페이스부(150)는, 사용자가 입력한 신호를 신호 처리부(170)로 전달하거나, 신호 처리부(170)로부터의 신호를 사용자에게 전달한다.
예를 들어, 원격제어장치(200)로부터 전원 온/오프, 채널 선택, 화면 설정 등의 사용자 입력 신호를 송신/수신하거나, 전원키, 채널키, 볼륨키, 설정치 등의 로컬키(미도시)에서 입력되는 사용자 입력 신호를 신호 처리부(170)에 전달하거나, 사용자의 제스처를 센싱하는 센서부(미도시)로부터 입력되는 사용자 입력 신호를 신호 처리부(170)에 전달하거나, 신호 처리부(170)로부터의 신호를 센서부(미도시)로 송신할 수 있다.
신호 처리부(170)는, 튜너부(110) 또는 복조부(120) 또는 네트워크 인터페이스부(135) 또는 외부장치 인터페이스부(130)를 통하여, 입력되는 스트림을 역다중화하거나, 역다중화된 신호들을 처리하여, 영상 또는 음성 출력을 위한 신호를 생성 및 출력할 수 있다.
예를 들어, 신호 처리부(170)는, 영상 수신부(105)에서 수신된 방송 신호 또는 HDMI 신호 등을 수신하고, 수신되는 방송 신호 또는 HDMI 신호에 기초한 신호 처리를 수행하여, 신호 처리된 영상 신호를 출력할 수 있다.
신호 처리부(170)에서 영상 처리된 영상 신호는 디스플레이(180)로 입력되어, 해당 영상 신호에 대응하는 영상으로 표시될 수 있다. 또한, 신호 처리부(170)에서 영상 처리된 영상 신호는 외부장치 인터페이스부(130)를 통하여 외부 출력장치로 입력될 수 있다.
신호 처리부(170)에서 처리된 음성 신호는 오디오 출력부(185)로 음향 출력될 수 있다. 또한, 신호 처리부(170)에서 처리된 음성 신호는 외부장치 인터페이스부(130)를 통하여 외부 출력장치로 입력될 수 있다.
도 2에는 도시되어 있지 않으나, 신호 처리부(170)는 역다중화부, 영상처리부 등을 포함할 수 있다. 즉, 신호 처리부(170)는, 다양한 신호 처리를 수행할 수 있으며, 이에 따라, 시스템 온 칩(System On Chip,SOC)의 형태로 구현될 수 있다. 이에 대해서는 도 3을 참조하여 후술한다.
그 외, 신호 처리부(170)는, 영상표시장치(100) 내의 전반적인 동작을 제어할 수 있다. 예를 들어, 신호 처리부(170)는 튜너부(110)를 제어하여, 사용자가 선택한 채널 또는 기저장된 채널에 해당하는 RF 방송을 선택(Tuning)하도록 제어할 수 있다.
또한, 신호 처리부(170)는 사용자입력 인터페이스부(150)를 통하여 입력된 사용자 명령 또는 내부 프로그램에 의하여 영상표시장치(100)를 제어할 수 있다.
한편, 신호 처리부(170)는, 영상을 표시하도록 디스플레이(180)를 제어할 수 있다. 이때, 디스플레이(180)에 표시되는 영상은, 정지 영상 또는 동영상일 수 있으며, 2D 영상 또는 3D 영상일 수 있다.
한편, 신호 처리부(170)는 디스플레이(180)에 표시되는 영상 내에, 소정 오브젝트가 표시되도록 할 수 있다. 예를 들어, 오브젝트는, 접속된 웹 화면(신문, 잡지 등), EPG(Electronic Program Guide), 다양한 메뉴, 위젯, 아이콘, 정지 영상, 동영상, 텍스트 중 적어도 하나일 수 있다.
한편, 신호 처리부(170)는, 촬영부(미도시)로부터 촬영된 영상에 기초하여, 사용자의 위치를 인식할 수 있다. 예를 들어, 사용자와 영상표시장치(100) 간의 거리(z축 좌표)를 파악할 수 있다. 그 외, 사용자 위치에 대응하는 디스플레이(180) 내의 x축 좌표, 및 y축 좌표를 파악할 수 있다.
디스플레이(180)는, 신호 처리부(170)에서 처리된 영상 신호, 데이터 신호, OSD 신호, 제어 신호 또는 외부장치 인터페이스부(130)에서 수신되는 영상 신호, 데이터 신호, 제어 신호 등을 변환하여 구동 신호를 생성한다.
한편, 디스플레이(180)는, 터치 스크린으로 구성되어 출력 장치 이외에 입력 장치로 사용되는 것도 가능하다.
오디오 출력부(185)는, 신호 처리부(170)에서 음성 처리된 신호를 입력 받아 음성으로 출력한다.
촬영부(미도시)는 사용자를 촬영한다. 촬영부(미도시)는 1 개의 카메라로 구현되는 것이 가능하나, 이에 한정되지 않으며, 복수 개의 카메라로 구현되는 것도 가능하다. 촬영부(미도시)에서 촬영된 영상 정보는 신호 처리부(170)에 입력될 수 있다.
신호 처리부(170)는, 촬영부(미도시)로부터 촬영된 영상, 또는 센서부(미도시)로부터의 감지된 신호 각각 또는 그 조합에 기초하여 사용자의 제스처를 감지할 수 있다.
전원 공급부(190)는, 영상표시장치(100) 전반에 걸쳐 해당 전원을 공급한다. 특히, 전원 공급부(190)는, 시스템 온 칩(System On Chip,SOC)의 형태로 구현될 수 있는 신호 처리부(170)와, 영상 표시를 위한 디스플레이(180), 및 오디오 출력을 위한 오디오 출력부(185) 등에 전원을 공급할 수 있다.
구체적으로, 전원 공급부(190)는, 교류 전원을 직류 전원으로 변환하는 컨버터와, 직류 전원의 레벨을 변환하는 dc/dc 컨버터를 구비할 수 있다.
원격제어장치(200)는, 사용자 입력을 사용자입력 인터페이스부(150)로 송신한다. 이를 위해, 원격제어장치(200)는, 블루투스(Bluetooth), RF(Radio Frequency) 통신, 적외선(IR) 통신, UWB(Ultra Wideband), 지그비(ZigBee) 방식 등을 사용할 수 있다. 또한, 원격제어장치(200)는, 사용자입력 인터페이스부(150)에서 출력한 영상, 음성 또는 데이터 신호 등을 수신하여, 이를 원격제어장치(200)에서 표시하거나 음성 출력할 수 있다.
한편, 상술한 영상표시장치(100)는, 고정형 또는 이동형 디지털 방송 수신 가능한 디지털 방송 수신기일 수 있다.
한편, 도 2에 도시된 영상표시장치(100)의 블록도는 본 발명의 일실시예를 위한 블록도이다. 블록도의 각 구성요소는 실제 구현되는 영상표시장치(100)의 사양에 따라 통합, 추가, 또는 생략될 수 있다. 즉, 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분되어 구성될 수 있다. 또한, 각 블록에서 수행하는 기능은 본 발명의 실시예를 설명하기 위한 것이며, 그 구체적인 동작이나 장치는 본 발명의 권리범위를 제한하지 아니한다.
도 3은 도 2의 신호 처리부의 내부 블록도의 일예이다.
도면을 참조하여 설명하면, 본 발명의 일실시예에 의한 신호 처리부(170)는, 역다중화부(310), 영상 처리부(320), 프로세서(330), 오디오 처리부(370)를 포함할 수 있다. 그 외 , 데이터 처리부(미도시)를 더 포함할 수 있다.
역다중화부(310)는, 입력되는 스트림을 역다중화한다. 예를 들어, MPEG-2 TS가 입력되는 경우 이를 역다중화하여, 각각 영상, 음성 및 데이터 신호로 분리할 수 있다. 여기서, 역다중화부(310)에 입력되는 스트림 신호는, 튜너부(110) 또는 복조부(120) 또는 외부장치 인터페이스부(130)에서 출력되는 스트림 신호일 수 있다.
영상 처리부(320)는, 입력되는 영상에 대한 신호 처리를 수행할 수 있다. 예를 들어, 영상 처리부(320)는, 역다중화부(310)로부터 역다중화된 영상 신호의 영상 처리를 수행할 수 있다.
이를 위해, 영상 처리부(320)는, 영상 디코더(325), 스케일러(335), 화질 처리부(635), 영상 인코더(미도시), OSD 생성부(340), 프레임 레이트 변환부(350), 및 포맷터(360) 등을 포함할 수 있다.
영상 디코더(325)는, 역다중화된 영상신호를 복호화하며, 스케일러(335)는, 복호화된 영상신호의 해상도를 디스플레이(180)에서 출력 가능하도록 스케일링(scaling)을 수행한다.
영상 디코더(325)는 다양한 규격의 디코더를 구비하는 것이 가능하다. 예를 들어, MPEG-2, H,264 디코더, 색차 영상(color image) 및 깊이 영상(depth image)에 대한 3D 영상 디코더, 복수 시점 영상에 대한 디코더 등을 구비할 수 있다.
스케일러(335)는, 영상 디코더(325) 등에서 영상 복호 완료된, 입력 영상 신호를 스케일링할 수 있다.
예를 들어, 스케일러(335)는, 입력 영상 신호의 크기 또는 해상도가 작은 경우, 업 스케일링하고, 입력 영상 신호의 크기 또는 해상도가 큰 경우, 다운 스케일링할 수 있다.
화질 처리부(635)는, 영상 디코더(325) 등에서 영상 복호 완료된, 입력 영상 신호에 대한 화질 처리를 수행할 수 있다.
예를 들어, 화질 처리부(635)는, 입력 영상 신호의 노이즈 제거 처리를 하거나, 입력 영상 신호의 도계조의 해상를 확장하거나, 영상 해상도 향상을 수행하거나, 하이 다이나믹 레인지(HDR) 기반의 신호 처리를 하거나, 프레임 레이트를 가변하거나, 패널 특성, 특히 유기발광패널에 대응하는 화질 처리 등을 할 수 있다.
OSD 생성부(340)는, 사용자 입력에 따라 또는 자체적으로 OSD 신호를 생성한다. 예를 들어, 사용자 입력 신호에 기초하여, 디스플레이(180)의 화면에 각종 정보를 그래픽(Graphic)이나 텍스트(Text)로 표시하기 위한 신호를 생성할 수 있다. 생성되는 OSD 신호는, 영상표시장치(100)의 사용자 인터페이스 화면, 다양한 메뉴 화면, 위젯, 아이콘 등의 다양한 데이터를 포함할 수 있다. 또한, 생성되는 OSD 신호는, 2D 오브젝트 또는 3D 오브젝트를 포함할 수 있다.
또한, OSD 생성부(340)는, 원격제어장치(200)로부터 입력되는 포인팅 신호에 기초하여, 디스플레이에 표시 가능한, 포인터를 생성할 수 있다. 특히, 이러한 포인터는, 포인팅 신호 처리부에서 생성될 수 있으며, OSD 생성부(240)는, 이러한 포인팅 신호 처리부(미도시)를 포함할 수 있다. 물론, 포인팅 신호 처리부(미도시)가 OSD 생성부(240) 내에 구비되지 않고 별도로 마련되는 것도 가능하다.
프레임 레이트 변환부(Frame Rate Conveter, FRC)(350)는, 입력되는 영상의 프레임 레이트를 변환할 수 있다. 한편, 프레임 레이트 변환부(350)는, 별도의 프레임 레이트 변환 없이, 그대로 출력하는 것도 가능하다.
한편, 포맷터(Formatter)(360)는, 입력되는 영상 신호의 포맷을, 디스플레이에 표시하기 위한 영상 신호로 변화시켜 출력할 수 있다.
특히, 포맷터(Formatter)(360)는, 디스플레이 패널에 대응하도록 영상 신호의 포맷을 변화시킬 수 있다.
프로세서(330)는, 영상표시장치(100) 내 또는 신호 처리부(170) 내의 전반적인 동작을 제어할 수 있다.
예를 들어, 프로세서(330)는 튜너(110)를 제어하여, 사용자가 선택한 채널 또는 기저장된 채널에 해당하는 RF 방송을 선택(Tuning)하도록 제어할 수 있다.
또한, 프로세서(330)는, 사용자입력 인터페이스부(150)를 통하여 입력된 사용자 명령 또는 내부 프로그램에 의하여 영상표시장치(100)를 제어할 수 있다.
또한, 프로세서(330)는, 네트워크 인터페이스부(135) 또는 외부장치 인터페이스부(130)와의 데이터 전송 제어를 수행할 수 있다.
또한, 프로세서(330)는, 신호 처리부(170) 내의 역다중화부(310), 영상 처리부(320) 등의 동작을 제어할 수 있다.
한편, 신호 처리부(170) 내의 오디오 처리부(370)는, 역다중화된 음성 신호의 음성 처리를 수행할 수 있다. 이를 위해 오디오 처리부(370)는 다양한 디코더를 구비할 수 있다.
또한, 신호 처리부(170) 내의 오디오 처리부(370)는, 베이스(Base), 트레블(Treble), 음량 조절 등을 처리할 수 있다.
신호 처리부(170) 내의 데이터 처리부(미도시)는, 역다중화된 데이터 신호의 데이터 처리를 수행할 수 있다. 예를 들어, 역다중화된 데이터 신호가 부호화된 데이터 신호인 경우, 이를 복호화할 수 있다. 부호화된 데이터 신호는, 각 채널에서 방영되는 방송프로그램의 시작시간, 종료시간 등의 방송정보를 포함하는 전자 프로그램 가이드 정보(Electronic Program Guide) 정보일 수 있다.
한편, 도 3에 도시된 신호 처리부(170)의 블록도는 본 발명의 일실시예를 위한 블록도이다. 블록도의 각 구성요소는 실제 구현되는 신호 처리부(170)의 사양에 따라 통합, 추가, 또는 생략될 수 있다.
특히, 프레임 레이트 변환부(350), 및 포맷터(360)는 영상 처리부(320) 외에 별도로 마련될 수도 있다.
도 4a는 도 2의 원격제어장치의 제어 방법을 도시한 도면이다.
도 4a의 (a)에 도시된 바와 같이, 디스플레이(180)에 원격제어장치(200)에 대응하는 포인터(205)가 표시되는 것을 예시한다.
사용자는 원격제어장치(200)를 상하, 좌우(도 4a의 (b)), 앞뒤(도 4a의 (c))로 움직이거나 회전할 수 있다. 영상표시장치의 디스플레이(180)에 표시된 포인터(205)는 원격제어장치(200)의 움직임에 대응한다. 이러한 원격제어장치(200)는, 도면과 같이, 3D 공간 상의 움직임에 따라 해당 포인터(205)가 이동되어 표시되므로, 공간 리모콘 또는 3D 포인팅 장치라 명명할 수 있다.
도 4a의 (b)는 사용자가 원격제어장치(200)를 왼쪽으로 이동하면, 영상표시장치의 디스플레이(180)에 표시된 포인터(205)도 이에 대응하여 왼쪽으로 이동하는 것을 예시한다.
원격제어장치(200)의 센서를 통하여 감지된 원격제어장치(200)의 움직임에 관한 정보는 영상표시장치로 전송된다. 영상표시장치는 원격제어장치(200)의 움직임에 관한 정보로부터 포인터(205)의 좌표를 산출할 수 있다. 영상표시장치는 산출한 좌표에 대응하도록 포인터(205)를 표시할 수 있다.
도 4a의 (c)는, 원격제어장치(200) 내의 특정 버튼을 누른 상태에서, 사용자가 원격제어장치(200)를 디스플레이(180)에서 멀어지도록 이동하는 경우를 예시한다. 이에 의해, 포인터(205)에 대응하는 디스플레이(180) 내의 선택 영역이 줌인되어 확대 표시될 수 있다. 이와 반대로, 사용자가 원격제어장치(200)를 디스플레이(180)에 가까워지도록 이동하는 경우, 포인터(205)에 대응하는 디스플레이(180) 내의 선택 영역이 줌아웃되어 축소 표시될 수 있다. 한편, 원격제어장치(200)가 디스플레이(180)에서 멀어지는 경우, 선택 영역이 줌아웃되고, 원격제어장치(200)가 디스플레이(180)에 가까워지는 경우, 선택 영역이 줌인될 수도 있다.
한편, 원격제어장치(200) 내의 특정 버튼을 누른 상태에서는 상하, 좌우 이동의 인식이 배제될 수 있다. 즉, 원격제어장치(200)가 디스플레이(180)에서 멀어지거나 접근하도록 이동하는 경우, 상,하,좌,우 이동은 인식되지 않고, 앞뒤 이동만 인식되도록 할 수 있다. 원격제어장치(200) 내의 특정 버튼을 누르지 않은 상태에서는, 원격제어장치(200)의 상,하, 좌,우 이동에 따라 포인터(205)만 이동하게 된다.
한편, 포인터(205)의 이동속도나 이동방향은 원격제어장치(200)의 이동속도나 이동방향에 대응할 수 있다.
도 4b는 도 2의 원격제어장치의 내부 블록도이다.
도면을 참조하여 설명하면, 원격제어장치(200)는 무선통신부(425), 사용자 입력부(435), 센서부(440), 출력부(450), 전원공급부(460), 저장부(470), 신호 처리부(480)를 포함할 수 있다.
무선통신부(425)는 전술하여 설명한 본 발명의 실시예들에 따른 영상표시장치 중 임의의 어느 하나와 신호를 송수신한다. 본 발명의 실시예들에 따른 영상표시장치들 중에서, 하나의 영상표시장치(100)를 일예로 설명하도록 하겠다.
본 실시예에서, 원격제어장치(200)는 RF 통신규격에 따라 영상표시장치(100)와 신호를 송수신할 수 있는 RF 모듈(421)을 구비할 수 있다. 또한 원격제어장치(200)는 IR 통신규격에 따라 영상표시장치(100)와 신호를 송수신할 수 있는 IR 모듈(423)을 구비할 수 있다.
본 실시예에서, 원격제어장치(200)는 영상표시장치(100)로 원격제어장치(200)의 움직임 등에 관한 정보가 담긴 신호를 RF 모듈(421)을 통하여 전송한다.
또한, 원격제어장치(200)는 영상표시장치(100)가 전송한 신호를 RF 모듈(421)을 통하여 수신할 수 있다. 또한, 원격제어장치(200)는 필요에 따라 IR 모듈(423)을 통하여 영상표시장치(100)로 전원 온/오프, 채널 변경, 볼륨 변경 등에 관한 명령을 전송할 수 있다.
사용자 입력부(435)는 키패드, 버튼, 터치 패드, 또는 터치 스크린 등으로 구성될 수 있다. 사용자는 사용자 입력부(435)를 조작하여 원격제어장치(200)로 영상표시장치(100)와 관련된 명령을 입력할 수 있다. 사용자 입력부(435)가 하드키 버튼을 구비할 경우 사용자는 하드키 버튼의 푸쉬 동작을 통하여 원격제어장치(200)로 영상표시장치(100)와 관련된 명령을 입력할 수 있다. 사용자 입력부(435)가 터치스크린을 구비할 경우 사용자는 터치스크린의 소프트키를 터치하여 원격제어장치(200)로 영상표시장치(100)와 관련된 명령을 입력할 수 있다. 또한, 사용자 입력부(435)는 스크롤 키나, 조그 키 등 사용자가 조작할 수 있는 다양한 종류의 입력수단을 구비할 수 있으며 본 실시예는 본 발명의 권리범위를 제한하지 아니한다.
센서부(440)는 자이로 센서(441) 또는 가속도 센서(443)를 구비할 수 있다. 자이로 센서(441)는 원격제어장치(200)의 움직임에 관한 정보를 센싱할 수 있다.
일예로, 자이로 센서(441)는 원격제어장치(200)의 동작에 관한 정보를 x,y,z 축을 기준으로 센싱할 수 있다. 가속도 센서(443)는 원격제어장치(200)의 이동속도 등에 관한 정보를 센싱할 수 있다. 한편, 거리측정센서를 더 구비할 수 있으며, 이에 의해, 디스플레이(180)와의 거리를 센싱할 수 있다.
출력부(450)는 사용자 입력부(435)의 조작에 대응하거나 영상표시장치(100)에서 전송한 신호에 대응하는 영상 또는 음성 신호를 출력할 수 있다. 출력부(450)를 통하여 사용자는 사용자 입력부(435)의 조작 여부 또는 영상표시장치(100)의 제어 여부를 인지할 수 있다.
일예로, 출력부(450)는 사용자 입력부(435)가 조작되거나 무선 통신부(425)을 통하여 영상표시장치(100)와 신호가 송수신되면 점등되는 LED 모듈(451), 진동을 발생하는 진동 모듈(453), 음향을 출력하는 음향 출력 모듈(455), 또는 영상을 출력하는 디스플레이 모듈(457)을 구비할 수 있다.
전원공급부(460)는 원격제어장치(200)로 전원을 공급한다. 전원공급부(460)는 원격제어장치(200)이 소정 시간 동안 움직이지 않은 경우 전원 공급을 중단함으로서 전원 낭비를 줄일 수 있다. 전원공급부(460)는 원격제어장치(200)에 구비된 소정 키가 조작된 경우에 전원 공급을 재개할 수 있다.
저장부(470)는 원격제어장치(200)의 제어 또는 동작에 필요한 여러 종류의 프로그램, 애플리케이션 데이터 등이 저장될 수 있다. 만일 원격제어장치(200)가 영상표시장치(100)와 RF 모듈(421)을 통하여 무선으로 신호를 송수신할 경우 원격제어장치(200)와 영상표시장치(100)는 소정 주파수 대역을 통하여 신호를 송수신한다. 원격제어장치(200)의 신호 처리부(480)는 원격제어장치(200)와 페어링된 영상표시장치(100)와 신호를 무선으로 송수신할 수 있는 주파수 대역 등에 관한 정보를 저장부(470)에 저장하고 참조할 수 있다.
신호 처리부(480)는 원격제어장치(200)의 제어에 관련된 제반사항을 제어한다. 신호 처리부(480)는 사용자 입력부(435)의 소정 키 조작에 대응하는 신호 또는 센서부(440)에서 센싱한 원격제어장치(200)의 움직임에 대응하는 신호를 무선 통신부(425)를 통하여 영상표시장치(100)로 전송할 수 있다.
영상표시장치(100)의 사용자 입력 인터페이스부(150)는, 원격제어장치(200)와 무선으로 신호를 송수신할 수 있는 무선통신부(151)와, 원격제어장치(200)의 동작에 대응하는 포인터의 좌표값을 산출할 수 있는 좌표값 산출부(415)를 구비할 수 있다.
사용자 입력 인터페이스부(150)는, RF 모듈(412)을 통하여 원격제어장치(200)와 무선으로 신호를 송수신할 수 있다. 또한 IR 모듈(413)을 통하여 원격제어장치(200)이 IR 통신 규격에 따라 전송한 신호를 수신할 수 있다.
좌표값 산출부(415)는 무선통신부(151)를 통하여 수신된 원격제어장치(200)의 동작에 대응하는 신호로부터 손떨림이나 오차를 수정하여 디스플레이(180)에 표시할 포인터(205)의 좌표값(x,y)을 산출할 수 있다.
사용자 입력 인터페이스부(150)를 통하여 영상표시장치(100)로 입력된 원격제어장치(200) 전송 신호는 영상표시장치(100)의 신호 처리부(180)로 전송된다. 신호 처리부(180)는 원격제어장치(200)에서 전송한 신호로부터 원격제어장치(200)의 동작 및 키 조작에 관한 정보를 판별하고, 그에 대응하여 영상표시장치(100)를 제어할 수 있다.
또 다른 예로, 원격제어장치(200)는, 그 동작에 대응하는 포인터 좌표값을 산출하여 영상표시장치(100)의 사용자 입력 인터페이스부(150)로 출력할 수 있다. 이 경우, 영상표시장치(100)의 사용자 입력 인터페이스부(150)는 별도의 손떨림이나 오차 보정 과정 없이 수신된 포인터 좌표값에 관한 정보를 신호 처리부(180)로 전송할 수 있다.
또한, 다른 예로, 좌표값 산출부(415)가, 도면과 달리 사용자 입력 인터페이스부(150)가 아닌, 신호 처리부(170) 내부에 구비되는 것도 가능하다.
도 5는 도 2의 디스플레이의 내부 블록도이다.
도면을 참조하면, 유기발광패널 기반의 디스플레이(180)는, 유기발광패널(210), 제1 인터페이스부(230), 제2 인터페이스부(231), 타이밍 컨트롤러(232), 게이트 구동부(234), 데이터 구동부(236), 메모리(240), 프로세서(270), 전원 공급부(290), 전류 검출부(510) 등을 포함할 수 있다.
디스플레이(180)는, 영상 신호(Vd)와, 제1 직류 전원(V1) 및 제2 직류 전원(V2)을 수신하고, 영상 신호(Vd)에 기초하여, 소정 영상을 표시할 수 있다.
한편, 디스플레이(180) 내의 제1 인터페이스부(230)는, 신호 처리부(170)로부터 영상 신호(Vd)와, 제1 직류 전원(V1)을 수신할 수 있다.
여기서, 제1 직류 전원(V1)은, 디스플레이(180) 내의 전원 공급부(290), 및 타이밍 컨트롤러(232)의 동작을 위해 사용될 수 있다.
다음, 제2 인터페이스부(231)는, 외부의 전원 공급부(190)로부터 제2 직류 전원(V2)을 수신할 수 있다. 한편, 제2 직류 전원(V2)은, 디스플레이(180) 내의 데이터 구동부(236)에 입력될 수 있다.
타이밍 컨트롤러(232)는, 영상 신호(Vd)에 기초하여, 데이터 구동 신호(Sda) 및 게이트 구동 신호(Sga)를 출력할 수 있다.
예를 들어, 제1 인터페이스부(230)가 입력되는 영상 신호(Vd)를 변환하여 변환된 영상 신호(va1)를 출력하는 경우, 타이밍 컨트롤러(232)는, 변환된 영상 신호(va1)에 기초하여, 데이터 구동 신호(Sda) 및 게이트 구동 신호(Sga)를 출력할 수 있다.
타이밍 컨트롤러(timing controller)(232)는, 신호 처리부(170)로부터의 비디오 신호(Vd) 외에, 제어 신호, 수직동기신호(Vsync) 등을 더 수신할 수 있다.
그리고, 타이밍 컨트롤러(timing controller)(232)는, 비디오 신호(Vd) 외에, 제어 신호, 수직동기신호(Vsync) 등에 기초하여, 게이트 구동부(234)의 동작을 위한 게이트 구동 신호(Sga), 데이터 구동부(236)의 동작을 위한 데이터 구동 신호(Sda)를 출력할 수 있다.
이때의 데이터 구동 신호(Sda)는, 패널(210)이 RGBW의 서브픽셀을 구비하는 경우, RGBW 서브픽셀 구동용 데이터 구동 신호일 수 있다.
한편, 타이밍 컨트롤러(232)는, 게이트 구동부(234)에 제어 신호(Cs)를 더 출력할 수 있다.
게이트 구동부(234)와 데이터 구동부(236)는, 타이밍 컨트롤러(232)로부터의 게이트 구동 신호(Sga), 데이터 구동 신호(Sda)에 따라, 각각 게이트 라인(GL) 및 데이터 라인(DL)을 통해, 주사 신호 및 영상 신호를 유기발광패널(210)에 공급한다. 이에 따라, 유기발광패널(210)은 소정 영상을 표시하게 된다.
한편, 유기발광패널(210)은, 유기 발광층을 포함할 수 있으며, 영상을 표시하기 위해, 유기 발광층에 대응하는 각 화소에, 다수개의 게이트 라인(GL) 및 데이터 라인(DL)이 매트릭스 형태로 교차하여 배치될 수 있다.
한편, 데이터 구동부(236)는, 제2 인터페이스부(231)로부터의 제2 직류 전원(V2)에 기초하여, 유기발광패널(210)에 데이터 신호를 출력할 수 있다.
전원 공급부(290)는, 각종 전원을, 게이트 구동부(234)와 데이터 구동부(236), 타이밍 컨트롤러(232) 등에 공급할 수 있다.
전류 검출부(510)는, 유기발광패널(210)의 서브픽셀에 흐르는 전류를 검출할 수 있다. 검출되는 전류는, 누적 전류 연산을 위해, 프로세서(270) 등에 입력될 수 있다.
프로세서(270)는, 디스플레이(180) 내의 각종 제어를 수행할 수 있다. 예를 들어, 게이트 구동부(234)와 데이터 구동부(236), 타이밍 컨트롤러(232) 등을 제어할 수 있다.
한편, 프로세서(270)는, 전류 검출부(510)로부터, 유기발광패널(210)의 서브픽셀에 흐르는 전류 정보를 수신할 수 있다.
그리고, 프로세서(270)는, 유기발광패널(210)의 서브픽셀에 흐르는 전류 정보에 기초하여, 각 유기발광패널(210)의 서브픽셀의 누적 전류를 연산할 수 있다. 연산되는 누적 전류는, 메모리(240)에 저장될 수 있다.
한편, 프로세서(270)는, 각 유기발광패널(210)의 서브픽셀의 누적 전류가, 허용치 이상인 경우, 번인(burn in)으로 판단할 수 있다.
예를 들어, 프로세서(270)는, 각 유기발광패널(210)의 서브픽셀의 누적 전류가, 300000 A 이상인 경우, 번인된 서브픽셀로 판단할 수 있다.
한편, 프로세서(270)는, 각 유기발광패널(210)의 서브픽셀 중 일부 서브픽셀의 누적 전류가, 허용치에 근접하는 경우, 해당 서브픽셀을, 번인이 예측되는 서브픽셀로 판단할 수 있다.
한편, 프로세서(270)는, 전류 검출부(510)에서 검출된 전류에 기초하여, 가장 누적 전류가 큰 서브픽셀을, 번인 예측 서브픽셀로 판단할 수 있다.
도 6a 내지 도 6b는 도 5의 유기발광패널의 설명에 참조되는 도면이다.
먼저, 도 6a는, 유기발광패널(210) 내의 픽셀(Pixel)을 도시하는 도면이다.
도면을 참조하면, 유기발광패널(210)은, 복수의 스캔 라인(Scan 1 ~ Scan n)과, 이에 교차하는 복수의 데이터 라인(R1,G1,B1,W1 ~ Rm,Gm,Bm,Wm)을 구비할 수 있다.
한편, 유기발광패널(210) 내의 스캔 라인과, 데이터 라인의 교차 영역에, 픽셀(subpixel)이 정의된다. 도면에서는, RGBW의 서브픽셀(SR1,SG1,SB1,SW1)을 구비하는 픽셀(Pixel)을 도시한다.
도 6b는, 도 6a의 유기발광패널의 픽셀(Pixel) 내의 어느 하나의 서브픽셀(sub pixel)의 회로를 예시한다.
도면을 참조하면, 유기발광 서브픽셀(sub pixell) 회로(CRTm)는, 능동형으로서, 스캔 스위칭 소자(SW1), 저장 커패시터(Cst), 구동 스위칭 소자(SW2), 유기발광층(OLED)을 구비할 수 있다.
스캔 스위칭 소자(SW1)는, 게이트 단자에 스캔 라인(Scan line)이 접속되어, 입력되는 스캔 신호(Vdscan)에 따라 턴 온하게 된다. 턴 온되는 경우, 입력되는 데이터 신호(Vdata)를 구동 스위칭 소자(SW2)의 게이트 단자 또는 저장 커패시터(Cst)의 일단으로 전달하게 된다.
저장 커패시터(Cst)는, 구동 스위칭 소자(SW2)의 게이트 단자와 소스 단자 사이에 형성되며, 저장 커패시터(Cst)의 일단에 전달되는 데이터 신호 레벨과, 저장 커패시터(Cst)의 타단에 전달되는 직류 전원(VDD) 레벨의 소정 차이를 저장한다.
예를 들어, 데이터 신호가, PAM(Pluse Amplitude Modulation) 방식에 따라 서로 다른 레벨을 갖는 경우, 데이터 신호(Vdata)의 레벨 차이에 따라, 저장 커패시터(Cst)에 저장되는 전원 레벨이 달라지게 된다.
다른 예로, 데이터 신호가 PWM(Pluse Width Modulation) 방식에 따라 서로 다른 펄스폭을 갖는 경우, 데이터 신호(Vdata)의 펄스폭 차이에 따라, 저장 커패시터(Cst)에 저장되는 전원 레벨이 달라지게 된다.
구동 스위칭 소자(SW2)는, 저장 커패시터(Cst)에 저장된 전원 레벨에 따라 턴 온된다. 구동 스위칭 소자(SW2)가 턴 온하는 경우, 저장된 전원 레벨에 비례하는, 구동 전류(IOLED)가 유기발광층(OLED)에 흐르게 된다. 이에 따라, 유기발광층(OLED)은 발광동작을 수행하게 된다.
유기발광층(OLED)은, 서브픽셀에 대응하는 RGBW의 발광층(EML)을 포함하며, 정공주입층(HIL), 정공 수송층(HTL), 전자 수송층(ETL), 전자 주입층(EIL) 중 적어도 하나를 포함할 수 있으며, 그 외에 정공 저지층 등도 포함할 수 있다.
한편, 서브픽셀(sub pixell)은, 유기발광층(OLED)에서 모두 백색의 광을 출력하나, 녹색,적색,청색 서브픽셀의 경우, 색상 구현을 위해, 별도의 컬러필터가 구비된다. 즉, 녹색,적색,청색 서브픽셀의 경우, 각각 녹색,적색,청색 컬러필터를 더 구비한다. 한편, 백색 서브픽셀의 경우, 백색광을 출력하므로, 별도의 컬러필터가 필요 없게 된다.
한편, 도면에서는, 스캔 스위칭 소자(SW1)와 구동 스위칭 소자(SW2)로서, p타입의 MOSFET인 경우를 예시하나, n타입의 MOSFET이거나, 그 외, JFET, IGBT, 또는 SIC 등의 스위칭 소자가 사용되는 것도 가능하다.
한편, 픽셀(Pixel)은, 단위 표시 기간 동안, 구체적으로 단위 프레임 동안, 스캔 신호가 인가된 이후, 유기발광층(OLED)에서 계속 발광하는 홀드 타입의 소자이다.
도 7은 본 발명의 실시예에 따른 신호 처리부의 내부 블록도의 일예이고, 도 8 내지 도 9b는 도 7의 신호 처리부의 동작 설명에 참조되는 도면이다.
먼저, 도 7을 참조하면, 본 발명의 실시예에 따른 영상표시 시스템(10)은, 영상표시장치(100), 서버(600), 셋탑 박스(300)를 구비할 수 있다.
서버(600)는, 학습 영상을 수신하고 이를 저장하는 학습 DB(640)와, 학습 DB(640)로부터의 학습 영상, 및 심층 신경망(Deep Neural Network)을 이용하여, 영상 소스 퀄리티를 연산하는 퀄리티 연산부(670), 학습 DB(640)와 퀄리티 연산부(670)에 기초하여 심층 신경망에 대한 파라미터를 업데이트하는 파라미터 업데이트부(675)를 구비할 수 있다.
파라미터 업데이트부(675)는, 업데이트된 파라미터를 영상표시장치(100) 내의 퀄리티 연산부(632)로 전송할 수 있다.
셋탑 박스(300)는, 영상 제공자가 제공하는 입력 신호를 수신하고, 영상표시장치(100)의 HDMI 단자로 영상 신호를 전송할 수 있다.
영상표시장치(100)는, 외부의 셋탑 박스(300) 또는 네트워크를 통해 영상 신호를 수신하는 영상 수신부(105)와, 영상 수신부(105)에서 수신되는 영상 신호에 대한 신호 처리를 수행하는 신호 처리부(170)와, 신호 처리부(170)에서 처리된 영상을 표시하는 디스플레이(180)를 포함할 수 있다.
한편, 영상표시장치(100)는, 입력 영상의 화질에 따라 최적의 튜닝을 적용할 수 있다.
한편, 영상표시장치(100)는, 실시간으로 입력 영상을 분석하여, 원본 해상도, Noise 수준, 압축 수준, Enhancement 수준을 판별할 수 있다.
한편, 영상표시장치(100)는, 연산된 영상 정보 데이터에 기초하여, 위화감 없이 화질 세팅을 변경할 수 있다.
한편, 신호 처리부(170)는, 외부의 셋탑 박스(300) 또는 네트워크를 통해 수신되는 영상 신호의 원본 퀄리티를 연산하는 퀄리티 연산부(632)와, 연산된 원본 퀄리티에 따라, 영상 신호의 화질을 설정하는 화질 설정부(634)와, 설정된 화질에 따라, 영상 신호의 화질 처리를 수행하는 화질 처리부(635)를 포함할 수 있다.
화질 설정부(634)는, 수신되는 영상 신호의 원본 퀄리티가, 제1 시점에 가변되는 경우, 화질 설정을 제1 설정에서 제2 설정으로 순차적으로 가변하며, 화질 처리부(635)는, 제1 설정에서 제2 설정으로 순차 가변되는 화질 설정에 따라, 화질 처리를 수행한다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다. 특히, 영상 신호의 원본 퀄리티 가변시 급격한 화질 변경이 수행되지 않으므로, 부드러운 화질 변경이 가능하게 된다.
한편, 화질 설정부(634)는, 영상 재생 중에, 수신되는 영상 신호의 원본 퀄리티가, 제1 시점에 가변되는 경우, 화질 설정을 제1 설정에서 제2 설정으로 순차적으로 가변할 수 있다. 이에 따라, 수신되는 영상 신호의 원본 퀄리티의 가변시 실시간으로 화질 설정을 변경할 수 있게 된다. 특히, 영상 신호의 원본 퀄리티 가변시 급격한 화질 변경이 수행되지 않으므로, 부드러운 화질 변경이 가능하게 된다.
한편, 화질 설정부(634)는, 셋탑 박스(300)로부터 영상 신호가 수신되는 상태에서, 채널 변경 또는 입력 변경에 따라, 수신되는 영상 신호의 원본 퀄리티가, 제1 시점에 가변되는 경우, 화질 설정을 제1 설정에서 제2 설정으로 순차적으로 가변할 수 있다. 이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다. 특히, 영상 신호의 원본 퀄리티 가변시 급격한 화질 변경이 수행되지 않으므로, 부드러운 화질 변경이 가능하게 된다.
퀄리티 연산부(632)는, 입력 영상을 UHD (3840x2160 이상), FHD (1920x1080), HD (1280x720), SD ( 720x480 이하) 등으로 분류할 수 있다.
퀄리티 연산부(632)는, 입력 영상에 대해, 각각의 해상도별 확률을 구하고, 최종 예측한 확률이 가장 높은 해상도를 최종 해상도로 선정하며, 최종 예측 확률이 너무 낮은 경우는 판단에서 제외한다.
퀄리티 연산부(632)는, 해상도 이외에도 Noise 수준 및 압축 수준을 예상할 수 있다.
한편, 퀄리티 연산부(632)는, 압축 수준 연산시, 원본 상태를 기준으로 압축 bit-rate를 낮추어 가면서 취득한 학습 DATA를 기반으로 하여 압축 수준을 판단할 수 있다.
예를 들어, 퀄리티 연산부(632)는, FHD의 경우 현재 Digital TV 방송 표준을 1.0 수준으로 평가하고, 압축을 많이 하여 DATA가 소실 될 수록 0.0인 것으로 연산할 수 있다.
한편, 퀄리티 연산부(632)는, 입력 영상 내의 Flicker의 수준을 측정하여, Noise 수준을 연산할 수 있다.
예를 들어, 퀄리티 연산부(632)는, 입력 영상 내의 노이즈 수준을, 강,중,약,노이즈없음의 4단계로 연산할 수 있다.
한편, 퀄리티 연산부(632)는, 심층 신경망(Deep Neural Network)을 이용하여, 수신되는 영상 신호의 해상도와, 노이즈 수준을 연산할 수 있다. 이에 따라, 수신되는 영상 신호의 원본 퀄리티 연산을 정확하게 수행할 수 있게 된다.
한편, 퀄리티 연산부(632)는, 서버(600)로부터 심층 신경망에 대한 파라미터를 업데이트하고, 업데이트된 파라미터에 기초하여, 수신되는 영상 신호의 해상도와, 노이즈 수준을 연산할 수 있다. 이에 따라, 학습 기반하에 영상 신호의 원본 퀄리티 연산을 정확하게 수행할 수 있게 된다.
한편, 퀄리티 연산부(632)는, 영상 신호의 제1 영역 및 제2 영역을 추출하고, 제1 영역에 기초하여, 영상 신호의 원본의 해상도를 연산하며, 제2 영역에 기초하여, 영상 신호의 노이즈 수준을 연산할 수 있다. 이에 따라, 퀄리티 연산에 적합한 영상 추출에 기초하여, 영상 신호의 원본 퀄리티 연산을 정확하게 수행할 수 있게 된다.
한편, 퀄리티 연산부(632)는, 영상 신호 내에 에지 성분이 가장 많은 영역을 제1 영역으로 추출하고, 영상 신호 내에 에지 성분이 가장 적은 영역을 제2 영역으로 추출할 수 있다. 이에 따라, 퀄리티 연산에 적합한 영상 추출에 기초하여, 영상 신호의 원본 퀄리티 연산을 정확하게 수행할 수 있게 된다.
한편, 화질 처리부(635)는, 연산된 노이즈 수준이 높을수록, 영상 신호의 노이즈 리덕션 처리 강도가 커지도록 제어할 수 있다. 이에 따라, 수신되는 영상 신호의 노이즈 수준에 적합한 화질 처리를 수행할 수 있게 된다.
한편, 퀄리티 연산부(632)는, 수신되는 영상 신호의 원본의 해상도, 노이즈 수준 및 압축 수준을 연산하며, 압축 비트 레이트를 낮추어 가면서 취득한 학습 데이터에 기초하여, 압축 수준을 연산할 수 있다.
한편, 화질 처리부(635)는, 연산된 압축 수준이 높을수록, 영상 신호의 인핸스 처리 강도가 작아지도록 제어할 수 있다. 이에 따라, 압축 수준 연산을 정확하게 수행할 수 있게 된다.
한편, 화질 처리부(635)는, 영상 신호의 원본의 해상도가 커질수록, 영상 신호의 인핸스 처리 강도가 커지도록 제어할 수 있다. 이에 따라, 수신되는 영상 신호의 원본의 해상도에 적합한 화질 처리를 수행할 수 있게 된다.
한편, 화질 처리부(635)는, 연산된 압축 수준이 높을수록, 영상 신호의 블러 처리 강도가 커지도록 제어할 수 있다. 이에 따라, 수신되는 영상 신호의 압축 수준에 적합한 화질 처리를 수행할 수 있게 된다.
한편, 화질 처리부(635)는, 영상 신호의 원본의 해상도가 커질수록 영산 신호의 필터링을 위한 필터의 사이즈가 작아지도록 제어할 수 있다. 이에 따라, 수신되는 영상 신호의 원본의 해상도에 적합한 화질 처리를 수행할 수 있게 된다.
한편, 화질 처리부(635)는, 영상 신호의 원본의 해상도에 따라, 영상 신호를 다운 스케일링 한 이후, 다운 스케일링된 영상 신호에 대해 화질 처리를 수행하고, 화질 처리 수행된 영상 신호를 업 스케일링하고, 업 스케일링된 영상 신호를 출력할 수 있다. 이에 따라, 수신되는 영상 신호의 원본의 해상도에 적합한 화질 처리를 수행할 수 있게 된다
도 8은 도 7의 신호 처리부(170)의 내부 블록도의 일예이다.
한편, 도 8의 신호 처리부(170)는, 도 2의 신호 처리부(170)에 대응할 수 있다.
먼저, 도 8을 참조하면, 본 발명의 실시예에 따른 신호 처리부(170)는, 영상 분석부(610), 및 화질 처리부(635)를 구비할 수 있다.
영상 분석부(610)는, 도 7의 퀄리티 연산부(632)와, 화질 세팅부(634)를 구비할 수 있다.
영상 분석부(610)는, 입력 영상 신호를 분석하고, 분석된 입력 영상 신호와 관련된 정보를 출력할 수 있다.
한편, 영상 분석부(610)는, 입력되는 제1 입력 영상 신호의 오브젝트 영역과 배경 영역을 구분할 수 있다. 또는, 영상 분석부(610)는, 입력되는 제1 입력 영상 신호의 오브젝트 영역과 배경 영역의 확률 또는 비율을 연산할 수 있다.
입력 영상 신호는, 영상 수신부(105)로부터의 입력 영상 신호이거나, 도 3의 영상 디코더(320)에서 복호화된 영상일 수 있다.
특히, 영상 분석부(610)는, 인공 지능(artificial intelligence;AI)을 이용하여, 입력 영상 신호를 분석하고, 분석된 입력 영상 신호 정보를 출력할 수 있다.
구체적으로, 영상 분석부(610)는, 입력 영상 신호의 해상도, 계조(resolution), 잡음 수준, 패턴 여부 등을 분석하고, 분석된 입력 영상 신호와 관련된 정보, 특히 화질 설정 정보를, 화질 처리부(635)로 출력할 수 있다.
화질 처리부(635)는, HDR 처리부(705), 제1 리덕션부(710), 인핸스부(750), 제2 리덕션부(790)를 구비할 수 있다.
HDR 처리부(705)는, 영상 신호를 입력받고, 입력되는 영상 신호에 대해, 하이 다이내믹 레인지(HDR) 처리를 할 수 있다.
예를 들어, HDR 처리부(705)는, 스탠다드 다이내믹 레인지(Standard Dynamic Range; SDR) 영상 신호를 HDR 영상 신호로 변환할 수 있다.
다른 예로, HDR 처리부(705)는, 영상 신호를 입력받고, 입력되는 영상 신호에 대해, 하이 다이내믹 레인지를 위한, 계조 처리를 할 수 있다.
한편, HDR 처리부(705)는, 입력되는 영상 신호가 SDR 영상 신호인 경우, 계조 변환을 바이패스하고, 입력되는 영상 신호가 HDR 영상 신호인 경우, 계조 변환을 수행할 수 있다. 이에 따라, 입력 영상에 대해, 고계조 표현력을 증대시킬 수 있게 된다.
한편, HDR 처리부(705)는, 저계조와 고계조 중 저계조를 강조하고 고계조가 포화되도록 하는 제1 계조 변환 모드, 또는 저계조와 고계조 전반에 대해 다소 균일하게 변환되도록 하는 제2 계조 변환 모드에 기초하여, 계조 변환 처리를 할 수 있다.
구체적으로, HDR 처리부(705)는, 제1 계조 변환 모드가 수행되는 경우, 룩업 테이블 내의 제1 계조 변환 모드에 대응하는 데이터에 기초하여, 계조 변환 처리를 할 수 있다.
더 구체적으로, HDR 처리부(705)는, 제1 계조 변환 모드가 수행되는 경우, 입력 데이터에 관한 연산식, 및 상기 연산식에 따라 결정되는 룩업 테이블 내의 제1 계조 변환 모드에 대응하는 데이터에 기초하여, 계조 변환 처리를 할 수 있다. 여기서 입력 데이터는, 비디오 데이터와 메타 데이터를 포함할 수 있다.
한편, HDR 처리부(705)는, 제2 계조 변환 모드가 수행되는 경우, 룩업 테이블 내의 제2 계조 변환 모드에 대응하는 데이터에 기초하여, 계조 변환 처리를 할 수 있다.
더 구체적으로, HDR 처리부(705)는, 제2 계조 변환 모드가 수행되는 경우, 입력 데이터에 관한 연산식, 및 상기 연산식에 따라 결정되는 룩업 테이블 내의 제2 계조 변환 모드에 대응하는 데이터에 기초하여, 계조 변환 처리를 할 수 있다. 여기서 입력 데이터는, 비디오 데이터와 메타 데이터를 포함할 수 있다.
한편, HDR 처리부(705)는, 제2 리덕션부(790) 내의 고계조 증폭부(851)에서의 제3 계조 변환 모드 또는 제4 계조 변환 모드에 따라, 제1 계조 변환 모드, 또는 제2 계조 변환 모드를 선택할 수도 있다.
예를 들어, 제2 리덕션부(790) 내의 고계조 증폭부(851)는, 제3 계조 변환 모드가 수행되는 경우, 룩업 테이블 내의 제3 계조 변환 모드에 대응하는 데이터에 기초하여, 계조 변환 처리를 할 수 있다.
구체적으로, 제2 리덕션부(790) 내의 고계조 증폭부(851)는, 제3 계조 변환 모드가 수행되는 경우, 입력 데이터에 관한 연산식, 및 상기 연산식에 따라 결정되는 룩업 테이블 내의 제3 계조 변환 모드에 대응하는 데이터에 기초하여, 계조 변환 처리를 할 수 있다. 여기서 입력 데이터는, 비디오 데이터와 메타 데이터를 포함할 수 있다.
한편, 제2 리덕션부(790) 내의 고계조 증폭부(851)는, 제4 계조 변환 모드가 수행되는 경우, 룩업 테이블 내의 제4 계조 변환 모드에 대응하는 데이터에 기초하여, 계조 변환 처리를 할 수 있다.
구체적으로, 제2 리덕션부(790) 내의 고계조 증폭부(851)는, 제4 계조 변환 모드가 수행되는 경우, 입력 데이터에 관한 연산식, 및 상기 연산식에 따라 결정되는 룩업 테이블 내의 제4 계조 변환 모드에 대응하는 데이터에 기초하여, 계조 변환 처리를 할 수 있다. 여기서 입력 데이터는, 비디오 데이터와 메타 데이터를 포함할 수 있다.
예를 들어, HDR 처리부(705)는, 제2 리덕션부(790) 내의 고계조 증폭부(851)에서, 제4 계조 변환 모드가 수행되는 경우, 제2 계조 변환 모드를 수행할 수 있다.
다른 예로, HDR 처리부(705)는, 제2 리덕션부(790) 내의 고계조 증폭부(851)에서, 제3 계조 변환 모드가 수행되는 경우, 제1 계조 변환 모드를 수행할 수 있다.
또는, 제2 리덕션부(790) 내의 고계조 증폭부(851)는, HDR 처리부(705)에서의 계조 변환 모드에 따라, 수행되는 계조 변환 모드를 가변할 수도 있다.
예를 들어, 제2 리덕션부(790) 내의 고계조 증폭부(851)는, HDR 처리부(705)에서 제2 계조 변환 모드가 수행되는 경우, 제4 계조 변환 모드를 수행할 수 있다.
다른 예로, 제2 리덕션부(790) 내의 고계조 증폭부(851)는, HDR 처리부(705)에서 제1 계조 변환 모드가 수행되는 경우, 제3 계조 변환 모드를 수행할 수 있다.
한편, 본 발명의 일 실시예에 따른 HDR 처리부(705)는, 저계조와 고계조가 균일하게 변환되도록 계조 변환 모드를 수행할 수 있다.
한편, 제2 리덕션부(790)는, HDR 처리부(705)에서의, 제2 계조 변환 모드에 따라, 제4 계조 변환 모드를 수행하며, 이에 입력되는 영상 신호의 계조의 상한 레벨을 증폭할 수 있다. 이에 따라, 입력 영상에 대해, 고계조 표현력을 증대시킬 수 있게 된다.
다음, 제1 리덕션부(reduction unit))(710)는, 입력 영상 신호 또는 HDR 처리부(705)에서 처리된 영상 신호에 대해, 노이즈 제거를 수행할 수 있다.
구체적으로, 제1 리덕션부(reduction unit))(710)는, 입력 영상 신호 또는 HDR 처리부(705)로부터의 HDR 영상에 대해, 상기 다단계 노이즈 제거 처리, 및 제1 단계 계조 확장 처리를 할 수 있다.
이를 위해, 제1 리덕션부(710)는, 다단계로 노이즈 제거를 위한 복수의 노이즈 제거부(715,720)와, 계조 확장을 위한 계조 확장부(725)를 구비할 수 있다.
다음, 인핸스부(enhancement unit)(750)는, 제1 리덕션부(710)로부터의 영상에 대해, 다단계 영상 해상도 향상 처리를 할 수 있다.
또한, 인핸스부(750)는, 오브젝트 입체감 향상 처리를 할 수 있다. 또한, 인핸스부(750)는, 컬러 또는 컨트라스트 향상 처리를 할 수 있다.
이를 위해, 인핸스부(750)는, 다단계로 영상 해상도 향상을 위한 복수의 해상도 향상부(735,738,742), 오브젝트의 입체감 향상을 위한 오브젝트 입체감 향상부(745), 컬러 또는 컨트라스트 향상을 위한 컬러 컨트라스트 향상부(749)를 구비할 수 있다.
다음, 제2 리덕션부(790)는, 제1 리덕션부(710)로부터 입력된 노이즈 제거된 영상 신호에 기초하여, 제2 단계 계조 확장 처리를 수행할 수 있다.
한편, 제2 리덕션부(790)는, 입력되는 신호의 계조의 상한 레벨을 증폭하고, 입력 신호의 도계조의 해상를 확장할 수 있다. 이에 따라, 입력 영상에 대해, 고계조 표현력을 증대시킬 수 있게 된다.
예를 들어, 입력되는 신호의 전 계조 영역에 대해 균일하게 계조 확장을 수행할 수 있다. 이에 따라, 입력 영상의 영역에 대해 균일한 계조 확장이 수행되면서, 고계조 표현력을 증대시킬 수 있게 된다.
한편, 제2 리덕션부(790)는, 제1 계조 확장부(725)로부터의 입력 신호에 기초하여, 계조 증폭 및 확장을 수행할 수 있다. 이에 따라, 입력 영상에 대해, 고계조 표현력을 증대시킬 수 있게 된다.
한편, 제2 리덕션부(790)는, 사용자 입력 신호에 기초하여, 입력되는 영상 신호가 SDR 영상 신호인 경우, 증폭의 정도를 가변할 수 있다. 이에 따라, 사용자 설정에 대응하여, 고계조 표현력을 증대시킬 수 있게 된다.
한편, 제2 리덕션부(790)는, 입력되는 영상 신호가 HDR 영상 신호인 경우, 설정된 값에 따라, 증폭을 수행할 수 있다. 이에 따라, 입력 영상에 대해, 고계조 표현력을 증대시킬 수 있게 된다.
한편, 제2 리덕션부(790)는, 사용자 입력 신호에 기초하여, 입력되는 영상 신호가 HDR 영상 신호인 경우, 증폭의 정도를 가변할 수 있다. 이에 따라, 사용자 설정에 대응하여, 고계조 표현력을 증대시킬 수 있게 된다.
한편, 제2 리덕션부(790)는, 사용자 입력 신호에 기초하여, 계조 확장시, 계조 확장의 정도를 가변할 수 있다. 이에 따라, 사용자 설정에 대응하여, 고계조 표현력을 증대시킬 수 있게 된다.
한편, 제2 리덕션부(790)는, HDR 처리부(705)에서의, 계조 변환 모드에 따라, 계조의 상한 레벨을 증폭시킬 수 있다. 이에 따라, 입력 영상에 대해, 고계조 표현력을 증대시킬 수 있게 된다.
신호 처리부(170)는, 영상 신호를 입력받고, 입력되는 영상 신호의 휘도를 조절하는 HDR 처리부(705)와, HDR 처리부(705)로부터의 영상 신호의 휘도를 증폭하고, 영상 신호의 계조 해상도를 증가시켜, 인핸스드(enhanced) 영상 신호를 생성하는 리덕션부(790)를 포함하고, 앤핸스드 영상 신호는, 표시되는 HDR 이미지 내의 하이다이나믹 레인지를 유지하는 동안, 영상 신호의 증가된 휘도와 계조 해상도를 제공한다.
한편, 영상 신호의 휘도 범위는, 신호 처리부(170)에 수신되는 제어 신호에 따라 조절된다.
한편, 입력되는 영상 신호가 HDR 신호인지 SDR 신호인지 여부를 결정하고, HDR 처리부(705)로 제공하기 위한 제어 신호를 생성하는 영상 분석부를 더 포함하고, 제어 신호가, 입력되는 영상 신호가 HDR 신호인 것을 나타내는 경우에만 조절된다.
한편, 제어 신호는, 신호 처리와 연관된 영상 표시 장치의 제어부로부터 수신되고, 영상 표시 장치의 설정에 대응한다.
한편, 계조의 해상도는, 영상 신호의 조정된 휘도의 증폭에 기초하여 증가된다.
한편, 계조의 해상도는, 신호 처리부(170)에 입력되는 제어 신호에 기초하여 증가된다.
한편, 제어 신호는, 신호 처리와 연관된 영상 표시 장치의 제어부로부터 수신되고, 영상 표시 장치의 설정에 대응한다.
한편, 리덕션부(790)는, 입력되는 신호의 계조의 상한 레벨을 증폭하는 고계조 증폭부(851)와, 고계조 증폭부(851)로부터의 증폭된 계조의 해상도를 확장하는 디컨투어부(842,844)를 포함할 수 있다.
제2 리덕션부(790)는, 제2 단계 계조 확장을 위한 제2 계조 확장부(729)를 구비할 수 있다.
한편, 본 발명의 신호 처리부(170) 내의 화질 처리부(635)는, 도 8과 같이, 4단계의 리덕션 처리와, 4단계의 영상 향상 처리를 수행하는 것을 특징으로 한다.
여기서, 4단계 리덕션 처리는, 2단계의 노이즈 제거 처리와, 2단계의 계조 확장 처리를 포함할 수 있다.
여기서, 2단계의 노이즈 제거 처리는, 제1 리덕션부(710) 내의 제1 및 제2 노이즈 제거부(715,720)가 수행하며, 2단계의 계조 확장 처리는, 제1 리덕션부(710) 내의 제1 계조 확장부(725)와, 제2 리덕션부(790) 내의 제2 계조 확장부(729)가 수행할 수 있다.
한편, 4단계 영상 향상 처리는, 3단계의 영상 해상도 향상 처리(bit resolution enhancement)와, 오브젝트 입체감 향상 처리를 구비할 수 있다.
여기서, 3단계의 영상 해상도 향상 처리는, 제1 내지 제3 해상도 향상부(735,738,742)가 처리하며, 오브젝트 입체감 향상 처리는, 오브젝트 입체감 향상부(745)가 처리할 수 있다.
한편, 본 발명의 신호 처리부(170)의 제1 특징은, 다단계 화질 처리로서 동일 또는 유사한 알고리즘을 다중 적용하여 점진적으로 화질을 향상시키는 것에 있다.
이를 위해, 본 발명의 신호 처리부(170) 내의 화질 처리부(635)는, 동일 또는 유사 알고리즘을 2회 이상 적용하여, 화질 처리를 진행하는 것으로 한다.
한편, 화질 처리부(635)에서 수행되는 동일 또는 유사 알고리즘은, 각 단계별로 달성하고자 하는 목표가 다르며, 점진적으로 다단계 화질 처리를 수행함으로써, 1 단계에 모든 화질을 처리하는 것 대비하여, 영상의 아티팩트(Artifact)가 적게 발생하는 장점이 있으며, 보다 자연스럽고 보다 선명한 영상 처리 결과물을 얻을 수 있다는 장점이 있다.
한편, 동일 또는 유사 알고리즘을, 다른 화질처리 알고리즘과 교차하면서 다중으로 적용함으로써, 단순 연속 처리 이상의 효과를 얻을 수 있게 된다.
한편, 본 발명의 신호 처리부(170)는, 다단계로 노이즈 제거 처리를 수행할 수 있다. 각 단계의 노이즈 제거 처리는, 시간(Temporal) 처리와, 공간(Spatial) 처리를 포함할 수 있다.
한편, 영상 신호의 원본 퀄리티를 연산하기 위해, 본 발명에서는, 인공지능과 같은 최신의 기술을 사용한다. 이를 위해, 심층 신경망(Deep Neural Network)을 이용할 수 있다.
퀄리티 연산부(632)는, 심층 신경망(Deep Neural Network)을 이용하여, 수신되는 영상 신호의 해상도와, 노이즈 수준을 연산한다.
퀄리티 연산부(632) 또는 퀄리티 연산부(670)는, 원본 해상도 및 압축 수준 별 학습 영상을 취득하여 정확도가 향상되도록 Network를 학습시킬 수 있다.
학습에 사용한 영상은 일상의 방송에서 접할 수 있는 일반적인 영상으로 다양한 영상으로 구비되어 전체 입력 환경을 커버할 수 있다.
한편, 퀄리티 연산부(632)는, 검출시 필요한 시간 또는 비용 감축을 목적으로 계층수가 적은 Convolutional Neural Network, Mobile-Net 등을 활용하여 학습을 진행할 수 있다.
예를 들어, 퀄리티 연산부(632)는, 전체 영상 중 일부 영역(예: 224x224, 128x128, 64x64)만을 분석할 수 있다.
한편, 퀄리티 연산부(632)는, 검출 목적에 맞는 적절한 검출 영역을 선택할 수 있다.
예를 들어, 퀄리티 연산부(632)는, 원본 해상도 검출시, Edge 성분이 가장 많은 제1 영역을 선택하고, 노이즈 검출시, Edge 성분이 가장 적은 제2 영역을 선택할 수 있다.
특히, 퀄리티 연산부(632)는, 처리 속도 향상을 목적으로 검출 영역을 빠르게 선정하는 알고리즘 적용할 수 있다.
예를 들어, 퀄리티 연산부(632)는, 검출 정확도 향상을 목적으로 검출 영역에, FFT(Fast Fourier Transform)과 같은 전처리 작업을 수행할 수 있다.
도 9a는 Convolutional Neural Network에 기반한 연산을 도시하는 도면이다.
도면을 참조하면, 획득된 이미지(1010) 내의 일부 영역(1015)에 대해, 컨벌루션 뉴럴 네트워크(convolutional Neural Network)를 사용한다.
컨벌루션 뉴럴 네트워크는, 컨벌루션 네트워크(Convolution network)와, 디컨벌루션 네트워크(Deconvolution network)가 수행될 수 있다.
이러한 컨벌루션 뉴럴 네트워크에 의하면, 컨벌루션(convolution), 풀링(pooling)이 반복적으로 수행된다.
한편, 도 9a의 CNN 기법에 의하면, 일부 영역(1015) 내의 픽셀(pixel)의 종류를 판단하기 위해, 영역(1015)의 정보가 사용될 수 있다.
도 9b는 Mobile-Net에 기반한 연산을 도시하는 도면이다.
도면과 같은 방식에 의해, 퀄리티 연산이 수행되게 된다.
한편, 본 발명의 신호 처리부(170)는, 원본 Quality 가 변함에 따라 실시간으로 Quality에 상응하는 화질 세팅이 적용되도록 한다.
특히, 신호 처리부(170)는, 화질 세팅 변경시, 채널 변경 또는 입력 변경 등의 조건없이 영상 재생 중에 세팅이 변경되도록 한다.
여기서 실시간이라 하는 것은 IIR 방식 , Step 이동 방식을 포함한 Temporal 처리 기술을 사용하는 것을 의미한다.
도 9a 내지 도 16은 도 7의 신호 처리부(170)의 동작 설명에 참조되는 도면이다.
영상 신호의 원본 퀄리티를 연산하기 위해, 본 발명에서는, 인공지능과 같은 최신의 기술을 사용한다.
특히, 퀄리티 연산부(632)는, 심층 신경망(Deep Neural Network)을 이용하여, 수신되는 영상 신호의 해상도와, 노이즈 수준을 연산한다.
퀄리티 연산부(632) 또는 퀄리티 연산부(670)는, 원본 해상도 및 압축 수준 별 학습 영상을 취득하여 정확도가 향상되도록 Network를 학습시킬 수 있다.
학습에 사용한 영상은 일상의 방송에서 접할 수 있는 일반적인 영상으로 다양한 영상으로 구비되어 전체 입력 환경을 커버할 수 있다.
한편, 퀄리티 연산부(632)는, 검출시 필요한 시간 또는 비용 감축을 목적으로 계층수가 적은 Convolutional Neural Network, Mobile-Net 등을 활용하여 학습을 진행할 수 있다.
예를 들어, 퀄리티 연산부(632)는, 전체 영상 중 일부 영역(예: 224x224, 128x128, 64x64)만을 분석할 수 있다.
한편, 퀄리티 연산부(632)는, 검출 목적에 맞는 적절한 검출 영역을 선택할 수 있다.
예를 들어, 퀄리티 연산부(632)는, 원본 해상도 검출시, Edge 성분이 가장 많은 제1 영역을 선택하고, 노이즈 검출시, Edge 성분이 가장 적은 제2 영역을 선택할 수 있다.
특히, 퀄리티 연산부(632)는, 처리 속도 향상을 목적으로 검출 영역을 빠르게 선정하는 알고리즘 적용할 수 있다.
예를 들어, 퀄리티 연산부(632)는, 검출 정확도 향상을 목적으로 검출 영역에, FFT(Fast Fourier Transform)과 같은 전처리 작업을 수행할 수 있다.
도 9a는 Convolutional Neural Network에 기반한 연산을 도시하는 도면이다.
도면을 참조하면, 획득된 이미지(1010) 내의 일부 영역(1015)에 대해, 컨벌루션 뉴럴 네트워크(convolutional Neural Network)를 사용한다.
컨벌루션 뉴럴 네트워크는, 컨벌루션 네트워크(Convolution network)와, 디컨벌루션 네트워크(Deconvolution network)가 수행될 수 있다.
이러한 컨벌루션 뉴럴 네트워크에 의하면, 컨벌루션(convolution), 풀링(pooling)이 반복적으로 수행된다.
한편, 도 9a의 CNN 기법에 의하면, 일부 영역(1015) 내의 픽셀(pixel)의 종류를 판단하기 위해, 영역(1015)의 정보가 사용될 수 있다.
도 9b는 Mobile-Net에 기반한 연산을 도시하는 도면이다.
도면과 같은 방식에 의해, 퀄리티 연산이 수행되게 된다.
한편, 본 발명의 신호 처리부(170)는, 원본 Quality 가 변함에 따라 실시간으로 Quality에 상응하는 화질 세팅이 적용되도록 한다.
특히, 신호 처리부(170)는, 화질 세팅 변경시, 채널 변경 또는 입력 변경 등의 조건없이 영상 재생 중에 세팅이 변경되도록 한다.
여기서 실시간이라 하는 것은 IIR 방식 , Step 이동 방식을 포함한 Temporal 처리 기술을 사용하는 것을 의미한다.
한편, 다운믹스된 스테레오 오디오 신호를 업믹스하여 멀티 채널의 오디오 신호로 변환하기 위해, 독립성분 분석 방법(Independent Componen Analysis, ICA), 주성분과 부성분 신호로 분석하는 주성분 분석 방법(Primary Component Analysis, PCA), 비지도 학습 기반의 비음수 행렬 분해 방법 (Nonnegative Matrix Factorization, NMF) 등이 사용될 수 있다.
한편, 주성분 분석 방법(PCA)에 따라, 주성분과 부성분으로 분리된 신호는, 원본 멀티 채널과는 다르기 때문에 주성분과 부성분을 원본의 멀티 채널 신호에 매칭하기는 불가능하다.
예를 들어, 멀티 채널 재생장치에서 주성분을 전방 채널에 배치하고 부성분은 전 채널에 고르게 배치하거나, 후방, 샹향 채널에 렌더링하면 실제 컨텐츠 제작자의 의도와는 다르게 전방에만 오디오 객체가 정위되는 등 왜곡된 공간 음향 특성이 나타난다.
이에 본 발명에서는, 주성분 분석 방법(PCA)과 심층 신경망(DNN) 모델을 이용하여, 멀티 채널 신호를 합성할 수 있는 업믹스 방법을 제안한다. 특히, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있는 방안을 제시한다. 이에 대해서는 도 10 이하를 참조하여 기술한다.
도 10은 본 발명의 실시예에 따른 신호 처리부의 내부 블록도의 일예를 도시한다.
도면을 참조하면, 신호 처리부(170)는, 스테레오 오디오 신호로부터 멀티 채널 오디오 신호로 업믹스하기 위해, 변환부(1010), 필터뱅크(1020), 주성분 분석부(1030), 특징 추출부(1040), 마스킹부(1055), 포락선 조정부(1060), 역변환부(1070)를 구비할 수 있다.
변환부(1010)는, 입력되는 스테레오 오디오 신호를 주파수 변환할 수 있다. 예를 들어, 변환부(1010)는, 입력되는 스테레오 오디오 신호를 STFT(Short time Fourier Transform) 변환할 수 있다.
다음, 필터뱅크(1020)는, 주파수 변환된 스테레오 오디오 신호를 복수의 대역통과필터에 의해 필터링을 수행할 수 있다.
예를 들어, 필터뱅크(1020)는, 청각 특성에 기반한 임계 밴드, 옥타브 밴드, 감마톤의 ERB(Equivalent Rectangular Bandwidth) 등의 필터뱅크를 구비하고, 해당 필터링을 수행할 수 있다.
한편, 필터뱅크(1020)는, QMF (Quadrature Mirror Filter) 변환을 수행할 수도 있다.
한편, 필터뱅크(1020)에 의해, 스테레오 오디오 신호의 2채널 신호는, 시간, 주파수 밴드로 분석되어 목소리, 오디오 객체 등 주요 정보를 전달하는 주성분 신호와 잔향, 공간감을 표현하는 부성분 신호로 구분될 수 있다.
이에 따라, 업믹스에 필요한 파라미터(parameter)를 단순화할 수 있으며, 심층 신경망(DNN)을 통한 분석시, 연산 복잡도를 줄일 수 있게 된다.
한편, 주성분 분석(PCA)에 기반한 음원 분리 방법은 수학식 1과 같이 나타날 수 있다.
Figure pat00001
여기서, s1[i,k],s2[i,k]는 각각 시간 영역의 인덱스 i와, 주파수 영역의 밴드 k에 대한 주성분 신호를 나타내며, n1[i,k],n2[i,k]는 각각 시간 영역의 인덱스 i와, 주파수 영역의 밴드 k에 대한 부성분 신호를 나타내며, a는 패닝 이득을 나타낼 수 있다.
주성분 신호는, 스테레오 신호의 두 채널의 상관 관계가 높고 크기만 차이가 있는 성분을 나타내고, 부성분 신호는 여러 경로에 의하여 반사된 음이나 잔향음처럼 두 채널의 상관관계가 낮은 성분을 나타낼 수 있다.
이러한, 주성분 분석 방법은, 직접음, 목소리, 악기 등의 특정한 소스들은 주성분으로 분리하므로, 전방 채널에 패닝(panning)하여 명료도를 효율적으로 향상시킬 수 있다.
또한, 주성분 분석 방법은, 배경음이 부성분으로 분리되고 전체 채널에 고르게 렌더링되므로, 공간감을 극대화하기 위한 용도로 활용될 수 있다.
하지만, 주성분이 존재하지 않은 구간이나 한쪽 채널로 주성분이 패닝된 경우, 상관 관계가 작기 때문에 성능이 저하될 수 있다.
또한, 추정된 주성분 신호에는 전방, 중심, 우퍼, 후방, 상향 채널 등 모든 채널에 대한 주성분 신호가 섞여 있으며, 부성분에도 마찬가지로 모든 원본 채널의 부성분 신호들이 섞여 있게 된다.
따라서, 주성분 분석 방법(PCA)은, 멀티 채널 재생장치의 각 스피커에 해당 원본 채널의 성분을 정확히 렌더링하기 어려울 수 있다. 뿐만 아니라, 스테레오 재생장치의 경우에, 부정확한 멀티 채널 업믹스는, 각 채널에 적합한 가상화를 통하여 음장감을 향상시키는데 제약이 발생하기 때문에 컨텐츠 제작자의 의도와는 다르게 공간 왜곡이 발생할 수 있다.
한편, ICA, NMF 등에 기반한 방법 역시 독립성분, 기저성분을 기반으로 신호를 분해하므로, 실제의 전방, 중심, 우퍼, 후방, 상향등의 멀티 채널로 매칭시키는 것은 어렵다.
최근에, 뉴럴 네트워크 연구가 여러 계층 모델에 대하여, 곡소 최저치(local minima)에 빠지지 않고 성능을 향상시킬 수 있는 기법들이 발달되면서, 음성 인식 뿐만 아니라, 음성 오디오 신호의 분류, 인식, 검출, 검색 등 다양한 분야로 확대되고 있다.
이에 본 발명에서는, 심층 신경망(DNN) 모델을 이용한, 인공지능(AI) 화질 처리, 인공지능(AI) 음질 처리 등이 수행되도록 한다. 특히, 심층 신경망(DNN) 모델을 이용한 업믹스 방안을 제시한다.
이를 위해, 심층 신경망(DNN) 모델을 이용한, 다운믹스 오디오 신호 또는 멀티 채널 오디오 신호의 학습이 필요하다. 이에 대해서는 도 11을 참조하여 기술한다.
한편, 주성분 분석부(1030)는, 변환부(1010)로부터의 신호에 기초하여, 주성분 분석을 수행할 수 있다.
특히, 주성분 분석부(1030)는, 필터뱅크(1020)로부터의 신호에 기초항, 주성분 분석을 수행할 수 있다.
특징 추출부(1040)는, 주성분 분석부(1030)로부터의 신호에 기초하여 주성분 신호의 특징을 추출할 수 있다.
모델 학습예측부(1050)는, 특징 추출부(1040)로부터의 특징에 기초하여, 심층 신경망 모델 기반하에 예측을 수행할 수 있다.
마스킹부(1055)는, 모델 학습예측부(1050)로부터의 예측 결과에 마스킹을 수행할 수 있다.
마스킹부(1055)는, 멀티 채널의 각 채널이 시간과 주파수에 대해 독립인 경우, 모델 학습예측부(1050)로부터의 예측 결과에 기초하여, 시간 주파수 성분으로 마스킹을 수행하여, 채널 분리를 수행할 수 있다.
포락선 조정부(1060)는, 심층 신경망 모델 기반하에 수행된 예측에 기초하여, 포락선 조정을 수행할 수 있다.
포락선 조정부(1060)는, 모델 학습예측부(1050)로부터의 예측 결과에 기초하여, 주파수 밴드에 대한 가중치 함수에 따라, 주파수 대역에서의 신호의 포락선을 보정하여, 채널을 분리할 수 있다.
포락선 조정부(1060)는, 각 주파수 주파수 밴드의 크기를 목표 채널에 포락선에 추종하도록 조정할 수 있다.
역변환부(1070)는, 포락선 조정부(1060)로부터 신호를 역변환하여 멀티 채널의 업믹스 오디오 신호를 출력할 수 있다.
도 11은 본 발명의 실시예에 따른 신호 처리부의 내부 블록도의 다른 예를 도시한다.
도면을 참조하면, 신호 처리부(170)는, 스테레오 오디오 신호로부터 멀티 채널 오디오 신호로 업믹스하기 위해, 제2 변환부(1015), 제2 필터뱅크(1025), 제2 주성분 분석부(1035), 제2 특징 추출부(1045)를 더 구비할 수 있다.
한편, 데이터 베이스(1005)는, 다운믹스 스테레오 오디오 신호와 멀티 채널 오디오 신호를 포함할 수 있다.
이때의 데이터 베이스(1005)는, 서버(600) 등에 구비될 수 있다.
한편, 제2 변환부(1015)는, 데이터 베이스(1005)로부터 수신되는 다운믹스 스테레오 오디오 신호 또는 멀티 채널 오디오 신호를 주파수 변환할 수 있다.
예를 들어, 제2 변환부(1015)는, 입력되는 다운믹스 스테레오 오디오 신호 또는 멀티 채널 오디오 신호를 STFT(Short time Fourier Transform) 변환할 수 있다.
다음, 제2 필터뱅크(1025)는, 주파수 변환된 스테레오 오디오 신호를 복수의 대역통과필터에 의해 필터링을 수행할 수 있다.
예를 들어, 제2 필터뱅크(1025)는, 청각 특성에 기반한 임계 밴드, 옥타브 밴드, 감마톤의 ERB(Equivalent Rectangular Bandwidth) 등의 필터뱅크를 구비하고, 해당 필터링을 수행할 수 있다.
한편, 제2 필터뱅크(1025)는, QMF (Quadrature Mirror Filter) 변환을 수행할 수도 있다.
한편, 제2 필터뱅크(1025)에 의해, 스테레오 오디오 신호의 2채널 신호 또는 멀티 채널의 오디오 신호는, 시간, 주파수 밴드로 분석되어 목소리, 오디오 객체 등 주요 정보를 전달하는 주성분 신호와 잔향, 공간감을 표현하는 부성분 신호로 구분될 수 있다.
제2 주성분 분석부(1035)는, 스테레오 오디오 신호의 2채널 신호 또는 멀티 채널의 오디오 신호에 대한 주성분 신호와 부성분 신호를 분리하고, 주성분 신호의 채널 간의 상관 관계 연산, 주성분 신호의 패닝 이득 연산, 주성분 신호의 파워 연산 등을 수행할 수 있다.
한편, 제2 주성분 분석부(1035)는, 부성분 신호의 채널 간의 상관 관계 연산, 부성분 신호의 패닝 이득 연산, 부성분 신호의 파워 연산 등을 수행할 수도 있다.
제2 특징 추출부(1045)는, 주성분 신호의 패닝 이득, 주성분 신호의 파워, 부성분 신호의 패닝 이득, 부성분 신호의 파워 등을 특징으로 추출할 수 있다.
한편, 제2 특징 추출부(1045)에서 추출된 특징 등은, 모델 학습예측부(1050)에 입력될 수 있다.
한편, 모델 학습예측부(1050)는, 제2 특징 추출부(1045)에서 추출된 특징에 기초하여, 심층 신경망 모델 기반하에 학습을 수행할 수 있다.
특히, 모델 학습예측부(1050)는, 제2 특징 추출부(1045)에서 추출된 주성분 신호의 패닝 이득, 주성분 신호의 파워와 같은 특징에 기초하여, 심층 신경망 모델 기반하에 학습을 수행할 수 있다.
한편, 모델 학습예측부(1050)는, 신호 처리부(170) 내에 구비되는 것도 가능하나, 서버(600)에 구비되는 것도 가능하다.
한편, 도 10에 도시된 신호 처리부(170)는, 스테레오 오디오 신호를 멀티 채널의 오디오 신호로 변환할 수 있다.
이를 위해, 상술한 바와 같이, 도 10에 도시된 신호 처리부(170)는, 변환부(1010), 필터뱅크(1020), 주성분 분석부(1030), 특징 추출부(1040), 마스킹부(1055), 포락선 조정부(1060), 역변환부(1070)를 구비할 수 있다.
변환부(1010)는, 입력되는 다운믹스 스테레오 오디오 신호(input signal)를 주파수 변환할 수 있다.
다음, 필터뱅크(1020)는, 주파수 변환된 스테레오 오디오 신호를 복수의 대역통과필터에 의해 필터링을 수행할 수 있다.
다음, 주성분 분석부(1030)는, 스테레오 오디오 신호의 2채널 신호에 대한 주성분 신호와 부성분 신호를 분리하고, 주성분 신호의 채널 간의 상관 관계 연산, 주성분 신호의 패닝 이득 연산, 주성분 신호의 파워 연산 등을 수행할 수 있다.
한편, 주성분 분석부(1030)는, 부성분 신호의 채널 간의 상관 관계 연산, 부성분 신호의 패닝 이득 연산, 부성분 신호의 파워 연산 등을 수행할 수도 있다.
한편, 특징 추출부(1040)는, 주성분 신호의 패닝 이득, 주성분 신호의 파워, 부성분 신호의 패닝 이득, 부성분 신호의 파워 등을 특징으로 추출할 수 있다.
한편, 특징 추출부(1040)에서 추출된 특징 등은, 모델 학습예측부(1050)에 입력될 수 있다.
한편, 모델 학습예측부(1050)는, 특징 추출부(1040)에서 추출된 특징에 기초하여, 심층 신경망 모델 기반하에 예측을 수행할 수 있다.
특히, 모델 학습예측부(1050)는, 특징 추출부(1040)에서 추출된 주성분 신호의 패닝 이득, 주성분 신호의 파워와 같은 특징에 기초하여, 심층 신경망 모델 기반하에 예측을 수행할 수 있다.
한편, 모델 학습예측부(1050)는, 신호 처리부(170) 내에 구비되는 것도 가능하나, 서버(600)에 구비되는 것도 가능하다.
한편, 주성분 분석에 의하여 다운믹스 입력신호input signal)가 이상적으로 분리되면, 수학식 2, 수학식 3과 같이 표현될 수 있다.
Figure pat00002
Figure pat00003
여기서, Sd,Sf,Sc,Sw,Sr,Sh는 각각 다운믹스 채널의 주성분과 원본 멀티 채널에 대한 전방, 중심, 우퍼, 후방, 상향 채널의 주성분을 나타내고, nd,nf,nr,nh는 각각 다운믹스 채널의 부성분과 원본 멀티 채널의 전방, 후방, 상향 채널의 부성분을 나타낸다.
수학식 2에서 주성분에는 전방, 중심, 우퍼, 후방, 상향 채널의 주성분이 믹스되어 있다. 특히 중심, 우퍼 신호는 다운믹스 방법에 의해서 상관관계가 높기 때문에 주성분에 두드러지게 나타난다.
수학식 2, 수학식 3은 멀티 채널 신호가 5.1.2 채널의 레이아웃으로 가정하였지만, 다른 레이아웃의 멀티 채널 신호도 이와 유사하게 표현이 가능하다.
마스킹부(1055)는, 모델 학습예측부(1050)에서 예측된 결과에 마스킹을 수행할 수 있다.
마스킹부(1055)는, 멀티 채널 신호에서 각각의 채널이 시간과 주파수에서 대하여 연관성이 없이 통계적으로 독립인 경우, 시간 주파수 성분으로 마스킹하여 수학식 4와 같은 각각의 채널 분리를 수행할 수 있다.
Figure pat00004
여기서, Msx 와 Mnx는 각각 업믹스 채널의 주성분과 부성분의 마스크 함수를 나타낸다.
마스크 함수는 입력 신호의 주성분과 부성분에 대하여 원본 멀티 채널 중 어느 채널의 밴드에 매칭되는지에 따라 결정된다.
매칭 방법은 심층 신경망(DNN)의 모델(model)로부터 예측한 멀티 채널의 주성분과 부성분의 밴드 파워로 간단히 포함 관계를 알 수 있다.
이처럼 마스크 함수는 입력 다운믹스의 주성분(Sd)과 부성분(nd)을 업믹스 채널의 주성분(Sx)과 부성분(nx)로 분리하기 위한 함수를 의미할 수 있다.
이렇게 분리한 목표 채널의 주성분과 부성분은, 수학식 5와 같이 믹스하여, 최종 업믹스 신호를 얻을 수 있다.
Figure pat00005
이처럼 사각 윈도우의 바이너리 마스크를 사용하는 경우, 객관적 평가에는 좋은 성능을 나타낼 수 있지만, 주관적 음질 측면에서는 왜곡이 심한 단점이 있다.
이에, 가우시안 필터를 이용하여 청감상 부자연스러운 왜곡을 개선할 수 있다.
하지만, 실제 멀티 채널 신호는 서로 상호 배반적인 특성이 아니기 때문에, 단순 마스크 형태로 완전히 대응할 수 없다.
이에 따라, 포락선 조정부(1060)는, 마스킹에 의해 출력되는 신호의 포락선을 조정할 수 있다.
즉, 포락선 조정부(1060)는, 수학식 6과 같이 가중치 함수로 채널을 분리할 수 있다. 이에 따라, 더욱 자연스러운 출력을 얻을 수 있다.
Figure pat00006
여기서, Wsx, Wnx는, 각각 목표 채널에 대하여 주성분 가중치와 부성분 가중치 함수를 나타낸다.
가중치 함수는 목표 업믹스 채널의 신호와 다운믹스 신호에 대하여 주성분과 부성분 신호의 오차를 최소화하는 가중치 함수를 나타낸다.
이처럼 주파수 밴드에 대한 가중치 함수는 주파수 대역에서 신호의 포락선을 보정하는 것으로 볼 수 있다.
즉, 포락선 조정부(1060)는, 멀티 채널의 주성분과 부성분 포락선의 가중치를 연산하여, 포락선을 조정할 수 있다.
가중치 함수를 적용한 최종 업믹스 신호는 수학식 7과 같이 생성된다.
Figure pat00007
포락선을 조정하기 위하여 업믹스 파라미터는, 모델 학습예측부(1050) 내의 심층 신경망(DNN)의 모델로부터 예측될 수 있다.
이에 따라, 모델 학습예측부(1050) 내 심층 신경망(DNN) 학습 성능에 따라 멀티 채널 업믹스 성능이 저하될 수 있다.
한편, 포락선 조정부(1060)가, 각 주파수 밴드의 크기를 목표 채널의 포락선에 추종하도록 조정할 수 있다. 이러한 경우, 주성분과 부성분 밴드의 크기 정보만을 특징 벡터로 추정하면 되기 때문에 구현상 용이한 장점이 있다.
또한, 기존 주성분 분석법에 의하여 추정된 주성분과 부성분에 대하여, 심층 신경망(DNN) 모델로부터 최적화된 가중치 함수를 적용할 수 있기 때문에, 실시간 튜닝이 가능한 장점이 있다.
한편, 역변환부(1070)는, 포락선 조정부(1060)로부터 출력되는 신호를 역변환하여, 멀티 채널의 업믹스 오디오 신호를 출력할 수 있다.
이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다.
도 12는 도 10 내지 도 11의 설명에 참조되는 도면이다.
도면을 참조하면, 스테레오 입력 신호(left signal, right signal)는, 주성분 분석부(1030)에 의해, 주성분 신호(primary)와 부성분 신호(ambient)로 분리될 수 있다.
그리고, 포락선 조정부(1060) 등을 거쳐, 멀티 채널 신호로 업믹스될 수 dflT다
한편, 멀티 채널 오디오 신호의 전방, 중심, 우퍼 채널은 주파수 영역에 대하여 서로 연관성이 없다. 또한, 좌우 채널은 같은 신호로 상관 관계가 높기 때문에 주성분으로 분해가 가능하다.
한편, 후방, 상향 채널은 좌우 채널의 상관 관계가 낮기 때문에 부성분으로 분해될 수 있다.
한편, 포락선 조정부(1060)에서 분해된 주성분과 부성분은, 심층 신경망 모델에서 예측된 가중치 함수가 적용되어, 업믹스 채널이 생성된다.
도 13은 본 발명의 일실시예에 따른 신호 처리부의 동작을 나타내는 순서도이다.
도면을 참조하면, 신호 처리부(170)는, 입력되는 스테레오 신호를 수신할 수 있다(S1405). 특히, 다운믹스된 스테레오 신호를 수신할 수 있다.
다음, 신호 처리부(170) 내의 변환부(1030)는, 입력되는 스테레오 오디오 신호를 주파수 변환할 수 있다(S1410). 상술한 바와 같이, 입력되는 스테레오 오디오 신호를 STFT(Short time Fourier Transform) 변환할 수 있다.
다음, 필터뱅크(1020)는, 주파수 변환된 스테레오 오디오 신호를 복수의 대역통과필터에 의해 필터링을 수행할 수 있다(S1415).
다음, 주성분 분석부(1030)는, 변환부(1010)로부터의 신호에 기초하여, 주성분 분석을 수행할 수 있다(S1420).
특히, 주성분 분석부(1030)는, 필터뱅크(1020)로부터의 신호에 기초항, 주성분 분석을 수행할 수 있다.
다음, 특징 추출부(1040)는, 주성분 분석부(1030)로부터의 신호에 기초하여 주성분 신호의 특징을 추출할 수 있다(S1425).
다음, 모델 학습예측부(1050)는, 특징 추출부(1040)로부터의 특징에 기초하여, 심층 신경망 모델 기반하에 예측을 수행할 수 있다(S1430).
다음, 마스킹부(1055)는, 모델 학습예측부(1050)로부터의 예측 결과에 마스킹을 수행할 수 있다(S1435).
한편, 마스킹부(1055)는, 멀티 채널의 각 채널이 시간과 주파수에 대해 독립인 경우, 모델 학습예측부(1050)로부터의 예측 결과에 기초하여, 시간 주파수 성분으로 마스킹을 수행하여, 채널 분리를 수행할 수 있다.
다음, 포락선 조정부(1060)는, 심층 신경망 모델 기반하에 수행된 예측에 기초하여, 포락선 조정을 수행할 수 있다(1440).
한편, 포락선 조정부(1060)는, 모델 학습예측부(1050)로부터의 예측 결과에 기초하여, 주파수 밴드에 대한 가중치 함수에 따라, 주파수 대역에서의 신호의 포락선을 보정하여, 채널을 분리할 수 있다.
한편, 포락선 조정부(1060)는, 각 주파수 주파수 밴드의 크기를 목표 채널에 포락선에 추종하도록 조정할 수 있다.
다음, 역변환부(1070)는, 포락선 조정부(1060)로부터 신호를 역변환하여 멀티 채널의 업믹스 오디오 신호를 출력할 수 있다.
이에 따라, 다운믹스 스테레오 오디오 신호를 멀티 채널 오디오 신호로 업믹스하는 경우 공간상의 왜곡을 개선할 수 있게 된다. 특히, 주성분 분석 방법과 심층 신경망 모델을 이용하여 멀티 채널 신호를 간단하게 합성할 수 있게 된다.
도 14는 본 발명의 다른 실시예에 따른 신호 처리부의 동작을 나타내는 순서도이다.
도면을 참조하면, 신호 처리부(170)는, 데이터 베이스(1005)로부터 수신되는 다운믹스 스테레오 오디오 신호 또는 멀티 채널 오디오 신호를 수신할 수 있다.
다음, 신호 처리부(170) 내의 제2 변환부(1035)는, 입력되는 데이터 베이스(1005)로부터 수신되는 다운믹스 스테레오 오디오 신호 또는 멀티 채널 오디오 신호를 주파수 변환할 수 있다(S1310). 상술한 바와 같이, 입력되는 스테레오 오디오 신호를 STFT(Short time Fourier Transform) 변환할 수 있다.
다음, 제2 필터뱅크(1025)는, 주파수 변환된 스테레오 오디오 신호를 복수의 대역통과필터에 의해 필터링을 수행할 수 있다(S1315).
다음, 제2 주성분 분석부(1035)는, 제2 변환부(1035)로부터의 신호에 기초하여, 주성분 분석을 수행할 수 있다(S1320).
특히, 제2 주성분 분석부(1035)는, 제2 필터뱅크(1025)로부터의 신호에 기초항, 주성분 분석을 수행할 수 있다.
다음, 제2 특징 추출부(1045)는, 제2 주성분 분석부(1035)로부터의 신호에 기초하여 주성분 신호의 특징을 추출할 수 있다(S1325).
다음, 모델 학습예측부(1050)는, 제2 특징 추출부(1045)로부터의 특징에 기초하여, 심층 신경망 모델 기반하에 학습을 수행할 수 있다(S1330).
이에 따라, 심층 신경망 모델 기반하에 학습이 수행되어, 도 13의 멀티 채널 예측시, 정확한 예측 수행이 가능하게 된다.
한편, 상술한 신호 처리부(170) 또는 신호 처리 장치(170)의 오디오 신호의 업믹스 채널 생성은, TV, 이동 단말기, 차량용 디스플레이 장치와 같은 영상표시장치 외에, 휴대용 재생장치, 홈씨어터, 사운드바, 카오디오 등 오디오 컨텐츠를 재생할 수 있는 모든 재생장치에 적용될 수 있다.
특히, 홈씨어터, 카오디오 등 멀티 채널 재생 장치에서는 각 스피커에 출력할 수 있는 멀티 채널 오디오 신호를 생성할 수 있다.
또한, 이어폰, 헤드폰으로 재생하는 휴대용 재생장치에서도 3차원 멀티 채널 신호를 외재화 기술과 연계하여 이머시브 오디오 환경을 재현할 수 있다.
그 밖에 TV, 사운드 바 형태의 2채널 스피커의 재생장치에서도 멀티 채널 가상화 기술과 결합하여 더욱 향상된 3차원 오디오를 재현할 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

Claims (13)

  1. 입력되는 스테레오 오디오 신호를 주파수 변환하는 변환부;
    상기 변환부로부터의 신호에 기초하여, 주성분 분석을 수행하는 주성분 분석부;
    상기 주성분 분석부로부터의 신호에 기초하여 주성분 신호의 특징을 추출하는 특징 추출부;
    심층 신경망 모델 기반하에 수행된 예측에 기초하여, 포락선 조정을 수행하는 포락선 조정부; 및
    상기 포락선 조정부로부터 신호를 역변환하여 멀티 채널의 업믹스 오디오 신호를 출력하는 역변환부;를 포함하는 것을 특징으로 하는 신호 처리 장치.
  2. 제1항에 있어서,
    상기 변환부로부터의 주파수 변환된 스테레오 오디오 신호를 복수의 대역통과필터에 의해 필터링을 수행하는 필터뱅크;를 더 포함하는 것을 특징으로 하는 신호 처리 장치.
  3. 제1항에 있어서,
    상기 특징 추출부로부터의 특징에 기초하여, 심층 신경망 모델 기반하에 상기 예측을 수행하는 모델 학습예측부;를 더 포함하는 것을 특징으로 하는 신호 처리 장치.
  4. 제1항에 있어서,
    상기 모델 학습예측부로부터의 예측 결과에 마스킹을 수행하는 마스킹부;를 더 포함하는 것을 특징으로 하는 신호 처리 장치.
  5. 제4항에 있어서,
    상기 마스킹부는,
    멀티 채널의 각 채널이 시간과 주파수에 대해 독립인 경우, 상기 모델 학습예측부로부터의 예측 결과에 기초하여, 시간 주파수 성분으로 마스킹을 수행하여, 채널 분리를 수행하는 것을 특징으로 하는 신호 처리 장치.
  6. 제1항에 있어서,
    상기 포락선 조정부는,
    상기 모델 학습예측부로부터의 예측 결과에 기초하여, 주파수 밴드에 대한 가중치 함수에 따라, 주파수 대역에서의 신호의 포락선을 보정하여, 채널을 분리하는 것을 특징으로 하는 신호 처리 장치.
  7. 제1항에 있어서,
    상기 포락선 조정부는,
    각 주파수 주파수 밴드의 크기를 목표 채널에 포락선에 추종하도록 조정하는 것을 특징으로 하는 신호 처리 장치.
  8. 제1항에 있어서,
    상기 주성분 분석부는,
    상기 입력되는 스테레오 오디오 신호의 주성분 신호와 부성분 신호를 분리하는 것을 특징으로 하는 신호 처리 장치.
  9. 제1항에 있어서,
    상기 주성분 분석부는,
    상기 입력되는 스테레오 오디오 신호의 주성분 신호의 채널 간의 상관 관계 연산, 주성분 신호의 패닝 이득 연산, 주성분 신호의 파워 연산을 수행하는 것을 특징으로 하는 신호 처리 장치.
  10. 제9항에 있어서,
    상기 특징 추출부는,
    상기 입력되는 스테레오 오디오 신호의 상기 주성분 신호의 패닝 이득, 상기 주성분 신호의 파워를 특징으로 추출하는 것을 특징으로 하는 신호 처리 장치.
  11. 제1항에 있어서,
    데이터 베이스로부터 수신되는 다운믹스 스테레오 오디오 신호 또는 멀티 채널 오디오 신호를 주파수 변환하는 제2 변환부;
    상기 제2 변환부로부터의 신호에 기초하여, 주성분 분석을 수행하는 제2 주성분 분석부;
    상기 제2 주성분 분석부로부터의 신호에 기초하여 주성분 신호의 특징을 추출하는 제2 특징 추출부;를 더 포함하며,
    상기 제2 특징 추출부에서 추출된 특징에 기초하여, 상기 심층 신경망 모델 기반하에 학습이 수행되는 것을 특징으로 하는 신호 처리 장치.
  12. 제11항에 있어서,
    상기 제2 특징 추출부에서 추출된 특징에 기초하여, 상기 심층 신경망 모델 기반하에 학습을 수행하는 모델 학습예측부;를 더 포함하는 것을 특징으로 하는 신호 처리 장치.
  13. 제1항 내지 제12항 중 어느 한 항의 신호 처리 장치를 포함하는 것을 특징으로 하는 영상표시장치.
KR1020190002219A 2019-01-08 2019-01-08 신호 처리 장치 및 이를 구비하는 영상표시장치 KR102603621B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020190002219A KR102603621B1 (ko) 2019-01-08 2019-01-08 신호 처리 장치 및 이를 구비하는 영상표시장치
CN202010017313.3A CN111432273B (zh) 2019-01-08 2020-01-08 信号处理装置和包括该信号处理装置的图像显示设备
PCT/KR2020/000335 WO2020145659A1 (en) 2019-01-08 2020-01-08 Signal processing device and image display apparatus including the same
US16/737,646 US11089423B2 (en) 2019-01-08 2020-01-08 Signal processing device and image display apparatus including the same
EP20150690.4A EP3680897B1 (en) 2019-01-08 2020-01-08 Signal processing device and image display apparatus including the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190002219A KR102603621B1 (ko) 2019-01-08 2019-01-08 신호 처리 장치 및 이를 구비하는 영상표시장치

Publications (2)

Publication Number Publication Date
KR20200086064A true KR20200086064A (ko) 2020-07-16
KR102603621B1 KR102603621B1 (ko) 2023-11-16

Family

ID=69147533

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190002219A KR102603621B1 (ko) 2019-01-08 2019-01-08 신호 처리 장치 및 이를 구비하는 영상표시장치

Country Status (5)

Country Link
US (1) US11089423B2 (ko)
EP (1) EP3680897B1 (ko)
KR (1) KR102603621B1 (ko)
CN (1) CN111432273B (ko)
WO (1) WO2020145659A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022065933A1 (ko) * 2020-09-28 2022-03-31 삼성전자 주식회사 오디오의 부호화 장치 및 방법, 및 오디오의 복호화 장치 및 방법
WO2024147370A1 (ko) * 2023-01-02 2024-07-11 엘지전자 주식회사 디스플레이 장치 및 그의 오디오 신호 처리 방법

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102436512B1 (ko) * 2019-10-29 2022-08-25 삼성전자주식회사 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
CN114827666B (zh) * 2021-01-27 2024-10-08 阿里巴巴集团控股有限公司 视频处理方法、装置及设备
CN115482174B (zh) * 2022-09-26 2024-08-09 深圳信息职业技术学院 图像增强方法、装置、电子设备及存储介质
CN115712065B (zh) * 2023-01-05 2023-04-07 湖南大学 时频旋转门与卷积核感知匹配的电机故障诊断方法及系统
CN116014917B (zh) * 2023-03-22 2023-07-07 中国科学院空天信息创新研究院 无线供能系统及其闭环控制方法、最大功率跟踪方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101724320B1 (ko) * 2015-12-14 2017-04-10 광주과학기술원 서라운드 채널 오디오 생성 방법

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000196611A (ja) * 1998-12-25 2000-07-14 Sony Corp 情報受信装置、及び情報送受信システム
US7072427B2 (en) * 2001-11-09 2006-07-04 Parkervision, Inc. Method and apparatus for reducing DC offsets in a communication system
WO2003077425A1 (fr) * 2002-03-08 2003-09-18 Nippon Telegraph And Telephone Corporation Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques
EP1475996B1 (en) * 2003-05-06 2009-04-08 Harman Becker Automotive Systems GmbH Stereo audio-signal processing system
WO2005096274A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
KR20070038020A (ko) * 2005-10-24 2007-04-09 엘지전자 주식회사 오디오 신호 처리 방법 및 장치와 프로그램을 기록하는컴퓨터로 읽을 수 있는 기록 매체
FR2898725A1 (fr) * 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
CN101816191B (zh) * 2007-09-26 2014-09-17 弗劳恩霍夫应用研究促进协会 用于提取环境信号的装置和方法
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US20120076307A1 (en) * 2009-06-05 2012-03-29 Koninklijke Philips Electronics N.V. Processing of audio channels
US9094645B2 (en) * 2009-07-17 2015-07-28 Lg Electronics Inc. Method for processing sound source in terminal and terminal using the same
CN101667425A (zh) * 2009-09-22 2010-03-10 山东大学 一种对卷积混叠语音信号进行盲源分离的方法
KR20140090469A (ko) * 2013-01-09 2014-07-17 엘지전자 주식회사 영상표시장치의 동작 방법
PL3011557T3 (pl) * 2013-06-21 2017-10-31 Fraunhofer Ges Forschung Urządzenie i sposób do udoskonalonego stopniowego zmniejszania sygnału w przełączanych układach kodowania sygnału audio podczas ukrywania błędów
US20160035024A1 (en) * 2014-07-29 2016-02-04 Chicago Mercantile Exchange Inc. Initial Margining Using Decayed Scenarios
US20170061978A1 (en) * 2014-11-07 2017-03-02 Shannon Campbell Real-time method for implementing deep neural network based speech separation
US9742593B2 (en) * 2015-12-16 2017-08-22 Kumu Networks, Inc. Systems and methods for adaptively-tuned digital self-interference cancellation
KR101871604B1 (ko) 2016-12-15 2018-06-27 한양대학교 산학협력단 심화 신경망을 이용한 다채널 마이크 기반의 잔향시간 추정 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101724320B1 (ko) * 2015-12-14 2017-04-10 광주과학기술원 서라운드 채널 오디오 생성 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022065933A1 (ko) * 2020-09-28 2022-03-31 삼성전자 주식회사 오디오의 부호화 장치 및 방법, 및 오디오의 복호화 장치 및 방법
WO2024147370A1 (ko) * 2023-01-02 2024-07-11 엘지전자 주식회사 디스플레이 장치 및 그의 오디오 신호 처리 방법

Also Published As

Publication number Publication date
EP3680897B1 (en) 2022-04-06
CN111432273A (zh) 2020-07-17
US11089423B2 (en) 2021-08-10
EP3680897A1 (en) 2020-07-15
KR102603621B1 (ko) 2023-11-16
CN111432273B (zh) 2022-06-24
WO2020145659A1 (en) 2020-07-16
US20200221242A1 (en) 2020-07-09

Similar Documents

Publication Publication Date Title
KR102603621B1 (ko) 신호 처리 장치 및 이를 구비하는 영상표시장치
KR102142019B1 (ko) 신호 처리 장치 및 이를 구비하는 영상표시장치
KR102661826B1 (ko) 신호 처리 장치 및 이를 구비하는 영상표시장치
KR102627646B1 (ko) 신호 처리 장치 및 이를 구비하는 영상표시장치
KR102662951B1 (ko) 신호 처리 장치 및 이를 구비하는 영상표시장치
US12118916B2 (en) Image display apparatus with AI-based image processing
KR20200087979A (ko) 비디오 월
US11315522B2 (en) Image display apparatus
KR20200063303A (ko) 영상 처리 장치 및 그 제어방법
KR102673322B1 (ko) 영상 및 오디오 처리 장치 및 그 동작 방법
EP3941041A1 (en) Video wall
US11234042B2 (en) Display device, control method therefor and recording medium
KR20210105636A (ko) 전자장치 및 그 제어방법
CN113689810B (zh) 图像显示设备及其方法
KR20210035723A (ko) 신호처리장치 및 이를 구비하는 영상표시장치
KR20190109197A (ko) 신호 처리 장치 및 이를 구비하는 영상표시장치
KR20200113643A (ko) 신호 처리 장치 및 이를 구비하는 영상표시장치
EP3982351A1 (en) Signal processing device and image display apparatus including the same
KR20200125060A (ko) 신호 처리 장치 및 이를 구비하는 영상표시장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant