KR102614577B1 - 전자 장치 및 그 제어 방법 - Google Patents

전자 장치 및 그 제어 방법 Download PDF

Info

Publication number
KR102614577B1
KR102614577B1 KR1020160122050A KR20160122050A KR102614577B1 KR 102614577 B1 KR102614577 B1 KR 102614577B1 KR 1020160122050 A KR1020160122050 A KR 1020160122050A KR 20160122050 A KR20160122050 A KR 20160122050A KR 102614577 B1 KR102614577 B1 KR 102614577B1
Authority
KR
South Korea
Prior art keywords
sound
signal
sound signal
preset
voice
Prior art date
Application number
KR1020160122050A
Other languages
English (en)
Other versions
KR20180032860A (ko
Inventor
조재연
김선민
김기범
강기웅
임동현
황인우
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020160122050A priority Critical patent/KR102614577B1/ko
Priority to PCT/KR2017/009942 priority patent/WO2018056624A1/en
Priority to CN201780057932.1A priority patent/CN109716780B/zh
Priority to EP17191341.1A priority patent/EP3300077A1/en
Priority to US15/708,396 priority patent/US10362433B2/en
Publication of KR20180032860A publication Critical patent/KR20180032860A/ko
Application granted granted Critical
Publication of KR102614577B1 publication Critical patent/KR102614577B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4852End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • H04N5/607Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for more than one sound signal, e.g. stereo, multilanguages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4398Processing of audio elementary streams involving reformatting operations of audio signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/15Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Abstract

스마트 음향 모드를 제공하는 전자 장치가 개시된다. 전자 장치는, 사용자 명령을 입력받는 입력부, 음향 신호를 입력받는 입력부 및, 기설정된 이벤트가 발생되면 스마트 음향 모드 설정을 가이드하는 UI를 제공하고, 사용자 명령에 따라 스마트 음향 모드가 선택되면 음향 신호를 구성하는 복수의 채널 간의 공통 성분인 제1 음향 신호에서의 음성 검출 여부 및 복수의 채널 간의 차이 성분인 제2 음향 신호에서의 효과음 검출 여부에 기초하여 제1 음향 신호 및 제2 음향 신호를 개별적으로 렌더링하고, 렌더링된 제1 및 제2 음향 신호를 멀티 채널 음향 신호로 믹싱하는 프로세서 및, 멀티 채널 음향 신호를 출력하는 출력부를 포함한다.

Description

전자 장치 및 그 제어 방법 { Electronic device and control method thereof }
본 발명은 전자 장치 및 그 제어 방법에 관한 것으로, 더욱 상세하게는 복수 개의 스피커를 구비한 전자 장치 및 그 제어 방법에 관한 것이다.
전자 기술의 발달에 힘입어 다양한 유형의 전자기기가 개발 및 보급되고 있다. 특히, 가정, 사무실, 공공 장소 등 다양한 장소에서 이용되는 스피커와 같은 음향 출력 장치는 최근 수년 간 지속적으로 발전하고 있다.
음향 출력 장치의 성능이 고급화되면서, 음질 향상 및 넓은 사운드 스테이지(Sound stage) 형성을 위하여 오디오에 입력되는 신호는 다채널의 형태를 가지게 되었다.
한편, 현재 TV 등과 같은 전자 장치에서는 원하는 음향 모드를 선택하도록 되어 있다. 예를 들어 사용자는 시청하고자 하는 컨텐츠 타입에 따라 영화 모드, 뉴스 모드, 음악 모드, 게임 모드 등과 같은 다양한 음향 모드를 선택하여 선택된 음향 모드를 제공받을 수 있다.
이 경우, 사용자가 음향 모드를 직접 선택해야 하는 번거로움이 존재하였다. 또한, 대부분 사용자들은 음향 모드를 아예 설정하지 않고 시청하여, 사용자들이 제대로 된 음향 효과를 제공받지 못한다는 문제점이 있었다.
본 발명은 상술한 필요성에 따른 것으로, 본 발명의 목적은, 컨텐츠의 음향신호를 센터 신호 및 앰비언트로 분리하여 각각의 신호 특성에 기초하여 렌더링함으로써 컨텐츠에 최적화된 음향을 제공하는 전자 장치 및 그 제어 방법을 제공함에 있다.
본 발명의 또 다른 목적은, 실시간 컨텐츠 분석에 따른 렌더링을 통해 컨텐츠의 컨텍스트에 최적화된 음향을 제공하는 전자 장치 및 그 제어 방법을 제공함에 있다.
이상과 같은 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 스마트 음향 모드를 제공하는 전자 장치는, 사용자 명령을 입력받는 사용자 입력부, 음향 신호를 입력받는 입력부, 기설정된 이벤트가 발생되면 스마트 음향 모드 설정을 가이드하는 UI를 제공하고, 상기 사용자 명령에 따라 상기 스마트 음향 모드가 선택되면 상기 음향 신호를 구성하는 복수의 채널 간의 공통 성분인 제1 음향 신호에서의 음성 검출 여부 및 상기 복수의 채널 간의 차이 성분인 제2 음향 신호에서의 효과음 검출 여부에 기초하여 상기 제1 음향 신호 및 상기 제2 음향 신호를 개별적으로 렌더링하고, 렌더링된 제1 및 제2 음향 신호를 멀티 채널 음향 신호로 믹싱하는 프로세서 및 상기 멀티 채널 음향 신호를 출력하는 출력부를 포함한다.
또한, 상기 프로세서는, 상기 제1 음향 신호에서 기설정된 구간 단위로 주파수 변화량을 확인하여 각 구간에서의 음성 존재 여부를 검출하고, 상기 제2 음향 신호에서 기설정된 구간 단위로 주파수 변화량을 확인하여 효과음 존재 여부를 검출하고, 각 검출 결과에 기초하여 상기 제1 음향 신호 및 상기 제2 음향 신호를 개별적으로 렌더링할 수 있다.
또한, 상기 프로세서는, 상기 제1 음향 신호의 특정 구간에서 적어도 하나의 이전 구간에 대한 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 상기 음성이 존재하는 것으로 검출하고, 상기 제2 음향 신호의 특정 구간에서 적어도 하나의 이전 구간에 대한 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 상기 효과음이 존재하는 것으로 검출할 수 있다.
또한, 상기 프로세서는, 상기 제1 음향 신호의 각 구간에서의 음성 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 음성 강조 필터에 가중치를 적용하여 상기 제1 음향 신호를 렌더링하고, 상기 제2 음향 신호의 각 구간에서의 효과음 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 효과음 강조 필터에 가중치를 적용하여 상기 제2 음향 신호를 렌더링할 수 있다.
또한, 상기 프로세서는, 상기 제1 음향 신호의 각 구간에서의 음성 검출 여부에 기초하여 상기 기설정된 렌더링 단위 구간 별로 적용되는 파라미터를 업데이트하여 상기 제1 음향 신호를 렌더링하고, 상기 제2 음향 신호의 각 구간에서의 효과음 검출 여부에 기초하여 상기 기설정된 렌더링 단위 구간 별로 적용되는 파라미터를 업데이트하여 상기 제2 음향 신호를 렌더링할 수 있다.
또한, 상기 프로세서는, 상기 전자 장치의 기기 세팅 정보, 시청 환경 정보, 이용 히스토리 정보 및 상기 음향 컨텐츠 관련 부가 정보 중 적어도 하나에 기초하여, 상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나에 적용되는 필터의 가중치를 조정할 수 있다.
또한, 상기 프로세서는, 상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나에 음악적 요소가 존재하는 것으로 판단되면, 음악 강조 필터에 기설정된 가중치를 적용하여 상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나를 렌더링할 수 있다.
또한, 상기 음향 신호는 2 채널 스테레오 신호이며, 상기 프로세서는, 상기 2 채널 스테레오 신호를, 상기 2 채널 스테레오 신호 간 공통된 성분인 센터(center) 신호 및 차이 성분인 앰비언트(ambient) 신호를 분리하고, 상기 센터 신호에서의 음성 검출 여부 및 상기 효과음 신호에서의 효과음 검출 여부에 기초하여 상기 센터음 신호 및 상기 배경음 신호를 개별적으로 렌더링할 수 있다.
또한, 디스플레이를 더 포함하며, 상기 프로세서는, 상기 기설정된 이벤트가 발생되면, 상기 스마트 음향 모드로 진입 가능한 UI 및 스마트 음향 효과를 조정하기 위한 UI 중 적어도 하나를 상기 디스플레이를 통해 제공할 수 있다.
여기서, 상기 기설정된 이벤트는, 상기 전자 장치를 제어하는 원격 제어 장치 상에 구비된 기설정된 버튼이 누름 조작되는 이벤트 및 상기 스마트 음향 모드를 적용하기에 적합한 음향 부분이 출력되는 이벤트 중 적어도 하나를 포함할 수 있다.
한편, 본 발명의 일 실시 예에 따른 스마트 음향 모드를 제공하는 전자 장치의 제어 방법은, 음향 신호를 입력받는 단계, 기설정된 이벤트가 발생되면 스마트 음향 모드 설정을 가이드하는 UI를 제공하는 단계, 사용자 명령에 따라 상기 스마트 음향 모드가 선택되면 상기 음향 신호를 구성하는 복수의 채널 간의 공통 성분인 제1 음향 신호에서의 음성 검출 여부 및 상기 복수의 채널 간의 차이 성분인 제2 음향 신호에서의 효과음 검출 여부에 기초하여 상기 제1 음향 신호 및 상기 제2 음향 신호를 개별적으로 렌더링하는 단계 및, 상기 렌더링된 제1 및 제2 음향 신호를 멀티 채널 음향 신호로 믹싱하고, 상기 멀티 채널 음향 신호를 출력하는 단계를 포함한다.
또한, 상기 렌더링하는 단계는, 상기 제1 음향 신호에서 기설정된 구간 단위로 주파수 변화량을 확인하여 각 구간에서의 음성 존재 여부를 검출하고, 상기 제2 음향 신호에서 기설정된 구간 단위로 주파수 변화량을 확인하여 효과음 존재 여부를 검출할 수 있다.
또한, 상기 렌더링하는 단계는, 상기 제1 음향 신호의 특정 구간에서 적어도 하나의 이전 구간에 대한 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 상기 음성이 존재하는 것으로 검출하고, 상기 제2 음향 신호의 특정 구간에서 적어도 하나의 이전 구간에 대한 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 상기 효과음이 존재하는 것으로 검출할 수 있다.
또한, 상기 렌더링하는 단계는, 상기 제1 음향 신호의 각 구간에서의 음성 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 음성 강조 필터에 가중치를 적용하여 상기 제1 음향 신호를 렌더링하고, 상기 제2 음향 신호의 각 구간에서의 효과음 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 효과음 강조 필터에 가중치를 적용하여 상기 제2 음향 신호를 렌더링할 수 있다.
또한, 상기 렌더링하는 단계는, 상기 제1 음향 신호의 각 구간에서의 음성 검출 여부에 기초하여 상기 기설정된 렌더링 단위 구간 별로 적용되는 파라미터를 업데이트하여 상기 제1 음향 신호를 렌더링하고, 상기 제2 음향 신호의 각 구간에서의 효과음 검출 여부에 기초하여 상기 기설정된 렌더링 단위 구간 별로 적용되는 파라미터를 업데이트하여 상기 제2 음향 신호를 렌더링할 수 있다.
또한, 상기 렌더링하는 단계는, 상기 전자 장치의 기기 세팅 정보, 시청 환경 정보, 이용 히스토리 정보 및 상기 음향 컨텐츠 관련 부가 정보 중 적어도 하나에 기초하여, 상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나에 적용되는 필터의 가중치를 조정할 수 있다.
또한, 상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나에 음악적 요소가 존재하는 것으로 판단되면, 음악 강조 필터에 기설정된 가중치를 적용하여 상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나를 렌더링하는 단계를 더 포함할 수 있다.
상기 음향 신호는, 2 채널 스테레오 신호이며, 상기 분리하는 단계는, 상기 2 채널 스테레오 신호를, 상기 2 채널 스테레오 신호 간 공통된 성분인 센터(center) 신호 및 차이 성분인 앰비언트(ambient) 신호를 분리하고, 상기 렌더링 하는 단계는, 상기 센터 신호에서의 음성 검출 여부 및 상기 효과음 신호에서의 효과음 검출 여부에 기초하여 상기 센터음 신호 및 상기 배경음 신호를 개별적으로 렌더링할 수 있다.
또한, 상기 기설정된 이벤트가 발생되면, 상기 스마트 음향 모드로 진입 가능한 UI 및 스마트 음향 효과를 조정하기 위한 UI 중 적어도 하나를 제공하는 단계를 더 포함할 수 있다.
여기서, 상기 기설정된 이벤트는, 상기 전자 장치를 제어하는 원격 제어 장치 상에 구비된 기설정된 버튼이 누름 조작되는 이벤트 및 상기 스마트 음향 모드를 적용하기에 적합한 음향 부분이 출력되는 이벤트 중 적어도 하나를 포함할 수 있다.
본 발명의 다양한 실시 예에 따르면, 컨텐츠의 음향을 센터 신호 및 앰비언트로 분리하여 각각의 신호 특성에 기초하여 렌더링함으로써, 음성은 보다 명료하게 하고 효과음에 대해서는 보다 넓은 음장감을 제공할 수 있게 된다.
또한, 기설정된 음향 구간 단위로 컨텐츠를 분석하여 실시간 렌더링을 수행하여, 보다 스마트한 음향 효과를 제공할 수 있게 된다.
또한, 다양한 부가 정보에 기초하여 컨텐츠의 음향을 렌더링함으로써 사용자 컨텍스트에 최적인 음향 렌더링을 수행함으로써 보다 스마트한 음향 효과를 제공할 수 있게 된다.
도 1은 본 발명의 일 실시 예에 따른 전자 장치의 일 구현 예를 나타내는 도면이다.
도 2는 본 발명의 일 실시 예에 따른 전자 장치의 구성을 나타내는 블럭도이다.
도 3은 본 발명의 일 실시 예에 따른 신호 분리 방법을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시 예에 따른 신호 검출 방법을 설명하기 위한 도면이다.
도 5a 내지 도 5d는 본 발명의 일 실시 예에 따른 신호 검출 동작을 자세히 설명하기 위한 도면들이다.
도 6은 본 발명의 일 실시 예에 따른 렌더링 동작을 자세히 설명하기 위한 도면이다.
도 7은 도 2에 도시된 전자 장치의 세부 구성을 나타내는 블럭도이다.
도 8 내지 도 10b는 본 발명의 일 실시 예에 따른 UI 제공 방법을 설명하기 위한 도면들이다.
도 11은 본 발명의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 흐름도이다.
이하 본 발명의 다양한 실시 예를 첨부된 도면을 참조하여 상세히 설명한다.
도 1은 본 발명의 일 실시 예에 따른 전자 장치의 일 구현 예를 나타내는 도면이다.
도 1에 따르면 전자 장치(100)는 복수의 스피커 유닛을 구비한 디지털 TV로 구현될 수 있다. 다만, 이에 한정되는 것은 아니며 오디오 장치, 사용자 단말 장치, 사운드바, 홈씨어터 시스템, 룸 스피커 등 복수의 스피커 유닛을 포함하는 장치라면 이에 한정되지 않고 적용가능하다.
전자 장치(100)가 디지털 TV로 구현되는 경우 전자 장치(100)는 원격 제어 장치(10), 사용자 모션 또는 음성에 의해 제어될 수 있다. 예를 들어, 원격 제어 장치(10)는 입력된 키에 대응되는 신호를 전송하거나, 움직임을 감지하고 움직임에 대응되는 신호를 전송하거나, 음성을 인식하고 인식된 음성에 대응되는 신호를 전송하는 등의 다양한 형태로 구현될 수 있다. 이 경우, 원격 제어 장치(10)는 구현 타입에 따라 다양한 형태의 사용자 명령을 입력받기 위해 모션 센서, 터치 센서 또는 광학 기술을 응용한 OJ(optical Joystick) 센서, 물리적 버튼(예를 들어, Tact Switch), 디스플레이 화면, 마이크 중 적어도 하나를 포함하도록 구현될 수 있다.
한편, 전자 장치(100)에 포함된 복수의 스피커 유닛은 전기 펄스를 음파로 변환시키는 기능을 하며, 전기신호를 음파로 변환시키는 원리와 방법에 따라 구분되는 동전형(動電型) 즉, 다이내믹 형으로 구현될 수 있다. 다만, 이에 한정되는 것은 아니며 본 발명이 적용되는 범위 내에서 정전형(靜電型), 유전체형(誘電體型), 자기왜형(磁氣歪型) 등으로 구현될 수도 있다.
여기서, 복수의 스피커 유닛은 2 채널, 2.1 채널, 3 채널, 3.1 채널, 5.1 채널, 7.1 채널 등과 같이 복수의 채널을 각각 담당하여 재생할 수 있다. 예를 들어, 복수의 스피커 유닛은 L(Left) 채널 스피커 및 R(Right) 채널 스피커를 포함할 수 있으며, 이하에서는 설명의 편의를 위하여 복수의 스피커 유닛이 L 채널, R 채널을 각각 재생하는 경우를 상정하여 설명하도록 한다.
한편, 본 발명의 일 실시 예에 따르면, 전자 장치(100)는 복수의 스피커 유닛으로 출력될 음향 신호를 렌더링할 때 입력된 음향 컨텐츠를 센터 신호 및 앰비언트 신호로 분리하여 개별적으로 렌더링을 수행함으로써, 음성은 보다 명료하게 하고 효과음은 보다 넓은 음장감(Sound Field)을 제공하는 스마트 음향 모드(또는 스마트 오디오 모드)를 제공할 수 있는데, 이하에서는 도면을 참조하여 본 발명의 다양한 실시 예에 대해 설명하도록 한다.
도 2는 본 발명의 일 실시 예에 따른 전자 장치의 구성을 나타내는 블럭도이다.
도 2에 따르면 전자 장치(100)는 입력부(110), 프로세서(120) 및 출력부(130)를 포함한다.
사용자 입력부(105)는 다양한 사용자 명령을 입력받는다. 사용자 입력부(105)는 전자 장치(100)의 구현 예에 따라 다양한 형태로 구현될 수 있다. 예를 들어, 전자 장치(100)가 디지털 TV로 구현되는 경우 사용자 입력부(105)는 원격 제어 장치(도1, 10)로부터 리모콘 신호를 수신하는 리모콘 수신부로 구현될 수 있으나, 이에 한정되는 것은 아니며, 사용자 모션을 입력받는 카메라, 사용자 음성을 입력받는 마이크, 전자 장치(100) 자체에 구비된 키 등으로 구현될 수도 있다.
입력부(110)는 음향 신호를 입력받는다. 여기서, 입력되는 음향 신호는 복수의 채널 신호(예를 들어, 스테레오 신호)가 될 수 있다. 다만, 본 발명의 일 실시 예에 따라 센터 신호와 앰비언트 신호로 분리가능한 신호라면 한정되지 않고 적용 가능하다. 이 경우, 음향 신호는 음향 컨텐츠 자체에 포함된 음향 신호이거나, 영상 컨텐츠의 일부인 음향 신호가 될 수 있다.
프로세서(120)는 전자 장치(100)의 전반적인 동작을 제어한다. 프로세서(120)는 중앙처리장치(central processing unit(CPU)), 컨트롤러(controller), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)), ARM 프로세서 중 하나 또는 그 이상을 포함하거나, 해당 용어로 정의될 수 있다.
또한, 프로세서(120)는 디지털 시그널 프로세서(digital signal processor(DSP))로 구현될 수 있고, 컨텐츠 프로세싱 알고리즘이 내장된 SoC로 구현될 수도 있고, FPGA(Field Programmable gate array) 형태로 구현될 수도 있다.
일 실시 예에 따라, 프로세서(120)는 기설정된 이벤트가 발생되면 스마트 음향 모드 진입을 가이드하는 UI를 제공하고, 사용자 명령에 따라 스마트 음향 모드가 선택되면 본 발명에 따른 신호 처리 동작을 수행할 수 있다. 예를 들어, 스마트 음향 모드 진입을 가이드하는 UI는, 전자 장치(100)의 다양한 기능을 셋팅하기 위한 UI(Quick Settings UI), 음향 신호 출력 중 스마트 음향 모드 진입을 가능하게 하는 UI, 스마트 음향 효과를 조정하기 위한 UI 중 적어도 하나의 형태로 구현될 수 있다. 즉, 스마트 음향 모드 진입을 가이드하는 UI는 음향 신호 출력 전, 음향 신호 출력 도중과 같이 다양한 시점에 제공될 수 있다.
다만, 다른 실시 예에 따라 본 발명에 따른 스마트 음향 모드가 디폴트로 설정된 전자 장치(100)의 경우에는 사용자 명령과 관계없이 해당 신호 처리 동작이 적용되는 것도 가능하다.
이하에서는, 본 발명의 일 실시 예에 따라 스마트 음향 효과를 제공하는 신호 처리 동작에 대해 설명하도록 한다.
< 신호 분리 >
프로세서(120)는 입력된 음향 신호를, 복수의 채널 간의 공통 성분인 제1 음향 신호 및 복수의 채널 간의 차이 성분인 제2 음향 신호로 분리할 수 있다. 여기서, 제1 음향 신호는, 센터(또는 주성분(Primary)) 신호이고, 제2 음향 신호는 앰비언트(ambient)(잔향, 박수, 바람, 다양한 배경음) 신호가 될 수 있다. 이하에서는 설명의 편의를 위하여 복수의 채널이 L 채널 및 R 채널인 경우를 상정하여 설명하도록 한다.
일반적으로, 동일 음원에서 나온 음은 마이크로폰의 위치에 따라 집음되는 신호가 달라질 수 있다. 일반적으로 가수나 아나운서 등과 같이 음성 신호를 발생시키는 음원은 스테이지의 센터에 위치하는 경우가 대부분이므로, 스테이지의 센터에 위치하는 음원으로부터 발생하는 음성 신호에 대해 생성되는 스테레오 신호는 L 신호와 R 신호가 서로 동일하게 된다. 그러나, 음원이 스테이지의 센터에 위치하지 않은 경우, 동일한 음원에서 나온 신호라도 두 개의 마이크로폰에 도달하는 음의 세기와 도달시간 등에 차이가 생기게 되므로 마이크로 폰에 집음되는 신호가 달라지게 되어 좌, 우 스테레오 신호 또한 서로 달라지게 된다.
본 명세서에서는 음성 신호와 같이 스테레오 신호에 공통으로 들어있는 신호를 센터 신호(center signal)이라 하고, 스테레오 신호 간 차이 성분(예를 들어, 스테레오 신호에서 센터 신호를 차감한 신호)을 앰비언트 신호(또는 앰비언트 스테레오 신호)라 부르기로 한다.
< 신호 검출 >
제1 및 제2 음향 신호가 분리되면, 프로세서(120)는 제1 음향 신호에서의 음성 존재 여부 및 제2 음향 신호에서의 효과음 존재 여부를 검출한다. 일 실시 예에서, 프로세서(130)는 센터 신호에서의 음성 존재 여부 및 앰비언트 신호에서의 효과음 존재 여부를 검출할 수 있다.
프로세서(120)는 제1 음향 신호에서 기설정된 구간(이하, 검출 구간이라 함) 단위로 주파수 변화량을 확인하여 각 검출 구간에서의 음성 존재 여부를 검출할 수 있다. 또한, 제2 음향 신호에서 기설정된 검출 구간 단위로 주파수 변화량을 확인하여 효과음 존재 여부를 검출할 수 있다. 여기서, 기설정된 검출 구간 단위는 예를 들어, 적어도 하나의 오디오 프레임 단위, 적어도 하나의 오디오 씬 단위, 적어도 하나의 오디오 청크 단위 중 적어도 하나가 될 수 있다. 여기서 오디오 씬은 오디오의 묵음 구간이나 저(低)에너지 구간을 탐지하여 결정될 수 있다. 여기서, 주파수 변화량은 현재 검출 구간 및 적어도 하나의 이전 검출 구간에서의 주파수 크기 변화량이 될 수 있다. 예를 들어, 현재 프레임 및 적어도 하나의 이전 프레임에서의 주파수 크기 변화량이 될 수 있다.
일 실시 예에 따르면, 프로세서(120)는 제1 음향 신호(또는 제2 음향 신호)에서 기설정된 검출 구간 각각에 대해 주파수 변화량을 확인하여 각 검출 구간에서의 음성(또는 효과음) 존재 여부를 검출할 수 있다. 예를 들어 기설정된 검출 구간이 1프레임인 경우, 1프레임 단위로 음성(또는 효과음) 존재 여부를 검출할 수 있다.
다른 실시 예에 따르면, 프로세서(120)는 제1 음향 신호(또는 제2 음향 신호)에서 기설정된 검출 구간에 대해 기설정된 주기 단위로 주파수 변화량을 확인하여 각 검출 구간에서의 음성 존재 여부를 검출할 수 있다. 예를 들어 기설정된 검출 구간이 1프레임이고, 기설정된 주기가 2프레임 간격인 경우, 1프레임, 제3프레임, 제5 프레임… 에서 음성(또는 효과음) 존재 여부를 검출할 수 있다 이 경우, 현재 프레임(제5프레임)에서 음성(또는 효과음)이 검출되면, 변화량이 산출되지 않는 적어도 하나의 프레임의 인접 프레임(예를 들어 제4 프레임 또는 제5프레임)의 음성(또는 효과음)에는 현재 프레임의 음성 검출 결과가 동일하게 적용될 수 있다.
또 다른 실시 예에 따르면, 프로세서(120)는 기설정된 개수의 연속된 프레임에서 음성(또는 효과음)이 검출되거나, 검출되지 않은 것으로 판단되면, 음성(또는 효과음)이 검출 동작을 위한 주기를 조정할 수 있다. 예를 들어 1 프레임 단위로 음성(또는 효과음)이 검출 동작을 수행하여 기설정된 개수의 연속된 프레임에서 음성(또는 효과음)이 검출되면, 이후부터는 2이상의 프레임 단위로 음성(또는 효과음)이 검출 동작을 수행할 수 있다.
이하에서는 설명의 편의를 위하여 기설정된 검출 구간 각각에 대해 주파수 변화량을 확인하여 각 검출 구간에서의 음성(또는 효과음) 존재 여부를 검출하는 경우를 상정하여 설명하도록 한다.
일 실시 예에 따르면, 프로세서(120)는 제1 음향 신호의 각 검출 구간에서 적어도 하나의 이전 검출 구간과의 관계에서 주파수 별 크기 변화량을 산출하고, 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 음성이 존재하는 것으로 검출하고, 제2 음향 신호의 각 검출 구간에서 적어도 하나의 이전 검출 구간과의 관계에서 주파수 별 크기 변화량을 산출하고, 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 효과음이 존재하는 것으로 검출할 수 있다.
구체적으로, 프로세서(120)는 제1 음향 신호(또는 제2 음향 신호)의 각 검출 구간에서 바로 이전 검출 구간과의 관계에서 주파수 별 크기 변화량을 산출할 수도 있으나, 적어도 3개 이상의 연속된 검출 구간에서의 주파수 별 크기 변화량을 산출할 수도 있다.
일 예로, 현재 프레임에서 이전 프레임과 비교하여 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 현재 프레임에 음성(또는 효과음)이 존재하는 것으로 검출할 수 있다. 다른 예로, 세 개 이상의 연속된 프레임 각각에서 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 현재 프레임에 음성이 존재하는 것으로 검출할 수 있다.
다른 표현으로, 프로세서(120)는 제1 음향 신호의 각 검출 구간에서 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 동적 성분이 있다고 판단하고 음성이 존재하는 것으로 검출하고, 제2 음향 신호의 각 검출 구간에서 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 동적 성분이 있다고 판단하고 효과음이 존재하는 것으로 검출할 수 있다.
여기서, 제1 음향 신호의 각 검출 구간 및 제2 음향 신호의 각 검출 구간 및 검출 주기는 동일하거나 상이할 수 있다. 예를 들어, 센터 신호, 앰비언트 신호 모두 프레임 단위로 주파수의 크기 변화량을 검출할 수도 있으나, 경우에 따라서는 센터 신호에는 1 프레임 단위(즉 이전 프레임에 대한 크기 변화량)로, 앰비언트 신호에서는 2 프레임 단위(즉, 이전 프레임 및 이이전 프레임에 대한 크기 변화량)로 주파수의 크기 변화량을 검출할 수 있다.
또한, 제1 음향 신호에서의 임계 개수와 제2 음향 신호에서의 임계 개수는 동일하거나 상이할 수 있다.
또 다른 실시 예에 따르면, 프로세서(120)는 제1 음향 신호(또는 제2 음향 신호)의 각 검출 구간에서 복수의 임계 값 및 복수의 임계 계수를 적용하여 음성(또는 효과음)을 검출할 수 있다. 예를 들어, 제1 음향 신호(또는 제2 음향 신호)의 각 검출 구간에서 적어도 하나의 이전 검출 구간과의 관계에서 주파수 별 크기 변화량을 산출하고, 크기 변화량이 제1 임계값 이상인 주파수 개수가 제1 임계 개수 이상이고, 제2 임계값 이상인 주파수 개수가 제2 임계 계수 이상이면, 해당 구간에 음성(또는 효과음)이 존재하는 것으로 검출할 수 있다.
또 다른 실시 예에 따르면, 프로세서(120)는 제1 음향 신호의 각 검출 구간에서 주파수 별 크기 변화량에 정보가 기설정된 임계 값 이상이면 해당 검출 구간에 음성이 존재하는 것으로 검출하고, 제2 음향 신호의 각 검출 구간에서 주파수 별 크기 변화량에 대한 정보가 기설정된 임계 값 이상이면 해당 구간에 효과음이 존재하는 것으로 검출할 수 있다. 여기서, 각 검출 구간에서 주파수 별 크기 변화량에 정보는, 예를 들어 각 검출 구간에서 주파수 별 크기 변화량에 대한 분산 값, 표준 편차 값 등이 될 수 있다.
< 렌더링 >
이어서, 프로세서(120)는 제1 음향 신호에서의 음성 검출 결과 및 제2 음향 신호에서의 효과음 검출 결과에 기초하여 제1 음향 신호 및 제2 음향 신호를 개별적으로 렌더링한다.
이 경우, 프로세서(120)는 제1 음향 신호에서 음성이 검출되면, 음성 강조 필터에 기설정된 가중치를 적용하여 제1 음향 신호를 렌더링하고, 제2 음향 신호에서 효과음이 검출되면 효과음 강조 필터에 기설정된 가중치를 적용하여 제2 음향 신호를 렌더링할 수 있다.
예를 들어, 프로세서(120)는 센터 신호에서 음성이 검출되면 센터음 성분에 가해지는 이득(gain)을 증가시키고, 음성이 검출되지 않으면 가해지는 이득을 감소시킨다. 이 경우, 프로세서(120)는 음성 강조 필터에 가해지는 이득에 따른 가중치를 적용하여 센터 신호를 렌더링한다.
프로세서(120)는 앰비언트 신호에서 효과음이 검출되면 배경음 성분에 가해지는 이득을 증가시키고, 효과음이 검출되지 않으면 가해지는 이득을 감소시킨다. 이 경우, 프로세서(120)는 효과음 강조 필터에 가해지는 이득에 따른 가중치를 적용하여 앰비언트 신호를 렌더링한다.
또한, 프로세서(120)는 제1 및 제2 음향 신호 중 적어도 하나에 음악적 요소가 존재하는 것으로 판단되면, 음악 강조 필터에 기설정된 가중치를 적용하여 제1 음향 신호 및 제2 음향 신호 중 적어도 하나를 렌더링할 수 있다.
예를 들어, 프로세서(120)는 분리된 센터 신호 및 앰비언트 신호의 유사도, 연속성, 에너지 변화, 주기성, 음상(음이 맺히는 위치) 등로부터 음악적 요소가 있는지를 모니터링한다. 음악적 요소의 검출에 따라 음악 강조 필터에 가중치를 적용할 수 있다. 예를 들어, 연속성이 높은 경우 피아노, 현악기 등과 같은 악기에 위한 음악적 요소가 있다고 판단하고 음악 강조 필터에 가중치를 적용할 수 있다. 다만, 음악 강조 필터에 특정 가중치가 적용되는 경우 음성 강조 필터/효과음 강조 필터에는 상황에 따라 가중치가 적용되거나, 적용되지 않을 수 있다.
특히, 프로세서(120)는 제1 음향 신호의 각 검출 구간에서의 음성 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 음성 강조 필터에 가중치를 적용하여 제1 음향 신호를 렌더링하고, 제2 음향 신호의 각 검출 구간에서의 효과음 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 효과음 강조 필터에 가중치를 적용하여 제2 음향 신호를 렌더링할 수 있다. 여기서, 기설정된 렌더링 단위 구간은 예를 들어, 적어도 하나의 오디오 프레임 단위, 적어도 하나의 오디오 씬 단위, 적어도 하나의 오디오 청크 단위 중 적어도 하나가 될 수 있다. 또한, 기설정된 렌더링 단위 구간은 음성 및 효과음을 검출하기 위한 검출구간과 동일하거나 상이할 수 있다.
또한, 프로세서(120)는 제1 음향 신호의 각 검출 구간에서의 음성 검출 여부에 기초하여 기설정된 렌더링 단위 구간 별로 적용되는 렌더링 파라미터를 업데이트하여 제1 음향 신호를 렌더링하고, 제2 음향 신호의 각 검출 구간에서의 효과음 검출 여부에 기초하여 기설정된 렌더링 단위 구간 별로 적용되는 렌더링 파라미터를 업데이트하여 제2 음향 신호를 렌더링할 수 있다. 예를 들어, 기본 렌더링 파라미터가 기 저장되어 있거나, 외부 서버로부터 수신될 수 있는데, 프로세서(120)는 제1 음향 신호의 음성 검출 여부 및 제2 음향 신호에서의 효과음 검출 여부에 기초하여 기본 렌더링 파라미터 중 적어도 일부를 업데이트할 수 있다. 여기서, 기본 파라미터는 전자 장치(100)의 특성에 기초하여 컨텐츠 장르와 관계없이 설정된 디폴트 파라미터이거나, 컨텐츠 장르에 따라 설정된 장르 파라미터 등이 될 수 있다.
또한, 프로세서(120)는 전자 장치(100)와 관련된 기기 세팅 정보, 시청 환경 정보, 이용 히스토리 정보 및 음향 컨텐츠 관련 부가 정보 중 적어도 하나에 기초하여, 제1 음향 신호 및 제2 음향 신호를 렌더링할 수 있다. 여기서, 기기 세팅 정보, 시청 환경 정보, 이용 히스토리 정보 및 음향 컨텐츠 관련 부가 정보 중 적어도 하나는 전자 장치(100)에 구비된 메모리(미도시)에 저장되어 있거나, 외부 서버(미도시)로부터 수신될 수 있다.
여기서, 기기 세팅 정보는 현재 채널, 현재 볼륨, 현재 셋팅된 메뉴 등의 정보를 포함할 수 있고, 시청 환경 정보는 사용자 음성의 크기/위치/지속시간, 사용자 수, 주변 소음의 크기/위치/지속시간, 현재 시간 등의 정보를 포함할 수 있다. 이 경우, 전자 장치(100)는 사용자 음성을 감지하기 위한 음성 감지 센서, 주변 소음을 감지하기 위한 소음 센서 등을 구비할 수 있다.
또한, 음향 컨텐츠 관련 부가 정보는 컨텐츠 장르(EPG, EIT, ETT 등으로부터 획득) 등의 정보를 포함할 수 있으며, 이용 히스토리 정보는, 사용자의 이용 패턴(예를 들어, 기기 세팅값 변동 로그), 사용자 방문 채널/프로그램 리스트, 사용자가 등록한 선호 채널/프로그램 리스트, 사용자가 시청 예약한 채널/프로그램 스케쥴링 정보, 외부 미디어 기기를 연결했을 때의 기기 세팅값 등의 정보를 포함할 수 있다. 이 경우, 프로세서(120)는 사용자 이용 히스토리 정보들로부터 학습/축적된 렌더링 파라미터를 참조하여 사용자의 음향 설정 개입을 최소화하면서 사용자에게 최적인 음향 렌더링을 제공할 수 있게 된다.
프로세서(120)는 이러한 부가 정보들에 기초하여 각종 렌더링 필터가 적용되는 상황을 부가적으로 판단하거나, 각종 필터에 적용되는 가중치에 제한/변화를 주어 가중치를 조정할 수 있다.
예를 들어, 전자 장치(100)의 볼륨 값이 기설정된 값 이하인 경우, 대사 전달의 중요성이 커지므로 음성 강조 필터의 가중치를 증가시키고, 효과음 강조 필터의 가중치를 저감시킬 수 있다. 또한, 볼륨 값이 기설정된 값 이상인 경우, 사운드를 즐기고자 하는 의도가 있다고 판단하고 효과음 강조 필터의 가중치를 증가시키고 음성 강조 필터의 가중치를 저감시킬 수 있다.
한편, 본 발명의 다른 실시 예에 따라, 센터 신호에서의 음성 존재 여부 및, 앰비언트 신호에서의 효과음 존재 여부는 존재 확률 값의 형태로 검출될 수 있다.프로세서(120)는 검출된 확률값에 대응되는 가중치를 적용하여 각 음향 신호를 필터링할 수 있다.
예를 들어, 센터 신호에서의 각 검출 구간에서 크기 변화량이 임계값 이상인 주파수 개수가 제1 임계 개수 이상인 경우 제1 확률 값, 크기 변화량이 임계값 이상인 주파수 개수가 제2 임계 개수 이상인 경우 제2 확률 값으로 검출될 수 있다. 이 경우, 프로세서(120)는 제1 확률 값에 대응되는 제1 가중치를 음성 강조 필터에 적용하여 제1 음향 신호를 필터링하거나, 제2 확률 값에 대응되는 제2 가중치를 효과음 강조 필터에 적용하여 제2 음향 신호를 필터링할 수 있다.
< 믹싱 및 출력 >
또한, 프로세서(130)는 렌더링된 제1 음향 신호 및 제2 음향 신호를 복수 개의 출력 채널로 믹싱한다. 여기서, 출력 채널의 개수는 입력 채널의 개수와 동일하거나, 입력 채널 수에서 확장 또는 축소된 개수가 될 수 있다. 일 예로, 출력 채널의 개수가 입력 채널의 개수보다 적다면, 입력 채널은 출력 채널 개수에 맞추어 다운믹싱(downmixing)된다. 다른 예로, 출력 채널의 개수가 입력 채널의 개수보다 많다면, 입력 채널은 출력 채널 개수에 맞추어 업믹싱(upmixing)된다.
이 경우, 프로세서(130)는 믹싱 작업을 수행하기 위한 믹서(mixer)(또는 오디오 믹서)를 포함하거나, 별도로 구비된 믹서를 제어하도록 구현될 수 있다. 일 예로, 믹서는 입력된 신호가 인서트와 버스를 거친 다음에, 출력 채널로 출력되는 구조로 구현될 수 있다. 믹서는, 믹싱 콘솔(Mixing Console), 믹싱 데스크(Mixing Desk), 그리고 사운드 보드(Sound Board)라고도 하며, 소리의 세기 및 음색, 그리고 위상과 서라운드 이미지를 제어할 수 있다.
출력부(130)는 멀티 채널 음향 신호를 출력하여 출력한다.
이 경우, 출력부(130)는 멀티 채널을 출력할 수 있는, 복수의 스피커 유닛(또는 앰프)을 포함할 수 있다. 예를 들어, 출력부(130)는 L 채널, R 채널을 각각 재생하는 L 채널 스피커 및 R 채널 스피커를 포함할 수 있다.
도 3은 본 발명의 일 실시 예에 따른 음향 처리를 수행하기 위한 프로세서의 동작을 자세히 설명하기 위한 도면이다.
도 3에 도시된 블럭들은 구현 예에 따라 프로세서(120)가 음향 처리에 이용하는 기 저장된 소프트웨어 모듈을 의미하거나, 프로세서(120)의 칩(예를 들어 DSP 칩)에서 수행되는 다양한 기능을 의미할 수 있다.
도 3에 따르면, 프로세서(120)는 신호 분리 블럭(121), 신호 검출 블럭(122), 렌더링 블럭(123) 및 믹싱 블럭(124)을 포함한다.
신호 분리 블럭(121)은 입력된 음향 신호를, 음향 신호를 구성하는 복수의 채널 간의 공통 성분인 제1 음향 신호 및 복수의 채널 간의 차이 성분인 제1 음향 신호로 분리한다. 예를 들어, L/R 채널을 포함하는 스테레오 음향 신호가 입력되는 경우, L/R 채널 간의 공통 성분인 센터 신호 및 L/R 채널 간의 차이 성분인 앰비언트 신호를 분리할 수 있다.
신호 검출 블럭(122)은 제1 음향 신호에서 음성 존재 여부를 검출하고, 제2 음향 신호에서의 효과음 존재 여부를 검출한다. 예를 들어, 센터 신호에서 음성 존재 여부를 검출하고, 앰비언트 신호에서 효과음 존재 여부를 검출한다.
렌더링 블럭(123)은 제1 음향 신호에서의 음성 검출 여부 및 제2 음향 신호에서의 효과음 검출 여부에 기초하여 제1 음향 신호 및 제2 음향 신호를 개별적으로 렌더링한다.
믹싱 블럭(124)은 렌더링된 제1 및 제2 음향 신호를 멀티 채널 음향 신호로 믹싱한다.
도 4는 본 발명의 일 실시 예에 따른 도 3의 신호 분리 블럭(121)의 세부 동작을 설명하기 위한 도면이다.
도 4에서는 설명의 편의를 위하여 L/R 채널을 포함하는 스테레오 음향 신호로부터 센터 신호 및 앰비언트 신호를 분리하는 경우를 상정하여 설명하도록 한다.
입력된 음향 신호에 포함된 L 채널 신호 및 R 채널 신호는 각각 제1 및 제2 도메인 변환 블럭(121-1, 121-2)으로 입력되고, 제1 및 제2 도메인 변환 블럭(121-1, 121-2)은 각각 L 채널 신호 및 R 채널 신호의 도메인을 변환한다. 예를 들어, 제1 및 제2 도메인 변환 블럭(121-1, 121-2)은 FFT(Fast Fourier Transform) 등의 알고리즘을 이용하여 스테레오 신호를 시간-주파수 도메인으로 변환한다. 시간-주파수 도메인은 시간과 주파수 변화를 동시에 표현하기 위해 사용되며, 음향 신호를 시간과 주파수 값에 따라 복수의 구간(예를 들어 프레임)들로 나누고, 각 프레임에서의 신호를 각 타임 슬롯에서의 주파수 서브밴드 값들로 표현할 수 있다.
상관 계수 획득 블럭(121-3)은 제1 및 제2 도메인 변환 블럭(121-1, 121-2)에서 시간-주파수 도메인으로 변환된 스테레오 신호를 이용하여 상관 계수를 구한다. 상관 계수 획득 블럭(121-3) 스테레오 신호 사이의 상관도(coherence)를 나타내는 제1 계수와 두 신호 사이의 유사성(similarity)을 나타내는 제 2 계수를 구하고, 제1 계수와 제 2 계수를 이용하여 상관 계수를 구한다. 여기서, 두 신호 사이의 상관도란 두 신호의 관련 정도를 나타내는 것으로, 제1 및 제2 상관 계수를 구하는 방법은 종래의 기술이 이용될 수 있으므로 자세한 설명을 생략하도록 한다. 예를 들어, Journal of Audio Engineering Society, Vol.52, No.7/8, 2004 July/August "A frequency-domain approach to multichannel upmix"(저자 Carlos Avendano)에 개시된 방법을 이용할 수 있다.
센터 신호 획득 블럭(121-4)은 상관 계수 획득 블럭(121-3)에서 획득된 상관 계수 및 스테레오 신호를 이용하여 스테레오 신호로부터 센터 신호를 추출한다. 예를 들어, 센터 신호 획득 블럭(121-4)은 스테레오 신호의 산술 평균을 구하고 여기에 상관 계수를 곱하여 센터 신호를 생성한다.
이어서, 센터 신호 획득 블럭(121-4)은 센터 신호를 역도메인 변환 블록(121-5)으로 전달하고, 역도메인 변환 블록(121-5)은 시간-주파수 도메인에서 생성된 센터 신호를 IFFT(Inverse Fast Fourier Transform) 등과 같은 알고리즘을 이용하여 시간 도메인으로 변환한다. 역도메인 변환 블록(121-5)은 시간 도메인으로 변환된 센터 신호를 제1 및 제2 신호 차감 블럭(121-6, 121-7)으로 전달한다.
제1 및 제2 신호 차감 블럭(121-6, 121-7)은 시간 도메인에서, 스테레오 신호와 센터 신호의 차를 구한다. 즉, 제1 신호 차감 블럭(121-6)은 L 채널 신호에서 센터 신호를 차감하여 앰비언트 L 신호를 구하고, 제2 신호 차감 블럭(121-7)은 R 채널 신호에서 센터 신호를 차감하여 앰비언트 R 신호를 생성한다.
다만, 도 4에 도시된 신호 분리 방법은 일 실시 예를 설명한 것이며, 신호 분리 방법은 해당 실시 예에 한정되는 것은 아니며, 종래의 다양한 신호 분리 방법이 적용될 수 있다. 예를 들어, 시간-주파수 도메인 상에서 상관 계수를 구하는 것이 아닌, 시간 도메인 상에서가 아닌 시간-주파수 도메인 상에서 상관 계수를 구하는 방법도 가능하다. 또한, 상술한 실시 예 외에 PCA(Principal Component Analysis) 알고리즘, Modified PCA 알고리즘 등 다양한 신호 분리 알고리즘이 적용될 수 있다(J. Usher and J. Benesty, "Enhancement of spatial sound quality: A new reverberation-extraction audio upmixer," IEEE Trans. Audio, Speech, and Language Processing, vol. 15, no. 7, pp. 2141-2150, 2007, C. Faller, "Multiple-loudspeaker playback of stereo signals," J. AES, vol. 54, no.11, pp. 1051-1064, 2006., S.W. Jeon, Y.C. Park, S.P. Lee, D.H. Yoon, "Robust Representation of Spatial Sound in Stereo-to Multichannel Upmix", AES convention, 2010, Goodwin. M.M., "Geometric Signal Decompositions for Spatial Audio Enhancement", IEEE ICASSP conf, pp 409-412, 2008 등)
한편, 입력 채널의 개수가 2 채널보다 큰 경우에는 입력 채널 신호를 2 채널씩 묶어 센터 채널 신호 분리 기술을 여러 번 적용하거나, 입력 채널을 다운믹싱한 후 센터 채널 분리 기술을 적용하여 여러 위치에 대한 채널 분리를 수행할 수도 있다.
도 5a 내지 도 5d 는 본 발명의 일 실시 예에 따른 도 3의 신호 검출 블럭(122)의 세부 동작을 설명하기 위한 도면이다.
도 5a는 본 발명의 일 실시 예에 따른 센터 신호(또는 앰비언트 신호)의 기설정된 검출 구간 단위(예를 들어 프레임) 별 신호 크기를 나타내는 도면이다. 즉, 도 5a는 센터 신호(또는 앰비언트 신호)의 시간 축 상에서의 신호 크기를 나타낸다.
도 5b는 본 발명의 일 실시 예에 따른 센터 신호(또는 앰비언트 신호)의 FFT 변환 후, 주파수 도메인에서의 각 프레임 신호에 포함된 주파수 분포 및 각 주파수 별 크기를 나타내는 도면이다.
신호 검출 블럭(122)에서는 기설정된 검출 구간 단위, 예를 들어 프레임 단위로 주파수 별 크기 변화량을 측정하고, 각 프레임의 주파수 별 크기 변화량을 산출할 수 있으며, 예를 들어, 그 결과는 도 5b에 도시된 바와 같다.
도 5b에 따르면, 가로축은 시간 순으로 나열된 각 프레임을 나타내며, 세로축은 각 프레임의 주파수 성분을 나타낸다. 설명의 편의를 위하여 각 주파수(Hz)를 1~10의 인디케이터로 표시하고, 주파수 크기를 복수의 레벨로 구분하였으며, 각 프레임의 주파수 성분 각각에 대한 크기 레벨을 서로 다른 해칭으로 표시하였다. 여기서, 256 개의 샘플이 포함된 구간을 1 프레임으로 하는 경우, 1초에 48000 샘플이 재생되는 경우, 1 프레임 구간은 256/48000=5.3mm/sec가 된다.
이어서, 신호 검출 블럭(122)에서는 크기 변화량이 기설정된 임계값 이상인 주파수들의 개수를 각 프레임 별로 산출할 수 있으며, 그 결과는 예를 들어 도 5c에 도시된 바와 같다. 즉, 도 5c에서 각 바(Bar)의 높이는 각 프레임에서 이전 프레임과의 관계에서 크기 변화량이 임계값 이상인 주파수들의 개수를 나타낸다. 다만, 편의를 위하여 이전 프레임과 현재 프레임 간의 주파수 변화량 만을 도시하였으며, 상술한 바와 같이 연속된 3개 이상의 프레임 간의 주파수 변화량을 이용할 수도 있다.
이 경우, 신호 검출 블럭(122)에서는 프레임에서 크기 변화량이 임계값 이상인 주파수들의 개수가 임계 개수(예를 들어 Nth) 이상인 프레임부터 음성 (또는 효과음)이 검출된 것으로 판단할 수 있다.
다만, 다른 실시 예에 따르면, 신호 검출 블록(122)에서는, 기설정된 검출 구간 단위, 예를 들어 프레임 단위로 주파수 별 크기 변화량을 측정하고, 각 프레임 신호의 주파수 별 크기 변화량에 대한 정보, 예를 들어 분산 값에 기초하여 음성(또는 효과음)을 검출할 수 있다.
신호 검출 블럭(122)에서는 도 5b에 도시된 바와 같이 각 프레임의 주파수 별 크기 변화량에 기초하여 각 프레임에 대한 주파수 별 크기 변화량의 분산 값을 산출할 수 있으며, 예를 들어, 그 결과는 도 5d에 도시된 바와 같다. 즉, 도 5d에서 각 바(Bar)의 높이는 각 프레임에서 주파수 별 크기 변화량의 분산 값을 나타낸다.
이 경우, 신호 검출 블럭(122)에서는 주파수 별 크기 변화량의 분산 값이 임계 값(예를 들어 0.1) 이상인 프레임부터 음성 (또는 효과음)이 검출된 것으로 판단할 수 있다.
도 6은 본 발명의 일 실시 예에 따른 도 3의 렌더링 블럭(123)의 세부 동작을 설명하기 위한 도면이다.
도 6에 따르면, 필터링 블럭(124-1)은 음성 또는 효과음 검출 여부에 기초하여 제1 및 제2 음향 신호를 필터링한다.
필터링 블럭(124-1)은 음성 강조 필터(또는 센터음 성분 렌더링 필터), 효과음 강조 필터(또는 배경음 성분 렌더링 필터), 음악 강조 필터 등을 이용하여 제1 및 제2 음향 신호를 필터링한다. 이 경우, 하이패스 필터, 로우패스 필터, 밴드패스 필터, 마스크(mask) 필터, HRTF(머리 전달 함수, Head-Related Transfer Function) 필터 등 다양한 필터가 이용될 수 있다.
음성 강조 필터는 음성 명료도 조절, 음성 강조 정도를 조절할 수 있는 렌더링 파라미터에 기초하여 필터링을 수행하고, 효과음 강조 필터는 효과음 서라운드감 조절, 사운드 스테이지 확장 정도를 조절할 수 있는 렌더링 파라미터에 기초하여 필터링을 수행한다.
필터링 블럭(124-1)은, 센터 신호의 각 검출 구간에서의 음성 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 음성 강조 필터에 가중치를 적용하여 센터 신호를 렌더링하고, 앰비언트 신호의 각 검출 구간에서의 효과음 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 효과음 강조 필터에 가중치를 적용하여 앰비언트 신호를 렌더링할 수 있다.
한편, 렌더링 파라미터는 기설정된 렌더링 구간 단위로 업데이트 될 수 있다. 예를 들어, 기설정된 렌더링 구간 단위는, 적어도 하나의 오디오 프레임 단위, 적어도 하나의 오디오 씬 단위, 적어도 하나의 오디오 청크 단위 중 적어도 하나가 될 수 있다. 또한, 기설정된 렌더링 단위 구간은 음성 또는 효과음을 검출하기 위한 검출구간의 단위와 동일하거나 상이할 수 있다.
이 경우, 필터링 블럭(124-1)은 특정 렌더링 단위 구간에서 음성(또는 효과음) 검출 결과가 없는 경우 기설정된 시간 범위 내에서 속하는 렌더링 단위 구간 예를 들어, 인접 렌더링 단위 구간에서의 렌더링 파라미터를 적용하여 렌더링을 수행할 수 있다.
패닝 모듈(124-2)은 제1 및 제2 음향 신호를 각 출력 채널에 대해 패닝시키기 위해 각 주파수 대역별, 각 채널별로 적용될 패닝 계수(또는 패닝 게인)를 구하고 적용한다. 음향 신호에 대한 패닝은 두 출력 채널 사이의 특정 위치에 음원을 렌더링하기 위해 각 출력 채널에 인가하는 신호의 크기를 제어하는 것을 의미한다.
도 7은 도 2에 도시된 전자 장치의 세부 구성을 나타내는 블럭도이다.
도 7에 따르면, 전자 장치(100)는 입력부(110), 프로세서(120), 출력부(130), 디스플레이(140), 스토리지(150), 광 수신부(160), 전원 공급부(170) 등을 포함한다. 도 3에 도시된 구성요소들 중 도 2에 도시된 구성요소와 중복되는 부분에 대해서는 자세한 설명을 생략하도록 한다.
입력부(110)는 외부 소스와 유선 또는 무선으로 연결되어 다양한 컨텐츠를 입력받는다. 예를 들어, 입력부(110) 음향(오디오), 비디오, 이미지, 텍스트 중 적어도 하나를 포함하는 컨텐츠를 입력받을 수 있다. 여기서, 컨텐츠는, 지상파 방송 컨텐츠, 케이블 컨텐츠, 소셜(Social) 컨텐츠, VOD(Video on demand) 컨텐츠, 웹(Wep) 컨텐츠 등 다양한 타입의 컨텐츠가 될 수 있다. 입력부(110)는 전자 장치(110)의 성능 및 구조에 따라 유선 이더넷(Ethernet, 111), 무선랜 통신부(112), 근거리 통신부(113), HDMI 입력 포트(High-Definition Multimedia Interface port, 114), 컴포넌트 입력 잭(115), PC 입력 포트(116), 및 USB 입력 잭(117) 중 적어도 하나를 포함할 수 있다. 실시 예에 따라 입력부(110)는 방송 신호를 수신하는 튜너를 포함하는 형태로 구현 가능하다.
프로세서(120)는 CPU(121), 전자 장치(100)의 제어를 위한 제어 프로그램이 저장된 롬(ROM, 또는 비 휘발성 메모리, 122) 및 전자 장치(100)의 외부에서부터 입력되는 데이터를 저장하거나 전자 장치(100)에서 수행되는 다양한 작업에 대응되는 저장 영역으로 사용되는 램(RAM, 또는 휘발성 메모리, 123)을 포함할 수 있다.
프로세서(120)는 전원 공급부(180)에서부터 내부 구성요소들(105 내지 170)에게 공급되는 전원을 제어한다. 또한, 프로세서(120)는 기설정된 이벤트가 발생되면 스토리지(150)에 저장된 OS(Operating System) 및 다양한 어플리케이션을 실행할 수 있다.
프로세서(120)는 영상에 대응되는 그래픽 처리를 위한 그래픽 프로세서(Graphic Processing Unit, 미도시)를 포함할 수 있다. 프로세서(120)는 코어(core, 미도시)와 GPU(미도시)를 포함하는 SoC(System On Chip)로 구현될 수 있다. 프로세서(130)는 싱글 코어, 듀얼 코어, 트리플 코어, 쿼드 코어 및 그 배수의 코어를 포함할 수 있다.
CPU(121)는 스토리지(150)에 액세스하여, 스토리지(150)에 저장된 O/S를 이용하여 부팅을 수행한다. 그리고, 스토리지(150)에 저장된 각종 프로그램, 컨텐츠, 데이터 등을 이용하여 다양한 동작을 수행한다.
ROM(122)에는 시스템 부팅을 위한 명령어 세트 등이 저장된다. 턴온 명령이 입력되어 전원이 공급되면, CPU(121)는 ROM(122)에 저장된 명령어에 따라 스토리지(150)에 저장된 O/S를 RAM(123)에 복사하고, O/S를 실행시켜 시스템을 부팅시킨다. 부팅이 완료되면, CPU(121)는 스토리지(150)에 저장된 각종 프로그램을 RAM(123)에 복사하고, RAM(123)에 복사된 프로그램을 실행시켜 각종 동작을 수행한다. 여기서, CPU(121), ROM(122) 및 RAM(123)은 내부 버스(bus)를 통해 상호 연결될 수 있다.
또한, 프로세서(120)는 디지털 시그널 프로세서(digital signal processor(DSP))을 포함할 수 있고, DSP는 디지털 필터, 이펙트, 음장감 등 다양한 기능을 추가할 수 있으며, 샘플레이트 컨버터(SRC)를 통해 디지털과 아날로그 간 변환시의 음질 열화를 방지하는 오버샘플링(Over Sampling) 기술도 적용할 수 있다.
출력부(130)는 멀티 채널 재생을 위한 복수의 스피커를 포함할 수 있다. 예를 들어, 출력부(130)는 믹싱되어 출력되는 각 채널을 담당하는 복수의 스피커를 포함할 수 있다. 경우에 따라서는 적어도 하나의 채널을 담당하는 스피커는 서로 다른 주파수 대역을 재생하기 위한 복수의 스피커 유닛을 포함하는 스피커 어레이로 구현되는 것도 가능하다.
디스플레이(140)는 전자 장치(100)를 통해 제공 가능한 다양한 컨텐츠 화면을 제공할 수 있다. 여기서, 컨텐츠는 화면은 이미지, 동영상, 텍스트, 음악 등과 같은 다양한 컨텐츠, 다양한 컨텐츠를 포함하는 어플리케이션 실행 화면, GUI(Graphic User Interface) 화면 등을 포함할 수 있다. 특히, 디스플레이(140)는 본 발명의 일 실시 예에 따른 스마트 음향 모드와 관련된 다양한 UI를 디스플레이할 수 있다.
예를 들어, 프로세서(120)는 기설정된 이벤트가 발생되면, 본 발명의 일 실시 예에 따른 스마트 음향 모드로 진입 가능한 UI 및 스마트 음향 효과를 조정하기 위한 UI 중 적어도 하나를 디스플레이(140)를 통해 제공할 수 있다. 여기서, 기설정된 이벤트는, 전자 장치(100)를 제어하는 원격 제어 장치(10) 상에 구비된 기설정된 버튼(또는 키)이 누름 조작되는 이벤트 및 스마트 음향 모드를 적용하기에 적합한 음향 부분이 출력되는 이벤트 중 적어도 하나를 포함할 수 있다.
이 경우, 프로세서(120)는 기설정된 버튼(또는 키)이 누름 조작되는 이벤트또는 스마트 음향 모드를 적용하기에 적합한 음향 부분이 출력되는 이벤트가 발생하면 대응되는 가이드 UI를 제공하거나, 스마트 음향 모드를 적용하기에 적합한 음향 부분이 출력됨과 동시에 기설정된 버튼이 누름 조작되는 이벤트가 발생하면, 대응되는 가이드 UI를 제공할 수 있다.
또한, 프로세서(120)는 기설정된 버튼의 누름 조작 형태, 누름 조작 횟수, 누름 조작 간격 등에 기초하여 상이한 형태의 UI를 제공하거나, 제공된 UI를 상이하게 제어할 있다. 예를 들어, 기설정된 버튼이 짧게 누름 조작되면 스마트 음향 모드로 진입 가능한 UI를 디스플레이하고, 길게 누름 조작되면 스마트 음향 모드를 해제할 수 있다. 이와 관련된 다양한 실시 예에 대해서는 도면을 참조하여 자세히 설명하도록 한다.
한편, 디스플레이(140)는 액정 디스플레이(liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), LCoS(Liquid Crystal on Silicon), DLP(Digital Light Processing) 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 또한, 디스플레이(140)는 투명한 재질로 구현되어 정보를 디스플레이하는 투명 디스플레이로 구현되는 것도 가능하다. 한편, 디스플레이(140)는 경우에 따라 터치패드와 상호 레이어 구조를 이루는 터치 스크린 형태로 구현될 수 있으며, 이 경우, 디스플레이(140)은 출력 장치 이외에 사용자 인터페이스로 사용될 수 있게 된다.
스토리지(150)는 전자 장치(100)를 구동/제어하기 위한 다양한 데이터, 프로그램 또는 어플리케이션을 저장할 수 있다.
스토리지(150)는 전자 장치(100) 및 프로세서(120)의 제어를 위한 제어 프로그램, 제조사에서 최초 제공되거나 외부에서부터 다운로드 받은 어플리케이션, 어플리케이션과 관련된 GUI(graphical user interface, 이하에서는 "GUI"라고 칭한다), GUI를 제공하기 위한 오브젝트(예를 들어, 이미지 텍스트, 아이콘, 버튼 등), 사용자 정보, 문서, 데이터베이스들 또는 관련 데이터들을 저장할 수 있다.
특히, 스토리지(150)는 본 발명의 일 실시 예에 따라 음향 신호 렌더링에 이용되는 기기 세팅 정보, 시청 환경 정보, 이용 히스토리 정보 및 음향 컨텐츠 관련 부가 정보 중 적어도 하나를 저장할 수 있다. 또한 스토리지(150)는 음향 처리를 위한 다양한 파라미터(예를 들어, 렌더링 파라미터)를 저장할 수 있다.
스토리지(150)는 방송 수신 모듈, 채널 제어 모듈, 볼륨 제어 모듈, 통신 제어 모듈, 음성 인식 모듈, 모션 인식 모듈, 광 수신 모듈, 디스플레이 제어 모듈, 오디오 제어 모듈, 외부 입력 제어 모듈, 전원 제어 모듈, 음성 데이터베이스(DB), 또는 모션 데이터베이스(DB)을 포함할 수 있다.
스토리지(150)는 전자 장치(100)에 장착되는 메모리 카드(예를 들어, micro SD 카드, USB 메모리 등), USB 포트에 연결가능한 외부 메모리(예를 들어, USB 메모리 등), 비휘발성 메모리, 휘발성 메모리, 하드 디스크 드라이브(HDD) 또는 솔리드 스테이트 드라이브(SSD)를 포함할 수 있다.
광 수신부(160)는 원격 제어 장치(도 1, 10)에서부터 출력되는 광 신호(제어 정보를 포함)를 광창(미도시)을 통해 수신한다. 광 수신부(160)는 원격 제어 장치(10)로부터 사용자 입력(예를 들어, 터치, 눌림, 터치 제스처, 음성, 또는 모션)에 대응되는 광 신호를 수신할 수 있다. 이 경우, 수신된 광 신호에서 추출된 제어 정보는 프로세서(120)로 전송될 수 있다.
전원 공급부(170)는 프로세서(120)의 제어에 의해 전자 장치(100) 내부의 구성 요소들(105 내지 160)로 외부 전원 소스에서부터 입력되는 전원을 공급한다.
도 8 내지 도 10b는 본 발명의 일 실시 예에 따른 UI 제공 방법을 설명하기 위한 도면들이다.
도 8은 본 발명의 일 실시 예에 따른 스마트 음향 모드를 설정하기 위한 UI 화면을 나타내는 도면이다.
도 8에 도시된 바와 같이 기설정된 이벤트에 따라 화면(810) 상에 Quick Settings UI(811)가 제공될 수 있다. 여기서, 기설정된 이벤트는 원격 제어 장치(10)에 구비된 특정 버튼(예를 들어 홈 버튼)이 누름 조작되는 이벤트가 될 수 있으나, 이에 한정되는 것은 아니다.
여기서, Quick Settings UI(811)에 포함된 복수의 메뉴 중 음향 모드 설정메뉴(811-1)가 "Standard Sound Mode"로 세팅된 상태가 될 수 있다.
음향 모드 설정 메뉴(811-1)는 toggle 방식으로 "Smart Sound Mode"로 전환될 수 있다. 즉, 사용자가 해당 메뉴를 선택하면, 도시된 바와 같이 "Smart Sound Mode"로 전환될 수 있다. 이와 같이 "Smart Sound Mode"가 선택되면, 상술한 실시 예에 따른 스마트 음향 모드에 따라 음향이 출력될 수 있다.
다만, 도 8에서는 Quick Settings UI(811) 가 도시되었으나, 음향 모드 설정 메뉴(811-1)를 포함하는 UI이면 이에 한정되지 않음은 물론이다.
도 9는 본 발명의 다른 실시 예에 따른 스마트 음향 모드를 설정하기 위한 UI 화면을 나타내는 도면이다.
도 9에 도시된 바와 같이 전자 장치(100)는 사용자의 시청 도중 적절한 시점에 스마트 음향 모드 설정을 위한 UI를 제공할 있다. 예를 들어, 전자 장치(100)는 스마트 음향 모드 설정이 필요하다고 판단됨과 동시에 원격 제어 장치(10)에 구비된 특정 버튼(예를 들어, 볼륨 조작이나 채널 변경 버튼)이 누름 조작되는 경우에 스마트 음향 모드를 설정을 위한 UI를 제공하여 사용자의 설정을 유도할 수 있다.
예를 들어, 전자 장치(100)는 음향 분석을 통해서 스마트 음향 모드를 적용하기에 효과적인 컨텐츠인지 여부를 실시간으로 모니터링할 수 있다. 예를 들어, 도 5a 내지 도 5d에 도시된 바와 같이 센터 신호 및 앰비언트 신호 각각에 대해 각 프레임 단위로 주파수 별 크기 변화량을 모니터링하여 크기 변화량이 임계값 이상인 주파수들의 개수가 임계 개수(예를 들어 Nth) 이상인 프레임들의 개수에 기초하여 현재 출력되는 컨텐츠가 스마트 음향 모드를 적용하기에 효과적인 컨텐츠인지 판단할 수 있다. 예를 들어, 현재 까지 출력된 프레임들의 개수에 대한 해당 조건을 만족하는 프레임들의 개수의 비율이 기설정된 임계 비율 이상인 경우, 현재 출력되는 컨텐츠가 스마트 음향 모드를 적용하기에 효과적인 컨텐츠라고 판단할 수 있다.
전자 장치(100)는 현재 출력되는 컨텐츠가 스마트 음향 모드를 적용하기에 효과적인 컨텐츠라고 판단되는 경우, 도 9에 도시된 바와 같이 사용자가 원격 제어 장치(10)의 특정 버튼을 누르는 순간에 화면(910) 상에 스마트 음향 모드를 추천하는 UI(911)를 제공할 수 있다. 이 경우, 해당 UI 는 스마트 음향 모드에 진입할 수 있는 사용자 조작을 가이드하는 내용을 포함할 수 있다. 예를 들어, 도시된 바와 같이 볼륨 버튼(또는 볼륨 키)을 길게 누르도록 유도하는 내용을 포함할 수 있다. 다만, 다른 예의 경우 단순히 스마트 음향 모드를 추천하는 내용 예를 들어, "현재 스마트 음향 모드 설정을 추천합니다" 만을 포함할 수도 있다. 경우에 따라 해당 가이드는 음성으로 제공되는 것도 가능하다.
한편, 디스플레이된 UI는 가이드한 사용자 조작(예를 들어, 볼륨 버튼을 길게 누르는 조작)이 기설정된 시간 이내에 입력되지 않는 경우 자동으로 사라질 수 있다. 또는, 해당 조작이 아닌 다른 조작(예를 들어 채널 버튼을 누르는 조작)이 있는 경우 자동으로 사라질 수 있다.
한편, 상술한 실시 예들에서도 사용자의 특정 조작이 있는 경우 스마트 음향 모드 설정과 관련된 UI를 제공하는 것으로 설명하였지만, 다른 실시 예에 따르면, 사용자의 특정 조작이 없더라도 음향 컨텐츠의 분석 만으로 스마트 음향 모드가 적합하다고 판단되면 해당 UI를 자동으로 제공하는 것도 가능하다.
도 10a 및 도 10b는 본 발명의 또 다른 실시 예에 따른 스마트 음향 모드를 설정하기 위한 UI 화면을 나타내는 도면이다.
도 10a에 도시된 바와 같이 전자 장치(100)는 사용자의 시청 도중 적절한 시점에 스마트 음향 설정(1011)를 제공할 수 있다. 예를 들어, 도 10a에 도시된 바와 같이 사용자가 원격 제어 장치(10)의 특정 버튼(예를 들어 볼륨 버튼)을 누르는 순간에 화면(1010) 상에 스마트 음향 모드를 선택할 수 있는 UI(1011)를 제공할 수 있다. 또는, 사용자의 조작이 없더라도 음향 컨텐츠 분석에 따라 적절한 시점에 스마트 음향 모드를 선택할 수 있는 UI(1011)를 제공할 수 있다.
이 경우, 해당 UI(1011)는 선택 가능하도록 디스플레이될 수 있으며, 해당 UI(1011)가 선택되면(예를 들어 선택 버튼(OK 버튼)의 누름 조작되면), 스마트 음향 모드로 진입하게 된다. 예를 들어, 해당 UI(1011)는 활성화 상태에서 사용자 선택에 의해 비활성화되어 스마트 음향 모드로 진입하고, 해당 UI(1011)는 사용자 선택 여부와 관계없이 기설정된 임계 시간 경과 후 화면 상에서 사라지도록 구현될 수 있다.
또는, 도 10b에 도시된 바와 같이 스마트 음향 효과에 대한 사용자의 선호도를 반영할 수 있는 UI 화면을 제공할 수 있다.
도 10b에 도시된 바와 같이 전자 장치(100)는 사용자의 시청 도중 적절한 시점에 스마트 음향 효과를 사용자가 조정할 수 있는 UI(1012)를 제공할 수 있다. 예를 들어, 전자 장치(100)는 원격 제어 장치(10)에 구비된 특정 버튼(예를 들어, 볼륨 조작이나 채널 변경 버튼)이 누름 조작되는 경우에 스마트 음향 효과를 조정할 수 있는 UI를 제공하여 사용자의 설정을 유도할 수 있다. 예를 들어, 클리어 보이스를 강조할 지, 와이드 스테레오 효과를 강조할 지 사용자 선택할 수 있는 UI를 제공할 수 있다.
예를 들어, 도 10b에 도시된 바와 같이 사용자가 원격 제어 장치(10)의 특정 버튼(예를 들어 볼륨 버튼)을 누르는 순간에 화면(1010) 상에 스마트 음향 효과 조정 UI(1012)를 제공할 수 있다. 이 경우 볼륨 버튼의 UP/DOWN 조작에 따라 스마트 음향 효과가 조정될 수 있다. 즉, 도시된 바와 같이 UP 방향 볼륨 버튼이 조작되면, 음성 명료도를 더욱 강화하고 DOWN 방향 볼륨 버튼이 조작되면 스테레오감을 더욱 강화하도록 스마트 음향 효과가 조정될 수 있다.
한편, 원격 제어 장치(10)에 구비된 버튼은 다양한 형태로 구현될 수 있으며, 구현 형태에 따라 다양한 형태의 조작에 기초하여 스마트 음향 효과가 조정될 수 있다. 예를 들어, 도 10c에 도시된 바와 같이 원격 제어 장치(10)에 구비된 볼륨 버튼(11)이 누름 조작가능하며, 상하에 기설정된 이동 공간을 가지는 홀 상에 마련되어 상하 공간으로 물리적으로 이동 가능한 형태로 구현되는 경우 사용자는 볼륨 버튼(11)을 누름 조작한 상태에서 상/하 방향으로 이동시켜 즉, 홀드 업/다운(hold up/down)하여 스마트 음향 효과를 조정할 수 있다. 일 예로, 볼륨 버튼(11)이 홀드 업 조작되면 음성 명료도를 더욱 강화하고 홀드 다운 조작되면 스테레오감을 더욱 강화하도록 스마트 음향 효과가 조정될 수 있다.
다른 실시 예에 따르면, 본 발명의 스마트 음향 모드를 선택하기 위한 버튼이 별도로 마련될 수 있다. 이 경우, 해당 버튼의 조작 형태에 따라 스마트 음향 모드가 선택되거나, 해제될 수 있다. 예를 들어, 도 10a에 도시된 바와 같은 스마트 음향 설정 UI(1011)가 제공된 상태에서 해당 버튼을 짧게 누름 조작하면, 스마트 음향 모드로 진입하고, 길게 누름 조작하면 스마트 음향 모드가 해제될 수 있다. 다만, 스마트 음향 설정 UI(1011)는 음성 형태도 제공될 수 있다.
또는, 조작 형태와 관계없이 현재 모드에 기초하여 스마트 음향 모드가 선택되거나, 해제될 수 있다. 예를 들어, 도 10a에 도시된 바와 같은 스마트 음향 설정 UI(1011)가 제공된 상태에서 해당 버튼을 누름 조작하면, 스마트 음향 모드 상태에서 해당 버튼이 누름 조작하면 스마트 음향 모드가 해제될 수 있다.
또는, 해당 버튼을 짧게 누름 조작하면 스마트 음향 모드로 진입하면, 원격 제어 장치(10)에 마련된 버튼들의 기능이 스마트 음향 모드에 대응되도록 재맵핑될 수도 있다. 예를 들어, 스마트 음향 모드 진입 후, 상/하 방향 버튼(또는 좌/우 방향 버튼) 스마트 음향 효과의 레벨을 조정하기 위한 기능이 맵핑될 수 있다. 이에 따라 상측 방향 버튼을 누름조작하면 스마트 음향 효과가 강해지고, 하측 방향 버튼을 누름 조작하면 스마트 음향 효과가 약해질 수 있다.
또는, 상/하 버튼 및 좌/우 방향 버튼에는 상이한 스마트 음향 기능이 맵핑되는 것도 가능하다. 예를 들어, 상/하 방향 버튼에는 음성 강조 기능이 맵핑되어, 상측 방향 버튼을 누름조작하면 음성 강조 효과가 강해지고 하측 방향 버튼을 누름 조작하면 음성 강조 효과가 약해질 수 있다. 또한, 좌/우 방향 버튼에는 효과음(또는 음장감) 강조 기능이 맵핑되어, 우측 방향 버튼을 누름 조작하면 음장감 강조 효과가 강해지고 죄측 방향 버튼을 누름 조작하면 음장감 강조 효과가 약해질 수 있다.
또 다른 실시 예에 따르면, 스마트 음향 효과를 조정할 수 있는 버튼이 별도로 마련될 수 있으며, 예를 들어, 도 10c에 도시된 바와 같은 볼륨 버튼의 형태로 구현될 수 있다. 이 경우, 사용자가 해당 버튼(11)을 누름 조작하면 스마트 음향 모드로 진입하고, 키를 누른 상태에서 상측 방향으로 이동(hold/up)시키면 스마트 음향 효과가 강해지고, 하측 방향으로 이동(hold/down)시키면 스마트 음향 효과가 약해질 수 있다. 또한, 해당 버튼(11)을 길게 누름 조작하면 스마트 음향 모드가 해제될 수 있다.
또 다른 실시 예에 따르면, 스마트 음향 효과를 조정할 수 있는 버튼이 별도로 마련될 수 있으며, 사용자는 해당 버튼의 누름 조작을 통해 스마트 음향 효과를 제공하기 위한 파라미터를 직접 설정할 수도 있다.
예를 들어, 사용자가 스마트 음향 모드로 진입하기 위하여 해당 버튼을 짧게 누름 조작하는 경우, 스마트 음향 모드로 진입하고 이 경우 스마트 음향 효과를 제공하기 위한 복수의 파라미터 셋팅 값 중 최우선 순위로 저장된 셋팅 값 세트에 의해 스마트 음향 효과가 제공될 수 있다.
이어서, 사용자가 해당 버튼을 재차 누름 조작하면, 스마트 음향 효과를 제공하기 위한 파라미터 셋팅 값 세트의 우선 순위가 변경되어 저장될 수 있다. 예를 들어, 전자 장치(100)는 다양한 음향 효과를 제공하기 위한 파라미터 셋팅 값들을 포함하는 복수의 셋팅값 세트를 저장하고 있을 수 있다. 복수의 셋팅값 세트는 음성을 다양한 단계로 강조하거나, 음장감을 다양한 단계로 강조하기 위한 파라미터 셋팅값들을 포함할 수 있다.
이 경우, 전자 장치(100)는 해당 버튼이 누름 조작될 때마다, 셋팅값 세트의 우선 순위를 변경하고, 변경된 우선 순위에 기초하여 최우선 순위의 셋팅 값 세트에 기초하여 스마트 음향 효과를 제공할 수 있다. 즉, 사용자는 현재 제공되는 스마트 음향 효과가 만족스럽지 못한 경우 해당 버튼을 누름 조작하여 스마트 음향 효과를 조정할 수 있으며, 자신이 원하는 스마트 음향 효과가 제공되면 해당 버튼의 누름 조작을 중지할 수 있다. 이에 따라 사용자는 하나의 버튼 만으로 자신이 원하는 스마트 음향 효과를 제공받을 수 있게 된다.
한편, 전자 장치(100)는 추후에 스마트 음향 모드에 진입하면 스마트 음향 효과에 대응되는 파라미터 셋팅값 세트에 기초하여 스마트 음향 효과를 제공할 수 있다.
또 다른 실시 예에 따르면, 스마트 음향 효과를 조정할 수 있는 버튼이 별도로 마련될 수 있으며, 사용자는 해당 버튼의 누름 조작을 통해 스마트 음향 효과를 제공하기 위한 파라미터를 직접 설정할 수 있는 UI를 제공받을 수도 있다.
예를 들어, 사용자가 스마트 음향 모드로 진입하기 위하여 해당 버튼을 짧게 누름 조작하는 경우, 도 10d에 도시된 바와 같이 다양한 스마트 음향 효과에 대응되는 수 개의 선택 메뉴를 포함하는 UI 화면(1013)이 제공될 수 있다. 일 예로써, 음성을 더 강조하기 위한 "more Clear Voice" 메뉴(1013-1) 및 "more Wide Stereo" 메뉴(1013-2)를 포함하는 UI 화면(1313)이 제공될 수 있다. 이 경우, 사용자는 원격 제어 장치(100)에 별도로 마련된 방향 버튼을 통해 두 개의 메뉴를 네비게이팅하고, 선택 버튼(예를 들어 OK 버튼 또는 상술한 해당 버튼)을 통해 특정 메뉴를 선택할 수 있다. 또는 해당 버튼의 누름 조작 횟수에 기초하여 특정 메뉴가 선택되거나, 숫자 버튼에 의해 특정 메뉴가 선택될 수 있다. 예를 들어 해당 버튼을 한번 누름 조작하면 1번 메뉴(1013-1)가 선택되고, 두번 누름 조작하면 2번 메뉴(1013-2)가 선택될 수 있다. 또한, 1번 숫자 버튼을 누름 조작하면 1번 메뉴(1013-1)가 선택되고, 2번 숫자 버튼을 누름 조작하면 2번 메뉴(1013-2)가 선택될 수 있다.
이 경우, 특정 메뉴가 선택되면, 해당 메뉴에 대응되는 기능이 수행되거나, 해당 메뉴의 서브 메뉴가 제공될 수 있다. 예를 들어, "more Clear Voice" 메뉴(1013-1)가 선택되면, 음성을 좀더 강조하는 스마트 음향 효과를 제공하거나, 복수의 음성 강조 레벨을 포함하는 서브 메뉴를 제공하여 사용자가 복수의 음성 강조 레벨 중 원하는 레벨을 선택하도록 할 수 있다.
또는, 커서(또는 하이라이트)가 특정 메뉴에 위치된 상태에서 해당 버튼의 누름 조작 횟수에 기초하여 대응되는 스마트 음향 효과의 레벨을 선택할 수 있다. 예를 들어, 커서(또는 하이라이트)가 "more Clear Voice" 메뉴(1013-1) 상에 위치된 상태에서 해당 버튼이 짧게 누름 조작되는 횟수에 기초하여 음성 강조 레벨이 선택될 수 있다. 예를 들어, 한번 누름 조작되면, 제1 레벨 만큼 음성을 강조하는 파라미터 셋팅값 세트에 기초하여 스마트 음향 효과를 제공하고, 두번 누름 조작되면 제2 레벨 만큼 음성을 강조하는 파라미터 셋팅값 세트에 기초하여 스마트 음향 효과를 제공할 수 있다.
한편, 상술한 다양한 실시 예들은 다양한 형태로 조합되어 새로운 실시 예를 제공할 수 있다. 예를 들어, 도 9에 도시된 실시 예에서 도 10c에 도시된 바와 같은 원격 제어 장치(10)가 이용되는 경우 해당 버튼(11)을 길게 누름 조작하여 스마트 음향 모드를 추천하는 UI(911)가 화면 상에서 사라지도록 할 수 있다.
또한, 상술한 실시 예들에서는 원격 제어 장치(100)를 통해 전자 장치(100)를 제어하는 경우에 대해 설명하였지만, 전자 장치(100) 자체에 구비된 버튼에 의해서도 해당 실시 예들이 적용될 수 있음은 물론이다. 예를 들어, 전자 장치(100)에 마련된 특정 버튼을 짧게 누름 조작하여 스마트 음향 모드로 진입하거나, 해당 버튼을 길게 누름 조적하여 스마트 음향 모드를 해제할 수 있다.
도 11은 본 발명의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 흐름도이다.
도 11에 도시된 스마트 음향 모드를 제공하는 전자 장치의 제어 방법에 따르면, 기설정된 이벤트가 발생되면(S1110:Y), 스마트 음향 모드 진입을 가이드 하는 UI를 제공한다(S1120). 여기서, 기설정된 이벤트는, 도 8 내지 도 10b에서 설명한 바와 같이 전자 장치(100)를 제어하는 원격 제어 장치 상에 구비된 기설정된 버튼이 누름 조작되는 이벤트, 전자 장치(100)에 구비된 기설정된 버튼이 누름 조작되는 이벤트 및 스마트 음향 모드를 적용하기에 적합한 음향 부분이 출력되는 이벤트 중 적어도 하나를 포함할 수 있다. 또한, 가이드 UI는 오디오로 제공되거나, 디스플레이(도7, 140)를 통해 디스플레이되는 형태로 제공될 수 있다. 가이드 UI가 디스플레이(140)를 통해 제공되는 경우 도 8 내지 도 10b에서 설명한 다양한 형태의 UI로 제공될 수 있다.
이어서, 사용자 명령에 따라 스마트 음향 모드가 선택되면(S1130:Y), 음향 신호를 구성하는 복수의 채널 간의 공통 성분인 제1 음향 신호에서의 음성 검출 여부 및 복수의 채널 간의 차이 성분인 제2 음향 신호에서의 효과음 검출 여부에 기초하여 제1 음향 신호 및 제2 음향 신호를 개별적으로 렌더링한다(S1140).
이 후, 렌더링된 제1 및 제2 음향 신호를 멀티 채널 음향 신호로 믹싱하고, 멀티 채널 음향 신호를 출력한다(S1150).
또한, S1140의 렌더링 단계에서는, 제1 음향 신호에서 기설정된 구간(이하 검출 구간) 단위로 주파수 변화량을 확인하여 각 검출 구간에서의 음성 존재 여부를 검출하고, 제2 음향 신호에서 기설정된 검출 구간 단위로 주파수 변화량을 확인하여 효과음 존재 여부를 검출할 수 있다.
또한, S1140의 렌더링 단계에서는, 제1 음향 신호의 각 검출 구간에서 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 음성이 존재하는 것으로 검출하고, 제2 음향 신호의 각 검출 구간에서 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 효과음이 존재하는 것으로 검출할 수 있다.
또한, S1140의 렌더링 단계에서는, 제1 음향 신호의 각 검출 구간에서의 음성 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 음성 강조 필터에 가중치를 적용하여 제1 음향 신호를 렌더링하고, 제2 음향 신호의 각 검출 구간에서의 효과음 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 효과음 강조 필터에 가중치를 적용하여 제1 음향 신호를 렌더링할 수 있다.
또한, S1140의 렌더링 단계에서는, 제1 음향 신호의 각 검출 구간에서의 음성 검출 여부에 기초하여 기설정된 렌더링 단위 구간 별로 적용되는 파라미터를 업데이트하여 제1 음향 신호를 렌더링하고, 제2 음향 신호의 각 검출 구간에서의 효과음 검출 여부에 기초하여 기설정된 렌더링 단위 구간 별로 적용되는 파라미터를 업데이트하여 제2 음향 신호를 렌더링할 수 있다.
또한, S1140의 렌더링 단계에서는, 전자 장치의 기기 세팅 정보, 시청 환경 정보, 이용 히스토리 정보 및 음향 컨텐츠 관련 부가 정보 중 적어도 하나에 기초하여, 제1 음향 신호 및 제2 음향 신호 중 적어도 하나에 적용되는 필터의 가중치를 조정할 수 있다.
또한, 상기 제어 방법은, 제1 음향 신호 및 제2 음향 신호 중 적어도 하나에 음악적 요소가 존재하는 것으로 판단되면, 음악 강조 필터에 기설정된 가중치를 적용하여 제1 음향 신호 및 제2 음향 신호 중 적어도 하나를 렌더링하는 단계를 더 포함할 수 있다.
또한, 음향 신호는, 2 채널 스테레오 신호이며, S1120의 분리하는 단계에서는, 2 채널 스테레오 신호를, 2 채널 스테레오 신호 간 공통된 성분인 센터(center) 신호 및 차이 성분인 앰비언트(ambient) 신호를 분리하고, S1130의 렌더링 하는 단계는, 센터 신호에서의 음성 검출 여부 및 효과음 신호에서의 효과음 검출 여부에 기초하여 센터음 신호 및 앰비언트 신호를 개별적으로 렌더링할 수 있다.
본 발명의 다양한 실시 예에 따르면, 컨텐츠의 음향 신호를 센터 신호 및 앰비언트 신호로 분리하여 각각의 신호 특성에 기초하여 렌더링함으로써, 음성은 보다 명료하게 하고 효과음에 대해서는 보다 넓은 음장감을 제공할 수 있게 된다.
또한, 기설정된 음향 구간 단위로 실시간 렌더링을 수행하여 컨텐츠의 각 음향 구간에 적합한 음향 렌더링을 수행할 수 있으므로, 보다 스마트한 음향 효과를 제공할 수 있게 된다.
또한, 다양한 부가 정보에 기초하여 컨텐츠의 음향을 렌더링함으로써 사용자 컨텍스트에 최적인 음향 렌더링을 수행함으로써 보다 스마트한 음향 효과를 제공할 수 있게 된다.
한편, 상술한 본 발명의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치에 대한 소프트웨어 업그레이드, 또는 하드웨어 업그레이드 만으로도 구현될 수 있다.
또한, 상술한 본 발명의 다양한 실시 예들은 전자 장치에 구비된 임베디드 서버, 또는 전자 장치 외부의 서버를 통해 수행되는 것도 가능하다.
또한, 본 발명에 따른 제어 방법을 순차적으로 수행하는 프로그램이 저장된 비일시적 판독 가능 매체(non-transitory computer readable medium)가 제공될 수 있다.
일 예로, 음향 신호를, 음향 신호를 구성하는 복수의 채널 간의 공통 성분인 제1 음향 신호 및 복수의 채널 간의 차이 성분인 제2 음향 신호로 분리하는 단계, 제1 음향 신호에서의 음성 검출 여부 및 제2 음향 신호에서의 효과음 검출 여부에 기초하여 제1 음향 신호 및 제2 음향 신호를 개별적으로 렌더링하는 단계 및, 렌더링된 제1 및 제2 음향 신호를 멀티 채널 음향 신호로 믹싱하고, 멀티 채널 음향 신호를 출력하는 단계를 수행하는 프로그램이 저장된 비일시적 판독 가능 매체(non-transitory computer readable medium)가 제공될 수 있다.
비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
105: 사용자 입력부 110: 입력부
120: 프로세서 130: 출력부

Claims (20)

  1. 스마트 음향 모드를 제공하는 전자 장치에 있어서,
    사용자 명령을 입력받는 사용자 입력부;
    음향 신호를 입력받는 입력부;
    기설정된 이벤트가 발생되면 스마트 음향 모드 설정을 가이드하는 UI를 제공하고,
    상기 사용자 명령에 따라 상기 스마트 음향 모드가 선택되면 상기 음향 신호를 구성하는 복수의 채널 간의 공통 성분인 제1 음향 신호의 주파수 변화에 기초하여 상기 제1 음향 신호에서의 음성 검출 여부를 식별하고, 상기 복수의 채널 간의 차이 성분인 제2 음향 신호의 주파수 변화에 기초하여 상기 제2 음향 신호에서의 효과음 검출 여부를 식별하며,
    상기 제1 음향 신호에서의 음성 검출 여부에 기초하여 상기 제1 음향 신호를 렌더링하고, 상기 제2 음향 신호에서의 효과음 검출 여부에 기초하여 상기 제2 음향 신호를 렌더링하고,
    상기 렌더링된 제1 및 제2 음향 신호를 멀티 채널 음향 신호로 믹싱하는 프로세서; 및
    상기 멀티 채널 음향 신호를 출력하는 출력부;를 포함하며,
    상기 프로세서는,
    상기 제1 음향 신호의 복수의 구간에서 기설정된 제1 간격으로 상기 음성의 존재 여부를 식별하며, 상기 음성이 존재하는 것으로 기설정된 횟수 이상 식별되면 상기 기설정된 제1 간격을 증가시키고,
    상기 제2 음향 신호의 복수의 구간에서 기설정된 제2 간격으로 상기 효과음의 존재 여부를 식별하며, 상기 효과음이 존재하는 것으로 상기 기설정된 횟수 이상 식별되면 상기 기설정된 제2 간격을 증가시키는, 전자 장치.
  2. 삭제
  3. 제1항에 있어서,
    상기 프로세서는,
    상기 제1 음향 신호의 각 구간에서 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 상기 음성이 존재하는 것으로 검출하고,
    상기 제2 음향 신호의 각 구간에서 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 상기 효과음이 존재하는 것으로 검출하는, 전자 장치.
  4. 제1항에 있어서,
    상기 프로세서는,
    상기 제1 음향 신호의 각 구간에서의 음성 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 음성 강조 필터에 가중치를 적용하여 상기 제1 음향 신호를 렌더링하고,
    상기 제2 음향 신호의 각 구간에서의 효과음 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 효과음 강조 필터에 가중치를 적용하여 상기 제2 음향 신호를 렌더링하는, 전자 장치.
  5. 제4항에 있어서,
    상기 프로세서는,
    상기 제1 음향 신호의 각 구간에서의 음성 검출 여부에 기초하여 상기 기설정된 렌더링 단위 구간 별로 적용되는 파라미터를 업데이트하여 상기 제1 음향 신호를 렌더링하고,
    상기 제2 음향 신호의 각 구간에서의 효과음 검출 여부에 기초하여 상기 기설정된 렌더링 단위 구간 별로 적용되는 파라미터를 업데이트하여 상기 제2 음향 신호를 렌더링하는, 전자 장치.
  6. 제4항에 있어서,
    상기 프로세서는,
    상기 전자 장치의 기기 세팅 정보, 시청 환경 정보, 이용 히스토리 정보 및 음향 컨텐츠 관련 부가 정보 중 적어도 하나에 기초하여, 상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나에 적용되는 필터의 가중치를 조정하는, 전자 장치.
  7. 제1항에 있어서,
    상기 프로세서는,
    상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나에 음악적 요소가 존재하는 것으로 판단되면, 음악 강조 필터에 기설정된 가중치를 적용하여 상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나를 렌더링하는, 전자 장치.
  8. 제1항에 있어서,
    상기 음향 신호는 2 채널 스테레오 신호이며,
    상기 프로세서는,
    상기 2 채널 스테레오 신호를, 상기 2 채널 스테레오 신호 간 공통된 성분인 센터(center) 신호 및 차이 성분인 앰비언트(ambient) 신호를 분리하고, 상기 센터 신호에서의 음성 검출 여부 및 상기 앰비언트 신호에서의 효과음 검출 여부에 기초하여 상기 센터 신호 및 상기 앰비언트 신호를 개별적으로 렌더링하는, 전자 장치.
  9. 제1항에 있어서,
    디스플레이;를 더 포함하며,
    상기 프로세서는,
    상기 기설정된 이벤트가 발생되면, 상기 스마트 음향 모드로 진입 가능한 UI 및 스마트 음향 효과를 조정하기 위한 UI 중 적어도 하나를 상기 디스플레이를 통해 제공하는, 전자 장치.
  10. 제9항에 있어서,
    상기 기설정된 이벤트는,
    상기 전자 장치를 제어하는 원격 제어 장치 상에 구비된 기 설정된 버튼이 누름 조작되는 이벤트 및 상기 스마트 음향 모드를 적용하기에 적합한 음향 부분이 출력되는 이벤트 중 적어도 하나를 포함하는, 전자 장치.
  11. 스마트 음향 모드를 제공하는 전자 장치의 제어 방법에 있어서,
    음향 신호를 입력받는 단계;
    기설정된 이벤트가 발생되면 스마트 음향 모드 설정을 가이드하는 UI를 제공하는 단계;
    사용자 명령에 따라 상기 스마트 음향 모드가 선택되면 상기 음향 신호를 구성하는 복수의 채널 간의 공통 성분인 제1 음향 신호의 주파수 변화에 기초하여 상기 제1 음향 신호에서의 음성 검출 여부를 식별하고, 상기 복수의 채널 간의 차이 성분인 제2 음향 신호의 주파수 변화에 기초하여 상기 제2 음향 신호에서의 효과음 검출 여부를 식별하는 단계;
    상기 제1 음향 신호에서의 음성 검출 여부에 기초하여 상기 제1 음향 신호를 렌더링하고, 상기 제2 음향 신호에서의 효과음 검출 여부에 기초하여 상기 제2 음향 신호를 렌더링하는 단계; 및
    상기 렌더링된 제1 및 제2 음향 신호를 멀티 채널 음향 신호로 믹싱하고, 상기 멀티 채널 음향 신호를 출력하는 단계;를 포함하며,
    상기 식별하는 단계는,
    상기 제1 음향 신호의 복수의 구간에서 기설정된 제1 간격으로 상기 음성의 존재 여부를 식별하며, 상기 음성이 존재하는 것으로 기설정된 횟수 이상 식별되면 상기 기설정된 제1 간격을 증가시키고,
    상기 제2 음향 신호의 복수의 구간에서 기설정된 제2 간격으로 상기 효과음의 존재 여부를 식별하며, 상기 효과음이 존재하는 것으로 상기 기설정된 횟수 이상 식별되면 상기 기설정된 제2 간격을 증가시키는 제어 방법.
  12. 삭제
  13. ◈청구항 13은(는) 설정등록료 납부시 포기되었습니다.◈
    제11항에 있어서,
    상기 렌더링하는 단계는,
    상기 제1 음향 신호의 각 구간에서 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 상기 음성이 존재하는 것으로 검출하고,
    상기 제2 음향 신호의 각 구간에서 크기 변화량이 임계값 이상인 주파수 개수가 임계 개수 이상이면 해당 구간에 상기 효과음이 존재하는 것으로 검출하는, 제어 방법.
  14. ◈청구항 14은(는) 설정등록료 납부시 포기되었습니다.◈
    제11항에 있어서,
    상기 렌더링하는 단계는,
    상기 제1 음향 신호의 각 구간에서의 음성 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 음성 강조 필터에 가중치를 적용하여 상기 제1 음향 신호를 렌더링하고,
    상기 제2 음향 신호의 각 구간에서의 효과음 검출 여부에 기초하여 기설정된 렌더링 단위 구간에서 효과음 강조 필터에 가중치를 적용하여 상기 제2 음향 신호를 렌더링하는, 제어 방법.
  15. ◈청구항 15은(는) 설정등록료 납부시 포기되었습니다.◈
    제14항에 있어서,
    상기 렌더링하는 단계는,
    상기 제1 음향 신호의 각 구간에서의 음성 검출 여부에 기초하여 상기 기설정된 렌더링 단위 구간 별로 적용되는 파라미터를 업데이트하여 상기 제1 음향 신호를 렌더링하고,
    상기 제2 음향 신호의 각 구간에서의 효과음 검출 여부에 기초하여 상기 기설정된 렌더링 단위 구간 별로 적용되는 파라미터를 업데이트하여 상기 제2 음향 신호를 렌더링하는, 제어 방법.
  16. ◈청구항 16은(는) 설정등록료 납부시 포기되었습니다.◈
    제14항에 있어서,
    상기 렌더링하는 단계는,
    상기 전자 장치의 기기 세팅 정보, 시청 환경 정보, 이용 히스토리 정보 및 음향 컨텐츠 관련 부가 정보 중 적어도 하나에 기초하여, 상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나에 적용되는 필터의 가중치를 조정하는, 제어 방법.
  17. ◈청구항 17은(는) 설정등록료 납부시 포기되었습니다.◈
    제11항에 있어서,
    상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나에 음악적 요소가 존재하는 것으로 판단되면, 음악 강조 필터에 기설정된 가중치를 적용하여 상기 제1 음향 신호 및 상기 제2 음향 신호 중 적어도 하나를 렌더링하는 단계;를 더 포함하는, 제어 방법.
  18. ◈청구항 18은(는) 설정등록료 납부시 포기되었습니다.◈
    제11항에 있어서,
    상기 음향 신호는, 2 채널 스테레오 신호이며,
    상기 제어 방법은,
    상기 2 채널 스테레오 신호를, 상기 2 채널 스테레오 신호 간 공통된 성분인 센터(center) 신호 및 차이 성분인 앰비언트(ambient) 신호를 분리하는 단계;를 더 포함하고,
    상기 렌더링하는 단계는, 상기 센터 신호에서의 음성 검출 여부 및 상기 앰비언트 신호에서의 효과음 검출 여부에 기초하여 상기 센터 신호 및 상기 앰비언트 신호를 개별적으로 렌더링하는, 제어 방법.
  19. ◈청구항 19은(는) 설정등록료 납부시 포기되었습니다.◈
    제11항에 있어서,
    상기 기설정된 이벤트가 발생되면, 상기 스마트 음향 모드로 진입 가능한 UI 및 스마트 음향 효과를 조정하기 위한 UI 중 적어도 하나를 제공하는 단계;를 더 포함하는, 제어 방법.
  20. ◈청구항 20은(는) 설정등록료 납부시 포기되었습니다.◈
    제19항에 있어서,
    상기 기설정된 이벤트는,
    상기 전자 장치를 제어하는 원격 제어 장치 상에 구비된 기 설정된 버튼이 누름 조작되는 이벤트 및 상기 스마트 음향 모드를 적용하기에 적합한 음향 부분이 출력되는 이벤트 중 적어도 하나를 포함하는, 제어 방법.



KR1020160122050A 2016-09-23 2016-09-23 전자 장치 및 그 제어 방법 KR102614577B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020160122050A KR102614577B1 (ko) 2016-09-23 2016-09-23 전자 장치 및 그 제어 방법
PCT/KR2017/009942 WO2018056624A1 (en) 2016-09-23 2017-09-11 Electronic device and control method thereof
CN201780057932.1A CN109716780B (zh) 2016-09-23 2017-09-11 电子设备及其控制方法
EP17191341.1A EP3300077A1 (en) 2016-09-23 2017-09-15 Electronic device and control method thereof
US15/708,396 US10362433B2 (en) 2016-09-23 2017-09-19 Electronic device and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160122050A KR102614577B1 (ko) 2016-09-23 2016-09-23 전자 장치 및 그 제어 방법

Publications (2)

Publication Number Publication Date
KR20180032860A KR20180032860A (ko) 2018-04-02
KR102614577B1 true KR102614577B1 (ko) 2023-12-18

Family

ID=59997058

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160122050A KR102614577B1 (ko) 2016-09-23 2016-09-23 전자 장치 및 그 제어 방법

Country Status (5)

Country Link
US (1) US10362433B2 (ko)
EP (1) EP3300077A1 (ko)
KR (1) KR102614577B1 (ko)
CN (1) CN109716780B (ko)
WO (1) WO2018056624A1 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106303897A (zh) * 2015-06-01 2017-01-04 杜比实验室特许公司 处理基于对象的音频信号
WO2018119903A1 (zh) * 2016-12-29 2018-07-05 华为技术有限公司 多媒体数据播放方法及终端设备
CN111326172A (zh) * 2018-12-17 2020-06-23 北京嘀嘀无限科技发展有限公司 冲突检测方法、装置、电子设备及可读存储介质
CN109682676A (zh) * 2018-12-29 2019-04-26 上海工程技术大学 一种纤维拉伸断裂的声发射信号的特征提取方法
CN111641863A (zh) * 2019-03-01 2020-09-08 深圳Tcl新技术有限公司 一种环绕声的播放控制方法、系统、装置及存储介质
WO2021010562A1 (en) * 2019-07-15 2021-01-21 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof
KR20210008788A (ko) 2019-07-15 2021-01-25 삼성전자주식회사 전자 장치 및 그 제어 방법
US10805665B1 (en) * 2019-12-13 2020-10-13 Bank Of America Corporation Synchronizing text-to-audio with interactive videos in the video framework
CN112740708B (zh) * 2020-05-21 2022-07-22 华为技术有限公司 一种音频数据传输方法及相关装置
CN113727240A (zh) * 2020-05-26 2021-11-30 南宁富桂精密工业有限公司 声音播放调整方法及可携式装置
CN112351290A (zh) * 2020-09-08 2021-02-09 深圳Tcl新技术有限公司 智能设备的视频录制方法、装置、设备及可读存储介质
CN114257924A (zh) * 2020-09-24 2022-03-29 华为技术有限公司 一种分配声道的方法及相关设备
CN112466057B (zh) * 2020-12-01 2022-07-29 上海旷日网络科技有限公司 基于人脸识别和语音识别的交互式认证取件系统
CN113422992B (zh) * 2021-06-17 2023-03-21 歌尔股份有限公司 遥控器和电子系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03236691A (ja) * 1990-02-14 1991-10-22 Hitachi Ltd テレビジョン受信機用音声回路
KR940001861B1 (ko) * 1991-04-12 1994-03-09 삼성전자 주식회사 오디오 대역신호의 음성/음악 판별장치
JP3326201B2 (ja) * 1992-07-14 2002-09-17 株式会社パラマ・テック 血圧計及び脈波計における圧力降下速度制御装置
US6281749B1 (en) * 1997-06-17 2001-08-28 Srs Labs, Inc. Sound enhancement system
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US7412380B1 (en) * 2003-12-17 2008-08-12 Creative Technology Ltd. Ambience extraction and modification for enhancement and upmix of audio signals
JP5773124B2 (ja) 2008-04-21 2015-09-02 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
EP2249334A1 (en) 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
JP2011065093A (ja) 2009-09-18 2011-03-31 Toshiba Corp オーディオ信号補正装置及びオーディオ信号補正方法
KR101405976B1 (ko) 2010-01-06 2014-06-12 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
KR20150022476A (ko) * 2013-08-23 2015-03-04 삼성전자주식회사 디스플레이장치 및 그 제어방법
KR101537653B1 (ko) 2013-12-31 2015-07-17 서울대학교산학협력단 주파수 또는 시간적 상관관계를 반영한 잡음 제거 방법 및 시스템
KR102229156B1 (ko) 2014-03-05 2021-03-18 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 제어 방법
EP3175634B1 (en) * 2014-08-01 2021-01-06 Steven Jay Borne Audio device
CN106797525B (zh) * 2014-08-13 2019-05-28 三星电子株式会社 用于生成和回放音频信号的方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Wu, B., Ren, X., Liu, C. et al. A Novel Speech/Noise Discrimination Method for Embedded ASR System. EURASIP J. Adv. Signal Process. 2004, 951918 (2004). https://doi.org/10.1155/S111086570440225X*

Also Published As

Publication number Publication date
KR20180032860A (ko) 2018-04-02
US10362433B2 (en) 2019-07-23
EP3300077A1 (en) 2018-03-28
CN109716780A (zh) 2019-05-03
CN109716780B (zh) 2021-07-13
US20180091926A1 (en) 2018-03-29
WO2018056624A1 (en) 2018-03-29

Similar Documents

Publication Publication Date Title
KR102614577B1 (ko) 전자 장치 및 그 제어 방법
US10123140B2 (en) Dynamic calibration of an audio system
JP4913038B2 (ja) 音声レベル制御
US8452430B2 (en) Method and an apparatus for processing an audio signal
US8639368B2 (en) Method and an apparatus for processing an audio signal
JP5973058B2 (ja) レイアウト及びフォーマットに依存しない3dオーディオ再生のための方法及び装置
KR100913092B1 (ko) 믹스신호의 인터페이스 표시 방법 및 장치
JP2010515290A (ja) ダイアログエンハンスメント技術のコントローラ及びユーザインタフェース
KR101958664B1 (ko) 멀티미디어 콘텐츠 재생 시스템에서 다양한 오디오 환경을 제공하기 위한 장치 및 방법
KR20130016025A (ko) 음성 인식 및 모션 인식을 이용한 전자 장치의 제어 방법 및 이를 적용한 전자 장치
JP2011519223A (ja) オーディオ信号の処理方法及び装置
US20090262957A1 (en) Method and an apparatus for processing an audio signal
US8452030B2 (en) External equipment controlling apparatus
US10318234B2 (en) Display apparatus and controlling method thereof
US8340798B2 (en) Method and an apparatus for processing an audio signal
US10972849B2 (en) Electronic apparatus, control method thereof and computer program product using the same
US10992273B2 (en) Electronic device and operation method thereof
US20090265176A1 (en) Method and an apparatus for processing an audio signal
CN117896658A (zh) 一种终端设备及空间声场矫正方法
KR20150051073A (ko) 이미지에 워터마크를 삽입하기 위한 전자 장치 및 방법
CN115687684A (zh) 音频播放方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
AMND Amendment
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant