KR20080027987A - 음원 재생기에서의 이퀄라이저 조정 방법 및 그 시스템 - Google Patents

음원 재생기에서의 이퀄라이저 조정 방법 및 그 시스템 Download PDF

Info

Publication number
KR20080027987A
KR20080027987A KR1020060092858A KR20060092858A KR20080027987A KR 20080027987 A KR20080027987 A KR 20080027987A KR 1020060092858 A KR1020060092858 A KR 1020060092858A KR 20060092858 A KR20060092858 A KR 20060092858A KR 20080027987 A KR20080027987 A KR 20080027987A
Authority
KR
South Korea
Prior art keywords
music
equalizer
sound mode
mode
sound
Prior art date
Application number
KR1020060092858A
Other languages
English (en)
Other versions
KR100832360B1 (ko
Inventor
김형국
엄기완
쉬얀얀
주선
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020060092858A priority Critical patent/KR100832360B1/ko
Priority to US11/715,376 priority patent/US20080075303A1/en
Publication of KR20080027987A publication Critical patent/KR20080027987A/ko
Application granted granted Critical
Publication of KR100832360B1 publication Critical patent/KR100832360B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/005Tone control or bandwidth control in amplifiers of digital signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/02Analogue recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/12Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
    • G10H1/125Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/02Analogue recording or reproducing
    • G11B20/06Angle-modulation recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/046Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/075Musical metadata derived from musical analysis or for use in electrophonic musical instruments
    • G10H2240/081Genre classification, i.e. descriptive metadata for classification or selection of musical pieces according to style
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/131Mathematical functions for musical analysis, processing, synthesis or composition
    • G10H2250/215Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
    • G10H2250/235Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

본 발명은 연속적인 오디오 스트림으로부터 추출된 오디오 특징값을 이용하여 카테고리를 분류하고, 분류된 카테고리에 따라 이퀄라이저를 조정하기 위한 제1 사운드 모드를 인식하는 제1 사운드 모드 인식기와, 저장된 음악으로부터 추출된 하이라이트를 이용하여 각 음원의 장르를 분류하여 상기 이퀄라이저를 조정하기 위한 제2 사운드 모드를 인식하는 제2 사운드 모드 인식기 및 상기 제1 사운드 모드 또는 상기 제2 사운드 모드를 분석하여 조정할 사운드 모드를 선택하고, 선택된 사운드 모드에 따라 상기 이퀄라이저를 조정하는 이퀄라이저 조정기를 포함하는 것을 특징으로 하는 이퀄라이저 조정 시스템을 제공한다.
Figure P1020060092858
이퀄라이저, 조정, 오디오 특징값, 카테고리, 장르, 분류

Description

음원 재생기에서의 이퀄라이저 조정 방법 및 그 시스템{Method for controlling equalizer in digital media player and system thereof}
도 1은 본 발명의 일실시예에 따른 이퀄라이저 조정 시스템의 전체 구성도를 나타낸다.
도 2는 본 발명의 다른 실시예에 따른 이퀄라이저 조정 방법의 흐름을 나타내는 도면이다.
도 3은 본 발명의 또 다른 실시예에 따른 이퀄라이저 조정 방법의 흐름을 나타내는 도면이다.
도 4는 본 발명에 따른 오디오 특징값을 추출하는 특징 추출부의 구성의 일례를 나타내는 도면이다.
도 5는 본 발명에 따른 음악/비음악 분류부의 구성의 일례를 나타내는 도면이다.
도 6은 본 발명에 따른 음악 장르 분류부의 구성의 일례를 나타내는 도면이다.
도 7은 본 발명에 따른 사운드 모드의 주파수별 특성을 나타내는 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
100: 이퀄라이저 조정 시스템
110: 제1 사운드 모드 인식기 120: 제2 사운드 모드 인식기
130: 이퀄라이저 조정기
본 발명은 디지털 멀티미디어 재생기에서 이퀄라이저를 자동으로 조정하는 방법 및 그 시스템에 관한 것으로, 더욱 상세하게는 디지털 미디어 재생기에서 재생되는 음악의 장르를 분류하고 분류된 장르에 따라 이퀄라이저의 사운드 모드를 자동으로 조정하는 방법 및 그 시스템에 관한 것이다.
일반적으로 디지털 미디어 재생기는 MP3 플레이어, CD 플레이어, 자동차 스테레오, AM/FM/XM 방송 수신기 등이 포함되며, 음악의 특성에 맞도록 음악 소리를 줄이거나 키울 수 있도록 하는 장치인 이퀄라이저를 이용하여 음악을 청취하는 사용자의 감흥을 극대화시킬 수 있다. 상기 이퀄라이저는 각각의 주파수가 갖는 신호음의 크기(Level)을 조정하는 기능을 수행한다. 즉, 사용자가 어떤 음악을 청취하고 있을 때 특정 악기의 소리를 강조해서 듣고 싶다면 그 악기가 주로 재생하는 주파수 대역을 상기 이퀄라이저를 통해 다른 소리보다 크게 나올 수 있도록 조절할 수 있다. 한편, 사용자가 어떤 음악을 청취하고 있을 때 대조적으로 특정 악기의 소리를 줄여서 청취하고자 한다면 상기 이퀄라이저를 통해 다른 소리보다 상대적으로 작게 나올 수 있도록 조절할 수 있다.
대략적으로 인간이 청취할 수 있는 가청 주파수 대역은 대략 20Hz~20kHz이 며, 30Hz~90Hz 대역은 주로 베이스 드럼의 주파수 영역으로 제시될 수 있고, 80Hz~3kHz 대역은 베이스, 바리톤, 테너, 알토, 소프라노의 보컬(vocal) 영역과 바이올린, 기타, 피아노, 피콜로, 트럼펫, 플롯, 테너 섹스폰, 전자 오르간과 같은 악기의 주파수 대역으로 제시될 수 있으며, 2.5kHz~20kHz 대역은 피나온, 피콜로, 전자오르간, 심볼즈와 같은 악기의 주파수 대역으로 제시될 수 있다.
각 주파수의 특성에 따라 이퀄라이저를 조정하는 방법은 이하에서 예를 들어 구체적으로 설명하기로 한다.
일례로 사용자가 타악기인 드럼 소리 중 킥드럼 소리가 다른 악기의 소리보다 상대적으로 약하다고 느낀다면, 상기 킥드럼의 주파수 대역인 20Hz~80Hz의 대역 중 상기 킥드럼 소리의 주축을 이루는 주파수 대역을 상기 이퀄라이저를 통해 승압 조정함으로써 상기 킥드럼의 소리를 크게 조절할 수 있다. 이와 반대로 사용자가 심벌즈와 같은 고대역이 다소 강하다고 느낀다면, 4kHz~20kHz 대역 중 상기 심벌즈 소리의 주축을 이루고 있는 주파수 대역을 상기 이퀄라이저를 통해 감압 조정함으로써 상기 심벌즈의 소리를 작게 조절할 수 있다.
따라서, 디지털 미디어 재생기에서 재생되는 음악을 듣는 사용자는 각 주파수 대역을 수동으로 이퀄라이저를 조절하여 자신이 원하는 스타일로 음악을 들을 수 있다. 하지만 이러한 수동 이퀄라이저 조정 방식은 다양한 곡들에 대해 각 곡마다 수동으로 상기 이퀄라이저를 사용자가 직접 조정해야 하는 번거로움이 있으므로 사용자는 주로 하나의 주파수 대역에 고정해 놓고 음악을 청취하게 됨에 따라 디지털 미디어 재생기가 상기 이퀄라이저를 구비하고 있음에도 불구하고 상기 이퀄 라이저를 제대로 활용하지 못하는 문제점이 있다.
종래 디지털 미디어 재생기에서의 이퀄라이저 조정 방법은 일례로 각 음악 파일이 서브-코드(sub-code)로 인코딩되며, 음원 사업자에 의해 미리 정해진 음악 장르를 사용하여 상기 음악 파일에 따라 자동적으로 이퀄라이저를 수행한다.
종래 디지털 미디어 재생기에서의 이퀄라이저 조정 방법은 다른 일례로 평활 모드(equalization mode)가 오디오 플레이어의 사용자 인터페이스를 통해 사용자에 의해서 수동으로 조정되거나 인코딩된 음악 파일의 태그 정보를 이용하여 자동으로 선택된다.
종래 디지털 미디어 재생기에서의 이퀄라이저 조정 방법은 다른 일례로 디지털 라디오 방송의 프로그램 정보를 이용하여 이퀄라이저를 조정한다.
하지만 이와 같이 종래 이퀄라이저 조정 방법은 상기 음악 파일에 상기 음원 사업자에 의해 미리 정해진 음악 장르 정보, 음악 파일의 태그 정보 또는 프로그램 정보가 포함되지 않은 경우 자동적으로 이퀄라이저 조정 기능을 수행할 수 없는 문제점이 있다.
본 발명은 상기와 같은 종래기술의 문제점을 해결하기 위해 안출된 것으로서, 음원 재생기에서 재생되는 음악 신호를 분석하여 장르를 분류하고 분류된 장르에 기초하여 사운드 모드를 인식하고 인식된 사운드 모드에 따라 자동으로 이퀄라이저를 조정하는 방법 및 그 시스템을 제공하는 것을 목적으로 한다.
본 발명의 다른 목적은 음원 재생기에서 저장된 음악 장르에 따라 사용되는 악기의 주파수 대역이 다르다는 점을 이용하여 각 음악 장르에 따라 주파수 대역이 다르게 설정되도록 이퀄라이저를 조정하는 방법 및 그 시스템을 제공하는 것이다.
본 발명의 또 다른 목적은 음원 재생기에 저장된 음악의 하이라이트를 검출하고 검출된 하이라이트로부터 오디오 특징값을 추출하고, 추출된 오디오 특징값을 이용하여 음악의 장르를 분류하고, 분류된 음악의 장르에 따라 이퀄라이저를 자동으로 조정하는 방법 및 그 시스템을 제공하는 것이다.
본 발명의 또 다른 목적은 음원 재생기에서 재생되는 음원 또는 저장된 음원을 분석하여 음악의 장르를 분류하고, 분류된 음악의 장르에 따라 사운드 모드를 인식하고 인식된 사운드 모드에 따라 이퀄라이저를 자동으로 조정하는 방법 및 그 시스템을 제공하는 것이다.
상기의 목적을 이루고 종래기술의 문제점을 해결하기 위하여, 본 발명은 연속적인 오디오 스트림으로부터 추출된 오디오 특징값을 이용하여 카테고리를 분류하고, 분류된 카테고리에 따라 이퀄라이저를 조정하기 위한 제1 사운드 모드를 인식하는 제1 사운드 모드 인식기와, 저장된 음악으로부터 추출된 하이라이트를 이용하여 각 음원의 장르를 분류하여 상기 이퀄라이저를 조정하기 위한 제2 사운드 모드를 인식하는 제2 사운드 모드 인식기 및 상기 제1 사운드 모드 또는 상기 제2 사운드 모드를 분석하여 조정할 사운드 모드를 선택하고, 선택된 사운드 모드에 따라 상기 이퀄라이저를 조정하는 이퀄라이저 조정기를 포함하는 것을 특징으로 하는 이퀄라이저 조정 시스템을 제공한다.
본 발명의 다른 일측에 따르는 음원 재생기에서의 이퀄라이저 조정 방법은, 연속적인 오디오 스트림으로부터 추출된 오디오 특징값을 이용하여 음악/비음악으로 카테고리를 분류하고, 분류된 카테고리가 음악인 경우 상기 음악의 장르를 분류하고 분류된 장르에 따라 사운드 모드를 인식하는 단계 및 각 사운드 모드에 대응되는 이퀄라이저 모드를 미리 설정하고, 상기 인식된 사운드 모드에 대응되는 이퀄라이저 모드 설정에 따라 상기 이퀄라이저를 조정하는 단계를 포함한다.
본 발명의 또 다른 일측에 따르는 음원 재생기에서의 이퀄라이저 조정 방법은, 저장된 각 음악으로부터 하이라이트를 추출하고, 상기 추출된 하이라이트를 이용하여 상기 음악의 장르를 분류하고, 상기 분류된 음악의 장르에 따라 사운드 모드를 인식하는 단계 및 각 사운드 모드에 대응되는 이퀄라이저 모드를 미리 설정하고, 상기 인식된 사운드 모드에 대응되는 이퀄라이저 모드 설정에 따라 상기 이퀄라이저를 조정하는 단계를 포함한다.
본 발명의 또 다른 일측에 따르는 음원 재생기에서의 이퀄라이저 조정 방법은, 연속적인 오디오 스트림으로부터 추출된 오디오 특징값을 이용하여 음악/비음악으로 카테고리를 분류하고, 상기 분류된 카테고리에 기초하여 상기 이퀄라이저의 제1 사운드 모드를 인식하는 단계와, 상기 저장된 음악으로부터 추출된 하이라이트를 이용하여 상기 음악의 장르를 분류하여 상기 이퀄라이저의 제2 사운드 모드를 인식하는 단계 및 각 사운드 모드에 대응되는 이퀄라이저 모드를 미리 설정하고, 상기 제1 사운드 모드 또는 상기 제2 사운드 모드를 분석하여 사운드 모드를 선택하고, 상기 선택된 사운드 모드에 대응되는 상기 이퀄라이저 모드에 따라 상기 이 퀄라이저를 조정하는 단계를 포함한다.
이하에서는 첨부된 도면들을 참조하여 본 발명의 실시예에 따른 이퀄라이저 조정 시스템 및 그 방법을 상세히 설명한다.
도 1은 본 발명의 일실시예에 따른 이퀄라이저 조정 시스템의 전체 구성도를 나타낸다.
도 1을 참조하면, 이퀄라이저 조정 시스템(100)은 제1 사운드 모드 인식기(110), 제2 사운드 모드 인식기(120) 및 이퀄라이저 조정기(130)를 포함한다.
제1 사운드 모드 인식기(110)는 연속적인 오디오 스트림(continuous audio stream)으로부터 추출된 오디오 특징값을 이용하여 카테고리를 분류하고, 분류된 카테고리에 따라 이퀄라이저를 조정하기 위한 제1 사운드 모드를 인식한다. 제1 사운드 모드 인식기(110)는 음원 분할부(111), 제1 특징 추출부(112), 음악/비음악(music/non-music) 분류부(113), 상태 기록부(114) 및 제1 음악 장르 분류부(115)를 포함한다.
음원 분할부(111)는 MP3 플레이어(player), CD 플레이어, 라디오 리시버(radio receiver), 텔레비전, 카 스테레오 등과 같은 음원 제공 장치로부터 상기 연속적인 오디오 스트림을 제공받고, 상기 오디오 스트림을 정해진 시간 간격의 오디오 클립으로 분할한다. 즉, 음원 분할부(111)는 예를 들어 상기 연속적인 오디오 스트림인 30초 길이인 경우, 상기 오디오 스트림을 중첩하지 않고 '6초'간격으로 나누어 5개의 오디오 클립으로 분할할 수 있다.
제1 특징 추출부(112)는 상기 오디오 클립으로부터 오디오 특징값을 추출한 다. 이하 도 4를 참조하여 특징 추출부의 동작 및 구성을 보다 상세하게 설명한다.
도 4는 본 발명에 따른 오디오 특징값을 추출하는 특징 추출부의 구성의 일례를 나타내는 도면이다.
도 4를 참조하면, 특징 추출부(112, 122)는 상기 오디오 클립으로 음색 특징 및 리듬 특징과 같은 오디오 특징값을 추출한다. 음색 특징 추출부(timbre feature extractor)(410), 리듬 특징 추출부(rhythmic feature extractor)(420), 제2 가산부(430) 및 프레임 결합부(440)를 포함한다.
음색 특징 추출부(410)는 상기 오디오 클립으로부터 음색 특징을 추출하며, 서브-프레임 분할부(411), 제1 FFT 처리부(412), 스펙트럼 특징 추출부(413), 가산부(414), 서브 프레임 결합부(415), 제1 프레밍부(416), 평균값 추출부(417)를 포함한다. 서브 프레임 분할부(411)는 상기 오디오 클립을 예를 들어 20ms 서브 프레임 폭(sub-frame width)으로 나누고, 10ms 서브 프레임 스텝(sub-frame step)을 사용하여 각 서브 프레임을 분석한다. 제1 FFT(Fast Fourier Transform) 처리부(412)는 예를 들어 상기 20ms 오디오 데이터의 짧은 구간(short term) FFT를 취하여 주파수 영역으로 변환한다. 스펙트럼 특징 추출부(413)는 각 서브 프레임의 65Hz에서 8372Hz를 7 옥타브(actaves)로 분할된 주파수 영역에서 하기 수학식 1 내지 수학식 8을 이용하여 스펙트럼 중심, 스펙트럼 대역폭, 스펙트럼 롤오프, 스펙트럼 플럭스, 스펙트럼 평탄과 같은 상기 오디오 데이터의 스펙트럼 특징을 추출한다.
스펙트럼 특징 추출부(413)는 스펙트럼 중심 추출부(Spectral Centroid Extraction part)(413-1), 스펙트럼 대역폭 추출부(Spectral Bandwidth Extraction part)(413-2), 스펙트럼 롤오프 추출부(Spectral roll-off Extraction part)(413-3), 스펙트럼 플럭스 추출부(Spectral Flux Extraction part)(413-4), 스펙트럼 평탄 추출부(Spectral Flatness Extraction part)(413-5), 스펙트럼 대비 추출부(Spectral Contrast Extraction part)(413-6)를 포함한다.
스펙트럼 중심 추출부(413-1)는 상기 7 옥타브로 분할된 주파수 영역에서 하기 수학식 1을 이용하여 상기 오디오 데이터의 스펙트럼 중심을 추출한다.
Figure 112006069231236-PAT00001
여기서,
Figure 112006069231236-PAT00002
는 주파수 스펙트럼이다.
스펙트럼 대역폭 추출부(413-2)는 상기 7 옥타브로 분할된 주파수 영역에서 하기 수학식 2를 이용하여 상기 오디오 데이터의 스펙트럼 대역폭을 추출한다.
Figure 112006069231236-PAT00003
스펙트럼 롤오프 추출부(413-3)는 상기 7 옥타브로 분할된 주파수 영역에서 하기 수학식 3을 이용하여 상기 오디오 데이터의 스펙트럼 롤오프를 추출한다.
Figure 112006069231236-PAT00004
스펙트럼 플럭스 추출부(413-4)는 상기 7 옥타브로 분할된 주파수 영역에서 하기 수학식 4를 이용하여 상기 오디오 데이터의 스펙트럼 플럭스를 추출한다.
Figure 112006069231236-PAT00005
스펙트럼 평탄 추출부(413-5)는 상기 7 옥타브로 분할된 주파수 영역에서 하기 수학식 5를 이용하여 상기 오디오 데이터의 스펙트럼 평탄을 추출한다.
Figure 112006069231236-PAT00006
스펙트럼 평탄 추출부(413-6)는 상기 7 옥타브로 분할된 주파수 영역에서 하기 수학식 6 내지 수학식 8을 이용하여 상기 오디오 데이터의 스펙트럼 대조 특징 세트(spectral contrast feature set)를 추출한다. 여기서, 상기 스펙트럼 대조 특징 세트는 상기 7개의 옥타브-스케일 서브 밴드에 대해 피크/밸리/평균 로그 에너지(peak/valley/mean log-energy)로 구성된다.
Figure 112006069231236-PAT00007
상기 수학식 6은 상기 7개의 옥타브 스케일 서브 밴드(octave-scale sub-bands)에 대한 피크 로그 에너지(peak log-energy)를 나타낸다.
Figure 112006069231236-PAT00008
상기 수학식 7은 상기 7개의 옥타브 스케일 서브 밴드에 대한 밸리 로그 에너지(valley log-energy)를 나타낸다.
Figure 112006069231236-PAT00009
상기 수학식 8은 상기 7개의 옥타브 스케일 서브 밴드에 대한 평균 로그 에너지(mean log-energy)를 나타낸다.
제1 가산부(414)는 스펙트럼 중심 추출부(Spectral Centroid Extraction part)(413-1), 스펙트럼 대역폭 추출부(Spectral Bandwidth Extraction part)(413-2), 스펙트럼 롤오프 추출부(Spectral roll-off Extraction part)(413-3), 스펙트럼 플럭스 추출부(Spectral Flux Extraction part)(413-4), 스펙트럼 평탄 추출부 (Spectral Flatness Extraction part)(413-5), 스펙트럼 대비 추출부(Spectral Contrast Extraction part)(413-6)로부터 각각 추출된 스펙트럼 특징 벡터를 가산한다. 여기서, 총 26차원의 음색 오디오 특징값을 추출한다.
서브 프레임 결합부(415)는 상기 분할된 스펙트럼 특징 벡터의 서브 프레임을 결합하고, 제1 프레밍부(416)는 상기 결합된 서브 프레임을 프레밍하고, 평균값 추출부(417)는 예를 들어 3초의 프레임 대역과 0.25초 프레임 스텝(frame step)을 이용하여 각 프레임에서 특징값의 서브 프레임의 평균값(mean)과 분산값(variance)를 추출하여 52차원의 오디오 특징값을 추출한다.
리듬 특징 추출부(420)는 상기 오디오 클립으로부터 리듬 특징을 추출하며, 대역 통과 필터링부(band-pass filter)(421), 다운 샘플링부(422), 프레밍부(423), 제2 FFT 처리부(424), 서브 밴드 에너지 추출부(424)를 포함한다. 대역 통과 필터링부(421)는 일반적으로 악기음의 리듬의 대부분의 에너지가 낮은 주파수를 포함하고 있는 서브 밴드(sub-band)에 분포되어 있으므로 낮은 주파수 영역에 존재하고 있는 음악 신호에서 리듬을 추출하기 위해서 상기 오디오 클립 중 상기 서브 밴드의 대역 주파수만을 통과시키는 필터링을 수행한다. 즉, 대역 통과 필터링부(421)는 예를 들어 65Hz와 131Hz 영역으로 구성된 필터(filter)를 이용하여 상기 오디오 클립 중 상기 영역에 해당되는 오디오 신호를 추출한다. 상기 오디오 신호는 상기 7개의 옥타브 중 첫 번째 옥타브의 주파수 영역에 해당된다. 다운 샘플링부(422)는 상기 필터링된 오디오 신호를 예를 들어 200Hz 샘플링 레이트(sampling rate)으로 다운 샘플링(down-sampling)한다. 제2 프레밍부(423)는 상기 다운 샘플링된 오 디오 신호를 프레밍한다. 제2 FFT 처리부(424)는 상기 다운 샘플링된 오디오 신호에 예를 들어 3초 프레임 대역폭과 0.25초 프레임 스텝을 이용하여 FFT를 취하여 주파수 영역으로 전환한다. 서브 밴드 에너지 추출부(424)는 상기 주파수 영역에서 추출된 파워 스펙트럼을 대수적으로(logarithmically) 분포된 12 triangular 필터를 사용하여 각 필터로부터 서브 밴드 에너지를 추출하여 각 프레임당 12 차원의 리듬 특징값을 추출한다. 제2 가산부(430)는 음색 특징 추출부(410)에서 추출된 음색 특징값과 리듬 특징 추출부(420)에서 추출된 리듬 특징값을 가산한다. 프레임 결합부(440)는 상기 음색 특징값과 상기 리듬 특징값을 포함하는 특징 벡터를 하나의 프레임으로 결합한다. 즉, 프레임 결합부(440)는 예를 들어 상기 음색 특징값으로 추출된 52차원의 오디오 특징값과 상기 리듬 특징값으로 추출된 12차원의 오디오 특징값을 결합하여 총 64차원의 오디오 특징값을 획득한다.
음악/비음악 분류부(113)는 상기 오디오 특징값을 이용하여 상기 오디오 클립이 음악인지 또는 비음악인지를 분류한다. 이하 도 5를 참조하여 음악/비음악 분류부(113)의 구성 및 동작을 보다 상세하게 설명한다.
도 5는 본 발명에 따른 음악/비음악 분류부의 구성의 일례를 나타내는 도면이다.
도 5를 참조하면, 음악/비음악 분류부(113)는 모델 데이터베이스(531) 및 인식 모듈(532)을 포함한다. 트레이닝 모듈(520)은 음악 샘플(511) 및 비음악 샘플(512)에 의해 음악과 비음악을 구분하는 트레이닝을 수행하여 음악 모델과 비음악 모델을 각각 형성한다. 음악 샘플(511)은 클래식 음악, 팝 음악, 재즈 음악, 댄스 음악, 락 음악, 발라드 음악과 같이 주파수에 따라 그 특징이 달라지기 때문에 이퀄라이저의 조정을 필요로 하는 샘플을 포함한다. 비음악 샘플(512)은 뉴스, 안내 멘트, 시낭송 등과 같이 주파수에 따라 그 특징의 변화가 없기 때문에 이퀄라이저의 조정을 필요로 하지 않는 샘플을 포함한다. 모델 데이터베이스(531)는 상기 트레이닝 수행 결과에 의해 생성된 상기 음악 모델 및 상기 비음악 모델을 기록하고 유지한다. 인식 모듈(532)는 모델 데이터베이스(531)를 참조하여 상기 오디오 특징값에 대응되는 상기 음악 모델 또는 상기 비음악 모델을 검색하고, 검색 결과에 따라 상기 오디오 클립이 상기 음악 또는 상기 비음악인지를 분류한다. 즉, 인식 모듈(532)은 모델 데이터베이스(531)를 참조하여 상기 오디오 특징값이 상기 음악 모델과 유사한 경우, 상기 오디오 클립이 상기 음악인 것으로 분류한다. 또한, 인식 모듈(532)은 모델 데이터베이스(531)를 참조하여 상기 오디오 특징값이 상기 비음악 모델과 유사한 경우, 상기 오디오 클립이 상기 비음악인 것으로 분류한다.
상태 기록부(114)는 상기 분류된 음원의 카테고리 상태를 기록한다. 즉, 상태 기록부(114)는 현재 분석된 음원의 카테고리가 음악인 경우, 상기 음원의 카테고리를 상기 음악으로 기록한다. 또한, 상태 기록부(114)는 현재 분석된 음원의 카테고리가 비음악인 경우, 상기 음원의 카테고리를 상기 비음악으로 기록한다. 상태 기록부(114)는 상기 현재 분석된 음원의 카테고리가 이전에 분석된 음원의 카테고리와 동일한 경우, 이전에 기록된 카테고리 정보를 유지한다. 즉, 상태 기록부(114)는 상기 현재 분석된 음원의 카테고리가 상기 음악이고, 상기 이전에 분석된 음원의 카테고리가 상기 음악인 경우, 상기 현재 분석된 음원의 카테고리와 상 기 이전에 분석된 음원의 카테고리가 동일하기 때문에 상기 기록된 카테고리 정보를 유지한다. 한편, 상태 기록부(114)는 상기 현재 분석된 음원의 카테고리가 상기 음악이고, 상기 이전에 분석된 음원의 카테고리가 상기 비음악인 경우, 상기 현재 분석된 음원의 카테고리가 상기 이전에 분석된 음원의 카테고리와 동일하지 않기 때문에 상기 기록된 카테고리 정보를 변경한다. 상태 기록부(114)는 예를 들어 상기 음원의 카테고리 정보가 상기 음악인 경우 '1'로 기록하고, 상기 음원의 카테고리 정보가 상기 비음악인 경우 '0'으로 기록하면, 상기 현재 음원의 카테고리 정보가 상기 음악이고, 상기 이전에 기록된 음원의 카테고리 정보가 상기 비음악인 경우 상기 기록된 카테고리 정보를 '0'을 '1'로 반전시킬 수 있다.
제1 음악 장르 분류부(115)는 상태 기록부(114)에 기록된 상기 음원의 카테고리 정보가 상기 음악인 경우, 상기 추출된 오디오 특징에 기초하여 상기 음악의 장르를 분류하고, 분류된 음악의 장르에 따라 제1 사운드 모드를 이퀄라이저 조정기(130)로 제공한다. 이하 도 6을 참조하여 제1 음악 장르 분류부의 동작 및 구성을 보다 상세하게 설명하기로 한다.
도 6은 본 발명에 따른 음악 장르 분류부의 구성의 일례를 나타내는 도면이다.
도 6을 참조하면, 음악 장르 분류부(115, 123)는 모델 데이터베이스(631) 및 인식 모델(632)을 포함한다. 음악 장르 분류부(115, 123)는 GS(Gaussian Classifier), GMM(Gaussian Mixture Model), KNN(K-Nearest Neighbor), SVM(Support Vector Machine) 등과 같은 통계학적 분류 방식을 적용할 수 있다. 상기 음악 장르는 클래식 음악(611), 팝 음악(612), 재즈 음악(613), 댄스 음악(614) 또는 락 음악(615) 등을 포함할 수 있다. 트레이닝 모듈(620)은 상기 음악 장르별 샘플을 이용한 트레이닝을 통해 각 음악 장르에 대응되는 모델을 형성하고, 상기 형성된 음악 장르 모델을 모델 데이베이스(631)에 기록한다. 모델 데이터베이스(631)는 각 음악 장르별 모델을 기록하고 유지한다. 인식 모델(632)은 모델 데이터베이스(631)를 참조하여 상기 오디오 특징값에 대응되는 상기 음악 장르 모델을 검색하고, 검색 결과에 따라 상기 음악의 장르를 분류한다. 즉, 인식 모듈(632)은 모델 데이터베이스(631)를 참조하여 상기 오디오 특징값에 대응되는 모델이 일례로 상기 클래식 음악 모델인 경우, 상기 음악의 장르가 클래식 음악인 것으로 분류할 수 있다. 인식 모듈(632)은 모델 데이터베이스(631)를 참조하여 상기 오디오 특징값에 대응되는 모델이 다른 일례로 상기 팝 음악 모델인 경우, 상기 음악의 장르가 팝 음악인 것으로 분류할 수 있다. 인식 모듈(632)은 모델 데이터베이스(631)를 참조하여 상기 오디오 특징값에 대응되는 모델이 또 다른 일례로 상기 재즈 음악 모델인 경우, 상기 음악의 장르가 재즈 음악인 것으로 분류할 수 있다. 인식 모듈(632)은 모델 데이터베이스(631)를 참조하여 상기 오디오 특징값에 대응되는 모델이 또 다른 일례로 상기 댄스 음악 모델인 경우, 상기 음악의 장르가 댄스 음악인 것으로 분류할 수 있다. 인식 모듈(632)은 모델 데이터베이스(631)를 참조하여 상기 오디오 특징값에 대응되는 모델이 또 다른 일례로 상기 락 음악 모델인 경우, 상기 음악의 장르가 락 음악인 것으로 분류할 수 있다.
음악 장르 분류부(115)는 일례로 상기 현재 카테고리 상태와 상기 이전 카테 고리 상태를 비교하여 동일한 경우, 상기 이퀄라이저의 현재 사운드 모드를 유지하도록 하는 상기 제1 사운드 모드를 이퀄라이저 조정기(130)로 제공할 수 있다.
음악 장르 분류부(115)는 다른 일례로 현재 오디오 클립의 상태가 음악 구간에서 음악 구간으로 변화가 없는 경우, 상기 이퀄라이저의 현재 사운드 모드를 이전의 모드와 변동 없이 지속하도록 하는 상기 제1 사운드 모드를 이퀄라이저 조정기(130)로 제공할 수 있다.
제1 음악 장르 분류부(115)는 또 다른 일례로 상기 현재 오디오 클립의 상태가 비음악 구간에서 비음악 구간으로 변화가 없는 경우, 상기 이퀄라이저를 플랫 모드(flat mode)로 유지하도록 하는 상기 제1 사운드 모드를 이퀄라이저 조정기(130)로 제공할 수 있다.
제1 음악 장르 분류부(115)는 또 다른 일례로 상기 현재 오디오 클립의 상태가 비음악 구간에서 음악 구간으로 변경된 경우, 상기 현재 오디오 클립의 음악 장르를 분류하고, 상기 분류된 음악 장르에 따른 상기 제1 사운드 모드를 이퀄라이저 조정기(130)로 제공할 수 있다.
제2 사운드 모드 인식기(120)는 저장된 음악으로부터 추출된 하이라이트를 이용하여 각 음악의 장르를 분류하고, 상기 분류된 음악의 장르에 따른 제2 사운드 모드를 인식한다. 즉, 제2 사운드 모드 인식기(120)는 MP3 플레이어 또는 CD 플레이어에 저장된 음악으로부터 추출된 하이라이트를 이용하여 상기 음악의 장르를 분류하고, 상기 분류된 음악의 장르에 따라 상기 이퀄라이저를 조정하기 위한 제2 사운드 모드를 인식할 수 있다. 제2 사운드 모드 인식기(120)는 하이라이트 검출부 (121), 제2 특징 추출부(122) 및 제2 음악 장르 분류부(123)를 포함한다.
하이라이트 검출부(121)는 상기 음악으로부터 상기 음악을 대표하는 일정 시간 이내의 하이라이트를 검출한다. 즉, 하이라이트 검출부(121)는 상기 저장된 음악의 전체를 모두 검색하는 경우 시간이 많이 소모되므로 상기 음악의 특징을 대표할 수 있는 하이라이트를 검출할 수 있다. 하이라이트 검출부(121)는 예를 들어 6초 정도의 음악 신호로부터 평균 에너지(mean energy)를 계산하고, 각 6초 정도의 세그먼트에서 최대 평균 에너지(maximum mean energy)를 추출하여 상기 음악의 하이라이트로 검출할 수 있다. 이러한 방식은 오디오 핑그프린트 유사도 매트릭스(audio fingerprint similarity matrix)를 이용하여 반복 구간을 찾는 방식보다 프로세싱 속도가 빠른 이점이 있다.
제2 특징 추출부(122)는 상기 하이라이트로부터 기준치보다 짧은 구간의 오디오 특징값과 상기 기준치보다 긴 구간의 오디오 특징값을 추출한다. 즉, 제2 특징 추출부(122)는 상기 하이라이트를 분석하여 상기 오디오 특징값의 일례로 음색 특징값 또는 리듬 특징값을 추출할 수 있다. 상기 기준치보다 짧은 구간의 오디오 특징값은 상기 음색 특징값이 될 수 있고, 상기 기준치보다 긴 구간의 오디오 특징값은 상기 리듬 특징값이 될 수 있다.
제2 음악 장르 분류부(123)는 상기 오디오 특징값을 이용하여 상기 음악의 장르를 분류하고, 상기 분류된 장르에 따른 제2 사운드 모드를 이퀄라이저 조정기(130)로 제공한다.
이퀄라이저 조정기(130)는 상기 제1 사운드 모드 및 상기 제2 사운드 모드를 분석하여 조정할 사운드 모드를 선택하고, 선택된 사운드 모드에 따라 상기 이퀄라이저를 조정한다. 이퀄라이저 조정기(130)는 이퀄라이저 모드 설정부(131), 이퀄라이저 모드 선택부(132) 및 사운드 재생부(133)를 포함한다.
이퀄라이저 모드 설정부(131)는 상기 제1 사운드 모드 또는 상기 제2 사운드 모드에 대응되는 이퀄라이저의 주파수 특성을 미리 설정한다. 즉, 이퀄라이저 모드 설정부(131)는 상기 음악의 장르 분류에 의한 상기 제1 사운드 모드 또는 상기 제2 사운드 모드에 따라 각 주파수의 음원에 대한 강약이 조절되도록 이퀄라이저 모드를 미리 설정한다.
도 7은 본 발명에 따른 사운드 모드의 주파수별 특성을 나타내는 도면이다.
도 7을 참조하면, 참조번호(710)은 상기 사운드 모드가 일례로 클래식 음악 모드인 경우로서 60Hz부터 3kHz까지 범위에서 상기 이퀄라이저 특성이 일정하다가 3kHz부터 6kHz까지 상기 이퀄라이저 특성이 감소하다가 다시 6kHz에서 14kHz까지 상기 이퀄라이저 특성이 일정하며, 14kHz부터 16kHz까지 상기 이퀄라이저 특성이 다소 감소하는 형태를 나타낸다.
참조번호(720)는 상기 사운드 모드가 다른 일례로 팝 음악인 경우로서 60Hz부터 600Hz까지 범위에서 상기 이퀄라이저 특성이 증가하다가 600Hz부터 6kHz까지 상기 이퀄라이저 특성이 감소하다가 다시 6kHz에서 16kHz까지 상기 이퀄라이저 특성이 일정한 형태를 나타낸다.
참조번호(730)는 상기 사운드 모드가 또 다른 일례로 재즈 음악인 경우로서 60Hz부터 600Hz까지 범위에서 상기 이퀄라이저 특성이 감소하다가 600Hz부터 16kHz 까지 상기 이퀄라이저 특성이 증가하는 형태를 나타낸다.
참조번호(740)는 상기 사운드 모드가 또 다른 일례로 댄스 음악 모드인 경우로서 60Hz부터 12kHz까지 범위에서 상기 이퀄라이저 특성이 감소하다가 12kHz부터 14kHz까지 상기 이퀄라이저 특성이 증가하다가 14kHz부터 16kHz까지 상기 이퀄라이저 특성이 일정한 형태를 나타낸다.
참조번호(750)는 상기 사운드 모드가 또 다른 일례로 락 음악인 경우로서 60Hz부터 600Hz까지 범위에서 상기 이퀄라이저 특성이 감소하다가 600Hz부터 12kHz까지 상기 이퀄라이저 특성이 증가하다가 다시 12kHz에서 16kHz까지 상기 이퀄라이저 특성이 일정한 형태를 나타낸다.
참조번호(760)는 상기 사운드 모드가 또 다른 일례로 플랫 모드인 경우로서 모든 주파수에서 동일한 이퀄라이저 특성을 나타낸다.
이퀄라이저 모드 선택부(132)는 상기 제1 사운드 모드 또는 상기 제2 사운드 모드 중 선택된 사운드 모드에 대응하는 이퀄라이저 모드를 선택한다. 즉, 이퀄라이저 모드 선택부(132)는 이퀄라이저 조정 시스템(100)에서 실시간으로 제공되는 음원이 상기 연속적인 오디오 데이터인 경우 상기 제1 사운드 모드에 따라 상기 이퀄라이저 모드를 선택하고, 저장된 음원을 재생하는 경우 상기 제2 사운드 모드에 따라 상기 이퀄라이저 모드를 선택한다.
이퀄라이저 모드 선택부(132)는 상기 제1 사운드 모드 또는 상기 제2 사운드 모드에 따라 상기 분류된 음악의 장르가 일례로 상기 클래식 음악인 경우 참조번호(710)와 같은 클래식 음악의 주파수 특성을 가지는 이퀄라이저 모드를 선택한 다.
이퀄라이저 모드 선택부(132)는 상기 제1 사운드 모드 또는 상기 제2 사운드 모드에 따라 상기 분류된 음악의 장르가 다른 일례로 상기 팝 음악인 경우 참조번호(720)와 같은 팝 음악의 주파수 특성을 가지는 이퀄라이저 모드를 선택한다.
이퀄라이저 모드 선택부(132)는 상기 제1 사운드 모드 또는 상기 제2 사운드 모드에 따라 상기 분류된 음악의 장르가 또 다른 일례로 상기 재즈 음악인 경우 참조번호(730)와 같은 재즈 음악의 주파수 특성을 가지는 이퀄라이저 모드를 선택한다.
이퀄라이저 모드 선택부(132)는 상기 제1 사운드 모드 또는 상기 제2 사운드 모드에 따라 상기 분류된 음악의 장르가 또 다른 일례로 상기 댄스 음악인 경우 참조번호(740)와 같은 댄스 음악의 주파수 특성을 가지는 이퀄라이저 모드를 선택한다.
이퀄라이저 모드 선택부(132)는 상기 제1 사운드 모드 또는 상기 제2 사운드 모드에 따라 상기 분류된 음악의 장르가 또 다른 일례로 상기 락 음악인 경우 참조번호(750)와 같은 락 음악의 주파수 특성을 가지는 이퀄라이저 모드를 선택한다.
이퀄라이저 모드 선택부(132)는 상기 제1 사운드 모드 또는 상기 제2 사운드 모드에 따라 상기 음악이 아닌 비음악인 것으로 판단되면, 참조번호(760)와 같은 플랫 모드의 주파수 특성을 가지는 이퀄라이저 모드를 선택한다.
사운드 재생부(sound reproducer)(133)는 상기 선택된 이퀄라이저 모드에 따라 상기 설정된 주파수 특성에 맞도록 사운드를 재생한다. 즉, 사운드 재생부(133)는 상기 연속적인 오디오 스트림인 제1 오디오 데이터 또는 상기 저장된 음원인 제2 오디오 데이터를 재생할 때 상기 선택된 이퀄라이저 모드에 따라 상기 설정된 주파수 특성이 강조되도록 상기 제1 오디오 데이터 또는 상기 제2 오디오 데이터의 사운드를 재생할 수 있다.
도 2는 본 발명의 다른 실시예에 따른 이퀄라이저 조정 방법의 흐름을 나타내는 도면이다.
도 2를 참조하면, 단계(S210)에서 이퀄라이저 조정 시스템은 연속적인 오디오 스트림을 일정 시간 간격의 오디오 클립으로 분할한다.
단계(S220)에서 상기 이퀄라이저 조정 시스템은 입력된 데이터가 오디오 클립인지 여부를 판단한다.
상기 오디오 클립인 경우, 단계(S230)에서 상기 이퀄라이저 조정 시스템은 상기 분할된 오디오 클립으로부터 오디오 특징값을 추출한다. 즉, 단계(S230)에서 상기 이퀄라이저 조정 시스템은 상기 오디오 클립으로부터 기준치보다 짧은 구간의 오디오 특징값과 상기 기준치보다 긴 구간의 오디오 특징값을 추출한다. 단계(S230)에서 상기 이퀄라이저 조정 시스템은 일례로 상기 오디오 클립으로부터 상기 기준치보다 짧은 구간의 오디오 특징값으로 음색 특징을 추출하고, 상기 기준치보다 긴 구간의 오디오 특징값으로 리듬 특징을 추출할 수 있다.
단계(S240)에서 상기 이퀄라이저 조정 시스템은 상기 추출된 오디오 특징값을 기초로 하여 상기 오디오 클립을 음악/비음악으로 카테고리를 분류한다. 즉, 단계(S240)에서 상기 이퀄라이저 조정 시스템은 상기 추출된 오디오 특징값을 기초로 하여 음악 모델 또는 비음악 모델과 비교하여 상기 오디오 특징값이 상기 음악 모델과 유사한 경우 상기 오디오 클립을 음악 카테고리로 분류하고, 상기 오디오 특징값이 상기 비음악 모델과 유사한 경우 상기 오디오 클립을 비음악 카테고리로 분류할 수 있다.
단계(S250)에서 상기 이퀄라이저 조정 시스템은 현재 분류된 카테고리의 상태가 이전에 분류된 카테고리의 상태와 동일한지 여부를 판단한다.
상기 현재 분류된 카테고리의 상태와 상기 이전에 분류된 카테고리의 상태가 동일한 경우, 단계(S255)에서 상기 이퀄라이저 조정 시스템은 현재 사운드 모드를 이전 사운드 모드로 유지한다.
상기 현재 분류된 카테고리의 상태와 상기 이전에 분류된 카테고리의 상태가 동일하지 않은 경우, 단계(S260)에서 상기 이퀄라이저 조정 시스템은 이전에 기록된 카테고리의 상태를 반전시키고, 단계(S265)에서 상기 반전된 카테고리의 상태를 상태 레지스터에 기록한다.
단계(S270)에서 상기 이퀄라이저 조정 시스템은 상기 오디오 클립이 비음악인지 여부를 판단한다.
상기 오디오 클립이 상기 비음악인 경우, 단계(S275)에서 상기 이퀄라이저 조정 시스템은 상기 사운드 모드를 플랫 모드로 설정한다.
상기 오디오 클립이 비음악이 아닌 음악인 경우, 단계(S280)에서 상기 이퀄라이저 조정 시스템은 상기 추출된 오디오 특징값을 이용하여 상기 음악의 장르를 분류한다.
단계(S285)에서 상기 이퀄라이저 조정 시스템은 상기 분류된 음악 장르에 따라 사운드 모드를 설정한다.
단계(S290)에서 상기 이퀄라이저 조정 시스템은 상기 설정된 사운드 모드에 따라 이퀄라이저를 조정한다.
이와 같이, 본 발명에 다른 실시예에 따른 이퀄라이저 조정 방법은 연속적인 오디오 스트림으로부터 추출된 오디오 특징값을 이용하여 음악/비음악으로 카테고리를 분류하고, 상기 분류된 카테고리에 기초하여 상기 음악인 경우 상기 오디오 특징값을 이용하여 상기 음악의 장르를 분류하고, 각 음악 장르에 대응되는 이퀄라이저 모드를 미리 설정하고, 상기 인식된 음악의 사운드 모드에 대응되는 이퀄라이저 모드 설정에 따라 상기 이퀄라이저를 조정할 수 있다.
도 3은 본 발명의 또 다른 실시예에 따른 이퀄라이저 조정 방법의 흐름을 나타내는 도면이다.
도 3을 참조하면, 단계(S310)에서 이퀄라이저 조정 시스템은 저장된 음원 중 하나의 오디오 데이터를 가져온다. 즉, 단계(S310)에서 상기 이퀄라이저 조정 시스템은 MP3 플레이어 또는 CD 플레이어에 저장된 복수의 음원으로부터 분석하고자 하는 하나의 오디오 데이터를 추출한다.
단계(S320)에서 상기 이퀄라이저 조정 시스템은 상기 오디오 데이터가 음악인지 여부를 판단한다.
상기 오디오 데이터가 상기 음악인 경우, 단계(S330)에서 상기 이퀄라이저 조정 시스템은 상기 음악의 하이라이트를 검출한다.
단계(S340)에서 상기 이퀄라이저 조정 시스템은 상기 검출된 음악의 하이라이트로부터 오디오 특징값을 추출한다. 상기 오디오 특징값은 음색 특징값 및 리듬 특징값을 포함할 수 있다. 즉, 단계(S340)에서 상기 이퀄라이저 조정 시스템은 상기 검출된 음악의 하이라이트로부터 기준치보다 짧은 구간의 오디오 특징값과 상기 기준치보다 긴 구간의 오디오 특징값을 추출할 수 있다.
단계(S350)에서 상기 이퀄라이저 조정 시스템은 상기 추출된 오디오 특징값을 이용하여 상기 음악의 장르를 분류한다. 즉, 단계(S350)에서 상기 이퀄라이저 조정 시스템은 트레이닝에 의해 음악의 장르가 분류된 음악 장르 모델에 기초하여 상기 추출된 오디오 특징값과 유사한 음악 장르 모델을 검출하고, 상기 검출된 음악 장르 모델에 따라 상기 음악의 장르를 분류할 수 있다.
단계(S360)에서 상기 이퀄라이저 조정 시스템은 상기 분류된 음악 장르에 따른 사운드 모드를 인식한다.
단계(S370)에서 상기 이퀄라이저 조정 시스템은 상기 인식된 사운드 모드에 따라 이퀄라이저를 조정한다. 즉, 단계(S370)에서 상기 이퀄라이저 조정 시스템은 미리 설정된 사운드 모드의 주파수 특성을 제공하고, 상기 인식된 사운드 모드에 대한 주파수 특성을 선택하고, 상기 선택된 주파수 특성에 적합하도록 상기 이퀄라이저를 조정하여 사운드를 재생한다.
이와 같이, 본 발명의 또 다른 실시예에 따른 이퀄라이저 조정 방법은 저장된 각 음악으로부터 하이라이트를 추출하고, 상기 추출된 하이라이트를 이용하여 상기 음악의 장르를 분류하고, 상기 분류된 음악의 장르에 따라 사운드 모드를 인식하고, 각 사운드 모드에 대응되는 이퀄라이저 모드를 미리 설정하고, 상기 인식된 사운드 모드에 대응되는 이퀄라이저 모드 설정에 따라 상기 이퀄라이저를 조정할 수 있다.
한편 본 발명의 또 다른 실시예에 따른 이퀄라이저 조정 방법은 연속적인 오디오 스트림으로부터 추출된 오디오 특징값을 이용하여 음악/비음악으로 카테고리를 분류하고, 상기 분류된 카테고리에 기초하여 상기 이퀄라이저의 제1 사운드 모드를 인식하고, 저장된 음악으로부터 추출된 하이라이트를 이용하여 상기 음악의 장르를 분류하여 상기 이퀄라이저의 제2 사운드 모드를 인식하고, 각 사운드 모드에 대응되는 이퀄라이저 모드를 미리 설정하고, 상기 제1 사운드 모드 또는 상기 제2 사운드 모드를 분석하여 사운드 모드를 선택하고, 상기 선택된 사운드 모드에 대응되는 상기 이퀄라이저 모드에 따라 상기 이퀄라이저를 조정할 수도 있다.
또한 본 발명에 따른 이퀄라이저 조정 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.
본 발명에 따르면, 음원 재생기에서 재생되는 음악 신호를 분석하여 장르를 분류하고 분류된 장르에 기초하여 사운드 모드를 인식하고 인식된 사운드 모드에 따라 자동으로 이퀄라이저를 조정하는 방법 및 그 시스템을 제공할 수 있다.
또한 본 발명에 따르면, 음원 재생기에서 저장된 음악 장르에 따라 사용되는 악기의 주파수 대역이 다르다는 점을 이용하여 각 음악 장르에 따라 주파수 대역이 다르게 설정되도록 이퀄라이저를 조정하는 방법 및 그 시스템을 제공할 수 있다.
또한 본 발명에 따르면, 음원 재생기에 저장된 음악의 하이라이트를 검출하고 검출된 하이라이트로부터 오디오 특징값을 추출하고, 추출된 오디오 특징값을 이용하여 음악의 장르를 분류하고, 분류된 음악의 장르에 따라 이퀄라이저를 자동으로 조정하는 방법 및 그 시스템을 제공할 수 있다.
또한 본 발명에 따르면, 음원 재생기에서 재생되는 음원 또는 저장된 음원을 분석하여 음악의 장르를 분류하고, 분류된 음악의 장르에 따라 사운드 모드를 인식하고 인식된 사운드 모드에 따라 이퀄라이저를 자동으로 조정하는 방법 및 그 시스템을 제공할 수 있다.

Claims (27)

  1. 연속적인 오디오 스트림으로부터 추출된 오디오 특징값을 이용하여 카테고리를 분류하고, 분류된 카테고리에 따라 이퀄라이저를 조정하기 위한 제1 사운드 모드를 인식하는 제1 사운드 모드 인식기;
    저장된 음악으로부터 추출된 하이라이트를 이용하여 각 음원의 장르를 분류하여 상기 이퀄라이저를 조정하기 위한 제2 사운드 모드를 인식하는 제2 사운드 모드 인식기; 및
    상기 제1 사운드 모드 또는 상기 제2 사운드 모드를 분석하여 조정할 사운드 모드를 선택하고, 선택된 사운드 모드에 따라 상기 이퀄라이저를 조정하는 이퀄라이저 조정기
    를 포함하는 것을 특징으로 하는 이퀄라이저 조정 시스템.
  2. 제1항에 있어서,
    상기 제1 사운드 모드 인식기는,
    상기 연속적인 오디오 스트림을 정해진 시간 간격의 오디오 클립으로 분할하는 분할부;
    상기 오디오 클립으로부터 오디오 특징값을 추출하는 특징 추출부;
    상기 오디오 특징값을 이용하여 상기 오디오 클립이 음악인지 또는 비음악인지를 분류하는 음악/비음악 분류부;
    상기 분류된 음원의 카테고리 상태를 기록하는 상태 기록부; 및
    상기 음원이 음악인 경우, 상기 추출된 오디오 특징에 기초하여 상기 음악의 장르를 분류하는 음악 장르 분류부
    를 포함하는 것을 특징으로 하는 이퀄라이저 조정 시스템.
  3. 제2항에 있어서,
    상기 특징 추출부는,
    상기 오디오 클립으로부터 음색 특징값 또는 리듬 특징값을 추출하는 것을 특징으로 하는 이퀄라이저 조정 시스템.
  4. 제2항에 있어서,
    상기 음악/비음악 분류부는,
    상기 오디오 특징값을 이용하여 현재의 오디오 클립이 음악인지 또는 비음악인지를 분류하는 것을 특징으로 하는 이퀄라이저 조정 시스템.
  5. 제2항에 있어서,
    상기 음악 장르 분류부는,
    상기 현재 카테고리 상태와 상기 이전 카테고리 상태를 비교하여 동일한 경우, 상기 이퀄라이저 조정기에 대한 현재 사운드 모드를 유지하도록 하는 상기 제1 사운드 모드를 상기 이퀄라이저 조정기로 제공하는 것을 특징으로 하는 이퀄라이저 조정 시스템.
  6. 제5항에 있어서,
    상기 음악 장르 분류부는,
    현재 오디오 클립의 상태가 음악 구간에서 음악 구간으로 변화가 없는 경우, 상기 현재 사운드 모드를 이전의 모드와 변동 없이 지속하도록 하는 상기 제1 사운드 모드를 상기 이퀄라이저 조정기로 제공하는 것을 특징으로 하는 이퀄라이저 조정 시스템.
  7. 제5항에 있어서,
    상기 음악 장르 분류부는,
    현재 오디오 클립의 상태가 비음악 구간에서 비음악 구간으로 변화가 없는 경우, 상기 이퀄라이저의 사운드 모드를 플랫 모드(flat mode)로 유지하도록 하는 상기 제1 사운드 모드를 상기 이퀄라이저 조정기로 제공하는 것을 특징으로 하는 이퀄라이저 조정 시스템.
  8. 제2항에 있어서,
    상기 상태 기록부는,
    상기 현재 오디오 클립의 상태와 상기 이전 오디오 클립의 상태가 다른 경우, 이전에 기록된 상태를 반전 기입하는 것을 특징으로 하는 이퀄라이저 조정 시 스템.
  9. 제8항에 있어서,
    상기 음악 장르 분류부는,
    상기 상태가 비음악 구간에서 음악 구간으로 변경된 경우, 음악 장르를 분류하고, 상기 분류된 음악 장르 정보에 따른 상기 제1 사운드 모드를 상기 이퀄라이저 조정기로 제공하는 것을 특징으로 이퀄라이저 조정 시스템.
  10. 제8항에 있어서,
    상기 음악 장르 분류부는,
    상기 상태가 음악 구간에 비음악 구간으로 변경된 경우, 상기 이퀄라이저를 플랫 모드로 설정하도록 하는 제1 사운드 모드를 상기 이퀄라이저 조정기로 제공하는 것을 특징으로 이퀄라이저 조정 시스템.
  11. 제1항에 있어서,
    상기 제2 사운드 모드 인식기는,
    상기 음악으로부터 추출된 하이라이트를 이용하여 상기 음악의 장르를 분류하고, 상기 분류된 음악의 장르에 따라 상기 이퀄라이저에 대한 제2 사운드 모드를 인식하고, 상기 제2 사운드 모드를 상기 이퀄라이저 조정기로 제공하는 것을 특징으로 이퀄라이저 조정 시스템.
  12. 제1항에 있어서,
    상기 제2 사운드 모드 인식기는,
    상기 음악으로부터 상기 음악을 대표하는 일정 시간 이내의 하이라이트를 검출하는 하이라이트 검출부;
    상기 하이라이트로부터 기준치보다 짧은 구간의 오디오 특징값과 상기 기준치보다 긴 구간의 오디오 특징값을 추출하는 특징 추출부; 및
    상기 오디오 특징값을 이용하여 상기 음악의 장르를 분류하는 음악 장르 분류부
    를 포함하는 것을 특징으로 하는 이퀄라이저 조정 시스템.
  13. 제1항에 있어서,
    상기 이퀄라이저 조정기는,
    상기 제1 사운드 모드 또는 상기 제2 사운드 모드에 대응되는 이퀄라이저의 주파수 특성을 설정하는 이퀄라이저 모드 설정부;
    상기 제1 사운드 모드 또는 상기 제2 사운드 모드 중 선택된 사운드 모드에 대응하는 이퀄라이저 모드를 선택하는 이퀄라이저 모드 선택부; 및
    상기 선택된 이퀄라이저 모드에 대응되는 주파수 특성에 맞도록 사운드를 재생하는 사운드 재생부(sound reproducer)
    를 포함하는 것을 특징으로 하는 이퀄라이저 조정 시스템.
  14. 음원 재생기에서의 이퀄라이저 조정 방법에 있어서,
    연속적인 오디오 스트림으로부터 추출된 오디오 특징값을 이용하여 음악/비음악으로 카테고리를 분류하고, 분류된 카테고리가 음악인 경우 상기 음악의 장르를 분류하고 분류된 장르에 따라 사운드 모드를 인식하는 단계; 및
    각 사운드 모드에 대응되는 이퀄라이저 모드를 미리 설정하고, 상기 인식된 사운드 모드에 대응되는 이퀄라이저 모드 설정에 따라 상기 이퀄라이저를 조정하는 단계
    를 포함하는 것을 특징으로 하는 이퀄라이저 조정 방법.
  15. 음원 재생기에서의 이퀄라이저 조정 방법에 있어서,
    저장된 각 음악으로부터 하이라이트를 추출하고, 상기 추출된 하이라이트를 이용하여 상기 음악의 장르를 분류하고, 상기 분류된 음악의 장르에 따라 사운드 모드를 인식하는 단계; 및
    각 사운드 모드에 대응되는 이퀄라이저 모드를 미리 설정하고, 상기 인식된 사운드 모드에 대응되는 이퀄라이저 모드 설정에 따라 상기 이퀄라이저를 조정하는 단계
    를 포함하는 것을 특징으로 하는 이퀄라이저 조정 방법.
  16. 음원 재생기에서의 이퀄라이저 조정 방법에 있어서,
    연속적인 오디오 스트림으로부터 추출된 오디오 특징값을 이용하여 음악/비음악으로 카테고리를 분류하고, 상기 분류된 카테고리에 기초하여 상기 이퀄라이저의 제1 사운드 모드를 인식하는 단계;
    저장된 음악으로부터 추출된 하이라이트를 이용하여 상기 음악의 장르를 분류하여 상기 이퀄라이저의 제2 사운드 모드를 인식하는 단계; 및
    각 사운드 모드에 대응되는 이퀄라이저 모드를 미리 설정하고, 상기 제1 사운드 모드 또는 상기 제2 사운드 모드를 분석하여 사운드 모드를 선택하고, 상기 선택된 사운드 모드에 대응되는 상기 이퀄라이저 모드에 따라 상기 이퀄라이저를 조정하는 단계
    를 포함하는 것을 특징으로 하는 이퀄라이저 조정 방법.
  17. 제16항에 있어서,
    상기 제1 사운드 모드를 인식하는 단계는,
    상기 연속적인 오디오 스트림을 정해진 시간 간격의 오디오 클립으로 분할하는 단계;
    상기 오디오 클립으로부터 오디오 특징값을 추출하는 단계;
    상기 오디오 특징값을 이용하여 음악 카테고리 또는 비음악 카테고리를 분류하는 단계;
    상기 음악 카테고리 또는 상기 비음악 카테고리 상태를 기록하는 단계; 및
    현재 카테고리 정보와 상기 상태 기록부에 기록된 이전 카테고리 정보를 비 교하여 상기 음악의 장르를 분류하는 단계
    를 포함하는 것을 특징으로 하는 이퀄라이저 조정 방법.
  18. 제17항에 있어서,
    상기 오디오 특징값을 추출하는 단계는,
    상기 오디오 클립으로부터 기준치보다 짧은 구간의 오디오 특징값과 상기 기준치보다 긴 구간의 오디오 특징값을 추출하는 것을 특징으로 하는 이퀄라이저 조정 시스템.
  19. 제17항에 있어서,
    상기 현재 카테고리 상태와 상기 이전 카테고리 상태를 비교하여 동일한 경우, 현재 사운드 모드를 유지하는 단계를 더 포함하는 것을 특징으로 하는 이퀄라이저 조정 방법.
  20. 제19항에 있어서,
    상기 현재 사운드 모드를 유지하는 단계는,
    현재 오디오 클립의 상태가 음악 구간에서 음악 구간으로 변화가 없는 경우, 상기 현재 사운드 모드를 이전 사운드 모드와 변동 없이 지속적으로 유지하는 것을 특징으로 하는 이퀄라이저 조정 방법.
  21. 제17항에 있어서,
    상기 제1 사운드 모드를 인식하는 단계는,
    상기 오디오 클립의 카테고리가 비음악 카테고리인 경우, 상기 제1 사운드 모드를 플랫 모드(flat mode)로 인식하는 것을 특징으로 하는 이퀄라이저 조정 방법.
  22. 제17항에 있어서,
    상기 현재 카테고리 정보와 이전 카테고리 정보를 비교하여 상기 현재 오디오 클립의 상태와 상기 이전 오디오 클립의 상태가 다른 경우, 상태를 반전시키고, 상기 반전된 상태를 상태 레지스터에 기록하는 단계를 더 포함하는 것을 특징으로 하는 이퀄라이저 조정 방법.
  23. 제17항에 있어서,
    상기 현재 카테고리 정보와 이전 카테고리 정보를 비교하여 상기 현재 오디오 클립의 상태가 비음악 구간에서 음악 구간으로 변경된 경우, 음악 장르를 분류하고 분류된 장르 정보를 이퀄라이저 조정기로 제공하는 단계를 더 포함하는 것을 특징으로 이퀄라이저 조정 방법.
  24. 제17항에 있어서,
    상기 음원의 장르를 분류하는 단계는,
    상기 현재 카테고리 정보와 이전 카테고리 정보를 비교하여 상기 현재 오디오 클립의 상태가 음악 구간에 비음악 구간으로 변경된 경우, 상기 제1 사운드 모드를 플랫 모드로 설정하는 것을 특징으로 이퀄라이저 조정 시스템.
  25. 제16항에 있어서,
    상기 제2 사운드 모드를 인식하는 단계는,
    상기 음악으로부터 상기 음악을 대표하는 일정 시간 이내의 하이라이트를 추출하는 단계;
    상기 하이라이트로부터 기준치보다 짧은 구간의 오디오 특징값과 상기 기준치보다 긴 구간의 오디오 특징값을 추출하는 단계;
    상기 추출된 오디오 특징값을 이용하여 상기 음악의 장르를 분류하는 단계; 및
    상기 분류된 음악의 장르에 따라 상기 제2 사운드 모드를 인식하는 단계
    를 포함하는 것을 특징으로 하는 이퀄라이저 조정 방법.
  26. 제16항에 있어서,
    상기 이퀄라이저를 조정하는 단계는,
    미리 설정된 사운드 모드의 주파수 특성을 제공하는 단계;
    상기 제1 사운드 모드 또는 상기 제2 사운드 모드 중 선택된 사운드 모드에 대한 주파수 특성을 선택하는 단계; 및
    선택된 주파수 특성에 적합하도록 상기 이퀄라이저를 조정하여 사운드를 재생하는 단계
    를 포함하는 것을 특징으로 하는 이퀄라이저 조정 방법.
  27. 제14항 내지 제26항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록하는 컴퓨터 판독 가능한 기록매체.
KR1020060092858A 2006-09-25 2006-09-25 음원 재생기에서의 이퀄라이저 조정 방법 및 그 시스템 KR100832360B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020060092858A KR100832360B1 (ko) 2006-09-25 2006-09-25 음원 재생기에서의 이퀄라이저 조정 방법 및 그 시스템
US11/715,376 US20080075303A1 (en) 2006-09-25 2007-03-08 Equalizer control method, medium and system in audio source player

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060092858A KR100832360B1 (ko) 2006-09-25 2006-09-25 음원 재생기에서의 이퀄라이저 조정 방법 및 그 시스템

Publications (2)

Publication Number Publication Date
KR20080027987A true KR20080027987A (ko) 2008-03-31
KR100832360B1 KR100832360B1 (ko) 2008-05-26

Family

ID=39224990

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060092858A KR100832360B1 (ko) 2006-09-25 2006-09-25 음원 재생기에서의 이퀄라이저 조정 방법 및 그 시스템

Country Status (2)

Country Link
US (1) US20080075303A1 (ko)
KR (1) KR100832360B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100955429B1 (ko) * 2008-07-04 2010-05-04 경상대학교산학협력단 동물용 비학습 소리 재생 시스템
KR20170093884A (ko) * 2014-12-03 2017-08-16 피터 그라함 크레이븐 고해상도 오디오의 사전-응답 주파수에서 그룹 딜레이를 갖는 비선형 필터
KR102331274B1 (ko) * 2020-11-26 2021-12-01 주식회사 버시스 사용자의 인터랙션을 이용한 오디오 소스 재생 방법 및 이를 이용한 음악 어플리케이션
US11579838B2 (en) 2020-11-26 2023-02-14 Verses, Inc. Method for playing audio source using user interaction and a music application using the same

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4649859B2 (ja) * 2004-03-25 2011-03-16 ソニー株式会社 信号処理装置および方法、記録媒体、並びにプログラム
JP5135931B2 (ja) * 2007-07-17 2013-02-06 ヤマハ株式会社 楽曲加工装置およびプログラム
WO2010005033A1 (ja) * 2008-07-11 2010-01-14 クラリオン株式会社 音響処理装置
WO2010138311A1 (en) * 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Equalization profiles for dynamic equalization of audio data
WO2010138309A1 (en) 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Audio signal dynamic equalization processing control
US9153217B2 (en) * 2010-11-01 2015-10-06 James W. Wieder Simultaneously playing sound-segments to find and act-upon a composition
CN102622999A (zh) * 2011-01-26 2012-08-01 英华达(南京)科技有限公司 音效自动调整系统及其方法
US20120294459A1 (en) * 2011-05-17 2012-11-22 Fender Musical Instruments Corporation Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals in Consumer Audio and Control Signal Processing Function
TWI607321B (zh) * 2012-03-01 2017-12-01 群邁通訊股份有限公司 音樂自動優化系統及方法
CN104078050A (zh) * 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN104079247B (zh) 2013-03-26 2018-02-09 杜比实验室特许公司 均衡器控制器和控制方法以及音频再现设备
US9380383B2 (en) 2013-09-06 2016-06-28 Gracenote, Inc. Modifying playback of content using pre-processed profile information
TWI569257B (zh) * 2014-07-04 2017-02-01 玄舟科技有限公司 音訊處理裝置及其音訊處理方法
KR20170030384A (ko) * 2015-09-09 2017-03-17 삼성전자주식회사 음향 조절 장치 및 방법과, 장르 인식 모델 학습 장치 및 방법
US10178415B2 (en) * 2015-09-15 2019-01-08 Piksel, Inc. Chapter detection in multimedia streams via alignment of multiple airings
US9928025B2 (en) 2016-06-01 2018-03-27 Ford Global Technologies, Llc Dynamically equalizing receiver
US10325588B2 (en) * 2017-09-28 2019-06-18 International Business Machines Corporation Acoustic feature extractor selected according to status flag of frame of acoustic signal
US10545720B2 (en) * 2017-09-29 2020-01-28 Spotify Ab Automatically generated media preview
CN117544884A (zh) * 2017-10-04 2024-02-09 谷歌有限责任公司 基于房间特性自动均衡音频输出的方法和系统
US10186247B1 (en) * 2018-03-13 2019-01-22 The Nielsen Company (Us), Llc Methods and apparatus to extract a pitch-independent timbre attribute from a media signal
US10991379B2 (en) * 2018-06-22 2021-04-27 Babblelabs Llc Data driven audio enhancement
CN109147739B (zh) * 2018-09-12 2021-07-23 网易(杭州)网络有限公司 基于语音控制的音效调节方法、介质、装置和计算设备
CN111492424A (zh) * 2018-10-19 2020-08-04 索尼公司 信息处理设备、信息处理方法以及信息处理程序
KR20200142787A (ko) * 2019-06-13 2020-12-23 네이버 주식회사 멀티미디어 신호 인식을 위한 전자 장치 및 그의 동작 방법
US11481628B2 (en) 2019-11-26 2022-10-25 Gracenote, Inc. Methods and apparatus for audio equalization based on variant selection
WO2021108664A1 (en) * 2019-11-26 2021-06-03 Gracenote, Inc. Methods and apparatus for audio equalization based on variant selection
US10798484B1 (en) * 2019-11-26 2020-10-06 Gracenote, Inc. Methods and apparatus for audio equalization based on variant selection
WO2021183138A1 (en) * 2020-03-13 2021-09-16 Hewlett-Packard Development Company, L.P. Media classification
EP3889958A1 (en) * 2020-03-31 2021-10-06 Moodagent A/S Dynamic audio playback equalization using semantic features
KR102466985B1 (ko) * 2020-07-14 2022-11-11 (주)드림어스컴퍼니 음성 명령 기반의 음질 제어 방법 및 그를 위한 장치
CN112203181A (zh) * 2020-09-25 2021-01-08 江苏紫米电子技术有限公司 均衡器的自动切换方法、装置、电子设备及存储介质
US20240022224A1 (en) * 2020-11-27 2024-01-18 Dolby Laboratories Licensing Corporation Automatic generation and selection of target profiles for dynamic equalization of audio content
CN114339392B (zh) * 2021-11-12 2023-09-12 腾讯科技(深圳)有限公司 视频剪辑方法、装置、计算机设备及存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0129989B1 (ko) * 1993-06-30 1998-10-01 김광호 자동 음색 조정방법 및 장치
US5745583A (en) * 1994-04-04 1998-04-28 Honda Giken Kogyo Kabushiki Kaisha Audio playback system
KR0149410B1 (ko) * 1995-11-30 1998-11-02 김광호 오디오기기의 음악쟝르별 자동 이퀄라이징방법 및 그 장치
JPH09171664A (ja) * 1995-12-20 1997-06-30 Sharp Corp 音楽情報再生装置及び音楽情報記録再生装置
US6570991B1 (en) * 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
KR19990025250A (ko) * 1997-09-11 1999-04-06 구자홍 자동 이퀄라이저 장치
US20020159607A1 (en) * 2001-04-26 2002-10-31 Ford Jeremy M. Method for using source content information to automatically optimize audio signal
JP2005502979A (ja) * 2001-09-11 2005-01-27 トムソン ライセンシング ソシエテ アノニム 等化モードを自動的に作動化するための方法および装置
US20040131206A1 (en) * 2003-01-08 2004-07-08 James Cao User selectable sound enhancement feature
US7179980B2 (en) * 2003-12-12 2007-02-20 Nokia Corporation Automatic extraction of musical portions of an audio stream
EP1580882B1 (en) * 2004-03-19 2007-01-10 Harman Becker Automotive Systems GmbH Audio enhancement system and method
US20050251273A1 (en) * 2004-05-05 2005-11-10 Motorola, Inc. Dynamic audio control circuit and method
US7774078B2 (en) * 2005-09-16 2010-08-10 Sony Corporation Method and apparatus for audio data analysis in an audio player
US7826911B1 (en) * 2005-11-30 2010-11-02 Google Inc. Automatic selection of representative media clips
US20080002839A1 (en) * 2006-06-28 2008-01-03 Microsoft Corporation Smart equalizer
US20080013752A1 (en) * 2006-07-11 2008-01-17 Stephens Peter A Audio entertainment system equalizer and method
US8452427B2 (en) * 2006-09-13 2013-05-28 Savant Systems, Llc Signal path using general-purpose computer for audio processing and audio-driven graphics

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100955429B1 (ko) * 2008-07-04 2010-05-04 경상대학교산학협력단 동물용 비학습 소리 재생 시스템
KR20170093884A (ko) * 2014-12-03 2017-08-16 피터 그라함 크레이븐 고해상도 오디오의 사전-응답 주파수에서 그룹 딜레이를 갖는 비선형 필터
KR102331274B1 (ko) * 2020-11-26 2021-12-01 주식회사 버시스 사용자의 인터랙션을 이용한 오디오 소스 재생 방법 및 이를 이용한 음악 어플리케이션
US11579838B2 (en) 2020-11-26 2023-02-14 Verses, Inc. Method for playing audio source using user interaction and a music application using the same

Also Published As

Publication number Publication date
KR100832360B1 (ko) 2008-05-26
US20080075303A1 (en) 2008-03-27

Similar Documents

Publication Publication Date Title
KR100832360B1 (ko) 음원 재생기에서의 이퀄라이저 조정 방법 및 그 시스템
JP6178456B2 (ja) デジタル音声信号からハプティック・イベントを自動生成するシステム及び方法
US9239700B2 (en) System and method for automatically producing haptic events from a digital audio signal
US9330546B2 (en) System and method for automatically producing haptic events from a digital audio file
JP4795934B2 (ja) パラメータで表示された時間特性の分析
EP2661743B1 (en) Input interface for generating control signals by acoustic gestures
WO2013187986A1 (en) Systems, methods, apparatus, and computer-readable media for pitch trajectory analysis
Yoshii et al. INTER: D: a drum sound equalizer for controlling volume and timbre of drums
KR20070070728A (ko) 오디오의 자동 이퀄라이징 시스템 및 그 방법
JP2023539121A (ja) オーディオコンテンツの識別
JP2017139592A (ja) 音響処理方法および音響処理装置
Yoshii et al. Drum sound identification for polyphonic music using template adaptation and matching methods
MOUNIR ABDELMESSIH SHEHATA Acoustic Event Detection: Feature, Evaluation and Dataset Design
Ezzaidi et al. Voice singer detection in polyphonic music
CN112185325A (zh) 音频播放风格调节方法、装置、电子设备及存储介质
RICHARD Audio Signal Indexing
Sankaye et al. Human Perception for Recognition of Indian Musical Instruments Using LPC and LPI

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130429

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140429

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150429

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160428

Year of fee payment: 9