KR101430221B1 - Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium - Google Patents

Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium Download PDF

Info

Publication number
KR101430221B1
KR101430221B1 KR1020070112728A KR20070112728A KR101430221B1 KR 101430221 B1 KR101430221 B1 KR 101430221B1 KR 1020070112728 A KR1020070112728 A KR 1020070112728A KR 20070112728 A KR20070112728 A KR 20070112728A KR 101430221 B1 KR101430221 B1 KR 101430221B1
Authority
KR
South Korea
Prior art keywords
band
subband signals
frequency band
input signal
delete delete
Prior art date
Application number
KR1020070112728A
Other languages
Korean (ko)
Other versions
KR20080042696A (en
Inventor
유키 미츠후지
토루 치넨
히로유키 혼마
켄이치 마키노
Original Assignee
소니 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 주식회사 filed Critical 소니 주식회사
Publication of KR20080042696A publication Critical patent/KR20080042696A/en
Application granted granted Critical
Publication of KR101430221B1 publication Critical patent/KR101430221B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

입력신호를 대역확장한 후 입력신호를 재생하는 재생장치는 상기 입력신호에 관련되는 정보에 따라서 입력신호의 확장개시대역을 결정하는 확장 제어기와, 상기 입력 신호를 복수의 서브 밴드 신호로 분할하는 대역 분할기를 포함한다.

주파수대역은 상기 대역 분할기에 의해 상기 입력신호가 대역 분할된 복수의 서브 밴드 신호중 상기 확장 개시 대역보다 저역측의 복수의 서브 밴드 신호에 의거하여 확대된다.

Figure R1020070112728

A playback apparatus for playing back an input signal after band expansion of an input signal includes an extension controller for determining an extension start band of the input signal in accordance with the information related to the input signal and an extension controller for dividing the input signal into a plurality of sub- And a divider.

The frequency bands are divided by the band divider so that the input signal is band- And the signal is expanded based on a plurality of subband signals on the lower side of the extension start band among the plurality of subband signals.

Figure R1020070112728

Description

주파수대역확대장치 및 주파수대역확대방법, 재생장치 및 재생방법, 프로그램 및 기록 매체{Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium}TECHNICAL FIELD [0001] The present invention relates to a frequency band expanding apparatus, a frequency band extending method, a reproducing apparatus, a reproducing method, a program,

본 발명은 고주파수대역의 신호를 삭제한 후 인코드된 인코드 데이터를 보다 고음질로 재생할 수 있는 주파수대역확대장치 및 주파수대역확대방법, 재생장치 및 재생방법, 재생 처리를 컴퓨터에 실행시키는 프로그램 및 프로그램이 기록된 기록 매체에 관한 것이다.The present invention relates to a frequency band enlarging device and a frequency band enlarging device, a reproducing device and a reproducing method, a program for causing a computer to execute reproduction processing, and a program for executing a reproducing process, which can reproduce encoded encoded data with higher quality after erasing a signal of a high frequency band And a recording medium having recorded thereon.

최근에, MP3(국제표준규격 ISO/IEC 11172-3, MPEG Audio Layer3) 등의 인코드된 데이터를 제공하는 음악 전달 서비스가 확산되고 있다. 이러한 서비스의 대부분은 데이터를 다운로드할 때에 시간이 걸리지 않도록 비트율이 감소된 인코드 데이터가 분배된다.Recently, a music delivery service that provides encoded data such as MP3 (International Standard ISO / IEC 11172-3, MPEG Audio Layer 3) has been spreading. Most of these services distribute encoded data with reduced bit rate so that it does not take time to download the data.

저비트율의 인코드 데이터는 종종 인간의 귀에서 청취하기 어려운 약 15kHz 이상의 고주파대역에 속하는 신호의 성분을 삭제하여 인코드된다. 그 결과 데이터는 파일 용량이 작게 되지만, 고주파대역신호를 삭제하면 원신호가 제공하는 실제감이 없어지고 소리가 둔탁하게 되는 문제가 있다.Encoded data of a low bit rate is often encoded by deleting the components of a signal belonging to a high frequency band of about 15 kHz or more, which is difficult to hear in the human ear. As a result, the file size of the resultant data becomes small. However, if the high frequency band signal is deleted, there is a problem that the actual feeling provided by the original signal is lost and the sound becomes dull.

이와 같은 문제에 대처하기 위해, HE-AAC(국제표준규격 ISO/IEC 14496-3, High Efficiency MPEG4 AAC)등의 인코드 방식에서는 대역 확장 기술에 의해서, 약 15kHz이상의 고주파수대역에 속하는 신호 성분을 생성함으로써 원신호에 가까운 고주파성분을 재생하고 있다. 또한, 최근에는, 고주파수대역에 속하는 신호의 성분을 삭제하여 인코드된 데이터를 복호화 처리하여 얻을 수 있는 신호를 입력하고, 고주파수대역을 보완하는 후처리 대역 확장 기술 등에 의해 원신호에 가까운 고주파수성분이 재생된다.To cope with such a problem, in the encoding method such as HE-AAC (International Standard ISO / IEC 14496-3, High Efficiency MPEG4 AAC), a signal component belonging to a high frequency band of about 15 kHz or more Thereby reproducing a high-frequency component close to the original signal. In recent years, a high-frequency component close to the original signal is obtained by a post-processing band extension technique or the like which inputs a signal obtained by decoding the encoded data by deleting the component of the signal belonging to the high frequency band, Is reproduced.

예를 들면, 일본특허출원공보 No. JP 2004-184472(특허 문헌 1)에서 제시된 기술에서는, 입력 신호와 국부 발진 신호를 혼합하여 고주파수대역이 생성되고, 인코드 방식이나 악곡의 장르에 대응하는 통과역특성(a passband characteristic)으로 필터링한 고역주파수 성분과 입력 신호를 가산함으로써 대역을 보완하고 있다. 일본특허출원공보 No. JP 2002-175092(특허 문헌 2)에서 제시된 기술에서 주파수대역 신호성분을 부여하기 위해 푸리에(Fourier)변환에 의해 입력 신호가 주파수 영역으로 변환되고, 저주파대역의 주파수 스펙트럼으로부터 고주파수대역의 포락선이 추정되며, 그 포락에 따르도록 저주파대역의 주파수 스펙트럼의 이득이 조정된다. For example, in Japanese Patent Application Laid-Open No. Hei. According to the technique disclosed in JP 2004-184472 (Patent Document 1), a high frequency band is generated by mixing an input signal and a local oscillation signal, and a high frequency band is generated by filtering by a passband characteristic corresponding to an encoding scheme or a genre of music The band is compensated by adding the high frequency component and the input signal. Japanese Patent Application Laid-open No. Hei. In the technique disclosed in JP 2002-175092 (Patent Document 2), an input signal is converted into a frequency domain by Fourier transformation to give a frequency band signal component, an envelope of a high frequency band is estimated from a frequency spectrum of a low frequency band , The gain of the frequency spectrum of the low frequency band is adjusted to follow the envelope.

그러나, 상기 특허 문헌 1에서 제시된 기술에서는 미리 학습하는 고역통과 필터의 통과역특성의 종류에 한계가 있어, 고주파수대역의 이득 조정에 있어서의 유연성을 얻을 수 없다. 또한, 상기 특허 문헌 2에서 제시된 기술에서는 입력신호가 주파수 영역에서 조정된 진폭을 얻기 위해 푸리에 변환되고, 그 결과 신호가시간영역신호를 얻기 위해 역푸리에 변환되지만, 이 기술은 푸리에 변환장에 의존한 시간영역 앨리어싱(aliasing)이 발생하는 문제가 있다.However, in the technique disclosed in Patent Document 1, there is a limitation in the type of the pass band characteristic of the high pass filter to be preliminarily learned, and flexibility in the gain adjustment in the high frequency band can not be obtained. Further, in the technique disclosed in Patent Document 2, although the input signal is Fourier transformed to obtain the adjusted amplitude in the frequency domain, and the resultant signal is inverse Fourier transformed to obtain the time domain signal, the technique is based on the Fourier transform field There is a problem that time-domain aliasing occurs.

또한, 일본특허 No. 3538122(특허 문헌 3)에서 대역 분할 필터를 이용하는 것으로 이러한 문제를 회피하고 있다. 도 10은 특허 문헌 3에서 제안된 종래기술의 재생장치의 블럭도이다. 이 기술에서는 입력된 PCM(Pulse-Code Modulation) 신호가 대역 분할부(101)에서 복수의 서브 밴드 신호로 분해된다. 그리고 포락 추정부(102)에서 프레임 단위의 주파수 포락이 추정되며, 고주파대역생성부(103)에서 고주파수대역에 속하는 서브 밴드 신호가 생성된다. 마지막으로, 대역 확장된 서브 밴드 신호가 대역 합성부(104)로 공급되고, 대역 확장된 PCM 신호가 출력된다.Further, in Japanese Patent No. 3538122 (Patent Document 3), this problem is avoided by using a band-dividing filter. 10 is a block diagram of a conventional playback apparatus proposed in Patent Document 3. [ In this technique, an input PCM (Pulse-Code Modulation) signal is decomposed into a plurality of subband signals in the band division unit 101. [ Then, the envelope estimating unit 102 estimates a frame-by-frame frequency envelope, and a high-frequency band generating unit 103 generates a subband signal belonging to a high-frequency band. Finally, the band-extended subband signal is supplied to the band synthesizer 104, and the band-extended PCM signal is output.

그러나, 상기 특허 문헌 3에서 제안된 기술은 세 가지 문제가 발생된다. 첫째는, 일정한 수의 프레임 단위로 실시된 처리의 결과로서 입력 신호의 1프레임내에서의 시간적 변동에 따르는 고주파수대역 신호의 생성이 실행되지 않는 문제이다. 둘째는, 극도로 큰 신호가 입력되었을 경우, 거기에 대응하여 고주파수대역 의 신호도 매우 크게 계산되어 대역 합성 필터의 출력이 오버플로우 할 가능성이 있다. 셋째는, 인코드 데이터를 복호화 처리하여 얻어진 신호가 입력되고, 고주파수대역이 보완되는 후처리 대역 확장 기술에서는 대역 확장을 위한 대역개시 주파수대역을 알 수 없다.However, the technique proposed in Patent Document 3 causes three problems. First, it is a problem that the generation of the high-frequency band signal is not performed in accordance with the temporal fluctuation of the input signal within one frame as a result of the processing performed on a constant number of frame basis. Secondly, when an extremely large signal is input, there is a possibility that the signal of the high frequency band corresponding to it is also calculated very large, and the output of the band combining filter may overflow. Third, a signal obtained by decoding the encode data is input, and a band start frequency band for band extension can not be known in a post-processing band extension technique in which a high frequency band is supplemented.

본 발명은 상기 문제점을 감안하여, 고주파수대역에 속하는 신호의 성분을 삭제하여 인코드된 인코드 데이터를 보다 고음질로 재생할 수 있는 주파수대역확대장치 및 주파수대역확대방법, 재생장치 및 재생방법, 재생 처리를 컴퓨터에 실행시키는 프로그램 및 프로그램이 기록된 기록 매체에 관한 것이다.SUMMARY OF THE INVENTION In view of the above problems, it is an object of the present invention to provide a frequency band enlarging device and a frequency band enlarging method, a reproducing device and reproducing method, a reproducing method and a reproducing method capable of deleting components of a signal belonging to a high frequency band and reproducing the encoded encoded data with higher quality. And a recording medium on which the program is recorded.

본 발명의 일실시예에서, 입력신호의 주파수대역을 확대하는 주파수대역확대장치가 제공된다. 이 주파수대역확대장치는 상기 입력 신호의 확장 개시 대역을 결정하는 확장 제어 수단과, 상기 입력 신호를 복수의 서브 밴드 신호로 분할하는 대역 분할 수단을 구비하고, 상기 대역 분할 수단에 의해 상기 입력신호가 대역 분할된 복수의 서브 밴드 신호중 상기 확장 개시 대역보다 낮은 저역측의 복수의 서브 밴드 신호에 의거하여 주파수대역이 확대되는 것을 특징으로 한다.In one embodiment of the present invention, a frequency band extending apparatus for enlarging a frequency band of an input signal is provided. The frequency band extending apparatus includes expansion control means for determining an extension start band of the input signal and band dividing means for dividing the input signal into a plurality of subband signals, The frequency band is expanded based on a plurality of subband signals on the low-frequency side lower than the extension start frequency band among a plurality of subband signals divided into bands.

본 발명의 다른 실시예에서, 입력신호의 주파수대역을 확대하는 주파수대역확대방법이 제공된다. 이 주파수대역확대방법은 입력신호에 관련되는 정보에 따라서 입력신호용 확장개시대역을 결정하는 확장제어단계와, 상기 입력 신호를 복수의 서브 밴드 신호로 분할하는 대역 분할 단계와, 상기 대역 분할 단계에서 상기 입력신호가 대역 분할된 복수의 서브 밴드 신호중 상기 확장 개시 대역보다 낮은 저역측의 복수의 서브 밴드 신호에 의거하여 주파수대역이 확대되는 주파수대역확대단계를 포함한다.In another embodiment of the present invention, there is provided a frequency band enlarging method for enlarging a frequency band of an input signal. The frequency band extension method includes an extension control step of determining an extension start band for an input signal according to information related to an input signal, a band division step of dividing the input signal into a plurality of subband signals, When the input signal is band- And expanding the frequency band based on the plurality of subband signals on the low-frequency side lower than the expansion start frequency band among the plurality of subband signals.

본 발명의 다른 실시예에서, 입력신호를 대역확장한 후 입력신호를 재생하는 재생장치가 제공된다. 이 재생장치는 상기 입력신호에 관련되는 정보에 따라서 입력신호용 확장개시대역을 결정하는 확장 제어 수단과, 상기 입력 신호를 복수의 서브 밴드 신호로 분할하는 대역 분할 수단을 구비하고, 상기 대역 분할 수단에 의해 상기 입력신호가 대역 분할된 복수의 서브 밴드 신호중 상기 확장 개시 대역보다 저역측의 복수의 서브 밴드 신호에 의거하여 주파수대역이 확대되는 것을 특징으로 한다.In another embodiment of the present invention, there is provided a playback apparatus for playing back an input signal after bandwidth expansion of an input signal. The reproduction apparatus includes expansion control means for determining an extension start band for an input signal in accordance with information related to the input signal and band dividing means for dividing the input signal into a plurality of subband signals, The input signal is band divided And the frequency band is expanded based on a plurality of subband signals on the lower side of the extension start band among the plurality of subband signals.

본 발명의 다른 실시예에서, 입력신호를 대역확장한 후 입력신호를 재생하는 재생방법이 제공된다. 이 재생방법은 상기 입력신호에 관련되는 정보에 따라서 입력신호용 확장개시대역을 결정하는 확장 제어 단계와, 상기 입력 신호를 복수의 서브 밴드 신호로 분할하는 대역 분할 단계를 구비하고, 상기 대역 분할 단계에 의해 상기 입력신호가 대역 분할된 복수의 서브 밴드 신호중 상기 확장 개시 대역보다 저역측의 복수의 서브 밴드 신호에 의거하여 주파수대역이 확대되는 주파수대역확대단계를 포함한다.In another embodiment of the present invention, a playback method is provided for playing back an input signal after bandwidth expansion of the input signal. This reproduction method includes an extension control step of determining an extension start band for an input signal in accordance with information related to the input signal and a band dividing step of dividing the input signal into a plurality of subband signals, The input signal is band divided And expanding the frequency band based on a plurality of subband signals on the lower side of the extended start band among the plurality of subband signals.

본 발명의 다른 실시예에서,입력신호를 대역확장한 후 입력신호를 재생하는 처리를 컴퓨터에 실행시키는 프로그램이 제공된다. 이 프로그램은 상기 입력신호에 관련되는 정보에 따라서 입력신호의 확장개시대역을 결정하는 확장 제어 단계와, 상기 입력 신호를 복수의 서브 밴드 신호로 분할하는 대역 분할 단계를 구비하고, 상기 대역 분할 단계에 의해 상기 입력신호가 대역 분할된 복수의 서브 밴드 신호중 상기 확장 개시 대역보다 저역측의 복수의 서브 밴드 신호에 의거하여 주파수대역이 확대되는 주파수대역확대단계를 컴퓨터에 실행시키는 것을 특징으로 한다.In another embodiment of the present invention, there is provided a program for causing a computer to execute processing for expanding an input signal and then reproducing an input signal. The program includes an extension control step of determining an extension start band of an input signal in accordance with information related to the input signal and a band dividing step of dividing the input signal into a plurality of subband signals, The input signal is band divided The frequency band expanding step of expanding the frequency band based on a plurality of subband signals on the lower side of the extended start band among the plurality of subband signals.

본 발명의 다른 실시예에서, 입력신호를 대역확장한 후 입력신호를 재생하는 처리를 컴퓨터에 실행시키는 프로그램이 기록된 기록 매체가 제공된다. 이 프로그램은 상기 입력신호용 확장개시대역을 결정하는 확장 제어 단계와, 상기 입력 신호를 복수의 서브 밴드 신호로 분할하는 대역 분할 단계를 구비하고, 상기 대역 분할 단계에 의해 상기 입력신호가 대역 분할된 복수의 서브 밴드 신호중 상기 확장 개시 대역보다 저역측의 복수의 서브 밴드 신호에 의거하여 주파수대역이 확대되는 주파수대역확대단계를 컴퓨터에 실행시키는 것을 특징으로 한다.In another embodiment of the present invention, there is provided a recording medium on which a program for causing a computer to execute processing for expanding an input signal and then reproducing an input signal is provided. The program includes an extension control step of determining an extension start band for the input signal and a band dividing step of dividing the input signal into a plurality of subband signals, The frequency band expanding step of expanding the frequency band based on a plurality of subband signals on the lower side of the extended start band among the plurality of subband signals.

상기 본 발명의 실시예에 의하면, 입력 신호의 확장 개시 대역이 결정될 수 있고, 확장 개시 대역보다 저역측의 복수의 서브 밴드 신호에 의거하여 주파수대역을 확대된다. 따라서, 입력신호는 고음질로 재생될 수 있다.According to the embodiment of the present invention, the extension start band of the input signal can be determined, and the frequency band is expanded based on the plurality of subband signals on the lower side than the extension start band. Therefore, the input signal can be reproduced with high sound quality.

이하, 본 발명의 구체적인 실시예에 대해서 도면을 참조하여 상세하게 설명한다. 이 실시예는 입력신호를 고음질로 재생하도록 한다.Hereinafter, specific embodiments of the present invention will be described in detail with reference to the drawings. This embodiment allows the input signal to be reproduced with high sound quality.

도 1은 본 실시예에 있어서의 주파수대역확대 장치(10)의 구성을 나타내는 블럭도이다. 이 주파수대역확대 장치(10)는 확장 제어부(11), 대역 분할부(12), 시간 분류부(13), 포락 추정부(14), 대역 보완부(15), 고주파대역생성부(16), 위상 조정부(17) 및 대역 합성부(18)를 포함한다.1 is a block diagram showing a configuration of a frequency band extending apparatus 10 according to the present embodiment. The frequency band extending apparatus 10 includes an extension control unit 11, a band dividing unit 12, a time dividing unit 13, a envelope estimating unit 14, a band compensating unit 15, a high frequency band generating unit 16, A phase adjusting unit 17, and a band synthesizing unit 18.

확장 제어부(11)는 입력신호에 관련되는 인코드 방식의 종류, 샘플링 레이트, 비트율 등의 사이드 정보가 공급되고, 이 사이드 정보에 의거하여 확장개시 주파수대역을 결정하고 결정된 확장개시 주파수대역을 대역 분할부(12)에 공급한다. 선택적으로, 사이드 정보는 입력신호의 인코드 방식의 종류에 따라서 미리 설정된 값이 되거나 임의의 사용자 지정값이 될 수 있다.The extension control unit 11 is supplied with side information such as an encoding type, a sampling rate, a bit rate, etc. related to an input signal, determines an extension start frequency band based on the side information, (12). Optionally, the side information may be a preset value or an arbitrary user specified value depending on the type of encoding scheme of the input signal.

대역 분할부(12)는 입력 신호를 복수의 서브 밴드 신호로 분할한다. 그 결과, 대역 분할부(12)는 생성된 복수의 서브 밴드 신호중 확장 개시 주파수대역보다 저역측의 복수의 서브 밴드 신호(이하, 저역 서브 밴드 신호라고 한다.)를 대역 합성부(18)에 공급한다. 또한, 대역 분할부(12)는 복수의 저역 서브 밴드 신호중 확장 개시 주파수대역에 가까운 쪽의 복수의 서브 밴드 신호(이하, 확장 저역 서브 밴드 신호라고 한다)를 시간 분류부(13) 및 고주파대역생성부(16)로 공급한다.The band dividing section 12 divides the input signal into a plurality of subband signals. As a result, the band dividing section 12 supplies a plurality of subband signals (hereinafter, referred to as low-band subband signals) on the lower side of the generated start frequency band to the band combining section 18 do. In addition, the band dividing section 12 divides a plurality of subband signals (hereinafter, referred to as extended low band subband signals) closer to the extension start frequency band into a plurality of low frequency subband signals into a time division section 13 and a high frequency band generation (16).

시간 분류부(13)는 확장 저역 서브 밴드 신호의 시간 방향의 과도 검출을 실시하고, 확장 저역 서브 밴드 신호를 시간 방향으로 그룹화하고, 확장 저역 서브 밴드 신호의 그룹 마다의 평균 샘플 파워를 생성하고, 이 평균 샘플 파워를 포락 추정부(14)에 공급한다.The time division unit 13 performs temporal transient detection of the extended low-band subband signal, groups the extended low-band subband signals in the time direction, generates average sample power for each group of the extended low-band subband signals, And supplies the average sample power to the envelope estimating unit 14. [

포락 추정부(14)는 시간 분류부(13)에서 생성된 평균 샘플 파워의 합으로부터 그룹마다 그룹 파워를 얻고, 확장 저역 서브 밴드 신호 전체의 그룹 파워의 평균치를 계산한다. 그리고, 그룹 파워의 평균치를 기점으로 하여 확장 주파수대 역보다 고역측의 서브 밴드의 포락치가 추정되고, 추정된 포락치가 대역 보완부(15)에 공급된다.The envelope estimating unit 14 obtains the group power per group from the sum of the average sample powers generated in the time classifying unit 13 and calculates the average value of the group power of the entire extended low band subband signal. Then, the envelope of the subband on the high-frequency side is estimated from the average value of the group power as the starting point, and the estimated envelope is supplied to the band compensating unit 15. [

대역 보완부(15)는 고역측의 서브 밴드의 포락치와 저역측의 서브 밴드의 포락치로부터 확장 저역 서브 밴드 신호에서 고역측의 서브 밴드 신호까지 이득 조정치를 계산하고, 계산된 이득 조정치를 고주파대역생성부(16)에 공급한다.The band compensating unit 15 calculates the gain adjustment value from the envelope of the high-frequency subband and the envelope of the low-frequency subband to the high-frequency subband signal and outputs the calculated gain adjustment value to the high- And supplies it to the band generating section 16. [

고주파대역생성부(16)는 고역측의 서브 밴드신호의 이득 조정치를 확장 저역 서브 밴드 신호에 곱셈하는 것으로, 고역측의 서브 밴드 신호를 생성하고, 생성된 고역측의 서브 밴드 신호를 위상 조정부(17)에 공급한다.The high frequency band generating section 16 multiplies the gain adjustment value of the high frequency side subband signal by the extended low frequency subband signal to generate a high frequency side subband signal and supplies the generated high frequency side subband signal to the phase adjusting section 17).

위상 조정부(17)는 고주파대역생성부(16)에 의해 생성된 고역측의 서브 밴드 신호의 위상을 변경하여 고역측의 위상이 변경된 서브 밴드 신호를 대역 합성부(18)에 공급한다.The phase adjusting unit 17 changes the phase of the high-frequency side subband signal generated by the high frequency band generating unit 16 and supplies the subband signal whose phase is changed on the high frequency side to the band combining unit 18. [

대역 합성부(18)는 위상 조정부(17)에서 공급된 고역측의 서브 밴드 신호와 대역 분할부에서 공급된 저역 서브 밴드 신호를 대역 합성하고, 그 결과로서 생기는 대역 확대된 신호를 출력한다.The band combining section 18 performs band combining on the high-frequency side subband signal supplied from the phase adjusting section 17 and the low-frequency subband signal supplied from the band dividing section, and outputs a resultant band-widened signal.

이와 같이 입력신호에 관련되는 사이드 정보를 이용함으로써, 대역 확장을 위한 확장 개시 주파수대역이 고정밀도로 결정될 수 있다. 또한, 확장 개시 주파수대역보다 고역측의 서브 밴드 신호가 확장 개시 주파수대역에 가까운 확장 저역 서브 밴드 신호에 의거하여 생성되기 때문에, 보다 고음질로 주파수대역이 확대될 수 있다. 또한, 생성된 고역측의 서브 밴드 신호의 위상을 변경함으로써 오버플로우가 방지될 수 있다.By using the side information related to the input signal in this way, the expansion start frequency band for band extension can be determined with high accuracy. In addition, since the subband signal on the high-frequency side is generated based on the extended low-frequency subband signal close to the extension start frequency band, the frequency band can be expanded to a higher quality. In addition, overflow can be prevented by changing the phase of the generated high-frequency subband signal.

이하, 상술한 주파수대역확대 장치의 각 구성부를 상세하게 설명한다.Hereinafter, each component of the above-described frequency band expanding apparatus will be described in detail.

확장 제어부The extension control unit

확장 제어부(11)는 입력신호에 관련되는 사이드 정보에 의거하여 확장 개시 주파수대역을 결정한다. 이 사이드 정보는 인코드 방식의 종류, 샘플링 레이트, 비트율 등을 포함한다. 선택적으로, 사이드 정보는 입력신호의 인코드 방식의 종류에 따라서 미리 설정된 값이 되거나 임의의 사용자 지정값이 될 수 있다.The extension control unit 11 determines the extension start frequency band based on the side information related to the input signal. This side information includes a type of encoding scheme, a sampling rate, a bit rate, and the like. Optionally, the side information may be a preset value or an arbitrary user specified value depending on the type of encoding scheme of the input signal.

일반적으로, 입력 신호의 주파수대역은 인코드 방식의 종류, 샘플링 레이트, 비트율등의 다양한 사이드 정보와 상관관계를 가지고 있다. 따라서, 본 실시예에서는, 이 사이드 정보를 이용하여 입력 신호의 주파수대역을 추정하고, 주파수대역보완하는 확장 개시 주파수대역(sb)을 결정한다. 결정된 확장 개시 주파수대역(sb)은 대역 분할부(12)로 공급된다.Generally, the frequency band of the input signal correlates with various side information such as the type of encoding scheme, the sampling rate, and the bit rate. Therefore, in the present embodiment, the frequency band of the input signal is estimated using this side information, and the extended start frequency band sb for compensating the frequency band is determined. The determined extended start frequency band sb is supplied to the band division unit 12. [

도 2는 사이드 정보와 확장 개시 주파수대역(sb)사이의 관계를 나타내는 도면이다. 도 2에 나타내는 바와 같이, 입력 신호에 속하는 주파수대역이 16개의 서브밴드로 분할했을 경우이며, 인코드 방식, 샘플링 레이트 및 비트율에 따라서 확장 개시 주파수대역(sb)(sb는 0에서 15까지의 임의의 정수)이 결정된다. 예를 들면, 사이드 정보의 인코드 방식이 B이고, 샘플링 레이트가 44100Hz이며, 비트율이 64-96kbps인 경우, 확장 개시 주파수대역(sb)은 9로 결정된다. 사이드 정보를 결정하기 위한 요소들은 스테레오/모노, CBR/VBR 등을 포함한다.2 is a diagram showing the relationship between the side information and the extended start frequency band sb. As shown in FIG. 2, when the frequency band belonging to the input signal is divided into 16 subbands, the extended start frequency band sb (sb is an arbitrary arbitrary range from 0 to 15) according to the encoding scheme, sampling rate and bit rate Is determined. For example, when the encoding method of the side information is B, the sampling rate is 44100 Hz, and the bit rate is 64-96 kbps, the extension start frequency band sb is determined to be 9. The elements for determining side information include stereo / mono, CBR / VBR, and the like.

대역 treason 분할부Partition

대역 분할부(12)는 입력 신호(x(n))를 16개의 서브 밴드 신호(x(ib, n))에 분할한다.(ib=0~15, 여기서 id가 큰 만큼 고역의 서브 밴드 신호를 나타낸다.) 이 16개의 서브 밴드 신호(x(ib, n))중 서브 밴드 0으로부터 확장 개시 주파수대역(이하, sb라고 부른다.)의 하나의 서브 밴드 전인 서브밴드(sb-1)까지의 영역의 서브 밴드에 속하는 서브 밴드 신호(x(ib, n))를 대역 합성부(18)로 공급하고, sb-4에서 sb-1까지의 서브 밴드에 속하는 서브 밴드 신호(x(ib, n))를 시간 분류부(13) 및 고주파대역생성부(16)에 공급한다.The band dividing section 12 divides the input signal x (n) into 16 subband signals x (ib, n) (where ib = 0 to 15, (Sb-1) which is one subband of the extended start frequency band (hereinafter referred to as sb) among the 16 subband signals x (ib, n) The subband signals x (ib, n) belonging to the subbands from sb-4 to sb-1 are supplied to the band synthesizer 18, ) To the time division section 13 and the high frequency band generation section 16. [

본 실시예에서는 입력 신호(x(n))가 16개의 서브 밴드 신호(x(ib, n))로 분할되는 것으로 기술되었지만, 입력 신호가 분할되는 서브 밴드 분할 수가 한정되는 것은 아니다.Although the input signal x (n) is described as being divided into 16 subband signals x (ib, n) in this embodiment, the number of subbands in which the input signal is divided is not limited.

시간 time 분류부Classification section

시간 분류부(13)는 소리의 상승 또는 하강 등의 시간 방향의 과도를 검출을 할 때마다 다른 그룹으로서 신호를 분류하고, 그룹마다 고주파수대역을 보완한다.이러한 배치에 의해, 비연속상태 및 연속상태가 있고, 이득이나 주파수 특성에 차이가 있는 자연계의 음향 신호에 대해도 음질 열화를 방지할 수 있다. 한편, 특허 문헌 3에 제안된 기술은 프레임 처리가 실시되고, 프레임 단위로 처리가 실시되어 고주파대역을 보완하고 있다. 즉, 자연계의 음향 신호를 분리하지 않고, 시간 변동을 고려하지 않고 보완이 실시된다. 이것이 음질 열화의 원인이 된다.The time classifying section 13 classifies the signals as different groups and compensates for the high frequency band for each group every time it detects transitions in the time direction such as rising or falling of the sound. By this arrangement, , And sound quality deterioration can be prevented even for a natural sound signal having a difference in gain or frequency characteristics. On the other hand, in the technique proposed in Patent Document 3, frame processing is performed, and processing is performed on a frame-by-frame basis to supplement the high frequency band. That is, the sound signal of the natural system is not separated, but the sound signal is compensated without considering the time variation. This causes sound quality deterioration.

ㆍ시간 분할 및 파워 포락선의 산출 ㆍ Time division and power envelope calculation

대역 분할부(12)에서 공급된 sb-4에서 sb-1까지의 저역측의 서브 밴드 신호(x(ib, n))를 입력으로서 이용한다. 각 서브 밴드 신호(x(ib, n))를 16개로 분할하고, 그것은 슬롯이라 부르는 단위로 한다. 그리고 샘플당 평균 샘플 파워(power(ib, islot))가 슬롯마다 계산되고, 각 슬롯의 샘플수는 8개로 설정된다.(X (ib, n) on the low-band side from sb-4 to sb-1 supplied from the band dividing section 12 as an input. Each subband signal x (ib, n) is divided into 16, and it is a unit called a slot. The average sample power per sample (power (ib, islot)) is calculated for each slot, and the number of samples in each slot is set to eight.

Figure 112007079683352-pat00001
Figure 112007079683352-pat00001

ㆍ과도 검출에 의한 그룹화ㆍ Grouping by transient detection

sb-4로부터 sb-1까지의 저역측의 서브 밴드에서는 평균 샘플 파워(power(ib, islot))가 16슬롯 전체에 대해 시간 방향(시간 축으로 따라서 전 및 후)에서 비교되고, 상승 및 하강을 검출하기 위한 과도검출이 실시된다. 과도검출이란 용어는 평균 샘플 파워가 시간방향에서 큰 변동을 나타내는 위치의 검출을 의미한다.the average sample power power (ib, islot) is compared in the time direction (before and after the time axis) with respect to the entire 16 slots in the low-band sideband from sb-4 to sb-1, The transient detection is performed. The term transient detection refers to the detection of a location where the average sample power exhibits large variations in the time direction.

탐색중의 슬롯과 그 슬롯전의 슬롯의 평균 샘플 파워(power(ib, islot-1))의 비율(ratio)을 산출하고, 그 비율이 16배 이상인 경우 상승으로서 판단하고, 그 비율이 1/16(=0.0625)배 이하인 경우 하강으로 판단하여 일시적으로 과거에 과도가 검출된 슬롯으로부터 현재 과도가 검출된 슬롯의 다음 슬롯까지를 1개의 그룹으로 형성한다.The ratio of the average sample power (power (ib, islot-1)) of the slot being searched and the slot before the slot is calculated. When the ratio is 16 times or more, (= 0.0625) times or less, it is judged as a fall, and the slot from the slot in which the transient was detected in the past is formed into one group from the slot next to the slot in which the current transient is detected.

어느 서브 밴드(ib)에서 상승 또는 하강이 검출되었을 경우 sb-4로부터 sb-1까지의 저역측의 모든 서브 밴드에서 상승 및 하강이 검출된 것으로 가정한다.It is assumed that rising and falling are detected in all the subbands on the low-band side from sb-4 to sb-1 when a rise or a fall is detected in any subband ib.

Figure 112007079683352-pat00002
Figure 112007079683352-pat00002

이 결과, 시간 변동을 추종하여 그룹화가 실시되어 보다 자연계의 음향 신호에 가까운 고주파대역 성분을 생성하는 것이 가능하므로 고음질이 산출될 수 있다.As a result, grouping is performed following the time variation, so that it is possible to generate a high-frequency band component that is closer to the natural sound signal, so that high-quality sound can be calculated.

또한, 본 실시예에서는 대역 분할부에서 공급된 sb-4에서 sb-1까지의 저역측의 서브 밴드 신호(x(ib,n))가 각각 시간 방향으로 16개로 분할되고, 그 단위를 슬롯으로 하고 있지만, 시간 방향의 분할수에 대해서는 한정되지 않는다. 또한, 1슬롯은 8샘플을 포함하고 있지만, 시간 방향의 분할수 및 1슬롯의 샘플수는 한정되지 않는다. 또한, 과도 검출을 위한 비율이 16배 이상인 경우 상승으로서 판단되고, 비율이 1/16(=0.0625)배 이하인 경우 하강으로서 판정되며, 대역 분할수, 시간 방향의 분할수 등에 대응하여 상승 및 하강의 검출을 위한 임계값이 변경될 수 있다.In the present embodiment, the subband signals x (ib, n) on the low-band side from sb-4 to sb-1 supplied from the band dividing unit are divided into 16 in the time direction, However, the number of division in the time direction is not limited. Although one slot includes eight samples, the number of divisions in the time direction and the number of samples in one slot are not limited. When the ratio for transient detection is 16 times or more, it is judged as an increase. When the ratio is 1/16 (= 0.0625) times or less, it is judged as a fall. The threshold value for detection can be changed.

ㆍ과도 검출 대상 서브 밴드의 결정 Determination of subbands for transient detection

부호 열화를 수반하는 인코드 신호의 그룹화에서는 과도 검출을 실시하는 대상의 저역측의 서브 밴드 신호의 열화 상태에 의해서 시간 변동의 정확성이 좌우된다. 도 3은 부호 열화가 격렬한 경우의 주파수 진폭 특성을 나타내는 도면이다. 도 3에 나타낸 바와 같이, 부호 열화("a")가 격렬한 경우, 주파수 축상의 구멍으로서 보여지며, 시간 분류부(13)는 그 구멍을 신호의 감쇠 상태로서 해석함으로써 원신호에서 과도 부분이 존재하지 않는 개소에서도 잘못된 과도를 검출하는 문제가 있다. 그 결과, 그룹화의 정밀도가 낮아지기 때문에 음질이 열화되고, 그러한 과도 검출에 의해 계산량이 증가된다.In the grouping of the encode signals accompanied by the code degradation, the accuracy of the time variation depends on the deterioration state of the low-band side subband signal to be subjected to transient detection. Fig. 3 is a diagram showing the frequency amplitude characteristic when the code degradation is vigorous. As shown in Fig. 3, when the code degradation ("a") is intense, it is seen as a hole on the frequency axis, and the time classifying section 13 interprets the hole as the attenuation state of the signal, There is a problem of detecting an erroneous transient even in a place where it does not exist. As a result, the accuracy of the grouping is lowered, so that the sound quality is deteriorated, and the amount of calculation is increased by such transient detection.

이들 문제에 대해서, 본 실시예에서는 평균 샘플 파워의 최대치를 서브 밴드 마다 비교하고, 과도 검출에 필요한 서브 밴드인지 아닌지를 판단한다. 그 후, 실제의 과도 검출을 실시한다. 또한, 모든 서브 밴드가 극단적으로 미소한 신호의 경우에 청취할 수 없는 범위의 시간 변동에 의한 계산량의 증가를 막기 위해 과도 검출은 실시되지 않는다.As to these problems, in this embodiment, the maximum value of the average sample power is compared for each subband, and it is judged whether or not the subband is necessary for the transient detection. Then, actual transient detection is performed. In addition, in the case of a signal in which all the subbands are extremely small, no transient detection is performed in order to prevent an increase in the amount of calculation due to the time variation in the range that can not be heard.

도 4는 과도 검출의 대상 서브 밴드를 결정하는 처리의 흐름을 나타내는 플로차트이다.4 is a flowchart showing a flow of processing for determining a target subband for transient detection.

스텝(S41~S43)에서는, sb-4에서 sb-1까지의 저역측의 4개의 서브 밴드 신호 각각에 있어서, 전체 16슬롯의 평균 샘플 파워의 최대값(power(ib, islot))이 검색되고, 이 최대값이 그 서브 밴드의 대표값 max power(ib)로 설정된다.In steps S41 to S43, the maximum value power (ib, islot) of the average 16-slot average sample power is searched for each of the four subband signals on the low-band side from sb-4 to sb-1 , And this maximum value is set to the representative value max power (ib) of the subband.

스텝(S44)에서는, 저역측의 4개의 서브 밴드로 각각 얻어진 4개의 대표값 (max power(ib)(ib=sb-4, sb-3, sb-2, sb-1)) 중에서 최대값을 가지는 서브 밴드가 패런트(parent) 서브 밴드(pb)로 설정되고, 나머지는 차일드(child)서브 밴드(cb(0), cb(1), cb(2))로 설정된다. 패런트 밴드의 대표값이 max power(pb)로서 설정된다(스텝(S45)).In step S44, the maximum value among the four representative values (max power (ib) (ib = sb-4, sb-3, sb-2, sb-1) obtained by the four subbands on the low- And the rest are set to the child subbands cb (0), cb (1), cb (2)). The representative value of the parent band is set as max power (pb) (step S45).

스텝(S46)에서 패런트 서브 밴드의 대표값(max power(pb))이 16비트 풀 스케일 기준에 의거하여 -80[dBFs]이상의 레벨과 동등하다고 판정되면, 스텝(S47)으로 처리가 진행된다.If it is determined in step S46 that the representative value max power (pb) of the parent subband is equal to or higher than -80 [dBFs] based on the 16-bit full scale reference, the process proceeds to step S47 .

한편, 패런트 서브 밴드의 대표값(max power(pb))이 16비트 풀 스케일 기준에 의거하여 -80[dBFs]보다 작은 레벨과 동등한 경우, 저역측의 4개의 밴드에 대해 과도 검출에 의한 시간 방향의 그룹화가 실시되지 않는다. 이것은 서브 밴드가 없다는 것을 의미한다.(스텝(S48)). 이 결과, 미소 신호의 과도 검출이 실시되지 않아 쓸데없는 계산량의 증가를 막을 수 있다.On the other hand, when the representative value (max power (pb)) of the parent subbands is equal to a level lower than -80 [dBFs] based on the 16-bit full-scale criterion, the time Direction grouping is not performed. This means that there is no subband (step S48). As a result, the transient detection of the small signal is not performed, thereby preventing the unnecessary increase of the calculation amount.

스텝(S47)에서, max power(ib)가 -80[dBFs] 이상이라고 판정되고, 패런트 서브 밴드(pb)의 대표값(max power(pb))에 대해서 어느 차일드 서브 밴드(cb(m))의 대표값(max power(cb(m)))이 0.0015625배보다 작은 값이라면, 그 처리는 스텝(S49)으로 진행되고, 이 서브 밴드에 대해 과도 검출이 전혀 실시되지 않는다.If it is determined in step S47 that max power (ib) is equal to or larger than -80 [dBFs], and if any child subband cb (m) is set to the representative value max power (pb) of the parent subband pb (Max power (cb (m))) is less than 0.0015625 times, the process proceeds to step S49, and no transient detection is performed on this subband.

한편, max power(ib)가 -80[dBFs] 이상이며, 패런트 서브 밴드(pb)의 대표값 (max power(pb))에 대해서 어느 차일드 서브 밴드(cb(m))의 대표값(max power(cb(m)))이 0.0015625배 이상의 값이라면, 그 처리는 스텝(S50)으로 진행되어 이 서브 밴드에 대해 과도 검출이 실시된다. 과도 검출을 위한 서브 밴드에는 패런트 서브 밴드(pb)도 포함된다.On the other hand, when the max power (ib) is equal to or larger than -80 [dBFs] and the representative value max (max) of any child subbands cb If power (cb (m)) is a value of 0.0015625 times or more, the process proceeds to step S50, and transient detection is performed on this subband. The subband for transient detection also includes the parent subband pb.

Figure 112007079683352-pat00003
Figure 112007079683352-pat00003

이 결과, 부호 열화에 의한 시간 변동의 오류 검출을 방지하여 자연 음향 신호에 가까운 시간 포락을 재현하는 것으로 고음질을 재생하는 것이 가능하다. 시간 분류부(13)에서 생성된 sb-4에서 sb-1까지 저역측의 4개의 서브 밴드(ib)의 평균 샘플 파워(power( ib, islot))는 포락 추정부(14)에 공급된다.As a result, it is possible to reproduce a high quality sound by preventing the error detection of the time variation due to the code deterioration and reproducing the temporal envelope close to the natural acoustic signal. The average sample power power (ib, islot) of the four subbands ib on the low-band side from sb-4 to sb-1 generated in the time classifying section 13 is supplied to the envelope estimating section 14. [

본 실시예에서는, 과도 검출을 위한 비율이 0.0015625배보다 작은 값을 가지는 서브 밴드상에서 과도 검출이 실시되지 않지만, 대역 분할수, 시간 방향의 분할수 등에 대응하여 과도 검출을 위한 임계값인 0.0015625를 변경해도 좋다.In the present embodiment, the transient detection is not performed on subbands having a value for the transient detection smaller than 0.0015625 times, but the threshold value for transient detection is changed to 0.0015625 corresponding to the number of band divisions, It is also good.

포락 Envelope 추정부Estimation part

포락 추정부(14)는 우선, 시간 분류부(13)에서 생성된 평균 샘플 파워(powe r(ib, islot))의 합으로부터 그룹마다 그룹 파워를 취득하고, sb-4에서 sb-1까지의 저역측의 서브 밴드의 그룹 파워의 평균치를 계산한다. 그 후, 그 저역측의 서브 밴드의 그룹 파워의 평균치를 기점으로 하여 일차 직선에 의거한 외부 삽입에 의해 sb에서 15까지의 고역측의 서브 밴드의 포락치를 추정한다. 포락치의 일차 직선을 ax+b로 나타냈을 경우, 기준점(b)은 후술하는 가중평균에 의한 포락 기준치의 산출에 의해 얻어지며, 후술하는 포락 경사치(a_lev)의해 경사(a)가 얻어진다.The envelope estimating unit 14 first obtains the group power for each group from the sum of the average sample powers (powr (ib, islot)) generated in the time classifying unit 13 and calculates the group power from sb-4 to sb- The average value of the group power of the subband on the low-band side is calculated. Subsequently, the envelope of the subband in the high-frequency side from sb to 15 is estimated by the external insertion based on the primary straight line from the average value of the group power of the subband on the low-frequency side as a starting point. When the primary straight line of the envelope is represented by ax + b, the reference point (b) is obtained by calculating the envelope reference value by the weighted average to be described later, and the slope (a) is obtained by the envelope slope value a_lev described later.

ㆍ그룹 파워의 계산ㆍ Calculation of group power

포락 추정부(14)는 시간 분류부(13)에서 공급된 sb-4에서 sb-1까지 저역측의 4개의 서브 밴드(ib)의 평균 샘플 파워(power(ib, islot))를 입력으로 한다. 각각의 서브 밴드(ib)에서 각 그룹내에 존재하는 슬롯수(nslot(ig))의 수로서 평균 샘플 파워(power(ib, islot))의 합계를 그룹마다 계산하고, ig가 현재의 그룹을 나타내고, 최대 16그룹이 되는 그룹 파워(tpow(ig,ib))로서 그 합계를 설정한다.The envelope estimating unit 14 receives the average sample power power (ib, islot) of the four subbands ib on the low-band side from sb-4 to sb-1 supplied from the time classifying unit 13 . Calculates the sum of the average sample power power (ib, islot) as the number of slots nslot (ig) existing in each group in each subband ib for each group, and ig represents the current group , And sets the sum as a group power tpow (ig, ib) that is a maximum of 16 groups.

Figure 112007079683352-pat00004
Figure 112007079683352-pat00004

ㆍ가중평균에 의한 포락 기준치의 산출ㆍ Calculation of envelope reference value by weighted average

식(4)에 의해 얻어진 각 그룹에 있어서의 그룹 파워(tpow(ig,ib))로부터 sb-4에서 sb-1까지의 저역측의 서브 밴드 신호 전체의 평균치가 얻어진다. 여기서, 평균치를 얻기 위해 가중평균을 이용하여 sb에 가까운 서브 밴드에 더 큰 중량감을 할당함으로써 본 실시예는 저역측의 포락이 고역측의 포락에 더욱 부드럽게 연결될 수 있다.The average value of all the subband signals on the low-band side from sb-4 to sb-1 is obtained from the group power tpow (ig, ib) in each group obtained by the equation (4). Here, by allocating a larger weight to subbands close to sb using a weighted average to obtain an average value, the present embodiment can more smoothly connect the envelope on the low-band side to the envelope on the high-band side.

도 5(a)와 도 5(b)는 각각 다른 평균방법에 의거하여 포락 기준치를 나타내는 개략도이다. 여기서, 도 5(a)와 도 5(b)에 도시된 바와 같이, sb에 근접하는 서브 밴드(sb-1)의 그룹 파워(tpow(sb-1, ig))가 나머지 서브 밴드의 그룹 파워와 비교하여 작은 경우에 다른 평균 방법으로부터 결과가 되는 차이에 대해 설명한다.5 (a) and 5 (b) are schematic diagrams showing the envelope reference values based on different averaging methods. Here, as shown in Figs. 5 (a) and 5 (b), the group power tpow (sb-1, ig) of the subband sb- And the differences that result from different averaging methods when small.

균등인 중량감을 가지는 평균치를 이용하면, 도 5(a)에 도시된 바와 같이, sb로부터 먼 나머지 3개의 서브 밴드의 그룹 파워(tpow(ib, ig))의 크기의 영향때문에 평균치로부터 나중에 계산되는 기준점(b)이 큰 값으로 계산된다. 그 결과, 서브 밴드(sb-1)와 서브 밴드(sb)는 매끄럽게 연결되지 않게 되어 음질 열화가 발생된다.Using an average value having a uniform weight is calculated later from the average value due to the influence of the magnitude of the group power tpow (ib, i g) of the remaining three subbands far from sb as shown in Fig. 5 (a) The reference point b is calculated as a large value. As a result, the subband sb-1 and the subband sb are not smoothly connected and sound quality deterioration occurs.

한편, 본 실시예에서는 도 5(b)에 도시된 바와 같이, sb에 가까운 서브 밴드에 더 큰 중량감을 할당하여 평균을 계산함으로써 주파수 포락을 매끄럽게 연결할 수 있다.On the other hand, in the present embodiment, as shown in FIG. 5B, a larger weight is assigned to subbands close to sb, and the average is calculated, so that the frequency envelope can be smoothly connected.

도 6은 가중평균에 의한 포락 기준치의 산출을 위한 처리의 흐름을 나타내는 플로차트이다. 스텝(S61~S63)에서, sb-4에서 sb-1까지의 저역측의 4개의 서브 밴드 각각의 그룹 파워(tpow(ig, ib))가 산출된다. 그 후, sb에 가장 가까운 서브 밴드로부터 순서대로 그룹 파워(tpow(ig, ib))에 대해, 예를 들면 8:4:2:1의 비율로 가중평균치(w_avg(ig))를 얻기 위해(스텝 S64) 가중평균이 실시된다(스텝 S65).6 is a flowchart showing the flow of processing for calculating the envelope reference value by the weighted average. In step S61 to S63, the group power tpow (ig, ib) of each of the four subbands on the low-band side from sb-4 to sb-1 is calculated. Then, in order to obtain the weighted average value w_avg (ig) at a ratio of 8: 4: 2: 1, for example, to the group power tpow (ig, ib) in order from the subband closest to sb Step S64) The weighted average is performed (Step S65).

Figure 112007079683352-pat00005
Figure 112007079683352-pat00005

그 후, sb-4에서 sb-1까지의 저역측의 4개의 서브 밴드신호로부터 얻어진 가중평균치(w_avg(ig))를 이용하여 서브 밴드(sb)의 그룹 파워가 추정된다. 이 값은 기준치(b)와 동일하고, 포락 기준치(fenv(ig))라고 부른다. 본 실시예에서는, 이 값이 사용자 지정 포락 기준 조정치(b_lev)와 곱셈하여 결정된다. 즉, 포락 기준치는 고유하게 결정하는 것이 아니라, 사용자가 제어가능한 포락 기준 조정 기능이 제공된다.Then, the group power of the subband sb is estimated using the weighted average value w_avg (ig) obtained from the four subband signals on the low-band side from sb-4 to sb-1. This value is the same as the reference value (b) and is called the envelope reference value (fenv (ig)). In the present embodiment, this value is determined by multiplying by the user-specified envelope reference adjustment value b_lev. That is, the envelope reference value is not determined uniquely, but the user can control the envelope reference adjustment function.

Figure 112007079683352-pat00006
Figure 112007079683352-pat00006

본 발명의 실시예에서, 포락 기준 조정치(b_lev)는 0.25이상 1.0 이하의 범위이며 사용자가 임의로 설정할 수 있다. 본 발명의 실시예에서 포락 기준 조정치(b_lev)는 일반적인 음악 데이터의 통계적으로 분석하여 얻어진 주파수 포락에 의거하여 0.5를 추천값으로서 설정된다. 그러나 포락 기준 조정치(b_lev)의 범위는 대역 분할수, 확장 개시 주파수대역(sb)에 대응하여 변경될 수 있다.In the embodiment of the present invention, the envelope reference adjustment value b_lev is in the range of 0.25 to 1.0, and can be set by the user at will. In the embodiment of the present invention, the envelope reference adjustment value b_lev is set to 0.5 as a recommended value based on the frequency envelope obtained by statistically analyzing general music data. However, the range of the envelope reference adjustment value b_lev may be changed corresponding to the number of band divisions and the extension start frequency band sb.

ㆍ포락 기준치의 제한ㆍ Limitation of envelope standard value

포락 기준치(fenv(ig))는 가중평균치(w_avg(ig)) 또는 확장 강도(e_lev)에 따라서 극도로 큰 값이 되어, 대역 합성부에서 서브 밴드 신호를 합성한 경우 결과가 되는 대역 합성 출력 신호가 오버플로우 할 가능성이 있다. 이런 상황을 감안하여, 본 발명의 실시예에서는 포락 기준치(fenv(ig))에 대해서 극단적으로 큰 값을 받지 않도록 제한기를 적용함으로써 출력 신호의 오버플로우가 방지될 수 있다.The envelope reference value fenv (ig) becomes an extremely large value according to the weighted average value w_avg (ig) or the extended strength e_lev, and the band synthesized output signal Is likely to overflow. In view of this situation, in the embodiment of the present invention, overflow of the output signal can be prevented by applying a limiter so as not to receive an extremely large value for the envelope reference value fenv (ig).

도 7은 포락 기준치를 제한하는 처리의 흐름을 나타내는 플로차트이다. 또한, 도 8(a) 및 도 8(b)는 포락 기준치가 어떻게 제한되는지를 나타내는 개략도이다.7 is a flowchart showing a flow of processing for limiting the envelope reference value. 8 (a) and 8 (b) are schematic diagrams showing how the envelope reference value is limited.

스텝(S71)에서, 포락 기준치(fenv(ig))가 임계값-6[dBFs](=16384^2*nslot(ig))보다 크다고 판정된 경우는 그 처리가 스텝(S72)으로 진행되어 도 8(b)에 도시된 바와 같이, 임계값과 동일한 레벨까지 강제적으로 감쇠시킨다.If it is determined in step S71 that the envelope reference value fenv (ig) is greater than the threshold value -6 [dBFs] (= 16384 ^ 2 * nslot (ig)), the process proceeds to step S72 Forcibly attenuates to the same level as the threshold value, as shown in Fig. 8 (b).

한편, 스텝(S71)에서, 포락 기준치(fenv(ig))가 임계값-6[dBFs](= 16384^2*nslot(ig))이하라고 판정된 경우는 그 처리가 스텝(S73)으로 진행되어, 도 8(a)에 나타낸 바와 같이 포락 기준치(fenv(ig))가 직접 이용된다.On the other hand, if it is determined in step S71 that the envelope reference value fenv (ig) is less than or equal to the threshold value -6 [dBFs] (= 16384 ^ 2 * nslot (ig)), the process proceeds to step S73 And the envelope reference value fenv (ig) is directly used as shown in Fig. 8 (a).

본 발명의 실시예에서는 포락 기준치(fenv(ig))를 제한하기 위한 임계값을-6[dBFs]로 설정되었다. 선택적으로, 임계값은 대역 분할수, 확장 개시 주파수대역(sb) 등에 대응하여 변경해도 좋다.In the embodiment of the present invention, the threshold for limiting the envelope reference value fenv (ig) is set to -6 [dBFs]. Alternatively, the threshold value may be changed corresponding to the number of band divisions, the extension start frequency band sb, and the like.

Figure 112007079683352-pat00007
Figure 112007079683352-pat00007

ㆍ고역측의 포락치의 결정ㆍ Determination of the envelope on the high side

sb로부터 15까지의 고역측의 서브 밴드의 포락치(env(ib,ig))는 포락 기준치(fenv(ig))에 경사(기울기)(a)를 곱셈하여 계산된다. 경사(a)는 포락 경사치(a_lev)에 의해 결정된다. 본 발명의 실시예에서는 경사가 고유하게 결정되는 것이 아니라, 사용자가 제어가능한 포락 경사 조정 기능이 제공된다.The envelope (env (ib, ig) of the high-frequency side subband from sb to 15 is calculated by multiplying the envelope reference value fenv (ig) by the slope (slope) (a). The slope (a) is determined by the inclination value a_lev. In the embodiment of the present invention, the inclination is not uniquely determined, but a user-controllable inclination adjustment function is provided.

Figure 112007079683352-pat00008
Figure 112007079683352-pat00008

(a- lev: 포락경사치)(a - lev : inclined angle)

본 발명의 실시예에서 포락 경사치(a_lev)는 0.25이상 1.0 이하의 범위이며, 사용자가 임의로 설정할 수 있다. 본 발명의 실시예에서 포락 경사치(a_lev)는 일반적인 음악 데이터를 통계적으로 분석하여 얻어진 주파수 포락에 의거하여 0.5를 추천값로 설정하고 있지만, 포락 경사치(a_lev)의 범위는 대역 분할수, 확장 개시 주파수대역(sb) 등에 대응하여 변경해도 좋다.In the embodiment of the present invention, the inclination value a_lev is in the range of 0.25 to 1.0, and the user can set it arbitrarily. In the embodiment of the present invention, the envelope slope value a_lev is set to a recommended value of 0.5 based on the frequency envelope obtained by statistically analyzing general music data. The range of the envelope slope value a_lev is, The starting frequency band sb, or the like.

저역측의 서브 밴드에서의 포락치(env(ib, ig))는 그룹 파워(tpow(ib, ig))와 동일한 의미이며, 저역측의 확장 대역의 그룹 파워가 저역측의 포락치로서 설정된다.The envelope env (ib, iig) in the low-band side subband has the same meaning as the group power tpow (ib, iig), and the group power of the low-band extended band is set as the low- .

Figure 112007079683352-pat00009
Figure 112007079683352-pat00009

상기 기술한 처리에 의해 얻어진 시간 분류부(13)에서 공급된 sb-4에서 sb-1까지의 저역측의 서브 밴드 신호의 포락치(env(i b, ig))와 sb에서 15까지의 고역측의 서브 밴드의 포락치(env(ib, ig))는 대역 보완부(15)에 공급된다.(Env (ib, iig) of the low-band side subband signal from sb-4 to sb-1 supplied from the time classifying section 13 obtained by the above-described processing and the envelope (Env (ib, ig)) of the subband of the subband is supplied to the band complementer 15.

대역 treason 보완부Complementary part

대역 보완부(15)에서는 sb-4에서 sb-1까지의 저역측의 서브 밴드 신호의 이득을 조정하고, sb에서 15까지의 고역측의 서브 밴드 신호를 보완한다. 서브 밴드의 각 쌍의 매핑 패턴은 sb에 의해 고유하게 결정된다.The band compensating unit 15 adjusts the gain of the low-band sideband signal from sb-4 to sb-1 and compensates the high-band side subband signal of sb to 15. The mapping pattern of each pair of subbands is uniquely determined by sb.

Figure 112007079683352-pat00010
Figure 112007079683352-pat00010

포락 추정부(14)에서 공급된 sb에서 15까지의 고역측의 서브 밴드의 각각에 대한 포락치(env(ib, ig))를 분할하고, 서브 밴드(ib)의 소스 신호가 존재하는 sb-4에서 sb-1까지의 저역측의 서브 밴드(sb_map(ib)) 각각에 대한 포락치(env(sb_map(ib), ig))에 의해 얻어진 제산(除算)의 평방근(平方根)을 취하는 것으로, sb에서 15까지의 고역측의 서브 밴드의 이득 조정 계수(gain(ib, ig))가 얻어 진다.The envelope env (ib, iig) for each of the high-side subbands from sb to 15 supplied from the envelope estimating unit 14 is divided and the sb- (Square root) of the division obtained by the envelope env (sb_map (ib), ig) for each of the subbands sb_map (ib) on the low- (gain (ib, ig)) of subbands on the high-frequency side from sb to 15 is obtained.

Figure 112007079683352-pat00011
Figure 112007079683352-pat00011

그리고, 식(12)에 의해 얻어진 sb에서 15까지의 고역측의 서브 밴드의 이득 조정 계수(gain(ib, ig))를 고주파대역생성부(16)에 공급한다.The gain adjustment coefficient gain (ib, ig) of the subbands on the high-frequency side from sb to 15 obtained by the equation (12) is supplied to the high-frequency band generation unit 16. [

고주파대역생성부The high-

고주파대역생성부(16)는 대역 분할부(12)로부터 공급된 sb-4에서 sb-1까지의 저역측의 서브 밴드 신호(x(ib,n))를 입력으로 하고, 또한, 대역 보완부(15)에서 공급된 sb에서 15까지의 고역측의 서브 밴드의 이득 조정 계수(gain(ib,ig))를 입력한다. 소스신호가 되는 sb-4에서 sb-1까지의 저역측의 서브 밴드 신호 (x(sb_map(ib),n))에, sb에서 15까지의 고역측의 서브 밴드의 이득 조정 계수 (gain(ib,ig))를 곱셈하여 sb에서 15까지의 고역측의 서브 밴드 신호(x(ib,n))를 얻는다.The high frequency band generating section 16 receives the subband signals x (ib, n) on the low side from sb-4 to sb-1 supplied from the band dividing section 12, (Ib, ig) of the subbands on the high-frequency side from sb to 15 supplied from the adder 15 are input. (Ib (ib), n) on the low-band side from sb-4 to sb-1 serving as the source signal, , ig) to obtain the subband signal x (ib, n) on the high-frequency side from sb to 15.

Figure 112007079683352-pat00012
Figure 112007079683352-pat00012

그리고, 식(13)에서 얻어진 sb에서 15까지의 고역측의 서브 밴드 신호(x(i b,n))를 위상 조정부(17)에 공급한다.Then, the subband signal x (i b, n) on the high-frequency side from sb to 15 obtained in the equation (13) is supplied to the phase adjusting section 17. [

위상 조정부The phase-

그런데, 대역 보완부(15)에서 공급된 sb에서 15까지의 고역측의 서브 밴드 신호(x(ib,n))는 sb-4에서 sb-1까지의 저역측의 4개의 서브 밴드 신호(x(sb_m ap(ib),n))로부터 생성된다. 따라서, 시간영역 신호의 피크가 저역측의 서브 밴드 신호와 고역측의 서브 밴드 신호에서 동일한 타이밍으로 나타난다. 동일한 타이밍의 피크를 가지는 개소에서 대역합성에 의해 모든 서브 밴드를 서로 더하면 대역합성 출력신호의 오버플로우가 생기는 일이 있다.However, the subband signals x (ib, n) on the high-frequency side from sb to 15 supplied from the band complementer 15 are the four subband signals x (ib, n) on the low-band side from sb-4 to sb- (sb_map (ib), n). Therefore, the peak of the time-domain signal appears at the same timing in the subband signal on the low-frequency side and the subband signal on the high-frequency side. If all of the subbands are added together by band synthesis at a position having a peak at the same timing, an overflow of the band synthesis output signal may occur.

상기의 관점에서, 위상 조정부(17)는 오버플로우를 방지하기 위해서, 저역측의 서브 밴드 신호와 고역측의 서브 밴드 신호의 피크를 변경한 후 대역 합성부(18)에 입력한다.In view of the above, the phase adjusting section 17 changes the peaks of the subband signal on the low-frequency side and the subband signal on the high-frequency side and then inputs the subband signal to the band combining section 18 in order to prevent overflow.

도 9는 저역측의 서브 밴드 신호와 고역측의 서브 밴드 신호의 위상 조정을 나타내는 개략도이다. 여기서, sb에서 15까지의 고역측의 서브 밴드 신호 (x(ib,n))는 시간축을 따라 4개의 샘플에 의해 후방으로 이동된다. 즉, 본 실시예에서는 인간의 청각시스템에서 관찰되는 후방시간 마스킹 특성을 이용하여 청취할 수 없는 범위내의 시간 방향에서 서브 밴드 신호(x(ib,n))가 지연된다.9 is a schematic diagram showing the phase adjustment of the subband signal on the low-frequency side and the subband signal on the high-frequency side. Here, the subband signal x (ib, n) on the high-frequency side from sb to 15 is moved backward by four samples along the time axis. That is, in the present embodiment, the subband signal x (ib, n) is delayed in the time direction within a range that can not be audited by using the backward time masking characteristic observed in the human auditory system.

Figure 112007079683352-pat00013
Figure 112007079683352-pat00013

여기서 4개의 샘플로 지연이 실시되었지만, 대역 분할수, 확장 개시 주파수대역(sb), 샘플링 주파수 등에 대응하여 4개의 샘플의 지연이 변경될 수 있다.Here, although the delay is performed by four samples, the delay of four samples can be changed corresponding to the number of band divisions, the extension start frequency band (sb), the sampling frequency, and the like.

위상 조정부(17)는 샘플 시프팅(sample-shifting)에 의해 얻어진 sb에서 15까지의 고역측의 서브 밴드 신호(x(ib,n))를 대역 합성부(18)에 공급한다.The phase adjusting unit 17 supplies the band combining unit 18 with the subband signals x (ib, n) on the high-range side from sb to 15 obtained by sample-shifting.

대역 treason 합성부Synthesizing unit

대역 합성부(18)는 위상 조정부(17)에서 공급된 sb에서 15까지의 고역측의 서브 밴드 신호(x(ib, n))와 대역 분할부(12)에서 공급된 0에서 sb-1까지의 저역측의 서브 밴드 신호(x(ib, n))를 필터 뱅크에 의해서 대역 합성하고, 대역 합성 출력 신호(y(n))를 얻는다.Band synthesizer 18 multiplies the subband signals x (ib, n) on the high-frequency side from sb to 15 supplied from the phase adjusting section 17 and the subband signals x (ib, n) supplied from the band dividing section 12 Band synthesized output signal y (n) by band-narrowing the subband signal x (ib, n) on the low-band side of the filter bank.

상술한 바와 같이, 본 발명의 실시예에서 사이드 정보로 따라서 sb가 결정되고, 그 후 sb보다 저역측의 복수의 서브 밴드 신호에 의거하여 주파수대역이 확대된다. 따라서, 고주파수 대역에 속하는 신호 성분이 삭제되는 신호가 고음질로 재생될 수 있다. 또한, sb-4에서 sb-1까지의 저역측의 서브 밴드 신호의 부호 열화가 검출되고, 열화 검출 결과에 따라 sb-4에서 sb-1까지의 저역측의 서브 밴드 신호의 과도 검출이 실시된다. 따라서, 과도 검출의 계산량이 증가되는 것을 방지할 수 있다. 또한, sb-4에서 sb-1까지의 저역측의 서브 밴드 신호에 고역측에 가깝게 중량감을 할당하여 주파수 포락을 평균하여 저역측과 고역측의 주파수 포락이 매끄럽게 연결될 수 있다. 또한, sb-4에서 sb-1까지의 저역측의 서브 밴드 신호로부터 산출된 포락 기준치에 제한기를 적용하여 대역 합성을 실시함으로써 대역 합성 출력 신호의 오버플로우가 방지될 수 있다. 또한, 0에서 sb-1까지의 저역측의 복수의 서브 밴드 신호에 대응하여 sb에서 15까지의 서브밴드에 속하는 복수의 서브 밴드 신호의 위상을 변경하여 대역 합성 출력 신호의 오버플로우가 방지될 수 있다.As described above, sb is determined according to the side information in the embodiment of the present invention, and then the frequency band is expanded based on a plurality of subband signals on the lower side than sb. Therefore, a signal from which a signal component belonging to a high frequency band is deleted can be reproduced with high sound quality. Further, the code deterioration of the low-band side subband signal from sb-4 to sb-1 is detected, and the transient detection of the low band side subband signal from sb-4 to sb-1 is performed according to the deterioration detection result . Therefore, it is possible to prevent the amount of calculation of the transient detection from being increased. In addition, the subbands on the low-band side from sb-4 to sb-1 can be weighted close to the high-frequency side to average the frequency envelopes, so that the frequency envelopes on the low and high frequencies can be smoothly connected. In addition, over-flow of the band synthesized output signal can be prevented by applying the limiter to the envelope reference value calculated from the low-band side sub-band signals sb-4 to sb-1 to perform band synthesis. In addition, it is possible to change the phase of a plurality of subband signals belonging to subbands sb to 15 corresponding to a plurality of subband signals on the low side from 0 to sb-1, have.

본 발명은 상술한 실시예에만 한정되는 것이 아니고, 본 발명의 요지를 일탈하지 않고 여러 가지의 변경이 가능한 것은 물론이다. 본 발명의 실시 형태에서는 복호화 처리 후의 신호를 처리하는 주파수대역확대 장치를 예로서 설명하였다. 선택적으로, 본 발명은 복호화 수단이 제공된 재생장치에도 적용 가능하다. 또한, 상술의 실시예에서 하드웨어 구성으로서 설명했지만, 본 발명은 이것으로 한정되는 것은 아니다. 본 발명은 임의의 처리를 CPU(Central Processing Unit)가 컴퓨터 프로그램을 실행시키는 것으로 실현되는 것도 가능하다. 이 경우, 컴퓨터 프로그램은 기록 매체상에 기록되도록 제공될 수 있고, 인터넷 또는 다른 전송 매체를 거쳐서 전송에 의해 제공될 수 있다. It is needless to say that the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the gist of the present invention. In the embodiment of the present invention, a frequency band expanding apparatus for processing a signal after a decoding process has been described as an example. Alternatively, the present invention is also applicable to a reproducing apparatus provided with decoding means. Although the hardware configuration has been described in the above embodiment, the present invention is not limited thereto. The present invention can also be realized by a CPU (Central Processing Unit) executing a computer program in an arbitrary process. In this case, the computer program may be provided to be recorded on a recording medium, and may be provided by transmission over the Internet or other transmission medium.

본 발명은 일본특허청에서 2006년 11월 9일자로 출원된 일본특허출원(JP 2006-304501)에 관련된 내용을 포함한다.The present invention includes contents related to Japanese Patent Application (JP 2006-304501) filed on November 9, 2006 by the Japanese Patent Office.

도 1은 본 발명의 실시예에 따른 주파수대역확대장치의 구성을 나타내는 블럭도이다.1 is a block diagram showing a configuration of a frequency band extending apparatus according to an embodiment of the present invention.

도 2는 사이드 정보와 확장 개시 주파수대역("sb")의 관계를 나타내는 도면이다.2 is a diagram showing the relationship between the side information and the extension start frequency band ("sb").

도 3은 부호 열화가 격렬한 경우의 주파수 진폭 특성을 나타내는 도면이다.Fig. 3 is a diagram showing the frequency amplitude characteristic when the code degradation is vigorous.

도 4는 과도 검출 대상 서브 밴드를 결정하기 위한 처리의 흐름을 나타내는 플로차트이다.4 is a flowchart showing a flow of a process for determining a subband to be detected for a transient.

도 5(a) 및 도 5(b)는 각각 다른 평균 기술에 의거하여 포락 기준치를 나타내는 개략도이다.5 (a) and 5 (b) are schematic diagrams showing the envelope reference values based on different averaging techniques, respectively.

도 6은 가중평균에 의한 포락 기준치를 산출하기 위한 처리의 흐름을 나타내는 플로차트이다.6 is a flowchart showing a flow of processing for calculating the envelope reference value by the weighted average.

도 7은 포락 기준치를 제한하기 위한 처리의 흐름을 나타내는 플로차트이다.7 is a flowchart showing a flow of processing for limiting the envelope reference value.

도 8(a) 및 도 8(b)는 각각 포락 기준치가 제한되는 것을 나타내는 개략도이다.8 (a) and 8 (b) are schematic views showing that the envelope reference value is limited, respectively.

도 9는 저역측의 서브 밴드 신호와 고역측의 서브 밴드 신호의 위상 조정을나타내는 개략도이다.9 is a schematic diagram showing the phase adjustment of the subband signal on the low-frequency side and the subband signal on the high-frequency side.

도 10은 종래 기술의 주파수대역확대장치의 구성을 나타내는 블럭도이다.10 is a block diagram showing a configuration of a frequency band extending apparatus of the prior art.

[도면의 주요부분에 대한 부호의 설명]DESCRIPTION OF THE REFERENCE NUMERALS

10: 주파수대역확대 장치 11: 확장 제어부10: Frequency band extending device 11: Extension control part

12: 대역 분할부 13: 시간 분류부12: band dividing section 13: time dividing section

14: 포락 추정부 15: 대역 보완부14: envelope estimation unit 15: band complementary unit

16: 고주파대역생성부 17: 위상 조정부16: high frequency band generating section 17: phase adjusting section

18: 대역 합성부18:

Claims (18)

입력신호의 주파수대역을 확대하고,The frequency band of the input signal is enlarged, 상기 입력 신호의 확장 개시 대역을 결정하는 확장 제어 수단과,An extension control means for determining an extension start band of the input signal, 상기 입력 신호를 복수의 서브 밴드 신호로 분할하는 대역 분할 수단을 구비하고,And band dividing means for dividing the input signal into a plurality of subband signals, 상기 대역 분할 수단에 의해 상기 입력신호가 대역 분할된 복수의 서브 밴드 신호중 상기 확장 개시 대역보다 낮은 저역측의 복수의 서브 밴드 신호에 의거하여 주파수대역이 확대되며, The frequency band is expanded by the band dividing means on the basis of a plurality of subband signals on the low-frequency side lower than the extension start frequency band among a plurality of subband signals into which the input signal is band- 상기 확장 개시 대역보다 저역측의 복수의 서브 밴드 신호와 상기 확장 개시 대역 이상의 복수의 서브 밴드 신호를 합성하는 대역합성수단을 포함하는 주파수대역확대장치에 있어서, Band synthesizing means for synthesizing a plurality of subband signals on the low-frequency side and a plurality of subband signals on the extension start frequency band that are lower than the extended start frequency band, 상기 대역합성수단은 상기 확장 개시 대역보다 저역측의 복수의 서브 밴드 신호와 상기 확장 개시 대역 이상의 복수의 서브 밴드 신호의 위상을 변화시켜 합성하는 것을 특징으로 하는 주파수대역확대장치.Wherein said band synthesizing means synthesizes a plurality of subband signals on the lower side of said extended start band and a plurality of subband signals of said extended start frequency band by changing the phase. 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 입력신호의 주파수대역을 확대하는 주파수대역확대장치에 있어서,1. A frequency band expanding apparatus for expanding a frequency band of an input signal, 상기 입력 신호에 관련되는 정보에 따라서 상기 입력신호의 확장 개시 대역을 결정하는 확장 제어 수단과,Extension control means for determining an extension start band of the input signal in accordance with information related to the input signal; 상기 입력 신호를 복수의 서브 밴드 신호로 분할하는 대역 분할 수단과,Band dividing means for dividing the input signal into a plurality of subband signals, 상기 대역 분할 수단에 의해 상기 입력신호가 대역 분할된 상기 확장 개시 대역보다 저역측의 복수의 서브 밴드 신호 가운데 상기 확장 개시 대역에 연속하는 소정수의 서브 밴드 신호를 각각 시간 방향으로 과도 검출하는 과도(過渡) 검출 수 단과,A transitional period in which a predetermined number of subband signals continuous to the extended start band are transiently detected in a time direction among a plurality of subband signals on a lower side than the extended start band in which the input signal is band- Transient detection) 상기 과도검출수단에서 과도 검출 결과에 의거하여 상기 소정수의 서브 밴드 신호를 시간 방향으로 복수의 그룹에 분할하는 그룹 분할 수단과,Group dividing means for dividing the predetermined number of subband signals into a plurality of groups in the time direction on the basis of the transient detection result in the transient detecting means; 상기 그룹분할수단에 의해 상기 소정수의 서브 밴드 신호가 분할된 그룹의 그룹 파워의 평균치에 의거하여 상기 소정수의 서브밴드신호의 파워의 평균치를 산출하는 파워 평균치 산출수단과,Power average value calculating means for calculating an average value of the powers of the predetermined number of subband signals based on an average value of group powers of the group in which the predetermined number of subband signals are divided by the group dividing means; 상기 파워 평균치 산출수단에 의해 산출된 평균치를 기점으로서 상기 확장 개시 대역 이상의 복수의 서브밴드신호의 포락 직선을 외삽(外揷)하는 포락추정수단과,Envelop estimation means for extrapolating an envelope straight line of a plurality of subband signals of the extension start frequency band or more starting from an average value calculated by the power average value calculation means; 상기 포락 직선에 의거하여 상기 확장 개시 대역 이상의 복수의 서브밴드신호를 보완하는 대역 보완 수단과,Band complementing means for supplementing a plurality of subband signals over the extension start band on the basis of the envelope straight line, 상기 확장 개시 대역보다 저역측의 복수의 서브 밴드 신호와 상기 확장 개시 대역 이상의 복수의 서브 밴드 신호를 합성하는 대역합성수단을 구비하고,And band synthesizing means for synthesizing a plurality of subband signals on the lower side of the extended start band and a plurality of subband signals on the extended start band or more, 상기 대역 분할 수단에 의해 상기 입력신호가 대역 분할된 복수의 서브 밴드 신호 가운데 상기 확장 개시 대역보다 낮은 저역측의 복수의 서브 밴드 신호에 의거하여 주파수대역이 확대되는 것을 특징으로 하는 주파수대역확대장치.Wherein the frequency band is enlarged by the band dividing means based on a plurality of subband signals on the low-band side lower than the extension start band among a plurality of subband signals into which the input signal is band-divided. 삭제delete 삭제delete
KR1020070112728A 2006-11-09 2007-11-06 Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium KR101430221B1 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006304501 2006-11-09
JPJP-P-2006-00304501 2006-11-09
JP2007274091A JP5141180B2 (en) 2006-11-09 2007-10-22 Frequency band expanding apparatus, frequency band expanding method, reproducing apparatus and reproducing method, program, and recording medium
JPJP-P-2007-00274091 2007-10-22

Publications (2)

Publication Number Publication Date
KR20080042696A KR20080042696A (en) 2008-05-15
KR101430221B1 true KR101430221B1 (en) 2014-08-18

Family

ID=39405121

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070112728A KR101430221B1 (en) 2006-11-09 2007-11-06 Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium

Country Status (4)

Country Link
JP (2) JP5141180B2 (en)
KR (1) KR101430221B1 (en)
CN (1) CN101178898B (en)
TW (1) TWI377563B (en)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2729474C (en) * 2008-07-11 2015-09-01 Frederik Nagel Apparatus and method for generating a bandwidth extended signal
EP2151822B8 (en) * 2008-08-05 2018-10-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal for speech enhancement using a feature extraction
JP2010079275A (en) * 2008-08-29 2010-04-08 Sony Corp Device and method for expanding frequency band, device and method for encoding, device and method for decoding, and program
EP2360687A4 (en) * 2008-12-19 2012-07-11 Fujitsu Ltd Voice band extension device and voice band extension method
JP5754899B2 (en) 2009-10-07 2015-07-29 ソニー株式会社 Decoding apparatus and method, and program
JP5928539B2 (en) * 2009-10-07 2016-06-01 ソニー株式会社 Encoding apparatus and method, and program
EP4250290A1 (en) 2010-01-19 2023-09-27 Dolby International AB Improved subband block based harmonic transposition
JP5850216B2 (en) * 2010-04-13 2016-02-03 ソニー株式会社 Signal processing apparatus and method, encoding apparatus and method, decoding apparatus and method, and program
JP5609737B2 (en) 2010-04-13 2014-10-22 ソニー株式会社 Signal processing apparatus and method, encoding apparatus and method, decoding apparatus and method, and program
JP6103324B2 (en) * 2010-04-13 2017-03-29 ソニー株式会社 Signal processing apparatus and method, and program
JP5652658B2 (en) 2010-04-13 2015-01-14 ソニー株式会社 Signal processing apparatus and method, encoding apparatus and method, decoding apparatus and method, and program
JP6075743B2 (en) 2010-08-03 2017-02-08 ソニー株式会社 Signal processing apparatus and method, and program
JP5707842B2 (en) 2010-10-15 2015-04-30 ソニー株式会社 Encoding apparatus and method, decoding apparatus and method, and program
JP5704397B2 (en) 2011-03-31 2015-04-22 ソニー株式会社 Encoding apparatus and method, and program
JP2013007944A (en) 2011-06-27 2013-01-10 Sony Corp Signal processing apparatus, signal processing method, and program
JP5975243B2 (en) * 2011-08-24 2016-08-23 ソニー株式会社 Encoding apparatus and method, and program
JP5942358B2 (en) * 2011-08-24 2016-06-29 ソニー株式会社 Encoding apparatus and method, decoding apparatus and method, and program
JP6037156B2 (en) 2011-08-24 2016-11-30 ソニー株式会社 Encoding apparatus and method, and program
KR101897455B1 (en) * 2012-04-16 2018-10-04 삼성전자주식회사 Apparatus and method for enhancement of sound quality
JP2014026138A (en) 2012-07-27 2014-02-06 Sony Corp Frequency band extension device, method, and program
JP6152639B2 (en) * 2012-11-27 2017-06-28 沖電気工業株式会社 Audio band expansion device and program, and audio feature amount calculation device and program
JP6073456B2 (en) * 2013-02-22 2017-02-01 三菱電機株式会社 Speech enhancement device
RU2665228C1 (en) 2013-04-05 2018-08-28 Долби Интернэшнл Аб Audio encoder and decoder for interlace waveform encoding
TWI546799B (en) 2013-04-05 2016-08-21 杜比國際公司 Audio encoder and decoder
KR20220140002A (en) 2013-04-05 2022-10-17 돌비 레버러토리즈 라이쎈싱 코오포레이션 Companding apparatus and method to reduce quantization noise using advanced spectral extension
JP6531649B2 (en) 2013-09-19 2019-06-19 ソニー株式会社 Encoding apparatus and method, decoding apparatus and method, and program
CN104517611B (en) 2013-09-26 2016-05-25 华为技术有限公司 A kind of high-frequency excitation signal Forecasting Methodology and device
RU2764260C2 (en) 2013-12-27 2022-01-14 Сони Корпорейшн Decoding device and method
FR3017484A1 (en) * 2014-02-07 2015-08-14 Orange ENHANCED FREQUENCY BAND EXTENSION IN AUDIO FREQUENCY SIGNAL DECODER
JP2015163909A (en) * 2014-02-28 2015-09-10 富士通株式会社 Acoustic reproduction device, acoustic reproduction method, and acoustic reproduction program
JP6401521B2 (en) * 2014-07-04 2018-10-10 クラリオン株式会社 Signal processing apparatus and signal processing method
US9468006B2 (en) * 2014-12-09 2016-10-11 Acer Incorporated Method of determining transit power for data transmission between a network and a user equipment and related wireless communication system
JP6210338B2 (en) * 2015-12-28 2017-10-11 ソニー株式会社 Signal processing apparatus and method, and program
JP6439843B2 (en) * 2017-09-14 2018-12-19 ソニー株式会社 Signal processing apparatus and method, and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003140696A (en) 2001-08-23 2003-05-16 Matsushita Electric Ind Co Ltd Speech processor
JP2006031053A (en) 1999-10-01 2006-02-02 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE512719C2 (en) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd A method and apparatus for reducing data flow based on harmonic bandwidth expansion
JP2002366178A (en) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd Method and device for band expansion of audio signal
JP2003015695A (en) * 2001-07-05 2003-01-17 Matsushita Electric Ind Co Ltd Device for expanding audio frequency band
CN100395817C (en) * 2001-11-14 2008-06-18 松下电器产业株式会社 Encoding device and decoding device
JP4313993B2 (en) * 2002-07-19 2009-08-12 パナソニック株式会社 Audio decoding apparatus and audio decoding method
JP2004198485A (en) * 2002-12-16 2004-07-15 Victor Co Of Japan Ltd Device and program for decoding sound encoded signal
JP4254479B2 (en) * 2003-10-27 2009-04-15 ヤマハ株式会社 Audio band expansion playback device
JP2006003580A (en) * 2004-06-17 2006-01-05 Matsushita Electric Ind Co Ltd Device and method for coding audio signal

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031053A (en) 1999-10-01 2006-02-02 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP2003140696A (en) 2001-08-23 2003-05-16 Matsushita Electric Ind Co Ltd Speech processor

Also Published As

Publication number Publication date
CN101178898A (en) 2008-05-14
TWI377563B (en) 2012-11-21
JP5141180B2 (en) 2013-02-13
TW200832358A (en) 2008-08-01
KR20080042696A (en) 2008-05-15
JP5429309B2 (en) 2014-02-26
JP2012083790A (en) 2012-04-26
CN101178898B (en) 2011-11-02
JP2008139844A (en) 2008-06-19

Similar Documents

Publication Publication Date Title
KR101430221B1 (en) Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
EP1921610B1 (en) Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
US10546594B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9659573B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US8639500B2 (en) Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101345695B1 (en) An apparatus and a method for generating bandwidth extension output data
US8417515B2 (en) Encoding device, decoding device, and method thereof
US7983922B2 (en) Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US9583112B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US20090097676A1 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
AU2005259618A1 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
JP2006201801A (en) Device for improving performance of information source coding system
TW200407846A (en) Audio decoding apparatus and method
KR20120093934A (en) Adaptive dynamic range enhancement of audio recordings
CN102044250A (en) Band spreading method and apparatus
US7680665B2 (en) Device and method for interpolating frequency components of signal adaptively
JP2004198485A (en) Device and program for decoding sound encoded signal
EP1563490B1 (en) Method and apparatus for generating audio components
JP2002247699A (en) Stereophonic signal processing method and device, and program and recording medium
WO2020179472A1 (en) Signal processing device, method, and program
JP2000207000A (en) Signal processor and signal processing method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
LAPS Lapse due to unpaid annual fee