KR101855969B1 - 오디오 신호를 압축하는 디지털 압축기 - Google Patents

오디오 신호를 압축하는 디지털 압축기 Download PDF

Info

Publication number
KR101855969B1
KR101855969B1 KR1020157036811A KR20157036811A KR101855969B1 KR 101855969 B1 KR101855969 B1 KR 101855969B1 KR 1020157036811 A KR1020157036811 A KR 1020157036811A KR 20157036811 A KR20157036811 A KR 20157036811A KR 101855969 B1 KR101855969 B1 KR 101855969B1
Authority
KR
South Korea
Prior art keywords
compression
audio signal
input audio
signal
auxiliary signal
Prior art date
Application number
KR1020157036811A
Other languages
English (en)
Other versions
KR20160014027A (ko
Inventor
페터 그로셰
위에 랑
칭 장
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20160014027A publication Critical patent/KR20160014027A/ko
Application granted granted Critical
Publication of KR101855969B1 publication Critical patent/KR101855969B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/18Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

본 발명은 입력 오디오 신호를 압축하는 디지털 압축기에 관한 것으로, 상기 디지털 압축기는 압축 이득 파라미터를 제공하는 압축 이득 제어부; 상기 압축 이득 파라미터로부터 압축비를 결정하기 위한 압축 파라미터 결정기로서, 미리 정해진 가중 계수에 의해 상기 압축 이득 파라미터에 가중치를 부여하여 압축비를 취득하도록 구성된 압축 파라미터 결정기; 상기 압축비에 의존하여 상기 입력 오디오 신호를 조작하여 제1 보조 신호를 취득하는 보조 신호 생성기; 및 상기 제1 보조 신호와 상기 압축 이득 파라미터를 결합하여 제2 보조 신호를 취득하고, 상기 입력 오디오 신호와 상기 제2 보조 신호를 결합하여 상기 압축 오디오 신호를 취득하는 결합 유닛을 포함한다.

Description

오디오 신호를 압축하는 디지털 압축기 {A DIGITAL COMPRESSOR FOR COMPRESSING AN AUDIO SIGNAL}
본 발명은 오디오 신호 처리 분야에 관한 것이다.
오디오 신호의 동적 범위의 감소는 사운드 녹음(sound recording), 사운드 재생(sound reproduction) 및 방송(broadcasting) 분야에서 중요한 주제이다. 동적 범위의 감소는 사용된 오디오 장비의 물리적 능력(physical capability)에 대해 오디오 신호의 특성을 적응시키기 것과 관련 있을 수 있다.
오디오 신호의 동적 범위를 감소시키기 위해, 압축기가 사용될 수 있다. 압축기의 압축 특성은 오디오 신호의 지각 품질(perceived quality)에 상당히 영향을 미칠 수 있는 복수의 압축 파라미터에 의해 제어될 수 있다.
압축기의 파라미터의 조정은 일반적으로 경험이 있는 사용자에 의해 수동으로 수행된다. 동시에 오디오 신호의 높은 지각 품질을 유지하면서 오디오 신호의 압축을 제어하는 직관적인 메커니즘(intuitive mechanism)은 존재하지 않는다.
G. W. McNally의 논문 ["Dynamic Range Control of Digital Audio Signals", Journal of the Audio Engineering Society, vol. 32, pp. 316-327, 1984]에는, 압축기를 사용한 동적 범위 압축이 기술되어 있다.
본 발명의 목적은 입력 오디오 신호의 압축을 제어하기 위한 효율적인 메커니즘을 갖는, 입력 오디오 신호를 압축하는 디지털 압축기를 제공하는 것이다.
이러한 목적은 독립항의 특징에 의해 달성된다. 또한 구현 형태는 종속 청구항, 설명, 및 도면으로부터 명백하다.
본 발명은 단일 압축 이득 파라미터로부터 유도될 수 있는, 입력 오디오 신호의 압축을 위한 복수의 압축 파라미터를 발견하는 것에 기초한다.
압축된 오디오 신호의 높은 지각 품질이 달성될 수 있도록, 복수의 압축 파라미터가 유도될 수 있다. 압축 이득 파라미터는 연속적으로 선택될 수 있고 입력 오디오 신호의 상이한 압축도를 초래할 수 있다. 따라서, 입력 오디오 신호의 압축을 제어하기 위한 직관적인 메커니즘을 제공할 수 있다.
제1 측면에 따르면, 본 발명은 입력 오디오 신호를 압축하는 디지털 압축기에 관한 것으로, 상기 디지털 압축기는, 압축 이득 파라미터를 제공하는 압축 이득 제어부; 상기 압축 이득 파라미터로부터 압축비를 결정하기 위한 압축 파라 미터 결정기로서, 미리 정해진 가중 계수에 의해 상기 압축 이득 파라미터에 가중치를 부여하여 압축비를 취득하도록 구성된 압축 파라미터 결정기; 상기 압축비에 의존하여 상기 입력 오디오 신호를 조작하여 제1 보조 신호를 취득하는 보조 신호 생성기; 및 상기 제1 보조 신호와 상기 압축 이득 파라미터를 결합하여 제2 보조 신호를 취득하고, 상기 입력 오디오 신호와 상기 제2 보조 신호를 결합하여 압축된 오디오 신호를 취득하는 결합 유닛을 포함한다. 따라서, 단일 압축 이득 파라미터에 의해 제어될 수 있는 디지털 압축기를 제공할 수 있다.
상기 입력 오디오 신호는 샘플링 및/또는 양자화된 오디오 신호일 수 있다. 상기 입력 오디오 신호는 모노 오디오 신호, 스테레오 오디오 신호, 또는 다채널 오디 신호를 포함할 수 있다.
상기 압축 이득 제어부는 압축 이득 파라미터를 제공하는 슬라이딩 제어부(sliding control)를 포함할 수 있다. 상기 압축 이득 파라미터는 로그 스케일(logarithmic scale), 예컨대, 0dB, 3dB, 6dB, 또는 12dB로 제공될 수 있다.
상기 압축 파라미터 결정기는 미리 정해진 가중 계수에 의해 압축 이득 파라미터에 가중치를 부여하여 압축 이득 파라미터로부터 압축비를 결정할 수 있다. 상기 압축비는 선형 스케일(linear scale), 예컨대 1, 2, 5 또는 10으로 제공될 수 있다. 상기 미리 정해진 가중 계수는 로그 스케일, 예컨대 2 dB, 또는 선형 스케일 예컨대 1.5로 제공될 수 있다.
상기 보조 신호 생성기는 제1 보조 신호를 취득하기 위해 상기 압축비에 의존하여 상기 입력 오디오 신호를 조작한다. 상기 조작은 상기 입력 오디오 신호로부터 상기 제1 보조 신호의 유도에 관한 것일 수 있거나 상기 제1 보조 신호를 취득하기 위한 상기 입력 오디오 신호의 처리에 관한 것일 수 있다. 상기 제1 보조 신호는 시간 종속 실수 값(time-dependent real-valued) 신호일 수 있다.
상기 결합 유닛은 제2 보조 신호를 취득하기 위해 상기 제1 보조 신호와 상기 압축 이득 파라미터를 결합할 수 있다. 상기 결합 유닛은 또한 압축된 오디오 신호를 취득하기 위해 상기 입력 오디오 신호와 상기 제2 보조 신호를 결합할 수 있다. 상기 제2 보조 신호는 시간 종속 실수 값(time-dependent real-valued) 신호일 수 있다.
상기 압축된 오디오신호는 샘플링 및/또는 양자화된 오디오 신호일 수 있다. 상기 압축된 오디오 신호는 모노 오디오 신호, 스테레오 오디오 신호, 또는 다채널 오디 신호를 포함할 수 있다. 상기 압축된 오디오 신호의 동적 범위는 상기 입력 오디오 신호의 동적 범위에 대해 감소될 수 있다.
이러한 제1 측면에 따른 디지털 압축기의 제1 구현 방식에서, 상기 압축 파라미터 결정기는 아래 식:
Figure 112015127653262-pct00001
, 또는
Figure 112015127653262-pct00002
에 따라 상기 압축비를 결정하도록 구성되고,
위 식에서, G는 상기 압축 이득 파라미터를 나타내고, K는 상기 미리 정해진 가중 계수를 나타내고, R은 상기 압축비를 나타낸다. 따라서, 압축비가 효율적으로 결정될 수 있다.
상기 미리 정해진 가중 계수는, 예컨대 1.5dB∼3dB의 로그 범위 이내, 또는 예컨대 1.4∼2의 선형 범위 이내에서 선택될 수 있다. 압축비는 미리 정해진 편차 범위(deviation range), 예컨대 ±10% 내에서 상기 식의 결정된 값으로부터 유도될 수 있다.
이러한 제1 측면 또는 제1 측면의 제1 구현 형태에 따른 디지털 압축기의 제2 구현 형태에서, 상기 압축 파라미터 결정기는 아래 식:
Figure 112015127653262-pct00003
에 따라 상기 압축 이득 파라미터로부터 어택 필터링 시간 상수(attack filtering time constant)를 결정하도록 더 구성되고,
위 식에서, G는 로그 스케일(logarithmic scale)의 압축 이득 파라미터를 나타내고, A1은 미리 정해진 제1 어택 상수를 나타내고, A2는 미리 정해진 제2 어택 상수를 나타내고,
Figure 112015127653262-pct00004
는 상기 어택 필터링 시간 상수를 나타내며, 상기 보조 신호 생성기는 상기 제1 보조 신호를 취득하기 위해 상기 어택 필터링 시간 상수에 의존하여 상기 입력 오디오 신호를 필터링하도록 구성된다. 따라서, 어택 필터링 시간 상수를 효율적으로 결정할 수 있다.
상기 어택 필터링 시간 상수는 어택 위상(attack phase) 내에서 상기 입력 오디오 신호를 필터링하기 위한 필터링 특성을 규정할 수 있다. 상기 어택 위상은 상기 입력 오디오 신호의 진폭(amplitude)이 증가함에 따라 시간 간격에 관련 있을 수 있다.
미리 정해진 제1 어택 상수는 상기 압축 이득 파라미터에 의존하여 상기 어택 필터링 시간 상수의 증가 또는 감소와 관련된 기울기(slope)일 수 있다. 상기 미리 정해진 제1 어택 상수는 예컨대, -0.0002 sec/dB일 수 있다. 미리 정해진 제2 어택 상수는 상기 어택 필터링 시간 상수와 관련된 오프셋일 수 있다. 상기 제2 미리 정해진 어택 상수는 예를 들어 0.006 sec일 수 있다.
이러한 제1 측면 또는 제1 측면의 선행하는 구현 형태 중 어느 하나에 따른 디지털 압축기의 제3 구현 형태에서, 상기 압축 파라미터 결정기는 아래 식:
Figure 112015127653262-pct00005
에 따라 상기 압축 이득 파라미터로부터 릴리즈 필터링 시간 상수(release filtering time constant)를 결정하도록 더 구성되고,
위 식에서, G는 로그 스케일의 상기 압축 이득 파라미터를 나타내고, B1은 미리 정해진 제1 릴리즈 상수를 나타내고, B2는 미리 정해진 제2 릴리즈 상수를 나타내고,
Figure 112015127653262-pct00006
는 상기 릴리즈 필터링 시간 상수를 나타내며, 상기 보조 신호 생성기는 상기 제1 보조 신호를 취득하기 위해 상기 릴리즈 필터링 시간 상수에 의존하여 상기 입력 오디오 신호를 필터링하도록 구성된다. 따라서, 릴리즈 필터링 시간 상수를 효율적으로 결정할 수 있다.
상기 릴리즈 필터링 시간 상수는 릴리즈 위상(release phase) 이내의 상기 입력 오디오 신호를 필터링하기 위한 필터링 특성을 정의할 수 있다. 상기 릴리즈 위상은 상기 입력 오디오 신호의 진폭이 감소함에 따라 시간 간격에 관련될 수 있다.
상기 미리 정해진 제1 릴리즈 상수는 상기 압축 이득 파라미터에 의존하여 상기 릴리즈 필터링 시간 상수의 증가 또는 감소에 관련된 기울기일 수 있다. 상기 미리 정해진 제1 릴리즈 상수는 예컨대, -0.0033sec/dB일 수 있다. 상기 미리 정해진 제2 릴리즈 상수는 상기 릴리즈 필터링 시간 상수에 관련된 오프셋일 수 있다. 상기 미리 정해진 제2 릴리즈 상수는 예컨대, 0.12sec일 수 있다.
이러한 제1 측면 또는 제1 측면의 선행하는 구현 형태 중 어느 하나에 따른 디지털 압축기의 제4 구현 형태에서, 상기 압축 파라미터 결정기는 아래 식:
Figure 112015127653262-pct00007
에 따라 상기 압축 이득 파라미터로부터 압축 임계값을 결정하도록 더 구성되고,
위 식에서, G는 로그 스케일의 상기 압축 이득 파라미터를 나타내고,
Figure 112015127653262-pct00008
는 허용오차 계수(tolerance factor)를 나타내고, R은 상기 압축비를 나타내고, PMAX는 로그 스케일의 상기 입력 오디오 신호의 최대 크기(maximum magnitude)를 나타내고, T는 로그 스케일의 상기 압축 임계값을 나타내며, 상기 보조 신호 생성기는 상기 제1 보조 신호를 취득하기 위해 상기 입력 오디오 신호를 상기 압축 임계값과 비교하도록 구성된다. 따라서, 압축 임계값을 효율적으로 결정할 수 있다.
상기 압축 임계값은 상기 입력 오디오 신호를 압축하기 위한 임계값으로 정의할 수 있다. 상기 입력 오디오 신호의 압축은 상기 압축 임계값을 초과하는 상기 입력 오디오 신호의 크기 또는 진폭에 대해 수행될 수 있다. 상기 압축 임계값은, 예컨대, -15dB일 수 있다.
상기 허용오차 계수는 상기 어택 필터링 시간 상수로부터 상기 압축 임계값의 의존도(dependency)를 도입할 수 있다. 상기 허용오차 계수는, 예컨대,
Figure 112015127653262-pct00009
에 따라 결정될 수 있고,
Figure 112015127653262-pct00010
는 상기 어택 필터링 시간 상수를 나타낸다. 상기 허용오차 계수는 실수, 예컨대 1.2 또는 1.5일 수 있다.
상기 입력 오디오 신호의 최대 크기는 상기 압축 파라미터 결정기에 의해 결정될 수 있다.
이러한 제1 측면 또는 제1 측면의 선행하는 구현 형태 중 어느 하나에 따른 디지털 압축기의 제5 구현 형태에서, 상기 보조 신호 생성기는 디지털 필터에 의해 상기 입력 오디오 신호를 필터링하도록 구성되고, 상기 디지털 필터는 주파수를 넘는 크기를 가지는 주파수 전달 함수(frequency transfer function)를 포함하고, 상기 크기는 인간 귀의 등음량 곡선(equal loudness curve)에 의해 형성된다. 따라서, 입력 오디오 신호의 압축이 주로 입력 오디오 신호의, 인간의 귀가 덜 민감한 부분들에서 수행될 수 있다.
상기 인간 귀의 등음량 곡선은 인간이 순수(pure) 및/또는 안정된(steady) 톤을 사용하여 일정한 음량을 감지하는 주파수에 대한 음압 곡선(sound pressure)에 관련 있을 수 있다. 인간 귀의 등음량 곡선은 ISO 226:2003에 따른 등음량 곡선일 수 있다.
이러한 제1 측면 또는 제1 측면의 선행하는 구현 형태 중 어느 하나에 따른 디지털 압축기의 제6 구현 형태에서, 상기 보조 신호 생성기는 디지털 저역 통과 필터에 의해 상기 입력 오디오 신호를 필터링하도록 구성되고, 상기 디지털 저역 통과 필터는 시간 도메인에서의 필터 계단 응답(filter step response)을 포함한다.
상기 필터 계단 응답은 상기 입력 오디오 신호의 크기를 증가시키고 상기 오디오 입력 신호의 크기를 감소시키기 위한 상이한 시간 상수를 포함할 수 있다. 상기 필터 계단 응답의 상승 시간은 어택 필터링 시간 상수에 의해 결정될 수 있다. 상기 필터 계단 응답의 하강 시간은 릴리즈 필터링 시간 상수에 의해 결정될 수 있다.
이러한 제1 측면의 제6 구현 형태에 따른 디지털 압축기의 제7 구현 형태에서, 상기 디지털 저역 통과 필터는 아래 식:
Figure 112015127653262-pct00011
Figure 112015127653262-pct00012
에 따라 상기 입력 오디오 신호를 필터링하도록 구성되고,
위 식에서,
Figure 112015127653262-pct00013
는 상기 어택 필터링 시간 상수를 나타내고,
Figure 112015127653262-pct00014
은 상기 릴리즈 필터링 시간 상수를 나타내고,
Figure 112015127653262-pct00015
는 지수 어택 상수(exponential attack constant)를 나타내고,
Figure 112015127653262-pct00016
은 지수 릴리즈 상수(exponential release constant)를 나타내고, t는 샘플링 시간 색인(sampling time index)을 나타내고, Px는 로그 스케일의 입력 오디오 신호의 크기를 나타내고, Ps는 로그 스케일의 상기 필터링된 오디오 신호의 크기를 나타낸다. 따라서, 디지털 저역 통과 필터가 효율적으로 구현될 수 있다.
상기 지수 어택 상수는 무단위(unit-less) 또는 정규화된(normalized) 어택 필터링 시간 상수로부터 결정될 수 있다. 상기 지수 해방 상수는 무단위 또는 정규화된 해방 필터링 시간 상수로부터 결정될 수 있다. 상기 샘플링 시간 색인은 상기 입력 오디오 신호의 샘플링 시간을 지시할 수 있다. 샘플링 시간 색인은 자연수, 예컨대, 2 또는 128일 수 있다.
상기 디지털 저역 통과 필터는 1차(first-order) 디지털 저역 통과 필터에 관련 있을 수 있다. 상기 디지털 저역 통과 필터는 1극 재귀적(one-pole recursive) 무한 임펄스 응답(infinite impulse response, IIR) 필터일 수 있다.
이러한 제1 측면 또는 제1 측면의 선행하는 구현 형태 중 어느 하나에 따른 디지털 압축기의 제8 구현 형태에서, 상기 보조 신호 생성기는 아래 식:
Figure 112015127653262-pct00017
에 따라 제1 보조 신호의 크기를 결정하도록 구성되고,
위 식에서, R은 상기 압축비를 나타내고, T는 로그 스케일의 압축 임계값을 나타내고, Ps는 로그 스케일의 상기 입력 오디오 신호의 크기를 나타내고, t는 시간을 나타내고, g(t)는 로그 스케일의 상기 제1 보조 신호의 크기를 나타낸다. 따라서, 제1 보조 신호의 크기를 효율적으로 결정할 수 있다.
상기 제1 보조 신호의 크기는 상기 디지털 압축기의 구분적(piecewise) 선형 압축 특성에 따라 결정될 수 있다. 상기 압축 임계값은 상기 구분적 선형 압축 특성의 코너 레벨(corner level)일 수 있다.
이러한 제1 측면 또는 제1 측면의 선행하는 구현 형태 중 어느 하나에 따른 디지털 압축기의 제9 구현 형태에서, 상기 결합 유닛은 상기 제2 보조 신호를 취득하기 위해 상기 제1 보조 신호에 상기 압축 이득 파라미터를 승산하도록 구성된다. 따라서, 오디오 신호 압축에 의해 유도되는 압축 헤드룸(compression headroom)을 보상할 수 있다.
상기 승산은 선형 스케일의 상기 제1 보조 신호 및 상기 압축 이득 파라미터 경우에 선형 스케일의 상기 제2 보조 신호를 취득하기 위해 수행될 수 있다. 또한, 가산은 로그 스케일의 상기 제1 보조 신호 및 상기 압축 이득 신호의 경우에 로그 스케일의 상기 압축된 오디오 신호를 취득하기 위해 수행될 수 있다.
이러한 제1 측면 또는 제1 측면의 선행하는 구현 형태 중 어느 하나에 따른 디지털 압축기의 제10 구현 형태에서, 상기 결합 유닛은 상기 압축된 오디오 신호를 취득하기 위해 상기 입력 오디오 신호에 상기 제1 보조 신호를 승산하도록 구성된다. 따라서 입력 오디오 신호의 압축을 효율적으로 수행할 수 있다.
상기 승산은 선형 스케일의 상기 입력 오디오 신호 및 상기 제2 보조 신호의 경우에 선형 스케일의 상기 압축된 오디오 신호를 취득하기 위해 수행될 수 있다. 또한, 가산은 로그 스케일의 상기 입력 오디오 신호 및 상기 제2 보조 신호의 경우에 로그 스케일의 상기 압축된 오디오 신호를 취득하기 위해 수행될 수 있다.
이러한 제1 측면 또는 제1 측면의 선행하는 구현 형태 중 어느 하나에 따른 디지털 압축기의 제11 구현 형태에서, 상기 디지털 압축기는 상기 압축된 오디오 신호를 필터링하는 등화 필터를 더 포함하고, 상기 등화 필터는 주파수 이상의 크기를 가지는 주파수 전달 함수(frequency transfer function)를 포함하며, 상기 크기는 인간 귀의 등음량 곡선에 의해 형성된다. 따라서, 디지털 압축기의 평탄한 주파수 응답을 달성할 수 있다.
상기 인간 귀의 등음량 곡선은 인간이 순수 및/또는 안정된 톤을 사용하여 일정한 음량을 감지하는 주파수에 대한 음압 곡선(sound pressure)과 관련 있을 수 있다. 인간 귀의 등음량 곡선은 ISO 226:2003에 따른 등음량 곡선일 수 있다.
이러한 제1 측면 또는 제1 측면의 선행하는 구현 형태 중 어느 하나에 따른 디지털 압축기의 제12 구현 형태에서,
상기 디지털 압축기는 시간 도메인에서의 상기 압축된 오디오 신호의 최대 크기를 감소시키는 피크 제한기(peak limiter)를 더 포함한다.
상기 피크 제한기는 높은 압축 임계값 및/또는 높은 압축비를 갖는 동적 범위 압축기로서 실현될 수 있다.
제2 측면에 따르면, 본 발명은 입력 오디오 신호를 압축하는 디지털 압축 방법에 관한 것으로, 상기 디지털 압축 방법은, 압축 이득 파라미터를 제공하는 단계; 미리 정해진 가중 계수에 의해 상기 압축 이득 파라미터에 가중치를 부여하여 상기 압축 이득 파라미터로부터 압축비를 결정하여 상기 압축비를 취득하는 단계; 상기 압축비에 의존하여 상기 입력 오디오 신호를 조작하여 제1 보조 신호를 취득하는 단계; 상기 제1 보조 신호와 상기 압축 이득 파라미터를 결합하여 제2 보조 신호를 취득하는 단계; 및 상기 입력 오디오 신호와 상기 제2 보조 신호를 결합하여 압축된 오디오 신호를 취득하는 단계를 포함한다.
상기 디지털 압축 방법은 상기한 제1 측면 또는 제1 측면의 어느 구현 형태에 따른 디지털 압축기에 의해 수행될 수 있다. 상기 디지털 압축 방법의 다른 특징은 그러한 제1 측면 또는 제1 측면의 어느 구현 형태에 따른 디지털 압축기의 기능에 직접적으로 기인할 수 있다.
제3 측면에 따르면, 본 발명은 컴퓨터에서 실행될 때 제2 측면에 따른 디지털 압축 방법을 실행하기 위한 프로그램 코드를 포함하는 컴퓨터 프로그램에 관한 것이다. 따라서, 디지털 압축방법을 자동 및 반복 가능한 방식으로 적용할 수 있다.
상기 컴퓨터 프로그램은 기계로 판독 가능한 프로그램 코드(machine-readable program code)의 형태로 제공될 수 있다. 상기 프로그램 코드는 컴퓨터의 프로세서를 위한 일련의 커맨드(command)를 포함할 수 있다. 상기 컴퓨터의 프로세서는 상기 프로그램 코드를 구성하도록 구성될 수 있다.
본 발명은 하드웨어 및/또는 소프트웨어로 구현될 수 있다.
또한, 본 발명의 실시예들은 아래의 도면과 관련하여 설명할 것이다.
도 1은 구현 형태에 따른 입력 오디오 신호를 압축하는 디지털 압축기를 나타낸 도면이다.
도 2는 구현 형태에 따른 입력 오디오 신호의 압축하는 디지털 압축 방법을 나타낸 도면이다.
도 3은 구현 형태에 따른 입력 오디오 신호를 필터링하는 디지털 필터를 나타낸 도면이다.
도 4는 구현 형태에 따른 높은 동적 범위 오디오 신호 및 압축된 오디오 신호를 나타낸 도면이다.
도 5는 구현 형태에 따른 동적 범위 압축 원리를 나타낸 도면이다.
도 6은 구현 형태에 따른 지수적 감쇠(exponential decay)를 사용한 시간적 평활화를 나타낸 도면이다.
도 7은 구현 형태에 따른 입력 오디오 신호를 압축하는 디지털 압축기를 나타낸 도면이다.
도 8은 구현 형태에 다른 상이한 등음량 곡선을 나타낸 도면이다.
도 9는 구현 형태에 따른 입력 오디오 신호를 필터링하는 디지털 필터를 나타낸 도면이다.
도 10은 구현 형태에 따른 인간 귀의 음량 민감도(loudness sensitivity)를 모델링하는 데 사용된 디지털 필터의 주파수 응답을 나타낸 도면이다.
도 11은 구현 형태에 따른 입력 오디오 신호를 압축하는 디지털 압축기를 나타낸 도면이다.
도 12는 구현 형태에 따른 등화 필터의 주파수 응답을 나타낸 도면이다.
도 13은 구현 형태에 따른 입력 오디오 신호에 대한 디지털 압축기의 효과를 설명하는 도면이다.
도 14는 구현 형태에 따른 입력 오디오 신호를 압축하는 디지털 압축기를 나타낸 도면이다.
도 15는 구현 형태에 따른 입력 오디오 신호를 압축하는 디지털 압축기를 나타낸 도면이다.
도 16은 구현 형태에 따른 입력 오디오 신호를 필터링하는 디지털 필터를 나타낸 도면이다.
도 1은 구현 형태에 따른 입력 오디오 신호를 압축하는 디지털 압축기(100)를 나타낸 도면이다.
디지털 압축기(100)는 압축 이득 파라미터를 제공하는 압축 이득 제어부(101), 압축 이득 파라미터로부터 압축비를 결정하기 위한 압축 파라미터 결정기로서, 미리 정해진 가중 계수에 의해 압축 이득 파라미터에 가중치를 부여하여 압축비를 취득하도록 구성된 압축 파라미터 결정기(103), 압축비에 의존하여 입력 오디오 신호를 조작하여 제1 보조 신호를 취득하는 보조 신호 생성기(105), 및 제1 보조 신호와 압축 이득 파라미터를 결합하여 제2 보조 신호를 취득하고, 오디오 신호와 제2 보조 신호를 결합하여 압축된 오디오 신호를 취득하는 결합 유닛(107)을 포함한다.
입력 오디오 신호는 샘플링 및/또는 양자화된 오디오 신호일 수 있다. 입력 오디오 신호는 모노 오디오 신호, 스테레오 오디오 신호, 또는 다채널 오디 신호를 포함할 수 있다.
압축 이득 제어부(101)는 압축 이득 파라미터를 제공하는 슬라이딩 제어부(sliding control)를 포함할 수 있다. 압축 이득 파라미터는 로그 스케일, 예컨대, 0dB, 3dB, 6dB, 또는 12dB로 제공될 수 있다.
압축 파라미터 결정기(103)는 미리 정해진 가중 계수로 압축 이득 파라미터에 가중치를 부여하여 압축 이득 파라미터로부터 압축비를 결정할 수 있다. 압축비는 선형 스케일, 예컨대 1, 2, 5 또는 10으로 제공될 수 있다. 미리 정해진 가중 계수는 로그 스케일(예컨대 2dB), 또는 선형 스케일(예컨대 1.5)로 제공될 수 있다.
보조 신호 생성기(105)는 보조 신호를 취득하기 위해 압축비에 의존하여 입력 오디오 신호를 조작한다. 상기 조작은 입력 오디오 신호로부터 제1 보조 신호를 유도하는 것에 관한 것일 수 있거나 또는 보조 신호를 취득하기 위해 입력 오디오 신호를 처리하는 것에 관한 것일 수 있다. 제1 보조 신호는 시간 종속 실수 값 신호일 수 있다.
결합 유닛(107)은 제1 보조 신호와 압축 이득 파라미터를 결합하여 제2 보조 신호를 취득할 수 있다. 결합 유닛(107)은 또한 입력 오디오 신호와 제2 보조 신호를 결합하여 압축된 오디오 신호를 취득할 수 있다. 제2 보조 신호는 시간 종속 실수 값 신호일 수 있다.
압축된 오디오신호는 샘플링 및/또는 양자화된 오디오 신호일 수 있다. 압축된 오디오 신호는 모노 오디오 신호, 스테레오 오디오 신호, 또는 다채널 오디 신호를 포함할 수 있다. 압축된 오디오 신호의 동적 범위는 입력 오디오 신호의 동적 범위에 대해 감소될 수 있다.
도 2는 구현 형태에 따른 입력 오디오 신호의 압축하는 디지털 압축 방법(200)을 나타낸 도면이다.
디지털 압축 방법(200)은 압축 이득 파라미터를 제공하는 단계(201), 미리 정해진 가중 계수에 의해 압축 이득 파라미터에 가중치를 부여하여 압축비를 취득하는 단계(203), 압축비에 의존하여 입력 오디오 신호를 조작하여 제1 보조 신호를 취득하는 단계(205), 제1 보조 신호와 압축 이득 파라미터를 결합하여 제2 보조 신호를 취득하는 단계(207), 및 입력 오디오 신호와 제2 보조 신호를 결합하여 압축된 오디오 신호를 취득하는 단계(209)를 포함한다.
디지털 압축 방법(200)은 도 1의 디지털 압축기(100)에 의해 수행될 수 있다. 디지털 압축 방법(200)의 다른 특징들은 도 1의 디지털 압축기(100)의 기능에 직접적으로 기인할 수 있다.
도 3은 구현 형태에 따른 입력 오디오 신호를 필터링하는 디지털 필터(300)를 나타낸 도면이다.
보조 신호 생성기는 디지털 필터(300)로 입력 오디오 신호를 필터링하도록 구성될 수 있으며, 디지털 필터(300)는 주파수 대해 크기를 가지는 주파수 전달 함수를 포함하고, 그 크기는 사람 귀의 등음량 곡선에 의해 형성된다.
인간 귀의 등음량 곡선은, 인간이 순수한 및/또는 안정된 톤을 사용하여 일정한 음량을 감지하는 주파수에 대한 음압 곡선과 관련이 있을 수 있다. 인간 귀의 등음량 곡선은 ISO 226:2003에 따른 등음량 곡선일 수 있다.
도 4는 구현 형태에 따른 높은 동적 범위 오디오 신호 및 압축된 오디오 신호를 나타낸 도면이다. 왼쪽에, 피크 진폭 1인 원래의 높은 동적 범위 오디오 신호가 나타나 있다. 오른쪽에, 피크 진폭 1이지만, 감소된 동적 범위를 갖는 압축된 오디오 신호가 나타나 있다.
태블릿 또는 스마트폰과 같은 모바일 기기는 일반적으로 소형의 저품질 마이크로 스피커 및 저전력 증폭기를 장비하고 있다. 그 결과, 그러한 기기 내의 전기 음향 시스템(electro-acoustic system)으로 재생될 수 있는 음질은 제한될 수 있다. 특히, 생성될 수 있는 최대 음압 레벨이 제한될 수 있다. 이것은 높은 레벨에서의 신호 왜곡 및 제한된 동적 범위를 초래할 수 있다.
또한, 이러한 기기는 높은 출력 레벨을 요구할 수 있는 소란한 환경에서 사운드를 재생하는 데 자주 사용된다. 게다가, 스피커들 사이의 짧은 거리를 보상하기 위한 스테레오 확장(stereo widening)과 같은, 추가적인 처리는 최대 출력 레벨을 더욱 감소시킬 수 있다.
이 문제에 대한 하나의 해결방안은 고품질의 스피커 및 증폭기와 고출력 전력의 통합일 수 있다. 그러나, 이것은 소형의 모바일 기기에 통합될 수 없는 더 큰 스피커와 배터리에서 더 많은 에너지를 소비하는 증폭기를 요구할 수 있다. 따라서, 그러한 음향 기기에 의해 재생되는 음향 신호의 지각된 음량을 향상시킬 수 있는 신호 처리 기술에 대한 요구가 있을 수 있다. 오디오 신호의 동적 범위 압축(dynamic range compression, DRC)이 음량 향상을 위한 하나의 기술이 될 수 있다. DRC의 목표는 전자 음량 시스템의 능력에 의해 부과된 제한 내에 피크 에너지를 유지하면서 평군 신호 에너지를 증가시키는 것이다. 이 효과를 달성하기 위해, 약한 신호 성분의 레벨을 향상시키는 것이 한 가지 전략일 수 있다.
오디오 신호의 동적 범위 압축의 효과는 도 4에 도시되어 있다. 왼쪽 도면은 일반적인 음악 예의 신호 진폭을 보여준다. 규칙적으로 발생하는 높은 진폭 피크는 일반적으로 드럼을 치는 것에 대응한다. 이 신호는 전기 음향 시스템에 의해 처리될 수 있는 최대 진폭에 대응할 수 있는 피크 진폭 1을 취득하기 위해 정규화될 수 있다. 디지털 오디오 신호의 진폭은 일반적으로 구간(interval) [-1; 1]에 제약을 받는다. 이 제한을 초과하는 진폭은 클리핑(clipping)을 초래할 수 있다, 즉, 그 한계(limits)로 제한될 수 있다. 이것은 높은 신호 왜곡을 발생시킬 수 있다. 이 피크 진폭은, 높은 동적 범위 오디오 신호에서는 매우 드물게 발생할 수 있기 때문에, 신호의 전체 출력 레벨을 제한할 수 있다. 신호의 대부분은 낮은 진폭을 가질 수 있다. 이 신호에 대해 수행된 동적 범위 압축 연산(dynamic range compression operation)의 결과는 도 4의 오른쪽의 진폭 플롯(amplitude plot)을 초래할 수 있다. 결과로서 생성된 신호(resulting signal)의 피크 진폭은 여전히 1일 수 있지만, 지각된 평균 음량을 정의하는 평균 진폭은 훨씬 높을 수 있다. 특히, 낮은 진폭의 성분이 상당히 향상될 수 있다. 높은 에너지 성분에 대한 낮은 것의 비율로 정의될 수 있는 동적 범위를 감소시킬 수 있다.
도 5는 예시적인 구현 형태에 따른 동적 범위 압축 원리를 나타낸 도면이다. 피크 진폭 검출에 기초하여 정적 압축 곡선을 사용한 동적 범위 압축의 기본 원리가 도시되어 있다. 압축을 하지 않는 경우는 실선으로 나타나 있다. -15dB의 압축 임계값 및 3:1의 압축비를 사용한 압축의 경우는 점선으로 나타나 있다.
입력 신호 x와 압축된 신호
Figure 112015127653262-pct00018
사이의 전달 함수는 다음 거동을 보인다. 입력 신호 x의 레벨이 dB로 지정된 주어진 임계값 T보다 작은 경우, 수정되지 않고; 압축된 신호
Figure 112015127653262-pct00019
는 x와 동일하다. 입력 신호 x의 레벨이 임계값 T를 초과하는 경우,
Figure 112015127653262-pct00020
는 주어진 압축비 R에 의해 감소된다. 압축비는 출력 신호의 레벨 또는 레벨 변화에 대한 입력 신호의 레벨 또는 레벨 변화에 관한 것이다. 이 예에서, 압축비 R=3은, 입력 신호에서 임계값 T를 3dB 초과하는 레벨이 출력 신호에서 임계값 위의 겨우 1dB의 레벨로 감소한다는 것을 지시한다. 그 결과, 압축된 신호의 레벨
Figure 112015127653262-pct00021
은, 시변 이득 g(t)에 따라, 입력 신호의 레벨 Px에 비해, 감소된다.
식 1이 다음과 같이 주어질 수 있다:
Figure 112015127653262-pct00022
이것이 동적 범위 압축의 기본 원리일 수 있다. DRC는 음악 녹음 및 재생에서 중요한 문제일 수 있기 때문에, 아날로그 도메인에서도, 많은 상이한 구현 및 확장이 적용될 수 있다. 특히, 도 5에 도시된 구분적 선형 압축 곡선은, 예컨대 심한 굴곡부(knee)를 가지는 소프트 압축 곡선, 또는 S자 곡선(sigmoid)과 같은 포화 압축 곡선(saturating compression curve )으로 대체될 수 있다
도 6은 구현 형태에 따른 지수적 감쇠(exponential decay)를 사용한 시간적 평활화를 나타낸 도면이다. 지수적 감쇠는 어택(attack) 및/또는 감쇠 시간을 모델링하는 데 사용될 수 있다. 실선은 Px를 나타낸다. 점선은 30ms의 어택(attack) 필터링 시간 상수 및 150ms 릴리즈(release) 필터링 시간 상수를 사용한 Ps를 나타낸다.
시간적 평활화를 하지 않으면, 출력 신호의 레벨이 너무 빨리 변화할 수 있기 때문에 동적 범위 압축은 많은 아티팩트(artifact)를 도입할 수 있다. 출력 신호는 입력 신호의 특성과 유사하지 않을 수 있다. DRC의 가청 아티팩트를 감소시키기 위해, 압축 이득을 천천히 변화시킬 수 있다.
이 효과를 달성하기 위한 방법(approach)은 도 6에 도시된 바와 같이 어택 및 릴리즈 시간에 대해 지수적 감쇠를 추가함으로써 피크 진폭의 검출을 평활화하는 것일 수 있다. 어택, 색인 A, 및 릴리즈, 색인 R에 대해 상이한 시간 상수
Figure 112015127653262-pct00023
를 지정하는 것은 음향 이벤트(acoustic event)의 상이한 상태들에 대한 평활화 효과를 제어할 수 있도록 해준다. 어택은 신호 레벨의 증가와 함께 가는 이벤트의 개시를 가리킬 수 있다. 릴리즈는 일반적으로 더 느린 이 이벤트의 에너지 감쇠(energy decay)를 가리킬 수 있다. 어택 및 릴리즈에 대한 지수적 감쇠는 다음과 같이 계산될 수 있다:
Figure 112015127653262-pct00024
은 어택 및 릴리즈에 대한 최종 값의 63%에 도달하는 시간으로 정의될 수 있고;
Figure 112015127653262-pct00025
이고,
Figure 112015127653262-pct00026
이다.
식 2가 다음과 같이 주어질 수 있다:
Figure 112015127653262-pct00027
그러면,
Figure 112015127653262-pct00028
Figure 112015127653262-pct00029
를 대신하는 시변 이득 g(t)의 계산을 위해 식 1 또는 2에 사용될 수 있다.
다른 구현, 예컨대, 분리(decoupled), 분지(branching), 피드 포워드(feed-forward), 피드백(feedback), 측쇄(side-chain), 편향(biased), 및/또는 포스트 이득 구현(post gain implementation)이 사용될 수 있다.
시간적 평활화 파라미터 설정은 압축량과 오디오 품질, 즉 아티팩트 사이의 트래드오프(trade-off)와 관련 있을 수 있고 트래드오프를 구성할 수 있다. 특히, 이들은, 드럼 또는 과도현상(transient)으로 인해 영향을 받을 수 있으므로 어떻게든 진폭 피크에 영향을 미칠 수 있다. 긴 릴리즈 시간 상수의 경우에는, 피크 또는 과도현상 후에, 신호는 장시간 감쇄될 수 있고(attenuated), Py는 너무 많이 감소 될 수 있다. 짧은 릴리즈 시간 상수의 경우에는, 과도현상 후에 신호 레벨의 점프가 발생할 수 있다. 긴 어택 시간 상수의 경우에는, 과도현상이 어택 시간보다 짧을 수 있으므로 과도현상은 감쇄되지 않을 수 있고, 피크 레벨은 여전히 높을 수 있다. 짧은 어택 시간 상수의 경우에는, 과도현상은 명확성(clarity) 결여의 결과로 억압될 수 있고(squshed), 레벨이 너무 많이 감소될 수 있으며, 과도현상의 레벨은 과도현상 직전의 신호의 레벨과 동일할 수 있다.
다른 솔루션이 DRC에 적용될 수 있다. DRC 알고리즘을 평가하는 4가지 주요 기준은 음질, 압축비, 계산 복잡도 및 사용자 제어성(user controllability)일 수 있다. 높은 압축은 일반적으로 나쁜 음질을 초래할 수 있으므로 압축과 품질 사이에는 트래드오프가 존재할 수 있다. 파형에서의 피크, 예컨대 과도현상 또는 어택은 높은 압축 이득을 취득하기 위해 감쇄될 수 있다. 이것은 지각 선명도(perceptual clarity)의 결여를 초래할 수 있다. TV 및 라디오 방송에서 예로서 사용된 고품질의 동적 범위 압축 시스템은 일반적으로 주파수 영역에서 또는 전체 대역(full-band) 신호의 서브대역(sub-band)에서 동작할 수 있다. 이것은 높은 계산 복잡도를 초래할 수 있다. 특히 모바일 기기의 경우, 계산 및 에너지 자원이 제한될 수 있다.
파라미터 설정은 높은 오디오 품질을 유지하면서 높은 압축량을 얻는 것과 관련 있을 수 있다. 최적의 파라미터 설정은 또한 특정 오디오 신호와 청취 환경에 의존할 수 있다. 소비자 기기의 애플리케이션의 경우, 파라미터는 일반적으로 보수적 또는 덜 최적인 설정(conservative or less optimal setting)을 사용하여 미리 정의될 수 있다. 사용자는 온(on) 또는 오프(off)를 제외하고는 어떠한 제어 메커니즘도 없을 것이다.
도 7은 구현 형태에 따른 입력 오디오 신호를 압축하는 디지털 압축기를 나타낸 도면이다. 디지털 압축기(100)는 동적범위 압축 시스템을 포함할 수 있다.
디지털 압축기(100)는 압축 이득 제어부(101), 압축 파라미터 결정기(103), 보조 신호 생성기(105), 결합 유닛(107), 등화 필터(701), 및 피크 제한기(703)를 포함한다. 압축 파라미터 결정기(103)는 파라미터 명세(parameter specification)에 사용될 수 있다. 압축 파라미터 결정기(103)는 압축 임계값, 압축비, 어택 필터링 시간 상수, 및 릴리즈 필터링 시간 상수를 보조 신호 생성기(105)에 제공할 수 있다. 보조 신호 생성기(105)는 디지털 필터(300) 및 이득 추정 유닛(705)을 포함할 수 있다.
많은 방법이 음악 제작 애플리케이션에 초점을 맞추고 있다. 본 발명의 실시예들은 특히, 목표가 고음질과 낮은 계산 복잡도 및 낮은 전력 소비나 낮은 배터리 전력 소비를 유지하면서 실시간으로 스마트폰 및/또는 태블릿과 같은 모바일 기기의 스피커에 의해 생성된 평균 출력 레벨을 증가시킬 수 있는, 모바일 사운드 재생 시나리오를 다룬다.
본 발명의 실시예는, 예를 들어, 도 7에 도시된 향상된 디지털 압축기(100) 또는 동적 범위 압축 시스템에 관한 것이다. 디지털 압축기(100) 또는 시스템은 인간 귀의 민감도의 주파수 특성을 고려하기 위한 인간 음성 지각의 모델, 즉 필터 등음량 모듈을 포함할 수 있다. 디지털 압축기(100) 또는 시스템은 신호 선명도를 유지하면서 과도현상의 레벨을 감소시키기 위해 캐스케이딩된(cascaded) 동적 범위 압축 시스템, 즉, 피크 제한기 모듈과 캐스케이딩된 동적 범위 압축 모듈을 포함할 수 있다. 디지털 압축기(100) 또는 시스템은 사용자 또는 소비자에 의해 연속적인 방식으로 제어될 수 있는 압축 이득 G를 위한 단일 제어 파라미터를 포함할 수 있다. 디지털 압축기(100) 또는 시스템은 모바일 기기상의 실시간 애플리케이션을 위해 시간 도메인에서 낮은 복잡도 전체 대역 구현을 포함할 수 있다.
디지털 압축기(100) 또는 시스템의 흐름도가 도 7에 도시되어 있다. 입력 신호 x(t)가 주어지면, 디지털 압축기(100) 또는 시스템은 다음의 단계들을 실행할 수 있다:
처음에, 디지털 필터(300) 또는 동음량 모듈 필터가 적용될 수 있다, 즉, 전처리 작업(preprocessing operation)은 음량 등화된(loudness equalized) 입력 신호 xl(t)를 취득하기 위해 등음량 곡선을 사용하여 입력 신호 x(t)를 필터링하여 단순화된 음량 모델을 적용한다. 전처리의 목적은 인간 귀가 덜 민감한 신호에서 주파수를 강조할 수 있다. 두 번째로, 동적 범위 압축 모듈이 적용될 수 있다. 이것은 압축 파라미터 결정기(103) 또는 파라미터 명세 모듈을 포함할 수 있다. 외부적으로, 예컨대, 사용자가 지정한 원하는 압축 이득이 dB로 주어지면, 내부의 동적 범위 압축 파라미터
Figure 112015127653262-pct00030
은 최적의 방식으로 조정될 수 있다. 이것은 또한 음량 등화된(loudness equalized) 입력 신호 xl(t)로부터 시변 이득 g(t)을 추정할 수 있는 이득 추정 유닛(705) 또는 이득 추정 모듈을 포함할 수 있다. 취득된 압축은 인간 귀가 덜 민감한 영역에 대응할 수 있는, 등화에 의해 강조된 영역에서 더 강할 수 있다. 그 결과, 동적 범위 압축의 아티팩트가 덜 들릴 수 있고 더 강한 압축이 적용될 수 있다. 입력 신호 x(t)의 동적 범위 압축은 신호 x(t)에 시변 이득 g(t)와 원하는 압축 이득 G를 적용하여 수행되어 압축된 신호 xc(t)를 취득할 수 있다. 세 번째로, 주파수 종속 압축을 보정하고 신호 xe(t)의 평탄한 주파수 응답을 재생성하기 위해 xc(t)에 등화를 적용할 수 있는 등화 필터(701) 또는 등화 모듈이 적용될 수 있다. 이것은 또한 계정에 라우드스피커의 주파수 응답을 고려할 수 있다. 네 번째로, 피크 제한기(703)가 선택적으로 적용될 수 있다. 피크 및/또는 과도현상의 소프트 제한(soft limiting)이 출력 신호 y(t)를 취득하기 위해 얻기 위해 강한 어택 위상에서 클리핑 방지에 적용될 수 있다.
도 8은 구현 형태에 다른 상이한 등음량 곡선을 나타낸 도면이다.
귀는 모든 주파수에 동일하게 민감하지 않을 수 있다. 도 8은 전체 가청 범위 대한 상이한 가청 주파수들에 대한 응답을, 동등한 크기로 지각되는 음압 레벨을 나타내는 곡선들의 집합으로 나타낸다. 저 주파수 및 고 주파수의 경우, 음압 레벨은 중간 주파수에서와 동일한 지각된 음량을 취득하기 위해 훨씬 더 높을 수 있다. 곡선들은, 귀가 이 범위의 주파수에 가장 민감할 수 있다는 것을 나타내는, 4kHz에서의 딥(dip)과 함께, 2∼5kHz 범위에서 가장 낮을 수 있다. 더 높거나 더 낮은 톤의 강도 레벨은 음량의 동일한 인상을 만들기 위해 실질적으로 증대될 수 있다. 이러한 결과는 출력 신호의 더 높은 음질을 달성하기 위해 이용될 수 있다. 이 사상(idea)은 인간 귀가 덜 민감한 주파수 영역들에서의 강한 동적 범위 압축에 적용될 수 있다.
도 9는 구현 형태에 따른 입력 오디오 신호를 필터링하는 디지털 필터(300)를 나타낸 도면이다. 디지털 필터(300)는 필터 등음량 모듈을 포함할 수 있다.
디지털 필터(300)는 결정 유닛(901) 및 필터링 유닛(903)을 포함할 수 있다. 결정 유닛(901)은 필터 파라미터 명세를 위해 사용될 수 있으며, 필터 파라미터를 취득하기 위해 등음량 곡선이 결정 유닛(901)에 제공될 수 있다. 필터링 유닛(903)은 필터 파라미터에 기초하여 입력 신호 x(t)를 필터링하여 음량 등화된 신호 xl(t)를 취득한다.
음량 모델은 등음량 곡선을 사용하여 필터링함으로써 인간 귀의 감도를 모델링하는 데 사용될 수 있다. 이것은 인간 귀가 덜 민감한 주파수들을 강화할 수 있고 이가 귀가 매우 민감한 주파수들을 감쇄시킬 수 있다.
도 10은 구현 형태에 따른 인간 귀의 음량 민감도를 모델링하는 데 사용된 디지털 필터의 주파수 응답을 나타낸 도면이다. 저 주파수에서, 증폭은 제약받을 수 있고 스피커에 의해 재생되지 않을 수 있다. 고 주파수에서, 증폭은 제약받을 수 있고 일반적으로 스피커에 의해 강화된다.
이 효과를 얻기 위해 이하의 처리가 사용될 수 있으며, 도 9를 참조하기 바란다. 등음량 곡선과 유사한 필터 응답을 가지고 필터링을 수행한다. 이것은 인간 귀가 덜 민감한 주파수에서의 레벨을 강화할 수 있고 인간 귀가 매우 민감한 주파수를 감쇄시킬 수 있다. 그러면, 후속하는 동적 범위 압축은 인간 귀가 덜 민감한 주파수 영역, 즉 고 주파수 및 저 주파수에서 제한을 받을 수 있다. 그 결과, 압축 아티팩트가 덜 들릴 수 있다. 특히, 주파수 범위 2-5 kHz 또는 2-6 kHz는 동적 범위 압축에 의해 거의 변경되지 않는다. 이 범위가 사운드 선명도에 가장 중요할 수 있다.
도 10에 도시된 바와 같은 필터 응답은 등음량 곡선에 기초하지만 여러 측면에 따라 수정될 수 있다. 마이크로 스피커의 특성 및 능력을 고려하기 위해, 최저 및 최고 주파수의 증폭은 상한을 도입함으로써 제한될 수 있다. 이 제한을 위한 동기는 소형 스피커를 사용하는 숙고한 애플리케이션 시나리오에 기초할 수 있다. 여기서, 최저 주파수는 스피커에 의해 재생되지 않을 수 있으며, 고 주파수는 일반적으로 그러한 스피커에 의해 증폭될 수 있다. 증폭의 제한은 이 점을 고려할 수 있다. 증폭의 전체 범위, 즉 필터 응답의 최소와 최대 사이의 차이는 단지 15dB에 걸쳐 제한될 수 있다. 도 8로부터는 단일의 등음량 곡선의 음압 레벨의 최소값과 최대값 사이의 차이가 최대 80dB까지 이를 수 있음을 알 수 있다. 동적 범위 압축에서, 임계값 T는, 일반적인 애플리케이션 시나리오에서, 6과 20dB 사이의 값으로 설정될 수 있다. 그 결과, 다른 것에 비해 특정 주파수를 80dB까지 증폭할 수 있는 등화는 오직 이들 주파수에서 고도로 압축되는 결과를 초래할 수 있지만, 다른 것은 임계값에 도달할 수 있고, 따라서 전혀 압축되지 않을 수 있다. 증폭의 전체 범위를 제한하는 것은 상이한 주파수 영역들에서의 동적 범위 압축의 강도를 제어할 수 있도록 해준다.
도 11은 구현 형태에 따른 입력 오디오 신호를 압축하는 디지털 압축기(100)를 나타낸 도면이다. 디지털 압축기(100)는 동적 범위 압축 모듈을 포함할 수 있다.
디지털 압축기(100)는 압축 파라미터 결정기(103), 보조 신호 생성기(105), 및 결합 유닛(107)을 포함한다. 디지털 압축기(100)의 압축 이득 제어는 도 11에 도시되어 있지 않다. 압축 파라 미터 결정기(103)는 파라미터 명세를 위해 사용될 수 있다. 압축 파라미터 결정기(103)는 압축 임계값, 압축비, 어택 필터링 시간 상수, 및 릴리즈 필터링 신간 상수를 보조 신호 생성기(105)에 제공할 수 있다. 보조 신호 생성기(105)는 이득 추정 유닛(705)을 포함할 수 있다. 음량 등화된 신호 xl(t)는 보조 신호 생성기(105)에 제공될 수 있다. 입력 오디오 신호 x(t)는 결합 유닛(107)에 제공될 수 있다. 압축된 오디오 신호 xc(t)는 결합 유닛(107)에 의해 제공될 수 있다.
이어서, 도 11에 도시된 바와 같이 동적 범위 압축이 적용될 수 있다. 동적 범위 압축은 일반적인 설명을 따를 수 있으며 동일한 표기법(notation)을 사용할 수 있다.
먼저, 예를 들어 사용자에 의해 지정되는, 원하는 압축 이득 파라미터 G가 주어지면, 소개한 바와 같은 동적 범위 압축을 위한 파라미터
Figure 112015127653262-pct00031
이 다음과 같이 유도될 수 있다. 목표는 G의 헤드룸이 클립핑 없이 재생될 수 있는 xc(t)의 피크 크기 또는 진폭과 최대값 Pmax 사이에서 생성될 수 있도록 신호를 압축하는 것일 수 있다.
Figure 112015127653262-pct00032
결과(finding)는 원하는 압축 이득 파라미터 G를 얻기 위해, R 및 T에 대해 상이한 값이 가능하다는 것일 수 있다. 임계값을 낮추는 것은 더 높은 G를 취득할 수 있도록 해주지만, 동시에 동적 범위 압축(DRC)에 의해 영향을 받을 수 있는 신호 성분의 양을 증가시킬 수도 있다. 압축비를 증가시킴으로써, 임계값 이상의 성분이 더 이 강하게 압축될 수 있다. 지각적 품질의 관점에서 최적인 R 및 T 값을 선택하는 것은 어려운 작업일 수 있다. 결과는 임계값 T와 압축비 R 사이의 특정 관계가 높은 품질을 획득하기 위해 바람직하다는 것이다. 또한, 광범위한 청취 테스트는 그것이 대략 아래와 같을 때 동적 범위 압축의 지각 품질이 최적인 것으로 밝혀졌다:
Figure 112015127653262-pct00033
.
필터링 시간 상수 또는 시간적 평활화 상수
Figure 112015127653262-pct00034
는 높은 지각 품질을 얻기 위해 중요할 수 있는 시간적 연속성을 보장하기 위해 압축량을 감소시킴으로써 DRC 결과에 영향을 미칠 수 있다. 그 결과, 달성되는 최종 압축은 원하는 G보다 낮을 수 있다. 평활화가 강할수록, 즉 시간 상수
Figure 112015127653262-pct00035
가 클수록, 달성된 압축은 더 낮다. 최상의 가능한 지각 품질을 얻기 위해, 필터링 시간 상수에 대한 파라미터 값은 원하는 압축 이득 파라미터 G에 의존하여 선택된다.
Figure 112015127653262-pct00036
지각 청취 테스트(perceptual listening test)는 필터링 시간 상수와 G 사이의 선형 의존성이 최상의 결과를 낳는 것으로 밝혀졌다. G 값을 증가시키기 위해, 필터링 시간 상수는 선형적으로 감소될 수 있다.
평활화의 결과,
Figure 112015127653262-pct00037
이 발생할 수 있다. 따라서, 허용오차 계수
Figure 112015127653262-pct00038
의 추가가 원하는 압축 이득 파라미터 G가 달성될 수 있도록 보장하기 위해 바람직할 수 있다. 허용오차 계수는 빠른 과도현상이 어택 감쇠에 의해 파악되지 않을 수 있고 높은 신호 피크를 초래할 수 있음을 고려할 수 있다. 따라서, 허용오차 계수 값은 어택 필터링 시간 정수에 따라 선택될 수 있다.
Figure 112015127653262-pct00039
최적의 파라미터 설정을 유도한 후, 시변 이득 g(t)는 음량 등화된 신호
Figure 112015127653262-pct00040
로부터 추정될 수 있다.
Figure 112015127653262-pct00041
위 식에서
Figure 112015127653262-pct00042
Figure 112015127653262-pct00043
마지막으로, 이득은 원하는 압축 이득 파라미터 G와 승산 또는 증폭될 수 있고 마지막으로 원래의 입력 신호 x(t)에 승산될 수 있고, 음량 등화된 신호에 승산될 수 없다. 원래의 신호가 음량 모델에 의해서 뿐 아니라 음량 보정된 이득(loudness-corrected gain)에 의해서도 변경될 수 없으므로 가능한 최상의 품질을 제공할 수 있다.
Figure 112015127653262-pct00044
도 12는 구현 형태에 따른 등화 필터의 주파수 응답을 나타낸 도면이다.
선택적인 후처리 단계로서, 등화 필터가 신호에 적용될 수 있다. 등화는 주파수 종속 동적 범위 압축을 보상하는 것이 바람직할 수 있다. 음량 모델에 의해 강화되는 주파수 범위는 더 강하게 압축될 수 있으므로 음량 모델에 의해 감쇄되는 주파수보다 낮은 수준을 받을 수 있다. 이 접근 방법은, 동적 범위 압축이 아티팩트 압축을 위해 인간의 귀가 덜 만감한 주파수 범위 내에 집중될 수 있도록 보장하지만, 주파수 응답이 평탄하지 않는 출력 신호를 초래할 수도 있다. 이 효과를 보상하기 위해, 다시 등음량 곡선의 변형에 의한 필터링이 사용될 수 있다.
도 12에 도시된 바와 같이 필터 응답은 이득 g(t)의 계산에 영향을 미치는 등음량을 위한 전처리 필터로 인한 비선형 압축을 보상하기 위해 조정될 수 있다. 이득 g(t)는 음량 등화된 신호로부터 유도되지만 원래의 입력 신호에 적용되기 때문에, 압축된 신호는 일반적으로 평탄한 주파수 응답을 가질 수 없다. 특히, 저 주파수 및 고 주파수는 감쇄될 수 있다. 도 12에 도시된 필터 응답은 압축 이득 6dB을 낳는 임계값 T=12dB 및 2:1의 비율을 사용한 예시적인 압축의 경우에 이 효과를 보상하기 위해 설계될 수 있다. 이 경우, 저 주파수 및 고 주파수는 평탄한 주파수 응답을 얻기 위해 약 2dB만큼 증폭될 수 있다. G의 다른 값에 대해, 응답은 선형 적으로 확대 축소(linearly scaled)될 수 있다.
등화는 주파수 종속 동적 레인지 압축을 보상하는 것이 바람직할 수 있다. 등음량 곡선의 변형에 의한 필터링이 사용될 수 있다. 잠재적으로, 등화는 압축 이득에 따라 달라진다. 또한, 목표 출력 기기가 등화를 정의하는 것으로 간주될 수 있다.
도 13은 구현 형태에 따른 입력 오디오 신호에 대한 디지털 압축기의 효과를 설명하는 도면이다. 디지털 압축기는 동적 범위 압축 시스템을 포함할 수 있다. 첫 번째 파형은 입력 신호 x(t)을 도시하고, 두 번째 파형은 단계 3, 즉 등화 이후의 오디오 신호 xe(t)를 도시하고, 세 번째 파형은 단계 4, 즉 피크 제한 이후의 오디오 신호 y(t)를 도시한다.
마지막 단계로서, 피크 제한기가 출력 신호에 클리핑 방지하기 위해 적용될 수 있다. 클리핑은 가능한 최대값 Pmax를 초과하는 신호의 진폭을 나타낼 수 있다. 시간 상수
Figure 112015127653262-pct00045
에 의해 수행된 시간적 평활화로 인해, 빠르고 강한 과도현상, 예컨대 드럼 치기는 압축되지 않을 수 있다. 그 결과, 신호 레벨의 빠른 변화가 높은 지각 품질 또는 신호 선명도를 보장하는 중요한 측면일 수 있는 출력 신호에 보존될 수 있다. 그러나, 이들 피크는, 원하는 압축 이득 G가 클리핑의 도입 없이 달성될 수 있는 것을 방지할 수 있다. 이 문제에 대한 한 가지 해결방안은 동적 범위 압축 모듈에 사용된 시간 상수를 감소시키는 것일 수 있다. 그러나 이것은 품질을 저하시킬 수 있다.
최종 처리 단계로서 피크 제한기를 추가하는 경우 클리핑을 회피하면서 높은 음질을 달성할 수 있다. 피크 제한기는 단지 신호의 나머지 피크에 영향을 미치도록 조정될 수 있는 동적 범위 압축기일 수 있다. 이를 위해, 임계값 T는 높은 임계값, 예컨대, T=-1dB로 설정될 수 있고, 압축비는 예컨대 R=60:1로 높을 수 있다. 어택 및 릴리즈 시간 상수에 대한 작은 값과 함께, 이들 설정값은 임계값을 초과하는, 그에 따라 클리핑을 초래하는 임의의 피크가 매우 큰 비율, 예컨대 R=60:1로 압축될 수 있음을 보장할 수 있다. 그 결과, 임계값을 초과하는 피크가 강하게 압축되거나 그것들이 이 임계값을 초과하지 않도록 보장하기 위해 소프트 클리핑될 수 있다(soft-clipped).
동적 범위 압축 모듈에 의해 수행되는 느린 동적 범위 압축은, 느리게 전개되는 오디오 신호의 장기 및 중기 특성이 압축에 의해 유지될 수 있도록 보장할 수 있고, 빠르게 반응하는 피크 제한기는 오직 클리핑을 방지하기 위해 소프트 클리핑을 수행할 수 있다. 조합하여, 신호 품질, 특히 신호 선명도는, 여전히 높은 압축 이득을 확보하면서 최대한 유지될 수 있다.
도 13은 입력 신호 x(t)를 피크 제한 이후의 최종 출력 신호 y(t)뿐 아니라 등화 이후 압축된 신호 xe(t)와 비교한다
동적 범위 압축 후, 신호의 중기 레벨 특성은 유지될 수 있지만 [-1; +1]의 진폭값을 초과하는 피크는 후 신호 xe(t)에 남아 있을 수 있다. 이들은 마지막으로 피크 제한기에 의해 소프트 클리핑되어 신호 y(t)를 얻을 수 있다.
도 14는 구현 형태에 따른 입력 오디오 신호를 압축하는 디지털 압축기(100)를 나타낸 도면이다. 디지털 압축기(100)는 동적 범위 압축 시스템을 포함할 수 있다.
디지털 압축기(100)는 압축 이득 제어부(101), 내부 파라미터의 적응을 위한 압축 파라미터 결정기(103), 음량 모델을 사용하는 보조 신호 생성기(105), 동적 범위 압축을 위한 결합 유닛(107), 등화 필터(701), 및 피크 제한기(703)를 포함한다. 입력 오디오 신호는 보조 신호 생성기(105), 및 결합 유닛(107)에 제공될 수 있다. 압축된 오디오 출력 신호는 피크 제한기(703)에 의해 제공될 수 있다.
단순화된 음량 모델의 적용, 즉 등음량 곡선을 사용하는 필터는 인간 귀가 덜 민감한 주파수를 강조할 수 있다. 동적 범위 압축이 달성될 수 있다. 음량 모델로 인해, 귀가 덜 민감한 영역에서 압축은 더 강력할 수 있고 압축 아티팩트는 덜 들릴 수 있다. 주파수 종속 압축을 보정하고 평탄한 주파수 응답은 재생성(recrate)하기 위해 등화를 적용하는 것이 바람직할 수 있다. 강한 어택 위상에서의 클리핑을 방지하기 위한 피크 제한기가 채용될 수 있다.
도 15는 구현 형태에 따른 입력 오디오 신호를 압축하는 디지털 압축기(100)를 나타낸 도면이다. 디지털 압축기(100)는 동적 범위 압축 시스템을 포함할 수 있다.
디지털 압축기(100)는 파라미터 명세를 위한 압축 파라미터 결정기(103), 이득 추정 유닛(705)을 구비한 보조 신호 생성기(105), 및 결합 유닛(107)을 포함할 수 있다. 압축 파라미터 결정기(103)는 보조 신호 생성기(105)에 압축 임계값, 압축비, 어택 필터링 시간 상수, 및 릴리즈 필터링 시간 상수를 제공할 수 있다. 음량 등화된 오디오 신호가 보조 신호 생성기(105)에 제공될 수 있다. 입력 오디오 신호는 결합 유닛(107)에 제공될 수 있다. 압축된 오디오 신호 y(t)는 결합 유닛(107)에 의해 제공될 수 있다.
동적 범위 압축이 달성될 수 있다. 이득은 음량 등화된 신호로부터 추정되고 원래의 입력 신호에 적용될 수 있다. 동적 범위 압축의 매개 변수 설정을 단순화하는 것이 바람직할 수 있다. 사용자는 연속적인 방식으로 원하는 압축 이득 G를 지정할 수 있다. 동적 범위 압축을 위한 파라미터
Figure 112015127653262-pct00046
는 유도될 수 있고 DRC 알고리즘에 제공될 수 있다.
Figure 112015127653262-pct00047
일 수 있기 때문에, 허용오차 계수
Figure 112015127653262-pct00048
가 원하는 압축 이득 파라미터 G를 취득하기 위해 추가될 수 있다.
도 16은 구현 형태에 따른 입력 오디오 신호를 필터링하는 디지털 필터(300)를 나타낸 도면이다. 디지털 필터(300)는 필터 등음량 모듈을 포함할 수 있다.
디지털 필터(300)는 등음량 곡선을 사용하는 결정 유닛(901), 및 필터링 유닛(903)을 포함할 수 있다. 필터링 유닛(903)은 음량 등화된 오디오 신호를 제공하기 위해 입력 오디오 신호를 필터링 할 수 있다. 디지털 필터(300)는 음량 모델에 기초할 수 있다.
본 발명은 제한된 전기 음향 시스템, 처리 능력 및 소비 전력을 갖는 모바일 기기에 대한 애플리케이션에 특별히 맞추어 질 수 있다.
더 높은 음질을 제공할 수 있다. 압축 아티팩트는 인간의 귀가 덜 민감한 주파수 범위에 집중될 수 있다. 느린 압축과 빠른 피크 제한의 조합은 신호의 느린 성분과 빠른 성분 둘 다의 둘 다의 원래 특성을 가능한 한 많이 유지할 수 있다. 지각적 선명도를 유지할 수 있다. 원하는 압축 이득을 지정하는 단일의 압축 이득 파라미터를 채용할 수 있다. 이는 신호의 내용 및/또는 청취 환경에 적응시키기 위해 계속해서 조정 가능할 수 있다. 컴퓨터를 이용한(computational) 간단한 구현을 제공할 수 있다. 주파수 도메인 및/또는 서브대역 처리 대신에 전체 대역 처리가 채용될 수 있다. 주파수 변환 및/또는 서브대역 분해(sub-band decomposition)가 채용될 수 없으므로 낮은 지연을 달성할 수 있다.
일 구현 형태에서, 본 발명은 인간의 귀의 감도의 주파수 특성을 고려하기 위한 인간 음성 인식의 전체 대역 모델, 및 신호 선명도를 유지하면서 과도현상의 레벨을 감소시키기 위한 캐스케이딩된 동적 범위 압축 및 소프트 클리핑 시스템을 포함하는 오디오 신호의 강화된 동적 범위 압축을 위한 방법 및 장치에 관한 것이다.
일 구현 형태에서, 본 발명은 상기한 방법 및 장치에 관한 것으로, 사용자가 압축 이득을 위한 단일의 제어 파라미터를 연속적인 방식을 제어하도록 하는 유닛, 및 지정된 압축 이득 파라미터로부터 최적의 파라미터 설정을 유도하기 위한 내부 변환기를 더 포함한다.
일 구현 형태에서, 본 발명은 단말기 및/또는 디코더 특징(feature)에 관한 것이다.

Claims (20)

  1. 입력 오디오 신호를 압축하는 디지털 압축기로서,
    압축 이득 파라미터를 제공하는 압축 이득 제어부;
    상기 압축 이득 파라미터로부터 압축비를 결정하기 위한 압축 파라미터 결정기로서, 미리 정해진 가중 계수에 의해 상기 압축 이득 파라미터에 가중치를 부여하여 압축비를 취득하도록 구성된 압축 파라미터 결정기;
    상기 압축비에 의존하여 상기 입력 오디오 신호를 조작하여 제1 보조 신호를 취득하는 보조 신호 생성기; 및
    상기 제1 보조 신호와 상기 압축 이득 파라미터를 결합하여 제2 보조 신호를 취득하고, 상기 입력 오디오 신호와 상기 제2 보조 신호를 결합하여 압축된 오디오 신호를 취득하는 결합 유닛
    을 포함하고,
    상기 압축 파라미터 결정기는 아래 식:
    Figure 112017130693813-pct00101

    에 따라 상기 압축 이득 파라미터로부터 압축 임계값을 결정하도록 더 구성되고,
    위 식에서, G는 로그 스케일의 상기 압축 이득 파라미터를 나타내고,
    Figure 112017130693813-pct00102
    는 허용오차 계수(tolerance factor)를 나타내고, R은 상기 압축비를 나타내고, PMAX는 로그 스케일의 상기 입력 오디오 신호의 최대 크기를 나타내고, T는 로그 스케일의 상기 압축 임계값을 나타내며,
    상기 보조 신호 생성기는 상기 입력 오디오 신호를 상기 압축 임계값과 비교하여 상기 제1 보조 신호를 취득하도록 구성되는,
    디지털 압축기.
  2. 제1항에 있어서,
    상기 압축 파라미터 결정기는 아래 식:
    Figure 112015127786146-pct00080
    , 또는
    Figure 112015127786146-pct00081

    에 따라 상기 압축비를 결정하도록 구성되고,
    위 식에서, G는 상기 압축 이득 파라미터를 나타내고, K는 상기 미리 정해진 가중 계수를 나타내고, R은 상기 압축비를 나타내는, 디지털 압축기.
  3. 제1항에 있어서,
    상기 압축 파라미터 결정기는 아래 식:
    Figure 112015127786146-pct00082

    에 따라 상기 압축 이득 파라미터로부터 어택 필터링 시간 상수(attack filtering time constant)를 결정하도록 더 구성되고,
    위 식에서, G는 로그 스케일(logarithmic scale)의 압축 이득 파라미터를 나타내고, A1은 미리 정해진 제1 어택 상수를 나타내고, A2는 미리 정해진 제2 어택 상수를 나타내고,
    Figure 112015127786146-pct00083
    는 상기 어택 필터링 시간 상수를 나타내며,
    상기 보조 신호 생성기는 상기 어택 필터링 시간 상수에 의존하여 상기 입력 오디오 신호를 필터링하여 상기 제1 보조 신호를 취득하도록 구성되는, 디지털 압축기.
  4. 제1항에 있어서,
    상기 압축 파라미터 결정기는 아래 식:
    Figure 112015127786146-pct00084

    에 따라 상기 압축 이득 파라미터로부터 릴리즈 필터링 시간 상수(release filtering time constant)를 결정하도록 더 구성되고,
    위 식에서, G는 로그 스케일의 상기 압축 이득 파라미터를 나타내고, B1은 미리 정해진 제1 릴리즈 상수를 나타내고, B2는 미리 정해진 제2 릴리즈 상수를 나타내고,
    Figure 112015127786146-pct00085
    는 상기 릴리즈 필터링 시간 상수를 나타내며,
    상기 보조 신호 생성기는 상기 릴리즈 필터링 시간 상수에 의존하여 상기 입력 오디오 신호를 필터링하여 상기 제1 보조 신호를 취득하도록 구성되는, 디지털 압축기.
  5. 제1항에 있어서,
    상기 보조 신호 생성기는 디지털 필터에 의해 상기 입력 오디오 신호를 필터링하도록 구성되고,
    상기 디지털 필터는 주파수에 대한 크기를 가지는 주파수 전달 함수(frequency transfer function)를 포함하고, 상기 크기는 인간 귀의 등음량 곡선(equal loudness curve)에 의해 형성되는, 디지털 압축기.
  6. 제1항에 있어서,
    상기 보조 신호 생성기는 디지털 저역 통과 필터에 의해 상기 입력 오디오 신호를 필터링하도록 구성되고,
    상기 디지털 저역 통과 필터는 시간 도메인에서의 필터 계단 응답(filter step response)을 포함하는, 디지털 압축기.
  7. 제6항에 있어서,
    상기 디지털 저역 통과 필터는 아래 식:
    Figure 112017130693813-pct00088


    Figure 112017130693813-pct00089

    에 따라 상기 입력 오디오 신호를 필터링하도록 구성되고,
    위 식에서,
    Figure 112017130693813-pct00090
    는 어택 필터링 시간 상수를 나타내고,
    Figure 112017130693813-pct00091
    은 릴리즈 필터링 시간 상수를 나타내고,
    Figure 112017130693813-pct00092
    는 지수 어택 상수(exponential attack constant)를 나타내고,
    Figure 112017130693813-pct00093
    은 지수 릴리즈 상수(exponential release constant)를 나타내고, t는 샘플링 시간 색인(sampling time index)을 나타내고, Px는 로그 스케일의 입력 오디오 신호의 크기를 나타내고, Ps는 로그 스케일의 상기 필터링된 오디오 신호의 크기를 나타내는, 디지털 압축기.
  8. 제1항에 있어서,
    상기 보조 신호 생성기는 아래 식:
    Figure 112017130693813-pct00094

    에 따라 제1 보조 신호의 크기를 결정하도록 구성되고,
    위 식에서, R은 상기 압축비를 나타내고, T는 로그 스케일의 압축 임계값을 나타내고, Ps는 로그 스케일의 상기 입력 오디오 신호의 크기를 나타내고, t는 시간을 나타내고, g(t)는 로그 스케일의 상기 제1 보조 신호의 크기를 나타내는, 디지털 압축기.
  9. 제1항에 있어서,
    상기 결합 유닛은 상기 제1 보조 신호에 상기 압축 이득 파라미터를 승산하여 상기 제2 보조 신호를 취득하도록 구성되는, 디지털 압축기.
  10. 제1항에 있어서,
    상기 결합 유닛은 상기 입력 오디오 신호에 상기 제1 보조 신호를 승산하여 상기 압축된 오디오 신호를 취득하도록 구성되는, 디지털 압축기.
  11. 제1항에 있어서,
    상기 압축된 오디오 신호를 필터링하는 등화 필터를 더 포함하고,
    상기 등화 필터는 주파수에 대한 크기를 가지는 주파수 전달 함수를 포함하고, 상기 크기는 인간 귀의 등음량 곡선에 의해 형성되는, 디지털 압축기.
  12. 제1항에 있어서,
    시간 도메인에서의 상기 압축된 오디오 신호의 최대 크기를 감소시키는 피크 제한기(peak limiter)를 더 포함하는 디지털 압축기.
  13. 입력 오디오 신호를 압축하는 디지털 압축 방법으로서,
    압축 이득 파라미터를 제공하는 단계;
    미리 정해진 가중 계수에 의해 상기 압축 이득 파라미터에 가중치를 부여하여 상기 압축 이득 파라미터로부터 압축비를 결정하여 상기 압축비를 취득하는 단계;
    상기 압축비에 의존하여 상기 입력 오디오 신호를 조작하여 제1 보조 신호를 취득하는 단계;
    상기 제1 보조 신호와 상기 압축 이득 파라미터를 결합하여 제2 보조 신호를 취득하는 단계; 및
    상기 입력 오디오 신호와 상기 제2 보조 신호를 결합하여 압축된 오디오 신호를 취득하는 단계
    를 포함하고,
    상기 디지털 압축 방법은,
    아래 식:
    Figure 112017130693813-pct00103

    에 따라 상기 압축 이득 파라미터로부터 압축 임계값을 결정하는 단계 - 위 식에서, G는 로그 스케일의 상기 압축 이득 파라미터를 나타내고,
    Figure 112017130693813-pct00104
    는 허용오차 계수를 나타내고, R은 상기 압축비를 나타내고, PMAX는 로그 스케일의 상기 입력 오디오 신호의 최대 크기를 나타내고, T는 로그 스케일의 상기 압축 임계값을 나타냄 -; 및
    상기 입력 오디오 신호를 상기 압축 임계값과 비교하여 상기 제1 보조 신호를 취득하는 단계를 더 포함하는,
    디지털 압축 방법.
  14. 제13항에 있어서,
    상기 압축비는 아래 식:
    Figure 112017130693813-pct00095
    , 또는
    Figure 112017130693813-pct00096

    에 따라 결정되고,
    위 식에서, G는 상기 압축 이득 파라미터를 나타내고, K는 상기 미리 정해진 가중 계수를 나타내고, R은 상기 압축비를 나타내는, 디지털 압축 방법.
  15. 제13항에 있어서,
    아래 식:
    Figure 112017130693813-pct00097

    에 따라 상기 압축 이득 파라미터로부터 어택 필터링 시간 상수를 결정하는 단계 - 위 식에서, G는 로그 스케일의 압축 이득 파라미터를 나타내고, A1은 미리 정해진 제1 어택 상수를 나타내고, A2는 미리 정해진 제2 어택 상수를 나타내고,
    Figure 112017130693813-pct00098
    는 상기 어택 필터링 시간 상수를 나타냄 -; 및
    상기 어택 필터링 시간 상수에 의존하여 상기 입력 오디오 신호를 필터링하여 상기 제1 보조 신호를 취득하는 단계를 더 포함하는 디지털 압축 방법.
  16. 제13항에 있어서,
    아래 식:
    Figure 112017130693813-pct00099

    에 따라 상기 압축 이득 파라미터로부터 릴리즈 필터링 시간 상수를 결정하는 단계 - 위 식에서, G는 로그 스케일의 상기 압축 이득 파라미터를 나타내고, B1은 미리 정해진 제1 릴리즈 상수를 나타내고, B2는 미리 정해진 제2 릴리즈 상수를 나타내고,
    Figure 112017130693813-pct00100
    는 상기 릴리즈 필터링 시간 상수를 나타냄 -; 및
    상기 릴리즈 필터링 시간 상수에 의존하여 상기 입력 오디오 신호를 필터링하여 상기 제1 보조 신호를 취득하는 단계를 더 포함하는 디지털 압축 방법.
  17. 제13항에 있어서,
    상기 입력 오디오 신호는 디지털 필터에 의해 필터링되고,
    상기 디지털 필터는 주파수에 대한 크기를 가지는 주파수 전달 함수를 포함하고, 상기 크기는 인간 귀의 등음량 곡선에 의해 형성되는, 디지털 압축 방법.
  18. 제13항에 있어서,
    상기 입력 오디오 신호는 디지털 저역 통과 필터에 의해 필터링되고,
    상기 디지털 저역 통과 필터는 시간 도메인에서의 필터 계단 응답을 포함하는, 디지털 압축 방법.
  19. 삭제
  20. 삭제
KR1020157036811A 2014-01-30 2014-01-30 오디오 신호를 압축하는 디지털 압축기 KR101855969B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2014/051795 WO2015113602A1 (en) 2014-01-30 2014-01-30 A digital compressor for compressing an audio signal

Publications (2)

Publication Number Publication Date
KR20160014027A KR20160014027A (ko) 2016-02-05
KR101855969B1 true KR101855969B1 (ko) 2018-06-25

Family

ID=50030299

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157036811A KR101855969B1 (ko) 2014-01-30 2014-01-30 오디오 신호를 압축하는 디지털 압축기

Country Status (10)

Country Link
US (1) US9985597B2 (ko)
EP (1) EP2995000B1 (ko)
JP (1) JP6388457B2 (ko)
KR (1) KR101855969B1 (ko)
CN (1) CN105612692B (ko)
BR (1) BR112016001809A2 (ko)
ES (1) ES2627227T3 (ko)
MX (1) MX356305B (ko)
PL (1) PL2995000T3 (ko)
WO (1) WO2015113602A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240098312A (ko) 2022-12-21 2024-06-28 서동민 가변 이득 증폭기를 이용한 음량 압축기

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10236850B2 (en) * 2016-06-15 2019-03-19 Ess Technology, Inc. Signal processor using multiple frequency bands
KR102356625B1 (ko) * 2017-06-19 2022-01-28 삼성전자주식회사 아날로그 출력의 특성을 향상시키기 위해 이득 제어 및 이득 압축을 수행하는 전자 회로 및 그것을 포함하는 전자 장치
CN107277042B (zh) * 2017-07-21 2020-08-07 中国地质大学(武汉) 一种信号压缩传输的方法、装置及其存储装置
US11011180B2 (en) * 2018-06-29 2021-05-18 Guoguang Electric Company Limited Audio signal dynamic range compression
EP3928315A4 (en) * 2019-03-14 2022-11-30 Boomcloud 360, Inc. SPATIALLY SENSITIVE MULTIBAND COMPRESSION SYSTEM WITH PRIORITY
JP7252866B2 (ja) * 2019-09-10 2023-04-05 株式会社東海理化電機製作所 制御装置、制御方法、及びプログラム
JP7344058B2 (ja) * 2019-09-10 2023-09-13 株式会社東海理化電機製作所 制御装置、制御方法、及びプログラム
CN113470692B (zh) * 2020-03-31 2024-02-02 抖音视界有限公司 音频处理方法、装置、可读介质及电子设备
US20230163739A1 (en) * 2021-08-17 2023-05-25 Bang & Olufsen A/S Method for increasing perceived loudness of an audio data signal
CN114299968A (zh) * 2021-12-30 2022-04-08 深圳万兴软件有限公司 音频多频段分离压缩方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050123152A1 (en) * 2003-12-09 2005-06-09 Magrath Anthony J. Signal processors and associated methods
US20070291959A1 (en) * 2004-10-26 2007-12-20 Dolby Laboratories Licensing Corporation Calculating and Adjusting the Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal
US20090116664A1 (en) * 2007-11-06 2009-05-07 Microsoft Corporation Perceptually weighted digital audio level compression

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5706352A (en) * 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
JPH09130184A (ja) * 1995-08-28 1997-05-16 Victor Co Of Japan Ltd デジタル信号処理装置
JPH11225398A (ja) * 1998-02-05 1999-08-17 Matsushita Electric Ind Co Ltd ラウドネス調整方法および補聴器
US6757396B1 (en) * 1998-11-16 2004-06-29 Texas Instruments Incorporated Digital audio dynamic range compressor and method
US7580531B2 (en) * 2004-02-06 2009-08-25 Cirrus Logic, Inc Dynamic range reducing volume control
JP5083208B2 (ja) * 2006-03-22 2012-11-28 日本電気株式会社 オーディオ回路
EP1923994B1 (en) * 2006-11-17 2008-11-19 AKG Acoustics GmbH Audio compressor
JP5228840B2 (ja) * 2008-11-27 2013-07-03 ヤマハ株式会社 増幅器
WO2011069504A1 (en) * 2009-12-09 2011-06-16 Widex A/S Method of processing a signal in a hearing aid, a method of fitting a hearing aid and a hearing aid
US9685921B2 (en) * 2012-07-12 2017-06-20 Dts, Inc. Loudness control with noise detection and loudness drop detection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050123152A1 (en) * 2003-12-09 2005-06-09 Magrath Anthony J. Signal processors and associated methods
US20070291959A1 (en) * 2004-10-26 2007-12-20 Dolby Laboratories Licensing Corporation Calculating and Adjusting the Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal
US20090116664A1 (en) * 2007-11-06 2009-05-07 Microsoft Corporation Perceptually weighted digital audio level compression

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240098312A (ko) 2022-12-21 2024-06-28 서동민 가변 이득 증폭기를 이용한 음량 압축기

Also Published As

Publication number Publication date
WO2015113602A1 (en) 2015-08-06
KR20160014027A (ko) 2016-02-05
MX356305B (es) 2018-05-23
JP2016530765A (ja) 2016-09-29
CN105612692A (zh) 2016-05-25
EP2995000B1 (en) 2017-03-29
EP2995000A1 (en) 2016-03-16
CN105612692B (zh) 2018-06-26
US20160211821A1 (en) 2016-07-21
US9985597B2 (en) 2018-05-29
PL2995000T3 (pl) 2017-09-29
MX2016001168A (es) 2016-04-29
JP6388457B2 (ja) 2018-09-12
ES2627227T3 (es) 2017-07-27
BR112016001809A2 (pt) 2017-08-01

Similar Documents

Publication Publication Date Title
KR101855969B1 (ko) 오디오 신호를 압축하는 디지털 압축기
US20160344356A1 (en) Audio Compression System for Compressing an Audio Signal
US9361901B2 (en) Integrated speech intelligibility enhancement system and acoustic echo canceller
US9197181B2 (en) Loudness enhancement system and method
TWI463817B (zh) 可適性智慧雜訊抑制系統及方法
JP6328627B2 (ja) 雑音検出及びラウドネス低下検出によるラウドネスコントロール
US10750278B2 (en) Adaptive bass processing system
US8645144B2 (en) Audio signal shaping for playback by audio devices
US20100296669A1 (en) Apparatus for processing an audio signal and method thereof
WO2009119460A1 (ja) オーディオ信号処理装置及びオーディオ信号処理方法
US20110286606A1 (en) Method and system for noise cancellation
CN110136734B (zh) 使用非线性增益平滑以降低音乐伪声的方法和音频噪声抑制器
US10897670B1 (en) Excursion and thermal management for audio output devices
CN105323695B (zh) 自适应检测器和用于动态处理器的自动模式
CN116964964A (zh) 音频信号处理系统、扬声器和电子设备

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant