KR101386645B1 - 모바일 기기에서 지각적 오디오 코딩 장치 및 방법 - Google Patents

모바일 기기에서 지각적 오디오 코딩 장치 및 방법 Download PDF

Info

Publication number
KR101386645B1
KR101386645B1 KR1020070095078A KR20070095078A KR101386645B1 KR 101386645 B1 KR101386645 B1 KR 101386645B1 KR 1020070095078 A KR1020070095078 A KR 1020070095078A KR 20070095078 A KR20070095078 A KR 20070095078A KR 101386645 B1 KR101386645 B1 KR 101386645B1
Authority
KR
South Korea
Prior art keywords
unit
audio
audio signal
crosstalk
filter
Prior art date
Application number
KR1020070095078A
Other languages
English (en)
Other versions
KR20090029904A (ko
Inventor
김재현
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070095078A priority Critical patent/KR101386645B1/ko
Publication of KR20090029904A publication Critical patent/KR20090029904A/ko
Application granted granted Critical
Publication of KR101386645B1 publication Critical patent/KR101386645B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 모바일 기기에서 지각적 오디오 코딩 장치 및 방법에 관한 것으로서, 고속 푸리에 변환된 오디오 신호로부터 채널간 주파수 영역에서의 위상차를 산출하는 위상분석부와, 상기 산출된 위상차를 통해 옥타브 밴드별로 유사도를 결정하고 이에 따른 누화 제거 적용 가중치를 산출하는 가중치 산출부와, 상기 산출된 위상차와 가중치를 통해 필터를 설계하고 필터 계수를 추출하는 필터 계수 추출부와, 상기 추출된 필터 계수와 허프만 코딩된 오디오 신호를 더하여 비트스트림을 생성하는 코딩 오디오 출력부를 포함함으로써 저음역 손실이 없고, 상기 주파수 대역의 분석을 통해 음질 왜곡을 최소화할 수 있다.
누화 제거, Cross talk, 지각적 오디오 코더, 오디오

Description

모바일 기기에서 지각적 오디오 코딩 장치 및 방법{APPARATUS AND METHOD FOR PURCEPTUAL AUDIO CODING IN MOBILE EQUIPMENT}
본 발명은 모바일 기기에서 지각적 오디오 코딩 장치 및 방법에 관한 것으로, 특히, 지각적 오디오 코더(Perceptual Audio coder)에 누화 제거 방법을 적용하는 장치 및 방법에 관한 것이다.
종래의 지각적 오디오 코더로 소리를 압축하여 재생할 시에는 불필요한 정보를 어떻게 효율적으로 배제하고 청취 시 얼마나 원시소리와 차이가 없는지에 초점이 맞추어져 있다.
도 1은 종래의 기술에 따른 오디오 인코더와 오디오 디코더의 블록구성을 도시하고 있다.
여기서, 상기 인코더는 분석 필터 뱅크(101), 양자화 & 코딩부(103), 비트스트림 인코딩부(105), 지각적 모델링부(107)을 포함하여 구성될 수 있다.
상기 분석 필터 뱅크(101)는 입력되는 오디오 신호를 필터뱅크(filterbank) 를 적용하여 주파수 밴드별 분석이 가능하도록 여러개의 서브밴드 신호로 재구성하여 상기 양자화 & 코딩부(103)로 출력한다.
상기 지각적 모델부(107)는 시간영역 입력값과 필터뱅크 분석결과를 사용하여 심리음향모델을 적용한 실제적인 마스킹 임계치를 산출하여 상기 양자화 & 코딩부(103)로 출력한다. 여기서 상기 심리음향모델을 적용한 실제적인 마스킹 임계치는 입력된 주파수 스펙트럼에서 원음과 최초가청한계의 곡선으로부터 실제로 원음을 들으면서 감지할 수 있는 마스킹 임계치를 말한다.
상기 양자화 & 코딩부(103)는 상기 분석 필터 뱅크로부터 입력된 서브밴드 신호를 상기 지각적 모델부(107)를 통해 입력된 마스킹 임계치 아래로 양자화를 수행하고 코드화하여 상기 비트스트림 인코딩부(105)로 출력한다.
상기 비트스트림 인코딩부(105)는 상기 양자화 & 코딩부(103)로부터 입력된 신호를 비트 스트림으로 정형화하여 출력한다. 여기서, 상기 비트 스트림은 전형적으로 양자화, 코드화된 압축된 오디오 신호와 부가정보로 구성된다.
또한, 상기 디코더는 비트스트림 디코딩부(110), 역양자화부(112), 합성 필터뱅크(114)를 포함하여 구성되며 상기 인코더와 반대로 진행된다.
먼저, 상기 비트스트림 디코딩부(110)는 입력되는 비트스트림을 디코딩하여 상기 역양자화부(112)로 출력하고 상기 역양자화부(112)는 입력된 비트스트림을 역양자화하여 합성 필터뱅크(114)에 출력하면 상기 합성 필터뱅크(114)는 각 서브밴드에 대해 필터뱅크를 통합하여 오디오 신호를 출력한다.
상술한 바와 같이 종래의 기술에 따른 오디오 디코더를 통해 나온 신호가 스 피커를 통해 출력될 시, 이어폰의 출력되는 다른 스피커 간의 누화(cross-talk)가 발생된다. 여기서, 상기 누화는 왼쪽 스피커에서 출력되는 소리가 오른쪽 귀로 청취되거나 오른쪽 스피커에서 출력되는 소리기 왼쪽 귀로 청취되는 현상을 일컫는다.
일반적인 하이파이(Hi-Fi) 오디오 시스템에서는 적당한 누화가 편안한 청취환경을 만드는데 도움을 줄 수 있으나 휴대폰, PMP, DMB 등의 소형화된 모바일 기기에서 인접한 스피커 배치는 스테레오 효과가 줄어들거나 음의 명료성이 떨어지는 문제점이 있다.
상기 문제를 해결하기 위한 방안으로 상기 누화를 추정하여 원래의 오디오 신호에 상쇄하는 신호를 미리 실어 재생하기도 하지만 모바일 기기와 같이 소형화 되어 스피커의 간격이 현저히 좁아지게 되면 원래 재생하고자 하는 신호와 제거해야할 누화 성분간의 차이가 거의 없게 된다. 이에 따라, 상기 소형의 모바일 기기에서 누화 제거기를 적용하여 누화와 반대되는 신호를 원래의 신호에 더해줄 때 누화가 원 신호와 유사하기 때문에 원신호를 제거하게 된다. 이는 단순한 음질 왜곡 뿐만 아니라 저 음역성분이 제거되고 주로 중앙에 위치하는 모노톤의 신호의 손실을 야기하는 문제점이 있다.
본 발명의 목적은 모바일 기기에서 지각적 오디오 코딩(Perceptual Audio coding) 장치 및 방법을 제공함에 있다.
본 발명의 다른 목적은 지각적 오디오 코더에 누화 제거 방법을 적용하는 장치 및 방법을 제공함에 있다.
본 발명의 또 다른 목적은 지각적 오디오 코더에서 위상차를 이용하여 누화를 추정하는 장치 및 방법을 제공함에 있다.
본 발명의 또 다른 목적은 지각적 오디오 코더에서 누화를 추정하여 원래의 오디오 신호에 상쇄하는 신호를 실어 재생하는 장치 및 방법을 제공함에 있다.
상술한 목적들을 달성하기 위한 본 발명의 제 1견지에 따르면, 모바일 기기에서 지각적 오디오 인코딩 장치는, 고속 푸리에 변환된 오디오 신호로부터 채널간 주파수 영역에서의 위상차를 산출하는 위상분석부와, 상기 산출된 위상차를 통해 옥타브 밴드별로 유사도를 결정하고 이에 따른 누화 제거 적용 가중치를 산출하는 가중치 산출부와, 상기 산출된 위상차와 가중치를 통해 필터를 설계하고 필터 계수를 추출하는 필터 계수 추출부와, 상기 추출된 필터 계수와 허프만 코딩된 오디오 신호를 더하여 비트스트림을 생성하는 코딩 오디오 출력부를 포함하는 것을 특징으로 한다.
상술한 목적들을 달성하기 위한 본 발명의 제 2견지에 따르면, 모바일 기기에서 지각적 오디오 디코딩 장치는, 코딩된 오디오 신호를 압축된 오디오과 부가 정보로 언패킹하기 위한 프레임 언패킹부와, 상기 부가정보로부터 누화 제거 적용 가중치를 획득하여 프레임간 가중치 정보를 평활화(smoothing)하기 위한 평활화부와, 상기 평활화된 가중치 정보로 필터 계수를 조정하는 필터 조정부와, 상기 조정된 필터계수를 통해 누화제거 필터링 동작을 수행하여 오디오 신호를 출력하는 누화제거 필터링부를 포함하는 것을 특징으로 한다.
상술한 목적들을 달성하기 위한 본 발명의 제 3견지에 따르면, 모바일 기기에서 지각적 오디오 인코딩 방법은, 고속 푸리에 변환된 오디오 신호로부터 채널간 주파수 영역에서의 위상차를 산출하는 과정과, 상기 산출된 위상차를 통해 옥타브 밴드별로 유사도를 결정하고 이에 따른 누화 제거 적용 가중치를 산출하는 과정과, 상기 산출된 위상차와 가중치를 통해 필터를 설계하고 필터 계수를 추출하는 과정과, 상기 추출된 필터 계수와 허프만 코딩된 오디오 신호를 더하여 비트스트림을 생성하여 출력하는 과정을 포함하는 것을 특징으로 한다.
상술한 목적들을 달성하기 위한 본 발명의 제 4견지에 따르면, 모바일 기기에서 지각적 오디오 디코딩 방법은, 코딩된 오디오 신호를 압축된 오디오과 부가 정보로 언패킹하는 과정과, 상기 부가정보로부터 누화 제거 적용 가중치를 획득하여 프레임간 가중치 정보를 평활화(smoothing)하는 과정과, 상기 평활화된 가중치 정보로 필터 계수를 조정하는 과정과, 상기 조정된 필터계수를 통해 누화제거 필터링 동작을 수행하여 오디오 신호를 출력하는 과정을 포함하는 것을 특징으로 한다.
상술한 바와 같이 본 발명은 모바일 기기에서 위상 차를 이용하여 누화를 추정하고 누화 제거 필터링을 함으로써 저음역 손실이 없고, 상기 주파수 대역의 분석을 통해 음질 왜곡을 최소화할 수 있는 효과가 있다.
이하 본 발명의 바람직한 실시 예를 첨부된 도면의 참조와 함께 상세히 설명한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다.
이하 본 발명에서는 지각 오디오 코더에 위상 차를 이용하여 누화를 추정하고 누화를 제거하는 필터링을 수행하여 오디오 신호를 재생하는 장치 및 방법에 관해 설명할 것이다.
도 2는 본 발명에 따른 지각적 오디오 인코더의 블록구성을 도시하고 있다. 여기서 상기 지각적 오디오 인코더는 분석 필터 뱅크(201), 양자화 & 코딩부(203), 비트스트림 인코딩부(205), 지각적 모델링부(207), 위상분석 & 조정필터 설계부(209)를 포함하여 구성될 수 있다.
상기 분석 필터 뱅크(201)는 입력되는 오디오 신호에 필터뱅크(filterbank)를 적용하여 주파수 밴드별 분석이 가능하도록 여러개의 서브밴드 신호로 재구성하여 상기 양자화 & 코딩부(203)로 출력한다.
상기 지각적 모델링부(207)는 입력되는 오디오 신호를 위상분석 & 조정필터 설계부(209)로 출력하고 상기 오디오 신호에 대한 시간영역 입력 값과 필터뱅크 분석결과를 사용하여 심리음향모델을 적용한 실제적인 마스킹 임계치를 산출하여 상기 양자화 & 코딩부(203)로 출력한다.
상기 양자화 & 코딩부(203)는 상기 분석 필터 뱅크로부터 입력된 서브밴드 신호를 상기 지각적 모델부(207)를 통해 입력된 마스킹 임계치 아래로 양자화를 수행하고 코드화하여 상기 비트스트림 인코딩부(205)로 출력한다.
상기 위상분석 & 조정필터 설계부(209)는 상기 입력되는 오디오 신호의 주파수 영역에서 각 대역별 위상차와, 옥타브 밴드별 대표 가중치를 산출하여 산출된 값에 의해 필터를 설계하고 부가정보에 포함하여 비트스트림 인코딩부(205)로 출력한다.
상기 비트스트림 인코딩부(205)는 상기 양자화 & 코딩부(203)로부터 입력된 신호에 상기 위상분석 & 조정필터 설계부(209)로부터 입력된 부가정보를 더하여 비트 스트림으로 정형화하여 출력한다.
도 3은 본 발명의 따른 지각적 오디오 디코더의 블록구성을 도시하고 있다.
여기서, 상기 디코더는 비트스트림 디코딩부(301), 역양자화부(303), 합성 필터뱅크(305), 누화제거 필터 조정부(307), 누화 제거 필터링부(309)를 포함하여 구성되며 상기 인코더와 반대로 진행된다.
본 발명에서는 오디오 신호를 스피커로 출력할 시 누화제거 필터링을 수행하여 출력하는 방법을 도 3을 참조하여 설명하기로 한다.
먼저, 비트스트림 신호를 이어폰으로 출력할 경우, 상기 비트스트림 디코딩부(301)는 입력되는 비트스트림을 디코딩하여 상기 역양자화부(303)로 출력하고 상기 역양자화부(303)는 입력된 비트스트림을 역양자화하여 합성 필터뱅크(305)에 출력하면 상기 합성 필터뱅크(305)는 각 서브밴드에 대해 필터뱅크를 통합하여 오디오 신호를 출력한다.
한편, 상기 비트스트림 신호를 스피커로 출력할 경우, 상기 비트스트림 디코딩부는 입력되는 비트스트림을 압축된 오디오 신호와 부가정보로 디코딩하여 누화제거 필터 조정부(307)로 출력한다.
상기 누화제거 필터 조정부(307)는 상기 부가정보의 누화 제거 적용 가중치로부터 필터 계수를 조정한다.
상시 누화 제거 필터링부(309)는 상기 압축된 오디오 신호를 상기 조정된 필터 계수를 통해 필터링하여 스피커를 통해 오디오 신호를 출력한다.
도 4는 본 발명의 실시 예에 따른 MP3 인코더의 블록 구성을 도시하고 있다. 여기서, 상기 MP3 인코더는 필터뱅크(401), MDCT(Modified Discrete Cosine Transform)부(403), FFT부(405), 심리 음향부(407), 양자화부(409), 허프만인코딩 부(411), 부가정보 코딩부(413), 코딩 오디오 출력부(415), 위상분석부(417), 가중치산출부(419), 필터계수추출부(421)를 포함하여 구성된다.
상기 도 4을 참조하면 상기 필터뱅크(401)는 입력되는 디지털 오디오 신호를 32개의 서브밴드로 세분하여 MDCT부(403)로 출력하고, 상기 MDCT부(403)는 입력된 서브밴드를 보다 세밀한 주파수 대역으로 분할하여 DCT 스펙트럼을 양자화부(409)로 출력한다.
또한, 상기 FFT부(405)는 상기 입력되는 디지털 오디오 신호를 주파수 영역의 스펙트럼으로 변환하여 심리음향부(407)와 위상분석부(417)에 출력하고, 상기 심리음향부(407)는 입력된 주파수 스펙트럼에 심리음향 모델을 적용하여 각 임계 대역에 대해 SMR(Signal to Masking Ratio)를 산출하고 상기 양자화부(405)로 출력한다.
상기 양자화부(409)는 입력받은 상기 DCT 스펙트럼과 상기 SMR을 입력받아 내부 및 외부 반복 루프를 통해 양자화 연산을 하고 상기 허프만 인코딩부(411)로 출력한다. 여기서, 상기 외부 반복 루프(409a)는 주파수 영역에서 얻어진 잡음의 레벨이 마스킹 임계치보다 큰 밴드에 대해서 스케일 펙터를 크게하여 잡음 레벨을 조정하고, 상기 내부 반복 루프(409c)는 허프만 코딩된 데이터의 비트율이 일정하지 않기 때문에 사용 가능한 비트보다 크면 양자화 스텝사이즈를 늘려 조정하는 역할을 한다.
상기 허프만 인코딩부(411)는 각 서브밴드에서 양자화된 신호를 허프만 부호화하여 상기 코딩 오디오 출력부(415)로 출력한다.
상기 부가정보 코딩부(413)는 상기 양자화부(409)의 연산시에 사용되는 부가정보와 필터계수추출부(421)를 통해 입력된 필터계수를 상기 코딩 오디오 출력부(415)로 출력한다.
상기 위상분석부(417)는 상기 FFT부(405)로부터 입력된 신호를 통해 주파수 영역에서의 편차를 산출하여 상기 가중치 산출부(419)로 출력한다.
상기 가중치 산출부(419)는 상기 입력된 주파수 편차를 통해 옥타브 밴드 별로 유사도를 결정하고 이에 따른 누화 제거 적용 가중치를 산출하여 상기 필터계수 추출부(421)로 출력한다.
상기 필터계수 추출부(421)는 상기 입력된 가중치를 디코딩 영역의 누화 제거에서 쉽게 적용할 수 있도록 변환하는 단순화 모델링 과정을 수행하여 필터 계수를 추출하며 이때, 산출된 정보는 부가정보 코딩부(413)로 출력된다.
상기 코딩 오디오 출력부(415)는 입력된 부가정보 및 허프만 부호화된 오디오 신호에 오류체크 비트 등을 부가하여 출력한다.
도 5는 본 발명의 실시 예에 따른 MP3 디코더의 블록 구성을 도시하고 있다. 여기서 상기 MP3 디코더는 프레임 언패킹부(501), 허프만 디코딩부(503), 부가정보코딩부(505), 역양자화부 & 스케일부(507), 역 MDCT부(509), 대역합성 필터(511), 평활화부(513), 필터조정부(515), 누화제거 필터링부(517), 누화제거제어부(519)를 포함하여 구성된다.
먼저, 상기 프레임 언패킹부(501)는 코딩된 오디오 신호를 프레임 언페 킹(Frame Unfacking)하여 언패킹 된 신호 중 압축된 오디오 신호를 허프만 디코딩부(503)로 출력하고, 부가정보는 부가 정보 코딩부로 출력한다.
상기 허프만 디코딩부(503)는 상기 입력된 압축된 오디오신호를 허프만 디코딩하여 상기 역양자화부 & 스케일부(507)로 출력하고 상기 역양자화부 & 스케일부(507)는 상기 입력된 부가정보와 압축된 오디오 신호를 역양자화, 재스케일링을 수행하여 역 MDCT부(509)로 출력한다.
상기 부가정보 코딩부(505)는 입력된 부가정보를 디코딩하여 상기 평활화부(513), 필터조정부(515), 역양자화부 & 스케일부(507)로 출력한다.
상기 역양자화부 & 스케일부(507)는 상기 입력된 부가정보와 압축된 오디오 신호를 역양자화, 재스케일링을 수행하고 역 MDCT부(509)로 출력한다.
상기 역 MDCT부(509)는 역 MDCT를 수행하여 분활된 주파수 대역 신호를 32서브밴드로 통합하고 대역합성 필터(511)로 출력한다.
상기 대역합성 필터(511)는 IPQF(Inverse Polyphase Quadrature Filter)를 사용하여 상기 서브밴드를 합성하고 음향 파형 신호를 생성하여 디지털 오디오 신호를 출력한다.
상기 평활화부(513)는 인코딩 시 전달된 누화 제거에 적용된 가중치 정보가 달라지기 때문에 상기 부가정보 코딩부(505)로부터 입력된 부가정보에서 획득된 이전 산출된 가중치와의 평활화 과정을 수행하고 상기 필터조정부(515)로 출력한다.
상기 필터조정부(515)는 상기 입력된 가중치 정보로 필터 계수를 조정하여 누화 제거 필터링 부(517)의 필터에 적용한다.
상기 누화제거 필터링부(517)는 상기 적용 가중치가 수정된 누화 제거 필터 계수를 이용하여 스피커 재생시 누화 제거 필터링하여 스피커로 출력한다.
상기 누화 제거 제어부(519)는 출력장치가 스피커일 시, 상기 평활화부(513), 상기 필터 조정부(515), 상기 누화제거 필터링부(517)를 동작 시키는 기능을 제어한다.
도 6은 본 발명의 실시 예에 따른 MP3 인코더의 절차를 도시하고 있다.
상기 도 6을 참조하면 먼저 상기 MP3인코더는 601단계에서 PCM 데이터가 입력되면 입력 버퍼를 구성하고 603단계로 진행하여 필터 뱅크 분석을 통해 32 서브밴드로 필터링을 수행하고 입력 버퍼에 대해 롱 윈도우(1024), 쇼트 윈도우(256)를 구성하고 FFT를 수행한다.
상기 MP3인코더는 605단계에서 주파수 스펙트럼을 이용하여 산출된 마스킹 임계치인 심리 음향 모델을 적용하고 607단계에서 MDCT를 수행한다. 여기서, 상기 MDCT는 지각적 에너지가 임계치보다 크면 쇼트 윈도우(1024)를 수행하고, 지각적 에너지가 임계치보다 작으면 롱 윈도우(256)을 수행한다. 또한, 삭제 주파수에 따라 저주파수의 서브밴드 MDCT를 생략한다.
이후, 상기 MP3인코더는 609단계에서 양자화를 수행하고 611단계로 진행하여 허프만 코딩을 수행한다.
또한, 상기 MP3인코더는 613단계에서 상기 603단계에서 수행된 FFT 결과를 통해 주파수 영역에서 각 대역별 위상차를 산출하고 615단계에서 상기 산출된 위상 차를 통해 옥타브 밴드별 대표 가중치를 산출한다.
이후, 상기 MP3인코더는 617단계로 진행하여 상기 산출된 가중치를 통해 필터설계 후, 계수 값을 추출하고 619단계로 진행하여 상기 설계 필터와 계수 값을 부가정보에 포함한다.
이후, 상기 MP3 인코더는 621단계에서 상기 부가 정보와 허프만 부호화된 오디오 신호에 오류체크 비트등을 부가하여 비트스트림을 만들고 본 발명에 따른 알고리즘을 종료한다.
도 7은 본 발명의 실시 예에 따른 MP3 디코더의 절차를 도시하고 있다.
상기 도 7을 참조하면, 먼저 상기 MP3 디코더는 701단계에서 비트스트림이 입력되면 703단계로 진행하여 프레임 언패킹을 수행하여 압축된 오디오과 부가정보를 획득한다.
이후, 상기 MP3 디코더는 705단계에서 상기 프레임 언패킹된 압축된 오디오에 대해 허프만 디코딩을 수행하고 707단계로 진행하여 역양자화와 재스케일링을 수행한다.
이후, 상기 MP3 디코더는 709단계에서 역 MDCT를 수행하고 811단계로 진행하여 상기 MDCT를 통해 얻어진 각 서브밴드를 필터뱅크에 의해 통합한다.
이후, 상기 MP3 디코더는 713단계에서 상기 프레임 언패킹된 부가정보로부터 누화 제거 적용 가중치에 대한 부가정보를 획득하여 디코딩을 수행하고 815단계로 진행하여 프레임간 가중치 정보를 평활화한다.
이후, 상기 MP3 디코더는 717단계에서 상기 평활화된 가중치로 필터 계수를 조정하고 819단계에서 오디오을 출력하기 위한 출력장치가 스피커인지 검사한다.
만일, 상기 출력장치가 스피커이면 상기 MP3 디코더는 721단계로 진행하여 누화제거 필터링을 수행하고 723단계에서 상기 오디오을 스피커로 출력한다.
이후, 상기 MP3 디코더는 본 발명에 따른 알고리즘을 종료한다.
한편, 상기 출력장치가 스피커가 아니면 상기 MP3 디코더는 725단계로 진행하여 이어폰으로 오디오을 출력하고 본 발명에 따른 알고리즘을 종료한다.
한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
도 1은 종래의 기술에 따른 오디오 인코더와 오디오 디코더의 블록구성을 도시하는 도면,
도 2는 본 발명에 따른 지각적 오디오 인코더의 블록구성을 도시하는 도면,
도 3은 본 발명의 따른 지각적 오디오 디코더의 블록구성을 도시하는 도면,
도 4는 본 발명의 실시 예에 따른 MP3 인코더의 블록 구성을 도시하는 도면,
도 5는 본 발명의 실시 예에 따른 MP3 디코더의 블록 구성을 도시하는 도면,
도 6은 본 발명의 실시 예에 따른 MP3 인코더의 절차를 도시하는 도면,
도 7은 본 발명의 실시 예에 따른 누화 제거 가중치를 산출하는 절차를 도시하는 도면, 및
도 8은 본 발명의 실시 예에 따른 MP3 디코더의 절차를 도시하는 도면.

Claims (14)

  1. 모바일 기기에서 지각적 오디오 인코딩 장치에 있어서,
    고속 푸리에 변환된 오디오 신호로부터 채널간 주파수 영역에서의 위상차를 산출하는 위상분석부와,
    상기 산출된 위상차를 통해 옥타브 밴드별로 유사도를 결정하고 이에 따른 누화 제거 적용 가중치를 산출하는 가중치 산출부와,
    상기 산출된 위상차와 가중치를 통해 필터를 설계하고 필터 계수를 추출하는 필터 계수 추출부와,
    상기 추출된 필터 계수와 허프만 코딩된 오디오 신호를 더하여 비트스트림을 생성하는 코딩 오디오 출력부를 포함하는 것을 특징으로 하는 장치.
  2. 제 1항에 있어서,
    상기 고속 푸리에 변환된 오디오 신호는,
    인코더의 심리음향모델(Psychoacoustic Model)을 위해 수행된 고속 푸리에 변환값을 이용하는 것을 특징으로 하는 장치.
  3. 제1항에 있어서,
    상기 옥타브 밴드별 유사도의 결정은,
    주파수 대역별로 분석하여 결정하는 것을 특징으로 하는 장치.
  4. 제 1항에 있어서,
    상기 추출된 필터 계수값은,
    압축된 오디오와 같이 오디오 파일로 인코딩되는 것을 특징으로 하는 장치.
  5. 제 4항에 있어서,
    상기 오디오 파일로 인코딩 시, 압축률 손실이 없도록 필터 계수값 추출을 가변적으로 수행하는 것을 특징으로 하는 장치.
  6. 모바일 기기에서 지각적 오디오 디코딩 장치에 있어서,
    코딩된 오디오 신호를 압축된 오디오과 부가 정보로 언패킹하기 위한 프레임 언패킹부와,
    상기 부가정보로부터 누화 제거 적용 가중치를 획득하여 프레임간 가중치 정보를 평활화(smoothing)하기 위한 평활화부와,
    상기 평활화된 가중치 정보로 필터 계수를 조정하는 필터 조정부와,
    상기 조정된 필터계수를 통해 누화제거 필터링 동작을 수행하여 오디오 신호를 출력하는 누화제거 필터링부를 포함하는 것을 특징으로 하는 장치.
  7. 제 6항에 있어서,
    상기 지각적 오디오 디코딩 장치는,
    출력장치에 따라 상기 누화 제거 필터링부의 동작여부를 결정하는 누화제거 제어부를 더 포함하는 것을 특징으로 하는 장치.
  8. 모바일 기기에서 지각적 오디오 인코딩 방법에 있어서,
    고속 푸리에 변환된 오디오 신호로부터 채널간 주파수 영역에서의 위상차를 산출하는 과정과,
    상기 산출된 위상차를 통해 옥타브 밴드별로 유사도를 결정하고 이에 따른 누화 제거 적용 가중치를 산출하는 과정과,
    상기 산출된 위상차와 가중치를 통해 필터를 설계하고 필터 계수를 추출하는 과정과,
    상기 추출된 필터 계수와 허프만 코딩된 오디오 신호를 더하여 비트스트림을 생성하여 출력하는 과정을 포함하는 것을 특징으로 하는 방법.
  9. 제 8항에 있어서,
    상기 고속 푸리에 변환된 오디오 신호는,
    인코더의 심리음향모델(Psychoacoustic Model)을 위해 수행된 고속 푸리에 변환값을 이용하는 것을 특징으로 하는 방법.
  10. 제 8항에 있어서,
    상기 옥타브 밴드별 유사도의 결정은,
    주파수 대역별로 분석하여 결정하는 것을 특징으로 하는 방법.
  11. 제 8항에 있어서,
    상기 추출된 필터 계수값은,
    압축된 오디오와 같이 오디오 파일로 인코딩되는 것을 특징으로 하는 방법.
  12. 제 11항에 있어서,
    상기 오디오 파일로 인코딩 시, 압축률 손실이 없도록 필터 계수값 추출을 가변적으로 수행하는 것을 특징으로 하는 방법.
  13. 모바일 기기에서 지각적 오디오 디코딩 방법에 있어서,
    코딩된 오디오 신호를 압축된 오디오과 부가 정보로 언패킹하는 과정과,
    상기 부가정보로부터 누화 제거 적용 가중치를 획득하여 프레임간 가중치 정보를 평활화(smoothing)하는 과정과,
    상기 평활화된 가중치 정보로 필터 계수를 조정하는 과정과,
    상기 조정된 필터계수를 통해 누화제거 필터링 동작을 수행하여 오디오 신호를 출력하는 과정을 포함하는 것을 특징으로 하는 방법.
  14. 제 13항에 있어서,
    상기 누화 제거 필터링 동작은 출력장치에 따라 동작 여부가 결정되는 것을 특징으로 하는 방법.
KR1020070095078A 2007-09-19 2007-09-19 모바일 기기에서 지각적 오디오 코딩 장치 및 방법 KR101386645B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070095078A KR101386645B1 (ko) 2007-09-19 2007-09-19 모바일 기기에서 지각적 오디오 코딩 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070095078A KR101386645B1 (ko) 2007-09-19 2007-09-19 모바일 기기에서 지각적 오디오 코딩 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20090029904A KR20090029904A (ko) 2009-03-24
KR101386645B1 true KR101386645B1 (ko) 2014-04-17

Family

ID=40696385

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070095078A KR101386645B1 (ko) 2007-09-19 2007-09-19 모바일 기기에서 지각적 오디오 코딩 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101386645B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219198A (ja) * 1998-01-30 1999-08-10 Sony Corp 位相検出装置及び方法、並びに音声符号化装置及び方法
KR20020077959A (ko) * 2001-04-03 2002-10-18 엘지전자 주식회사 디지탈 오디오 부호화기 및 복호화 방법
KR100363259B1 (ko) 2000-05-16 2002-11-30 삼성전자 주식회사 인지 특성 가중 함수를 이용한 음성신호의 위상 양자화장치 및 방법
JP3501199B2 (ja) 1997-02-17 2004-03-02 日本電信電話株式会社 音響信号分離方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3501199B2 (ja) 1997-02-17 2004-03-02 日本電信電話株式会社 音響信号分離方法
JPH11219198A (ja) * 1998-01-30 1999-08-10 Sony Corp 位相検出装置及び方法、並びに音声符号化装置及び方法
KR100363259B1 (ko) 2000-05-16 2002-11-30 삼성전자 주식회사 인지 특성 가중 함수를 이용한 음성신호의 위상 양자화장치 및 방법
KR20020077959A (ko) * 2001-04-03 2002-10-18 엘지전자 주식회사 디지탈 오디오 부호화기 및 복호화 방법

Also Published As

Publication number Publication date
KR20090029904A (ko) 2009-03-24

Similar Documents

Publication Publication Date Title
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
KR101428608B1 (ko) 대역폭 확장을 위한 스펙트럼 평탄도 제어
KR101265669B1 (ko) 코딩된 오디오의 경제적인 소리세기 측정
KR101120911B1 (ko) 음성신호 복호화 장치 및 음성신호 부호화 장치
EP2250641B1 (en) Apparatus for mixing a plurality of input data streams
JP4899359B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR100814673B1 (ko) 오디오 부호화
EP1600946A1 (en) Method and apparatus for encoding/decoding a digital signal
US20040162720A1 (en) Audio data encoding apparatus and method
WO2006049204A1 (ja) 符号化装置、復号化装置、符号化方法及び復号化方法
KR20160018497A (ko) 음향 신호의 대역폭 확장을 행하는 장치 및 방법
CN103069484A (zh) 时/频二维后处理
US20210035591A1 (en) Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
JP2011059714A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
EP1514263A1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
CN106030704B (zh) 用于对音频信号进行编码/解码的方法和设备
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
KR20020077959A (ko) 디지탈 오디오 부호화기 및 복호화 방법
KR101386645B1 (ko) 모바일 기기에서 지각적 오디오 코딩 장치 및 방법
JP4625709B2 (ja) ステレオオーディオ信号符号化装置
CN115843378A (zh) 使用针对多声道音频信号的声道的缩放参数的联合编码的音频解码器、音频编码器以及相关方法
KR101281945B1 (ko) 오디오 코딩 장치 및 방법
CN114783449A (zh) 神经网络训练方法、装置、电子设备及介质
JP5569476B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR100195712B1 (ko) 디지탈 오디오 복호화기의 음질 조절 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee