KR20030048061A - 지각적으로 개선된 음향신호의 엔코딩 - Google Patents
지각적으로 개선된 음향신호의 엔코딩 Download PDFInfo
- Publication number
- KR20030048061A KR20030048061A KR10-2003-7005479A KR20037005479A KR20030048061A KR 20030048061 A KR20030048061 A KR 20030048061A KR 20037005479 A KR20037005479 A KR 20037005479A KR 20030048061 A KR20030048061 A KR 20030048061A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- coded signal
- primary
- frequency
- coefficients
- Prior art date
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 115
- 230000003595 spectral effect Effects 0.000 claims abstract description 46
- 230000005540 biological transmission Effects 0.000 claims abstract description 36
- 230000004044 response Effects 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 58
- 230000008859 change Effects 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 16
- 230000007704 transition Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 6
- 230000005236 sound signal Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 230000007423 decrease Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000005284 excitation Effects 0.000 claims 2
- 230000001939 inductive effect Effects 0.000 claims 1
- 238000009499 grossing Methods 0.000 abstract 2
- 230000000875 corresponding effect Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 230000001149 cognitive effect Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereo-Broadcasting Methods (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Description
Claims (44)
- 음향 소오스신호(x)에 응해, 음향 소오스신호(x) 중에서 인지적으로 중요한 특징들을 나타내는 기본 코드화 신호(P1)와,음향 소오스신호(x)의 필터링된 버전을 나타내는 타겟신호(r)와,기본 코드화 신호(P1)을 기반으로 한 재생신호를 나타내는 일차 코드화 신호(y)를 생성하는 단계와;일차 코드화 신호(y)와 타겟신호(r) 중 적어도 하나에 응해, 일차 코드호ㅘ 신호(y)와 타겟신호(r)의 인지적으로 개선된 표시를 구성하는 대응하는 평탄화 신호(yE; rE)를 생성하는 단계와;그리고평탄화된 일차 코드화 신호(yE)와 타겟신호(r)와,일차 코드화 신호(y)와 평탄화된 타겟신호(rE)와,평탄화된 일차 코드화 신호(yE)와 평탄화된 타겟신호(rE)들 각각의 조합을 기반으로 이차 코드화 신호(PC)를 생성하는 단계를 포함하는, 전송매체(306)를 통한 전송을 위한 엔코드화 신호(P1, PC)를 생성하기 위해 음향 소오스신호(x)를 엔코딩하는 방법에 있어서,일차 코드화 신호(y)는, 각각이 주파수성분을 나타내는 계수들(KY)을 포함하고,타겟신호(r)는, 각각이 주파수성분을 나타내는 계수들을 포함하고,대응하는 평탄화된 신호들(yE; rE)은 일차 코드화 신호(y)와 타겟신호(r)의 선택적으로 수정된 버전이며, 여기에서 문턱값(fT) 위의 주파수정보를 나타내는 계수값들(KYE)에서 변화가 감소되는 것을 특징으로 하는, 전송매체를 통한 전송을 위한 엔코드화 신호를 생성하기 위해 음향 소오스신호를 엔코딩하는 방법.
- 제1항에 있어서,문턱값(fT) 위의 주파수성분들을 나타내는 일차 코드화 신호(y)의 계수들(KY)들을 하나 이상의 주파수대역들(ⅰ,ⅱ 및 ⅲ)로 나누고,각 주파수대역들(ⅰ,ⅱ 및 ⅲ) 내에서 계수들(KY)에 대해 평균 계수값들(Kⅰ, Kⅱ및 Kⅲ)을 계산하고, 그리고각 주파수대역들(ⅰ,ⅱ 및 ⅲ) 내 계수들(KY)을 각 평균 계수값들(Kⅰ, Kⅱ및 Kⅲ)로 교체함으로서 평탄화된 일차 코드화 신호(yE)가 일차 코드화 신호(y)로부터 유도되는 것을 특징으로 하는 방법.
- 제2항에 있어서, 상기 주파수대역들(ⅰ,ⅱ 및 ⅲ)이 등간격인 것을 특징으로하는 방법.
- 제2항 또는 제3항에 있어서, 상기 주파수대역들(ⅰ,ⅱ 및 ⅲ)이 적어도 부분적으로 중첩되는 것을 특징으로 하는 방법.
- 제4항에 있어서,윈도우된 대응하는 주파수대역들을 구하기 위해 윈도우함수(W1; W2)들로 각 주파수대역(ⅰ,ⅱ 및 ⅲ)들을 승산하고,각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써, 주파수대역들(ⅰ,ⅱ 및 ⅲ)의 중첩하는 영역에서의 최종 계수값들이 유도되는 것을 특징으로 하는 방법.
- 제5항에 있어서, 상기 윈도우함수(W1; W2)들은 비-중첩 주파수영역에서는 일전한 크기를 가지고 또한 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 방법.
- 제1항에 있어서, 일차 코드화 신호(y)의 선택적 수정은,각각이 켑스트럼 영역에서 성분을 나타내는 켑스트럼 계수들의 셋트를 가지는 켑스트럼 코드화 신호를 생성하는 단계와,특정 차수(n)와 이 보다 높은 차수의 켑스트럼 코드화 신호에서 켑스트럼 계수들을 폐기하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제7항에 있어서, 문턱값(fT) 위의 주파수정보를 나타내는 평탄화된 일차 코드화 신호(yE)의 계수값들(KYE)에서 변화가 감소되도록 상기 특정 차수(n)를 선택하는 것을 특징으로 하는 방법.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 이차 코드화 신호(PC)는, 제1 코드화 신호(P1)가 음향신호(x)를 얼마나 잘 묘사하는지를 나타내는 것을 특징으로 하는 방법.
- 제9항에 있어서, 이차 코드화 신호(PC)는 타겟신호(r)와 일차 코드화 신호(y) 간의 스펙트럼 비율을 나타내는 것을 특징으로 하는 방법.
- 제9항에 있어서, 이차 코드화 신호(PC)는 타겟신호(r)와 일차 코드화 신호(y) 간의 대수적 스펙트럼 차이를 나타내는 것을 특징으로 하는 방법.
- 제10항 또는 제11항 중 어느 한 항에 있어서,음향신호(x)에 응해 주파수 변환된 타겟신호(R)를 생성하고,음향신호(x)에 응해 주파수 변환된 일차 코드화 신호(Y)를 생성하고,주파수 변환된 타겟신호(R)와 주파수 변환된 일차 코드화 신호(Y) 간의 비율 스펙트럼(C)을 생성하고, 그리고비율 스펙트럼(C)을 기반으로 이차 코드화 신호(PC)를 형성함으로써,이차 코드화 신호(PC)를 유도하는 것을 특징으로 하는 방법.
- 컴퓨터의 내부 메모리에 직접 로딩될 수 있으며, 컴퓨터에서 실행될 때에 청구항 제1항 내지 제12항 중 어느 하나의 단계들을 제어하기 위한 소프트웨어를 포함하는 컴퓨터 프로그램.
- 청구항 제1항 내지 제12항 중 어느 한 항의 단계를 컴퓨터가 제어할 수 있도록 해주는 프로그램이 기록되어 있는 컴퓨터 판독가능 매체.
- 적어도 하나의 코드화 신호(P(E))를 나타내는 적어도 하나의 전송된 코드화 신호를 수신하는 단계와,적어도 하나의 전송된 코드화 신호에서부터 적어도 하나의 일차 디코드화 스펙트럼을 디코딩하는 단계와,적어도 하나의 일차 디코드화 스펙트럼에서부터 평탄화된 일차 디코드화 스펙트럼을 생성하는 단계와, 그리고평탄화된 일차 디코드화 스펙트럼을 기반으로 음향 소오스신호(x)의 추정을 생성하는 단계를 포함하는, 전송매체(306)를 통해 전송된 엔코드화 정보로부터 음향 소오스신호(x)의 표현의 추정을 디코딩하는 방법에 있어서,상기 평탄화된 일차 디코드화 스펙트럼은, 각각이 주파수성분을 나타내는 계수들(KY)을 포함하고, 상기 평탄화된 일차 디코드화 스펙트럼은 적어도 하나의 일차 디코드화 스펙트럼의 선택적으로 수정된 버전이고, 여기에서 문턱값(fT) 위의 주파수정보를 나타내는 계수값들(KYE)에서 변화가 감소하는 것을 특징으로 하는, 전송매체(306)를 통해 전송된 엔코드화 정보로부터 음향 소오스신호(x)의 표현의 추정을 디코딩하는 방법.
- 제15항에 있어서, 음향 소오스신호(x)의 표현은 음향 소오스신호(x) 그 자체를 구성하는 것을 특징으로 하는 방법.
- 제15항에 있어서, 음향 소오스신호(x)의 표현은 여기신호를 구성하고, 음향 소오스신호(x)가 상기 여기신호로부터 유도될 수 있는 것을 특징으로 하는 방법.
- 제15항 내지 제17항 중 어느 한 항에 있어서,문턱값(fT) 위의 주파수성분들을 나타내는 적어도 하나의 일차 디코드화 스펙트럼중 하나의 계수들(KY)들을 하나 이상의 주파수대역들(ⅰ, ⅱ; ⅲ)로 분할하고,각 주파수대역들(ⅰ, ⅱ; ⅲ) 내의 계수들(KY)에 대한 평균 계수값(Kⅰ, Kⅱ및 Kⅲ)들을 계산하고,각 주파수대역들(ⅰ, ⅱ; ⅲ) 내 계수들(KY)을 각 평균 계수값(Kⅰ, Kⅱ및 Kⅲ)들로 교체시킴으로써, 평탄화된 일차 디코드화 신호가 적어도 하나의 일차 디코드화 스펙트럼에서부터 유도되는 것을 특징으로 하는 방법.
- 제18항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)은 등간격인 것을 특징으로 하는 방법.
- 제18항 또는 제19항 중 어느 한 항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)이 적어도 부분적으로 중첩되어 있는 것을 특징으로 하는 방법.
- 제20항에 있어서,윈도우된 대응하는 주파수대역들을 얻기 위해서 각 주파수대역들(ⅰ, ⅱ; ⅲ)을 윈도우함수(W1; W2)로 승산하고,각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써 주파수대역(ⅰ, ⅱ; ⅲ)들의 중첩영역들에서의 최종 계수값들이 유도되는 것을 특징으로 하는 방법.
- 제21항에 있어서, 윈도우함수(W1; W2)는 비-중첩 주파수영역들에서 일정한 크기를 가지고, 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 방법.
- 제15항 내지 제17항 중 어느 한 항에 있어서, 적어도 하나의 일차 디코드화 스펙트럼의 선택적 수정은,각각이 켑스트럼 영역에서 성분을 나타내는 켑스트럼 계수들의 셋트를 가지는 켑스트럼 코드화 신호를 생성하는 단계와,특정 차수(n)와 이 보다 높은 차수의 켑스트럼 코드화 신호에서 켑스트럼 계수들을 폐기하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제23항에 있어서, 문턱값(fT) 위의 주파수정보를 나타내는 평탄화된 일차 디코드화 스펙트럼의 계수값들(KYE)에서 변화가 감소되도록 상기 특정 차수(n)를 선택하는 것을 특징으로 하는 방법.
- 제15항 내지 제24항 중 어느 한 항에 있어서, 적어도 하나의 전송된 강화 코드화 신호가,음향신호(x)의 코딩된 표현을 구성하는 제1 코드화 신호(P1)의 제1추정과,제1 코드화 신호(P1)가 음향신호(x)를 얼마나 잘 묘사하는지를 나타내는 제2차 코드화 신호(PC)의 제2추정을 포함하는 것을 특징으로 하는 방법.
- 제25항에 있어서, 상기 제2차 코드화 신호(PC)는 타겟신호(r)의 스펙트럼과 일차 코드화 신호(y)의 스펙트럼 간의 비율을 나타내는 것을 특징으로 하는 방법.
- 제25항에 있어서, 상기 제2차 코드화 신호(PC)는 타겟신호(r)의 대수적 스펙트럼과 일차 코드화 신호(y)의 대수적 스펙트럼 간의 차이를 나타내는 것을 특징으로 하는 방법.
- 제25항 내지 제27항 중 어느 한 항에 있어서,제1추정에 응해 적어도 하나의 일차 디코드화 스펙트럼을 생성하고,상기 적어도 하나의 일차 디코드화 스펙트럼에 응해 평탄화된 일차 디코드화 스펙트럼을 생성하고,제2추정에 응해 등화 스펙트럼을 생성하고, 그리고등화 스펙트럼과 평탄화된 일차 디코드화 스펙트럼에 응해 음향 소오스신호(x)의 추정을 생성함으로써, 음향 소오스신호(x)의 추정이 유도되는 것을 특징으로 하는 방법.
- 컴퓨터의 내부 메모리에 직접 로딩될 수 있으며, 컴퓨터에서 실행될 때에 청구항 제15항 내지 제28항 중 어느 하나의 단계들을 제어하기 위한 소프트웨어를 포함하는 컴퓨터 프로그램.
- 청구항 제15항 내지 제28항 중 어느 한 항의 단계를 컴퓨터가 제어할 수 있도록 해주는 프로그램이 기록되어 있는 컴퓨터 판독가능 매체.
- 음향 소오스신호(x)를 수신하기 위한 입력을 가지고 또한 음향소오스신호(x)의 추정을 재구성할 수 있는 음향신호(x)의 인지적으로 중요한 특성들을 나타내는 기본 코드화 신호(P1)을 제공하기 위한 제1출력과, 음향 소오스신호(x)의 필터링된 버전을 나타내는 타겟신호(r)를 제공하기 위한 제2출력과, 기본 코드화 신호(P1)을 기반으로 하는 재구성신호를 나타내는 일차 코드화 신호(y)를 제공하기 위한 제3출력을 가지는 일차 코더(702)와,상기 일차 코드화 신호(y)에 응해, 일차 코드화 신호(y)의 인지적으로 개선된 표현을 구성하는, 평탄화된 일차 코드화 신호(yE)를 생성하기 위한 적어도 하나의 스펙트럼 평탄화 유닛(305a)과,상기 평탄화된 일차 코드화 신호(yE)와 타겟신호(r)를 기반으로 이차 코드화 신호(PC)를 생성하기 위한 양자화기(704)를 포함하는, 전송매체(306)를 통한 전송을 위한 엔코딩된 정보를 생성하기 위해 음향 소오스신호(x)를 엔코딩하는 송신기에 있어서,상기 적어도 하나의 스펙트럼 평탄화 유닛(305a)은, 문턱값(fT) 위의 주파수정보를 나타내는 계수값(KYE)들에서 변화가 감소되도록 일차 코드화 신호(y)를 선택적으로 수정함으로서 일차 코드화 신호(y)로부터 평탄화된 출력신호(yE)를 생성하도록 고안되는 것을 특징으로 하는 송신기.
- 제31항에 있어서, 상기 적어도 하나의 스펙트럼 평탄화 유닛(305a,305b)은:각각이 주파수성분을 나타내는 입력신호(P)의 계수들(KY)을 저장하기 위한 제1 버퍼메모리(401)와,문턱값(fT) 위의 주파수성분들에 대응하는 계수들(kY n+1- kY m)들에 대해, 적어도 하나의 주파수대역(ⅰ, ⅱ; ⅲ)들 각각에 대해 상기 제1 버퍼메모리(401)에 저장된 계수들(kP n+1- kP m)의 평균 계수값들(Kⅰ, Kⅱ; Kⅲ)을 계산하기 위한 프로세싱 유닛(402)와,특정 주파수대역들(ⅰ, ⅱ; ⅲ)에서 적어도 하나의 기본 코드화 신호(P)의 대응하는 계수들(KP)들이 있는 한 각 주파수대역들(ⅰ, ⅱ; ⅲ)에 대한 각 평균 계수값들(Kⅰ, Kⅱ; Kⅲ)을 반복적으로 저장하기 위한 제2 버퍼메모리(403)와,상기 제1 버퍼메모리(401)에서부터 문턱값(fT) 까지의 계수들(kY 1- kY n)을 독출하고 또한 제2 버퍼메모리(403)에서부터 문턱값(fT) 위의 계수들(kY n+1- kY m)을 독출하여 출력신호(yE)의 계수들(KYE)을 형성하는 독출유닛(404)를 포함하는 것을 특징으로 하는 송신기.
- 제32항에 있어서, 상기 주파수대역(ⅰ, ⅱ; ⅲ)들은 등간격인 것을 특징으로하는 송신기.
- 제32항 또는 제33항에 있어서, 상기 주파수대역(ⅰ, ⅱ; ⅲ)들은 적어도 부분적으로 중첩되는 것을 특징으로 하는 송신기.
- 제34항에 있어서,윈도우된 대응하는 주파수대역들을 얻기 위하여 윈도우함수(W1; W2)로 각 주파수대역(ⅰ, ⅱ; ⅲ)을 승산하고, 그리고각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써 주파수대역들(ⅰ, ⅱ; ⅲ)의 중첩영역들에서 최종 계수값들을 유도하기 위한 계수 결합기를 포함하는 것을 특징으로 하는 송신기.
- 제35항에 있어서, 상기 윈도우함수(W1; W2)들은 비-중첩 주파수영역에서는 일전한 크기를 가지고 또한 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 송신기.
- 수신한 엔코드 정보로부터 유도되는 일차 디코드화 스펙트럼을 수신하기 위한 입력과 평탄화된 일차 디코드화 스펙트럼를 제공하기 위한 출력을 가지는 스펙트럼 평탄화유닛(305b)를 포함하는, 전송매체(306)로부터 수신된엔코드화 정보로부터 음향 소오스신호(x)의 표현의 추정을 디코딩하는 수신기에 있어서, 상기 평탄화된 일차 디코드화 스펙트럼은 주파수성분을 나타내고, 스펙트럼 평탄화유닛(305b)은 문턱값(fT) 위의 주파수성분을 나타내는 계수값들 (KYE)에서 변화가 감소되도록 일차 디코드화 스펙트럼을 선택적으로 수정함으로써 평탄화된 일차 디코드화 스펙트럼을 생성하도록 고안되는 것을 특징으로 하는 수신기.
- 제37항에 있어서,엔코드된 정보에서 제1 전송신호을 수신하기 위한 입력과 일차 디코드화 스펙트럼을 제공하기 위한 출력을 가지는 재구성(재생)유닛(708)와,엔코드된 정보에서 제2 전송신호를 수신하기 위한 입력과 추정된 등화 스펙트럼을 제공하기 출력을 가지는 등화 디코더(707)와,평탄화된 일차 디코드화 스펙트럼를 수신하기 위한 제1입력과, 상기 추정된 등화 스펙트럼을 수신하기 위한 제2입력과 그리고 음향 소오스신호(x)의 추정을 제공하기 위한 출력을 가지는 양자화기(709)를 더포함하는 것을 특징으로 하는 수신기.
- 제38항에 있어서, 스펙트럼 평탄화 유닛(305b)은:각각이 주파수성분을 나타내는 일차 디코드화 스펙트럼의 계수들(KY)을 저장하기 위한 제1 버퍼메모리(401)와,문턱값(fT) 위의 주파수성분들에 대응하는 계수들(kY n+1- kY m)들에 대해, 적어도 하나의 주파수대역(ⅰ, ⅱ; ⅲ)들 각각에 대해 상기 제1 버퍼메모리(401)에 저장된 계수들(kY n+1- kY m)의 평균 계수값들(Kⅰ, Kⅱ; Kⅲ)을 계산하기 위한 프로세싱 유닛(402)와,특정 주파수대역들(ⅰ, ⅱ; ⅲ)에서 적어도 하나의 기본 코드화 신호(P)의 대응하는 계수들(KY)들이 있는 한 각 주파수대역들(ⅰ, ⅱ; ⅲ)에 대한 각 평균 계수값들(Kⅰ, Kⅱ; Kⅲ)을 반복적으로 저장하기 위한 제2 버퍼메모리(403)와,상기 제1 버퍼메모리(401)에서부터 문턱값(fT) 까지의 계수들(kY 1- kY n)을 독출하고 또한 제2 버퍼메모리(403)에서부터 문턱값(fT) 위의 계수들(kY n+1- kY m)을 독출하여 평탄화된 일차 디코드화 스펙트럼의 계수들(KYE)을 형성하는 독출유닛(404)를 포함하는 것을 특징으로 하는 수신기.
- 제39항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)은 등간격인 것을 특징으로 하는 수신기.
- 제39항 또는 제40항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)은 적어도 부분적으로 중첩하는 것을 특징으로 하는 수신기.
- 제41항에 있어서,윈도우된 대응하는 주파수대역들을 얻기 위하여 윈도우함수(W1; W2)로 각 주파수대역(ⅰ, ⅱ; ⅲ)을 승산하고, 그리고각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써 주파수대역들(ⅰ, ⅱ; ⅲ)의 중첩영역들에서 최종 계수값들을 유도하기 위한 계수 결합기를 포함하는 것을 특징으로 하는 수신기.
- 제42항에 있어서, 상기 윈도우함수(W1; W2)들은 비-중첩 주파수영역에서는 일전한 크기를 가지고 또한 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 수신기.
- 제1노드에서 제2노드로 음향 소오스신호(x)의 전송을 위한 통신시스템에 있어서,상기 청구항 제31항 내지 제36항 중 어느 한 항에 따라 엔코드된 정보를 생성하기 위해 음향 소오스신호(x)를 엔코딩하는 송신기(300)와,상기 송신기(300)가 생성한 엔코드된 정보를 수신하기 위한 입력을 가지고 또한 엔코딩된 정보를 청구항 제37항 내지 제43항 중 어느 한 항에 따라 음향 소오스신호(x)의 추정으로 디코딩하는 수신기(310)와,송신기(300)에서 수신기(310)로 적어도 하나의 강화된 코드화 신호(P(E))를 전송하기 위한 전송매체(306)를 포함하는 것을 특징으로 하는 통신시스템.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00850172A EP1199812A1 (en) | 2000-10-20 | 2000-10-20 | Perceptually improved encoding of acoustic signals |
EP00850172.8 | 2000-10-20 | ||
PCT/SE2001/001919 WO2002033692A1 (en) | 2000-10-20 | 2001-09-07 | Perceptually improved encoding of acoustic signals |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20030048061A true KR20030048061A (ko) | 2003-06-18 |
KR100832144B1 KR100832144B1 (ko) | 2008-05-27 |
Family
ID=8175680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020037005479A KR100832144B1 (ko) | 2000-10-20 | 2001-09-07 | 지각적으로 개선된 음향신호의 엔코딩 |
Country Status (12)
Country | Link |
---|---|
US (1) | US6611798B2 (ko) |
EP (2) | EP1199812A1 (ko) |
JP (1) | JP5222452B2 (ko) |
KR (1) | KR100832144B1 (ko) |
CN (1) | CN1312658C (ko) |
AT (1) | ATE380378T1 (ko) |
AU (2) | AU8460601A (ko) |
CA (1) | CA2424373C (ko) |
DE (1) | DE60131766T2 (ko) |
ES (1) | ES2296791T3 (ko) |
PT (1) | PT1328923E (ko) |
WO (1) | WO2002033692A1 (ko) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100393085C (zh) * | 2000-12-29 | 2008-06-04 | 诺基亚公司 | 数字网络中的音频信号质量增强 |
IL144158A (en) | 2001-07-05 | 2011-06-30 | Mosaid Technologies Inc | Socket for connecting an analog telephone to a digital communications network that carries digital voice signals |
US7308406B2 (en) * | 2001-08-17 | 2007-12-11 | Broadcom Corporation | Method and system for a waveform attenuation technique for predictive speech coding based on extrapolation of speech waveform |
WO2003091989A1 (en) * | 2002-04-26 | 2003-11-06 | Matsushita Electric Industrial Co., Ltd. | Coding device, decoding device, coding method, and decoding method |
DE10254612A1 (de) * | 2002-11-22 | 2004-06-17 | Humboldt-Universität Zu Berlin | Verfahren zur Ermittlung spezifisch relevanter akustischer Merkmale von Schallsignalen für die Analyse unbekannter Schallsignale einer Schallerzeugung |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
US7724827B2 (en) * | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US7075434B2 (en) * | 2003-09-22 | 2006-07-11 | Michael Shafir | Encoding and decoding method and system |
US7536302B2 (en) * | 2004-07-13 | 2009-05-19 | Industrial Technology Research Institute | Method, process and device for coding audio signals |
KR100619893B1 (ko) * | 2004-07-23 | 2006-09-19 | 엘지전자 주식회사 | 휴대단말기의 개선된 저전송률 선형예측코딩 장치 및 방법 |
KR20060067016A (ko) | 2004-12-14 | 2006-06-19 | 엘지전자 주식회사 | 음성 부호화 장치 및 방법 |
US7930176B2 (en) | 2005-05-20 | 2011-04-19 | Broadcom Corporation | Packet loss concealment for block-independent speech codecs |
US8599925B2 (en) * | 2005-08-12 | 2013-12-03 | Microsoft Corporation | Efficient coding and decoding of transform blocks |
US7490036B2 (en) * | 2005-10-20 | 2009-02-10 | Motorola, Inc. | Adaptive equalizer for a coded speech signal |
EP1870880B1 (en) | 2006-06-19 | 2010-04-07 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
US7774205B2 (en) * | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
EP2320416B1 (en) * | 2008-08-08 | 2014-03-05 | Panasonic Corporation | Spectral smoothing device, encoding device, decoding device, communication terminal device, base station device, and spectral smoothing method |
US9979962B2 (en) * | 2011-08-08 | 2018-05-22 | Hewlett-Packard Development Company, L.P. | Method and system for compression of a real-time surveillance signal |
CN105321521B (zh) * | 2014-06-30 | 2019-06-04 | 美的集团股份有限公司 | 基于终端运行环境的音频信号编码方法和系统 |
WO2018084305A1 (ja) * | 2016-11-07 | 2018-05-11 | ヤマハ株式会社 | 音声合成方法 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US920832A (en) | 1906-11-26 | 1909-05-04 | Vickers Sons & Maxim Ltd | Automatic gun. |
US5307441A (en) | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
US5206884A (en) * | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
IT1241358B (it) * | 1990-12-20 | 1994-01-10 | Sip | Sistema di codifica del segnale vocale con sottocodice annidato |
SG49883A1 (en) | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
US5526464A (en) | 1993-04-29 | 1996-06-11 | Northern Telecom Limited | Reducing search complexity for code-excited linear prediction (CELP) coding |
US5574825A (en) | 1994-03-14 | 1996-11-12 | Lucent Technologies Inc. | Linear prediction coefficient generation during frame erasure or packet loss |
JPH07261797A (ja) * | 1994-03-18 | 1995-10-13 | Mitsubishi Electric Corp | 信号符号化装置及び信号復号化装置 |
JP3237089B2 (ja) | 1994-07-28 | 2001-12-10 | 株式会社日立製作所 | 音響信号符号化復号方法 |
JP3970327B2 (ja) * | 1996-02-15 | 2007-09-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ | 複雑さが軽減された信号送信システム |
EP0814458B1 (en) * | 1996-06-19 | 2004-09-22 | Texas Instruments Incorporated | Improvements in or relating to speech coding |
EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
KR20000068538A (ko) * | 1997-07-11 | 2000-11-25 | 이데이 노부유끼 | 정보 복호 방법 및 장치, 정보 부호화 방법 및 장치, 및 제공매체 |
TW408298B (en) * | 1997-08-28 | 2000-10-11 | Texas Instruments Inc | Improved method for switched-predictive quantization |
JPH11296196A (ja) * | 1998-04-13 | 1999-10-29 | Hitachi Ltd | 音声符号化方法および音声符号化処理装置 |
JP2000047695A (ja) * | 1998-07-29 | 2000-02-18 | Oki Electric Ind Co Ltd | 符号化装置及び復号化装置 |
US6182030B1 (en) * | 1998-12-18 | 2001-01-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Enhanced coding to improve coded communication signals |
-
2000
- 2000-10-20 EP EP00850172A patent/EP1199812A1/en not_active Withdrawn
-
2001
- 2001-09-07 DE DE60131766T patent/DE60131766T2/de not_active Expired - Lifetime
- 2001-09-07 PT PT01963677T patent/PT1328923E/pt unknown
- 2001-09-07 AT AT01963677T patent/ATE380378T1/de not_active IP Right Cessation
- 2001-09-07 CN CNB018173799A patent/CN1312658C/zh not_active Expired - Lifetime
- 2001-09-07 KR KR1020037005479A patent/KR100832144B1/ko active IP Right Grant
- 2001-09-07 AU AU8460601A patent/AU8460601A/xx active Pending
- 2001-09-07 JP JP2002536999A patent/JP5222452B2/ja not_active Expired - Lifetime
- 2001-09-07 EP EP01963677A patent/EP1328923B1/en not_active Expired - Lifetime
- 2001-09-07 CA CA2424373A patent/CA2424373C/en not_active Expired - Lifetime
- 2001-09-07 AU AU2001284606A patent/AU2001284606B2/en not_active Expired
- 2001-09-07 ES ES01963677T patent/ES2296791T3/es not_active Expired - Lifetime
- 2001-09-07 WO PCT/SE2001/001919 patent/WO2002033692A1/en active IP Right Grant
- 2001-10-19 US US09/982,027 patent/US6611798B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP1328923A1 (en) | 2003-07-23 |
ES2296791T3 (es) | 2008-05-01 |
DE60131766T2 (de) | 2008-11-13 |
US20020049584A1 (en) | 2002-04-25 |
PT1328923E (pt) | 2008-02-28 |
KR100832144B1 (ko) | 2008-05-27 |
WO2002033692A1 (en) | 2002-04-25 |
ATE380378T1 (de) | 2007-12-15 |
CA2424373C (en) | 2011-08-30 |
EP1328923B1 (en) | 2007-12-05 |
JP2004515801A (ja) | 2004-05-27 |
DE60131766D1 (de) | 2008-01-17 |
AU2001284606B2 (en) | 2007-01-25 |
CA2424373A1 (en) | 2002-04-25 |
EP1199812A1 (en) | 2002-04-24 |
CN1312658C (zh) | 2007-04-25 |
JP5222452B2 (ja) | 2013-06-26 |
US6611798B2 (en) | 2003-08-26 |
AU8460601A (en) | 2002-04-29 |
CN1470048A (zh) | 2004-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100832144B1 (ko) | 지각적으로 개선된 음향신호의 엔코딩 | |
RU2763374C2 (ru) | Способ и система с использованием разности долговременных корреляций между левым и правым каналами для понижающего микширования во временной области стереофонического звукового сигнала в первичный и вторичный каналы | |
JP5047268B2 (ja) | Mdct係数を使用する音声後処理 | |
CN100559465C (zh) | 保真度优化的可变帧长编码 | |
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
CA2698031C (en) | Method and device for noise filling | |
JP3881943B2 (ja) | 音響符号化装置及び音響符号化方法 | |
US9020815B2 (en) | Spectral envelope coding of energy attack signal | |
US9251800B2 (en) | Generation of a high band extension of a bandwidth extended audio signal | |
CN103187065B (zh) | 音频数据的处理方法、装置和系统 | |
US20110002266A1 (en) | System and Method for Frequency Domain Audio Post-processing Based on Perceptual Masking | |
AU2001284606A1 (en) | Perceptually improved encoding of acoustic signals | |
KR20030046468A (ko) | 부호화 음향 신호를 지각적으로 개선 강화시키는 방법 및장치 | |
CN111312278B (zh) | 用于带宽扩展的高频解码的方法及设备 | |
Bhatt et al. | A novel approach for artificial bandwidth extension of speech signals by LPC technique over proposed GSM FR NB coder using high band feature extraction and various extension of excitation methods | |
JP5451603B2 (ja) | デジタルオーディオ信号の符号化 | |
Herre et al. | Perceptual audio coding of speech signals | |
Pollak et al. | Audio Compression using Wavelet Techniques | |
JPH0537393A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130507 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20140512 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20150508 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20160510 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20170508 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20180509 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20190516 Year of fee payment: 12 |