KR20130019019A - 신호 인코딩 및 디코딩 방법, 장치 및 시스템 - Google Patents

신호 인코딩 및 디코딩 방법, 장치 및 시스템 Download PDF

Info

Publication number
KR20130019019A
KR20130019019A KR1020137002434A KR20137002434A KR20130019019A KR 20130019019 A KR20130019019 A KR 20130019019A KR 1020137002434 A KR1020137002434 A KR 1020137002434A KR 20137002434 A KR20137002434 A KR 20137002434A KR 20130019019 A KR20130019019 A KR 20130019019A
Authority
KR
South Korea
Prior art keywords
signal
frequency signal
high frequency
encoding
decoding
Prior art date
Application number
KR1020137002434A
Other languages
English (en)
Other versions
KR101341078B1 (ko
Inventor
레이 미아오
제신 류
롱잉 첸
첸 후
웨이 샤오
마르셀 타데이 허브
킹 장
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20130019019A publication Critical patent/KR20130019019A/ko
Application granted granted Critical
Publication of KR101341078B1 publication Critical patent/KR101341078B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

신호 인코딩 및 신호 디코딩 방법과 장치, 그리고 인코딩 및 디코딩 시스템을 제공한다. 신호 인코딩 방법은, 입력 신호 중 고주파 신호에 대해 분류 결정 프로세스를 수행하는 단계; 상기 분류 결정 프로세스의 결과에 따라 상기 고주파 신호를 적응적으로 인코딩하는 단계; 및 저주파 신호의 코드, 상기 고주파 신호의 적응형 코드, 및 상기 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 출력하는 단계를 포함한다. 분류 결정 프로세스를 고주파 신호에 대해 수행하고, 분류 결정 프로세스의 결과에 따라 적응형 인코딩 또는 적응형 디코딩을 수행하므로, 보이스 및 오디오 출력 신호의 품질이 향상된다.

Description

신호 인코딩 및 디코딩 방법, 장치 및 시스템 {METHODS, APPARATUSES AND SYSTEM FOR ENCODING AND DECODING SIGNAL}
본 출원은 발명의 명칭 "METHODS AND APPARATUSES FOR ENCODING SIGNAL AND DECODING SIGNAL AND SYSTEM FOR ENCODING AND DECODING"으로, 2008년 12월 10일 중국 특허청에 출원된 중국 특허출원 제200810239451.5호에 대해 우선권을 주장하며, 그 내용 전부는 인용에 의해 본 명세서에 포함된다.
본 발명은 음성 및 오디오의 인코딩 및 디코딩 분야에 관한 것으로, 특히 신호 인코딩 및 신호 디코딩 방법과 장치, 그리고 인코딩 및 디코딩 시스템에 관한 것이다.
보이스 및 오디오(voice and audio) 인코딩 알고리즘에서는, 사람의 청각 특성 및 비트 레이트(bit rate)의 제한 때문에 저주파 신호가 보통 우선적으로 인코딩된다. 네트워크의 발전과 더불어, 대역폭에 대한 제한은 점점 좁아지고 있고, 사운드(sound) 품질에 대한 요구는 더 높아진다. 신호의 사운드 품질은 신호의 대역폭을 증대시킴으로써 향상될 수 있으며, 비트가 존재하지 않거나 어느 정도 존재할 때 대역폭 확장 기술이 채택될 수 있다. 보이스 신호의 대역 범위를 확장하고 신호의 품질을 향상시키는 기술로서, 대역폭 확장 기술이 최근 몇년간 두드러지게 발전하였고 여러 분야에서 상업적 애플리케이션을 실현하였는데, 두 가지 널리 사용되는 대역폭 확장 기술은 G.729.1의 대역폭 확장 알고리즘과 동영상 전문가 그룹(Motion Picture Expert Group, MPEG)의 스펙트럼 대역 복제(Spectral Band Replication, SBR) 기술이다.
종래기술에서 제공된 대역폭 확장 기술에서 한 가지 방법은 다음과 같다. 인코딩 단(encoding end)에서, 고주파 신호는 인코딩되지 않고, 인코더의 저주파 신호의 인코딩 알고리즘은 변경되지 않는다. 디코딩 단(decoding end)에서, 고주파 신호는 디코딩에 의해 취득된 저주파 신호 및 고주파와 저주파 사이의 잠재적인 관계(potential relation)에 따라 무작정 확장된다. 이 방법에서, 고주파 신호와 관련없는 정보가 디코딩 단에서 참조될 수 있기 때문에, 확장된 고주파 신호의 품질은 나쁘다.
다른 방법은 다음과 같다. 인코딩 단에서는, 고주파 신호의 일부 시간 포락선(time envelope) 및 스펙트럼 포락선(spectral envelope)을 인코딩한다. 디코딩단에서는, 저주파 신호의 스펙트럼 정보에 따라 여기 신호(excitation signal)를 생성하고, 이 여기 신호와 디코딩을 통해 취득된 고주파 신호의 시간 포락선 및 스펙트럼 포락선의 정보를 결합하여 고주파 신호가 복원된다. 전술한 방법과 비교하면, 이 방법이 확장된 고주파 신호의 품질을 더 양호하게 만드는 데 더 도움이 되지만, 일부 고조파 세기 신호(harmonic intense signal)에 대해서는, 큰 왜곡을 일으키기 쉽다. 그러므로, 이 방법에서도 출력 보이스 및 오디오 신호의 품질을 향상시킬 필요가 있다.
본 발명은 보이스 및 오디오 출력 신호의 품질을 향상시키기 위한 신호 인코딩 및 신호 디코딩 방법과 장치, 그리고 인코딩 및 디코딩 시스템에 관한 것이다.
본 발명의 일 실시예는 신호 인코딩 방법을 제공하며, 상기 방법은,
입력 신호 중 고주파 신호에 대해 분류 결정 프로세스를 수행하는 단계;
상기 분류 결정 프로세스의 결과에 따라 상기 고주파 신호를 적응적으로 인코딩(adaptively encoding)하는 단계; 및
저주파 신호의 인코딩된 비트 스트림(bitstream), 상기 고주파 신호의 적응적으로 인코딩된 비트 스트림, 및 상기 분류 결정 프로세스의 결과를 출력하는 단계를 포함한다.
본 발명의 일 실시예는 신호 디코딩 방법을 제공하며, 상기 방법은,
저주파 신호의 코드를 포함하는 인코딩된 비트 스트림, 고주파 신호의 적응적으로 인코딩된 비트 스트림, 및 고주파 신호의 분류 결정 프로세스의 결과를 수신하는 단계;
상기 분류 결정 프로세스의 결과 및 결정된 여기 신호에 따라 상기 고주파 신호를 적응적으로 디코딩(adaptively decoding)하는 단계; 및
디코딩된 저주파 신호 및 상기 적응적으로 디코딩된 고주파 신호를 포함하는 출력 신호를 취득하는 단계를 포함한다.
본 발명의 일 실시예는 신호 인코딩 장치를 제공하며, 상기 장치는,
입력 신호 중 고주파 신호에 대해 분류 결정 프로세스를 수행하도록 구성된 코드 분류 모듈;
상기 분류 결정 프로세스의 결과에 따라 상기 고주파 신호를 적응적으로 인코딩하도록 구성된 적응형(adaptive) 인코딩 모듈; 및
상기 입력 신호 중 저주파 신호의 코드, 상기 고주파 신호의 적응형 코드(adaptive code), 및 상기 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 출력하도록 구성된 비트 스트림 출력 모듈을 포함한다.
본 발명의 일 실시예는 신호 디코딩 장치를 제공하며, 상기 장치는,
저주파 신호의 코드, 고주파 신호의 적응형 코드, 및 고주파 신호의 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 수신하도록 구성된 수신 모듈;
상기 분류 결정 프로세스의 결과 및 결정된 여기 신호에 따라 상기 고주파 신호를 적응적으로 디코딩하도록 구성된 적응형 디코딩 모듈; 및
디코딩된 저주파 신호 및 상기 적응적으로 디코딩된 고주파 신호를 포함하는 출력 신호를 취득하도록 구성된 신호 취득 모듈을 포함한다.
본 발명의 실시예는 인코딩 및 디코딩 시스템을 제공하며, 상기 시스템은,
입력 신호 중 고주파 신호에 대해 분류 결정 프로세스를 수행하고, 상기 분류 결정 프로세스의 결과에 따라 상기 고주파 신호를 적응적으로 인코딩하고, 상기 입력 신호 중 저주파 신호의 코드, 상기 고주파 신호의 적응형 코드, 및 상기 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 출력하도록 구성된, 신호 인코딩 장치; 및
상기 입력 신호 중 저주파 신호의 코드, 상기 고주파 신호의 적응형 코드, 및 고주파 신호의 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 수신하고, 상기 분류 결정 프로세스의 결과 및 결정된 여기 신호에 따라 상기 고주파 신호를 적응적으로 디코딩하고, 디코딩된 저주파 신호 및 상기 적응적으로 디코딩된 고주파 신호를 포함하는 출력 신호를 취득하도록 구성된, 신호 디코딩 장치를 포함한다.
본 발명의 실시예에 따르면, 분류 결정 프로세스를 고주파 신호에 대해 수행하고, 분류 결정 프로세스의 결과에 따라 적응형 인코딩 또는 적응형 디코딩을 수행하므로, 보이스 및 오디오 출력 신호의 품질이 향상된다.
도 1은 본 발명의 실시예 1에 따른 신호 인코딩 방법의 흐름도이다.
도 2는 본 발명의 실시예 2에 따른 신호 인코딩 방법의 흐름도이다.
도 3은 본 발명의 실시예 2에 따른 신호 인코딩 방법에 있어 적응형 인코딩의 개략도이다.
도 4는 본 발명의 실시예 3에 따른 신호 인코딩 방법에 있어 적응형 인코딩의 개략도이다.
도 5는 본 발명의 실시예 4에 따른 신호 인코딩 방법에 있어 적응형 인코딩의 개략도이다.
도 6은 본 발명의 실시예 1에 따른 신호 디코딩 방법의 흐름도이다.
도 7은 본 발명의 실시예 2에 따른 신호 디코딩 방법의 흐름도이다.
도 8은 본 발명의 실시예 2에 따른 신호 디코딩 방법에 있어 적응형 디코딩의 개략도이다.
도 9는 본 발명의 실시예 3에 따른 신호 디코딩 방법에 있어 적응형 디코딩의 개략도이다.
도 10은 본 발명의 실시예 1에 따른 신호 인코딩 장치의 개략 구성도이다.
도 11은 본 발명의 실시예 2에 따른 신호 인코딩 장치의 개략 구성도이다.
도 12는 본 발명의 실시예 1에 따른 신호를 디코딩하는 장치의 개략 구성도이다.
도 13는 본 발명의 실시예 2에 따른 신호를 디코딩하는 장치의 개략 구성도이다.
도 14는 본 발명의 일 실시예에 따른 인코딩 및 디코딩 시스템의 개략 구성도이다.
첨부도면 및 이하의 실시예와 관련하여 본 발명의 기술적 해결에 대해 더 상세하게 설명한다.
도 1은 본 발명의 실시예 1에 따른 신호 인코딩 방법의 흐름도이다. 도 1에 도시된 바와 같이, 상기 방법은 구체적으로 다음의 단계를 포함한다.
단계 101에서는, 입력 신호 중 고주파 신호에 대해 분류 결정 프로세스를 수행한다.
단계 102에서는, 분류 결정 프로세스의 결과에 따라 고주파 신호를 적응적으로 인코딩한다.
단계 103에서는, 저주파 신호의 인코딩된 비트 스트림, 고주파 신호의 적응적으로 인코딩된 비트 스트림, 및 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 출력한다.
실시예 1에 따르면, 고주파 신호에 대해 분류 결정 프로세스를 수행하고, 분류 결정 프로세스의 결과에 따라 적응형 인코딩을 수행한다. 이렇게 상이한 유형의 신호에 대해 적응형 인코딩을 수행하므로, 보이스 및 오디오 출력 신호의 품질이 향상된다.
도 2는 본 발명의 실시예 2에 따른 신호 인코딩 방법의 흐름도이다. 도 2에 도시된 바와 같이, 실시예 2는 구체적으로 다음의 단계를 포함한다.
단계 201에서는, 입력 신호에 대해 신호 분해를 수행하여 저주파 신호 및 고주파 신호를 취득한다.
단계 202에서는, 저주파 신호를 인코딩한다. 단계 202 및 단계 203 내지 단계 205를 수행하는 순서는 실시예 2에 한정되지 않는다.
단계 203에서는, 고주파 신호에 대해 시간 주파수 변환 프로세스를 수행한다.
단계 204에서는, 시간 주파수 변환 후의 고주파 신호에 대해 분류 결정 프로세스를 수행하며, 분류 결정 프로세스는 고주파 신호의 유형을 결정할 수 있다. 고주파 신호의 유형에는 구체적으로 과도 신호(transient signal) 및 비과도 신호(non-transient signal)를 포함하고, 이 중 비과도 신호는 고조파 신호(harmonic signal), 유사 노이즈 신호(noise-like signal), 및 일반 신호(ordinary signal)를 포함한다.
또, 단계 204는 다음의 단계를 포함할 수 있다.
단계 2041에서는, 고주파 신호의 파라미터를 계산한다.
구체적으로는, 고주파 신호의 현재 프레임을 포착하여 신호 분석 모듈에 입력한다. 신호 분석 모듈은 분류에 필요한 파라미터 및 인코딩에 필요한 파라미터를 포함하는 파라미터를 계산하도록 되어 있다. 예를 들면, 과도 신호를 결정하기 위한, 시간 도메인 포락선 및 다음의 시간 도메인 포락선에 의해 취득된 최대값에서 두 개의 연속하는 시간 도메인 포락선 중 이전의 것을 제외하는 것과 같은, 계산을 필요로 하는 파라미터; 및 고조파 신호를 결정하기 위한, 전역(global) 주파수 스펙트럼 에너지, 주파수 도메인 포락선 에너지, 및 부대역(subband) 고조파 세기와 같은, 계산을 필요로 하는 파라미터이다.
단계 2042에서는, 계산된 파라미터 및 결정 방식(decision mechanism)에 따라 고주파 신호의 현재 프레임 유형(current frame type)을 결정한다.
구체적으로는, 신호 분석 모듈에 의해 취득된 파라미터 및 결정 방식에 따라 신호의 유형을 결정한다. 결정 방식은 고주파 신호의 이전의 프레임 유형 및 수 개 이전의 프레임 유형의 가중치에 따라 동적으로 조정될 수 있다. 예를 들면, 과도 신호를 결정할 때, 시간의 각종 파라미터를 종합적으로 판단할 필요가 있고, 이전 프레임(previous frame)이 과도 신호인지 여부의 판단 또한 필요하며; 고조파 신호를 결정할 때, 이전 프레임의 유형에 따라 결정 임계값은 동적인 조정을 필요로 하고, 현재 프레임의 신호의 유형은 수 개 이전 프레임의 유형의 가중치에 따라 결정될 것을 필요로 한다.
단계 205에서는, 분류 결정 프로세스의 결과에 따라 고주파 신호를 적응적으로 인코딩하며, 상기 결과는 고주파 신호의 현재 프레임 유형을 나타낸다.
또한, 단계 205는 다음의 단계를 포함한다.
단계 2051에서는, 고주파 신호의 현재 프레임 유형에 따라 현재 이용 가능한 비트를 할당하고, B는 현재 이용 가능한 비트, 즉 할당될 비트를 타나낸다.
단계 2052에서는, 할당된 비트를 사용하여 고주파 신호의 현재 프레임의 시간 포락선과 스펙트럼 포락선을 적응적으로 인코딩한다.
도 3은 본 발명의 실시예 2에 따른 신호 인코딩 방법에 있어 적응형 인코딩의 개략도이다. 구체적으로는 도 3에 도시된 바와 같이, 인코딩 단에서는, 전술한 분류 알고리즘을 통해 취득된 상이한 신호 유형의 현재 프레임에 따라, 현재 프레임의 시간 포락선 및 공간 포락선을 상이한 비트 할당 방법을 사용하여 적응적으로 인코딩한다. 과도 신호에 대해 설명하면, 스펙트럼 신호는 비교적 안정하고, 시간 신호는 급격히 변화하기 때문에, 시간 신호가 더욱 중요하고, 그래서 다수의 비트를 시간 신호의 인코딩에 사용한다. 비과도 신호에 대해 설명하면, 시간 신호는 비교적 안정하고, 스펙트럼 신호는 급속히 변화하므로, 스펙트럼 신호가 더 중요하고, 그래서 다수의 비트를 스펙트럼 신호의 인코딩에 사용한다.
고주파 신호의 현재 프레임 유형이 과도 신호이고, B1은 과도 신호에 의해 사용된 모든 비트를 나타내고, M1은 과도 신호의 시간 포락선에 의해 사용된 비트를 나타내고, N1은 과도 신호의 스펙트럼 포락선에 의해 사용된 비트를 나타낸다고 하면, B1=M1+N1이며, 여기서 M1은 N1과 같거나 크다. 즉, 과도 신호의 경우에는, 더 많은 수의 비트가 시간 포락선의 인코딩에 사용된다.
고주파 신호의 현재 프레임 유형이 비과도 신호이고, B2는 비과도 신호에 의해 사용된 모든 비트를 나타내고, M2는 비과도 신호의 스펙트럼 포락선에 의해 사용된 비트를 나타내고, N2는 비과도 신호의 시간 포락선에 의해 사용된 비트를 나타낸다고 하면, B2=M2+N2이며, 여기서 M2는 N2와 같거나 크고, 프레임 길이가 보다 짧은 조건에서는 N2는 0일 수 있다. 즉, 비과도 신호의 경우에는, 더 많은 수의 비트가 스펙트럼 포락선의 인코딩에 사용된다.
또, 일 구현예에서 B=B1=B2이다. 즉, 현재 이용 가능한 비트가 시간 포락선 및/또는 스펙트럼 포락선의 인코딩에 모두 사용된다. 다른 구현예에서 B≥B1, B≥B2이고, B1과 B2는 다를 수 있다. 즉, 남은 비트가 존재할 수 있으며, 그 남은 비트는 B와 B1 또는 B와 B2의 차이다. B와 B1의 차는 과도 신호의 시간 포락선 및/또는 스페트럼 포락선에 대한 정밀 양자화 인코딩(fine quantizing encoding)의 수행에 사용될 수 있거나, 또는 저주파 신호에 대한 정밀 양자화 인코딩의 수행에 사용될 수 있고; B와 B2의 차는 비과도 신호의 스펙트럼 포락선 및/또는 시간 포락선에 대한 정밀 양자화 인코딩의 수행에 사용될 수 있거나, 또는 저주파 신호에 대한 정밀 양자화 인코딩의 수행에 사용될 수 있다.
M1과 N1, 또는M2와 N2의 값은 미리 설정될 수 있고, 코드를 통해 전송될 필요가 없다, 즉, 고주파 신호의 현재 프레임 유형을 취득할 때, 현재 이용 가능한 비트를 미리 설정된 비트값에 따라 할당하고, 인코딩 단과 디코딩 단 모두 미리 설정된 값을 사용하며; M1 및/또는 N1의 값 또는 M2 및/또는 N2의 값이 비트 스트림 내에 부가된다. 예를 들면, M1의 값은 비트 스트림 내에 전송되고, B1의 값은 인코딩 단 및 디코딩 단에 알려져 있으므로, N1의 값은 디코딩 단에서 B1-M1을 통해 취득될 수 있다.
단계 206에서는, 인코딩된 저주파 신호의 비트 스트림, 고주파 신호의 적응적으로 인코딩된 비트 스트림, 및 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 출력한다.
실시예 2에서, 상이한 유형의 고주파 신호에 대해, 시간 포락선 및 스펙트럼 포락선의 인코딩 시에 상이한 엠퍼시스(emphasis)를 둠으로, 출력 신호의 품질이 보다 양호하다. 또, 현재 프레임의 최종 신호 유형은 현재 프레임의 파라미터 및 인코딩 단에서의 이전 프레임의 신호 유형에 따라 결정되므로, 결정 프로세스가 더욱 정확하다.
본 발명의 실시예 3에 따른 신호 인코딩 방법에서는, 입력 초광대역 신호를 분해하여 0 kHz에서 8 kHz 사이의 주파수를 가지는 저주파 신호(광대역 신호)와 8 kHz에서 14 kHz 사이의 주파수를 가지는 고주파 신호를 취득한다. G. 722 인코더를 사용하여 저주파 신호를 인코딩하고, 고주파 신호에 대해서는 시간 주파수 변환 프로세스를 수행하며, 그후 분류 결정 프로세스를 수행한다. 고주파 신호는 과도 신호, 고주파 신호, 유사 노이즈 신호, 및 일반 신호를 포함하고, 고주파 신호, 유사 노이즈 신호, 및 일반 신호는 통틀어서 비과도 신호라고 하며, 분류 결정 프로세서는 실시예 2를 참조할 수 있다. 입력 신호에 대해서는 5 ms마다 1 프레임씩 프레이밍 프로세스(framing process)를 수행한다. 도 4는 본 발명의 실시예 3에 따른 신호 인코딩 방법에 있어 적응형 인코딩의 개략도이다. 도 4에 도시된 바와 같이, 실시예 3에서, B=B1=B2=32 비트이고, 과도 신호에 대해서는, M1=16 비트를 사용하여 네 개의 시간 포락선을 인코딩하고, N1=16 비트를 사용하여 네 개의 스펙트럼 포락선을 인코딩하며; 비과도 신호에 대해서는, M2=32 비트를 사용하여 여덟 개의 스펙트럼 포락선을 인코딩하고, 프레임 길이가 비교적 짧은 5 ms이기 때문에, 시간 포락선을 인코딩하지는 않는다, 즉 N2=0. 끝으로, 입력 신호 중 저주파 신호의 코드, 고주파 신호의 적응형 코드, 및 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 출력한다.
실시예 3에서는, 상이한 유형의 신호에 따라 B=B1=B2인 조건에서, 이용 가능한 비트를 할당하여 스펙트럼 포락선 및 시간 포락선의 인코딩에 각각 사용한다. 이렇게 입력 신호의 특성을 종합적으로 고려하여 최적화 코드의 효과를 달성하며, 출력 신호의 품질을 향상시킨다.
도 5는 본 발명의 실시예 4에 따른 신호 인코딩 방법에 있어 적응형 인코딩의 개략도이다. 도 5에 도시된 바와 같이, 실시예 4와 실시예 3과의 차이는 B=B1>B2인 점에 있으며, B1는 B2와 상이하고, 여기서 B1=32이고 B2=12이다. 과도 신호에 대해서는 M1=16 비트를 사용하여 네 개의 시간 포락선을 인코딩하고, N1=16 비트를 사용하여 네 개의 스펙트럼 포락선을 인코딩하며; 비과도 신호에 대해서는, 벡터 양자화 방법을 이용하여 스펙트럼 포락선을 인코딩하며, M2=12 비트를 사용하여 여덟 개의 스펙트럼 포락선을 인코딩하고, 프레임 길이가 비교적 짧은 5 ms이기 때문에, 시간 포락선을 인코딩하지는 않는다, 즉 N2=0. 실시예 4에서는, 더 작은 수의 비트를 사용하여 비과도 신호를 인코딩하고, G. 722 코어 인코더의 품질을 강화시키 위해 남은 비트를 사용한다, 즉 저주파 신호에 대해 정밀 양자화 인코딩을 수행한다.
도 6은 본 발명의 실시예 1에 따른 신호 디코딩 방법의 흐름도이다. 도 6에 도시된 바와 같이, 실시예 1은 구체적으로 다음의 단계를 포함한다.
단계 301에서는, 저주파 신호의 인코딩된 비트 스트림, 고주파 신호의 적응적으로 인코딩된 비트 스트림, 및 고주파 신호의 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 수신한다.
단계 302에서는, 분류 결정 프로세스의 결과 및 결정된 여기 신호에 따라 고주파 신호를 적응적으로 디코딩한다.
단계 303에서는, 디코딩된 저주파 신호 및 적응적으로 디코딩된 고주파 신호를 포함하는 출력 신호를 취득한다.
실시예 1에 따르면, 분류 결정 프로세스에 따라 고주파 신호를 적응적으로 디코딩한다. 이렇게 상이한 유형의 신호를 적응적으로 디코딩하므로 출력 고주파 신호의 품질이 향상된다.
도 7은 본 발명의 실시예 2에 따른 신호 디코딩 방법의 흐름도이다. 도 7에 도시된 바와 같이, 실시예 2는 실시예2의 신호 인코딩 방법에 대응할 수 있으며, 구체적으로는 다음의 단계를 포함한다.
단계 401에서는, 저주파 신호의 인코딩된 비트 스트림, 고주파 신호의 적응적으로 인코딩된 비트 스트림, 및 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 수신한다.
단계 402에서는, 저주파 신호를 디코딩한다. 이 단계 및 그 다음의 단계 403 내지 단계 406를 수행하는 순서는 실시예 2에 한정되지 않는다.
단계 403에서는, 분류 결정 프로세스의 결과 및 디코딩 및 시간 주파수 변환 프로세스를 실행한 후의 저주파 신호에 따라 에 따라 여기 신호를 결정한다.
구체적으로는, 신호 분류 결정의 결과를 충분히 사용함으로써 더 높은 복원 품질을 얻기 위해, 상이한 유형의 고주파 신호에 따라 여기 신호를 선택한다. 예를 들면, 고주파 신호가 과도 신호인 경우, 저주파의 정밀 구성(fine structure)을 더 잘 사용하기 위해, 더 넓은 주파수 대역을 가지는 신호를 여기 신호로 선택하고; 고주파 신호가 고조파 신호인 경우, 저주파의 정밀 구성을 더 잘 사용하기 위해, 더 넓은 주파수 대역을 가지는 신호를 여기 신호로 선택하고; 고주파 신호가 유사 노이즈 신호인 경우, 불규칙 노이즈(random noise)를 여기 신호로 선택하고; 고주파 신호가 일반 신호인 경우, 고주파에서 너무 많은 고조파가 생성되는 것을 피하기 위해 저주파 신호를 여기 신호로 선택하지 않는다.
단계 404에서, 분류 결정 프로세스의 결과에 따라 고주파 신호를 적응적으로 디코딩하며, 상기 결과는 고주파 신호 및 여기 신호의 현재 프레임 유형을 나타낸다.
이 단계는, 고주파 신호의 현재 프레임 유형에 따라 비트를 할당하는 단계; 및 할당된 비트를 사용하여, 선택된 여기 신호에 따라 고주파 신호의 현재 프레임의 시간 포락선 및 스펙트럼 포락선을 적응적으로 디코딩하는 단계를 포함할 수 있다.
도 8은 본 발명의 실시예 2에 따른 신호 디코딩 방법에 있어 적응형 디코딩의 개략도이다. 구체적으로, 디코딩 단에서, M1과 N1, M2와 N2의 값은 미리 설정될 수 있으며, 고주파 신호의 현재 프레임 유형이 과도 신호일 때는, M1과 N1의 값에 따라 할당된 비트에 따라 적응형 디코딩을 수행하고; 고주파 신호의 현재 프레임 유형이 비고도 신호일 때는, M2와 N2의 값에 따라 할당된 비트에 따라 적응형 디코딩을 수행한다. 다르게는, M1과 N1, M2와 N2의 값은 비트 스트림 내에 포함된 값으로부터 취득될 수 있으며, 그후 고주파 신호를 복원하기 위해, 고주파 신호의 현재 프레임 유형에 따라 고주파 신호의 시간 포락선 및 스펙트럼 포락선을 디코딩한다.
단계 405에서는, 고주파 신호를 적응적으로 디코딩하여 얻은 고주파 스펙트럼 신호에 대해 주파수 시간 변환 프로세스를 수행한다.
단계 406에서는, 고주파 신호가 비과도 신호인 경우, 고주파 신호에 대해 저역 통과 필터링 프로세스를 수행한다.
고주파 신호에 대해 저역 통과 필터링 프로세스를 수행하기 위해 저역 통과 필터를 사용할 수 있으며, 구체적으로 저역 통과 필터의 표현식은 다음과 같다:
Figure pat00001
저역 통과 필터링 프로세스를 통해, 저주파 부분의 에너지를 보증할 수 있고, 고주파 부분의 에너지를 약간 감소시킬 수 있어, 에러로 인해 도입인 노이즈를 더욱 감소시킨다.
단계 407에서는. 디코딩된 저주파 신호 및 고주파 신호를 포함하는 취득된 출력 신호와, 디코딩된 저주파 신호 및 고주파 신호를 합성하여 출력한다.
실시예 2에서는, 분류 결정 프로세스에 따라 고주파 신호를 적응적으로 디코딩한다. 이렇게 상이한 유형의 신호를 적응적으로 디코딩하므로 출력 고주파 신호의 품질이 향상된다. 한편, 분류 결정 프로세스의 결과에 따라 여기 신호를 결정하므로, 디코딩을 통해 취득된 고주파 신호가 인코딩 이전의 원래 고주파 신호에 더 가깝도록 할 수 있어, 출력 고주파 신호의 품질을 더욱 향상시킨다.
도 9는 본 발명의 실시예 3에 따른 신호 디코딩 방법에 있어 적응형 디코딩의 개략도이다. 도 9에 도시된 바와 같이, 실시예 3은 실시예 3의 신호 인코딩 방법에 대응할 수 있다. 디코딩 단에서, G. 722 디코더를 사용하여 저주파 신호를 디코딩하여 광대역 신호를 취득한다. 한편, 비트 스트림으로부터 분류 결정 프로세스의 결과를 취득하고, 이 분류 결정 프로세스의 결과에 따라 여기 신호를 선택하며, 상이한 유형의 고주파 신호에는 상인한 여기 신호를 사용한다. 분류 결정 프로세스의 결과에 따라, 비트를 할당하기 위해 M1=16, N1=16, 또는 M2=32, N2=0의 값을 선택하고, 할당된 비트를 사용하여 시간 포락선 및 스펙트럼 포락선을 디코딩함으로써, 고주파 신호를 복원한다.
구체적으로는, 고주파 신호가 과도 신호인 경우, 저주파의 정밀 구성을 더 잘 사용하기 위해 0 kHz 내지 6 kHz의 저주파 스펙트럼 신호를 여기 신호로 선택하고; 고주파 신호가 고조파 신호인 경우, 저주파의 정밀 구성을 더 잘 사용하기 위해 0 kHz 내지 6 kHz의 저주파 스펙트럼 신호를 여기 신호로 선택하고; 고주파 신호가 유사 노이즈 신호인 경우, 불규칙 노이즈를 여기 신호로 선택하고; 고주파 신호가 일반 신호인 경우, 고주파에서 너무 많은 고조파가 생성되는 것을 피하기 위해, 3 kHz 내지 6 kHz의 저주파를 8 kHz 내지 11 kHz 및 11 kHz 내지 14 kHz에 대한 스펙트럼으로 선택하여 여기 신호를 취득한다. 여기 신호를 선택하는 방법은 본 발명의 실시예로 한정되지 않으며, 여기 신호는 다른 방법을 사용하여 선택될 수도 있다.
도 10은 본 발명의 실시예 1에 따른 신호 인코딩 장치의 개략 구성도이다. 도 10에 도시된 바와 같이, 실시예 1은 코드 분류 모듈(12), 적응형 인코딩 모듈(13) 및 비트 스트림 출력 모듈(14)을 포함한다. 코드 분류 모듈(12)은 입력 신호 중 고주파 신호에 대해 분류 결정 프로세스를 수행한다. 적응형 인코딩 모듈(13)은 분류 결정 프로세스의 결과에 따라 고주파 신호를 적응적으로 인코딩한다. 비트 스트림 출력 모듈(14)은 입력 신호 중의 저주파 신호의 인코딩된 비트 스트림, 고주파 신호의 적응적으로 인코딩된 비트 스트림, 및 분류 결정 프로세스의 결과를 포함하는 인코딩된 비트 스트림을 출력한다.
도 11은 본 발명의 실시예 2에 따른 신호 인코딩 장치의 개략 구성도이다. 도 11에 도시된 바와 같이, 도 10에 도시된 실시예 1에 기초하여, 실시예 2에서, 코드 분류 모듈(12)은 신호 분석 유닛(12A), 및 유형 결정 유닛(12B)을 포함할 수 있다. 신호 분석 유닛(12A)은 고주파 신호의 파라미터를 계산한다. 유형 결정 유닛(12B)은 계산된 파라미터 및 결정 방식에 따라 고주파 신호의 현재 프레임 유형을 결정한다.
적응형 인코딩 모듈(13)은 비트 할당 유닛(13A) 및 적응형 인코딩 유닛(13B)를 포함할 수 있다. 비트 할당 유닛(13A)은 고주파 신호의 현재 프레임 유형에 따라 비트를 할당할 수 있다. 적응형 인코딩 유닛(13B)은 할당된 비트를 사용하여 고주파 신호의 현재 프레임의 시간 포락선 및 스펙트럼 포락선을 적응적으로 인코딩한다.
실시예 2는 분해 모듈(11)을 포함할 수 있으며, 이 분해 모듈(11)은 입력 신호를 분해하여 저주파 신호와 고주파 신호를 취득한다.
실시예 2는 정밀 인코딩 모듈(15)을 더 포함할 수 있으며, 이 정밀 인코딩 모듈(15)은 남은 비트를 사용하여 고주파 신호의 시간 포락선 및/또는 스펙트럼 포락선에 대해 정밀 양자화 인코딩을 수행하거나, 또는 저주파 신호에 대해 정밀 양자화 인코딩을 수행한다.
또, 실시예 2는 시간 주파수 변환 모듈(16), 저주파 신호 인코딩 모듈(17) 및 모드 인코딩 모듈(18)을 더 포함한다. 시간 주파수 변환 모듈(16)은 분해된 고주파 신호에 대해 시간 주파수 변환 프로세스를 수행한다. 저주파 신호 인코딩 모듈(17)은 저주파 신호를 인코딩하며, 구체적으로 저주파 신호 인코딩 모듈(17)은 G. 722 인코더일 수 있다. 모드 인코딩 모듈(18)은 분류 결정 프로세스의 결과를 인코딩한다.
실시예 2는 실시예 1 내지 실시예 4의 신호 인코딩 방법에 있어 신호를 인코딩하는 임의의 프로세스에 적용 가능하다.
실시예 2에서, 코드 분류 모듈(12)은 고주파 신호에 대해 분류 결정 프로세스를 수행하고, 적응형 인코딩 모듈(13)은 분류 결정 프로세스의 결과에 따라 적응형 인코딩을 수행하며; 이렇게, 상이한 유형의 신호를 적응적으로 인코딩하므로 보이스 및 오디오 출력 신호의 품질이 향상된다.
도 12는 본 발명의 실시예 1에 따른 신호 디코딩 장치의 개략 구성도이다. 도 12에 도시된 바와 같이, 실시예 1은 수신 모듈(21), 적응형 디코딩 모듈(22), 및 신호 취득 모듈(23)을 포함한다. 수신 모듈(21)은 저주파 신호의 코드, 고주파 신호의 적응형 코드, 및 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 수신한다. 적응형 디코딩 모듈(22)은 분류 결정 프로세스의 결과 및 결정된 여기 신호에 따라 고주파 신호를 적응적으로 디코딩한다. 신호 취득 모듈(23)은 디코딩된 저주파 신호 및 적응적으로 디코딩된 고주파 신호를 포함하는 출력 신호를 취득한다.
도 13은 본 발명의 실시예 2에 따른 신호 디코딩 장치의 개략 구성도이다. 도 13에 도시된 바와 같이, 도 12에 도시된 실시예 1에 기초하여, 적응형 디코딩 모듈(22)은 비트 할당 유닛(22A)와 적응형 디코딩 유닛(22B)를 포함한다. 비트 할당 유닛(22A)은 고주파 신호의 현재 프레임 유형에 따라 비트를 할당한다. 적응형 디코딩 유닛(22B)은 할당된 비트를 신호를 사용하여 선택된 여기 신호에 따라 고주파 신호의 현재 프레임의 시간 포락선 및 스펙트럼 포락선을 적응적으로 디코딩한다.
또, 실시예 2는 여기 선택 모듈(24)를 더 포함하고, 이 여기 선택 모듈(24)은 분류 결정 프로세스의 결과 및 디코딩된 저주파 신호에 따라 여기 신호를 결정한다.
실시예 2는 정밀 디코딩 모듈(25)을 더 포함할 수 있으며, 이 정밀 디코딩 모듈(25)은 남은 비트를 사용하여 고주파 신호의 시간 포락선 및/또는 스펙트럼 포락선에 대해 정밀 양자화 및 디코딩을 수행하거나, 또는 저주파 신호에 대해 정밀 양자화 및 디코딩을 수행한다.
실시예 2는 주파수 시간 변환 모듈(26) 및 저역 통과 필터링 모듈(27)을 더 포함한다. 주파수 시간 변환 모듈(26)은 적응적으로 디코딩된 고주파 스펙트럼 신호에 대해 주파수 시간 변환 프로세스를 수행한다. 고주파 신호가 비과도 신호일 때, 저역 통과 필터링 모듈(27)은 주파수 시간 변환 프로세스 이후에 고주파 신호에 대해 저역 통과 필터링 프로세스를 수행한다.
또, 실시예 2는 저주파 신호 디코딩 모듈(28)과 시간 주파수 변환 모듈(29)을 더 포함한다. 저주파 신호 디코딩 모듈(28)은 저주파 신호를 디코딩한다. 시간 주파수 변환 모듈(29)은 저주파 신호에 대해 시간 주파수 변환 프로세스를 수행한다.
실시예 2는 실시예 1 내지 실시예 3의 신호 디코딩 방법에 있어 신호를 디코딩하는 임의의 프로세스에 적용 가능하다.
실시예 2에서, 적응형 디코딩 모듈(22)은 분류 결정 프로세스의 결과에 따라 고주파 신호를 적응적으로 디코딩하며; 이렇게 하여, 상이한 유형의 신호를 적응적으로 디코딩하므로, 출력 고주파 신호의 품질이 향상된다. 여기 선택 모듈(24)은 분류 결정 프로세스의 결과에 따라 여기 신호를 선택하고, 이 여기 신호는 고주파 신호를 적응적으로 디코딩하도록 적응되어, 디코딩을 통해 취득된 고주파 신호가 인코딩 이전의 원래 고주파 신호에 더 가깝도록 할 수 있고, 출력 고주파 신호의 품질을 더욱 향상시킨다. 또, 고주파 신호가 비과도 신호일 때, 저역 통과 필터링 모듈(27)은 저역 통과 필터링 프로세스를 수행하여, 저주파 부분의 에너지를 보증할 수 있는 한편, 고주파 부분의 에너지를 약간 감소시킬 수 있으므로, 에러로 인해 도입인 노이즈를 더욱 감소시킨다.
도 14는 본 발명의 일 실시예에 따른 인코딩 및 디코딩 시스템의 개략 구성도이다. 도 14에 도시된 바와 같이, 본 실시예는 신호 인코딩 장치(31) 및 신호 디코딩 장치(32)를 포함한다.
신호 인코딩 장치(31)는 입력 신호 중 고주파 신호에 대해 분류 결정 프로세스를 수행하고, 분류 결정 프로세스의 결과에 따라 고주파 신호를 적응적으로 인코딩하고, 입력 신호 중 저주파 신호의 코드, 고주파 신호의 적응형 코드, 및 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 출력한다.
디코딩 장치(32)는 저주파 신호의 코드, 고주파 신호의 적응형 코드, 및 분류 결정 프로세스의 결과를 포함하는 비트 스트림을 수신하고, 분류 결정 프로세스의 결과 및 결정된 여기 신호에 따라 고주파 신호를 적응적으로 디코딩하고, 디코딩된 저주파 신호 및 적응적으로 디코딩된 고주파 신호를 포함하는 출력 신호를 취득한다.
본 실시예에서, 신호 인코딩 장치(31)는 본 발명의 임의의 실시예에서의 신호를 인코딩하는 임의의 장치일 수 있으며, 신호 디코딩 장치(32)는 본 발명의 임의의 실시예에서의 신호를 디코딩하는 임의의 장치일 수 있다.
해당 기술분야의 당업자라면, 본 발명의 실시예에 따른 방법의 단계 전부 또는 일부를 관련 하드웨어에 지시하는 프로그램으로 구현할 수 있다는 것을 알아야 한다. 이 프로그램은 컴퓨터로 판독 가능한 저장 매체에 저장될 수 있다. 이 프로그램은 실행될 때, 본 발명의 실시예에 따른 방법의 단계를 수행한다. 저장 매체는 판독 전용 메모리(ROM), 임의 접근 메모리(RAM), 자기 디스크, 및 광 디스크와 같은, 프로그램 코드를 저장할 수 있는 임의의 매체일 수 있다.
끝으로, 전술한 실시예는 본 발명의 기술적 해법을 설명하기 위해 제공된 것일 뿐이며, 본 발명을 한정하기 위한 것이 아님에 유의하여야 한다. 해당 기술분야의 당업자라면, 이상에서는 실시예와 관련하여 본 발명을 상세하게 설명하였지만, 변영 및 교체가 본 발명의 사상 및 범위를 벗어나지 않는 한, 실시예에 기재된 기술적 해법을 변형시킬 수 있거나, 기술적 해법에 있어 일부 기술적 특징을 등가물로 교체할 수 있다는 것을 알아야 한다.

Claims (23)

  1. 입력 신호 중 고주파 신호에 대해 분류 결정 프로세스를 수행하는 단계;
    상기 분류 결정 프로세스의 결과에 따라 상기 고주파 신호를 적응적으로 인코딩하는 단계; 및
    저주파 신호의 인코딩된 비트 스트림, 상기 고주파 신호의 적응적으로 인코딩된 비트 스트림, 및 상기 분류 결정 프로세스의 결과를 출력하는 단계
    를 포함하고,
    상기 분류 결정 프로세스는 상기 고주파 신호의 유형을 결정하는데 사용되고, 상기 고주파 신호의 유형은 과도 신호(transient signal) 또는 비과도 신호(non-transient signal)를 포함하는,
    신호 인코딩 방법.
  2. 제1항에 있어서,
    상기 입력 신호 중 고주파 신호에 대해 분류 결정 프로세스를 수행하는 단계는,
    상기 고주파 신호의 파라미터를 계산; 및
    상기 파라미터 및 결정 방식에 따라 상기 고주파 신호의 현재 프레임 유형을 결정하는 단계를 포함하는, 신호 인코딩 방법.
  3. 제2항에 있어서,
    상기 결정 방식은 상기 고주파 신호의 이전 프레임 유형 및 수 개 이전 프레임 유형의 가중치에 따라 동적으로 조정되는, 신호 인코딩 방법.
  4. 제2항에 있어서,
    상기 분류 결정 프로세스의 결과에 따라 상기 고주파 신호를 적응적으로 인코딩하는 단계는,
    상기 고주파 신호의 현재 프레임 유형에 따라 비트를 할당하는 단계; 및
    상기 할당된 비트를 사용하여, 상기 고주파 신호의 현재 프레임의 시간 포락선과 스펙트럼 포락선을 적응적으로 인코딩하는 단계를 포함하는, 신호 인코딩 방법.
  5. 제4항에 있어서,
    상기 고주파 신호의 현재 프레임 유형이 과도 신호이고, B1은 상기 과도 신호에 의해 사용된 모든 비트를 나타내고, M1은 상기 과도 신호의 시간 포락선에 의해 사용된 비트를 나타내고, N1은 상기 과도 신호의 스펙트럼 포락선에 의해 사용된 비트를 나타내는 경우, B1=M1+N1이며, M1은 N1과 같거나 크고;
    상기 고주파 신호의 현재 프레임 유형이 비과도 신호이고, B2는 상기 비과도 신호에 의해 사용된 모든 비트를 나타내고, M2는 상기 비과도 신호의 스펙트럼 포락선에 의해 사용된 비트를 나타내고, N2은 상기 비과도 신호의 시간 포락선에 의해 사용된 비트를 나타내는 경우, B2=M2+N2이며, M2은 N2과 같거나 큰, 신호 인코딩 방법.
  6. 제5항에 있어서,
    B는 할당된 비트를 나타내며, B=B1=B2인, 신호 인코딩 방법.
  7. 제5항에 있어서,
    B는 할당된 비트를 나타내며, B≥B1이고, B≥B2인, 신호 인코딩 방법.
  8. 제7항에 있어서,
    B와 B1의 차는 상기 고주파 신호의 시간 포락선 및/또는 스페트럼 포락선에 대한 정밀 양자화 인코딩의 수행에 사용되거나, 또는 상기 저주파 신호에 대한 정밀 양자화 인코딩의 수행에 사용되고;
    B와 B2의 차는 상기 고주파 신호의 스펙트럼 포락선 및/또는 시간 포락선에 대한 정밀 양자화 인코딩의 수행에 사용되거나, 또는 상기 저주파 신호에 대한 정밀 양자화 인코딩의 수행에 사용되는, 신호 인코딩 방법.
  9. 제5항에 있어서,
    M1과 N1의 값이 미리 설정되거나, M1과 N1 중 하나 이상의 값이 상기 인코딩된 비트 스트림에 부가되고;
    M2와 N2의 값이 미리 설정되거나, M2와 N2 중 하나 이상의 값이 상기 인코딩된 비트 스트림에 부가되는, 신호 인코딩 방법.
  10. 저주파 신호의 인코딩된 비트 스트림, 고주파 신호의 적응적으로 인코딩된 비트 스트림, 및 분류 결정 프로세스의 결과를 수신하는 단계;
    상기 분류 결정 프로세스의 결과 및 결정된 여기 신호에 따라 상기 고주파 신호를 적응적으로 디코딩하는 단계; 및
    디코딩된 저주파 신호 및 상기 적응적으로 디코딩된 고주파 신호를 포함하는 출력 신호를 취득하는 단계
    를 포함하고,
    상기 분류 결정 프로세스는 상기 고주파 신호의 유형을 결정하는데 사용되고, 상기 고주파 신호의 유형은 과도 신호(transient signal) 또는 비과도 신호(non-transient signal)를 포함하는,
    신호 디코딩 방법.
  11. 제10항에 있어서,
    상기 분류 결정 프로세스의 결과는 상기 고주파 신호의 현재 프레임 유형을 포함하고,
    상기 고주파 신호를 적응적으로 디코딩하는 단계는,
    상기 고주파 신호의 현재 프레임 유형에 따라 비트를 할당하는 단계; 및
    상기 할당된 비트를 사용하여, 결정된 여기 신호에 따라 상기 고주파 신호의 현재 프레임의 시간 포락선 및 스펙트럼 포락선을 적응적으로 디코딩하는 단계를 포함하는, 신호 디코딩 방법.
  12. 제11항에 있어서,
    상기 분류 결정 프로세스의 결과 및 상기 디코딩된 저주파 신호에 따라 상기 여기 신호를 결정하는 단계를 더 포함하는 신호 디코딩 방법.
  13. 제11항에 있어서,
    상기 할당 후 남은 비트를 사용하여, 상기 고주파 신호의 시간 포락선 및/또는 스펙트럼 포락선에 대해 정밀 양자화 및 디코딩을 수행하거나, 또는 상기 저주파 신호에 대해 정밀 양자화 및 디코딩을 수행하는 단계를 더 포함하는 신호 디코딩 방법.
  14. 제10항에 있어서,
    상기 고주파 신호를 적응적으로 디코딩하는 단계 이후에, 상기 고주파 신호를 적응적으로 디코딩하여 얻은 고주파 스펙트럼 신호에 대해 주파수 시간 변환 프로세스를 수행하는 단계를 더 포함하고;
    상기 고주파 신호가 비과도 신호인 경우, 상기 주파수 시간 변환 프로세스 이후에 상기 고주파 신호에 대해 저역 통과 필터링 프로세스를 수행하는 단계를 더 포함하는 신호 디코딩 방법.
  15. 입력 신호 중 고주파 신호에 대해 분류 결정 프로세스를 수행하도록 구성된 코드 분류 모듈;
    상기 분류 결정 프로세스의 결과에 따라 상기 고주파 신호를 적응적으로 인코딩하도록 구성된 적응형 인코딩 모듈; 및
    상기 입력 신호 중의 저주파 신호의 코드, 상기 고주파 신호의 적응형 코드, 및 상기 분류 결정 프로세스의 결과를 포함하는 인코딩된 비트 스트림을 출력하도록 구성된 비트 스트림 출력 모듈
    을 포함하고,
    상기 분류 결정 프로세스는 상기 고주파 신호의 유형을 결정하는데 사용되고, 상기 고주파 신호의 유형은 과도 신호(transient signal) 또는 비과도 신호(non-transient signal)를 포함하는,
    신호 인코딩 장치.
  16. 제15항에 있어서,
    상기 코드 분류 모듈은,
    상기 고주파 신호의 파라미터를 계산하도록 구성된 신호 분석 유닛; 및
    상기 파라미터 및 결정 방식에 따라 상기 고주파 신호의 현재 프레임 유형을 결정하도록 구성된 유형 결정 유닛을 포함하는, 신호 인코딩 장치.
  17. 제16항에 있어서,
    상기 적응형 인코딩 모듈은,
    상기 고주파 신호의 현재 프레임 유형에 따라 비트를 할당하도록 구성된 비트 할당 유닛; 및
    상기 할당된 비트를 사용하여, 상기 고주파 신호의 현재 프레임의 시간 도메인 포락선 및 주파수 도메인 포락선을 적응적으로 인코딩하도록 구성된 적응형 인코딩 유닛을 포함하는, 신호 인코딩 장치.
  18. 제17항에 있어서,
    상기 할당 후 남은 비트를 사용하여, 상기 고주파 신호의 시간 도메인 포락선 및/또는 주파수 도메인 포락선에 대해 정밀 양자화 인코딩을 수행하거나, 또는 상기 저주파 신호에 대해 정밀 양자화 인코딩을 수행하는 정밀 양자화 인코딩 모듈을 더 포함하는 신호 인코딩 장치.
  19. 저주파 신호의 코드, 고주파 신호의 적응형 코드, 및 분류 결정 프로세스의 결과를 포함하는 인코딩된 비트 스트림을 수신하도록 구성된 수신 모듈;
    상기 분류 결정 프로세스의 결과 및 결정된 여기 신호에 따라 상기 고주파 신호를 적응적으로 디코딩하도록 구성된 적응형 디코딩 모듈; 및
    디코딩된 저주파 신호 및 상기 적응적으로 디코딩된 고주파 신호를 포함하는 출력 신호를 취득하도록 구성된 신호 취득 모듈
    을 포함하고,
    상기 분류 결정 프로세스는 상기 고주파 신호의 유형을 결정하는데 사용되고, 상기 고주파 신호의 유형은 과도 신호(transient signal) 또는 비과도 신호(non-transient signal)를 포함하는,
    신호 디코딩 장치.
  20. 제19항에 있어서,
    상기 적응형 디코딩 모듈은,
    상기 고주파 신호의 현재 프레임 유형에 따라 비트를 할당하도록 구성된 비트 할당 유닛; 및
    상기 할당된 비트를 사용하여, 선택된 여기 신호에 따라 상기 고주파 신호의 현재 프레임의 시간 도메인 포락선 및 주파수 도메인 포락선을 적응적으로 디코딩하도록 구성된 적응형 디코딩 유닛을 포함하는, 신호 디코딩 장치.
  21. 제20항에 있어서,
    상기 분류 결정 프로세스의 결과 및 상기 디코딩된 저주파 신호에 따라 여기 신호를 결정하도록 구성된 여기 선택 모듈을 더 포함하는 신호 디코딩 장치.
  22. 제20항에 있어서,
    상기 할당 후 남은 비트를 사용하여, 상기 고주파 신호의 시간 도메인 포락선 및/또는 주파수 도메인 포락선에 대해 정밀 양자화 디코딩을 수행하거나, 또는 상기 저주파 신호에 대해 정밀 양자화 디코딩을 수행하도록 구성된 정밀 양자화 디코딩 모듈을 더 포함하는 신호 디코딩 장치.
  23. 제19항에 있어서,
    상기 고주파 신호를 적응적으로 디코딩하여 얻은 고주파 스펙트럼 신호에 대해 주파수 시간 변환 프로세스를 수행하도록 구성된 주파수 시간 변환 모듈; 및
    상기 고주파 신호가 비과도 신호일 때, 상기 주파수 시간 변환 프로세스 이후에 상기 고주파 신호에 대해 저역 통과 필터링 프로세스를 수행하도록 구성된 저역 통과 필터링 모듈
    을 더 포함하는 신호 디코딩 장치.
KR1020137002434A 2008-12-10 2009-11-20 신호 인코딩 및 디코딩 방법, 장치 및 시스템 KR101341078B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200810239451.5 2008-12-10
CN2008102394515A CN101751926B (zh) 2008-12-10 2008-12-10 信号编码、解码方法及装置、编解码系统
PCT/CN2009/075053 WO2010066158A1 (zh) 2008-12-10 2009-11-20 信号编码、解码方法及装置、编解码系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020117012587A Division KR101311396B1 (ko) 2008-12-10 2009-11-20 신호 인코딩 및 디코딩 방법, 장치 및 시스템

Publications (2)

Publication Number Publication Date
KR20130019019A true KR20130019019A (ko) 2013-02-25
KR101341078B1 KR101341078B1 (ko) 2013-12-11

Family

ID=42242339

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020117012587A KR101311396B1 (ko) 2008-12-10 2009-11-20 신호 인코딩 및 디코딩 방법, 장치 및 시스템
KR1020137002434A KR101341078B1 (ko) 2008-12-10 2009-11-20 신호 인코딩 및 디코딩 방법, 장치 및 시스템

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020117012587A KR101311396B1 (ko) 2008-12-10 2009-11-20 신호 인코딩 및 디코딩 방법, 장치 및 시스템

Country Status (7)

Country Link
US (1) US8135593B2 (ko)
EP (7) EP3223276B1 (ko)
JP (6) JP5249426B2 (ko)
KR (2) KR101311396B1 (ko)
CN (1) CN101751926B (ko)
ES (3) ES2779848T3 (ko)
WO (1) WO2010066158A1 (ko)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763856B (zh) * 2008-12-23 2011-11-02 华为技术有限公司 信号分类处理方法、分类处理装置及编码系统
CN102339607A (zh) * 2010-07-16 2012-02-01 华为技术有限公司 一种频带扩展的方法和装置
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
CN102737636B (zh) * 2011-04-13 2014-06-04 华为技术有限公司 一种音频编码方法及装置
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
WO2013062392A1 (ko) 2011-10-27 2013-05-02 엘지전자 주식회사 음성 신호 부호화 방법 및 복호화 방법과 이를 이용하는 장치
CN102522092B (zh) * 2011-12-16 2013-06-19 大连理工大学 一种基于g.711.1的语音带宽扩展的装置和方法
WO2013141638A1 (ko) 2012-03-21 2013-09-26 삼성전자 주식회사 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치
JP6200034B2 (ja) * 2012-04-27 2017-09-20 株式会社Nttドコモ 音声復号装置
CN106847297B (zh) 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
PL2951815T3 (pl) 2013-01-29 2018-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodery audio, dekodery audio, systemy, sposoby i programy komputerowe wykorzystujące zwiększoną rozdzielczość czasową w otoczeniu czasowym początków lub końców spółgłosek szczelinowych lub spółgłosek zwarto-szczelinowych
CN103971694B (zh) 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
US9489959B2 (en) 2013-06-11 2016-11-08 Panasonic Intellectual Property Corporation Of America Device and method for bandwidth extension for audio signals
ES2901806T3 (es) * 2013-12-02 2022-03-23 Huawei Tech Co Ltd Método y aparato de codificación
JP6383000B2 (ja) * 2014-03-03 2018-08-29 サムスン エレクトロニクス カンパニー リミテッド 帯域幅拡張のための高周波復号方法及びその装置
CN106463133B (zh) 2014-03-24 2020-03-24 三星电子株式会社 高频带编码方法和装置,以及高频带解码方法和装置
EP3067889A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
US9916836B2 (en) * 2015-03-23 2018-03-13 Microsoft Technology Licensing, Llc Replacing an encoded audio output signal
US11087774B2 (en) * 2017-06-07 2021-08-10 Nippon Telegraph And Telephone Corporation Encoding apparatus, decoding apparatus, smoothing apparatus, inverse smoothing apparatus, methods therefor, and recording media
US11025964B2 (en) 2019-04-02 2021-06-01 Wangsu Science & Technology Co., Ltd. Method, apparatus, server, and storage medium for generating live broadcast video of highlight collection
CN109862388A (zh) * 2019-04-02 2019-06-07 网宿科技股份有限公司 直播视频集锦的生成方法、装置、服务器及存储介质
CN113470667A (zh) * 2020-03-11 2021-10-01 腾讯科技(深圳)有限公司 语音信号的编解码方法、装置、电子设备及存储介质
CN112904724B (zh) * 2021-01-19 2023-04-07 中国人民大学 基于误差自适应编解码迭代学习控制信息传输系统和方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3802219B2 (ja) * 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
KR100949232B1 (ko) * 2002-01-30 2010-03-24 파나소닉 주식회사 인코딩 장치, 디코딩 장치 및 그 방법
TW594674B (en) * 2003-03-14 2004-06-21 Mediatek Inc Encoder and a encoding method capable of detecting audio signal transient
BRPI0409327B1 (pt) * 2003-04-17 2018-02-14 Koninklijke Philips N.V. Dispositivo para gerar um sinal de áudio de saída com base em um sinal de aúdio de entrada, método para prover um sinal de áudio de saída com base em um sinal de áudio de entrada e aparelho para fornecer um sinal de áudio de saída
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
JP4767687B2 (ja) * 2003-10-07 2011-09-07 パナソニック株式会社 スペクトル包絡線符号化のための時間境界及び周波数分解能の決定方法
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
DE102005032724B4 (de) 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
JP2007025290A (ja) * 2005-07-15 2007-02-01 Matsushita Electric Ind Co Ltd マルチチャンネル音響コーデックにおける残響を制御する装置
KR20070037945A (ko) * 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
KR20070077652A (ko) 2006-01-24 2007-07-27 삼성전자주식회사 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8010352B2 (en) * 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
CN101145345B (zh) * 2006-09-13 2011-02-09 华为技术有限公司 音频分类方法
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
KR100883656B1 (ko) * 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치

Also Published As

Publication number Publication date
EP3223276A1 (en) 2017-09-27
JP2020190755A (ja) 2020-11-26
EP4283616A3 (en) 2024-02-21
ES2440753T3 (es) 2014-01-30
ES2779848T3 (es) 2020-08-20
JP6937877B2 (ja) 2021-09-22
JP6158861B2 (ja) 2017-07-05
EP2367168A4 (en) 2012-04-18
JP2015180960A (ja) 2015-10-15
EP2367168B1 (en) 2013-10-16
KR20110091738A (ko) 2011-08-12
EP3686886B1 (en) 2022-05-11
EP2998957A1 (en) 2016-03-23
ES2628008T3 (es) 2017-08-01
JP6400790B2 (ja) 2018-10-03
KR101311396B1 (ko) 2013-09-25
JP2013174899A (ja) 2013-09-05
EP3223276B1 (en) 2020-01-08
EP2650876B1 (en) 2016-02-10
EP4071755B1 (en) 2024-01-03
JP5249426B2 (ja) 2013-07-31
JP2019003206A (ja) 2019-01-10
EP2367168A1 (en) 2011-09-21
US8135593B2 (en) 2012-03-13
KR101341078B1 (ko) 2013-12-11
EP4283616A2 (en) 2023-11-29
JP6752854B2 (ja) 2020-09-09
EP2998957B1 (en) 2017-04-19
JP2017151486A (ja) 2017-08-31
WO2010066158A1 (zh) 2010-06-17
JP2012511731A (ja) 2012-05-24
EP2650876A1 (en) 2013-10-16
EP3686886A1 (en) 2020-07-29
CN101751926A (zh) 2010-06-23
EP4071755A1 (en) 2022-10-12
US20110194598A1 (en) 2011-08-11
CN101751926B (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
KR101341078B1 (ko) 신호 인코딩 및 디코딩 방법, 장치 및 시스템
JP6558745B2 (ja) 符号化/復号化方法および符号化/復号化デバイス
KR101221918B1 (ko) 신호 처리 방법 및 장치
KR101693280B1 (ko) 오디오 데이터 처리 방법, 장치 및 시스템
JP2004522198A (ja) 音声符号化方法
JP2008015281A (ja) 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
US10607624B2 (en) Signal codec device and method in communication system
KR20190060887A (ko) 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템
JP5459688B2 (ja) 復号信号のスペクトルを調整する方法、装置、および音声復号システム
KR101248535B1 (ko) 배경 노이즈 생성 방법 및 노이즈 처리 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161123

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171114

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20181121

Year of fee payment: 6