KR102271852B1 - 광대역 신호 생성방법 및 장치와 이를 채용하는 기기 - Google Patents

광대역 신호 생성방법 및 장치와 이를 채용하는 기기 Download PDF

Info

Publication number
KR102271852B1
KR102271852B1 KR1020130132623A KR20130132623A KR102271852B1 KR 102271852 B1 KR102271852 B1 KR 102271852B1 KR 1020130132623 A KR1020130132623 A KR 1020130132623A KR 20130132623 A KR20130132623 A KR 20130132623A KR 102271852 B1 KR102271852 B1 KR 102271852B1
Authority
KR
South Korea
Prior art keywords
band
signal
narrowband
narrow
highband
Prior art date
Application number
KR1020130132623A
Other languages
English (en)
Other versions
KR20150051301A (ko
Inventor
주기현
강상원
성호상
오은미
전종근
이아성
Original Assignee
삼성전자주식회사
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사, 한양대학교 산학협력단 filed Critical 삼성전자주식회사
Priority to KR1020130132623A priority Critical patent/KR102271852B1/ko
Priority to US15/033,834 priority patent/US10373624B2/en
Priority to PCT/KR2014/010456 priority patent/WO2015065137A1/ko
Publication of KR20150051301A publication Critical patent/KR20150051301A/ko
Application granted granted Critical
Publication of KR102271852B1 publication Critical patent/KR102271852B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

광대역 신호 생성방법은 적어도 두가지 매핑을 결합하여, 복원된 협대역 신호로부터 고대역 스펙트럼 파라미터를 추정하는 단계; 상기 복원된 협대역 신호에 대하여 고대역 여기신호를 추정하는 단계; 추정된 상기 고대역 스펙트럼 파라미터와 추정된 상기 고대역 여기신호를 이용하여 고대역 신호를 생성하는 단계; 및 상기 복원된 협대역 신호와 상기 고대역 신호를 합성하여 광대역 신호를 생성하는 단계를 포함할 수 있다.

Description

광대역 신호 생성방법 및 장치와 이를 채용하는 기기 {Method and apparatus for generating wideband signal and device employing the same}
본 발명은 신호의 복호화에 관한 것으로서, 좀 더 구체적으로는 협대역 비트스트림으로부터 광대역 신호를 생성하는 방법 및 장치, 및 이를 채용하는 기기에 관한 것이다.
대부분 음성 통신 시스템에서, 대역폭은 0.3 ~ 3.4 kHz로 제한되어 있다. 음성 대역은 유성음과 무성음을 포함하는데, 대역폭의 제한으로 인하여 원음보다 음질이 떨어지게 된다. 이러한 음질 저하 현상을 억제하기 위해서 광대역 음성 수신 장치가 제안되었다. 대역폭이 0.05 ~ 7 kHz인 광대역 음성은 유/무성음을 포함한 모든 음성 대역을 커버할 수 있을 뿐만 아니라, 협대역 음성과 비교하여 자연성과 명료성을 증대시킬 수 있다. 그러나, 공중회선 교환 전화망(PSTN), 인터넷 전화(VoIP, VoWiFi) 및 모바일 기기에 탑재되어 있는 음성관련 어플리케이션과 같은 음성 통신 응용에서는 여전히 협대역 음성코덱으로 서비스되고 있기 때문에 코덱을 광대역 코덱으로 교체하는 데에는 시간 및 비용 측면에서 큰 부담이 되고 있다.
이러한 측면에서 복호화기에서 수신된 협대역 신호로부터 광대역 신호를 얻기 위하여 다양한 대역확장 기법이 제안되었다. 대역확장 기법의 일예로는, 고대역에 대한 추가 비트를 할당하는 방법, 예를 들면 가이디드 대역확장(guided bandwidth extension)이 있다. 이는 부가정보를 비트스트림에 포함시키는 방식으로서, 부호화기로부터 전송되는 부호화 정보를 이용하여, 음성대역을 확장한다. 부호화기는 음성신호를 분석하여 고대역 신호를 위한 부가정보를 생성해서 전송하며, 복호화기는 전송된 부가정보와 저대역 신호를 바탕으로 고대역 신호를 생성한다. 대역확장 기법의 다른 예로는, 추가비트 할당없이 복호화기에서 저대역 신호로부터 고대역 신호를 생성하는 방법, 예를 들면 블라인드 대역확장(blind bandwidth extension)이 있다. 이를 위하여 HMM(Hidden Markov Model) 및 GMM(Gaussian mixture model) 등과 같은 패턴인식 기법을 이용한 추정을 통한 방식들이 제안되었다. 그러나, 패턴인식은 트레이닝 과정을 필요로 하며 사용되는 언어에 따라 성능이 달라질 수 있다. 또한, 예측 또는 추정시 연산량이 매우 증가하여 실시간으로 수신되는 음성 신호를 빠르고 효과적으로 처리하기 어렵고, 추가 비트 할당없이 생성되는 고대역 신호의 음질은 다소 떨어지는 것이 일반적이다.
최근에는 대역확장 기법을 적용하더라도, 현존하는 통신 시스템 즉, 텔레포니 시스템이나 수신측에서 사용되는 복호화기의 기본 구조를 변경하지 않고서, 과도한 복잡도 증가없이 협대역 신호로부터 개선된 음질의 광대역 신호 혹은 초광대역 신호를 사용자에게 제공할 필요성이 증가하는 추세이다.
본 발명의 기술적 과제는 블라인드 대역확장을 이용하여 협대역 비트스트림으로부터 광대역 신호를 생성하는 방법 및 장치, 및 이를 채용하는 기기를 제공하는데 있다.
본 발명의 일실시 형태는 광대역 신호 생성방법으로서, 적어도 두가지 매핑방식을 결합하여, 복원된 협대역 신호로부터 고대역 스펙트럼 파라미터를 추정하는 단계; 상기 복원된 협대역 신호에 대하여 고대역 여기신호를 추정하는 단계; 추정된 상기 고대역 스펙트럼 파라미터와 추정된 상기 고대역 여기신호를 이용하여 고대역 신호를 생성하는 단계; 및 상기 복원된 협대역 신호와 상기 고대역 신호를 합성하여 광대역 신호를 생성하는 단계를 포함할 수 있다.
본 발명의 다른 실시 형태는 광대역 신호 생성방법으로서, 복원된 협대역 신호를 이용하여 고대역 스펙트럼 파라미터를 추정하는 단계; 상기 복원된 협대역 신호에 대하여 화이트닝 처리를 수행하고, 화이트닝된 신호를 이용하여 고대역 여기신호를 추정하는 단계; 추정된 상기 고대역 스펙트럼 파라미터와 추정된 상기 고대역 여기신호를 이용하여 고대역 신호를 생성하는 단계; 및 상기 복원된 협대역 신호와 상기 고대역 신호를 합성하여 광대역 신호를 생성하는 단계를 포함할 수 있다.
본 발명의 다른 실시 형태는 광대역 신호 생성장치로서, 적어도 두가지 매핑방식을 결합하여, 복원된 협대역 신호로부터 고대역 스펙트럼 파라미터를 추정하고, 상기 복원된 협대역 신호에 대하여 고대역 여기신호를 추정하여 고대역 신호를 생성하는 고대역 생성부; 및 상기 복원된 협대역 신호와 상기 고대역 신호를 합성하여 광대역 신호를 생성하는 합성부를 포함할 수 있다.
본 발명의 다른 실시 형태는 광대역 신호 생성장치로서, 복원된 협대역 신호를 이용하여 고대역 스펙트럼 파라미터를 추정하고, 상기 복원된 협대역 신호에 대하여 화이트닝 처리를 수행하고, 화이트닝된 신호를 이용하여 고대역 여기신호를 추정하여 고대역 신호를 생성하는 고대역 생성부; 및 상기 복원된 협대역 신호와 상기 고대역 신호를 합성하여 광대역 신호를 생성하는 합성부를 포함할 수 있다.
협대역을 지원하는 통신 시스템 즉, 텔레포니 시스템이나 수신측에서 사용되는 복호화기의 기본 구조를 변경하지 않고서, 과도한 복잡도 증가없이 협대역 신호로부터 개선된 음질의 광대역 신호 혹은 초광대역 신호를 사용자에게 제공할 수 있다. 또한, 부호화기로부터 제공되는 비트스트림에 대역 확장을 위한 추가 비트가 포함될 필요가 없으므로 낮은 비트레이트의 네트워크에 더욱 적합할 수 있다. 또한, 사용자의 조작에 따라서 혹은 협대역신호의 특성에 따라서 대역확장 처리가 선택되독 수행됨으로써 협대역 신호 혹은 광대역 신호가 선택적으로 제공될 수 있다.
도 1은 일실시 형태에 따른 광대역 신호 생성장치의 구성을 나타낸 블록도이다.
도 2는 다른 실시 형태에 따른 광대역 신호 생성장치의 구성을 나타낸 블록도이다.
도 3은 다른 실시 형태에 따른 광대역 신호 생성장치의 구성을 나타낸 블록도이다.
도 4는 일실시 형태에 따른 고대역 생성 모듈의 구성을 나타낸 블록도이다.
도 5는 도 4에 도시된 고대역 생성모듈에서 일실시 형태에 따른 스펙트럼 파라미터 추정부의 구성을 나타낸 블럭도이다.
도 6는 도 4에 도시된 고대역 생성모듈에서 일실시 형태에 따른 여기 추정부의 구성을 나타낸 블럭도이다.
도 7은 일실시 형태에 따른 합성모듈의 구성을 나타낸 블럭도이다.
도 8은 도 5에 도시된 스펙트럼 파라미터 추정모듈의 동작을 설명하기 위한 도면이다.
도 9는 여기신호와 화이트닝된 여기신호를 비교한 파형도이다.
도 10a 및 도 10b는 기존의 여기신호를 이용하여 블라인드 대역확장을 수행한 결과와 화이트닝된 여기신호를 이용하여 블라인드 대역확장을 수행한 결과를 각각 나타낸 파형도이다.
도 11은 일실시 형태에 따른 광대역 신호 생성방법의 동작을 설명하는 흐름도이다.
도 12는 본 발명의 일실시예에 따른 멀티미디어 기기의 구성을 나타낸 블록도이다.
도 13은 본 발명의 다른 실시예에 따른 멀티미디어 기기의 구성을 나타낸 블록도이다.
이하, 도면을 참조하여 본 발명의 실시 형태에 대하여 구체적으로 설명하기로 한다. 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략하기로 한다.
어떤 구성요소가 다른 구성요소에 연결되어 있다거나 접속되어 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있으나, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로 사용될 수 있다.
신호는 값(value), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 포함하는 용어로서, 경우에 따라 의미는 달리 해석될 수 있고 혼용되어 사용될 수 있다.
'부'(unit)라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, '부'는 서로 다른 특징적인 기능들을 수행할 수 있다. 그러나, '부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '부'는 어드레싱할 수 있는 저장 매체에 있도록 구성되거나, 적어도 하나의 프로세서가 동작되도록 구성될 수 있다. 따라서, '부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함할 수 있다. 구성요소들과 '부'들안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '부'들로 분리되거나 추가적인 구성요소들과 '부'들로 결합될 수 있다.
도 1은 일실시 형태에 따른 광대역 신호 생성장치의 구성을 나타낸 블록도이다.
도 1에 도시된 광대역 신호 생성장치는 협대역 복호화부(110), 고대역 생성부(130) 및 합성부(150)를 포함할 수 있다. 여기서, 협대역 복호화부(110), 고대역 생성부(130) 및 합성부(150)가 모두 하나의 기기에 포함될 수 있다. 한편, 협대역 복호화부(110)는 제1 기기에, 고대역 생성부(130)와 합성부(150)는 제2 기기에 포함될 수 있다. 제1 기기로는 신호 복호화 모듈을 내장하는 모바일 기기와 같은 멀티미디어 기기 등을 예로 들 수 있다. 제2 기기로는 멀티미디어 기기에 접속될 수 있는 헤드셋 혹은 외장 스피커 등을 예로 들 수 있다. 하나의 기기에 포함된 구성요소들은 하나의 모듈로 일체화되어 프로세서로 구현될 수 있다. 여기서, 신호는 오디오 신호 혹은 스피치 신호, 혹은 오디오와 스피치의 혼합신호를 의미할 수 있으며, 이하 설명의 편의를 위하여 스피치 신호를 사용하기로 한다. 한편, 통상적으로 협대역은 0.3 ~ 3.4 KHz, 고대역은 3.4 ~ 7 KHz 를 의미할 수 있으나 고정되는 주파수 범위는 아니며, 네트워크 조건, 기기의 성능 혹은 원하는 품질 등의 여러가지 파라미터간의 트레이드-오프를 통하여 가변적으로 설정될 수 있다. 한편, 광대역은 협대역과 고대역을 포함하는 주파수 범위일 수 있다. 필요에 따라서 초광대역까지 확장되도록 구현될 수 있다.
도 1을 참조하면, 협대역 복호화부(110)는 협대역 비트스트림에 대하여 복호화를 수행하여 복원된 협대역 신호를 생성할 수 있다. 협대역 비트스트림은 네트워크를 통하여 제공되거나, 저장매체로부터 제공될 수 있다. 협대역 복호화부(110)는 협대역 비트스트림에 적용된 코덱 알고리즘에 대응되도록 구현될 수 있다. 예를 들어, 협대역 복호화부(110)는 표준화된 알고리즘 혹은 다른 코덱 알고리즘을 적용할 수 있으며, 바람직하게로는 분석-합성 구조(Analysis-by-Synthesis)에 기반한 코덱 알고리즘을 적용할 수 있다. 분석-합성 구조에 포함되는 분석 모듈의 전달함수와 합성 모듈의 전달함수는 서로 역의 관계가 성립할 수 있다. 분석-합성 구조에 기반한 코덱 알고리즘의 대표적인 예로는 CELP(code-excited linear prediction)를 들 수 있으며, 다른 예로는 ACELP(Algebraic CELP), RCELP(Relaxed CELP), VSELP(Vector-Sum Excited Linear Prediction), MELP((Mixed Excitation Linear Prediction), RPE(Regular Pulse Excitation), MPE(Multi Pulse Excitation)이 있으나, 이에 한정되는 것은 아니다. 관련된 코덱 알고리즘들은 MBE(Multi-Band Excitation) 및/또는 PWI(Prototype Waveform Interpolation) 방식을 포함할 수 있다.
고대역 생성부(130)는 협대역 복호화부(110)로부터 제공되는 복원된 협대역 신호를 이용하여 고대역 생성에 필요한 확장 파라미터들을 추정하고, 추정된 확장 파라미터들을 이용하여 고대역 신호를 생성할 수 있다. 여기서, 확장 파라미터들의 예로는 스펙트럼 파라미터와 여기신호를 들 수 있다. 스펙트럼 파라미터의 예로는 엔벨로프 신호, 에너지 레벨 혹은 게인 중 적어도 하나 이상을 들 수 있고, 여기신호는 레지듀얼 신호 혹은 레지듀얼 에러 신호일 수 있다. 고대역 생성부(130)의 구체적인 구성 및 동작에 대해서는 후술하기로 한다.
합성부(150)는 협대역 복호화부(110)로부터 제공되는 복원된 협대역 신호와 고대역 생성부(130)로부터 제공된 고대역 신호를 합성하여 광대역 신호를 생성할 수 있다.
도 2는 다른 실시 형태에 따른 광대역 신호 생성장치의 구성을 나타낸 블록도이다.
도 2에 도시된 광대역 신호 생성장치는 신호분류부(200), 협대역 복호화부(210), 고대역 생성부(230) 및 합성부(250)를 포함할 수 있다. 도 1에서와 마찬가지로, 각 구성요소는 하나의 기기에 포함되거나, 설계 사양에 따라서 서로 다른 기기에 포함될 수 있다. 도 1의 광대역 신호 생성장치와 다른 점은 신호 분류부(200)가 추가되어 신호 특성에 따라서 대역확장을 선택적으로 수행하는 것으로서, 중복된 구성요소에 대한 세부적인 설명은 생략하기로 한다.
도 2를 참조하면, 신호분류부(200)는 협대역 비트스트림 혹은 복원된 협대역 신호를 분석하여 유성음 구간과 나머지 구간, 예를 들면 무성음 구간으로 분류할 수 있다. 여기서, 유성음 구간과 무성음 구간을 분류하기 위해서는 공지된 다양한 방식을 사용할 수 있으며, 예를 들면 경사도(gradient), 스펙트럼 틸트(spectral tilt), 제로 크로싱 레이트(zero crossing rate) 등과 같은 파라미터를 적용할 수 있다.
일실시예에서는, 유성음 구간과 무성음 구간에 대하여 선택적으로 대역확장이 수행되도록 구현할 수 있다. 즉, 유성음 구간에 대하여 대역확장을 수행하고, 무성음 구간에 대해서는 대역확장을 수행하지 않을 수 있다. 실시예에 따르면, 무성음 구간에 대해서는 고대역에 0을 채우거나, 미리 설정된 노이즈 성분을 채울 수 있다. 신호 분류부(200)는 유성음 구간의 경우 고대역 생성부(230)를 동작시키는 인에이블 신호를 고대역 생성부(230)로 제공할 수 있다. 다른 실시예에 따르면, 신호 분류부(200)는 유성음 구간 혹은 무성음 구간에 따라서 경우 협대역 복호화부(210)에서 복원된 협대역 신호를 고대역 생성부(230)로 제공할지 여부를 결정할 수 있다.
고대역 생성부(230)는 협대역 신호의 유성음 구간에 대하여, 협대역 복호화부(110)로부터 제공되는 복원된 협대역 신호를 이용하여 고대역 생성에 필요한 확장 파라미터들을 추정하고, 추정된 확장 파라미터들을 이용하여 고대역 신호를 생성할 수 있다.
합성부(250)는 협대역 복호화부(210)로부터 제공되는 복원된 협대역 신호와 고대역 생성부(230)로부터 제공된 고대역 신호를 합성하여 광대역 신호를 생성할 수 있다.
도 3은 다른 실시 형태에 따른 광대역 신호 생성장치의 구성을 나타낸 블록도이다.
도 3에 도시된 광대역 신호 생성장치는 협대역 복호화부(310), 스위칭부(320), 고대역 생성부(330) 및 합성부(350)를 포함할 수 있다. 도 1에서와 마찬가지로, 각 구성요소는 하나의 기기에 포함되거나, 설계 사양에 따라서 서로 다른 기기에 포함될 수 있다. 도 1 혹은 도 2의 광대역 신호 생성장치와 다른 점은 스위칭부(320)가 추가되어 사용자 조작에 의해 발생되는 스위칭 신호에 따라서 대역확장 수행 여부를 결정하는 것으로서, 중복된 구성요소에 대한 세부적인 설명은 생략하기로 한다.
도 3을 참조하면, 스위칭부(320)는 스위칭 신호에 따라서 협대역 복호화부(310)로부터 복원된 협대역 신호를 고대역 생성부(330)에 제공할 수 있다. 여기서, 스위칭 신호는 협대역 신호와 광대역 신호 중 어느 것을 청취할지에 대한 결정에 따라서 사용자가 스위치(미도시) 혹은 버튼(미도시)를 조작함으로써 발생될 수 있다.
고대역 생성부(330)는 스위칭부(320)를 통하여 제공되는 협대역 복호화부(310)로부터 복원된 협대역 신호를 이용하여 고대역 생성에 필요한 확장 파라미터들을 추정하고, 추정된 확장 파라미터들을 이용하여 고대역 신호를 생성할 수 있다.
합성부(350)는 협대역 복호화부(310)로부터 제공되는 복원된 협대역 신호와 고대역 생성부(330)로부터 제공된 고대역 신호를 합성하여 광대역 신호를 생성할 수 있다.
다른 실시예에 따르면, 고대역 생성부(330)에 항상 협대역 복호화부(310)로부터 복원된 협대역 신호가 제공되도록 구현한 경우, 사용자 조작에 의해 스위칭 신호가 발생되면 고대역 생성부(330)가 동작되도록 설계할 수 있다.
도 4는 일실시 형태에 따른 고대역 생성 모듈의 구성을 나타낸 블록도로서, 도 1 내지 도 3에 도시된 고대역 생성부(130, 230, 330)에 대응될 수 있다.
도 4에 도시된 고대역 생성모듈은 분석-합성 구조(Analysis-by-Synthesis)에 기반하며, 제1 LP 분석부(410), 스펙트럼 파라미터 추정부(430), 제1 LPC 필터링부(450), 여기 추정부(470) 및 제1 LP 합성부(490)를 포함할 수 있다. 구성요소들은 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다. 제1 LP 분석부(410)의 전달함수와 제1 LP 합성부(490)의 전달함수는 서로 역의 관계가 성립될 수 있다.
도 4를 참조하면, 제1 LP 분석부(410)는 복원된 협대역 신호에 대하여 LP(Linear Prediction) 분석을 수행하여 협대역 LPC(Linear Prediction Coding) 계수를 생성할 수 있다.
스펙트럼 파라미터 추정부(430)는 제1 LP 분석부(410)로부터 제공되는 협대역 LPC 계수를 이용하여 고대역 스펙트럼 파라미터, 예를 들면 고대역 엔벨로프 신호를 추정할 수 있다. 구체적으로, 스펙트럼 파라미터 추정부(430)는 적어도 두가지의 매핑방식을 결합하여, 협대역 LPC 계수를 고대역 LPC 계수로 매핑함으로써, 고대역 엔벨로프 신호를 추정할 수 있다. 또한, 스펙트럼 파라미터 추정부(430)는 제1 LP 분석부(410)로부터 제공되는 협대역 LPC 계수 혹은 협대역 신호로부터 게인을 추정할 수 있다. 게인 추정은 공지된 다양한 방법으로 가능하다. 실시예에 따르면, 스펙트럼 파라미터 추정부(430)는 적어도 두가지, 예를 들면 코드북 매핑과 선형매핑을 결합하여 사용할 수 있다. LPC 계수는 효율적으로 양자화와 같은 처리를 수행하기 어렵기 때문에 일반적으로 다른 표현, 예를 들면 라인 스펙트럼 쌍(Line Spectrum Pair: LSP) 계수 혹은 라인 스펙트럼 주파수(Line Spectrum Frequency: LSF) 계수로 변환하여 사용될 수 있다. 또한, LPC 계수는 다른 표현, 예를 들면 파코어(parcor) 계수, 로그-면적비(log-area ratio) 값, 이미턴스 스펙트럼 쌍(Immittance Spectrum Pair) 계수 혹은 이미턴스 스펙트럼 주파수(Immittance Spectrum Frequency) 계수를 포함할 수 있다. 한편, LPC 계수 대신 켑스트럼 계수(cepstral coefficient)를 사용할 수도 있다.
제1 LPC 필터링부(450)는 복원된 협대역 신호로부터 제1 LP 분석부(410)로부터 제공되는 협대역 LPC 계수를 필터링하여 협대역 여기신호를 생성할 수 있다.
여기 추정부(470)는 제1 LPC 필터링부(450)로부터 제공되는 협대역 여기신호에 대하여 재차 LP 분석 및 LPC 필터링을 수행하여 화이트닝된 협대역 여기신호를 생성하고, 화이트닝된 협대역 여기신호를 이용하여 고대역 여기신호를 추정할 수 있다. 구체적으로, 화이트닝된 협대역 여기신호를 대응하는 고대역으로 쉬프팅하여 화이트닝된 고대역 여기신호를 생성하고, 협대역 여기신호에 대하여 LP 분석을 수행하여 협대역 여기 LPC 계수를 생성하고, 협대역 여기 LPC 계수를 대응하는 고대역 여기 LPC 계수로 선형 매핑시켜 고대역 여기 LPC 계수를 생성할 수 있다. 화이트닝된 고대역 여기신호와 고대역 여기 LPC 계수에 대하여 LP 합성을 수행하여 고대역 여기신호를 생성할 수 있다. 설명의 편의를 위하여 LSP 계수 대신 LPC 계수를 사용하고 있으나, 선형 매핑을 위하여 LSP 계수를 사용함이 바람직할 수 있다.
제1 LP 합성부(490)는 스펙트럼 파라미터 추정부(430)에서 추정된 고대역 스펙트럼 파라미터 예를 들면, 고대역 엔벨로프 신호와 여기 추정부(470)에서 추정된 고대역 여기신호에 대하여 LP 합성을 수행하여 고대역 신호를 생성할 수 있다.
도 5는 일실시 형태에 따른 스펙트럼 파라미터 추정모듈의 구성을 나타낸 블럭도로서, 도 4에 도시된 스펙트럼 파라미터 추정부(430)에 대응될 수 있다.
도 5에 도시된 스펙트럼 파라미터 추정모듈은 제1 변환부(510), 코드북 매핑부(530), 제1 선형 매핑부(550), 선택부(570) 및 제1 역변환부(590)를 포함할 수 있다. 여기서, 스펙트럼 파라미터 추정을 위하여 사용되는 계수에 따라서 제1 변환부(510)와 제1 역변환부(590)는 옵션으로 구비될 수 있다.
도 5를 참조하면, 제1 변환부(510)는 협대역 LPC 계수를 변환하여 협대역 LSP 계수를 생성하여, 코드북 매핑부(530)와 제1 선형 매핑부(550)로 제공할 수 있다.
코드북 매핑부(530)는 협대역 코드북과 대응하는 고대역 코드북을 이용하여 협대역 LSP 계수를 대응하는 고대역 LSP 계수로 매핑시켜 제1 확장된 스펙트럼 파라미터인 제1 고대역 LSP 계수 즉, 제1 고대역 코드워드를 생성할 수 있다. 협대역 코드북과 고대역 코드북은 인접한 코드워드들이 N개의 그룹으로 구성되도록 설계될 수 있다. 각 그룹은 동일한 수의 코드워드들을 포함할 수 있으나, 이에 한정되지는 않는다. 여기서, 인접한 코드워드는 주파수가 서로 유사한 코드워드 혹은 크기가 서로 유사한 코드워드를 의미할 수 있다.
제1 선형 매핑부(550)는 코드북 매핑부(530)에서 제공되는 매핑 결과에 근거하여, 협대역 LSP 계수를 선형 매트릭스를 이용하여 매핑하여 제2 확장된 스펙트럼 파라미터인 제2 고대역 LSP 계수 즉, 제2 고대역 코드워드를 생성할 수 있다. 여기서, 선형 매트릭스는 협대역 트레이닝 데이터와 고대역 트레이닝 데이터의 관계로부터 얻어질 수 있다.
선택부(570)는 제1 고대역 LSP 계수와 제2 고대역 LSP 계수를 협대역 LSP 계수와 비교하여, 적은 스펙트럼 왜곡을 갖는 고대역 LSP 계수를 선택할 수 있다.
제1 역변환부(590)는 선택부(570)에서 선택된 LSP 계수를 역변환하여 고대역 LPC 계수를 생성할 수 있다. 생성된 고대역 LPC 계수로부터 고대역 스펙트럼 파라미터인 엔벨로프 신호, 에너지 레벨 혹은 게인 중 적어도 하나 이상을 추정할 수 있다.
도 6는 일실시 형태에 따른 여기 추정모듈의 구성을 나타낸 블럭도로서, 도 4에 도시된 여기 추정부(470)에 대응될 수 있다.
도 6에 도시된 여기 추정모듈은 제2 LP 분석부(610), 제2 LPC 필터링부(620), 쉬프팅부(630), 제2 변환부(640), 제2 선형 매핑부(650), 제2 역변환부(660) 및 제2 LP 합성부(670)를 포함할 수 있다. 마찬가지로, 여기 추정을 위하여 사용되는 계수에 따라서 제2 변환부(640)와 제2 역변환부(660)는 옵션으로 구비될 수 있다. 제2 LP 분석부(610)의 전달함수와 제2 LP 합성부(670)의 전달함수는 서로 역의 관계가 성립될 수 있다.
도 6을 참조하면, 제2 LP 분석부(610)는 협대역 여기신호에 대하여 LP 분석을 수행하여 협대역 여기 LPC 계수를 생성할 수 있다. 여기서, 협대역 여기신호는 복원된 협대역 신호에 대하여 LP 분석 및 LPC 필터링을 수행하여 얻어질 수 있다. 실시예에 따르면, 협대역 여기신호에 대하여 차수가 6인 LP 분석을 수행하고, 그 결과 차수가 6인 협대역 여기 LPC 계수를 얻을 수 있다.
제2 LPC 필터링부(620)는 협대역 여기신호에 대하여 제2 LP 분석부(610)로부터 제공되는 협대역 여기 LPC 계수를 필터링하여 화이트닝된 협대역 여기신호를 생성할 수 있다.
쉬프팅부(630)는 제2 LPC 필터링부(620)로부터 제공되는 화이트닝된 협대역 여기신호를 대응하는 고대역으로 쉬프팅시킬 수 있다. 구체적으로, 스펙트럼 측면에서 여기신호는 플랫한 특성을 가지므로, 화이트닝된 협대역 여기신호를 주파수 도메인에서 고대역에 복사하여 화이트닝된 고대역 여기신호를 생성할 수 있다. 일실시예에 따르면, 피치 정보를 기반으로 고대역으로 쉬프팅되는 협대역 여기신호의 주파수를 조정하는 적응적 스펙트럼 쉬프팅(adaptive spectral shifting) 방식을 적용할 수 있다. 적응적 스펙트럼 쉬프팅을 적용할 경우 협대역과 고대역간에 유사한 하모닉 구조가 유지될 수 있다.
구체적으로, 주파수 도메인에서 고대역 여기신호의 하위 영역과 상위 영역이 화이트닝된 협대역 여기신호의 상위 영역을 복사하여 얻어질 수 있다. 여기서, 화이트닝된 협대역 여기신호의 상위 영역은 1.9 - 3.8 kHz, 고대역 여기신호의 하위 영역과 상위 영역은 각각 ~3.8 - 5.7 kHz, ~5.7 - 7.6 kHz를 예로 들 수 있다. ~3.8 kHz와 ~5.7 kHz는 각각 3.8 kHz와 5.7 kHz를 넘지 않으면서 이에 근접한 기본 주파수의 배수를 나타낸다. 즉, 기본 주파수가 대략 1.9 kHz인 경우를 예로 든 것이다.
실시예에서는 스펙트럼 쉬프팅 방식을 적용하였으나, 대신 비선형 함수 변환, 오버샘플링, 가우시안 변조와 같은 방식을 통하여 화이트닝된 협대역 여기신호로부터 화이트닝된 고대역 여기신호를 생성하는 것도 가능하다.
제2 변환부(640)는 제2 LPC 분석부(610)로부터 제공되는 협대역 여기 LPC 계수를 변환하여 협대역 여기 LSP 계수를 생성할 수 있다.
제2 선형 매핑부(650)는 제2 변환부(640)로부터 제공되는 협대역 여기 LSP 계수를 선형 매트릭스를 이용하여 매핑하여 고대역 여기 LSP 계수를 생성할 수 있다. 실시예에 따르면, 차수가 6인 협대역 여기 LPC 계수로부터 변환된 협대역 여기 LSP 계수를 하나의 선형 매트릭스를 이용하여 차수가 10인 고대역 LSP 계수로 매핑할 수 있다. 선형 매트릭스는 협대역 트레이닝 데이터와 고대역 트레이닝 데이터의 관계로부터 얻어질 수 있다.
제2 역변환부(660)는 제2 선형 매핑부(650)로부터 제공되는 고대역 여기 LSP 계수를 역변환하여 고대역 여기 LPC 계수를 생성할 수 있다.
제2 LPC 합성부(670)는 쉬프팅부(630)로부터 제공되는 화이트닝된 고대역 여기신호와 제2 역변환부(660)로부터 제공되는 고대역 여기 LPC 계수에 대하여 LPC 합성을 수행하여 고대역 여기신호를 생성할 수 있다.
실시예에서는 선형 매핑을 적용하였으나, 비선형 함수 혹은 다른 변환방식을 통하여 협대역 여기 LSP 계수로부터 고대역 여기 LSP 계수를 생성하는 것도 가능하다.
도 7은 일실시 형태에 따른 합성모듈의 구성을 나타낸 블럭도로서, 도 1 내지 도 3에 도시된 합성부(150, 250, 350)에 대응될 수 있다.
도 7에 도시된 합성모듈은 업샘플링부(710), 저역통과필터(730), 고역통과필터(750) 및 결합부(770)를 포함할 수 있다.
도 7을 참조하면, 업샘플링부(710)는 복원된 협대역 신호를 업샘플링할 수 있다. 복원된 협대역 신호는 도 1 내지 도 3의 협대역 복호화부(110, 210, 310)로부터 제공될 수 있다.
저역통과필터(730)는 업샘플링부(710)로부터 제공되는 업샘플링된 협대역 신호에 대하여 협대역의 최대 주파수를 컷오프 주파수로 설정하여 저역통과필터링을 수행할 수 있다.
고역통과필터(750)는 블라인드 대역확장을 통하여 생성된 고대역 신호에 대하여 고대역의 최소 주파수를 컷오프 주파수로 설정하여 고역통과필터링을 수행할 수 있다. 고대역 신호는 도 1 내지 도 3의 고대역 복호화부(130, 230, 330)로부터 제공될 수 있다.
결합부(770)는 저역통과필터(730)로부터 제공되는 협대역 신호와 고역통과필터(750)로부터 제공되는 고대역 신호를 결합하여 광대역 신호를 생성할 수 있다.
도 8은 도 5에 도시된 스펙트럼 파라미터 추정모듈의 동작을 설명하기 위한 도면이다.
도 8에 도시된 코드북 매핑부(810)는 제1 저장부(810), 제1 코드북 탐색부(815), 제2 저장부(817)과 제2 코드북 탐색부(819)를 포함할 수 있다. 제1 선형 매핑부(830)는 제3 저장부(833)와 매핑부(835)를 포함할 수 있다.
도 8을 참조하면, 코드북 매핑부(810)에 있어서, 제1 저장부(810)는 협대역 코드북을 저장하며, 제2 저장부(817)는 고대역 코드북을 저장할 수 있다. 협대역 코드북과 고대역 코드북은 예를 들면 LBG(Linda, Buzo, Gray) 알고리즘에 의한 트레이닝 과정을 거쳐 생성될 수 있다. 실시예에 따르면, 듀얼 구조의 협대역 코드북과 고대역 코드북을 사용하여 협대역-고대역간 매핑이 이루어질 수 있다. 협대역 코드북은 협대역 코드워드들을 포함하고, 고대역 코드북은 대응하는 고대역 코드워드들을 포함할 수 있으며, 코드워드들은 임의 형태의 대표적인 LSP 계수들을 포함할 수 있다. 듀얼 구조의 협대역 코드북과 고대역 코드북 생성을 좀 더 구체적으로 설명하면 다음과 같다.
먼저, 협대역에 대응하는 주파수 성분들과 고대역에 대응하는 주파수 성분들을 포함하는 광범위한 광대역 컨텐츠에 대하여 원하는 샘플링 레이트로 샘플링된 트레이닝 데이터가 수집될 수 있다. 이때, 처리될 실제 신호의 대역폭과 매칭시키기 위하여 트레이닝 데이터에 대하여 인위적으로 다운샘플링 처리가 수행될 수 있다. 트레이닝 데이터의 협대역 성분들에 대하여 LBG 알고리즘을 적용하여 협대역 코드북을 생성할 수 있다. 협대역 트레이닝 데이터에 대하여 LBG 알고리즘을 적용하는 동안, 고대역 트레이닝 데이터에 대하여 마찬가지로 LBG 알고리즘을 적용하여 고대역 코드북을 생성할 수 있다. 이와 같은 방법으로, 듀얼 구조의 코드북은 대표적인 협대역 코드워드와 이에 대응하는 대표적인 고대역 코드워드 세트를 포함할 수 있다. 듀얼 구조의 코드북은 특정 화자 혹은 화자 클래스에 대하여 저대역 스펙트럼 엔벨로프와 고대역 스펙트럼 엔벨로프간 상관관계에 근거하여 생성될 수 있다. 한편, 각 코드북에 포함되는 코드워드들은 인접한 코드워드들끼리 그룹핑될 수 있으며, 트레이닝 데이터에 대하여 실험적으로 혹은 시뮬레이션을 통하여 최적의 그룹들을 도출할 수 있다.
제1 코드북 탐색부(815)는 협대역 LSP 계수에 대하여 협대역 코드북을 탐색하고, 협대역 코드북으로부터 최적의 코드워드에 대응하는 협대역 코드워드 인덱스와 그룹 인덱스를 출력할 수 있다. 즉, 최적의 코드워드에 대응하는 협대역 코드워드 인덱스가 탐색되면 그룹 인덱스를 자동으로 결정될 수 있다. 협대역 LSP 계수는 도 5의 제1 변환부(510)로부터 제공될 수 있다.
제2 코드북 탐색부(819)는 제1 코드북 탐색부(815)로부터 제공되는 협대역 코드워드 인덱스를 이용하여 고대역 코드북을 탐색하고, 고대역 코드북으로부터 협대역 코드워드 인덱스에 대응하는 위치에서 제1 고대역 코드워드를 얻을 수 있다. 즉, 트레이닝 과정을 통하여 협대역 코드북과 고대역 코드북간에 코드워드들의 위치가 서로 매핑되어 있기 때문에 동일한 코드워드 인덱스를 적용할 수 있다.
한편, 제1 선형 매핑부(830)에 있어서, 제3 저장부(833)는 제1 및/또는 제2 저장부(813, 817)에 각각 저장된 협대역 코드북과 고대역 코드북을 구성하는 N개의 그룹에 대응되는 N개의 선형 매트릭스를 저장하고 있다. N 개의 선형 매트릭스 생성을 코드북 매핑에 사용된 코드북과 연동하여 좀 더 구체적으로 설명하면 다음과 같다.
먼저, 전체 트레이닝 데이터에 대한 가장 근접한 이웃 탐색(nearest neighbor search)에 근거하여 각각 N개의 클러스터 세트 즉, N개의 그룹으로 파티션할 수 있다. 다음, 전체 트레이닝 데이터를 N개의 클러스터 세트를 통과시킴으로써 클러스터 세트 즉, 그룹별 트레이닝 데이터를 생성할 수 있다. 다음, N개의 그룹별 트레이닝 데이터에 대하여 최적 매트릭스 솔루션을 적용하여 N개의 선형 매트릭스를 구성할 수 있다. 한편, 클러스터 i에 존재하는 엔트리들과 협대역 코드북과 고대역 코드북의 그룹 i에 각각 존재하는 엔트리들이 서로 대응될 수 있도록 협대역 코드북과 고대역 코드북의 코드워드들은 재정렬될 수 있다. 이때, 최적 매트릭스 솔루션에서는 협대역 트레이닝 데이터와 고대역 트레이닝 데이터의 매핑 관계를 이용할 수 있다.
매핑부(835)는 제3 저장부(833)로부터 제1 코드북 탐색부(815)로부터 제공되는 그룹 인덱스에 대응되는 선형 매트릭스를 독출하고, 독출된 선형 매트릭스를 협대역 LSP 계수에 승산하여 제2 고대역 코드워드를 생성할 수 있다. 생성된 제2 고대역 코드워드에 대하여 LSP 계수의 순서 혹은 간격을 정리하기 위하여 리오더링 처리가 수행될 수 있다.
선택부(850)는 코드북 매핑부(810)로부터 제공되는 제1 고대역 코드워드와 제1 선형 매핑부(830)로부터 제공되는 제2 고대역 코드워드에 대하여 협대역 신호를 기준으로 스펙트럼 왜곡(spectral distortion)을 산출하여 더 적은 값을 갖는 고대역 코드워드를 선택할 수 있다. 이는 하기의 수학식 1에서와 같이 나타낼 수 있다.
Figure 112013099858513-pat00001
여기서,
Figure 112013099858513-pat00002
는 선택부(850)에서 출력되는 고대역 코드워드 즉, 고대역 LSP 계수를 나타내고,
Figure 112013099858513-pat00003
은 협대역 LSP 계수를 나타내고,
Figure 112013099858513-pat00004
Figure 112013099858513-pat00005
은 각각 코드북 매핑부(810)와 제1 선형 매핑부(830)에서 출력되는 제1 및 제2 고대역 코드워드를 나타낸다. 또한,
Figure 112013099858513-pat00006
은 하기 수학식 2
Figure 112013099858513-pat00007
와 같이 나타낼 수 있고, 여기서 p는 협대역 LSP 계수를 차수를 나타낸다.
상기한 수학식 1 및 2를 통하여 협대역 LSP 계수의 p개 파라미터와 제1 혹은 제2 고대역 LSP 계수의 p개 파라미터간 스펙트럼 왜곡이 산출되고, 더 작은 값의 고대역 LSP 계수가 선택될 수 있다.
도 9는 여기신호와 화이트닝된 여기신호를 비교한 파형도로서, 참조번호 910은 여기신호의 평균 스펙트럼, 참조번호 930은 화이트닝된 여기신호의 평균 스펙트럼을 나타낸다.
통상적으로, 화이트닝 필터의 역할을 수행하는 도 4의 제1 LPC 필터링부(450)로부터 제공되는 협대역 여기신호의 스펙트럼(910)은 플랫하지 않을 수 있다. 일반적으로 고대역 신호의 크기는 저대역 신호보다 작기 때문에 스펙트럼 쉬프팅 방식에 의해 협대역 여기신호를 고대역에 복사하여 고대역 여기신호를 생성하게 되면, 고대역 여기신호는 과추정된(over-estimated) 상태가 되어 합성된 고대역 신호가 증폭될 수 있다.
이를 방지하기 위하여, 제1 LPC 필터링부(450)로부터 제공되는 협대역 여기신호에 대하여 도 6의 제2 LPC 필터링부(620)에 의해 재차 화이트닝 처리를 수행하게 되면, 좀 더 플랫한 스펙트럼을 갖는 협대역 여기신호(930)를 생성할 수 있다. 이와 같이 화이트닝된 협대역 여기신호를 고대역에 복사하게 되면 합성된 고대역 신호가 증폭되지 않을 수 있다.
도 10a 및 도 10b는 기존의 여기신호를 이용하여 블라인드 대역확장을 수행한 결과와 화이트닝된 여기신호를 이용하여 블라인드 대역확장을 수행한 결과를 각각 나타낸 파형도이다.
도 10a를 살펴보면, 기존의 여기신호를 이용한 블라인드 대역확장을 통하여 얻어지는 합성된 스피치 신호의 크기가 원래의 스피치 신호보다 크다는 것을 알 수 있다. 이는 과추정된 고대역 여기신호에 의해 증폭되었음을 의미한다. 한편, 도 10b를 살펴보면, 화이트닝된 여기신호를 이용한 블라인드 대역확장을 통하여 얻어지는 합성된 스피치 신호의 크기가 원래의 스피치 신호와 같거나 작다는 것을 알 수 있다.
지각적인 측면에서 보면, 블라인드 대역확장시 화이트닝된 여기신호를 이용하게 되면 기존의 여기신호를 이용한 경우보다 좀 더 적은 결함(artifact)를 야기할 수 있다.
한편, 도 10a 및 도 10b를 살펴보면, 적응적 스펙트럼 쉬프팅 방식을 적용한 결과, 생성된 고대역 스피치 신호가 저대역 스피치 신호와 우수한 피치 코히어런스(pitch coherence)를 가짐을 알 수 있다.
도 11은 일실시 형태에 따른 광대역 생성방법의 동작을 설명하는 흐름도로서, 적어도 하나의 프로세서에 의해 수행될 수 있다. 바람직하게로는 도 1 내지 도 3의 광대역 생성장치의 고대역 생성부(130,230,330)과 합성부(150,250,350)에 의해 수행될 수 있다.
도 11을 참조하면, 1110 단계에서는 협대역 비트스트림에 대한 복호화 결과 얻어지는 복원된 협대역 신호를 수신할 수 있다.
1130 단계에서는 복원된 협대역 신호를 이용하여 고대역 생성에 필요한 확장 파라미터들을 추정하고, 추정된 확장 파라미터들을 이용하여 고대역 신호를 생성할 수 있다.
1150 단계에서는 복원된 협대역 신호와 고대역 신호를 합성하여 광대역 신호를 생성할 수 있다.
일 실시예에 따르면, 1110 단계 이전에 대역확장 여부를 결정하는 사용자 조작에 의하여 인에이블 신호 혹은 스위칭 신호가 발생하는지를 판단하는 단계를 더 구비할 수 있다. 이에 따르면, 인에이블 신호 혹은 스위칭 신호가 발생될 경우 1110 단계 내지 1150 단계가 동작되도록 구현할 수 있다.
다른 실시예에 따르면, 1110 단계 이전에 협대역 신호의 특성에 따라서 대역확장 여부를 결정하는 단계를 더 구비할 수 있다. 이에 따르면, 대역확장을 통하여 음질 개선을 기대할 수 있는 유성음 구간에 대하여 1110 단계 내지 1150 단계를 수행할 수 있다. 나머지 구간, 예를 들면 무성음 구간에 대해서는 고대역 부분을 0으로 채우거나, 미리 설정된 노이즈 성분을 채울 수 있다.
한편, 예를 들어 협대역의 주파수 범위가 0.3 - 3.4 kHz, 광대역의 주파수 범위가 0.05 - 7 kHz인 경우, 3.4 - 7 kHz에 대해서는 상기한 고대역 생성 처리를 통하여 대역확장이 이루어지고, 0.05 - 0.3 kHz에 대해서는 정현파(sinusoidals)를 이용하여 대역확장이 이루어지도록 구현할 수 있다.
도 12는 일실시 형태에 따른 복호화모듈을 포함하는 멀티미디어 기기의 구성을 나타낸 블록도이다.
도 12에 도시된 멀티미디어 기기(1200)는 통신부(1210)와 복호화모듈(1230)을 포함할 수 있다. 또한, 복호화 결과 얻어지는 복원된 협대역 신호의 용도에 따라서, 복원된 협대역 신호를 저장하는 저장부(1250)을 더 포함할 수 있다. 또한, 멀티미디어 기기(1200)는 스피커(1270)를 더 포함할 수 있다. 즉, 저장부(1250)와 스피커(1270)는 옵션으로 구비될 수 있다. 또한, 복호화모듈(1230)은 협대역 모듈(1233)과 광대역 모듈(1235)를 포함할 수 있다. 협대역 모듈(1233)은 임의의 협대역 복호화 알고리즘에 의해 동작하는 것으로서, 공지된 다양한 코덱 알고리즘으로 구현할 수 있다. 광대역 모듈(1235)은 대역확장 알고리즘에 의해 동작하는 것으로서 도 1 내지 도 8에 도시된 바와 같은 실시예에 따라서 구현될 수 있다. 또한, 복호화모듈(1230)은 스위치(1237)를 옵션으로 구비할 수 있다. 한편, 도 12에 도시된 멀티미디어 기기(1200)는 임의의 부호화모듈(미도시), 예를 들면 일반적인 부호화 기능을 수행하는 부호화모듈을 더 포함할 수 있다. 여기서, 복호화모듈(1230)은 멀티미디어 기기(1200)에 구비되는 다른 구성요소(미도시)와 함께 일체화되어 적어도 하나의 이상의 프로세서(미도시)로 구현될 수 있다. 멀티미디어 기기(1200)는 헤드셋(1280) 혹은 외장 스피커(1290)에 연결될 수 있다. 이때, 복호화모듈(1230) 대신에 헤드셋(1280)에 광대역 모듈(1235)을 내장할 수 있으며, 스위치(1237)는 옵션으로 구비될 수 있다. 마찬가지로, 복호화모듈(1230) 대신에 외장 스피커(1290)에 광대역 모듈(1235)을 내장할 수 있으며, 스위치(1237)는 옵션으로 구비될 수 있다.
도 12를 참조하면, 통신부(1210)는 외부로부터 제공되는 부호화된 협대역 비트스트림과 협대역 신호 중 적어도 하나를 수신하거나 복호화 모듈(1230)의 복호화결과 얻어지는 복원된 협대역 신호와 부호화결과 얻어지는 협대역 비트스트림 중 적어도 하나를 송신할 수 있다. 통신부(1210)는 무선 인터넷, 무선 인트라넷, 무선 전화망, 무선 랜(LAN), 와이파이(Wi-Fi), 와이파이 다이렉트(WFD, Wi-Fi Direct), 3G(Generation), 4G(4 Generation), 블루투스(Bluetooth), 적외선 통신(IrDA, Infrared Data Association), RFID(Radio Frequency Identification), UWB(Ultra WideBand), 지그비(Zigbee), NFC(Near Field Communication)와 같은 무선 네트워크 또는 유선 전화망, 유선 인터넷과 같은 유선 네트워크를 통해 외부의 멀티미디어 기기 혹은 서버와 데이터를 송수신할 수 있도록 구성된다.
복호화 모듈(1230)은 일반적인 협대역 복호화 알고리즘과 대역확장 알고리즘을 구비하고 있고, 여기서 대역확장 알고리즘은 디폴트로 수행되거나, 스위치(1337)를 통한 사용자 조작에 의해 혹은 협대역 신호의 특성에 따라서 선택적으로 수행될 수 있다. 복호화 모듈(1230)에 구비된 대역확장 알고리즘은 도 1 내지 도 3의 광대역 신호 생성장치의 각 구성요소의 동작에 근거할 수 있다. 복호화 모듈(1230)은 협대역 신호, 광대역 신호 혹은 초광대역 신호를 생성할 수 있다.
저장부(1250)는 복호화 모듈(1230)에서 생성되는 협대역 신호 혹은 광대역 신호를 저장할 수 있다. 한편, 저장부(1250)는 멀티미디어 기기(1200)의 운용에 필요한 다양한 프로그램을 저장할 수 있다.
스피커(1270)는 복호화 모듈(1230)에서 생성되는 협대역 신호 혹은 광대역 신호를 외부로 출력할 수 있다.
한편, 스피커(1270)는 유선 혹은 무선으로 외부의 헤드셋(1280) 혹은 외장 스피커(1290)에 연결될 수 있고, 복호화 모듈(1230)이 아니라, 헤드셋(1280) 혹은 외장 스피커(1290)에 대역확장 알고리즘을 구현할 수 있다. 이 경우, 디폴트로 대역확장 알고리즘이 실행되거나, 헤드셋(1280) 혹은 외장 스피커(1290)에 설치된 스위치(1237)를 이용하여, 사용자의 조작에 따른 대역확장 수행여부가 결정되면 대역확장 알고리즘이 동작되도록 구현할 수 있다.
도 13은 일실시 형태에 따른 부호화모듈과 복호화모듈을 포함하는 멀티미디어 기기의 구성을 나타낸 블록도이다.
도 13에 도시된 멀티미디어 기기(1300)는 통신부(1310), 부호화모듈(1340)과 복호화모듈(1330)을 포함할 수 있다. 또한, 부호화 결과 얻어지는 협대역 비트스트림 혹은 복호화 결과 얻어지는 복원된 협대역 신호의 용도에 따라서, 협대역 비트스트림 혹은 복원된 협대역 신호를 저장하는 저장부(1340)을 더 포함할 수 있다. 또한, 멀티미디어 기기(1300)는 마이크로폰(1350) 혹은 스피커(1360)를 더 포함할 수 있다. 또한, 복호화모듈(1330)은 협대역 모듈(1333)과 광대역 모듈(1335)를 포함할 수 있다. 협대역 모듈(1333)은 임의의 협대역 복호화 알고리즘에 의해 동작하는 것으로서, 공지된 다양한 코덱 알고리즘으로 구현할 수 있다. 광대역 모듈(1335)은 대역확장 알고리즘에 의해 동작하는 것으로서 도 1 내지 도 8에 도시된 바와 같은 실시예에 따라서 구현될 수 있다. 또한, 복호화모듈(1330)은 스위치(1337)를 옵션으로 구비할 수 있다. 부호화모듈(1340)은 일반적인 부호화 기능을 수행하는 것으로서, 공지된 다양한 코덱 알고리즘으로 구현할 수 있다. 멀티미디어 기기(1300)는 헤드셋(1380) 혹은 외장 스피커(1390)에 연결될 수 있다. 이때, 복호화모듈(1330) 대신에 헤드셋(1380)에 광대역 모듈(1335)을 내장할 수 있으며, 스위치(1337)는 옵션으로 구비될 수 있다. 마찬가지로, 복호화모듈(1330) 대신에 외장 스피커(1390)에 광대역 모듈(1335)을 내장할 수 있으며, 스위치(1337)는 옵션으로 구비될 수 있다. 여기서, 부호화모듈(1340)과 복호화모듈(1330)은 멀티미디어 기기(1300)에 구비되는 다른 구성요소(미도시)와 함께 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다. 나머지 구성요소들의 동작은 도 12에서와 유사하므로 세부적인 설명은 생략하기로 한다.
도 12 내지 도 13에 도시된 멀티미디어 기기(1200, 1300)에는, 전화, 모바일 폰 등을 포함하는 음성통신 전용단말, TV, MP3 플레이어 등을 포함하는 방송 혹은 음악 전용장치, 혹은 음성통신 전용단말과 방송 혹은 음악 전용장치의 융합 단말장치, 텔레컨퍼런싱 혹은 인터랙션 시스템의 사용자 단말이 포함될 수 있으나, 이에 한정되는 것은 아니다. 또한, 멀티미디어 기기(1100, 1200, 1300)는 클라이언트, 서버 혹은 클라이언트와 서버 사이에 배치되는 변환기로서 사용될 수 있다.
한편, 멀티미디어 기기(1200, 1300)가 예를 들어 모바일 폰인 경우, 도시되지 않았지만 키패드 등과 같은 유저 입력부, 유저 인터페이스 혹은 모바일 폰에서 처리되는 정보를 디스플레이하는 디스플레이부, 모바일 폰의 전반적인 기능을 제어하는 프로세서를 더 포함할 수 있다. 또한, 모바일 폰은 촬상 기능을 갖는 카메라부와 모바일 폰에서 필요로 하는 기능을 수행하는 적어도 하나 이상의 구성요소를 더 포함할 수 있다.
한편, 멀티미디어 기기(1200, 1300)가 예를 들어 TV인 경우, 도시되지 않았지만 키패드 등과 같은 유저 입력부, 수신된 방송정보를 디스플레이하는 디스플레이부, TV의 전반적인 기능을 제어하는 프로세서를 더 포함할 수 있다. 또한, TV는 TV에서 필요로 하는 기능을 수행하는 적어도 하나 이상의 구성요소를 더 포함할 수 있다.
상기 실시예들에 따른 방법은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상술한 본 발명의 실시예들에서 사용될 수 있는 데이터 구조, 프로그램 명령, 혹은 데이터 파일은 컴퓨터로 읽을 수 있는 기록매체에 다양한 수단을 통하여 기록될 수 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함할 수 있다. 컴퓨터로 읽을 수 있는 기록매체의 예로는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 또한, 컴퓨터로 읽을 수 있는 기록매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 전송 매체일 수도 있다. 프로그램 명령의 예로는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다.
이상과 같이 본 발명의 일실시예는 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명의 일실시예는 상기 설명된 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 스코프는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 이의 균등 또는 등가적 변형 모두는 본 발명 기술적 사상의 범주에 속한다고 할 것이다.
110,210,310 ... 협대역 복호화부 130,230,330 ... 고대역 생성부
150,250,350 ... 합성부 200 ... 신호분류부
320 ... 스위칭부 410 ...제1 LP 분석부
430 ... 스펙트럼 파라미터 추정부 450 ... 제1 LPC 필터링부
470 ... 여기 추정부 490 ... 제1 LP 합성부
510 ... 제1 변환부 530 ... 코드북 매핑부
550 ... 제1 선형 매핑부 570 ... 선택부
590 ... 제1 역변환부 610 ... 제2 LP 분석부
620 ... 제2 LPC 필터링부 630 ... 쉬프팅부
640 ... 제2 변환부 650 ... 제2 선형매핑부
660 ... 제2 역변환부 670 ... 제2 LP 합성부

Claims (21)

  1. 복원된 협대역 신호로부터 LP 분석을 수행하여 협대역 LPC 계수를 생성하는 단계;
    상기 협대역 LPC 계수를 변환하여 협대역 LSP 계수를 생성하는 단계;
    상기 협대역 LSP 계수에 대하여 협대역 코드북을 탐색하여, 최적의 코드워드에 대응하는 코드워드 인덱스 및 그룹 인덱스를 결정하는 단계;
    상기 협대역 코드북과 대응하는 고대역 코드북 및 상기 코드워드 인덱스를 이용하여, 상기 협대역 LSP 계수를 제1 고대역 LSP 계수로 매핑하는 단계;
    상기 협대역 코드북과 상기 고대역 코드북에 포함된 코드워드들을 그룹핑하는 N개의 그룹에 각각 대응되는 N개의 선형 매트릭스 중에서, 상기 그룹 인덱스에 대응되는 선형 매트릭스를 결정하는 단계;
    상기 결정된 선형 매트릭스를 이용하여, 상기 협대역 LSP 계수를 제2 고대역 LSP 계수로 매핑하는 단계;
    상기 제1 고대역 LSP 계수와 상기 제2 고대역 LSP 계수를 상기 협대역 LSP 계수와 비교하여, 적은 스펙트럼 왜곡을 갖는 고대역 LSP 계수를 선택하는 단계;
    상기 선택된 고대역 LSP 계수로부터 고대역 엔벨로프 신호를 추정하는 단계;
    상기 복원된 협대역 신호에 대하여 고대역 여기신호를 추정하는 단계;
    추정된 상기 고대역 엔벨로프 신호와 추정된 상기 고대역 여기신호를 이용하여 고대역 신호를 생성하는 단계; 및
    상기 복원된 협대역 신호와 상기 고대역 신호를 합성하여 광대역 신호를 생성하는 단계를 포함하는 광대역 신호 생성방법.
  2. 제1항에 있어서, 상기 고대역 여기신호를 추정하는 단계는,
    상기 협대역 LPC 계수를 필터링하여 협대역 여기신호를 생성하는 단계;
    상기 협대역 여기신호에 대하여 LP 분석 및 LPC 필터링을 수행하여 화이트닝된 협대역 여기신호를 생성하는 단계; 및
    상기 화이트닝된 협대역 여기신호를 이용하여 고대역 여기신호를 추정하는 단계를 포함하는, 광대역 신호 생성방법.
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 코드북 매핑과 선형 매핑을 결합하여, 복원된 협대역 신호로부터 고대역 엔벨로프 신호를 추정하고, 상기 복원된 협대역 신호에 대하여 고대역 여기신호를 추정하고, 추정된 상기 고대역 엔벨로프 신호와 추정된 상기 고대역 여기신호를 이용하여 고대역 신호를 생성하는 고대역 생성부; 및
    상기 복원된 협대역 신호와 상기 고대역 신호를 합성하여 광대역 신호를 생성하는 합성부를 포함하고,
    상기 고대역 생성부는, 상기 복원된 협대역 신호로부터 LP 분석을 수행하여 협대역 LPC 계수를 생성하고, 상기 협대역 LPC 계수를 변환하여 협대역 LSP 계수를 생성하고, 상기 협대역 LSP 계수에 대하여 협대역 코드북을 탐색하여, 최적의 코드워드에 대응하는 코드워드 인덱스 및 그룹 인덱스를 결정하고, 상기 협대역 코드북과 대응하는 고대역 코드북 및 상기 코드워드 인덱스를 이용하여 상기 협대역 LSP 계수를 제1 고대역 LSP 계수로 매핑하고, 상기 협대역 코드북과 상기 고대역 코드북에 포함된 코드워드들을 그룹핑하는 N개의 그룹에 각각 대응되는 N개의 선형 매트릭스 중에서, 상기 그룹 인덱스에 대응되는 선형 매트릭스를 결정하고, 상기 결정된 선형 매트릭스를 이용하여 상기 협대역 LSP 계수를 제2 고대역 LSP 계수로 매핑하고, 상기 제1 고대역 LSP 계수와 상기 제2 고대역 LSP 계수를 상기 협대역 LSP 계수와 비교하여, 적은 스펙트럼 왜곡을 갖는 고대역 LSP 계수를 선택하고, 상기 선택된 고대역 LSP 계수로부터 고대역 엔벨로프 신호를 추정하는, 광대역 신호 생성장치.
  10. 제9항에 있어서, 상기 고대역 생성부는 상기 협대역 LPC 계수를 필터링하여 협대역 여기신호를 생성하고, 상기 협대역 여기신호에 대하여 LP 분석 및 LPC 필터링을 수행하여 화이트닝된 협대역 여기신호를 생성하고, 상기 화이트닝된 협대역 여기신호를 이용하여 고대역 여기신호를 추정하는, 광대역 신호 생성장치.
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 협대역 비트스트림을 복호화하여 복원된 협대역신호를 생성하는 협대역 복호화부; 및
    제9항 또는 제10항에 기재된 장치를 포함하는 멀티미디어 기기.
  17. 제9항 또는 제10항에 기재된 장치를 포함하는 헤드셋.
  18. 제17항에 있어서, 사용자 조작에 의해 상기 장치의 동작 여부를 결정하는 스위치를 더 포함하는 헤드셋.
  19. 제9항 또는 제10항에 기재된 장치를 포함하는 스피커.
  20. 제19항에 있어서, 사용자 조작에 의해 상기 장치의 동작 여부를 결정하는 스위치를 더 포함하는 스피커.
  21. 제1항 또는 제2항에 기재된 방법을 실행하는 컴퓨터로 읽을 수 있는 기록매체.
KR1020130132623A 2013-11-02 2013-11-02 광대역 신호 생성방법 및 장치와 이를 채용하는 기기 KR102271852B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020130132623A KR102271852B1 (ko) 2013-11-02 2013-11-02 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
US15/033,834 US10373624B2 (en) 2013-11-02 2014-11-03 Broadband signal generating method and apparatus, and device employing same
PCT/KR2014/010456 WO2015065137A1 (ko) 2013-11-02 2014-11-03 광대역 신호 생성방법 및 장치와 이를 채용하는 기기

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130132623A KR102271852B1 (ko) 2013-11-02 2013-11-02 광대역 신호 생성방법 및 장치와 이를 채용하는 기기

Publications (2)

Publication Number Publication Date
KR20150051301A KR20150051301A (ko) 2015-05-12
KR102271852B1 true KR102271852B1 (ko) 2021-07-01

Family

ID=53004639

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130132623A KR102271852B1 (ko) 2013-11-02 2013-11-02 광대역 신호 생성방법 및 장치와 이를 채용하는 기기

Country Status (3)

Country Link
US (1) US10373624B2 (ko)
KR (1) KR102271852B1 (ko)
WO (1) WO2015065137A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
WO2017116022A1 (ko) * 2015-12-30 2017-07-06 주식회사 오르페오사운드웍스 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법
CN110660402B (zh) * 2018-06-29 2022-03-29 华为技术有限公司 立体声信号编码过程中确定加权系数的方法和装置
US11295726B2 (en) * 2019-04-08 2022-04-05 International Business Machines Corporation Synthetic narrowband data generation for narrowband automatic speech recognition systems
RU2715007C1 (ru) * 2019-06-04 2020-02-21 Акционерное общество "Концерн "Созвездие" Способ формирования короткоимпульсных сверхширокополосных сигналов
CN110556121B (zh) * 2019-09-18 2024-01-09 腾讯科技(深圳)有限公司 频带扩展方法、装置、电子设备及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030093278A1 (en) 2001-10-04 2003-05-15 David Malah Method of bandwidth extension for narrow-band speech
US20080027718A1 (en) * 2006-07-31 2008-01-31 Venkatesh Krishnan Systems, methods, and apparatus for gain factor limiting

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
US7346499B2 (en) * 2000-11-09 2008-03-18 Koninklijke Philips Electronics N.V. Wideband extension of telephone speech for higher perceptual quality
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US7120207B2 (en) * 2001-12-31 2006-10-10 Nokia Corporation Transmission method and radio receiver
EP1579427A4 (en) 2003-01-09 2007-05-16 Dilithium Networks Pty Ltd METHOD AND APPARATUS FOR IMPROVING THE QUALITY OF VOICE TRANSCODING
US20080302873A1 (en) * 2003-11-13 2008-12-11 Metrologic Instruments, Inc. Digital image capture and processing system supporting automatic communication interface testing/detection and system configuration parameter (SCP) programming
ATE534990T1 (de) * 2004-09-17 2011-12-15 Panasonic Corp Skalierbare sprachcodierungsvorrichtung, skalierbare sprachdecodierungsvorrichtung, skalierbares sprachcodierungsverfahren, skalierbares sprachdecodierungsverfahren, kommunikationsendgerät und basisstationsgerät
KR100708121B1 (ko) 2005-01-22 2007-04-16 삼성전자주식회사 음성 신호의 대역 확장 방법 및 장치
WO2006107838A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Systems, methods, and apparatus for highband time warping
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7805314B2 (en) * 2005-07-13 2010-09-28 Samsung Electronics Co., Ltd. Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data
KR101171098B1 (ko) 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
US8229106B2 (en) * 2007-01-22 2012-07-24 D.S.P. Group, Ltd. Apparatus and methods for enhancement of speech
US8126707B2 (en) * 2007-04-05 2012-02-28 Texas Instruments Incorporated Method and system for speech compression
US9319636B2 (en) * 2012-12-31 2016-04-19 Karl Storz Imaging, Inc. Video imaging system with multiple camera white balance capability

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030093278A1 (en) 2001-10-04 2003-05-15 David Malah Method of bandwidth extension for narrow-band speech
US20080027718A1 (en) * 2006-07-31 2008-01-31 Venkatesh Krishnan Systems, methods, and apparatus for gain factor limiting

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Ulrich Kornagel. Techniques for artificial bandwidth extension of telephone speech. Signal Processing, 2006.06.01.*
구본강, et al. AMR 기반 저 전력 인공 대역 확장 기술 개발, 한국음향학회지, 2011년 제30권제4호, 2011.05.*

Also Published As

Publication number Publication date
US20160275959A1 (en) 2016-09-22
KR20150051301A (ko) 2015-05-12
WO2015065137A1 (ko) 2015-05-07
US10373624B2 (en) 2019-08-06

Similar Documents

Publication Publication Date Title
KR102271852B1 (ko) 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
CN110827842B (zh) 高频带激励信号生成
CN111583955B (zh) 高频带信号建模
US9818419B2 (en) High-band signal coding using multiple sub-bands
US9984699B2 (en) High-band signal coding using mismatched frequency ranges
CN105745703B (zh) 信号编码方法和装置以及信号解码方法和装置
JP2017528751A (ja) 信号符号化方法及びその装置、並びに信号復号方法及びその装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)