KR20190095530A - 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체 - Google Patents
신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체 Download PDFInfo
- Publication number
- KR20190095530A KR20190095530A KR1020197022968A KR20197022968A KR20190095530A KR 20190095530 A KR20190095530 A KR 20190095530A KR 1020197022968 A KR1020197022968 A KR 1020197022968A KR 20197022968 A KR20197022968 A KR 20197022968A KR 20190095530 A KR20190095530 A KR 20190095530A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- information
- sinusoidal
- noise
- envelope
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 127
- 230000005236 sound signal Effects 0.000 claims abstract description 42
- 230000002194 synthesizing effect Effects 0.000 claims description 12
- 238000003672 processing method Methods 0.000 claims description 3
- 230000010076 replication Effects 0.000 claims description 2
- 230000003595 spectral effect Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000015572 biosynthetic process Effects 0.000 description 132
- 238000003786 synthesis reaction Methods 0.000 description 132
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 35
- 238000004364 calculation method Methods 0.000 description 15
- 238000001514 detection method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Stereophonic System (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
본 기술은, 음성 신호를 복호하는 경우에, 보다 음질이 좋은 음성이 얻어지도록 할 수 있는 신호 처리 장치 및 방법 및 프로그램에 관한 것이다. 포락 정보 생성부(24)는 부호화 대상의 음성 신호의 고역 성분의 포락 형상을 나타내는 포락 정보를 생성한다. 정현파 정보 생성부(26)는 음성 신호의 고역 성분으로부터 정현파 신호를 검출하고, 정현파 신호의 출현 개시 위치를 나타내는 정현파 정보를 생성한다. 부호화 스트림 생성부(27)는 포락 정보, 정현파 정보 및 부호화된 음성 신호의 저역 성분을 다중화하고, 그 결과 얻어진 부호화 스트림을 출력한다. 이에 의해 부호화 스트림의 수신측에 있어서는 포락 정보와 정현파 정보로부터 정현파 신호가 포함되는 고역 성분을 보다 고정밀도로 예측할 수 있다. 본 발명은 신호 처리 장치에 적용할 수 있다.
Description
본 발명은 신호 처리 장치 및 방법, 및 프로그램에 관한 것으로, 특히, 부호화된 음성 신호를 복호하는 경우에 보다 음질이 좋은 음성이 얻어지도록 한 신호 처리 장치 및 방법, 및 프로그램에 관한 것이다.
종래, 음성 신호의 부호화 방법으로서 HE-AAC(High Efficiency MPEG(Moving Picture Experts Group) 4AAC(Advanced Audio Coding))(국제 표준 규격 ISO/IEC14496-3) 등이 알려져 있다. 이러한 부호화 방법에서는 SBR(Spectral Band Replication)이라고 불리는 고역 특징 부호화 기술이 사용되고 있다(예를 들어, 특허문헌 1 참조).
SBR에서는 음성 신호의 부호화 시에 부호화된 음성 신호의 저역 성분(이하, 저역 신호라고 칭함)과 함께, 음성 신호의 고역 성분(이하, 고역 신호라고 칭함)을 생성하기 위한 SBR 정보가 출력된다. 복호 장치에서는 부호화된 저역 신호를 복호 함과 함께, 복호에 의해 얻어진 저역 신호와 SBR 정보를 사용해서 고역 신호를 생성하고, 저역 신호와 고역 신호를 포함하여 이루어지는 음성 신호를 얻는다.
이러한 SBR 정보에는 주로 고역 성분의 포락 형상을 나타내는 포락 정보와, 복호 장치에 있어서 고역 성분을 생성하기 위해서 부가되는 노이즈 신호를 얻기 위한 노이즈 포락 정보가 포함되어 있다.
여기서 노이즈 포락 정보에는 고역 성분에 포함되는 노이즈 신호의 각 SBR 프레임을 2개의 구간으로 분할하는 경계 위치(이하, 노이즈 경계 위치라고 칭함)를 나타내는 정보와, 각 구간에 있어서의 노이즈 신호의 게인을 나타내는 정보가 포함된다. 따라서, 복호 장치에서는 노이즈 포락 정보에 기초하여 미리 정해진 노이즈 신호에 대하여 노이즈 경계 위치로 구획되는 각 구간의 게인 조정이 행해져서 최종적인 노이즈 신호가 된다. 또한, SBR에서는 노이즈 신호의 SBR 프레임을 2개의 구간으로 분할하지 않고, SBR 프레임 전체에 대하여 게인을 설정하는 것도 가능하게 되어있다.
복호 장치는 음성 신호의 복호 시에 있어서 저역 신호 및 포락 정보로부터 얻어지는 의사적인 고역 신호와, 노이즈 포락 정보로부터 얻어지는 노이즈 신호를 합성함으로써 고역 성분을 생성하고, 얻어진 고역 성분과 저역 신호로부터 음성 신호를 생성한다.
그런데 SBR에서는 톤성이 높은 음성 신호에 대해서는 또한 정현파 합성을 사용한 부호화가 행해지고 있다. 즉, 복호측에서의 고역 성분의 생성 시에 있어서 의사적인 고역 신호에 대하여 노이즈 신호뿐만 아니라, 특정 주파수의 정현파 신호도 가산된다. 이러한 경우, 의사적인 고역 신호, 노이즈 신호 및 정현파 신호를 합성해서 얻어지는 신호가 예측에 의해 얻어진 고역 신호가 되게 된다.
고역 성분의 예측에 정현파 신호를 사용할 경우, SBR 정보에는 SBR 프레임에 있어서의 정현파 신호의 유무를 나타내는 정현파 정보도 포함되게 된다. 구체적으로는, 복호 시에 있어서의 정현파 신호의 합성 개시 위치는 SBR 프레임의 개시 위치 또는 노이즈 경계 위치가 되고, 노이즈 경계 위치에 의해 분할되는 SBR 프레임의 각 구간에 대해서 그들 구간에 있어서의 정현파 신호의 합성의 유무를 나타내는 2치 정보가 정현파 정보가 된다.
이와 같이 하여 의사적인 고역 신호에 부가되는 노이즈 신호나 정현파 신호는 원 음성 신호의 고역 성분 중 포락 정보로부터는 재현하는 것이 곤란한 성분이다. 따라서, 의사적인 고역 신호가 적절한 위치에 노이즈 신호나 정현파 신호를 합성함으로써 고정밀도로 고역 성분을 예측할 수 있게 되고, 예측에 의해 얻어진 고역 성분을 사용해서 대역 확장을 행하면, 보다 음질이 좋은 음성을 재생할 수 있다.
그런데, 고역 성분의 예측에 정현파 신호를 사용할 경우, 정현파 신호의 합성 개시 위치는 SBR 프레임의 개시 위치 또는 노이즈 경계 위치가 되는 점에서 원 음성 신호에 있어서의 정현파 성분의 출현 개시 위치에 대하여 어긋남이 발생해버리는 경우가 있다. 그러면, 고역 성분을 고정밀도로 재현할 수 없게 되고, 복호에 의해 얻어진 음성 신호에 청감 상의 열화가 발생해버리게 된다.
특히, SBR에서는 부호화 대상이 되는 음성 신호의 샘플링 레이트에 관계없이 프레임 길이가 일정하므로, 샘플링 레이트가 낮은 경우에는 1프레임당의 절대시간의 길이가 길어진다. 그로 인해, 원 음성 신호에 있어서의 정현파 성분의 출현 개시 위치와, 복호시에 합성되는 정현파 신호의 합성 개시 위치의 절대 시간의 어긋남량(차분)이 커지고, 그 어긋남의 구간에서 발생한 양자화 잡음이 두드러지기 쉬워져버린다.
본 기술은 이러한 상황을 감안하여 이루어진 것이며, 음성 신호를 복호할 경우에 보다 음질이 좋은 음성이 얻어지도록 하는 것이다.
본 발명의 제1 측면의 신호 처리 장치는 음성 신호의 저역 성분, 상기 음성 신호의 고역 성분의 포락을 나타내는 포락 정보, 및 상기 고역 성분에 포함되는 정현파 성분의 주파수 및 출현 위치를 특정하기 위한 정현파 정보를 추출하는 추출부와, 상기 저역 성분으로서의 저역 신호와 상기 포락 정보에 기초하여 상기 고역 성분을 구성하는 의사 고역 신호를 생성하는 의사 고역 생성부와, 상기 정현파 정보에 의해 나타나는 주파수의 정현파 신호로서, 또한 상기 정현파 정보로부터 특정되는 상기 출현 위치를 개시 위치로 하는 정현파 신호를 생성하는 정현파 생성부와, 상기 저역 신호, 상기 의사 고역 신호 및 상기 정현파 신호를 합성해서 음성 신호를 생성하는 합성부를 구비한다.
상기 정현파 정보에는 상기 고역 성분의 프레임의 개시 위치부터 상기 정현파 성분의 출현 개시 위치까지의 거리를 나타내는 정보가 상기 출현 위치를 특정하기 위한 정보로서 포함되도록 할 수 있다.
신호 처리 장치에는 노이즈 포락 정보에 의해 나타나는 노이즈 경계 위치로 분할된 각 구간에 대해서 소정의 신호의 상기 구간을 상기 노이즈 포락 정보에 의해 나타나는 상기 구간의 게인을 나타내는 정보에 기초하여 게인 조정함으로써 상기 고역 성분을 구성하는 노이즈 신호를 생성하는 노이즈 생성부가 더 구비되고, 상기 추출부는 또한 상기 노이즈 포락 정보를 추출하고, 상기 정현파 정보에는 상기 노이즈 경계 위치부터 상기 정현파 성분의 출현 개시 위치까지의 거리를 나타내는 정보가 상기 출현 위치를 특정하기 위한 정보로서 포함되어 있고, 상기 합성부는 상기 저역 신호, 상기 의사 고역 신호, 상기 정현파 신호 및 상기 노이즈 신호를 합성해서 음성 신호를 생성시킬 수 있다.
상기 정현파 정보에는 상기 고역 성분의 포락의 피크 위치부터 상기 정현파 성분의 출현 개시 위치까지의 거리를 나타내는 정보가 상기 출현 위치를 특정하기 위한 정보로서 포함되도록 할 수 있다.
상기 정현파 정보를 프레임마다 추출시키고, 상기 정현파 생성부에는 상기 고역 성분의 프레임마다 상기 정현파 신호를 생성시킬 수 있다.
상기 정현파 정보를 상기 고역 성분을 구성하는 대역마다 추출시키고, 상기 정현파 생성부에는 상기 대역마다 상기 정현파 신호를 생성시킬 수 있다.
본 발명의 제1 측면의 신호 처리 방법 또는 프로그램은 음성 신호의 저역 성분, 상기 음성 신호의 고역 성분의 포락을 나타내는 포락 정보, 및 상기 고역 성분에 포함되는 정현파 성분의 주파수 및 출현 위치를 특정하기 위한 정현파 정보를 추출하고, 상기 저역 성분으로서의 저역 신호와 상기 포락 정보에 기초하여 상기 고역 성분을 구성하는 의사 고역 신호를 생성하고, 상기 정현파 정보에 의해 나타나는 주파수의 정현파 신호로서, 또한 상기 정현파 정보로부터 특정되는 상기 출현 위치를 개시 위치로 하는 정현파 신호를 생성하고, 상기 저역 신호, 상기 의사 고역 신호 및 상기 정현파 신호를 합성해서 음성 신호를 생성하는 스텝을 포함한다.
본 발명의 제1 측면에 있어서는 음성 신호의 저역 성분, 상기 음성 신호의 고역 성분의 포락을 나타내는 포락 정보, 및 상기 고역 성분에 포함되는 정현파 성분의 주파수 및 출현 위치를 특정하기 위한 정현파 정보가 추출되고, 상기 저역 성분으로서의 저역 신호와 상기 포락 정보에 기초하여 상기 고역 성분을 구성하는 의사 고역 신호가 생성되고, 상기 정현파 정보에 의해 나타나는 주파수의 정현파 신호로서, 또한 상기 정현파 정보로부터 특정되는 상기 출현 위치를 개시 위치로 하는 정현파 신호가 생성되고, 상기 저역 신호, 상기 의사 고역 신호 및 상기 정현파 신호가 합성되어서 음성 신호가 생성된다.
본 발명의 제2 측면의 신호 처리 장치는 음성 신호의 고역 성분인 고역 신호의 포락을 나타내는 포락 정보를 생성하는 포락 정보 생성부와, 상기 고역 신호에 포함되는 정현파 신호를 검출하고, 상기 정현파 신호의 주파수 및 출현 위치를 특정하기 위한 정현파 정보를 생성하는 정현파 정보 생성부와, 상기 음성 신호의 저역 성분인 저역 신호, 상기 포락 정보 및 상기 정현파 정보를 포함하여 이루어지는 데이터를 생성해서 출력하는 출력부를 구비한다.
상기 정현파 정보에는 상기 고역 성분의 프레임의 개시 위치부터 상기 정현파 신호의 출현 개시 위치까지의 거리를 나타내는 정보가 상기 출현 위치를 특정하기 위한 정보로서 포함되도록 할 수 있다.
신호 처리 장치에는 상기 고역 신호에 포함되는 노이즈 신호를 검출하고, 상기 노이즈 신호를 몇개의 구간으로 분할하는 노이즈 경계 위치를 나타내는 정보와, 상기 구간에 있어서의 상기 노이즈 신호의 게인을 나타내는 정보를 포함하여 이루어지는 노이즈 포락 정보를 생성하는 노이즈 포락 정보 생성부가 더 구비되고, 상기 정현파 정보에는 상기 노이즈 경계 위치부터 상기 정현파 성분의 출현 개시 위치까지의 거리를 나타내는 정보가 상기 출현 위치를 특정하기 위한 정보로서 포함되도록 하고, 상기 출력부에는 상기 저역 신호, 상기 포락 정보, 상기 정현파 정보 및 상기 노이즈 포락 정보를 포함하여 이루어지는 데이터를 생성시켜서 출력시킬 수 있다.
상기 정현파 정보에는 상기 고역 성분의 포락의 피크 위치부터 상기 정현파 성분의 출현 개시 위치까지의 거리를 나타내는 정보가 상기 출현 위치를 특정하기 위한 정보로서 포함되도록 할 수 있다.
상기 정현파 정보는 프레임마다 생성되도록 할 수 있다.
상기 정현파 정보는 상기 고역 성분을 구성하는 대역마다 생성되도록 할 수 있다.
본 발명의 제2 측면의 신호 처리 방법 또는 프로그램은 음성 신호의 고역 성분인 고역 신호의 포락을 나타내는 포락 정보를 생성하고, 상기 고역 신호에 포함되는 정현파 신호를 검출하고, 상기 정현파 신호의 주파수 및 출현 위치를 특정하기 위한 정현파 정보를 생성하고, 상기 음성 신호의 저역 성분인 저역 신호, 상기 포락 정보 및 상기 정현파 정보를 포함하여 이루어지는 데이터를 생성해서 출력하는 스텝을 포함한다.
본 발명의 제2 측면에 있어서는 음성 신호의 고역 성분인 고역 신호의 포락을 나타내는 포락 정보가 생성되고, 상기 고역 신호에 포함되는 정현파 신호가 검출되고, 상기 정현파 신호의 주파수 및 출현 위치를 특정하기 위한 정현파 정보가 생성되고, 상기 음성 신호의 저역 성분인 저역 신호, 상기 포락 정보 및 상기 정현파 정보를 포함하여 이루어지는 데이터가 생성되어서 출력된다.
본 기술의 제1 측면 및 제2 측면에 의하면, 음성 신호를 복호할 경우에 보다 음질이 좋은 음성을 얻을 수 있다.
도 1은 부호화 장치의 일 실시 형태의 구성예를 도시하는 도면이다.
도 2는 부호화 처리를 설명하는 흐름도이다.
도 3은 정현파 신호의 합성 개시 위치에 대해서 설명하는 도면이다.
도 4는 정현파 신호의 합성 개시 위치에 대해서 설명하는 도면이다.
도 5는 복호 장치의 일 실시 형태의 구성예를 도시하는 도면이다.
도 6은 복호 처리를 설명하는 흐름도이다.
도 7은 정현파 신호 생성 처리를 설명하는 흐름도이다.
도 8은 부호화 장치의 다른 구성예를 도시하는 도면이다.
도 9는 부호화 처리를 설명하는 흐름도이다.
도 10은 정현파 신호의 합성 개시 위치에 대해서 설명하는 도면이다.
도 11은 복호 장치의 다른 구성예를 도시하는 도면이다.
도 12는 복호 처리를 설명하는 흐름도이다.
도 13은 정현파 신호 생성 처리를 설명하는 흐름도이다.
도 14는 부호화 장치의 다른 구성예를 도시하는 도면이다.
도 15는 부호화 처리를 설명하는 흐름도이다.
도 16은 정현파 신호의 합성 개시 위치에 대해서 설명하는 도면이다.
도 17은 복호 장치의 다른 구성예를 도시하는 도면이다.
도 18은 복호 처리를 설명하는 흐름도이다.
도 19는 정현파 신호 생성 처리를 설명하는 흐름도이다.
도 20은 부호화 장치의 다른 구성예를 도시하는 도면이다.
도 21은 부호화 처리를 설명하는 흐름도이다.
도 22는 복호 장치의 다른 구성예를 도시하는 도면이다.
도 23은 복호 처리를 설명하는 흐름도이다.
도 24는 정현파 신호 생성 처리를 설명하는 흐름도이다.
도 25는 컴퓨터의 구성예를 도시하는 도면이다.
도 2는 부호화 처리를 설명하는 흐름도이다.
도 3은 정현파 신호의 합성 개시 위치에 대해서 설명하는 도면이다.
도 4는 정현파 신호의 합성 개시 위치에 대해서 설명하는 도면이다.
도 5는 복호 장치의 일 실시 형태의 구성예를 도시하는 도면이다.
도 6은 복호 처리를 설명하는 흐름도이다.
도 7은 정현파 신호 생성 처리를 설명하는 흐름도이다.
도 8은 부호화 장치의 다른 구성예를 도시하는 도면이다.
도 9는 부호화 처리를 설명하는 흐름도이다.
도 10은 정현파 신호의 합성 개시 위치에 대해서 설명하는 도면이다.
도 11은 복호 장치의 다른 구성예를 도시하는 도면이다.
도 12는 복호 처리를 설명하는 흐름도이다.
도 13은 정현파 신호 생성 처리를 설명하는 흐름도이다.
도 14는 부호화 장치의 다른 구성예를 도시하는 도면이다.
도 15는 부호화 처리를 설명하는 흐름도이다.
도 16은 정현파 신호의 합성 개시 위치에 대해서 설명하는 도면이다.
도 17은 복호 장치의 다른 구성예를 도시하는 도면이다.
도 18은 복호 처리를 설명하는 흐름도이다.
도 19는 정현파 신호 생성 처리를 설명하는 흐름도이다.
도 20은 부호화 장치의 다른 구성예를 도시하는 도면이다.
도 21은 부호화 처리를 설명하는 흐름도이다.
도 22는 복호 장치의 다른 구성예를 도시하는 도면이다.
도 23은 복호 처리를 설명하는 흐름도이다.
도 24는 정현파 신호 생성 처리를 설명하는 흐름도이다.
도 25는 컴퓨터의 구성예를 도시하는 도면이다.
이하, 도면을 참조하여 본 기술을 적용한 실시 형태에 대해서 설명한다.
<제1 실시 형태>
[부호화 장치의 구성예]
도 1은 본 기술을 적용한 부호화 장치의 일 실시 형태의 구성예를 도시하는 도면이다.
부호화 장치(11)는 다운 샘플러(21), 저역 부호화부(22), 대역 분할 필터(23), 포락 정보 생성부(24), 노이즈 포락 정보 생성부(25), 정현파 정보 생성부(26) 및 부호화 스트림 생성부(27)로 구성된다. 부호화 장치(11)는 입력된 음성 신호를 부호화해서 출력하는 것이며, 부호화 장치(11)에 입력된 음성 신호는 다운 샘플러(21) 및 대역 분할 필터(23)에 공급된다.
다운 샘플러(21)는 입력된 음성 신호를 다운 샘플링함으로써 음성 신호의 저역 성분인 저역 신호를 추출하고, 저역 부호화부(22) 및 노이즈 포락 정보 생성부(25)에 공급한다. 또한, 이하, 음성 신호가 특정한 주파수 이하의 주파수 대역 성분을 저역 성분이라고 칭하고, 음성 신호의 저역 성분보다도 높은 주파수 대역의 성분을 고역 성분이라고 칭하기로 한다.
저역 부호화부(22)는 다운 샘플러(21)로부터 공급된 저역 신호를 부호화하여 부호화 스트림 생성부(27)에 공급한다.
대역 분할 필터(23)는 입력된 음성 신호에 대하여 필터 처리를 실시하여 음성 신호의 대역 분할을 행한다. 이 대역 분할에 의해 음성 신호는 복수의 대역 성분의 신호로 분할된다. 또한, 이하, 대역 분할에 의해 얻어진 각 대역의 신호 중 고역 성분을 구성하는 대역의 신호를 고역 신호라고 칭하기로 한다. 대역 분할 필터(23)는 대역 분할에 의해 얻어진 고역측의 각 대역의 고역 신호를 포락 정보 생성부(24), 노이즈 포락 정보 생성부(25) 및 정현파 정보 생성부(26)에 공급한다.
포락 정보 생성부(24)는 대역 분할 필터(23)로부터 공급된 고역 신호에 기초하여 고역측의 대역마다 그 대역의 고역 신호의 포락(엔벨로프) 형상을 나타내는 포락 정보를 생성하고, 노이즈 포락 정보 생성부(25)에 공급한다. 또한, 포락 정보 생성부(24)는 부호화부(41)를 구비하고 있고, 부호화부(41)는 포락 정보 생성부(24)에 의해 생성된 포락 정보를 부호화하여 부호화 스트림 생성부(27)에 공급한다.
노이즈 포락 정보 생성부(25)는 대역 분할 필터(23)로부터의 고역 신호와, 포락 정보 생성부(24)로부터의 포락 정보에 기초하여 필요에 따라서 정현파 정보 생성부(26)와 정보를 주고 받으면서 노이즈 포락 정보를 생성한다.
여기서 노이즈 포락 정보란, 음성 신호의 고역 성분에 포함되는 노이즈 신호를 분할하는 경계 위치(노이즈 경계 위치)를 나타내는 정보와, 노이즈 경계 위치로 분할되는 각 구간에 있어서의 노이즈 신호의 게인을 나타내는 정보를 포함하여 이루어지는 정보이다. 또한, 노이즈 신호는 미리 정해진 신호인 것으로 한다.
또한, 노이즈 포락 정보 생성부(25)는 신호 생성부(51), 경계 산출부(52) 및 부호화부(53)를 구비하고 있다. 신호 생성부(51)는 노이즈 포락 정보의 생성 시에 있어서 다운 샘플러(21)로부터의 저역 신호와, 포락 정보 생성부(24)로부터의 포락 정보에 기초하여 음성 신호의 고역측의 각 대역 성분을 예측한다.
경계 산출부(52)는 노이즈 포락 정보의 생성 시에 있어서 고역측의 각 대역 성분의 예측 결과인 의사 고역 신호와 고역 신호로부터 얻어지는 노이즈 신호의 포락에 기초하여 노이즈 신호를 복수 구간으로 분할하기 위한 노이즈 경계 위치를 결정한다. 부호화부(53)는 노이즈 포락 정보 생성부(25)에 의해 생성된 노이즈 포락 정보를 부호화하여 부호화 스트림 생성부(27)에 공급한다.
정현파 정보 생성부(26)는 필요에 따라서 노이즈 포락 정보 생성부(25)와 정보를 주고 받으면서 대역 분할 필터(23)로부터 공급된 고역 신호에 기초하여 고역측의 대역마다 그 대역에 포함되는 정현파 신호를 얻기 위한 정현파 정보를 생성한다.
여기서 정현파 정보란, 음성 신호의 고역 성분에 포함되는 정현파 신호의 유무를 나타내는 정보, 및 그 정현파 신호의 출현 개시 위치를 특정하기 위한 정보를 포함하여 이루어지는 정보이다. 바꾸어 말하면, 정현파 정보는 음성 신호의 복호 시에 의사적인 고역 성분에 합성되는 정현파 신호의 유무를 나타내는 정보, 및 정현파 신호의 합성 개시 위치를 나타내는 정보를 포함하여 이루어지는 정보라고 할 수 있다.
또한, 정현파 정보 생성부(26)는 정현파 검출부(61), 위치 검출부(62) 및 부호화부(63)를 구비하고 있다. 정현파 검출부(61)는 정현파 정보의 생성 시에 있어서 고역 신호로부터 정현파 성분의 유무를 검출한다.
위치 검출부(62)는 정현파 정보의 생성 시에 있어서 대역 분할 필터(23)로부터의 고역 신호에 기초하여 정현파 신호의 합성을 개시해야 할 합성 개시 위치, 즉 정현파 신호의 출현 개시 위치를 검출한다. 부호화부(63)는 정현파 정보 생성부(26)에 의해 생성된 정현파 정보를 부호화하여 부호화 스트림 생성부(27)에 공급한다.
부호화 스트림 생성부(27)는 저역 부호화부(22)로부터의 저역 신호, 포락 정보 생성부(24)로부터의 포락 정보, 노이즈 포락 정보 생성부(25)로부터의 노이즈 포락 정보 및 정현파 정보 생성부(26)로부터의 정현파 정보를 부호화하고, 부호화에 의해 얻어진 부호화 스트림을 출력한다. 즉, 저역 신호, 포락 정보, 노이즈 포락 정보 및 정현파 정보가 다중화되어서 부호화 스트림이 된다.
[부호화 처리의 설명]
이어서, 부호화 장치(11)의 동작에 대해서 설명한다.
부호화 장치(11)에 음성 신호가 입력되어서 음성 신호의 부호화가 지시되면, 부호화 장치(11)는 부호화 처리를 행하여 음성 신호의 부호화를 행하고, 그 결과 얻어진 부호화 스트림을 출력한다. 이하, 도 2의 흐름도를 참조하여 부호화 장치(11)에 의한 부호화 처리에 대해서 설명한다.
스텝 S11에 있어서, 다운 샘플러(21)는 입력된 음성 신호를 다운 샘플링해서 저역 신호를 생성하고, 노이즈 포락 정보 생성부(25) 및 저역 부호화부(22)에 공급한다.
스텝 S12에 있어서, 저역 부호화부(22)는 다운 샘플러(21)로부터 공급된 저역 신호를 부호화하여 부호화 스트림 생성부(27)에 공급한다. 예를 들어, 저역 신호는 MPEG4 AAC, MPEG2 AAC, CELP(Code Excited Linear Prediction), TCX(Transform Coded Excitation), AMR(Adaptive Multi-Rate) 등의 부호화 방식으로 부호화된다.
스텝 S13에 있어서, 대역 분할 필터(23)는 입력된 음성 신호를 대역 분할하고, 그 결과 얻어진 고역 성분을 포락 정보 생성부(24) 내지 정현파 정보 생성부(26)에 공급한다. 예를 들어, 고역 성분으로서 64개의 대역 각각의 고역 신호가 얻어진다.
스텝 S14에 있어서, 포락 정보 생성부(24)는 대역 분할 필터(23)로부터 공급된 각 대역의 고역 신호에 기초하여 대역마다 포락 정보를 생성한다. 예를 들어, 포락 정보 생성부(24)는 고역 신호의 32샘플을 포함하여 이루어지는 구간을 1프레임으로 하여 프레임마다 각 대역의 포락 정보를 생성한다.
구체적으로는, 포락 정보 생성부(24)는 1프레임에 있어서의 고역 신호의 시간 방향에 인접하는 2개의 샘플의 샘플값의 평균값을 구하고, 그들 평균값을 새로운 고역 신호의 샘플값으로 한다. 이에 의해 1프레임분의 고역 신호는 32샘플에서 16샘플의 신호로 변환되게 된다.
이어서, 포락 정보 생성부(24)는 16샘플이 된 고역 신호에 대하여 차분 부호화를 행하고, 그 결과 얻어진 정보를 포락 정보로 한다. 예를 들어, 차분 부호화에서는 처리 대상의 고역 신호의 시간 방향에 인접하는 2개의 샘플의 샘플값의 차분이 구해져서 그들 차분이 포락 정보가 된다. 또한, 예를 들어 처리 대상의 대역의 고역 신호의 샘플의 샘플값과, 그 대역에 인접하는 대역의 고역 신호의 동일 위치에 있는 샘플의 샘플값의 차분이 포락 정보가 되도록 해도 된다.
이와 같이 하여 얻어진 포락 정보는 고역 신호의 1프레임분의 포락의 형상을 나타내는 정보이다. 부호화부(41)는 생성된 포락 정보에 대하여 하프만 부호화 등의 가변장 부호화를 행하고, 부호화된 포락 정보를 부호화 스트림 생성부(27)에 공급한다. 또한, 포락 정보 생성부(24)는 포락 정보를 노이즈 포락 정보 생성부(25)에 공급한다.
또한, 이하에서는 고역 신호는 32샘플로 구성되는 1프레임을 단위로 하여 처리되는 것으로서 설명을 계속한다. 또한, 이하에서는 고역 신호(음성 신호)의 2개의 샘플로 구성되는 구간을 1타임 슬롯이라고 칭하기로 한다.
스텝 S15에 있어서, 노이즈 포락 정보 생성부(25)의 신호 생성부(51)는 포락 정보 생성부(24)로부터 공급된 포락 정보와, 다운 샘플러(21)로부터 공급된 저역 신호에 기초하여 고역측의 대역마다 의사 고역 신호를 생성한다.
예를 들어, 신호 생성부(51)는 저역 신호의 소정의 대역의 1프레임분의 구간을 추출하고, 추출한 저역 신호를 포락 정보에 의해 나타나는 포락의 형상으로 가공한다. 즉, 저역 신호의 샘플의 샘플값이 포락 정보에 의해 나타나는 포락에 있어서의 그 샘플에 대응하는 위치의 게인이 되도록 증감되고, 그 결과 얻어진 신호가 의사 고역 신호가 된다.
이와 같이 하여 얻어진 의사 고역 신호는 포락 정보에 의해 나타나는 실제의 고역 신호의 포락과 거의 동일한 포락 형상을 갖는 신호이다. 즉, 저역 신호와 포락 정보로부터 생성된 의사적인 고역 신호이다.
스텝 S16에 있어서, 노이즈 포락 정보 생성부(25)는 고역측의 대역마다 고역 신호와 의사 고역 신호의 차분을 산출하여 노이즈 신호의 포락(이하, 노이즈 포락이라고도 칭함)을 구한다.
또한, 보다 상세하게는, 스텝 S16에 있어서 구해지는 노이즈 포락은 가상의 노이즈 포락이다. 부호화 장치(11)로부터 출력되는 부호화 스트림의 수신측에서는 음성 신호의 복호 시에 있어서 음성 신호의 고역 성분이 예측되지만, 그 예측은 의사 고역 신호, 노이즈 신호 및 정현파 신호를 합성함으로써 행해진다.
즉, 실제의 음성 신호의 고역 성분에는 의사 고역 신호, 노이즈 신호 및 정현파 신호가 포함되어 있는 것으로 가정된다. 여기서, 스텝 S16에서는 고역 신호와 의사 고역 신호의 차분이 구해지므로, 그 차분은 노이즈 신호와 정현파 신호를 합성한 것일 것이다. 따라서, 이와 같이 하여 얻어진 차분은 정현파 신호가 포함되어 있는 노이즈 신호의 포락인 것이 된다.
노이즈 포락 정보 생성부(25)는 이상과 같이 해서 얻어진 고역측의 각 대역의 가상의 노이즈 포락을 정현파 정보 생성부(26)에 공급한다.
스텝 S17에 있어서, 정현파 정보 생성부(26)의 정현파 검출부(61)는 노이즈 포락 정보 생성부(25)로부터 공급된 가상의 노이즈 포락에 기초하여 대역마다 고역 신호로부터 정현파 성분을 검출한다.
예를 들어, 정현파 검출부(61)는 가상의 노이즈 포락에 대하여 주파수 변환을 실시하여 노이즈 포락을 주파수 성분으로 변환한다. 그리고, 정현파 검출부(61)는 얻어진 주파수 성분 중에 돌출되어서 파워가 큰 주파수가 있는 경우, 그 주파수의 성분이 정현파 성분이 된다. 구체적으로는, 주목하는 주파수의 파워와, 그 주위의 다른 주파수의 파워의 차분 각각이 소정의 임계값 이상인 경우, 주목하고 있는 주파수가 정현파 성분이 된다. 이와 같이 하여 검출된 주파수의 정현파의 신호가 실제의 고역 성분에 포함되는 정현파 신호인 것이 된다.
스텝 S18에 있어서, 정현파 정보 생성부(26)의 위치 검출부(62)는 대역 분할 필터(23)로부터 공급된 고역 신호에 기초하여 대역마다 검출된 정현파 성분인 정현파 신호를 합성해야 할 합성 개시 위치를 검출한다.
예를 들어, 위치 검출부(62)는 타임 슬롯을 단위로 하여 고역 신호의 1타임 슬롯에 포함되는 샘플의 샘플값의 평균값과, 검출된 정현파 신호의 1타임 슬롯에 포함되는 샘플의 샘플값의 평균값의 차분을 구한다. 그리고, 위치 검출부(62)는 1프레임의 구간의 선두에서 보아 구한 차분의 값이 소정의 임계값 이상이 되는 마지막 위치(타임 슬롯의 개시 위치 또는 종료 위치의 샘플)를 합성 개시 위치로 한다. 이것은, 합성 개시 위치는 실제의 고역 신호에 포함되는 정현파 신호의 출현 개시 위치이며, 합성 개시 위치 이후의 시각에서는 고역 신호와 정현파 신호의 평균적인 샘플값의 차분이 작아질 것이기 때문이다.
또한, 정현파 정보 생성부(26)는 고역측의 대역마다 그 대역으로부터 정현파 신호가 검출되었는지 여부를 나타내는 정보, 검출된 정현파 신호의 주파수 및 파워를 나타내는 정보, 및 합성 개시 위치를 노이즈 포락 정보 생성부(25)에 공급한다.
스텝 S19에 있어서, 정현파 정보 생성부(26)는 고역측의 대역마다 정현파 정보를 생성하여 부호화 스트림 생성부(27)에 공급한다.
예를 들어, 정현파 정보 생성부(26)는 고역의 대역으로부터 정현파 신호가 검출되었는지 여부를 나타내는 정보와 합성 개시 위치를 포함하여 이루어지는 정보를 정현파 정보로 한다. 또한, 정현파 정보의 생성 시에 있어서 정현파 정보 생성부(26)의 부호화부(63)는 합성 개시 위치를 나타내는 정보를 가변장 부호화한다.
여기서, 정현파 신호가 검출되었는지 여부를 나타내는 정보는 보다 상세하게는 고역의 대역의 어느 주파수의 정현파 성분이 검출되었는지를 나타내는 정보가 된다. 예를 들어, 고역의 대역으로부터 복수의 정현파 신호가 검출된 경우에는 그들 정현파 신호의 주파수를 특정하기 위한 정보가 정현파 신호가 검출되었는지 여부를 나타내는 정보가 된다. 또한, 고역의 대역으로부터 복수의 정현파 신호가 검출된 경우에는 그들 정현파 신호마다 합성 개시 위치를 나타내는 정보가 생성되게 된다.
또한, 고역의 대역으로부터 정현파 성분이 검출되지 않은 경우에는 정현파 신호가 검출되었는지 여부를 나타내는 정보만을 포함하여 이루어지는 정현파 정보가 복호측에 송신되게 된다. 즉, 합성 개시 위치를 나타내는 정보가 포함되지 않는 정현파 정보가 송신되게 된다.
또한, 부호화 장치(11)는 프레임마다 정현파 정보를 복호측에 전송할지 여부를 선택할 수 있다. 이와 같이 정현파 정보 송신의 필요 여부를 선택 가능하게 함으로써 부호화 스트림의 전송 효율을 향상시키는 동시에, 정현파 합성의 시간 정보의 리셋을 행할 수 있다. 이에 의해, 부호화 스트림의 복호측에 있어서, 스트림의 도중의 임의의 프레임부터 복호 처리를 개시할 경우에 있어서 합성 개시 위치를 나타내는 정보가 포함되어 있는 프레임부터 정현파 합성을 개시할 수 있다.
또한, 예를 들어 도 3에 도시한 바와 같이, 종래, 복호측에서의 합성 개시 위치는 프레임의 개시 위치 또는 노이즈 경계 위치 중 어느 한쪽이 되어 있었다. 또한, 도면 중 가로 방향은 시간 방향을 나타내고 있다. 또한, 도 3에 있어서 화살표(FS1) 및 화살표(FE1)는 각각 프레임의 개시 위치 및 종료 위치를 나타내고 있다.
도 3의 예에서는 화살표(N1)에 의해 나타나는 위치가 노이즈 경계 위치로 되어 있고, 정현파 신호의 합성 개시 위치도 노이즈 경계 위치와 동일한 위치로 되어 있다. 따라서, 화살표(N1)에 의해 나타나는 위치부터 프레임의 종료 위치까지의 구간에 정현파 신호가 합성되게 된다.
그러나, 예를 들어 실제로 고역 성분에 포함되는 정현파 신호가 출현하는 위치가 화살표(N1)에 의해 나타나는 노이즈 경계 위치보다도 후의 위치에 있는 경우, 복호측에서는 노이즈 경계 위치부터 실제의 정현파 신호의 출현 개시 위치까지의 동안에 불필요한 정현파 성분이 부가되어버리게 된다. 그러면, 복호에 의해 얻어진 음성 신호에 청감 상의 위화감이 발생하여 음질이 좋은 음성을 얻을 수 없게 되어버린다.
이에 반해, 부호화 장치(11)에서는 도 4에 도시한 바와 같이 복호측에 출력되는 합성 개시 위치는 노이즈 경계 위치와 동일하게 된다고 만은 할 수 없다. 또한, 도면 중 가로 방향은 시간 방향을 나타내고 있다. 또한, 도 4에 있어서 화살표(FS2) 및 화살표(FE2)는 각각 프레임의 개시 위치 및 종료 위치를 나타내고 있다.
도 4의 예에서는 화살표(N2)에 의해 나타나는 위치가 노이즈 경계 위치로 되어 있다. 또한, 정현파 신호의 합성 개시 위치는 화살표(G1)에 의해 나타나는 위치로 되어 있고, 합성 개시 위치는 노이즈 경계 위치보다도 앞에 위치하고 있다. 이 예에서는 화살표(G1)에 의해 나타나는 합성 개시 위치부터 프레임의 종료 위치까지의 구간에 정현파 신호가 합성되게 된다.
또한, 이 경우, 화살표(FS2)에 의해 나타나는 프레임의 개시 위치부터 화살표(G1)에 의해 나타나는 합성 개시 위치까지의 시간의 길이(시간 거리)를 나타내는 정보가 합성 개시 위치를 나타내는 정보가 된다. 여기서, 프레임 선두부터 합성 개시 위치까지의 시간은 타임 슬롯 길이의 정수배의 시간이 된다.
이와 같이, 노이즈 경계 위치와는 독립적으로 합성 개시 위치를 지정함으로써 음성 신호의 복호 시에 불필요한 신호가 합성되어버리는 것을 방지할 수 있어 보다 음질이 좋은 음성을 얻을 수 있게 된다.
또한, 이상에서는 정현파 정보로서 고역측의 대역마다 합성 개시 위치를 나타내는 정보를 생성한다고 설명했지만, 그들 대역의 합성 개시 위치의 대표값이 고역을 구성하는 각 대역에 대하여 공통적으로 사용되는 정현파 정보가 되도록 해도 된다. 그러한 경우, 예를 들어 고역을 구성하는 복수의 대역 중 가장 정현파 신호의 파워가 큰 대역의 합성 개시 위치를 나타내는 정보가 정현파 정보가 된다.
또한, 이상에서는 합성 개시 위치를 나타내는 정보가 가변장 부호화되어서 정현파 정보가 된다고 설명했지만, 합성 개시 위치를 나타내는 정보가 부호화되지 않도록 해도 된다.
도 2의 흐름도의 설명으로 되돌아가서 스텝 S19에서 정현파 정보가 생성되면, 그 후, 처리는 스텝 S20으로 진행한다.
스텝 S20에 있어서, 노이즈 포락 정보 생성부(25)의 경계 산출부(52)는 고역측의 대역마다 노이즈 경계 위치를 검출한다.
예를 들어, 경계 산출부(52)는 정현파 정보 생성부(26)로부터 공급된 정현파 신호가 검출되었는지 여부를 나타내는 정보, 정현파 신호의 주파수 및 파워를 나타내는 정보, 및 합성 개시 위치에 기초하여 고역을 구성하는 대역의 프레임에 포함되는 정현파 신호를 생성한다. 예를 들어, 정현파 신호가 검출된 경우, 프레임의 선두부터 합성 개시 위치까지의 구간은 무음 구간이 되고, 그 이후의 구간은 검출된 주파수의 소정 진폭의 정현파 성분을 포함하여 이루어지는 구간이 된다. 이 때, 정현파 신호의 진폭은 정현파 정보 생성부(26)로부터 공급된 정현파 신호의 파워를 나타내는 정보로부터 정해진다. 또한, 정현파 신호가 검출되지 않은 경우에는 정현파 신호의 진폭은 0이 된다.
이어서, 경계 산출부(52)는 이와 같이 하여 구한 정현파 신호를 스텝 S16에서 구한 가상의 노이즈 포락으로부터 감산하여 최종적인 노이즈 포락을 구한다. 그리고, 경계 산출부(52)는 최종적인 노이즈 포락의 게인의 분포에 따라서 노이즈 경계 위치를 결정한다.
즉, 경계 산출부(52)는 최종적인 노이즈 포락의 게인의 분포에 기초하여 필요에 따라서 프레임을 2개의 구간으로 분할한다. 구체적으로는, 처리 대상의 대역의 프레임 전체에 있어서 노이즈 포락의 게인이 거의 동일한 값이 되어 있는 경우에는 프레임의 분할은 행해지지 않는다. 즉, 노이즈 경계 위치는 없는 것이 된다.
또한, 프레임에 있어서의 소정의 위치에서 그 위치보다 앞의 구간과 후의 구간에서 노이즈 포락의 게인 분포가 크게 상이한 경우에는 그 위치가 노이즈 경계 위치가 된다. 또한, 노이즈 경계 위치는 타임 슬롯의 경계 위치가 된다.
스텝 S21에 있어서, 노이즈 포락 정보 생성부(25)는 고역측의 대역마다 노이즈 포락 정보를 생성하여 부호화 스트림 생성부(27)에 공급한다.
예를 들어, 노이즈 포락 정보 생성부(25)는 노이즈 경계 위치와, 그 노이즈 경계 위치에 의해 분할되는 프레임 내의 각 구간에 있어서의 노이즈 신호의 게인을 포함하여 이루어지는 정보를 노이즈 포락 정보로 한다. 이 때, 부호화부(53)는 노이즈 경계 위치를 나타내는 정보의 부호화, 및 분할된 각 구간의 게인을 나타내는 정보의 가변장 부호화를 행한다.
여기서, 분할된 각 구간의 게인은, 예를 들어 그들 구간에 있어서의 노이즈 포락의 게인의 평균값 등이 된다. 즉, 예를 들어 처리 대상의 프레임이 노이즈 경계 위치에 의해 2개의 구간으로 분할되었다고 하자. 이 경우, 프레임 선두부터 노이즈 경계 위치까지의 구간의 게인은 그 구간에 있어서의 최종적인 노이즈 포락의 각 위치에 있어서의 게인의 평균값이 된다.
스텝 S22에 있어서, 부호화 스트림 생성부(27)는 저역 부호화부(22)로부터의 저역 신호, 포락 정보 생성부(24)로부터의 포락 정보, 노이즈 포락 정보 생성부(25)로부터의 노이즈 포락 정보, 및 정현파 정보 생성부(26)로부터의 정현파 정보를 부호화하여 부호화 스트림을 생성한다. 그리고, 부호화 스트림 생성부(27)는 부호화에 의해 얻어진 부호화 스트림을 복호 장치 등에 송신하고, 부호화 처리는 종료한다.
이상과 같이 하여, 부호화 장치(11)는 저역 신호, 포락 정보, 노이즈 포락 정보 및 정현파 정보를 포함하여 이루어지는 부호화 스트림을 생성해서 출력한다. 이 때, 보다 정확한 정현파 신호의 합성 개시 위치를 검출하여 그 합성 개시 위치를 포함하는 정현파 정보를 생성함으로써 음성 신호의 복호측에 있어서 보다 정확하게 정현파 신호의 합성을 행할 수 있게 되어 보다 음질이 좋은 음성을 얻을 수 있게 된다.
또한, 이상에서는 다운 샘플러(21)에 의해 생성된 저역 신호가 노이즈 포락 정보 생성부(25)에 공급된다고 설명했지만, 노이즈 포락 정보 생성부(25)에 공급되는 저역 신호는 대역 분할 필터(23)에 의한 대역 분할로 얻어지는 저역 신호이어도 된다. 또한, 저역 부호화부(22)에서 부호화된 저역 신호를 복호해서 얻어진 것이 노이즈 포락 정보 생성부(25)에 공급되도록 해도 된다.
[복호 장치의 구성예]
이어서, 도 1의 부호화 장치(11)로부터 출력된 부호화 스트림을 수신하여 부호화 스트림으로부터 음성 신호를 얻는 복호 장치에 대해서 설명한다. 그러한 복호 장치는, 예를 들어 도 5에 도시하는 바와 같이 구성된다.
도 5의 복호 장치(91)는 부호화 스트림 복호부(101), 저역 복호부(102), 포락 정보 복호부(103), 노이즈 포락 정보 복호부(104), 정현파 정보 복호부(105) 및 대역 합성 필터(106)로 구성된다.
부호화 스트림 복호부(101)는 부호화 장치(11)로부터 송신되어 온 부호화 스트림을 수신해서 복호한다. 즉, 부호화 스트림 복호부(101)는 부호화 스트림을 비다중화하고, 이에 의해 얻어진 저역 신호, 포락 정보, 노이즈 포락 정보 및 정현파 정보를 저역 복호부(102), 포락 정보 복호부(103), 노이즈 포락 정보 복호부(104) 및 정현파 정보 복호부(105)에 공급한다.
저역 복호부(102)는 부호화 스트림 복호부(101)로부터 공급된 저역 신호를 복호하여 포락 정보 복호부(103) 및 대역 합성 필터(106)에 공급한다.
포락 정보 복호부(103)는 부호화 스트림 복호부(101)로부터 공급된 포락 정보를 복호함과 함께, 복호된 포락 정보를 정현파 정보 복호부(105)에 공급한다. 또한, 포락 정보 복호부(103)는 생성부(121)를 구비하고 있고, 생성부(121)는 포락 정보와, 저역 복호부(102)로부터의 저역 신호에 기초하여 의사 고역 신호를 생성하여 대역 합성 필터(106)에 공급한다.
노이즈 포락 정보 복호부(104)는 부호화 스트림 복호부(101)로부터 공급된 노이즈 포락 정보를 복호한다. 또한, 노이즈 포락 정보 복호부(104)는 생성부(131)를 구비하고 있고, 생성부(131)는 노이즈 포락 정보에 기초하여 노이즈 신호를 생성하여 대역 합성 필터(106)에 공급한다.
정현파 정보 복호부(105)는 부호화 스트림 복호부(101)로부터 공급된 정현파 정보를 복호한다. 또한, 정현파 정보 복호부(105)는 생성부(141)를 구비하고 있고, 생성부(141)는 포락 정보 복호부(103)로부터의 포락 정보와 정현파 정보에 기초하여 정현파 신호를 생성하여 대역 합성 필터(106)에 공급한다.
대역 합성 필터(106)는 저역 복호부(102)로부터의 저역 신호, 포락 정보 복호부(103)로부터의 의사 고역 신호, 노이즈 포락 정보 복호부(104)로부터의 노이즈 신호, 및 정현파 정보 복호부(105)로부터의 정현파 신호를 대역 합성하여 음성 신호를 생성한다. 대역 합성 필터(106)는 대역 합성에 의해 얻어진 신호를 복호된 음성 신호로서 후단의 재생부 등에 출력한다.
[복호 처리의 설명]
도 5에 도시한 복호 장치(91)에 부호화 장치(11)로부터의 부호화 스트림이 송신되어 오면, 복호 장치(91)는 프레임 단위로 복호 처리를 행하여 음성 신호를 복호한다. 이하, 도 6의 흐름도를 참조하여 복호 장치(91)에 의한 복호 처리에 대해서 설명한다.
스텝 S51에 있어서, 부호화 스트림 복호부(101)는 부호화 장치(11)로부터 수신된 부호화 스트림을 복호하고, 그 결과 얻어진 저역 신호, 포락 정보, 노이즈 포락 정보 및 정현파 정보를 저역 복호부(102) 내지 정현파 정보 복호부(105)에 공급한다.
스텝 S52에 있어서, 저역 복호부(102)는 부호화 스트림 복호부(101)로부터의 저역 신호를 복호하여 포락 정보 복호부(103) 및 대역 합성 필터(106)에 공급한다.
스텝 S53에 있어서, 포락 정보 복호부(103)는 부호화 스트림 복호부(101)로부터의 포락 정보를 복호한다. 또한, 포락 정보 복호부(103)는 복호된 포락 정보를 정현파 정보 복호부(105)에 공급한다.
스텝 S54에 있어서, 포락 정보 복호부(103)의 생성부(121)는 고역측의 대역마다 포락 정보와 저역 복호부(102)로부터의 저역 신호에 기초하여 의사 고역 신호를 생성하여 대역 합성 필터(106)에 공급한다. 예를 들어, 생성부(121)는 저역 신호의 소정 대역의 1프레임의 구간을 추출하고, 추출한 저역 신호의 샘플의 샘플값이 포락 정보로 나타나는 포락에 있어서의 그 샘플에 대응하는 위치의 게인이 되도록 저역 신호를 증감시킴으로써 의사 고역 신호를 생성한다.
스텝 S55에 있어서, 노이즈 포락 정보 복호부(104)는 부호화 스트림 복호부(101)로부터의 노이즈 포락 정보를 복호한다.
스텝 S56에 있어서, 노이즈 포락 정보 복호부(104)의 생성부(131)는 고역측의 대역마다 노이즈 포락 정보에 기초하여 노이즈 신호를 생성하여 대역 합성 필터(106)에 공급한다. 즉 생성부(131)는 미리 정해진 신호에 대하여 노이즈 포락 정보에 의해 나타나는 노이즈 경계 위치로 분할되는 구간마다 그 신호의 게인이 노이즈 포락 정보에 의해 나타나는 게인이 되도록 게인 조정을 행함으로써 노이즈 신호를 생성한다.
스텝 S57에 있어서, 정현파 정보 복호부(105)는 부호화 스트림 복호부(101)로부터의 정현파 정보를 복호한다. 예를 들어, 정현파 정보에 포함되어 있는 합성 개시 위치를 나타내는 정보가 필요에 따라서 복호된다.
스텝 S58에 있어서, 정현파 정보 복호부(105)는 정현파 신호 생성 처리를 행해서 고역측의 대역마다 정현파 신호를 생성하여 대역 합성 필터(106)에 공급한다. 또한, 정현파 신호 생성 처리의 상세한 것은 후술한다.
스텝 S59에 있어서, 대역 합성 필터(106)는 저역 복호부(102)로부터의 저역 신호, 포락 정보 복호부(103)로부터의 의사 고역 신호, 노이즈 포락 정보 복호부(104)로부터의 노이즈 신호, 및 정현파 정보 복호부(105)로부터의 정현파 신호를 대역 합성한다.
즉, 저역 복호부(102) 내지 정현파 정보 복호부(105)로부터 입력되어 오는 저역 신호, 각 대역의 의사 고역 신호, 각 대역의 노이즈 신호 및 각 대역의 정현파 신호의 각 시각의 샘플을 가산함으로써 대역 합성을 행하여 음성 신호를 생성한다. 여기서, 의사 고역 신호, 노이즈 신호 및 정현파 신호를 포함하여 이루어지는 신호가 예측에 의해 얻어진 고역 성분이다.
대역 합성 필터(106)는 대역 합성에 의해 음성 신호가 얻어지면, 그 음성 신호를 후단의 재생부 등에 출력하고, 복호 처리는 종료한다. 이 복호 처리는 프레임마다 행해지고, 복호 장치(91)는 다음 프레임의 부호화 스트림이 입력되면, 그 프레임의 부호화 스트림에 대하여 복호 처리를 행한다.
이와 같이 하여, 복호 장치(91)는 저역 신호와, 포락 정보, 노이즈 포락 정보 및 정현파 정보에 기초하여 고역 성분을 예측하고, 예측에 의해 얻어진 고역 신호와, 복호된 저역 신호로부터 대역 확장된 음성 신호를 생성한다. 이 때, 보다 정확한 정현파 신호의 합성 개시 위치가 나타나는 정현파 정보를 사용함으로써 보다 정확하게 정현파 신호의 합성을 행할 수 있어 보다 음질이 좋은 음성을 얻을 수 있다.
[정현파 신호 생성 처리의 설명]
이어서, 도 7의 흐름도를 참조하여 도 6의 스텝 S58의 처리에 대응하는 정현파 신호 생성 처리에 대해서 설명한다.
스텝 S81에 있어서, 정현파 정보 복호부(105)의 생성부(141)는 정현파 정보에 포함되는 정현파 신호가 검출되었는지 여부를 나타내는 정보와 합성 개시 위치에 기초하여 정현파 합성 처리의 개시 시각이 되었는지 여부를 판정한다.
예를 들어, 생성부(141)는 고역 성분을 구성하는 정현파 성분으로서 프레임의 선두를 출현 개시 위치로 하고, 프레임의 종단부를 출현 종료 위치로 하는 정현파 신호를 생성한다.
여기서, 고역 성분을 구성하는 정현파 성분이 되는 정현파 신호의 주파수는 정현파 정보에 포함되어 있는 정현파 신호가 검출되었는지 여부를 나타내는 정보에 의해 특정된다. 또한, 정현파 정보에 의해 특정되는 주파수의 정현파 신호의 진폭은 포락 정보 복호부(103)로부터 정현파 정보 복호부(105)에 공급된 포락 정보로부터 특정된다. 예를 들어, 생성부(141)는 포락 정보를 주파수 변환하여 그 결과 얻어진 각 주파수의 파워 중의 정현파 신호의 주파수의 파워에 기초하여 정현파 신호의 진폭을 구한다.
이어서, 생성부(141)는 1프레임분의 정현파 신호에 있어서의 타임 슬롯의 개시 위치에 있는 샘플을 프레임의 선두부터 순서대로 처리 대상의 샘플(타임 슬롯)로서 선택해 간다. 그리고, 생성부(141)는 선택한 샘플의 위치가 합성 개시 위치에 의해 나타나는 샘플 위치, 즉 정현파 신호의 합성을 개시해야 할 시각인지를 판정한다. 예를 들어, 정현파 정보에 정현파 신호가 검출되지 않은 취지의 정보가 포함되어 있는 경우에는 계속해서 정현파 합성 처리의 개시 시각이 되어 있지 않다고 판정된다.
스텝 S81에 있어서, 개시 시각이 되어 있지 않다고 판정된 경우, 스텝 S82에 있어서, 생성부(141)는 생성한 정현파 신호를 1타임 슬롯분만큼 시간 방향에서의 후방향측으로 시프트한다. 이에 의해 정현파 신호의 출현 개시 위치가 시간 방향의 후방측으로 시프트되게 된다. 정현파 신호의 시프트가 행해지면, 처리 대상으로 되어 있는 타임 슬롯의 구간에서는 정현파는 아직 출현하고 있지 않으므로, 정현파 신호가 정현파 정보 복호부(105)로부터 대역 합성 필터(106)에는 출력되지 않는다.
스텝 S83에 있어서, 생성부(141)는 1프레임의 종단부에 도달했는지 여부를 판정한다. 예를 들어, 프레임을 구성하는 마지막 타임 슬롯의 구간이 처리 대상으로 된 경우, 즉 프레임 내의 모든 타임 슬롯이 처리된 경우, 프레임의 종단부에 도달했다고 판정된다.
스텝 S83에 있어서, 프레임의 종단부에 도달하고 있지 않다고 판단된 경우, 다음의 타임 슬롯이 처리 대상으로서 선택되어 처리는 스텝 S81에 복귀되어 상술한 처리가 반복된다. 이 경우, 이미 생성된 정현파 신호에 대하여 시프트 처리 등이 행해진다.
이에 반해, 스텝 S83에 있어서, 프레임의 종단부에 도달했다고 판정된 경우, 정현파 신호 생성 처리는 종료하고, 그 후, 처리는 도 6의 스텝 S59로 진행한다. 이 경우에는 정현파 신호의 합성이 행해지지 않게 된다.
또한, 스텝 S81에 있어서, 정현파 합성 처리의 개시 시각이 되었다고 판정된 경우, 스텝 S84에 있어서, 생성부(141)는 정현파 합성 처리를 행한다. 즉, 생성부(141)는 적절히 시프트 처리된 정현파 신호의 처리 대상으로 되어 있는 타임 슬롯을 구성하는 샘플의 샘플값을 대역 합성 필터(106)에 출력한다. 이에 의해, 출력된 정현파 신호의 샘플의 샘플값이 고역 성분을 구성하는 정현파 성분으로서 저역 신호에 합성되게 된다.
스텝 S85에 있어서, 생성부(141)는 1프레임의 종단부에 도달했는지 여부를 판정한다. 예를 들어, 프레임을 구성하는 마지막 타임 슬롯의 구간이 처리된 경우, 프레임의 종단부에 도달했다고 판정된다.
스텝 S85에 있어서, 프레임의 종단부에 도달하고 있지 않다고 판단된 경우, 다음의 타임 슬롯이 처리 대상으로서 선택되어 처리는 스텝 S84에 복귀되어 상술한 처리가 반복된다. 이에 반해, 스텝 S85에 있어서, 프레임의 종단부에 도달했다고 판정된 경우, 정현파 신호 생성 처리는 종료되고, 그 후, 처리는 도 6의 스텝 S59로 진행한다.
이와 같이 하여, 정현파 정보 복호부(105)는 정현파 정보에 기초하여 정현파 신호의 출현 개시 위치를 합성 개시 위치까지 시프트시키고, 시프트된 정현파 신호를 출력한다. 이에 의해, 1프레임에 있어서의 보다 정확한 위치부터 정현파 신호의 합성이 개시되게 되어 보다 음질이 좋은 음성을 얻을 수 있다.
<제2 실시 형태>
[부호화 장치의 구성예]
또한, 이상에서는 정현파 정보에는 프레임의 선두 위치부터 정현파 신호의 합성을 개시해야 할 위치까지의 시간(샘플수)을 나타내는 합성 개시 위치가 포함된다고 설명했지만, 합성 개시 위치와 노이즈 경계 위치의 차분 정보가 포함되도록 해도 된다.
그러한 경우, 부호화 장치는, 예를 들어 도 8에 도시한 바와 같이 구성된다. 또한, 도 8에 있어서, 도 1에 있어서의 경우와 대응하는 부분에는 동일한 부호를 붙이고 있고, 그 설명은 적절히 생략한다. 도 8의 부호화 장치(171)와 부호화 장치(11)는 부호화 장치(171)의 정현파 정보 생성부(26)에 새롭게 차분 산출부(181)가 설치되어 있는 점에서 상이하고, 그 밖의 점에서는 동일하다.
정현파 정보 생성부(26)의 차분 산출부(181)는 위치 검출부(62)에 의해 검출된 정현파 신호의 합성 개시 위치와 노이즈 경계 위치의 차분을 산출한다. 정현파 정보 생성부(26)는 차분 산출부(181)에 의해 산출된 노이즈 경계 위치와의 차분을 나타내는 차분 정보, 및 정현파 신호가 검출되었는지 여부를 나타내는 정보를 포함하여 이루어지는 정보를 정현파 정보로 하여 부호화 스트림 생성부(27)에 공급한다.
[부호화 처리의 설명]
이어서, 도 9의 흐름도를 참조하여 부호화 장치(171)에 의한 부호화 처리를 설명한다. 또한, 스텝 S111 내지 스텝 S118의 처리는 도 2의 스텝 S11 내지 스텝 S18의 처리 각각과 동일하므로, 그 설명은 생략한다.
스텝 S119에 있어서, 노이즈 포락 정보 생성부(25)의 경계 산출부(52)는 고역측의 대역마다 노이즈 경계 위치를 검출한다. 그리고, 스텝 S120에 있어서, 노이즈 포락 정보 생성부(25)는 고역측의 대역마다 노이즈 포락 정보를 생성하여 부호화 스트림 생성부(27)에 공급한다. 또한, 스텝 S119 및 스텝 S120에서는, 도 2의 스텝 S20 및 스텝 S21과 동일한 처리가 행해진다.
스텝 S121에 있어서, 정현파 정보 생성부(26)의 차분 산출부(181)는 고역측의 대역마다 위치 검출부(62)에 의해 검출된 정현파 신호의 합성 개시 위치와 노이즈 경계 위치의 차분을 산출한다.
예를 들어, 도 10에 도시한 바와 같이, 정현파 합성의 개시 위치부터 노이즈 경계 위치까지의 시간(샘플수)이 차분으로서 산출된다. 또한, 도면 중 가로 방향은 시간 방향을 나타내고 있다. 또한, 도 10에 있어서 화살표(FS11) 및 화살표(FE11)는 각각 프레임의 개시 위치 및 종료 위치를 나타내고 있다.
도 10의 예에서는 프레임 내에 있어서의 화살표(N11)에 의해 나타나는 위치가 노이즈 경계 위치로 되어 있다. 또한, 정현파 신호의 합성 개시 위치는 화살표(G11)에 의해 나타나는 위치로 되어 있고, 합성 개시 위치는 노이즈 경계 위치보다도 앞에 위치하고 있다. 따라서, 화살표(G11)에 의해 나타나는 합성 개시 위치부터 프레임의 종료 위치까지의 구간에 정현파 신호가 합성되게 된다.
이 예에서는 화살표(G11)에 의해 나타나는 합성 개시 위치부터 화살표(N11)에 의해 나타나는 노이즈 경계 위치까지의 시간의 길이(시간 거리)가 노이즈 경계 위치와의 차분 정보가 된다. 여기서, 합성 개시 위치부터 노이즈 경계 위치까지의 시간은 타임 슬롯 길이의 정수배의 시간이 된다.
이와 같이 하여 구해진 합성 개시 위치부터 노이즈 경계 위치까지의 시간을 나타내는 차분 정보에 의해서도 음성 신호의 복호측에 있어서 보다 정확한 합성 개시 위치를 특정할 수 있어 보다 음질이 좋은 음성을 얻을 수 있게 된다.
도 9의 흐름도의 설명으로 되돌아가서 스텝 S121에 있어서 노이즈 경계 위치와의 차분 정보가 얻어지면, 처리는 스텝 S122로 진행한다.
스텝 S122에 있어서, 정현파 정보 생성부(26)는 고역측의 대역마다 정현파 정보를 생성하여 부호화 스트림 생성부(27)에 공급한다.
예를 들어, 정현파 정보 생성부(26)는 고역의 대역으로부터 정현파 신호가 검출되었는지 여부를 나타내는 정보 및 합성 개시 위치와 노이즈 경계 위치의 차분 정보를 포함하여 이루어지는 정보를 정현파 정보로 한다. 이 때, 정현파 정보 생성부(26)의 부호화부(63)는 노이즈 경계 위치와의 차분 정보를 가변장 부호화한다. 정현파 정보 생성부(26)는 가변장 부호화된 차분 정보와 정현파 신호가 검출되었는지 여부를 나타내는 정보를 포함하여 이루어지는 정현파 정보를 부호화 스트림 생성부(27)에 공급한다.
정현파 정보가 생성되면, 그 후, 스텝 S123의 처리가 행해져서 부호화 처리는 종료되지만, 스텝 S123의 처리는 도 2의 스텝 S22의 처리와 동일하므로, 그 설명은 생략한다.
이상과 같이 하여, 부호화 장치(171)는 저역 신호, 포락 정보, 노이즈 포락 정보 및 정현파 정보를 포함하여 이루어지는 부호화 스트림을 생성해서 출력한다. 이 때, 보다 정확한 정현파 신호의 합성 개시 위치를 검출하여 그 합성 개시 위치를 특정하기 위한 차분 정보가 포함되는 정현파 정보를 생성함으로써 음성 신호의 복호측에 있어서 보다 정확하게 정현파 신호의 합성을 행할 수 있게 된다. 이에 의해 보다 음질이 좋은 음성을 얻을 수 있다.
[복호 장치의 구성예]
또한, 부호화 장치(171)로부터 송신된 부호화 스트림을 수신하여 부호화 스트림으로부터 음성 신호를 얻는 복호 장치는, 예를 들어 도 11에 도시하는 바와 같이 구성된다. 또한, 도 11에 있어서, 도 5에 있어서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있고, 그 설명은 적절히 생략한다. 도 11의 복호 장치(211)와 복호 장치(91)는 복호 장치(211)의 정현파 정보 복호부(105)에 새롭게 위치 산출부(221)가 설치되어 있는 점에서 상이하며, 그 밖의 점에서는 동일하다.
복호 장치(211)의 위치 산출부(221)는 노이즈 포락 정보 복호부(104)로부터 공급된 노이즈 경계 위치와, 정현파 정보로부터 얻어지는 차분 정보로부터 정현파 신호의 합성 개시 위치를 산출한다.
[복호 처리의 설명]
이어서, 도 12의 흐름도를 참조하여 복호 장치(211)에 의해 행해지는 복호 처리에 대해서 설명한다. 또한, 스텝 S151 내지 스텝 S157의 처리는 도 6의 스텝 S51 내지 스텝 S57의 처리와 동일하므로, 그 설명은 생략한다. 단, 스텝 S155에 있어서, 노이즈 포락 정보 복호부(104)는 복호에 의해 얻어진 노이즈 포락 정보에 포함되어 있는 노이즈 경계 위치를 나타내는 정보를 정현파 정보 복호부(105)에 공급한다.
스텝 S158에 있어서, 정현파 정보 복호부(105)는 정현파 신호 생성 처리를 행해서 고역측의 대역마다 정현파 신호를 생성하여 대역 합성 필터(106)에 공급한다. 또한, 정현파 신호 생성 처리의 상세한 것은 후술한다.
정현파 신호 생성 처리가 행해지면, 그 후, 스텝 S159의 처리가 행해져서 복호 처리는 종료되지만, 스텝 S159의 처리는 도 6의 스텝 S59의 처리와 동일하므로, 그 설명은 생략한다.
[정현파 신호 생성 처리의 설명]
또한, 도 12의 스텝 S158에 있어서, 정현파 정보 복호부(105)는 도 13에 도시하는 정현파 신호 생성 처리를 행한다. 이하, 도 13의 흐름도를 참조하여 스텝 S158의 처리에 대응하는 정현파 신호 생성 처리에 대해서 설명한다.
스텝 S181에 있어서, 정현파 정보 복호부(105)의 위치 산출부(221)는 노이즈 포락 정보 복호부(104)로부터 공급된 노이즈 경계 위치와, 정현파 정보로부터 얻어진 차분 정보로부터 정현파 신호의 합성 개시 위치를 산출한다. 즉, 처리 대상의 프레임의 개시 위치부터 노이즈 경계 위치까지의 시간으로부터 합성 개시 위치와 노이즈 경계 위치의 시간의 차분이 감산되어 프레임의 개시 위치부터 정현파 신호의 합성 개시 위치까지의 시간이 구해지고, 합성 개시 위치의 시각(샘플)이 특정된다.
합성 개시 위치가 산출되면, 그 후, 스텝 S182 내지 스텝 S186의 처리가 행해져서 정현파 신호 생성 처리는 종료되지만, 이들 처리는 도 7의 스텝 S81 내지 스텝 S85의 처리와 동일하므로, 그 설명은 생략한다. 이와 같이 하여 정현파 신호 생성 처리가 종료되면, 그 후, 처리는 도 12의 스텝 S159로 진행한다.
이상과 같이 하여 정현파 정보 복호부(105)는 정현파 정보에 포함되는 차분 정보와 노이즈 경계 위치로부터 보다 정확한 정현파 신호의 합성 개시 위치를 산출한다. 이에 의해 1프레임에 있어서의 보다 정확한 위치부터 정현파 신호의 합성을 개시할 수 있어 보다 음질이 좋은 음성을 얻을 수 있다.
<제3 실시 형태>
[부호화 장치의 구성예]
또한, 제2 실시 형태에 있어서는, 정현파 정보에 합성 개시 위치와 노이즈 경계 위치의 차분 정보가 포함되는 예에 대해서 설명했지만, 정현파 정보에 합성 개시 위치와 고역 신호의 포락의 피크 위치의 차분 정보가 포함되도록 해도 된다.
그러한 경우, 부호화 장치는, 예를 들어 도 14에 도시하는 바와 같이 구성된다. 또한, 도 14에 있어서, 도 1에 있어서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있고, 그 설명은 적절히 생략한다. 도 14의 부호화 장치(251)와 부호화 장치(11)는 부호화 장치(251)의 정현파 정보 생성부(26)에 새롭게 피크 검출부(261) 및 차분 산출부(262)가 설치되어 있는 점에서 상이하며, 그 밖의 점에서는 동일하다.
부호화 장치(251)에서는 포락 정보 생성부(24)로부터 노이즈 포락 정보 생성부(25)에 공급된 포락 정보가, 또한 노이즈 포락 정보 생성부(25)로부터 정현파 정보 생성부(26)에도 공급된다. 피크 검출부(261)는 노이즈 포락 정보 생성부(25)로부터 공급된 포락 정보에 기초하여 고역 신호의 포락의 피크 위치를 검출한다.
차분 산출부(262)는 위치 검출부(62)에 의해 검출된 정현파 신호의 합성 개시 위치와, 고역 신호의 포락의 피크 위치의 차분을 산출한다. 정현파 정보 생성부(26)는 차분 산출부(262)에 의해 산출된 피크 위치와의 차분을 나타내는 차분 정보 및 정현파 신호가 검출되었는지 여부를 나타내는 정보를 포함하여 이루어지는 정보를 정현파 정보로서 부호화 스트림 생성부(27)에 공급한다.
[부호화 처리의 설명]
이어서, 도 15의 흐름도를 참조하여 부호화 장치(251)에 의한 부호화 처리를 설명한다. 또한, 스텝 S211 내지 스텝 S218의 처리는 도 2의 스텝 S11 내지 스텝 S18의 처리 각각과 동일하므로, 그 설명은 생략한다. 단, 스텝 S214에서는 생성된 포락 정보가 포락 정보 생성부(24)로부터 노이즈 포락 정보 생성부(25)를 거쳐서 정현파 정보 생성부(26)에도 공급된다.
스텝 S219에 있어서, 정현파 정보 생성부(26)의 피크 검출부(261)는 고역측의 대역마다 노이즈 포락 정보 생성부(25)로부터 공급된 포락 정보에 기초하여 고역 신호의 포락의 피크 위치를 검출한다. 예를 들어, 포락 정보에 의해 나타나는 고역 신호의 포락에 있어서 게인이 최대가 되는 위치가 고역 신호의 포락의 피크 위치로서 검출된다.
스텝 S220에 있어서, 차분 산출부(262)는 고역측의 대역마다 위치 검출부(62)에 의해 검출된 정현파 신호의 합성 개시 위치와, 피크 검출부(261)에 의해 검출된 포락의 피크 위치의 차분을 산출한다.
예를 들어, 도 16에 도시한 바와 같이, 정현파 합성의 개시 위치부터 포락의 피크 위치까지의 시간(샘플수)이 차분으로서 산출된다. 또한, 도면 중 가로 방향은 시간 방향을 나타내고 있다. 또한, 도 16에 있어서 화살표(FS21) 및 화살표(FE21)는 각각 프레임의 개시 위치 및 종료 위치를 나타내고 있다.
도 16의 예에서는 고역 신호의 포락이 점선으로 표현되어 있고, 화살표(P1)에 의해 나타나는 위치가 그 포락의 피크 위치로 되어 있다. 또한, 정현파 신호의 합성 개시 위치는 화살표(G21)에 의해 나타나는 위치로 되어 있고, 합성 개시 위치는 포락의 피크 위치보다도 앞에 위치하고 있다. 복호 시에는 화살표(G21)에 의해 나타나는 합성 개시 위치부터 프레임의 종료 위치까지의 구간에 정현파 신호가 합성되게 된다.
이 예에서는 화살표(G21)에 의해 나타나는 합성 개시 위치부터 화살표(P1)에 의해 나타나는 고역 신호의 포락의 피크 위치까지의 시간의 길이(시간 거리)가 피크 위치와의 차분 정보가 된다. 여기서, 합성 개시 위치부터 피크 위치까지의 시간은 타임 슬롯 길이의 정수배의 시간이 된다.
이와 같이 하여 구해진 합성 개시 위치부터 피크 위치까지의 시간을 나타내는 차분 정보에 의해서도 음성 신호의 복호측에 있어서 보다 정확한 합성 개시 위치를 특정할 수 있어 보다 음질이 좋은 음성을 얻을 수 있게 된다.
도 15의 흐름도의 설명으로 되돌아가서 스텝 S220에 있어서, 피크 위치와의 차분 정보가 얻어지면, 처리는 스텝 S221로 진행한다.
스텝 S221에 있어서, 정현파 정보 생성부(26)는 고역측의 대역마다 정현파 정보를 생성하여 부호화 스트림 생성부(27)에 공급한다.
예를 들어, 정현파 정보 생성부(26)는 고역의 대역으로부터 정현파 신호가 검출되었는지 여부를 나타내는 정보 및 합성 개시 위치와 피크 위치의 차분 정보를 포함하여 이루어지는 정보를 정현파 정보로 한다. 이 때, 정현파 정보 생성부(26)의 부호화부(63)는 피크 위치와의 차분 정보를 가변장 부호화한다. 정현파 정보 생성부(26)는 가변장 부호화된 차분 정보와, 정현파 신호가 검출되었는지 여부를 나타내는 정보를 포함하여 이루어지는 정현파 정보를 부호화 스트림 생성부(27)에 공급한다.
정현파 정보가 생성되면, 그 후, 스텝 S222 내지 스텝 S224의 처리가 행해져서 부호화 처리는 종료되지만, 이들 처리는 도 2의 스텝 S20 내지 스텝 S22의 처리와 동일하므로, 그 설명은 생략한다.
이상과 같이 하여 부호화 장치(251)는 저역 신호, 포락 정보, 노이즈 포락 정보 및 정현파 정보를 포함하여 이루어지는 부호화 스트림을 생성해서 출력한다. 이 때, 보다 정확한 정현파 신호의 합성 개시 위치를 검출하여 그 합성 개시 위치를 특정하기 위한 차분 정보가 포함되는 정현파 정보를 생성함으로써 음성 신호의 복호측에 있어서 보다 정확하게 정현파 신호의 합성을 행할 수 있게 된다. 이에 의해 보다 음질이 좋은 음성을 얻을 수 있다.
[복호 장치의 구성예]
또한, 부호화 장치(251)로부터 송신된 부호화 스트림을 수신하여 부호화 스트림으로부터 음성 신호를 얻는 복호 장치는, 예를 들어 도 17에 도시한 바와 같이 구성된다. 또한, 도 17에 있어서, 도 5에 있어서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있고, 그 설명은 적절히 생략한다. 도 17의 복호 장치(301)과 복호 장치(91)는 복호 장치(301)의 정현파 정보 복호부(105)에 새롭게 위치 산출부(311)가 설치되어 있는 점에서 상이하며, 그 밖의 점에서는 동일하다.
복호 장치(301)의 위치 산출부(311)는 포락 정보 복호부(103)로부터 공급된 포락 정보와, 정현파 정보로부터 얻어지는 차분 정보로부터 정현파 신호의 합성 개시 위치를 산출한다.
[복호 처리의 설명]
이어서, 도 18의 흐름도를 참조하여 복호 장치(301)에 의해 행해지는 복호 처리에 대해서 설명한다. 또한, 스텝 S251 내지 스텝 S257의 처리는 도 6의 스텝 S51 내지 스텝 S57의 처리와 동일하므로, 그 설명은 생략한다.
스텝 S258에 있어서, 정현파 정보 복호부(105)는 정현파 신호 생성 처리를 행해서 고역측의 대역마다 정현파 신호를 생성하여 대역 합성 필터(106)에 공급한다. 또한, 정현파 신호 생성 처리의 상세한 것은 후술한다.
정현파 신호 생성 처리가 행해지면, 그 후, 스텝 S259의 처리가 행해져서 복호 처리는 종료되지만, 스텝 S259의 처리는 도 6의 스텝 S59의 처리와 동일하므로, 그 설명은 생략한다.
[정현파 신호 생성 처리의 설명]
또한, 도 18의 스텝 S258에 있어서, 정현파 정보 복호부(105)는 도 19에 도시하는 정현파 신호 생성 처리를 행한다. 이하, 도 19의 흐름도를 참조하여 스텝 S258의 처리에 대응하는 정현파 신호 생성 처리에 대해서 설명한다.
스텝 S281에 있어서, 정현파 정보 복호부(105)의 위치 산출부(311)는 포락 정보 복호부(103)로부터 공급된 포락 정보와, 정현파 정보로부터 얻어진 차분 정보로부터 정현파 신호의 합성 개시 위치를 산출한다.
즉, 위치 산출부(311)는 포락 정보에 의해 나타나는 고역 신호의 포락에 있어서 게인이 최대가 되는 위치를 고역 신호의 포락의 피크 위치로서 검출한다. 그리고, 위치 산출부(311)는 처리 대상의 프레임의 개시 위치부터 피크 위치까지의 시간으로부터 합성 개시 위치와 피크 위치의 시간의 차분을 감산하여 프레임의 개시 위치부터 정현파 신호의 합성 개시 위치까지의 시간을 구하고, 합성 개시 위치의 시각(샘플)을 특정한다.
합성 개시 위치가 산출되면, 그 후, 스텝 S282 내지 스텝 S286의 처리가 행해져서 정현파 신호 생성 처리는 종료되지만, 이들 처리는 도 7의 스텝 S81 내지 스텝 S85의 처리와 동일하므로, 그 설명은 생략한다. 이와 같이 하여 정현파 신호 생성 처리가 종료되면, 그 후, 처리는 도 18의 스텝 S259로 진행한다.
이상과 같이 하여 정현파 정보 복호부(105)는 정현파 정보에 포함되는 차분 정보와 고역 신호의 포락의 피크 위치로부터 보다 정확한 정현파 신호의 합성 개시 위치를 산출한다. 이에 의해 1프레임에 있어서의 보다 정확한 위치부터 정현파 신호의 합성을 개시할 수 있어 보다 음질이 좋은 음성을 얻을 수 있다.
또한, 이상에서는 복호 장치(301)측에서도 포락의 피크 위치의 검출을 행한다고 설명했지만, 정현파 정보에 피크 위치를 나타내는 정보가 포함되도록 해도 된다. 그러한 경우, 부호화 장치(251)의 정현파 정보 생성부(26)는 피크 위치를 나타내는 정보를 포함하는 정현파 정보를 생성하고, 복호 장치(301)의 위치 산출부(311)는 정현파 정보에 포함되는 차분 정보와 피크 위치를 나타내는 정보로부터 합성 개시 위치를 산출한다.
<제4 실시 형태>
[부호화 장치의 구성예]
또한, 이상에서는 합성 개시 위치, 노이즈 경계 위치와의 차분 정보 또는 피크 위치와의 차분 정보 중 미리 정한 정보가 정현파 정보에 포함된다고 설명했지만, 이들 중 가장 부호량이 적은 것이 선택되어서 정현파 정보에 포함되도록 해도 된다.
그러한 경우, 부호화 장치는, 예를 들어 도 20에 도시한 바와 같이 구성된다. 또한, 도 20에 있어서, 도 1 또는 도 14에 있어서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있고, 그 설명은 적절히 생략한다. 도 20의 부호화 장치(341)와 도 1의 부호화 장치(11)는 부호화 장치(341)의 정현파 정보 생성부(26)에 새롭게 피크 검출부(261), 차분 산출부(351) 및 선택부(352)가 설치되어 있는 점에서 상이하며, 그 밖의 점에서는 동일하다.
부호화 장치(341)에서는 포락 정보 생성부(24)로부터 노이즈 포락 정보 생성부(25)에 공급된 포락 정보가, 또한 노이즈 포락 정보 생성부(25)로부터 정현파 정보 생성부(26)에도 공급되고, 피크 검출부(261)는 포락 정보에 기초하여 고역 신호의 포락의 피크 위치를 검출한다.
차분 산출부(351)는 위치 검출부(62)에 의해 검출된 정현파 신호의 합성 개시 위치와 고역 신호의 포락의 피크 위치의 차분을 산출한다. 또한, 차분 산출부(351)는 합성 개시 위치와 노이즈 경계 위치의 차분도 산출한다.
선택부(352)는 합성 개시 위치, 피크 위치와의 차분 정보 및 노이즈 경계 위치와의 차분 정보 중 가변장 부호화했을 때에 가장 부호량이 적어지는 정보를 선택한다. 정현파 정보 생성부(26)는 선택부(352)에 의한 선택 결과를 나타내는 정보, 선택부(352)에 의해 선택된 정보 및 정현파 신호가 검출되었는지 여부를 나타내는 정보를 포함하여 이루어지는 정보를 정현파 정보로서 부호화 스트림 생성부(27)에 공급한다.
[부호화 처리의 설명]
이어서, 도 21의 흐름도를 참조하여 부호화 장치(341)에 의한 부호화 처리를 설명한다. 또한, 스텝 S311 내지 스텝 S321의 처리는 도 9의 스텝 S111 내지 스텝 S121의 처리 각각과 동일하므로, 그 설명은 생략한다.
단, 스텝 S321에서는, 정현파 정보 생성부(26)의 차분 산출부(351)가 고역측의 대역마다 위치 검출부(62)에 의해 검출된 정현파 신호의 합성 개시 위치와 노이즈 경계 위치의 차분을 산출한다. 또한, 스텝 S314에서는, 생성된 포락 정보가 포락 정보 생성부(24)로부터 노이즈 포락 정보 생성부(25)를 거쳐서 정현파 정보 생성부(26)에도 공급된다.
스텝 S322에 있어서, 정현파 정보 생성부(26)의 피크 검출부(261)는 고역측의 대역마다 노이즈 포락 정보 생성부(25)로부터 공급된 포락 정보에 기초하여 고역 신호의 포락의 피크 위치를 검출한다.
스텝 S323에 있어서, 차분 산출부(351)는 고역측의 대역마다 위치 검출부(62)에 의해 검출된 정현파 신호의 합성 개시 위치와, 피크 검출부(261)에 의해 검출된 포락의 피크 위치의 차분을 산출한다.
또한, 이들 스텝 S322 및 스텝 S323에서는 도 15의 스텝 S219 및 스텝 S220과 동일한 처리가 행해진다.
스텝 S324에 있어서, 선택부(352)는 고역측의 대역마다 합성 개시 위치, 합성 개시 위치와 피크 위치의 차분 정보 및 합성 개시 위치와 노이즈 경계 위치의 차분 정보 중 가변장 부호화했을 때에 가장 부호량이 적어지는 정보를 선택한다. 그리고, 선택부(352)는 그 선택 결과를 나타내는 선택 정보를 생성한다. 이 때, 합성 개시 위치 등의 부호량만이 산출되어서 비교되어도 되고, 실제로 합성 개시 위치 등의 정보가 가변장 부호화되어서 그 부호량이 비교되어도 된다.
스텝 S325에 있어서, 정현파 정보 생성부(26)는 고역측의 대역마다 정현파 정보를 생성하여 부호화 스트림 생성부(27)에 공급한다.
구체적으로는, 정현파 정보 생성부(26)는 고역의 대역으로부터 정현파 신호가 검출되었는지 여부를 나타내는 정보, 선택 정보 및 선택 정보에 의해 나타나는 정보를 포함하여 이루어지는 정보를 정현파 정보로 한다. 이 때, 정현파 정보 생성부(26)의 부호화부(63)는 선택 정보 및 선택 정보에 의해 나타나는 정보를 가변장 부호화한다. 정현파 정보 생성부(26)는 가변장 부호화된 선택 정보 및 선택 정보에 의해 나타나는 정보와, 정현파 신호가 검출되었는지 여부를 나타내는 정보를 포함하여 이루어지는 정현파 정보를 부호화 스트림 생성부(27)에 공급한다.
예를 들어, 선택 정보에 의해 나타나는 정보가 합성 개시 위치와 피크 위치의 차분 정보인 경우, 선택 정보, 피크 위치와의 차분 정보 및 정현파 신호가 검출되었는지 여부를 나타내는 정보를 포함하여 이루어지는 정보가 정현파 정보가 된다. 이와 같이, 정현파 신호의 합성 개시 위치를 특정하는 정보 중 가장 부호량이 적은 것이 포함되는 정현파 정보를 생성함으로써 부호화 스트림의 부호량을 보다 적게 할 수 있다.
정현파 정보가 생성되면, 그 후, 스텝 S326의 처리가 행해져서 부호화 처리는 종료되지만, 이 처리는 도 15의 스텝 S224의 처리와 동일하므로, 그 설명은 생략한다.
이상과 같이 하여 부호화 장치(341)는 저역 신호, 포락 정보, 노이즈 포락 정보 및 정현파 정보를 포함하여 이루어지는 부호화 스트림을 생성해서 출력한다. 이 때, 합성 개시 위치를 특정하기 위한 정보 중 가장 부호량이 적은 정보가 포함되는 정현파 정보를 생성함으로써 전송되는 스트림의 데이터량을 삭감시킴과 함께, 음성 신호의 복호측에 있어서 보다 정확하게 정현파 신호의 합성을 행할 수 있다. 이에 의해 보다 음질이 좋은 음성을 얻을 수 있다.
[복호 장치의 구성예]
또한, 부호화 장치(341)로부터 송신된 부호화 스트림을 수신하여 부호화 스트림으로부터 음성 신호를 얻는 복호 장치는, 예를 들어 도 22에 도시한 바와 같이 구성된다. 또한, 도 22에 있어서, 도 5에 있어서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있고, 그 설명은 적절히 생략한다. 도 22의 복호 장치(381)와 복호 장치(91)는 복호 장치(381)의 정현파 정보 복호부(105)에 새롭게 위치 산출부(391)가 설치되어 있는 점에서 상이하며, 그 밖의 점에서는 동일하다.
복호 장치(381)의 위치 산출부(391)는 정현파 정보에 포함되는 선택 정보에 따라서 정현파 정보로부터 얻어지는 피크 위치와의 차분 정보 또는 노이즈 경계 위치와의 차분 정보로부터 정현파 신호의 합성 개시 위치를 산출한다.
[복호 처리의 설명]
이어서, 도 23의 흐름도를 참조하여 복호 장치(381)에 의해 행해지는 복호 처리에 대해서 설명한다. 또한, 스텝 S351 내지 스텝 S356의 처리는 도 6의 스텝 S51 내지 스텝 S56의 처리와 동일하므로, 그 설명은 생략한다.
단, 스텝 S355에 있어서, 노이즈 포락 정보 복호부(104)는 복호에 의해 얻어진 노이즈 포락 정보에 포함되어 있는 노이즈 경계 위치를 나타내는 정보를 정현파 정보 복호부(105)에 공급한다.
스텝 S357에 있어서, 정현파 정보 복호부(105)는 부호화 스트림 복호부(101)로부터의 정현파 정보를 복호한다. 예를 들어, 정현파 정보에 포함되어 있는 선택 정보와, 그 선택 정보에 의해 특정되는 합성 개시 위치를 얻기 위한 정보가 복호된다.
스텝 S358에 있어서, 정현파 정보 복호부(105)는 정현파 신호 생성 처리를 행해서 고역측의 대역마다 정현파 신호를 생성하여 대역 합성 필터(106)에 공급한다. 또한, 정현파 신호 생성 처리의 상세한 것은 후술한다.
정현파 신호 생성 처리가 행해지면, 그 후, 스텝 S359의 처리가 행해져서 복호 처리는 종료되지만, 스텝 S359의 처리는 도 6의 스텝 S59의 처리와 동일하므로, 그 설명은 생략한다.
[정현파 신호 생성 처리의 설명]
또한, 도 23의 스텝 S358에 있어서, 정현파 정보 복호부(105)는 도 24에 도시하는 정현파 신호 생성 처리를 행한다. 이하, 도 24의 흐름도를 참조하여 스텝 S358에 대응하는 정현파 신호 생성 처리에 대해서 설명한다.
스텝 S381에 있어서, 위치 산출부(391)는 선택 정보에 의해 나타나는 정현파 신호의 합성 개시 위치를 얻기 위한 정보가 합성 개시 위치 바로 그것을 나타내는 정보인지 여부를 판정한다. 즉, 정현파 정보에 합성 개시 위치가 포함되어 있는지 여부가 판정된다.
스텝 S381에 있어서, 선택 정보에 의해 나타나는 정보가 합성 개시 위치를 나타내는 정보라고 판정된 경우, 처리는 스텝 S385로 진행한다.
한편, 스텝 S381에 있어서, 선택 정보에 의해 나타나는 정보가 합성 개시 위치를 나타내는 정보가 아니라고 판정된 경우, 처리는 스텝 S382로 진행한다.
스텝 S382에 있어서, 위치 산출부(391)는 선택 정보에 의해 나타나는 정현파 신호의 합성 개시 위치를 얻기 위한 정보가 합성 개시 위치와 노이즈 경계 위치의 차분 정보인지 여부를 판정한다. 즉, 정현파 정보에 노이즈 경계 위치와의 차분 정보가 포함되어 있는지 여부가 판정된다.
스텝 S382에 있어서, 선택 정보에 의해 나타나는 정보가 노이즈 경계 위치와의 차분 정보라고 판정된 경우, 처리는 스텝 S383으로 진행한다.
스텝 S383에 있어서, 정현파 정보 복호부(105)의 위치 산출부(391)는 노이즈 포락 정보 복호부(104)로부터 공급된 노이즈 경계 위치와, 정현파 정보로부터 얻어진 노이즈 경계 위치의 차분 정보로부터 정현파 신호의 합성 개시 위치를 산출한다. 합성 개시 위치가 산출되면, 그 후, 처리는 스텝 S385로 진행한다.
또한, 스텝 S382에 있어서, 선택 정보에 의해 나타나는 정보가 노이즈 경계 위치와의 차분 정보가 아니라고 판정된 경우, 즉, 선택 정보에 의해 나타나는 정보가 합성 개시 위치와 피크 위치의 차분 정보인 경우, 처리는 스텝 S384로 진행한다.
스텝 S384에 있어서, 정현파 정보 복호부(105)의 위치 산출부(391)는 포락 정보 복호부(103)로부터 공급된 포락 정보 및 정현파 정보로부터 얻어진 고역 신호의 포락의 피크 위치와의 차분 정보로부터 정현파 신호의 합성 개시 위치를 산출한다.
즉, 위치 산출부(391)는 포락 정보에 의해 나타나는 고역 신호의 포락에 있어서 게인이 최대가 되는 위치를 고역 신호의 포락의 피크 위치로서 검출한다. 그리고, 위치 산출부(391)는 처리 대상의 프레임의 개시 위치부터 피크 위치까지의 시간으로부터 합성 개시 위치와 피크 위치의 시간의 차분을 감산하여 프레임의 개시 위치부터 정현파 신호의 합성 개시 위치까지의 시간을 구하고, 합성 개시 위치의 시각(샘플)을 특정한다. 합성 개시 위치가 산출되면, 그 후, 처리는 스텝 S385로 진행한다.
스텝 S381에 있어서, 선택 정보에 의해 나타나는 정보가 합성 개시 위치를 나타내는 정보라고 판정되었거나, 스텝 S383에 있어서 합성 개시 위치가 산출되었거나 또는 스텝 S384에 있어서 합성 개시 위치가 산출되면, 처리는 스텝 S385로 진행한다. 그리고, 스텝 S385 내지 스텝 S389의 처리가 행해져서 정현파 신호 생성 처리는 종료되지만, 이들 처리는 도 7의 스텝 S81 내지 스텝 S85의 처리와 동일하므로, 그 설명은 생략한다. 이와 같이 하여 정현파 신호 생성 처리가 종료되면, 그 후, 처리는 도 23의 스텝 S359로 진행한다.
이상과 같이 하여 정현파 정보 복호부(105)는 선택 정보로부터 정현파 정보에 포함되어 있는 정보를 특정하고, 그 특정 결과에 따라서 적절히 정확한 정현파 신호의 합성 개시 위치를 산출한다. 이에 의해 1프레임에 있어서의 보다 정확한 위치부터 정현파 신호의 합성을 개시할 수 있어 보다 음질이 좋은 음성을 얻을 수 있다.
상술한 일련의 처리는 하드웨어에 의해 실행할 수도 있고, 소프트웨어에 의해 실행할 수도 있다. 일련의 처리를 소프트웨어에 의해 실행할 경우에는, 그 소프트웨어를 구성하는 프로그램이 전용의 하드웨어에 내장되어 있는 컴퓨터 또는, 각종 프로그램을 인스톨함으로써 각종 기능을 실행하는 것이 가능한, 예를 들어 범용의 퍼스널 컴퓨터 등에 프로그램 기록 매체로부터 인스톨된다.
도 25는 상술한 일련의 처리를 프로그램에 의해 실행하는 컴퓨터의 하드웨어의 구성예를 도시하는 블록도이다.
컴퓨터에 있어서 CPU(501), ROM(Read Only Memory)(502), RAM(Random Access Memory)(503)은 버스(504)에 의해 서로 접속되어 있다.
버스(504)에는 또한 입출력 인터페이스(505)가 접속되어 있다. 입출력 인터페이스(505)에는 키보드, 마우스, 마이크로폰 등으로 이루어지는 입력부(506), 디스플레이, 스피커 등으로 이루어지는 출력부(507), 하드 디스크나 불휘발성의 메모리 등을 포함하여 이루어지는 기록부(508), 네트워크 인터페이스 등으로 이루어지는 통신부(509), 자기 디스크, 광 디스크, 광자기 디스크, 또는 반도체 메모리 등의 리무버블 미디어(511)를 구동하는 드라이브(510)가 접속되어 있다.
이상과 같이 구성되는 컴퓨터에서는 CPU(501)가, 예를 들어 기록부(508)에 기록되어 있는 프로그램을 입출력 인터페이스(505) 및 버스(504)를 통해서 RAM(503)에 로드해서 실행함으로써 상술한 일련의 처리가 행해진다.
컴퓨터(CPU501)가 실행하는 프로그램은, 예를 들어 자기 디스크(플렉시블 디스크를 포함함), 광 디스크(CD-ROM(Compact Disc-Read Only Memory), DVD(Digital Versatile Disc) 등), 광자기 디스크, 또는 반도체 메모리 등을 포함하여 이루어지는 패키지 미디어인 리무버블 미디어(511)에 기록하여, 또는, 근거리 네트워크, 인터넷, 디지털 위성 방송이라는 유선 또는 무선의 전송 매체를 통해서 제공된다.
그리고, 프로그램은 리무버블 미디어(511)를 드라이브(510)에 장착함으로써 입출력 인터페이스(505)를 통해서 기록부(508)에 인스톨할 수 있다. 또한, 프로그램은 유선 또는 무선의 전송 매체를 통해서 통신부(509)에서 수신하여 기록부(508)에 인스톨할 수 있다. 그 밖에 프로그램은 ROM(502)이나 기록부(508)에 미리 인스톨해 둘 수 있다.
또한, 컴퓨터가 실행하는 프로그램은 본 명세서에서 설명하는 순서에 따라서 시계열로 처리가 행해지는 프로그램이어도 되고, 병렬로, 또는 호출이 행해졌을 때 등의 필요한 타이밍에 처리가 행해지는 프로그램이어도 된다.
또한, 본 기술의 실시 형태는 상술한 실시 형태에 한정되지는 않으며, 본 기술의 요지를 일탈하지 않는 범위에서 다양한 변경이 가능하다.
11 : 부호화 장치
22 : 저역 부호화부
24 : 포락 정보 생성부
25 : 노이즈 포락 정보 생성부
26 : 정현파 정보 생성부
52 : 경계 산출부
61 : 정현파 검출부
62 : 위치 검출부
91 : 복호 장치
102 : 저역 복호부
103 : 포락 정보 복호부
104 : 노이즈 포락 정보 복호부
105 : 정현파 정보 복호부
141 : 생성부
181 : 차분 산출부
221 : 위치 산출부
261 : 피크 검출부
262 : 차분 산출부
311 : 위치 검출부
351 : 차분 산출부
352 : 선택부
391 : 위치 산출부
22 : 저역 부호화부
24 : 포락 정보 생성부
25 : 노이즈 포락 정보 생성부
26 : 정현파 정보 생성부
52 : 경계 산출부
61 : 정현파 검출부
62 : 위치 검출부
91 : 복호 장치
102 : 저역 복호부
103 : 포락 정보 복호부
104 : 노이즈 포락 정보 복호부
105 : 정현파 정보 복호부
141 : 생성부
181 : 차분 산출부
221 : 위치 산출부
261 : 피크 검출부
262 : 차분 산출부
311 : 위치 검출부
351 : 차분 산출부
352 : 선택부
391 : 위치 산출부
Claims (3)
- 신호 처리 장치로서,
음성 신호의 부호화된 저역 성분과 함께, 상기 음성 신호의 고역 성분의 포락을 나타내는 포락 정보, 상기 고역 성분에 포함되는 정현파 성분의 주파수 및 출현 위치를 특정하기 위한 정현파 정보, 및 상기 고역 성분에 포함되는 노이즈 신호의 노이즈 경계 위치 및 노이즈 경계 위치에 나타나는 각 구간의 게인을 나타내는 노이즈 포락 정보를 포함하는 부호화된 SBR(Spectral Band Replication) 정보를 수취하고, 상기 저역 성분 및 상기 SBR 정보에 포함된 각 정보를 복호하는 복호부와,
상기 저역 성분으로서의 저역 신호와 상기 포락 정보에 기초하여, 상기 고역 성분에 포함되는 의사 고역 신호를 생성하는 의사 고역 생성부와,
노이즈 포락 정보에 의해 나타나는 노이즈 경계 위치로 분할된 각 구간에 대해서, 소정의 신호의 상기 구간을, 상기 노이즈 포락 정보에 의해 나타나는 상기 구간의 게인을 나타내는 정보에 기초하여 게인 조정함으로써, 상기 고역 성분에 포함되는 노이즈 신호를 생성하는 노이즈 생성부와,
상기 정현파 정보에 의해 나타나는 주파수의 정현파 신호로서, 상기 고역 성분의 프레임의 개시 위치로부터 상기 정현파 성분의 출현 개시 위치까지의 거리를 나타내는 정보이며, 상기 노이즈 포락 정보가 나타내는 프레임 내의 위치와는 독립적인 위치를 개시 위치로 하는 정현파 신호를 생성하는 정현파 생성부와,
상기 저역 신호, 상기 의사 고역 신호, 상기 정현파 신호, 및 상기 노이즈 신호를 합성해서 음성 신호를 생성하는 합성부
를 구비하는, 신호 처리 장치. - 복호부에 의해, 음성 신호의 부호화된 저역 성분과 함께, 상기 음성 신호의 고역 성분의 포락을 나타내는 포락 정보, 상기 고역 성분에 포함되는 정현파 성분의 주파수 및 출현 위치를 특정하기 위한 정현파 정보, 및 상기 고역 성분에 포함되는 노이즈 신호의 노이즈 경계 위치 및 노이즈 경계 위치에 나타나는 각 구간의 게인을 나타내는 노이즈 포락 정보를 포함하는 부호화된 SBR 정보를 수취하고, 상기 저역 성분 및 상기 SBR 정보에 포함된 각 정보를 복호하는 스텝과,
의사 고역 생성부에 의해, 상기 저역 성분으로서의 저역 신호와 상기 포락 정보에 기초하여, 상기 고역 성분에 포함되는 의사 고역 신호를 생성하는 스텝과,
노이즈 생성부에 의해, 노이즈 포락 정보에 의해 나타나는 노이즈 경계 위치로 분할된 각 구간에 대해서, 소정의 신호의 상기 구간을, 상기 노이즈 포락 정보에 의해 나타나는 상기 구간의 게인을 나타내는 정보에 기초하여 게인 조정함으로써, 상기 고역 성분에 포함되는 노이즈 신호를 생성하는 스텝과,
정현파 생성부에 의해, 상기 정현파 정보에 의해 나타나는 주파수의 정현파 신호로서, 상기 고역 성분의 프레임의 개시 위치로부터 상기 정현파 성분의 출현 개시 위치까지의 거리를 나타내는 정보이며, 상기 노이즈 포락 정보가 나타내는 프레임 내의 위치와는 독립적인 위치를 개시 위치로 하는 정현파 신호를 생성하는 스텝과,
합성부에 의해, 상기 저역 신호, 상기 의사 고역 신호, 상기 정현파 신호, 및 상기 노이즈 신호를 합성해서 음성 신호를 생성하는 스텝
을 포함하는 신호 처리 방법. - 프로그램이 기록된 컴퓨터 판독가능 기록 매체로서, 상기 프로그램은,
음성 신호의 부호화된 저역 성분과 함께, 상기 음성 신호의 고역 성분의 포락을 나타내는 포락 정보, 상기 고역 성분에 포함되는 정현파 성분의 주파수 및 출현 위치를 특정하기 위한 정현파 정보, 및 상기 고역 성분에 포함되는 노이즈 신호의 노이즈 경계 위치 및 노이즈 경계 위치에 나타나는 각 구간의 게인을 나타내는 노이즈 포락 정보를 포함하는 부호화된 SBR 정보를 수취하고, 상기 저역 성분 및 상기 SBR 정보에 포함된 각 정보를 복호하고,
상기 저역 성분으로서의 저역 신호와 상기 포락 정보에 기초하여, 상기 고역 성분에 포함되는 의사 고역 신호를 생성하고,
노이즈 포락 정보에 의해 나타나는 노이즈 경계 위치로 분할된 각 구간에 대해서, 소정의 신호의 상기 구간을, 상기 노이즈 포락 정보에 의해 나타나는 상기 구간의 게인을 나타내는 정보에 기초하여 게인 조정함으로써, 상기 고역 성분에 포함되는 노이즈 신호를 생성하고,
상기 정현파 정보에 의해 나타나는 주파수의 정현파 신호로서, 상기 고역 성분의 프레임의 개시 위치로부터 상기 정현파 성분의 출현 개시 위치까지의 거리를 나타내는 정보이며, 상기 노이즈 포락 정보가 나타내는 프레임 내의 위치와는 독립적인 위치를 개시 위치로 하는 정현파 신호를 생성하고,
상기 저역 신호, 상기 의사 고역 신호, 상기 정현파 신호, 및 상기 노이즈 신호를 합성해서 음성 신호를 생성하는 스텝을 포함하는 처리를 컴퓨터에 실행시키는, 컴퓨터 판독가능 기록 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2011-006233 | 2011-01-14 | ||
JP2011006233A JP5743137B2 (ja) | 2011-01-14 | 2011-01-14 | 信号処理装置および方法、並びにプログラム |
PCT/JP2012/050173 WO2012096230A1 (ja) | 2011-01-14 | 2012-01-06 | 信号処理装置および方法、並びにプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197011892A Division KR102010220B1 (ko) | 2011-01-14 | 2012-01-06 | 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190095530A true KR20190095530A (ko) | 2019-08-14 |
KR102048672B1 KR102048672B1 (ko) | 2019-11-25 |
Family
ID=46507130
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137017522A KR101975066B1 (ko) | 2011-01-14 | 2012-01-06 | 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체 |
KR1020197011892A KR102010220B1 (ko) | 2011-01-14 | 2012-01-06 | 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체 |
KR1020197022968A KR102048672B1 (ko) | 2011-01-14 | 2012-01-06 | 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137017522A KR101975066B1 (ko) | 2011-01-14 | 2012-01-06 | 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체 |
KR1020197011892A KR102010220B1 (ko) | 2011-01-14 | 2012-01-06 | 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체 |
Country Status (12)
Country | Link |
---|---|
US (3) | US20130275142A1 (ko) |
EP (3) | EP4435780A2 (ko) |
JP (1) | JP5743137B2 (ko) |
KR (3) | KR101975066B1 (ko) |
CN (1) | CN103314407B (ko) |
AU (1) | AU2012206122B2 (ko) |
BR (1) | BR112013017427B1 (ko) |
CA (1) | CA2820195C (ko) |
MX (1) | MX345045B (ko) |
RU (1) | RU2604338C2 (ko) |
TW (1) | TWI498885B (ko) |
WO (1) | WO2012096230A1 (ko) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP6037156B2 (ja) | 2011-08-24 | 2016-11-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
JPWO2014007097A1 (ja) | 2012-07-02 | 2016-06-02 | ソニー株式会社 | 復号装置および方法、符号化装置および方法、並びにプログラム |
BR112014004127A2 (pt) | 2012-07-02 | 2017-04-04 | Sony Corp | dispositivo e método de decodificação, programa, e, dispositivo e método de codificação |
CA2843223A1 (en) | 2012-07-02 | 2014-01-09 | Sony Corporation | Decoding device, decoding method, encoding device, encoding method, and program |
JP6284298B2 (ja) * | 2012-11-30 | 2018-02-28 | Kddi株式会社 | 音声合成装置、音声合成方法および音声合成プログラム |
CN104584124B (zh) * | 2013-01-22 | 2019-04-16 | 松下电器产业株式会社 | 编码装置、解码装置、编码方法、以及解码方法 |
ES2768179T3 (es) | 2013-01-29 | 2020-06-22 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, método para proporcionar una información de audio codificada, método para proporcionar una información de audio decodificada, programa informático y representación codificada utilizando una ampliación de ancho de banda adaptada a la señal |
EP2954517B1 (en) | 2013-02-05 | 2016-07-27 | Telefonaktiebolaget LM Ericsson (publ) | Audio frame loss concealment |
US9666202B2 (en) | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
CN105765655A (zh) * | 2013-11-22 | 2016-07-13 | 高通股份有限公司 | 高频带译码中的选择性相位补偿 |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
BR112017024480A2 (pt) * | 2016-02-17 | 2018-07-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | pós-processador, pré-processador, codificador de áudio, decodificador de áudio e métodos relacionados para aprimoramento do processamento transiente |
US10887395B2 (en) * | 2016-11-21 | 2021-01-05 | Ecosteer Srl | Processing signals from a sensor group |
JP6769299B2 (ja) * | 2016-12-27 | 2020-10-14 | 富士通株式会社 | オーディオ符号化装置およびオーディオ符号化方法 |
EP3435376B1 (en) * | 2017-07-28 | 2020-01-22 | Fujitsu Limited | Audio encoding apparatus and audio encoding method |
CN113948094A (zh) * | 2020-07-16 | 2022-01-18 | 华为技术有限公司 | 音频编解码方法和相关装置及计算机可读存储介质 |
CN112233685B (zh) * | 2020-09-08 | 2024-04-19 | 厦门亿联网络技术股份有限公司 | 基于深度学习注意力机制的频带扩展方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001521648A (ja) | 1997-06-10 | 2001-11-06 | コーディング テクノロジーズ スウェーデン アクチボラゲット | スペクトル帯域複製を用いた原始コーディングの強化 |
US20050080621A1 (en) * | 2002-08-01 | 2005-04-14 | Mineo Tsushima | Audio decoding apparatus and audio decoding method |
US20080221905A1 (en) * | 2006-10-18 | 2008-09-11 | Markus Schnell | Encoding an Information Signal |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2049456C1 (ru) * | 1993-06-22 | 1995-12-10 | Вячеслав Алексеевич Сапрыкин | Способ передачи речевых сигналов |
US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
WO2001041124A2 (en) * | 1999-12-01 | 2001-06-07 | Koninklijke Philips Electronics N.V. | Method of and system for coding and decoding sound signals |
ATE325109T1 (de) * | 2000-12-27 | 2006-06-15 | Pola Chem Ind Inc | Benzofuranderivate und pharmazeutische zusammensetzungen, die diese enthalten |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US20050228648A1 (en) * | 2002-04-22 | 2005-10-13 | Ari Heikkinen | Method and device for obtaining parameters for parametric speech coding of frames |
JP4313993B2 (ja) * | 2002-07-19 | 2009-08-12 | パナソニック株式会社 | オーディオ復号化装置およびオーディオ復号化方法 |
JP3861770B2 (ja) * | 2002-08-21 | 2006-12-20 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
ES2259158T3 (es) * | 2002-09-19 | 2006-09-16 | Matsushita Electric Industrial Co., Ltd. | Metodo y aparato decodificador audio. |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
KR20070001185A (ko) * | 2004-03-17 | 2007-01-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
JP5224017B2 (ja) * | 2005-01-11 | 2013-07-03 | 日本電気株式会社 | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム |
BRPI0607646B1 (pt) * | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
KR100684029B1 (ko) * | 2005-09-13 | 2007-02-20 | 엘지전자 주식회사 | 푸리에 변환을 이용한 배음 생성 방법 및 이를 위한 장치,다운 샘플링에 의한 배음 생성 방법 및 이를 위한 장치와소리 보정 방법 및 이를 위한 장치 |
WO2007052088A1 (en) * | 2005-11-04 | 2007-05-10 | Nokia Corporation | Audio compression |
JP4736812B2 (ja) * | 2006-01-13 | 2011-07-27 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
US7775528B2 (en) * | 2006-02-13 | 2010-08-17 | Freudenberg-Nok General Partnership | Bi-directional pattern for dynamic seals |
JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
KR101149449B1 (ko) * | 2007-03-20 | 2012-05-25 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 |
WO2009059633A1 (en) * | 2007-11-06 | 2009-05-14 | Nokia Corporation | An encoder |
ES2796493T3 (es) * | 2008-03-20 | 2020-11-27 | Fraunhofer Ges Forschung | Aparato y método para convertir una señal de audio en una representación parametrizada, aparato y método para modificar una representación parametrizada, aparato y método para sintetizar una representación parametrizada de una señal de audio |
US8725502B2 (en) * | 2008-06-05 | 2014-05-13 | Qualcomm Incorporated | System and method of an in-band modem for data communications over digital wireless communication networks |
BRPI0910511B1 (pt) * | 2008-07-11 | 2021-06-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para decodificar e codificar um sinal de áudio |
JP5551694B2 (ja) * | 2008-07-11 | 2014-07-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 多くのスペクトルエンベロープを計算するための装置および方法 |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
US8380498B2 (en) * | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
PL3246919T3 (pl) * | 2009-01-28 | 2021-03-08 | Dolby International Ab | Ulepszona transpozycja harmonicznych |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5704397B2 (ja) | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5975243B2 (ja) | 2011-08-24 | 2016-08-23 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP6037156B2 (ja) | 2011-08-24 | 2016-11-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
US20150088528A1 (en) | 2012-04-13 | 2015-03-26 | Sony Corporation | Decoding apparatus and method, audio signal processing apparatus and method, and program |
CA2843223A1 (en) | 2012-07-02 | 2014-01-09 | Sony Corporation | Decoding device, decoding method, encoding device, encoding method, and program |
JPWO2014007097A1 (ja) | 2012-07-02 | 2016-06-02 | ソニー株式会社 | 復号装置および方法、符号化装置および方法、並びにプログラム |
BR112014004127A2 (pt) | 2012-07-02 | 2017-04-04 | Sony Corp | dispositivo e método de decodificação, programa, e, dispositivo e método de codificação |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
JP2014123011A (ja) | 2012-12-21 | 2014-07-03 | Sony Corp | 雑音検出装置および方法、並びに、プログラム |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
-
2011
- 2011-01-14 JP JP2011006233A patent/JP5743137B2/ja active Active
- 2011-11-23 TW TW100142973A patent/TWI498885B/zh active
-
2012
- 2012-01-06 WO PCT/JP2012/050173 patent/WO2012096230A1/ja active Application Filing
- 2012-01-06 CA CA2820195A patent/CA2820195C/en not_active Expired - Fee Related
- 2012-01-06 US US13/978,175 patent/US20130275142A1/en not_active Abandoned
- 2012-01-06 RU RU2013130742/08A patent/RU2604338C2/ru active
- 2012-01-06 CN CN201280004776.XA patent/CN103314407B/zh active Active
- 2012-01-06 KR KR1020137017522A patent/KR101975066B1/ko active Application Filing
- 2012-01-06 MX MX2013007895A patent/MX345045B/es active IP Right Grant
- 2012-01-06 EP EP24190747.6A patent/EP4435780A2/en active Pending
- 2012-01-06 AU AU2012206122A patent/AU2012206122B2/en active Active
- 2012-01-06 EP EP21158857.9A patent/EP3849087B1/en active Active
- 2012-01-06 BR BR112013017427-7A patent/BR112013017427B1/pt active IP Right Grant
- 2012-01-06 EP EP12734067.7A patent/EP2665061B1/en active Active
- 2012-01-06 KR KR1020197011892A patent/KR102010220B1/ko active IP Right Grant
- 2012-01-06 KR KR1020197022968A patent/KR102048672B1/ko active IP Right Grant
-
2017
- 2017-02-03 US US15/424,741 patent/US10431229B2/en active Active
-
2019
- 2019-07-30 US US16/526,215 patent/US10643630B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001521648A (ja) | 1997-06-10 | 2001-11-06 | コーディング テクノロジーズ スウェーデン アクチボラゲット | スペクトル帯域複製を用いた原始コーディングの強化 |
US20050080621A1 (en) * | 2002-08-01 | 2005-04-14 | Mineo Tsushima | Audio decoding apparatus and audio decoding method |
US20080221905A1 (en) * | 2006-10-18 | 2008-09-11 | Markus Schnell | Encoding an Information Signal |
Non-Patent Citations (1)
Title |
---|
Martin Wolters et al., ‘A closer look into MPEG-4 high efficiency AAC’, Audio Engineering Society Convention Paper, pp.1~16, October 2003.* * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102048672B1 (ko) | 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체 | |
JP5942358B2 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
JP6037156B2 (ja) | 符号化装置および方法、並びにプログラム | |
JP5975243B2 (ja) | 符号化装置および方法、並びにプログラム | |
KR20100086000A (ko) | 오디오 신호 처리 방법 및 장치 | |
WO2012133195A1 (ja) | 符号化装置および方法、並びにプログラム | |
JP6210338B2 (ja) | 信号処理装置および方法、並びにプログラム | |
JP2005148539A (ja) | オーディオ信号符号化装置およびオーディオ信号符号化方法 | |
JP2017223996A (ja) | 信号処理装置および方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |