KR101663607B1 - 부호화 방법, 복호 방법, 주파수 영역 피치 주기 분석 방법, 부호화 장치, 복호 장치, 주파수 영역 피치 주기 분석 장치 및 기록 매체 - Google Patents
부호화 방법, 복호 방법, 주파수 영역 피치 주기 분석 방법, 부호화 장치, 복호 장치, 주파수 영역 피치 주기 분석 장치 및 기록 매체 Download PDFInfo
- Publication number
- KR101663607B1 KR101663607B1 KR1020167021875A KR20167021875A KR101663607B1 KR 101663607 B1 KR101663607 B1 KR 101663607B1 KR 1020167021875 A KR1020167021875 A KR 1020167021875A KR 20167021875 A KR20167021875 A KR 20167021875A KR 101663607 B1 KR101663607 B1 KR 101663607B1
- Authority
- KR
- South Korea
- Prior art keywords
- pitch period
- frequency domain
- sample
- value
- frequency
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 118
- 230000007774 longterm Effects 0.000 claims description 218
- 238000006243 chemical reaction Methods 0.000 claims description 173
- 230000008707 rearrangement Effects 0.000 claims description 82
- 238000012545 processing Methods 0.000 claims description 81
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 54
- 238000013139 quantization Methods 0.000 claims description 44
- 230000008569 process Effects 0.000 claims description 34
- 238000004458 analytical method Methods 0.000 claims description 30
- 238000011084 recovery Methods 0.000 claims description 21
- 230000015572 biosynthetic process Effects 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 17
- 238000003786 synthesis reaction Methods 0.000 claims description 17
- 230000005236 sound signal Effects 0.000 claims description 16
- 230000000737 periodic effect Effects 0.000 claims description 8
- 241000209094 Oryza Species 0.000 description 139
- 235000007164 Oryza sativa Nutrition 0.000 description 139
- 235000009566 rice Nutrition 0.000 description 139
- 238000010606 normalization Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 16
- 238000003860 storage Methods 0.000 description 15
- 230000004048 modification Effects 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 230000003595 spectral effect Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 7
- 230000001131 transforming effect Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000005284 excitation Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000005242 forging Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/903—Pitch determination of speech signals using a laryngograph
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/906—Pitch tracking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
소정의 시간 구간의 음향 신호의 시간 영역 피치 주기 부호에 시간 영역의 피치 주기 L이 대응하고, 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻고, 환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1을 포함하는 후보값 중에서 주파수 영역 피치 주기 T를 결정하고, 주파수 영역 피치 주기 T가 환산 간격 T1의 몇배인지를 나타내는 주파수 영역 피치 주기 부호를 얻는다. 주파수 영역 피치 주기 부호는 복호측에서 주파수 영역 피치 주기 T를 특정할 수 있도록 출력된다.
Description
본 발명은 음향 신호의 부호화 기술 및 이 부호화 기술에 의해 얻어진 부호열의 복호 기술에 관한 것이다. 보다 상세하게는 음향 신호를 주파수 영역으로 변환하여 얻어진 주파수 영역의 샘플열의 부호화와 그 복호에 관한 것이다.
저비트(예를 들면 10kbit/s~20kbit/s정도)의 음성 신호나 음향 신호의 부호화 방법으로서 DFT(이산 푸리에 변환)이나 MDCT(변형 이산 코사인 변환) 등의 직교 변환 계수에 대한 적응 부호화가 알려져 있다. 예를 들면 표준규격기술인 AMR-WB+(Extended Adaptive Multi-Rate Wideband)는 TCX(transform coded excitation:변환 부호화 여진) 부호화 모드를 가지고, 이 중에서는 DFT 계수를 8샘플마다 정규화하여 벡터 양자화하고 있다.
또, TwinVQ(Transform domain Weighted Interleave Vector Quantization)에서는, MDCT 계수 전체를 고정의 규칙으로 재배열한 후의 샘플의 모임이 벡터로서 부호화된다. 이 때, 예를 들면, MDCT 계수로부터 시간 영역의 피치 주기마다의 큰 성분을 추출하고, 시간 영역의 피치 주기에 대응하는 정보를 부호화하고, 또한 시간 영역의 피치 주기마다의 큰 성분을 제외한 나머지의 MDCT 계수열을 재배열하여, 재배열 후의 MDCT 계수열을 소정 샘플수마다 벡터 양자화함으로써 부호화하는 방법 등이 채용되는 경우도 있다. TwinVQ에 관한 문헌으로서 비특허문헌 1, 2를 예시할 수 있다.
또, 등간격으로 샘플을 추출하여 부호화하는 기술로서 예를 들면 특허문헌 1을 예시할 수 있다.
T. Moriya, N. Iwakami, A. Jin, K. Ikeda, and S. Miki, "A Design of Transform Coder for Both Speech and Audio Signals at 1bit/sample," Proc. ICASSP'97, pp. 1371-1374, 1997.
J. Herre, E. Allamanche, K. Brandenburg, M. Dietz, B. Teichmann, B. Grill, A. Jin, T. Moriya, N. Iwakami, T. Norimatsu, M. Tsushima, T. Ishikawa, "The integrated Filterbank Based Scalable MPEG-4 Audio Coder," 105th Convention Audio Engineering Society, 4810, 1998.
AMR-WB+를 비롯하여, TCX에 기초하는 부호화에서는 주기성에 기초하는 주파수 영역의 샘플열의 진폭의 불균일은 고려되어 있지 않고, 진폭의 불균일이 큰 샘플열을 합쳐서 부호화하면 부호화 효율이 저하되어버린다. 부호화 효율을 향상시키기 위해서는, 주파수 영역의 샘플열의 피치 주기에 기초하여, 진폭의 불균일이 작은 샘플군마다 상이한 기준에 따라 부호화를 행하는 것이 유효하다.
그러나, 주파수 영역의 샘플열의 피치 주기를 효율적으로 결정하여 부호화하는 방법은 알려져 있지 않다.
본 발명은 이러한 기술적 배경을 감안하여, 부호화시에 주파수 영역의 샘플열의 피치 주기를 효율적으로 결정하여 부호화하고, 복호시에 주파수 영역의 샘플열의 피치 주기를 특정하는 것이 가능한 기술을 제공하는 것을 목적으로 한다.
본 발명의 부호화 기술에 의하면, 소정의 시간 구간의 음향 신호의 시간 영역 피치 주기 부호에 시간 영역의 피치 주기 L이 대응하고, 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻고, 환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1을 포함하는 후보값 중에서 주파수 영역 피치 주기 T를 결정하고, 주파수 영역 피치 주기 T가 환산 간격 T1의 몇배인지를 나타내는 주파수 영역 피치 주기 부호를 얻는다. 주파수 영역 피치 주기 부호는 복호측에서 주파수 영역 피치 주기 T를 특정할 수 있도록 출력된다.
본 발명에 의하면, 환산 간격의 정수배로부터 주파수 영역 피치 주기 T를 탐색하기 때문에, 주파수 영역 피치 주기 T의 탐색에 필요한 연산 처리량이 적다. 또한, 주파수 영역 피치 주기 T를 특정하는 정보로서 주파수 영역 피치 주기 T가 환산 간격의 몇배인지를 나타내는 정보를 사용하므로, 주파수 영역 피치 주기 부호의 부호량을 억제할 수 있다. 이것에 의해, 부호화시에 주파수 영역의 샘플열의 피치 주기를 효율적으로 결정하여 부호화하고, 복호시에 주파수 영역의 샘플열의 피치 주기를 특정할 수 있다.
도 1은 실시형태의 부호화 장치의 블록도.
도 2는 실시형태의 복호 장치의 블록도.
도 3은 시간 영역에서의 기본 주기와 시간 영역의 피치 주기와 샘플점과의 관계를 나타낸 도면.
도 4는 주파수 영역에서의 이상 환산 간격과 그 m배의 간격과 주파수와의 관계를 나타낸 도면.
도 5는 주파수 영역 피치 주기/(변환 프레임 길이*2/시간 영역의 피치 주기)의 빈도를 나타낸 도면.
도 6은 샘플열에 포함되는 샘플의 재배열의 일례를 설명하기 위한 개념도.
도 7은 샘플열에 포함되는 샘플의 재배열의 일례를 설명하기 위한 개념도.
도 8은 실시형태의 부호화 장치의 블록도.
도 9는 실시형태의 복호 장치의 블록도.
도 10은 실시형태의 부호화 장치의 블록도.
도 11은 실시형태의 복호 장치의 블록도.
도 12는 실시형태의 가변 길이 부호장을 예시한 도면.
도 13은 실시형태의 가변 길이 부호장을 예시한 도면.
도 14는 실시형태의 부호화 장치의 블록도.
도 15는 실시형태의 복호 장치의 블록도.
도 16은 실시형태의 주파수 영역 피치 주기 분석 장치의 블록도.
도 2는 실시형태의 복호 장치의 블록도.
도 3은 시간 영역에서의 기본 주기와 시간 영역의 피치 주기와 샘플점과의 관계를 나타낸 도면.
도 4는 주파수 영역에서의 이상 환산 간격과 그 m배의 간격과 주파수와의 관계를 나타낸 도면.
도 5는 주파수 영역 피치 주기/(변환 프레임 길이*2/시간 영역의 피치 주기)의 빈도를 나타낸 도면.
도 6은 샘플열에 포함되는 샘플의 재배열의 일례를 설명하기 위한 개념도.
도 7은 샘플열에 포함되는 샘플의 재배열의 일례를 설명하기 위한 개념도.
도 8은 실시형태의 부호화 장치의 블록도.
도 9는 실시형태의 복호 장치의 블록도.
도 10은 실시형태의 부호화 장치의 블록도.
도 11은 실시형태의 복호 장치의 블록도.
도 12는 실시형태의 가변 길이 부호장을 예시한 도면.
도 13은 실시형태의 가변 길이 부호장을 예시한 도면.
도 14는 실시형태의 부호화 장치의 블록도.
도 15는 실시형태의 복호 장치의 블록도.
도 16은 실시형태의 주파수 영역 피치 주기 분석 장치의 블록도.
도면을 참조하면서 본 발명의 실시형태를 설명한다. 또한, 중복되는 구성 요소에는 동일한 참조 부호를 붙이고 중복 설명을 생략한다.
[제1 실시형태]
「부호화 장치(11)」
도 1을 참조하여 부호화 장치(11)가 행하는 부호화 처리를 설명한다. 부호화 장치(11)의 각 부는 소정의 시간 구간인 프레임 단위에, 이하의 동작을 한다. 이하의 설명에서는 프레임의 샘플수가 Nt이며, 1프레임분의 디지털 음향 신호가 디지털 음향 신호열 x(1),...,x(Nt)인 것으로 하고 있다.
「장기 예측 분석부(111)」
(개요)
장기 예측 분석부(111)는 소정의 시간 구간인 프레임 단위에, 입력된 디지털 음향 신호열 x(1),...,x(Nt)에 대응하는 시간 영역의 피치 주기 L을 얻어(스텝 S111-1), 당해 시간 영역의 피치 주기 L에 대응하는 피치 이득 gp을 산출하고(스텝 S111-2), 당해 피치 이득 gp에 기초하여 장기 예측을 실행할지 여부를 나타내는 장기 예측 선택 정보를 구하여 출력하고(스텝 S111-3), 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 적어도 시간 영역의 피치 주기 L과, 시간 영역의 피치 주기 L을 특정하는 시간 영역 피치 주기 부호 CL을 추가로 출력한다(스텝 S111-4).
(스텝 S111-1:시간 영역의 피치 주기 L)
장기 예측 분석부(111)는 예를 들면 미리 정한 시간 영역의 피치 주기의 후보 τ 중에서, 식(A1)에 의해 얻어지는 값이 최대가 되는 후보 τ를 디지털 음향 신호열 x(1),...,x(Nt)에 대응하는 시간 영역의 피치 주기 L로서 선택한다.
후보 τ 및 시간 영역의 피치 주기 L은 정수만을 사용하여 표현되는 경우(정수 정밀도)뿐만아니라, 정수와 소수값(분수값)을 사용하여 표현되는 경우(소수 정밀도)도 있다. 소수 정밀도의 후보 τ에 대한 식(A1)의 값을 구하는 경우에는, 복수의 디지털 음향 신호 샘플에 가중 평균 조작을 행하는 보간 필터를 사용하여 x(t-τ)를 구한다.
(스텝 S111-2:피치 이득 gp)
장기 예측 분석부(111)는 예를 들면 디지털 음향 신호와 시간 영역의 피치 주기 L에 기초하여, 식(A2)에 의해 피치 이득 gp을 산출한다.
(스텝 S111-3:장기 예측 선택 정보)
장기 예측 분석부(111)는 피치 이득 gp이 미리 정한 값 이상인 경우에는 장기 예측을 실행하는 것을 나타내는 장기 예측 선택 정보를 얻어 출력하고, 피치 이득 gp이 상기한 미리 정한 값 미만인 경우에는 장기 예측을 실행하지 않는 것을 나타내는 장기 예측 선택 정보를 얻어 출력한다.
(스텝 S111-4:장기 예측을 실행하는 경우)
장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 장기 예측 분석부(111)는 이하를 행한다.
장기 예측 분석부(111)에는 미리 정한 시간 영역의 피치 주기의 후보 τ에 당해 후보와 일의(一意)로 대응하는 인덱스가 할당된 것이 격납되어 있다. 장기 예측 분석부(111)는 시간 영역의 피치 주기 L로서 선택된 후보 τ를 특정하는 인덱스를, 시간 영역의 피치 주기 L을 특정하는 시간 영역 피치 주기 부호 CL로서 선택한다.
그리고, 장기 예측 분석부(111)는 상기한 장기 예측 선택 정보에 더하여, 시간 영역의 피치 주기 L과, 시간 영역 피치 주기 부호 CL를 출력한다.
또, 장기 예측 분석부(111)가 양자화 종료 피치 이득 gp^ 및 피치 이득 부호 Cgp도 출력하는 경우에는, 장기 예측 분석부(111)에는 미리 정한 피치 이득의 후보에 당해 후보와 일의로 대응하는 인덱스가 할당된 것이 격납되어 있다. 장기 예측 분석부(111)는 피치 이득의 후보 중 피치 이득 gp과 가장 가까운 것을 특정하는 인덱스를, 양자화 종료 피치 이득 gp^을 특정하는 피치 이득 부호 Cgp로서 선택한다.
그리고, 장기 예측 분석부(111)는 상기한 장기 예측 선택 정보와, 시간 영역의 피치 주기 L과, 시간 영역 피치 주기 부호 CL에 더하여, 양자화 종료 피치 이득 gp^과, 피치 이득 부호 Cgp를 출력한다.
「장기 예측 잔차 생성부(112)」
장기 예측 분석부(111)가 출력한 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 장기 예측 잔차 생성부(112)는 소정의 시간 구간인 프레임 단위에, 입력된 디지털 음향 신호열로부터 장기 예측된 신호를 제외한 장기 예측 잔차 신호열을 생성하여 출력한다. 예를 들면, 입력된 디지털 음향 신호열 x(1),...,x(Nt)과 시간 영역의 피치 주기 L과 양자화 종료 피치 이득 gp^에 기초하여, 식(A3)에 의해 장기 예측 잔차 신호열 xp(1),...,xp(Nt)을 산출함으로써 생성한다. 장기 예측 분석부(111)가 양자화 종료 피치 이득 gp^을 출력하지 않는 경우에는, gp^로서 예를 들면 0.5 등의 미리 정한 값을 사용한다.
xp(t)=x(t)-gp^x(t-L) (A3)
「주파수 영역 변환부(113a)」
우선, 주파수 영역 변환부(113a)가 프레임 단위로, 장기 예측 분석부(111)가 출력한 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는 입력된 장기 예측 잔차 신호열 xp(1),...,xp(Nt)을, 장기 예측 분석부(111)가 출력한 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는 입력된 디지털 음향 신호열 x(1),...,x(Nt)을, 주파수 영역의 N점(N을 「변환 프레임 길이」라고 부른다)의 MDCT 계수열 X(1),...,X(N)로 변환한다(스텝 S113a). 주파수 영역 변환부(113a)는 시간 영역에서 2*N점의 장기 예측 잔차 신호열 또는 디지털 음향 신호열에 윈도우잉한 후의 신호열의 MDCT 변환을 행하고, 주파수 영역에서 N점의 계수를 얻는다. 또한, 기호 *는 승산을 나타낸다. 주파수 영역 변환부(113a)는 시간 영역에서의 윈도우를 N점씩 어긋나게 함으로써 프레임을 갱신한다. 이 때, 이웃하는 프레임의 샘플은 N점씩 중복된다. 장기 예측 분석의 대상 샘플과 MDCT 변환에서의 윈도우의 대상 샘플은 독립이며, 지연이나 중첩의 정도로 윈도우의 형태를 설정할 수 있다. 예를 들면 장기 예측 분석의 대상 샘플로서 중첩이 없는 샘플 부분으로부터 Nt점을 취출하면 된다. 또 중첩이 있는 샘플에 대해서도 장기 예측 분석을 행하는 경우에는, 중첩 처리와 장기 예측의 차분과 합성의 처리의 적응 순서 등을 설정하여, 부호화 장치와 복호 장치에서 큰 오차를 발생시키지 않도록 할 필요가 있다.
「가중 포락 정규화부(113b)」
가중 포락 정규화부(113b)가 프레임 단위의 디지털 음향 신호열에 대한 선형 예측 분석에 의해 구해진 선형 예측 계수를 사용하여 추정된 디지털 음향 신호열의 파워 스펙트럼 포락 계수열에 의해, 입력된 MDCT 계수열의 각 계수를 정규화하고, 가중 정규화 MDCT 계수열을 출력한다(스텝 S113b). 여기서는 청각적으로 왜곡이 작아지는 것 같은 양자화의 실현을 위해서, 가중 포락 정규화부(113b)는 파워 스펙트럼 포락을 약하게 한 가중 파워 스펙트럼 포락 계수열을 사용하여, 프레임 단위로 MDCT 계수열의 각 계수를 정규화한다. 이 결과, 가중 정규화 MDCT 계수열은 입력된 MDCT 계수열 정도의 큰 진폭의 경사나 진폭의 요철을 가지지 않지만, 음성 음향 디지털 신호의 파워 스펙트럼 포락 계수열과 유사한 대소관계를 가지는 것, 즉, 낮은 주파수에 대응하는 계수측의 영역에 다소 큰 진폭을 가지고, 시간 영역의 피치 주기에 기인하는 미세 구조를 가지는 것이 된다.
[가중 포락 정규화 처리의 구체예]
N점의 MDCT 계수열의 각 계수 X(1),…,X(N)에 대응하는 파워 스펙트럼 포락 계수열의 각 계수 W(1),…,W(N)는 선형 예측 계수를 주파수 영역으로 변환하여 얻을 수 있다. 예를 들면, 전극형 모델인 p차 자기 회귀 과정에 의해, 시각에 대응하는 샘플점 t의 디지털 음향 신호 x(t)는 p시점(p는 정의 정수)까지 거슬러 올라간 과거의 자기 자신의 값 x(t-1),…,x(t-p)과 예측 잔차 e(t)와 선형 예측 계수 α1,…,αp에 의해 식(1)으로 표시된다. 이 때, 파워 스펙트럼 포락 계수열의 각 계수 W(n)[1≤n≤N]는 식(2)으로 표시된다. exp(·)는 네이피어 수를 밑으로 하는 지수 함수, j는 허수 단위, σ2는 예측 잔차 에너지이다.
선형 예측 계수는 장기 예측 분석부(111)에 입력된 것과 동일한 디지털 음향 신호열을 가중 포락 정규화부(113b)에 의해 선형 예측 분석하여 얻어진 것이어도 되고, 부호화 장치(11) 내에 있는 도시하지 않는 다른 수단에 의해 음성 음향 디지털 신호를 선형 예측 분석하여 얻어진 것이어도 된다. 이러한 경우에는 가중 포락 정규화부(113b)가 선형 예측 계수를 사용하여 파워 스펙트럼 포락 계수열의 각 계수 W(1),…,W(N)를 구한다. 또, 부호화 장치(11) 내에 있는 다른 수단(파워 스펙트럼 포락 계수열 계산부)에 의해 파워 스펙트럼 포락 계수열의 각 계수 W(1),…,W(N)가 이미 얻어져 있는 경우에는, 가중 포락 정규화부(113b)는 이 파워 스펙트럼 포락 계수열의 각 계수 W(1),…,W(N)를 사용할 수 있다. 또한, 후술하는 복호 장치(12)에서도 부호화 장치(11)에서 얻어진 값과 동일한 값을 얻을 필요가 있기 때문에, 양자화된 선형 예측 계수 및/또는 파워 스펙트럼 포락 계수열이 이용된다. 이후의 설명에 있어서, 특별히 한정이 없는 한, 「선형 예측 계수」 내지 「파워 스펙트럼 포락 계수열」은 양자화된 선형 예측 계수 내지 파워 스펙트럼 포락 계수열을 의미한다. 또, 선형 예측 계수는 예를 들면 종래적인 부호화 기술에 의해 부호화되고, 그것에 의해 얻어지는 예측 계수 부호가 복호측에 전송된다. 종래적인 부호화 기술은 예를 들면 선형 예측 계수 그 자체에 대응하는 부호를 예측 계수 부호로 하는 부호화 기술, 선형 예측 계수를 LSP 파라미터로 변환하여 LSP 파라미터에 대응하는 부호를 예측 계수 부호로 하는 부호화 기술, 선형 예측 계수를 PARCOR 계수로 변환하여 PARCOR 계수에 대응하는 부호를 예측 계수 부호로 하는 부호화 기술 등이다. 부호화 장치(11) 내에 있는 다른 수단에 의해 파워 스펙트럼 포락 계수열이 얻어지는 구성인 경우는, 부호화 장치(11) 내에 있는 다른 수단에 있어서 선형 예측 계수가 종래적인 부호화 기술에 의해 부호화되어 예측 계수 부호가 복호측에 전송된다.
여기서는, 가중 포락 정규화 처리의 구체예로서 2개의 예를 나타냈지만, 본 발명에서는 이들 예에 한정되는 것은 아니다.
<예 1>
가중 포락 정규화부(113b)는 MDCT 계수열의 각 계수 X(1),…,X(N)를 당해 각 계수에 대응하는 파워 스펙트럼 포락 계수열의 각 계수의 보정값 Wγ(1),…,Wγ(N)로 제산(除算)함으로써, 가중 정규화 MDCT 계수열의 각 계수 X(1)/Wγ(1),…,X(N)/Wγ(N)를 얻는 처리를 행한다. 보정값 Wγ(n)[1≤n≤N]은 식(3)으로 부여된다. 단, γ는 1 이하의 정의 상수이며, 파워 스펙트럼 계수를 약하게 한 상수이다.
<예 2>
가중 포락 정규화부(113b)는 MDCT 계수열의 각 계수 X(1),…,X(N)를 당해 각 계수에 대응하는 파워 스펙트럼 포락 계수열의 각 계수의 β승(0<β<1)의 값 W(1)β,…,W(N)β으로 제산함으로써, 가중 정규화 MDCT 계수열의 각 계수 X(1)/W(1)β,…,X(N)/W(N)β를 얻는 처리를 행한다.
이 결과, 프레임 단위의 가중 정규화 MDCT 계수열이 얻어지지만, 가중 정규화 MDCT 계수열은 입력된 MDCT 계수열 정도의 큰 진폭의 경사나 진폭의 요철을 가지지 않지만, 입력된 MDCT 계수열의 파워 스펙트럼 포락과 유사한 대소관계를 가지는 것, 즉, 낮은 주파수에 대응하는 계수측의 영역에 다소 큰 진폭을 가지고, 시간 영역의 피치 주기에 기인하는 미세 구조를 가지는 것이 된다.
또한, 가중 포락 정규화 처리에 대응하는 역처리, 즉, 가중 정규화 MDCT 계수열로부터 MDCT 계수열을 복원하는 처리가 복호측에서 행해지기 때문에, 파워 스펙트럼 포락 계수열로부터 가중 파워 스펙트럼 포락 계수열을 산출하는 방법을 부호화측과 복호측에서 공통의 설정으로 해 두는 것이 필요하다.
「정규화 이득 계산부(113c)」
다음에, 정규화 이득 계산부(113c)가 가중 정규화 MDCT 계수열을 입력으로 하고, 프레임마다 가중 정규화 MDCT 계수열의 각 계수를 주어진 총 비트수로 양자화할 수 있도록, 전 주파수에 걸친 진폭값의 합 또는 에너지값을 사용하여 양자화 스텝 폭을 결정하고, 이 양자화 스텝 폭이 되도록 가중 정규화 MDCT 계수열의 각 계수를 나눗셈하는 계수(이하, 이득이라고 한다.)를 구한다(스텝 S113c). 이 이득을 나타내는 정보는 이득 정보로서 복호측에 전송된다. 정규화 이득 계산부(113c)는 프레임마다 입력된 가중 정규화 MDCT 계수열의 각 계수를 이 이득으로 정규화(제산)하여 출력한다.
「양자화부(113d)」
다음에, 양자화부(113d)가 프레임마다 이득으로 정규화된 가중 정규화 MDCT 계수열의 각 계수를 스텝 S113c의 처리에서 결정된 양자화 스텝 폭으로 양자화하고, 얻어진 양자화 MDCT 계수열을 「주파수 영역의 샘플열」로서 출력한다(스텝 S113d).
스텝 S113d의 처리에서 얻어진 프레임 단위의 양자화 MDCT 계수열(주파수 영역의 샘플열)은 주파수 영역 피치 주기 분석부(115) 및 재배열 처리부(116a)의 입력이 된다.
「주기 환산부(114)」
주기 환산부(114)는 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 입력된 시간 영역의 피치 주기 L과 주파수 영역의 샘플점수 N에 기초하여, 식(A4)에 의해 환산 간격 T1을 구하여 출력한다. 식(A4)의 「INT()」는 () 내의 수치의 소수점 이하를 잘라버린 것을 나타낸다.
T1=INT(N*2/L) (A4)
또한 이론적인 환산 주기는 N*2/L-1/2이지만, 환산 간격 T1을 정수값으로 하는 경우에는 이것을 반올림하기 위해서 1/2을 더하여 잘라버린다. 또는, N*2/L-1/2을 미리 정한 소수점 자리수 이하를 반올림하여 환산 간격 T1으로 해도 된다. 예를 들면, N*2/L-1/2이 2진 5자리의 소수부를 가지는 의사 부동 소수점 형식으로 유지하고, 정수값으로서의 피치 주기를 반올림으로 구하는 경우는, 25*(N*2/L-1/2+1/2)을 잘라버린 값을 환산 간격 T1으로 하고, T1을 정수배로 한 결과를 1/25=1/32배하여 부동 소수점수로 되돌린 값을 후보로 하여, 주파수 영역의 피치 주기를 결정해도 된다.
주기 환산부(114)는 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는 아무 것도 하지 않는다. 단, 장기 예측 선택 정보가 장기 예측을 실행하는 경우와 동일한 처리를 행해도 문제는 없다. 즉, 주기 환산부(114)에는 장기 예측 선택 정보가 입력되지 않고, 입력된 시간 영역의 피치 주기 L과 주파수 영역의 샘플점수 N이 입력되어, 환산 간격 T1을 구하여 출력하는 구성이어도 된다.
「주파수 영역 피치 주기 분석부(115)」
주파수 영역 피치 주기 분석부(115)는 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 입력된 환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1을 후보값으로 하여, 주파수 영역 피치 주기 T를 결정하고, 주파수 영역 피치 주기 T와 주파수 영역 피치 주기 T가 환산 간격 T1의 몇배인지를 나타내는 주파수 영역 피치 주기 부호를 출력한다. 단, U는 미리 정한 제1 범위의 정수이다. 예를 들면 U는 0을 제외하는 정수이며, 예를 들면 U≥2이다. 예를 들면, 미리 정한 제1 범위의 정수가 2 이상 8 이하인 경우는, 환산 간격 T1, 환산 간격 T1의 2배~8배의 2T1, 3T1, 4T1, 5T1, 6T1, 7T1, 8T1의 합계 8개의 값이 주파수 영역 피치 주기의 후보값이며, 이들 후보값 중에서 주파수 영역 피치 주기 T가 선택된다. 이 경우는 주파수 영역 피치 주기 부호는 적어도 3비트의 1 이상 8 이하의 정수 각각과 일대일로 대응하는 부호이다.
주파수 영역 피치 주기 분석부(115)는 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 미리 정한 제2 범위의 정수값을 후보값으로 하여 주파수 영역 피치 주기 T를 결정하고, 주파수 영역 피치 주기 T와 주파수 영역 피치 주기 T를 나타내는 주파수 영역 피치 주기 부호를 출력한다. 예를 들면, 미리 정한 제2 범위의 정수값이 5 이상 36 이하인 경우는, 5, 6,…,36의 합계 25개의 값이 주파수 영역 피치 주기의 후보값이며, 이들 후보값 중에서 주파수 영역 피치 주기 T가 선택된다. 이 경우는 주파수 영역 피치 주기 부호는 적어도 5비트의 0 이상 31 이하의 정수 각각과 일대일로 대응하는 부호이다.
주파수 영역 피치 주기 분석부(115)는 예를 들면 미리 정한 재배열 규칙에 따라 선택되는 샘플군으로의 에너지의 집중도를 나타내는 지표값이 최대가 되는 후보를 주파수 영역 피치 주기 T로서 결정한다. 에너지의 집중도를 나타내는 지표값은 에너지의 총합, 절대값합 등이다. 즉, 에너지의 집중도를 나타내는 지표값이 에너지의 총합인 경우는, 미리 정한 재배열 규칙에 따라 선택되는 샘플군에 포함되는 전 샘플의 에너지의 총합이 최대가 되는 후보값을 주파수 영역 피치 주기 T로서 결정한다. 또, 에너지의 집중도를 나타내는 지표값이 절대값합인 경우는, 미리 정한 재배열 규칙에 따라 선택되는 샘플군에 포함되는 전 샘플의 값의 절대값합이 최대가 되는 후보값을 주파수 영역 피치 주기 T로서 결정한다. 「미리 정한 재배열 규칙에 따라 선택되는 샘플군」에 대해서는, 재배열 처리부(116a)의 란에서 상세하게 설명한다.
또는, 주파수 영역 피치 주기 분석부(115)는 예를 들면 미리 정한 재배열 규칙에 따라 재배열한 샘플열을 실제로 부호화하여 부호량이 최소가 되는 후보값을 주파수 영역 피치 주기 T로 결정한다. 「미리 정한 재배열 규칙에 따라 재배열한 샘플열」에 대해서는, 재배열 처리부(116a)의 란에서 상세하게 설명한다.
또는, 주파수 영역 피치 주기 분석부(115)는 예를 들면 미리 정한 재배열 규칙에 따라 선택되는 샘플군으로의 에너지의 집중도를 나타내는 지표값이 최대로부터 상기 소정 개수의 후보값을 선택하고, 선택된 후보값 중에서 미리 정한 재배열 규칙에 따라 재배열한 샘플열을 실제로 부호화하여 부호량이 최소가 되는 후보값을 주파수 영역 피치 주기 T로 결정한다.
주파수 영역 피치 주기 분석부(115)가 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 환산 간격 T1 및 환산 간격 T1 정수배의 값 U×T1을 후보값으로 하여, 주파수 영역 피치 주기 T를 결정하는 것의 의미를 이하에 설명한다.
시간 영역에서 2*N점의 장기 예측 잔차 신호열에 윈도우잉을 한 후의 신호열을 xp'(1),...,xp'(2*N)로 하면, 이 신호열 xp'(1),...,xp'(2*N)의 MDCT 변환에 의해 얻어지는 MDCT 계수열 X(1),...,X(N)은 예를 들면 이하와 같이 된다.
단, ρ는 (1/N)1/2 등의 계수이며, k는 주파수에 대응하는 인덱스 k=1,...,N이다. 즉 각 MDCT 계수열 X(k)은 예를 들면 이하의 2*N차원의 정규 직교 기저 벡터 B(k)와 신호열 벡터 (xp'(1),...,xp'(2*N))의 내적이다.
이상적으로는 신호열 xp'(1),...,xp'(2*N)은 시간 영역에서 기본 주기 Pf(디지털 음향 신호열 x(1),...,x(Nt)의 기본 주기)의 주기성을 가지기 때문에, 상기한 각 내적으로 이루어지는 열, 즉 각 MDCT 계수 X(k)의 에너지나 절대값은 주파수 방향의 간격 2*N/Pf(이하 「이상 환산 간격」이라고 한다)의 주기에서 극대가 된다(단, 신호열 xp'(1),...,xp'(2*N)이 정현파인 것 같은 특별한 경우를 제외한다). 따라서 이상적으로는 스텝 S111-1에서 선택되는 시간 영역의 피치 주기 L이 기본 주기 Pf이며, Pf=L로 한 이상 환산 간격 2*N/Pf가 주파수 영역 피치 주기 T이다.
그러나, x(1),...,x(Nt) 및 X(1),...,X(N)은 각각 이산값이다. 시간 영역에서의 x(1),...,x(Nt)의 인접 샘플 간격의 정수배가 기본 주기 Pf라고는 한정되지 않고, 또한, 주파수 영역에서의 X(1),...,X(N)의 인접 샘플 간격의 정수배가 이상 환산 간격 2*N/Pf라고도 한정되지 않는다. 따라서, 스텝 S111-1에서 선택되는 시간 영역의 피치 주기 L이 기본 주기 Pf 또는 그 근방의 후보 τ가 아니고, 기본 주기 Pf의 정수배 또는 그 근방의 후보 τ인 경우도 있다. 시간 영역의 피치 주기 L이 기본 주기의 정수배 n*Pf였을 경우, 시간 영역의 피치 주기 L을 주파수 영역으로 환산한 간격 T1'은 이상 환산 간격의 정수분의 1배, 즉 (2*N/Pf)/n이 된다. 결과적으로 이상 환산 간격 2*N/Pf를 주파수 영역 피치 주기 T로 하여 샘플군을 선택할 수 없고, 간격 T1'=2*N/L의 정수배를 주파수 영역 피치 주기 T로 하여 샘플군을 선택함으로써, 선택된 샘플군으로의 에너지의 집중도를 나타내는 지표값을 크게 할 수 있는 경우도 있다. 이하, 구체예를 사용하여 이들을 설명한다.
상기 서술한 바와 같이, 스텝 S111-1에서 선택되는 시간 영역의 피치 주기 L은 식(A1)에 의해 얻어지는 값을 최대로 하는 후보 τ이다. 일반적으로 식(A1)의 x(t)x(t-τ)가 최대가 되는 것은, 디지털 음향 신호열 x(1),...,x(Nt)의 기본 주기 Pf 또는 그 정수배, 즉 n*Pf(단, n은 정의 정수)의 어느 하나에 가장 가까운 후보 τ가 선택된 경우이다. 즉, n*Pf의 어느 하나에 가장 가까운 후보 τ가 시간 영역의 피치 주기 L이 되는 경향이 높다. 여기서, 기본 주기 Pf가 디지털 음향 신호열 x(1),...,x(Nt)의 샘플링 주기(인접 샘플 간격)의 정수배이면, 기본 주기 Pf 또는 그것에 가장 가까운 후보 τ가 식(A1)에 의해 얻어지는 값을 최대로 하고, 시간 영역의 피치 주기 L이 되는 경향이 높다. 한편, 기본 주기 Pf가 샘플링 주기의 정수배가 아닌 경우에는, 기본 주기 Pf 이외의 n*Pf 또는 그것에 가장 가까운 후보 τ가 식(A1)에 의해 얻어지는 값을 최대로 하고, 시간 영역의 피치 주기 L이 되는 경우가 많다. 예를 들면 도 3의 예에서는, 기본 주기 Pf가 샘플링 주기의 정수배가 아니고, 2*Pf가 시간 영역의 피치 주기 L로서 선택되어 있다. 시간 영역 피치 주기의 후보 τ 중, 샘플링 주기의 정수배가 되는 후보가 복수 있었던 경우, 후보의 값이 작은 쪽이 식(A1)의 값이 커지므로, 시간 영역 피치 주기 L로서 선택되기 쉬운 경향이 있다. 예를 들면, 2*Pf와 4*Pf가 샘플링 주기의 정수배가 되는 경우, 2*Pf 쪽이 식(A1)의 값이 커지므로, 시간 영역 피치 주기 L로서 선택되기 쉽다. 즉, 상기 서술한 n은 값이 작은 것일수록 사용될 가능성이 높은 경향이 있다고 할 수 있다.
즉, 스텝 S111-1에서 선택되는 시간 영역의 피치 주기 L은 L≒n*Pf와 근사할 수 있다. 따라서, 시간 영역의 피치 주기 L을 주파수 영역으로 환산한 간격 T1'=2*N/L은 이하와 같이 근사할 수 있다.
T1'=2*N/L≒2*N/n*Pf=(2*N/Pf)/n (A41)
즉, 간격 T1'는 이상 환산 간격 (2*N/Pf)의 1/n배로 근사할 수 있다. 이러한 경우, 간격 T1' 그 자체가 아니라, 간격의 정수배 n*T1'가 이상 환산 간격 2*N/Pf에 대응한다.
또한, 주파수 영역에 있어서의 샘플링 간격의 정수배는 이상 환산 간격 2*N/Pf에 대응하고 있다고는 할 수 없다. 예를 들면, 도 4의 예에서는, 이상 환산 간격 2*N/Pf가 MDCT 계수열 X(1),...,X(N)의 인접 샘플 간격의 정수배로 되어 있지 않기 때문에, 이상 환산 간격 2*N/Pf를 주파수 영역 피치 주기 T로 하여 샘플군을 선택할 수 없다. 그러나, 주파수 영역의 피치 주기에 기초하여 선택되는 샘플군으로의 에너지의 집중도를 크게 할 목적에서는, 이상 환산 간격 2*N/Pf 그 자체를 주파수 영역의 피치 주기로서 선택할 수 없어도, 이상 환산 간격 2*N/Pf의 m배(단, m은 정의 정수)를 주파수 영역 피치 주기 T=m*2*N/Pf로 하여 샘플군을 선택함으로써, 선택된 샘플군으로의 에너지의 집중도를 나타내는 지표값을 크게 할 수 있다. 즉, 선택되는 샘플군으로의 에너지의 집중도를 크게 할 목적에서는, 주파수 영역 피치 주기 T와 환산 간격 T1'의 관계는, 식(A41)을 사용하여 이하와 같이 기재할 수 있다.
T=m*(2*N/Pf)≒m*n*T1' (A42)
또한, 식(A42)은 식(A4)의 환산 간격 T1을 사용하여 이하와 같이 근사할 수 있다.
T≒m*n*INT(T1')=m*n*INT(2*N/L)=m*n*T1 (A43)
즉, 주파수 영역의 피치 주기 T는 환산 간격 T1의 정수배로 근사할 수 있다. 바꾸어 말하면, 환산 간격 T1의 정수배의 값 쪽이, 그 이외의 값보다 샘플군으로의 에너지의 집중도를 나타내는 지표값을 크게 하는 것 같은 주파수 영역의 피치 주기 T일 가능성이 높다. 즉, 환산 간격 T1 및 환산 간격 T1의 정수배와 그 근방의 값을 후보값으로 하여, 주파수 영역 피치 주기 T를 결정함으로써, 샘플군으로의 에너지의 집중도를 나타내는 지표값을 크게 할 수 있다.
상기 서술한 바와 같이, n은 값이 작은 것일수록 사용될 가능성이 높은 경향이 있고, m은 정의 정수이므로, 주파수 영역에 있어서는 주파수 영역 피치 주기 T의 환산 간격 T1에 대한 승수 m*n이 작은 것일수록 주파수 영역 피치 주기 T로서 결정되기 쉬운 경향이 있다고 할 수 있다. 즉, 환산 간격 T1의 정수배의 배수값이 작을수록 주파수 영역 피치 주기 T로서 결정되기 쉬운 경향이 있다고 할 수 있다.
도 5에, 주파수 영역 피치 주기/(변환 프레임 길이*2/시간 영역의 피치 주기)(T/(2*N/L)=T/T1)을 횡축으로 하고, 그 빈도를 종축으로 한 그래프를 예시한다. 도 5는 샘플군으로의 에너지의 집중도를 나타내는 지표값을 크게 하는 것 같은 주파수 영역 피치 주기와 시간 영역 피치 주기의 관계를 나타내는 것이다. 도 5로부터, 주파수 영역 피치 주기 T가 환산 간격 T1의 정수배(특히 1배, 2배, 3배, 4배) 또는 그 근방의 값이 되는 빈도가 높고, 주파수 영역 피치 주기 T가 환산 간격 T1의 정수배가 되지 않는 경우의 빈도가 낮은 것을 알 수 있다. 즉, 도 5는 샘플군으로의 에너지의 집중도를 크게 하는 것 같은 주파수 영역 피치 주기 T는 환산 간격 T1의 정수배 혹은 그 근방의 값이 될 확률이 매우 높은 것을 나타내고 있다. 또, 주파수 영역 피치 주기 T의 환산 간격 T1에 대한 승수 m*n이 작은 것일수록, 주파수 영역 피치 주기 T로서 결정되기 쉬운 경향이 있는 것도 알 수 있다. 따라서, 환산 간격 T1의 정수배 및 그 근방의 값을 후보값으로 하여 주파수 영역 피치 주기를 탐색함으로써, 샘플군으로의 에너지의 집중도를 크게 하는 것 같은 값을 주파수 영역 피치 주기로서 얻을 수 있다.
「주파수 영역 피치 주기 고려 부호화부(116)」
주파수 영역 피치 주기 고려 부호화부(116)는 재배열 처리부(116a)와 부호화부(116b)를 구비하고, 주파수 영역 피치 주기 T에 기초하는 부호화 방법으로, 입력된 주파수 영역의 샘플열을 부호화하고, 그것에 의해 얻어진 부호열을 출력한다.
「재배열 처리부(116a)」
재배열 처리부(116a)는 (1) 주파수 영역의 샘플열의 모든 샘플을 포함하고, 또한 (2) 주파수 영역의 샘플열 중 주파수 영역 피치 주기 분석부(115)가 결정한 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 주파수 영역 샘플열 중 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플의 전부 또는 일부의 샘플이 모이도록 샘플열에 포함되는 적어도 일부의 샘플을 재배열한 것을 재배열 후의 샘플열로서 출력한다. 즉, 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 당해 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플이 모이도록, 입력된 샘플열에 포함되는 적어도 일부의 샘플이 재배열된다.
그리고, 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 당해 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플은 저주파측에 하나로 합쳐지도록 모아진다.
구체예로서, 재배열 처리부(116a)는 입력된 샘플열로부터, 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플 F(nT)의 전후의 샘플 F(nT-1), F(nT+1)를 포함한 3개의 샘플 F(nT-1), F(nT), F(nT+1)을 선택한다. 이 선택된 샘플에 의한 군이 주파수 영역 피치 주기 분석부(115)에 있어서의 「미리 정한 재배열 규칙에 따라 선택되는 샘플군」이다. F(j)는 주파수에 대응하는 샘플 인덱스를 나타내는 번호 j에 대응하는 샘플이다. n은 1 내지 nT+1이 미리 설정한 대상 샘플의 상한 N을 넘지 않는 범위의 각 정수로 한다. 주파수에 대응하는 샘플 인덱스를 나타내는 번호 j의 최대값을 jmax로 한다. n에 따라 선택된 샘플의 모임을 샘플군이라고 호칭한다. 상한 N은 jmax와 일치시켜도 되지만, 음성이나 악음 등의 음향 신호에서는 고역에 있어서의 샘플의 지표는 일반적으로 충분히 작은 것이 많으므로, 후술하는 부호화 효율의 향상을 위해서 큰 지표를 가지는 샘플을 저주파측에 모은다는 관점에서, N은 jmax보다 작은 값이어도 된다. 예를 들면, N은 jmax의 절반정도의 값이어도 된다. 상한 N에 기초하여 정해지는 n의 최대값을 nmax로 하면, 입력된 샘플열에 포함되는 샘플 중, 최저의 주파수로부터 제1 소정의 주파수 nmax*T+1까지의 각 주파수에 대응하는 샘플이 재배열의 대상이 된다. 또한, 기호 *는 승산을 나타낸다.
재배열 처리부(116a)는 선택된 샘플 F(j)을 원래의 번호 j의 대소관계를 유지한 채로 샘플열의 선두부터 순서대로 배치하여 샘플열 A를 생성한다. 예를 들면, n이 1 내지 5까지의 각 정수를 나타내는 경우, 재배열 처리부(116a)는 제1 샘플군 F(T-1), F(T), F(T+1), 제2 샘플군 F(2T-1), F(2T), F(2T+1), 제3 샘플군 F(3T-1), F(3T), F(3T+1), 제4 샘플군 F(4T-1), F(4T), F(4T+1), 제5 샘플군 F(5T-1), F(5T), F(5T+1)를 샘플열의 선두부터 배열한다. 즉, 15개의 샘플 F(T-1), F(T), F(T+1), F(2T-1), F(2T), F(2T+1), F(3T-1), F(3T), F(3T+1), F(4T-1), F(4T), F(4T+1), F(5T-1), F(5T), F(5T+1)이 이 순번으로 샘플열의 선두부터 배열되고, 이들 15개의 샘플이 샘플열 A를 구성한다.
또한, 재배열 처리부(116a)는 선택되지 않은 샘플 F(j)를, 원래의 번호의 대소관계를 유지한 채 샘플열 A의 최후로부터 순서대로 배치한다. 선택되지 않은 샘플 F(j)는 샘플열 A를 구성하는 샘플군의 사이에 위치하는 샘플이며, 이러한 연속한 하나로 합쳐진 샘플을 샘플 세트라고 호칭한다. 즉, 상기 서술한 예이면, 제1 샘플 세트 F(1),…,F(T-2), 제2 샘플 세트 F(T+2),…,F(2T-2), 제3 샘플 세트 F(2T+2),…,F(3T-2), 제4 샘플 세트 F(3T+2),…,F(4T-2), 제5 샘플 세트 F(4T+2),…,F(5T-2), 제6 샘플 세트 F(5T+2),…F(jmax)가 샘플열 A의 최후로부터 순서대로 배열되고, 이들의 샘플이 샘플열 B를 구성한다.
요컨대, 이 예이면, 입력된 샘플열 F(j)(1≤j≤jmax)은 F(T-1), F(T), F(T+1), F(2T-1), F(2T), F(2T+1), F(3T-1), F(3T), F(3T+1), F(4T-1), F(4T), F(4T+1), F(5T-1), F(5T), F(5T+1), F(1),…,F(T-2), F(T+2),…,F(2T-2), F(2T+2),…,F(3T-2), F(3T+2),…,F(4T-2), F(4T+2),…,F(5T-2), F(5T+2),…F(jmax)로 재배열되게 된다(도 6 참조). 이 재배열 후의 샘플열이 주파수 영역 피치 주기 분석부(115)에 있어서의 「미리 정한 재배열 규칙에 따라 재배열한 샘플열」이다.
또한, 저주파수 대역에서는 주파수 영역 피치 주기 T에 대응하는 샘플이나 그 정수배의 샘플 이외의 샘플이라도, 각 샘플은 진폭이나 파워가 큰 값을 가지는 경우가 많다. 그래서, 최저의 주파수로부터 소정의 주파수 f까지의 각 주파수에 대응하는 샘플의 재배열을 행하지 않도록 해도 된다. 예를 들면, 소정의 주파수 f를 nT+α로 하면, 재배열 전의 샘플 F(1),…,F(nT+α)을 재배열하지 않고, 재배열 전의 F(nT+α+1) 이후의 샘플을 재배열의 대상으로 한다. α는 0 이상 또한 T보다 어느 정도 작은 정수(예를 들면 T/2를 넘지 않는 정수)로 미리 설정되어 있다. 여기서 n은 2 이상의 정수여도 된다. 또는 재배열 전의 최저 주파수에 대응하는 샘플로부터 연속하는 P개의 샘플 F(1),…,F(P)을 재배열하지 않도록 하고, 재배열 전의 F(P+1) 이후의 샘플을 재배열의 대상으로 해도 된다. 이 경우, 소정의 주파수 f는 P이다. 재배열의 대상이 되는 샘플의 모임에 대한 재배열의 기준은 상기 서술한 바와 같다. 또한, 제1 소정의 주파수가 설정되어 있는 경우, 소정의 주파수 f(제2 소정의 주파수)는 제1 소정의 주파수보다 작다.
예를 들면, 재배열 전의 샘플 F(1),…,F(T+1)을 재배열하지 않고, 재배열 전의 F(T+2) 이후의 샘플을 재배열의 대상으로 하는 경우, 상기 서술한 재배열의 기준에 따르면, 입력된 샘플열 F(j)(1≤j≤jmax)는 F(1),…,F(T+1), F(2T-1), F(2T), F(2T+1), F(3T-1), F(3T), F(3T+1), F(4T-1), F(4T), F(4T+1), F(5T-1), F(5T), F(5T+1), F(T+2),…,F(2T-2), F(2T+2),…,F(3T-2), F(3T+2),…,F(4T-2), F(4T+2),…,F(5T-2), F(5T+2),…F(jmax)로 재배열되게 된다(도 7 참조).
재배열의 대상이 되는 번호 j의 최대값을 결정짓는 상한 N 또는 제1 소정의 주파수를 모든 프레임에 공통의 값으로 하지 않고, 프레임마다 상이한 상한 N 또는 제1 소정의 주파수를 설정해도 된다. 이 경우, 프레임마다 상한 N 또는 제1 소정의 주파수를 지정하는 정보를 복호측에 보내면 된다. 또, 재배열의 대상이 되는 번호 j의 최대값을 지정하는 것이 아니라, 재배열하는 샘플군의 개수를 지정해도 되고, 이 경우, 샘플군의 개수를 프레임마다 설정하고, 샘플군의 개수를 지정하는 정보를 복호측에 보내도 된다. 물론, 재배열하는 샘플군의 개수를 모든 프레임에 공통으로 해도 된다. 또, 제2 소정의 주파수 f에 대해서도, 모든 프레임에 공통의 값으로 하지 않고, 프레임마다 상이한 제2 소정의 주파수 f를 설정해도 된다. 이 경우, 프레임마다 제2 소정의 주파수를 지정하는 정보를 복호측에 보내면 된다.
이와 같이 재배열된 후의 샘플열은 주파수를 횡축으로 하고, 샘플의 지표를 종축으로 한 경우에, 샘플의 지표의 포락선이 주파수의 증대에 따라 하강 경향을 나타내게 된다. 이 이유로서 주파수 영역의 샘플열은 음향 신호, 특히 음성 신호나 악음 신호의 특징으로서, 일반적으로 고주파 성분이 적다는 사실을 들 수 있다. 바꾸어 말하면, 재배열 처리부(116a)는 샘플의 지표의 포락선이 주파수의 증대에 따라 하강 경향을 나타내도록 입력된 샘플열에 포함되는 적어도 일부의 샘플을 재배열한다고 해도 된다. 또한, 도 6 및 도 7에서는, 샘플의 재배열에 의해 저역측으로, 보다 큰 진폭을 가지는 샘플이 치우치는 것을 알기 쉽게 도시하기 위해서, 주파수 영역의 샘플열에 포함되는 모든 샘플이 정의 값인 경우의 예를 도시하고 있다. 실제로는 주파수 영역의 샘플열에 포함되는 각 샘플은 정 또는 부 또는 제로의 값인 경우도 많지만, 이러한 경우에도 상기 서술한 재배열 처리 또는 후술하는 재배열 처리를 실행하면 된다.
또한, 이 실시형태에서는 저역측에, 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플을 모으는 재배열을 행했지만, 반대로 고역측에, 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플을 모으는 재배열을 행해도 된다. 이 경우, 샘플열 A에서는 샘플군이 역순으로 배열되고, 샘플열 B에서는 샘플 세트가 역순으로 배열되며, 저역측에 샘플열 B가 배치되고 샘플 B의 뒤에 샘플열 A가 배치된다. 즉, 상기 서술한 예이면, 저역측으로부터 제6 샘플 세트 F(5T+2),…F(jmax), 제5 샘플 세트 F(4T+2),…,F(5T-2), 제4 샘플 세트 F(3T+2),…,F(4T-2), 제3 샘플 세트 F(2T+2),…,F(3T-2), 제2 샘플 세트 F(T+2),…,F(2T-2), 제1 샘플 세트 F(1),…,F(T-2), 제5 샘플군 F(5T-1), F(5T), F(5T+1), 제4 샘플군 F(4T-1), F(4T), F(4T+1), 제3 샘플군 F(3T-1), F(3T), F(3T+1), 제2 샘플군 F(2T-1), F(2T), F(2T+1), 제1 샘플군 F(T-1), F(T), F(T+1)의 순번으로 샘플이 배열된다.
이와 같이 재배열된 후의 샘플열은 주파수를 횡축으로 하고, 샘플의 지표를 종축으로 한 경우에, 샘플의 지표의 포락선이 주파수의 증대에 따라 증대 경향을 나타내게 된다. 바꾸어 말하면, 재배열 처리부(116a)는 샘플의 지표의 포락선이 주파수의 증대에 따라 증대 경향을 나타내도록 입력된 샘플열에 포함되는 적어도 일부의 샘플을 재배열한다고 해도 된다.
주파수 영역 피치 주기 T는 정수가 아니고 소수인 경우도 있다. 이 경우, 예를 들면, R(nT)을 nT를 반올림한 값으로 하여, F(R(nT-1)), F(R(nT)), F(R(nT+1))이 선택되게 된다.
또한, 주파수 영역 피치 주기 분석부(115)가 실제의 부호량이 최소가 되는 후보값을 주파수 영역 피치 주기 T로서 결정하는 처리를 행하는 경우는, 주파수 영역 피치 주기 분석부(115)에 있어서 재배열 후의 샘플열이 생성되어 있으므로, 주파수 영역 피치 주기 고려 부호화부(116)가 재배열 처리부(116a)를 구비하지 않아도 된다.
[모으는 샘플의 개수]
또, 이 실시형태에서는 각 샘플군에 포함되는 샘플의 개수가 주파수 영역 피치 주기 T 내지 그 정수배에 대응하는 샘플(이하, 중심 샘플이라고 한다)과 그 전후 1샘플의 합계 3 샘플이라는 고정된 개수의 예를 나타냈다. 그러나, 샘플군에 포함되는 샘플의 개수나 샘플 인덱스를 가변으로 하는 경우에는, 재배열 처리부(116a)는 샘플군에 포함되는 샘플의 개수와 샘플 인덱스의 조합이 상이한 복수의 선택지 중에서 선택된 하나를 나타내는 정보를 보조 정보(제1 보조 정보)로서 출력한다.
예를 들면, 선택지로서,
(1) 중심 샘플만, F(nT)
(2) 중심 샘플과 그 전후 1샘플의 합계 3 샘플, F(nT-1), F(nT), F(nT+1)
(3) 중심 샘플과 그 전 2샘플의 합계 3 샘플, F(nT-2), F(nT-1), F(nT)
(4) 중심 샘플과 그 전 3샘플의 합계 4 샘플, F(nT-3), F(nT-2), F(nT-1), F(nT)
(5) 중심 샘플과 그 후 2샘플의 합계 3 샘플, F(nT), F(nT+1), F(nT+2)
(6) 중심 샘플과 그 후 3샘플의 합계 4 샘플, F(nT), F(nT+1), F(nT+2), F(nT+3)
가 설정되어 있는 경우에, (4)가 선택되면, 이 (4)가 선택된 것을 나타내는 정보를 제1 보조 정보로 한다. 이 예이면, 선택된 선택지를 나타내는 정보로서 3비트가 있으면 충분하다.
또한, 이러한 선택지 중에서 어느 것을 선택하면 좋을지 결정하는 방법으로서, 재배열 처리부(116a)에서는 각 선택지에 대응하는 재배열을 실시하고, 후술하는 부호화부(116b)에서 각 선택지에 대응하는 부호열의 부호량을 얻어, 가장 부호량이 작은 선택지를 선택한다는 방법을 채용하면 된다. 이 경우는 제1 보조 정보는 재배열 처리부(116a)로부터가 아니라 부호화부(116b)로부터 출력된다. 이 방법은 n을 선택 가능한 경우에도 타당하다.
「부호화부(116b)」
다음에, 부호화부(116b)가 재배열 처리부(116a)가 출력한 샘플열을 부호화하고, 얻어진 부호열을 출력한다(스텝 S116b). 예를 들면, 부호화부(116b)는 재배열 처리부(116a)가 출력한 샘플열에 포함되는 샘플의 진폭의 치우침에 따라 가변 길이 부호화의 방법을 전환하여 부호화한다. 즉, 재배열 처리부(116a)에 의해 프레임 내에서, 저역측(또는 고역측)에 진폭이 큰 샘플이 모이고 있으므로, 부호화부(116b)는 그 치우침에 적합한 방법에 의한 가변 길이 부호화를 행한다. 재배열 처리부(116a)가 출력한 샘플열과 같이, 국소적인 영역마다 동등하거나 동일한 정도의 진폭을 가지는 샘플이 모이고 있으면, 예를 들면 영역마다 상이한 라이스 파라미터로 라이스 부호화함으로써 평균 부호량을 삭감할 수 있다. 이하, 프레임 내에서 저역측(프레임의 선두에 가까운 측)에 진폭이 큰 샘플이 모이고 있는 경우를 예로 들어 설명한다.
[부호화의 구체예]
구체예로서, 부호화부(116b)는 큰 진폭을 가지는 샘플이 모이고 있는 영역에서는 샘플마다 라이스 부호화(골롬-라이스 부호화라고도 한다)를 적용한다. 이 영역 이외의 영역에서는 부호화부(116b)는 복수의 샘플을 합친 샘플의 집합에 대한 부호화에도 적합한 엔트로피 부호화(하프만 부호화나 산술 부호화 등)를 적용한다. 라이스 부호화의 적용에 관하여, 라이스 부호화의 적용 영역과 라이스 파라미터가 고정되어 있어도 되고, 또는 라이스 부호화의 적용 영역과 라이스 파라미터의 조합이 상이한 복수의 선택지 중에서 하나 선택할 수 있는 구성이어도 된다. 이러한 복수의 선택지로부터 하나를 선택할 때, 라이스 부호화의 선택 정보로서, 예를 들면 하기와 같은 가변 길이 부호(기호 ””로 둘러싸인 바이너리값)를 사용할 수 있고, 부호화부(116b)는 선택 정보도 출력한다.
”1”:라이스 부호화를 적용하지 않는다
”01”:라이스 부호화를 선두부터 1/32의 영역에 라이스 파라미터를 1로서 적용한다.
”001”:라이스 부호화를 선두부터 1/32의 영역에 라이스 파라미터를 2로서 적용한다.
”0001”:라이스 부호화를 선두부터 1/16의 영역에 라이스 파라미터를 1로서 적용한다.
”00001”:라이스 부호화를 선두부터 1/16의 영역에 라이스 파라미터를 2로서 적용한다.
”00000”:라이스 부호화를 선두부터 1/32의 영역에 라이스 파라미터를 3으로서 적용한다.
또한, 이러한 선택지 중에서 어느 것을 선택하면 되는지를 결정하는 방법으로서, 부호화 처리로 얻어지는 각 라이스 부호화에 대응하는 부호열의 부호량을 비교하고, 가장 부호량이 작은 선택지를 선택한다는 방법을 채용하면 된다.
또, 재배열 후의 샘플열에 0의 진폭을 가지는 샘플이 길게 계속되는 영역이 나타나면, 0의 진폭을 가지는 샘플의 연속수를 예를 들면 런 랭스 부호화함으로써 평균 부호량을 삭감할 수 있다. 이러한 경우, 부호화부(116b)는 (1) 큰 진폭을 가지는 샘플이 모이고 있는 영역에서는 샘플마다 라이스 부호화를 적용하고, (2) 이 영역 이외의 영역에서는, (a) 0의 진폭을 가지는 샘플이 연속하는 영역에서는, 0의 진폭을 가지는 샘플의 연속수를 나타내는 부호를 출력하는 부호화를 행하고, (b) 나머지 영역에서는, 복수의 샘플을 합친 샘플의 집합에 대한 부호화에도 적합한 엔트로피 부호화(하프만 부호화나 산술 부호화 등)를 적용한다. 이러한 경우에도, 상기 서술한 바와 같은 라이스 부호화의 선택을 행해도 된다. 또, 이러한 경우, 어느 영역에 런 랭스 부호화가 적용되었는지를 나타내는 정보도 복호측에 전송될 필요가 있고, 예를 들면 이 정보는 상기 선택 정보에 포함된다. 또한, 엔트로피 부호화에 속하는 복수의 부호화 방법을 선택지로서 준비하고 있는 경우에는, 어느 부호화를 선택했는지를 특정하기 위한 정보도 복호측에 전송될 필요가 있고, 예를 들면 이 정보는 상기 선택 정보에 포함된다.
또한, 샘플열에 포함되는 샘플의 재배열에 의한 이점이 없는 경우도 생각된다. 이러한 경우에는 재배열 전의 샘플열을 부호화해야 한다. 그래서, 재배열 처리부(116a)로부터는 재배열 전의 샘플열(재배열을 행하고 있지 않은 샘플열)도 출력하고, 부호화부(116b)는 재배열 전의 샘플열과 재배열 후의 샘플열을 각각 가변 길이 부호화하고, 재배열 전의 샘플열을 가변 길이 부호화하여 얻어지는 부호열의 부호량과, 재배열 후의 샘플열을 영역마다 가변 길이 부호화를 전환하여 부호화하여 얻어지는 부호열의 부호량을 비교하고, 재배열 전의 샘플열의 부호량이 최소인 경우에는, 재배열 전의 샘플열을 가변 길이 부호화하여 얻어진 부호열을 출력한다. 이 경우, 부호화부(116b)는 부호열에 대응하는 샘플열이 샘플의 재배열을 행한 샘플열인지 여부를 나타내는 보조 정보(제2 보조 정보)도 출력한다. 이 제2 보조 정보로서 1비트를 사용하면 충분하다. 또한, 제2 보조 정보가 부호열에 대응하는 샘플열이 샘플의 재배열을 행하고 있지 않는 샘플열을 특정하는 것인 경우는, 제1 보조 정보는 출력되지 않아도 된다.
또, 미리 예측 이득 또는 그 추정값이 어떤 정해진 역치보다 큰 경우에만 샘플열의 재배열을 적용하는 것으로 정해 둘 수도 있다. 이것은 예측 이득이 클 때에는 성대 진동이나 악기의 진동이 강하고, 주기성도 높은 경우가 많다는 음성이나 악음의 성질을 이용하는 것이다. 예측 이득은 원음의 에너지를 예측 잔차의 에너지로 나눈 것이다. 선형 예측 계수나 PARCOR 계수를 파라미터로서 사용하는 부호화에 있어서는, 양자화 종료의 파라미터를 부호화 장치와 복호 장치에서 공통으로 사용할 수 있다. 그래서, 예를 들면, 부호화부(116b)는 부호화 장치(11) 내의 도시하지 않는 별도의 수단에서 의해 구한 i차의 양자화 종료 PARCOR 계수 k(i)를 사용하여, (1-k(i)*k(i))을 차수마다 승산한 것의 역수로 표시되는 예측 이득의 추정값을 계산하고, 계산된 추정값이 어떤 정해진 역치보다 큰 경우는 재배열 후의 샘플열을 가변 길이 부호화하여 얻어진 부호열을 출력하고, 그렇지 않은 경우는 재배열 전의 샘플열을 가변 길이 부호화하여 얻어진 부호열을 출력한다. 이 경우는, 부호열에 대응하는 샘플열이 재배열을 행한 샘플열인지 여부를 나타내는 제2 보조 정보를 출력할 필요는 없다. 즉, 예측이 불가능한 잡음적 음성이나 무음시에는 효과가 작을 가능성이 높으므로 재배열을 하지 않는다고 정해 두는 쪽이 제2 보조 정보나 계산의 낭비가 적다.
또한, 재배열 처리부(116a)에 있어서, 예측 이득 또는 예측 이득의 추정값의 계산을 행하고, 예측 이득 또는 예측 이득의 추정값이 어떤 정해진 역치보다 큰 경우는 샘플열에 대한 재배열을 행하여 재배열 후의 샘플열을 부호화부(116b)에 출력하고, 그렇지 않은 경우는 샘플열에 대한 재배열을 행하지 않고 재배열 처리부(116a)에 입력된 샘플열 그 자체를 부호화부(116b)에 출력하고, 부호화부(116b)에서는 재배열 처리부(116a)로부터 출력된 샘플열을 가변 길이 부호화하는 구성으로 해도 된다.
또한, 이 구성의 경우에는, 역치를 부호화측과 복호측에서 공통의 값으로서 미리 설정해 두는 것으로 한다.
또한, 여기서 예시한 라이스 부호화, 산술 부호화, 런 랭스 부호화는 모두 주지이므로 그 상세한 설명을 생략한다. 또, 양자화 종료 PARCOR 계수는 선형 예측 계수나 LSP 파라미터로부터 변환 가능한 계수이므로, 부호화 장치(11) 내의 도시하지 않는 별도의 수단에 의해 양자화 종료 PARCOR 계수를 구하는 대신에, 부호화 장치(11) 내의 도시하지 않는 별도의 수단에 의해 우선 양자화 종료의 선형 예측 계수나 양자화 종료의 LSP 파라미터를 구하고, 다음에, 구한 파라미터로부터 양자화 종료 PARCOR 계수를 구하고, 또한, 예측 이득의 추정값을 구해도 된다. 요컨대, 예측 이득의 추정값은 선형 예측 계수에 대응하는 양자화 종료의 계수에 기초하여 구해지게 된다.
상기 서술한 부호화 처리에서는, 재배열 처리부(116a)가 출력한 샘플열에 포함되는 샘플의 진폭의 치우침에 따라 가변 길이 부호화 방법을 전환하여 부호화하는 예를 설명했지만, 이러한 부호화 처리에 한정되는 것은 아니다. 예를 들면, 하나 또는 복수의 샘플을 1심볼(부호화 단위)로 하고, 그 하나 또는 복수의 심볼에 의한 계열(이하, 심볼 계열이라고 부른다)의 직전의 심볼 계열에 의존하여 할당 부호를 적응적으로 제어하는 부호화 처리를 채용할 수도 있다. 이러한 부호화 처리로서, 예를 들면 JPEG2000에도 채용되어 있는 적응형 산술 부호를 예시할 수 있다. 적응형 산술 부호화에서는 모델링 처리와 산술 부호화가 행해진다. 모델링 처리에서는 직전의 심볼 계열로부터 산술 부호화를 위한 심볼 계열의 빈도표이 선택된다. 그리고, 선택된 심볼 계열의 출현 확률에 따라 폐구간 반직선[0,1]을 구분하고, 구분된 구간 내의 위치를 나타내는 2진 소수값에 그 심볼 계열에 대한 부호를 할당하는 산술 부호화가 행해진다. 본 발명의 실시형태에 있어서는, 모델링 처리로서, 재배열 후의 주파수 영역의 샘플열(상기 서술한 예에서는 양자화 MDCT 계수열)을 저역으로부터 순차적으로 심볼로 나누고, 산술 부호화를 위한 빈도표를 선택하고, 또한 산술 부호화로서 선택된 심볼 계열의 출현 확률에 따라 폐구간 반직선[0,1]을 구분하고, 구분된 구간 내의 위치를 나타내는 2진 소수값에 그 심볼 계열에 대한 부호를 할당한다. 상기 서술한 바와 같이, 재배열 처리에 의해, 이미 샘플열이 샘플의 크기를 반영하는 지표(예를 들면 진폭의 절대값)가 동등하거나 동일한 정도의 샘플이 모이도록 재배열되어 있는 점에서, 샘플열 내에서의 인접하는 샘플간에서의 샘플의 크기를 반영하는 지표의 변동이 작아져, 심볼의 빈도표의 정밀도가 높아지고, 심볼에 대한 산술 부호화에 의해 얻어지는 부호의 총부호량을 억제할 수 있다.
「복호 장치」
도 2를 참조하여 복호 장치(12)가 행하는 복호 처리를 설명한다.
복호 장치(12)에는 적어도 상기 장기 예측 선택 정보와, 상기 이득 정보와, 상기 주파수 영역 피치 주기 부호와, 상기 부호열이 입력된다. 또, 상기 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 적어도 시간 영역 피치 주기 부호 CL이 입력된다. 시간 영역 피치 주기 부호 CL에 더하여 피치 이득 부호 Cgp도 입력되는 경우도 있다. 또한, 부호화 장치(11)로부터 선택 정보나 제1 보조 정보나 제2 보조 정보가 출력된 경우에는 이 선택 정보, 제1 보조 정보, 또는 제2 보조 정보도 복호 장치(12)에 입력된다.
「주파수 영역 피치 주기 고려 복호부(123)」
주파수 영역 피치 주기 고려 복호부(123)는 복호부(123a)와 회복부(123b)를 구비하고, 주파수 영역 피치 주기 T에 기초하는 복호 방법으로서, 입력된 부호열을 복호하여 원래의 샘플의 배열을 얻어 출력한다.
「복호부(123a)」
복호부(123a)가 프레임마다 입력된 부호열을 복호하여 주파수 영역의 샘플열을 출력한다(스텝 S123a).
복호 장치(12)에 제2 보조 정보가 입력된 경우에는, 제2 보조 정보가 부호열에 대응하는 샘플열이 샘플의 재배열을 행한 샘플열인 것을 나타내는지 여부에 의해, 복호부(123a)가 얻은 주파수 영역의 샘플열의 출력처가 상이하다. 제2 보조 정보가 부호열에 대응하는 샘플열이 재배열을 행한 샘플열인 것을 나타내는 경우에는, 복호부(123a)가 얻은 주파수 영역의 샘플열은 회복부(123b)에 대하여 출력된다. 제2 보조 정보가 부호열에 대응하는 샘플열이 재배열을 행하고 있지 않은 샘플열인 것을 나타내는 경우에는, 복호부(123a)가 얻은 주파수 영역의 샘플열은 이득 승산부(124a)에 대하여 출력된다.
또, 부호화 장치(11)로 미리 예측 이득 또는 그 추정값과 역치의 비교 결과에 의해 샘플의 재배열을 행하는지 여부의 전환을 행한 경우에는, 복호 장치(12)에서도 마찬가지의 전환을 행한다. 즉, 복호부(123a)는 복호 장치(12) 내의 도시하지 않는 별도의 수단에 의해 구한 i차의 양자화 종료 PARCOR 계수 k(i)를 사용하여, (1-k(i)*k(i))를 차수마다 승산한 것의 역수로 표시되는 예측 이득의 추정값을 계산한다. 그리고, 복호부(123a)는 계산된 추정값이 어떠한 정해진 역치보다 큰 경우는, 복호부(123a)가 얻은 주파수 영역의 샘플열을 회복부(123b)에 대하여 출력한다. 그렇지 않은 경우는, 복호부(123a)는 복호부(123a)가 얻은 주파수 영역의 샘플열을 재배열 전의 샘플열을 이득 승산부(124a)에 대하여 출력한다.
또한, 복호 장치(12) 내의 도시하지 않는 별도의 수단에 의해 양자화 종료 PARCOR 계수를 구하는 방법으로서는, PARCOR 계수에 대응하는 부호를 복호하여 양자화 종료 PARCOR 계수를 얻는 방법, LSP 파라미터에 대응하는 부호를 복호하여 양자화 종료 LSP 파라미터를 얻어, 얻어진 양자화 종료 LSP 파라미터를 변환하여 양자화 종료 PARCOR 계수를 얻는 방법 등 주지의 방법을 채용하면 된다. 요컨대 이들 방법은 모두 선형 예측 계수에 대응하는 부호로부터 선형 예측 계수에 대응하는 양자화 종료의 계수를 얻는 방법이다. 즉, 예측 이득의 추정값은 선형 예측 계수에 대응하는 부호를 복호하여 얻어진 선형 예측 계수에 대응하는 양자화 종료의 계수에 기초하는 것이다.
복호 장치(12)에 부호화 장치(11)로부터 선택 정보가 입력된 경우에는, 복호부(123a)는 입력된 부호열에 대하여 선택 정보에 따른 복호 방법으로 복호 처리를 실행한다. 당연한 것이지만, 부호열을 얻기 위해서 실행된 부호화 방법에 대응하는 복호 방법이 실행된다. 복호부(123a)에 의한 복호 처리의 상세는 부호화 장치(11)의 부호화부(116b)에 의한 부호화 처리의 상세에 대응하므로, 당해 부호화 처리의 설명을 여기에 원용하고, 실행된 부호화에 대응하는 복호가 복호부(123a)가 행하는 복호 처리인 것을 명기하고, 이것으로써 복호 처리의 상세한 설명으로 한다. 또한, 선택 정보가 입력된 경우에는, 어떠한 부호화 방법이 실행되었는지는 당해 선택 정보에 의해 특정된다. 선택 정보에 예를 들면 라이스 부호화의 적용 영역과 라이스 파라미터를 특정하는 정보와, 런 랭스 부호화의 적용 영역을 나타내는 정보와, 엔트로피 부호화의 종류를 특정하는 정보가 포함되어 있는 경우에는, 이들 부호화 방법에 따른 복호 방법이 입력된 부호열이 대응하는 영역에 적용된다. 라이스 부호화에 대응하는 복호 처리, 엔트로피 부호화에 대응하는 복호 처리, 런 랭스 부호화에 대응하는 복호 처리는 모두 주지이므로 설명을 생략한다.
「장기 예측 정보 복호부(121)」
장기 예측 정보 복호부(121)는 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 입력된 시간 영역 피치 주기 부호 CL을 복호하여 시간 영역의 피치 주기 L을 얻어 출력한다. 피치 이득 부호 Cgp도 입력된 경우에는, 또한 피치 이득 부호 Cgp를 복호하여 양자화 종료 피치 이득 gp^을 얻어 출력한다.
「주기 환산부(122)」
주기 환산부(122)는 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 입력된 주파수 영역 피치 주기 부호를 복호하여 주파수 영역 피치 주기 T가 환산 간격 T1의 몇배인지를 나타내는 정수값을 얻고, 시간 영역의 피치 주기 L과 주파수 영역의 샘플점수 N에 기초하여 식(A4)에 의해 환산 간격 T1을 얻고, 환산 간격 T1에 정수값을 승산함으로써 주파수 영역 피치 주기 T를 얻어 출력한다.
주기 환산부(122)는 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 입력된 주파수 영역 피치 주기 부호를 복호하여 주파수 영역 피치 주기 T를 얻어 출력한다.
「회복부(123b)」
다음에, 회복부(123b)가 프레임마다 주기 환산부(122)가 얻은 주파수 영역 피치 주기 T에 따라, 또는 복호 장치(12)에 보조 정보가 입력된 경우에는 주기 환산부(122)가 얻은 주파수 영역 피치 주기 T와 입력된 보조 정보에 따라, 복호부(123a)가 출력한 주파수 영역의 샘플열로부터 원래의 샘플의 배열을 얻어 출력한다(스텝 S123b). 여기서 「원래의 샘플의 배열」은 부호화 장치(11)의 주파수 영역 샘플열 생성부(113)로부터 출력된 「주파수 영역의 샘플열」에 상당한다. 상기 서술한 바와 같이, 부호화 장치(11)의 재배열 처리부(116a)에 의한 재배열 방법이나 재배열 방법에 대응하는 재배열의 선택지는 다양하게 있지만, 재배열이 실행된 경우에는 실행된 재배열은 하나이며, 그 재배열은 주파수 영역 피치 주기 T와 보조 정보에 의해 특정할 수 있다.
회복부(123b)에 의한 회복 처리의 상세는 부호화 장치(11)의 재배열 처리부(116a)에 의한 재배열 처리의 상세에 대응하므로, 당해 재배열 처리의 설명을 여기에 원용하고, 그 재배열 처리의 역순의 처리(반대의 재배열)가 회복부(123b)가 행하는 회복 처리인 것을 명기하고, 이것으로써 회복 처리의 상세한 설명으로 한다. 또한, 이해의 도움을 위해, 상기 서술한 재배열 처리의 구체예에 대응하는 회복 처리의 일례를 설명한다.
예를 들면, 재배열 처리부(116b)가 샘플군을 저역측에 모아 F(T-1), F(T), F(T+1), F(2T-1), F(2T), F(2T+1), F(3T-1), F(3T), F(3T+1), F(4T-1), F(4T), F(4T+1), F(5T-1), F(5T), F(5T+1), F(1),…,F(T-2), F(T+2),…,F(2T-2), F(2T+2),…,F(3T-2), F(3T+2),…,F(4T-2), F(4T+2),…,F(5T-2), F(5T+2),…F(jmax)를 출력한 상기 서술한 예이면, 회복부(123b)에는 복호부(123a)가 출력한 주파수 영역의 샘플열 F(T-1), F(T), F(T+1), F(2T-1), F(2T), F(2T+1), F(3T-1), F(3T), F(3T+1), F(4T-1), F(4T), F(4T+1), F(5T-1), F(5T), F(5T+1), F(1),…,F(T-2), F(T+2),…,F(2T-2), F(2T+2),…,F(3T-2), F(3T+2),…,F(4T-2), F(4T+2),…,F(5T-2), F(5T+2),…F(jmax)가 입력된다. 회복부(123b)는 주파수 영역 피지 주기 T와 보조 정보에 기초하여, 입력된 샘플열 F(T-1), F(T), F(T+1), F(2T-1), F(2T), F(2T+1), F(3T-1), F(3T), F(3T+1), F(4T-1), F(4T), F(4T+1), F(5T-1), F(5T), F(5T+1), F(1),…,F(T-2), F(T+2),…,F(2T-2), F(2T+2),…,F(3T-2), F(3T+2),…,F(4T-2), F(4T+2),…,F(5T-2), F(5T+2),…F(jmax)를 원래의 샘플의 배열 F(j)(1≤j≤jmax)로 되돌린다.
「이득 승산부(124a)」
다음에, 이득 승산부(124a)가 프레임마다 복호부(123a) 또는 회복부(123b)가 출력한 샘플열의 각 계수에, 상기 이득 정보로 특정되는 이득을 곱하여, 「정규화된 가중 정규화 MDCT 계수열」을 얻어 출력한다(스텝 S124a).
「가중 포락 역정규화부(124b)」
다음에, 가중 포락 역정규화부(124b)가 프레임마다 이득 승산부(124a)가 출력한 「정규화된 가중 정규화 MDCT 계수열」의 각 계수에, 상기 서술한 바와 같이 전송된 파워 스펙트럼 포락 계수열로부터 얻어지는 보정 계수를 적용함으로써 「MDCT 계수열」을 얻어 출력한다(스텝 S124b). 부호화 장치(11)에서 실행된 가중 포락 정규화 처리의 예에 대응시켜 구체예를 설명하면, 가중 포락 역정규화부(124b)는 이득 승산부(124a)가 출력한 「정규화된 가중 정규화 MDCT 계수열」의 각 계수에, 당해 각 계수에 대응하는 파워 스펙트럼 포락 계수열의 각 계수의 β승(0<β<1)의 값 W(1)β ,…,W(N)β를 승산함으로써, MDCT 계수열의 각 계수 X(1),…,X(N)를 얻는다.
「시간 영역 변환부(124c)」
다음에, 시간 영역 변환부(124c)가 프레임마다 가중 포락 역정규화부(124b)가 출력한 「MDCT 계수열」을 시간 영역으로 변환하여 프레임 단위의 신호열(시간 영역의 신호열)을 얻어 출력한다(스텝 S124c). 장기 예측 정보 복호부(121)가 출력한 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 시간 영역 변환부(124c)가 얻은 신호열은 장기 예측 잔차 신호열 xp(1),...,xp(Nt)로서 장기 예측 합성부(125)에 입력된다. 장기 예측 정보 복호부(121)가 출력한 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 시간 영역 변환부(124c)가 얻은 신호열은 디지털 음향 신호열 x(1),...,x(Nt)로서 복호 장치(12)로부터 출력된다.
「장기 예측 합성부(125)」
장기 예측 합성부(125)는 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 시간 영역 변환부(124c)가 얻은 장기 예측 잔차 신호열 xp(1),...,xp(Nt)과, 장기 예측 정보 복호부(121)이 출력한 시간 영역의 피치 주기 L과 양자화 종료 피치 이득 gp^과, 장기 예측 합성부(125)가 생성한 과거의 디지털 음향 신호에 기초하여, 식(A5)에 의해, 디지털 음향 신호열 x(1),...,x(Nt)를 얻는다. 장기 예측 정보 복호부(121)가 양자화 종료 피치 이득 gp^을 출력하지 않는 경우, 즉, 복호 장치(12)에 피치 이득 부호 Cgp가 입력되지 않은 경우에는, gp^로서 예를 들면 0.5 등의 미리 정한 값을 사용한다. 이 경우의 gp^의 값은 부호화 장치(11)와 복호 장치(12)에서 동일한 값을 사용할 수 있도록, 장기 예측 정보 복호부(121) 내에 미리 기억시켜 둔다.
x(t)=xp(t)+gp^x(t-L) (A5)
그리고, 장기 예측 합성부(125)가 얻은 신호열은 디지털 음향 신호열 x(1),...,x(Nt)로서 복호 장치(12)로부터 출력된다.
장기 예측 합성부(125)는 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 아무 것도 하지 않는다.
실시형태로부터 명확한 바와 같이, 예를 들면 주파수 영역 피치 주기 T가 명료한 경우에는, 주파수 영역 피치 주기 T에 따라 샘플열을 재배열한 것을 부호화함으로써, 효율이 높은 부호화를 할 수 있다(즉 평균 부호 길이를 작게 할 수 있다). 또, 샘플열의 재배열에 의해 국소 영역마다 동등하거나 동일한 정도의 지표를 가지는 샘플이 집중되므로, 가변 길이 부호화의 효율화 뿐만아니라, 양자화 왜곡의 경감이나 부호량의 삭감이 가능하게 되어 있다.
[제1 실시형태의 변형예]
제1 실시형태의 부호화 장치(11)에서는 환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1을 후보값으로 하여 주파수 영역 피치 주기 T를 결정했지만, 환산 간격 T1의 정수배의 값 U×T1 이외의 배수값도 후보값으로 하여 주파수 영역 피치 주기 T를 결정해도 된다. 이하, 제1 실시형태와 상이한 점에 대해서 설명한다.
[부호화 장치(11')]
본 변형예의 부호화 장치(11')가 제1 실시형태의 부호화 장치(11)와 상이한 것은 주파수 영역 피치 주기 분석부(115) 대신에 주파수 영역 피치 주기 분석부(115')를 구비한다는 점이다. 본 변형예에서는, 주파수 영역 피치 주기 분석부(115')가 환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1 및 환산 간격 T1의 정수배 U×T1 이외의 미리 정한 배수의 값을 후보값으로 하여, 주파수 영역 피치 주기 T를 결정하여 출력한다. 주파수 영역 피치 주기 분석부(115')는 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 제1 실시형태와 마찬가지로, 미리 정한 제2 범위의 정수값을 후보값으로 하여 주파수 영역 피치 주기 T를 결정하여 출력한다.
「주파수 영역 피치 주기 분석부(115')」
주파수 영역 피치 주기 분석부(115')는 환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1 및 환산 간격 T1의 정수배 U×T1 이외의 미리 정한 배수의 값을 후보값으로 하여, 주파수 영역 피치 주기 T를 결정하고(환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1을 포함하는 후보값 중에서 주파수 영역 피치 주기 T를 결정하고), 주파수 영역 피치 주기 T와 주파수 영역 피치 주기 T가 환산 간격 T1의 몇배인지를 나타내는 주파수 영역 피치 주기 부호를 출력한다.
예를 들면, 미리 정한 제1 범위의 정수가 2 이상 9 이하인 경우는, 환산 간격 T1, 그 정수배의 값 2T1, 3T1, 4T1, 5T1, 6T1, 7T1, 8T1, 9T1, 환산 간격 T1의 정수배 이외의 미리 정한 배수의 값인 1.9375T1, 2.0625T1, 2.125T1, 2.1875T1, 2.25T1, 2.9375T1, 3.0625T1의 합계 16개의 값이 주파수 영역 피치 주기의 후보값이며, 이들 후보값 중에서 주파수 영역 피치 주기 T가 선택된다. 이 경우는 주파수 영역 피치 주기 부호는 16개의 후보값 각각과 일대일로 대응하는 적어도 4비트의 부호이다.
또한, 「미리 정한 제1 범위의 정수」는 어떠한 정수 이상 어떠한 정수 이하의 모든 정수를 반드시 포함할 필요는 없다. 예를 들면, 2 이상 9 이하이며, 또한, 5를 제외하는 정수를 미리 정한 제1 범위의 정수로 해도 된다. 이 경우에는 예를 들면 환산 간격 T1, 그 정수배의 값 2T1, 3T1, 4T1, 6T1, 7T1, 8T1, 9T1, 환산 간격 T1의 정수배 이외의 미리 정한 배수의 값인 1.3750T1, 1.53125T1, 2.03125T1, 2.0625T1, 2.09375T1, 2.1250T1, 8.5000T1, 14.5000T1의 합계 16개의 값이 주파수 영역 피치 주기의 후보값이며, 이들 후보값 중에서 주파수 영역 피치 주기 T가 선택된다. 이 경우는 주파수 영역 피치 주기 부호는 16개의 후보값 각각과 일대일로 대응하는 적어도 4비트의 부호이다.
주파수 영역 피치 주기 분석부(115')는 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 제1 실시형태와 마찬가지로, 미리 정한 제2 범위의 정수값을 후보값으로 하여 주파수 영역 피치 주기 T를 결정한다.
[복호 장치(12')]
본 변형예의 복호 장치(12')가 제1 실시형태의 복호 장치(12)와 상이한 것은, 주기 환산부(122) 대신에 주기 환산부(122')를 구비한다는 점이다.
「주기 환산부(122')」
주기 환산부(122')는 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 주파수 영역 피치 주기 부호를 복호하여 주파수 영역 피치 주기 T가 환산 간격 T1의 몇배인지를 나타내는 값(배수값)을 얻고, 시간 영역의 피치 주기 L과 주파수 영역의 샘플점수 N에 기초하여 식(A4)에 의해 환산 간격 T1을 얻고, 환산 간격 T1에 몇배인지를 나타내는 값을 승산함으로써 주파수 영역 피치 주기 T를 얻어 출력한다.
주기 환산부(122')는 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 주파수 영역 피치 주기 부호를 복호하여 주파수 영역 피치 주기 T를 얻어 출력한다.
[제1 실시형태의 변형예 2]
제1 실시예의 변형예 1에서는, 환산 간격 T1의 정수배의 값 U×T1 이외의 배수값도 후보값으로 하여 주파수 영역 피치 주기 T를 결정했다. 이 때, 정수배의 값 U×T1 쪽이 그 이외의 값보다 주파수 영역 피치 주기 T가 될 가능성이 높다는 특성이 있는 것을 반영하고, 제1 실시형태의 변형예 2에서는, 주파수 영역 피치 주기 부호의 길이를 가변 길이 부호장에 의해 결정한다.
또, 주파수 영역 피치 주기 분석부(115'')에 있어서, 주파수 영역 피치 주기 부호의 길이도 고려하여, 피치 주기 T를 결정한다.
이하, 제1 실시형태의 변형예 1과 상이한 점에 대해서 설명한다. 본 변형예의 부호화 장치(11'')가 제1 실시형태의 부호화 장치(11)와 상이한 것은, 주파수 영역 피치 주기 분석부(115) 대신에 주파수 영역 피치 주기 분석부(115'')를 구비한다는 점이다.
「주파수 영역 피치 주기 분석부(115'')」
주파수 영역 피치 주기 분석부(115'')는 환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1 및 환산 간격 T1의 정수배 U×T1 이외의 미리 정한 배수의 값을 후보값으로 하여, 주파수 영역 피치 주기 T를 결정하고(환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1을 포함하는 후보값 중에서 주파수 영역 피치 주기 T를 결정하고), 주파수 영역 피치 주기 T와 주파수 영역 피치 주기 T가 환산 간격 T1의 몇배인지를 나타내는 주파수 영역 피치 주기 부호를 출력한다.
여기서, 주파수 영역 피치 주기 T가 환산 간격 T1의 몇배인지를 나타내는 주파수 영역 피치 주기 부호는 환산 간격 T1의 정수배의 값 V×T1에 대응하는 부호의 부호 길이가, 그 이외의 후보에 대응하는 부호의 부호 길이보다 짧아지는 것 같은 가변 길이 부호장을 사용하여 주파수 영역 피치 주기 부호를 결정한다. 단, V는 정수이다. 예를 들면 V는 0을 제외하는 정수이며, 예를 들면 V는 정의 정수이다. 예를 들면 V∈{1, U}이다.
예를 들면, 주파수 영역 피치 주기 T가 환산 간격 T1 그 자체인 경우의 가변 길이 부호의 부호 길이 및 주파수 영역 피치 주기 T가 환산 간격 T1의 정수배 U×T1인 경우의 가변 길이 부호의 부호 길이가, 그 이외의 경우의 가변 길이 부호의 부호 길이보다 짧은 가변 길이 부호장(예 1)을 사용하여, 주파수 영역 피치 주기 부호를 결정해도 된다. 또한, 「가변 길이 부호」는 빈도가 높은 사상에 대하여 빈도가 낮은 사상에 대한 부호보다 짧은 부호를 할당하여 평균 부호 길이를 짧게 하는 부호를 의미한다. 이러한 주파수 영역 피치 주기 부호는 주파수 영역 피치 주기 T가 환산 간격 T1 그 자체인 경우, 환산 간격 T1의 정수배인 경우의 부호 길이 쪽이, 그 이외의 경우의 부호 길이보다 짧다. 이러한 가변 길이 부호장의 예를 도 12에 나타낸다. 환산 간격 T1의 정수배는 그 이외보다 주파수 영역 피치 주기로서 결정되는 빈도가 높은 성질이 있으므로, 이러한 가변 길이 부호장을 사용하여 주파수 영역 피치 주기 부호를 결정함으로써, 평균 부호 길이를 짧게 할 수 있다.
또, 주파수 영역 피치 주기 T가 환산 간격 T1 그 자체인 경우의 가변 길이 부호의 부호 길이, 주파수 영역 피치 주기 T가 환산 간격 T1의 정수배 U×T1인 경우의 가변 길이 부호의 부호 길이, 주파수 영역 피치 주기 T가 환산 간격 T1의 근방인 경우의 가변 길이 부호의 부호 길이 및 주파수 영역 피치 주기 T가 환산 간격 T1의 정수배 U×T1의 근방인 경우의 가변 길이 부호의 부호 길이가, 모두 그 이외의 경우의 가변 길이 부호의 부호 길이보다 짧은 가변 길이 부호장(예 2)을 사용하여, 주파수 영역 피치 주기 부호를 결정해도 된다. 이 경우의 주파수 영역 피치 주기 부호는 주파수 영역 피치 주기 T가 환산 간격 T1 그 자체인 경우, 환산 간격 T1의 정수배인 경우, 환산 간격 T1의 근방인 경우, 환산 간격 T1의 정수배의 근방인 경우의 부호 길이 쪽이, 그 이외의 경우의 부호 길이보다 짧다. 주파수 영역 피치 주기 T가 환산 간격 T1 그자체인 경우, 환산 간격 T1의 정수배인 경우, 환산 간격 T1의 근방인 경우, 환산 간격 T1의 정수배의 근방인 경우는 그 이외의 경우보다 주파수 영역 피치 주기로서 선택되는 빈도가 높아지는 성질이 있으므로, 그들에 대응하는 부호 길이를 그 이외의 경우의 부호 길이보다 짧게 함으로써 평균 부호 길이를 짧게 할 수 있다.
또, 주파수 영역 피치 주기 T가 환산 간격 T1 그 자체인 경우의 가변 길이 부호의 부호 길이 쪽이, 주파수 영역 피치 주기 T가 환산 간격 T1의 정수배 U×T1인 경우의 가변 길이 부호의 부호 길이보다 짧은 가변 길이 부호장(예 3)을 사용하여, 주파수 영역 피치 주기 부호를 결정해도 된다. 이 경우의 주파수 영역 피치 주기 부호는 주파수 영역 피치 주기 T가 환산 간격 T1 그자체인 경우의 부호 길이 쪽이, 환산 간격 T1의 근방인 경우의 부호 길이보다 짧다.
또, 주파수 영역 피치 주기 T가 환산 간격 T1의 정수배 U×T1인 경우의 가변 길이 부호의 부호 길이 쪽이, 주파수 영역 피치 주기 T가 환산 간격 T1의 정수배 U×T1의 근방인 경우의 가변 길이 부호의 부호 길이보다 짧은 가변 길이 부호장(예 4)을 사용해도 된다. 이 경우의 제1 주파수 영역 피치 주기 부호는, 제1 주파수 영역 피치 주기 T가 환산 간격 T1의 정수배인 경우의 부호 길이 쪽이, 환산 간격 T1의 정수배의 근방인 경우의 부호 길이보다 짧다.
또, 상기 서술한 바와 같이, 과거의 프레임의 정보를 사용할 수 없는 경우 또는 사용하지 않는 경우, 주파수 영역 피치 주기 T의 환산 간격 T1에 대한 승수 m*n이 작은 것일수록, 주파수 영역 피치 주기 T로서 결정되기 쉬운 경향이 있다. 이 점을 반영하여, 도 13과 같이, 적어도 주파수 영역 피치 주기 T가 환산 간격 T1의 정수배의 값 V×T1인 경우의 가변 길이 부호의 부호 길이가, 당해 정수값 V의 크기에 대하여 단조비감소의 관계가 되도록 가변 길이 부호가 할당된 가변 길이 부호장(예 5)을 사용하여 주파수 영역 피치 주기 부호를 결정해도 된다. 이 경우, 적어도 상기 주파수 영역 피치 주기 T가 환산 간격 T1의 정수배의 값 V×T1인 경우의 주파수 영역 피치 주기 부호의 부호 길이는 정수 V의 크기에 대하여 단조비감소의 관계가 된다.
또, 상기 서술한 예 1, 3의 특징을 겸비한 가변 길이 부호장(예 6)을 사용해도 되고, 예 2, 3의 특징을 겸비한 가변 길이 부호장(예 7)을 사용해도 되며, 예 2, 4의 특징을 겸비한 가변 길이 부호장(예 8)을 사용해도 되고, 예 2, 3, 4의 특징을 겸비한 가변 길이 부호장(예 9)을 사용해도 되고, 예 1~9 중 어느 하나와 예 5의 특징을 겸비한 가변 길이 부호장(예 10)을 사용해도 된다.
주파수 영역 피치 주기 분석부(115'')는 미리 정한 재배열 규칙에 따라 선택되는 샘플군으로의 에너지의 집중도를 나타내는 지표값과 환산 간격 T1과의 관계를 나타내는 부호의 길이를 고려하여 주파수 영역 피치 주기 T를 결정한다. 예를 들면 집중도의 지표가 동일하면, 환산 간격 T1과의 관계를 나타내는 부호의 길이가 짧은 쪽을 선택한다. 또는 c를 적절하게 미리 설정한 상수(가중치)로 하여
변형한 집중도 지표=집중도의 지표-c*(환산 간격 T1과의 관계를 나타내는 부호의 길이)
로 하고, 변형한 집중도 지표가 최대가 되는 주파수 영역 피치 주기 T를 결정한다.
[제2 실시형태]
[부호화 장치(21)]
본 실시형태의 부호화 장치(21)가 제1 실시형태의 부호화 장치(11)와 상이한 것은, 주파수 영역 피치 주기 분석부(115) 대신에 주파수 영역 피치 주기 분석부(215)를 구비한다는 점이다. 본 실시형태에서는, 주파수 영역 피치 주기 분석부(215)가 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1 중에서 중간 후보값을 결정하고, 중간 후보값 및 중간 후보값의 근방의 미리 정한 제3 범위의 값 중에서 주파수 영역 피치 주기 T를 결정하여 출력한다. 주파수 영역 피치 주기 분석부(215)는 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 제1 실시형태와 마찬가지로, 미리 정한 제2 범위의 정수값을 후보값으로 하여 주파수 영역 피치 주기 T를 결정하여 출력한다. 이하, 제1 실시형태와 상이한 점에 대해서 설명한다.
「주파수 영역 피치 주기 분석부(215)」
주파수 영역 피치 주기 분석부(215)는 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 우선, 환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1을 후보값으로 하여, 중간 후보값을 결정한다. 다음에 주파수 영역 피치 주기 분석부(215)는 중간 후보값 및 중간 후보값의 근방의 미리 정한 제3 범위의 값을 후보값으로 하여, 주파수 영역 피치 주기 T를 결정하고 주파수 영역 피치 주기 T를 출력한다. 또한, 주파수 영역 피치 주기 분석부(215)는 중간 후보값이 환산 간격 T1의 몇배인지를 나타내는 정보와, 주파수 영역 피치 주기 T와 중간 후보값의 차를 나타내는 정보를 주파수 영역 피치 주기 부호로서 출력한다.
예를 들면, 미리 정한 제1 범위의 정수가 2 이상 8 이하인 경우는, 환산 간격 T1, 환산 간격 T1의 2배~8배의 2T1, 3T1, 4T1, 5T1, 6T1, 7T1, 8T1의 합계 8개의 값이 중간 후보값의 후보이며, 이들 후보 중에서 중간 후보값 Tcand가 선택된다. 이 경우는 중간 후보값이 환산 간격 T1의 몇배인지를 나타내는 정보는 적어도 3비트의 1 이상 8 이하의 정수 각각과 일대일로 대응하는 부호이다.
또, 예를 들면 미리 정한 제3 범위가 -3 이상 4 이하의 정수인 경우는, Tcand-3, Tcand-2, Tcand-1, Tcand, Tcand+1, Tcand+2, Tcand+3, Tcand+4의 합계 8개의 값이 주파수 영역 피치 주기 T의 후보이며, 이들 후보 중에서 주파수 영역 피치 주기 T가 선택된다. 이 경우는, 주파수 영역 피치 주기 T와 중간 후보값의 차를 나타내는 정보는 적어도 3비트의 -3 이상 4 이하의 정수 각각과 일대일로 대응하는 부호이다.
또한, 미리 정한 제3 범위의 값은 정수값이어도 되고 소수값이어도 된다. 또, 제1 실시형태의 변형예와 마찬가지로, 환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1에 더하여, 환산 간격 T1의 정수배의 값 U×T1 이외의 배수값도 후보값으로 하여, 중간 후보값을 결정해도 된다. 즉, 환산 간격 T1 및 환산 간격 T1의 정수배의 값 U×T1을 포함하는 후보값 중에서 중간 후보값을 결정해도 된다.
[복호 장치(22)]
본 실시형태의 복호 장치(22)가 제1 실시형태의 복호 장치(12)와 상이한 것은 주기 환산부(122) 대신에 주기 환산부(222)를 구비한다는 점이다. 본 실시형태에서는 주기 환산부(222)가 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 주파수 영역 피치 주기 부호를 복호하여, 중간 후보값이 환산 간격 T1의 몇배인지의 정수값과, 주파수 영역 피치 주기 T와 중간 후보값의 차의 값을 얻고, 환산 간격 T1에 정수값을 승산하여 얻어지는 값에 상기한 차의 값을 가산한 것을 주파수 영역 피치 주기 T로서 얻어 출력한다. 주기 환산부(222)는 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 주파수 영역 피치 주기 부호를 복호하여 주파수 영역 피치 주기 T를 얻어 출력한다.
[제3 실시형태]
[부호화 장치(31)]
본 실시형태의 부호화 장치(31)가 제1 실시형태, 제1 실시형태의 변형예 및 제2 실시형태의 부호화 장치(11, 11', 21)와 상이한 것은 주파수 영역 피치 주기 분석부(115, 115', 215) 대신에 주파수 영역 피치 주기 분석부(315)를 구비한다는 점이다. 본 실시형태에서는, 주파수 영역 피치 주기 분석부(315)는 「장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우」 대신에 「양자화 종료 피치 이득 gp^이 미리 정한 값 이상인 경우」, 「장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우」 대신에 「양자화 종료 피치 이득 gp^이 미리 정한 값보다 작은 경우」로 하여 처리를 행한다. 그 이외는 제1 실시형태 및 제2 실시형태와 마찬가지이다. 또한, 본 실시형태는 제1 실시형태 중, 부호화 장치(31)가 양자화 종료 피치 이득 gp^ 및 피치 이득 부호 Cgp를 얻는 구성이 전제가 된다.
[복호 장치(32)]
본 실시형태의 복호 장치(32)가 제1 실시형태 및 제2 실시형태의 복호 장치(12, 12', 22)와 상이한 것은 주기 환산부(122, 122', 222) 대신에 주기 환산부(322)를 구비한다는 점이다. 본 실시형태에서는 주기 환산부(322)는 「장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우」 대신에 「양자화 종료 피치 이득 gp^이 미리 정한 값 이상인 경우」, 「장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우」 대신에 「양자화 종료 피치 이득 gp^이 미리 정한 값보다 작은 경우」로 하여 처리를 행한다. 그 이외는 제1 실시형태 및 제2 실시형태와 마찬가지이다. 또한, 본 실시형태는 제1 실시형태 중, 복호 장치(32)에 피치 이득 부호 Cgp가 입력되어 양자화 종료 피치 이득 gp^를 얻는 구성이 전제가 된다.
[제4 실시형태]
[부호화 장치(41)]
본 실시형태의 부호화 장치(41)가 제1 실시형태, 제1 실시형태의 변형예 및 제2 실시형태의 부호화 장치(11, 11', 21)와 상이한 것은 장기 예측 분석부(111), 장기 예측 잔차 생성부(112), 주파수 영역 변환부(113a), 주기 환산부(114), 주파수 영역 피치 주기 분석부(115, 115', 215)의 각각 대신에, 장기 예측 분석부(411), 장기 예측 잔차 생성부(412), 주파수 영역 변환부(413a), 주기 환산부(414), 주파수 영역 피치 주기 분석부(415)를 구비한다는 점이다.
본 실시형태의 장기 예측 분석부(411)에서는, 피치 이득 gp의 값에 상관없이 장기 예측을 실행한다. 보다 구체적으로는 장기 예측 분석부(411)는 피치 이득 gp의 값에 상관없이, 장기 예측 분석부(111)의 「장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우」의 처리를 행한다. 따라서, 장기 예측 분석부(411)가 피치 이득 gp이 미리 정한 값 이상인지 여부에 의한 장기 예측의 실행의 유무의 판단을 행할 필요는 없고, 장기 예측 선택 정보를 출력할 필요도 없다.
이후, 장기 예측 잔차 생성부(412), 주파수 영역 변환부(413a), 주기 환산부(414), 주파수 영역 피치 주기 분석부(415)의 각각은 장기 예측 잔차 생성부(112), 주파수 영역 변환부(113a), 주기 환산부(114), 주파수 영역 피치 주기 분석부(115, 115', 215)의 「장기 예측 분석부(111)가 출력한 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우」에 대응하는 처리를 실시한다.
[복호 장치(42)]
본 실시형태의 복호 장치(42)가 제1 실시형태 및 제2 실시형태의 복호 장치(12, 12', 22)와 상이한 것은 복호부(123a), 장기 예측 정보 복호부(121), 주기 환산부(122, 122', 222), 시간 영역 변환부(124c), 장기 예측 합성부(125)의 각각에 대신하여, 복호부(423a), 장기 예측 정보 복호부(421), 주기 환산부(422), 시간 영역 변환부(424c), 장기 예측 합성부(425)를 구비한다는 점이다. 본 실시형태는 장기 예측 선택 정보나 양자화 종료 피치 이득 gp^의 값에 상관없이 장기 예측 합성을 행한다. 따라서, 본 실시형태의 복호 장치(42)에는 장기 예측 선택 정보는 입력될 필요는 없다.
본 실시형태의 복호부(423a), 장기 예측 정보 복호부(421), 주기 환산부(422), 시간 영역 변환부(424c), 장기 예측 합성부(425)의 각각은, 복호부(123a), 장기 예측 정보 복호부(121), 주기 환산부(122, 122', 222), 시간 영역 변환부(124c), 장기 예측 합성부(125)의 「장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우」에 대응하는 처리를 실시한다.
[기타]
상기한 각 실시형태의 부호화 장치(11, 11', 21, 31, 41)에서는, 주파수 영역 변환부(113a, 413a)와 가중 포락 정규화부(113b)와 정규화 이득 계산부(113c)와 양자화부(113d)를 구비하여, 양자화부(113d)에서 얻어진 프레임 단위의 양자화 MDCT 계수열을 주파수 영역 피치 주기 분석부(115, 115', 215, 315, 415)의 입력으로 했다. 그러나, 부호화 장치(11, 11', 21, 31, 41)가 주파수 영역 변환부(113a, 413a)와 가중 포락 정규화부(113b)와 정규화 이득 계산부(113c)와 양자화부(113d) 이외의 처리부를 구비하거나, 일부의 처리부를 생략한 처리를 행해도 된다. 즉, 부호화 장치(11, 11', 21, 31, 41)는 일례로서 주파수 영역 변환부(113a, 413a)와 가중 포락 정규화부(113b)와 정규화 이득 계산부(113c)와 양자화부(113d)에 의해 구성되는 주파수 영역 샘플열 생성부(113)를 구비하고 있게 된다. 부호화 장치(11, 11', 21, 31, 41)가 구비하는 주파수 영역 샘플열 생성부(113)는 장기 예측을 실행하는 경우에는 상기 장기 예측 잔차 신호에 유래하는 주파수 영역의 샘플열을 얻는 처리를 행하고, 장기 예측을 실행하지 않는 경우에는 상기 음향 신호에 유래하는 주파수 영역의 샘플열을 얻는 처리를 행한다. 주파수 영역 샘플열 생성부(113)가 얻은 샘플열은 주파수 영역 피치 주기 분석부(115, 115', 215, 315, 415)에 입력된다.
복호 장치(12, 12', 22, 32, 42)에 대해서도 마찬가지이며, 복호 장치(12, 12', 22, 32, 42)는, 일례로서 이득 승산부(124a)와 가중 포락 역정규화부(124b)와 시간 영역 변환부(124c, 424c)에 의해 구성되는 시간 영역 신호열 생성부(124)를 구비하고 있게 된다. 복호 장치(12, 12', 22, 32, 42)가 구비하는 시간 영역 신호열 생성부(124)는 복호부(123a, 423a) 또는 회복부(123b)로부터 입력된 주파수 영역의 샘플열에 유래하는 시간 영역의 신호열을 얻는 처리를 행한다. 장기 예측 정보 복호부(121, 421)가 출력한 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 시간 영역 신호열 생성부(124)가 얻은 신호열은 장기 예측 잔차 신호열 xp(1),...,xp(Nt)로서 장기 예측 합성부(125, 425)에 입력된다. 장기 예측 정보 복호부(121, 421)가 출력한 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 시간 영역 신호열 생성부(124)가 얻은 신호열은 디지털 음향 신호열 x(1),...,x(Nt)로서 복호 장치(12, 12', 22, 32, 42)로부터 출력된다.
[제5 실시형태]
[부호화 장치(51)]
도 8에 나타내는 바와 같이, 본 실시형태의 부호화 장치(51)가 제1 실시형태, 제1 실시형태의 변형예, 제2 실시형태, 제3 실시형태 및 제4 실시형태의 부호화 장치(11, 11', 21, 31, 41)와 상이한 것은 부호화 장치(51)가 주파수 영역 피치 주기 고려 부호화부(116)를 포함하지 않는다는 점이다. 이 경우는 부호화 장치(51)는 주파수 영역 피치 주기를 특정하기 위한 부호를 얻는 부호화 장치로서 기능한다. 부호화 장치(51)로부터 출력된 주파수 영역의 샘플열도 부호화하는 경우는, 부호화 장치(51)로부터 출력된 주파수 영역의 샘플열은, 예를 들면, 부호화 장치(51)의 외부의 주파수 영역 피치 주기 고려 부호화부(116)에 입력되어 부호화되지만, 그 밖의 부호화 수단을 사용하여 부호화해도 된다. 그 밖에는 제1 실시형태, 제1 실시형태의 변형예, 제2 실시형태, 제3 실시형태 및 제4 실시형태의 부호화 장치(11, 11', 21, 31, 41)와 동일하다.
[복호 장치(52)]
도 9에 나타내는 바와 같이, 본 실시형태의 복호 장치(52)가 제1 실시형태, 제1 실시형태의 변형예, 제2 실시형태, 제3 실시형태 및 제4 실시형태의 복호 장치(12, 12', 22, 32, 42)와 상이한 것은 복호 장치(52)가 주파수 영역 피치 주기 고려 복호부(123), 시간 영역 신호열 생성부(124) 및 장기 예측 합성부(125)를 포함하지 않는다는 점이다. 이 경우는 복호 장치(52)는 부호열에 포함되는 적어도 주파수 영역 피치 주기 부호와 시간 영역 피치 주기 부호로부터, 적어도 장기 예측 주파수 영역 피치 주기 T와 시간 영역의 피치 주기 L을 얻는 복호 장치로서 기능한다. 예를 들면, 복호 장치(52)로부터 출력된 시간 영역의 피치 주기 L 및 양자화 종료 피치 이득 gp^은 장기 예측 합성부(125)의 입력이 된다. 또, 예를 들면, 부호열, 복호 장치(52)로부터 출력된 주파수 영역 피치 주기 T(및 보조 정보가 입력된 경우에는 보조 정보)는 주파수 영역 피치 주기 고려 복호부(123)의 입력이 된다. 그 밖에는 제1 실시형태, 제1 실시형태의 변형예, 제2 실시형태, 제3 실시형태 및 제4 실시형태의 복호 장치(12, 12', 22, 32, 42)와 동일하다.
[제6 실시형태]
도 10 및 도 11에 나타내는 바와 같이, 본 실시형태의 부호화 장치(61) 및 복호 장치(62)가 제1 실시형태, 제1 실시형태의 변형예, 제2 실시형태, 제3 실시형태 및 제4 실시형태와 상이한 것은 주파수 영역 피치 주기 고려 부호화부(116) 대신에 주파수 영역 피치 주기 고려 부호화부(616)가 구성되고, 주파수 영역 피치 주기 고려 복호부(123) 대신에 주파수 영역 피치 주기 고려 복호부(623)가 구성된다는 점이다. 주파수 영역의 샘플열은 주파수 영역 피치 주기 고려 부호화부(616)의 입력이 된다. 부호열, 주파수 영역 피치 주기 T 및 보조 정보는 주파수 영역 피치 주기 고려 복호부(623)의 입력이 된다. 이하에서는 주파수 영역 피치 주기 고려 부호화부(616) 및 주파수 영역 피치 주기 고려 복호부(623)만을 설명한다.
「주파수 영역 피치 주기 고려 부호화부(616)」
주파수 영역 피치 주기 고려 부호화부(616)는 부호화부(616b)를 구비하고, 주파수 영역 피치 주기 T에 기초하는 부호화 방법으로, 입력된 주파수 영역의 샘플열을 부호화하고, 그것에 의해 얻어진 부호열을 출력한다.
「부호화부(616b)」
부호화부(616b)는 주파수 영역의 샘플열 중 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 주파수 영역의 샘플열 중 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플의 전부 또는 일부의 샘플에 의한 샘플군 G1과, 주파수 영역의 샘플열 중 샘플군 G1에 포함되지 않는 샘플에 의한 샘플군 G2를 상이한 기준에 따라(구별하여) 부호화하고, 그것에 의해 얻어진 부호열을 출력한다.
[샘플군 G1, G2의 구체예]
「주파수 영역의 샘플열 중 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 주파수 영역의 샘플열 중 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플의 전부 또는 일부의 샘플」의 구체예는 제1 실시형태와 동일하며, 이러한 샘플에 의한 군이 샘플군 G1이다. 제1 실시형태에서 설명한 바와 같이, 이러한 샘플군 G1의 설정 방법에는 다양한 선택지가 있다. 예를 들면, 부호화부(616b)에 입력된 샘플열 중, 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플 F(nT)의 전후의 샘플 F(nT-1), F(nT+1)을 포함한 3개의 샘플 F(nT-1), F(nT), F(nT+1)에 의한 샘플군의 집합이 샘플군 G1의 예이다. 예를 들면, n이 1 내지 5까지의 각 정수를 나타내는 경우, 제1 샘플군 F(T-1), F(T), F(T+1), 제2 샘플군 F(2T-1), F(2T), F(2T+1), 제3 샘플군 F(3T-1), F(3T), F(3T+1), 제4 샘플군 F(4T-1), F(4T), F(4T+1), 제5 샘플군 F(5T-1), F(5T), F(5T+1)로 이루어지는 군이 샘플군 G1이다.
부호화부(616b)에 입력된 샘플열 중 샘플군 G1에 포함되지 않는 샘플로 이루어지는 군이 샘플군 G2이다. 예를 들면, n이 1 내지 5까지의 각 정수를 나타내는 경우, 제1 샘플 세트 F(1),…,F(T-2), 제2 샘플 세트 F(T+2),…,F(2T-2), 제3 샘플 세트 F(2T+2),…,F(3T-2), 제4 샘플 세트 F(3T+2),…,F(4T-2), 제5 샘플 세트 F(4T+2),…,F(5T-2), 제6 샘플 세트 F(5T+2),…F(jmax)로 이루어지는 군이 샘플군 G2의 예이다.
그 밖에 제1 실시형태에서 예시한 바와 같이, 주파수 영역 피치 주기 T가 소수인 경우, 예를 들면, F(R(nT-1)), F(R(nT)), F(R(nT+1))에 의한 샘플군의 집합이 샘플군 G1이어도 된다. 단, R(nT)은 nT를 반올림한 값이다. 또, 샘플군 G1을 구성하는 각 샘플군에 포함되는 샘플의 개수나 샘플 인덱스를 가변으로 해도 되고, 샘플군 G1을 구성하는 각 샘플군에 포함되는 샘플의 개수와 샘플 인덱스의 조합이 상이한 복수의 선택지 중에서 선택된 하나를 나타내는 정보가 보조 정보(제1 보조 정보)로서 출력되어도 된다.
[상이한 기준에 따른 부호화의 예]
부호화부(616b)는 샘플군 G1, G2에 포함되는 샘플의 재배열을 행하지 않고, 샘플군 G1과 샘플군 G2를 서로 상이한 기준에 따라 부호화하고, 그것에 의해 얻어진 부호열을 출력한다.
샘플군 G1에 포함되는 샘플은 샘플군 G2에 포함되는 샘플보다 평균적으로 진폭이 크다. 이 때, 예를 들면, 샘플군 G1에 포함되는 샘플의 진폭의 크기 또는 그 추정값에 대응하는 기준에 따라 샘플군 G1에 포함되는 샘플을 가변 길이 부호화하고, 샘플군 G2에 포함되는 샘플의 진폭의 크기 또는 그 추정값에 대응하는 기준에 따라 샘플군 G2에 포함되는 샘플을 가변 길이 부호화한다. 이러한 구성으로 함으로써, 샘플열에 포함되는 모든 샘플을 동일한 기준에 따라 가변 길이 부호화하는 경우보다 샘플의 진폭의 추정 정밀도를 높일 수 있으므로, 가변 길이 부호의 평균 부호량을 적게 할 수 있다. 즉, 샘플군 G1과 샘플군 G2를 서로 상이한 기준에 따라 부호화하면, 재배열 조작 없이도 샘플열의 부호량을 적게 하는 효과가 얻어진다. 진폭의 크기의 예는 진폭의 절대값, 진폭의 에너지 등이다.
[라이스 부호화의 예]
가변 길이 부호화로서 1샘플마다의 라이스 부호화를 사용하는 예를 설명한다.
이 경우, 부호화부(616b)는 샘플군 G1에 포함되는 샘플의 진폭의 크기 또는 그 추정값에 대응하는 라이스 파라미터를 사용하여 샘플군 G1에 포함되는 샘플을 1샘플마다 라이스 부호화한다. 또 부호화부(616b)는 샘플군 G2에 포함되는 샘플의 진폭의 크기 또는 그 추정값에 대응하는 라이스 파라미터를 사용하여 샘플군 G2에 포함되는 샘플을 1샘플마다 라이스 부호화한다. 부호화부(616b)는 라이스 부호화에 의해 얻어진 부호열과, 라이스 파라미터를 특정하기 위한 보조 정보를 출력한다.
예를 들면, 부호화부(616b)는 각 프레임에서 샘플군 G1에 포함되는 샘플의 진폭의 크기의 평균으로부터, 당해 프레임에서의 샘플군 G1의 라이스 파라미터를 구한다. 예를 들면, 부호화부(616b)는 각 프레임에서 샘플군 G2에 포함되는 샘플의 진폭의 크기의 평균으로부터, 당해 프레임에서의 샘플군 G2의 라이스 파라미터를 구한다. 라이스 파라미터는 0 이상의 정수이다. 부호화부(616b)는 각 프레임에서, 샘플군 G1의 라이스 파라미터를 사용하여 샘플군 G1에 포함되는 샘플을 라이스 부호화하고, 샘플군 G2의 라이스 파라미터를 사용하여 샘플군 G2에 포함되는 샘플을 라이스 부호화한다. 이것에 의해 평균 부호량을 삭감할 수 있다. 이하에 이 것을 상세하게 설명한다.
우선, 샘플군 G1에 포함되는 샘플을 1샘플마다 라이스 부호화하는 경우를 예로 든다.
샘플군 G1에 포함되는 샘플 X(k)를 1샘플마다 라이스 부호화하여 얻어지는 부호는 샘플군 G1의 라이스 파라미터 s에 대응하는 값으로 샘플 X(k)을 제산하여 얻어지는 몫 q(k)을 알파 부호화한 prefix(k)와, 그 나머지를 특정하는 sub(k)를 포함한다. 즉, 이 예에서의 샘플 X(k)에 대응하는 부호는 prefix(k)와 sub(k)를 포함한다. 또한, 라이스 부호화 대상이 되는 샘플 X(k)는 정수 표현된 것이다.
이하에 q(k) 및 sub(k)의 산출 방법을 예시한다.
라이스 파라미터 s>0의 경우, 이하와 같이 몫 q(k)이 생성된다. 단, floor(χ)는 χ 이하의 최대의 정수이다.
q(k)=floor(X(k)/2s-1)(for X(k)≥0)…(B1)
q(k)=floor{(-X(k)-1)/2s-1}(for X(k)<0)…(B2)
라이스 파라미터 s=0인 경우, 이하와 같이 몫 q(k)이 생성된다.
q(k)=2*X(k)(for X(k)≥0)…(B3)
q(k)=-2*X(k)-1(for X(k)<0)…(B4)
라이스 파라미터 s>0인 경우, 이하와 같이 sub(k)이 생성된다.
sub(k)=X(k)-2s-1*q(k)+2s-1(for X(k)≥0)…(B5)
sub(k)=(-X(k)-1)-2s-1*q(k)(for X(k)<0)…(B6)
라이스 파라미터 s=0인 경우, sub(k)은 null이다(sub(k)=null).
식(B1)~(B4)을 공통화하여 몫 q(k)을 표현하면 이하와 같이 된다. 단, |·|는 ·의 절대값을 나타낸다.
q(k)=floor{(2*|X(k)|-z)/2s}(z=0 or 1 or 2)…(B7)
라이스 부호화의 경우, prefix(k)는 몫 q(k)을 알파 부호화한 부호이며, 그 부호량은 식(B7)을 사용하여 이하와 같이 표현할 수 있다.
floor{(2*|X(k)|-z)/2s}+1…(B8)
라이스 부호화의 경우, 식(B5) (B6)의 나머지를 특정하는 sub(k)는 s비트로 표현된다. 따라서, 샘플군 G1이 포함되는 샘플 X(k)에 대응하는 부호(prefix(k) 및 sub(k))의 총부호량 C(s, X(k), G1)은 이하와 같이 된다.
여기서 floor{(2*|X(k)|-z)/2s}=(2*|X(k)|-z)/2s와 근사하면, 식(B9)은 이하와 같이 근사할 수 있다. 단, |G1|은 1프레임에서의 샘플군 G1에 포함되는 샘플 X(k)의 개수를 나타낸다.
식(B10)의 s에 대한 편미분 결과를 0로 하는 s를 s'로 표현한다.
s'=log2{ln2*(2*D/|G1|-z)}…(B11)
D/|G1|이 z보다 충분히 크면, 식(B11)은 이하와 같이 근사할 수 있다.
s'=log2{ln2*(2·D/|G1|)}…(B12)
식(B12)에서 얻어지는 s'는 정수화되어 있지 않기 때문에, s'를 정수에 양자화한 값을 라이스 파라미터 s로 한다. 이 라이스 파라미터 s는 샘플군 G1에 포함되는 샘플의 진폭의 크기의 평균 D/|G1|에 대응하고(식(B12) 참조), 샘플군 G1에 포함되는 샘플 X(k)에 대응하는 부호의 총부호량을 최소화한다.
이상은 샘플군 G2에 포함되는 샘플을 라이스 부호화하는 경우에 대해서도 마찬가지이다. 따라서, 각 프레임에서, 샘플군 G1에 포함되는 샘플의 진폭의 크기의 평균으로부터 샘플군 G1을 위한 라이스 파라미터를 구하고, 샘플군 G2에 포함되는 샘플의 진폭의 크기의 평균으로부터 샘플군 G2를 위한 라이스 파라미터를 구하고, 샘플군 G1과 샘플군 G2를 구별하여 라이스 부호화를 행함으로써, 총부호량을 최소화할 수 있다.
또한, 근사된 식(B10)에 의한 총부호량 C(s, X(k), G1)의 평가는 샘플 X(k)의 진폭의 크기의 변동이 작을수록 적절한 것이 된다. 그 때문에, 특히 샘플군 G1에 포함되는 샘플의 진폭의 크기가 대략 균등하며, 또한, 샘플군 G2에 포함되는 샘플의 진폭의 크기가 대략 균등한 경우에, 보다 큰 부호량 삭감 효과가 얻어진다.
[라이스 파라미터를 특정하기 위한 보조 정보의 예 1]
샘플군 G1에 대응하는 라이스 파라미터와 샘플군 G2에 대응하는 라이스 파라미터를 구별하여 취급하는 경우, 복호측에서는 샘플군 G1에 대응하는 라이스 파라미터를 특정하기 위한 보조 정보(제3 보조 정보)와, 샘플군 G2에 대응하는 라이스 파라미터를 특정하기 위한 보조 정보(제4 보조 정보)가 필요하게 된다. 그 때문에, 부호화부(616b)는 샘플열을 1샘플마다 라이스 부호화하여 얻어진 부호로 이루어지는 부호열에 더해, 제3 보조 정보 및 제4 보조 정보를 출력해도 된다.
[라이스 파라미터를 특정하기 위한 보조 정보의 예 2]
음향 신호가 부호화 대상인 경우, 샘플군 G1에 포함되는 샘플의 진폭의 크기의 평균은 샘플군 G2에 포함되는 샘플의 진폭의 크기의 평균보다 크고, 샘플군 G1에 대응하는 라이스 파라미터가 샘플군 G2에 대응하는 라이스 파라미터보다 크다. 이 점을 이용하여 라이스 파라미터를 특정하기 위한 보조 정보의 부호량을 삭감할 수도 있다.
예를 들면, 샘플군 G1에 대응하는 라이스 파라미터가 샘플군 G2에 대응하는 라이스 파라미터보다 고정적으로 고정값(예를 들면 1)만큼 크다고 정한다. 즉, 고정적으로 「샘플군 G1에 대응하는 라이스 파라미터=샘플군 G2에 대응하는 라이스 파라미터+고정값」의 관계를 만족한다고 한다. 이 경우, 부호화부(616b)는 부호열에 더해, 제3 보조 정보 또는 제4 보조 정보의 어느 한쪽만을 출력하면 된다.
[라이스 파라미터를 특정하기 위한 보조 정보의 예 3]
단독으로 샘플군 G1에 대응하는 라이스 파라미터를 특정할 수 있는 정보를 제5 보조 정보로 하고, 샘플군 G1에 대응하는 라이스 파라미터와 샘플군 G2에 대응하는 라이스 파라미터의 차분을 특정할 수 있는 정보를 제6 보조 정보로 해도 된다. 반대로, 단독으로 샘플군 G2에 대응하는 라이스 파라미터를 특정할 수 있는 정보를 제6 보조 정보로 하고, 샘플군 G1에 대응하는 라이스 파라미터와 샘플군 G2에 대응하는 라이스 파라미터의 차분을 특정할 수 있는 정보를 제5 보조 정보로 해도 된다. 또한, 샘플군 G1에 대응하는 라이스 파라미터가 샘플군 G2에 대응하는 라이스 파라미터보다 큰 것을 알고 있기 때문에, 샘플군 G1에 대응하는 라이스 파라미터와 샘플군 G2에 대응하는 라이스 파라미터의 대소관계를 나타내는 보조 정보(정부(正負)를 나타내는 정보 등)는 불필요하다.
[라이스 파라미터를 특정하기 위한 보조 정보의 예 4]
프레임 전체에 할당되는 부호 비트수가 정해져 있는 경우에는, 스텝 S113c에서 구해지는 이득의 값도 상당히 제약되고, 샘플의 진폭이 취할 수 있는 범위도 크게 제약된다. 이 경우, 프레임 전체에 할당되는 부호 비트수로부터 샘플의 진폭의 크기의 평균을 어느 정도의 정밀도로 추정할 수 있다. 부호화부(616b)는 당해 샘플의 진폭의 크기의 평균의 추정값으로부터 추정되는 라이스 파라미터를 사용하여 라이스 부호화를 행해도 된다.
예를 들면, 부호화부(616b)는 당해 추정되는 라이스 파라미터에 제1 차분값(예를 들면 1)을 더한 것을 샘플군 G1에 대응하는 라이스 파라미터로서 사용하고, 당해 추정되는 라이스 파라미터를 샘플군 G2에 대응하는 라이스 파라미터로서 사용해도 된다. 또는, 부호화부(616b)는 당해 추정되는 라이스 파라미터를 샘플군 G1에 대응하는 라이스 파라미터로서 사용하고, 당해 추정되는 라이스 파라미터로부터 제2 차분값(예를 들면 1)을 감한 것을 샘플군 G2에 대응하는 라이스 파라미터로서 사용해도 된다.
이들 경우의 부호화부(616b)는 예를 들면 부호열에 더해, 제1 차분값을 특정하기 위한 보조 정보(제7 보조 정보) 또는 제2 차분값을 특정하기 위한 보조 정보(제8 보조 정보)를 출력하면 된다.
[라이스 파라미터를 특정하기 위한 보조 정보의 예 5]
샘플군 G1에 포함되는 샘플의 진폭의 크기가 균등하지 않은 경우나, 샘플군 G2에 포함되는 샘플의 진폭의 크기가 균등하지 않은 경우에도, 샘플열 X(1),...,X(N)의 진폭의 포락 정보에 의존하여, 부호량 삭감 효과가 보다 큰 라이스 파라미터를 추정할 수도 있다. 예를 들면, 샘플의 진폭의 크기가 고역일수록 큰 경우에는, 샘플군 G1에 포함되는 샘플 중 고역측의 샘플에 대응하는 라이스 파라미터를 고정적으로 증가시키고, 샘플군 G2에 포함되는 샘플 중 고역측의 샘플에 대응하는 라이스 파라미터를 고정적으로 증가시킴으로써, 부호량을 보다 삭감할 수 있다. 이하에 구체예를 나타낸다.
단, s1 및 s2는 [라이스 파라미터를 특정하기 위한 보조 정보의 예 1~4]에서 예시한 샘플군 G1 및 G2에 각각 대응하는 라이스 파라미터이다. const.1 내지 const.10은 미리 정해진 정의 정수이다. 이 예의 경우, 부호화부(616b)는 부호열 및 라이스 파라미터의 예 2, 3에서 예시한 보조 정보에 더해, 포락 정보를 특정하는 보조 정보(제9 보조 정보)를 출력하면 된다. 포락 정보가 복호측에 이미 알려진 경우에는, 부호화부(616b)는 제9 보조 정보를 출력하지 않아도 된다.
「주파수 영역 피치 주기 고려 복호부(623)」
주파수 영역 피치 주기 고려 복호부(623)는 복호부(623a)를 구비하고, 주파수 영역 피치 주기 T에 기초하는 복호 방법으로 부호열을 복호하여 주파수 영역의 샘플열을 얻어 출력한다.
「복호부(623a)」
복호부(623a)는 주파수 영역의 샘플열을, 주파수 영역의 샘플열 중 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 주파수 영역의 샘플열 중 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플의 전부 또는 일부의 샘플에 의한 샘플군 G1과, 주파수 영역의 샘플열 중 샘플군 G1에 포함되지 않는 샘플에 의한 샘플군 G2를 상이한 기준에 따른(구별된) 복호 처리에 의해 부호열을 복호함으로써 얻어 출력한다.
[부호군 C1, C2와 샘플군 G1, G2의 구체예]
복호부(623a)는 입력된 주파수 영역 피치 주기 T에 의해(제1 보조 정보가 입력되는 경우에는 주파수 영역 피치 주기 T와 제1 보조 정보에 의해), 프레임마다, 입력된 부호열에 포함되는 부호군 C1 및 C2 및 각각의 부호군이 대응하는 샘플군 G1 및 G2에 포함되는 샘플 번호를 특정하고, 부호군 C1 및 C2를 복호하여 얻어지는 샘플값군을 각 부호가 대응하는 샘플 번호에 할당함으로써 샘플군 G1 및 G2를 얻음으로써 주파수 영역의 샘플열을 얻는다. 부호군 C1은 부호열 중 샘플군 G1에 포함되는 샘플에 대응하는 부호로 이루어지고, 부호군 C2는 부호열 중 샘플군 G2에 포함되는 샘플에 대응하는 부호로 이루어진다. 복호부(623a)에서의 부호군 C1 및 C2의 특정 방법은 부호화부(616b)에서의 샘플군 G1 및 G2의 설정 방법에 대응하고, 예를 들면, 상기 서술한 샘플군 G1 및 G2의 설정 방법에서의 「샘플」을 「부호」로, 「F(j)」를 「C(j)」로, 「샘플군 G1」을 「부호군 C1」로, 「샘플군 G2」를 「부호군 C2」로 치환한 것이다. 단, C(j)는 샘플 F(j)에 대응하는 부호이다.
예를 들면, 부호화부(616b)에 입력된 샘플열 중, 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플 F(nT)의 전후의 샘플 F(nT-1), F(nT+1)을 포함한 3개의 샘플 F(nT-1), F(nT), F(nT+1)에 의한 군이 샘플군 G1으로 되어 있는 경우, 복호부(623a)는 입력된 부호열 C(1),…,C(jmax) 중, 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플 번호 nT의 전후의 샘플 번호 nT-1, nT+1을 포함한 3개의 샘플 번호에 대응하는 부호 C(nT-1), C(nT), C(nT+1)에 의한 군을 부호군 C1으로 하고, 부호군 C1에 포함되지 않는 부호로 이루어지는 군을 부호군 C2로 하고, 부호군 C1에 포함되는 부호 C(nT-1), C(nT), C(nT+1)을 각각 복호하여 샘플 번호 nT-1의 샘플 F(nT-1), 샘플 번호 nT의 샘플 F(nT), 샘플 번호 nT+1의 샘플 F(nT+1)를 얻고, 부호군 C2에 포함되는 부호를 복호하여 샘플 번호 nT-1, nT, nT+1 이외의 샘플 번호의 샘플을 얻는다. 예를 들면, n이 1 내지 5까지의 각 정수를 나타내는 경우, 제1 부호군 C(T-1), C(T), C(T+1), 제2 부호군 C(2T-1), C(2T), C(2T+1), 제3 부호군 C(3T-1), C(3T), C(3T+1), 제4 부호군 C(4T-1), C(4T), C(4T+1), 제5 부호군 C(5T-1), C(5T), C(5T+1)로 이루어지는 군이 부호군 C1이며, 제1 부호 세트 C(1),…,C(T-2), 제2 부호 세트 C(T+2),…,C(2T-2), 제3 부호 세트 C(2T+2),…,C(3T-2), 제4 부호 세트 C(3T+2),…,C(4T-2), 제5 부호 세트 C(4T+2),…,C(5T-2), 제6 부호 세트 C(5T+2), …C(jmax)로 이루어지는 군이 부호군 C2이며, 이들 부호군과 부호 세트를 각각 복호하여, 제1 샘플군 F(T-1), F(T), F(T+1), 제2 샘플군 F(2T-1), F(2T), F(2T+1), 제3 샘플군 F(3T-1), F(3T), F(3T+1), 제4 샘플군 F(4T-1), F(4T), F(4T+1), 제5 샘플군 F(5T-1), F(5T), F(5T+1), 제1 샘플 세트 F(1),…,F(T-2), 제2 샘플 세트 F(T+2),…,F(2T-2), 제3 샘플 세트 F(2T+2),…,F(3T-2), 제4 샘플 세트 F(3T+2),…,F(4T-2), 제5 샘플 세트 F(4T+2),…,F(5T-2), 제6 샘플 세트 F(5T+2),…F(jmax)를 얻음으로써, 주파수 영역의 샘플열을 얻는다.
[상이한 기준에 따른 복호의 예]
복호부(623a)는 부호군 C1과 부호군 C2를 서로 상이한 기준에 따라 복호하고, 그것에 의해 주파수 영역의 샘플열을 얻어 출력한다. 예를 들면, 복호부(623a)는 부호군 C1에 대응하는 샘플군 G1에 포함되는 샘플의 진폭의 크기 또는 그 추정값에 대응하는 기준에 따라 부호군 C1에 포함되는 부호를 복호하고, 부호군 C2에 대응하는 샘플군 G2에 포함되는 샘플의 진폭의 크기 또는 그 추정값에 대응하는 기준에 따라 부호군 C2에 포함되는 부호를 복호한다.
[라이스 부호화의 예]
1샘플마다의 라이스 부호화에 의해 부호열이 얻어지고 있는 경우를 예시한다.
이 경우, 복호부(623a)는 프레임마다, 입력된 보조 정보(제1~9 보조 정보의 적어도 일부)로부터 특정되는 샘플군 G1에 대응하는 라이스 파라미터를 부호군 C1에 대응하는 라이스 파라미터로 하고, 샘플군 G2에 대응하는 라이스 파라미터를 부호군 C2에 대응하는 라이스 파라미터로 한다. 이하에 상기 서술한 [라이스 파라미터를 특정하기 위한 보조 정보의 예 1~5]에 대응하는 라이스 파라미터의 특정 방법을 예시한다.
[라이스 파라미터를 특정하기 위한 보조 정보의 예 1의 경우]
예를 들면, 제3 보조 정보 및 제4 보조 정보가 입력된 복호부(623a)는 제3 보조 정보로부터 샘플군 G1에 대응하는 라이스 파라미터를 특정하고, 그것을 부호군 C1에 대응하는 라이스 파라미터로 하고, 제4 보조 정보로부터 샘플군 G2에 대응하는 라이스 파라미터를 특정하고, 그것을 부호군 C2에 대응하는 라이스 파라미터로 한다.
[라이스 파라미터를 특정하기 위한 보조 정보의 예 2의 경우]
예를 들면, 부호열 이외에 제4 보조 정보만이 입력된 복호부(623a)는 제4 보조 정보로부터 부호군 C2에 대응하는 라이스 파라미터를 특정하고, 부호군 C2에 대응하는 라이스 파라미터에 고정값(예를 들면 1)을 더한 것을 부호군 C1에 대응하는 라이스 파라미터로 한다. 또는, 부호열 이외에 제3 보조 정보만이 입력된 복호부(623a)는 제3 보조 정보로부터 부호군 C1에 대응하는 라이스 파라미터를 특정하고, 부호군 C1에 대응하는 라이스 파라미터로부터 고정값(예를 들면 1)을 감한 것을 부호군 C2에 대응하는 라이스 파라미터로 한다.
[라이스 파라미터를 특정하기 위한 보조 정보의 예 3의 경우]
예를 들면, 라이스 파라미터를 특정하는 제5 보조 정보 및 차분을 특정하는 제6 보조 정보가 입력된 복호부(623a)는 제5 보조 정보로부터 샘플군 G1에 대응하는 라이스 파라미터를 특정하고, 그것을 부호군 C1에 대응하는 라이스 파라미터로 한다. 또한, 부호군 C1에 대응하는 라이스 파라미터로부터, 제6 보조 정보로부터 특정한 차분을 감한 값을 부호군 C2에 대응하는 라이스 파라미터로 한다.
예를 들면, 차분을 특정하는 제5 보조 정보 및 라이스 파라미터를 특정하는 제6 보조 정보가 입력된 복호부(623a)는 제6 보조 정보로부터 샘플군 G1에 대응하는 라이스 파라미터를 특정하고, 그것을 부호군 C1에 대응하는 라이스 파라미터로 한다. 또한, 부호군 C2에 대응하는 라이스 파라미터에 제5 보조 정보로부터 특정한 차분을 가산한 값을 부호군 C1에 대응하는 라이스 파라미터로 한다.
[라이스 파라미터를 특정하기 위한 보조 정보의 예 4의 경우]
예를 들면, 제7 보조 정보가 입력된 복호부(623a)는 프레임 전체에 할당되는 부호 비트수로부터 추정되는 라이스 파라미터를 부호군 C2에 대응하는 라이스 파라미터로 하고, 이것에 제7 보조 정보로부터 특정되는 제1 차분값을 가산한 것을 부호군 C1에 대응하는 라이스 파라미터로 한다.
예를 들면, 제8 보조 정보가 입력된 복호부(623a)는 프레임 전체에 할당되는 부호 비트수로부터 추정되는 라이스 파라미터를 부호군 C1에 대응하는 라이스 파라미터로 하고, 이것으로부터 제8 보조 정보로부터 특정되는 제2 차분값을 감한 것을 부호군 C2에 대응하는 라이스 파라미터로 한다.
[라이스 파라미터를 특정하기 위한 보조 정보의 예 5의 경우]
예를 들면, 상기 서술한 라이스 파라미터를 특정하기 위한 보조 정보에 더해, 또한 제9 보조 정보가 입력된 복호부(623a)는 보조 정보 3~8의 적어도 일부를 사용하여 s1 및 s2를 특정하고, 제9 보조 정보에 기초하여 s1 및 s2를 상기 서술한 [표 1]과 같이 조정함으로써, 부호군 C1 및 C2에 각각 대응하는 라이스 파라미터를 얻는다.
제9 보조 정보가 입력되지 않는 경우에도, 포락 정보가 이미 알려져 있고, 부호화부(616b)가 s1 및 s2를 상기 서술한 [표 1]과 같이 조정함으로써 샘플군 G1 및 G2에 각각 대응하는 라이스 파라미터를 얻고 있는 경우에는, 복호부(623a)는 s1 및 s2를 상기 서술한 [표 1]과 같이 조정함으로써, 부호군 C1 및 C2에 각각 대응하는 라이스 파라미터를 얻는다.
상기 서술한 바와 같이 라이스 파라미터를 얻은 복호부(623a)는 프레임마다, 부호군 C1에 대응하는 라이스 파라미터를 사용하여 부호군 C1에 포함되는 부호를 복호하고, 부호군 C2에 대응하는 라이스 파라미터를 사용하여 부호군 C2에 포함되는 부호를 복호하고, 그것에 의해 원래의 샘플의 배열을 얻어 출력한다. 또한, 라이스 부호화에 대응하는 복호 처리는 주지이므로 설명을 생략한다.
[제7 실시형태]
제6 실시형태에서는, 부호화 장치(61)의 내부에 주파수 영역 피치 주기 고려 부호화부(616)가 구성되고, 복호 장치(62)의 내부에 주파수 영역 피치 주기 고려 복호부(623)가 구성되는 예를 나타냈다. 그러나, 부호화 장치(61)에 주파수 영역 피치 주기 고려 부호화부(616)를 포함하지 않는 구성으로 하고, 복호 장치(62)에 주파수 영역 피치 주기 고려 복호부(623)를 포함하지 않는 구성으로 해도 된다. 이것은 제1 실시형태, 제1 실시형태의 변형예, 제2 실시형태, 제3 실시형태, 제4 실시형태에 대한 제5 실시형태와 동일한 구성의 차이이므로, 상세한 설명은 생략한다.
[제8 실시형태]
[부호화 장치(81)]
도 14에 나타내는 바와 같이, 본 실시형태의 부호화 장치(81)가 제5 실시형태의 부호화 장치(51)와 상이한 것은 부호화 장치(81)가 장기 예측 분석부(111)와 장기 예측 잔차 생성부(112)와 주파수 영역 샘플열 생성부(113)를 포함하지 않는다는 점이다. 이 경우는 부호화 장치(81)는 부호화 장치(81)의 외부로부터 시간 영역의 피치 주기 L과 시간 영역 피치 주기 부호 CL과 주파수 영역 샘플열이 입력되고, 주파수 영역 샘플열에 대한 주파수 영역 피치 주기를 특정하기 위한 부호를 얻는 부호화 장치로서 기능한다.
부호화 장치(81)에 입력되는 시간 영역의 피치 주기 L과 시간 영역 피치 주기 부호 CL은, 예를 들면, 장기 예측 분석부(111)에서 계산되지만, 그 밖의 시간 영역 피치 주기 산출 수단을 사용하여 산출해도 된다.
또, 부호화 장치(81)에 입력되는 주파수 영역 샘플열은 입력 디지털 음향 신호열을 주파수 영역의 N점으로 변환한 샘플열에 대응하는 샘플열이며, 예를 들면, 부호화 장치(81)의 외부의 주파수 영역 샘플열 생성부(113)에 있어서 계산되는 양자화 MDCT 계수열이어도 되고, 다른 주파수 영역 샘플열 생성 수단을 사용하여 생성된 주파수 영역 샘플열이어도 된다.
부호화 장치(81)의 주기 환산부(814)에는 시간 영역의 피치 주기 L과 주파수 영역의 샘플점수 N이 입력되고, 환산 간격 T1을 구하여 출력한다. 환산 간격 T1을 구하는 처리는 주기 환산부(114)와 동일하다. 또한, 시간 영역의 피치 주기 L 대신에, 시간 영역의 피치 주기 L에 대응하는 시간 영역 피치 주기 부호 CL이 입력되어도 되고, 이 경우는 입력된 시간 영역 피치 주기 부호 CL에 대응하는 시간 영역 피치 주기 L을 구하고, 시간 영역 피치 주기 L로부터 환산 간격 T1을 구하여 출력한다.
주파수 영역 피치 주기 분석부(815)에는 환산 간격 T1과 주파수 영역 샘플열이 입력된다. 주파수 영역 피치 주기 분석부(815)는 환산 간격 T1과 환산 간격 T1의 정수배의 값 U×T1(단, U는 미리 정한 제1 범위의 정수)을 포함하는 후보값으로부터, 주파수 영역 피치 주기를 결정하고, 주파수 영역 피치 주기를 특정하기 위한 부호를 얻어 출력한다. 주파수 영역 피치 주기를 결정하는 처리 및 주파수 영역 피치 주기를 특정하기 위한 부호를 얻는 처리는 주파수 영역 피치 주기 분석부(115, 115', 215, 315, 415)의 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우의 처리와 동일하다.
또, 주기 환산부(814)와 주파수 영역 피치 주기 분석부(815)는 주기 환산부(114, 414)와 주파수 영역 피치 주기 분석부(115, 115', 215, 315, 415)와 마찬가지로, 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우와 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에서 상이한 처리를 행하는 구성으로 해도 된다. 이 경우는 부호화 장치(81)의 외부의 장기 예측 분석부(111)에 있어서, 장기 예측 선택 정보도 부호화 장치(81)에 입력된다.
[복호 장치(82)]
도 15에 나타내는 바와 같이, 본 실시형태의 복호 장치(82)가 제5 실시형태의 복호 장치(52)와 상이한 것은 복호 장치(82)가 장기 예측 정보 복호부(121)를 포함하지 않는다는 점이다. 이 경우는 복호 장치(82)는 복호 장치(82)의 외부의 장기 예측 정보 복호부(121)에 의해 얻은 시간 영역 피치 주기 L과, 입력되는 부호열에 포함되는 적어도 주파수 영역 피치 주기 부호와 시간 영역 피치 주기 부호로부터, 적어도 주파수 영역 피치 주기 T를 얻는 복호 장치로서 기능한다. 예를 들면, 부호열, 부호화 장치(81)로부터 출력된 주파수 영역 피치 주기 T(및 보조 정보가 입력된 경우에는 보조 정보)는 주파수 영역 피치 주기 고려 복호부(123)의 입력이 된다. 그 밖에는 제5 실시형태의 복호 장치(52)와 동일하다.
[제9 실시형태]
[주파수 영역 피치 주기 분석 장치(91)]
또, 제5 실시형태, 제7 실시형태, 제8 실시형태에서는, 부호화 장치(51, 81)에서 구한 주파수 영역 피치 주기 T를, 외부의 주파수 영역 피치 주기 고려 부호화부(116, 616)에서 주파수 영역의 샘플열의 부호화에 사용하는 것을 전제로 하여, 주파수 영역 피치 주기 T에 대응하는 주파수 영역 피치 주기 부호를 출력하고 있었다. 그러나, 주파수 영역 피치 주기 T를 부호화 이외의 목적으로 사용하는 것도 가능하며, 그 경우, 주파수 영역 피치 주기 T에 대응하는 주파수 영역 피치 주기 부호를 출력하지 않아도 된다. 부호화 이외의 목적으로서는 예를 들면 음성이나 악음의 분석, 복수의 음성이나 악음의 분리, 음성이나 악음의 인식 등이 생각된다.
도 16에 나타내는 바와 같이, 제9 실시형태의 주파수 영역 피치 주기 분석 장치(91)가 제5 실시형태, 제7 실시형태, 제8 실시형태의 부호화 장치(51, 81)와 상이한 점은 주파수 영역 피치 주기 T에 대응하는 주파수 영역 피치 주기 부호를 출력하지 않는다는 점이다. 이 경우, 주파수 영역 피치 주기 분석 장치(91)는 외부로부터 입력된 시간 영역의 피치 주기 L로부터, 주파수 영역 샘플열에 대한 주파수 영역 피치 주기를 결정하는 주파수 영역 피치 주기 분석 장치로서 기능한다.
제9 실시형태의 주기 환산부(914)에는 시간 영역의 피치 주기 L과 주파수 영역의 샘플점수 N이 입력되고, 환산 간격 T1을 구하여 출력한다. 환산 간격 T1을 구하는 처리는 주기 환산부(114)와 동일하다.
주파수 영역 피치 주기 분석부(915)에는 환산 간격 T1과 주파수 영역 샘플열이 입력되고, 환산 간격 T1과 환산 간격 T1의 정수배의 값 U×T1(단, U는 미리 정한 제1 범위의 정수)을 포함하는 후보값으로부터, 주파수 영역 피치 주기를 결정하고, 결정한 주파수 영역 피치 주기를 출력한다.
[기타]
또한, 제1 실시형태, 제1 실시형태의 변형예, 제2 실시형태, 제3 실시형태, 제4 실시형태에서는, 주파수 영역 피치 주기 고려 부호화부로서 재배열 처리부(116a)와 부호화부(116b)에 의한 구성을 설명하고, 제6 실시형태에서는, 주파수 영역 피치 주기 고려 부호화부로서 부호화부(616b)에 의한 구성을 설명했지만, 어느 주파수 영역 피치 주기 고려 부호화부도 「주파수 영역 피치 주기 T에 기초하는 부호화 방법으로, 입력된 주파수 영역의 샘플열을 부호화하고, 그것에 의해 얻어진 부호열을 출력한다.」는 것이며, 보다 상세하게는 「주파수 영역의 샘플열 중 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 주파수 영역의 샘플열 중 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플의 전부 또는 일부의 샘플에 의한 샘플군(G1)과, 주파수 영역의 샘플열 중 샘플군 G1에 포함되지 않는 샘플에 의한 샘플군을 상이한 기준에 따라(구별하여) 부호화하고, 그것에 의해 얻어진 부호열을 출력한다.」는 것이다.
복호 장치에 대해서도 마찬가지이며, 제1 실시형태, 제1 실시형태의 변형예, 제2 실시형태, 제3 실시형태, 제4 실시형태의 주파수 영역 피치 주기 고려 복호부와, 제6 실시형태의 주파수 영역 피치 주기 고려 복호부는 「주파수 영역 피치 주기 T에 기초하는 복호 방법으로, 입력된 부호열을 복호하여 주파수 영역의 샘플열을 출력한다.」는 것이며, 보다 상세하게는 「입력된 부호열로부터, 주파수 영역의 샘플열 중 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 주파수 영역의 샘플열 중 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플의 전부 또는 일부의 샘플에 의한 샘플군과, 주파수 영역의 샘플열 중 샘플군 G1에 포함되지 않는 샘플에 의한 샘플군을 상이한 기준에 따라(구별하여) 복호하여 주파수 영역의 샘플열을 얻어 출력한다.」는 것이다.
<부호화 장치/복호 장치의 하드웨어 구성예>
상기 서술한 실시형태에 따른 부호화 장치/복호 장치는 키보드 등이 접속 가능한 입력부, 액정 디스플레이 등이 접속 가능한 출력부, CPU(Central Processing Unit) 〔캐시 메모리 등을 구비하고 있어도 된다.〕, 메모리인 RAM(Random Access Memory)이나 ROM(Read Only Memory), 하드디스크인 외부 기억 장치 및 이들의 입력부, 출력부, CPU, RAM, ROM, 외부 기억 장치간의 데이터의 주고받음이 가능하도록 접속되는 버스 등을 구비하고 있다. 또 필요에 따라 부호화 장치/복호 장치에, CD-ROM 등의 기억 매체를 읽고 쓸 수 있는 장치(드라이브) 등을 설치해도 된다.
부호화 장치/복호 장치의 외부 기억 장치에는 부호화/복호를 실행하기 위한 프로그램 및 이 프로그램의 처리에 있어서 필요하게 되는 데이터 등이 기억되어 있다〔외부 기억 장치에 한정되지 않고, 예를 들면 프로그램을 판독 전용 기억 장치인 ROM에 기억시켜 두거나 해도 된다.〕. 또, 이들 프로그램의 처리에 의해 얻어지는 데이터 등은 RAM이나 외부 기억 장치 등에 적시에 기억된다. 이하, 데이터나 그 격납 영역의 어드레스 등을 기억하는 기억 장치를 간단히 「기억부」라고 부르기로 한다.
부호화 장치의 기억부에는 음성 음향 신호에 유래하는 주파수 영역의 샘플열의 재배열을 행하기 위한 프로그램, 재배열에서 얻어진 샘플열의 부호화를 위한 프로그램 등이 기억되어 있다.
복호 장치의 기억부에는 입력된 부호열을 복호하기 위한 프로그램, 복호로 얻어진 샘플열을 부호화 장치로 재배열이 행해지기 전의 샘플열로 회복하기 위한 프로그램 등이 기억되어 있다.
부호화 장치에서는 기억부에 기억된 각 프로그램과 이 각 프로그램의 처리에 필요한 데이터가 필요에 따라 RAM에 읽혀, CPU에서 해석 실행·처리된다. 이 결과, CPU가 소정의 기능(재배열 처리부, 부호화부 등)을 실현함으로써 부호화가 실현된다.
복호 장치에서는 기억부에 기억된 각 프로그램과 이 각 프로그램의 처리에 필요한 데이터가 필요에 따라 RAM에 읽혀, CPU에서 해석 실행·처리된다. 이 결과, CPU가 소정의 기능(복호부, 회복부 등)을 실현함으로써 복호가 실현된다.
<보기>
본 발명은 상기 서술한 실시형태에 한정되는 것은 아니며, 본 발명의 취지를 일탈하지 않는 범위에서 적당히 변경이 가능하다. 또, 상기 실시형태에 있어서 설명한 처리는 기재의 순서에 따라 시계열로 실행될 뿐만 아니라, 처리를 실행하는 장치의 처리 능력 또는 필요에 따라 병렬적으로 또는 개별로 실행되는 것으로 해도 된다. 예를 들면, 상기 서술한 복호 처리에 있어서, 장기 예측 정보 복호부(121)에 의한 처리와 복호부(123a, 523a)에 의한 처리는 병렬로 실행할 수 있다.
또, 상기 실시형태에 있어서 설명한 하드웨어 엔티티(부호화 장치/복호 장치)에 있어서의 처리 기능을 컴퓨터에 의해 실현하는 경우, 하드웨어 엔티티가 가져야 할 기능의 처리 내용은 프로그램에 의해 기술된다. 그리고, 이 프로그램을 컴퓨터로 실행함으로써, 상기 하드웨어 엔티티에 있어서의 처리 기능이 컴퓨터 상에서 실현된다.
이 처리 내용을 기술한 프로그램은 컴퓨터로 판독 가능한 기록 매체에 기록해 둘 수 있다. 컴퓨터로 판독 가능한 기록 매체의 예는 비일시적인(non-transitory) 기록 매체이다. 컴퓨터로 판독 가능한 기록 매체로서는 예를 들면 자기 기록 장치, 광디스크, 광자기 기록 매체, 반도체 메모리 등 어떠한 것이어도 된다. 구체적으로는, 예를 들면, 자기 기록 장치로서 하드디스크 장치, 플렉서블 디스크, 자기 테이프 등을, 광디스크로서 DVD(Digital Versatile Disc), DVD-RAM(Random Access Memory), CD-ROM(Compact Disc Read Only Memory), CD-R (Recordable)/RW(ReWritable) 등을, 광자기 기록 매체로서 MO(Magneto-Optical disc) 등을 반도체 메모리로서 EEP-ROM(Electronically Erasable and Programmable-Read Only Memory) 등을 사용할 수 있다.
또, 이 프로그램의 유통은 예를 들면 그 프로그램을 기록한 DVD, CD-ROM 등의 가반형 기록매체를 판매, 양도, 대여하거나 함으로써 행한다. 또한, 이 프로그램을 서버 컴퓨터 기억 장치에 격납해 두고, 네트워크를 통하여 서버 컴퓨터로부터 다른 컴퓨터에 그 프로그램을 전송함으로써, 이 프로그램을 유통시키는 구성으로 해도 된다.
이러한 프로그램을 실행하는 컴퓨터는, 예를 들면, 우선, 가반형 기록 매체에 기록된 프로그램 혹은 서버 컴퓨터로부터 전송된 프로그램을, 일단 자기의 기억 장치에 격납한다. 그리고, 처리의 실행시, 이 컴퓨터는 자기의 기록 매체에 격납된 프로그램을 판독하고, 판독한 프로그램에 따른 처리를 실행한다. 또, 이 프로그램의 다른 실행 형태로서, 컴퓨터가 가반형 기록 매체로부터 직접 프로그램을 판독하고, 그 프로그램에 따른 처리를 실행하는 것으로 해도 되고, 또한, 이 컴퓨터에 서버 컴퓨터로부터 프로그램이 전송될 때마다, 차례로 수취한 프로그램에 따른 처리를 실행하는 것으로 해도 된다. 또, 서버 컴퓨터로부터, 이 컴퓨터로의 프로그램의 전송은 행하지 않고, 그 실행 지시와 결과 취득만에 의해 처리 기능을 실현하는 소위 ASP(Application Service Provider)형의 서비스에 의해, 상기 서술한 처리를 실행하는 구성으로 해도 된다. 또한, 본 형태에 있어서의 프로그램에는 전자 계산기에 의한 처리의 용도에 제공하는 정보로서 프로그램에 준하는 것(컴퓨터에 대한 직접의 지령은 아니지만 컴퓨터의 처리를 규정하는 성질을 가지는 데이터 등)을 포함하는 것으로 한다.
또, 이 형태에서는 컴퓨터상에서 소정의 프로그램을 실행시킴으로써 하드웨어 엔티티를 구성하는 것으로 했지만, 이들 처리 내용의 적어도 일부를 하드웨어적으로 실현하는 것으로 해도 된다.
11, 21, 31, 41, 51, 61, 81 : 부호화 장치
12, 22, 32, 42, 52, 62, 82 : 복호 장치
91 : 주파수 영역 피치 주기 분석 장치
111, 411 : 장기 예측 분석부
112, 412 : 장기 예측 잔차 생성부
113 : 주파수 영역 샘플열 생성부
113a, 413a : 주파수 영역 변환부
113b : 가중 포락 정규화부
113c : 정규화 이득 계산부
113d : 양자화부
114, 414, 914 : 주기 환산부
115, 215, 315, 415, 915 : 주파수 영역 피치 주기 분석부
116, 616 :주파수 영역 피치 주기 고려 부호화부
116a : 재배열 처리부
116b, 616b : 부호화부
121, 421 : 장기 예측 정보 복호부
122, 222, 422 : 주기 환산부
123, 623 : 주파수 영역 피치 주기 고려 복호부
123a, 623a : 복호부
123b : 회복부
124 : 시간 영역 신호열 생성부
124a : 이득 승산부
124b : 가중 포락 역정규화부
124c : 시간 영역 변환부
125, 425 : 장기 예측 합성부
12, 22, 32, 42, 52, 62, 82 : 복호 장치
91 : 주파수 영역 피치 주기 분석 장치
111, 411 : 장기 예측 분석부
112, 412 : 장기 예측 잔차 생성부
113 : 주파수 영역 샘플열 생성부
113a, 413a : 주파수 영역 변환부
113b : 가중 포락 정규화부
113c : 정규화 이득 계산부
113d : 양자화부
114, 414, 914 : 주기 환산부
115, 215, 315, 415, 915 : 주파수 영역 피치 주기 분석부
116, 616 :주파수 영역 피치 주기 고려 부호화부
116a : 재배열 처리부
116b, 616b : 부호화부
121, 421 : 장기 예측 정보 복호부
122, 222, 422 : 주기 환산부
123, 623 : 주파수 영역 피치 주기 고려 복호부
123a, 623a : 복호부
123b : 회복부
124 : 시간 영역 신호열 생성부
124a : 이득 승산부
124b : 가중 포락 역정규화부
124c : 시간 영역 변환부
125, 425 : 장기 예측 합성부
Claims (34)
- 소정의 시간 구간의 음향 신호의 시간 영역 피치 주기 부호에 시간 영역의 피치 주기 L이 대응하고, 상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻는 주기 환산 스텝; 및
상기 환산 간격 T1의 정수배의 값 U×T1(단, U는 미리 정한 제1 범위 내의 정수)을 포함하는 복수의 후보값 중에서 중간 후보값을 결정하고, 상기 중간 후보값 및 상기 중간 후보값의 근방의 미리 정한 제3 범위의 값 중에서 상기 음향 신호에 유래하는 주파수 영역 샘플열의 피치 주기(이하, 「제1 주파수 영역 피치 주기 T」라고 한다.)를 결정하고, 상기 중간 후보값이 상기 환산 간격 T1의 몇배인지를 나타내는 정보와, 상기 제1 주파수 영역 피치 주기 T와 상기 중간 후보값의 차를 나타내는 정보를 제1 주파수 영역 피치 주기 부호로서 얻는 주파수 영역 피치 주기 분석 스텝;을 가지는 것을 특징으로 하는 부호화 방법. - 소정의 시간 구간의 음향 신호의 시간 영역에서의 장기 예측 분석을 행하고 시간 영역의 피치 주기 L과 상기 시간 영역의 피치 주기 L에 대응하는 시간 영역 피치 주기 부호를 얻는 장기 예측 분석 스텝;
상기 시간 영역의 피치 주기 L을 사용하여 상기 음향 신호의 장기 예측 잔차 신호를 얻는 장기 예측 잔차 생성 스텝;
상기 장기 예측 잔차 신호에 유래하는 주파수 영역의 샘플열 또는 상기 음향 신호에 유래하는 주파수 영역의 샘플열을 얻는 주파수 영역 샘플열 생성 스텝;
상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻는 주기 환산 스텝; 및
상기 환산 간격 T1의 정수배의 값 U×T1(단, U는 미리 정한 제1 범위 내의 정수)을 포함하는 복수의 후보값 중에서 중간 후보값을 결정하고, 상기 중간 후보값 및 상기 중간 후보값의 근방의 미리 정한 제3 범위의 값 중에서 상기 주파수 영역 샘플열의 피치 주기(이하, 「제1 주파수 영역 피치 주기 T」라고 한다.)를 결정하고, 상기 중간 후보값이 상기 환산 간격 T1의 몇배인지를 나타내는 정보와, 상기 제1 주파수 영역 피치 주기 T와 상기 중간 후보값의 차를 나타내는 정보를 제1 주파수 영역 피치 주기 부호로서 얻는 주파수 영역 피치 주기 분석 스텝;을 가지는 것을 특징으로 하는 부호화 방법. - 소정의 시간 구간의 음향 신호의 시간 영역에서의 장기 예측 분석을 행하고, 장기 예측을 실행할지 여부를 나타내는 장기 예측 선택 정보, 장기 예측을 실행하는 경우는 시간 영역의 피치 주기 L과 상기 시간 영역의 피치 주기 L에 대응하는 시간 영역 피치 주기 부호를 얻는 장기 예측 분석 스텝;
장기 예측을 실행하는 경우에는, 상기 시간 영역의 피치 주기 L을 사용하여 상기 음향 신호의 장기 예측 잔차 신호를 얻는 장기 예측 잔차 생성 스텝;
장기 예측을 실행하는 경우에는 상기 장기 예측 잔차 신호에, 장기 예측을 실행하지 않는 경우에는 상기 음향 신호에 유래하는 주파수 영역의 샘플열을 얻는 주파수 영역 샘플열 생성 스텝;
상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻는 주기 환산 스텝; 및
장기 예측을 실행하는 경우에는, 상기 환산 간격 T1의 정수배의 값 U×T1(단, U는 미리 정한 제1 범위 내의 정수)을 포함하는 복수의 후보값 중에서 상기 주파수 영역 샘플열의 피치 주기(이하, 「제1 주파수 영역 피치 주기」라고 한다.) T를 결정하고, 상기 제1 주파수 영역 피치 주기 T가 상기 환산 간격 T1의 몇배인지를 나타내는 제1 주파수 영역 피치 주기 부호를 얻고, 장기 예측을 실행하지 않는 경우에는, 미리 정한 제2 범위의 정수값을 후보값 중에서 상기 주파수 영역 샘플열의 피치 주기(이하, 「제2 주파수 영역 피치 주기」라고 한다.) T를 결정하고, 상기 제2 주파수 영역 피치 주기 T를 나타내는 제2 주파수 영역 피치 주기 부호를 얻는 주파수 영역 피치 주기 분석 스텝;을 가지는 것을 특징으로 하는 부호화 방법. - 제 3 항에 있어서,
상기 주파수 영역 피치 주기 분석 스텝은,
장기 예측을 실행하는 경우에는, 상기 환산 간격 T1의 정수배의 값 U×T1을 포함하는 복수의 후보값 중에서 중간 후보값을 결정하고, 상기 중간 후보값 및 상기 중간 후보값의 근방의 미리 정한 제3 범위의 값 중에서 상기 제1 주파수 영역 피치 주기 T를 결정하고, 상기 중간 후보값이 상기 환산 간격 T1의 몇배인지를 나타내는 정보와, 상기 제1 주파수 영역 피치 주기 T와 상기 중간 후보값의 차를 나타내는 정보를 상기 제1 주파수 영역 피치 주기 부호로서 얻고, 장기 예측을 실행하지 않는 경우에는, 상기 미리 정한 제2 범위의 정수값을 후보값으로 하여 상기 제2 주파수 영역 피치 주기 T를 결정하고, 상기 제2 주파수 영역 피치 주기 T와 상기 제2 주파수 영역 피치 주기 T를 나타내는 상기 제2 주파수 영역 피치 주기 부호를 얻는 것을 특징으로 하는 부호화 방법. - 소정의 시간 구간의 음향 신호의 시간 영역에서의 장기 예측 분석을 행하고, 장기 예측을 실행할지 여부를 나타내는 장기 예측 선택 정보, 장기 예측을 실행하는 경우는 시간 영역의 피치 주기 L과 상기 시간 영역의 피치 주기 L에 대응하는 시간 영역 피치 주기 부호와 피치 이득을 얻는 장기 예측 분석 스텝;
장기 예측을 실행하는 경우에는, 상기 시간 영역의 피치 주기 L과 상기 피치 이득을 사용하여 상기 음향 신호의 장기 예측 잔차 신호를 얻는 장기 예측 잔차 생성 스텝;
장기 예측을 실행하는 경우에는 상기 장기 예측 잔차 신호에, 장기 예측을 실행하지 않는 경우에는 상기 음향 신호에 유래하는 주파수 영역의 샘플열을 얻는 주파수 영역 샘플열 생성 스텝;
상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻는 주기 환산 스텝; 및
양자화 종료 피치 이득이 미리 정한 값 이상인 경우에는, 상기 환산 간격 T1의 정수배의 값 U×T1(단, U는 미리 정한 제1 범위 내의 정수)을 포함하는 복수의 후보값 중에서 상기 주파수 영역 샘플열의 피치 주기(이하, 「제1 주파수 영역 피치 주기」라고 한다.) T를 결정하고, 상기 제1 주파수 영역 피치 주기 T와 상기 제1 주파수 영역 피치 주기 T가 상기 환산 간격 T1의 몇배인지를 나타내는 제1 주파수 영역 피치 주기 부호를 얻고, 상기 양자화 종료 피치 이득이 미리 정한 값보다 작은 경우에는, 미리 정한 제2 범위의 정수값을 후보값 중에서 상기 주파수 영역 샘플열의 피치 주기(이하, 「제2 주파수 영역 피치 주기」라고 한다.) T를 결정하고, 상기 제2 주파수 영역 피치 주기 T와 상기 제2 주파수 영역 피치 주기 T를 나타내는 제2 주파수 영역 피치 주기 부호를 얻는 주파수 영역 피치 주기 분석 스텝;을 가지는 것을 특징으로 하는 부호화 방법. - 제 5 항에 있어서,
상기 주파수 영역 피치 주기 분석 스텝은,
상기 양자화 종료 피치 이득이 미리 정한 값 이상인 경우에는, 상기 환산 간격 T1의 정수배의 값 U×T1을 포함하는 복수의 후보값 중에서 중간 후보값을 결정하고, 상기 중간 후보값 및 상기 중간 후보값의 근방의 미리 정한 제3 범위의 값 중에서 상기 제1 주파수 영역 피치 주기 T를 결정하고, 상기 중간 후보값이 상기 환산 간격 T1의 몇배인지를 나타내는 정보와, 상기 제1 주파수 영역 피치 주기 T와 상기 중간 후보값의 차를 나타내는 정보를 상기 제1 주파수 영역 피치 주기 부호로서 얻고, 상기 양자화 종료 피치 이득이 미리 정한 값보다 작은 경우에는, 상기 미리 정한 제2 범위의 정수값을 후보값으로 하여 상기 제2 주파수 영역 피치 주기 T를 결정하고, 상기 제2 주파수 영역 피치 주기 T와 상기 제2 주파수 영역 피치 주기 T를 나타내는 상기 제2 주파수 영역 피치 주기 부호를 얻는 것을 특징으로 하는 부호화 방법. - 소정의 시간 구간의 음향 신호의 시간 영역 피치 주기 부호에 시간 영역의 피치 주기 L이 대응하고, 상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻는 주기 환산 스텝;
상기 환산 간격 T1의 정수배의 값 U×T1(단, U는 미리 정한 제1 범위 내의 정수)을 포함하는 복수의 후보값 중에서 상기 음향 신호에 유래하는 주파수 영역 샘플열의 피치 주기(이하, 「제1 주파수 영역 피치 주기」라고 한다.) T를 결정하고, 상기 제1 주파수 영역 피치 주기 T가 상기 환산 간격 T1의 몇배인지를 나타내는 제1 주파수 영역 피치 주기 부호를 얻는 주파수 영역 피치 주기 분석 스텝; 및
상기 제1 주파수 영역 피치 주기 T에 기초하는 부호화 방법으로서 상기 주파수 영역의 샘플열을 부호화하는 주파수 영역 피치 주기 고려 부호화 스텝을 가지는 것을 특징으로 하는 부호화 방법. - 제 7 항에 있어서,
상기 제1 주파수 영역 피치 주기 T에 기초하는 부호화 방법은,
상기 주파수 영역의 샘플열 중 상기 제1 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 상기 주파수 영역의 샘플열 중 상기 제1 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플의 전부 또는 일부의 샘플에 의한 샘플군과, 상기 샘플열 중 상기 샘플군에 포함되지 않는 샘플에 의한 제2 샘플군을 상이한 기준에 따라서 부호화하는 부호화 방법인 것을 특징으로 하는 부호화 방법. - 제 7 항에 있어서,
상기 주파수 영역 피치 주기 고려 부호화 스텝은,
(1) 상기 샘플열의 모든 샘플이 포함되고, 또한
(2) 상기 샘플열 중 상기 제1 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 상기 샘플열 중 상기 제1 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플의 전부 또는 일부의 샘플이 모이도록 상기 샘플열에 포함되는 적어도 일부의 샘플을 재배열한 것
을 재배열 후의 샘플열로서 얻는 재배열 스텝; 및
상기 재배열 스텝에서 얻어진 샘플열을 부호화하는 부호화 스텝;을 포함하는 것을 특징으로 하는 부호화 방법. - 제 9 항에 있어서,
상기 재배열 스텝에서는,
상기 소정의 시간 구간의 음향 신호에 대응하는 예측 이득 또는 그 추정값이 미리 정한 역치 이하인 경우는, 상기 샘플열을 재배열 후의 샘플열로서 출력하는 것을 특징으로 하는 부호화 방법. - 시간 영역 피치 주기 부호를 복호하여 시간 영역의 피치 주기 L을 얻는 장기 예측 정보 복호 스텝; 및
상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻고, 제1 주파수 영역 피치 주기 부호를 복호하여, 중간 후보값이 상기 환산 간격 T1의 몇배인지의 배수값과, 제1 주파수 영역 피치 주기 T와 상기 중간 후보값의 차의 값을 얻고, 상기 환산 간격 T1에 상기 배수값을 승산하여 얻어지는 값에 상기 차의 값을 가산한 것을 상기 제1 주파수 영역 피치 주기 T로서 얻는 주기 환산 스텝;을 가지는 것을 특징으로 하는 복호 방법. - 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에, 시간 영역 피치 주기 부호를 복호하여 시간 영역의 피치 주기 L을 얻는 장기 예측 정보 복호 스텝; 및
상기 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻고, 제1 주파수 영역 피치 주기 부호를 복호하여 제1 주파수 영역 피치 주기 T가 상기 환산 간격 T1의 몇배인지를 나타내는 배수값을 얻고, 상기 환산 간격 T1에 상기 배수값을 승산한 것을 상기 제1 주파수 영역 피치 주기 T로서 얻고, 상기 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 제2 주파수 영역 피치 주기 부호를 복호하여 제2 주파수 영역 피치 주기 T를 얻는 주기 환산 스텝;을 가지는 것을 특징으로 하는 복호 방법. - 제 12 항에 있어서,
상기 주기 환산 스텝은,
상기 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에는, 상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 상기 환산 간격 T1으로서 얻고, 상기 제1 주파수 영역 피치 주기 부호를 복호하여, 중간 후보값이 상기 환산 간격 T1의 몇배인지의 배수값과, 상기 제1 주파수 영역 피치 주기 T와 상기 중간 후보값의 차의 값을 얻고, 상기 환산 간격 T1에 상기 배수값을 승산하여 얻어지는 값에 상기 차의 값을 가산한 것을 상기 제1 주파수 영역 피치 주기 T로서 얻고, 상기 장기 예측 선택 정보가 장기 예측을 실행하지 않는 것을 나타내는 경우에는, 상기 제2 주파수 영역 피치 주기 부호를 복호하여 상기 제2 주파수 영역 피치 주기 T를 얻는 것을 특징으로 하는 복호 방법. - 장기 예측 선택 정보가 장기 예측을 실행하는 것을 나타내는 경우에, 시간 영역 피치 주기 부호를 복호하여 시간 영역의 피치 주기 L을 얻고, 이득 부호를 복호하여 양자화 종료 피치 이득을 얻는 장기 예측 정보 복호 스텝; 및
상기 양자화 종료 피치 이득이 미리 정한 값 이상인 경우에는, 상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻고, 제1 주파수 영역 피치 주기 부호를 복호하여 제1 주파수 영역 피치 주기 T가 상기 환산 간격 T1의 몇배인지를 나타내는 배수값을 얻고, 상기 환산 간격 T1에 상기 배수값을 한 것을 상기 제1 주파수 영역 피치 주기 T로서 얻고, 상기 양자화 종료 피치 이득이 미리 정한 값보다 작은 경우에는, 제2 주파수 영역 피치 주기 부호를 복호하여 제2 주파수 영역 피치 주기 T를 얻는 주기 환산 스텝;을 가지는 것을 특징으로 하는 복호 방법. - 제 14 항에 있어서,
상기 주기 환산 스텝은,
상기 양자화 종료 피치 이득이 미리 정한 값 이상인 경우에는, 상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 상기 환산 간격 T1으로서 얻고, 상기 제1 주파수 영역 피치 주기 부호를 복호하여, 중간 후보값이 상기 환산 간격 T1의 몇배인지의 배수값과, 상기 제1 주파수 영역 피치 주기 T와 상기 중간 후보값의 차의 값을 얻고, 상기 환산 간격 T1에 상기 배수값을 승산하여 얻어지는 값에 상기 차의 값을 가산한 것을 상기 제1 주파수 영역 피치 주기 T로서 얻고, 상기 양자화 종료 피치 이득이 미리 정한 값보다 작은 경우에는, 상기 제2 주파수 영역 피치 주기 부호를 복호하여 상기 제2 주파수 영역 피치 주기 T를 얻는 것을 특징으로 하는 복호 방법. - 시간 영역 피치 주기 부호를 복호하여 시간 영역의 피치 주기 L을 얻는 장기 예측 정보 복호 스텝; 및
상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻고, 제1 주파수 영역 피치 주기 부호를 복호하여 제1 주파수 영역 피치 주기 T가 상기 환산 간격 T1의 몇배인지를 나타내는 배수값을 얻고, 상기 환산 간격 T1에 상기 배수값을 승산한 것을 상기 제1 주파수 영역 피치 주기 T로서 얻는 주기 환산 스텝;을 가지고,
상기 제1 주파수 영역 피치 주기 T에 기초하는 복호 방법으로 부호열을 복호하여 주파수 영역의 샘플열을 얻는 주파수 영역 피치 주기 고려 복호 스텝;
상기 주파수 영역의 샘플열에 유래하는 시간 영역의 신호열을 얻는 시간 영역 신호열 생성 스텝; 및
상기 시간 영역의 신호열과 상기 시간 영역의 피치 주기 L과 과거의 복호 음향 신호열을 사용하여, 복호 음향 신호열을 얻는 장기 예측 합성 스텝;을 추가로 가지는 것을 특징으로 하는 복호 방법. - 제 12 항 내지 제 15 항 중 어느 한 항에 있어서,
상기 제1 또는 2 주파수 영역 피치 주기 T에 기초하는 복호 방법으로 부호열을 복호하여 주파수 영역의 샘플열을 얻는 주파수 영역 피치 주기 고려 복호 스텝;
상기 주파수 영역의 샘플열에 유래하는 시간 영역의 신호열을 얻는 시간 영역 신호열 생성 스텝; 및
상기 시간 영역의 신호열과 상기 시간 영역의 피치 주기 L과 과거의 복호 음향 신호열을 사용하여, 복호 음향 신호열을 얻는 장기 예측 합성 스텝;을 추가로 가지는 것을 특징으로 하는 복호 방법. - 제 16 항에 있어서,
상기 제1 주파수 영역 피치 주기 T에 기초하는 복호 방법은,
상기 주파수 영역의 샘플열 중 상기 제1 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 상기 주파수 영역의 샘플열 중 상기 제1 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플의 전부 또는 일부의 샘플에 의한 샘플군과, 상기 주파수 영역의 샘플열 중 상기 샘플군에 포함되지 않는 샘플에 의한 제2 샘플군이 상이한 기준에 따른 복호 처리에 의해 얻어지는 복호 방법인 것을 특징으로 하는 복호 방법. - 제 17 항에 있어서,
상기 제1 또는 2 주파수 영역 피치 주기 T에 기초하는 복호 방법은,
상기 주파수 영역의 샘플열 중 상기 제1 또는 2 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 상기 주파수 영역의 샘플열 중 상기 제1 또는 2 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플의 전부 또는 일부의 샘플에 의한 샘플군과, 상기 주파수 영역의 샘플열 중 상기 샘플군에 포함되지 않는 샘플에 의한 제2 샘플군이 상이한 기준에 따른 복호 처리에 의해 얻어지는 복호 방법인 것을 특징으로 하는 복호 방법. - 제 16 항에 있어서,
상기 주파수 영역 피치 주기 고려 복호 스텝은,
상기 부호열을 복호하여 샘플열을 얻는 복호 스텝; 및
상기 제1 주파수 영역 피치 주기 T에 따라 상기 샘플열로부터 주파수순의 샘플의 배열인 주파수 영역의 샘플열을 얻는 회복 스텝;
을 포함하는 것을 특징으로 하는 복호 방법. - 제 17 항에 있어서,
상기 주파수 영역 피치 주기 고려 복호 스텝은,
상기 부호열을 복호하여 샘플열을 얻는 복호 스텝; 및
상기 제1 또는 2 주파수 영역 피치 주기 T에 따라 상기 샘플열로부터 주파수순의 샘플의 배열인 주파수 영역의 샘플열을 얻는 회복 스텝;
을 포함하는 것을 특징으로 하는 복호 방법. - 제 20 항에 있어서,
상기 회복 스텝에서는,
소정의 시간 구간의 예측 이득의 추정값이 미리 정한 역치 이하인 경우는, 상기 부호열을 복호하여 얻어진 샘플열을 원래의 샘플의 배열인 주파수 영역의 샘플열로서 출력하는 것을 특징으로 하는 복호 방법. - 제 21 항에 있어서,
상기 회복 스텝에서는,
소정의 시간 구간의 예측 이득의 추정값이 미리 정한 역치 이하인 경우는, 상기 부호열을 복호하여 얻어진 샘플열을 원래의 샘플의 배열인 주파수 영역의 샘플열로서 출력하는 것을 특징으로 하는 복호 방법. - 제 11 항에 있어서,
상기 제1 주파수 영역 피치 주기 T에 기초하는 복호 방법으로 부호열을 복호하여 주파수 영역의 샘플열을 얻는 주파수 영역 피치 주기 고려 복호 스텝;
상기 주파수 영역의 샘플열에 유래하는 시간 영역의 신호열을 얻는 시간 영역 신호열 생성 스텝; 및
상기 시간 영역의 신호열과 상기 시간 영역의 피치 주기 L과 과거의 복호 음향 신호열을 사용하여, 복호 음향 신호열을 얻는 장기 예측 합성 스텝;을 추가로 가지는 것을 특징으로 하는 복호 방법. - 제 24 항에 있어서,
상기 제1 주파수 영역 피치 주기 T에 기초하는 복호 방법은,
상기 주파수 영역의 샘플열 중 상기 제1 주파수 영역 피치 주기 T에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플 및 상기 주파수 영역의 샘플열 중 상기 제1 주파수 영역 피치 주기 T의 정수배에 대응하는 샘플을 포함하는 하나 또는 연속하는 복수의 샘플의 전부 또는 일부의 샘플에 의한 샘플군과, 상기 주파수 영역의 샘플열 중 상기 샘플군에 포함되지 않는 샘플에 의한 제2 샘플군이 상이한 기준에 따른 복호 처리에 의해 얻어지는 복호 방법인 것을 특징으로 하는 복호 방법. - 제 24 항에 있어서,
상기 주파수 영역 피치 주기 고려 복호 스텝은,
상기 부호열을 복호하여 샘플열을 얻는 복호 스텝; 및
상기 제1 주파수 영역 피치 주기 T에 따라 상기 샘플열로부터 주파수순의 샘플의 배열인 주파수 영역의 샘플열을 얻는 회복 스텝;
을 포함하는 것을 특징으로 하는 복호 방법. - 소정의 시간 구간의 음향 신호에 유래하는 주파수 영역 샘플열의 피치 주기(이하, 「주파수 영역 피치 주기」라고 한다.) T를 결정하는 주파수 영역 피치 주기 분석 방법으로서,
상기 음향 신호의 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻는 주기 환산 스텝; 및
상기 환산 간격 T1의 정수배의 값 U×T1(단, U는 미리 정한 제1 범위 내의 정수)을 포함하는 복수의 후보값 중에서 중간 후보값을 결정하고, 상기 중간 후보값 및 상기 중간 후보값의 근방의 미리 정한 제3 범위의 값 중에서 상기 주파수 영역 피치 주기 T를 결정하는 주파수 영역 피치 주기 분석 스텝;을 가지는 것을 특징으로 하는 주파수 영역 피치 주기 분석 방법. - 소정의 시간 구간의 음향 신호의 시간 영역 피치 주기 부호에 시간 영역의 피치 주기 L이 대응하고, 상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻는 주기 환산부; 및
상기 환산 간격 T1의 정수배의 값 U×T1(단, U는 미리 정한 제1 범위 내의 정수)을 포함하는 복수의 후보값 중에서 중간 후보값을 결정하고, 상기 중간 후보값 및 상기 중간 후보값의 근방의 미리 정한 제3 범위의 값 중에서 상기 음향 신호에 유래하는 주파수 영역 샘플열의 피치 주기(이하, 「제1 주파수 영역 피치 주기 T」라고 한다.) T를 결정하고, 상기 중간 후보값이 상기 환산 간격 T1의 몇배인지를 나타내는 정보와, 상기 제1 주파수 영역 피치 주기 T와 상기 중간 후보값의 차를 나타내는 정보를 제1 주파수 영역 피치 주기 부호로서 얻는 주파수 영역 피치 주기 분석부;를 가지는 것을 특징으로 하는 부호화 장치. - 소정의 시간 구간의 음향 신호의 시간 영역에서의 장기 예측 분석을 행하고 시간 영역의 피치 주기 L과 상기 시간 영역의 피치 주기 L에 대응하는 시간 영역 피치 주기 부호를 얻는 장기 예측 분석부;
상기 시간 영역의 피치 주기 L을 사용하여 상기 음향 신호의 장기 예측 잔차 신호를 얻는 장기 예측 잔차 생성부;
상기 장기 예측 잔차 신호에 유래하는 주파수 영역의 샘플열 또는 상기 음향 신호에 유래하는 주파수 영역의 샘플열을 얻는 주파수 영역 샘플열 생성부;
상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻는 주기 환산부; 및
상기 환산 간격 T1의 정수배의 값 U×T1(단, U는 미리 정한 제1 범위 내의 정수)을 포함하는 복수의 후보값 중에서 중간 후보값을 결정하고, 상기 중간 후보값 및 상기 중간 후보값의 근방의 미리 정한 제3 범위의 값 중에서 상기 주파수 영역 샘플열의 피치 주기(이하, 「제1 주파수 영역 피치 주기」라고 한다.) T를 결정하고, 상기 중간 후보값이 상기 환산 간격 T1의 몇배인지를 나타내는 정보와, 상기 제1 주파수 영역 피치 주기 T와 상기 중간 후보값의 차를 나타내는 정보를 제1 주파수 영역 피치 주기 부호로서 얻는 주파수 영역 피치 주기 분석부;를 가지는 것을 특징으로 하는 부호화 장치. - 시간 영역 피치 주기 부호를 복호하여 시간 영역의 피치 주기 L을 얻는 장기 예측 정보 복호부; 및
상기 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻고, 제1 주파수 영역 피치 주기 부호를 복호하여, 중간 후보값이 상기 환산 간격 T1의 몇배인지의 배수값과, 제1 주파수 영역 피치 주기 T와 상기 중간 후보값의 차의 값을 얻고, 상기 환산 간격 T1에 상기 배수값을 승산하여 얻어지는 값에 상기 차의 값을 가산한 것을 상기 제1 주파수 영역 피치 주기 T로서 얻는 주기 환산부;를 가지는 것을 특징으로 하는 복호 장치. - 소정의 시간 구간의 음향 신호에 유래하는 주파수 영역 샘플열의 피치 주기(이하, 「주파수 영역 피치 주기」라고 한다.) T를 결정하는 주파수 영역 피치 주기 분석 장치로서,
상기 음향 신호의 시간 영역의 피치 주기 L에 대응하는 주파수 영역의 샘플 간격을 환산 간격 T1으로서 얻는 주기 환산부; 및
상기 환산 간격 T1의 정수배의 값 U×T1(단, U는 미리 정한 제1 범위 내의 정수)을 포함하는 복수의 후보값 중에서 중간 후보값을 결정하고, 상기 중간 후보값 및 상기 중간 후보값의 근방의 미리 정한 제3 범위의 값 중에서 상기 주파수 영역 피치 주기 T를 결정하는 주파수 영역 피치 주기 분석부;를 가지는 것을 특징으로 하는 주파수 영역 피치 주기 분석 장치. - 제 1 항 내지 제 10 항 중 어느 한 항에 기재된 부호화 방법의 각 스텝을 컴퓨터에 실행시키기 위한 프로그램을 격납한 컴퓨터 판독 가능한 기록 매체.
- 제 11 항 내지 제 16 항 중 어느 한 항에 기재된 복호 방법의 각 스텝을 컴퓨터에 실행시키기 위한 프로그램을 격납한 컴퓨터 판독 가능한 기록 매체.
- 제 27 항의 주파수 영역 피치 주기 분석 방법의 각 스텝을 컴퓨터에 실행시키기 위한 프로그램을 격납한 컴퓨터 판독 가능한 기록 매체.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012117172 | 2012-05-23 | ||
JPJP-P-2012-117172 | 2012-05-23 | ||
JP2012171155 | 2012-08-01 | ||
JPJP-P-2012-171155 | 2012-08-01 | ||
PCT/JP2013/064209 WO2013176177A1 (ja) | 2012-05-23 | 2013-05-22 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147030874A Division KR20140143438A (ko) | 2012-05-23 | 2013-05-22 | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160100411A KR20160100411A (ko) | 2016-08-23 |
KR101663607B1 true KR101663607B1 (ko) | 2016-10-07 |
Family
ID=49623862
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147030874A KR20140143438A (ko) | 2012-05-23 | 2013-05-22 | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체 |
KR1020177016696A KR101762204B1 (ko) | 2012-05-23 | 2013-05-22 | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체 |
KR1020167021875A KR101663607B1 (ko) | 2012-05-23 | 2013-05-22 | 부호화 방법, 복호 방법, 주파수 영역 피치 주기 분석 방법, 부호화 장치, 복호 장치, 주파수 영역 피치 주기 분석 장치 및 기록 매체 |
KR1020167018299A KR101750071B1 (ko) | 2012-05-23 | 2013-05-22 | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147030874A KR20140143438A (ko) | 2012-05-23 | 2013-05-22 | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체 |
KR1020177016696A KR101762204B1 (ko) | 2012-05-23 | 2013-05-22 | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167018299A KR101750071B1 (ko) | 2012-05-23 | 2013-05-22 | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체 |
Country Status (8)
Country | Link |
---|---|
US (3) | US9947331B2 (ko) |
EP (3) | EP3576089B1 (ko) |
JP (1) | JP6053196B2 (ko) |
KR (4) | KR20140143438A (ko) |
CN (3) | CN108962270B (ko) |
ES (3) | ES2689072T3 (ko) |
PL (2) | PL2830057T3 (ko) |
WO (1) | WO2013176177A1 (ko) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2689072T3 (es) * | 2012-05-23 | 2018-11-08 | Nippon Telegraph And Telephone Corporation | Codificación de una señal de audio |
WO2016121826A1 (ja) * | 2015-01-30 | 2016-08-04 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法、プログラム及び記録媒体 |
US10276186B2 (en) * | 2015-01-30 | 2019-04-30 | Nippon Telegraph And Telephone Corporation | Parameter determination device, method, program and recording medium for determining a parameter indicating a characteristic of sound signal |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3270376B1 (en) * | 2015-04-13 | 2020-03-18 | Nippon Telegraph and Telephone Corporation | Sound signal linear predictive coding |
CN106373594B (zh) * | 2016-08-31 | 2019-11-26 | 华为技术有限公司 | 一种音调检测方法及装置 |
CN110291583B (zh) * | 2016-09-09 | 2023-06-16 | Dts公司 | 用于音频编解码器中的长期预测的系统和方法 |
JP6712643B2 (ja) * | 2016-09-15 | 2020-06-24 | 日本電信電話株式会社 | サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム |
EP3742441B1 (en) * | 2018-01-17 | 2023-04-12 | Nippon Telegraph And Telephone Corporation | Encoding device, decoding device, fricative determination device, and method and program thereof |
CN110728990B (zh) * | 2019-09-24 | 2022-04-05 | 维沃移动通信有限公司 | 基音检测方法、装置、终端设备和介质 |
US11769071B2 (en) * | 2020-11-30 | 2023-09-26 | IonQ, Inc. | System and method for error correction in quantum computing |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4797926A (en) | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
US5003604A (en) * | 1988-03-14 | 1991-03-26 | Fujitsu Limited | Voice coding apparatus |
US5127053A (en) * | 1990-12-24 | 1992-06-30 | General Electric Company | Low-complexity method for improving the performance of autocorrelation-based pitch detectors |
JP3362471B2 (ja) * | 1993-07-27 | 2003-01-07 | ソニー株式会社 | 音声信号の符号化方法及び復号化方法 |
JP3890605B2 (ja) * | 1994-08-22 | 2007-03-07 | ソニー株式会社 | 送受信装置 |
TW321810B (ko) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
WO1999059139A2 (en) * | 1998-05-11 | 1999-11-18 | Koninklijke Philips Electronics N.V. | Speech coding based on determining a noise contribution from a phase change |
GB9811019D0 (en) * | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
JP4550176B2 (ja) * | 1998-10-08 | 2010-09-22 | 株式会社東芝 | 音声符号化方法 |
JP2000267700A (ja) * | 1999-03-17 | 2000-09-29 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化復号方法および装置 |
JP4005359B2 (ja) * | 1999-09-14 | 2007-11-07 | 富士通株式会社 | 音声符号化及び音声復号化装置 |
JP3404350B2 (ja) * | 2000-03-06 | 2003-05-06 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化パラメータ取得方法、音声復号方法及び装置 |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
JP3731575B2 (ja) * | 2002-10-21 | 2006-01-05 | ソニー株式会社 | 符号化装置及び復号装置 |
EP1619664B1 (en) * | 2003-04-30 | 2012-01-25 | Panasonic Corporation | Speech coding apparatus, speech decoding apparatus and methods thereof |
BRPI0517246A (pt) | 2004-10-28 | 2008-10-07 | Matsushita Electric Ind Co Ltd | aparelho de codificação escalável, aparelho de decodificação escalável e métodos para os mesmos |
WO2006075605A1 (ja) * | 2005-01-12 | 2006-07-20 | Nippon Telegraph And Telephone Corporation | 長期予測符号化方法、長期予測復号化方法、これら装置、そのプログラム及び記録媒体 |
ES2351935T3 (es) * | 2005-04-01 | 2011-02-14 | Qualcomm Incorporated | Procedimiento y aparato para la cuantificación vectorial de una representación de envolvente espectral. |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
JP4964114B2 (ja) | 2007-12-25 | 2012-06-27 | 日本電信電話株式会社 | 符号化装置、復号化装置、符号化方法、復号化方法、符号化プログラム、復号化プログラム、および記録媒体 |
WO2010140546A1 (ja) * | 2009-06-03 | 2010-12-09 | 日本電信電話株式会社 | 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム及びこれらの記録媒体 |
JP5612698B2 (ja) * | 2010-10-05 | 2014-10-22 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
ES2689072T3 (es) * | 2012-05-23 | 2018-11-08 | Nippon Telegraph And Telephone Corporation | Codificación de una señal de audio |
US9589570B2 (en) * | 2012-09-18 | 2017-03-07 | Huawei Technologies Co., Ltd. | Audio classification based on perceptual quality for low or medium bit rates |
-
2013
- 2013-05-22 ES ES13793620.9T patent/ES2689072T3/es active Active
- 2013-05-22 WO PCT/JP2013/064209 patent/WO2013176177A1/ja active Application Filing
- 2013-05-22 EP EP19185171.6A patent/EP3576089B1/en active Active
- 2013-05-22 ES ES18173806T patent/ES2762160T3/es active Active
- 2013-05-22 CN CN201811010320.XA patent/CN108962270B/zh active Active
- 2013-05-22 KR KR1020147030874A patent/KR20140143438A/ko active Application Filing
- 2013-05-22 KR KR1020177016696A patent/KR101762204B1/ko active IP Right Grant
- 2013-05-22 PL PL13793620T patent/PL2830057T3/pl unknown
- 2013-05-22 KR KR1020167021875A patent/KR101663607B1/ko active IP Right Grant
- 2013-05-22 JP JP2014516829A patent/JP6053196B2/ja active Active
- 2013-05-22 CN CN201811009738.9A patent/CN109147827B/zh active Active
- 2013-05-22 CN CN201380026430.4A patent/CN104321814B/zh active Active
- 2013-05-22 US US14/391,534 patent/US9947331B2/en active Active
- 2013-05-22 EP EP18173806.3A patent/EP3385950B1/en active Active
- 2013-05-22 EP EP13793620.9A patent/EP2830057B1/en active Active
- 2013-05-22 PL PL18173806T patent/PL3385950T3/pl unknown
- 2013-05-22 ES ES19185171T patent/ES2834391T3/es active Active
- 2013-05-22 KR KR1020167018299A patent/KR101750071B1/ko active IP Right Grant
-
2018
- 2018-02-23 US US15/904,159 patent/US10096327B2/en active Active
- 2018-02-23 US US15/904,140 patent/US10083703B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101663607B1 (ko) | 부호화 방법, 복호 방법, 주파수 영역 피치 주기 분석 방법, 부호화 장치, 복호 장치, 주파수 영역 피치 주기 분석 장치 및 기록 매체 | |
JP5612698B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP5893153B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
KR101740359B1 (ko) | 부호화 방법, 부호화 장치, 주기성 특징량 결정 방법, 주기성 특징량 결정 장치, 프로그램, 기록 매체 | |
JP5603484B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP5694751B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right |