KR20170126515A - 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 - Google Patents
선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 Download PDFInfo
- Publication number
- KR20170126515A KR20170126515A KR1020177032372A KR20177032372A KR20170126515A KR 20170126515 A KR20170126515 A KR 20170126515A KR 1020177032372 A KR1020177032372 A KR 1020177032372A KR 20177032372 A KR20177032372 A KR 20177032372A KR 20170126515 A KR20170126515 A KR 20170126515A
- Authority
- KR
- South Korea
- Prior art keywords
- coefficient
- value
- fundamental frequency
- autocorrelation
- coefficients
- Prior art date
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 103
- 238000000034 method Methods 0.000 title description 36
- 238000004364 calculation method Methods 0.000 claims abstract description 82
- 238000013139 quantization Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 84
- 238000012986 modification Methods 0.000 description 49
- 230000004048 modification Effects 0.000 description 49
- 230000006870 function Effects 0.000 description 26
- 238000012545 processing Methods 0.000 description 22
- 230000002596 correlated effect Effects 0.000 description 21
- 230000005236 sound signal Effects 0.000 description 18
- 238000001228 spectrum Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000007423 decrease Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 102220475340 DNA replication licensing factor MCM2_S41A_mutation Human genes 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005242 forging Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 101100441445 Sulfolobus acidocaldarius (strain ATCC 33909 / DSM 639 / JCM 8929 / NBRC 15157 / NCIMB 11770) cutB gene Proteins 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 101150089047 cutA gene Proteins 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
자기상관 계산부(21)가 입력 신호로부터 자기상관 RO(i)을 계산한다. 예측 계수 계산부(23)가 계수 wO(i)와 자기상관 RO(i)이 승산된 것인 변형 자기상관 R'O(i)을 사용하여 선형 예측 분석을 행한다. 여기서, 적어도 일부의 각 차수 i에 대하여, 각 차수 i에 대응하는 계수 wO(i)가 현재 또는 과거의 프레임에 있어서의 입력 신호의 기본 주파수와 부의 상관관계에 있는 값의 증가와 함께 단조증가하는 관계에 있는 경우가 포함되어 있는 것으로 한다.
Description
본 발명은 음성 신호, 음향 신호, 심전도, 뇌파, 뇌자도, 지진파 등의 디지털 시계열 신호의 분석 기술에 관한 것이다.
음성 신호, 음향 신호의 부호화에서는 입력된 음성 신호나 음향 신호를 선형 예측 분석하여 얻은 예측 계수에 기초하여 부호화하는 수법이 널리 사용되고 있다(예를 들면, 비특허문헌 1, 2 참조.).
비특허문헌 1 내지 3에서는 도 15에 예시하는 선형 예측 분석 장치에 의해 예측 계수가 계산되고 있다. 선형 예측 분석 장치(1)는 자기상관 계산부(11), 계수 승산부(12) 및 예측 계수 계산부(13)를 구비하고 있다.
입력된 시간 영역의 디지털 음성 신호나 디지털 음향 신호인 입력 신호는 N샘플의 프레임마다 처리된다. 현 시각에서 처리 대상으로 하는 프레임인 현 프레임의 입력 신호를 XO(n)(n=0,1,…,N-1)로 한다. n은 입력 신호에 있어서의 각 샘플의 샘플 번호를 나타내고, N은 소정의 정의 정수이다. 여기서, 현 프레임의 1개 앞의 프레임의 입력 신호는 XO(n)(n=-N, -N+1,…,-1)이며, 현 프레임의 1개 뒤의 프레임의 입력 신호는 XO(n)(n=N, N+1,…,2N-1)이다.
[자기상관 계산부(11)]
선형 예측 분석 장치(1)의 자기상관 계산부(11)는 입력 신호 XO(n)로부터 자기상관 RO(i)(i=0,1,…,Pmax)을 식(11)에 의해 구한다. Pmax는 N 미만의 소정의 정의 정수이다.
[수 1]
[계수 승산부(12)]
다음에 계수 승산부(12)가 자기상관 RO(i)에 미리 정한 계수 wO(i)(i=0,1,…,Pmax)를 동일한 i마다 곱함으로써, 변형 자기상관 R'O(i)(i=0,1,…,Pmax)을 구한다. 즉, 변형 자기상관 R'O(i)은 식(12)에 의해 구한다.
[수 2]
[예측 계수 계산부(13)]
그리고, 예측 계수 계산부(13)가 R'O(i)을 사용하여 예를 들면 Levinson-Durbin법 등에 의해 1차로부터 미리 정한 최대 차수인 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구한다. 선형 예측 계수로 변환 가능한 계수는 PARCOR 계수 KO(1), KO(2), …,KO(Pmax)나 선형 예측 계수 aO(1), aO(2), …,aO(Pmax) 등이다.
비특허문헌 1인 국제표준 ITU-T G.718이나 비특허문헌 2인 국제표준 ITU-T G.729에서는 계수 wO(i)로서 미리 구해 둔 60Hz의 밴드폭의 고정의 계수를 사용하고 있다.
구체적으로는 계수 wO(i)는 식(13)과 같이 지수함수를 사용하여 정의되어 있고, 식(3)에서는 f0=60Hz라는 고정값이 사용되고 있다. fs는 샘플링 주파수이다.
[수 3]
비특허문헌 3에는 상기 서술한 지수함수 이외의 함수에 기초하는 계수를 사용하는 예가 기재되어 있다. 그러나, 여기서 사용되고 있는 함수는 샘플링 주기 τ(fs에 대응하는 주기에 상당)와 소정의 상수 a에 기초하는 함수이며, 역시 고정값의 계수가 사용되고 있다.
ITU-T Recommendation G.718, ITU, 2008.
ITU-T Recommendation G.729, ITU, 1996
Yoh'ichi Tohkura, Fumitada Itakura, Shin'ichiro Hashimoto, "Spectral Smoothing Technique in PARCOR Speech Analysis-Synthesis", IEEE Trans. on Acoustics, Speech, and Signal Processing, Vol. ASSP-26, No. 6, 1978
종래의 음성 신호, 음향 신호의 부호화에서 사용되고 있는 선형 예측 분석 방법에서는 자기상관 RO(i)에 고정의 계수 wO(i)가 승산되어 얻어지는 변형 자기상관 R'O(i)을 사용하여 선형 예측 계수로 변환 가능한 계수를 구하고 있었다. 따라서, 자기상관 RO(i)로의 계수 wO(i)의 승산에 의한 변형을 필요로 하지 않는 것 같은, 즉 변형 자기상관 R'O(i)이 아니라 자기상관 RO(i) 그 자체를 사용하여 선형 예측 계수로 변환 가능한 계수를 구했다고 해도, 선형 예측 계수로 변환 가능한 계수에 대응하는 스펙트럼 포락에 있어서 스펙트럼의 피크가 지나치게 커지지 않는 것 같은 입력 신호의 경우에는, 자기상관 RO(i)로의 계수 wO(i)의 승산에 의해 변형 자기상관 R'O(i)에 의해 구해지는 선형 예측 계수로 변환 가능한 계수에 대응하는 스펙트럼 포락이 입력 신호 XO(n)의 스펙트럼 포락을 근사하는 정밀도가 떨어져버린다는, 즉 선형 예측 분석의 정밀도가 떨어져버린다는 가능성이 있었다.
본 발명은 종래보다 분석 정밀도가 높은 선형 예측 분석 방법, 장치, 프로그램 및 기록 매체를 제공하는 것을 목적으로 한다.
본 발명의 하나의 태양에 의한 선형 예측 분석 방법은 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 소정 시간 구간인 프레임마다 구하는 선형 예측 분석 방법으로서, 적어도 i=0,1,…,Pmax의 각각에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산 스텝과, 계수 wO(i)와 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산 스텝을 포함하고, 적어도 일부의 각 차수 i에 대하여, 각 차수 i에 대응하는 계수 wO(i)가 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 주기, 또는 주기의 양자화값, 또는 기본 주파수와 부의 상관관계에 있는 값의 증가와 함께 단조증가하는 관계에 있는 경우가 포함되어 있다.
본 발명의 하나의 태양에 의한 선형 예측 분석 방법은 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 소정 시간 구간인 프레임마다 구하는 선형 예측 분석 방법으로서, 적어도 i=0,1,…,Pmax의 각각에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산 스텝과, 2개 이상의 계수 테이블의 각각에는 i=0,1,…,Pmax의 각 차수 i와 각 차수 i에 대응하는 계수 wO(i)가 대응지어져 기억되어 있는 것으로 하여, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 주기, 또는 주기의 양자화값, 또는 기본 주파수와 부의 상관관계에 있는 값을 사용하여 2개 이상의 계수 테이블 중의 1개의 계수 테이블로부터 계수 wO(i)를 취득하는 계수 결정 스텝과, 취득된 계수 wO(i)와 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산 스텝을 포함하고, 2개 이상의 계수 테이블 중의 주기, 또는 주기의 양자화값, 또는 기본 주파수와 부의 상관관계에 있는 값이 제1값인 경우에 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제1 계수 테이블로 하고, 2개 이상의 계수 테이블 중의 주기, 또는 주기의 양자화값, 또는 기본 주파수와 부의 상관관계에 있는 값이 제1값보다 큰 제2값인 경우에 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제2 계수 테이블로 하여, 적어도 일부의 각 차수 i에 대하여, 제2 계수 테이블에 있어서의 각 차수 i에 대응하는 계수는 제1 계수 테이블에 있어서의 각 차수 i에 대응하는 계수보다 크다.
본 발명의 하나의 태양에 의한 선형 예측 분석 방법은 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 소정 시간 구간인 프레임마다 구하는 선형 예측 분석 방법으로서, 적어도 i=0,1,…,Pmax의 각각에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산 스텝과, 계수 테이블 t0에는 계수 wt0(i)가 격납되어 있고, 계수 테이블 t1에는 계수 wt1(i), 계수 테이블 t2에는 계수 wt2(i)가 격납되어 있는 것으로 하여, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 주기, 또는 주기의 양자화값, 또는 기본 주파수와 부의 상관관계에 있는 값을 사용하여 계수 테이블 t0,t1,t2 중의 1개의 계수 테이블로부터 계수를 취득하는 계수 결정 스텝과, 취득한 계수와 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산 스텝을 포함하고, 주기, 또는 주기의 양자화값, 또는 기본 주파수와 부의 상관관계에 있는 값에 따라, 주기가 짧은 경우, 주기가 중간 정도인 경우, 주기가 긴 경우의 어느 하나의 경우로 분류되는 것으로 하고, 주기가 짧은 경우에 계수 결정 스텝에서 계수가 취득되는 계수 테이블을 계수 테이블 t0로 하고, 주기가 중간 정도인 경우에 계수 결정 스텝에서 계수가 취득되는 계수 테이블을 계수 테이블 t1으로 하고, 주기가 긴 경우에 계수 결정 스텝에서 계수가 취득되는 계수 테이블을 계수 테이블 t2로 하여, 적어도 일부의 i에 대해서 wt0(i)<wt1(i)≤wt2(i)이며, 그 이외의 i 중 적어도 일부의 각 i에 대해서 wt0(i)≤wt1(i)<wt2(i)이며, 나머지 각 i에 대해서 wt0(i)≤wt1(i)≤wt2(i)이다.
본 발명의 하나의 태양에 의한 선형 예측 분석 방법은 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 소정 시간 구간인 프레임마다 구하는 선형 예측 분석 방법으로서, 적어도 i=0,1,…,Pmax의 각각에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산 스텝과, 계수 wO(i)와 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산 스텝을 포함하고, 적어도 일부의 각 차수 i에 대하여, 각 차수 i에 대응하는 계수 wO(i)가 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 기본 주파수와 정의 상관관계에 있는 값의 증가와 함께 단조감소하는 관계에 있는 경우가 포함되어 있다.
본 발명의 하나의 태양에 의한 선형 예측 분석 방법은 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 소정 시간 구간인 프레임마다 구하는 선형 예측 분석 방법으로서, 적어도 i=0,1,…,Pmax의 각각에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산 스텝과, 2개 이상의 계수 테이블의 각각에는 i=0,1,…,Pmax의 각 차수 i와 각 차수 i에 대응하는 계수 wO(i)가 대응지어져 기억되어 있는 것으로 하여, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 기본 주파수와 정의 상관관계에 있는 값을 사용하여 2개 이상의 계수 테이블 중의 1개의 계수 테이블로부터 계수 wO(i)를 취득하는 계수 결정 스텝과, 취득된 계수 wO(i)와 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산 스텝을 포함하고, 2개 이상의 계수 테이블 중의 기본 주파수와 정의 상관관계에 있는 값이 제1값인 경우에 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제1 계수 테이블로 하고, 2개 이상의 계수 테이블 중의 기본 주파수와 정의 상관관계에 있는 값이 제1값보다 작은 제2값인 경우에 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제2 계수 테이블로 하여, 적어도 일부의 각 차수 i에 대하여, 제2 계수 테이블에 있어서의 각 차수 i에 대응하는 계수는 제1 계수 테이블에 있어서의 각 차수 i에 대응하는 계수보다 크다.
본 발명의 하나의 태양에 의한 선형 예측 분석 방법은 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 소정 시간 구간인 프레임마다 구하는 선형 예측 분석 방법으로서, 적어도 i=0,1,…,Pmax의 각각에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산 스텝과, 계수 테이블 t0에는 계수 wt0(i)가 격납되어 있고, 계수 테이블 t1에는 계수 wt1(i), 계수 테이블 t2에는 계수 wt2(i)가 격납되어 있다고 하여, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 기본 주파수와 정의 상관관계에 있는 값을 사용하여 계수 테이블 t0,t1,t2 중의 1개의 계수 테이블로부터 계수를 취득하는 계수 결정 스텝과, 취득한 계수와 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산 스텝을 포함하고, 기본 주파수와 정의 상관관계에 있는 값에 따라, 기본 주파수가 높은 경우, 기본 주파수가 중간 정도인 경우, 기본 주파수가 낮은 경우의 어느 하나의 경우로 분류되는 것으로 하고, 기본 주파수가 높은 경우에 계수 결정 스텝에서 계수가 취득되는 계수 테이블을 계수 테이블 t0로 하고, 기본 주파수가 중간 정도인 경우에 계수 결정 스텝에서 계수가 취득되는 계수 테이블을 계수 테이블 t1으로 하고, 기본 주파수가 낮은 경우에 계수 결정 스텝에서 계수가 취득되는 계수 테이블을 계수 테이블 t2로 하여, 적어도 일부의 i에 대해서 wt0(i)<wt1(i)≤wt2(i)이며, 그 이외의 i 중 적어도 일부의 각 i에 대해서 wt0(i)≤wt1(i)<wt2(i)이며, 나머지 각 i에 대해서 wt0(i)≤wt1(i)≤wt2(i)이다.
변형 자기상관을 구하기 위해서 자기상관에 곱하는 계수로서 기본 주파수와 정의 상관관계에 있는 값 또는 기본 주파수와 부의 상관관계에 있는 값에 따라 특정되는 계수를 사용함으로써, 종래보다 분석 정밀도가 높은 선형 예측을 실현할 수 있다.
도 1은 제1 실시형태 및 제2 실시형태의 선형 예측 장치의 예를 설명하기 위한 블록도.
도 2는 선형 예측 분석 방법의 예를 설명하기 위한 플로우차트.
도 3은 제2 실시형태의 선형 예측 분석 방법의 예를 설명하기 위한 플로우차트.
도 4는 제2 실시형태의 선형 예측 분석 방법의 예를 설명하기 위한 플로우차트.
도 5는 제3 실시형태의 선형 예측 분석 장치의 예를 설명하기 위한 블록도.
도 6은 제3 실시형태의 선형 예측 분석 방법의 예를 설명하기 위한 플로우차트.
도 7은 제3 실시형태의 구체예를 설명하기 위한 도면.
도 8은 제3 실시형태의 구체예를 설명하기 위한 도면.
도 9는 실험 결과의 예를 나타내는 도면.
도 10은 변형예를 설명하기 위한 블록도.
도 11은 변형예를 설명하기 위한 블록도.
도 12는 변형예를 설명하기 위한 플로우차트.
도 13은 제4 실시형태의 선형 예측 분석 장치의 예를 설명하기 위한 블록도.
도 14는 제4 실시형태의 변형예의 선형 예측 분석 장치의 예를 설명하기 위한 블록도.
도 15는 종래의 선형 예측 장치의 예를 설명하기 위한 블록도.
도 2는 선형 예측 분석 방법의 예를 설명하기 위한 플로우차트.
도 3은 제2 실시형태의 선형 예측 분석 방법의 예를 설명하기 위한 플로우차트.
도 4는 제2 실시형태의 선형 예측 분석 방법의 예를 설명하기 위한 플로우차트.
도 5는 제3 실시형태의 선형 예측 분석 장치의 예를 설명하기 위한 블록도.
도 6은 제3 실시형태의 선형 예측 분석 방법의 예를 설명하기 위한 플로우차트.
도 7은 제3 실시형태의 구체예를 설명하기 위한 도면.
도 8은 제3 실시형태의 구체예를 설명하기 위한 도면.
도 9는 실험 결과의 예를 나타내는 도면.
도 10은 변형예를 설명하기 위한 블록도.
도 11은 변형예를 설명하기 위한 블록도.
도 12는 변형예를 설명하기 위한 플로우차트.
도 13은 제4 실시형태의 선형 예측 분석 장치의 예를 설명하기 위한 블록도.
도 14는 제4 실시형태의 변형예의 선형 예측 분석 장치의 예를 설명하기 위한 블록도.
도 15는 종래의 선형 예측 장치의 예를 설명하기 위한 블록도.
이하, 도면을 참조하여, 선형 예측 분석 장치 및 방법의 각 실시형태를 설명한다.
[제1 실시형태]
제1 실시형태의 선형 예측 분석 장치(2)는 도 1에 나타내는 바와 같이 자기상관 계산부(21), 계수 결정부(24), 계수 승산부(22) 및 예측 계수 계산부(23)를 예를 들면 구비하고 있다. 자기상관 계산부(21), 계수 승산부(22) 및 예측 계수 계산부(23)의 동작은 종래의 선형 예측 분석 장치(1)의 자기상관 계산부(11), 계수 승산부(12) 및 예측 계수 계산부(13)에 있어서의 동작과 각각 동일하다.
선형 예측 분석 장치(2)에는 소정 시간 구간인 프레임마다의 시간 영역의 디지털 음성 신호나 디지털 음향 신호나 심전도, 뇌파, 뇌자도, 지진파 등의 디지털 신호인 입력 신호 XO(n)가 입력된다. 입력 신호는 입력 시계열 신호이다. 현 프레임 입력 신호를 XO(n)(n=0,1,…,N-1)로 한다. n은 입력 신호에 있어서의 각 샘플의 샘플 번호를 나타내고, N은 소정의 정의 정수이다. 여기서, 현 프레임의 1개 앞의 프레임의 입력 신호는 XO(n)(n=-N, -N+1,…,-1)이며, 현 프레임의 1개 뒤의 프레임의 입력 신호는 XO(n)(n=N, N+1,…,2N-1)이다. 이하에서는, 입력 신호 XO(n)가 디지털 음성 신호나 디지털 음향 신호인 경우에 대해서 설명한다. 입력 신호 XO(n)(n=0,1,…,N-1)는 수음된 신호 그 자체여도 되고, 분석을 위해서 샘플링 레이트가 변환된 신호여도 되며, 프리엠퍼시스 처리된 신호여도 되고, 윈도우 신호여도 된다.
또, 선형 예측 분석 장치(2)에는 프레임마다의 디지털 음성 신호나 디지털 음향 신호의 기본 주파수에 대한 정보도 입력된다. 기본 주파수에 대한 정보는 선형 예측 분석 장치(2) 밖에 있는 주기성 분석부(900)로 구해진다. 주기성 분석부(900)는 예를 들면 기본 주파수 계산부(930)를 구비한다.
[기본 주파수 계산부(930)]
기본 주파수 계산부(930)는 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1) 및/또는 현 프레임의 근방의 프레임의 입력 신호의 전부 또는 일부로부터 기본 주파수 P를 구한다. 기본 주파수 계산부(930)는 예를 들면 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1)의 전부 또는 일부를 포함하는 신호 구간의 디지털 음성 신호나 디지털 음향 신호의 기본 주파수 P를 구하고, 기본 주파수 P를 특정 가능한 정보를 기본 주파수에 대한 정보로서 출력한다. 기본 주파수를 구하는 방법으로서는 다양한 공지의 방법이 존재하므로, 공지의 어느 방법을 사용해도 된다. 또, 구한 기본 주파수 P를 부호화하여 기본 주파수 부호를 얻는 구성으로 하고, 기본 주파수 부호를 기본 주파수에 대한 정보로서 출력해도 된다. 또한 기본 주파수 부호에 대응하는 기본 주파수의 양자화값 ^P를 얻는 구성으로 하고, 기본 주파수의 양자화값 ^P를 기본 주파수에 대한 정보로서 출력해도 된다. 이하, 기본 주파수 계산부(930)의 구체예에 대해서 설명한다.
<기본 주파수 계산부(930)의 구체예 1>
기본 주파수 계산부(930)의 구체예 1은 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1)가 복수개의 서브프레임으로 구성되어 있는 경우, 또한 동일한 프레임에 대해서는 선형 예측 분석 장치(2)보다 먼저 기본 주파수 계산부(930)가 동작되는 경우의 예이다. 기본 주파수 계산부(930)는 우선 2 이상의 정수인 M개의 서브프레임인 XOs1(n)(n=0,1,…,N/M-1),…,XOsM(n)(n=(M-1)N/M, (M-1)N/M+1,…,N-1)의 각각의 기본 주파수인 Ps1,…,PsM을 구한다. N은 M으로 나누어 떨어지는 것으로 한다. 기본 주파수 계산부(930)는 현 프레임을 구성하는 M개의 서브프레임의 기본 주파수인 Ps1,…,PsM 중 최대값 max(Ps1,…,PsM)을 특정 가능한 정보를 기본 주파수에 대한 정보로서 출력한다.
<기본 주파수 계산부(930)의 구체예 2>
기본 주파수 계산부(930)의 구체예 2는 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1)와 1개 뒤의 프레임의 일부의 입력 신호 XO(n)(n=N, N+1,…,N+Nn-1)(단 Nn은 Nn<N이라는 관계를 만족하는 소정의 정의 정수.)로, 미리보기 부분을 포함하는 신호 구간이 현 프레임의 신호 구간으로서 구성되어 있는 경우이며, 또한 동일한 프레임에 대해서는 선형 예측 분석 장치(2)보다 뒤에 기본 주파수 계산부(930)가 동작되는 경우의 예이다. 기본 주파수 계산부(930)는 현 프레임의 신호 구간에 대해서, 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1)와 1개 뒤의 프레임의 일부의 입력 신호 XO(n)(n=N, N+1,…,N+Nn-1)의 각각의 기본 주파수인 Pnow, Pnext를 구하고, 기본 주파수 Pnext를 기본 주파수 계산부(930)에 기억한다. 기본 주파수 계산부(930)는 또 1개 앞의 프레임의 신호 구간에 대해서 구하여 기본 주파수 계산부(930)에 기억되어 있던 기본 주파수 Pnext, 즉 1개 앞의 프레임의 신호 구간 중 현 프레임의 일부의 입력 신호 XO(n)(n=0,1,…,Nn-1)에 대해서 구한 기본 주파수를 특정 가능한 정보를 기본 주파수에 대한 정보로서 출력한다. 또한, 구체예 1과 마찬가지로, 현 프레임에 대해서는 복수의 서브프레임마다의 기본 주파수를 구해도 된다.
<기본 주파수 계산부(930)의 구체예 3>
기본 주파수 계산부(930)의 구체예 3은 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1) 그 자체가 현 프레임의 신호 구간으로서 구성되어 있는 경우이며, 또한 동일한 프레임에 대해서는 선형 예측 분석 장치(2)보다 뒤에 기본 주파수 계산부(930)가 동작되는 경우의 예이다. 기본 주파수 계산부(930)는 현 프레임의 신호 구간인 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1)의 기본 주파수 P를 구하고, 기본 주파수 P를 기본 주파수 계산부(930)에 기억한다. 기본 주파수 계산부(930)는 또 1개 앞의 프레임의 신호 구간, 즉 1개 앞의 프레임의 입력 신호 XO(n)(n=-N, -N+1,…,-1)에 대해서 구하여 기본 주파수 계산부(930)에 기억되어 있던 기본 주파수 P를 특정 가능한 정보를 기본 주파수에 대한 정보로서 출력한다.
이하, 선형 예측 분석 장치(2)의 동작에 대해서 설명한다. 도 2는 선형 예측 분석 장치(2)에 의한 선형 예측 분석 방법의 플로우차트이다.
[자기상관 계산부(21)]
자기상관 계산부(21)는 입력된 N샘플의 프레임마다의 시간 영역의 디지털 음성 신호나 디지털 음향 신호인 입력 신호 XO(n)(n=0,1,…,N-1)로부터 자기상관 RO(i)(i=0,1,…,Pmax)을 계산한다(스텝 S1). Pmax는 예측 계수 계산부(23)가 구하는 선형 예측 계수로 변환 가능한 계수의 최대 차수이며, N 이하의 소정의 정의 정수이다. 계산된 자기상관 RO(i)(i=0,1,…,Pmax)은 계수 승산부(22)에 제공된다.
자기상관 계산부(21)는 입력 신호 XO(n)를 사용하여 예를 들면 식(14A)에 의해 자기상관 RO(i)(i=0,1,…,Pmax)을 계산한다. 즉, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i)와의 자기상관 RO(i)을 계산한다.
[수 4]
또는, 자기상관 계산부(21)는 입력 신호 XO(n)를 사용하여 예를 들면 식(14B)에 의해 자기상관 RO(i)(i=0,1,…,Pmax)을 계산한다. 즉, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)와의 자기상관 RO(i)을 계산한다.
[수 5]
또는, 자기상관 계산부(21)는 입력 신호 XO(n)에 대응하는 파워 스펙트럼을 구하고나서 Wiener-Khinchin의 정리에 따라 자기상관 RO(i)(i=0,1,…,Pmax)을 계산해도 된다. 또, 어느 방법에 있어서도, 입력 신호 XO(n)(n=-Np, -Np+1,…,-1,0,1,…,N-1, N,…,N-1+Nn)와 같이 전후의 프레임의 입력 신호의 일부도 사용하여 자기상관 RO(i)을 계산해도 된다. 여기서, Np, Nn은 각각 Np<N, Nn<N이라는 관계를 만족하는 소정의 정의 정수이다. 혹은 MDCT 계열을 파워 스펙트럼의 근사로서 대용하고, 근사된 파워 스펙트럼으로부터 자기상관을 구해도 된다. 이와 같이 자기상관의 산출 방법은 세상에서 사용되고 있는 공지 기술의 어느 하나를 사용할 수 있다.
[계수 결정부(24)]
계수 결정부(24)는 입력된 기본 주파수에 대한 정보를 사용하여, 계수 wO(i)(i=0,1,…,Pmax)를 결정한다(스텝 S4). 계수 wO(i)는 자기상관 RO(i)을 변형하여 변형 자기상관 R'O(i)을 얻기 위한 계수이다. 계수 wO(i)는 신호 처리의 분야에 있어서는 래그 윈도우 wO(i) 또는 래그 윈도우 계수 wO(i)라고도 불리고 있는 것이다. 계수 wO(i)는 정의 값이므로, 계수 wO(i)가 소정의 값보다 큰/작은 것을 계수 wO(i)의 크기가 소정의 값보다 크다/작다라고 표현하는 경우가 있다. 또, 래그 윈도우 wO(i)의 크기는 그 래그 윈도우 wO(i)의 값을 의미하는 것으로 한다.
계수 결정부(24)에 입력되는 기본 주파수에 대한 정보는 현 프레임의 입력 신호 및/또는 현 프레임의 근방의 프레임의 입력 신호의 전부 또는 일부로부터 구해진 기본 주파수를 특정하는 정보이다. 즉, 계수 wO(i)의 결정에 사용하는 기본 주파수는 현 프레임의 입력 신호 및/또는 현 프레임의 근방의 프레임의 입력 신호의 전부 또는 일부로부터 구해진 기본 주파수이다.
계수 결정부(24)는 0차로부터 Pmax차의 모두 또는 일부의 차수에 대해서, 기본 주파수에 대한 정보에 대응하는 기본 주파수가 취할 수 있는 범위 중 모두 또는 일부에서, 기본 주파수에 대한 정보에 대응하는 기본 주파수가 클수록 작은 값을 계수 wO(0), wO(1),…,wO(Pmax)로서 결정한다. 또, 계수 결정부(24)는 기본 주파수 대신에 기본 주파수와 정의 상관관계에 있는 값을 사용하여, 기본 주파수가 클수록 작은 값을 계수 wO(0), wO(1),…,wO(Pmax)로서 결정해도 된다.
즉, 계수 wO(i)(i=0,1,…,Pmax)는 적어도 일부의 예측 차수 i에 대하여 그 차수 i에 대응하는 계수 wO(i)의 크기가 현 프레임의 입력 신호 XO(n)의 전부 또는 일부를 포함하는 신호 구간의 기본 주파수와 정의 상관관계에 있는 값의 증가와 함께 단조감소하는 관계에 있는 경우가 포함되어 있도록 결정된다. 바꾸어 말하면, 후술하는 바와 같이 차수 i에 따라서는 계수 wO(i)의 크기가 기본 주파수와 정의 상관관계에 있는 값의 증가와 함께 단조감소하지 않아도 된다.
또한, 기본 주파수와 정의 상관관계에 있는 값이 취할 수 있는 범위에는 계수 wO(i)의 크기가 기본 주파수와 정의 상관관계에 있는 값의 증가에 상관없이 일정한 범위가 있어도 되지만, 그 밖의 범위에서는 계수 wO(i)의 크기가 기본 주파수와 정의 상관관계에 있는 값의 증가와 함께 단조감소하는 것으로 한다.
계수 결정부(24)는 예를 들면 입력된 기본 주파수에 대한 정보에 대응하는 기본 주파수에 대한 단조 비증가 함수를 사용하여 계수 wO(i)를 결정한다. 예를 들면, 이하의 식(1)에 의해 계수 wO(i)를 결정한다. 이하의 식에 있어서, P는 입력된 기본 주파수에 대한 정보에 대응하는 기본 주파수이다.
[수 6]
또는, 0보다 큰 미리 정한 값인 α를 사용한 이하의 식(2)에 의해 계수 wO(i)를 결정한다. α는 계수 wO(i)를 래그 윈도우로서 파악했을 때의 래그 윈도우의 폭, 바꾸어 말하면 래그 윈도우의 강도를 조정하기 위한 값이다. 미리 정하는 α는 예를 들면 복수의 α의 후보값에 대해서 선형 예측 분석 장치(2)를 포함하는 부호화 장치와 그 부호화 장치에 대응하는 복호 장치로 음성 신호나 음향 신호를 부호화 복호하여, 복호 음성 신호나 복호 음향 신호의 주관 품질이나 객관 품질이 양호한 후보값을 α로서 선택함으로써 정하면 된다.
[수 7]
또는, 기본 주파수 P에 대한 미리 정한 함수 f(P)를 사용한 이하의 식(2A)에 의해 계수 wO(i)를 결정해도 된다. 함수 f(P)는 f(P)=αP+β(α는 정의 수, β는 임의의 수), f(P)=αP2+βP+γ(α는 정의 수, β, γ는 임의의 수) 등의 기본 주파수 P와 정의 상관관계, 기본 주파수 P에 대하여 단조 비감소의 관계가 되는 함수이다.
[수 8]
또, 기본 주파수 P를 사용하여 계수 wO(i)를 결정하는 식은 상기 서술한 식(1), (2), (2A)에 한정되지 않고 기본 주파수와 정의 상관관계에 있는 값의 증가에 대하여 단조 비증가의 관계를 기술할 수 있는 것이면 다른 식이어도 된다. 예를 들면, 계수 wO(i)를 이하의 (3) 내지 (6)의 어느 하나의 식에 의해 결정해도 된다. 이하의 (3) 내지 (6)의 식에 있어서, a를 기본 주파수에 의존하여 정해지는 실수로 하고, m을 기본 주파수에 의존하여 정해지는 자연수로 한다. 예를 들면, a를 기본 주파수와 부의 상관관계에 있는 값으로 하고, m을 기본 주파수와 부의 상관관계에 있는 값으로 한다. τ는 샘플링 주기이다.
[수 9]
식(3)은 'Bartlett window'라고 불리는 형식의 윈도우 함수이며, 식(4)은 Binomial window라고 불리는 형식의 윈도우 함수이며, 식(5)은 'Triangular in frequency domain window'라고 불리는 형식의 윈도우 함수이며, 식(6)은 'Rectangular in frequency domain window'라고 불리는 형식의 윈도우 함수이다.
또한, 0≤i≤Pmax의 각 i가 아니고, 적어도 일부의 차수 i에 대해서만, 계수 wO(i)가 기본 주파수와 정의 상관관계에 있는 값의 증가와 함께 단조감소해도 된다. 바꾸어 말하면, 차수 i에 따라서는 계수 wO(i)의 크기가 기본 주파수와 정의 상관관계에 있는 값의 증가와 함께 단조감소하지 않아도 된다.
예를 들면, i=0인 경우는, 상기 서술한 식(1) 내지 식(6) 중 어느 하나를 사용하여 계수 wO(0)의 값을 결정해도 되고, ITU-T G.718 등에서도 사용되고 있는 것 같은 wO(0)=1.0001,wO(0)=1.003과 같은 기본 주파수와 정의 상관관계에 있는 값에는 의존하지 않는 경험적으로 얻어진 고정값을 사용해도 된다. 즉, 1≤i≤Pmax의 각 i에 대해서는, 계수 wO(i)는 기본 주파수와 정의 상관관계에 있는 값이 클수록 작은 값을 취하는데, i=0의 계수에 대해서는 이것에 한정되지 않고 고정값을 사용해도 된다.
[계수 승산부(22)]
계수 승산부(22)는 계수 결정부(24)에서 결정한 계수 wO(i)(i=0,1,…,Pmax)와, 자기상관 계산부(21)에서 구한 자기상관 RO(i)(i=0,1,…,Pmax)을 동일한 i마다 곱함으로써, 변형 자기상관 R'O(i)(i=0,1,…,Pmax)을 구한다(스텝 S2). 즉, 계수 승산부(22)는 이하의 식(15)에 의해 자기상관 R'O(i)을 계산한다. 계산된 자기상관 R'O(i)은 예측 계수 계산부(23)에 제공된다.
[수 10]
[예측 계수 계산부(23)]
예측 계수 계산부(23)는 변형 자기상관 R'O(i)을 사용하여 선형 예측 계수로 변환 가능한 계수를 구한다(스텝 S3).
예를 들면, 예측 계수 계산부(23)는 변형 자기상관 R'O(i)을 사용하여 Levinson-Durbin법 등에 의해 1차로부터 미리 정한 최대 차수인 Pmax차까지의 PARCOR 계수 KO(1), KO(2), …,KO(Pmax)나 선형 예측 계수 aO(1), aO(2), …,aO(Pmax)를 계산한다.
제1 실시형태의 선형 예측 분석 장치(2)에 의하면, 기본 주파수와 정의 상관관계에 있는 값에 따라, 적어도 일부의 예측 차수 i에 대하여, 그 차수 i에 대응하는 계수 wO(i)의 크기가 현 프레임의 입력 신호 XO(n)의 전부 또는 일부를 포함하는 신호 구간의 기본 주파수와 정의 상관관계에 있는 값의 증가와 함께 단조감소하는 관계에 있는 경우가 포함되어 있는 계수 wO(i)를 자기상관에 승산하여 변형 자기상관을 구하여 선형 예측 계수로 변환 가능한 계수를 구함으로써, 입력 신호의 기본 주파수가 높을 때여도 피치 성분에 기인하는 스펙트럼의 피크의 발생을 억제한 선형 예측 계수로 변환 가능한 계수를 구할 수 있고, 또한 입력 신호의 기본 주파수가 낮을 때여도 스펙트럼 포락을 표현 가능한 선형 예측 계수로 변환 가능한 계수를 구할 수 있어, 종래보다 분석 정밀도가 높은 선형 예측을 실현할 수 있다. 따라서, 제1 실시형태의 선형 예측 분석 장치(2)를 포함하는 부호화 장치와 그 부호화 장치에 대응하는 복호 장치로 음성 신호나 음향 신호를 부호화 복호하여 얻어지는 복호 음성 신호나 복호 음향 신호의 품질은 종래의 선형 예측 분석 장치를 포함하는 부호화 장치와 그 부호화 장치에 대응하는 복호 장치로 음성 신호나 음향 신호를 부호화 복호하여 얻어지는 복호 음성 신호나 복호 음향 신호의 품질보다 좋다.
<제1 실시형태의 변형예>
제1 실시형태의 변형예는 계수 결정부(24)가 기본 주파수와 정의 상관관계에 있는 값이 아니고, 기본 주파수와 부의 상관관계에 있는 값에 기초하여 계수 wO(i)를 결정하는 것이다. 기본 주파수와 부의 상관관계에 있는 값은 예를 들면 주기, 주기의 추정값 또는 주기의 양자화값이다. 예를 들면, 주기 T, 기본 주파수 P, 샘플링 주파수 fs로 하면, T=fs/P가 되기 때문에, 주기는 기본 주파수와 부의 상관관계에 있는 것이다. 기본 주파수와 부의 상관관계에 있는 값에 기초하여 계수 wO(i)를 결정하는 예를 제1 실시형태의 변형예로서 설명한다.
제1 실시형태의 변형예의 선형 예측 분석 장치(2)의 기능 구성과 선형 예측 분석 장치(2)에 의한 선형 예측 분석 방법의 플로우차트는 제1 실시형태와 동일한 도 1과 도 2이다. 제1 실시형태의 변형예의 선형 예측 분석 장치(2)는 계수 결정부(24)의 처리가 상이한 부분 이외에는 제1 실시형태의 선형 예측 분석 장치(2)와 동일하다. 선형 예측 분석 장치(2)에는 프레임마다의 디지털 음성 신호나 디지털 음향 신호의 주기에 대한 정보도 입력된다. 주기에 대한 정보는 선형 예측 분석 장치(2) 밖에 있는 주기성 분석부(900)에서 구해진다. 주기성 분석부(900)는 예를 들면 주기 계산부(940)를 구비한다.
[주기 계산부(940)]
주기 계산부(940)는 현 프레임의 입력 신호 XO 및/또는 현 프레임의 근방의 프레임의 입력 신호의 전부 또는 일부로부터 주기 T를 구한다. 주기 계산부(940)는 예를 들면 현 프레임의 입력 신호 XO(n)의 전부 또는 일부를 포함하는 신호 구간의 디지털 음성 신호나 디지털 음향 신호의 주기 T를 구하고, 주기 T를 특정 가능한 정보를 주기에 대한 정보로서 출력한다. 주기를 구하는 방법으로서는 다양한 공지의 방법이 존재하므로, 공지의 어느 방법을 사용해도 된다. 또, 구한 주기 T를 부호화하여 주기 부호를 얻는 구성으로 하고, 주기 부호를 주기에 대한 정보로서 출력해도 된다. 또한 주기 부호에 대응하는 주기의 양자화값 ^T를 얻는 구성으로 하고, 주기의 양자화값 ^T를 주기에 대한 정보로서 출력해도 된다. 이하, 주기 계산부(940)의 구체예에 대해서 설명한다.
<주기 계산부(940)의 구체예 1>
주기 계산부(940)의 구체예 1은 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1)가 복수개의 서브프레임으로 구성되어 있는 경우, 또한 동일한 프레임에 대해서는 선형 예측 분석 장치(2)보다 먼저 주기 계산부(940)가 동작되는 경우의 예이다. 주기 계산부(940)는 우선 2 이상의 정수인 M개의 서브프레임인 XOs1(n)(n=0,1,…,N/M-1),…,XOsM(n)(n=(M-1)N/M, (M-1)N/M+1,…,N-1)의 각각의 주기인 Ts1,…,TsM을 구한다. N은 M으로 나누어 떨어지는 것으로 한다. 주기 계산부(940)는 현 프레임을 구성하는 M개의 서브프레임의 주기인 Ts1,…,TsM 중 최소값 min(Ts1,…,TsM)을 특정 가능한 정보를 주기에 대한 정보로서 출력한다.
<주기 계산부(940)의 구체예 2>
주기 계산부(940)의 구체예 2는 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1)와 1개 뒤의 프레임의 일부의 입력 신호 XO(n)(n=N, N+1,…,N+Nn-1)(단, Nn은 Nn<N이라는 관계를 만족하는 소정의 정의 정수.)로, 미리보기 부분을 포함하는 신호 구간이 현 프레임의 신호 구간으로서 구성되어 있는 경우이며, 또한 동일한 프레임에 대해서는 선형 예측 분석 장치(2)보다 뒤에 주기 계산부(940)가 동작되는 경우의 예이다. 주기 계산부(940)는 현 프레임의 신호 구간에 대해서, 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1)와 1개 뒤의 프레임의 일부의 입력 신호 XO(n)(n=N, N+1,…,N+Nn-1)의 각각의 주기인 Tnow, Tnext를 구하고, 주기 Tnext를 주기 계산부(940)에 기억한다. 주기 계산부(940)는 또 1개 앞의 프레임의 신호 구간에 대해서 구하여 주기 계산부(940)에 기억되어 있던 주기 Tnext, 즉, 1개 앞의 프레임의 신호 구간 중 현 프레임의 일부의 입력 신호 XO(n)(n=0,1,…,Nn-1)에 대해서 구한 주기를 특정 가능한 정보를 주기에 대한 정보로서 출력한다. 또한, 구체예 1과 마찬가지로, 현 프레임에 대해서는 복수의 서브프레임마다의 주기를 구해도 된다.
<주기 계산부(940)의 구체예 3>
주기 계산부(940)의 구체예 3은 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1) 그 자체가 현 프레임의 신호 구간으로서 구성되어 있는 경우이며, 또한 동일한 프레임에 대해서는 선형 예측 분석 장치(2)보다 뒤에 주기 계산부(940)가 동작되는 경우의 예이다. 주기 계산부(940)는 현 프레임의 신호 구간인 현 프레임의 입력 신호 XO(n)(n=0,1,…,N-1)의 주기 T를 구하고, 주기 T를 주기 계산부(940)에 기억한다. 주기 계산부(940)는 또 1개 앞의 프레임의 신호 구간, 즉 1개 앞의 프레임의 입력 신호 XO(n)(n=-N, -N+1,…,-1)에 대해서 구하여 주기 계산부(940)에 기억되어 있던 주기 T를 특정 가능한 정보를 주기에 대한 정보로서 출력한다.
이하, 제1 실시형태의 변형예의 선형 예측 분석 장치(2)의 동작 중, 제1 실시형태의 선형 예측 분석 장치(2)와 상이한 부분인 계수 결정부(24)의 처리에 대해서 설명한다.
[변형예의 계수 결정부(24)]
제1 실시형태의 변형예의 선형 예측 분석 장치(2)의 계수 결정부(24)는 입력된 주기에 대한 정보를 사용하여, 계수 wO(i)(i=0,1,…,Pmax)를 결정한다(스텝 S4).
계수 결정부(24)에 입력되는 주기에 대한 정보는 현 프레임의 입력 신호 및/또는 현 프레임의 근방의 프레임의 입력 신호의 전부 또는 일부로부터 구해진 주기를 특정하는 정보이다. 즉, 계수 wO(i)의 결정에 사용하는 주기는 현 프레임의 입력 신호 및/또는 현 프레임의 근방의 프레임의 입력 신호의 전부 또는 일부로부터 구해진 주기이다.
계수 결정부(24)는 0차로부터 Pmax차의 모두 또는 일부의 차수에 대해서, 주기에 대한 정보에 대응하는 주기가 취할 수 있는 범위 중 모두 또는 일부에서, 주기에 대한 정보에 대응하는 주기가 클수록 큰 값을 계수 wO(0), wO(1),…,wO(Pmax)로서 결정한다. 또, 계수 결정부(24)는 주기 대신에 주기와 정의 상관관계에 있는 값을 사용하여, 주기가 클수록 큰 값을 계수 wO(0), wO(1),…,wO(Pmax)로서 결정해도 된다.
즉, 계수 wO(i)(i=0,1,…,Pmax)는 적어도 일부의 예측 차수 i에 대하여, 그 차수 i에 대응하는 계수 wO(i)의 크기가 현 프레임의 입력 신호 XO(n)의 전부 또는 일부를 포함하는 신호 구간의 기본 주파수와 부의 상관관계에 있는 값의 증가와 함께 단조증가하는 관계에 있는 경우가 포함되어 있도록 결정된다. 바꾸어 말하면, 차수 i에 따라서는 계수 wO(i)의 크기가 기본 주파수와 부의 상관관계에 있는 값의 증가와 함께 단조증가하지 않아도 된다.
또한, 기본 주파수와 부의 상관관계에 있는 값이 취할 수 있는 범위에는 계수 wO(i)의 크기가 기본 주파수와 부의 상관관계에 있는 값의 증가에 상관없이 일정한 범위가 있어도 되는데, 그 밖의 범위에서는 계수 wO(i)의 크기가 기본 주파수와 부의 상관관계에 있는 값의 증가와 함께 단조증가하는 것으로 한다.
계수 결정부(24)는 예를 들면 입력된 주기에 대한 정보에 대응하는 주기에 대한 단조 비감소 함수를 사용하여 계수 wO(i)를 결정한다. 예를 들면, 이하의 식(7)에 의해 계수 wO(i)를 결정한다. T는 입력된 주기에 대한 정보에 대응하는 주기이다.
[수 11]
또는, 0보다 큰 미리 정한 값인 α를 사용한 이하의 식(8)에 의해 계수 wO(i)를 결정한다. α는 계수 wO(i)를 래그 윈도우로서 파악했을 때의 래그 윈도우의 폭, 바꾸어 말하면 래그 윈도우의 강도를 조정하기 위한 값이다. 미리 정하는 α는 예를 들면 복수의 α의 후보값에 대해서 선형 예측 분석 장치(2)를 포함하는 부호화 장치와 그 부호화 장치에 대응하는 복호 장치로 음성 신호나 음향 신호를 부호화 복호하여, 복호 음성 신호나 복호 음향 신호의 주관 품질이나 객관 품질이 양호한 후보값을 α로서 선택함으로써 정하면 된다.
[수 12]
또는, 주기 T에 대한 미리 정한 함수 f(T)를 사용한 이하의 식(8A)에 의해 계수 wO(i)를 결정한다. 함수 f(T)는 f(T)=αT+β(α는 정의 수, β는 임의의 수), f(T)=αT2+βT+γ(α는 정의 수, β, γ는 임의의 수) 등의 주기 T와 정의 상관관계, 주기 T에 대하여 단조 비감소의 관계가 되는 함수이다.
[수 13]
또한, 주기 T를 사용하여 계수 wO(i)를 결정하는 식은 상기 서술한 식(7), (8), (8A)에 한정되지 않고, 기본 주파수와 부의 상관관계에 있는 값의 증가에 대하여 단조 비감소의 관계를 기술할 수 있는 것이면 다른 식이여도 된다.
또한, 0≤i≤Pmax의 각 i가 아니고, 적어도 일부의 차수 i에 대해서만 계수 wO(i)가 기본 주파수와 부의 상관관계에 있는 값의 증가와 함께 단조증가해도 된다. 바꾸어 말하면, 차수 i에 따라서는, 계수 wO(i)의 크기가 기본 주파수와 부의 상관관계에 있는 값의 증가와 함께 단조증가하지 않아도 된다.
예를 들면, i=0의 경우는, 상기 서술한 식(7), (8), (8A)을 사용하여 계수 wO(0)의 값을 결정해도 되고, ITU-T G.718 등에서도 사용되고 있는 것 같은 wO(0)=1.0001,wO(0)=1.003과 같은 기본 주파수와 부의 상관관계에 있는 값에는 의존하지 않는 경험적으로 얻어진 고정값을 사용해도 된다. 즉, 1≤i≤Pmax의 각 i에 대해서는, 계수 wO(i)는 기본 주파수와 부의 상관관계에 있는 값이 클수록 큰 값을 취하지만, i=0의 계수에 대해서는 이것에 한정되지 않고 고정값을 사용해도 된다.
제1 실시형태의 변형예의 선형 예측 분석 장치(2)에 의하면, 기본 주파수와 부의 상관관계에 있는 값에 따라, 적어도 일부의 예측 차수 i에 대하여, 그 차수 i에 대응하는 계수 wO(i)의 크기가 현 프레임의 입력 신호 XO(n)의 전부 또는 일부를 포함하는 신호 구간의 기본 주파수와 부의 상관관계에 있는 값의 증가와 함께 단조증가하는 관계에 있는 경우가 포함되어 있는 계수 wO(i)를 자기상관에 승산하여 변형 자기상관을 구하여 선형 예측 계수로 변환 가능한 계수를 구함으로써, 입력 신호의 기본 주파수가 높을 때여도 피치 성분에 기인하는 스펙트럼의 피크의 발생을 억제한 선형 예측 계수로 변환 가능한 계수를 구할 수 있고, 또한 입력 신호의 기본 주파수가 낮을 때여도 스펙트럼 포락을 표현 가능한 선형 예측 계수로 변환 가능한 계수를 구할 수 있어, 종래보다 분석 정밀도가 높은 선형 예측을 실현할 수 있다. 따라서, 제1 실시형태의 변형예의 선형 예측 분석 장치(2)를 포함하는 부호화 장치와 그 부호화 장치에 대응하는 복호 장치로 음성 신호나 음향 신호를 부호화 복호하여 얻어지는 복호 음성 신호나 복호 음향 신호의 품질은 종래의 선형 예측 분석 장치를 포함하는 부호화 장치와 그 부호화 장치에 대응하는 복호 장치로 음성 신호나 음향 신호를 부호화 복호하여 얻어지는 복호 음성 신호나 복호 음향 신호의 품질보다 좋다.
[실험 결과]
도 9는 24개의 음성 음향 신호 소스와 24인의 피험자에 의한 MOS 평가 실험의 실험 결과이다. 도 9의 「종래법」 「cutA」의 6개의 MOS값은 종래의 선형 예측 분석 장치를 포함하는 도 9에 기재한 각 비트 레이트의 부호화 장치와 그들 부호화 장치에 대응하는 복호 장치를 사용하여, 음성 음향 신호 소스를 부호화 복호하여 얻어진 복호 음성 신호나 복호 음향 신호에 대한 MOS값이다. 도 9의 「제안 수법」 「cutB」의 6개의 MOS값은 제1 실시형태의 변형예의 선형 예측 분석 장치를 포함하는 도 9에 기재한 각 비트 레이트의 부호화 장치와 그들 부호화 장치에 대응하는 복호 장치를 사용하여, 음성 음향 신호 소스를 부호화 복호하여 얻어진 복호 음성 신호나 복호 음향 신호에 대한 MOS값이다. 도 9의 실험 결과로부터도 본 발명의 선형 예측 분석 장치를 포함하는 부호화 장치와 그 부호화 장치에 대응하는 복호 장치를 사용함으로써 종래의 선형 예측 분석 장치를 포함하는 경우보다 높은 MOS값 즉 좋은 음질을 얻을 수 있었던 것을 알 수 있다.
[제2 실시형태]
제2 실시형태는 기본 주파수와 정의 상관관계에 있는 값 또는 기본 주파수와 부의 상관관계에 있는 값과 소정의 역치를 비교하고, 그 비교 결과에 따라 계수 wO(i)를 결정하는 것이다. 제2 실시형태는 계수 결정부(24)에 있어서의 계수 wO(i)의 결정 방법만이 제1 실시형태와 상이하고, 다른 점에 대해서 제1 실시형태와 마찬가지이다. 이하, 제1 실시형태와 상이한 부분을 중심으로 설명하고, 제1 실시형태와 마찬가지인 부분에 대해서는 중복 설명을 생략한다.
여기서는 우선 기본 주파수와 정의 상관관계에 있는 값과 소정의 역치를 비교하고, 그 비교 결과에 따라 계수 wO(i)를 결정하는 예에 대해서 설명하고, 기본 주파수와 부의 상관관계에 있는 값과 소정의 역치를 비교하고, 그 비교 결과에 따라 계수 wO(i)를 결정하는 예는 제2 실시형태의 제1 변형예로 설명한다.
제2 실시형태의 선형 예측 분석 장치(2)의 기능 구성과 선형 예측 분석 장치(2)에 의한 선형 예측 분석 방법의 플로우차트는 제1 실시형태와 동일한 도 1과 도 2이다. 제2 실시형태의 선형 예측 분석 장치(2)는 계수 결정부(24)의 처리가 상이한 부분 이외는 제1 실시형태의 선형 예측 분석 장치(2)와 동일하다.
제2 실시형태의 계수 결정부(24)의 처리의 흐름의 예를 도 3에 나타낸다. 제2 실시형태의 계수 결정부(24)는 예를 들면 도 3의 각 스텝 S41A, 스텝 S42, 스텝 S43의 처리를 행한다.
계수 결정부(24)는 입력된 기본 주파수에 대한 정보에 대응하는 기본 주파수와 정의 상관관계에 있는 값과 소정의 역치를 비교한다(스텝 S41A). 입력된 기본 주파수에 대한 정보에 대응하는 기본 주파수와 정의 상관관계에 있는 값은 예를 들면 입력된 기본 주파수에 대한 정보에 대응하는 기본 주파수 그 자체이다.
계수 결정부(24)는 기본 주파수와 정의 상관관계에 있는 값이 소정의 역치 이상인 경우, 즉, 기본 주파수가 높다고 판단된 경우에는, 미리 정한 규칙에 의해 계수 wh(i)를 결정하고, 이 결정된 계수 wh(i)(i=0,1,…,Pmax)를 wO(i)(i=0,1,…,Pmax)로 한다(스텝 S42). 즉, wO(i)=wh(i)로 한다.
계수 결정부(24)는 기본 주파수와 정의 상관관계에 있는 값이 소정의 역치 이상이 아닌 경우, 즉, 기본 주파수가 낮다고 판단된 경우에는, 미리 정한 규칙에 의해 계수 wl(i)를 결정하고, 이 결정된 계수 wl(i)(i=0,1,…,Pmax)를 wO(i)(i=0,1,…,Pmax)로 한다(스텝 S43). 즉, wO(i)=wl(i)로 한다.
여기서, wh(i)와 wl(i)는 적어도 일부의 각 i에 대해서 wh(i)<wl(i)라는 관계를 만족하도록 결정한다. 또는, wh(i)와 wl(i)는 적어도 일부의 각 i에 대해서는 wh(i)<wl(i)라는 관계를 만족하고, 그 이외의 i에 대해서는 wh(i)≤wl(i)라는 관계를 만족하도록 결정한다. 여기서, 적어도 일부의 각 i는 예를 들면 0 이외의 i(즉, 1≤i≤Pmax)이다. 예를 들면, wh(i)와 wl(i)는 식(1)에서 기본 주파수 P가 P1일 때의 wO(i)를 wh(i)로서 구하고, 식(1)에서 기본 주파수 P가 P2(단 P1>P2)일 때의 wO(i)를 wl(i)로서 구한다는 미리 정한 규칙에 의해 구한다. 또, 예를 들면, wh(i)와 wl(i)는 식(2)에서 α가 α1일 때의 wO(i)를 wh(i)로서 구하고, 식(2)에서 α가 α2(단 α1>α2)일 때의 wO(i)를 wl(i)로서 구한다는 미리 정한 규칙에 의해 구한다. 이 경우는 α1과 α2는 모두 식(2)의 α와 마찬가지로 미리 정해 둔다. 또한, 이들 어느 하나의 규칙에 의해 미리 구한 wh(i)와 wl(i)를 테이블에 기억해 두고, 기본 주파수와 정의 상관관계에 있는 값이 소정의 역치 이상인지 여부에 의해 wh(i)와 wl(i)의 어느 하나를 테이블로부터 선택하는 구성으로 해도 된다. 또, wh(i)와 wl(i)의 각각은 i가 커짐에 따라 wh(i), wl(i)의 값이 작아지도록 결정된다. 또한, i=0의 계수 wh(0), wl(0)에 대해서는, wh(0)≤wl(0)의 관계를 만족하고 있는 것은 필수가 아니며, wh(0)>wl(0)의 관계를 만족하는 값을 사용해도 된다.
제2 실시형태에 의해서도, 제1 실시형태와 마찬가지로, 입력 신호의 기본 주파수가 높을 때여도 피치 성분에 기인하는 스펙트럼의 피크의 발생을 억제한 선형 예측 계수로 변환 가능한 계수를 구할 수 있고, 또한 입력 신호의 기본 주파수가 낮을 때여도 스펙트럼 포락을 표현 가능한 선형 예측 계수로 변환 가능한 계수를 구할 수 있어, 종래보다 분석 정밀도가 높은 선형 예측을 실현할 수 있다.
<제2 실시형태의 제1 변형예>
제2 실시형태의 제1 변형예는 기본 주파수와 정의 상관관계에 있는 값이 아니고, 기본 주파수와 부의 상관관계에 있는 값과 소정의 역치를 비교하고, 그 비교 결과에 따라 계수 wO(i)를 결정하는 것이다. 제2 실시형태의 제1 변형예에 있어서의 소정의 역치는 제2 실시형태에 있어서 기본 주파수와 정의 상관관계에 있는 값과 비교되는 소정의 역치와는 상이하다.
제2 실시형태의 제1 변형예의 선형 예측 분석 장치(2)의 기능 구성과 플로우차트는 제1 실시형태의 변형예와 동일한 도 1과 도 2이다. 제2 실시형태의 제1 변형예의 선형 예측 분석 장치(2)는 계수 결정부(24)의 처리가 상이한 부분 이외는 제1 실시형태의 변형예의 선형 예측 분석 장치(2)와 동일하다.
제2 실시형태의 제1 변형예의 계수 결정부(24)의 처리의 흐름의 예를 도 4에 나타낸다. 제2 실시형태의 제1 변형예의 계수 결정부(24)는 예를 들면 도 4의 스텝 S41B, 스텝 S42, 스텝 S43의 처리를 행한다.
계수 결정부(24)는 입력된 주기에 대한 정보에 대응하는 기본 주파수와 부의 상관관계에 있는 값과 소정의 역치를 비교한다(스텝 S41B). 입력된 주기에 대한 정보에 대응하는 기본 주파수와 부의 상관관계에 있는 값은 예를 들면 입력된 주기에 대한 정보에 대응하는 주기이다.
계수 결정부(24)는 기본 주파수와 부의 상관관계에 있는 값이 소정의 역치 이하인 경우, 즉, 주기가 짧다고 판단된 경우에는, 미리 정한 규칙에 의해 계수 wh(i)(i=0,1,…,Pmax)를 결정하고, 이 결정된 계수 wh(i)(i=0,1,…,Pmax)를 wO(i)(i=0,1,…,Pmax)로 한다(스텝 S42). 즉, wO(i)=wh(i)로 한다.
계수 결정부(24)는 기본 주파수와 부의 상관관계에 있는 값이 소정의 역치 이하가 아닌 경우, 즉, 주기가 길다고 판단된 경우에는, 미리 정한 규칙에 의해 계수 wl(i)(i=0,1,…,Pmax)를 결정하고, 이 결정된 계수 wl(i)를 wO(i)로 한다(스텝 S43). 즉, wO(i)=wl(i)로 한다.
여기서, wh(i)와 wl(i)는 적어도 일부의 i에 대해서 wh(i)<wl(i)라는 관계를 만족하도록 결정한다. 또는, wh(i)와 wl(i)는 적어도 일부의 i에 대해서는 wh(i)<wl(i)라는 관계를 만족하고, 그 밖의 i에 대해서는 wh(i)≤wl(i)라는 관계를 만족하도록 결정한다. 여기서, 적어도 일부의 i는 예를 들면 0 이외의 i(즉, 1≤i≤Pmax)이다. 예를 들면, wh(i)와 wl(i)는 식(7)에서 주기 T가 T1일 때의 wO(i)를 wh(i)로서 구하고, 식(7)에서 주기 T가 T2(단 T1<T2)일 때의 wO(i)를 wl(i)로서 구한다는 미리 정한 규칙에 의해 구한다. 또, 예를 들면, wh(i)와 wl(i)는 식(8)에서 α가 α1일 때의 wO(i)를 wh(i)로서 구하고, 식(8)에서 α가 α2(단 α1<α2)일 때의 wO(i)를 wl(i)로서 구한다는 미리 정한 규칙에 의해 구한다. 이 경우는 α1과 α2는 모두 식(8)의 α와 마찬가지로 미리 정해 둔다. 또한, 이들의 어느 하나의 규칙에 의해 미리 구한 wh(i)와 wl(i)를 테이블에 기억해 두고, 기본 주파수와 부의 상관관계에 있는 값이 소정의 역치 이하인지 여부에 의해 wh(i)와 wl(i)의 어느 하나를 테이블로부터 선택하는 구성으로 해도 된다. 또, wh(i)와 wl(i)의 각각은 i가 커짐에 따라 wh(i), wl(i)의 값이 작아지도록 결정된다. 또한, i=0의 계수 wh(0), wl(0)에 대해서는 wh(0)≤wl(0)의 관계를 만족하고 있는 것은 필수가 아니며, wh(0)>wl(0)의 관계를 만족하는 값을 사용해도 된다.
제2 실시형태의 제1 변형예에 의해서도, 제1 실시형태의 변형예와 마찬가지로, 입력 신호의 기본 주파수가 높을 때여도 피치 성분에 기인하는 스펙트럼의 피크의 발생을 억제한 선형 예측 계수로 변환 가능한 계수를 구할 수 있고, 또한 입력 신호의 기본 주파수가 낮을 때여도 스펙트럼 포락을 표현 가능한 선형 예측 계수로 변환 가능한 계수를 구할 수 있어, 종래보다 분석 정밀도가 높은 선형 예측을 실현할 수 있다.
<제2 실시형태의 제2 변형예>
제2 실시형태에서는 1개의 역치를 사용하여 계수 wO(i)를 결정했는데, 제2 실시형태의 제2 변형예는 2개 이상의 역치를 사용하여 계수 wO(i)를 결정하는 것이다. 이하, 2개의 역치 th1', th2'를 사용하여 계수를 결정하는 방법을 예로 들어 설명한다. 역치 th1', th2'는 0<th1'<th2'라는 관계를 만족하는 것으로 한다.
제2 실시형태의 제2 변형예의 선형 예측 분석 장치(2)의 기능 구성은 제2 실시형태와 동일한 도 1이다. 제2 실시형태의 제2 변형예의 선형 예측 분석 장치(2)는 계수 결정부(24)의 처리가 상이한 부분 이외는 제2 실시형태의 선형 예측 분석 장치(2)와 동일하다.
계수 결정부(24)는 입력된 기본 주파수에 대한 정보에 대응하는 기본 주파수와 정의 상관관계에 있는 값과, 역치 th1', th2'를 비교한다. 입력된 기본 주파수에 대한 정보에 대응하는 기본 주파수와 정의 상관관계에 있는 값은 예를 들면 입력된 기본 주파수에 대한 정보에 대응하는 기본 주파수 그 자체이다.
계수 결정부(24)는 기본 주파수와 정의 상관관계에 있는 값이 역치 th2'보다 큰 경우, 즉, 기본 주파수가 높다고 판단된 경우에는, 미리 정한 규칙에 의해 계수 wh(i)(i=0,1,…,Pmax)를 결정하고, 이 결정된 계수 wh(i)(i=0,1,…,Pmax)를 wO(i)(i=0,1,…,Pmax)로 한다. 즉, wO(i)=wh(i)로 한다.
계수 결정부(24)는 기본 주파수와 정의 상관관계에 있는 값이 역치 th1'보다 크고 역치 th2' 이하인 경우, 즉, 기본 주파수가 중간 정도라고 판단된 경우에는, 미리 정한 규칙에 의해 계수 wm(i)(i=0,1,…,Pmax)를 결정하고, 이 결정된 계수 wm(i)(i=0,1,…,Pmax)를 wO(i)(i=0,1,…,Pmax)로 한다. 즉, wO(i)=wm(i)로 한다.
계수 결정부(24)는 기본 주파수와 정의 상관관계에 있는 값이 역치 th1' 이하인 경우, 즉, 기본 주파수가 낮다고 판단된 경우에는, 미리 정한 규칙에 의해 계수 wl(i)(i=0,1,…,Pmax)를 결정하고, 이 결정된 계수 wl(i)(i=0,1,…,Pmax)를 wO(i)(i=0,1,…,Pmax)로 한다. 즉, wO(i)=wl(i)로 한다.
여기서, wh(i), wm(i), wl(i)는 적어도 일부의 각 i에 대해서 wh(i)<wm(i)<wl(i)라는 관계를 만족하도록 결정하는 것으로 한다. 여기서, 적어도 일부의 각 i는 예를 들면 0 이외의 각 i(즉, 1≤i≤Pmax)이다. 또는, wh(i), wm(i), wl(i)는 적어도 일부의 각 i에 대해서 wh(i)<wm(i)≤wl(i), 그 이외의 i 중 적어도 일부의 각 i에 대해서 wh(i)≤wm(i)<wl(i), 나머지 적어도 일부의 각 i에 대해서 wh(i)≤wm(i)≤wl(i)라는 관계를 만족하도록 결정한다. 예를 들면, wh(i), wm(i), wl(i)는 식(1)에서 기본 주파수 P가 P1일 때의 wO(i)를 wh(i)로서 구하고, 식(1)에서 기본 주파수 P가 P2(단 P1>P2)일 때의 wO(i)를 wm(i)로서 구하고, 식(1)에서 기본 주파수 P가 P3(단 P2>P3)일 때의 wO(i)를 wl(i)로서 구한다는 미리 정한 규칙에 의해 구한다. 또, 예를 들면, wh(i), wm(i), wl(i)는 식(2)에서 α가 α1일 때의 wO(i)를 wh(i)로서 구하고, 식(2)에서 α이 α2(단 α1>α2)일 때의 wO(i)를 wm(i)로서 구하고, 식(2)에서 α가 α3(단 α2>α3)일 때의 wO(i)를 wl(i)로서 구한다는 미리 정한 규칙에 의해 구한다. 이 경우는 α1,α2,α3은 식(2)의 α와 마찬가지로 미리 정해 둔다. 또한, 이들의 어느 하나의 규칙에 의해 미리 구한 wh(i), wm(i), wl(i)를 테이블에 기억해 두고, 기본 주파수와 정의 상관관계에 있는 값과 소정의 역치와의 비교에 의해 wh(i), wm(i), wl(i)의 어느 하나를 테이블로부터 선택하는 구성으로 해도 된다. 또한, wh(i)와 wl(i)를 사용하여, 그 사이의 계수 wm(i)를 결정해도 된다. 즉, wm(i)=β'×wh(i)+(1-β')×wl(i)에 의해 wm(i)를 결정해도 된다. 여기서 β'는 0≤β'≤1이며, 또한 기본 주파수 P가 작은 값을 취할 때는 β'의 값도 작아지고, 기본 주파수 P가 큰 값을 취할 때에 β'의 값도 커지는 함수 β'=c(P)에 의해, 기본 주파수 P로부터 구하는 값이다. 이와 같이 wm(i)를 구하면, 계수 결정부(24)에는 wh(i)(i=0,1,…,Pmax)를 기억한 테이블과 wl(i)(i=0,1,…,Pmax)를 기억한 테이블의 2개의 테이블만을 기억해 둠으로써, 기본 주파수가 중간 정도인 경우 중 기본 주파수가 클 때에는 wh(i)에 가까운 계수를 얻을 수 있고, 반대로 기본 주파수가 중간 정도인 경우 중 기본 주파수가 작을 때에는 wl(i)에 가까운 계수를 얻을 수 있다. 또, wh(i), wm(i), wl(i)는 i가 커짐에 따라 각각 wh(i), wm(i), wl(i)의 값이 작아지도록 결정된다. 또한, i=0의 계수 wh(0), wm(0), wl(0)에 대해서는 wh(0)≤wm(0)≤wl(0)의 관계를 만족하고 있는 것은 필수가 아니며, wh(0)>wm(0) 또는/및 wm(0)>wl(0)의 관계를 만족하는 값을 사용해도 된다.
제2 실시형태의 제2 변형예에 의해서도, 제2 실시형태와 마찬가지로, 입력 신호의 기본 주파수가 높을 때여도 피치 성분에 기인하는 스펙트럼의 피크의 발생을 억제한 선형 예측 계수로 변환 가능한 계수를 구할 수 있고, 또한 입력 신호의 기본 주파수가 낮을 때여도 스펙트럼 포락을 표현 가능한 선형 예측 계수로 변환 가능한 계수를 구할 수 있어, 종래보다 분석 정밀도가 높은 선형 예측을 실현할 수 있다.
<제2 실시형태의 제3 변형예>
제2 실시형태의 제1 변형예에서는 1개의 역치를 사용하여 계수 wO(i)를 결정했는데, 제2 실시형태의 제3 변형예는 2개 이상의 역치를 사용하여 계수 wO(i)를 결정하는 것이다. 이하, 2개의 역치 th1, th2를 사용하여 계수를 결정하는 방법을 예로 들어 설명한다. 역치 th1, th2는 0<th1<th2라는 관계를 만족하는 것으로 한다.
제2 실시형태의 제3 변형예의 선형 예측 분석 장치(2)의 기능 구성은 제2 실시형태의 제1 변형예와 동일한 도 1이다. 제2 실시형태의 제3 변형예의 선형 예측 분석 장치(2)는 계수 결정부(24)의 처리가 상이한 부분 이외는 제2 실시형태의 제1 변형예의 선형 예측 분석 장치(2)와 동일하다.
계수 결정부(24)는 입력된 주기에 대한 정보에 대응하는 기본 주파수와 부의 상관관계에 있는 값과, 역치 th1, th2를 비교한다. 입력된 주기에 대한 정보에 대응하는 기본 주파수와 부의 상관관계에 있는 값은 예를 들면 입력된 주기에 대한 정보에 대응하는 주기이다.
계수 결정부(24)는 기본 주파수와 부의 상관관계에 있는 값이 역치 th1보다 작은 경우, 즉, 주기가 짧다고 판단된 경우에는, 미리 정한 규칙에 의해 계수 wh(i)(i=0,1,…,Pmax)를 결정하고, 이 결정된 계수 wh(i)(i=0,1,…,Pmax)를 wO(i)(i=0,1,…,Pmax)로 한다. 즉, wO(i)=wh(i)로 한다.
계수 결정부(24)는 기본 주파수와 부의 상관관계에 있는 값이 역치 th1 이상이며 역치 th2보다 작은 경우, 즉, 주기가 중간 정도라고 판단된 경우에는, 미리 정한 규칙에 의해 계수 wm(i)(i=0,1,…,Pmax)를 결정하고, 이 결정된 계수 wm(i)(i=0,1,…,Pmax)를 wO(i)(i=0,1,…,Pmax)로 한다. 즉, wO(i)=wm(i)로 한다.
계수 결정부(24)는 기본 주파수와 부의 상관관계에 있는 값이 역치 th2 이상인 경우, 즉, 주기가 길다고 판단된 경우에는, 미리 정한 규칙에 의해 계수 wl(i)를 결정하고, 이 결정된 계수 wl(i)(i=0,1,…,Pmax)를 wO(i)(i=0,1,…,Pmax)로 한다. 즉, wO(i)=wl(i)로 한다.
여기서, wh(i), wm(i), wl(i)는 적어도 일부의 각 i에 대해서 wh(i)<wm(i)<wl(i)라는 관계를 만족하도록 결정하는 것으로 한다. 여기서, 적어도 일부의 각 i는 예를 들면 0 이외의 각 i(즉, 1≤i≤Pmax)이다. 또는, wh(i), wm(i), wl(i)는 적어도 일부의 각 i에 대해서 wh(i)<wm(i)≤wl(i), 그 이외의 i 중 적어도 일부의 각 i에 대해서 wh(i)≤wm(i)<wl(i), 나머지 각 i에 대해서 wh(i)≤wm(i)≤wl(i)라는 관계를 만족하도록 결정한다. 예를 들면, wh(i), wm(i), wl(i)는 식(7)에서 주기 T가 T1일 때의 wO(i)를 wh(i)로서 구하고, 식(7)에서 주기 T가 T2(단 T1<T2)일 때의 wO(i)를 wm(i)로서 구하고, 식(7)에서 주기 T가 T3(단 T2<T3)일 때의 wO(i)를 wl(i)로서 구한다는 미리 정한 규칙에 의해 구한다. 또, 예를 들면, wh(i), wm(i), wl(i)는 식(8)에서 α가 α1일 때의 wO(i)를 wh(i)로서 구하고, 식(8)에서 α가 α2(단 α1<α2)일 때의 wO(i)를 wm(i)로서 구하고, 식(2)에서 α가 α3(단 α2 <α3)일 때의 wO(i)를 wl(i)로서 구한다는 미리 정한 규칙에 의해 구한다. 이 경우는 α1,α2,α3은 식(8)의 α와 마찬가지로 미리 정해 둔다. 또한, 이들의 어느 하나의 규칙에 의해 미리 구한 wh(i), wm(i), wl(i)를 테이블에 기억해 두고, 기본 주파수와 부의 상관관계에 있는 값과 소정의 역치와의 비교에 의해 wh(i), wm(i), wl(i)의 어느 하나를 테이블로부터 선택하는 구성으로 해도 된다. 또한, wh(i)와 wl(i)를 사용하여, 그 사이의 계수 wm(i)를 결정해도 된다. 즉, wm(i)=(1-β)×wh(i)+β×wl(i)에 의해 wm(i)를 결정해도 된다. 여기서 β는 0≤β≤1이며, 또한 주기 T가 작은 값을 취할 때는 β의 값도 작아지고, 주기 T가 큰 값을 취할 때에 β의 값도 커지는 함수 β=b(T)에 의해 주기 T로부터 구하는 값이다. 이와 같이 wm(i)를 구하면, 계수 결정부(24)에는 wh(i)(i=0,1,…,Pmax)를 기억한 테이블과 wl(i)(i=0,1,…,Pmax)를 기억한 테이블의 2개의 테이블만을 기억해 둠으로써, 주기가 중간 정도인 경우 중 주기가 작을 때에는 wh(i)에 가까운 계수를 얻을 수 있고, 반대로 주기가 중간 정도인 경우 중 주기가 클 때에는 wl(i)에 가까운 계수를 얻을 수 있다. 또, wh(i), wm(i), wl(i)는 i가 커짐에 따라서 각각 wh(i), wm(i), wl(i)의 값이 작아지도록 결정된다. 또한, i=0의 계수 wh(0), wm(0), wl(0)에 대해서는, wh(0)≤wm(0)≤wl(0)의 관계를 만족하고 있는 것은 필수가 아니며, wh(0)>wm(0) 또는/및 wm(0)>wl(0)의 관계를 만족하는 값을 사용해도 된다.
제2 실시형태의 제3 변형예에 의해서도, 제2 실시형태의 제1 변형예와 마찬가지로, 입력 신호의 기본 주파수가 높을 때여도 피치 성분에 기인하는 스펙트럼의 피크의 발생을 억제한 선형 예측 계수로 변환 가능한 계수를 구할 수 있고, 또한 입력 신호의 기본 주파수가 낮을 때여도 스펙트럼 포락을 표현 가능한 선형 예측 계수로 변환 가능한 계수를 구할 수 있어, 종래보다 분석 정밀도가 높은 선형 예측을 실현할 수 있다.
[제3 실시형태]
제3 실시형태는 복수개의 계수 테이블을 사용하여 계수 wO(i)를 결정하는 것이다. 제3 실시형태는 계수 결정부(24)에 있어서의 계수 wO(i)의 결정 방법만이 제1 실시형태와 상이하고, 다른 점에 대해서 제1 실시형태와 마찬가지이다. 이하, 제1 실시형태와 상이한 부분을 중심으로 설명하고, 제1 실시형태와 마찬가지인 부분에 대해서는 중복 설명을 생략한다.
제3 실시형태의 선형 예측 분석 장치(2)는 계수 결정부(24)의 처리가 상이하고, 도 5에 예시하는 바와 같이 계수 테이블 기억부(25)를 또한 구비하고 있는 부분 이외는 제1 실시형태의 선형 예측 분석 장치(2)와 동일하다. 계수 테이블 기억부(25)에는 2개 이상의 계수 테이블이 기억되어 있다.
제3 실시형태의 계수 결정부(24)의 처리의 흐름의 예를 도 6에 나타낸다. 제3 실시형태의 계수 결정부(24)는 예를 들면 도 6의 스텝 S44, 스텝 S45의 처리를 행한다.
우선, 계수 결정부(24)는 입력된 기본 주파수에 대한 정보에 대응하는 기본 주파수와 정의 상관관계에 있는 값 또는 입력된 주기에 대한 정보에 대응하는 기본 주파수와 부의 상관관계에 있는 값을 사용하여, 계수 테이블 기억부(25)에 기억된 2개 이상의 계수 테이블로부터, 그 기본 주파수와 정의 상관관계에 있는 값 또는 기본 주파수와 부의 상관관계에 있는 값에 따른 1개의 계수 테이블 t를 선택한다(스텝 S44). 예를 들면, 기본 주파수에 대한 정보에 대응하는 기본 주파수와 정의 상관관계에 있는 값은 기본 주파수에 대한 정보에 대응하는 기본 주파수이며, 입력된 주기에 대한 정보에 대응하는 기본 주파수와 부의 상관관계에 있는 값은 입력된 주기에 대한 정보에 대응하는 주기이다.
예를 들면, 계수 테이블 기억부(25)에 상이한 2개의 계수 테이블 t0, t1이 기억되어 있고, 계수 테이블 t0에는 계수 wt0(i)(i=0,1,…,Pmax)가 격납되어 있고, 계수 테이블 t1에는 계수 wt1(i)(i=0,1,…,Pmax)가 격납되어 있는 것으로 한다. 2개의 계수 테이블 t0, t1의 각각에는 적어도 일부의 각 i에 대해서 wt0(i)<wt1(i)이며, 나머지 각 i에 대해서 wt0(i)≤wt1(i)가 되도록 정해진 계수 wt0(i)(i=0,1,…,Pmax)와 계수 wt1(i)(i=0,1,…,Pmax)가 격납되어 있다.
이 때, 계수 결정부(24)는 기본 주파수와 정의 상관관계에 있는 값이 소정의 역치 이상이면 계수 테이블 t0을 계수 테이블 t로서 선택하고, 그렇지 않은 경우에는 계수 테이블 t1을 계수 테이블 t로서 선택한다. 즉, 기본 주파수와 정의 상관관계에 있는 값이 소정의 역치 이상인 경우, 즉, 기본 주파수가 높다고 판단된 경우에는, 각 i에 대한 계수가 작은 쪽의 계수 테이블을 선택하고, 기본 주파수와 정의 상관관계에 있는 값이 소정의 역치 이상이 아닌 경우, 즉 기본 주파수가 낮다고 판단된 경우에는, 각 i에 대한 계수가 큰 쪽의 계수 테이블을 선택한다. 바꾸어 말하면, 계수 테이블 기억부(25)에 기억되어 있는 2개의 계수 테이블 중의 기본 주파수와 정의 상관관계에 있는 값이 제1값인 경우에 계수 결정부(24)에 의해 선택되는 계수 테이블을 제1 계수 테이블로 하고, 계수 테이블 기억부(25)에 기억되어 있는 2개의 계수 테이블 중의 기본 주파수와 정의 상관관계에 있는 값이 제1값보다 작은 제2값인 경우에 계수 결정부(24)에 의해 선택되는 계수 테이블을 제2 계수 테이블로 하여, 적어도 일부의 각 차수 i에 대하여, 제2 계수 테이블에 있어서의 각 차수 i에 대응하는 계수의 크기는 제1 계수 테이블에 있어서의 각 차수 i에 대응하는 계수의 크기보다 크다.
또, 계수 결정부(24)는 기본 주파수와 부의 상관관계에 있는 값이 소정의 역치 이하이면 계수 테이블 t0을 계수 테이블 t로서 선택하고, 그렇지 않은 경우에는 계수 테이블 t1을 계수 테이블 t로서 선택한다. 즉, 기본 주파수와 부의 상관관계에 있는 값이 소정의 역치 이하인 경우, 즉 주기가 짧다고 판단된 경우에는, 각 i에 대한 계수가 작은 쪽의 계수 테이블을 선택하고, 기본 주파수와 부의 상관관계에 있는 값이 소정의 역치 이하가 아닌 경우, 즉 주기가 길다고 판단된 경우에는, 각 i에 대한 계수가 큰 쪽의 계수 테이블을 선택한다. 바꾸어 말하면, 계수 테이블 기억부(25)에 기억되어 있는 2개의 계수 테이블 중의 기본 주파수와 부의 상관관계에 있는 값이 제1값인 경우에 계수 결정부(24)에 의해 선택되는 계수 테이블을 제1 계수 테이블로 하고, 계수 테이블 기억부(25)에 기억되어 있는 2개의 계수 테이블 중의 기본 주파수와 부의 상관관계에 있는 값이 제1값보다 큰 제2값인 경우에 계수 결정부(24)에 의해 선택되는 계수 테이블을 제2 계수 테이블로 하여, 적어도 일부의 각 차수 i에 대하여, 제2 계수 테이블에 있어서의 각 차수 i에 대응하는 계수의 크기는 제1 계수 테이블에 있어서의 각 차수 i의 계수의 크기보다 크다.
또한, 계수 테이블 기억부(25)에 기억되어 있는 계수 테이블 t0, t1의 i=0의 계수 wt0(0), wt1(0)에 대해서는 wt0(0)≤wt1(0)의 관계를 만족하고 있는 것은 필수가 아니며, wt0(0)>wt1(0)의 관계에 있는 값이어도 된다.
또, 예를 들면, 계수 테이블 기억부(25)에 상이한 3개의 계수 테이블 t0, t1, t2이 기억되어, 계수 테이블 t0에는 계수 wt0(i)(i=0,1,…,Pmax)가 격납되어 있고, 계수 테이블 t1에는 계수 wt1(i)(i=0,1,…,Pmax), 계수 테이블 t2에는 계수 wt2(i)(i=0,1,…,Pmax)가 격납되어 있는 것으로 한다. 3개의 계수 테이블 t0, t1, t2의 각각에는 적어도 일부의 i에 대해서 wt0(i)<wt1(i)≤wt2(i)이며, 그 이외의 i 중 적어도 일부의 각 i에 대해서 wt0(i)≤wt1(i)<wt2(i)이며, 나머지 각 i에 대해서 wt0(i)≤wt1(i)≤wt2(i)가 되도록 정해진 계수 wt0(i)(i=0,1,…,Pmax)와 계수 wt1(i)(i=0,1,…,Pmax)와 계수 wt2(i)(i=0,1,…,Pmax)가 격납되어 있다.
여기서, 0<th1'<th2'라는 관계를 만족하는 2개의 역치 th1',th2'가 정해져 있는 것으로 한다. 이 때, 계수 결정부(24)는
(1) 기본 주파수와 정의 상관관계에 있는 값>th2'의 경우, 즉, 기본 주파수가 높다고 판단된 경우에는, 계수 테이블 t0을 계수 테이블 t로서 선택하고,
(2) th2'≥기본 주파수와 정의 상관관계에 있는 값>th1'의 경우, 즉, 기본 주파수가 중간 정도라고 판단된 경우에는, 계수 테이블 t1을 계수 테이블 t로서 선택하고,
(3) th1'≥기본 주파수와 정의 상관관계에 있는 값의 경우, 즉, 기본 주파수가 낮다고 판단된 경우에는, 계수 테이블 t2를 계수 테이블 t로서 선택한다.
또, 여기서, 0<th1<th2라는 관계를 만족하는 2개의 역치 th1,th2가 정해져 있는 것으로 한다. 이 때, 계수 결정부(24)는
(1) 기본 주파수와 부의 상관관계에 있는 값≥th2의 경우, 즉, 주기가 길다고 판단된 경우에는, 계수 테이블 t2를 계수 테이블 t로서 선택하고,
(2) th2>기본 주파수와 부의 상관관계에 있는 값≥th1의 경우, 즉, 주기가 중간 정도라고 판단된 경우에는, 계수 테이블 t1을 계수 테이블 t로서 선택하고,
(3) th1>기본 주파수와 부의 상관관계에 있는 값의 경우, 즉, 주기가 짧다고 판단된 경우에는, 계수 테이블 t0을 계수 테이블 t로서 선택한다.
또한, 계수 테이블 기억부(25)에 기억되어 있는 계수 테이블 t0, t1, t2의 i=0의 계수 wt0(0), wt1(0), wt2(0)에 대해서는, wt0(0)≤wt1(0)≤wt2(0)의 관계를 만족하고 있는 것은 필수가 아니며, wt0(0)>wt1(0) 또는/및 wt1(0)>wt2(0)의 관계에 있는 값이어도 된다.
그리고, 계수 결정부(24)는 그 선택된 계수 테이블 t에 격납된 각 차수 i의 계수 wt(i)를 계수 wO(i)로 한다(스텝 S45). 즉, wO(i)=wt(i)로 한다. 바꾸어 말하면, 계수 결정부(24)는 선택된 계수 테이블 t로부터 각 차수 i에 대응하는 계수 wt(i)를 취득하고, 취득된 각 차수 i에 대응하는 계수 wt(i)를 wO(i)로 한다.
제3 실시형태에서는 제1 실시형태 및 제2 실시형태와는 상이하게, 기본 주파수와 정의 상관관계에 있는 값이나 기본 주파수와 부의 상관관계에 있는 값의 함수에 기초하여 계수 wO(i)를 계산할 필요가 없기 때문에, 보다 적은 연산 처리량으로 wO(i)를 결정할 수 있다.
계수 테이블 기억부(25)에 기억되어 있는 2개 이상의 계수 테이블에 대해서 이하와 같이 말할 수 있다.
계수 테이블 기억부(25)에 기억되어 있는 2개 이상의 계수 테이블 중의 기본 주파수와 정의 상관관계에 있는 값이 제1값인 경우에 계수 결정부(24)에서 계수 wO(i)(i=0,1,…,Pmax)가 취득되는 계수 테이블을 제1 계수 테이블로 한다. 계수 테이블 기억부(25)에 기억되어 있는 2개 이상의 계수 테이블 중의 기본 주파수와 정의 상관관계에 있는 값이 제1값보다 작은 제2값인 경우에 계수 결정부(24)에서 계수 wO(i)(i=0,1,…,Pmax)가 취득되는 계수 테이블을 제2 계수 테이블로 한다. 이 때, 적어도 일부의 각 차수 i에 대하여, 제2 계수 테이블에 있어서의 각 차수 i에 대응하는 계수는 제1 계수 테이블에 있어서의 그 각 차수 i에 대응하는 계수보다 크다.
또, 계수 테이블 기억부(25)에 기억되어 있는 2개 이상의 계수 테이블 중의 기본 주파수와 부의 상관관계에 있는 값이 제1값인 경우에 계수 결정부(24)에서 계수 wO(i)(i=0,1,…,Pmax)가 취득되는 계수 테이블을 제1 계수 테이블로 한다. 계수 테이블 기억부(25)에 기억되어 있는 2개 이상의 계수 테이블 중의 기본 주파수와 부의 상관관계에 있는 값이 제1값보다 큰 제2값인 경우에 계수 결정부(24)에서 계수 wO(i)(i=0,1,…,Pmax)가 취득되는 계수 테이블을 제2 계수 테이블로 한다. 이 때, 적어도 일부의 각 차수 i에 대하여, 제2 계수 테이블에 있어서의 각 차수 i에 대응하는 계수는 제1 계수 테이블에 있어서의 그 각 차수 i에 대응하는 계수보다 크다.
<제3 실시형태의 구체예>
이하, 제3 실시형태의 구체예에 대해서 설명한다. 이 구체예에서는 기본 주파수와 부의 상관관계에 있는 값으로서 주기의 양자화값이 사용되고, 이 주기의 양자화값에 따라서 계수 테이블 t가 선택된다.
선형 예측 분석 장치(2)에는 하이 패스 필터를 통과하고, 12.8 kHz로 샘플링 변환되어, 프리엠퍼시스 처리가 된 1프레임당 N샘플의 디지털 음향 신호인 입력 신호 XO(n)(n=0,1,…,N-1)와, 주기에 대한 정보로서 현 프레임의 일부의 입력 신호 XO(n)(n=0,1,…,Nn)(단, Nn은 Nn<N이라는 관계를 만족하는 소정의 정의 정수.)에 대해 주기 계산부(940)에서 구한 주기 T가 입력된다. 현 프레임의 일부의 입력 신호 XO(n)(n=0,1,…,Nn)에 대한 주기 T는 주기 계산부(940)에 있어서 당해 입력 신호의 1개 앞의 프레임의 신호 구간으로서 현 프레임의 일부의 입력 신호 XO(n)(n=0,1,…,Nn)를 포함시켜 두고, 1개 앞의 프레임의 신호 구간에 대한 주기 계산부(940)의 처리에 있어서 XO(n)(n=0,1,…,Nn)에 대하여 계산하여 기억한 주기이다.
자기상관 계산부(21)는 입력 신호 XO(n)로부터 자기상관 RO(i)(i=0,1,…,Pmax)을 하기 식(16)으로 구한다.
[수 14]
계수 결정부(24)에 주기에 대한 정보인 주기 T가 입력된다. 여기서 주기 T는 29≤T≤231이라는 범위에 포함되어 있는 것으로 한다. 계수 결정부(24)는 입력된 주기 T에 대한 정보에서 특정되는 주기 T로부터, 이하의 식(17)의 연산에 의해 인덱스 D를 얻는다. 이 인덱스 D가 기본 주파수와 부의 상관관계에 있는 값이며, 주기의 양자화값에 대응하고 있다.
D=int(T/110+0.5)(17)
여기서, int는 정수값화 함수이며, 입력된 실수의 소수점 이하를 버림으로써 그 실수의 정수 부분만을 출력하는 함수이다. 도 7은 주기 T, 인덱스 D, 주기의 양자화값 T'의 관계를 나타내는 도면의 예이다. 도 7의 횡축은 주기 T이며, 종축은 주기의 양자화값 T'이다. 주기의 양자화값 T'=D×110이다. 주기 T가 29≤T≤231이기 때문에, 인덱스 D는 0,1,2의 어느 하나의 값이 된다. 또한, 식(17)을 사용하지 않고 역치를 사용하여 주기 T가 29≤T≤54라면 D=0, 55≤T≤164라면 D=1, 165≤T≤231이라면 D=2라고 하도록 하여 인덱스 D를 구해도 된다.
계수 테이블 기억부(25)에는 D=0의 경우에 선택되는 계수 테이블 t0과, D=1의 경우에 선택되는 계수 테이블 t1과, D=2의 경우에 선택되는 계수 테이블 t2가 기억되어 있다.
계수 테이블 t0은 식(13)의 종래법의 f0=60Hz(즉 반값폭 142Hz에 상당)의 계수 테이블이며, 각 차수의 계수 wtO(i)가 다음과 같이 정해져 있다.
wt0(i)=[1.0, 0.999566371, 0.998266613, 0.996104103, 0.993084457, 0.989215493, 0.984507263, 0.978971839, 0.972623467, 0.96547842, 0.957554817, 0.948872864, 0.939454317, 0.929322779, 0.918503404, 0.907022834, 0.894909143]
계수 테이블 t1은 식(13)의 f0=50Hz(즉 반값폭 116Hz에 상당)의 계수 테이블이며, 각 차수의 계수 wt1(i)가 다음과 같이 정해져 있다.
wt1(i)=[1.0, 0.999706, 0.998824, 0.997356, 0.995304, 0.992673, 0.989466, 0.985689, 0.98135, 0.976455, 0.971012, 0.965032, 0.958525, 0.951502, 0.943975, 0.935956, 0.927460]
계수 테이블 t2는 식(13)의 f0=25Hz(즉 반값폭 58Hz에 상당)의 테이블이며, 각 차수의 계수 wt2(i)가 다음과 같이 정해져 있다.
wt2(i)=[1.0, 0.999926, 0.999706, 0.999338, 0.998824, 0.998163, 0.997356, 0.996403, 0.995304, 0.99406, 0.992672, 0.99114, 0.989465, 0.987647, 0.985688, 0.983588, 0.981348]
여기서, 상기 서술한 wtO(i), wt1(i), wt2(i)의 리스트는 Pmax=16로 하여, i=0,1,2,…,16의 순서로 좌측으로부터 i에 대응하는 계수의 크기를 늘어놓은 것이다. 즉 상기 서술한 예에서는 예를 들면 wt0(0)=1.0이며,
wt0(3)=0.996104103이다.
도 8에 i마다의 계수 테이블의 계수 wt0(i), wt1(i), wt2(i)의 계수의 크기를 그래프로 나타낸다. 도 8의 횡축은 차수 i를 나타내고, 도 8의 종축은 계수의 크기를 나타낸다. 이 그래프로부터도 알 수 있는 바와 같이, 각 계수 테이블 내에서는 i의 값이 커짐에 따라 계수의 크기가 단조감소하는 관계에 있다. 또, 동일한 i의 값에 대응하는 상이한 계수 테이블의 계수의 크기를 비교하면, i≥1에 대하여 wt0(i)<wt1(i)<wt2(i)의 관계를 만족하고 있다. 즉, 0을 제외하는 i≥1의 i에 대하여, 바꾸어 말하면 적어도 일부의 i에 대해서 인덱스 D가 커짐에 따라 계수의 크기가 단조증가하는 관계에 있다. i=0 이외에 대하여, 계수 테이블 기억부(25)에 기억되는 복수의 계수 테이블은 이러한 관계를 가지는 것이면 상기 서술한 예에 한정되지 않는다.
또, 비특허문헌 1이나 비특허문헌 2에 기재되어 있는 바와 같이, i=0의 계수만 특별 취급을 하여, wt0(0)=wt1(0)=wt2(0)=1.0001이나 wt0(0)=wt1(0)=wt2(0)=1.003이라는 경험적인 값을 사용해도 된다. 또한, i=0에 대해서는 wt0(i)<wt1(i)<wt2(i)의 관계를 만족하고 있을 필요는 없고, 또, wt0(0), wt1(0), wt2(0)가 반드시 동일한 값이 아니어도 된다. 예를 들면, wt0(0)=1.0001, wt1(0)=1.0, wt2(0)=1.0과 같이, i=0에 관해서만 wt0(0), wt1(0), wt2(0) 중 2개 이상의 값의 대소관계가 wt0(i)<wt1(i)<wt2(i)의 관계를 만족하지 않아도 된다.
계수 결정부(24)는 인덱스 D에 대응하는 계수 테이블 tD를 계수 테이블 t로서 선택한다.
그리고, 계수 결정부(24)는 그 선택된 계수 테이블 t의 각 계수 wt(i)를 계수 wO(i)로 한다. 즉, wO(i)=wt(i)로 한다. 바꾸어 말하면, 계수 결정부(24)는 선택된 계수 테이블 t로부터 각 차수 i에 대응하는 계수 wt(i)를 취득하고, 취득된 각 차수 i에 대응하는 계수 wt(i)를 wO(i)로 한다.
또한, 상기 서술한 예에서는, 각 계수 테이블 t0, t1, t2를 인덱스 D와 대응짓고 있는데, 각 계수 테이블 t0, t1, t2를 기본 주파수와 정의 상관관계에 있는 값 또는 인덱스 D 이외의 기본 주파수와 부의 상관관계에 있는 값과 대응지어도 된다.
<제3 실시형태의 변형예>
제3 실시형태에서는 복수개의 계수 테이블 중 어느 1개의 테이블에 기억된 계수를 계수 wO(i)로서 결정했는데, 제3 실시형태의 변형예는 이것에 더해 복수개의 계수 테이블에 기억된 계수에 기초하는 연산 처리에 의해 계수 wO(i)를 결정하는 경우를 포함한다.
제3 실시형태의 변형예의 선형 예측 분석 장치(2)의 기능 구성은 제3 실시형태와 동일한 도 5이다. 제3 실시형태의 변형예의 선형 예측 분석 장치(2)는 계수 결정부(24)의 처리가 상이하고, 계수 테이블 기억부(25)에 포함되는 계수 테이블이 상이한 부분 이외는 제3 실시형태의 선형 예측 분석 장치(2)와 동일하다.
계수 테이블 기억부(25)에는 계수 테이블 t0과 t2만이 기억되어 있고, 계수 테이블 t0에는 계수 wt0(i)(i=0,1,…,Pmax)가 격납되어 있고, 계수 테이블 t2에는 계수 wt2(i)(i=0,1,…,Pmax)가 격납되어 있다. 2개의 계수 테이블 t0, t2의 각각에는 적어도 일부의 각 i에 대해서 wt0(i)<wt2(i)이며, 나머지 각 i에 대해서 wt0(i)≤wt2(i)가 되도록 정해진 계수 wt0(i)(i=0,1,…,Pmax)와 계수 wt2(i)(i=0,1,…,Pmax)가 격납되어 있다.
여기서, 0<th1'<th2'이라는 관계를 만족하는 2개의 역치 th1',th2'가 정해져 있는 것으로 한다. 이 때, 계수 계산부(24)는
(1) 기본 주파수와 정의 상관관계에 있는 값>th2'의 경우, 즉, 기본 주파수가 높다고 판단된 경우에는, 계수 테이블 t0의 각 계수 wt0(i)를 계수 wO(i)로서 선택하고,
(2) th2'≥기본 주파수와 정의 상관관계에 있는 값>th1'의 경우, 즉, 기본 주파수가 중간 정도라고 판단된 경우에는, 계수 테이블 t0의 각 계수 wt0(i)와 계수 테이블 t2의 각 계수 wt2(i)를 사용하여, wO(i)=β'×wt0(i)+(1-β')×wt2(i)에 의해 계수 wO(i)를 결정하고,
(3) th1'≥기본 주파수와 정의 상관관계에 있는 값의 경우, 즉, 기본 주파수가 낮다고 판단된 경우에는, 계수 테이블 t2의 각 계수 wt2(i)를 계수 wO(i)로서 선택한다. 여기서 β'는 0≤β'≤1이며, 기본 주파수 P가 작은 값을 취할 때는 β'의 값도 작아지고, 기본 주파수 P가 큰 값을 취할 때에 β'의 값도 커지는 함수 β'=c(P)에 의해, 기본 주파수 P로부터 구하는 값이다. 이 구성으로 하면, 기본 주파수가 중간 정도인 경우 중 기본 주파수 P가 작을 때에는 wt2(i)에 가까운 값을 계수 wO(i)로 할 수 있고, 반대로 기본 주파수가 중간 정도인 경우 중 기본 주파수 P가 클 때에는 wt0(i)에 가까운 값을 계수 wO(i)로 할 수 있으므로, 2개의 테이블만으로 3개 이상의 계수 wO(i)를 얻을 수 있다.
또, 여기서, 0<th1<th2라는 관계를 만족하는 2개의 역치 th1,th2가 정해져 있는 것으로 한다. 이 때, 계수 계산부(24)는
(1) 기본 주파수와 부의 상관관계에 있는 값≥th2의 경우, 즉, 주기가 길다고 판단된 경우에는, 계수 테이블 t2의 각 계수 wt2(i)를 계수 wO(i)로서 선택하고,
(2) th2>기본 주파수와 부의 상관관계에 있는 값≥th1의 경우, 즉, 주기가 중간 정도라고 판단된 경우에는, 계수 테이블 t0의 각 계수 wt0(i)와 계수 테이블 t2의 각 계수 wt2(i)를 사용하여, wO(i)=(1-β)×wt0(i)+β×wt2(i)에 의해 계수 wO(i)를 결정하고,
(3) th1>기본 주파수와 부의 상관관계에 있는 값의 경우, 즉, 주기가 작다고 판단된 경우에는, 계수 테이블 t0의 각 계수 wt0(i)를 계수 wO(i)로서 선택한다. 여기서 β는 0≤β≤1이며, 또한 주기 T가 작은 값을 취할 때는 β의 값도 작아지고, 주기 T가 큰 값을 취할 때에 β의 값도 커지는 함수 β=b(T)에 의해, 주기 T로부터 구하는 값이다. 이 구성으로 하면, 주기가 중간 정도인 경우 중 주기 T가 작을 때에는 wt0(i)에 가까운 값을 계수 wO(i)로 할 수 있고, 반대로 주기가 중간 정도인 경우 중 주기 T가 클 때에는 wt2(i)에 가까운 값을 계수 wO(i)로 할 수 있으므로, 2개의 테이블만으로 3개 이상의 계수 wO(i)를 얻을 수 있다.
또한, 계수 테이블 기억부(25)에 기억되어 있는 계수 테이블 t0, t2의 i=0의 계수 wt0(0), wt2(0)에 대해서는, wt0(0)≤wt2(0)의 관계를 만족하고 있는 것은 필수가 아니며, wt0(0)>wt2(0)의 관계에 있는 값이어도 된다.
[제1 실시형태 내지 제3 실시형태에 공통의 변형예]
도 10 및 도 11에 나타내는 바와 같이, 상기 서술한 모든 실시형태 및 변형예에 있어서, 계수 승산부(22)를 포함하지 않고, 예측 계수 계산부(23)에 있어서 계수 wO(i)와 자기상관 RO(i)을 사용하여 선형 예측 분석을 행해도 된다. 도 10과 도 11은 각각 도 1과 도 5에 대응하는 선형 예측 분석 장치(2)의 구성예이다. 이 경우는 예측 계수 계산부(23)는 도 12에 나타내는 바와 같이 계수 wO(i)와 자기상관 RO(i)이 승산된 것인 변형 자기상관 R'O(i)이 아니고, 계수 wO(i)와 자기상관 RO(i)을 직접 사용하여 선형 예측 분석을 행한다(스텝 S5).
[제4 실시형태]
제4 실시형태는 입력 신호 XO(n)에 대하여 종래의 선형 예측 분석 장치를 사용하여 선형 예측 분석을 행하고, 그 선형 예측 분석의 결과를 사용하여 기본 주파수 계산부에서 기본 주파수를 얻고, 얻어진 기본 주파수에 기초하는 계수 wO(i)를 사용하여 본 발명의 선형 예측 분석 장치에 의해 선형 예측 계수로 변환 가능한 계수를 구하는 것이다.
제4 실시형태의 선형 예측 분석 장치(3)는 예를 들면 도 13에 나타내는 바와 같이 제1선형 예측 분석부(31), 선형 예측 잔차 계산부(32), 기본 주파수 계산부(33), 제2 선형 예측 분석부(34)를 구비하고 있다.
[제1선형 예측 분석부(31)]
제1선형 예측 분석부(31)는 종래의 선형 예측 분석 장치(1)와 동일한 동작을 한다. 즉, 제1선형 예측 분석부(31)는 입력 신호 XO(n)로부터 자기상관 RO(i)(i=0,1,…,Pmax)을 구하고, 자기상관 RO(i)(i=0,1,…,Pmax)과 미리 정한 계수 wO(i)(i=0,1,…,Pmax)를 동일한 i마다 곱합으로써 변형 자기상관 R'O(i)(i=0,1,…,Pmax)을 구하고, 변형 자기상관 R'O(i)(i=0,1,…,Pmax)으로부터 1차로부터 미리 정한 최대 차수인 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구한다.
[선형 예측 잔차 계산부(32)]
선형 예측 잔차 계산부(32)는 입력 신호 XO(n)에 대하여 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수에 기초하는 선형 예측이나 선형 예측과 등가인 또는 유사한 필터링 처리를 행하여 선형 예측 잔차 신호 XR(n)를 구한다. 필터링 처리는 가중 처리라고도 할 수 있으므로, 선형 예측 잔차 신호 XR(n)는 가중 입력 신호라고도 할 수 있다.
[기본 주파수 계산부(33)]
기본 주파수 계산부(33)는 선형 예측 잔차 신호 XR(n)의 기본 주파수 P를 구하고, 기본 주파수에 대한 정보를 출력한다. 기본 주파수를 구하는 방법으로서는 다양한 공지의 방법이 존재하므로, 공지의 어느 방법을 사용해도 된다. 기본 주파수 계산부(33)는 예를 들면 현 프레임의 선형 예측 잔차 신호 XR(n)(n=0,1,…,N-1)를 구성하는 복수개의 서브프레임의 각각에 대해서 기본 주파수를 구한다. 즉, 2 이상의 정수인 M개의 서브프레임인 XRs1(n)(n=0,1,…,N/M-1),…,XRsM(n)(n=(M-1)N/M, (M-1)N/M+1,…,N-1)의 각각의 기본 주파수인 Ps1,…,PsM을 구한다. N은 M으로 나누어 떨어지는 것으로 한다. 기본 주파수 계산부(33)는 다음에 현 프레임을 구성하는 M개의 서브프레임의 기본 주파수인 Ps1,…,PsM 중 최대값 max(Ps1,…,PsM)을 특정 가능한 정보를 기본 주파수에 대한 정보로서 출력한다.
[제2 선형 예측 분석부(34)]
제2 선형 예측 분석부(34)는 제1 실시형태 내지 제3 실시형태의 선형 예측 분석 장치(2), 제2 실시형태의 제2 변형예의 선형 예측 분석 장치(2), 제3 실시형태의 변형예의 선형 예측 분석 장치(2), 제1 실시형태 내지 제3 실시형태에 공통인 변형예의 선형 예측 분석 장치(2)의 어느 하나와 동일한 동작을 한다. 즉, 제2 선형 예측 분석부(34)는 입력 신호 XO(n)로부터 자기상관 RO(i)(i=0,1,…,Pmax)을 구하고, 기본 주파수 계산부(33)가 출력한 기본 주파수에 대한 정보에 기초하여 계수 wO(i)(i=0,1,…,Pmax)를 결정하고, 자기상관 RO(i)(i=0,1,…,Pmax)과 결정한 계수 wO(i)(i=0,1,…,Pmax)를 사용하여 1차로부터 미리 정한 최대 차수인 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구한다.
<제4 실시형태의 변형예>
제4 실시형태의 변형예는 입력 신호 XO(n)에 대하여 종래의 선형 예측 분석 장치를 사용하여 선형 예측 분석을 행하고, 그 선형 예측 분석의 결과를 사용하여 주기 계산부에서 주기를 얻고, 얻어진 주기에 기초하는 계수 wO(i)를 사용하여 본 발명의 선형 예측 분석 장치에 의해 선형 예측 계수로 변환 가능한 계수를 구하는 것이다.
제4 실시형태의 변형예의 선형 예측 분석 장치(3)는 예를 들면 도 14에 나타내는 바와 같이 제1선형 예측 분석부(31), 선형 예측 잔차 계산부(32), 주기 계산부(35), 제2 선형 예측 분석부(34)를 구비하고 있다. 제4 실시형태의 변형예의 선형 예측 분석 장치(3)의 제1선형 예측 분석부(31)와 선형 예측 잔차 계산부(32)는 각각 제4 실시형태의 선형 예측 분석 장치(3)와 마찬가지이다. 이하, 제4 실시형태와 상이한 부분을 중심으로 설명한다.
[주기 계산부(35)]
주기 계산부(35)는 선형 예측 잔차 신호 XR(n)의 주기 T를 구하고, 주기에 대한 정보를 출력한다. 주기를 구하는 방법으로서는 다양한 공지의 방법이 존재하므로, 공지의 어느 방법을 사용해도 된다. 주기 계산부(35)는 예를 들면 현 프레임의 선형 예측 잔차 신호 XR(n)(n=0,1,…,N-1)를 구성하는 복수개의 서브프레임의 각각에 대해서 주기를 구한다. 즉, 2 이상의 정수인 M개의 서브프레임인 XRs1(n)(n=0,1,…,N/M-1),…,XRsM(n)(n=(M-1)N/M, (M-1)N/M+1,…,N-1)의 각각의 주기인 Ts1,…,TsM을 구한다. N은 M으로 나누어 떨어지는 것으로 한다. 주기 계산부(35)는 다음에 현 프레임을 구성하는 M개의 서브프레임의 주기인 Ts1,…,TsM 중 최소값 min(Ts1…,TsM)을 특정 가능한 정보를 주기에 대한 정보로서 출력한다.
[변형예의 제2 선형 예측 분석부(34)]
제4 실시형태의 변형예의 제2 선형 예측 분석부(34)는 제1 실시형태의 변형예의 선형 예측 분석 장치(2), 제2 실시형태의 제1 변형예의 선형 예측 분석 장치(2), 제2 실시형태의 제3 변형예의 선형 예측 분석 장치(2), 제3 실시형태의 선형 예측 분석 장치(2), 제3 실시형태의 변형예의 선형 예측 분석 장치(2), 제1 실시형태 내지 제3 실시형태에 공통인 변형예의 선형 예측 분석 장치(2)의 어느 하나와 동일한 동작을 한다. 즉, 제2 선형 예측 분석부(34)는 입력 신호 XO(n)로부터 자기상관 RO(i)(i=0,1,…,Pmax)을 구하고, 주기 계산부(35)가 출력한 주기에 대한 정보에 기초하여 계수 wO(i)(i=0,1,…,Pmax)를 결정하고, 자기상관 RO(i)(i=0,1,…,Pmax)과 결정한 계수 wO(i)(i=0,1,…,Pmax)를 사용하여 1차로부터 미리 정한 최대 차수인 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구한다.
<기본 주파수와 정의 상관관계에 있는 값에 대해서>
제1 실시형태에 있어서 기본 주파수 계산부(930)의 구체예 2로서 설명한 바와 같이 기본 주파수와 정의 상관관계에 있는 값으로서, 앞의 프레임의 신호 처리에 있어서 Look-ahead라고도 불리는 미리보기하여 이용하는 샘플 부분 중 현 프레임의 샘플에 대응하는 부분의 기본 주파수를 사용해도 된다.
또, 기본 주파수와 정의 상관관계에 있는 값으로서, 기본 주파수의 추정값을 사용해도 된다. 예를 들면, 과거의 복수 프레임의 기본 주파수로부터 예측되는 현재의 프레임에 대한 기본 주파수의 추정값이나, 과거의 복수 프레임에 대한 기본 주파수의 평균값이나 최소값이나 최대값을 기본 주파수의 추정값으로서 사용해도 된다. 또, 복수 서브프레임에 대한 기본 주파수의 평균값이나 최소값이나 최대값을 기본 주파수의 추정값으로서 사용해도 된다.
또, 기본 주파수와 정의 상관관계에 있는 값으로서, 기본 주파수의 양자화값을 사용해도 된다. 즉, 양자화 전의 기본 주파수를 사용해도 되고, 양자화 후의 기본 주파수를 사용해도 된다.
또한, 기본 주파수와 정의 상관관계에 있는 값으로서, 스테레오 등의 복수 채널의 경우에는 어느 하나의 분석이 완료된 채널에 대한 기본 주파수를 사용해도 된다.
<기본 주파수와 부의 상관관계에 있는 값에 대해서>
제1 실시형태에 있어서 주기 계산부(940)의 구체예 2로서 설명한 바와 같이, 기본 주파수와 부의 상관관계에 있는 값으로서, 앞의 프레임의 신호 처리에 있어서 Look-ahead라고도 불리는 미리보기하여 이용하는 샘플 부분 중 현 프레임의 샘플에 대응하는 부분의 주기를 사용해도 된다.
또, 기본 주파수와 부의 상관관계에 있는 값으로서, 주기의 추정값을 사용해도 된다. 예를 들면, 과거의 복수 프레임의 기본 주파수로부터 예측되는 현재의 프레임에 대한 주기의 추정값이나, 과거의 복수 프레임에 대한 주기의 평균값이나 최소값이나 최대값을 주기의 추정값으로서 사용해도 된다. 또, 복수 서브프레임에 대한 주기의 평균값이나 최소값이나 최대값을 주기의 추정값으로서 사용해도 된다. 혹은 과거의 복수 프레임의 기본 주파수 및 Look-ahead라고도 불리는 미리보기하여 이용하는 샘플 부분 중 현 프레임의 샘플에 대응하는 부분에 의해 예측되는 현 프레임에 대한 주기의 추정값을 사용해도 되고, 마찬가지로 과거의 복수 프레임의 기본 주파수 및 Look-ahead라고도 불리는 미리보기하여 이용하는 샘플 부분 중 현 프레임의 샘플에 대응하는 부분에 대한 평균값이나 최소값이나 최대값을 추정값으로서 사용해도 된다.
또, 기본 주파수와 부의 상관관계에 있는 값으로서, 주기의 양자화값을 사용해도 된다. 즉, 양자화 전의 주기를 사용해도 되고, 양자화 후의 주기를 사용해도 된다.
또한, 기본 주파수와 부의 상관관계에 있는 값으로서, 스테레오 등의 복수 채널의 경우에는 어느 하나의 분석이 완료된 채널에 대한 주기를 사용해도 된다.
또한, 상기한 각 실시형태 및 각 변형예의 기본 주파수와 정의 상관관계에 있는 값이나 기본 주파수와 부의 상관관계에 있는 값과 역치와의 비교에 있어서는, 기본 주파수와 정의 상관관계에 있는 값이나 기본 주파수와 부의 상관관계에 있는 값이 역치와 동일한 값인 경우에는, 역치를 경계로 하여 인접하는 2개의 경우의 어느 일방 경우로 나뉘도록 설정하면 된다. 즉, 어떠한 역치 이상의 경우로 되어 있는 곳을 당해 역치보다 큰 경우로 함과 아울러, 당해 역치보다 작은 경우로 되어 있는 곳을 당해 역치 이하의 경우로 해도 된다. 또, 어떠한 역치보다 큰 경우로 되어 있는 곳을 당해 역치 이상의 경우로 함과 아울러, 당해 역치 이하의 경우로 되어 있는 곳을 당해 역치보다 작은 경우로 해도 된다.
상기 장치 및 방법에 있어서 설명한 처리는 기재된 순서에 따라 시계열로 실행될 뿐만아니라 처리를 실행하는 장치의 처리 능력 또는 필요에 따라서 병렬적으로 또는 개별로 실행되어도 된다.
또, 선형 예측 분석 방법에 있어서의 각 스텝을 컴퓨터에 의해 실현하는 경우, 선형 예측 분석 방법이 가져야 할 기능의 처리 내용은 프로그램에 의해 기술된다. 그리고, 이 프로그램을 컴퓨터로 실행함으로써, 그 각 스텝이 컴퓨터 상에서 실현된다.
이 처리 내용을 기술한 프로그램은 컴퓨터로 판독 가능한 기록 매체에 기록해 둘 수 있다. 컴퓨터로 판독 가능한 기록 매체로서는 예를 들면 자기 기록 장치, 광디스크, 광자기 기록 매체, 반도체 메모리 등 어떠한 기록 매체이어도 된다.
또, 각 처리 수단은 컴퓨터 상에서 소정의 프로그램을 실행시킴으로써 구성하는 것으로 해도 되고, 이들 처리 내용의 적어도 일부를 하드웨어적으로 실현하는 것으로 해도 된다.
그 밖에 본 발명의 취지를 일탈하지 않는 범위에서 적당히 변경이 가능한 것은 말할 필요도 없다.
1: 종래의 선형 예측 분석 장치
2: 제1 실시형태의 선형 예측 분석 장치
3: 제4 실시형태의 선형 예측 분석 장치
21: 자기상관 계산부 22: 계수 승산부
23: 예측 계수 계산부 24: 계수 결정부
25: 계수 테이블 기억부 31: 제1선형 예측 분석부
32: 선형 예측 잔차 계산부 33: 기본 주파수 계산부
34: 제2 선형 예측 분석부 35: 주기 계산부
900: 주기성 분석부 930: 기본 주파수 계산부
940: 주기 계산부
2: 제1 실시형태의 선형 예측 분석 장치
3: 제4 실시형태의 선형 예측 분석 장치
21: 자기상관 계산부 22: 계수 승산부
23: 예측 계수 계산부 24: 계수 결정부
25: 계수 테이블 기억부 31: 제1선형 예측 분석부
32: 선형 예측 잔차 계산부 33: 기본 주파수 계산부
34: 제2 선형 예측 분석부 35: 주기 계산부
900: 주기성 분석부 930: 기본 주파수 계산부
940: 주기 계산부
Claims (10)
- 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 사전 결정된 시간 구간인 프레임마다 구하는 선형 예측 분석 방법으로서,
적어도 i=0,1,…,Pmax의 어느 하나에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산 스텝과,
i=0,1,…,Pmax의 각 차수 i와 상기 각 차수 i에 대응하는 계수 wO(i)가 대응지어져 기억되어 있는 2개 이상의 계수 테이블이 기억되어 있고, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 주기, 또는 주기의 양자화값, 또는 주기의 추정값을 사용하여 상기 2개 이상의 계수 테이블 중의 1개의 계수 테이블로부터 계수 wO(i)를 취득하는 계수 결정 스텝과,
취득된 상기 계수 wO(i)와 상기 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산 스텝을 포함하고,
상기 2개 이상의 계수 테이블 중의 상기 주기, 또는 주기의 양자화값, 또는 주기의 추정값이 소정의 값인 제1값인 경우에 상기 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제1 계수 테이블로 하고,
상기 2개 이상의 계수 테이블 중의 상기 주기, 또는 주기의 양자화값, 또는 주기의 추정값이 상기 제1값보다 큰 값인 제2값인 경우에 상기 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제2 계수 테이블로 하여,
적어도 일부의 차수에 대해서, 각 차수 i에 대하여, 상기 제2 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수는 상기 제1 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수보다 큰 것을 특징으로 하는 선형 예측 분석 방법. - 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 사전 결정된 시간 구간인 프레임마다 구하는 선형 예측 분석 방법으로서,
적어도 i=0,1,…,Pmax의 어느 하나에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산 스텝과,
i=0,1,…,Pmax의 각 차수 i와 상기 각 차수 i에 대응하는 계수 wO(i)가 대응지어져 기억되어 있는 2개 이상의 계수 테이블이 기억되어 있고, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 기본 주파수와 부의 상관관계에 있는 값을 사용하여 상기 2개 이상의 계수 테이블 중의 1개의 계수 테이블로부터 계수 wO(i)를 취득하는 계수 결정 스텝과,
취득된 상기 계수 wO(i)와 상기 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산 스텝을 포함하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수와 부의 상관관계에 있는 값이 소정의 값인 제1값인 경우에 상기 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제1 계수 테이블로 하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수와 부의 상관관계에 있는 값이 상기 제1값보다 큰 값인 제2값인 경우에 상기 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제2 계수 테이블로 하여,
적어도 일부의 차수에 대해서, 각 차수 i에 대하여, 상기 제2 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수는 상기 제1 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수보다 큰 것을 특징으로 하는 선형 예측 분석 방법. - 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 사전 결정된 시간 구간인 프레임마다 구하는 선형 예측 분석 방법으로서,
적어도 i=0,1,…,Pmax의 어느 하나에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산 스텝과,
i=0,1,…,Pmax의 각 차수 i와 상기 각 차수 i에 대응하는 계수 wO(i)가 대응지어져 기억되어 있는 2개 이상의 계수 테이블이 기억되어 있고, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 기본 주파수와 정의 상관관계에 있는 값을 사용하여 상기 2개 이상의 계수 테이블 중의 1개의 계수 테이블로부터 계수 wO(i)를 취득하는 계수 결정 스텝과,
취득된 계수 wO(i)와 상기 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산 스텝을 포함하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수와 정의 상관관계에 있는 값이 소정의 값인 제1값인 경우에 상기 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제1 계수 테이블로 하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수와 정의 상관관계에 있는 값이 상기 제1값보다 작은 값인 제2값인 경우에 상기 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제2 계수 테이블로 하여,
적어도 일부의 차수에 대해서, 각 차수 i에 대하여, 상기 제2 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수는 상기 제1 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수보다 큰 것을 특징으로 하는 선형 예측 분석 방법. - 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 사전 결정된 시간 구간인 프레임마다 구하는 선형 예측 분석 방법으로서,
적어도 i=0,1,…,Pmax의 어느 하나에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산 스텝과,
i=0,1,…,Pmax의 각 차수 i와 상기 각 차수 i에 대응하는 계수 wO(i)가 대응지어져 기억되어 있는 2개 이상의 계수 테이블이 기억되어 있고, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 기본 주파수를 사용하여 상기 2개 이상의 계수 테이블 중의 1개의 계수 테이블로부터 계수 wO(i)를 취득하는 계수 결정 스텝과,
취득된 계수 wO(i)와 상기 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산 스텝을 포함하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수가 소정의 값인 제1값인 경우에 상기 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제1 계수 테이블로 하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수가 상기 제1값보다 작은 값인 제2값인 경우에 상기 계수 결정 스텝에서 계수 wO(i)가 취득되는 계수 테이블을 제2 계수 테이블로 하여,
적어도 일부의 차수에 대해서, 각 차수 i에 대하여, 상기 제2 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수는 상기 제1 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수보다 큰 것을 특징으로 하는 선형 예측 분석 방법. - 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 사전 결정된 시간 구간인 프레임마다 구하는 선형 예측 분석 장치로서,
적어도 i=0,1,…,Pmax의 어느 하나에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산부와,
i=0,1,…,Pmax의 각 차수 i와 상기 각 차수 i에 대응하는 계수 wO(i)가 대응지어져 기억되어 있는 2개 이상의 계수 테이블이 기억되어 있고, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 주기, 또는 주기의 양자화값, 또는 주기의 추정값을 사용하여 상기 2개 이상의 계수 테이블 중의 1개의 계수 테이블로부터 계수 wO(i)를 취득하는 계수 결정부와,
취득된 상기 계수 wO(i)와 상기 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산부를 포함하고,
상기 2개 이상의 계수 테이블 중의 상기 주기, 또는 주기의 양자화값, 또는 주기의 추정값이 소정의 값인 제1값인 경우에 상기 계수 결정부에서 계수 wO(i)가 취득되는 계수 테이블을 제1 계수 테이블로 하고,
상기 2개 이상의 계수 테이블 중의 상기 주기, 또는 주기의 양자화값, 또는 주기의 추정값이 상기 제1값보다 큰 값인 제2값인 경우에 상기 계수 결정부에서 계수 wO(i)가 취득되는 계수 테이블을 제2 계수 테이블로 하여,
적어도 일부의 차수에 대해서, 각 차수 i에 대하여, 상기 제2 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수는 상기 제1 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수보다 큰 것을 특징으로 하는 선형 예측 분석 장치. - 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 사전 결정된 시간 구간인 프레임마다 구하는 선형 예측 분석 장치로서,
적어도 i=0,1,…,Pmax의 어느 하나에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산부와,
i=0,1,…,Pmax의 각 차수 i와 상기 각 차수 i에 대응하는 계수 wO(i)가 대응지어져 기억되어 있는 2개 이상의 계수 테이블이 기억되어 있고, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 기본 주파수와 부의 상관관계에 있는 값을 사용하여 상기 2개 이상의 계수 테이블 중의 1개의 계수 테이블로부터 계수 wO(i)를 취득하는 계수 결정부와,
취득된 상기 계수 wO(i)와 상기 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산부를 포함하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수와 부의 상관관계에 있는 값이 소정의 값인 제1값인 경우에 상기 계수 결정부에서 계수 wO(i)가 취득되는 계수 테이블을 제1 계수 테이블로 하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수와 부의 상관관계에 있는 값이 상기 제1값보다 큰 값인 제2값인 경우에 상기 계수 결정부에서 계수 wO(i)가 취득되는 계수 테이블을 제2 계수 테이블로 하여,
적어도 일부의 차수에 대해서, 각 차수 i에 대하여, 상기 제2 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수는 상기 제1 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수보다 큰 것을 특징으로 하는 선형 예측 분석 장치. - 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 사전 결정된 시간 구간인 프레임마다 구하는 선형 예측 분석 장치로서,
적어도 i=0,1,…,Pmax의 어느 하나에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산부와,
i=0,1,…,Pmax의 각 차수 i와 상기 각 차수 i에 대응하는 계수 wO(i)가 대응지어져 기억되어 있는 2개 이상의 계수 테이블이 기억되어 있고, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 기본 주파수와 정의 상관관계에 있는 값을 사용하여 상기 2개 이상의 계수 테이블 중의 1개의 계수 테이블로부터 계수 wO(i)를 취득하는 계수 결정부와,
취득된 상기 계수 wO(i)와 상기 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산부를 포함하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수와 정의 상관관계에 있는 값이 소정의 값인 제1값인 경우에 상기 계수 결정부에서 계수 wO(i)가 취득되는 계수 테이블을 제1 계수 테이블로 하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수와 정의 상관관계에 있는 값이 상기 제1값보다 작은 값인 제2값인 경우에 상기 계수 결정부에서 계수 wO(i)가 취득되는 계수 테이블을 제2 계수 테이블로 하여,
적어도 일부의 차수에 대해서, 각 차수 i에 대하여, 상기 제2 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수는 상기 제1 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수보다 큰 것을 특징으로 하는 선형 예측 분석 장치. - 입력 시계열 신호에 대응하는 선형 예측 계수로 변환 가능한 계수를 사전 결정된 시간 구간인 프레임마다 구하는 선형 예측 분석 장치로서,
적어도 i=0,1,…,Pmax의 어느 하나에 대해서, 현재의 프레임의 입력 시계열 신호 XO(n)와 i샘플만큼 과거의 입력 시계열 신호 XO(n-i) 또는 i샘플만큼 미래의 입력 시계열 신호 XO(n+i)의 자기상관 RO(i)을 계산하는 자기상관 계산부와,
i=0,1,…,Pmax의 각 차수 i와 상기 각 차수 i에 대응하는 계수 wO(i)가 대응지어져 기억되어 있는 2개 이상의 계수 테이블이 기억되어 있고, 현재 또는 과거의 프레임에 있어서의 입력 시계열 신호에 기초하는 기본 주파수를 사용하여 상기 2개 이상의 계수 테이블 중의 1개의 계수 테이블로부터 계수 wO(i)를 취득하는 계수 결정부와,
취득된 상기 계수 wO(i)와 상기 자기상관 RO(i)이 대응하는 i마다 승산된 것인 변형 자기상관 R'O(i)을 사용하여, 1차로부터 Pmax차까지의 선형 예측 계수로 변환 가능한 계수를 구하는 예측 계수 계산부를 포함하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수가 소정의 값인 제1값인 경우에 상기 계수 결정부에서 계수 wO(i)가 취득되는 계수 테이블을 제1 계수 테이블로 하고,
상기 2개 이상의 계수 테이블 중의 상기 기본 주파수가 상기 제1값보다 작은 값인 제2값인 경우에 상기 계수 결정부에서 계수 wO(i)가 취득되는 계수 테이블을 제2 계수 테이블로 하여,
적어도 일부의 차수에 대해서, 각 차수 i에 대하여, 상기 제2 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수는 상기 제1 계수 테이블에 있어서의 상기 각 차수 i에 대응하는 계수보다 큰 것을 특징으로 하는 선형 예측 분석 장치. - 제 1 항 내지 제 4 항 중 어느 한 항에 기재된 선형 예측 분석 방법의 각 스텝을 컴퓨터에 실행시키기 위하여 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램.
- 제 1 항 내지 제 4 항 중 어느 한 항에 기재된 선형 예측 분석 방법의 각 스텝을 컴퓨터에 실행시키기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013149160 | 2013-07-18 | ||
JPJP-P-2013-149160 | 2013-07-18 | ||
PCT/JP2014/068895 WO2015008783A1 (ja) | 2013-07-18 | 2014-07-16 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167001218A Division KR101797679B1 (ko) | 2013-07-18 | 2014-07-16 | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170126515A true KR20170126515A (ko) | 2017-11-17 |
KR101883767B1 KR101883767B1 (ko) | 2018-07-31 |
Family
ID=52346231
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167001218A KR101797679B1 (ko) | 2013-07-18 | 2014-07-16 | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 |
KR1020177032372A KR101883767B1 (ko) | 2013-07-18 | 2014-07-16 | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 |
KR1020177032374A KR101883789B1 (ko) | 2013-07-18 | 2014-07-16 | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167001218A KR101797679B1 (ko) | 2013-07-18 | 2014-07-16 | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177032374A KR101883789B1 (ko) | 2013-07-18 | 2014-07-16 | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 |
Country Status (9)
Country | Link |
---|---|
US (3) | US10909996B2 (ko) |
EP (3) | EP3012835B1 (ko) |
JP (1) | JP6117359B2 (ko) |
KR (3) | KR101797679B1 (ko) |
CN (6) | CN110070876B (ko) |
ES (3) | ES2749904T3 (ko) |
PL (3) | PL3012835T3 (ko) |
TR (1) | TR201815212T4 (ko) |
WO (1) | WO2015008783A1 (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110070876B (zh) * | 2013-07-18 | 2022-11-15 | 日本电信电话株式会社 | 线性预测分析装置、线性预测分析方法以及记录介质 |
ES2689120T3 (es) * | 2014-03-24 | 2018-11-08 | Nippon Telegraph And Telephone Corporation | Método de codificación, codificador, programa y soporte de registro |
US9721159B2 (en) * | 2015-10-05 | 2017-08-01 | Evan Donald Balster | Periodicity analysis system |
US11723579B2 (en) | 2017-09-19 | 2023-08-15 | Neuroenhancement Lab, LLC | Method and apparatus for neuroenhancement |
JP6904198B2 (ja) * | 2017-09-25 | 2021-07-14 | 富士通株式会社 | 音声処理プログラム、音声処理方法および音声処理装置 |
US11717686B2 (en) | 2017-12-04 | 2023-08-08 | Neuroenhancement Lab, LLC | Method and apparatus for neuroenhancement to facilitate learning and performance |
EP3731749A4 (en) | 2017-12-31 | 2022-07-27 | Neuroenhancement Lab, LLC | NEURO-ACTIVATION SYSTEM AND METHOD FOR ENHANCING EMOTIONAL RESPONSE |
US11364361B2 (en) | 2018-04-20 | 2022-06-21 | Neuroenhancement Lab, LLC | System and method for inducing sleep by transplanting mental states |
US11452839B2 (en) | 2018-09-14 | 2022-09-27 | Neuroenhancement Lab, LLC | System and method of improving sleep |
US11786694B2 (en) | 2019-05-24 | 2023-10-17 | NeuroLight, Inc. | Device, method, and app for facilitating sleep |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100169086A1 (en) * | 2008-12-30 | 2010-07-01 | Fengyan Qi | Signal compression method and apparatus |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5550859A (en) * | 1994-04-29 | 1996-08-27 | Lucent Technologies Inc. | Recovering analog and digital signals from superimposed analog and digital signals using linear prediction |
JP3402748B2 (ja) * | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
US5774846A (en) * | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
US5648989A (en) * | 1994-12-21 | 1997-07-15 | Paradyne Corporation | Linear prediction filter coefficient quantizer and filter set |
JP3522012B2 (ja) * | 1995-08-23 | 2004-04-26 | 沖電気工業株式会社 | コード励振線形予測符号化装置 |
TW321810B (ko) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
EP0992981B1 (en) * | 1996-11-07 | 2001-11-28 | Matsushita Electric Industrial Co., Ltd | Excitation Method Generator and Excitation Vector Generating Method |
FI113903B (fi) * | 1997-05-07 | 2004-06-30 | Nokia Corp | Puheen koodaus |
EP1959434B1 (en) * | 1999-08-23 | 2013-03-06 | Panasonic Corporation | Speech encoder |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
EP1484841B1 (en) * | 2002-03-08 | 2018-12-26 | Nippon Telegraph And Telephone Corporation | DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
RU2006137841A (ru) * | 2004-04-27 | 2008-05-10 | Мацусита Электрик Индастриал Ко., Лтд. (Jp) | Устройство масштабируемого кодирования, устройство масштабируемого декодирования и способ для этого |
EP2200023B8 (en) * | 2004-08-19 | 2015-02-25 | Nippon Telegraph and Telephone Corporation | Multichannel signal coding method and apparatus and program for the methods, and recording medium having program stored thereon. |
CN101006495A (zh) * | 2004-08-31 | 2007-07-25 | 松下电器产业株式会社 | 语音编码装置、语音解码装置、通信装置以及语音编码方法 |
CN102103860B (zh) * | 2004-09-17 | 2013-05-08 | 松下电器产业株式会社 | 频谱包络信息量化装置及方法、频谱包络信息解码装置及方法 |
EP1837997B1 (en) * | 2005-01-12 | 2011-03-16 | Nippon Telegraph And Telephone Corporation | Long-term prediction encoding method, long-term prediction decoding method, devices thereof, program thereof, and recording medium |
JP4675692B2 (ja) * | 2005-06-22 | 2011-04-27 | 富士通株式会社 | 話速変換装置 |
JP4736632B2 (ja) * | 2005-08-31 | 2011-07-27 | 株式会社国際電気通信基礎技術研究所 | ボーカル・フライ検出装置及びコンピュータプログラム |
CN1815552B (zh) * | 2006-02-28 | 2010-05-12 | 安徽中科大讯飞信息科技有限公司 | 基于线谱频率及其阶间差分参数的频谱建模与语音增强方法 |
EP2030199B1 (en) * | 2006-05-30 | 2009-10-28 | Koninklijke Philips Electronics N.V. | Linear predictive coding of an audio signal |
JP4757130B2 (ja) * | 2006-07-20 | 2011-08-24 | 富士通株式会社 | ピッチ変換方法及び装置 |
CN101154381B (zh) * | 2006-09-30 | 2011-03-30 | 华为技术有限公司 | 一种获取线性预测滤波器系数的装置 |
WO2008151408A1 (en) * | 2007-06-14 | 2008-12-18 | Voiceage Corporation | Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711 |
WO2009075326A1 (ja) * | 2007-12-11 | 2009-06-18 | Nippon Telegraph And Telephone Corporation | 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体 |
JP4918074B2 (ja) * | 2008-08-18 | 2012-04-18 | 日本電信電話株式会社 | 符号化装置、符号化方法、符号化プログラム、及び記録媒体 |
CN101983402B (zh) * | 2008-09-16 | 2012-06-27 | 松下电器产业株式会社 | 声音分析装置、方法、系统、合成装置、及校正规则信息生成装置、方法 |
CN102067211B (zh) * | 2009-03-11 | 2013-04-17 | 华为技术有限公司 | 一种线性预测分析方法、装置及系统 |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CN102044250B (zh) * | 2009-10-23 | 2012-06-27 | 华为技术有限公司 | 频带扩展方法及装置 |
US9378745B2 (en) * | 2010-04-09 | 2016-06-28 | Dolby International Ab | MDCT-based complex prediction stereo coding |
JP5612698B2 (ja) * | 2010-10-05 | 2014-10-22 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
JP5663461B2 (ja) * | 2011-12-06 | 2015-02-04 | 日本電信電話株式会社 | 符号化方法、符号化装置、プログラム、記録媒体 |
CN102693147B (zh) * | 2012-06-13 | 2015-10-28 | 上海第二工业大学 | 计算机汇编语言的辅助分析装置及分析方法 |
CN102867516B (zh) * | 2012-09-10 | 2014-08-27 | 大连理工大学 | 一种采用高阶线性预测系数分组矢量量化的语音编解方法 |
CN110070876B (zh) * | 2013-07-18 | 2022-11-15 | 日本电信电话株式会社 | 线性预测分析装置、线性预测分析方法以及记录介质 |
EP3098812B1 (en) * | 2014-01-24 | 2018-10-10 | Nippon Telegraph and Telephone Corporation | Linear predictive analysis apparatus, method, program and recording medium |
EP3462448B1 (en) * | 2014-01-24 | 2020-04-22 | Nippon Telegraph and Telephone Corporation | Linear predictive analysis apparatus, method, program and recording medium |
-
2014
- 2014-07-16 CN CN201811547970.8A patent/CN110070876B/zh active Active
- 2014-07-16 EP EP14826090.4A patent/EP3012835B1/en active Active
- 2014-07-16 CN CN201480040536.4A patent/CN105378836B/zh active Active
- 2014-07-16 EP EP18173638.0A patent/EP3399522B1/en active Active
- 2014-07-16 CN CN201811547577.9A patent/CN109979471B/zh active Active
- 2014-07-16 JP JP2015527315A patent/JP6117359B2/ja active Active
- 2014-07-16 KR KR1020167001218A patent/KR101797679B1/ko active IP Right Grant
- 2014-07-16 ES ES18173641T patent/ES2749904T3/es active Active
- 2014-07-16 KR KR1020177032372A patent/KR101883767B1/ko active IP Right Grant
- 2014-07-16 WO PCT/JP2014/068895 patent/WO2015008783A1/ja active Application Filing
- 2014-07-16 CN CN201811547969.5A patent/CN110085243B/zh active Active
- 2014-07-16 ES ES14826090T patent/ES2699582T3/es active Active
- 2014-07-16 PL PL14826090T patent/PL3012835T3/pl unknown
- 2014-07-16 ES ES18173638T patent/ES2760934T3/es active Active
- 2014-07-16 PL PL18173638T patent/PL3399522T3/pl unknown
- 2014-07-16 TR TR2018/15212T patent/TR201815212T4/tr unknown
- 2014-07-16 KR KR1020177032374A patent/KR101883789B1/ko active IP Right Grant
- 2014-07-16 CN CN201811547968.0A patent/CN109887520B/zh active Active
- 2014-07-16 CN CN201811547976.5A patent/CN110070877B/zh active Active
- 2014-07-16 EP EP18173641.4A patent/EP3389047B1/en active Active
- 2014-07-16 US US14/905,158 patent/US10909996B2/en active Active
- 2014-07-16 PL PL18173641T patent/PL3389047T3/pl unknown
-
2020
- 2020-12-14 US US17/120,462 patent/US11532315B2/en active Active
-
2022
- 2022-10-21 US US17/970,879 patent/US11972768B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100169086A1 (en) * | 2008-12-30 | 2010-07-01 | Fengyan Qi | Signal compression method and apparatus |
US20130117030A1 (en) * | 2008-12-30 | 2013-05-09 | Huawei Technologies Co., Ltd. | Signal compression method and apparatus |
Non-Patent Citations (5)
Title |
---|
FRANK K. SOONG, et al. Line spectrum pair (LSP) and speech data compression. IEEE International Conference on Acoustics, Speech, and Signal Processing(ICASSP'84), 1984. pp.37-40. * |
ITU-T Recommendation G.718, ITU, 2008. |
ITU-T Recommendation G.729, ITU, 1996 |
ITU-T Recommendation G.729. Coding of Speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear-prediction (CS-ACELP). ITU-T. 1996.03. * |
Yoh'ichi Tohkura, Fumitada Itakura, Shin'ichiro Hashimoto, "Spectral Smoothing Technique in PARCOR Speech Analysis-Synthesis", IEEE Trans. on Acoustics, Speech, and Signal Processing, Vol. ASSP-26, No. 6, 1978 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101883767B1 (ko) | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 | |
JP6423065B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 | |
JP6416363B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |