WO2015111568A1 - 線形予測分析装置、方法、プログラム及び記録媒体 - Google Patents

線形予測分析装置、方法、プログラム及び記録媒体 Download PDF

Info

Publication number
WO2015111568A1
WO2015111568A1 PCT/JP2015/051351 JP2015051351W WO2015111568A1 WO 2015111568 A1 WO2015111568 A1 WO 2015111568A1 JP 2015051351 W JP2015051351 W JP 2015051351W WO 2015111568 A1 WO2015111568 A1 WO 2015111568A1
Authority
WO
WIPO (PCT)
Prior art keywords
coefficient
max
pitch gain
series signal
autocorrelation
Prior art date
Application number
PCT/JP2015/051351
Other languages
English (en)
French (fr)
Inventor
優 鎌本
守谷 健弘
登 原田
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201580005196.6A priority Critical patent/CN106415718B/zh
Priority to EP15740820.4A priority patent/EP3098812B1/en
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to PL18196340T priority patent/PL3441970T3/pl
Priority to ES15740820T priority patent/ES2703565T3/es
Priority to KR1020187003046A priority patent/KR101850523B1/ko
Priority to KR1020167019020A priority patent/KR101826219B1/ko
Priority to JP2015558849A priority patent/JP6250072B2/ja
Priority to CN201910634745.6A priority patent/CN110415714B/zh
Priority to CN201910634756.4A priority patent/CN110415715B/zh
Priority to EP18196340.6A priority patent/EP3441970B1/en
Priority to KR1020187003053A priority patent/KR101877397B1/ko
Priority to PL15740820T priority patent/PL3098812T3/pl
Priority to US15/112,534 priority patent/US9966083B2/en
Priority to EP18196351.3A priority patent/EP3462453B1/en
Priority to PL18196351T priority patent/PL3462453T3/pl
Publication of WO2015111568A1 publication Critical patent/WO2015111568A1/ja
Priority to US15/924,887 priority patent/US10163450B2/en
Priority to US15/924,963 priority patent/US10170130B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Definitions

  • the present invention relates to a technique for analyzing a digital time series signal such as a voice signal, an acoustic signal, an electrocardiogram, an electroencephalogram, a magnetoencephalogram, and a seismic wave.
  • a digital time series signal such as a voice signal, an acoustic signal, an electrocardiogram, an electroencephalogram, a magnetoencephalogram, and a seismic wave.
  • Non-Patent Documents 1 and 2). reference. a method of encoding based on a prediction coefficient obtained by linear predictive analysis of an input audio signal or acoustic signal is widely used (for example, Non-Patent Documents 1 and 2). reference.).
  • Non-Patent Documents 1 to 3 the prediction coefficient is calculated by the linear prediction analyzer illustrated in FIG.
  • the linear prediction analysis apparatus 1 includes an autocorrelation calculation unit 11, a coefficient multiplication unit 12, and a prediction coefficient calculation unit 13.
  • the input signal which is a digital audio signal or digital audio signal in the time domain, is processed every N sample frames.
  • n represents the sample number of each sample in the input signal, and N is a predetermined positive integer.
  • P max is a predetermined positive integer less than N.
  • the prediction coefficient calculation unit 13 uses the modified autocorrelation R ′ O (i) output from the coefficient multiplication unit 12, for example, the P max order which is a predetermined prediction order from the first order by the Levinson-Durbin method or the like.
  • the coefficient which can be converted into the linear prediction coefficient up to is obtained.
  • Coefficients that can be converted into linear prediction coefficients include PARCOR coefficients K O (1), K O (2), ..., K O (P max ) and linear prediction coefficients a O (1), a O (2), ... , a O (P max ), etc.
  • f s is the sampling frequency.
  • Non-Patent Document 3 describes an example in which a coefficient based on a function other than the above-described exponential function is used.
  • the function used here is a function based on a sampling period ⁇ (corresponding to a period corresponding to f s ) and a predetermined constant a, and a fixed coefficient is also used.
  • a modified autocorrelation R ′ O obtained by multiplying the autocorrelation R O (i) by a fixed coefficient w O (i). i) was used to find the coefficients that can be converted into linear prediction coefficients. Therefore, it is not necessary to modify the autocorrelation R O (i) by the multiplication of the coefficient w O (i), that is, the autocorrelation R O (i) itself is not the modified autocorrelation R ′ O (i).
  • the input signal is such that the peak of the spectrum does not become too large in the spectral envelope corresponding to the coefficient that can be converted to the linear prediction coefficient.
  • the spectral envelope corresponding to the coefficient that can be converted into the linear prediction coefficient obtained by the modified autocorrelation R ′ O (i) is expressed by the input signal X O (n ) May be reduced in accuracy, that is, the accuracy of linear prediction analysis may be reduced.
  • An object of the present invention is to provide a linear predictive analysis method, apparatus, program, and recording medium with higher analysis accuracy than in the past.
  • a coefficient table in which the coefficient w O (i) (i 0, 1,..., P max ) is acquired in the coefficient determination step when the value positively correlated with the pitch gain is the first value.
  • the coefficient is determined in the coefficient determination step when a value that is positively correlated with the strength of periodicity or pitch gain in two or more coefficient tables is a second value that is smaller than the first value.
  • the coefficient table from which the coefficient is acquired in is the coefficient table t0, and the periodicity strength or pitch gain is medium
  • the coefficient table in which the coefficient is acquired in the coefficient determination step is a coefficient table t1
  • the coefficient table in which the coefficient is acquired in the coefficient determination step when the strength of the periodicity or the pitch gain is small is at least a part of the coefficient table t2.
  • the flowchart for demonstrating the example of a linear prediction analysis method The flowchart for demonstrating the example of the linear prediction analysis method of 2nd embodiment.
  • the block diagram for demonstrating the example of the linear prediction apparatus of 3rd embodiment The flowchart for demonstrating the example of the linear prediction analysis method of 3rd embodiment.
  • the block diagram for demonstrating the example of the linear prediction analyzer of 4th embodiment The block diagram for demonstrating the example of the conventional linear prediction apparatus.
  • the linear prediction analysis apparatus 2 includes, for example, an autocorrelation calculation unit 21, a coefficient determination unit 24, a coefficient multiplication unit 22, and a prediction coefficient calculation unit 23.
  • the operations of the autocorrelation calculation unit 21, the coefficient multiplication unit 22, and the prediction coefficient calculation unit 23 are the same as the operations in the autocorrelation calculation unit 11, the coefficient multiplication unit 12, and the prediction coefficient calculation unit 13 of the conventional linear prediction analysis apparatus 1, respectively. is there.
  • the linear predictive analyzer 2 receives an input signal X O (n) which is a digital signal such as a digital speech signal, a digital acoustic signal, an electrocardiogram, an electroencephalogram, a magnetoencephalogram, a seismic wave, etc. Entered.
  • the input signal is an input time series signal.
  • the input signal X O (n) (n N, N + 1,..., 2N ⁇ 1).
  • the input signal X O (n) may be the collected signal itself, or a signal whose sampling rate is converted for analysis, It may be a pre-emphasis processed signal or a windowed signal.
  • the linear prediction analysis apparatus 2 also receives information about the pitch gain of the digital audio signal and digital acoustic signal for each frame. Information about the pitch gain is obtained by a pitch gain calculation unit 950 outside the linear prediction analyzer 2.
  • Pitch gain is the strength of the periodicity of the input signal for each frame.
  • the pitch gain is, for example, a normalized correlation between signals having a time difference corresponding to the pitch period of the input signal and its linear prediction residual signal.
  • the pitch gain G is obtained, and information that can specify the pitch gain G is output as information about the pitch gain. Since there are various known methods for obtaining the pitch gain, any known method may be used.
  • the obtained pitch gain G may be encoded to obtain a pitch gain code, and the pitch gain code may be output as information about the pitch gain. Further, the pitch gain quantization value ⁇ G corresponding to the pitch gain code may be obtained, and the pitch gain quantization value ⁇ G may be output as information about the pitch gain.
  • the pitch gain calculation unit 950 a specific example of the pitch gain calculation unit 950 will be described.
  • Pitch gain calculator 950, G s1 is the pitch gain of the M sub-frames constituting the current frame, ..., a maximum value max (G s1, ..., G sM) of the G sM information capable of identifying the Output as information about pitch gain.
  • Nn is a predetermined positive integer that satisfies the relationship Nn ⁇ N
  • the pitch gain calculation unit 950 obtains the signal interval of the previous frame and stores the pitch gain G next stored in the pitch gain calculation unit 950, that is, the current frame in the signal interval of the previous frame.
  • the pitch gain for each of a plurality of subframes may be obtained for the current frame.
  • FIG. 2 is a flowchart of a linear prediction analysis method performed by the linear prediction analysis apparatus 2.
  • the input signal X O (n) (n -Np, -Np + 1, ..., -1, 0,1, ..., N-1, N, ..., N-1 + Nn
  • the autocorrelation R O (i) may be calculated using part of the input signals of the previous and subsequent frames.
  • Np and Nn are predetermined positive integers that satisfy the relationship of Np ⁇ N and Nn ⁇ N, respectively.
  • the autocorrelation may be obtained from the approximated power spectrum by using the MDCT sequence as an approximation of the power spectrum. As described above, any known technique used in the world may be used as the autocorrelation calculation method.
  • the coefficient w O (i) is a coefficient for transforming the autocorrelation R O (i).
  • the coefficient w O (i) is also called a lag window w O (i) or a lag window coefficient w O (i) in the field of signal processing. Since the coefficient w O (i) is a positive value, the coefficient w O (i) is larger / smaller than the predetermined value, and the coefficient w O (i) is larger / smaller than the predetermined value. Sometimes expressed. Further, the size of w O (i), shall mean the value of the w O (i).
  • the information about the pitch gain input to the coefficient determination unit 24 is information for specifying the pitch gain obtained from all or part of the input signal of the current frame and / or the input signal of the frame near the current frame. That is, the pitch gain used for determining the coefficient w O (i) is a pitch gain obtained from all or part of the input signal of the current frame and / or the input signal of a frame near the current frame.
  • the coefficient determination unit 24 supports the information about the pitch gain in all or a part of the possible range of the pitch gain corresponding to the information about the pitch gain for all or some orders from the 0th order to the P max order. As the pitch gain to be increased, a smaller value is determined as the coefficient w O (0), w O (1),..., W O (P max ). Further, the coefficient determination unit 24 uses a value having a positive correlation with the pitch gain instead of the pitch gain, and reduces the coefficient w O (0), w O (1),. It may be determined as w O (P max ).
  • the magnitude of the coefficient w O (i) may not monotonously decrease with an increase in a value having a positive correlation with the pitch gain.
  • the coefficient determination unit 24 determines the coefficient w O (i) using, for example, a monotone non-increasing function for the pitch gain corresponding to the input information about the pitch gain.
  • the coefficient w O (i) is determined by the following equation (2) using ⁇ which is a predetermined value larger than 0.
  • G means a pitch gain corresponding to information about the input pitch gain.
  • is a value for adjusting the width of the lag window when the coefficient w O (i) is regarded as the lag window, in other words, the strength of the lag window.
  • the predetermined ⁇ is obtained by encoding and decoding a speech signal or an acoustic signal with a coding device including the linear prediction analysis device 2 and a decoding device corresponding to the coding device for a plurality of candidate values of ⁇ , What is necessary is just to determine by selecting as a candidate value with favorable subjective quality and objective quality of a signal and a decoding acoustic signal as (alpha).
  • the coefficient w O (i) may be determined by the following equation (2A) using a predetermined function f (G) for the pitch gain G.
  • the equation for determining the coefficient w O (i) using the pitch gain G is not limited to the above (2) and (2A), and is monotonous and non-monotonous with respect to an increase in a value that is positively correlated with the pitch gain.
  • Other expressions may be used as long as they can describe the increase relationship.
  • the coefficient w O (i) may be determined by any one of the following formulas (3) to (6).
  • a is a real number determined depending on the pitch gain
  • m is a natural number determined depending on the pitch gain.
  • a is a value having a negative correlation with the pitch gain
  • m is a value having a negative correlation with the pitch gain.
  • is a sampling period.
  • Equation (3) is a window function of the form called Bartlett window
  • Equation (4) is a window function of the form called Binomial window defined by binomial coefficients
  • Equation (5) is Triangular in frequency domain window
  • (6) is a window function of the type called “Rectangular in frequency domain window”.
  • the coefficient w O (i) may monotonously decrease with an increase in a value having a positive correlation with the pitch gain only for at least a part of the orders i, not for each i of 0 ⁇ i ⁇ P max .
  • the magnitude of the coefficient w O (i) may not monotonously decrease as the value having a positive correlation with the pitch gain increases.
  • the prediction coefficient calculation unit 23 obtains a coefficient that can be converted into a linear prediction coefficient using the modified autocorrelation R ′ O (i) output from the coefficient multiplication unit 22 (step S3).
  • the prediction coefficient calculation unit 23 uses the modified autocorrelation R ′ O (i) output from the coefficient multiplication unit 22 and uses the Levinson-Durbin method or the like to obtain a P max order that is a predetermined maximum order from the first order.
  • the coefficient w O (i) is multiplied by the autocorrelation to obtain a modified autocorrelation and a coefficient that can be converted into a linear prediction coefficient, resulting in a pitch component even when the pitch gain of the input signal is large
  • the quality is higher than the quality of the decoded speech signal and the decoded acoustic signal obtained by encoding and decoding the speech signal and the acoustic signal with the encoding device including the conventional linear prediction analysis device and the decoding device corresponding to the encoding device. ,good.
  • a value that is positively correlated with the pitch gain of the input signal in the current or past frame is compared with a predetermined threshold value, and the coefficient w O (i) is determined according to the comparison result. It is.
  • the second embodiment is different from the first embodiment only in the method of determining the coefficient w O (i) in the coefficient determination unit 24, and is the same as the first embodiment in other points. The following description will focus on the parts that are different from the first embodiment, and redundant description of the same parts as in the first embodiment will be omitted.
  • the functional configuration of the linear prediction analysis apparatus 2 according to the second embodiment and the flowchart of the linear prediction analysis method performed by the linear prediction analysis apparatus 2 are the same as those in the first embodiment shown in FIGS.
  • the linear prediction analysis apparatus 2 according to the second embodiment is the same as the linear prediction analysis apparatus 2 according to the first embodiment except for a portion where the processing of the coefficient determination unit 24 is different.
  • FIG. 1 An example of the processing flow of the coefficient determination unit 24 of the second embodiment is shown in FIG.
  • the coefficient determination unit 24 of the second embodiment performs, for example, the processing of each step S41A, step S42, and step S43 in FIG.
  • the coefficient determination unit 24 compares the pitch gain corresponding to the input pitch gain information with a positive correlation value with a predetermined threshold (step S41A).
  • the value having a positive correlation with the pitch gain corresponding to the information about the input pitch gain is, for example, the pitch gain itself corresponding to the information about the input pitch gain.
  • the coefficient determination unit 24 calculates the coefficient w l (i) according to a predetermined rule.
  • w h (i) and w l (i) are determined so as to satisfy the relationship w h (i) ⁇ w l (i) for at least a part of each i.
  • w h (i) and w l (i) it is, for each of at least some i w h (i) ⁇ w l satisfies the relation (i), for the other i w h (i) ⁇ w l (i) is determined so as to satisfy the relationship.
  • at least a part of each i is, for example, i other than 0 (that is, 1 ⁇ i ⁇ P max ).
  • w h (i) and w l (i) are obtained by calculating w O (i) as w h (i) when pitch gain G is G1 in equation (2), and pitch gain in equation (2). It is determined according to a predetermined rule that w O (i) when G is G2 (where G1> G2) is determined as w l (i). Or, for example, w h (i) and w l (i) are obtained by calculating w O (i) as w h (i) when ⁇ is ⁇ 1 in equation (2), and ⁇ in equation (2) It is determined according to a predetermined rule that w O (i) when ⁇ 2 (where ⁇ 1> ⁇ 2) is determined as w l (i).
  • both ⁇ 1 and ⁇ 2 are predetermined in the same manner as ⁇ in the equation (2).
  • w h (i) and w l (i) obtained in advance by any of these rules are stored in a table, and whether the value having a positive correlation with the pitch gain is equal to or greater than a predetermined threshold value. Therefore, either w h (i) or w l (i) may be selected from the table. Also, each of w h (i) and w l (i), as w h i is increased (i), is determined as the value of w l (i) is reduced.
  • a coefficient that can be converted into a linear prediction coefficient that suppresses the occurrence of a spectrum peak due to the pitch component even when the pitch gain of the input signal is large is obtained.
  • the coefficient that can be converted into a linear prediction coefficient that can express the spectral envelope even when the pitch gain of the input signal is small can be obtained, and linear prediction with higher analysis accuracy than before can be realized. be able to.
  • the coefficient w O (i) is determined using one threshold value, but in the modification of the second embodiment, the coefficient w O (i) is determined using two or more threshold values. Is.
  • a method for determining a coefficient using two threshold values th1 and th2 will be described as an example. It is assumed that the thresholds th1 and th2 satisfy the relationship 0 ⁇ th1 ⁇ th2.
  • the functional configuration of the linear prediction analysis apparatus 2 of the modification of the second embodiment is the same as that of the second embodiment in FIG.
  • the linear prediction analysis apparatus 2 of the modified example of the second embodiment is the same as the linear prediction analysis apparatus 2 of the second embodiment, except for the part where the processing of the coefficient determination unit 24 is different.
  • the coefficient determination unit 24 compares the pitch gain corresponding to the information about the input pitch gain with a positive correlation value with the thresholds th1 and th2.
  • the value having a positive correlation with the pitch gain corresponding to the information about the input pitch gain is, for example, the pitch gain itself corresponding to the information about the input pitch gain.
  • w h (i), w m (i), and w l (i) satisfy the relationship w h (i) ⁇ w m (i) ⁇ w l (i) for at least a part of each i.
  • Shall be determined as follows.
  • at least a part of each i is, for example, each i other than 0 (that is, 1 ⁇ i ⁇ P max ).
  • w h (i), w m (i), and w l (i) are w h (i) ⁇ w m (i) ⁇ w l (i) for at least a part of each i, and other i W h (i) ⁇ w m (i) ⁇ w l (i) for at least a part of each i, w h (i) ⁇ w m (i) ⁇ w l for at least a part of each i Decide to satisfy the relationship (i).
  • w h (i), w m (i), and w l (i) are obtained by calculating w o (i) as w h (i) when pitch gain G is G1 in equation (2).
  • w O (i) when pitch gain G is G2 (where G1> G2) is obtained as w m (i)
  • pitch gain G is G3 (where G2> G3) in equation (2). It is determined according to a predetermined rule that w O (i) at a given time is determined as w l (i).
  • w h (i), w m (i), and w l (i) are obtained by calculating w O (i) when ⁇ is ⁇ 1 in equation (2) as w h (i).
  • the w O (i) when ⁇ is ⁇ 2 (where ⁇ 1> ⁇ 2) in (2) is obtained as w m (i), and w when ⁇ is ⁇ 3 (where ⁇ 2> ⁇ 3) in Equation (2)
  • O (i) is determined as w l (i).
  • ⁇ 1, ⁇ 2, and ⁇ 3 are determined in advance in the same manner as ⁇ in Expression (2).
  • w h (i), w m (i), and w l (i) obtained in advance according to any of these rules are stored in a table, and a value that is positively correlated with the pitch gain and a predetermined value are stored.
  • One of w h (i), w m (i), and w l (i) may be selected from the table by comparison with a threshold value.
  • w h (i), w m (i), and w l (i) are such that the values of w h (i), w m (i), and w l (i) decrease as i increases. It is determined.
  • the pitch gain of the input signal even when the pitch gain of the input signal is large, it can be converted into a linear prediction coefficient that suppresses the occurrence of a spectrum peak due to the pitch component. Coefficients can be obtained and coefficients that can be converted into linear prediction coefficients that can represent the spectral envelope even when the pitch gain of the input signal is small can be obtained, and linear prediction with higher analysis accuracy than before Can be realized.
  • the coefficient w O (i) is determined using a plurality of coefficient tables.
  • the third embodiment is different from the first embodiment only in the method of determining the coefficient w O (i) in the coefficient determination unit 24, and is the same as the first embodiment in other points.
  • the following description will focus on the parts that are different from the first embodiment, and redundant description of the same parts as in the first embodiment will be omitted.
  • the linear prediction analysis apparatus 2 of the third embodiment is different in the process of the coefficient determination unit 24, and as illustrated in FIG. 4, the linear prediction of the first embodiment except for the part further including the coefficient table storage unit 25. This is the same as the analyzer 2.
  • the coefficient table storage unit 25 stores two or more coefficient tables.
  • FIG. 5 shows an example of the processing flow of the coefficient determination unit 24 of the third embodiment.
  • the coefficient determination unit 24 according to the third embodiment performs, for example, the processes of steps S44 and S45 in FIG.
  • the coefficient determination unit 24 uses two or more coefficient tables stored in the coefficient table storage unit 25 using a value having a positive correlation with the pitch gain corresponding to the information about the input pitch gain.
  • One coefficient table t corresponding to a value having a positive correlation with the pitch gain is selected (step S44).
  • the value having a positive correlation with the pitch gain corresponding to the information about the pitch gain is the pitch gain corresponding to the information about the pitch gain.
  • the coefficient determination unit 24 selects the coefficient table t0 as the coefficient table t if a value having a positive correlation with the pitch gain specified by the input information about the pitch gain is equal to or greater than a predetermined threshold, Otherwise, the coefficient table t1 is selected as the coefficient table t. That is, when the value having a positive correlation with the pitch gain is equal to or greater than a predetermined threshold, that is, when it is determined that the pitch gain is large, the coefficient table with the smaller coefficient for each i is selected, When the value having a positive correlation with the pitch gain is smaller than the predetermined threshold value, that is, when it is determined that the pitch gain is small, the coefficient table with the larger coefficient for each i is selected.
  • the coefficient table selected by the coefficient determination unit 24 when the value that is positively correlated with the pitch gain in the two coefficient tables stored in the coefficient table storage unit 25 is the first value. Is the first coefficient table, and the value that is positively correlated with the pitch gain in the two coefficient tables stored in the coefficient table storage unit 25 is a second value that is smaller than the first value.
  • the coefficient table selected by the coefficient determination unit 24 is a second coefficient table, and the magnitude of the coefficient corresponding to each order i in the second coefficient table is at least a part of each order i in the first coefficient table. It is larger than the magnitude of the coefficient corresponding to each order i.
  • each of the three coefficient tables t0, t1, t2 at least a part of each i is w t0 (i) ⁇ w t1 (i) ⁇ w t2 (i), and at least of the other i W t0 (i) ⁇ w t1 (i) ⁇ w t2 (i) for some i and w t0 (i) ⁇ w t1 (i) ⁇ w t2 (i) for each remaining i
  • Coefficient w t0 (i) (i 0,1, ..., P max )
  • the coefficient determination unit 24 (1) When the value positively correlated with the pitch gain> th2, that is, when it is determined that the pitch gain is large, the coefficient table t0 is selected as the coefficient table t, (2) When th2 ⁇ a value that is positively correlated with the pitch gain> th1, that is, when it is determined that the pitch gain is medium, the coefficient table t1 is selected as the coefficient table t, (3) When the value has a positive correlation with th1 ⁇ pitch gain, that is, when it is determined that the pitch gain is small, the coefficient table t2 is selected as the coefficient table t.
  • the coefficient w O (i) does not need to be calculated based on an expression having a value positively correlated with the pitch gain.
  • W O (i) can be determined by the amount of calculation processing.
  • the pitch gain G calculated by the pitch gain calculation unit 950 is input.
  • the pitch gain G which is information about the pitch gain, is input to the coefficient determination unit 24.
  • the coefficient table storage unit 25 stores a coefficient table t0, a coefficient table t1, and a coefficient table t2.
  • w t0 (i) [1.0001, 0.999566371, 0.998266613, 0.996104103, 0.993084457, 0.989215493, 0.984507263, 0.978971839, 0.972623467, 0.96547842, 0.957554817, 0.948872864, 0.939454317, 0.929322779, 0.918503404, 0.907022834, 0.894909143]
  • w t1 (i) [1.0001, 0.999807253, 0.99922923, 0.99826661, 0.99692050, 0.99519245, 0.99308446, 0.99059895, 0.98773878, 0.98450724, 0.98090803, 0.97694527, 0.97262346, 0.96794752, 0.96292276, 0.95755484, 0.95184981]
  • w t2 (i) [1.0001, 0.99995181, 0.99980725, 0.99956637, 0.99922923, 0.99879594, 0.99826661, 0.99764141, 0.99692050, 0.99610410, 0.99519245, 0.99418581, 0.99308446, 0.99188872, 0.99059895, 0.98921550, 0.98773878]
  • FIG. 6 is a graph showing the magnitudes of the coefficients w t0 (i), w t1 (i), and w t2 (i) of the coefficient table t0, t1, t2.
  • the dotted line in the graph of FIG. 6 represents the magnitude of the coefficient w t0 (i) of the coefficient table t0
  • the alternate long and short dash line in the graph of FIG. 6 represents the magnitude of the coefficient w t1 (i) of the coefficient table t1.
  • the solid line in the graph represents the magnitude of the coefficient w t2 (i) in the coefficient table t2.
  • the horizontal axis of the graph of FIG. 6 means the degree i
  • the vertical axis of the graph of FIG. 6 represents the magnitude of the coefficient.
  • the coefficient size monotonously decreases as the value of i increases in each coefficient table. Further, when comparing the magnitudes of coefficients of different coefficient tables corresponding to the same i value, w i0 (i) ⁇ w t1 for i ⁇ 1 excluding 0, in other words, at least a part of i. (i) ⁇ w t2 (i) is satisfied.
  • the plurality of coefficient tables stored in the coefficient table storage unit 25 are not limited to the above example as long as they have such a relationship.
  • i 0, it is not necessary to satisfy the relationship of w t0 (i) ⁇ w t1 (i) ⁇ w t2 (i), and w t0 (0), w t1 (0), w t2 (0) does not necessarily have the same value.
  • w t0 (0) 1.0001
  • w t1 (0) 1.0
  • w t2 (0) 1.0 as in
  • w t0 (0) only for i 0, w t1 (0 )
  • w t2 (0 ) May not satisfy the relationship of w t0 (i) ⁇ w t1 (i) ⁇ w t2 (i).
  • G ⁇ 0.3 the coefficient table t2 is used.
  • 0.3 ⁇ G ⁇ 0.6 the coefficient table t1 is used. If 0.6 ⁇ G, the coefficient table t0 is selected.
  • the coefficient stored in any one of the plurality of coefficient tables is determined as the coefficient w O (i), but the modified example of the third embodiment additionally includes a plurality of coefficients. This includes the case where the coefficient w O (i) is determined by the arithmetic processing based on the coefficient stored in the table.
  • the functional configuration of the linear prediction analysis apparatus 2 of the modification of the third embodiment is the same as that of the third embodiment in FIG.
  • the linear prediction analysis apparatus 2 of the third embodiment is different from the linear prediction analysis apparatus 2 of the third embodiment except that the processing of the coefficient determination unit 24 is different and the coefficient table included in the coefficient table storage unit 25 is different. Is the same.
  • each coefficient w t0 (i) of the coefficient table t0 is converted to the coefficient w O (i) Select as (2)
  • th2 ⁇ value that is positively correlated with pitch gain> th1 that is, when it is determined that the pitch gain is medium
  • w O (i) ⁇ ' ⁇ w t0 (i) + (1- ⁇ ') coefficients by ⁇ w t2 (i) w O a (i)
  • Decide (3) When th1 ⁇ a value that is positively correlated with the pitch gain, that is, when it is determined that the pitch gain is small
  • ⁇ ′ is 0 ⁇ ⁇ ′ ⁇ 1, and when the pitch gain G takes a small value, the value of ⁇ ′ also becomes small, and when the pitch gain G takes a large value, the value of ⁇ ′ also becomes large.
  • the value obtained from the pitch gain G by the function ⁇ ′ c (G).
  • the coefficient multiplier 22 is not included, and the coefficient w O (i) and the autocorrelation R O (i) are calculated in the prediction coefficient calculator 23. May be used to perform linear prediction analysis. 7 and 8 are configuration examples of the linear prediction analysis apparatus 2 corresponding to FIGS. 1 and 4, respectively.
  • the prediction coefficient calculation unit 23 calculates the modified autocorrelation R ′ O (i) obtained by multiplying the coefficient w O (i) and the autocorrelation R O (i) in step S5 of FIG. Instead, linear prediction analysis is performed by directly using the coefficient w O (i) and the autocorrelation R O (i) (step S5).
  • a linear prediction analysis is performed on an input signal X O (n) using a conventional linear prediction analysis apparatus, and a pitch gain is obtained by a pitch gain calculation unit using a result of the linear prediction analysis.
  • the coefficient w O (i) based on the obtained pitch gain is used to obtain a coefficient that can be converted into a linear prediction coefficient by the linear prediction analysis apparatus of the present invention.
  • the linear prediction analysis apparatus 3 of the fourth embodiment includes a first linear prediction analysis unit 31, a linear prediction residual calculation unit 32, a pitch gain calculation unit 36, and a second linear prediction analysis unit 34, for example. I have.
  • Linear prediction residual calculation unit 32 performs filtering equivalent to or similar to linear prediction based on coefficients that can be converted into linear prediction coefficients from the first order to the P max order with respect to the input signal X O (n). Processing is performed to obtain a linear prediction residual signal X R (n). Since the filtering process can also be called a weighting process, the linear prediction residual signal X R (n) can also be said to be a weighted input signal.
  • G s1 is the pitch gain of the M sub-frames constituting the current frame, ..., a maximum value max (G s1, ..., G sM) of the G sM can identify Is output as information about pitch gain.
  • ⁇ Values that have a positive correlation with pitch gain> As described as the specific example 2 of the pitch gain calculation unit 950 in the first embodiment, a sample part that is pre-read and used as a look-ahead in the signal processing of the previous frame as a value having a positive correlation with the pitch gain. Of these, the pitch gain of the portion corresponding to the sample of the current frame may be used.
  • an estimated value of the pitch gain may be used as a value having a positive correlation with the pitch gain.
  • the estimated pitch gain value for the current frame predicted from the pitch gains of multiple past frames, the average, minimum, maximum, or weighted linear sum of pitch gains for multiple past frames You may use as an estimated value of a gain.
  • an average value, minimum value, maximum value, or weighted linear sum of pitch gains for a plurality of subframes may be used as an estimated value of pitch gain.
  • a quantized value of the pitch gain may be used. That is, a pitch gain before quantization may be used, or a pitch gain after quantization may be used.
  • a case where the value is greater than a certain threshold value may be a case where the value is equal to or greater than the threshold value, and a case where the value is equal to or less than the threshold value may be defined as a case where the value is smaller than the threshold value.
  • each step in the linear prediction analysis method is realized by a computer, the processing contents of the functions that the linear prediction analysis method should have are described by a program. And each step is implement
  • the program describing the processing contents can be recorded on a computer-readable recording medium.
  • a computer-readable recording medium any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
  • each processing means may be configured by executing a predetermined program on a computer, or at least a part of these processing contents may be realized by hardware.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Abstract

 自己相関計算部21が、入力信号から自己相関RO(i)を計算する。予測係数計算部23が、係数wO(i)と自己相関RO(i)とが乗算されたものである変形自己相関R'O(i)を用いて線形予測分析を行う。ここで、少なくとも一部の各次数iに対して、各次数iに対応する係数wO(i)が、現在又は過去のフレームにおける入力信号のピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にある場合が含まれているとする。

Description

線形予測分析装置、方法、プログラム及び記録媒体
 この発明は、音声信号、音響信号、心電図、脳波、脳磁図、地震波等のディジタル時系列信号の分析技術に関する。
 音声信号、音響信号の符号化では、入力された音声信号や音響信号を線形予測分析して得た予測係数に基づいて符号化する手法が広く用いられている(例えば、非特許文献1,2参照。)。
 非特許文献1から3では、図11に例示する線形予測分析装置により予測係数が計算されている。線形予測分析装置1は、自己相関計算部11、係数乗算部12及び予測係数計算部13を備えている。
 入力された時間領域のディジタル音声信号やディジタル音響信号である入力信号は、Nサンプルのフレーム毎に処理される。現時刻で処理対象とするフレームである現フレームの入力信号をXO(n)(n=0,1,…,N-1)とする。nは入力信号における各サンプルのサンプル番号を表し、Nは所定の正の整数である。ここで、現フレームの1つ前のフレームの入力信号はXO(n)(n=-N,-N+1,…,-1)であり、現フレームの1つ後のフレームの入力信号はXO(n)(n=N,N+1,…,2N-1)である。
 [自己相関計算部11]
 線形予測分析装置1の自己相関計算部11は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax,Pmaxは予測次数)を式(11)により求めて出力する。Pmaxは、N未満の所定の正の整数である。
Figure JPOXMLDOC01-appb-M000001
 [係数乗算部12]
 次に、係数乗算部12が、自己相関計算部11から出力された自己相関RO(i)に予め定めた係数wO(i) (i=0,1,…,Pmax)を同じiごとに乗じることにより、変形自己相関R'O(i) (i=0,1,…,Pmax)を求める。すなわち、変形自己相関関数R' O(i)を式(12)により求める。
Figure JPOXMLDOC01-appb-M000002
 [予測係数計算部13]
 そして、予測係数計算部13が、係数乗算部12から出力された変形自己相関R'O(i)を用いて例えばLevinson-Durbin法などにより、1次から予め定めた予測次数であるPmax次までの線形予測係数に変換可能な係数を求める。線形予測係数に変換可能な係数とは、PARCOR係数KO(1),KO(2),…,KO(Pmax)や線形予測係数aO(1),aO(2),…,aO(Pmax)等である。
 非特許文献1である国際標準ITU-T G.718や非特許文献2である国際標準ITU-T G.729では、係数wO(i)として予め求めておいた60 Hzのバンド幅の固定の係数を用いている。
 具体的には、係数wO(i)は式(13)のように指数関数を用いて定義されており、式(13)の中ではf0=60 Hzという固定値が使われている。fsはサンプリング周波数である。
Figure JPOXMLDOC01-appb-M000003
 非特許文献3には、上述の指数関数以外の関数に基づく係数を用いる例が記載されている。しかし、ここで用いられている関数は、サンプリング周期τ(fsに対応する周期に相当)と所定の定数aとに基づく関数であり、やはり固定値の係数が使われている。
ITU-T Recommendation G.718, ITU, 2008. ITU-T Recommendation G.729, ITU, 1996 Yoh'ichi Tohkura, Fumitada Itakura, Shin'ichiro Hashimoto, "Spectral Smoothing Technique in PARCOR Speech Analysis-Synthesis", IEEE Trans. on Acoustics, Speech, and Signal Processing, Vol. ASSP-26, No.6, 1978
 従来の音声信号、音響信号の符号化で用いられている線形予測分析方法では、自己相関RO(i)に固定の係数wO(i)が乗算して得られる変形自己相関R'O(i)を用いて線形予測係数に変換可能な係数を求めていた。よって、自己相関RO(i)への係数wO(i)の乗算による変形を必要としないような、すなわち、変形自己相関R'O(i)ではなく自己相関RO(i)そのものを用いて線形予測係数に変換可能な係数を求めたとしても、線形予測係数に変換可能な係数に対応するスペクトル包絡においてスペクトルのピークが大きくなりすぎることがないような入力信号の場合には、自己相関RO(i)への係数wO(i)の乗算によって、変形自己相関R'O(i)により求まる線形予測係数に変換可能な係数に対応するスペクトル包絡が、入力信号XO(n)のスペクトル包絡を近似する精度が下がってしまう、すなわち、線形予測分析の精度が下がってしまう可能性、があった。
 この発明は、従来よりも分析精度が高い線形予測分析方法、装置、プログラム及び記録媒体を提供することを目的とする。
 この発明の一態様による線形予測分析方法は、入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) (i=0, 1, …, Pmax)を計算する自己相関計算ステップと、係数wO(i) (i=0, 1, …, Pmax)と自己相関RO(i) (i=0, 1, …, Pmax)とが対応するiごとに乗算されたものである変形自己相関R'O(i) (i=0, 1, …, Pmax)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、少なくとも一部の各次数iに対して、各次数iに対応する係数wO(i)が、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にある場合が含まれている。
 この発明の一態様による線形予測分析方法は、入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i) またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) (i=0, 1, …, Pmax)を計算する自己相関計算ステップと、2個以上の係数テーブルのそれぞれにはi=0, 1, …, Pmaxの各次数iと各次数iに対応する係数wO(i)とが対応付けて記憶されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて2個以上の係数テーブルの中の1個の係数テーブルから係数wO(i) (i=0, 1, …, Pmax)を取得する係数決定ステップと、取得された係数wO(i) (i=0, 1, …, Pmax)と自己相関RO(i) (i=0, 1, …, Pmax)とが対応するiごとに乗算されたものである変形自己相関R' O(i) (i=0, 1, …, Pmax)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、2個以上の係数テーブルの中の、周期性の強さ又はピッチゲインと正の相関関係にある値が第一値である場合に係数決定ステップで係数wO(i) (i=0, 1, …, Pmax)が取得される係数テーブルを第一係数テーブルとし、2個以上の係数テーブルの中の周期性の強さ又はピッチゲインと正の相関関係にある値が第一値よりも小さい第二値である場合に係数決定ステップで係数wO(i) (i=0, 1, …, Pmax)が取得される係数テーブルを第二係数テーブルとして、少なくとも一部の各次数iに対して、第二係数テーブルにおける各次数iに対応する係数は、第一係数テーブルにおける各次数iに対応する係数よりも大きい。
 この発明の一態様による線形予測分析方法は、入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) (i=0, 1, …, Pmax)を計算する自己相関計算ステップと、係数テーブルt0には係数wt0(i) (i=0,1,…,Pmax)が格納されており、係数テーブルt1には係数wt1(i) (i=0,1,…,Pmax)、係数テーブルt2には係数wt2(i) (i=0,1,…,Pmax)が格納されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて係数テーブルt0,t1,t2の中の1個の係数テーブルから係数を取得する係数決定ステップと、取得した係数と自己相関RO(i) (i=0, 1, …, Pmax)とが対応するiごとに乗算されたものである変形自己相関R' O(i) (i=0, 1, …, Pmax)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、周期性の強さ又はピッチゲインと正の相関関係にある値に応じて、周期性の強さ又はピッチゲインが大きい場合、周期性の強さ又はピッチゲインが中程度の場合、周期性の強さ又はピッチゲインが小さい場合の何れかの場合に分類されるとし、周期性の強さ又はピッチゲインが大きい場合に係数決定ステップで係数が取得される係数テーブルを係数テーブルt0とし、周期性の強さ又はピッチゲインが中程度の場合に係数決定ステップで係数が取得される係数テーブルを係数テーブルt1とし、周期性の強さ又はピッチゲインが小さい場合に係数決定ステップで係数が取得される係数テーブルを係数テーブルt2として、少なくとも一部のiについてwt0(i)<wt1(i)≦wt2(i)であり、それ以外のiのうちの少なくとも一部の各iについてwt0(i)≦wt1(i)<wt2(i)であり、残りの各iについてwt0(i)≦wt1(i)≦wt2(i)である。
 従来よりも分析精度の高い線形予測を実現することができる。
第一実施形態及び第二実施形態の線形予測装置の例を説明するためのブロック図。 線形予測分析方法の例を説明するためのフローチャート。 第二実施形態の線形予測分析方法の例を説明するためのフローチャート。 第三実施形態の線形予測装置の例を説明するためのブロック図。 第三実施形態の線形予測分析方法の例を説明するためのフローチャート。 第三実施形態の具体例を説明するための図。 変形例を説明するためのブロック図。 変形例を説明するためのブロック図。 変形例を説明するためのフローチャート。 第四実施形態の線形予測分析装置の例を説明するためのブロック図。 従来の線形予測装置の例を説明するためのブロック図。
 以下、図面を参照して、線形予測分析装置及び方法の各実施形態を説明する。
 [第一実施形態]
 第一実施形態の線形予測分析装置2は、図1に示すように、自己相関計算部21、係数決定部24、係数乗算部22及び予測係数計算部23を例えば備えている。自己相関計算部21、係数乗算部22及び予測係数計算部23の動作は、従来の線形予測分析装置1の自己相関計算部11、係数乗算部12及び予測係数計算部13における動作とそれぞれ同じである。
 線形予測分析装置2には、所定時間区間であるフレームごとの時間領域のディジタル音声信号やディジタル音響信号や心電図、脳波、脳磁図、地震波等のやディジタル信号である入力信号XO(n)が入力される。入力信号は、入力時系列信号である。現フレームの入力信号をXO(n)(n=0,1,…,N-1)とする。nは入力信号における各サンプルのサンプル番号を表し、Nは所定の正の整数である。ここで、現フレームの1つ前のフレームの入力信号はXO(n)(n=-N,-N+1,…, -1)であり、現フレームの1つ後のフレームの入力信号はXO(n)(n=N,N+1,…, 2N-1)である。以下では、入力信号XO(n)がディジタル音声信号やディジタル音響信号である場合について説明する。入力信号XO(n) (n=0,1,…,N-1)は、収音された信号そのものであってもよいし、分析のためにサンプリングレートが変換された信号でもよいし、プリエンファシス処理された信号でもよいし、窓かけされた信号でもよい。
 また、線形予測分析装置2には、フレームごとのディジタル音声信号やディジタル音響信号のピッチゲインについての情報も入力される。ピッチゲインについての情報は、線形予測分析装置2外にあるピッチゲイン計算部950で求められる。
 ピッチゲインは、フレームごとの入力信号の周期性の強さのことである。ピッチゲインは、例えば、入力信号やその線形予測残差信号についてのピッチ周期分だけ時間差がある信号間の正規化された相関である。
 [ピッチゲイン計算部950]
 ピッチゲイン計算部950は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)および/または現フレームの近傍のフレームの入力信号の全部または一部からピッチゲインGを求める。ピッチゲイン計算部950は、例えば、現フレームの入力信号XO(n) (n=0, 1, …, N-1)の全部または一部を含む信号区間のディジタル音声信号やディジタル音響信号のピッチゲインGを求め、ピッチゲインGを特定可能な情報をピッチゲインについての情報として出力する。ピッチゲインを求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。また、求めたピッチゲインGを符号化してピッチゲイン符号を得る構成とし、ピッチゲイン符号をピッチゲインについての情報として出力してもよい。さらにピッチゲイン符号に対応するピッチゲインの量子化値^Gを得る構成とし、ピッチゲインの量子化値^Gをピッチゲインについての情報として出力してもよい。以下、ピッチゲイン計算部950の具体例について説明する。
 <ピッチゲイン計算部950の具体例1>
 ピッチゲイン計算部950の具体例1は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)が複数個のサブフレームで構成されている場合、かつ、同一のフレームについては線形予測分析装置2よりも先にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、まず、2以上の整数であるM個のサブフレームであるXOs1(n) (n=0, 1, …, N/M-1), …, XOsM(n)(n= (M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれのピッチゲインであるGs1,…, GsMを求める。NはMで割り切れるとする。ピッチゲイン計算部950は、現フレームを構成するM個のサブフレームのピッチゲインであるGs1,…, GsMのうちの最大値max(Gs1,…,GsM)を特定可能な情報をピッチゲインについての情報として出力する。
 <ピッチゲイン計算部950の具体例2>
 ピッチゲイン計算部950の具体例2は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)(ただし、Nnは、Nn<Nという関係を満たす所定の正の整数。)とで、先読み部分を含む信号区間が現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、現フレームの信号区間について、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)のそれぞれのピッチゲインであるGnow, Gnextを求め、ピッチゲインGnextをピッチゲイン計算部950に記憶する。ピッチゲイン計算部950は、また、1つ前のフレームの信号区間について求めてピッチゲイン計算部950に記憶されていたピッチゲインGnext、すなわち、1つ前のフレームの信号区間のうちの現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn-1)について求めたピッチゲイン、を特定可能な情報をピッチゲインについての情報として出力する。なお、具体例1と同様に、現フレームについては複数のサブフレームごとのピッチゲインを求めてもよい。
 <ピッチゲイン計算部950の具体例3>
 ピッチゲイン計算部950の具体例3は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)そのものが現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、現フレームの信号区間である現フレームの入力信号XO(n) (n=0, 1, …, N-1)のピッチゲインGを求め、ピッチゲインGをピッチゲイン計算部950に記憶する。ピッチゲイン計算部950は、また、1つ前のフレームの信号区間、すなわち、1つ前のフレームの入力信号XO(n) (n=-N, -N+1, …, -1)について求めてピッチゲイン計算部950に記憶されていたピッチゲインGを特定可能な情報をピッチゲインについての情報として出力する。
 以下、線形予測分析装置2の動作について説明する。図2は、線形予測分析装置2による線形予測分析方法のフローチャートである。
 [自己相関計算部21]
 自己相関計算部21は、入力されたNサンプルのフレーム毎の時間領域のディジタル音声信号やディジタル音響信号である入力信号XO(n)(n=0,1,…,N-1)から自己相関RO(i) (i=0,1,…,Pmax)を計算する(ステップS1)。Pmaxは、予測係数計算部23が求める線形予測係数に変換可能な係数の最大次数であり、N未満の所定の正の整数である。計算された自己相関RO(i) (i=0,1,…,Pmax)は、係数乗算部22に提供される。
 自己相関計算部21は、入力信号XO(n)を用いて、例えば式(14A)により自己相関RO(i) (i=0,1,…,Pmax)を計算して出力する。すなわち、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)との自己相関RO(i)を計算する。
Figure JPOXMLDOC01-appb-M000004
 または、自己相関計算部21は、入力信号XO(n)を用いて、例えば式(14B)により自己相関RO(i) (i=0,1,…,Pmax)を計算する。すなわち、現在のフレームの入力時系列信号XO(n)とiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i)を計算する。
Figure JPOXMLDOC01-appb-M000005
 または、自己相関計算部21は、入力信号XO(n)に対応するパワースペクトルを求めてからWiener-Khinchinの定理に従って自己相関RO(i) (i=0,1,…,Pmax)を計算してもよい。また、何れの方法においても、入力信号XO(n) (n=-Np, -Np+1,…, -1, 0,1,…,N-1, N,…, N-1+Nn)というように前後のフレームの入力信号の一部も用いて自己相関RO(i)を計算してもよい。ここで、Np,Nnはそれぞれ、Np<N, Nn<Nという関係を満たす所定の正の整数である。もしくは、MDCT系列をパワースペクトルの近似として代用し、近似されたパワースペクトルから自己相関を求めてもよい。このように自己相関の算出方法は世の中で使われている公知技術の何れかを用いればよい。
 [係数決定部24]
 係数決定部24は、入力されたピッチゲインについての情報を用いて、係数wO(i) (i=0,1,…,Pmax)を決定する(ステップS4)。係数wO(i)は、自己相関RO(i)を変形するための係数である。係数wO(i)は、信号処理の分野においては、ラグ窓wO(i)又はラグ窓係数wO(i)とも呼ばれているものである。係数wO(i)は正の値であるので、係数wO(i)が所定の値よりも大きい/小さいことを、係数wO(i)の大きさが所定の値よりも大きい/小さいと表現することがある。また、wO(i)の大きさとは、そのwO(i)の値を意味するものとする。
 係数決定部24に入力されるピッチゲインについての情報は、現フレームの入力信号および/または現フレームの近傍のフレームの入力信号の全部または一部から求まったピッチゲインを特定する情報である。すなわち、係数wO(i)の決定に用いるピッチゲインは、現フレームの入力信号および/または現フレームの近傍のフレームの入力信号の全部または一部から求まったピッチゲインである。
 係数決定部24は、0次からPmax次の全てまたは一部の次数について、ピッチゲインについての情報に対応するピッチゲインの取り得る範囲のうち全てまたは一部で、ピッチゲインについての情報に対応するピッチゲインが大きいほど小さな値を係数wO(0), wO(1), …, wO(Pmax)として決定する。また、係数決定部24は、ピッチゲインの代わりにピッチゲインと正の相関関係にある値を用いて、ピッチゲインが大きいほど小さな値を係数wO(0), wO(1), …, wO(Pmax)として決定してもよい。
 すなわち、係数wO(i) (i=0,1,…,Pmax)は、少なくとも一部の予測次数iに対して、その次数iに対応する係数wO(i)の大きさが、現フレームの入力信号XO(n)の全部または一部を含む信号区間のピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にある場合が含まれているように決定される。
 言い換えれば、後述するように、次数iによっては、係数wO(i)の大きさがピッチゲインと正の相関関係にある値の増加とともに単調減少しなくてもよい。
 また、ピッチゲインと正の相関関係にある値の取り得る範囲には、係数wO(i)の大きさがピッチゲインと正の相関関係にある値の増加に関わらず一定の範囲があってもよいが、その他の範囲では係数wO(i)の大きさがピッチゲインと正の相関関係にある値の増加とともに単調減少するものとする。
 係数決定部24は、例えば、入力されたピッチゲインについての情報に対応するピッチゲインについての単調非増加関数を用いて、係数wO(i)を決定する。例えば、0より大きい予め定めた値であるαを用いた、以下の式(2)により係数wO(i)を決定する。式(2)において、Gは入力されたピッチゲインについての情報に対応するピッチゲインを意味する。αは、係数wO(i)をラグ窓としてとらえたときのラグ窓の幅、言い換えればラグ窓の強さを調整するための値である。予め定めるαは、例えば、複数のαの候補値について線形予測分析装置2を含む符号化装置とその符号化装置に対応する復号装置とで音声信号や音響信号を符号化復号して、復号音声信号や復号音響信号の主観品質や客観品質が良好である候補値をαとして選択することにより定めればよい。
Figure JPOXMLDOC01-appb-M000006
 または、ピッチゲインGについての予め定めた関数f(G)を用いた、以下の式(2A)により係数wO(i)を決定してもよい。関数f(G)は、f(G)=αG+β(αは正の数、βは任意の数)、f(G)=αG2+βG+γ(αは正の数、β、γは任意の数)などの、ピッチゲインGと正の相関関係、ピッチゲインGに対して単調非減少の関係となる関数である。
Figure JPOXMLDOC01-appb-M000007
 また、ピッチゲインGを用いて係数wO(i)を決定する式は、上述の(2), (2A)に限らず、ピッチゲインと正の相関関係にある値の増加に対して単調非増加の関係を記述できるものであれば他の式であってもよい。例えば、係数wO(i)を、以下の(3)から(6)の何れかの式により決定してもよい。以下の(3)から(6)の式において、aをピッチゲインに依存して決まる実数とし、mをピッチゲインに依存して決まる自然数とする。例えば、aをピッチゲインと負の相関関係にある値とし、mをピッチゲインと負の相関関係にある値とする。τはサンプリング周期である。
Figure JPOXMLDOC01-appb-M000008
 式(3)はBartlett windowと呼ばれる形式の窓関数であり、式(4)は二項係数により定義されるBinomial windowと呼ばれる形式の窓関数であり、式(5)はTriangular in frequency domain windowと呼ばれる形式の窓関数であり、式(6)はRectangular in frequency domain windowと呼ばれる形式の窓関数である。
 なお、0≦i≦Pmaxの各iではなく、少なくとも一部の次数iについてのみ、係数wO(i)がピッチゲインと正の相関関係にある値の増加とともに単調減少してもよい。言い換えれば、次数iによっては、係数wO(i)の大きさがピッチゲインと正の相関関係にある値の増加とともに単調減少しなくてもよい。
 例えば、i=0の場合は、上述の式(2)から式(6)の何れかを用いて係数wO(0)の値を決定してもよいし、ITU-T G.718等でも用いられているようなwO(0)=1.0001,wO(0)=1.003といった、ピッチゲインと正の相関関係にある値には依存しない、経験的に得られた固定値を用いてもよい。すなわち、1≦i≦Pmaxの各iについては、係数wO(i)はピッチゲインと正の相関関係にある値が大きいほど小さな値を取るが、i=0の係数についてはこの限りではなく固定値を用いてもよい。
 [係数乗算部22]
 係数乗算部22は、係数決定部24で決定した係数wO(i) (i=0,1,…,Pmax)と、自己相関計算部21で求めた自己相関RO(i) (i=0,1,…,Pmax)とを同じiごとに乗じることにより、変形自己相関R'O(i) (i=0,1,…,Pmax)を求める(ステップS2)。すなわち、係数乗算部22は、以下の式(7)により自己相関R'O(i)を計算する。計算された自己相関R'O(i)は、予測係数計算部23に提供される。
Figure JPOXMLDOC01-appb-M000009
 [予測係数計算部23]
 予測係数計算部23は、係数乗算部22から出力された変形自己相関R'O(i)を用いて線形予測係数に変換可能な係数を求める(ステップS3)。
 例えば、予測係数計算部23は、係数乗算部22から出力された変形自己相関R'O(i)を用いて、Levinson-Durbin法などにより、1次から予め定めた最大次数であるPmax次までのPARCOR係数KO(1),KO(2),…,KO(Pmax)や線形予測係数aO(1),aO(2),…,aO(Pmax)を計算して出力する。
 第一実施形態の線形予測分析装置2によれば、ピッチゲインと正の相関関係にある値に応じて、少なくとも一部の予測次数iに対して、その次数iに対応する係数wO(i)の大きさが、現フレームの入力信号XO(n)の全部または一部を含む信号区間のピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にある場合が含まれている係数wO(i)を自己相関に乗算して変形自己相関を求めて線形予測係数に変換可能な係数を求めることにより、入力信号のピッチゲインが大きいときであってもピッチ成分に起因するスペクトルのピークの発生を抑えた線形予測係数に変換可能な係数を求めることができ、かつ、入力信号のピッチゲインが小さいときであってもスペクトル包絡を表現可能な線形予測係数に変換可能な係数を求めることができ、従来よりも分析精度の高い線形予測を実現することができる。したがって、第一実施形態の線形予測分析装置2を含む符号化装置とその符号化装置に対応する復号装置とで音声信号や音響信号を符号化復号して得られる復号音声信号や復号音響信号の品質は、従来の線形予測分析装置を含む符号化装置とその符号化装置に対応する復号装置とで音声信号や音響信号を符号化復号して得られる復号音声信号や復号音響信号の品質よりも、良い。
 [第二実施形態]
 第二実施形態は、現在又は過去のフレームにおける入力信号のピッチゲインと正の相関関係にある値と所定の閾値とを比較し、その比較結果に応じて係数wO(i)を決定するものである。第二実施形態は、係数決定部24における係数wO(i)の決定方法のみが第一実施形態と異なり、他の点については第一実施形態と同様である。以下、第一実施形態と異なる部分を中心に説明し、第一実施形態と同様の部分については重複説明を省略する。
 第二実施形態の線形予測分析装置2の機能構成と線形予測分析装置2による線形予測分析方法のフローチャートは、第一実施形態と同じ図1と図2である。第二実施形態の線形予測分析装置2は、係数決定部24の処理が異なる部分以外は、第一実施形態の線形予測分析装置2と同じである。
 第二実施形態の係数決定部24の処理の流れの例を図3に示す。第二実施形態の係数決定部24は、図3の各ステップS41A、ステップS42、ステップS43の処理を例えば行う。
 係数決定部24は、入力されたピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値と所定の閾値とを比較する(ステップS41A)。入力されたピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値とは、例えば、入力されたピッチゲインについての情報に対応するピッチゲインそのものである。
 係数決定部24は、ピッチゲインと正の相関関係にある値が所定の閾値以上である場合、すなわち、ピッチゲインが大きいと判断された場合には、予め定めた規則により係数wh(i)を決定し、この決定された係数wh(i) (i=0,1,…,Pmax)をwO(i) (i=0,1,…,Pmax)とする(ステップS42)。すなわち、wO(i)=wh(i)とする。
 係数決定部24は、ピッチゲインと正の相関関係にある値が所定の閾値以上でない場合、すなわち、ピッチゲインが小さいと判断された場合には、予め定めた規則により係数wl(i)を決定し、この決定された係数wl(i) (i=0,1,…,Pmax)をwO(i) (i=0,1,…,Pmax)とする(ステップS43)。すなわち、wO(i)=wl(i)とする。
 ここで、wh(i)とwl(i)は、少なくとも一部の各iについてwh(i)<wl(i)という関係を満たすよう決定する。または、wh(i)とwl(i)は、少なくとも一部の各iについてはwh(i)<wl(i)という関係を満たし、それ以外のiについてはwh(i)≦wl(i)という関係を満たすよう決定する。ここで、少なくとも一部の各iとは、例えば0以外のi(つまり、1≦i≦Pmax)のことである。例えば、wh(i)とwl(i)は、式(2)でピッチゲインGがG1であるときのwO(i)をwh(i)として求め、式(2)でピッチゲインGがG2(ただしG1>G2)であるときのwO(i)をwl(i)として求めるという予め定めた規則により求める。または、例えば、wh(i)とwl(i)は、式(2)でαがα1であるときのwO(i)をwh(i)として求め、式(2)でαがα2(ただしα1>α2)であるときのwO(i)をwl(i)として求めるという予め定めた規則により求める。この場合は、α1とα2は共に式(2)のαと同様に予め定めておく。なお、これらの何れかの規則により予め求めたwh(i) とwl(i)をテーブルに記憶しておき、ピッチゲインと正の相関関係にある値が所定の閾値以上であるか否かによりwh(i)とwl(i)の何れかをテーブルから選択する構成としてもよい。また、wh(i)とwl(i)のそれぞれは、iが大きくなるにつれてwh(i), wl(i)の値が小さくなるように決定される。なお、i=0の係数wh(i), wl(i)については、 wh(0)≦wl(0)の関係を満たしていることは必須ではなく、wh(0)>wl(0)の関係を満たす値を用いてもよい。
 第二実施形態によっても、第一実施形態と同様に、入力信号のピッチゲインが大きいときであってもピッチ成分に起因するスペクトルのピークの発生を抑えた線形予測係数に変換可能な係数を求めることができ、かつ、入力信号のピッチゲインが小さいときであってもスペクトル包絡を表現可能な線形予測係数に変換可能な係数を求めることができ、従来よりも分析精度の高い線形予測を実現することができる。
 <第二実施形態の変形例>
 上述の第二実施形態では1個の閾値を用いて係数wO(i)を決定したが、第二実施形態の変形例は2個以上の閾値を用いて係数wO(i)を決定するものである。以下、2個の閾値th1,th2を用いて係数を決定する方法を例に挙げて説明する。閾値th1,th2は、0<th1<th2という関係を満たすとする。
 第二実施形態の変形例の線形予測分析装置2の機能構成は、第二実施形態と同じ図1である。第二実施形態の変形例の線形予測分析装置2は、係数決定部24の処理が異なる部分以外は、第二実施形態の線形予測分析装置2と同じである。
 係数決定部24は、入力されたピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値と、閾値th1,th2とを比較する。入力されたピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値とは、例えば、入力されたピッチゲインについての情報に対応するピッチゲインそのものである。
 係数決定部24は、ピッチゲインと正の相関関係にある値が閾値th2より大きい場合、すなわち、ピッチゲインが大きいと判断された場合には、予め定めた規則により係数wh(i) (i=0,1,…,Pmax)を決定し、この決定された係数wh(i) (i=0,1,…,Pmax)をwO(i) (i=0,1,…,Pmax)とする。すなわち、wO(i)=wh(i)とする。
 係数決定部24は、ピッチゲインと正の相関関係にある値が閾値th1よりも大きく閾値th2以下の場合、すなわち、ピッチゲインが中程度と判断された場合には、予め定めた規則により係数wm(i) (i=0,1,…,Pmax)を決定し、この決定された係数wm(i) (i=0,1,…,Pmax)をwO(i) (i=0,1,…,Pmax)とする。すなわち、wO(i)=wm(i)とする。
 係数決定部24は、ピッチゲインと正の相関関係にある値が閾値th1以下の場合、すなわち、ピッチゲインが小さいと判断された場合には、予め定めた規則により係数wl(i) (i=0,1,…,Pmax)を決定し、この決定された係数wl(i) (i=0,1,…,Pmax)をwO(i) (i=0,1,…,Pmax)とする。すなわち、wO(i)=wl(i)とする。
 ここで、wh(i),wm(i),wl(i)は、少なくとも一部の各iについてwh(i)<wm(i)<wl(i)という関係を満たすよう決定するものとする。ここで、少なくとも一部の各iとは、例えば0以外の各i(つまり、1≦i≦Pmax)のことである。または、wh(i),wm(i),wl(i)は、少なくとも一部の各iについてwh(i)<wm(i)≦wl(i)、それ以外のiのうちの少なくとも一部の各iについてwh(i)≦wm(i)<wl(i)、残り少なくとも一部の各iについてwh(i)≦wm(i)≦wl(i)という関係を満たすよう決定する。例えば、wh(i), wm(i), wl(i)は、式(2)でピッチゲインGがG1であるときのwO(i)をwh(i)として求め、式(2)でピッチゲインGがG2(ただしG1>G2)であるときのwO(i)をwm(i)として求め、式(2)でピッチゲインGがG3(ただしG2>G3)であるときのwO(i)をwl(i)として求めるという予め定めた規則により求める。または、例えば、wh(i), wm(i), wl(i)は、式(2)でαがα1であるときのwO(i)をwh(i)として求め、式(2)でαがα2(ただしα1>α2)であるときのwO(i)をwm(i)として求め、式(2)でαがα3(ただしα2>α3)であるときのwO(i)をwl(i)として求めるという予め定めた規則により求める。この場合は、α1, α2, α3は式(2)のαと同様に予め定めておく。なお、これらの何れかの規則により予め求めたwh(i), wm(i), wl(i)をテーブルに記憶しておき、ピッチゲインと正の相関関係にある値と所定の閾値との比較によりwh(i), wm(i), wl(i)の何れかをテーブルから選択する構成としてもよい。
 なお、wh(i)とwl(i)を用いて、その間の係数wm(i)を決定しても良い。すなわち、wm(i)=β'×wh(i)+(1-β')×wl(i)によりwm(i)を決定しても良い。ここでβ'は、0≦β'≦1であり、かつ、ピッチゲインGが小さい値をとるときはβ'の値も小さくなり、ピッチゲインGが大きい値をとるときにβ'の値も大きくなる関数β'=c(G)により、ピッチゲインGから求める値である。このようにwm(i)を求めれば、係数決定部24にはwh(i) (i=0,1,…,Pmax)を記憶したテーブルとwl(i) (i=0,1,…,Pmax)を記憶したテーブルの2つのテーブルだけを記憶しておくことで、ピッチゲインが中程度の場合のうちのピッチゲインが大きいときにはwh(i)に近い係数を得ることができ、逆にピッチゲインが中程度の場合のうちのピッチゲインが小さいときにはwl(i)に近い係数を得ることができる。また、wh(i), wm(i), wl(i)は、iが大きくなるにつれてそれぞれwh(i), wm(i), wl(i)の値が小さくなるよう決定される。なお、i=0の係数wh(0), wm(0), wl(0)については、wh(0)≦wm(0)≦wl(0)の関係を満たしていることは必須ではなく、wh(0)>wm(0)または/およびwm(0)>wl(0)の関係を満たす値を用いてもよい。
 第二実施形態の変形例によっても、第二実施形態と同様に、入力信号のピッチゲインが大きいときであってもピッチ成分に起因するスペクトルのピークの発生を抑えた線形予測係数に変換可能な係数を求めることができ、かつ、入力信号のピッチゲインが小さいときであってもスペクトル包絡を表現可能な線形予測係数に変換可能な係数を求めることができ、従来よりも分析精度の高い線形予測を実現することができる。
 [第三実施形態]
 第三実施形態は、複数個の係数テーブルを用いて係数wO(i)を決定するものである。第三実施形態は、係数決定部24における係数wO(i)の決定方法のみが第一実施形態と異なり、他の点については第一実施形態と同様である。以下、第一実施形態と異なる部分を中心に説明し、第一実施形態と同様の部分については重複説明を省略する。
 第三実施形態の線形予測分析装置2は、係数決定部24の処理が異なり、図4に例示するように、係数テーブル記憶部25を更に備えている部分以外は、第一実施形態の線形予測分析装置2と同じである。係数テーブル記憶部25には、2個以上の係数テーブルが記憶されている。
 第三実施形態の係数決定部24の処理の流れの例を図5に示す。第三実施形態の係数決定部24は、図5のステップS44、ステップS45の処理を例えば行う。
 まず、係数決定部24は、入力されたピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値を用いて、係数テーブル記憶部25に記憶された2個以上の係数テーブルから、そのピッチゲインと正の相関関係にある値に応じた1個の係数テーブルtを選択する(ステップS44)。例えば、ピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値は、ピッチゲインについての情報に対応するピッチゲインである。
 例えば、係数テーブル記憶部25に、異なる2個の係数テーブルt0, t1が記憶されており、係数テーブルt0には係数wt0(i) (i=0,1,…,Pmax)が格納されており、係数テーブルt1には係数wt1(i) (i=0,1,…,Pmax)が格納されているとする。2個の係数テーブルt0, t1のそれぞれには、少なくとも一部の各iについてwt0(i)<wt1(i)であり、残りの各iについてwt0(i)≦wt1(i)となるように定められた係数wt0(i) (i=0,1,…,Pmax)と係数wt1(i) (i=0,1,…,Pmax)が格納されている。
 このとき、係数決定部24は、入力されたピッチゲインについての情報により特定されるピッチゲインと正の相関関係にある値が所定の閾値以上であれば係数テーブルt0を係数テーブルtとして選択し、そうでない場合には係数テーブルt1を係数テーブルtとして選択する。すなわち、ピッチゲインと正の相関関係にある値が所定の閾値以上である場合、すなわち、ピッチゲインが大きいと判断された場合には、各iについての係数が小さい方の係数テーブルを選択し、ピッチゲインと正の相関関係にある値が所定の閾値より小さい場合、すなわちピッチゲインが小さいと判断された場合には、各iについての係数が大きい方の係数テーブルを選択する。
 言い換えれば、係数テーブル記憶部25に記憶されている2個の係数テーブルの中の、ピッチゲインと正の相関関係にある値が第一値である場合に係数決定部24により選択される係数テーブルを第一係数テーブルとし、係数テーブル記憶部25に記憶されている2個の係数テーブルの中の、ピッチゲインと正の相関関係にある値が第一値よりも小さい第二値である場合に係数決定部24により選択される係数テーブルを第二係数テーブルとして、少なくとも一部の各次数iに対して、第二係数テーブルにおける各次数iに対応する係数の大きさは、第一係数テーブルにおける各次数iに対応する係数の大きさよりも大きい。
 なお、係数テーブル記憶部25に記憶されている係数テーブルt0, t1のi=0の係数wt0(0), wt1(0)については、wt0(0)≦wt1(0)の関係を満たしていることは必須ではなく、wt0(0)>wt1(0)の関係にある値であってもよい。
 また、例えば、係数テーブル記憶部25に、異なる3個の係数テーブルt0, t1, t2が記憶されて、係数テーブルt0には係数wt0(i) (i=0,1,…,Pmax)が格納されており、係数テーブルt1には係数wt1(i) (i=0,1,…,Pmax) 、係数テーブルt2には係数wt2(i) (i=0,1,…,Pmax)が格納されているとする。3個の係数テーブルt0, t1, t2のそれぞれには、少なくとも一部の各iについてwt0(i)<wt1(i)≦wt2(i)であり、それ以外のiのうちの少なくとも一部の各iについてwt0(i)≦wt1(i)<wt2(i)であり、残りの各iについてwt0(i)≦wt1(i)≦wt2(i)となるように定められた係数wt0(i) (i=0,1,…,Pmax)と係数wt1(i) (i=0,1,…,Pmax) と係数wt2(i) (i=0,1,…,Pmax)が格納されている。
 ここで、0<th1<th2という関係を満たす2個の閾値th1,th2が定められているとする。このとき、係数決定部24は、
(1) ピッチゲインと正の相関関係にある値>th2の場合、すなわち、ピッチゲインが大きいと判断された場合には、係数テーブルt0を係数テーブルtとして選択し、
(2) th2≧ ピッチゲインと正の相関関係にある値>th1の場合、すなわち、ピッチゲインが中程度であると判断された場合には、係数テーブルt1を係数テーブルtとして選択し、
(3) th1≧ ピッチゲインと正の相関関係にある値の場合、すなわち、ピッチゲインが小さいと判断された場合には、係数テーブルt2を係数テーブルtとして選択する。
 なお、係数テーブル記憶部25に記憶されている係数テーブルt0, t1, t2のi=0の係数wt0(0), wt1(0), wt2(0)については、wt0(0)≦wt1(0)≦wt2(0)の関係を満たしていることは必須ではなく、wt0(0)>wt1(0)または/およびwt1(0)>wt2(0)の関係にある値であってもよい。
 そして、係数決定部24は、その選択された係数テーブルtに格納された各次数iの係数wt(i)を係数wO(i)とする(ステップS45)。すなわち、wO(i)=wt(i)とする。言い換えれば、係数決定部24は、選択された係数テーブルtから各次数iに対応する係数wt(i)を取得し、取得された各次数iに対応する係数wt(i)をwO(i)とする。
 第三実施形態では、第一実施形態及び第二実施形態とは異なり、ピッチゲインと正の相関関係にある値の式に基づいて係数wO(i)を計算する必要がないため、より少ない演算処理量でwO(i)を決定することができる。
 <第三実施形態の具体例>
 以下、第三実施形態の具体例について説明する。線形予測分析装置2には、ハイパスフィルタを通り、12.8 kHzにサンプリング変換され、プリエンファシス処理をされた1フレームあたりNサンプルのディジタル音響信号である入力信号XO(n) (n=0,1,…,N-1)と、ピッチゲインについての情報として現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)(ただし、Nnは、Nn<Nという関係を満たす所定の正の整数。)についてピッチゲイン計算部950で求めたピッチゲインGとが入力される。現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)についてのピッチゲインGは、ピッチゲイン計算部950において当該入力信号の1つ前のフレームの信号区間として現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)を含めておき、1つ前のフレームの信号区間に対するピッチゲイン計算部950の処理においてXO(n) (n=0, 1, …, Nn)に対して計算し記憶したピッチゲインである。
 自己相関計算部21は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を下記の式(8)で求める。
Figure JPOXMLDOC01-appb-M000010
 係数決定部24に、ピッチゲインについての情報であるピッチゲインGが入力される。
 係数テーブル記憶部25には、係数テーブルt0と、係数テーブルt1と、係数テーブルt2とが記憶されているものとする。
 係数テーブルt0、式(13)の従来法のf0=60Hzの係数テーブルであり、各次数の係数wtO(i)が次のように定められている。
 wt0(i)=[1.0001, 0.999566371, 0.998266613, 0.996104103, 0.993084457, 0.989215493, 0.984507263, 0.978971839, 0.972623467, 0.96547842, 0.957554817, 0.948872864, 0.939454317, 0.929322779, 0.918503404, 0.907022834, 0.894909143]
 係数テーブルt1は、式(13)の従来法のf0=40Hzのテーブルであり、各次数の係数wt1(i)が次のように定められている。
 wt1(i)=[1.0001, 0.999807253, 0.99922923, 0.99826661, 0.99692050, 0.99519245, 0.99308446, 0.99059895, 0.98773878, 0.98450724, 0.98090803, 0.97694527, 0.97262346, 0.96794752, 0.96292276, 0.95755484, 0.95184981]
 係数テーブルt2は、式(13)の従来法のf0=20Hzのテーブルであり、各次数の係数wt2(i)が次のように定められている。
 wt2(i)=[1.0001, 0.99995181, 0.99980725, 0.99956637, 0.99922923, 0.99879594, 0.99826661, 0.99764141, 0.99692050, 0.99610410, 0.99519245, 0.99418581, 0.99308446, 0.99188872, 0.99059895, 0.98921550, 0.98773878]
 ここで、上述のwtO(i), wt1(i), wt2(i)のリストは、Pmax=16として、i=0,1,2,…,16の順に左からiに対応する係数の大きさを並べたものである。すなわち上述の例では、例えばwt0(0)=1.0001であり、wt0(3)=0.996104103である。
 図6に係数テーブルt0,t1,t2の係数wt0(i), wt1(i), wt2(i)の大きさをグラフで表す。図6のグラフの点線は係数テーブルt0の係数wt0(i)の大きさを表し、図6のグラフの一点鎖線は係数テーブルt1の係数wt1(i)の大きさを表し、図6のグラフの実線は係数テーブルt2の係数wt2(i)の大きさを表す。図6のグラフの横軸は次数iを意味し、図6のグラフの縦軸は係数の大きさを表す。このグラフからも分かるように、各係数テーブル内では、iの値が大きくなるにしたがって、係数の大きさが単調減少する関係にある。また、同じiの値に対応する異なる係数テーブルの係数の大きさを比較すると、0を除くi≧1のiに対して、言い換えれば少なくとも一部のiについて、wt0(i)<wt1(i)<wt2(i)の関係を満たしている。係数テーブル記憶部25に記憶される複数の係数テーブルは、このような関係を持つものであれば、上述の例に限らない。
 また、非特許文献1や非特許文献2に記載されているように、i=0の係数だけ特別扱いをして、wt0(0)=wt1(0)=wt2(0)=1.0001やwt0(0)=wt1(0)=wt2(0)=1.003という経験的な値を用いてもよい。なお、i=0についてはwt0(i)<wt1(i)<wt2(i)の関係を満たしている必要はなく、また、wt0(0),wt1(0),wt2(0)が必ずしも同じ値でなくともよい。例えば、wt0(0)=1.0001, wt1(0)=1.0, wt2(0)=1.0のように、i=0に関してのみwt0(0), wt1(0), wt2(0)のうちの2つ以上の値の大小関係がwt0(i)<wt1(i)<wt2(i)の関係を満たさなくてもよい。
 上述の係数テーブルt0は式(13)においてf0=60Hz, fs=12.8kHzとした場合、係数テーブルt1は式(13)においてf0=40Hz, fs=12.8kHzとした場合、係数テーブルt2は式(13)においてf0=20Hzとした場合の係数値に相当するが、これらはそれぞれ、式(2A)においてf(G)=60, fs=12.8kHzとした場合の係数値、f(G)=40, fs=12.8kHzとした場合、f(G)=20, fs=12.8kHzとした場合、に相当し、式(2A)における関数f(G)はピッチゲインGと正の相関関係にある関数である。つまり、3つの係数テーブルの係数値を予め定める際に、予め定めた3つのピッチゲインを用いて式(2A)により係数値を求めることに代えて、予め定めた3つのf0を用いて式(13)により係数値を求めてもよい。
 係数決定部24は、入力されたピッチゲインGを所定の閾値th1=0.3及び閾値th2=0.6と比較し、G≦0.3の場合は係数テーブルt2を、0.3<G≦0.6の場合は係数テーブルt1を、0.6<Gの場合は係数テーブルt0を選択する。
 そして、係数決定部24は、その選択された係数テーブルtの各係数wt(i)を係数wO(i)とする。すなわち、wO(i)=wt(i)とする。言い換えれば、係数決定部24は、選択された係数テーブルtから各次数iに対応する係数wt(i)を取得し、取得された各次数iに対応する係数wt(i)をwO(i)とする。
 <第三実施形態の変形例>
 第三実施形態では複数個の係数テーブルのうち何れか1つのテーブルに記憶された係数を係数wO(i)として決定したが、第三実施形態の変形例はこれに加えて複数個の係数テーブルに記憶された係数に基づく演算処理により係数wO(i)を決定する場合を含む。
 第三実施形態の変形例の線形予測分析装置2の機能構成は、第三実施形態と同じ図4である。第三実施形態の変形例の線形予測分析装置2は、係数決定部24の処理が異なり、係数テーブル記憶部25に含まれる係数テーブルが異なる部分以外は、第三実施形態の線形予測分析装置2と同じである。
 係数テーブル記憶部25には、係数テーブルt0とt2のみが記憶されており、係数テーブルt0には係数wt0(i) (i=0,1,…,Pmax)が格納されており、係数テーブルt2には係数wt2(i) (i=0,1,…,Pmax)が格納されている。2個の係数テーブルt0, t2のそれぞれには、少なくとも一部の各iについてwt0(i)<wt2(i)であり、残りの各iについてwt0(i)≦wt2(i)となるように定められた係数wt0(i) (i=0,1,…,Pmax)と係数wt2(i) (i=0,1,…,Pmax)が格納されている。
 ここで、0<th1<th2という関係を満たす2個の閾値th1,th2が定められているとする。このとき、係数決定部24は、
(1) ピッチゲインと正の相関関係にある値>th2の場合、すなわち、ピッチゲインが大きいと判断された場合には、係数テーブルt0の各係数wt0(i)を係数wO(i)として選択し、
(2) th2≧ピッチゲインと正の相関関係にある値>th1の場合、すなわち、ピッチゲインが中程度であると判断された場合には、係数テーブルt0の各係数wt0(i)と係数テーブルt2の各係数wt2(i)とを用いて、wO(i)=β'×wt0(i)+(1-β')×wt2(i)により係数wO(i)を決定し、
(3) th1≧ピッチゲインと正の相関関係にある値の場合、すなわち、ピッチゲインが小さいと判断された場合には、係数テーブルt2の各係数wt2(i)を係数wO(i)として選択する。
 ここでβ'は、0≦β'≦1であり、ピッチゲインGが小さい値をとるときはβ'の値も小さくなり、ピッチゲインGが大きい値をとるときにβ'の値も大きくなる関数β'=c(G)により、ピッチゲインGから求める値である。この構成とすれば、ピッチゲインが中程度の場合のうちのピッチゲインGが小さい時にはwt2(i)に近い値を係数wO(i)とすることができ、逆にピッチゲインが中程度の場合のうちのピッチゲインGが大きい時にはwt0(i)に近い値を係数wO(i)とすることができるので、2つのテーブルだけで、3個以上の係数wO(i)を得ることができる。
 なお、係数テーブル記憶部25に記憶されている係数テーブルt0, t2のi=0の係数wt0(0), wt2(0)については、wt0(0)≦wt2(0)の関係を満たしていることは必須ではなく、wt0(0)>wt2(0)の関係にある値であってもよい。
 [第一実施形態から第三実施形態に共通の変形例]
 図7及び図8に示すように、上述の全ての実施形態及び変形例において、係数乗算部22を含まず、予測係数計算部23において係数wO(i)と自己相関RO(i)とを用いて線形予測分析を行ってもよい。図7と図8は、それぞれ図1と図4に対応する線形予測分析装置2の構成例である。この場合は、予測係数計算部23は、図9のステップS5において、係数wO(i)と自己相関RO(i)とが乗算されたものである変形自己相関R'O(i)ではなく、係数wO(i)と自己相関RO(i)とを直接用いて線形予測分析を行う(ステップS5)。
 [第四実施形態]
 第四実施形態は、入力信号XO(n)に対して従来の線形予測分析装置を用いて線形予測分析を行い、その線形予測分析の結果を用いてピッチゲイン計算部でピッチゲインを得て、得られたピッチゲインに基づく係数wO(i)を用いて本発明の線形予測分析装置により線形予測係数に変換可能な係数を求めるものである。
 第四実施形態の線形予測分析装置3は、図10に示すように、第一線形予測分析部31、線形予測残差計算部32、ピッチゲイン計算部36、第二線形予測分析部34を例えば備えている。
 [第一線形予測分析部31]
 第一線形予測分析部31は、従来の線形予測分析装置1と同じ動作をする。すなわち、第一線形予測分析部31は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を求め、自己相関RO(i) (i=0,1,…,Pmax)と予め定めた係数wO(i) (i=0,1,…,Pmax)とを同じiごとに乗じることにより変形自己相関R' O(i) (i=0,1,…,Pmax)を求め、変形自己相関R' O(i) (i=0,1,…,Pmax)から1次から予め定めた最大次数であるPmax次までの線形予測係数に変換可能な係数を求める。
 [線形予測残差計算部32]
 線形予測残差計算部32は、入力信号XO(n)に対して、1次からPmax次までの線形予測係数に変換可能な係数に基づく線形予測や線形予測と等価なまたは類似したフィルタリング処理を行って線形予測残差信号XR(n)を求める。フィルタリング処理は重み付け処理とも言えるので、線形予測残差信号XR(n)は重み付け入力信号であるともいえる。
 [ピッチゲイン計算部36]
 ピッチゲイン計算部36は、線形予測残差信号XR(n)のピッチゲインGを求め、ピッチゲインについての情報を出力する。ピッチゲインを求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。ピッチゲイン計算部36は、例えば、現フレームの線形予測残差信号XR (n) (n=0, 1, …, N-1)を構成する複数個のサブフレームのそれぞれについてピッチゲインを求める。すなわち、2以上の整数であるM個のサブフレームであるXRs1(n) (n=0, 1, …, N/M-1), …, XRsM(n) (n=(M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれのピッチゲインであるGs1, …, GsMを求める。NはMで割り切れるとする。ピッチゲイン計算部36は、次に、現フレームを構成するM個のサブフレームのピッチゲインであるGs1, …, GsMのうちの最大値max(Gs1, …, GsM)を特定可能な情報をピッチゲインについての情報として出力する。
 [第二線形予測分析部34]
 第二線形予測分析部34は、本発明の第一実施形態から第三実施形態及びこれらの変形例の線形予測分析装置2の何れかと同じ動作をする。すなわち、第二線形予測分析部34は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を求め、ピッチゲイン計算部36が出力したピッチゲインについての情報に基づいて係数wO(i) (i=0,1,…,Pmax)を決定し、自己相関RO(i) (i=0,1,…,Pmax)と決定した係数wO(i) (i=0,1,…,Pmax)とを用いて変形自己相関R' O(i) (i=0,1,…,Pmax)から1次から予め定めた最大次数であるPmax次までの線形予測係数に変換可能な係数を求める。
 <ピッチゲインと正の相関関係にある値について>
 第一実施形態においてピッチゲイン計算部950の具体例2として説明した通り、ピッチゲインと正の相関関係にある値として、前のフレームの信号処理においてLook-aheadとも呼ばれる先読みして利用するサンプル部分のうち現フレームのサンプルに対応する部分のピッチゲインを用いてもよい。
 また、ピッチゲインと正の相関関係にある値として、ピッチゲインの推定値を用いてもよい。例えば、過去の複数フレームのピッチゲインから予測される現在のフレームについてのピッチゲインの推定値や、過去の複数フレームについてのピッチゲインの平均値や最小値や最大値や重み付線形和を、ピッチゲインの推定値として用いてもよい。また、複数サブフレームについてのピッチゲインの平均値や最小値や最大値や重み付線形和を、ピッチゲインの推定値として用いてもよい。
 また、ピッチゲインと正の相関関係にある値として、ピッチゲインの量子化値を用いてもよい。すなわち、量子化前のピッチゲインを用いてもよいし、量子化後のピッチゲインを用いてもよい。
 なお、上記の各実施形態及び各変形例のピッチゲインと正の相関関係にある値と閾値との比較においては、ピッチゲインと正の相関関係にある値が閾値と同じ値である場合には、閾値を境として隣接する二つの場合の何れか一方に場合分けされるように設定すればよい。すなわち、ある閾値以上の場合としているところを当該閾値より大きい場合とするとともに、当該閾値より小さい場合としているところを当該閾値以下の場合としてもよい。また、ある閾値より大きい場合としているところを当該閾値以上の場合とするとともに、当該閾値以下の場合としているところを当該閾値より小さい場合としてもよい。
 上記装置及び方法において説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
 また、線形予測分析方法における各ステップをコンピュータによって実現する場合、線形予測分析方法が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、その各ステップがコンピュータ上で実現される。
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
 また、各処理手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
 その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

Claims (8)

  1.  入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、
     少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) (i=0, 1, …, Pmax)を計算する自己相関計算ステップと、
     係数wO(i) (i=0, 1, …, Pmax)と前記自己相関RO(i) (i=0, 1, …, Pmax)とが対応するiごとに乗算されたものである変形自己相関R'O(i) (i=0, 1, …, Pmax)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、
     少なくとも一部の各次数iに対して、前記各次数iに対応する係数wO(i)が、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にある場合が含まれている、
     線形予測分析方法。
  2.  入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、
     少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) (i=0, 1, …, Pmax)を計算する自己相関計算ステップと、
     2個以上の係数テーブルのそれぞれにはi=0, 1, …, Pmaxの各次数iと前記各次数iに対応する係数wO(i)とが対応付けて記憶されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて前記2個以上の係数テーブルの中の1個の係数テーブルから係数wO(i) (i=0, 1, …, Pmax)を取得する係数決定ステップと、
     取得された前記係数wO(i) (i=0, 1, …, Pmax)と前記自己相関RO(i) (i=0, 1, …, Pmax)とが対応するiごとに乗算されたものである変形自己相関R' O(i) (i=0, 1, …, Pmax)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、
     前記2個以上の係数テーブルの中の、前記周期性の強さ又はピッチゲインと正の相関関係にある値が第一値である場合に前記係数決定ステップで係数wO(i) (i=0, 1, …, Pmax)が取得される係数テーブルを第一係数テーブルとし、
     前記2個以上の係数テーブルの中の、前記周期性の強さ又はピッチゲインと正の相関関係にある値が前記第一値よりも小さい第二値である場合に前記係数決定ステップで係数wO(i) (i=0, 1, …, Pmax)が取得される係数テーブルを第二係数テーブルとして、
     少なくとも一部の各次数iに対して、前記第二係数テーブルにおける前記各次数iに対応する係数は、前記第一係数テーブルにおける前記各次数iに対応する係数よりも大きい、
     線形予測分析方法。
  3.  入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、
     少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) (i=0, 1, …, Pmax)を計算する自己相関計算ステップと、
     係数テーブルt0には係数wt0(i) (i=0,1,…,Pmax)が格納されており、係数テーブルt1には係数wt1(i) (i=0,1,…,Pmax)、係数テーブルt2には係数wt2(i) (i=0,1,…,Pmax)が格納されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて前記係数テーブルt0,t1,t2の中の1個の係数テーブルから係数を取得する係数決定ステップと、
     前記取得した係数と前記自己相関RO(i) (i=0, 1, …, Pmax)とが対応するiごとに乗算されたものである変形自己相関R' O(i) (i=0, 1, …, Pmax)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、
     前記周期性の強さ又はピッチゲインと正の相関関係にある値に応じて、周期性の強さ又はピッチゲインが大きい場合、周期性の強さ又はピッチゲインが中程度の場合、周期性の強さ又はピッチゲインが小さい場合の何れかの場合に分類されるとし、周期性の強さ又はピッチゲインが大きい場合に前記係数決定ステップで係数が取得される係数テーブルを係数テーブルt0とし、周期性の強さ又はピッチゲインが中程度の場合に前記係数決定ステップで係数が取得される係数テーブルを係数テーブルt1とし、周期性の強さ又はピッチゲインが小さい場合に前記係数決定ステップで係数が取得される係数テーブルを係数テーブルt2として、少なくとも一部のiについてwt0(i)<wt1(i)≦wt2(i)であり、それ以外のiのうちの少なくとも一部の各iについてwt0(i)≦wt1(i)<wt2(i)であり、残りの各iについてwt0(i)≦wt1(i)≦wt2(i)である、
     線形予測分析方法。
  4.  入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析装置であって、
     少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) (i=0, 1, …, Pmax)を計算する自己相関計算部と、
     係数wO(i) (i=0, 1, …, Pmax)と前記自己相関RO(i) (i=0, 1, …, Pmax)とが対応するiごとに乗算されたものである変形自己相関R'O(i) (i=0, 1, …, Pmax)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算部と、を含み、
     少なくとも一部の各次数iに対して、前記各次数iに対応する係数wO(i)が、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にある場合が含まれている、
     線形予測分析装置。
  5.  入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析装置であって、
     少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) (i=0, 1, …, Pmax)を計算する自己相関計算部と、
     2個以上の係数テーブルのそれぞれにはi=0, 1, …, Pmaxの各次数iと前記各次数iに対応する係数wO(i)とが対応付けて記憶されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて前記2個以上の係数テーブルの中の1個の係数テーブルから係数wO(i) (i=0, 1, …, Pmax)を取得する係数決定部と、
     取得された前記係数wO(i) (i=0, 1, …, Pmax)と前記自己相関RO(i) (i=0, 1, …, Pmax)とが対応するiごとに乗算されたものである変形自己相関R' O(i) (i=0, 1, …, Pmax)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算部と、を含み、
     前記2個以上の係数テーブルの中の、前記周期性の強さ又はピッチゲインと正の相関関係にある値が第一値である場合に前記係数決定部で係数wO(i) (i=0, 1, …, Pmax)が取得される係数テーブルを第一係数テーブルとし、
     前記2個以上の係数テーブルの中の、前記周期性の強さ又はピッチゲインと正の相関関係にある値が前記第一値よりも小さい第二値である場合に前記係数決定部で係数wO(i) (i=0, 1, …, Pmax)が取得される係数テーブルを第二係数テーブルとして、
     少なくとも一部の各次数iに対して、前記第二係数テーブルにおける前記各次数iに対応する係数は、前記第一係数テーブルにおける前記各次数iに対応する係数よりも大きい、
     線形予測分析装置。
  6.  入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析装置であって、
     少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) (i=0, 1, …, Pmax)を計算する自己相関計算部と、
     係数テーブルt0には係数wt0(i) (i=0,1,…,Pmax)が格納されており、係数テーブルt1には係数wt1(i) (i=0,1,…,Pmax)、係数テーブルt2には係数wt2(i) (i=0,1,…,Pmax)が格納されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて前記係数テーブルt0,t1,t2の中の1個の係数テーブルから係数を取得する係数決定部と、
     前記取得した係数と前記自己相関RO(i) (i=0, 1, …, Pmax)とが対応するiごとに乗算されたものである変形自己相関R' O(i) (i=0, 1, …, Pmax)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算部と、を含み、
     前記周期性の強さ又はピッチゲインと正の相関関係にある値に応じて、周期性の強さ又はピッチゲインが大きい場合、周期性の強さ又はピッチゲインが中程度の場合、周期性の強さ又はピッチゲインが小さい場合の何れかの場合に分類されるとし、周期性の強さ又はピッチゲインが大きい場合に前記係数決定部で係数が取得される係数テーブルを係数テーブルt0とし、周期性の強さ又はピッチゲインが中程度の場合に前記係数決定部で係数が取得される係数テーブルを係数テーブルt1とし、周期性の強さ又はピッチゲインが小さい場合に前記係数決定部で係数が取得される係数テーブルを係数テーブルt2として、少なくとも一部のiについてwt0(i)<wt1(i)≦wt2(i)であり、それ以外のiのうちの少なくとも一部の各iについてwt0(i)≦wt1(i)<wt2(i)であり、残りの各iについてwt0(i)≦wt1(i)≦wt2(i)である、
     線形予測分析装置。
  7.  請求項1から3の何れかの線形予測分析方法の各ステップをコンピュータに実行させるためのプログラム。
  8.  請求項1から3の何れかの線形予測分析方法の各ステップをコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
PCT/JP2015/051351 2014-01-24 2015-01-20 線形予測分析装置、方法、プログラム及び記録媒体 WO2015111568A1 (ja)

Priority Applications (17)

Application Number Priority Date Filing Date Title
US15/112,534 US9966083B2 (en) 2014-01-24 2015-01-20 Linear predictive analysis apparatus, method, program and recording medium
CN201910634745.6A CN110415714B (zh) 2014-01-24 2015-01-20 线性预测分析装置、线性预测分析方法以及记录介质
PL18196340T PL3441970T3 (pl) 2014-01-24 2015-01-20 Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu
ES15740820T ES2703565T3 (es) 2014-01-24 2015-01-20 Aparato, método, programa y soporte de registro de análisis predictivo lineal
KR1020187003046A KR101850523B1 (ko) 2014-01-24 2015-01-20 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
KR1020167019020A KR101826219B1 (ko) 2014-01-24 2015-01-20 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
JP2015558849A JP6250072B2 (ja) 2014-01-24 2015-01-20 線形予測分析装置、方法、プログラム及び記録媒体
CN201580005196.6A CN106415718B (zh) 2014-01-24 2015-01-20 线性预测分析装置、方法以及记录介质
CN201910634756.4A CN110415715B (zh) 2014-01-24 2015-01-20 线性预测分析装置、线性预测分析方法以及记录介质
KR1020187003053A KR101877397B1 (ko) 2014-01-24 2015-01-20 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
EP18196340.6A EP3441970B1 (en) 2014-01-24 2015-01-20 Linear predictive analysis apparatus, method, program and recording medium
PL15740820T PL3098812T3 (pl) 2014-01-24 2015-01-20 Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu
EP15740820.4A EP3098812B1 (en) 2014-01-24 2015-01-20 Linear predictive analysis apparatus, method, program and recording medium
EP18196351.3A EP3462453B1 (en) 2014-01-24 2015-01-20 Linear predictive analysis apparatus, method, program and recording medium
PL18196351T PL3462453T3 (pl) 2014-01-24 2015-01-20 Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu
US15/924,887 US10163450B2 (en) 2014-01-24 2018-03-19 Linear predictive analysis apparatus, method, program and recording medium
US15/924,963 US10170130B2 (en) 2014-01-24 2018-03-19 Linear predictive analysis apparatus, method, program and recording medium

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2014011317 2014-01-24
JP2014-011317 2014-01-24
JP2014-152526 2014-07-28
JP2014152526 2014-07-28

Related Child Applications (3)

Application Number Title Priority Date Filing Date
US15/112,534 A-371-Of-International US9966083B2 (en) 2014-01-24 2015-01-20 Linear predictive analysis apparatus, method, program and recording medium
US15/924,887 Continuation US10163450B2 (en) 2014-01-24 2018-03-19 Linear predictive analysis apparatus, method, program and recording medium
US15/924,963 Continuation US10170130B2 (en) 2014-01-24 2018-03-19 Linear predictive analysis apparatus, method, program and recording medium

Publications (1)

Publication Number Publication Date
WO2015111568A1 true WO2015111568A1 (ja) 2015-07-30

Family

ID=53681371

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/051351 WO2015111568A1 (ja) 2014-01-24 2015-01-20 線形予測分析装置、方法、プログラム及び記録媒体

Country Status (8)

Country Link
US (3) US9966083B2 (ja)
EP (3) EP3441970B1 (ja)
JP (3) JP6250072B2 (ja)
KR (3) KR101850523B1 (ja)
CN (3) CN106415718B (ja)
ES (3) ES2770407T3 (ja)
PL (3) PL3441970T3 (ja)
WO (1) WO2015111568A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6117359B2 (ja) * 2013-07-18 2017-04-19 日本電信電話株式会社 線形予測分析装置、方法、プログラム及び記録媒体
WO2015111569A1 (ja) 2014-01-24 2015-07-30 日本電信電話株式会社 線形予測分析装置、方法、プログラム及び記録媒体
ES2768090T3 (es) 2014-03-24 2020-06-19 Nippon Telegraph & Telephone Método de codificación, codificador, programa y soporte de registro
KR101920297B1 (ko) * 2014-04-25 2018-11-20 가부시키가이샤 엔.티.티.도코모 선형 예측 계수 변환 장치 및 선형 예측 계수 변환 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007279393A (ja) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> Parcor係数算出装置、parcor係数算出方法、そのプログラムおよびその記録媒体
JP2007286200A (ja) * 2006-04-13 2007-11-01 Nippon Telegr & Teleph Corp <Ntt> 適応ブロック長符号化装置、その方法、プログラム及び記録媒体
JP2008185701A (ja) * 2007-01-29 2008-08-14 Nippon Telegr & Teleph Corp <Ntt> Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体
JP2009500681A (ja) * 2005-07-11 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号のエンコーディング及びデコーディング装置及び方法
WO2010073977A1 (ja) * 2008-12-22 2010-07-01 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
WO2010084951A1 (ja) * 2009-01-23 2010-07-29 日本電信電話株式会社 パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2654542B1 (fr) * 1989-11-14 1992-01-17 Thomson Csf Procede et dispositif de codage de filtres predicteurs de vocodeurs tres bas debit.
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
US5648989A (en) * 1994-12-21 1997-07-15 Paradyne Corporation Linear prediction filter coefficient quantizer and filter set
TW283775B (en) * 1995-10-11 1996-08-21 Nat Science Council Linear prediction coefficient based inverse spectrum coefficient generator
FR2742568B1 (fr) * 1995-12-15 1998-02-13 Catherine Quinquis Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application
CN1202514C (zh) * 2000-11-27 2005-05-18 日本电信电话株式会社 编码和解码语音及其参数的方法、编码器、解码器
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
WO2004084182A1 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Decomposition of voiced speech for celp speech coding
EP2030199B1 (en) * 2006-05-30 2009-10-28 Koninklijke Philips Electronics N.V. Linear predictive coding of an audio signal
US8301444B2 (en) 2008-12-29 2012-10-30 At&T Intellectual Property I, L.P. Automated demographic analysis by analyzing voice activity
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101609678B (zh) * 2008-12-30 2011-07-27 华为技术有限公司 信号压缩方法及其压缩装置
US8665945B2 (en) * 2009-03-10 2014-03-04 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoding device, decoding device, program, and recording medium
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
CN102783034B (zh) * 2011-02-01 2014-12-17 华为技术有限公司 用于提供信号处理系数的方法和设备
WO2012111512A1 (ja) * 2011-02-16 2012-08-23 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
CN102595495A (zh) * 2012-02-07 2012-07-18 北京新岸线无线技术有限公司 一种数据发送、接收方法和装置
CN103050121A (zh) * 2012-12-31 2013-04-17 北京迅光达通信技术有限公司 线性预测语音编码方法及语音合成方法
WO2015111569A1 (ja) * 2014-01-24 2015-07-30 日本電信電話株式会社 線形予測分析装置、方法、プログラム及び記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500681A (ja) * 2005-07-11 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2007279393A (ja) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> Parcor係数算出装置、parcor係数算出方法、そのプログラムおよびその記録媒体
JP2007286200A (ja) * 2006-04-13 2007-11-01 Nippon Telegr & Teleph Corp <Ntt> 適応ブロック長符号化装置、その方法、プログラム及び記録媒体
JP2008185701A (ja) * 2007-01-29 2008-08-14 Nippon Telegr & Teleph Corp <Ntt> Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体
WO2010073977A1 (ja) * 2008-12-22 2010-07-01 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
WO2010084951A1 (ja) * 2009-01-23 2010-07-29 日本電信電話株式会社 パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ITU-T RECOMMENDATION G.718, 2008
ITU-T RECOMMENDATION G.729, 1996
See also references of EP3098812A4
YOH'ICHI TOHKURA ET AL.: "Spectral Smoothing Technique in PARCOR Speech Analysis-Synthesis IEEE Transactions on Acoustics", SPEECH AND SIGNAL PROCESSING, vol. 26, no. 6, December 1978 (1978-12-01), pages 587 - 596, XP002032606 *
YOH'ICHI TOHKURA; FUMITADA ITAKURA; SHIN'ICHIRO HASHIMOTO: "Spectral Smoothing Technique in PARCOR Speech Analysis-Synthesis", IEEE TRANS. ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, vol. ASSP-26, no. 6, 1978, XP002032606, DOI: doi:10.1109/TASSP.1978.1163165

Also Published As

Publication number Publication date
CN110415715A (zh) 2019-11-05
EP3441970B1 (en) 2019-11-13
PL3441970T3 (pl) 2020-04-30
US10163450B2 (en) 2018-12-25
US20160336019A1 (en) 2016-11-17
EP3462453A1 (en) 2019-04-03
CN110415714A (zh) 2019-11-05
JP6416363B2 (ja) 2018-10-31
ES2770407T3 (es) 2020-07-01
US20180211679A1 (en) 2018-07-26
US9966083B2 (en) 2018-05-08
CN106415718B (zh) 2019-10-25
KR20180015284A (ko) 2018-02-12
JP2018028698A (ja) 2018-02-22
KR20160097367A (ko) 2016-08-17
EP3441970A1 (en) 2019-02-13
CN106415718A (zh) 2017-02-15
PL3462453T3 (pl) 2020-10-19
JPWO2015111568A1 (ja) 2017-03-23
US10170130B2 (en) 2019-01-01
CN110415714B (zh) 2022-11-25
JP6250072B2 (ja) 2017-12-20
KR101826219B1 (ko) 2018-02-13
ES2703565T3 (es) 2019-03-11
KR101877397B1 (ko) 2018-07-11
KR20180015286A (ko) 2018-02-12
EP3462453B1 (en) 2020-05-13
PL3098812T3 (pl) 2019-02-28
US20180211678A1 (en) 2018-07-26
EP3098812A1 (en) 2016-11-30
KR101850523B1 (ko) 2018-04-19
EP3098812B1 (en) 2018-10-10
JP2018028699A (ja) 2018-02-22
JP6449968B2 (ja) 2019-01-09
ES2799899T3 (es) 2020-12-22
EP3098812A4 (en) 2017-08-02
CN110415715B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
JP6117359B2 (ja) 線形予測分析装置、方法、プログラム及び記録媒体
JP6423065B2 (ja) 線形予測分析装置、方法、プログラム及び記録媒体
JP6416363B2 (ja) 線形予測分析装置、方法、プログラム及び記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15740820

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2015558849

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 20167019020

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 15112534

Country of ref document: US

REEP Request for entry into the european phase

Ref document number: 2015740820

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2015740820

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE