JP2002082696A - Inspecting method and inspecting device for voice coding and decoding equipment - Google Patents

Inspecting method and inspecting device for voice coding and decoding equipment

Info

Publication number
JP2002082696A
JP2002082696A JP2000271013A JP2000271013A JP2002082696A JP 2002082696 A JP2002082696 A JP 2002082696A JP 2000271013 A JP2000271013 A JP 2000271013A JP 2000271013 A JP2000271013 A JP 2000271013A JP 2002082696 A JP2002082696 A JP 2002082696A
Authority
JP
Japan
Prior art keywords
speech
encoding
output
voice
error signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000271013A
Other languages
Japanese (ja)
Other versions
JP3762204B2 (en
Inventor
Hirohisa Nishino
裕久 西野
Hiroyuki Sasai
浩之 笹井
Yuji Narita
裕二 成田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2000271013A priority Critical patent/JP3762204B2/en
Publication of JP2002082696A publication Critical patent/JP2002082696A/en
Application granted granted Critical
Publication of JP3762204B2 publication Critical patent/JP3762204B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To obtain a voice inspecting method capable of performing the voice inspection of a long time in real time as to the output voices of voice coding and decoding equipment which is made to be the object of the inspection. SOLUTION: In this voice inspecting method, the input voices and the output voices of the voice coding and decoding equipment which produces the output voices by coding and decoding the input voices are sampled respectively and estimated voices which are obtained by estimating voices of the output side of the equipment with the operation between the sampled input voices and the filter coefficient of a digital filter whose filter coefficient is controlled by an adaptive algorithm are produced and differences among the estimated voices and the sampled output voices are calculated and the differences are outputted as an error signal and also the error signal is inputted to the adaptive algorithm to update the filter coefficient of the digital filter by following up the characteristic of the voice coding and decoding equipment.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、入力音声を符号
化し、復号化して出力する音声符号化・復号化機器の検
査方法および検査装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an inspection method and an inspection apparatus for an audio encoding / decoding device for encoding, decoding, and outputting an input audio.

【0002】[0002]

【従来の技術】従来の音声符号化・復号化機器の検査方
法としては、特開平7−84596号公報に符号化音声
の品質評価方法が示されている。この品質評価方法はフ
ローチャートを図7に示す通りであり、SB1におい
て、その原音声データが被測定符号化・復号化装置で符
号化された音声が、例えば20ms毎に1フレームにま
とめられ、原音声データと復号化されて出力された音声
データとを高速フーリエ変換し、SB2において、パワ
ースペクトルの算出処理により、短時間音声スペクトル
の実数部と虚数部とが分離され、2乗和されて短時間パ
ワースペクトルが出力され、短時間パワースペクトルは
周波数軸からBark周波数に変換される。
2. Description of the Related Art As a conventional method for testing speech encoding / decoding equipment, Japanese Patent Laid-Open No. 7-84596 discloses a method for evaluating the quality of encoded speech. This quality evaluation method is as shown in the flowchart of FIG. 7. In SB1, the sound obtained by encoding the original audio data by the encoding / decoding device to be measured is combined into one frame every 20 ms, for example. The audio data and the decoded and output audio data are subjected to fast Fourier transform. In SB2, the real part and the imaginary part of the short-time audio spectrum are separated by the power spectrum calculation process, and the short-time is calculated by sum of squares. A time power spectrum is output, and the short-time power spectrum is converted from the frequency axis to the Bark frequency.

【0003】SB3において、短時間パワースペクトル
とあらかじめフィルタ係数記憶部に記憶された例えば図
8に示す臨界帯域フィルタのフィルタ係数との乗算(以
下、畳み込みという)が行われ、次にフィルタ係数の複
数個のセットと短時間パワースペクトルの畳み込みによ
って複数個の臨界帯域パワースペクトルが得られ、臨界
パワースペクトルに等ラウドネス曲線を模擬したプリエ
ンファシス特性が乗算されて複数個の総合的な臨界帯域
パワースペクトルが得られ、SB4において、プリエン
ファシス処理とBarkスペクトルの計算処理が行わ
れ、SB5において、各フレーム毎のマスキング量計算
処理が行われて現フレームでのBarkスペクトルが求
められ、SB6において、歪計算処理が行われる。
In SB3, a multiplication (hereinafter referred to as convolution) of the short-time power spectrum and a filter coefficient of a critical band filter shown in FIG. 8 stored in advance in a filter coefficient storage unit is performed. A plurality of critical band power spectra are obtained by convolving the set and the short-time power spectrum. At SB4, a pre-emphasis process and a calculation process of the Bark spectrum are performed. At SB5, a masking amount calculation process is performed for each frame to obtain a Bark spectrum at the current frame. At SB6, a distortion calculation process is performed. Is performed.

【0004】この方法によれば符号化音声の品質を高い
精度で推定でき、しかも計算量が削減できるという効果
が得られると示されている。
According to this method, it is shown that the quality of a coded speech can be estimated with high accuracy, and the effect of reducing the amount of calculation can be obtained.

【0005】[0005]

【発明が解決しようとする課題】上記の従来の音声符号
化・復号化機器の品質評価方法は、入力される原音声
(以下入力音声と呼称する)と、入力音声を符号化・復
号化した音声(以下、出力音声と呼称する)とを高速フ
ーリエ変換し、各周波数領域にて入力音声および出力音
声の特徴量を抽出し、比較して評価する方法であり、時
間領域から周波数領域への変換に時間を要するためにリ
アルタイムで長時間の音声検査を行うことができないと
いう問題点、および検査対象機器の符号化・復号化に要
する時間が変動する場合に、周波数領域での特徴量を比
較するこの方法では、符号化・復号化に要する時間変動
に対応できず正確な検査ができないという問題点があっ
た。
In the above-described conventional method for evaluating the quality of a speech encoding / decoding device, an input original speech (hereinafter referred to as an input speech) and an input speech are encoded and decoded. This is a method of performing a fast Fourier transform on a voice (hereinafter, referred to as an output voice) and extracting and comparing and evaluating the feature amounts of an input voice and an output voice in each frequency domain. Compare the amount of features in the frequency domain when there is a problem that a long time voice test cannot be performed in real time due to the time required for conversion, and when the time required for encoding and decoding of the device under test varies. However, this method has a problem in that it is not possible to cope with a time variation required for encoding / decoding and to perform an accurate inspection.

【0006】この発明は上記問題点を解決するためにな
されたものであり、対象とする符号化・復号化機器の出
力音声をリアルタイムに長時間の音声検査ができる音声
検査方法および検査装置を提供することを目的とするも
のである。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problem, and provides a voice inspection method and a voice inspection apparatus capable of performing real-time and long-term voice inspection of an output voice of a target encoding / decoding device. It is intended to do so.

【0007】[0007]

【課題を解決するための手段】この発明の請求項1に係
る音声符号化・復号化機器の検査方法は、入力音声を符
号化・復号化して出力音声を作成する音声符号化・復号
化機器の入力音声およびを出力音声をそれぞれサンプリ
ングし、サンプリングされた入力音声と適応アルゴリズ
ムによってフィルタ係数が制御されたディジタルフィル
タのフィルタ係数との演算により出力側の音声を推定し
た推定音声を作成し、この推定音声と上記サンプリング
された出力音声との差を算出し、誤差信号として出力す
るとともに、適応アルゴリズムに入力して音声符号化・
復号化機器の特性変動に追随してディジタルフィルタの
フィルタ係数の更新を行う方法である。
According to a first aspect of the present invention, there is provided an audio encoding / decoding device inspection method for encoding / decoding an input audio to generate an output audio. An input voice and an output voice are sampled, and an estimated voice is generated by estimating a voice on the output side by calculating a sampled input voice and a filter coefficient of a digital filter whose filter coefficient is controlled by an adaptive algorithm. The difference between the estimated speech and the sampled output speech is calculated and output as an error signal.
This is a method of updating the filter coefficient of the digital filter following the characteristic fluctuation of the decoding device.

【0008】この発明の請求項2に係る音声符号化・復
号化機器の検査装置は、入力音声を符号化・復号化して
出力音声を作成する音声符号化・復号化機器の入力音声
をサンプリングする入力音声検出部と、出力音声をサン
プリングする出力音声検出部と、サンプリングされた入
力音声と適応アルゴリズムによって音声符号化・復号化
機器の特性変動に追従するようにフィルタ係数が制御さ
れたディジタルフィルタのフィルタ係数とにより出力側
の音声を推定した推定音声を作成する推定音声作成部
と、推定音声と上記出力音声との差を算出して誤差信号
として出力するとともに、推定音声作成部の適応アルゴ
リズムに入力する誤差信号作成部と、誤差信号を評価す
る誤差評価部とで構成したものである。
According to a second aspect of the present invention, a speech encoding / decoding device inspection apparatus samples an input speech of a speech encoding / decoding device that encodes / decodes an input speech to create an output speech. An input audio detection unit, an output audio detection unit that samples output audio, and a digital filter in which a filter coefficient is controlled so as to follow a characteristic change of the audio encoding / decoding device by the sampled input audio and an adaptive algorithm. An estimated voice generating unit that generates an estimated voice by estimating the output-side voice based on the filter coefficient; and calculating a difference between the estimated voice and the output voice and outputting the calculated error as an error signal, and an adaptive algorithm of the estimated voice generating unit. It is composed of an input error signal generator and an error evaluator for evaluating the error signal.

【0009】この発明の請求項3に係る音声符号化・復
号化機器の検査装置は、請求項2の構成の誤差評価部に
は、音声異常検出レベルが設定され、誤差信号が音声異
常検出レベルを超えたときに異常信号を出力するように
構成したものである。
According to a third aspect of the present invention, in the inspection apparatus for an audio encoding / decoding device, the error evaluator having the configuration according to the second aspect is provided with a voice abnormality detection level, and the error signal is set to the audio abnormality detection level. When the value exceeds the limit, an abnormal signal is output.

【0010】この発明の請求項4に係る音声符号化・復
号化機器の検査装置は、請求項2の構成の誤差評価部に
は音声異常検出レベルが設定され、誤差信号が音声異常
検出レベルを超えた時間をカウントして誤差信号の大き
さを評価して出力するように構成したものである。
[0010] According to a fourth aspect of the present invention, in the inspection apparatus for audio encoding / decoding equipment, the error evaluator having the configuration according to the second aspect is provided with a speech abnormality detection level, and the error signal indicates the speech abnormality detection level. The configuration is such that the time exceeded is counted, and the magnitude of the error signal is evaluated and output.

【0011】この発明の請求項5に係る音声符号化・復
号化機器の検査装置は、請求項3または請求項4の構成
の誤差評価部に備えられた音声異常検出レベルは、入力
音声の大きさに応じて設定するように構成したものであ
る。
According to a fifth aspect of the present invention, in the inspection apparatus for an audio encoding / decoding device, the audio abnormality detection level provided in the error estimating unit according to the third or fourth aspect is such that the level of the input audio is large. It is configured to be set according to the degree.

【0012】この発明の請求項6に係る音声符号化・復
号化機器の検査方法は、請求項1の方法において誤差信
号が所定のレベルを超えたときに、ディジタルフィルタ
の適応アルゴリズムによるフィルタ係数の制御を一定時
間停止させる方法である。
According to a sixth aspect of the present invention, there is provided a method for inspecting a speech encoding / decoding device, comprising the steps of: obtaining a filter coefficient by an adaptive algorithm of a digital filter when an error signal exceeds a predetermined level; This is a method of stopping the control for a certain time.

【0013】この発明の請求項7に係る音声符号化・復
号化機器の検査装置は、請求項2乃至5の構成の推定音
声作成部は、誤差信号が所定のレベルを超えたときに、
ディジタルフィルタの適応アルゴリズムによるフィルタ
係数の制御を一定時間停止させるように構成したもので
ある。
According to a seventh aspect of the present invention, in the inspection apparatus for a speech encoding / decoding device, the estimated speech creation unit having the configuration according to any one of the second to fifth aspects is configured such that when the error signal exceeds a predetermined level,
The control of the filter coefficient by the adaptive algorithm of the digital filter is stopped for a certain period of time.

【0014】この発明の請求項8に係る音声符号化・復
号化機器の検査方法は、請求項1または請求項6の方法
において、音声符号化・復号化機器の符号化・復号化に
要する時間の変動に応じて、入力音声とディジタルフィ
ルタの演算に用いる時間区間を変動させて推定音声を作
成する方法である。
According to an eighth aspect of the present invention, there is provided a method for inspecting an audio encoding / decoding device according to claim 1 or 6, wherein the time required for encoding / decoding of the audio encoding / decoding device. In this method, the estimated speech is created by varying the input speech and the time interval used for the operation of the digital filter in accordance with the variation of the input speech.

【0015】この発明の請求項9に係る音声符号化・復
号化機器の検査装置は、請求項2乃至請求項5および請
求項7の構成の推定音声作成部は、符号化・複合化機器
の符号化・復号化に要する時間変動に応じて、入力音声
とディジタルフィルタの演算に用いる時間区間を変動さ
せて推定音声を作成するように構成したものである。
According to a ninth aspect of the present invention, there is provided an inspection apparatus for an audio encoding / decoding device. The estimated speech is created by varying the time interval used for the operation of the input speech and the digital filter in accordance with the time variation required for encoding / decoding.

【0016】[0016]

【発明の実施の形態】実施の形態1.図1は実施の形態
1の音声符号化・復号化機器の検査装置の構成を示すブ
ロック図、図2は図1の構成の検査装置による検査方法
のフローチャートである。図において、1は検査の対象
となる音声符号化・復号化機器である。2は入力音声を
サンプリングする入力音声検出部、3は出力音声をサン
プリングする出力音声検出部である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiment 1 FIG. 1 is a block diagram showing a configuration of an inspection apparatus for a speech encoding / decoding device according to Embodiment 1, and FIG. 2 is a flowchart of an inspection method by the inspection apparatus having the configuration shown in FIG. In the figure, reference numeral 1 denotes an audio encoding / decoding device to be inspected. Reference numeral 2 denotes an input voice detection unit that samples input voice, and reference numeral 3 denotes an output voice detection unit that samples output voice.

【0017】4はサンプリングされた入力音声から出力
音声を推定した推定音声を作成する推定音声作成部であ
り、適応型ディジタルフィルタ4aと、入力音声および
推定音声と出力音声との差が入力されて適応型ディジタ
ルフィルタのフィルタ係数を音声符号化・復号化機器の
特性変動に追従するように制御する適応アルゴリズム4
bとで構成されている。5は推定音声と出力音声との差
を算出して誤差評価部に出力するとともに、適応アルゴ
リズム4bに入力する誤差信号作成部である。6は誤差
信号作成部5からの誤差信号を評価する誤差評価部であ
る。
Reference numeral 4 denotes an estimated voice generation unit for generating an estimated voice by estimating the output voice from the sampled input voice. The adaptive digital filter 4a receives the input voice and the difference between the estimated voice and the output voice. An adaptive algorithm 4 for controlling the filter coefficients of the adaptive digital filter so as to follow the characteristic fluctuation of the speech encoding / decoding device 4
b. Reference numeral 5 denotes an error signal creation unit that calculates a difference between the estimated speech and the output speech, outputs the difference to the error evaluation unit, and inputs the difference to the adaptive algorithm 4b. Reference numeral 6 denotes an error evaluator for evaluating the error signal from the error signal generator 5.

【0018】次に図2のフローチャートによって実施の
形態1の検査方法を説明する。ステップS1において、
入力音声検出部2にて入力音声x(n)、出力音声検出部3
において出力音声d(n)をそれぞれサンプリングする。n
はサンプリングした時刻である。ステップS2におい
て、推定音声作成部4で(式1)によりフィルタ処理を
行い入力音声から出力側の音声を推定した推定音声y(n)
を算出する。
Next, the inspection method according to the first embodiment will be described with reference to the flowchart of FIG. In step S1,
Input voice x (n) in input voice detection unit 2, output voice detection unit 3
Sample the output sound d (n). n
Is the sampling time. In step S2, an estimated sound y (n) obtained by performing a filter process in (Equation 1) in the estimated sound creation unit 4 and estimating the output-side sound from the input sound
Is calculated.

【0019】[0019]

【数1】 (Equation 1)

【0020】Wiは i番目のディジタルフィルタのフィル
タ係数、I はフィルタのタップ数、idは時間遅れであ
る。
Wi is the filter coefficient of the i-th digital filter, I is the number of taps of the filter, and id is the time delay.

【0021】次にステップS3では、誤差信号作成部5
において、出力音声d(n)と推定音声y(n)との差 e(n)=
d(n)−y(n) を算出し、これを誤差信号e(n)として誤差
評価部6に出力するとともに、推定音声作成部4の適応
アルゴリズム4bに入力する。ステップS4では、誤差
評価部6において音声符号化・復号化機器の誤差信号e
の波形として表示され、波形を監視することで誤差信号
eの評価が行われる。
Next, in step S3, the error signal generator 5
, The difference e (n) between the output speech d (n) and the estimated speech y (n)
d (n) −y (n) is calculated and output to the error evaluator 6 as the error signal e (n), and is also input to the adaptive algorithm 4 b of the estimated speech generator 4. In step S4, the error evaluator 6 outputs the error signal e of the speech encoding / decoding device.
The error signal e is evaluated by monitoring the waveform.

【0022】ステップ5において、誤差信号作成部5か
ら誤差信号e(n)が入力された、適応アルゴリズム4bに
よって出力音声d(n)と推定音声y(n)との差e(n)の2乗平
均値を(式2)で演算し、差e(n)が最小となるようにス
テップS1にもどって処理を繰り返してディジタルフィ
ルタのフィルタ係数の更新を行う。
In step 5, the error signal e (n) is input from the error signal generator 5 and the difference e (n) between the output voice d (n) and the estimated voice y (n) is calculated by the adaptive algorithm 4b. The square mean value is calculated by (Equation 2), and the process returns to step S1 so that the difference e (n) is minimized, and the process is repeated to update the filter coefficient of the digital filter.

【0023】[0023]

【数2】 (Equation 2)

【0024】次に音声符号化・復号化機器を上記図1の
構成において図2のフローチャートにしたがって音声検
査を実施した場合の各音声波形の状況について説明す
る。図3は音声符号化・復号化機器について音声検査を
実施した場合の各音声および誤差信号の状況を示すもの
である。(a)が入力音声x、(b)が出力音声d、
(c)が推定音声y、(d)が誤差信号eである。実際
には出力音声dは入力音声xより符号化・復号化機器に
おける符号化・復号化する時間の遅れがあるが、図3は
入力音声xと出力音声yの時間軸の始点を合わせて表示
している。
Next, a description will be given of the state of each audio waveform when the audio encoder / decoder performs the audio inspection according to the flowchart of FIG. 2 in the configuration of FIG. FIG. 3 shows the state of each voice and error signal when a voice test is performed on a voice encoding / decoding device. (A) is an input voice x, (b) is an output voice d,
(C) is the estimated voice y, and (d) is the error signal e. Actually, the output audio d has a longer time for encoding / decoding in the encoding / decoding device than the input audio x, but FIG. 3 shows the start points of the time axes of the input audio x and the output audio y together. are doing.

【0025】図3の音声検査の例では、時間軸0〜0.
8秒の間は誤差信号eは0であり正常であることを示し
ている。時間軸0.8〜1.17秒の間には誤差信号e
が現れており異常があることを示している。実際の出力
音声dは音声が途切れた状態になっている。音声検査は
誤差信号eの振幅を監視することで音声符号化・復号化
機器の良否が連続してリアルタイムで検査することがで
きる。
In the example of the voice test shown in FIG.
During eight seconds, the error signal e is 0, indicating that it is normal. Error signal e during the time axis of 0.8 to 1.17 seconds
Appears, indicating that there is an abnormality. The actual output sound d is in a state where the sound is interrupted. In the audio inspection, the quality of the audio encoding / decoding device can be continuously inspected in real time by monitoring the amplitude of the error signal e.

【0026】検査対象の符号化・復号化機器の符号化・
復号化に要する時間が変動する場合でも、時間の変動が
サンプルステップ数に換算して、id〜id+I−1の範囲
であれば(式1)(式2)の演算によりその時間変動に
対応した出力音声dを推定し正確な検査を行うことがで
きる。つまり、検査対象機器の符号化・復号化に要する
時間変動がid〜id+I−1の範囲になるようにidとIの
値が設定されている。
The encoding / decoding device of the encoding / decoding device to be inspected
Even when the time required for decoding varies, the time variation is converted to the number of sample steps, and if it is in the range of id to id + I-1, the time variation can be handled by the calculations of (Equation 1) and (Equation 2). The output sound d can be estimated and an accurate inspection can be performed. That is, the values of id and I are set so that the time variation required for encoding / decoding of the inspection target device is in the range of id to id + I-1.

【0027】このように入力音声xと出力音声dとを検
出し、入力音声xから出力音声dの推定を適応型のディ
ジタルフィルタを用いて行い、出力音声dと推定音声y
とを時間領域で比較することで音声検査がリアルタイム
で長時間継続して検査できる音声符号化・復号化検査装
置が得られる。
As described above, the input voice x and the output voice d are detected, and the output voice d is estimated from the input voice x using an adaptive digital filter.
Is compared in the time domain to obtain an audio encoding / decoding inspection apparatus capable of performing audio inspection continuously in real time for a long time.

【0028】また、検査対象の符号化・復号化機器の符
号化・復号化に要する時間が変動する場合でも、符号化
・復号化に要する時間変動がid〜id+I−1の範囲であ
れば、その時間変動に対応した推定音声yを推定し、正
確な検査が実施できる。
Further, even when the time required for encoding / decoding of the encoding / decoding device to be inspected fluctuates, if the time variation required for encoding / decoding ranges from id to id + I-1, The estimated voice y corresponding to the time variation is estimated, and an accurate inspection can be performed.

【0029】実施の形態2.実施の形態1の図1の構成
においては、誤差信号eを波形として表示するものであ
ったが、実施の形態2の構成は、実施の形態1の誤差評
価部6に音声異常検出レベルを設定した構成としたもの
である。
Embodiment 2 In the configuration of FIG. 1 of the first embodiment, the error signal e is displayed as a waveform. However, in the configuration of the second embodiment, the audio abnormality detection level is set in the error evaluator 6 of the first embodiment. The configuration is as follows.

【0030】誤差評価部6では誤差信号作成部5で作成
された誤差信号eが、音声異常検出レベルを超えたとき
に異常信号を出力することにより、必要とする音声異常
レベルに対応した音声検査が効率よく実施できる。
The error evaluator 6 outputs an abnormal signal when the error signal e generated by the error signal generator 5 exceeds the audio abnormality detection level, thereby providing a sound inspection corresponding to the required audio abnormality level. Can be implemented efficiently.

【0031】実施の形態3.実施の形態2は、実施の形
態1の誤差評価部6に音声異常検出レベルを備え、誤差
評価部6に誤差信号eが音声異常検出レベルを超えたと
きに、異常信号を出力する構成であったが、この実施の
形態3は、さらに超えた部分の持続時間を検出する構成
としたものである。図4に実施の形態2の誤差評価部6
に音声異常検出レベルを設定した場合の誤差信号eの例
を示す。
Embodiment 3 The second embodiment has a configuration in which the error evaluator 6 of the first embodiment is provided with a speech abnormality detection level, and outputs an abnormality signal to the error evaluator 6 when the error signal e exceeds the speech abnormality detection level. However, in the third embodiment, the configuration is such that the duration of the portion that is further exceeded is detected. FIG. 4 shows an error evaluator 6 according to the second embodiment.
Shows an example of the error signal e when the audio abnormality detection level is set in FIG.

【0032】図4において、音声異常検出レベルは誤差
信号eのレベル0.5に設定した場合を示すものであ
り、誤差評価部6において誤差信号eの振幅を常時監視
し、誤差信号eが設定された音声異常検出レベルを超え
たサンプルステップ数、すなわち図4に示す音声異常検
出レベルの外側にある誤差信号eの点数をカウントし、
このカウント数により誤差信号の持続時間が評価され、
音声異常の時間を考慮した検査が実施できる。
FIG. 4 shows a case where the audio abnormality detection level is set to the level 0.5 of the error signal e, and the error evaluator 6 constantly monitors the amplitude of the error signal e and sets the error signal e. The number of sample steps exceeding the detected audio abnormality detection level, that is, the number of error signals e outside the audio abnormality detection level shown in FIG.
The duration of the error signal is evaluated by this count number,
An inspection can be performed in consideration of the time of the voice abnormality.

【0033】実施の形態4.実施の形態4は、実施の形
態2または実施の形態3の構成の誤差評価部6に設定し
た音声異常検出レベルを入力音声のレベルに応じて段階
的に設定できるように構成したものである。
Embodiment 4 The fourth embodiment is configured such that the audio abnormality detection level set in the error evaluation unit 6 of the configuration of the second or third embodiment can be set stepwise according to the level of the input audio.

【0034】このように構成すると、音声異常検査レベ
ルが検査される符号化・復号化機器の入力音声レベルの
変動に関わりなく要求される評価レベルに合わせた検査
が実施できるので、広範囲の検査対象機器に適用可能な
検査装置が構成できる。
[0034] With this configuration, it is possible to carry out the inspection in accordance with the required evaluation level regardless of the fluctuation of the input audio level of the encoding / decoding equipment whose audio abnormality inspection level is inspected. An inspection device applicable to equipment can be configured.

【0035】実施の形態5.実施の形態1の図1の音声
符号化・復号化機器の検査装置の構成において、適応ア
ルゴリズムによるフィルタ係数の更新を続行すると、誤
差信号が収束し、実施の形態2または実施の形態3にお
ける音声異常検出レベルを超えたときの音声異常検出レ
ベルの外側にある誤差信号eが小さくなって的確な音声
検査が困難になる可能性がある。この実施の形態5で
は、図1の構成に音声異常検出レベルを備えた実施の形
態2または実施の形態3の構成に加えて、初めて誤差信
号eが音声異常検出レベルを超えたとき以後の一定時
間、適応アルゴリズムによるフィルタ係数の制御を停止
させるように構成したものである。
Embodiment 5 FIG. In the configuration of the test apparatus of the speech encoding / decoding device in FIG. 1 according to the first embodiment, if the update of the filter coefficient by the adaptive algorithm is continued, the error signal converges, and the speech in the second or third embodiment There is a possibility that the error signal e outside the audio abnormality detection level when the abnormality detection level is exceeded becomes small, making it difficult to perform an accurate audio inspection. In the fifth embodiment, in addition to the configuration of the second or third embodiment in which the audio abnormality detection level is provided in the configuration of FIG. 1, a certain amount of time after the error signal e exceeds the audio abnormality detection level for the first time. It is configured to stop the control of the filter coefficient by the time and the adaptive algorithm.

【0036】このように適応アルゴリズムによるフィル
タ係数の制御を一定時間停止することにより、誤差信号
eの収束を防いで音声異常を強調した音声検査が可能な
検査装置が得られる。
As described above, by stopping the control of the filter coefficient by the adaptive algorithm for a certain period of time, it is possible to obtain an inspection apparatus capable of preventing a convergence of the error signal e and performing a voice test in which a voice abnormality is emphasized.

【0037】実施の形態6.検査される符号化・復号化
機器の符号化・復号化に要する時間の変動の巾がサンプ
ルステップ数に換算してフィルタタップ数Iを超える場
合は正確な検査を行うことが困難になる。この場合はフ
ィルタタップ数Iを大きくすれば解決できるが、フィル
タ処理のフィルタ係数更新の演算量が増し、リアルタイ
ムで検査ができなくなる問題点がある。実施の形態6
は、この問題点を解決するために推定音声作成部4の入
力音声xから推定音声yを推定するときに用いるディジ
タルフィルタの時間区間を符号化・復号化に要する時間
の変動に応じて変動させた構成である。
Embodiment 6 FIG. If the fluctuation of the time required for encoding / decoding of the encoding / decoding device to be inspected exceeds the number of filter taps I in terms of the number of sample steps, it becomes difficult to perform an accurate inspection. In this case, the problem can be solved by increasing the number of filter taps I. However, there is a problem that the amount of calculation for updating the filter coefficient of the filtering process increases, and the inspection cannot be performed in real time. Embodiment 6
In order to solve this problem, the time interval of a digital filter used when estimating the estimated speech y from the input speech x of the estimated speech creation unit 4 is varied according to the variation in the time required for encoding and decoding. Configuration.

【0038】以下具体的な方法について説明する。図5
は音声符号化・復号化機器の符号化・復号化に要する時
間の変動に応じて入力音声xとディジタルフィルタのフ
ィルタ係数の演算に用いる時間区間を変動させる場合の
音声検査方法のフローチャートである。音声検査装置は
図1と同一の構成である。ステップS11において、入
力音声x(n)を入力音声検出部2において、出力音声d(n)
を出力音声検出部3においてそれぞれサンプリングす
る。nはサンプリングした時刻である。ステップS12
において、推定音声作成部4で次に示す(式3)(式
4)(式5)によりフィルタ処理を行い、3通りの推定
音声yJ、yJ+1、yJ−1を求める。
Hereinafter, a specific method will be described. FIG.
5 is a flowchart of a speech inspection method in a case where a time interval used for calculating an input speech x and a filter coefficient of a digital filter is varied according to a variation in time required for encoding / decoding of a speech encoding / decoding device. The voice inspection device has the same configuration as that of FIG. In step S11, the input voice x (n) is output by the input voice detection unit 2 to the output voice d (n).
Are sampled in the output sound detection unit 3 respectively. n is the sampling time. Step S12
, The estimated voice creating unit 4 performs a filtering process using the following (Equation 3), (Equation 4), and (Equation 5) to obtain three estimated voices yJ, yJ + 1, and yJ-1.

【0039】[0039]

【数3】 (Equation 3)

【0040】Jはフィルタ演算時刻の変動量を示す変数
であり、初期のフィルタ演算時刻(J=0)から符号化
・復号化処理に要する時間の変動に応じて演算に用いる
ディジタルフィルタと入力音声xの時間区間を変動させ
たものである。yJは現在のフィルタ演算時刻での推定音
声、yJ+1は現在の演算時刻からサンプルステップを1
つ進めた場合の推定音声、yJ−1は現在の演算時刻から
サンプルステップを1つだけ遅らせた推定音声である。
J is a variable indicating the amount of change in the filter operation time. The digital filter and the input voice used for the operation according to the change in the time required for the encoding / decoding processing from the initial filter operation time (J = 0). The time interval of x is varied. yJ is the estimated voice at the current filter operation time, and yJ + 1 is one sample step from the current operation time.
The estimated voice when advanced by one, yJ-1 is an estimated voice obtained by delaying the sample step by one from the current calculation time.

【0041】次にステップ13において、3通りの誤差
信号e即ち、 eJ=d(n)−yJ eJ+1=d(n)−yJ+1 eJ−1
=d(n)−yJ−1 を算出し、ステップ14で、eJ、eJ+1、eJ−1の内絶
対値が最小のものを真の誤差信号e(n)とし、それに応じ
てフィルタ演算時刻Jを更新する。
Next, at step 13, three error signals e, ie, eJ = d (n) -yJ eJ + 1 = d (n) -yJ + 1 eJ-1
= D (n) -yJ-1 and, in step 14, the one having the smallest absolute value among eJ, eJ + 1, and eJ-1 is taken as the true error signal e (n), and the filter operation time J To update.

【0042】ステップ15において、誤差評価部6の誤
差信号eの大きさを評価して音声検査を実施する。ステ
ップ16においては、算出された誤差信号e(n)を適応ア
ルゴリズム4bに入力し、出力音声d(n)と推定音声y(n)
との差e(n)の2乗平均値を(式2)で演算し、差e(n)が
最小となるようにステップS11にもどって処理を繰り
返してディジタルフィルタのフィルタ係数の更新を行
う。この実施の形態5における誤差信号eの評価は上記
実施の形態1〜4と同様に行われる。
In step 15, the magnitude of the error signal e of the error evaluator 6 is evaluated and a voice test is performed. In step 16, the calculated error signal e (n) is input to the adaptive algorithm 4b, and the output speech d (n) and the estimated speech y (n)
The mean square value of the difference e (n) is calculated by (Equation 2), and the process returns to step S11 to repeat the process so as to update the filter coefficient of the digital filter so that the difference e (n) is minimized. . The evaluation of the error signal e in the fifth embodiment is performed in the same manner as in the first to fourth embodiments.

【0043】次に実施の形態5の演算に用いるディジタ
ルフィルタと入力音声の時間区間を変動させる処理につ
いて説明する。フィルタ演算時刻Jは初期値を0とし、
出力音声dは入力音声xに対して時間遅れid+Dだけ変
化させたものと仮定し、入力音声xから出力音声dを推
定するフィルタ係数は、WD=1、Wi=0(i≠D)が理
想的である。図6はこの場合の入力音声x、出力音声
d、フィルタ係数を示したものである。図中はyJを求
めるためのフィルタ係数および入力音声xの演算区間、
はyJ+1を求めるためのフィルタ係数および入力音声
の演算区間、はyJ−1を求めるためのフィルタ係数お
よび入力音声xの演算区間である。
Next, a description will be given of a digital filter used in the calculation of the fifth embodiment and a process of changing the time interval of the input voice. The initial value of the filter operation time J is 0,
The output voice d is assumed to be changed by a time delay id + D with respect to the input voice x, and the filter coefficients for estimating the output voice d from the input voice x are ideally WD = 1 and Wi = 0 (i ≠ D). It is a target. FIG. 6 shows the input voice x, the output voice d, and the filter coefficient in this case. In the figure, a filter coefficient for obtaining yJ and a calculation section of the input voice x,
Is a calculation section of the filter coefficient and input voice for obtaining yJ + 1, and is a calculation section of the filter coefficient and input voice x for obtaining yJ-1.

【0044】0≦D<Iの場合、演算区間で理想的な
フィルタ係数が実現できるため、演算区間を遅延させる
必要はない。時間遅れが変動してD≧Iとなった場合、
演算区間では理想的なフィルタ係数が実現できず、
演算区間でのみフィルタ係数が実現できる。よって誤
差信号eJ+1が最小となり、フィルタ演算時刻Jが1イ
ンクリメントされて演算区間がに移動する。同様に時
間遅れが変動してD<0となった場合、演算区間のみ
で理想的なフィルタ係数が実現できるため、誤差信号eJ
−1が最小となり、フィルタ演算時刻Jがデクリメント
されて演算区間がに移動する。以上のように演算に用
いるディジタルフィルタと入力音声xの時間区間は、入
力音声xと出力音声y間の時間遅れの変動に応じて移動
することになる。
In the case of 0 ≦ D <I, an ideal filter coefficient can be realized in the operation section, so that there is no need to delay the operation section. When the time delay fluctuates and D ≧ I,
In the calculation section, ideal filter coefficients cannot be realized,
The filter coefficient can be realized only in the calculation section. Therefore, the error signal eJ + 1 becomes minimum, the filter operation time J is incremented by 1, and the operation section moves to. Similarly, when the time delay fluctuates and D <0, an ideal filter coefficient can be realized only in the calculation section, and thus the error signal eJ
−1 becomes the minimum, the filter operation time J is decremented, and the operation section moves to. As described above, the time interval between the digital filter used for the calculation and the input voice x moves according to the fluctuation of the time delay between the input voice x and the output voice y.

【0045】このようにこの実施の形態6によれば、検
査対象の符号化・復号化機器に要する時間の変動幅が大
きい場合でもその変動に応じて演算に用いるディジタル
フィルタと入力音声xの時間区間を変動させることによ
り、音声の良否をリアルタイムで検査することができ
る。
As described above, according to the sixth embodiment, even when the fluctuation range of the time required for the encoding / decoding device to be inspected is large, the digital filter used for the calculation and the time of the input voice x in accordance with the fluctuation. By varying the section, it is possible to inspect the quality of the voice in real time.

【0046】[0046]

【発明の効果】この発明の請求項1に係る音声符号化・
復号化機器の検査方法は、サンプリングされた入力音声
と適応アルゴリズムによってフィルタ係数が制御された
ディジタルフィルタのフィルタ係数との演算により出力
側の音声を推定した推定音声を作成し、この推定音声と
出力音声との差を算出し、誤差信号として出力するとと
もに、適応アルゴリズムに入力し、音声符号化・復号化
機器の特性変動に追従してディジタルフィルタのフィル
タ係数の更新を行う方法であり、符号化・復号化機器が
リアルタイムで長時間の音声検査ができ、検査対象機器
の符号化・復号化に要する時間変動に対応してリアルタ
イムに音声検査を行うことができる。
According to the first aspect of the present invention, the speech encoding
The decoding method of the decoding device is to generate an estimated sound in which an output-side sound is estimated by calculating a sampled input sound and a filter coefficient of a digital filter whose filter coefficient is controlled by an adaptive algorithm, and generate the estimated sound and the output. This is a method of calculating the difference from speech, outputting it as an error signal, inputting it to an adaptive algorithm, and updating the filter coefficient of a digital filter following the characteristic fluctuation of speech encoding / decoding equipment. The decoding device can perform a long-term voice test in real time, and can perform a voice test in real time in response to the time variation required for encoding and decoding of the device to be tested.

【0047】この発明の請求項2に係る音声符号化・復
号化機器の検査装置は、入力音声をサンプリングする入
力音声検出部と、出力音声をサンプリングする出力音声
検出部と、サンプリングされた入力音声と適応アルゴリ
ズムによって音声符号化・復号化機器の特性変動に追従
するようにフィルタ係数が制御されたディジタルフィル
タのフィルタ係数とにより出力側の音声を推定した推定
音声を作成する推定音声作成部と、作成された推定音声
と上記出力音声との差を算出して誤差信号として出力す
るとともに、推定音声作成部の適応アルゴリズムに入力
する誤差信号作成部と、誤差信号を評価する誤差評価部
とで構成したので、符号化・復号化機器がリアルタイム
で長時間の音声検査が行うことができ、検査対象機器の
符号化・復号化に要する時間変動に対応してリアルタイ
ムに音声検査を行うことができる。
According to a second aspect of the present invention, there is provided an inspection apparatus for an audio encoding / decoding device, comprising: an input audio detecting section for sampling an input audio; an output audio detecting section for sampling an output audio; An estimated speech creation unit that creates an estimated speech based on the filter coefficients of a digital filter whose filter coefficients are controlled so as to follow a characteristic change of the speech encoding / decoding device by an adaptive algorithm, and an estimated speech on the output side. A difference between the generated estimated voice and the output voice is calculated and output as an error signal, and an error signal generating unit that inputs the adaptive algorithm of the estimated voice generating unit and an error evaluating unit that evaluates the error signal are configured. As a result, the encoding / decoding device can perform a long-term voice test in real time, It is possible to perform voice test in real time corresponds to the time fluctuation.

【0048】この発明の請求項3に係る音声符号化・復
号化機器の検査装置は、請求項2の構成の誤差評価部に
音声異常検出レベルを設定し、誤差信号が音声異常検出
レベルを超えたときに異常信号を出力するように構成し
たので、必要とする音声異常レベルに合わせた音声検査
が効率よく実施できる。
According to a third aspect of the present invention, an inspection apparatus for an audio encoding / decoding device sets an audio abnormality detection level in the error evaluation section having the configuration of the second aspect, and the error signal exceeds the audio abnormality detection level. In this case, an abnormal signal is output when the abnormal condition occurs, so that an audio test can be efficiently performed in accordance with a required abnormal audio level.

【0049】この発明の請求項4に係る音声符号化・復
号化機器の検査装置は、請求項2の構成の誤差評価部に
は音声異常検出レベルを設定し、誤差信号が音声異常検
出レベルを超えた時間をカウントして誤差信号の大きさ
を評価する構成としたので、符号化・復号化機器の誤差
信号の持続時間を考慮した検査ができる。
According to a fourth aspect of the present invention, there is provided an inspection apparatus for an audio encoding / decoding device, wherein an error evaluation level is set in the error evaluator having the configuration of the second aspect, and the error signal indicates the audio abnormality detection level. Since the configuration is such that the time elapsed is counted and the magnitude of the error signal is evaluated, it is possible to perform an inspection in consideration of the duration of the error signal of the encoding / decoding device.

【0050】この発明の請求項5に係る音声符号化・復
号化機器の検査装置は、請求項3または請求項4の構成
の誤差評価部に備えられた音声異常検出レベルは、入力
音声の大きさに応じて設定するように構成したので、符
号化・復号化機器入力音声レベルの変動に関わりなく要
求される評価レベルに合わせた検査が実施でき、広範囲
の検査対象機器に適用可能な検査装置となる。
According to a fifth aspect of the present invention, in the inspection apparatus for an audio encoding / decoding apparatus, the audio abnormality detection level provided in the error evaluator having the configuration of the third or fourth aspect is such that the level of the input audio is large. Since it is configured so as to be set in accordance with the level, it is possible to carry out the inspection in accordance with the required evaluation level regardless of the fluctuation of the input audio level of the encoding / decoding device, and the inspection device applicable to a wide range of inspection target devices. Becomes

【0051】この発明の請求項6に係る音声符号化・復
号化機器の検査方法は、請求項1の方法において誤差信
号が所定のレベルを超えたときに、ディジタルフィルタ
の適応アルゴリズムによるフィルタ係数の制御を一定時
間停止させる方法であり、誤差信号の収束を防いで音声
異常をより強調した検査ができる。
According to a sixth aspect of the present invention, in the method for inspecting a speech encoding / decoding device, when the error signal exceeds a predetermined level in the method of the first aspect, the filter coefficient of the digital filter is determined by the adaptive algorithm of the digital filter. This is a method in which the control is stopped for a certain period of time, and the inspection can be performed in which the convergence of the error signal is prevented and the abnormal voice is emphasized.

【0052】この発明の請求項7に係る音声符号化・復
号化機器の検査装置は、請求項2乃至請求項5の構成の
推定音声作成部は、誤差信号が所定のレベルを超えたと
きに、ディジタルフィルタの適応アルゴリズムによるフ
ィルタ係数の制御を一定時間停止させるように構成した
ので、誤差信号の収束を防いで音声異常をより強調した
検査ができる。
According to a seventh aspect of the present invention, in the inspection apparatus for an audio encoding / decoding device, the estimated audio creating section having the configuration according to any one of the second to fifth aspects is configured such that when the error signal exceeds a predetermined level, Since the control of the filter coefficient by the adaptive algorithm of the digital filter is stopped for a certain period of time, it is possible to prevent the convergence of the error signal and perform a test in which the speech abnormality is emphasized.

【0053】この発明の請求項8に係る音声符号化・復
号化機器の検査方法は、請求項1または請求項6の方法
において、音声符号化・復号化機器の符号化・復号化に
要する時間変動に応じて、入力音声とディジタルフィル
タの演算に用いる時間区間を変動させて出力音声との差
を算出する方法であり、音声符号化・復号化機器の符号
化・復号化の時間変動が大きい場合においても、リアル
タイムで長時間の音声検査が実施できる。
According to an eighth aspect of the present invention, there is provided a method for inspecting an audio encoding / decoding device according to the first or sixth aspect, wherein the time required for encoding / decoding of the audio encoding / decoding device is determined. This is a method of calculating the difference between the input voice and the output voice by changing the time interval used for the operation of the digital filter in accordance with the fluctuation. The time fluctuation of the coding / decoding of the voice coding / decoding device is large. Even in this case, a long-term voice test can be performed in real time.

【0054】この発明の請求項9に係る音声符号化・復
号化機器の検査装置は、請求項2乃至請求項5および請
求項7の構成の推定音声作成部は、符号化・複合化機器
の符号化・復号化に要する時間変動に応じて、入力音声
とディジタルフィルタの演算に用いる時間区間を変動さ
せて推定音声を推定するように構成したので、符号化・
復号化の時間の変動が大きい場合にも、リアルタイムで
長時間の音声検査が実施できる。
According to a ninth aspect of the present invention, there is provided an inspection apparatus for an audio encoding / decoding device, wherein the estimated speech creating section having the configuration according to any one of the second to fifth and seventh aspects comprises the step of: The configuration is such that the estimated speech is estimated by varying the time interval used for the operation of the input speech and the digital filter according to the time variation required for encoding / decoding.
Even when the fluctuation of the decoding time is large, a long-time voice test can be performed in real time.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 実施の形態1の音声符号化・復号化機器の検
査装置の構成を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of an inspection device of a speech encoding / decoding device according to a first embodiment.

【図2】 図1の構成の検査装置による検査方法のフロ
ーチャートである。
FIG. 2 is a flowchart of an inspection method by the inspection device having the configuration of FIG.

【図3】 音声符号化・復号化機器について図2のフロ
ーチャートにそって音声検査を実施した場合の各音声お
よび誤差信号の状況を示す図である。
FIG. 3 is a diagram showing the status of each voice and error signal when a voice test is performed on a voice encoding / decoding device according to the flowchart of FIG. 2;

【図4】 実施の形態2の誤差評価部に音声異常検出レ
ベルを設けた場合の誤差信号の状態を示す図である。
FIG. 4 is a diagram illustrating a state of an error signal when a speech abnormality detection level is provided in an error evaluation unit according to the second embodiment.

【図5】 実施の形態5のディジタルフィルタの時間区
間を符号化・復号化する時間に応じて遅延させる場合の
音声検査方法のフローチャートである。
FIG. 5 is a flowchart of an audio inspection method according to a fifth embodiment when a time section of a digital filter is delayed according to encoding / decoding time.

【図6】 ディジタルフィルタの時間区間を符号化・復
号化に要する時間の変動に応じて遅延させて音声検査を
行う場合の音声波形の状況を示す図である。
FIG. 6 is a diagram illustrating a state of a speech waveform when a speech test is performed by delaying a time section of a digital filter in accordance with a change in time required for encoding and decoding.

【図7】 従来の符号化・復号化機器の品質評価方法の
フローチャートである。
FIG. 7 is a flowchart of a conventional quality evaluation method for an encoding / decoding device.

【図8】 臨界帯域パワースペクトルのフィルタ処理に
用いられる臨界帯域フィルタのフィルタ係数を示す図で
ある。
FIG. 8 is a diagram showing filter coefficients of a critical band filter used for filtering a critical band power spectrum.

【符号の説明】[Explanation of symbols]

1 音声符号化・復号化機器、2 入力音声検出部、3
出力音声検出部、4a 適応型ディジタルフィルタ、
4b 適応アルゴリズム、4 推定音声作成部、5 誤
差信号作成部、6 誤差評価部。
1 audio encoding / decoding device, 2 input audio detector, 3
Output voice detector, 4a adaptive digital filter,
4b Adaptive algorithm, 4 Estimated speech generator, 5 Error signal generator, 6 Error evaluator.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 成田 裕二 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 Fターム(参考) 5D045 DA20  ────────────────────────────────────────────────── ─── Continued on the front page (72) Inventor Yuji Narita 2-3-2 Marunouchi, Chiyoda-ku, Tokyo F-term (reference) 5D045 DA20 in Mitsubishi Electric Corporation

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 入力音声を符号化・復号化して出力音声
を作成する音声符号化・復号化機器の入力音声および出
力音声をそれぞれサンプリングし、サンプリングされた
入力音声と適応アルゴリズムによってフィルタ係数が制
御されたディジタルフィルタのフィルタ係数との演算に
より出力側の音声を推定した推定音声を作成し、該推定
音声と上記サンプリングされた出力音声との差を算出
し、誤差信号として出力するとともに、上記適応アルゴ
リズムに入力して上記音声符号化・復号化機器の特性変
動に追従してディジタルフィルタのフィルタ係数の更新
を行うことを特徴とする音声符号化・復号化機器の検査
方法。
An input speech and an output speech of a speech encoding / decoding device for encoding and decoding an input speech to produce an output speech are respectively sampled, and a filter coefficient is controlled by the sampled input speech and an adaptive algorithm. An estimated sound is generated by estimating the sound on the output side by calculation with the filter coefficient of the digital filter, and a difference between the estimated sound and the sampled output sound is calculated and output as an error signal. A method for testing a speech encoding / decoding device, comprising inputting an algorithm to update a filter coefficient of a digital filter following a characteristic change of the speech encoding / decoding device.
【請求項2】 入力音声を符号化・復号化して出力音声
を作成する音声符号化・復号化機器の入力音声をサンプ
リングする入力音声検出部と、出力音声をサンプリング
する出力音声検出部と、上記サンプリングされた入力音
声と適応アルゴリズムによって上記音声符号化・復号化
機器の特性変動に追従するようにフィルタ係数が制御さ
れたディジタルフィルタのフィルタ係数とにより出力側
の音声を推定した推定音声を作成する推定音声作成部
と、上記推定音声と上記出力音声との差を算出して誤差
信号として出力するとともに、上記推定音声作成部の適
応アルゴリズムに入力する誤差信号作成部と、誤差信号
を評価する誤差評価部とで構成されていることを特徴と
する音声符号化・復号化機器の検査装置。
2. An input audio detector for sampling an input audio of an audio encoding / decoding device for encoding / decoding an input audio to generate an output audio, an output audio detector for sampling an output audio, An estimated speech is created by estimating the speech on the output side using the sampled input speech and a filter coefficient of a digital filter whose filter coefficient is controlled so as to follow the characteristic fluctuation of the speech encoding / decoding device by an adaptive algorithm. An estimated voice creation unit, an error signal creation unit that calculates a difference between the estimated speech and the output speech and outputs the difference signal as an error signal, and inputs the error signal to an adaptive algorithm of the estimated speech creation unit; An inspection apparatus for a speech encoding / decoding device, comprising: an evaluation unit.
【請求項3】 誤差評価部には、音声異常検出レベルが
設定され、誤差信号が音声異常検出レベルを超えたとき
に異常信号を出力するように構成されていることを特徴
とする請求項2記載の音声符号化・復号化機器の検査装
置。
3. The error evaluation section is configured to set a speech abnormality detection level, and output an abnormality signal when the error signal exceeds the speech abnormality detection level. Inspection device for the audio encoding / decoding device described in the above.
【請求項4】 誤差評価部には音声異常検出レベルが設
定され、誤差信号が音声異常検出レベルを超えた時間を
カウントして誤差信号の大きさを評価して出力するよう
に構成されていることを特徴とする請求項2記載の音声
符号化・復号化機器の検査装置。
4. An error evaluator is provided with a speech abnormality detection level, and is configured to count a time when the error signal exceeds the speech abnormality detection level, evaluate the magnitude of the error signal, and output the result. 3. The inspection apparatus for speech encoding / decoding equipment according to claim 2, wherein:
【請求項5】 誤差評価部に備えられた音声異常検出レ
ベルは、入力音声の大きさに応じて設定するように構成
されていることを特徴とする請求項3または請求項4記
載の音声符号化・復号化機器の検査装置。
5. The speech code according to claim 3, wherein the speech abnormality detection level provided in the error evaluation unit is set according to the volume of the input speech. Inspection equipment for encryption / decryption equipment.
【請求項6】 誤差信号が所定のレベルを超えたとき
に、ディジタルフィルタの適応アルゴリズムによるフィ
ルタ係数の制御を一定時間停止させることを特徴とする
請求項1記載の音声符号化・復号化機器の検査方法。
6. The speech encoding / decoding apparatus according to claim 1, wherein when the error signal exceeds a predetermined level, control of the filter coefficient by the adaptive algorithm of the digital filter is stopped for a predetermined time. Inspection methods.
【請求項7】 推定音声作成部は、誤差信号が所定のレ
ベルを超えたときに、ディジタルフィルタの適応アルゴ
リズムによるフィルタ係数の制御を一定時間停止させる
ように構成されていることを特徴とする請求項2乃至請
求項5のいずれかに記載の音声符号化・復号化機器の検
査装置。
7. The estimated speech creation section is configured to stop control of a filter coefficient by an adaptive algorithm of a digital filter for a predetermined time when an error signal exceeds a predetermined level. An inspection device for an audio encoding / decoding device according to any one of claims 2 to 5.
【請求項8】 音声符号化・復号化機器の符号化・復号
化に要する時間の変動に応じて、入力音声とディジタル
フィルタのフィルタ係数の演算に用いる時間区間を変動
させて推定音声を作成することを特徴とする請求項1ま
たは請求項6記載の音声符号化・復号化機器の検査方
法。
8. An estimated speech is created by varying a time interval used for calculating an input speech and a filter coefficient of a digital filter according to a variation in a time required for encoding / decoding of the speech encoding / decoding device. The method for inspecting a speech encoding / decoding device according to claim 1 or 6, wherein:
【請求項9】 推定音声作成部は、符号化・複合化機器
の符号化・復号化に要する時間の変動に応じて、入力音
声とディジタルフィルタのフィルタ係数の演算に用いる
時間区間を変動させて推定音声を作成するように構成さ
れていることを特徴とする請求項2乃至請求項5および
請求項7のいずれかに記載の音声符号化・復号化機器の
検査装置。
9. The estimated voice generating unit changes the time interval used for calculating the input voice and the filter coefficient of the digital filter according to the fluctuation of the time required for the encoding / decoding of the encoding / decoding device. The speech encoding / decoding device inspection apparatus according to any one of claims 2 to 5, wherein the apparatus is configured to generate an estimated speech.
JP2000271013A 2000-09-07 2000-09-07 Inspection method and inspection apparatus for speech encoding / decoding equipment Expired - Fee Related JP3762204B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000271013A JP3762204B2 (en) 2000-09-07 2000-09-07 Inspection method and inspection apparatus for speech encoding / decoding equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000271013A JP3762204B2 (en) 2000-09-07 2000-09-07 Inspection method and inspection apparatus for speech encoding / decoding equipment

Publications (2)

Publication Number Publication Date
JP2002082696A true JP2002082696A (en) 2002-03-22
JP3762204B2 JP3762204B2 (en) 2006-04-05

Family

ID=18757358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000271013A Expired - Fee Related JP3762204B2 (en) 2000-09-07 2000-09-07 Inspection method and inspection apparatus for speech encoding / decoding equipment

Country Status (1)

Country Link
JP (1) JP3762204B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007534990A (en) * 2004-04-28 2007-11-29 ブリュエル アンド ケアー サウンド アンド ヴァイブレーション メジャーメント エー/エス Judgment method of subjective characteristics of binaural sound signal
US9193836B2 (en) 2009-11-19 2015-11-24 Toray Industries, Inc. Process for production of polyamideimide resin microparticles, and polyamideimide resin microparticles
JP2021526240A (en) * 2018-05-30 2021-09-30 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. Speech similarity evaluator, speech encoder, method and computer program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007534990A (en) * 2004-04-28 2007-11-29 ブリュエル アンド ケアー サウンド アンド ヴァイブレーション メジャーメント エー/エス Judgment method of subjective characteristics of binaural sound signal
JP4909263B2 (en) * 2004-04-28 2012-04-04 ブリュエル アンド ケアー サウンド アンド ヴァイブレーション メジャーメント エー/エス Judgment method of subjective characteristics of binaural sound signal
US9193836B2 (en) 2009-11-19 2015-11-24 Toray Industries, Inc. Process for production of polyamideimide resin microparticles, and polyamideimide resin microparticles
JP2021526240A (en) * 2018-05-30 2021-09-30 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. Speech similarity evaluator, speech encoder, method and computer program
JP7301073B2 (en) 2018-05-30 2023-06-30 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. Speech Similarity Evaluator, Speech Encoder, Method and Computer Program

Also Published As

Publication number Publication date
JP3762204B2 (en) 2006-04-05

Similar Documents

Publication Publication Date Title
Tan et al. Low-complexity variable frame rate analysis for speech recognition and voice activity detection
Nagesh et al. Evaluation of digital filters for rejecting discrete spectral interference in on-site PD measurements
KR910015089A (en) Digital signal processing method and apparatus. Power system signal processing device and its control device
Rabiner et al. LPC prediction error--Analysis of its variation with the position of the analysis frame
Li et al. Distribution preserving quantization with dithering and transformation
EP1385150B1 (en) Method and system for parametric characterization of transient audio signals
SE470577B (en) Method and apparatus for encoding and / or decoding background noise
JP2002082696A (en) Inspecting method and inspecting device for voice coding and decoding equipment
Xu et al. Coded Speech Quality Measurement by a Non-Intrusive PESQ-DNN
Lemercier et al. Diffusion posterior sampling for informed single-channel dereverberation
JP6960766B2 (en) Noise suppression device, noise suppression method and program
Kühl et al. Tracking of time-variant linear systems: Influence of group delay for different excitation signals
JP4309749B2 (en) Voice quality objective evaluation system considering bandwidth limitation
Stahl et al. Speech enhancement quality assessment based on aspect-specific qualities: A preliminary analysis
Tahilramani et al. A hybrid scheme of information hiding incorporating steganography as well as watermarking in the speech signal using Quantization index modulation (QIM)
Nakazawa et al. De-reverberation using DNN for non-reference reverberant speech intelligibility estimation
JPS61184912A (en) Constant variable type audible sense weighting filter
Javed et al. An extended reverberation decay tail metric as a measure of perceived late reverberation
RU2380765C2 (en) Method of compressing speech signal
Dash et al. Objective quality measures evaluation of the different spectral subtraction algorithms in various noise conditions
Balík et al. Sound artifacts caused by the thresholding method
Milivojević et al. Estimation of the fundamental frequency of the speech signal compressed by G. 723.1 algorithm applying PCC interpolation
Jiao et al. Speech enhancement based on the wiener filter and wavelet entropy
Mujezinović ROCOF Estimation via EMD, MEMD and NA-MEMD
Zhang Applicability of Different Loudness Models to Time-Varying Sound in Vehicle

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060112

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100120

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100120

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110120

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120120

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees