JP3262204B2 - Frequency component extraction device - Google Patents

Frequency component extraction device

Info

Publication number
JP3262204B2
JP3262204B2 JP06856096A JP6856096A JP3262204B2 JP 3262204 B2 JP3262204 B2 JP 3262204B2 JP 06856096 A JP06856096 A JP 06856096A JP 6856096 A JP6856096 A JP 6856096A JP 3262204 B2 JP3262204 B2 JP 3262204B2
Authority
JP
Japan
Prior art keywords
point
state
points
frequency
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06856096A
Other languages
Japanese (ja)
Other versions
JPH09257559A (en
Inventor
邦夫 柏野
紀博 萩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP06856096A priority Critical patent/JP3262204B2/en
Publication of JPH09257559A publication Critical patent/JPH09257559A/en
Application granted granted Critical
Publication of JP3262204B2 publication Critical patent/JP3262204B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音響信号を周波数
解析して得られたサウンドスペクトログラムに対し、該
音響信号の分析、または音声、楽器音、ベル、その他の
物音など音響的事象の認識を図る上で重要な周波数成分
を、雑音成分の影響を軽減しつつ抽出する装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a sound spectrogram obtained by frequency-analyzing an acoustic signal and analyzing the acoustic signal or recognizing an acoustic event such as a sound, a musical instrument sound, a bell, and other object sounds. The present invention relates to an apparatus for extracting a frequency component that is important in reducing noise while reducing the influence of a noise component.

【0002】[0002]

【従来の技術】従来、音響信号に対する周波数成分の抽
出に関しては、スペクトログラム上においてパワーの閾
値を設定し、周波数軸方向のスペクトル極大点のうちで
この閾値を越えた点を選択し、これを時間軸方向に接続
して周波数成分とする方法が知られている。
2. Description of the Related Art Conventionally, regarding extraction of a frequency component from an acoustic signal, a power threshold is set on a spectrogram, a point exceeding the threshold is selected from spectral maximum points in the frequency axis direction, and this is determined by time. There is known a method of connecting in the axial direction to generate a frequency component.

【0003】また、対象とする音源の音源波形および伝
達特性のモデルを仮定し、このモデルのパラメータを推
定することによって音響信号の分析または音響事象の認
識を図る方法、あるいは音源のスペクトル特性を仮定
し、該特性をもつスペクトルのみを通過させるように設
計された濾波器を用いることによってスペクトル中の雑
音成分の除去を図り、分析および認識に用いる方法が知
られている。
A method of analyzing a sound signal or recognizing an acoustic event by assuming a model of a sound source waveform and a transfer characteristic of a target sound source and estimating parameters of the model, or assuming a spectral characteristic of the sound source. There is known a method of removing a noise component in a spectrum by using a filter designed to pass only a spectrum having the characteristic, and using the filter for analysis and recognition.

【0004】[0004]

【発明が解決しようとする課題】前者の周波数成分抽出
方法では、音響信号中に不可避的に含まれる残響および
雑音成分や、周波数解析手段において生じる演算誤差等
のため、該音響信号の的確な分析や、これに含まれる音
響的事象の認識を行い難いという欠点がある。
In the former frequency component extraction method, accurate analysis of the acoustic signal is required because of reverberation and noise components inevitably included in the audio signal and arithmetic errors generated in the frequency analysis means. In addition, there is a disadvantage that it is difficult to recognize an acoustic event included therein.

【0005】後者の方法は、音源の波形および伝達特性
が既知であるか、または音源のスペクトル特性が既知で
あって適切なモデル化が可能である場合には有効である
が、上記の仮定が的確に該当しない音源を含む音響信号
に対しては効果的な処理ができないことから、未知の音
源を含む音響信号や、複数の音源を含む音響信号に対し
ては、依然十分な周波数成分抽出を行い難いという欠点
があった。
[0005] The latter method is effective when the waveform and transfer characteristics of the sound source are known, or when the spectral characteristics of the sound source are known and appropriate modeling is possible. Effective processing cannot be performed on sound signals containing sound sources that do not correspond exactly, so sufficient frequency component extraction should still be performed on sound signals containing unknown sound sources or sound signals containing multiple sound sources. There was a drawback that it was difficult to do.

【0006】したがって、上記の各方法は、音響信号中
の残響や雑音成分および演算誤差等が大きい場合や、現
実の室内および室外の環境等のようにいかなる音が発生
するかを予め特定することが困難な場合にあっては、音
響信号の分析およびこれに含まれる音響的事象の認識ま
たはその他の目的に照らして、十分なる周波数成分抽出
処理が期待し難い。
Therefore, in each of the above-mentioned methods, it is necessary to specify in advance what kind of sound is to be generated, such as when reverberation and noise components in a sound signal and calculation errors are large, and in actual indoor and outdoor environments. Is difficult, it is difficult to expect sufficient frequency component extraction processing in light of analysis of acoustic signals and recognition of acoustic events included in the acoustic signals or other purposes.

【0007】本発明の目的は、合理的な制約条件を導入
し、制約に反した周波数成分、すなわち雑音の影響を軽
減した周波数成分抽出を行なう周波数成分抽出装置を提
供することにある。
It is an object of the present invention to provide a frequency component extraction apparatus which introduces a rational constraint condition and extracts a frequency component contrary to the constraint, that is, a frequency component with reduced influence of noise.

【0008】[0008]

【課題を解決するための手段】本発明の周波数成分抽出
装置は、音響信号に対して周波数解析を行い、周波数と
時間に関して離数化されたサウンドスペクトログラムを
出力する周波数解析手段と、周波数解析手段によって得
られたサウンドスペクトログラムに対し、各時点におけ
るパワー値を周波数軸方向に走査してスペクトラムの極
大点を求め、これを周波数成分を構成すべき点の候補点
として抽出する候補点抽出手段と、該候補点の近傍に位
置する一つまたは複数の点を走査し、これら近傍点と該
候補点が周波数成分を構成する点であるかどうかを意味
する、これら近傍点と該候補点の状態によって定義され
るエネルギー値を算出する状態評価手段と、候補点また
は近傍点の状態を変更することによって、予め設定した
時間窓内の該エネルギー値の合計値を最小化する状態最
適化手段と、状態最適化手段の出力をもとにして該候補
点が周波数成分を構成するか否かを判定し、周波数成分
を構成すると判定された点について時間、周波数、およ
びパワー値に関しての連続性を判定し、連続性を持つ点
どうしを接続する時間方向接続手段とを有し、 状態評価
手段は、候補点抽出手段によって抽出された候補点を入
力し、時間窓を設定し、エネルギー値を初期化し、その
時間窓内に存在する未評価の候補点を選択し、その近傍
の点の状態を取得し、その状態に対応するポテンシャル
値を取得してエネルギー値に加算する。
SUMMARY OF THE INVENTION A frequency component extracting apparatus according to the present invention performs frequency analysis on an acoustic signal and outputs a sound spectrogram discretized with respect to frequency and time, and frequency analyzing means. Candidate point extracting means for scanning the power value at each time point in the frequency axis direction with respect to the sound spectrogram obtained by the above to obtain a maximum point of the spectrum and extracting this as a candidate point of a point that should constitute a frequency component, One or more points located in the vicinity of the candidate point are scanned, and the state of these nearby points and the candidate points means whether these neighboring points and the candidate points are points constituting frequency components. State evaluation means for calculating an energy value to be defined; and changing the state of a candidate point or a nearby point to change the energy within a predetermined time window. State optimization means for minimizing the sum of the energy values, and whether or not the candidate point forms a frequency component is determined based on the output of the state optimization means, and it is determined that the candidate point forms a frequency component. time for the point, the frequency, and to determine the continuity of with respect to a power value, possess a time direction connecting means for connecting the points to each other with continuity, state evaluation
Means for inputting the candidate points extracted by the candidate point extracting means.
Force, set the time window, initialize the energy value,
Select an unevaluated candidate point within the time window, and select
Obtains the state of the point of, and the potential corresponding to that state
Get the value and add it to the energy value.

【0009】本発明は、局所的構造に関する緩い制約を
ポテンシャルとして導入することで、制約に反した成分
の抽出を抑圧しようとするものである。ところが、局所
的な制約は、ある部分に導入すると、その他の部分にし
わ寄せが生じる(その他の部分ではかえって制約に反す
る状態となってしまう)場合がある。すなわち、全体と
して制約を最もよく満たす状態を求める必要がある。そ
のために、本発明は、状態評価手段と状態最適化手段を
用いている。
The present invention seeks to suppress the extraction of components that violate the constraints by introducing a loose constraint on the local structure as a potential. However, when a local constraint is introduced in a certain portion, the other portion may be wrinkled (the other portion may be in a state contrary to the constraint). That is, it is necessary to find a state that satisfies the constraint as a whole as a whole. For this purpose, the present invention uses a state evaluation unit and a state optimization unit.

【0010】[0010]

【0011】本発明の実施態様によれば、エネルギー値
が、パワー値によって定まるエネルギーと、線スペクト
ルの局所的構造によって定まるポテンシャルを、時間窓
内の全ての候補点について加算したものの和である。
According to an embodiment of the present invention, the energy value is the sum of the energy determined by the power value and the potential determined by the local structure of the line spectrum for all candidate points in the time window.

【0012】本発明の他の周波数成分抽出装置は、 音響
信号に対して周波数解析を行い、周波数と時間に関して
離散化されたサウンドスペクトログラムを出力する周波
数解析手段と、前記周波数解析手段によって得られたサ
ウンドスペクトログラムに対し、各時点におけるパワー
値を周波数軸方向に走査してスペクトラムの極大点を求
め、これを周波数成分を構成すべき点の候補点として抽
出する候補点抽出手段と、該候補点の近傍に位置する一
つまたは複数の点を走査し、これら近傍点と該候補点が
周波数成分を構成する点であるかどうかを意味する、該
近傍点と該候補点の状態によって定義されるエネルギー
値を算出する状態評価手段と、該候補点または近傍点の
状態を変更することによって、予め設定した時間窓内の
該エネルギー値の合計値を最小化する状態最適化手段
と、該状態最適化手段の出力をもとにして該候補点が周
波数成分を構成するか否かを判定し、周波数成分を構成
すると判定された点について時間、周波数、およびパワ
ー値に関しての連続性を判定し、連続性を持つ点どうし
を接続する時間方向接続手段とを有し、状態最適化手段
は、状態評価手段から候補点の状態を取得し、ある時間
窓を設定し、この時間窓の中から1点を選択してから、
該点の状態を変更した場合、エネルギー値が変更前より
も小さくなるか否か調べ、エネルギー値が小さくなるな
らばその状態変更を実際に行い、もし状態変更によって
エネルギー値が大きくなるならば、状態変更前のエネル
ギー値を状態変更後のエネルギー値で割った値を確率と
し、該確率で状態変更を行なうまでの動作を、全体のエ
ネルギー値が設定値を下回るまで繰返し、その時点での
状態を最適な候補点の状態として出力する。
[0012] Other frequency component extraction device of the present invention, the acoustic
Perform a frequency analysis on the signal and determine the frequency and time
Output frequency of discretized sound spectrogram
Number analysis means, and the number of samples obtained by the frequency analysis means.
Power at each time point for und spectrogram
Scan the value in the frequency axis direction to find the maximum point of the spectrum
Therefore, this is extracted as a candidate point of a point that should constitute a frequency component.
A candidate point extracting means for outputting the candidate points;
One or more points are scanned, and these neighboring points and the candidate points are
The point that constitutes a frequency component.
Energy defined by the state of neighboring points and the candidate points
State evaluation means for calculating the value, and the candidate point or the neighboring point
By changing the state, the time within the preset time window
State optimizing means for minimizing the sum of the energy values
And the candidate point is determined based on the output of the state optimization means.
Determines whether to configure the wave number component and configures the frequency component
The time, frequency, and power
Judgment of continuity with respect to values
Possess the time direction connecting means for connecting, the state optimization means, to obtain the status of candidate points from the state evaluating means sets a certain time window, select one point from the time window ,
If the state of the point is changed, check whether the energy value is smaller than before the change, and if the energy value is smaller, actually change the state.If the energy value is larger due to the state change, The probability value is calculated by dividing the energy value before the state change by the energy value after the state change.
And, the operation up to carry out the state change in the probability repeated until the entire energy value is below the set value, outputs the state at that time as the state of the best candidate point.

【0013】本発明の実施態様によれば、時間方向接続
手段は、状態最適化手段によって出力された候補点の集
合を入力し、時間窓を時間の順に並べて結合し、1つの
候補点を選択し、選択した点に対し、時間、周波数、お
よびパワー値の近傍に候補点があるかどうか調べ、もし
あればそれら候補点を接続する処理を全ての候補点につ
いて順次行なう。
According to an embodiment of the present invention, the time direction connecting means inputs a set of candidate points output by the state optimizing means, arranges time windows in order of time, combines them, and selects one candidate point. Then, for the selected point, it is checked whether there are any candidate points near the time, frequency and power values, and if so, processing for connecting the candidate points is sequentially performed for all the candidate points.

【0014】[0014]

【発明の実施の形態】次に、本発明の実施形態について
図面を参照して説明する。
Next, embodiments of the present invention will be described with reference to the drawings.

【0015】図1は本発明の一実施形態の周波数成分抽
出装置のブロック図である。
FIG. 1 is a block diagram of a frequency component extracting apparatus according to one embodiment of the present invention.

【0016】本実施形態の周波数成分抽出装置は、周波
数解析手段である周波数解析回路1と、候補点抽出手段
である候補点抽出回路2と、状態評価手段である状態評
価回路3と、状態最適化手段である状態最適化回路4
と、時間方向接続手段である時間方向接続回路5で構成
され、音響信号を入力し、周波数成分を出力する。
The frequency component extracting apparatus of this embodiment includes a frequency analyzing circuit 1 as frequency analyzing means, a candidate point extracting circuit 2 as candidate point extracting means, a state evaluating circuit 3 as state evaluating means, State optimization circuit 4
And a time direction connection circuit 5 as a time direction connection means, which inputs an audio signal and outputs a frequency component.

【0017】周波数解析回路1は、音響信号に対し公知
の手段によって周波数解析を行ない、周波数と時間に関
して離散化されたサウンドスペクトログラムを出力する
回路である。図2は周波数解析回路1の一出力例を示し
ている。
The frequency analysis circuit 1 is a circuit that performs a frequency analysis on an acoustic signal by a known means, and outputs a sound spectrogram discretized with respect to frequency and time. FIG. 2 shows an output example of the frequency analysis circuit 1.

【0018】候補点抽出回路2は、周波数解析回路1が
出力したサウンドスペクトログラムにおいて、各時点に
おけるパワー値を周波数軸方向に走査して極大点を検出
し、これを周波数成分を構成する点の候補点(これを周
波数成分候補点という)として出力する回路である。図
3は、候補点抽出回路2の一出力例を示している。
The candidate point extracting circuit 2 scans the power value at each time point in the frequency axis direction in the sound spectrogram output from the frequency analyzing circuit 1 to detect a local maximum point, and uses this as a candidate for a point constituting a frequency component. This is a circuit that outputs points (referred to as frequency component candidate points). FIG. 3 shows an output example of the candidate point extraction circuit 2.

【0019】状態評価回路3は、候補点抽出回路2の出
力として得られた周波数成分候補点の状態(周波数成分
候補点が、実際に周波数成分を構成する点であるかをど
うかを意味する)に対して、局所的構造の観点から、す
なわちその点の状態と周囲の点の状態に基づいてエネル
ギー値を算出し、ある時間窓(スペクトログラム上に設
定されるある時間範囲)内に属するエネルギー値の合計
値(評価合計値)を求めて出力する。出力されるエネル
ギー値U(ω)(ただし、ωは周波数成分であるかどう
かの状態を表す)は、式(1)に示すように、パワー値
による位置エネルギーUg (ω)と、線スペクトルの局
所構造のもたらすエネルギーUl (ω)の和で構成す
る。
The state evaluation circuit 3 is a state of a frequency component candidate point obtained as an output of the candidate point extraction circuit 2 (means whether the frequency component candidate point is a point that actually constitutes a frequency component). , The energy value is calculated from the viewpoint of the local structure, that is, based on the state of the point and the state of surrounding points, and the energy value belonging to a certain time window (a certain time range set on the spectrogram) Is calculated and output. The output energy value U (ω) (where ω represents the state of whether or not it is a frequency component) is represented by a potential energy U g (ω) based on a power value and a line spectrum as shown in Expression (1). Of the energy U l (ω) provided by the local structure of

【0020】[0020]

【数1】 式(1)の右辺の2項のうち、まず位置エネルギーUg
(ω)は次式(2)によって与える。
(Equation 1) Of the two terms on the right side of equation (1), first, potential energy U g
(Ω) is given by the following equation (2).

【0021】[0021]

【数2】 ここで、iは離散的時間、jは離散的周波数、Vg は定
数、gi,j はパワー値、またhi,j は、周波数成分が存
在していれば1、存在していなければ0の値をとる変数
である。
(Equation 2) Here, i is a discrete time, j is a discrete frequency, V g is a constant, g i, j is a power value, and h i, j is 1 if a frequency component exists, and if not, It is a variable that takes a value of 0.

【0022】次に、エネルギーUl (ω)は、線スペク
トルの局所的構造によって定まるポテンシャルVc (分
析学習または試行錯誤によって適宜定める値)を、時間
窓内の全ての点について加算して求める。すなわちスペ
クトログラム上の点をs、互いに近傍にある点の集合を
Cで表せば、エネルギーUl (ω)は
Next, the energy U l (ω) is obtained by adding a potential V c (value appropriately determined by analytical learning or trial and error) determined by the local structure of the line spectrum for all points within the time window. . That is, if a point on the spectrogram is represented by s and a set of points near each other is represented by C, the energy U l (ω) becomes

【0023】[0023]

【数3】 である。図4は、時刻iにおいて候補点抽出回路2によ
って得られた候補点4−10に対して、近傍点として時
刻i−1における周波数軸上で隣接する3点4−7、4
−8、4−9を選んだとき、これらの点の状態によって
定義されるエネルギー値を求めるために、これら4点が
とり得る状態のうちの6状態を例示して、それぞれの状
態に対するポテンシャルVc の設定例を示したものであ
る。図4の例で、周波数成分の立上り、立下りにおいて
c の値が周波数成分の継続の場合よりも大きいのは、
周波数成分は一定時間長く続きがち(立上り、立下りは
めったに起きないとい)う性質を処理に導入したいため
である。また、周波数成分なしで値が小さいのは、周波
数成分がある状態よりもない状態を優遇することによっ
て、雑音成分が抽出されるのを抑止するためである。
(Equation 3) It is. FIG. 4 shows three points 4-7 and 4-4 adjacent to the candidate point 4-10 obtained by the candidate point extraction circuit 2 at time i on the frequency axis at time i-1 as neighboring points.
When -8 and 4-9 are selected, in order to obtain an energy value defined by the states of these points, six states of these four points are illustrated, and the potential V for each state is illustrated. This shows a setting example of c . In the example of FIG. 4, the rise of the frequency components, the value of V c is larger than in the case of continuation of the frequency components in the fall, the
This is because it is necessary to introduce a property that the frequency component tends to last for a certain period of time (rising and falling rarely occur) into the processing. Further, the reason why the value is small without the frequency component is to prevent the noise component from being extracted by favoring a state where the frequency component is not present than a state where the frequency component is present.

【0024】また、エネルギー値の定義にあたっては、
これ以外に、例えば、nオクターブ上下やn/2オクタ
ーブ上下(nは整数)の周波数値をもつ点を近傍点とみ
なしたり、あるいは図4の範囲よりも広い範囲にわたる
点を近傍点とみなしてポテンシアル値を設定することも
できる。
In defining the energy value,
In addition, for example, a point having a frequency value of n octaves up and down or n / 2 octaves up and down (n is an integer) is regarded as a nearby point, or a point over a range wider than the range of FIG. You can also set a potential value.

【0025】状態最適化回路4は、状態評価回路3の出
力を参照し、周波数成分候補点の状態(周波数成分を構
成するか否か)を変更することによって、評価合計値を
最小(評価関数の符号を反転し、これを最大としても等
価である)化する。
The state optimization circuit 4 refers to the output of the state evaluation circuit 3 and changes the state (whether or not to constitute a frequency component) of the frequency component candidate point to minimize the total evaluation value (the evaluation function). Is inverted, and the maximum is equivalent).

【0026】時間方向接続回路5は、状態最適化回路4
の出力(最小の評価合計値)を参照して、周波数成分候
補点が実際に周波数成分を構成する点であるかどうかを
判定し、その結果、周波数成分を構成すると判定された
点について、これらの点のうちで時間方向に連続してい
るものどうしを接続し、周波数成分として出力する。連
続性の判定においては、各点の時刻、周波数値、および
パワー値を参照する。時間方向接続回路5の出力例を図
5に示す。
The time direction connection circuit 5 includes a state optimization circuit 4
It is determined whether or not the frequency component candidate point is a point that actually constitutes a frequency component by referring to the output (the minimum evaluation total value). Are connected in the time direction among the points and output as a frequency component. In determining continuity, the time, frequency value, and power value of each point are referred to. FIG. 5 shows an output example of the time direction connection circuit 5.

【0027】次に、上述した各回路2、3、4、5にお
ける処理の流れを図6から図9に示す流れ図を参照して
説明する。
Next, the flow of processing in each of the circuits 2, 3, 4, and 5 will be described with reference to flowcharts shown in FIGS.

【0028】候補点抽出回路2では、時間と周波数に関
して離散化されたスペクトログラムを入力し(ステップ
101)、各時刻ごとに処理を行う。周波数軸上の離散
化された点の数をN(図2の縦軸の周波数の個数で、図
2ではN=11)とし、各時刻において、周波数軸上の
点nを順次検討する。まず、nを1とし(ステップ10
2)、nとN−1の値を比較して(ステップ103)、
n<N−1ならば、nの値を1増やし(ステップ10
4)、P(n−1),P(n),P(n+1)を取得す
る(ステップ105)。ここに、P(n)は、その時刻
における周波数軸上のn番目の点におけるパワー値を表
す。次に、「P(n−1)<P(n)かつP(n)>P
(n+1)」が真であるかどうかを判定する(ステップ
106)。もし真であれば、そのn番目の点を候補点と
して抽出し(ステップ107)、ステップ103に戻
る。もし偽であれば、そのままステップ103に戻る。
ステップ103においてn<N−1でなければ、その時
刻における候補点は全て抽出したことになるので、候補
点を出力し(ステップ107)、その時刻における処理
を終了して次の時刻の処理に進む。
The candidate point extraction circuit 2 inputs a spectrogram discretized with respect to time and frequency (step 101), and performs processing at each time. The number of discretized points on the frequency axis is N (the number of frequencies on the vertical axis in FIG. 2; N = 11 in FIG. 2), and at each time point n on the frequency axis is examined sequentially. First, n is set to 1 (step 10).
2) Compare the values of n and N-1 (step 103),
If n <N-1, the value of n is increased by 1 (step 10).
4), P (n-1), P (n), and P (n + 1) are obtained (step 105). Here, P (n) represents the power value at the n-th point on the frequency axis at that time. Next, “P (n−1) <P (n) and P (n)> P
(N + 1) "is true (step 106). If true, the n-th point is extracted as a candidate point (step 107), and the process returns to step 103. If false, the process returns to step 103.
If n <N−1 is not satisfied in step 103, all candidate points at that time have been extracted, so the candidate points are output (step 107), and the processing at that time is ended to proceed to the processing at the next time. move on.

【0029】状態評価回路3では、候補点抽出回路2に
よって抽出された候補点を入力する(ステップ20
1)。まず、時間窓を設定し、エネルギー値を初期化す
るとともに(ステップ202)、その時間窓内に存在す
る未評価の候補点を検索する(ステップ203)。もし
未評価の候補点があれば、その候補点を選択し(ステッ
プ204)、その候補点の近傍点の状態を取得する(ス
テップ205)。その状態に対応するポテンシヤル値
を、予め設定したテーブルより検索して取得し(ステッ
プ206)、取得した値をエネルギー値に加算し(ステ
ップ207)。未処理の評価点の検索ステップ(ステッ
プ203)に戻る。もし時間窓内に存在する全ての候補
点について評価を終えたならば、その時間窓内での処理
を終了し、時間窓を移動して処理を繰り返す。全ての時
間窓について処理を行ったならば、処理を終了する。
The state evaluation circuit 3 inputs the candidate points extracted by the candidate point extraction circuit 2 (step 20).
1). First, a time window is set, an energy value is initialized (step 202), and an unevaluated candidate point existing in the time window is searched (step 203). If there is an unevaluated candidate point, the candidate point is selected (step 204), and the state of a point near the candidate point is obtained (step 205). The potential value corresponding to the state is retrieved from a preset table and acquired (step 206), and the acquired value is added to the energy value (step 207). The process returns to the unprocessed evaluation point search step (step 203). If the evaluation has been completed for all the candidate points existing in the time window, the processing in the time window ends, and the processing is repeated by moving the time window. When the processing has been performed for all the time windows, the processing ends.

【0030】状態最適化回路4では、状態評価回路3を
通して候補点の状態を取得し、ある時間窓を設定する
(ステップ301)。次に、この時間窓の中から、候補
点であるか否かに関わらず、ランダムに一点を選択する
(ステップ302)。その選択した点に関して、その点
の状態を変更することを考える。すなわち、もしその点
が候補点であるならば、仮にその点が候補点でないと考
え、その点が候補点でなければ、仮にその点が候補点で
あると考える。そのような状態の変更を行った時、変更
前に比べてエネルギー値が小さくなるか否かを調べる
(ステップ303)。この際、状態評価回路3のステッ
プ205、206および207を用いる。もしエネルギ
ー値が小さくなるならば、その状態変更を実際に行う
(ステップ304)。もし状態変更によってエネルギー
値が大きくなるならば、状態変更前のエネルギー値を状
態変更後のエネルギー値で割った値をqとし、確率qで
状態変更を行う(ステップ305)。全体のエネルギー
変化量がある設定した値を下回って収束が判定されるま
で(ステップ306)、ステップ302から305を繰
り返す。もし収束したならば、その時点での状態を最適
な候補点の状態とみなして処理を終了する。
The state optimizing circuit 4 acquires the state of the candidate point through the state evaluating circuit 3 and sets a certain time window (step 301). Next, one point is randomly selected from this time window regardless of whether or not it is a candidate point (step 302). Consider changing the state of the selected point. That is, if the point is a candidate point, it is assumed that the point is not a candidate point, and if that point is not a candidate point, it is temporarily assumed that the point is a candidate point. When such a state change is performed, it is checked whether or not the energy value is smaller than before the change (step 303). At this time, steps 205, 206 and 207 of the state evaluation circuit 3 are used. If the energy value decreases, the state change is actually performed (step 304). If the energy value increases due to the state change, q is a value obtained by dividing the energy value before the state change by the energy value after the state change, and the state is changed with a probability q (step 305). Steps 302 to 305 are repeated until the convergence is determined as the total energy change falls below a set value (step 306). If the convergence has occurred, the state at that time is regarded as the state of the optimal candidate point, and the processing is terminated.

【0031】時間方向接続回路5では、状態最適化回路
4によって出力された候補点(これを周波数成分構成点
と呼ぶ)の集合を入力する(ステップ401)。まず、
状態最適化回路4で分割していた時間窓を時間の順に並
べて統合する(ステップ402)。次に、接続処理をま
だ行っていない周波数成分構成点を検索し(ステップ4
03)、未処理の周波数成分構成点を一つ選択する(ス
テップ404)。選択した点に対し、時間、周波数、お
よびパワー値に関する近傍に、周波数成分構成点がある
かどうかを調べ(ステップ405)、もしあればそれら
の周波数成分構成点を接続して(ステップ406)、ス
テップ403に戻る。もしなければ、そのままステップ
403に戻る。ステップ403において、未処理の周波
数成分構成点がなければ終了する。
The time direction connection circuit 5 receives a set of candidate points (referred to as frequency component points) output by the state optimization circuit 4 (step 401). First,
The time windows divided by the state optimization circuit 4 are arranged in order of time and integrated (step 402). Next, a search is made for frequency component composing points for which connection processing has not yet been performed (step 4).
03), one unprocessed frequency component composing point is selected (step 404). For the selected point, it is checked whether there is a frequency component point near the time, frequency, and power value (step 405), and if so, those frequency component points are connected (step 406), Return to step 403. If not, the process returns to step 403. In step 403, if there is no unprocessed frequency component constituent point, the process ends.

【0032】[0032]

【発明の効果】以上、説明したように、本発明によれ
ば、周波数成分抽出に対して合理的な制約条件(周波数
成分の連続性)を導入することが可能であり、制約条件
のものとでの周波数成分の状態の最適化を図ることによ
って、制約に反した周波数成分すなわち雑音の影響を軽
減した周波数成分抽出を行うことができるという効果が
ある。
As described above, according to the present invention, it is possible to introduce a reasonable constraint condition (frequency component continuity) for frequency component extraction. By optimizing the state of the frequency components in the above, there is an effect that it is possible to extract the frequency components contrary to the restrictions, that is, the frequency components in which the influence of noise is reduced.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態の周波数成分抽出装置のブ
ロック図である。
FIG. 1 is a block diagram of a frequency component extraction device according to an embodiment of the present invention.

【図2】周波数解析回路1の出力例を示す図である。FIG. 2 is a diagram showing an output example of a frequency analysis circuit 1.

【図3】候補点抽出回路2の出力側を示す図である。FIG. 3 is a diagram showing an output side of a candidate point extraction circuit 2.

【図4】状態評価回路3におけるポテンシャル値の設定
例を示す図である。
FIG. 4 is a diagram showing a setting example of a potential value in a state evaluation circuit 3.

【図5】状態判定回路5の出力側を示す図である。FIG. 5 is a diagram showing an output side of a state determination circuit 5;

【図6】候補点抽出回路2の処理の流れ図である。FIG. 6 is a flowchart of processing of a candidate point extraction circuit 2;

【図7】状態評価回路3の処理の流れ図である。FIG. 7 is a flowchart of a process of a state evaluation circuit 3;

【図8】状態最適化回路4の処理の流れ図である。FIG. 8 is a flowchart of the processing of the state optimization circuit 4;

【図9】時間方向接続回路5の処理の流れ図である。FIG. 9 is a flowchart of the processing of the time direction connection circuit 5;

【符号の説明】[Explanation of symbols]

1 周波数解析回路 2 候補点抽出回路 3 状態評価回路 4 状態最適化回路 5 時間方向接続回路 101〜107、201〜206、301〜306、4
01〜406 ステップ
DESCRIPTION OF SYMBOLS 1 Frequency analysis circuit 2 Candidate point extraction circuit 3 State evaluation circuit 4 State optimization circuit 5 Time direction connection circuit 101-107, 201-206, 301-306, 4
01-406 steps

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G01H 3/08 G01H 3/06 ──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 7 , DB name) G01H 3/08 G01H 3/06

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 音響信号に対して周波数解析を行い、周
波数と時間に関して離散化されたサウンドスペクトログ
ラムを出力する周波数解析手段と、 前記周波数解析手段によって得られたサウンドスペクト
ログラムに対し、各時点におけるパワー値を周波数軸方
向に走査してスペクトラムの極大点を求め、これを周波
数成分を構成すべき点の候補点として抽出する候補点抽
出手段と、 該候補点の近傍に位置する一つまたは複数の点を走査
し、これら近傍点と該候補点が周波数成分を構成する点
であるかどうかを意味する、該近傍点と該候補点の状態
によって定義されるエネルギー値を算出する状態評価手
段と、 該候補点または近傍点の状態を変更することによって、
予め設定した時間窓内の該エネルギー値の合計値を最小
化する状態最適化手段と、 該状態最適化手段の出力をもとにして該候補点が周波数
成分を構成するか否かを判定し、周波数成分を構成する
と判定された点について時間、周波数、およびパワー値
に関しての連続性を判定し、連続性を持つ点どうしを接
続する時間方向接続手段とを有し、 前記状態評価手段は、前記候補点抽出手段によって抽出
された候補点を入力し、時間窓を設定し、エネルギー値
を初期化し、その時間窓内に存在する未評価の候補点を
選択し、その近傍の点の状態を取得し、その状態に対応
するポテンシャル値を取得してエネルギー値に加算す
る、 周波数成分抽出装置。
1. A frequency analysis means for performing frequency analysis on an acoustic signal and outputting a sound spectrogram discretized with respect to frequency and time; and a power at each time point with respect to the sound spectrogram obtained by the frequency analysis means. Scanning a value in the frequency axis direction to obtain a local maximum point of the spectrum, extracting the local maximum point as a candidate point of a point that should constitute a frequency component, and one or more candidate points located near the candidate point. State evaluation means for scanning points, calculating whether or not these neighboring points and the candidate points are points constituting frequency components, and calculating an energy value defined by the states of the neighboring points and the candidate points; By changing the state of the candidate point or neighboring point,
State optimizing means for minimizing the total value of the energy values within a preset time window; and determining whether or not the candidate point forms a frequency component based on an output of the state optimizing means. , the time for the points that have been determined to constitute a frequency component, the frequency, and to determine the continuity of with respect to a power value, possess a time direction connecting means for connecting the points to each other with continuity, the condition evaluating unit, Extracted by the candidate point extracting means
Input candidate points, set time window, and energy value
Is initialized, and the unevaluated candidate points existing in the time window are
Select, get the state of points in the vicinity, and respond to that state
Obtain potential value and add it to energy value
That the frequency component extracting unit.
【請求項2】 前記エネルギー値が、パワー値によって
定まるエネルギーと、線スペクトルの局所的構造によっ
て定まるポテンシャルを、時間窓内の全ての候補点につ
いて加算したものの和である、請求項記載の周波数成
分抽出装置。
Wherein said energy value, the energy determined by the power value, a potential determined by the local structure of the line spectrum, the sum but the sum of all the candidate points in the time window, the frequency of claim 1, wherein Component extraction device.
【請求項3】 音響信号に対して周波数解析を行い、周
波数と時間に関して離散化されたサウンドスペクトログ
ラムを出力する周波数解析手段と、 前記周波数解析手段によって得られたサウンドスペクト
ログラムに対し、各時点におけるパワー値を周波数軸方
向に走査してスペクトラムの極大点を求め、これを周波
数成分を構成すべき点の候補点として抽出する候補点抽
出手段と、 該候補点の近傍に位置する一つまたは複数の点を走査
し、これら近傍点と該候補点が周波数成分を構成する点
であるかどうかを意味する、該近傍点と該候補点 の状態
によって定義されるエネルギー値を算出する状態評価手
段と、 該候補点または近傍点の状態を変更することによって、
予め設定した時間窓内の該エネルギー値の合計値を最小
化する状態最適化手段と、 該状態最適化手段の出力をもとにして該候補点が周波数
成分を構成するか否かを判定し、周波数成分を構成する
と判定された点について時間、周波数、およびパワー値
に関しての連続性を判定し、連続性を持つ点どうしを接
続する時間方向接続手段とを有し、 前記状態最適化手段は、前記状態評価手段から候補点の
状態を取得し、ある時間窓を設定し、この時間窓の中か
ら1点を選択してから、該点の状態を変更した場合、エ
ネルギー値が変更前よりも小さくなるか否か調べ、エネ
ルギー値が小さくなるならばその状態変更を実際に行
い、もし状態変更によってエネルギー値が大きくなるな
らば、状態変更前のエネルギー値を状態変更後のエネル
ギー値で割った値を確率とし、該確率で状態変更を行な
うまでの動作を、全体のエネルギー値が設定値を下回る
まで繰返し、その時点での状態を最適な候補点の状態と
して出力する 周波数成分抽出装置。
3. A frequency analysis is performed on an acoustic signal, and a frequency analysis is performed.
Sound spectrum log discretized with respect to wave number and time
Frequency analysis means for outputting a ram, and a sound spectrum obtained by the frequency analysis means
Power value at each time point on the frequency axis
Scan in the direction to find the maximum point of the spectrum,
Candidate point extraction to extract several components as candidate points
Scanning means and one or more points located near the candidate point
And the points at which these neighboring points and the candidate points constitute frequency components
State of the neighboring point and the candidate point, which means whether or not
State evaluator that calculates the energy value defined by
By changing the step and the state of the candidate point or neighboring point,
Minimize the sum of the energy values within a preset time window
State optimization means to be converted, and the candidate point is set to a frequency based on the output of the state optimization means.
Determine whether or not to configure the frequency component and configure the frequency component
, Frequency, and power values for the points determined as
Judge the continuity of
Time direction connecting means, and the state optimizing means comprises a
Get the status, set a certain time window,
If you change the state of a point after selecting one of them,
Check if the energy value is lower than before the change, and
If the energy value decreases, the state change is actually performed.
If the state change does not increase the energy value
If the energy value before the state change is
The value is divided by the energy value as the probability, and the state is changed with the probability.
Operation, the whole energy value falls below the set value
Until the optimal candidate point state is reached.
Frequency component extraction device that outputs the result .
【請求項4】 前記時間方向接続手段は、前記状態最適
化手段によって出力された候補点の集合を入力し、時間
窓を時間の順に並べて結合し、1つの候補点を選択し、
選択した点に対し、時間、周波数、およびパワー値の近
傍に候補点があるかどうか調べ、もしあればそれら候補
点を接続する処理を全ての候補点について順次行なう、
請求項1または3記載の周波数成分抽出装置。
4. The time direction connecting means inputs a set of candidate points output by the state optimizing means, arranges time windows in order of time, combines them, selects one candidate point,
For the selected point, check whether there are any candidate points near the time, frequency, and power values, and if so, perform the process of connecting those candidate points sequentially for all candidate points,
Frequency component extraction device according to claim 1 or 3 wherein.
JP06856096A 1996-03-25 1996-03-25 Frequency component extraction device Expired - Fee Related JP3262204B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06856096A JP3262204B2 (en) 1996-03-25 1996-03-25 Frequency component extraction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06856096A JP3262204B2 (en) 1996-03-25 1996-03-25 Frequency component extraction device

Publications (2)

Publication Number Publication Date
JPH09257559A JPH09257559A (en) 1997-10-03
JP3262204B2 true JP3262204B2 (en) 2002-03-04

Family

ID=13377278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06856096A Expired - Fee Related JP3262204B2 (en) 1996-03-25 1996-03-25 Frequency component extraction device

Country Status (1)

Country Link
JP (1) JP3262204B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4175563B2 (en) * 2003-03-27 2008-11-05 日本電信電話株式会社 Noise display method, apparatus and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0215915A4 (en) * 1985-03-18 1987-11-25 Massachusetts Inst Technology Processing of acoustic waveforms.
JP3212785B2 (en) * 1993-12-22 2001-09-25 防衛庁技術研究本部長 Signal detection device

Also Published As

Publication number Publication date
JPH09257559A (en) 1997-10-03

Similar Documents

Publication Publication Date Title
Virtanen Sound source separation using sparse coding with temporal continuity objective
CN102568474B (en) Signal processing apparatus and signal processing method
EP0134238A1 (en) Signal processing and synthesizing method and apparatus
US6826350B1 (en) High-speed signal search method device and recording medium for the same
CN105788592A (en) Audio classification method and apparatus thereof
KR20030070178A (en) Method and system for real-time music/speech discrimination in digital audio signals
US20070299663A1 (en) Speech recognition optimization tool
CN102770856B (en) The territory measured for precision waveform identifies and separates
CN108847252B (en) Acoustic feature extraction method based on acoustic signal spectrogram texture distribution
CN111081223A (en) Voice recognition method, device, equipment and storage medium
JP3262204B2 (en) Frequency component extraction device
US5787408A (en) System and method for determining node functionality in artificial neural networks
JP2001117579A (en) Device and method for voice collating and storage medium having voice collating process program stored therein
US20020198709A1 (en) Speech recognition method and apparatus with noise adaptive standard pattern
DE60214409T2 (en) METHOD AND DEVICE FOR TWO-PHASE BASIC FREQUENCY DETECTION
CN109241637B (en) Intelligent modeling system and method applicable to spectral analysis
JP3100646B2 (en) Sound identification device
Wong Intensity signal processing of images for optical to radar scene matching.
KR102241436B1 (en) Learning method and testing method for figuring out and classifying musical instrument used in certain audio, and learning device and testing device using the same
JP4198690B2 (en) Noise measurement method, noise measurement program, and noise measurement device
JP3322536B2 (en) Neural network learning method and speech recognition device
JPH09311880A (en) Method and device for judging noise analytic result of transmission line
JP2719330B2 (en) Envelope generator
KR910008689B1 (en) Signal processing and synthesising method and apparatus
JP2000065888A (en) Automatic judging method of partial discharge

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071221

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081221

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091221

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131221

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees