JP3100646B2 - 音識別装置 - Google Patents

音識別装置

Info

Publication number
JP3100646B2
JP3100646B2 JP03037513A JP3751391A JP3100646B2 JP 3100646 B2 JP3100646 B2 JP 3100646B2 JP 03037513 A JP03037513 A JP 03037513A JP 3751391 A JP3751391 A JP 3751391A JP 3100646 B2 JP3100646 B2 JP 3100646B2
Authority
JP
Japan
Prior art keywords
sound
pattern
identification
section
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03037513A
Other languages
English (en)
Other versions
JPH04276523A (ja
Inventor
克芳 長安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP03037513A priority Critical patent/JP3100646B2/ja
Publication of JPH04276523A publication Critical patent/JPH04276523A/ja
Application granted granted Critical
Publication of JP3100646B2 publication Critical patent/JP3100646B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音の種別を識別する装
置に関する。
【0002】
【従来の技術】機器の異常を音によって診断する装置や
環境騒音データ収集装置においては、収集された音の種
別を自動的に、迅速に、しかも誤判定することなく識別
する機能を備えていることが望まれる。たとえば、音に
よって機器の異常を診断する場合を例にとると、収集さ
れた音情報のうちの特定の周波数帯域のレベルが高くな
っても、このことが必ずしも機器の異常を示していると
は限らず、たとえば構内放送等の外乱音の影響である場
合もある。したがって、音による機器の異常診断装置で
は、機器の異常による音か、外乱音かを明確に識別でき
る機能が要求される。また、環境騒音データを収集する
場合には、収集された音情報の中の、たとえば自動車騒
音のみを抽出記録し、他の航空機,鉄道,商店街の騒音
等を除去しなければならないこともある。したがって、
環境騒音データ収集装置においても、収集された音情報
に含まれている音の種別を識別する機能が要求される。
【0003】ところで、公知の音による機器の異常診断
装置や環境騒音データ収集装置では、収集された音情報
を周波数分析し、特定の周波数帯域のレベル比較を行な
って音の種別を識別したり、あるいは音の継続時間を観
測することによって音の種別を識別したりする程度の機
能しか備えていない。また、予め処理法が固定的に全て
決められている必要があった。
【0004】したがって、このような従来の装置では、
識別能力が非常に低く、データのみ多くあるが、処理法
の予め定められないものは処理できないし、誤識別が多
い問題があった。また、識別精度を向上させる目的で、
周波数帯域や時間の区切り幅を細かくしても、識別精度
の向上度合に比して処理時間が異常に長くなる問題があ
った。
【0005】
【発明が解決しようとする課題】上述の如く、従来の音
の識別手法では、音の種別を正確に識別できないばかり
か、識別に長時間を要し、しかも大きな計算機容量を必
要とする問題があった。さらに、データを与えることに
よって処理法を定めていくと言った柔軟性に欠けてい
た。
【0006】そこで本発明は、比較的簡単な構成で、短
時間に、確実に、音の種別を識別でき、また柔軟性に富
んだ音識別装置を提供することを目的としている。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、本発明に係る音識別装置は、音を収集する音収集手
段と、この音収集手段によって収集された音を複数の周
波数帯域に区切り、各周波数帯域成分を一定時間間隔で
区切って出力するフィルタ手段と、このフィルタ手段か
ら出力される各周波数帯域成分を前記一定時間間隔で区
切られた区間毎に平滑化した時系列信号をそれぞれ出力
する複数の平滑化手段と、これらの各平滑化手段からそ
れぞれ出力される時系列信号の各区間のレベルと一定時
間前の区間のレベルとのレベル差を一定レベル範囲毎に
区切って複数段階の区分値とし、該区分値を時間方向に
複数個並べて区分値列とし、該区分値列を各周波数帯域
に亘って集積した区分値行列からなる被識別パターンを
作成する被識別パターン作成手段と、この被識別パター
ン作成手段によって作成された被識別パターンに基づい
て前記音収集手段によって収集された音の種別を識別す
る識別手段とを具備してなることを特徴とする。
【0008】
【作用】音の種別を区別する手段の1つとして、音の周
波数分布の時間変化を1つのパターンとみなし、このパ
ターンの基本パターンに対する類似度によって分類する
ことが考えられる。この手法を本発明装置は採用してい
る。
【0009】類似度判定を行ない易くするために、本発
明装置では収集された音情報の周波数・時間・レベルの
各方向を複数の区間に区分して一種の規格化を行なって
いる。すなわち、周波数方向には、たとえば1/3 オクタ
ーブ毎に区切り、それぞれの帯域の波形を抽出する。時
間方向には、波形を一定時間毎に区切り、時分割してい
る。レベル方向には、生波形をそのまま用いずに、平滑
化、たとえばRMS(Root Mean Squere,平均2乗値の
平方根,実効値)をとったものを用いている。さらに、
平滑化された波形の絶対レベルを用いずに、一定時間前
の区間のレベルとの差を用い、このレベル差を複数段階
に区分している。
【0010】このような処理で次のように離散化された
データ行列が得られる。すなわち、1つの周波数帯域に
着目してみると、時間方向の区間毎に一定時間前とのレ
ベル差が決まり、このレベル差が予め定められた区分に
よって複数種に分類される。時分割された区間は時間方
向に複数個並んでいるので、上記区分によって分類され
た時系列デ−タ、つまり区分値列が得られることにな
る。このような区分値列が各周波数帯域毎に得られるの
で、全体としては区分値行列が得られる。この区分値行
列を1つの被識別パターンとし、この被識別パターンの
特徴を比較・分類することで音を識別している。
【0011】このような手法であると、周波数・時間・
レベルの各方向が幾つかに区分されているので、情報が
圧縮されていることになり、周波数分布の時間変化で音
の特徴を捕らえる処理が簡単になる。また、被識別パタ
ーンを分類する際、予め定めた基準パターンと比較する
場合と、データを与えて識別手段の内部状態を自動的に
変更し、希望する識別を行うようにしたものとがある。
後者の場合には、予め基準パターンを定めておく必要が
なく、データを与えることで自動調整するので処理の柔
軟性を備えている。
【0012】
【実施例】以下、図面を参照しながら実施例を説明す
る。
【0013】図1には本発明の第1の実施例に係る音識
別装置の概略構成が示されている。
【0014】図中、1は音情報を収集するための騒音計
を示し、この騒音計1はマイクロホンとアンプとで構成
されている。
【0015】騒音計1の出力は1/3 オクターブフィルタ
2に入力される。1/3 オクターブフィルタ2は、入力を
1/3 オクターブ毎に、たとえば10帯域に区切り、この
区切られた成分をさらに、たとえば0.2 秒間隔に区切っ
てそれぞれ出力する。この10帯域分の出力は、それぞ
れRMS(実効値)をとる平滑化回路3a〜3jに入力
される。平滑回路3a〜3jは、0.2 秒間隔に区切られ
た区間のレベルを平均した値を、その区間のレベル信号
として出力する。そして、平滑化回路3a〜3jの出力
は、処理装置4に導入される。
【0016】処理装置4は、次のようにして入力、つま
り音の種別を識別する。すなわち、この処理装置4に
は、前述の如く10帯域に分離され、かつ各帯域毎に離
散化された時系列信号が入力される。時間方向に離散化
されているので、横軸を時間、縦軸をレベルにとって描
くと、図2中の太線のようになる。この図2では、1つ
の周波数帯域分だけを示している。
【0017】ここで、処理装置4は絶対レベルを用いず
に、1つ前の区間のレベルと比較したレベル差を用いて
いる。レベル差は+5 dB以上、+3 dB以上+5 dB未満、
−3dBを越え+3 dB未満、−3 dB以下−5 dBより大、−5
dB以下の5段階に別れている。そして、時間方向に6
区間のレベル差データを抽出する。すなわち、5段階に
区分された値が時間方向に6個並んだ区分値列Eを得
る。この区分値列Eで原理的には56 、つまり1562
5種類の音を区別できる。この区分値列Eが周波数帯域
毎に得られるので、全10帯域に亘ってみると、区分値
行列Fが得られることになる。この区分値行列Fは15
62510、つまり8.674×1041種類のパターンを
表現できることになる。このように多種のパターンを音
の特徴毎に幾つかのグループに分けることが音の識別を
意味する。
【0018】そこで、この第1の実施例の処理装置4で
は、区分値行列Fによって表現された被識別パターンを
音の特徴毎にグループに分ける方法として識別用基準パ
ターンGを用いている。予め幾つかの識別用基準パター
ンGi(i=1,2,3,…)を用意しておき、入力された区
分値行列Fのパターンが、どの識別用基準パターンGi
に近いかを判別して種別を分類する。すなわち、入力さ
れた区分値行列Fを最も類似度の高い識別用基準パター
ンGiの種別に分類することで識別を行なう。
【0019】ここで、類似度判定の一つの方法を図3を
用いて説明する。区分値行列Fと予め用意された複数の
識別用基準パターンGiとを比較するに際し、その区分
値行列Fを構成している各区分値列Eの各区間レベルと
識別用基準パターンGiを構成している各基準区分値列
Hの各区間レベルとの段階差を求める。図3の例では、
段階差は時刻1,2,3,4,5,6において、それぞ
れ1,0,1,1,2,0となる。
【0020】この段階差を時間方向に加算して、小計1
+0+1+1+2+0=5を得る。図3では1つの周波
数帯域のみについて示しているが、各周波数帯域毎に上
記のような小計を求める。この小計を全時系列の区間・
全周波数帯域に亘って求め、その合計値を求める。この
操作を全ての識別用基準パターンGiについて行い、前
述した合計値を求める。この中で合計値が最小を示す識
別用基準パターンGiが最も類似しているパターンと判
定して識別する。
【0021】なお、上述した類似度を比較する前に、被
識別パターンを構成している区分値行列Fと識別用基準
パターンGiとの開始点の符合を行なう。この符合操作
は、区分値行列Fを時間方向に順次移動して、前述した
段階差の合計値を求め、この合計値が最小となるところ
で、被識別パターンと識別用基準パターンGiとの開始
点が一致したとみなすことで行なっている。
【0022】図4は本発明の第2の実施例を示すもの
で、種別の識別にニューラル・ネットワーク5を使用し
た例を示している。ニューラル・ネットワーク5は、入
力層6と、中間層7と、出力層8とから構成されてお
り、学習機能を有したものとなっている。
【0023】前述した1/3 オクターブフィルタ2および
平滑化回路3a〜3jを通過した後、区分値行列Fに変
換された10帯域分の時系列信号Aa,Ab,…Ajが
入力層6を構成している各細胞に入力される。入力層6
と中間層7との間および中間層7と出力層8との間が結
線されており、前段の出力信号に重付けした信号が加算
されて後段に入る。各層の細胞は予め定めたしきい値を
持っており、入力の合計がしきい値を越えた場合のみ発
火して次の層へ信号を伝達する。そして、出力層8から
最終的な出力が送出される。
【0024】図1に示した実施例では、予め複数の識別
用基準パターンを用意しているが、この図4に示す実施
例ではニューラル・ネットワークの特徴を利用して自動
的に識別手段の内部状態を変え、希望する種別に識別で
きるようにしている。すなわち、ネットワークの教育段
階で、入力端に教示用の音データを入力し、そのときの
最終出力信号と解答であるパターン種別(これを教師信
号と呼ぶ)との差を求め、差がある場合は差が小さくな
るように前記重付け値およびしきい値を変更させてい
る。これはバックプロパゲーション(誤差逆伝播)と呼
ばれている。このように、予め処理方式を定めなくても
教示用データを用いて自動的に希望する種別に識別でき
るような学習機能を備えており、教育段階を経た後、認
識段階では希望する識別ができるようになる。この方法
では、予め基準パターンを用意する必要がなく、データ
に応じて内部状態が変化するので処理の柔軟化を図るこ
とができる。
【0025】なお、上述した実施例では、収集された音
情報を1/3 オクターブ毎に10帯域に分け、さらに各帯
域を0.2 秒単位で区切り、この区切られた区間のレベル
を平滑化した後、前段の区間のレベルとの差をとり、こ
の差を5段階に区別し、この区別された情報の6区間分
を区分値列としているが、この数値例に限定されるもの
ではない。
【0026】
【発明の効果】以上のように、本発明によれば、比較的
簡単な構成で、短時間に確実に音の種別を識別すること
ができる。
【図面の簡単な説明】
【図1】 本発明の第1の実施例に係る音識別装置の概
略構成図。
【図2】 同音識別装置の信号処理動作を説明するため
の図。
【図3】 同じく同音識別装置の信号処理動作を説明す
るための図。
【図4】 本発明の第2の実施例に係る音識別装置にお
ける識別部の概略構成図。
【符号の説明】
1…騒音計、2…1/3 オクターブフィルタ、3a〜3j
…平滑化回路、4…信号処理装置、5…ニューラルネッ
トワーク、E…被識別パターン(区分値行列)を構成し
ている区分値列、H…基準パターンを構成している区分
値列。
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G01H 17/00 G01H 3/08 G01R 23/16

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】音を収集する音収集手段と、 この音収集手段によって収集された音を複数の周波数帯
    域に区切り、各周波数帯域成分を一定時間間隔で区切っ
    て出力するフィルタ手段と、 このフィルタ手段から出力される各周波数帯域成分を前
    記一定時間間隔で区切られた区間毎に平滑化した時系列
    信号をそれぞれ出力する複数の平滑化手段と、 これらの各平滑化手段からそれぞれ出力される時系列信
    号の各区間のレベルと一定時間前の区間のレベルとのレ
    ベル差を一定レベル範囲毎に区切って複数段階の区分値
    とし、該区分値を時間方向に複数個並べて区分値列と
    し、該区分値列を各周波数帯域に亘って集積した区分値
    行列からなる被識別パターンを作成する被識別パターン
    作成手段と、 この被識別パターン作成手段によって作成された被識別
    パターンに基づいて前記音収集手段によって収集された
    音の種別を識別する識別手段とを具備してなることを特
    徴とする音識別装置。
  2. 【請求項2】前記識別手段は、前記被識別パターンと予
    め用意されている複数の識別用基準パターンとを比較し
    て該被識別パターンにおける前記各区間の前記区分値と
    該識別用基準パターンにおける対応する区間の区分値と
    の段階差を求め、この段階差の全時系列区間・全周波数
    帯域に亘る合計値が最小となる識別用基準パターンの種
    別を前記音収集手段によって収集された音の種別として
    識別することを特徴とする請求項1に記載の音識別装
    置。
  3. 【請求項3】前記識別手段は、前記被識別パターンと前
    記識別用基準パターンとを比較するときに、いずれか一
    方のパターンを時間方向に順次移動して前記段階差の前
    記合計値を求め、この合計値が最小となるところで前記
    被識別パターンと前記識別用基準パターンとの時間方向
    の初期位置が合致しているとみなすことを特徴とする請
    求項2に記載の音識別装置。
JP03037513A 1991-03-04 1991-03-04 音識別装置 Expired - Fee Related JP3100646B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03037513A JP3100646B2 (ja) 1991-03-04 1991-03-04 音識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03037513A JP3100646B2 (ja) 1991-03-04 1991-03-04 音識別装置

Publications (2)

Publication Number Publication Date
JPH04276523A JPH04276523A (ja) 1992-10-01
JP3100646B2 true JP3100646B2 (ja) 2000-10-16

Family

ID=12499620

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03037513A Expired - Fee Related JP3100646B2 (ja) 1991-03-04 1991-03-04 音識別装置

Country Status (1)

Country Link
JP (1) JP3100646B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10334069A (ja) * 1997-06-03 1998-12-18 Mikio Shimokawa ニューラルネットワーク
EP1462777A1 (de) * 2003-03-26 2004-09-29 Ford Global Technologies, Inc., A subsidiary of Ford Motor Company Verfahren und Vorrichtung zur quantitativen Analyse von Motorgeräuschen
GB0511307D0 (en) 2005-06-03 2005-07-13 South Manchester University Ho A method for generating output data
JP5480009B2 (ja) * 2010-05-12 2014-04-23 リオン株式会社 騒音測定装置
JP7272631B2 (ja) * 2019-03-08 2023-05-12 株式会社アニモ 音響又は振動の判定方法及び判定のための情報処理システム

Also Published As

Publication number Publication date
JPH04276523A (ja) 1992-10-01

Similar Documents

Publication Publication Date Title
CN109616140B (zh) 一种异常声音分析系统
US4918730A (en) Process and circuit arrangement for the automatic recognition of signal sequences
Godino-Llorente et al. Automatic detection of voice impairments by means of short-term cepstral parameters and neural network based detectors
Carletti et al. Audio surveillance using a bag of aural words classifier
CN110120218B (zh) 基于gmm-hmm的高速公路大型车辆识别方法
CN105139029A (zh) 一种监狱服刑人员的行为识别方法及装置
EP3504708B1 (en) A device and method for classifying an acoustic environment
Colonna et al. Feature evaluation for unsupervised bioacoustic signal segmentation of anuran calls
Lara-Cueva et al. On the use of multi-class support vector machines for classification of seismic signals at Cotopaxi volcano
CN112052712B (zh) 一种电力设备状态监测与故障识别方法及系统
JP3100646B2 (ja) 音識別装置
JP4760614B2 (ja) 信号識別装置の学習データの選択方法
CN116910690A (zh) 一种基于数据融合的目标分类系统
CN110443276A (zh) 基于深度卷积网络与灰度递归图分析的时间序列分类方法
JP3248522B2 (ja) 音源種別識別装置
JP3012449B2 (ja) 音響信号の識別方法および装置
CN114093385A (zh) 一种无人机检测方法及装置
Diez Gaspon et al. Deep learning for natural sound classification
JP2000275096A (ja) 音源種別識別装置
JP2003076976A (ja) パターンマッチング方法
JP2001209628A (ja) パターンマッチング方法
CN113948108B (zh) 一种自动识别生理声音的方法及系统
Abdul Rahim et al. Homogeneous multi-classifier system for moving vehicles noise classification based on multilayer perceptron
Xie et al. Acoustic features for multi-level classification of Australian frogs
JP3295845B2 (ja) 神経回路網を用いた波形評価装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees