JP5956624B1 - 異常音の検出方法及びその検出値を用いた構造物の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法 - Google Patents

異常音の検出方法及びその検出値を用いた構造物の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法 Download PDF

Info

Publication number
JP5956624B1
JP5956624B1 JP2015018596A JP2015018596A JP5956624B1 JP 5956624 B1 JP5956624 B1 JP 5956624B1 JP 2015018596 A JP2015018596 A JP 2015018596A JP 2015018596 A JP2015018596 A JP 2015018596A JP 5956624 B1 JP5956624 B1 JP 5956624B1
Authority
JP
Japan
Prior art keywords
vector
value
component
standard
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015018596A
Other languages
English (en)
Other versions
JP2016142625A (ja
Inventor
教博 神内
教博 神内
行雄 明石
行雄 明石
橋本 和明
和明 橋本
詳悟 林
詳悟 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West Nippon Expressway Engineering Shikoku Co Ltd
Original Assignee
West Nippon Expressway Engineering Shikoku Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West Nippon Expressway Engineering Shikoku Co Ltd filed Critical West Nippon Expressway Engineering Shikoku Co Ltd
Priority to JP2015018596A priority Critical patent/JP5956624B1/ja
Priority to CA2918533A priority patent/CA2918533C/en
Priority to US15/003,376 priority patent/US9552831B2/en
Priority to AU2016200487A priority patent/AU2016200487B2/en
Application granted granted Critical
Publication of JP5956624B1 publication Critical patent/JP5956624B1/ja
Publication of JP2016142625A publication Critical patent/JP2016142625A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/08Use of distortion metrics or a particular distance between probe pattern and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)

Abstract

【課題】打音等の正確な類似度検出値を得る方法を提供する。【解決手段】打音の特徴量を成分とする標準及び入力パターン原始ベクトルを作成し、基準形状より成る基準パターンベクトルに基づく歪度加重ベクトル、並びに、尖度加重ベクトルを作成し、歪度加重ベクトル、並びに、尖度加重ベクトルの成分値と標準パターン原始ベクトルの成分値との積和演算により標準パターン歪度加重ベクトル、並びに、標準パターン尖度加重ベクトルを算出し、これらに基づき標準パターン複合加重ベクトル(数41)を作成し、同様に、入力パターン複合加重ベクトル(数41)を作成し、標準及び入力パターン複合加重ベクトルに基づき標準及び入力パターン複合選択ベクトル(数44)を作成し、標準及び入力パターン複合選択ベクトルのなす角の値(数45)を標準及び入力パターン原始ベクトル間の形状距離値とする。【選択図】図47

Description

本発明は、標準情報と入力情報との間の類似度を検出する方法と、その類似度検出値を用いて、入力情報が異常であるか否かの判定、あるいは、入力情報が標準情報であるか否かの認識を行う方法に関する。より詳しくは、本発明は、打音点検によりコンクリート構造物が発する音や振動についての異常音の検出方法と、その異常音の検出値に基づいてコンクリート構造物の異常を判定する方法に関し、更に、任意の標準振動波と入力振動波との間の類似度を検出する方法と、この検出値を用いて音声を認識する方法にも関する。
コンクリート構造物では、長年の風雨や温度変化などが原因で内部に空洞などの損傷が発生する。そこで、この種の構造物では、内部の損傷などの異常の有無を検出するため、打音点検によりコンクリート構造物が発する音や振動について異常音を検出し、その異常音の検出値により異常発生を監視する手段が装備されている。
[従来技術]
●標準音と入力音間等の類似度を形状距離として検出する技術として、特許第3426905号公報(特願平9−61007号:発明の名称:異常音の検出方法及びその検出値を用いた機械の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法)が知られている。
●標準情報と入力情報との間の類似度を形状距離として検出する改良された技術として、特許第3342864号公報(特願2000−277749号:発明の名称:音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法)が知られている。
●標準情報と入力情報との間の類似度を形状距離として検出する更に改良された技術として、特許第3422787号公報(特願2002−68231号:発明の名称:画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法)が知られている。
上記3件の従来技術における標準情報と入力情報との間の類似度検出方法では、標準音のパワースペクトルなどの特徴量を成分とする標準パターンを予め登録しておき、入力音の特徴量を成分とする入力パターンを作成し、標準パターンと入力パターンとの類似の程度を形状距離値として算出する方法を採っている。また、上記3件の従来技術の異常音検出方法では、上記形状距離の算出値と任意に設定した許容値とを比較して異常の判定を行う方法を採っている。
ところで、統計解析の分野では、現象のモデルとして正規分布を用いることが多い。現象のモデルに正規分布を適用する場合、その現象が正規分布に従っているか否かを確かめることが重要であり、そのために「尖度」と「歪度」という2つの統計量が用いられている。尖度の値は、現象の分布形状が正規分布に従っているときは「3」に等しく、正規分布より尖った分布のときは「3」より大きく、反対に、正規分布よりなだらかな分布のときは「3」より小さくなることが知られている。また、歪度の値は、現象の分布形状が中心に関して左右対称であるときは「0」に等しく、右に裾が長い分布のときは「0」より大きく、反対に、左に裾が長い分布のときは「0」より小さくなることが知られている。
従来技術では標準パターンと入力パターンとの類似の程度を「尖度」だけを用いて形状距離値として算出する方法を採っているが、本発明では標準パターンと入力パターンとの類似の程度を「尖度」と「歪度」の2つを用いて新しい形状距離値として算出する。そこで、「尖度」と「歪度」を区別して明確に記述するために、従来技術(特許第3422787号公報)における「加重ベクトル」及び「加重曲線」を、本実施例ではそれぞれ「尖度加重ベクトル」及び「尖度加重曲線」と呼ぶこととする。また、従来技術(特許第3422787号公報)における「標準パターン原始加重ベクトル」及び「入力パターン原始加重ベクトル」を、本実施例ではそれぞれ「標準パターン尖度加重ベクトル」及び「入力パターン尖度加重ベクトル」と呼ぶこととする。更に、従来技術(特許第3426905号公報、特許第3342864号公報、並びに、特許第3422787号公報)における「形状距離」を、本実施例では「尖度形状距離」と呼ぶこととする。
従来の尖度形状距離の算出方法では、標準パターンと入力パターンの形状差を正規分布などの基準形状(基準パターン)の形状変化に置き換え、その形状変化の大きさを尖度の変化量として数値化している。そして、基準パターンの中心を標準及び入力パターンの各成分位置に移動しながら尖度の変化量を求め、これらを用いて尖度形状距離値を算出している。なお、従来技術(特許第3422787号公報)の方法では、直接的に尖度の変化量を求める代わりに、近似計算により尖度の変化量を算出する方法を採っている。
一般に、ベクトル形状の尖度の計算式においては、ベクトルの成分値が負の場合には定義できない。そこで、従来技術では、正規分布の値を成分とする基準パターン正ベクトルと、同正規分布の値を成分とする基準パターン負ベクトルを作成しておき、標準パターンと入力パターンの形状差を基準パターン正ベクトル及び基準パターン負ベクトルの形状変化に置き換えることにより、ベクトルの成分値が負にならないようにする方法を採っている。一方で、標準パターンと入力パターンの形状差が小さい場合には、標準パターンと入力パターンの形状差を1個の基準パターンベクトルの形状変化に置き換える方法であってもベクトルの成分値は負にならない。従来技術の原理説明においては、前者よりも後者の方法を用いて説明した方が理解が容易である。そこで、以下では、1個の基準パターンベクトル(基準パターン形状)を用いて従来技術の原理を説明する。即ち、入力パターンの成分値から標準パターンの成分値を減算した差の値だけ、1個の基準パターンの成分値を変化させ、基準パターン全体の形状変化の大きさを尖度の変化量として数値化する方法により従来技術を説明する。
図53(a)〜(e)の上段と中段は、それぞれ標準パターン形状と入力パターン形状の典型例を示しており、図53(a)〜(d)は、それぞれ1つのピークをもつ標準パターンと入力パターンを示しており、図53(e)は、平坦な形状をもつ標準パターンと、平坦な形状の上に「ゆらぎ」が発生した入力パターンを模式的に示している。また、図53(a)〜(e)の下段は、標準パターンと入力パターンの形状差を初期形状が正規分布である基準パターンの形状変化に置き換える様子を示している。ただし、図53(a)〜(d)に示す標準及び入力パターンのピークの高さはすべて同じであり、図53(a)〜(e)に示す標準及び入力パターンの面積はすべて1であるものとする。
●図53(a)は、標準パターンと入力パターンが同じ形状である例を示しており、このとき、基準パターンは正規分布から形状の変化がないため尖度Aの値は3になる。(A=3)
●図53(b)(c)(d)はそれぞれ、標準パターンと入力パターンのピークの「ずれ」が小さい例、中程度の例、大きい例を示しており、このとき、それぞれの基準パターンの形状は、標準パターンのピークの位置において標準パターンの成分値と入力パターンの成分値の差の絶対値だけ減少し、同時に入力パターンのピークの位置において標準パターンの成分値と入力パターンの成分値の差の絶対値だけ増加する。
●図53(b)では、基準パターンの増加の位置と減少の位置が近いため効果が相殺されて尖度Aは3に近い値になる。(A≒3)
●図53(d)では、基準パターンの形状が正規分布よりなだらかな分布になるため尖度Aの値は3から大きく減少する。(A≪3)
●図53(c)では、基準パターンが図53(b)と(d)の中間の形状をもつため尖度Aはそれらの中間の値になる。(A<3)
従って、図53(a)〜(d)より、標準パターンと入力パターンのピークの「ずれ」の増加とともに、尖度の値が単調減少することが分かる。
●図53(e)では、基準パターンの形状は標準パターンの成分値と入力パターンの成分値の差の絶対値だけ交互に増加減少し、正規分布から形状の変化が小さいため尖度Aは3に近い値になる。なお、基準パターンの形状がランダムに増加減少したときにも尖度Aは3に近い値になる。(A≒3)
従来の尖度形状距離の算出方法では、尖度の値から3を減算して尖度の変化量を求めている。更に、基準パターンの中心を標準及び入力パターンの各成分位置に移動しながら尖度の変化量を求め、得られた尖度の変化量の2乗和の平方根を尖度形状距離値としている。このようにして、雑音などの「ゆらぎ」の中で標準パターンと入力パターンにピークの「ずれ」が生じたとき、「ゆらぎ」を吸収しながら「ずれ」の増加とともに単調に増加する尖度形状距離値を得ている。
特許第3426905号公報(特願平9−61007号:発明の名称:異常音の検出方法及びその検出値を用いた機械の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法) 特許第3342864号公報(特願2000−277749号:発明の名称:音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法) 特許第3422787号公報(特願2002−68231号:発明の名称:画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法)
ところが、尖度の値を標準パターンと入力パターンとの間の類似度検出に用いた場合、標準パターンと入力パターンのピークの「ずれ」の増加とともに、尖度の値が単調に変化しない事象が発生することがある。このような場合には、標準音のパワースペクトルと入力音のパワースペクトルのピークの「ずれ」を正確に検出できなくなり、このことが異常音の検出を不正確にする要因となっている。以下、詳しく説明する。
図54(a)〜(d)の上段と中段は、それぞれ図53における標準パターン形状と入力パターン形状のピークの位置を左に移動した典型例を示している。また、図54(a)〜(d)の下段は、標準パターンと入力パターンの形状差を初期形状が正規分布である基準パターンの形状変化に置き換える様子を示している。ただし、図54(a)〜(d)に示す標準及び入力パターンのピークの高さはすべて同じであり、図54(a)〜(e)に示す標準及び入力パターンの面積はすべて1であるものとする。
●図54(a)は、標準パターンと入力パターンが同じ形状である例を示しており、このとき、基準パターンは正規分布から形状の変化がないため尖度Aの値は3になる。(A=3)
●図54(b)(c)(d)はそれぞれ、標準パターンと入力パターンのピークの「ずれ」が小さい例、中程度の例、大きい例を示しており、このとき、それぞれの基準パターンの形状は、標準パターンのピークの位置において標準パターンの成分値と入力パターンの成分値の差の絶対値だけ減少し、同時に入力パターンのピークの位置において標準パターンの成分値と入力パターンの成分値の差の絶対値だけ増加する。
●図54(b)では、基準パターンの増加の位置と減少の位置が近いため効果が相殺されて尖度Aは3に近い値になる。(A≒3)
●図54(c)では、基準パターンの形状が正規分布より尖った分布になるため尖度Aの値は3から大きく増加する。(A≫3)
●図54(d)では、基準パターンの増加の位置と減少の位置が基準パターンの中心に関して左右対称であるため効果が相殺されて尖度Aの値は3になる。(A=3)
従って、図54(a)〜(d)より、標準パターンと入力パターンのピークの「ずれ」の増加とともに、尖度の値が単調に変化しない事象が発生していることが分かる。
図53は、標準パターンと入力パターンのピークの「ずれ」の増加とともに尖度Aの値が単調減少する事例であるが、これに対して図54は、標準パターンと入力パターンのピークの「ずれ」の増加とともに尖度Aの値が単調に変化しない事例である。図53及び図54より、このような相違は標準及び入力パターンに対する基準パターンの相対的位置関係が原因となって発生することが分かる。従来技術では、基準パターンの中心を標準及び入力パターンのすべての成分位置に移動しながら尖度の変化量を求め、これらすべてを用いて尖度形状距離値を算出している。このため、基準パターンの中心の移動に際し、標準及び入力パターンに対する基準パターンの相対的位置関係が図54と同じになる事象が発生し、このことが異常音の検出を不正確にする要因となっている。
ここで、図53に示す典型例について、標準パターンと入力パターンの形状差を初期形状が正規分布である基準パターンの形状変化に置き換え、その形状変化の大きさを「歪度」の変化量として数値化することを考える。
●図53(a)は、標準パターンと入力パターンが同じ形状である例を示しており、このとき、基準パターンは正規分布から形状の変化がない(分布形状の中心に関して左右対称である)ため歪度Bの値は0になる。(B=0)
●図53(b)では、基準パターンの増加の位置が中心に近く、基準パターンの減少の位置が中心にあるため歪度Bは0に近い値になる。(B≒0)
●図53(d)では、基準パターンの形状が右に裾が長い分布になるため歪度Bの値は0から大きく増加する。(B≫0)
●図53(c)では、基準パターンが図53(b)と(d)の中間の形状をもつため歪度Bはそれらの中間の値になる。(B>0)
従って、図53(a)〜(d)より、標準パターンと入力パターンのピークの「ずれ」の増加とともに、歪度の値が単調増加することが分かる。
●図53(e)では、基準パターンの形状は標準パターンの成分値と入力パターンの成分値の差の絶対値だけ交互に増加減少し、正規分布から形状の変化が小さい(分布形状の中心に関してほぼ左右対称である)ため歪度Bは0に近い値になる。なお、基準パターンの形状がランダムに増加減少したときにも歪度Bは0に近い値になる。(B≒0)
上記の説明より、基準パターンの形状変化の大きさを「尖度」の変化量として数値化する従来技術の方法に代えて、基準パターンの形状変化の大きさを「歪度」の変化量として数値化しても、標準パターンと入力パターンとの類似の程度を歪度形状距離値として算出できることが分かる。
また、図54に示す典型例について、標準パターンと入力パターンの形状差を初期形状が正規分布である基準パターンの形状変化に置き換え、その形状変化の大きさを「歪度」の変化量として数値化することを考える。
●図54(a)は、標準パターンと入力パターンが同じ形状である例を示しており、このとき、基準パターンは正規分布から形状の変化がない(分布形状の中心に関して左右対称である)ため歪度Bの値は0になる。(B=0)
●図54(b)では、基準パターンの増加の位置と減少の位置が近いため効果が相殺されて歪度Bは0に近い値になる。(B≒0)
●図54(d)では、基準パターンの形状が右に裾が長い分布になるため歪度Bの値は0から大きく増加する。(B≫0)
●図54(c)では、基準パターンが図54(b)と(d)の中間の形状をもつため歪度Bはそれらの中間の値になる。(B>0)
従って、図54(a)〜(d)より、標準パターンと入力パターンのピークの「ずれ」の増加とともに、歪度の値が単調増加することが分かる。
上記の説明より、図53と同様に図54の典型例についても、基準パターンの形状変化の大きさを「尖度」の変化量として数値化する従来技術の方法に代えて、基準パターンの形状変化の大きさを「歪度」の変化量として数値化しても、標準パターンと入力パターンとの類似の程度を歪度形状距離値として算出できることが分かる。
更に、図55に示す典型例について、標準パターンと入力パターンの形状差を初期形状が正規分布である基準パターンの形状変化に置き換え、その形状変化の大きさを「尖度」の変化量、及び、「歪度」の変化量として数値化することを考える。図55(a)〜(e)の上段と中段は、それぞれ標準パターン形状と入力パターン形状の典型例を示しており、図55(a)は、それぞれ中央に1つのピークをもつ標準パターン及び入力パターンを示しており、図55(b)〜(d)は、中央に1つのピークをもつ標準パターンと、中心に関して左右対称の位置に2つのピークをもつ入力パターンを示している。また、図55(a)〜(d)の下段は、標準パターンと入力パターンの形状差を初期形状が正規分布である基準パターンの形状変化に置き換える様子を示している。ただし、図55(a)に示す標準及び入力パターンのピークの高さは同じであり、図55(a)〜(d)に示す標準及び入力パターンのピーク以外の部分の高さはすべて同じであり、図55(a)〜(e)に示す標準及び入力パターンの面積はすべて1であるものとする。
●図55(a)は、標準パターンと入力パターンが同じ形状である例を示しており、このとき、基準パターンは正規分布から形状の変化がないため尖度Aの値は3、また、基準パターンは中心に関して左右対称であるため歪度Bの値は0になる。(A=3、B=0)
●図55(b)(c)(d)はそれぞれ、標準パターンが中央に1つのピークをもち、入力パターンの2つのピークの「ずれ」が小さい例、中程度の例、大きい例を示しており、このとき、それぞれの基準パターンの形状は、標準パターンのピークの位置において標準パターンの成分値と入力パターンの成分値の差の絶対値だけ減少し、同時に入力パターンのピークの位置において標準パターンの成分値と入力パターンの成分値の差の絶対値だけ増加する。
●図55(b)では、基準パターンの増加の位置と減少の位置が近いため効果が相殺されて尖度Aは3に近い値になる。(A≒3)
●図55(d)では、基準パターンの形状が正規分布よりなだらかな分布になるため尖度Aの値は3から大きく減少する。(A≪3)
●図55(c)では、基準パターンが図55(b)と(d)の中間の形状をもつため尖度Aはそれらの中間の値になる。(A<3)
●図55(b)〜(d)では、それぞれの基準パターンは中心に関して左右対称であるため歪度Bの値はすべて0になる。(B=0)
従って、図55(a)〜(d)より、標準パターンと入力パターンのピークの「ずれ」の増加とともに、尖度の値が単調減少する一方で、歪度の値は全く変化しないことが分かる。
Figure 0005956624
表1は、図53〜図55の結果を示している。即ち、表1は、図53、図54、図55の事例の結果を示す表である。表1では、標準パターンと入力パターンのピークの「ずれ」の増加とともに、尖度、または、歪度の値が単調に変化した場合には○印を、単調に変化しなかった場合には×印を示している。表1に示すように、「尖度」及び「歪度」の値を標準パターンと入力パターンとの間の類似度検出に用いた場合、図53に示した事例では、標準パターンと入力パターンのピークの「ずれ」の増加とともに、尖度、及び、歪度の値は共に単調に変化した。また、図54に示した事例では、標準パターンと入力パターンのピークの「ずれ」の増加とともに、尖度の値が単調に変化しない事象が発生した一方で、歪度の値は単調に変化した。更に、図55に示した事例では、標準パターンと入力パターンのピークの「ずれ」の増加とともに、尖度の値は単調に変化した一方で、歪度の値が単調に変化しない事象が発生した。
即ち、従来技術(特許第3426905号公報、特許第3342864号公報、並びに、特許第3422787号公報)の方法において異常音の検出を不正確にする第1の要因は、標準パターンと入力パターンの形状差を正規分布などの基準形状(基準パターン)の形状変化に置き換え、その形状変化の大きさを「尖度の変化量だけ」を用いて数値化していることにある。
特に、従来技術(特許第3422787号公報)では、正規分布や矩形など任意の基準形状を作成し、上記基準形状の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの尖度の変化率の値を成分とする尖度加重ベクトル(尖度加重曲線)を作成している。次に、この尖度加重曲線に正数の重みの値を乗算して尖度加重曲線を変化させることにより最適な尖度加重曲線を算出している。その際、尖度加重曲線のu=0のときの関数値が正になり、尖度加重曲線がu軸と2点で交差し、かつ、u=0に関して対称になる場合に限定している。即ち、従来技術の方法において異常音の検出を不正確にする第1の要因は、中心に関して左右対称である尖度加重曲線を用いて標準パターン尖度加重ベクトルと入力パターン尖度加重ベクトルとを作成し、標準パターンと入力パターンとの類似の程度を尖度形状距離値として算出していることにある。

特許第3422787号公報の記述
[0242]これまで、図46(b)に示すように、加重曲線をu軸に平行な方向に伸縮させた場合について、各標準画像間の形状距離値が変化する様子を調べてきたが、次に、加重曲線をu軸に垂直な方向にも変化させることを考える。ただし、本実施例では、加重曲線をu軸に平行な方向に伸縮させ、同時に、u軸に垂直な方向に変化させたとき、図46(b)に示した曲線と同様に、変化した加重曲線のu=0のときの関数値が正になり、変化した加重曲線がu軸と2点で交差し、かつ、u=0に関して対称になる場合に限って考える。

[0272]図56は、各標準画像間の類似性尺度として形状距離dE を用いる場合について、最適な加重曲線、及び、最適な加重曲線に係る変数Cgの最適値を算出する処理手順を示したフローチャートである。図56において、最初のステップSc1では、分散の値が1である正規曲線の尖度の変化率に基づいて加重曲線を作成し、これを1番目(count=1)の加重曲線とする。ステップSc2では、1番目の加重曲線に正数の重みの値を乗算して(規定数−1)個の重み付き加重曲線を作成し、これらをcount番目(count=2〜規定数)の加重曲線とする。前述したように、図5に示す1つの加重曲線は、u軸の伸縮により図46(b)に示す複数の加重曲線を生成することができ、また、図5に示す別の1つの加重曲線は、u軸の伸縮により図49に示す複数の加重曲線を生成することができる。このため、ステップSc1、及び、ステップSc2では、代表的な1つの加重曲線を作成しておけばよい。ステップSc3では、count=1と初期設定しておき、次のステップSc4からステップSc8では、count=規定数までcountを1ずつ増加して最適な加重曲線、及び、最適な加重曲線に係る変数Cgの最適値を算出するループに入る。ただし、規定数には、コンピュータの処理時間の許す範囲で十分に大きい値を用いるものとする。

[図56]のSc2、[図58]のSd2
1番目の加重曲線に正数の重みの値を乗算して(規定数−1)個の重み付き加重曲線を作成
更に、従来技術(特許第3426905号公報、特許第3342864号公報、並びに、特許第3422787号公報)の方法において異常音の検出を不正確にする第2の要因は、基準パターンの中心を標準及び入力パターンの「すべての成分位置」に移動しながら尖度の変化量を算出していることにある。特に、従来技術(特許第3422787号公報)では、尖度加重ベクトル(尖度加重曲線)の中心を標準及び入力パターンの「すべての成分位置」に移動しながら、尖度加重ベクトルの成分値と標準及び入力パターンベクトルの成分値との積和値を算出している。即ち、尖度加重曲線の中心の移動に際し、標準及び入力パターンに対する尖度加重曲線の相対的位置関係を考慮しないで、すべての成分位置において一律に積和値を算出し、標準パターンと入力パターンとの類似の程度を尖度形状距離値として算出している。
要するに、従来技術の方法において異常音の検出を不正確にする第1の要因は、基準パターンの形状変化の大きさを数値化するために「尖度」の変化量と「歪度」の変化量の2つを相補的に用いていないことにある。また、第2の要因は、基準パターンの中心の移動に際し、標準及び入力パターンに対する基準パターンの相対的位置関係について、類似度検出精度を向上させる標準及び入力パターンの成分位置と、低下させる成分位置とを区別していないことにある。
このように、従来技術(特許第3426905号公報、特許第3342864号公報、並びに、特許第3422787号公報)の類似度検出方法では、類似度を正確に検出することができず、異常音を検出する上で十分に満足のいく精度が得られないという問題がある。
本発明は、上記問題を解決するためになされたものであり、第1の目的は標準パターン原始ベクトルと入力パターン原始ベクトルから、2つのベクトル間の正確な形状距離値を求めることができる異常音の検出方法を提供することにある。また、本発明の第2の目的は異常音の検出値から高い精度で構造物の異常判定を行うことができる判定方法を提供することにある。
また、本発明の第3の目的は音声その他任意の振動波について、標準パターン原始ベクトルと入力パターン原始ベクトルから、2つのベクトル間の正確な形状距離値を求めることができる振動波の類似度検出方法を提供することにある。また、本発明の第4の目的は振動波の類似度検出値から高い精度で音声認識を行うことができる方法を提供することにある。
なお、本発明は、従来技術(特許第3426905号公報、並びに、特許第3342864号公報、並びに、特許第3422787号公報)において説明されている標準パターン原始ベクトル(1次元)と入力パターン原始ベクトル(1次元)との間の形状距離について、その算出方法を改良したものである。
上記の課題を解決するため、請求項1の発明に係る異常音の検出方法は、
(a)標準音の特徴量を成分とする標準パターン原始ベクトルと、入力音の特徴量を成分とする入力パターン原始ベクトルとを作成すること、
(b)パターン原始ベクトルの指定成分ごとに異なる分散の値をもつ任意の基準形状を作成し、上記基準形状の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの歪度の変化率の値を成分とする歪度加重ベクトルを作成すること、
(c)標準パターン原始ベクトルの指定成分と各成分との間の長さを求め、歪度加重ベクトルの中心から上記長さだけ離れた位置に最も近い歪度加重ベクトルの成分番号を算出し、歪度加重ベクトルの上記成分番号の成分値と標準パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を標準パターン原始ベクトルの各成分について加算した積和値を算出すること、
(d)上記積和値を算出するに際し、標準パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする標準パターン歪度加重ベクトルを作成すること、
(e)入力パターン原始ベクトルの指定成分と各成分との間の長さを求め、歪度加重ベクトルの中心から上記長さだけ離れた位置に最も近い歪度加重ベクトルの成分番号を算出し、歪度加重ベクトルの上記成分番号の成分値と入力パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を入力パターン原始ベクトルの各成分について加算した積和値を算出すること、
(f)上記積和値を算出するに際し、入力パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする入力パターン歪度加重ベクトルを作成すること、
(g)上記標準パターン歪度加重ベクトルと上記入力パターン歪度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の歪度形状距離値とすること、
(h)基準形状の分散の値を変化させながら歪度加重ベクトルを作成し、異なるカテゴリの標準音間の歪度形状距離平均値から同じカテゴリの標準音間の歪度形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準音間の歪度形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準音間の歪度形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な歪度加重ベクトルを作成すること、
(i)上記最適な歪度加重ベクトルを用いて、標準パターン歪度加重ベクトル、及び、入力パターン歪度加重ベクトルを作成すること、
(j)パターン原始ベクトルの指定成分ごとに異なる分散の値をもつ任意の基準形状を作成し、上記基準形状の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの尖度の変化率の値を成分とする尖度加重ベクトルを作成すること、
(k)標準パターン原始ベクトルの指定成分と各成分との間の長さを求め、尖度加重ベクトルの中心から上記長さだけ離れた位置に最も近い尖度加重ベクトルの成分番号を算出し、尖度加重ベクトルの上記成分番号の成分値と標準パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を標準パターン原始ベクトルの各成分について加算した積和値を算出すること、
(l)上記積和値を算出するに際し、標準パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする標準パターン尖度加重ベクトルを作成すること、
(m)入力パターン原始ベクトルの指定成分と各成分との間の長さを求め、尖度加重ベクトルの中心から上記長さだけ離れた位置に最も近い尖度加重ベクトルの成分番号を算出し、尖度加重ベクトルの上記成分番号の成分値と入力パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を入力パターン原始ベクトルの各成分について加算した積和値を算出すること、
(n)上記積和値を算出するに際し、入力パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする入力パターン尖度加重ベクトルを作成すること、
(o)上記標準パターン尖度加重ベクトルと上記入力パターン尖度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の尖度形状距離値とすること、
(p)基準形状の分散の値を変化させながら尖度加重ベクトルを作成し、異なるカテゴリの標準音間の尖度形状距離平均値から同じカテゴリの標準音間の尖度形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準音間の尖度形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準音間の尖度形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な尖度加重ベクトルを作成すること、
(q)上記最適な尖度加重ベクトルを用いて、標準パターン尖度加重ベクトル、及び、入力パターン尖度加重ベクトルを作成すること、
(r)上記標準パターン歪度加重ベクトルと上記標準パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルを結合して標準パターン複合加重ベクトルを作成すること、
(s)上記入力パターン歪度加重ベクトルと上記入力パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルを結合して入力パターン複合加重ベクトルを作成すること、
(t)上記標準及び入力パターン複合加重ベクトルと同じ成分の個数をもち、0または1の値を成分とする選択ベクトルを作成し、それぞれ標準パターン複合加重ベクトル、及び、入力パターン複合加重ベクトルの各成分の成分値と上記選択ベクトルの同じ成分番号の成分値との積の値を求め、上記積の値を成分値とする標準パターン複合選択ベクトル、及び、入力パターン複合選択ベクトルを作成すること、
(u)上記標準パターン複合選択ベクトルと上記入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値とすること、
(v)選択ベクトルの各成分の0と1の値を変化させながら、異なるカテゴリの標準音間の形状距離平均値から同じカテゴリの標準音間の形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準音間の形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準音間の形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な選択ベクトルを作成すること、
(w)上記最適な選択ベクトルを用いて作成した標準パターン複合選択ベクトルと入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値とするものである。
また、請求項2の発明に係る構造物の異常判定方法は、前記異常音の検出方法を用いて、正常な標準音の特徴量を成分とする標準パターン原始ベクトルと未知の入力音の特徴量を成分とする入力パターン原始ベクトルとの間の形状距離を求め、また、異常な標準音の特徴量を成分とする標準パターン原始ベクトルと上記入力パターン原始ベクトルとの間の形状距離を求め、前者の形状距離値と後者の形状距離値を比較し、前者が後者以下であるとき入力音は正常であると判定し、前者が後者より大きいとき入力音は異常であると判定するものである。
次に、請求項3の発明に係る振動波の類似検出方法は、
(a)標準振動波の特徴量を成分とする標準パターン原始ベクトルと、入力振動波の特徴量を成分とする入力パターン原始ベクトルとを作成すること、
(b)パターン原始ベクトルの指定成分ごとに異なる分散の値をもつ任意の基準形状を作成し、上記基準形状の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの歪度の変化率の値を成分とする歪度加重ベクトルを作成すること、
(c)標準パターン原始ベクトルの指定成分と各成分との間の長さを求め、歪度加重ベクトルの中心から上記長さだけ離れた位置に最も近い歪度加重ベクトルの成分番号を算出し、歪度加重ベクトルの上記成分番号の成分値と標準パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を標準パターン原始ベクトルの各成分について加算した積和値を算出すること、
(d)上記積和値を算出するに際し、標準パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする標準パターン歪度加重ベクトルを作成すること、
(e)入力パターン原始ベクトルの指定成分と各成分との間の長さを求め、歪度加重ベクトルの中心から上記長さだけ離れた位置に最も近い歪度加重ベクトルの成分番号を算出し、歪度加重ベクトルの上記成分番号の成分値と入力パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を入力パターン原始ベクトルの各成分について加算した積和値を算出すること、
(f)上記積和値を算出するに際し、入力パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする入力パターン歪度加重ベクトルを作成すること、
(g)上記標準パターン歪度加重ベクトルと上記入力パターン歪度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の歪度形状距離値とすること、
(h)基準形状の分散の値を変化させながら歪度加重ベクトルを作成し、異なるカテゴリの標準振動波間の歪度形状距離平均値から同じカテゴリの標準振動波間の歪度形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準振動波間の歪度形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準振動波間の歪度形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な歪度加重ベクトルを作成すること、
(i)上記最適な歪度加重ベクトルを用いて、標準パターン歪度加重ベクトル、及び、入力パターン歪度加重ベクトルを作成すること、
(j)パターン原始ベクトルの指定成分ごとに異なる分散の値をもつ任意の基準形状を作成し、上記基準形状の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの尖度の変化率の値を成分とする尖度加重ベクトルを作成すること、
(k)標準パターン原始ベクトルの指定成分と各成分との間の長さを求め、尖度加重ベクトルの中心から上記長さだけ離れた位置に最も近い尖度加重ベクトルの成分番号を算出し、尖度加重ベクトルの上記成分番号の成分値と標準パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を標準パターン原始ベクトルの各成分について加算した積和値を算出すること、
(l)上記積和値を算出するに際し、標準パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする標準パターン尖度加重ベクトルを作成すること、
(m)入力パターン原始ベクトルの指定成分と各成分との間の長さを求め、尖度加重ベクトルの中心から上記長さだけ離れた位置に最も近い尖度加重ベクトルの成分番号を算出し、尖度加重ベクトルの上記成分番号の成分値と入力パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を入力パターン原始ベクトルの各成分について加算した積和値を算出すること、
(n)上記積和値を算出するに際し、入力パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする入力パターン尖度加重ベクトルを作成すること、
(o)上記標準パターン尖度加重ベクトルと上記入力パターン尖度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の尖度形状距離値とすること、
(p)基準形状の分散の値を変化させながら尖度加重ベクトルを作成し、異なるカテゴリの標準振動波間の尖度形状距離平均値から同じカテゴリの標準振動波間の尖度形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準振動波間の尖度形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準振動波間の尖度形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な尖度加重ベクトルを作成すること、
(q)上記最適な尖度加重ベクトルを用いて、標準パターン尖度加重ベクトル、及び、入力パターン尖度加重ベクトルを作成すること、
(r)上記標準パターン歪度加重ベクトルと上記標準パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルを結合して標準パターン複合加重ベクトルを作成すること、
(s)上記入力パターン歪度加重ベクトルと上記入力パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルを結合して入力パターン複合加重ベクトルを作成すること、
(t)上記標準及び入力パターン複合加重ベクトルと同じ成分の個数をもち、0または1の値を成分とする選択ベクトルを作成し、それぞれ標準パターン複合加重ベクトル、及び、入力パターン複合加重ベクトルの各成分の成分値と上記選択ベクトルの同じ成分番号の成分値との積の値を求め、上記積の値を成分値とする標準パターン複合選択ベクトル、及び、入力パターン複合選択ベクトルを作成すること、
(u)上記標準パターン複合選択ベクトルと上記入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値とすること、
(v)選択ベクトルの各成分の0と1の値を変化させながら、異なるカテゴリの標準振動波間の形状距離平均値から同じカテゴリの標準振動波間の形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準振動波間の形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準振動波間の形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な選択ベクトルを作成すること、
(w)上記最適な選択ベクトルを用いて作成した標準パターン複合選択ベクトルと入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値とするものである。
そして、請求項4に係る発明は音声認識方法であり、前記振動波の類似度検出方法を用いて、カテゴリ1の標準音声の特徴量を成分とする標準パターン原始ベクトルと未知の入力音声の特徴量を成分とする入力パターン原始ベクトルとの間の形状距離を求め、また、カテゴリ2の標準音声の特徴量を成分とする標準パターン原始ベクトルと上記入力パターン原始ベクトルとの間の形状距離を求め、前者の形状距離値と後者の形状距離値を比較し、前者が後者以下であるとき入力音声はカテゴリ1に属すると判定し、前者が後者より大きいとき入力音声はカテゴリ2に属すると判定するものである。
本発明の異常音の検出方法では、最適化された歪度加重ベクトルと尖度加重ベクトルの2つを用いて、標準パターン歪度加重ベクトルと入力パターン歪度加重ベクトル、並びに、標準パターン尖度加重ベクトルと入力パターン尖度加重ベクトルを作成する。次に、標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルを結合して標準パターン複合加重ベクトルを作成し、同様に、入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルを結合して入力パターン複合加重ベクトルを作成する。更に、上記標準パターン複合加重ベクトル及び入力パターン複合加重ベクトルにおいて、類似度検出精度を向上させる成分値を選択し、低下させる成分値を除外する(成分値を0にする)ことにより、標準パターン複合選択ベクトル及び入力パターン複合選択ベクトルを作成する。そして、標準パターン複合選択ベクトルと入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値として数値化するので、打音点検によりコンクリート構造物が発する音の正確な類似度検出値を得ることができる。
また、本発明の構造物の異常判定方法では、正確な異常音の検出値に基づいて異常の判定を行うので、判定の基準が信頼性の高いものとなり、構造物の異常検知の精度を著しく向上できる利点がある。
更に、本発明の振動波の類似度検出方法では、最適化された歪度加重ベクトルと尖度加重ベクトルの2つを用いて、標準パターン歪度加重ベクトルと入力パターン歪度加重ベクトル、並びに、標準パターン尖度加重ベクトルと入力パターン尖度加重ベクトルを作成する。次に、標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルを結合して標準パターン複合加重ベクトルを作成し、同様に、入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルを結合して入力パターン複合加重ベクトルを作成する。更に、上記標準パターン複合加重ベクトル及び入力パターン複合加重ベクトルにおいて、類似度検出精度を向上させる成分値を選択し、低下させる成分値を除外する(成分値を0にする)ことにより、標準パターン複合選択ベクトル及び入力パターン複合選択ベクトルを作成する。そして、標準パターン複合選択ベクトルと入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値として数値化するので、正確な類似度検出値を得ることができる。
また、本発明の音声認識方法では、正確な類似度検出値に基づいて音声認識を行うので、判定の基準が信頼性の高いものとなり、音声認識の精度を著しく向上できる利点がある。
本発明の一実施例における異常音の測定装置の構造を示すブロック図。 帯域通過フィルタ群の周波数ゲイン特性の一例を示す図。 標準音及び入力音のパワースペクトルの一例を示す図。 標準パターンベクトル形状と入力パターンベクトル形状、並びに、正規曲線と、その値を成分とする基準パターン正ベクトル形状及び基準パターン負ベクトル形状の一例を示す図。 標準パターン形状及び入力パターン形状の典型例、並びに、そのときの基準パターン正ベクトル及び基準パターン負ベクトルの形状変化を示す図。 正規分布の中心が移動したときの基準パターン正ベクトル及び基準パターン負ベクトルの形状変化の例を示す図。 図7(a)は、標準パターン形状と同形状に対しピークに「ずれ」がある入力パターン形状の典型例を示す図。図7(b)は、標準パターン形状と同形状に対し「ゆらぎ」がある入力パターン形状と1つのピークをもつ入力パターン形状の典型例を示す図。 図8(a)は、図7(a)に示した標準及び入力パターンについて、実験例1の歪度形状距離の実験結果を示す図。図8(b)は、図7(b)に示した標準及び入力パターンについて、実験例1の歪度形状距離の実験結果を示す図。 図9(a)は、図7(a)に示した標準及び入力パターンについて、実験例2の尖度形状距離の実験結果を示す図。図9(b)は、図7(b)に示した標準及び入力パターンについて、実験例2の尖度形状距離の実験結果を示す図。 実験例3で用いる標準パターン形状と入力パターン形状を示す図。 図10に示した標準及び入力パターンについて、実験例3の歪度形状距離の実験結果を示す図。 図10に示した標準及び入力パターンについて、実験例3の尖度形状距離の実験結果を示す図。 実験例4で用いる標準パターン形状と入力パターン形状を示す図。 図13に示した標準及び入力パターンについて、実験例4の歪度形状距離の実験結果を示す図。 図13に示した標準及び入力パターンについて、実験例4の尖度形状距離の実験結果を示す図。 1本の棒グラフがδだけ増加したときの歪度の変化を示す図。 2本の棒グラフが同時にδだけ増加したときの歪度の変化を示す図。 1本の棒グラフが0.2だけ増加し、1本の棒グラフがδだけ増加したときの歪度の変化を示す図。 基準パターンベクトルと歪度加重ベクトルを形状で表現した図。 図20(a)は、図7(a)に示した標準及び入力パターンについて、実験例5の歪度形状距離の実験結果を示す図。図20(b)は、図7(b)に示した標準及び入力パターンについて、実験例5の歪度形状距離の実験結果を示す図。 m次元パターン空間の模式図。 歪度加重ベクトルの共通化を説明する図。 歪度形状距離の計算フローチャートを示す図。 積和演算による標準パターン歪度加重ベクトルと入力パターン歪度加重ベクトルの作成方法を示す図。 図25(a)は、入力パターンの認識過程における歪度形状距離の直接計算法の計算フローチャートを示す図。図25(b)は、入力パターンの認識過程における歪度形状距離の近似計算法の計算フローチャートを示す図。 図26(a)は、図7(a)に示した標準及び入力パターンについて、実験例6の歪度形状距離の実験結果を示す図。図26(b)は、図7(b)に示した標準及び入力パターンについて、実験例6の歪度形状距離の実験結果を示す図。 基準パターンベクトルと尖度加重ベクトルを形状で表現した図。 尖度加重ベクトルの共通化を説明する図。 尖度形状距離の計算フローチャートを示す図。 積和演算による標準パターン尖度加重ベクトルと入力パターン尖度加重ベクトルの作成方法を示す図。 図31(a)は、入力パターンの認識過程における尖度形状距離の直接計算法の計算フローチャートを示す図。図31(b)は、入力パターンの認識過程における尖度形状距離の近似計算法の計算フローチャートを示す図。 図32(a)は、図7(a)に示した標準及び入力パターンについて、実験例7の尖度形状距離の実験結果を示す図。図32(b)は、図7(b)に示した標準及び入力パターンについて、実験例7の尖度形状距離の実験結果を示す図。 正規分布の分散の値が歪度形状距離の類似度検出精度に及ぼす影響について説明する図。 正規分布の中心が移動したときの基準パターンベクトルの形状変化の例を示す図。 正常音のパワースペクトルの2つの例と異常音のパワースペクトルの2つの例を示す図。 異なるカテゴリの標準音間の距離値の頻度分布と同じカテゴリの標準音間の距離値の頻度分布を示す模式図。 最適値ωsを求める処理手順を示す図。 実験例8による検定統計量Tの計算結果を示す図。 正規分布の分散の値が尖度形状距離の類似度検出精度に及ぼす影響について説明する図。 正規分布の中心が移動したときの基準パターンベクトルの形状変化の例を示す図。 最適値ωkを求める処理手順を示す図。 実験例9による検定統計量Tの計算結果を示す図。 標準パターン複合加重ベクトルの作成のための計算フローチャートを示す図。 積和演算による標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルの作成方法を示す図。 入力パターン複合加重ベクトルの作成のための計算フローチャートを示す図。 積和演算による入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルの作成方法を示す図。 形状距離dAの計算フローチャートを示す図。 最適な選択ベクトルを求めるためのフローチャートを示す図。 カテゴリ数が2である場合について、未知の入力音を認識する処理手順を示す図。 カテゴリ数が3以上である場合について、未知の入力音を認識する処理手順を示す図。 カテゴリ1〜カテゴリ4の組み合わせを示す図。 カテゴリ数がL(L≧3)である場合について、未知の入力音を認識する一般化された処理手順を示す図。 従来技術に関して、標準パターン形状及び入力パターン形状の典型例、並びに、そのときの基準パターンベクトルの形状変化を示す図。 従来技術に関して、図53における標準パターン形状と入力パターン形状のピークの位置を左に移動した典型例、並びに、そのときの基準パターンベクトルの形状変化を示す図。 従来技術に関して、標準パターン形状及び入力パターン形状の他の典型例、並びに、そのときの基準パターンベクトルの形状変化を示す図。
以下、本発明の実施の形態を説明する。
[原理説明]
基準形状として正規分布を用いて、標準パターン原始ベクトル(1次元)と入力パターン原始ベクトル(1次元)との間の新しい形状距離値を算出する方法について、本発明の原理を説明する。
従来技術では、第1に、標準パターンと入力パターンの形状差を正規分布などの基準形状(基準パターン)の形状変化に置き換え、その形状変化の大きさを「尖度」の変化量として数値化している。そして、基準パターンの中心を標準及び入力パターンの各成分位置に移動しながら「尖度」の変化量を求め、これらを用いて標準パターンと入力パターンとの類似の程度を距離値として検出している。
本発明では、第1に、標準パターンと入力パターンの形状差を正規分布などの基準形状(基準パターン)の形状変化に置き換え、その形状変化の大きさを「歪度」の変化量として数値化する。そして、基準パターンの中心を標準及び入力パターンの各成分位置に移動しながら「歪度」の変化量を求め、これらを用いて標準パターンと入力パターンとの類似の程度を距離値として検出する。
即ち、本実施例では、基準パターンの形状変化の大きさを「尖度」の変化量として数値化する従来技術の方法に代えて、基準パターンの形状変化の大きさを「歪度」の変化量として数値化しても、従来技術の方法と同様に、標準パターンと入力パターンとの類似の程度を距離値として検出できることを示す。
従来技術では、第2に、正規分布の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの「尖度」の変化率の値を成分とする尖度加重ベクトルを予め作成している。そして、音のパワースペクトルパターンを正規化しないで作成した標準パターン原始ベクトルについて、尖度加重ベクトルの成分値と標準パターン原始ベクトルの成分値との積和値を算出している。その際、尖度加重ベクトルの中心を標準パターン原始ベクトルの各成分位置に移動しながら積和値を求め、標準パターン尖度加重ベクトルを作成している。同様に、音のパワースペクトルパターンを正規化しないで作成した入力パターン原始ベクトルについて、尖度加重ベクトルの成分値と入力パターン原始ベクトルの成分値との積和値を算出している。その際、尖度加重ベクトルの中心を入力パターン原始ベクトルの各成分位置に移動しながら積和値を求め、入力パターン尖度加重ベクトルを作成している。そして、上記の標準パターン尖度加重ベクトルと入力パターン尖度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の尖度形状距離値としている。
本発明では、第2に、正規分布の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの「歪度」の変化率の値を成分とする歪度加重ベクトルを予め作成する。そして、音のパワースペクトルパターンを正規化しないで作成した標準パターン原始ベクトルについて、歪度加重ベクトルの成分値と標準パターン原始ベクトルの成分値との積和値を算出する。その際、歪度加重ベクトルの中心を標準パターン原始ベクトルの各成分位置に移動しながら積和値を求め、標準パターン歪度加重ベクトルを作成する。同様に、音のパワースペクトルパターンを正規化しないで作成した入力パターン原始ベクトルについて、歪度加重ベクトルの成分値と入力パターン原始ベクトルの成分値との積和値を算出する。その際、歪度加重ベクトルの中心を入力パターン原始ベクトルの各成分位置に移動しながら積和値を求め、入力パターン歪度加重ベクトルを作成する。そして、上記の標準パターン歪度加重ベクトルと入力パターン歪度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の歪度形状距離値とする。
即ち、本実施例では、基準パターンベクトルの「尖度」の変化率の値を成分とする尖度加重ベクトルを用いる従来技術の方法に代えて、基準パターンベクトルの「歪度」の変化率の値を成分とする歪度加重ベクトルを用いても、従来技術の方法と同様に、標準パターン原始ベクトルと入力パターン原始ベクトルとの類似の程度を歪度形状距離値として検出できることを示す。
上記第1及び第2の方法を示した後、本発明では、歪度加重ベクトルと尖度加重ベクトルの2つを用いて、標準パターン歪度加重ベクトルと入力パターン歪度加重ベクトル、並びに、標準パターン尖度加重ベクトルと入力パターン尖度加重ベクトルを作成する。次に、標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルを結合して標準パターン複合加重ベクトルを作成し、同様に、入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルを結合して入力パターン複合加重ベクトルを作成する。更に、上記標準パターン複合加重ベクトル及び入力パターン複合加重ベクトルにおいて、類似度検出精度を向上させる成分値を選択し、低下させる成分値を除外する(成分値を0にする)ことにより、標準パターン複合選択ベクトル及び入力パターン複合選択ベクトルを作成する。そして、標準パターン複合選択ベクトルと入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値とする。
即ち、「歪度」と「尖度」の2つを相補的に用いることにより情報量を増加させる一方で、図53〜図55の例に示したように、標準及び入力パターンに対する基準パターンの相対的位置関係について、類似度検出精度を向上させる標準及び入力パターンの成分位置と、低下させる成分位置とを区別するために、標準及び入力パターン複合加重ベクトルにおいて、類似度検出精度を向上させる成分値を選択し、低下させる成分値を除外する(成分値を0にする)ことにより、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の正確な形状距離値を求めることができる異常音の検出方法を提供する。
具体的には、標準パターン歪度加重ベクトルと入力パターン歪度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の歪度形状距離値とする。次に、正規分布の分散の値を変化させながら歪度加重ベクトルを作成し、異なるカテゴリの標準音間の歪度形状距離平均値から同じカテゴリの標準音間の歪度形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準音間の歪度形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準音間の歪度形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な歪度加重ベクトルを作成する。そして、上記最適な歪度加重ベクトルを用いて、標準パターン歪度加重ベクトル、及び、入力パターン歪度加重ベクトルを作成する。
同様に、標準パターン尖度加重ベクトルと入力パターン尖度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の尖度形状距離値とする。次に、正規分布の分散の値を変化させながら尖度加重ベクトルを作成し、異なるカテゴリの標準音間の尖度形状距離平均値から同じカテゴリの標準音間の尖度形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準音間の尖度形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準音間の尖度形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な尖度加重ベクトルを作成する。そして、上記最適な尖度加重ベクトルを用いて、標準パターン尖度加重ベクトル、及び、入力パターン尖度加重ベクトルを作成する。
更に、上記標準パターン歪度加重ベクトルと上記標準パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルを結合して標準パターン複合加重ベクトルを作成する。
同様に、上記入力パターン歪度加重ベクトルと上記入力パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルを結合して入力パターン複合加重ベクトルを作成する。
次に、標準及び入力パターン複合加重ベクトルと同じ成分の個数をもち、0または1を成分値とする選択ベクトルを作成し、それぞれ標準パターン複合加重ベクトル、及び、入力パターン複合加重ベクトルの各成分の成分値と上記選択ベクトルの同じ成分番号の成分値との積の値を求め、上記積の値を成分値とする標準パターン複合選択ベクトル、及び、入力パターン複合選択ベクトルを作成する。そして、上記標準パターン複合選択ベクトルと上記入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値とする。
更に、選択ベクトルの各成分の0と1の値を変化させながら、異なるカテゴリの標準音間の形状距離平均値から同じカテゴリの標準音間の形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準音間の形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準音間の形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な選択ベクトルを作成する。
最後に、上記最適な選択ベクトルを用いて作成した標準パターン複合選択ベクトルと入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値として検出する。
このような形状距離値は、標準音(或いは構造物の標準振動波)と入力音(或いは構造物の入力振動波)との間のベクトル形状変化を正確に検出するものであり、また、標準音声等の任意の標準振動波と入力音声等の任意の入力振動波との間の類似度を正確に検出するものである
従って、上記のように得られる形状距離値を用いて構造物の異常判定を行うことにより、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状変化を正確に検出することができ、構造物の異常検知の精度を著しく向上させることができる。また、このような形状距離値を用いて音声認識を行うことにより、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状変化を正確に検出することができ、音声認識の精度を著しく向上させることができる。
なお、最適な歪度加重ベクトル、最適な尖度加重ベクトル、及び、最適な選択ベクトルを求めるための目的関数が、ウェルチの検定統計量以外の統計量、または、異常音認識率、音声認識率などであっても上記の説明は成立する。
[実施例]
以下、本発明の実施例を添付図面に基づいて説明する。本実施例では、打音点検によりコンクリート構造物が発する異常音を正常音と識別するために、各音の周波数分布から標準パターンベクトルと入力パターンベクトルを作成し、これらベクトル間の形状差を正規分布の値を成分とする基準パターンベクトルの形状変化に置き換え、その形状変化の大きさを「歪度」の変化量、及び、「尖度」の変化量として数値化することにより異常音を検出し、更に、その検出値を用いて構造物の異常判定を行うものとする。
そのため、本実施例では、最初に、基準パターンの形状変化の大きさを「尖度」の変化量として数値化する従来技術の方法に代えて、基準パターンの形状変化の大きさを「歪度」の変化量として数値化しても、従来技術の方法と同様に、標準パターンと入力パターンとの類似の程度を距離値として検出できることを示す。
図1は異常音を検出するための測定装置の構造を示しており、1は検査対象となる構造物、2はマイクロホンである。マイクロホン2は構造物1の近傍の定位置に配置され、打音点検により構造物1が発する音波を測定し、信号として出力する。マイクロホン2の出力信号は、それぞれが異なる通過周波数帯域をもつ複数m個の帯域通過フィルタ3に入力され、音波の周波数成分波が抽出されてAD変換器4に入力され、各AD変換器4において同時刻に且つ周期的にディジタル信号に変換されてコンピュータ等の演算装置5に入力される。また、演算装置5は、マイクロホン2の出力信号に基づき、以下のように異常音の検出処理を行うように構成されている。ここで、i(i=1,2,…,m)番目の帯域通過フィルタ3の中心周波数はfiに設定されており、その出力信号がi番目のAD変換器4に入力されるものとする。
次に、図1の測定装置構造を用いて行う異常音の検出処理手順について説明する。ただし、音波のパワースペクトルを抽出する方法として様々なものが考案されているが、本実施例では、歴史的にも古く、性能が安定しているアナログ帯域通過フィルタ群による方法を用いた場合について、処理手順を説明する。図2は、帯域通過フィルタ3群の周波数ゲイン特性の一例を示したものであり、音波をi番目の帯域通過フィルタに通すことにより、中心周波数がfiの帯域の周波数成分波を抽出できることが分かる。このように、それぞれの帯域通過フィルタを構成しておけば、音波の周波数分布の特徴が抽出できる。
図1に示すように、i番目のAD変換器4の出力信号を時刻tの関数としてwi(t)(i=1,2,…,m)とした時、関数wi(t)はi番目の帯域通過フィルタ3を通して抽出した音波の周波数成分波である。そのため、i番目の周波数帯域のパワースペクトルPiは次の数1により算出できる。ただし、関数wi(t)の2乗和を計算する時間長Tは、時間的に変化する音波の特徴が顕著に現れるように任意に設定しておく。
Figure 0005956624
図3に、標準音及び入力音のパワースペクトルの一例を示す。ここで、標準音のパワースペクトルPi(i=1,2,…,m)を成分値soi(i=1,2,…,m)とする標準パターン原始ベクトルsoと、入力音のパワースペクトルPi(i=1,2,…,m)を成分値xoi(i=1,2,…,m)とする入力パターン原始ベクトルxoを作成し、次の数2のように表す。
Figure 0005956624
次に、数2において成分値soi及びxoiをそれぞれsoiの総和、及びxoiの総和で除算して正規化パワースペクトルsi及びxiを算出する。そして、siを成分とする標準パターンベクトルsと、xiを成分とする入力パターンベクトルxを作成し、次の数3のように表す。
Figure 0005956624
数2において成分値soiの総和、及びxoiの総和をそれぞれ定数cs、cxとしたとき、数2と数3の成分値の関係は次の数4のように表せる。
Figure 0005956624
また、数2において成分値soi及びxoiをそれぞれsoiの最大値、及びxoiの最大値で除算して正規化パワースペクトルs'i及びx'iを算出する。そして、s'iを成分とする標準パターンベクトルs'と、x'iを成分とする入力パターンベクトルx'を作成し、次の数5のように表す。
Figure 0005956624
数2において成分値soiの最大値、及びxoiの最大値をそれぞれ定数c's、c'xとしたとき、数2と数5の成分値の関係は次の数6のように表せる。
Figure 0005956624
数2、数3、数5は、標準音及び入力音のパワースペクトルの形状をそれぞれベクトルのm個の成分値で表現したものである。なお、本実施例では、図3に示すパワースペクトルの1本の棒グラフの幅を1/mとする。また、数2及び図3に示すsoとxoでは通常は面積や最大値が異なる。一方、数3に示すsとxでは面積が等しく、数5に示すs'とx'では最大値が等しい。
次の数7は、正規分布の確率密度関数の式である。ただし、μは平均値、σ2は分散である。
Figure 0005956624
図4(a)(b)は、数3に示す標準パターンベクトルsの形状と入力パターンベクトルxの形状の一例を示している。次に、標準パターンと入力パターンの形状差を正規分布の形状変化に置き換え、その形状変化の大きさを「歪度」の変化量として数値化する。ところが、一般に、ベクトル形状の歪度の計算式は、ベクトルの成分値が負のときには定義できない。そこで、ベクトルの成分値の変化が非減少になるように、初期形状が正規分布である一対の基準パターンを作成する。図4(c)(d)は、それぞれ正規分布の関数値r(+)i及びr(-)iと同じ高さをもつ棒グラフ(基準パターン)を示したものである。ここで、r(+)iを成分とする基準パターン正ベクトルr(+)と、r(-)iを成分とする基準パターン負ベクトルr(-)を作成し、次の数8のように表す。
Figure 0005956624
図4(c)(d)から分かるように、これら一対の基準パターンベクトルr(+)、r(-)は相等なベクトルであり、正規分布の形状をそれぞれベクトルのm個の成分値で表現したものである。ただし、数8の成分の個数は数3の成分の個数mに等しく、図4(a)〜(d)の棒グラフの幅はすべて等しいものとする。また、ここではmが奇数の場合を考えているが、mが偶数の場合にも同様の議論が成り立つ。また、図4(c)(d)に示すように、正規分布の中心は標準及び入力パターンの中央に位置するものとし、正規分布の分散σ2は、正規分布の形状の特徴をベクトルのm個の成分値で表現できる範囲の任意の値に設定して良い。なお、実験によれば、正規分布の−2.1σから+2.1σの範囲を用いて基準パターンベクトルを作成したとき有効な結果が得られることが分かっている。そこで、本実施例では、正規分布の−2.1σから+2.1σの範囲を用いることとする。
次に、数3に示す標準パターンベクトルsと入力パターンベクトルxの形状差を、次の数9を用いて基準パターン正ベクトルr(+)及び基準パターン負ベクトルr(-)の形状変化に置き換える。ただし、数9において、右辺のr(+)i及びr(-)iは形状が正規分布である基準パターン正負ベクトルの成分値を示し、左辺のそれらは形状が変化した後の成分値を示している。数9では、入力パターンベクトルの成分値xiが標準パターンベクトルの成分値siより大きいとき、基準パターン正ベクトルの成分値r(+)iが正規分布の値から|xi−si|だけ増加する。また、xiがsiより小さいとき、基準パターン負ベクトルの成分値r(-)iが正規分布の値から|xi−si|だけ増加する。このように数9では、r(+)iとr(-)iの値の変化は非減少である。
Figure 0005956624
次に、図5に示す典型例を用いて、数9を説明する。図5は、ベクトルの成分値をベクトル形状として図形で表現したものである。図5(a)〜(e)の上段と中段は、それぞれ標準パターンベクトル形状と入力パターンベクトル形状の典型例を示しており、図5(a)〜(d)は、それぞれ1つのピークをもつ標準パターンと入力パターンを示しており、図5(e)は、平坦な形状をもつ標準パターンと、平坦な形状の上に「ゆらぎ」が発生した入力パターンを模式的に示している。また、図5(a)〜(e)の下段は、標準パターンと入力パターンの形状差を初期形状が正規分布である一対の基準パターンの形状変化に置き換える様子を示している。ただし、図5(a)〜(d)に示す標準及び入力パターンのピークの高さはすべて同じであり、図5(a)〜(e)に示す標準及び入力パターンの面積はすべて1であるものとする。また、基準パターン負ベクトル形状は、基準パターン正ベクトル形状との対比を容易にするため、上下を逆に表示している。
●図5(a)は、標準パターンと入力パターンが同じ形状である例を示している。このとき、数9のr(+)iとr(-)iに変化がないため、図5(a)に示す一対の基準パターンにおいても正規分布から形状の変化はない。
●図5(b)(c)(d)はそれぞれ、標準パターンと入力パターンのピークの「ずれ」が小さい例、中程度の例、大きい例を示している。このとき数9を形状で表現すれば、図5(b)(c)(d)に示す一対の基準パターンの形状は、それぞれ標準パターンのピーク位置において標準パターンの成分値と入力パターンの成分値の差の絶対値だけr(-)iが増加し、同時に入力パターンのピーク位置において標準パターンの成分値と入力パターンの成分値の差の絶対値だけr(+)iが増加する。
●図5(e)では、数9において標準パターンの成分値と入力パターンの成分値の差の絶対値だけr(+)iとr(-)iが交互に増加するため、図5(e)に示す一対の基準パターンの形状は共に正規分布から変化が小さい。
図5において標準パターンベクトル形状及び入力パターンベクトル形状の典型例を示したが、通常の場合には、標準パターンベクトル形状に対して入力パターンベクトル形状のほとんどの部分が変化する。従って、数9は変化したすべての部分について形状変化の計算を行うことになる。また、数9は、絶対的な形状を問題にしているのではなく、相対的な形状変化を問題にしているため、任意形状の標準パターン及び入力パターンについて適用が可能である。
次に、数9により形状変化した一対の基準パターン(基準パターン正ベクトルr(+)と基準パターン負ベクトルr(-))について、それぞれの形状変化の大きさを「歪度」の変化量として数値化する。
ここで、基準パターン正ベクトルr(+)の歪度B(+)、及び、基準パターン負ベクトルr(-)の歪度B(-)は、それぞれ次の数10により算出できる。ただし、数10中のLi(i=1,2,…,m)は、図4(c)(d)に示すように、正規分布の中心からの偏差の値であり、正規分布の形状の特徴を表現できる範囲の任意の値に設定しておく。
Figure 0005956624
数10より算出される歪度の値B(+)及びB(-)は、正規分布の中心のまわりの3次の積率と、2次の積率の3乗の平方根との比である。なお、正規分布に限らず、数10より、任意の基準形状の歪度の値を算出できる。
前述したように、一般に、ベクトル形状の歪度の計算式においては、ベクトルの成分値が負の場合には定義できず、標準パターンベクトルの成分値と入力パターンベクトルの成分値のあらゆる大小関係に対して、基準パターンベクトルの成分値が非負である必要がある。このため、初期値が同じ形状の基準パターン正ベクトルr(+)及び基準パターン負ベクトルr(-)を作成しておき、数9ではそれらの成分値の変化が非減少になるようにし、数10においてそれぞれの歪度B(+)、B(-)を算出するようにしている。
次に、基準パターン正ベクトルの歪度B(+)と基準パターン負ベクトルの歪度B(-)の2つの変化量から、歪度の差の値(B(+)−B(-))を以て、標準パターンベクトルと入力パターンベクトルの類似の程度を表す歪度形状変化量Dとする。
例えば、数8により正規分布形状に初期設定された2つの基準パターンベクトルr(+)及びr(-)の歪度の値は、共に0に等しい。そのため、数9により形状変化した基準パターン正ベクトル及び基準パターン負ベクトルの歪度の変化量は、それぞれ{B(+)−0}及び{B(-)−0}となる。即ち、正方向の変化量は{B(+)−0}、また負方向の変化量は{B(-)−0}となり、全体の変化量はこの差の値となる。従って、次の数11より、歪度形状変化量Dが算出できる。
Figure 0005956624
Figure 0005956624
次に、図5(a)〜(e)に示した標準パターンベクトル形状及び入力パターンベクトル形状の典型例について、数11より算出される歪度形状変化量Dが示す値について説明する。また、表2は、図5(a)〜(e) において,基準パターン正負ベクトルの成分値r(+)i及びr(-)iのそれぞれの増加が歪度B(+)及びB(-)の増減にどのように影響するか、そして全体として歪度形状変化量Dがどのように変化するかをまとめたものである即ち、表2は、図5において標準パターン形状に対して入力パターン形状が変化したときの歪度の値の変化を示す表である。図5及び表2から次のことが分かる
●図5(a)では、r(+)i及びr(-)iに変化がなくB(+)=0かつB(-)=0よりD=0になる。
●図5(b)(c)(d)に共通して、標準パターンのピーク位置iが基準パターン負ベクトルの中心にあり、基準パターン負ベクトルの形状が基準パターン負ベクトルの中心に関して左右対称であるためr(-)iが増加してもB(-)=0になる。
●図5(b)では、入力パターンのピーク位置iが基準パターン正ベクトルの中心付近にあるためr(+)iの増加によってB(+)≒0になる。全体としてD≒0になる。
●図5(d)では、入力パターンのピーク位置iが基準パターン正ベクトルの端の部分にあり、基準パターン正ベクトルの形状が右に裾が長い分布になるためr(+)iの増加によってB(+)≫0になる。全体としてD≫0になる。
●図5(c)では、基準パターン正ベクトルが図5(b)と(d)の中間の形状をもつため歪度はそれらの中間の値になる。全体としてD>0になる。
●図5(e)では、一対の基準パターンの形状は共に正規分布から変化が小さいためB(+)≒0かつB(-)≒0よりD≒0になる。なお、r(+)i及びr(-)iがランダムに増加したときにもD≒0になる。
図5(a)〜(d) より、標準パターンと入力パターンのピークの「ずれ」の増加とともに|D|が単調増加することが分かる。また図5(e)より、「ゆらぎ」に対してD≒0になることも分かる。
これまで、図4及び図5に示したように、正規分布の中心が標準及び入力パターンの中央に位置するとして歪度形状変化量Dを求めた。次に、正規分布の中心が標準及び入力パターンの任意の成分位置j(j=1,2,…,m)に移動した場合を考え、jごとに歪度形状変化量Djを求める。図6(a)(b)に、標準パターンと入力パターンの一例を示す。また図6(c)〜(f) に、正規分布の中心がそれぞれ位置1、3、j、mに移動したときの基準パターン正負ベクトルを示す。ただし、図6(a)〜(f) の棒グラフの幅はすべて等しいものとする。なお、図6(e)に示すように、基準パターン正負ベクトルは必ずしも標準及び入力パターン全体を覆う必要はない。
次に、基準パターン正負ベクトルの「ゆらぎ」に対する感度が正規分布の移動位置にかかわらず等しくなるように端の処理を行う。図6(c)〜(f)に示す基準パターン正負ベクトルにおいて、白色の棒グラフは入力パターンの成分番号iに対応しているため入力パターンの「ゆらぎ」により値が変化するが、灰色の棒グラフは対応していないため値は変化しない。そこで、すべての基準パターン正負ベクトルにおいて白色の棒グラフの数が同じになるようにnjの値を設定する。図6(c)〜(f)では一例として、基準パターン正負ベクトルをそれぞれ9本の白色の棒グラフで構成している。このようにして、基準パターン正負ベクトルの「ゆらぎ」に対する感度を等しくする。以上のように数8を拡張して、正規分布の分散が移動位置jごとに異なる基準パターン正負ベクトルrj(+)及びrj(-)を作成し、次の数12のように表す。
Figure 0005956624
そして、標準パターンベクトルsと入力パターンベクトルxの形状差を、数9の代わりに次の数13を用いてrj(+)とrj(-)の形状変化に置き換える。
Figure 0005956624
なお、(1+nj)/2はrj(+)及びrj(-)の中央の成分番号であり、i−jは中央の成分番号からの偏差である。また、kの値が1≦k≦njを満たさない場合には、r(+)jk、r(-)jkは変化しないものとする。図6は、数13を形状で表現したものであり、r(+)jk及びr(-)jkが増加する様子を示している。次に、rj(+)とrj(-)の形状変化の大きさを歪度の変化量として数値化する。rj(+)とrj(-)の歪度は、数10の代わりに次の数14より算出できる。
Figure 0005956624
ただし、Ljkは位置jに対応する正規分布の中心からの偏差の値である。このとき歪度形状変化量Djは、数11の代わりに次の数15より算出できる。
Figure 0005956624
図6(c)〜(f)に示すように、Djは位置jごとに、それぞれの基準パターン正負ベクトルから算出される。数15で得られたm個の歪度形状変化量Djを用いて、標準パターンと入力パターンの形状差を、次の数16より算出して歪度形状距離dとする。
Figure 0005956624
[実験例1]
以上で歪度の変化量を用いた歪度形状距離値dの算出方法を述べたが、次に、図7(a)(b)に示す標準及び入力パターンについて、従来のユークリッド距離、従来のコサイン尺度、及び、数16による歪度形状距離dを算出する数値実験を行った結果を説明する。
図7(a)は「ずれ」の例として、パワースペクトルに2個のピークをもつ標準パターンと、ピーク位置がそれぞれ異なる入力パターン1、2、3を示している。ただし、各パターンは変数τについて図7(a)に示す関係をもつものとし、これにより標準パターンと各入力パターンの面積は常に同じ値になる。このとき,標準パターンと各入力パターン1、2、3の間のユークリッド距離及びコサイン尺度d1、d2、d3はd1=d2=d3になり、入力パターン1、2、3を区別できない。
また、図7(a)において標準パターンと各入力パターン1、2、3の間の歪度形状距離を、それぞれd1、d2、d3とする。ただし、図6において移動位置jの値にかかわらず同じ値nj=27、σj=0.58を用いて数12を作成した。このとき,基準パターン正負ベクトルの白色の棒グラフの数は、すべてのjについて11本になる。図8(a)は、図7(a)においてτの値を0.0から1.0まで増加しながら歪度形状距離d1、d2、d3を算出した結果を示している。図8(a)より、τの値を固定したとき、入力パターンのピークの「ずれ」の増加とともに歪度形状距離が単調増加することが分かる。即ち、すべてのτの値において、入力パターン1、2、3を区別できることが分かる。
図7(b)は「ゆらぎ」の例として、平坦なパワースペクトルをもつ標準パターンと、平坦なパワースペクトルの上に「ゆらぎ」が発生した入力パターン4、5と、1個のピークをもつ入力パターン6を示している。ただし、各パターンは変数ρについて図7(b)に示す関係をもつものとし、これにより標準パターンと各入力パターンの面積は常に同じ値になる。このときも,標準パターンと各入力パターン4、5、6の間のユークリッド距離及びコサイン尺度d4、d5、d6はd4=d5=d6になり、入力パターン4、5、6を区別できない。
また、図7(b)において標準パターンと各入力パターン4、5、6の間の歪度形状距離を、それぞれd4、d5、d6とする。ただし、図6において移動位置jの値にかかわらず同じ値nj=27、σj=0.58を用いて数12を作成した。このとき,基準パターン正負ベクトルの白色の棒グラフの数は、すべてのjについて11本になる。図8(b)は、図7(b)においてρの値を0.0から1.0まで増加しながら歪度形状距離d4、d5、d6を算出した結果を示している。図8(b)では、ρの値を固定したとき、d6に比べd4、d5の値は小さい。即ち、面積が等しい入力パターン4、5、6において、1個のピークにエネルギーが集中している入力パターン6に比べ、「ゆらぎ」として複数のピークにエネルギーが分散している入力パターン4、5では歪度形状距離の値は小さい。この結果より、「ゆらぎ」に対して歪度形状距離の変動は小さいことが分かる。即ち、すべてのρの値において、入力パターン4、5と入力パターン6を区別できることが分かる。
[実験例2]
ところで、従来技術(特許第3426905号公報、特許第3342864号公報)では、「尖度」の変化量を用いた尖度形状距離値の算出方法を開示している。そこで次に、図7(a)(b)に示した標準及び入力パターンについて尖度形状距離値dを算出する数値実験を行う。即ち、数14及び数15の代わりに、それぞれ次の数17及び数18を用いて、実験例1と同じ条件により尖度形状距離値dを算出する数値実験を行った結果を説明する。
Figure 0005956624
Figure 0005956624
図9(a)は、図7(a)においてτの値を0.0から1.0まで増加しながら尖度形状距離d1、d2、d3を算出した結果を示している。図9(a)より、τの値を固定したとき、入力パターンのピークの「ずれ」の増加とともに尖度形状距離が単調増加することが分かる。即ち、すべてのτの値において、入力パターン1、2、3を区別できることが分かる。
図9(b)は、図7(b)においてρの値を0.0から1.0まで増加しながら尖度形状距離d4、d5、d6を算出した結果を示している。
図9(b)では、ρの値を固定したとき、d6に比べd4、d5の値は小さい。即ち、面積が等しい入力パターン4、5、6において、1個のピークにエネルギーが集中している入力パターン6に比べ、「ゆらぎ」として複数のピークにエネルギーが分散している入力パターン4、5では尖度形状距離の値は小さい。この結果より、「ゆらぎ」に対して尖度形状距離の変動は小さいことが分かる。即ち、すべてのρの値において、入力パターン4、5と入力パターン6を区別できることが分かる。
図8(a)(b)、及び、図9(a)(b)より、歪度形状距離を用いた類似度検出の実験結果は、従来技術による尖度形状距離を用いた類似度検出の実験結果とほぼ同じになることが分かる。
[実験例3]
次に、図10に示す標準及び入力パターンについて、歪度形状距離d及び尖度形状距離dを算出する数値実験を行った結果を説明する。ただし、この数値実験は、実験例1と同じ条件により行った。
図10は、パワースペクトルに1個のピークをもつ標準パターンと、ピーク位置がそれぞれ異なる入力パターン7、8、9を示している。ただし、各パターンは変数τについて図10に示す関係をもつものとし、これにより標準パターンと各入力パターンの面積は常に同じ値になる。また、図10において標準パターンと各入力パターン7、8、9の間の歪度形状距離及び尖度形状距離を、それぞれd7、d8、d9とする。なお、図10に示す標準パターンは、図54(b)〜(d)に示す標準パターンと同じ形状であり、図10に示す入力パターン7、8、9は、それぞれ図54(b)〜(d)に示す入力パターンと同じ形状である。
図11は、図10においてτの値を0.0から1.0まで増加しながら歪度形状距離d7、d8、d9を算出した結果を示している。図11より、τの値を固定したとき、入力パターンのピークの「ずれ」の増加とともに歪度形状距離が単調増加することが分かる。即ち、すべてのτの値において、入力パターン7、8、9を区別できることが分かる。また、図12は、図10においてτの値を0.0から1.0まで増加しながら尖度形状距離d7、d8、d9を算出した結果を示している。図11及び図12より、歪度形状距離を用いた類似度検出の実験結果は、従来技術による尖度形状距離を用いた類似度検出の実験結果とほぼ同じになることが分かる。
[実験例4]
更に、図13に示す標準及び入力パターンについて、歪度形状距離d及び尖度形状距離dを算出する数値実験を行った結果を説明する。ただし、この数値実験は、実験例1と同じ条件により行った。
図13は、パワースペクトルの中央に1個のピークをもつ標準パターンと、中心に関して左右対称の位置にそれぞれ異なる2つのピークをもつ入力パターン10、11、12を示している。ただし、各パターンは変数τについて図13に示す関係をもつものとし、これにより標準パターンと各入力パターンの面積は常に同じ値になる。また、図13において標準パターンと各入力パターン10、11、12の間の歪度形状距離及び尖度形状距離を、それぞれd10、d11、d12とする。なお、図13に示す標準パターンは、図55(b)〜(d)に示す標準パターンと同じ形状であり、図13に示す入力パターン10、11、12は、それぞれ図55(b)〜(d)に示す入力パターンと同じ形状である。
図14は、図13においてτの値を0.0から1.0まで増加しながら歪度形状距離d10、d11、d12を算出した結果を示している。図14より、τの値を固定したとき、入力パターンのピークの「ずれ」の増加とともに歪度形状距離が単調増加することが分かる。即ち、すべてのτの値において、入力パターン10、11、12を区別できることが分かる。一方、図15は、図13においてτの値を0.0から1.0まで増加しながら尖度形状距離d10、d11、d12を算出した結果を示している。図14及び図15より、歪度形状距離を用いた類似度検出の実験結果は、従来技術による尖度形状距離を用いた類似度検出の実験結果とほぼ同じになること分かる。
数16に示す歪度形状距離dは、基準パターンベクトルの形状変化の大きさを「尖度」の変化量として数値化する従来技術の方法に代えて、基準パターンベクトルの形状変化の大きさを「歪度」の変化量として数値化するものである。以上の実験例1〜4の数値実験により、数16に示す歪度形状距離を用いた類似度検出の実験結果は、従来技術による尖度形状距離を用いた類似度検出の実験結果とほぼ同じになること分かる。従って、歪度形状距離または尖度形状距離のいずれか一方を、或いは両者を同時に用いることにより、標準パターンと入力パターンとの類似の程度を距離値として検出できることが分かる。
ここで、実験例3及び実験例4の実験結果について考察を述べる。図54(b)〜(d)において、標準パターンと入力パターンのピークの「ずれ」の増加とともに、尖度の値が単調に変化しない事象が発生することを示した。また、図55(b)〜(d)において、標準パターンと入力パターンのピークの「ずれ」が増加しても、歪度の値は全く変化しない事象が発生することを示した。その一方で、実験例3及び実験例4において、図10及び図13に示すように図54(b)〜(d)及び図55(b)〜(d)と同じ形状の標準及び入力パターンを用いて数値実験を行った結果、図11、図12、図14、及び、図15に示すように標準パターンと入力パターンのピークの「ずれ」の増加とともに歪度形状距離及び尖度形状距離が単調増加することを確認した。このことは、基準パターンの中心を標準及び入力パターンの各成分位置に移動しながら歪度の変化量または尖度の変化量を求めて数16を用いてそれらの2乗和の平方根を算出したならば、標準パターンと入力パターンのピークの「ずれ」の増加とともに歪度形状距離値及び尖度形状距離値が単調増加する結果が得られることを示している。即ち、数16は標準及び入力パターンの各成分位置における尖度の変化量または歪度の変化量を平均化するものであるから、標準パターンと入力パターンのピークの「ずれ」の増加とともに尖度の値または歪度の値が単調に変化しない事象が発生しても、標準パターンと入力パターンのピークの「ずれ」の増加とともに歪度形状距離値及び尖度形状距離値が単調増加する結果が得られたと考えられる。しかしながら、平均化することは、歪度の値や尖度の値が単調に変化しない事象を単調に変化する事象で相殺することであり、類似度検出精度を低下させるものであるから、根本的な改善が必要になる。そこで、本実施例の後半において、根本的な改善を行う方法について説明する。
本実施例では、次に、正規分布の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの「歪度」の変化率の値を成分とする歪度加重ベクトル(歪度加重曲線)を予め作成する。そして、歪度加重ベクトルの成分値と標準パターン原始ベクトルの成分値との積和値を算出する。その際、歪度加重曲線の中心を標準パターン原始ベクトルの各成分位置に移動しながら積和値を求め、標準パターン歪度加重ベクトルを作成する。同様に、歪度加重ベクトルの成分値と入力パターン原始ベクトルの成分値との積和値を算出する。その際、歪度加重曲線の中心を入力パターン原始ベクトルの各成分位置に移動しながら積和値を求め、入力パターン歪度加重ベクトルを作成する。そして、上記の標準パターン歪度加重ベクトルと入力パターン歪度加重ベクトルのなす角の値を求めることにより、標準パターン原始ベクトルと入力パターン原始ベクトルとの類似の程度を歪度形状距離値として検出できることを示す。
即ち、基準パターンベクトルの「尖度」の変化率の値を成分とする尖度加重ベクトルを用いる従来技術の方法に代えて、基準パターンベクトルの「歪度」の変化率の値を成分とする歪度加重ベクトルを用いても、従来技術の方法と同様に、標準パターン原始ベクトルと入力パターン原始ベクトルとの類似の程度を歪度形状距離値として検出できることを示す。
変数uiを離散値としたとき、関数f(ui)の歪度Bは次の数19より算出できる。
Figure 0005956624
ここで、歪度Bと図16〜図18に示す棒グラフの増分δの間の関係を調べる数値実験を行う。図16〜図18の各(a)〜(c)の上段は、正規分布の関数値f(ui)と同じ高さをもつそれぞれm本の棒グラフを示している。ただし、本実施例では、mが奇数の場合を考えているが、mが偶数の場合にも同様の議論が成り立つ。図16(a)〜(c) の棒グラフでは、それぞれ正規分布の中央、中間、端の部分において1本の棒グラフがδだけ増加している。図17(a)〜(c)では、2本の棒グラフが同じ値δだけ増加している。また図18(a)〜(c)では、1本の棒グラフがδだけ増加し、同時に、他の1本の棒グラフが0.2だけ増加している。
次に、上記のように形状変化した棒グラフについて、数19を用いて歪度Bを算出する。図16〜図18の各(a)〜(c)の下段に、得られたBとδの関係を記号(i)〜(ix)のグラフで示す。ただし、m=11とした。
図16(a)〜(c)に示す(i)(ii)(iii)より、δ=0のときにB=0になり、δの増加とともにBは近似的に直線として変化することが分かる。図17(a)〜(c)において記号(i)+(ii)、(ii)+(iii)、(i)+(iii)のグラフは、(i)(ii)(iii)のグラフをそれぞれ加算して得られた結果である。これらより(iv)(v)(vi)は、それぞれ(i)+(ii)、(ii)+(iii)、(i)+(iii)で近似できることが分かる。また図18(a)〜(c)より、(vii)(viii)(ix)のグラフの傾きは(i)(ii)(iii)にそれぞれ等しく、縦軸の切片は(ii)(iii)(i)のδ=0.2におけるBの変化量にそれぞれ等しいことが分かる。
以上の説明より、数19を用いて(i)(ii)(iii)のグラフを予め作図しておけば、(i)(ii)(iii) から(iv)〜(ix)のグラフを近似的に作図できることが分かる。即ち、(i)(ii)(iii)のグラフの傾きからBの変化率gi(i=1,2,…,m)を予め算出しておけば、複数の棒グラフが異なる値δiだけ増加した場合でも、棒グラフごとに積gi・δiを求め、増加したすべてのiについてgi・δiを加算することによりBの近似値が算出できる。なお、Bについての上記の説明はmの値、及び、正規分布の分散σ2の値にかかわらず常に成り立つ。
数12では、それぞれ正規分布の関数値r(+)jk及びr(-)jkを成分とする基準パターン正負ベクトルrj(+)及びrj(-)を移動位置jごとに作成した。図19(a)は、数12を形状で表現したものであり、また、図16(a)〜(c)の上段に示す棒グラフを一般化して表現したものであり、nj本の棒グラフで構成される。図19(a)では、位置k(k=1,2,…,nj)において1本の棒グラフがδだけ増加している。このとき、δに対するBの変化率は、数19と次の数20を用いて算出できる。
Figure 0005956624
gj(1+nj)/2、gjl、gjnjは、図16(a)〜(c)の下段に示したグラフの傾きにそれぞれ対応する。次に、図19(a)において、δだけ増加した棒グラフの位置kを1からnjまで走査しながら数20を計算する。図19(b)に、得られたgjkの値を棒グラフで示す。ただし、δ=0.2とした。ここで、gjkを成分とする歪度加重ベクトルgjを作成し、次の数21のように表す。
Figure 0005956624
数21は、歪度Bの変化率をベクトルのnj個の成分値で表現したものである。なお、初期状態のrj(+)及びrj(-)は相等なベクトルであるから、rj(+)から算出した歪度加重ベクトルとrj(-)から算出した歪度加重ベクトルは同じベクトルになる。このため、数21では記号(+)及び(−)を表記しないこととする。また、図19(b)に示す曲線は、njの値が十分に大きいときに算出したgjkの棒グラフの包絡線であり、本実施例ではこれを歪度加重曲線と呼ぶ。図19(a)(b)に示すように、正規曲線が歪度加重曲線に対応し、基準パターン正負ベクトルが歪度加重ベクトルに対応する。
数13では、標準パターンベクトルsと入力パターンベクトルxの形状差を、基準パターン正負ベクトルrj(+)及びrj(-)の形状変化に置き換えた。そして、数13により形状変化したrj(+)及びrj(-)の歪度を、数14より算出した。前述の説明では、歪度Bの変化率gjkと棒グラフの増加量|xi−si|の積gjk・|xi−si|を求め、増加したiについてgjk・|xi−si|を加算して歪度Bの近似値が算出できることを示した。従って、数14のB(+)jとB(-)jの値は次の数22より近似計算できる。
Figure 0005956624
ただし、kの値が1≦k≦njを満たさない場合にはgjk=0とする。次に、符号を考慮しながら|xi−si|を(xi−si)と置いて数22を次の数23のように書き換える。
Figure 0005956624
数14を用いて歪度を直接的に計算する代わりに、数23を用いて積和演算により歪度の値が近似計算できる。
数15では、標準パターンと入力パターンの形状差を歪度形状変化量Djとして算出した。従って、数15のDjの値は、数23を数15に代入して次の数24より近似計算できる。
Figure 0005956624
数24よりDjの値は、歪度加重ベクトルの成分値gjkと入力パターンベクトルの成分値xiの積和演算、並びに、同gjkと標準パターンベクトルの成分値siの積和演算に分離できることが分かる。
次に、数24に示す2つの積和演算を、それぞれsg(j)及びxg(j)と置いて次の数25のように表す。
Figure 0005956624
次に、sg(j)を成分とするベクトルsgと、xg(j)を成分とするベクトルxgを作成し、次の数26のように表す。数26は、面積で正規化したパワースペクトルを用いて作成したベクトルである。
Figure 0005956624
数24及び数25より、Djは、近似値として、次の数27のように表せる。
Figure 0005956624
数27よりDjは、近似値として、ベクトルxgの成分値xg(j)からベクトルsgの成分値sg(j)を減算して得られることが分かる。
数16では、標準パターンと入力パターンの形状差を歪度形状距離dとして算出した。従って、数16のdの値は、数27を数16に代入して次の数28より近似計算できる。ただし、dは、歪度形状距離dの近似値である。
Figure 0005956624
以上のようにdの値は、数3、数21、数25、数28を順に用いて算出できる。また、数25及び数28より、dの値は、標準パターンを用いた積和演算と入力パターンを用いた積和演算に分離して計算できることが分かる。
[実験例5]
数28に示すdの近似精度を検証するために、図7(a)(b)に示した標準及び入力パターンについて、実験例1と同じ条件を用いて、実験例1による歪度形状距離値d1〜d6と数28による近似値d1〜d6を比較する数値実験を行った。図20(a)(b)に実験結果を示す。なお、図20(a)(b)に示すd1〜d6のグラフは、図8(a)(b)に示すそれらと同じものである。図20(a)(b)よりd1〜d6、及び、d1〜d6は、それぞれほぼ一致していることが分かる。
次に、歪度加重ベクトルの成分値gjkと数2に示す標準パターン原始ベクトルの成分値soiの積和演算をsog(j)と置き、同gjkと入力パターン原始ベクトルの成分値xoiの積和演算をxog(j)と置いて次の数29のように表す。数29は、数25において、si及びxiをそれぞれsoi及びxoiに置き換えたものである。
Figure 0005956624
そして、sog(j)を成分とする標準パターン歪度加重ベクトルsogと、xog(j)を成分とする入力パターン歪度加重ベクトルxogを作成し、次の数30のように表す。数30は、正規化していないパワースペクトルを用いて作成したベクトルである。
Figure 0005956624
また、成分値gjkと数5に示す成分値s’iの積和演算をs’g(j)と置き、同gjkと成分値x’iの積和演算をx’g(j)と置いて次の数31のように表す。数31は、数25において、si及びxiをそれぞれs’i及びx’iに置き換えたものである。
Figure 0005956624
次に、s’g(j)を成分とするベクトルs’gと、x’g(j)を成分とするベクトルx’gを作成し、次の数32のように表す。数32は、最大値で正規化したパワースペクトルを用いて作成したベクトルである。
Figure 0005956624
ここで、数4を数25に代入し、数29を用いて次の数33を得る。
Figure 0005956624
同様に、数6を数31に代入し、数29を用いて次の数34を得る。
Figure 0005956624
図21は、m次元パターン空間の模式図であり、数30に示すsogとxog、数26に示すsgとxg、数32に示すs’gとx’gの6つのベクトルを示している。ただし、ベクトルの始点はすべて原点oにある。数33よりsg(j)とsog(j)は比例定数1/csの比例関係にあり、xg(j)とxog(j)は比例定数1/cxの比例関係にあることが分かる。また、数34よりs’g(j)とsog(j)は比例定数1/c’の比例関係にあり、x’g(j)とxog(j)は比例定数1/c’xの比例関係にあることが分かる。従って、図21に示すように、ベクトルs’g、sg、sogは同じ方向をもつ。また、ベクトルx’g、xg、xogは同じ方向をもつ。
数28より歪度形状距離dの近似値dは、ベクトルsgとベクトルxgの間のユークリッド距離として算出できることが分かる。そこで図21では、sgとxgの終点間の距離をdとしている。また、数3の代わりに数5を標準及び入力パターンベクトルとした場合、d’はs’gとx’gの間のユークリッド距離として算出できる。そこで、図21では、s’gとx’gの終点間の距離をd’としている。図21よりdとd’は、パワースペクトルの正規化の方法に影響されて異なる値になっていることが分かる。この問題を改善するため、図21に示すsogとxogのなす角の値dAを、次の数35より算出して新しい歪度形状距離dAとする。dAは、パワースペクトルの正規化の方法に影響されない歪度形状距離である。
Figure 0005956624
[歪度加重ベクトルの共通化]
次に、本発明における歪度加重ベクトルの共通化について説明する。数12では、m個の基準パターン正負ベクトル(正規曲線)を作成した。図22(a)に一例として、これらm個のうちの3個の正規曲線を示す。ただし、正規曲線の中心を成分位置jに重ねて作図している。次に数21では、図19(a)(b)に示すように、数12からm個の歪度加重ベクトル(歪度加重曲線)を作成した。このようにして図22(a)のそれぞれの正規曲線から作成した歪度加重曲線を図22(b)に示す。本実施例では、正規分布の分散の値が変化したときでも標準及び入力パターンの棒グラフの幅は一定である。この場合には図22(b)に示すように、これら歪度加重曲線は横軸方向に伸縮したとき一致する。そこで、m個の歪度加重ベクトルを1つに共通化して記憶容量を減らすことを考える。図22(c)に、分散σ2=1の正規曲線の−2.1σから+2.1σの範囲を用いて作成した歪度加重曲線を示す。また、歪度加重曲線の関数値と同じ高さをもつ棒グラフも示す。ここでは記憶容量を減らすため、歪度加重曲線の右半分を用いて棒グラフを作成する。そして、棒グラフの高さの値gk0(k0=1,2,…,n)を成分とする歪度加重ベクトルgを作成し、次の数36のように表す。ただし、図22(c)に示す棒グラフの幅を十分に小さくするため、nの値は数21の成分の個数njよりも十分に大きいものとする。更に、n<k0において適当数のgk0=0を挿入して数36を作成する。数36は、数21を代表する歪度加重ベクトルであり、歪度加重曲線の形状を表現するn個の成分値と適当数の成分値0で構成される。
Figure 0005956624
図22(b)の太線の歪度加重曲線に示すように、数21の歪度加重ベクトルgjでは、成分番号iと成分番号jの差は(i−j)になり、中央の成分番号と右端の成分番号の差は(nj−1)/2になる。一方、図22(c)に示すように、数36の歪度加重ベクトルgでは、成分番号k0と成分番号1の差は(k0−1)になり、成分番号nと成分番号1の差は(n−1)になる。上述したように図22(b)に示すそれぞれの歪度加重曲線は、図22(c)に示す歪度加重曲線を横軸方向に伸縮して得られる。従って、図22(a)(b)の成分番号iが図22(c)の成分番号k0に対応するとしたとき、(i−j)と(nj−1)/2の比は(k0−1)と(n−1)の比に等しく、2(i−j)/(nj−1)=(k0−1)/(n−1)が成り立つ。歪度加重曲線が原点に関して対称(奇関数)であることを考慮したとき、k0=1+2|i−j|・(n−1)/(nj−1)よりk0の値が算出できる。ただし、k0は4捨5入により整数値に丸める。なお、nの値が十分に大きい(即ち、図22(c)に示す棒グラフの幅が十分に小さい)ときには丸めによる誤差を小さくできる。このようにしてsog(j)及びxog(j)は、数29の代わりに次の数37より算出できる。ただし、数37において、Sign(i−j)は(i−j)の符号を意味する。即ち、(i−j)>0のときSign(i−j)=1、(i−j)=0のときSign(i−j)=0、(i−j)<0のときSign(i−j)=−1であるとする。また、数29の成分番号kは図22(c)または数37のk0に対応している。
Figure 0005956624
数37を用いれば、正規分布の移動位置jごとにgjを作成しなくても1個のgを作成するだけでsog(j)及びxog(j)を算出することができる。このように、数21ではgjの記憶容量がmの2乗(厳密には、nj×m)に比例して増大していたものが、数36ではgの記憶容量はnに固定される。以上のように、歪度加重ベクトルを共通化したことにより記憶容量を減らすことができる。
図23は、歪度形状距離の計算フローチャートを示している。なお、図中に数式番号を記載している。図23より歪度形状距離dAは、値ωをもつ正規分布の歪度の変化率の値を成分とする歪度加重ベクトルgと標準パターン原始ベクトルsoとの積和演算により算出される標準パターン歪度加重ベクトルsog、並びに、同歪度加重ベクトルgと入力パターン原始ベクトルxoとの積和演算により算出される入力パターン歪度加重ベクトルxogのなす角の値として求められることが分かる。なお、図23に示す“ω” の意味については後述の図34の説明において述べる。
また、図24(a)(b)は、数37の積和演算の流れを示している。ただし、図中の曲線は図22(c)に示す歪度加重曲線であり、記号▽(逆三角形)は乗算器、記号Σ(総和記号)は加算器である。図24(a)では▽により、歪度加重ベクトルの成分値Sign(i−j)・gk0と標準パターン原始ベクトルの成分値soiの積Sign(i−j)・gk0・soiを算出している。そしてΣにより、i(i=1,2,…,m)について積Sign(i−j)・gk0・soiを加算して積和値を算出し、これを標準パターン歪度加重ベクトルの成分値sog(j)としている。同様に、図24(b)では、歪度加重ベクトルと入力パターン原始ベクトルの積和演算により入力パターン歪度加重ベクトルを算出している。図24(a)(b)より、sog(j)及びxog(j)は、それぞれsoi及びxoiに歪度加重曲線の重み付けをして算出されることが分かる。
一般に,パターン認識の計算は、標準パターンの登録過程と入力パターンの認識過程に分けて考えることができる。図25(a)(b)は、入力パターンの認識過程において、歪度の直接計算法の計算量と歪度の近似計算法の計算量を比較したものである。なお、図中に数式番号を記載している。図25(a)は入力パターンの認識過程における歪度の直接計算法の処理手順を示しており、図より、N個の標準パターンと1個の入力パターンの間の歪度形状距離dをそれぞれ算出する場合、標準及び入力パターンのN個の組み合わせごとに、数3、数13、数14、数15、数16を順に用いて計算を行う必要があることが分かる。一方、図25(b)は入力パターンの認識過程における歪度の近似計算法の処理手順を示しており、図より、N個の標準パターンと1個の入力パターンの間の歪度形状距離dAをそれぞれ算出する場合、1回のxog(j)の計算とN回のコサイン尺度の計算を行うことによりN個のdAが得られることが分かる。図25(a)(b)より、入力パターンの認識過程において、歪度の直接計算法に比べて歪度の近似計算法は計算量を減少できることが分かる。
[実験例6]
次に、図7(a)(b)に示した標準及び入力パターンについて、実験例1と同じ条件を用いて、図23の処理手順により歪度形状距離dAを算出する数値実験を行った。ただし、図7(a)(b)においてd1〜d6をそれぞれdA1〜dA6に読み替えるものとする。図26(a)(b)に実験結果を示す。これより、図20(b)においてd4=d5であったものが、図26(b)ではdA5<dA4になっていることが分かる。このとき、図7に示す標準及び入力パターンではm=11であった。実験の結果、図26(b)ではmの値の増加とともに、dA4とdA5の大小が入れ替わりながら2つのグラフはdA5の位置に近づくことが分かった。一般のスペクトル分析ではm=256以上の値を用いるため、dA4とdA5の差は小さい。
[本発明と従来技術の対比]
本発明では、図19に示すように、正規分布の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの歪度の変化率の値を成分とする歪度加重ベクトル(数36)を作成する。次に、図23に示すように、数37を用いて、歪度加重ベクトル(数36)の成分値と標準パターン原始ベクトル(数2)の成分値との積和演算により標準パターン歪度加重ベクトル(数30)を作成する。同様に、数37を用いて、同歪度加重ベクトル(数36)の成分値と入力パターン原始ベクトル(数2)の成分値との積和演算により入力パターン歪度加重ベクトル(数30)を作成する。そして、数35を用いて、標準パターン歪度加重ベクトル(数30)と入力パターン歪度加重ベクトル(数30)のなす角の値を算出して歪度形状距離としている。
一方、従来技術の方法では、図27に示すように、正規分布の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの尖度の変化率の値を成分とする尖度加重ベクトルを作成している。次に、尖度加重ベクトルの成分値と標準パターン原始ベクトルの成分値との積和演算により標準パターン尖度加重ベクトルを作成している。同様に、同尖度加重ベクトルの成分値と入力パターン原始ベクトルの成分値との積和演算により入力パターン尖度加重ベクトルを作成している。そして、標準パターン尖度加重ベクトルと入力パターン尖度加重ベクトルのなす角の値を算出して尖度形状距離としている。
上記のように、歪度加重ベクトル、並びに、尖度加重ベクトルはそれぞれ異なる成分値をもっているが、これら2つのベクトルは同じ形式で表現できることが分かる。このため、本実施例では、歪度加重ベクトル、並びに、尖度加重ベクトルを同じ式(数21及び数36)を用いて表すこととする。また、標準及び入力パターン歪度加重ベクトル、並びに、標準及び入力パターン尖度加重ベクトルはそれぞれ歪度加重ベクトルの成分値と標準及び入力パターン原始ベクトルの成分値との積和演算、並びに、尖度加重ベクトルの成分値と標準及び入力パターン原始ベクトルの成分値との積和演算から算出されるが、これら4つの計算式は同じ形式で表現できることが分かる。このため、本実施例では、標準及び入力パターン歪度加重ベクトル、並びに、標準及び入力パターン尖度加重ベクトルの計算式を同じ式(数29)を用いて表すこととする。更に、標準及び入力パターン歪度加重ベクトル、並びに、標準及び入力パターン尖度加重ベクトルはそれぞれ異なる成分値をもっているが、これら4つのベクトルは同じ形式で表現できることが分かる。このため、本実施例では、標準及び入力パターン歪度加重ベクトル、並びに、標準及び入力パターン尖度加重ベクトルを同じ式(数30)を用いて表すこととする。そして、歪度形状距離、並びに、尖度形状距離はそれぞれ標準及び入力パターン歪度加重ベクトルのなす角の値、並びに、標準及び入力パターン尖度加重ベクトルのなす角の値から算出されるが、これら2つの計算式は同じ形式で表現できることが分かる。このため、本実施例では、歪度形状距離、並びに、尖度形状距離の計算式を同じ式(数16及び数35)を用いて表すこととする。
[尖度加重ベクトルの共通化]
ここで、従来技術における尖度加重ベクトルの共通化について説明する。数12では、m個の基準パターン正負ベクトル(正規曲線)を作成した。図28(a)に一例として、これらm個のうちの3個の正規曲線を示す。ただし、正規曲線の中心を成分位置jに重ねて作図している。次に数21では、図27(a)(b)に示すように、数12からm個の尖度加重ベクトル(尖度加重曲線)を作成した。このようにして図28(a)のそれぞれの正規曲線から作成した尖度加重曲線を図28(b)に示す。従来技術では、正規分布の分散の値が変化したときでも標準及び入力パターンの棒グラフの幅は一定である。この場合には図28(b)に示すように、これら尖度加重曲線は横軸方向に伸縮したとき一致する。そこで、m個の尖度加重ベクトルを1つに共通化して記憶容量を減らすことを考える。図28(c)に、分散σ2=1の正規曲線の−2.1σから+2.1σの範囲を用いて作成した尖度加重曲線を示す。また、尖度加重曲線の関数値と同じ高さをもつ棒グラフも示す。ここでは記憶容量を減らすため、尖度加重曲線の右半分を用いて棒グラフを作成する。そして、棒グラフの高さの値gk0(k0=1,2,…,n)を成分とする尖度加重ベクトルgを作成し、数36のように表す。ただし、図28(c)に示す棒グラフの幅を十分に小さくするため、nの値は数21の成分の個数njよりも十分に大きいものとする。更に、n<k0において適当数のgk0=0を挿入して数36を作成する。数36は、数21を代表する尖度加重ベクトルであり、尖度加重曲線の形状を表現するn個の成分値と適当数の成分値0で構成される。
図28(b)の太線の尖度加重曲線に示すように、数21の尖度加重ベクトルgjでは、成分番号iと成分番号jの差は(i−j)になり、中央の成分番号と右端の成分番号の差は(nj−1)/2になる。一方、図28(c)に示すように、数36の尖度加重ベクトルgでは、成分番号k0と成分番号1の差は(k0−1)になり、成分番号nと成分番号1の差は(n−1)になる。上述したように図28(b)に示すそれぞれの尖度加重曲線は、図28(c)に示す尖度加重曲線を横軸方向に伸縮して得られる。従って、図28(a)(b)の成分番号iが図28(c)の成分番号k0に対応するとしたとき、(i−j)と(nj−1)/2の比は(k0−1)と(n−1)の比に等しく、2(i−j)/(nj−1)=(k0−1)/(n−1)が成り立つ。尖度加重曲線が中心に関して左右対称(偶関数)であることを考慮したとき、k0=1+2|i−j|・(n−1)/(nj−1)よりk0の値が算出できる。ただし、k0は4捨5入により整数値に丸める。なお、nの値が十分に大きい(即ち、図28(c)に示す棒グラフの幅が十分に小さい)ときには丸めによる誤差を小さくできる。このようにしてsog(j)及びxog(j)は、数29の代わりに次の数38より算出できる。また、数29の成分番号kは図28(c)または数38のk0に対応している。
Figure 0005956624
数38を用いれば、正規分布の移動位置jごとにgjを作成しなくても1個のgを作成するだけでsog(j)及びxog(j)を算出することができる。このように、数21ではgjの記憶容量がmの2乗(厳密には、nj×m)に比例して増大していたものが、数36ではgの記憶容量はnに固定される。以上のように、尖度加重ベクトルを共通化したことにより記憶容量を減らすことができる。
図29は、尖度形状距離の計算フローチャートを示している。なお、図中に数式番号を記載している。図29より尖度形状距離dAは、値ωをもつ正規分布の尖度の変化率の値を成分とする尖度加重ベクトルgと標準パターン原始ベクトルsoとの積和演算により算出される標準パターン尖度加重ベクトルsog、並びに、同尖度加重ベクトルgと入力パターン原始ベクトルxoとの積和演算により算出される入力パターン尖度加重ベクトルxogのなす角の値として求められることが分かる。なお、図29に示す“ω” の意味については後述の図40の説明において述べる。
また、図30(a)(b)は、数38の積和演算の流れを示している。ただし、図中の曲線は図28(c)に示す尖度加重曲線であり、記号▽(逆三角形)は乗算器、記号Σ(総和記号)は加算器である。図30(a)では▽により、尖度加重ベクトルの成分値gk0と標準パターン原始ベクトルの成分値soiの積gk0・soiを算出している。そしてΣにより、i(i=1,2,…,m)について積gk0・soiを加算して積和値を算出し、これを標準パターン尖度加重ベクトルの成分値sog(j)としている。同様に、図30(b)では、尖度加重ベクトルと入力パターン原始ベクトルの積和演算により入力パターン尖度加重ベクトルを算出している。図30(a)(b)より、sog(j)及びxog(j)は、それぞれsoi及びxoiに尖度加重曲線の重み付けをして算出されることが分かる。
一般に,パターン認識の計算は、標準パターンの登録過程と入力パターンの認識過程に分けて考えることができる。図31(a)(b)は、入力パターンの認識過程において、尖度の直接計算法の計算量と尖度の近似計算法の計算量を比較したものである。なお、図中に数式番号を記載している。図31(a)は入力パターンの認識過程における尖度の直接計算法の処理手順を示しており、図より、N個の標準パターンと1個の入力パターンの間の尖度形状距離dをそれぞれ算出する場合、標準及び入力パターンのN個の組み合わせごとに、数3、数13、数17、数18、数16を順に用いて計算を行う必要があることが分かる。一方、図31(b)は入力パターンの認識過程における尖度の近似計算法の処理手順を示しており、図より、N個の標準パターンと1個の入力パターンの間の尖度形状距離dAをそれぞれ算出する場合、1回のxog(j)の計算とN回のコサイン尺度の計算を行うことによりN個のdAが得られることが分かる。図31(a)(b)より、入力パターンの認識過程において、尖度の直接計算法に比べて尖度の近似計算法は計算量を減少できることが分かる。
[実験例7]
次に、図7(a)(b)に示した標準及び入力パターンについて、実験例1と同じ条件を用いて、図29の処理手順により尖度形状距離dAを算出する数値実験を行った。ただし、図7(a)(b)においてd1〜d6をそれぞれdA1〜dA6に読み替えるものとする。図32(a)(b)に実験結果を示す。これより、図32(b)ではdA5>dA4になっていることが分かる。このとき、図7に示す標準及び入力パターンではm=11であった。実験の結果、図32(b)ではmの値の増加とともに、dA4とdA5の大小が入れ替わりながら2つのグラフはdA4の位置に近づくことが分かった。一般のスペクトル分析ではm=256以上の値を用いるため、dA4とdA5の差は小さい。
本発明による歪度形状距離は、正規分布の歪度の変化率の値を成分とする歪度加重ベクトルを用いる方法である。一方、従来技術による尖度形状距離は、正規分布の尖度の変化率の値を成分とする尖度加重ベクトルを用いる方法である。以上の実験例7の結果より、本発明による歪度形状距離を用いても、従来技術による尖度形状距離と同様に、標準パターン原始ベクトルと入力パターン原始ベクトルとの類似の程度を距離値として検出できることが分かる。
[本発明における正規分布の分散の最適化]
本発明では、図19(a)に示すように正規分布の値を成分とする基準パターンベクトル(数12)を作成し、数20を用いて、図19(b)に示すように上記基準パターンベクトルの歪度の変化率の値を成分とする歪度加重ベクトル(数21)を作成した。次に、本発明による歪度形状距離において、正規分布の分散の値が類似度検出精度に及ぼす影響について説明する。ただし、ここでは図53〜図55の説明と同様に、標準パターンと入力パターンの形状差が小さい場合に限定し、標準パターンと入力パターンの形状差を1個の基準パターンベクトルの形状変化に置き換える方法を用いて説明する。
図33(a)(b)の上段と中段は、それぞれ2つのピークをもつ標準パターン形状と入力パターン形状の典型例を示している。また、図33(a)(b)の下段は、標準パターンと入力パターンの形状差を初期形状が正規分布である基準パターンの形状変化に置き換える様子を示している。ただし、図33(a)(b)に示す標準パターンは共に同じ形状であり、図33(a)(b)に示す入力パターンは共に同じ形状である。また、図33(a)(b)に示す標準及び入力パターンのピークの高さはすべて同じであり、面積はすべて1であるものとする。
●図33(a)の下段は、分散の値が大きい正規分布から作成された基準パターンの例を示しており、このとき、図中に(i)で示す2つの棒グラフの位置は正規分布の中心に関して左右対称であるから、歪度Bjについて棒グラフの減少の効果は相殺される。同様に、図中に(ii)で示す2つの棒グラフの増加の効果も相殺され、結果としてBj=0になる。従って、この場合、歪度Bjの値を用いて標準パターンと入力パターンのピークの「ずれ」を検出することはできない。
●図33(b)の下段は、分散の値が小さい正規分布から作成された2つの基準パターンの例を示しており、このとき、歪度B4及びBjについてB4>0かつBj<0になる。従って、この場合、歪度B4及びBjの値を用いて標準パターンと入力パターンのピークの「ずれ」を検出することができる。
ここで、図33(b)の下段に示すように分散の値が小さい正規分布を用いる場合には、標準及び入力パターン全体を覆うために複数の基準パターンを用いる必要がある。このため、図34に示すように、基準パターンの中心を標準及び入力パターンの各成分位置j(j=1,2,…,m)に移動しながら歪度Bjの変化量を求め、これらm個の歪度Bj(j=1,2,…,m)の変化量の2乗和の平方根を算出して標準パターンと入力パターンとの間の歪度形状距離d(数16)としている。図33(a)(b)の典型例より、正規分布の分散の値が変化するにつれて類似度検出精度も変化することが分かる。
歪度形状距離の算出において、正規分布の分散の値が類似度検出精度に及ぼす影響について述べたが、次に、正規分布の分散の最適値を求める方法について説明する。
一般に、コンクリート構造物の打音点検においては、同じ構造物の同じ箇所であっても打撃ごとにパワースペクトルが微妙に変化するため、通常、正常な構造物の同じ箇所を繰り返し打撃して複数個の正常な標準音を登録し、異常な構造物の同じ箇所を繰り返し打撃して複数個の異常な標準音を登録する方法が採られている。また、音声認識においては、同じ音声であっても発声ごとにパワースペクトルが微妙に変化するため、通常、多数の人間が同じ音声を繰り返し発声して、音声ごとに複数個の標準音を登録する方法が採られている。なお、これまでの説明では、標準音と入力音との間の歪度形状距離値dAの算出方法を示したが、入力音を標準音に置き換え、同様な方法により、2つの標準音間の歪度形状距離値dAを算出することができる。
例えば、複数個の正常な標準音のグループをカテゴリ1としたとき、図35の上段は正常音のパワースペクトルの2つの例を示しており、これらをそれぞれカテゴリ1に属する標準音1、2とする。また、複数個の異常な標準音のグループをカテゴリ2としたとき、図35の下段は異常音のパワースペクトルの2つの例を示しており、これらをそれぞれカテゴリ2に属する標準音3、4とする。ただし、図35では、各標準音間の歪度形状距離をdA(1−2)、dA(3−4)、dA(1−3)、dA(1−4)、dA(2−3)、dA(2−4)として模式的に示している。実線矢印で示すdA(1−2)は同じカテゴリに属する正常な標準音1、2間の歪度形状距離であり、実線矢印で示すdA(3−4)は同じカテゴリに属する異常な標準音3、4間の歪度形状距離である。破線矢印で示すdA(1−3)、dA(1−4)は異なるカテゴリに属する正常な標準音1と異常な標準音3、4間の歪度形状距離であり、破線矢印で示すdA(2−3)、dA(2−4)は異なるカテゴリに属する正常な標準音2と異常な標準音3、4間の歪度形状距離である。
ここで、同じカテゴリに属する標準音間の距離が近くなり、同時に、異なるカテゴリに属する標準音間の距離が遠くなるようにできれば、結果として、同じカテゴリの標準音と異なるカテゴリの標準音の分離が良くなり、入力音が与えられたときの認識性能が向上する。
そこで次に、正規分布の分散の値を変化させながら、同じカテゴリの標準音と異なるカテゴリの標準音の分離の状態を調べることにする。本実施例では、正規分布の分散の値を変化させることを、図34(c)〜(f)に示すωの値を変化させることで実現する。図34(c)〜(f)に示す基準パターンにおいて、白色の棒グラフは入力パターンの成分番号iに対応しているため入力パターンの「ゆらぎ」により値が変化するが、灰色の棒グラフは対応していないため値は変化しない。ここで、基準パターンの「ゆらぎ」に対する感度が正規分布の移動位置にかかわらず等しくなるようにするために、すべての基準パターンにおいて白色の棒グラフの数が同じ値ωになるようにする。図34(c)〜(f)では、一例として、基準パターンをそれぞれ7本の白色の棒グラフ(ω=7)で構成している。なお、図23に示した“ω” は、図34(c)〜(f)に示す“ω”に対応している。
具体的には、図34(c)〜(f)に示すωの値を変化させながら、図35に示す各標準音間の歪度形状距離dA(1−2)、dA(3−4)、dA(1−3)、dA(1−4)、dA(2−3)、dA(2−4)の値の変化を調べるために、次の数39に示すように、異なるカテゴリの標準音間の歪度形状距離平均値d-1から同じカテゴリの標準音間の歪度形状距離平均値d-2を減算した平均値の差の値(d-1−d-2)を求め、異なるカテゴリの標準音間の歪度形状距離の標本分散s1 2をその標本数N1で除算した値(s1 2/N1)、及び、同じカテゴリの標準音間の歪度形状距離の標本分散s2 2をその標本数N2で除算した値(s2 2/N2)の和の値((s1 2/N1)+(s2 2/N2))の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量T(ω)を求めて目的関数の値とする。
Figure 0005956624
図36は、異なるカテゴリの標準音間の距離値の頻度分布と同じカテゴリの標準音間の距離値の頻度分布を、それぞれの平均値d-1、d-2、並びに、それぞれの標本標準偏差s1、s2を用いて作図した模式図である。図36より、数39に示すT(ω)の分子の値が大きくなり、同時に、分母の値が小さくなることにより、T(ω)が最大になったとき、同じカテゴリの標準音間の距離が近くなり、同時に、異なるカテゴリの標準音間の距離が遠くなることが分かる。従って、T(ω)の値を最大にするωの値に基づき作成した歪度加重曲線が最適なものとなる。以上に述べたことを一般化して表現すれば、最適な歪度加重曲線を求める問題は、T(ω)を目的関数としたとき、目的関数を最大にする変数ωの値を求める最適化問題を解くことに帰着する。
図37は、カテゴリ1に属するN1個の標準音(正常音)とカテゴリ2に属するN2個の標準音(異常音)を用いて、ωの最適値を求める処理手順を示している。ただし、N1≧2かつN2≧2とする。また、図3に示す棒グラフの数をm=257として標準音のパワースペクトルを作成する。図37では、ωの値を3から255まで走査して最適値を求める。
●図37のStep1では、カテゴリ1に属するN1個の標準音(正常音)とカテゴリ2に属するN2個の標準音(異常音)を録音して(N1+N2)個のパワースペクトルを作成する。
●Step2では、初期値としてω=3を設定する。
●Step3では、(N1+N2)個の標準音のすべての組み合わせについて、図23の処理手順により歪度形状距離dAを算出し、数39と同様にして、異なるカテゴリの標準音間の歪度形状距離、及び、同じカテゴリの標準音間の歪度形状距離について、それぞれの平均値、及び、標本分散を求める。
●Step4では、数39と同様にして、ウェルチの検定統計量T(ω)を算出する。
●Step5と6では、ωの値を255まで2ずつ増加しながら、Step3から4の処理を繰り返す。
●Step7では、T(ω)の値を最大にするωを求めて最適値ωsとする。
[実験例8]
次に、図37に示す処理手順により、正常なコンクリート構造物の同じ箇所を繰り返し打撃して10個の正常な標準音(これらはカテゴリ1に属する。)を録音し、異常なコンクリート構造物の同じ箇所を繰り返し打撃して10個の異常な標準音(これらはカテゴリ2に属する。)を録音し、これら20個の標準音を用いてωの最適値を求める実験を行った結果を説明する。ただし、図3に示す棒グラフの数をm=257として標準音のパワースペクトルを作成した。この実験の場合、図35と同様に考えれば、異なるカテゴリの標準音間の歪度形状距離dAとして10×10=100個の値が算出され、同じカテゴリの標準音間の歪度形状距離dAとして2×102=2×10×9/2=90個の値が算出される。そして、数39と同様にして、異なるカテゴリの標準音間の歪度形状距離、及び、同じカテゴリの標準音間の歪度形状距離について、それぞれの平均値及び標本分散を求め、ウェルチの検定統計量T(ω)を算出した。図38は、図34(c)〜(f)に示すωの値を3から255まで2ずつ増加しながら目的関数T(ω)の値を算出した結果を示している。図38より、ω=41のときT(ω)の値が最大になることが分かる。そこで、最適値をωs=41とし、この値を用いて最適な歪度加重曲線を作成する。
なお、ウェルチの検定統計量T(ω)に代えて、認識率R(ω)を目的関数として用いてもよい。この場合、例えば、カテゴリ1に属するN1個の標準音(正常音)とカテゴリ2に属するN2個の標準音(異常音)を予め録音しておき、これらとは別の1個の入力音(正常音)と上記(N1+N2)個の標準音との間の歪度形状距離dAをそれぞれ算出する。そして、得られた(N1+N2)個の歪度形状距離dAの中で、最小値に対応する標準音がカテゴリ1に属しているとき入力音はカテゴリ1に属する(正常音である)と判定し、最小値に対応する標準音がカテゴリ2に属しているとき入力音はカテゴリ2に属する(異常音である)と判定する。同様に、上記とは別の1個の入力音(異常音)と上記(N1+N2)個の標準音との間の歪度形状距離dAをそれぞれ算出する。そして、得られた(N1+N2)個の歪度形状距離dAの中で、最小値に対応する標準音がカテゴリ1に属しているとき入力音はカテゴリ1に属する(正常音である)と判定し、最小値に対応する標準音がカテゴリ2に属しているとき入力音はカテゴリ2に属する(異常音である)と判定する。同様にして、多数の入力音(正常音及び異常音)を用いて上記の認識実験を行い、入力音(正常音及び異常音)が正しく判定された割合から認識率R(ω)を求める。その際、ωの値を3から255まで2ずつ増加しながら目的関数R(ω)の値を算出してR(ω)の値を最大にするωを求めて最適値ωsとする。
本発明では、以上のようにして得られた最適値ωsをもつ正規分布を作成し、上記正規分布の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの「歪度」の変化率の値を成分とする歪度加重ベクトルを作成する。次に、歪度加重ベクトルの成分値と標準パターン原始ベクトルの成分値との積和演算により標準パターン歪度加重ベクトルを作成する。同様に、同歪度加重ベクトルの成分値と入力パターン原始ベクトルの成分値との積和演算により入力パターン歪度加重ベクトルを作成する。そして、標準パターン歪度加重ベクトルと入力パターン歪度加重ベクトルのなす角の値を算出し、標準パターン原始ベクトルと入力パターン原始ベクトルとの類似の程度を歪度形状距離値として検出する。
[従来技術における正規分布の分散の最適化]
従来技術(特許第3422787号公報)では、図27(a)に示すように正規分布の値を成分とする基準パターンベクトルを作成し、図27(b)に示すように上記基準パターンベクトルの尖度の変化率の値を成分とする尖度加重ベクトルを作成した。次に、尖度加重ベクトルの成分値と標準パターン原始ベクトルの成分値との積和演算により標準パターン尖度加重ベクトルを作成した。同様に、同尖度加重ベクトルの成分値と入力パターン原始ベクトルの成分値との積和演算により入力パターン尖度加重ベクトルを作成した。そして、標準パターン尖度加重ベクトルと入力パターン尖度加重ベクトルのなす角の値を算出し、標準パターン原始ベクトルと入力パターン原始ベクトルとの類似の程度を尖度形状距離値として検出できることを示している。
次に、従来技術(特許第3422787号公報)による尖度形状距離において、正規分布の分散の値が類似度検出精度に及ぼす影響について確認する。ただし、ここでは図53〜図55の説明と同様に、標準パターンと入力パターンの形状差が小さい場合に限定し、標準パターンと入力パターンの形状差を1個の基準パターンベクトルの形状変化に置き換える方法を用いて説明する。
図39(a)(b)の上段と中段は、それぞれ2つのピークをもつ標準パターン形状と入力パターン形状の典型例を示している。また、図39(a)(b)の下段は、標準パターンと入力パターンの形状差を初期形状が正規分布である基準パターンの形状変化に置き換える様子を示している。ただし、図39(a)(b)に示す標準パターンは共に同じ形状であり、図39(a)(b)に示す入力パターンは共に同じ形状である。また、図39(a)(b)に示す標準及び入力パターンのピークの高さはすべて同じであり、面積はすべて1であるものとする。なお、図39における標準パターンと入力パターンの第2ピークの位置は、図33におけるそれらの位置と異なっており、従って、図33及び図39において、基準パターンの棒グラフの増加の位置と減少の位置も異なっている。
●図39(a)の下段は、分散の値が大きい正規分布から作成された基準パターンの例を示しており、このとき、図中に(i)で示す2つの棒グラフの位置は正規分布の中心に関して左右対称であるから、尖度Ajについて棒グラフの増加の効果と減少の効果は相殺される。同様に、図中に(ii)で示す2つの棒グラフの増加の効果と減少の効果も相殺され、結果としてAj=3になる。従って、この場合、尖度Ajの値を用いて標準パターンと入力パターンのピークの「ずれ」を検出することはできない。
●図39(b)の下段は、分散の値が小さい正規分布から作成された2つの基準パターンの例を示しており、このとき、尖度A4及びAjについてA4<3かつAj<3になる。従って、この場合、尖度A4及びAjの値を用いて標準パターンと入力パターンのピークの「ずれ」を検出することができる。
ここで、図39(b)の下段に示すように分散の値が小さい正規分布を用いる場合には、標準及び入力パターン全体を覆うために複数の基準パターンを用いる必要がある。このため、図40に示すように、基準パターンの中心を標準及び入力パターンの各成分位置j(j=1,2,…,m)に移動しながら尖度Ajの変化量を求め、これらm個の尖度Aj(j=1,2,…,m)の変化量の2乗和の平方根を算出して標準パターンと入力パターンとの間の尖度形状距離dとしている。図39(a)(b)の典型例より、正規分布の分散の値が変化するにつれて類似度検出精度も変化することが分かる。
尖度形状距離の算出において、正規分布の分散の値が類似度検出精度に及ぼす影響について述べたが、次に、正規分布の分散の最適値を求める方法について説明する。
一般に、コンクリート構造物の打音点検においては、同じ構造物の同じ箇所であっても打撃ごとにパワースペクトルが微妙に変化するため、通常、正常な構造物の同じ箇所を繰り返し打撃して複数個の正常な標準音を登録し、異常な構造物の同じ箇所を繰り返し打撃して複数個の異常な標準音を登録する方法が採られている。また、音声認識においては、同じ音声であっても発声ごとにパワースペクトルが微妙に変化するため、通常、多数の人間が同じ音声を繰り返し発声して、音声ごとに複数個の標準音を登録する方法が採られている。なお、従来技術(特許第3422787号公報)では、標準音と入力音との間の尖度形状距離値dAの算出方法を示しているが、入力音を標準音に置き換え、同様な方法により、2つの標準音間の尖度形状距離値dAを算出することができる。
例えば、複数個の正常な標準音のグループをカテゴリ1としたとき、図35の上段は正常音のパワースペクトルの2つの例を示しており、これらをそれぞれカテゴリ1に属する標準音1、2とする。また、複数個の異常な標準音のグループをカテゴリ2としたとき、図35の下段は異常音のパワースペクトルの2つの例を示しており、これらをそれぞれカテゴリ2に属する標準音3、4とする。ただし、図35では、各標準音間の尖度形状距離をdA(1−2)、dA(3−4)、dA(1−3)、dA(1−4)、dA(2−3)、dA(2−4)として模式的に示している。実線矢印で示すdA(1−2)は同じカテゴリに属する正常な標準音1、2間の尖度形状距離であり、実線矢印で示すdA(3−4)は同じカテゴリに属する異常な標準音3、4間の尖度形状距離である。破線矢印で示すdA(1−3)、dA(1−4)は異なるカテゴリに属する正常な標準音1と異常な標準音3、4間の尖度形状距離であり、破線矢印で示すdA(2−3)、dA(2−4)は異なるカテゴリに属する正常な標準音2と異常な標準音3、4間の尖度形状距離である。
ここで、同じカテゴリに属する標準音間の距離が近くなり、同時に、異なるカテゴリに属する標準音間の距離が遠くなるようにできれば、結果として、同じカテゴリの標準音と異なるカテゴリの標準音の分離が良くなり、入力音が与えられたときの認識性能が向上する。
そこで次に、正規分布の分散の値を変化させながら、同じカテゴリの標準音と異なるカテゴリの標準音の分離の状態を調べることにする。ここでは、正規分布の分散の値を変化させることを、図40(c)〜(f)に示すωの値を変化させることで実現する。図40(c)〜(f)に示す基準パターンにおいて、白色の棒グラフは入力パターンの成分番号iに対応しているため入力パターンの「ゆらぎ」により値が変化するが、灰色の棒グラフは対応していないため値は変化しない。ここで、基準パターンの「ゆらぎ」に対する感度が正規分布の移動位置にかかわらず等しくなるようにするために、すべての基準パターンにおいて白色の棒グラフの数が同じ値ωになるようにする。図40(c)〜(f)では、一例として、基準パターンをそれぞれ7本の白色の棒グラフ(ω=7)で構成している。なお、図29に示した“ω” は、図40(c)〜(f)に示す“ω”に対応している。
具体的には、図40(c)〜(f)に示すωの値を変化させながら、図35に示す各標準音間の尖度形状距離dA(1−2)、dA(3−4)、dA(1−3)、dA(1−4)、dA(2−3)、dA(2−4)の値の変化を調べるために、数39に示すように、異なるカテゴリの標準音間の尖度形状距離平均値d-1から同じカテゴリの標準音間の尖度形状距離平均値d-2を減算した平均値の差の値(d-1−d-2)を求め、異なるカテゴリの標準音間の尖度形状距離の標本分散s1 2をその標本数N1で除算した値(s1 2/N1)、及び、同じカテゴリの標準音間の尖度形状距離の標本分散s2 2をその標本数N2で除算した値(s2 2/N2)の和の値((s1 2/N1)+(s2 2/N2))の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量T(ω)を求めて目的関数の値とする。
図36は、異なるカテゴリの標準音間の距離値の頻度分布と同じカテゴリの標準音間の距離値の頻度分布を、それぞれの平均値d-1、d-2、並びに、それぞれの標本標準偏差s1、s2を用いて作図した模式図である。図36より、数39に示すT(ω)の分子の値が大きくなり、同時に、分母の値が小さくなることにより、T(ω)が最大になったとき、同じカテゴリの標準音間の距離が近くなり、同時に、異なるカテゴリの標準音間の距離が遠くなることが分かる。従って、T(ω)の値を最大にするωの値に基づき作成した尖度加重曲線が最適なものとなる。以上に述べたことを一般化して表現すれば、最適な尖度加重曲線を求める問題は、T(ω)を目的関数としたとき、目的関数を最大にする変数ωの値を求める最適化問題を解くことに帰着する。
図41は、カテゴリ1に属するN1個の標準音(正常音)とカテゴリ2に属するN2個の標準音(異常音)を用いて、ωの最適値を求める処理手順を示している。ただし、N1≧2かつN2≧2とする。また、図3に示す棒グラフの数をm=257として標準音のパワースペクトルを作成する。図41では、ωの値を3から255まで走査して最適値を求める。
●図41のStep1では、カテゴリ1に属するN1個の標準音(正常音)とカテゴリ2に属するN2個の標準音(異常音)を録音して(N1+N2)個のパワースペクトルを作成する。
●Step2では、初期値としてω=3を設定する。
●Step3では、(N1+N2)個の標準音のすべての組み合わせについて、図29の処理手順により尖度形状距離dAを算出し、数39と同様にして、異なるカテゴリの標準音間の尖度形状距離、及び、同じカテゴリの標準音間の尖度形状距離について、それぞれの平均値、及び、標本分散を求める。
●Step4では、数39と同様にして、ウェルチの検定統計量T(ω)を算出する。
●Step5と6では、ωの値を255まで2ずつ増加しながら、Step3から4の処理を繰り返す。
●Step7では、T(ω)の値を最大にするωを求めて最適値ωkとする。
なお、尖度加重曲線は偶関数であり、歪度加重曲線は奇関数であるから、従来技術(特許第3422787号公報)の尖度加重ベクトルにおいては、数37に代えて、数38を用いて標準パターン尖度加重ベクトルと入力パターン尖度加重ベクトルを作成する。
[実験例9]
次に、図41に示す処理手順により、正常なコンクリート構造物の同じ箇所を繰り返し打撃して10個の正常な標準音(これらはカテゴリ1に属する。)を録音し、異常なコンクリート構造物の同じ箇所を繰り返し打撃して10個の異常な標準音(これらはカテゴリ2に属する。)を録音し、これら20個の標準音を用いてωの最適値を求める実験を行った結果を説明する。ただし、図3に示す棒グラフの数をm=257として標準音のパワースペクトルを作成した。なお、これら20個の標準音は、実験例8で用いた20個の標準音と同じものである。この実験の場合、図35と同様に考えれば、異なるカテゴリの標準音間の尖度形状距離dAとして10×10=100個の値が算出され、同じカテゴリの標準音間の尖度形状距離dAとして2×102=2×10×9/2=90個の値が算出される。そして、数39と同様にして、異なるカテゴリの標準音間の尖度形状距離、及び、同じカテゴリの標準音間の尖度形状距離について、それぞれの平均値及び標本分散を求め、ウェルチの検定統計量T(ω)を算出した。図42は、図40(c)〜(f)に示すωの値を3から255まで2ずつ増加しながら目的関数T(ω)の値を算出した結果を示している。図42より、ω=91のときT(ω)の値が最大になることが分かる。そこで、最適値をωk=91とし、この値を用いて最適な尖度加重曲線を作成する。
なお、ウェルチの検定統計量T(ω)に代えて、認識率R(ω)を目的関数として用いてもよい。この場合、例えば、カテゴリ1に属するN1個の標準音(正常音)とカテゴリ2に属するN2個の標準音(異常音)を予め録音しておき、これらとは別の1個の入力音(正常音)と上記(N1+N2)個の標準音との間の尖度形状距離dAをそれぞれ算出する。そして、得られた(N1+N2)個の尖度形状距離dAの中で、最小値に対応する標準音がカテゴリ1に属しているとき入力音はカテゴリ1に属する(正常音である)と判定し、最小値に対応する標準音がカテゴリ2に属しているとき入力音はカテゴリ2に属する(異常音である)と判定する。同様に、上記とは別の1個の入力音(異常音)と上記(N1+N2)個の標準音との間の尖度形状距離dAをそれぞれ算出する。そして、得られた(N1+N2)個の尖度形状距離dAの中で、最小値に対応する標準音がカテゴリ1に属しているとき入力音はカテゴリ1に属する(正常音である)と判定し、最小値に対応する標準音がカテゴリ2に属しているとき入力音はカテゴリ2に属する(異常音である)と判定する。同様にして、多数の入力音(正常音及び異常音)を用いて上記の認識実験を行い、入力音(正常音及び異常音)が正しく判定された割合から認識率R(ω)を求める。その際、ωの値を3から255まで2ずつ増加しながら目的関数R(ω)の値を算出してR(ω)の値を最大にするωを求めて最適値ωkとする。
従来技術(特許第3422787号公報)では、以上のようにして得られた最適値ωkをもつ正規分布を作成し、上記正規分布の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの「尖度」の変化率の値を成分とする尖度加重ベクトルを作成する。次に、尖度加重ベクトルの成分値と標準パターン原始ベクトルの成分値との積和演算により標準パターン尖度加重ベクトルを作成する。同様に、同尖度加重ベクトルの成分値と入力パターン原始ベクトルの成分値との積和演算により入力パターン尖度加重ベクトルを作成する。そして、標準パターン尖度加重ベクトルと入力パターン尖度加重ベクトルのなす角の値を算出し、標準パターン原始ベクトルと入力パターン原始ベクトルとの類似の程度を尖度形状距離値として検出している。
[最適な標準及び入力パターン歪度加重ベクトルと最適な標準及び入力パターン尖度加重ベクトルの結合]
従って、本発明の方法により、最適値ωsをもつ歪度加重ベクトル(数36)の成分値と標準及び入力パターン原始ベクトル(数2)の成分値との積和演算により最適な標準及び入力パターン歪度加重ベクトル(数30)を作成し、同様に、従来技術(特許第3422787号公報)の方法により、最適値ωkをもつ尖度加重ベクトル(数36)の成分値と標準及び入力パターン原始ベクトル(数2)の成分値との積和演算により最適な標準及び入力パターン尖度加重ベクトル(数30)を作成することができる。
次に、次の数40の第1式と第2式に示すように、最適値ωsを用いて作成した標準パターン歪度加重ベクトルsogの成分値sog(j)(j=1,2,…,m)、及び、同ωsを用いて作成した入力パターン歪度加重ベクトルxogの成分値xog(j)(j=1,2,…,m)を、それぞれのベクトルの大きさで除算して正規化成分値sogd(j)、及び、xogd(j)を算出する。同様に、数40の第3式と第4式に示すように、最適値ωkを用いて作成した標準パターン尖度加重ベクトルsogの成分値sog(j)(j=1,2,…,m)、及び、同ωkを用いて作成した入力パターン尖度加重ベクトルxogの成分値xog(j)(j=1,2,…,m)を、それぞれのベクトルの大きさで除算して正規化成分値sogd(m+j)、及び、xogd(m+j)を算出する。
Figure 0005956624
そして、sogd(j)及びsogd(m+j)を成分とする標準パターン複合加重ベクトルsogdと、xogd(j)及びxogd(m+j)を成分とする入力パターン複合加重ベクトルxogdを作成し、次の数41のように表す。
Figure 0005956624
数41において、標準パターン複合加重ベクトルsogdの1番目からm番目の成分値は、最適値ωsを用いて作成した標準パターン歪度加重ベクトルの1番目からm番目の正規化成分値にそれぞれ等しく、同ベクトルsogdの(m+1)番目から(m+m)番目の成分値は、最適値ωkを用いて作成した標準パターン尖度加重ベクトルの1番目からm番目の正規化成分値にそれぞれ等しい。同様に、入力パターン複合加重ベクトルxogdの1番目からm番目の成分値は、最適値ωsを用いて作成した入力パターン度加重ベクトルの1番目からm番目の正規化成分値にそれぞれ等しく、同ベクトルxogdの(m+1)番目から(m+m)番目の成分値は、最適値ωkを用いて作成した入力パターン尖度加重ベクトルの1番目からm番目の正規化成分値にそれぞれ等しい。
即ち、標準パターン複合加重ベクトルは、正規化して得られた標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルを結合して作成した複合的なベクトルである。同様に、入力パターン複合加重ベクトルは、正規化して得られた入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルを結合して作成した複合的なベクトルである。従って、標準及び入力パターン複合加重ベクトルは、それぞれ(m+m)個の成分値をもつ。
図43は、標準パターン複合加重ベクトルを作成するための計算フローチャートを示している。なお、図中に数式番号を記載している。図43より標準パターン複合加重ベクトルsogdは、最適値ωsをもつ正規分布の歪度の変化率の値を成分とする歪度加重ベクトルgと標準パターン原始ベクトルsoとの積和演算により算出された標準パターン歪度加重ベクトルsog、並びに、最適値ωkをもつ正規分布の尖度の変化率の値を成分とする尖度加重ベクトルgと標準パターン原始ベクトルsoとの積和演算により算出された標準パターン尖度加重ベクトルsogを、それぞれのベクトルの大きさで除算して正規化した後に結合して作成されることが分かる。
また、図44は、数37及び数38の積和演算の流れを示している。ただし、図中の左側の曲線は図22(c)に示す歪度加重曲線であり、図中の右側の曲線は図28(c)に示す尖度加重曲線であり、記号▽(逆三角形)は乗算器、記号Σ(総和記号)は加算器である。図44の左側では▽により、歪度加重ベクトルの成分値Sign(i−j)・gk0と標準パターン原始ベクトルの成分値soiの積Sign(i−j)・gk0・soiを算出している。そしてΣにより、i(i=1,2,…,m)について積Sign(i−j)・gk0・soiを加算して積和値を算出し、これを標準パターン歪度加重ベクトルの成分値sog(j)としている。同様に、図44の右側では、尖度加重ベクトルと標準パターン原始ベクトルの積和演算により標準パターン尖度加重ベクトルを算出している。図44より、標準パターン歪度加重ベクトルの成分値sog(j)及び標準パターン尖度加重ベクトルの成分値sog(j)は、それぞれsoiに歪度加重曲線及び尖度加重曲線の重み付けをして算出されることが分かる。
図45は、入力パターン複合加重ベクトルを作成するための計算フローチャートを示している。なお、図中に数式番号を記載している。図45より入力パターン複合加重ベクトルxogdは、最適値ωsをもつ正規分布の歪度の変化率の値を成分とする歪度加重ベクトルgと入力パターン原始ベクトルxoとの積和演算により算出された入力パターン歪度加重ベクトルxog、並びに、最適値ωkをもつ正規分布の尖度の変化率の値を成分とする尖度加重ベクトルgと入力パターン原始ベクトルxoとの積和演算により算出された入力パターン尖度加重ベクトルxogを、それぞれのベクトルの大きさで除算して正規化した後に結合して作成されることが分かる。
また、図46は、数37及び数38の積和演算の流れを示している。ただし、図中の左側の曲線は図22(c)に示す歪度加重曲線であり、図中の右側の曲線は図28(c)に示す尖度加重曲線であり、記号▽(逆三角形)は乗算器、記号Σ(総和記号)は加算器である。図46の左側では▽により、歪度加重ベクトルの成分値Sign(i−j)・gk0と入力パターン原始ベクトルの成分値xoiの積Sign(i−j)・gk0・xoiを算出している。そしてΣにより、i(i=1,2,…,m)について積Sign(i−j)・gk0・xoiを加算して積和値を算出し、これを入力パターン歪度加重ベクトルの成分値xog(j)としている。同様に、図46の右側では、尖度加重ベクトルと入力パターン原始ベクトルの積和演算により入力パターン尖度加重ベクトルを算出している。図46より、入力パターン歪度加重ベクトルの成分値xog(j)及び入力パターン尖度加重ベクトルの成分値xog(j)は、それぞれxoiに歪度加重曲線及び尖度加重曲線の重み付けをして算出されることが分かる。
[類似度検出精度を向上させる標準及び入力パターンの成分位置の選択]
図53〜図55、及び、表1を用いて前述したように、従来技術では、基準パターンの中心の移動に際し、標準及び入力パターンに対する基準パターンの相対的位置関係について、類似度検出精度を向上させる標準及び入力パターンの成分位置と、低下させる成分位置とを区別していない。次に、この問題を解決する方法について説明する。そのため、最初に、0または1の値を成分とする選択ベクトル(2値ベクトル)bを作成し、次の数42のように表す。ただし、選択ベクトルbの成分の個数は数41に示す標準及び入力パターン複合加重ベクトルの成分の個数(m+m)に等しいものとする。
Figure 0005956624
更に、次の数43に示すように、上記選択ベクトルbの成分番号j(j=1,2,…,m+m)の成分値b(j)と上記標準パターン複合加重ベクトルsogdの同じ成分番号jの成分値sogd(j)との積の値を算出してsogb(j)とする。同様に、上記選択ベクトルbの成分番号j(j=1,2,…,m+m)の成分値b(j)と上記入力パターン複合加重ベクトルxogdの同じ成分番号jの成分値xogd(j)との積の値を算出してxogb(j)とする。
Figure 0005956624
そして、sogb(j)(j=1,2,…,m+m)を成分とする標準パターン複合選択ベクトルsogbと、xogb(j)(j=1,2,…,m+m)を成分とする入力パターン複合選択ベクトルxogbを作成し、次の数44のように表す。
Figure 0005956624
最後に、上記標準パターン複合選択ベクトルsogbと上記入力パターン複合選択ベクトルxogbのなす角の値を、次の数45より算出して、標準パターン原始ベクトルsoと入力パターン原始ベクトルxoとの間の形状距離値dAとする。
Figure 0005956624
図47は、形状距離の計算フローチャートを示している。なお、図中に数式番号を記載している。図47より形状距離dAは、0または1の値を成分とする選択ベクトル(2値ベクトル)bと標準パターン複合加重ベクトルsogdの同じ成分番号ごとの積により算出された標準パターン複合選択ベクトルsogb、並びに、同選択ベクトル(2値ベクトル)bと入力パターン複合加重ベクトルxogdの同じ成分番号ごとの積により算出された入力パターン複合選択ベクトルxogbのなす角の値として求められることが分かる。以上、要するに、図43、図45、図47の処理手順により標準パターン原始ベクトルsoと入力パターン原始ベクトルxoとの間の形状距離値dAが算出できる。
図54(b)〜(d)、及び、表1において、標準パターンと入力パターンのピークの「ずれ」の増加とともに、尖度の値が単調に変化しない事象を説明し、図55(b)〜(d)、及び、表1において、標準パターンと入力パターンのピークの「ずれ」の増加とともに、歪度の値が単調に変化しない事象を説明した。ここで、基準パターンの中心の移動に際し、標準及び入力パターンに対する基準パターンの相対的位置関係について、類似度検出精度を向上させる標準及び入力パターンの成分位置と、低下させる成分位置とを区別するために、標準及び入力パターン複合加重ベクトルにおいて、類似度検出精度を向上させる成分値を選択し、低下させる成分値を除外することを考える。そのため、選択する場合には数42に示す選択ベクトルの成分値を1に設定し、除外する場合には0に設定することにする。次に、選択ベクトルの成分値を1または0に決定する方法について説明する。
一般に、コンクリート構造物の打音点検においては、同じ構造物の同じ箇所であっても打撃ごとにパワースペクトルが微妙に変化するため、通常、正常な構造物の同じ箇所を繰り返し打撃して複数個の正常な標準音を登録し、異常な構造物の同じ箇所を繰り返し打撃して複数個の異常な標準音を登録する方法が採られている。また、音声認識においては、同じ音声であっても発声ごとにパワースペクトルが微妙に変化するため、通常、多数の人間が同じ音声を繰り返し発声して、音声ごとに複数個の標準音を登録する方法が採られている。なお、これまでの説明では、標準音と入力音との間の形状距離値dAの算出方法を示したが、入力音を標準音に置き換え、同様な方法により、2つの標準音間の形状距離値dAを算出することができる。
例えば、複数個の正常な標準音のグループをカテゴリ1としたとき、図35の上段は正常音のパワースペクトルの2つの例を示しており、これらをそれぞれカテゴリ1に属する標準音1、2とする。また、複数個の異常な標準音のグループをカテゴリ2としたとき、図35の下段は異常音のパワースペクトルの2つの例を示しており、これらをそれぞれカテゴリ2に属する標準音3、4とする。ただし、図35では、各標準音間の形状距離をdA(1−2)、dA(3−4)、dA(1−3)、dA(1−4)、dA(2−3)、dA(2−4)として模式的に示している。実線矢印で示すdA(1−2)は同じカテゴリに属する正常な標準音1、2間の形状距離であり、実線矢印で示すdA(3−4)は同じカテゴリに属する異常な標準音3、4間の形状距離である。破線矢印で示すdA(1−3)、dA(1−4)は異なるカテゴリに属する正常な標準音1と異常な標準音3、4間の形状距離であり、破線矢印で示すdA(2−3)、dA(2−4)は異なるカテゴリに属する正常な標準音2と異常な標準音3、4間の形状距離である。
ここで、同じカテゴリに属する標準音間の距離が近くなり、同時に、異なるカテゴリに属する標準音間の距離が遠くなるようにできれば、結果として、同じカテゴリの標準音と異なるカテゴリの標準音の分離が良くなり、入力音が与えられたときの認識性能が向上する。
そこで次に、選択ベクトルの成分値を1または0に変化させながら、同じカテゴリの標準音と異なるカテゴリの標準音の分離の状態を調べることにする。
具体的には、数42に示す選択ベクトルbの成分値b(j)(j=1,2,…,m+m)を0または1に変化させながら、図35に示す各標準音間の形状距離dA(1−2)、dA(3−4)、dA(1−3)、dA(1−4)、dA(2−3)、dA(2−4)の値の変化を調べるために、次の数46に示すように、異なるカテゴリの標準音間の形状距離平均値d-1から同じカテゴリの標準音間の形状距離平均値d-2を減算した平均値の差の値(d-1−d-2)を求め、異なるカテゴリの標準音間の形状距離の標本分散s1 2をその標本数N1で除算した値(s1 2/N1)、及び、同じカテゴリの標準音間の形状距離の標本分散s2 2をその標本数N2で除算した値(s2 2/N2)の和の値((s1 2/N1)+(s2 2/N2))の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量T(b(1),b(2),…,b(m+m))を求めて目的関数の値とする。
Figure 0005956624
図36は、異なるカテゴリの標準音間の距離値の頻度分布と同じカテゴリの標準音間の距離値の頻度分布を、それぞれの平均値d-1、d-2、並びに、それぞれの標本標準偏差s1、s2を用いて作図した模式図である。図36より、数46に示すT(b(1),b(2),…,b(m+m))の分子の値が大きくなり、同時に、分母の値が小さくなることにより、T(b(1),b(2),…,b(m+m))が最大になったとき、同じカテゴリの標準音間の距離が近くなり、同時に、異なるカテゴリの標準音間の距離が遠くなることが分かる。従って、T(b(1),b(2),…,b(m+m))の値を最大にするb(1),b(2),…,b(m+m)の値に基づき作成した選択ベクトルが最適なものとなる。以上に述べたことを一般化して表現すれば、最適な選択ベクトルを求める問題は、T(b(1),b(2),…,b(m+m))を目的関数としたとき、目的関数を最大にする選択ベクトルbの成分値b(j)(j=1,2,…,m+m)の値を求める最適化問題を解くことに帰着する。
ところで、本実施例の実験例においては、図3に示す棒グラフの数をm=257として標準音のパワースペクトルを作成している。この場合、数42に示す選択ベクトルbの成分値b(j)(j=1,2,…,m+m)を0または1に変化させながら目的関数T(b(1),b(2),…,b(m+m))の値を算出するためには、目的関数T(b(1),b(2),…,b(m+m))を「2の514乗」とおり計算することが必要になり、計算時間を考えたとき実施が困難になる。その一方で、最適化問題については、数値計算法の分野において、最急降下法やニュートン法などの数値解法が提案されている。これらの数値解法は、目的関数が急速に減少、或いは、増加する方向に変数の値を変化させるものであり、少ない計算回数で変数の最適値を算出しようとするものである。本実施例においても、これらの数値解法を用いることにより、成分値b(j)(j=1,2,…,m+m)の最適値を能率良く算出することが可能になる。図48に、少ない計算回数で最適値を算出する方法の一例を示す。
図48は、カテゴリ1に属するN1個の標準音(正常音)とカテゴリ2に属するN2個の標準音(異常音)を用いて、b(j)(j=1,2,…,m+m)の最適値を求める処理手順を示している。ただし、N1≧2かつN2≧2とする。また、図3に示す棒グラフの数をm=257として標準音のパワースペクトルを作成する。図48では、jの値を1からm+mまで走査して最適値を求める。
●図48のStep1では、カテゴリ1に属するN1個の標準音(正常音)とカテゴリ2に属するN2個の標準音(異常音)を録音して(N1+N2)個のパワースペクトルを作成する。
●Step2−1では、図37の処理手順により最適値ωsを求める。
●Step2−2では、図41の処理手順により最適値ωkを求める。これらの最適値ωs及び最適値ωkを用いてStep3からStep9の処理を行う。
●Step3では、選択ベクトルのすべての成分値を1に設定する。即ち、b(j)=1(j=1,2,…,m+m)に設定する。そして、(N1+N2)個の標準音のすべての組み合わせについて、図43〜図47の処理手順により形状距離dAを算出し、数39と同様にして、異なるカテゴリの標準音間の形状距離、及び、同じカテゴリの標準音間の形状距離について、それぞれの平均値、及び、標本分散を算出し、ウェルチの検定統計量(数46)を求めてT1とする。即ち、T1=T(1,1,1,…,1,1,1,1,…,1,1,1)とする。
●Step4では、初期値としてj=1を設定する。
●Step5では、選択ベクトルの第j成分を0に設定し、第j成分以外を1に設定する。即ち、b(j)=0、b(k)=1(k≠j)とする。そして、(N1+N2)個の標準音のすべての組み合わせについて、図43〜図47の処理手順により形状距離dAを算出し、数39と同様にして、異なるカテゴリの標準音間の形状距離、及び、同じカテゴリの標準音間の形状距離について、それぞれの平均値、及び、標本分散を算出し、ウェルチの検定統計量(数46)を求めてT0(j)とする。即ち、T0(j)=T(1,1,1,…,1,0,1,1,…,1,1,1)とする。
●Step6では、T1>T0(j)のときbopt(j)=1とし、T1≦T0(j)のときbopt(j)=0とする。
●Step7と8では、jの値をm+mまで1ずつ増加しながら、Step5から6の処理を繰り返す。
●Step9では、bopt(j)(j=1,2,…,m+m)を成分とする選択ベクトルを最適な選択ベクトルとする。
[実験例10]
次に、図48に示す処理手順により、正常なコンクリート構造物の同じ箇所を繰り返し打撃して10個の正常な標準音(これらはカテゴリ1に属する。)を録音し、異常なコンクリート構造物の同じ箇所を繰り返し打撃して10個の異常な標準音(これらはカテゴリ2に属する。)を録音し、これら20個の標準音を用いてb(j)(j=1,2,…,m+m)の最適値を求める実験を行った結果を説明する。ただし、図3に示す棒グラフの数をm=257として標準音のパワースペクトルを作成した。なお、これら20個の標準音は、実験例8で用いた20個の標準音と同じものである。また、図38から得られた最適値ωs=41、及び、図42から得られた最適値ωk=91を用いて形状距離dAを算出した。この実験の場合、図35と同様に考えれば、異なるカテゴリの標準音間の形状距離dAとして10×10=100個の値が算出され、同じカテゴリの標準音間の形状距離dAとして2×102=2×10×9/2=90個の値が算出される。そして、数39と同様にして、異なるカテゴリの標準音間の形状距離、及び、同じカテゴリの標準音間の形状距離について、それぞれの平均値、及び、標本分散を求め、数46によりウェルチの検定統計量T1及びT0(j)(j=1,2,…,m+m)を算出した。次に、T1及びT0(j)の値の大小を比較してbopt(j)(j=1,2,…,m+m)の値を求めた。表3は、T1、T0(j)及びbopt(j)の値を算出した結果を示している。即ち、表3は、実験例10において選択ベクトルの最適値の実験結果を示す表である。ただし、表3では、紙面の制約により、jの値を8から256まで、また、257+8から257+256まで8ずつ増加したときの結果を表示している。表3の右最下段(総合)より、選択ベクトルのすべての成分値を1に設定したときの目的関数の値はT1=49.7822であり、選択ベクトルの成分値を最適値bopt(j)(j=1,2,…,m+m)に設定したときの目的関数の値は70.8422であり、最適化を行った結果として目的関数の値が42.3%増加したことが分かる。
Figure 0005956624
以上の実験例10では、基準パターンの中心の移動に際し、標準及び入力パターンに対する基準パターンの相対的位置関係について、類似度検出精度を向上させる標準及び入力パターンの成分位置と、低下させる成分位置とを区別するために、標準及び入力パターン複合加重ベクトルにおいて、類似度検出精度を向上させる成分値を選択し、低下させる成分値を除外する処理を行った。これにより、同じカテゴリに属する標準音間の距離が近くなり、同時に、異なるカテゴリに属する標準音間の距離が遠くなり、結果として、同じカテゴリの標準音と異なるカテゴリの標準音の分離が良くなり、入力音が与えられたときの認識性能が向上することが分かる。
なお、ウェルチの検定統計量T1及びT0(j)(j=1,2,…,m+m)に代えて、認識率R1及びR0(j)(j=1,2,…,m+m)を目的関数として用いてもよい。この場合、例えば、カテゴリ1に属するN1個の標準音(正常音)とカテゴリ2に属するN2個の標準音(異常音)を予め録音しておき、これらとは別の1個の入力音(正常音)と上記(N1+N2)個の標準音との間の形状距離dAをそれぞれ算出する。そして、得られた(N1+N2)個の形状距離dAの中で、最小値に対応する標準音がカテゴリ1に属しているとき入力音はカテゴリ1に属する(正常音である)と判定し、最小値に対応する標準音がカテゴリ2に属しているとき入力音はカテゴリ2に属する(異常音である)と判定する。同様に、上記とは別の1個の入力音(異常音)と上記(N1+N2)個の標準音との間の形状距離dAをそれぞれ算出する。そして、得られた(N1+N2)個の形状距離dAの中で、最小値に対応する標準音がカテゴリ1に属しているとき入力音はカテゴリ1に属する(正常音である)と判定し、最小値に対応する標準音がカテゴリ2に属しているとき入力音はカテゴリ2に属する(異常音である)と判定する。同様にして、多数の入力音(正常音及び異常音)を用いて上記の認識実験を行い、入力音(正常音及び異常音)が正しく判定された割合から認識率R1及びR0(j)を求める。その際、jの値を1からm+mまで1ずつ増加しながら目的関数R1及びR0(j)の値を算出し、R1及びR0(j)の値の大小を比較して最適値bopt(j)(j=1,2,…,m+m)の値を求める。
以上のように本発明では、最適化された歪度加重ベクトルと尖度加重ベクトルの2つを用いて、標準及び入力パターン歪度加重ベクトル、並びに、標準及び入力パターン尖度加重ベクトルを作成し、これら4つのベクトルの大きさをそれぞれ1に正規化する。次に、正規化して得られた標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルを結合して標準パターン複合加重ベクトルを作成する。同様に、正規化して得られた入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルを結合して入力パターン複合加重ベクトルを作成する。更に、標準及び入力パターン複合加重ベクトルにおいて、類似度検出精度を向上させる成分値を選択し、低下させる成分値を除外する(成分値を0にする)ことにより、標準及び入力パターン複合選択ベクトルを作成する。そして、標準パターン複合選択ベクトルと入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値とする。
[未知の入力音の認識]
音声認識における日本語の母音認識では、未知の入力音声は/a/、/i/、/u/、/e/、/o/の5つのカテゴリのいずれかに属するとして認識される。本実施例では、このとき「カテゴリ数は5である」と呼ぶことにする。一方、コンクリート構造物の打音点検では、コンクリート構造物が発する音はコンクリート内部に埋設されている鉄筋の量や深さにより変化するため、多くの場合、正常音のカテゴリ数は2以上になる。また、コンクリート構造物が発する音はコンクリート内部の空洞などの損傷の大きさや深さにより変化するため、多くの場合、異常音のカテゴリ数は2以上になる。次に、カテゴリ数が2である場合とカテゴリ数が3以上である場合に分けて、本発明による形状距離を用いて未知の入力音を認識する処理手順を説明する。
最初に、カテゴリ数が2である場合について、未知の入力音を認識する処理手順を説明する。図49は、カテゴリ1に属するN1個の標準音(正常音)とカテゴリ2に属するN2個の標準音(異常音)を予め登録しておき、これらとは別に未知の入力音が与えられたとき入力音がカテゴリ1とカテゴリ2のうちいずれに属するかを認識する処理手順を示している。ただし、N1≧2かつN2≧2とする。
●図49のStep1では、カテゴリ1(C1)に属するN1個の標準音(正常音)とカテゴリ2(C2)に属するN2個の標準音(異常音)を録音して(N1+N2)個のパワースペクトルを予め作成しておく。
●Step2では、図48の手順処理により最適値ωs、最適値ωk、及び、最適値bopt(j)(j=1,2,…,m+m)を予め算出しておく。
●Step3では、未知の入力音xを録音する。
●Step4では、最適値ωs、最適値ωk、及び、最適値bopt(j)(j=1,2,…,m+m)を用いて、図43〜図47の処理手順により、入力音xと上記(N1+N2)個の標準音との間の形状距離dAをそれぞれ算出する。
●Step5では、得られた(N1+N2)個の形状距離dAの中で、最小値に対応する標準音がカテゴリ1(C1)に属しているとき入力音xはカテゴリ1に属する(正常音である:x∈C1)と判定し、最小値に対応する標準音がカテゴリ2(C2)に属しているとき入力音xはカテゴリ2に属する(異常音である:x∈C2)と判定する。
次に、カテゴリ数が3以上である場合について、未知の入力音を認識する処理手順を説明する。カテゴリ数が3以上である場合であっても、異なるカテゴリの標準音間の距離値、及び、同じカテゴリの標準音間の距離値を定義することは可能であり、従って、図38及び図42に示した目的関数の曲線を作図することは可能である。しかしながら、多くの場合、カテゴリ数が増加するにつれて目的関数の曲線のピーク位置が不明確になり、ωの最適値を確定することが困難になる。そこで、本実施例では、図49の処理手順をカテゴリ数が3以上である場合に適用して、未知の入力音を認識する処理手順を説明する。
図50は、一例として、それぞれカテゴリ1〜カテゴリ4(C1〜C4)に属するN1個〜N4個の標準音(正常音または異常音)を予め登録しておき、これらとは別に未知の入力音が与えられたとき入力音がカテゴリ1〜カテゴリ4のうちいずれに属するか、または、いずれにも属しないかを認識する処理手順を示している。ただし、N1≧2かつN2≧2かつN3≧2かつN4≧2とする。また、図50では、それぞれの菱形の記号の内部において図49に示すStep1、2、4及び5の処理を行うものとする。例えば、図50のStep3の菱形の記号(判断記号)<C1:C3>では、図49に示すStep1、2、4及び5におけるC2をC3に、N2をN3に読み替えて処理を行うものとする。即ち、菱形の記号(判断記号)ごとに最適値ωs、最適値ωk、及び、最適値bopt(j)(j=1,2,…,m+m)を算出する。従って、<C1:C2>における最適値ωs、最適値ωk、及び、最適値bopt(j)(j=1,2,…,m+m)は、<C1:C3>におけるそれらとは異なる。また、図49に示すStep1、2、4及び5における正常音及び異常音は、正常音A及び正常音Bであってもよく、従って、図中の正常音及び異常音を正常音A、正常音B、異常音A、異常音Bなどに読み替えて処理を行うものとする。
●図50のStep1では、未知の入力音xを録音する。
●Step2の<C1:C2>では、図49に示すStep1、2、4及び5の処理を行い、x∈C1とx∈C2のうちいずれであるかを判定する。x∈C1と判定されたときStep3の<C1:C3>へ移り、x∈C2と判定されたときStep3の<C2:C3>へ移る。
●Step3の<C1:C3>では、図49に示すStep1、2、4及び5の処理を行い、x∈C1とx∈C3のうちいずれであるかを判定する。x∈C1と判定されたときStep4の<C1:C4>へ移り、x∈C3と判定されたときStep4の<C3:C4>へ移る。
●Step3の<C2:C3>では、図49に示すStep1、2、4及び5の処理を行い、x∈C2とx∈C3のうちいずれであるかを判定する。x∈C2と判定されたときStep4の<C2:C4>へ移り、x∈C3と判定されたときStep4の<C3:C4>へ移る。
●Step4では、Step2及び3と同様の処理を行う。
●Step5は、一例として、x∈C4と判定された場合を示している。
●この場合、Step6、7及び8においてC4を固定し、再び、C1、C2、及びC3と比較する処理を行う。
●Step9では、Step6、7及び8のすべてにおいてx∈C4と判定されたとき入力音xはカテゴリ4に属する(x∈C4)と最終判定する。それ以外のとき入力音xはC1〜C4のいずれにも属しないと最終判定する。
次に、図50に示したフローチャートを一般化することについて説明する。図49では、カテゴリ数が2である場合について、未知の入力音が与えられたとき入力音xが2つのカテゴリのうちいずれに属するかを判定している。更に、図50のStep6〜Step8の各ステップでは、図49の処理手順により入力音xが属するカテゴリを判定し、Step6〜Step8のすべてにおいて同じカテゴリに属すると判定されたとき入力音xはそのカテゴリに属すると最終判定している。ここで、図51は、カテゴリ1〜カテゴリ4(C1〜C4)について、Ci(i=1〜4)を固定したときCj(j=1〜4、ただしj≠i)との組み合わせを示したものであり、それぞれの組み合わせにおいて図49の処理手順により入力音xが2つのカテゴリ(Ci及びCj)のうちいずれに属するかが判定される。ここで、一例として、図51(d)に示すように、C4を固定し、C1、C2、及びC3とのそれぞれの組み合わせに図49の処理を行った結果、3つの組み合わせのすべてにおいてx∈C4と判定された場合を考える。このことを明示するために図51(d)では、C4に丸印を付けている。このとき、図51(a)に示すC1−C4、図51(b)に示すC2−C4、及び、図51(c)に示すC3−C4のそれぞれの組み合わせに図49の処理を行った場合、必然的にすべてx∈C4と判定される。このことを明示するために図51(a)(b)(c)では、C4に丸印を付けている。以上より、図51(d)においてx∈C4と最終判定された場合には、図51(a)(b)(c)においてx∈C1またはx∈C2またはx∈C3と最終判定されることはないことが分かる。即ち、入力音xは単一のカテゴリに属すると最終判定されるか、或は、いずれのカテゴリにも属しないと最終判定されるかのどちらかになる。言い換えれば、入力音xが複数のカテゴリに属すると最終判定されることはない。
以上で述べたことに基づき、次に、図50に示したフローチャートを一般化する。図52は、それぞれカテゴリ1〜カテゴリL(C1〜CL)に属するN1個〜NL個の標準音(正常音または異常音)を予め登録しておき、これらとは別に未知の入力音が与えられたとき入力音がカテゴリ1〜カテゴリLのうちいずれに属するか、または、いずれにも属しないかを認識する処理手順を示している。ただし、Ni≧2(i=1〜L)とする。また、図52のStep5では、菱形の記号の内部において図49に示すStep1、2、4及び5の処理を行うものとする。このため、図52のStep5の菱形の記号(判断記号)<Ci:Cj>では、図49に示すStep1、2、4及び5におけるC1、C2をCi、Cjに、N1、N2をNi、Njにそれぞれ読み替えて処理を行うものとする。即ち、CiとCjの組み合わせごとに最適値ωs、最適値ωk、及び、最適値bopt(j)(j=1,2,…,m+m)を算出する。従って、<C1:C2>における最適値ωs、最適値ωk、及び、最適値bopt(j)(j=1,2,…,m+m)は、<C1:C3>におけるそれらとは異なる。また、図49に示すStep1、2、4及び5における正常音及び異常音は、正常音A及び正常音Bであってもよく、従って、図中の正常音及び異常音を正常音A、正常音B、異常音A、異常音Bなどに読み替えて処理を行うものとする。
●図52のStep1では、未知の入力音xを録音する。
●Step2では、初期値としてi=1を設定する。
●Step3では、初期値としてj=1を設定する。
●Step4では、i=jのときStep6−1へ移り、i≠jのときStep5へ移る。
●Step5の<Ci:Cj>では、図49に示すStep1、2、4及び5の処理を行い、x∈Ciとx∈Cjのうちいずれであるかを判定する。x∈Ciと判定されたときStep6−1へ移り、x∈Cjと判定されたときStep6−2へ移る。
●Step6−1と7−1では、jの値をLまで1ずつ増加しながら、Step4から5の処理を繰り返す。
●Step6−2と7−2では、iの値をLまで1ずつ増加しながら、Step3から5の処理を繰り返す。
●Step8−1では、Ciを固定してCjと比較した結果、すべてのj(j=1〜L、j≠i)についてx∈Ciと判定されたのであるから入力音xはカテゴリiに属する(x∈Ci)と最終判定する。
●Step8−2では、Step8−1以外の場合であるから入力音xはC1〜CLのいずれにも属しないと最終判定する。
以上より、図52は、カテゴリ数をL(ただし、L≧3)として一般化されたフローチャートであり、コンピュータのプログラミングに適していることが分かる。
音声認識における日本語の母音認識では、未知の入力音声は/a/、/i/、/u/、/e/、/o/の5つのカテゴリのいずれかに属するとして認識される。この場合、カテゴリ数は5であることが予め分かっている。一方、コンクリート構造物の打音点検では、コンクリート構造物が発する音はコンクリート内部に埋設されている鉄筋の量や深さにより変化するため、多くの場合、正常音のカテゴリ数は2以上になる。また、コンクリート構造物が発する音はコンクリート内部の空洞などの損傷の大きさや深さにより変化するため、多くの場合、異常音のカテゴリ数は2以上になる。このため、この場合、カテゴリ数がいくつであるかを予め知ることができない。そこで次に、カテゴリ数を予め知ることができない場合にカテゴリ数を決定する処理手順を説明する。
第1段階では、最初に、コンクリート構造物の内部状態が異なる複数箇所を選定し、選定箇所ごとに1つのカテゴリを割り当てる。従って、選定箇所の数とカテゴリ数は等しい。そして、同じ箇所を繰り返し打撃して複数個の標準音(正常音または異常音)を録音し、それぞれのカテゴリに属する標準音として登録する。次に、任意の2つのカテゴリについて、図48に示す処理手順により最適値ωs、最適値ωk、及び、最適値bopt(j)(j=1,2,…,m+m)を求め、それらの最適値を用いたときのウェルチの検定統計量T(数46)を算出する。Tの値が任意に設定した閾値より小さいとき、これら2つのカテゴリは同じカテゴリであるとして1つのカテゴリに合併する。また、Tの値が任意に設定した閾値以上のとき、これら2つのカテゴリは別のカテゴリであるとする。選定箇所ごとに割り当てたカテゴリのすべての組み合わせについて上記の処理を行うことによりカテゴリ数は減少する。
第2段階では、第1段階で決定したカテゴリ数を用いて図52の処理手順により未知の入力音を認識する。認識結果として、「入力音は第1段階で決定したカテゴリのいずれにも属しない」と最終判定されたとき、新しいカテゴリを作成してこの入力音を新しいカテゴリに属する標準音とする。上記と同様の処理を続けることにより、「入力音は既存のカテゴリのいずれにも属しない」と最終判定されたとき、新しいカテゴリを作成してこの入力音を新しいカテゴリに属する標準音とする。従って、第2段階の処理を行うことによりカテゴリ数は増加する。ただし、図37、図41、図48及び図49において、カテゴリ1に属するN1個の標準音とカテゴリ2に属するN2個の標準音についてN1≧2かつN2≧2の条件を満たすため、コンクリート構造物の同じ箇所を繰り返し打撃して複数個の入力音を録音する。そして、「これら複数個の入力音のすべて(または、少なくとも1つ)が既存のカテゴリのいずれにも属しない」と最終判定されたとき、新しいカテゴリを作成してこれらの入力音を新しいカテゴリに属する標準音とする。なお、適時に再度、第1段階の処理を行うことによりカテゴリの合併を行ってもよい。以上のように、第1段階及び第2段階の処理を行うことによりカテゴリ数を決定することができる。
なお、本発明による形状距離dAの算出において、図43より標準パターン複合加重ベクトルsogdは標準パターンの登録過程で予め計算できることが分かる。同様に、図47より標準パターン複合選択ベクトルsogbも標準パターンの登録過程で予め計算できることが分かる。このため、N個の標準パターンと1個の入力パターンの間の形状距離値dAをそれぞれ算出する場合、図45及び図47に示すように、入力パターンの認識過程では、1回の入力パターン複合加重ベクトルxogd及び入力パターン複合選択ベクトルxogbの計算とN回のコサイン尺度の計算を行うことによりN個のdAが得られる。以上のように,入力パターンの認識過程において、形状距離dAの計算量は少ないことが分かる。また、図21より理解できるように、本発明による形状距離dAは、パワースペクトルの正規化の方法に影響されない類似性尺度である。
以上で、2つのパターン原始ベクトル間の類似度検出値を用いたコンクリート構造物の異常判定方法についての説明を終わる。
なお、以上の実施例は、目的関数としてウェルチの検定統計量を用いて歪度加重ベクトル、尖度加重ベクトル、及び、選択ベクトルの最適値を算出したものであったが、目的関数として認識率などその他の統計量を用いて歪度加重ベクトル、尖度加重ベクトル、及び、選択ベクトルの最適値を算出してもよい。
なお、以上の実施例は、最初に最適値ωs及び最適値ωkを求め、次に最適値bopt(j)(j=1,2,…,m+m)を算出したものであったが、得られた最適値bopt(j)(j=1,2,…,m+m)の値が1である成分位置に対応する標準及び入力パターンの成分位置だけを用いて、再度、最適値ωs及び最適値ωkを求めてもよい。この場合、目的関数の値の増加が飽和するまで、最適値ωs及び最適値ωkを求めることと最適値bopt(j)(j=1,2,…,m+m)を算出することを繰り返してもよい。
なお、以上の実施例は、打音点検によりコンクリート構造物が発する音や振動について形状距離値を算出し異常を検出したものであったが、打音点検によりアンカーボルトが発する音や振動について形状距離値を算出し異常を検出しても良い。
また、以上の実施例は、コンクリート構造物が発する音波について標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値を算出し異常検出を行ったものであったが、人間が発声する音声波について標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値を算出し音声認識を行っても良い。
なお、以上の実施例は、音響、振動波のパワースペクトルの棒グラフを作成して標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離を算出したものであったが、一般には、任意の棒グラフについて標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離を算出し、得られた形状距離値を以って棒グラフの類似度検出を行うことができる。また、この類似度検出値に基づいて棒グラフに関する解析等、各種処理を行うことができる。
1 構造物
2 マイクロホン
3 帯域通過フィルタ
4 AD変換器
5 演算装置

Claims (4)

  1. (a)標準音の特徴量を成分とする標準パターン原始ベクトルと、入力音の特徴量を成分とする入力パターン原始ベクトルとを作成すること、
    (b)パターン原始ベクトルの指定成分ごとに異なる分散の値をもつ任意の基準形状を作成し、上記基準形状の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの歪度の変化率の値を成分とする歪度加重ベクトルを作成すること、
    (c)標準パターン原始ベクトルの指定成分と各成分との間の長さを求め、歪度加重ベクトルの中心から上記長さだけ離れた位置に最も近い歪度加重ベクトルの成分番号を算出し、歪度加重ベクトルの上記成分番号の成分値と標準パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を標準パターン原始ベクトルの各成分について加算した積和値を算出すること、
    (d)上記積和値を算出するに際し、標準パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする標準パターン歪度加重ベクトルを作成すること、
    (e)入力パターン原始ベクトルの指定成分と各成分との間の長さを求め、歪度加重ベクトルの中心から上記長さだけ離れた位置に最も近い歪度加重ベクトルの成分番号を算出し、歪度加重ベクトルの上記成分番号の成分値と入力パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を入力パターン原始ベクトルの各成分について加算した積和値を算出すること、
    (f)上記積和値を算出するに際し、入力パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする入力パターン歪度加重ベクトルを作成すること、
    (g)上記標準パターン歪度加重ベクトルと上記入力パターン歪度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の歪度形状距離値とすること、
    (h)基準形状の分散の値を変化させながら歪度加重ベクトルを作成し、異なるカテゴリの標準音間の歪度形状距離平均値から同じカテゴリの標準音間の歪度形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準音間の歪度形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準音間の歪度形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な歪度加重ベクトルを作成すること、
    (i)上記最適な歪度加重ベクトルを用いて、標準パターン歪度加重ベクトル、及び、入力パターン歪度加重ベクトルを作成すること、
    (j)パターン原始ベクトルの指定成分ごとに異なる分散の値をもつ任意の基準形状を作成し、上記基準形状の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの尖度の変化率の値を成分とする尖度加重ベクトルを作成すること、
    (k)標準パターン原始ベクトルの指定成分と各成分との間の長さを求め、尖度加重ベクトルの中心から上記長さだけ離れた位置に最も近い尖度加重ベクトルの成分番号を算出し、尖度加重ベクトルの上記成分番号の成分値と標準パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を標準パターン原始ベクトルの各成分について加算した積和値を算出すること、
    (l)上記積和値を算出するに際し、標準パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする標準パターン尖度加重ベクトルを作成すること、
    (m)入力パターン原始ベクトルの指定成分と各成分との間の長さを求め、尖度加重ベクトルの中心から上記長さだけ離れた位置に最も近い尖度加重ベクトルの成分番号を算出し、尖度加重ベクトルの上記成分番号の成分値と入力パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を入力パターン原始ベクトルの各成分について加算した積和値を算出すること、
    (n)上記積和値を算出するに際し、入力パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする入力パターン尖度加重ベクトルを作成すること、
    (o)上記標準パターン尖度加重ベクトルと上記入力パターン尖度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の尖度形状距離値とすること、
    (p)基準形状の分散の値を変化させながら尖度加重ベクトルを作成し、異なるカテゴリの標準音間の尖度形状距離平均値から同じカテゴリの標準音間の尖度形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準音間の尖度形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準音間の尖度形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な尖度加重ベクトルを作成すること、
    (q)上記最適な尖度加重ベクトルを用いて、標準パターン尖度加重ベクトル、及び、入力パターン尖度加重ベクトルを作成すること、
    (r)上記標準パターン歪度加重ベクトルと上記標準パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルを結合して標準パターン複合加重ベクトルを作成すること、
    (s)上記入力パターン歪度加重ベクトルと上記入力パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルを結合して入力パターン複合加重ベクトルを作成すること、
    (t)上記標準及び入力パターン複合加重ベクトルと同じ成分の個数をもち、0または1の値を成分とする選択ベクトルを作成し、それぞれ標準パターン複合加重ベクトル、及び、入力パターン複合加重ベクトルの各成分の成分値と上記選択ベクトルの同じ成分番号の成分値との積の値を求め、上記積の値を成分値とする標準パターン複合選択ベクトル、及び、入力パターン複合選択ベクトルを作成すること、
    (u)上記標準パターン複合選択ベクトルと上記入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値とすること、
    (v)選択ベクトルの各成分の0と1の値を変化させながら、異なるカテゴリの標準音間の形状距離平均値から同じカテゴリの標準音間の形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準音間の形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準音間の形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な選択ベクトルを作成すること、
    (w)上記最適な選択ベクトルを用いて作成した標準パターン複合選択ベクトルと入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値とすることを特徴とする異常音の検出方法。
  2. 請求項1に記載の異常音の検出方法を用いて、正常な標準音の特徴量を成分とする標準パターン原始ベクトルと未知の入力音の特徴量を成分とする入力パターン原始ベクトルとの間の形状距離を求め、また、異常な標準音の特徴量を成分とする標準パターン原始ベクトルと上記入力パターン原始ベクトルとの間の形状距離を求め、前者の形状距離値と後者の形状距離値を比較し、前者が後者以下であるとき入力音は正常であると判定し、前者が後者より大きいとき入力音は異常であると判定することを特徴とする構造物の異常判定方法。
  3. (a)標準振動波の特徴量を成分とする標準パターン原始ベクトルと、入力振動波の特徴量を成分とする入力パターン原始ベクトルとを作成すること、
    (b)パターン原始ベクトルの指定成分ごとに異なる分散の値をもつ任意の基準形状を作成し、上記基準形状の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの歪度の変化率の値を成分とする歪度加重ベクトルを作成すること、
    (c)標準パターン原始ベクトルの指定成分と各成分との間の長さを求め、歪度加重ベクトルの中心から上記長さだけ離れた位置に最も近い歪度加重ベクトルの成分番号を算出し、歪度加重ベクトルの上記成分番号の成分値と標準パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を標準パターン原始ベクトルの各成分について加算した積和値を算出すること、
    (d)上記積和値を算出するに際し、標準パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする標準パターン歪度加重ベクトルを作成すること、
    (e)入力パターン原始ベクトルの指定成分と各成分との間の長さを求め、歪度加重ベクトルの中心から上記長さだけ離れた位置に最も近い歪度加重ベクトルの成分番号を算出し、歪度加重ベクトルの上記成分番号の成分値と入力パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を入力パターン原始ベクトルの各成分について加算した積和値を算出すること、
    (f)上記積和値を算出するに際し、入力パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする入力パターン歪度加重ベクトルを作成すること、
    (g)上記標準パターン歪度加重ベクトルと上記入力パターン歪度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の歪度形状距離値とすること、
    (h)基準形状の分散の値を変化させながら歪度加重ベクトルを作成し、異なるカテゴリの標準振動波間の歪度形状距離平均値から同じカテゴリの標準振動波間の歪度形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準振動波間の歪度形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準振動波間の歪度形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な歪度加重ベクトルを作成すること、
    (i)上記最適な歪度加重ベクトルを用いて、標準パターン歪度加重ベクトル、及び、入力パターン歪度加重ベクトルを作成すること、
    (j)パターン原始ベクトルの指定成分ごとに異なる分散の値をもつ任意の基準形状を作成し、上記基準形状の値を成分とする基準パターンベクトルを作成し、上記基準パターンベクトルの尖度の変化率の値を成分とする尖度加重ベクトルを作成すること、
    (k)標準パターン原始ベクトルの指定成分と各成分との間の長さを求め、尖度加重ベクトルの中心から上記長さだけ離れた位置に最も近い尖度加重ベクトルの成分番号を算出し、尖度加重ベクトルの上記成分番号の成分値と標準パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を標準パターン原始ベクトルの各成分について加算した積和値を算出すること、
    (l)上記積和値を算出するに際し、標準パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする標準パターン尖度加重ベクトルを作成すること、
    (m)入力パターン原始ベクトルの指定成分と各成分との間の長さを求め、尖度加重ベクトルの中心から上記長さだけ離れた位置に最も近い尖度加重ベクトルの成分番号を算出し、尖度加重ベクトルの上記成分番号の成分値と入力パターン原始ベクトルの各成分の成分値との積の値を求め、上記積の値を入力パターン原始ベクトルの各成分について加算した積和値を算出すること、
    (n)上記積和値を算出するに際し、入力パターン原始ベクトルの指定成分を各成分の位置に移動しながら積和値を求め、上記積和値を指定成分の成分値とする入力パターン尖度加重ベクトルを作成すること、
    (o)上記標準パターン尖度加重ベクトルと上記入力パターン尖度加重ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の尖度形状距離値とすること、
    (p)基準形状の分散の値を変化させながら尖度加重ベクトルを作成し、異なるカテゴリの標準振動波間の尖度形状距離平均値から同じカテゴリの標準振動波間の尖度形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準振動波間の尖度形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準振動波間の尖度形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な尖度加重ベクトルを作成すること、
    (q)上記最適な尖度加重ベクトルを用いて、標準パターン尖度加重ベクトル、及び、入力パターン尖度加重ベクトルを作成すること、
    (r)上記標準パターン歪度加重ベクトルと上記標準パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた標準パターン歪度加重ベクトルと標準パターン尖度加重ベクトルを結合して標準パターン複合加重ベクトルを作成すること、
    (s)上記入力パターン歪度加重ベクトルと上記入力パターン尖度加重ベクトルの大きさをそれぞれ1に正規化し、正規化して得られた入力パターン歪度加重ベクトルと入力パターン尖度加重ベクトルを結合して入力パターン複合加重ベクトルを作成すること、
    (t)上記標準及び入力パターン複合加重ベクトルと同じ成分の個数をもち、0または1の値を成分とする選択ベクトルを作成し、それぞれ標準パターン複合加重ベクトル、及び、入力パターン複合加重ベクトルの各成分の成分値と上記選択ベクトルの同じ成分番号の成分値との積の値を求め、上記積の値を成分値とする標準パターン複合選択ベクトル、及び、入力パターン複合選択ベクトルを作成すること、
    (u)上記標準パターン複合選択ベクトルと上記入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値とすること、
    (v)選択ベクトルの各成分の0と1の値を変化させながら、異なるカテゴリの標準振動波間の形状距離平均値から同じカテゴリの標準振動波間の形状距離平均値を減算した平均値の差の値を求め、異なるカテゴリの標準振動波間の形状距離の標本分散をその標本数で除算した値、及び、同じカテゴリの標準振動波間の形状距離の標本分散をその標本数で除算した値の和の平方根を求め、上記平均値の差の値を上記平方根で除算したウェルチの検定統計量を求めて目的関数の値とし、上記目的関数の値を最大にする最適な選択ベクトルを作成すること、
    (w)上記最適な選択ベクトルを用いて作成した標準パターン複合選択ベクトルと入力パターン複合選択ベクトルのなす角の値を、標準パターン原始ベクトルと入力パターン原始ベクトルとの間の形状距離値とすることを特徴とする振動波の類似度検出方法。
  4. 請求項3に記載の振動波の類似度検出方法を用いて、カテゴリ1に属する標準音声の特徴量を成分とする標準パターン原始ベクトルと未知の入力音声の特徴量を成分とする入力パターン原始ベクトルとの間の形状距離を求め、また、カテゴリ2に属する標準音声の特徴量を成分とする標準パターン原始ベクトルと上記入力パターン原始ベクトルとの間の形状距離を求め、前者の形状距離値と後者の形状距離値を比較し、前者が後者以下であるとき入力音声はカテゴリ1に属すると判定し、前者が後者より大きいとき入力音声はカテゴリ2に属すると判定することを特徴とする音声認識方法。
JP2015018596A 2015-02-02 2015-02-02 異常音の検出方法及びその検出値を用いた構造物の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法 Active JP5956624B1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015018596A JP5956624B1 (ja) 2015-02-02 2015-02-02 異常音の検出方法及びその検出値を用いた構造物の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法
CA2918533A CA2918533C (en) 2015-02-02 2016-01-21 Method for detecting abnormal sound and method for judging abnormality in structure by use of detected value thereof, and method for detecting similarity between oscillation waves and method for recognizing voice by use of detected value thereof
US15/003,376 US9552831B2 (en) 2015-02-02 2016-01-21 Method for detecting abnormal sound and method for judging abnormality in structure by use of detected value thereof, and method for detecting similarity between oscillation waves and method for recognizing voice by use of detected value thereof
AU2016200487A AU2016200487B2 (en) 2015-02-02 2016-01-28 Method for detecting abnormal sound and method for judging abnormality in structure by use of detected value thereof, and method for detecting similarity between oscillation waves and method for recognizing voice by use of detected value thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015018596A JP5956624B1 (ja) 2015-02-02 2015-02-02 異常音の検出方法及びその検出値を用いた構造物の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法

Publications (2)

Publication Number Publication Date
JP5956624B1 true JP5956624B1 (ja) 2016-07-27
JP2016142625A JP2016142625A (ja) 2016-08-08

Family

ID=56513723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015018596A Active JP5956624B1 (ja) 2015-02-02 2015-02-02 異常音の検出方法及びその検出値を用いた構造物の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法

Country Status (4)

Country Link
US (1) US9552831B2 (ja)
JP (1) JP5956624B1 (ja)
AU (1) AU2016200487B2 (ja)
CA (1) CA2918533C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111832910A (zh) * 2020-06-24 2020-10-27 陕西法士特齿轮有限责任公司 一种多指标异响判定阈值确定方法、系统和计算机设备

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10186253B2 (en) * 2015-10-05 2019-01-22 Olympus Corporation Control device for recording system, and recording system
CN106291293B (zh) * 2016-10-27 2018-09-18 西南石油大学 一种基于谱峭度与s变换的局放信号自适应去噪方法
CN106448700B (zh) * 2016-10-31 2019-09-17 济南中维世纪科技有限公司 一种尖锐声音检测方法和系统
JP6773612B2 (ja) * 2017-07-11 2020-10-21 株式会社東芝 音響検査装置、音声信号取得装置、音響検査システム、および音響検査方法
JP2019144187A (ja) * 2018-02-23 2019-08-29 パナソニックIpマネジメント株式会社 診断方法、診断装置及び診断プログラム
US11094316B2 (en) * 2018-05-04 2021-08-17 Qualcomm Incorporated Audio analytics for natural language processing
CN109085235B (zh) * 2018-08-27 2021-03-02 北京市康科瑞工程检测技术有限责任公司 一种套筒灌浆饱满度的超声综合因子图形识别检测方法
US11664044B2 (en) 2019-11-25 2023-05-30 Qualcomm Incorporated Sound event detection learning
EP3916495A1 (de) * 2020-05-28 2021-12-01 Carl Zeiss Industrielle Messtechnik GmbH Verfahren und anordnung zum auswerten oder zum vorbereiten einer auswertung einer stichprobe von messdaten aus einer vermessung einer vielzahl von werkstücken
US11410677B2 (en) 2020-11-24 2022-08-09 Qualcomm Incorporated Adaptive sound event classification
CN113176225B (zh) * 2021-04-26 2023-02-07 深圳市国科光谱技术有限公司 一种针对水分含量变化的多品种物质的光谱匹配方法
CN113987190B (zh) * 2021-11-16 2023-02-28 国网智能电网研究院有限公司 一种数据质量校验规则提取方法及系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5210820A (en) * 1990-05-02 1993-05-11 Broadcast Data Systems Limited Partnership Signal recognition system and method
JPH10149190A (ja) * 1996-11-19 1998-06-02 Matsushita Electric Ind Co Ltd 音声認識方法及び音声認識装置
JP3426905B2 (ja) 1997-03-14 2003-07-14 東京瓦斯株式会社 異常音の検出方法及びその検出値を用いた機械の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法
JP3342864B2 (ja) 2000-09-13 2002-11-11 株式会社エントロピーソフトウェア研究所 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法
JP3422787B1 (ja) 2002-03-13 2003-06-30 株式会社エントロピーソフトウェア研究所 画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法
JP2003334679A (ja) * 2002-05-16 2003-11-25 Mitsubishi Electric Corp レーザ溶接の診断装置
US20100332222A1 (en) * 2006-09-29 2010-12-30 National Chiao Tung University Intelligent classification method of vocal signal
TWI297486B (en) * 2006-09-29 2008-06-01 Univ Nat Chiao Tung Intelligent classification of sound signals with applicaation and method
JP5383265B2 (ja) * 2009-03-17 2014-01-08 株式会社日立ハイテクノロジーズ エッチング装置、分析装置、エッチング処理方法、およびエッチング処理プログラム
JP5504470B2 (ja) * 2009-09-08 2014-05-28 日産自動車株式会社 車両用運転状態検出装置、及び車両用運転状態検出方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111832910A (zh) * 2020-06-24 2020-10-27 陕西法士特齿轮有限责任公司 一种多指标异响判定阈值确定方法、系统和计算机设备
CN111832910B (zh) * 2020-06-24 2024-03-12 陕西法士特齿轮有限责任公司 一种多指标异响判定阈值确定方法、系统和计算机设备

Also Published As

Publication number Publication date
US20160225389A1 (en) 2016-08-04
US9552831B2 (en) 2017-01-24
CA2918533A1 (en) 2016-08-02
CA2918533C (en) 2018-04-10
AU2016200487B2 (en) 2017-05-18
JP2016142625A (ja) 2016-08-08
AU2016200487A1 (en) 2016-08-18

Similar Documents

Publication Publication Date Title
JP5956624B1 (ja) 異常音の検出方法及びその検出値を用いた構造物の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法
CN113689428B (zh) 基于图像处理的机械零件应力腐蚀检测方法及系统
US10757125B2 (en) Anomaly detection method and recording medium
CN115082482A (zh) 一种金属表面缺陷检测方法
JP4835459B2 (ja) 表認識プログラム、表認識方法および表認識装置
CN109934278B (zh) 一种信息增益混合邻域粗糙集的高维度特征选择方法
JPWO2004079658A1 (ja) 生体画像照合装置およびその照合方法
CN116137036B (zh) 基于机器学习的基因检测数据智能处理系统
KR20180114316A (ko) 프리캐스트 콘크리트의 보강용 철근 위치 검출 방법 및 이의 검출 장치
US7856127B2 (en) Ridge direction extraction device, ridge direction extraction method, ridge direction extraction program
Joo et al. Jump detection in a regression curve and its derivative
CN114972882A (zh) 基于多注意力机制的磨损表面损伤深度估计方法及系统
CN114943674A (zh) 瑕疵检测方法、电子装置及存储介质
CN105718723B (zh) 一种质谱数据处理中谱峰位置检测方法
US8849662B2 (en) Method and system for segmenting phonemes from voice signals
CN102509273B (zh) 基于同质片和模糊测度的乳腺超声图像的肿瘤分割方法
JP2006343234A (ja) 非球面形状誤差の評価方法および形状評価装置
JPH10253444A (ja) 異常音の検出方法及びその検出値を用いた機械の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法
JP5463534B2 (ja) イオノグラム電離圏エコーの自動偏波分離、及び自動読取方法
WO2005101313A1 (ja) テンプレートマッチング装置
AU2003201379A1 (en) Method for detecting similarity between images and method for recognizing image by use of detected value thereof, method for detecting similarity between voices and method for recognizing voice by use of detected value thereof, method for detecting similarity between oscillation waves and method for judging abnormality in machine by use of detected value thereof, method for detecting similarity between moving images and method for recognizing moving image by use of detected value thereof, and method for detecting similarity between solids and method for recognizing solid by use of detected
JP4516777B2 (ja) 薄板の表面欠陥の分布形態解析装置、薄板の表面欠陥の分布形態解析方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体
JP4388326B2 (ja) 画像処理装置
CN111310569B (zh) 基于加工表面二维变分模态分解的空间频率辨识方法
JP2006031166A (ja) 画像照合装置、画像照合方法および画像照合プログラム。

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160616

R150 Certificate of patent or registration of utility model

Ref document number: 5956624

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250