JP2015175770A - 音識別条件設定支援装置および音識別条件設定支援方法 - Google Patents

音識別条件設定支援装置および音識別条件設定支援方法 Download PDF

Info

Publication number
JP2015175770A
JP2015175770A JP2014053464A JP2014053464A JP2015175770A JP 2015175770 A JP2015175770 A JP 2015175770A JP 2014053464 A JP2014053464 A JP 2014053464A JP 2014053464 A JP2014053464 A JP 2014053464A JP 2015175770 A JP2015175770 A JP 2015175770A
Authority
JP
Japan
Prior art keywords
sound
abnormal
data
identification
spectrogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014053464A
Other languages
English (en)
Other versions
JP5937125B2 (ja
Inventor
勝哉 梶山
Katsuya Kajiyama
勝哉 梶山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chugoku Electric Power Co Inc
Original Assignee
Chugoku Electric Power Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chugoku Electric Power Co Inc filed Critical Chugoku Electric Power Co Inc
Priority to JP2014053464A priority Critical patent/JP5937125B2/ja
Publication of JP2015175770A publication Critical patent/JP2015175770A/ja
Application granted granted Critical
Publication of JP5937125B2 publication Critical patent/JP5937125B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

【課題】採取音のスペクトログラムにおいて異音の特徴抽出を容易にかつ確実に行い、当該処理に関する作業者の負担を削減できるようにする。
【解決手段】音識別条件設定支援装置は、異音を含む有異音サンプル音と異音を含まない無異音サンプル音の音声データのスペクトログラムデータを生成し、各スペクトログラムデータにつき、所定の周波数範囲を、所定の規則に従って設定したブロック数のブロックに分割し、ブロックごとに音の強度分布のヒストグラムデータを算出し、各ヒストグラムデータを用い、採取音中の異音の有無を識別する識別関数を生成する。さらに、音識別条件設定支援装置はブロック数の設定を変更し、複数の識別関数を生成する。さらに、音識別条件設定支援装置は、他のサンプル音の音声データを用い、生成した各識別関数の識別正解率を求め、識別正解率が最も高い識別関数およびそれに対応するブロック数を選定する。
【選択図】図10

Description

本発明は、採取音中の異音の有無を識別するための識別条件の設定を支援する音識別条件設定支援装置および音識別条件設定支援方法に関する。
例えば、送電線から発せられる異音を除去する方策を検討する場合や、機器から発せられる異音に基づいて機器の故障診断を行う場合に、送電線または機器に近い場所で採取した音の中に異音が含まれているか否かを、パターン認識手法を用いて判定する。具体的には、多くの場合、採取音をスペクトル解析し、採取音または異音の周波数の特徴に基づき、採取音中の異音の有無を識別する(特許文献1参照)。
しかしながら、異音の周波数または音の強さが時間的に変化する場合、採取音または異音の周波数の静的な特徴に基づくだけでは、異音の有無を高精度に識別することが難しいことがある。このような場合には、採取音のスペクトログラムを分析し、採取音または異音の周波数または音の強さの時間的変化を勘案し、採取音中の異音の有無を識別することが望ましい。これにより、異音の周波数または音の強さが時間的に変化する場合でも、異音の有無を高精度に識別することができる。
特開平11−241945号公報
採取音のスペクトログラムを用い、パターン認識手法により採取音中における異音の有無の識別を行うには、スペクトログラムとして表現された当該異音の特徴を抽出することが必要である。この特徴抽出の優劣が識別精度を大きく左右する。
異音の特徴抽出方法については、一般的または統一的な方法は知られていない。従来、作業者は、採取音のスペクトログラムをコンピュータのモニタに表示し、それを目で見ることにより異音のスペクトログラムの特徴を見出すといった方法で異音の特徴抽出を行っている。
しかしながら、異音の高精度な識別を可能にする異音の特徴を、コンピュータのモニタに表示されたスペクトログラムを見ることにより見出す作業は、長い時間がかかり、大きな負担を作業者に強いる。また、異音の高精度な識別を可能にする異音の特徴を見出せるか否かが作業者の経験に依存する場合が多いため、練達した作業者が存在しない場合には高精度な識別を実現することが困難である。
また、例えば送電線から発せられる異音を除去する方法を検討する場面では、異音の発生時期やどのような異音が発生するのかを予測することが困難であると共に、実際に異音が発生した場合には、その異音を除去する方策を短時間で講じなければならない。このような場面では、異音の特徴抽出を迅速にかつ確実に行わなければならないが、上述した通り、従来技術によってこれを実現することは難しい。
本発明は例えば上述したような問題に鑑みなされたものであり、本発明の課題は、採取音のスペクトログラムにおいて異音の特徴抽出またはそれに相当する処理を容易にかつ確実に行うことができ、当該処理に関する作業者の負担を削減することができると共に、異音の有無の高精度な識別を実現することができる音識別条件設定支援装置および音識別条件設定支援方法を提供することにある。
上記課題を解決するために、本発明の第1の音識別条件設定支援装置は、異音の有無を識別するための識別条件の設定を支援する音識別条件設定支援装置であって、異音を含む複数の有異音サンプル音および異音を含まない複数の無異音サンプル音のスペクトログラムをそれぞれ示すスペクトログラムデータを受け取り、当該各スペクトログラムデータにおける所定の周波数範囲を複数のブロックに分割し、当該各ブロックにおける音の強度分布のヒストグラムを示すヒストグラムデータを生成するヒストグラム生成部と、前記複数の有異音サンプル音のうちのいくつかの有異音サンプル音についての各ブロックのヒストグラムデータ、および前記複数の無異音サンプル音のうちのいくつかの無異音サンプル音についての各ブロックのヒストグラムデータを用い、異音の有無を識別するための識別関数を生成する識別関数生成部と、前記複数の有異音サンプル音のうちの他のいくつかの有異音サンプル音についての各ブロックのヒストグラムデータ、および前記複数の無異音サンプル音のうちの他のいくつかの無異音サンプル音についての各ブロックのヒストグラムデータを前記識別関数に入力して異音の有無の識別を実行し、前記識別関数が異音の有無を正しく識別する確率である識別正解率を算定する正解率算定部とを備えていることを特徴とする。
また、本発明の第2の音識別条件設定支援装置は、上述した本発明の第1の音識別条件設定支援装置において、前記各スペクトログラムデータにおける所定の周波数範囲を複数のブロックに分割する際のブロック数の設定を変更しつつ、前記ヒストグラム生成部、前記識別関数生成部および前記正解率算定部による処理を複数回実行し、当該処理を複数回実行した結果、前記識別関数生成部により生成された複数の識別関数のうち前記識別正解率が最も高い識別関数および当該識別関数を生成する際に設定された前記ブロック数を前記識別条件として選定する識別条件選定部とを備えていることを特徴とする。
また、本発明の第3の音識別条件設定支援装置は、上述した本発明の第1または第2の音識別条件設定支援装置において、前記有異音サンプル音または前記無異音サンプル音のスペクトログラムを示すスペクトログラムデータを生成するスペクトログラム生成部を備えていることを特徴とする。
上記課題を解決するために、本発明の音識別条件設定支援方法は、異音の有無を識別するための識別条件の設定を支援する音識別条件設定支援方法であって、異音を含む複数の有異音サンプル音および異音を含まない複数の無異音サンプル音のスペクトログラムをそれぞれ示すスペクトログラムデータのそれぞれにつき、当該スペクトログラムデータにおける所定の周波数範囲を複数のブロックに分割し、当該各ブロックにおける音の強度分布のヒストグラムを示すヒストグラムデータを生成するヒストグラム生成工程と、前記複数の有異音サンプル音のうちのいくつかの有異音サンプル音についての各ブロックのヒストグラムデータ、および前記複数の無異音サンプル音のうちのいくつかの無異音サンプル音についての各ブロックのヒストグラムデータを用い、異音の有無を識別するための識別関数を生成する識別関数生成工程と、前記複数の有異音サンプル音のうちの他のいくつかの有異音サンプル音についての各ブロックのヒストグラムデータ、および前記複数の無異音サンプル音のうちの他のいくつかの無異音サンプル音についての各ブロックのヒストグラムデータを前記識別関数に入力して異音の有無の識別を実行し、前記識別関数が異音の有無を正しく識別する確率である識別正解率を算定する正解率算定工程とを備え、前記各スペクトログラムデータにおける所定の周波数範囲を複数のブロックに分割する際のブロック数の設定を変更しつつ、前記ヒストグラム生成工程、前記識別関数生成工程および前記正解率算定工程を複数回実行し、これらの工程を複数回実行した結果、前記識別関数生成工程において生成された複数の識別関数のうち前記識別正解率が最も高い識別関数および当該識別関数を生成する際に設定された前記ブロック数を前記識別条件として選定することを特徴とする。
本発明によれば、採取音のスペクトログラムにおいて異音の特徴抽出またはそれに相当する処理を容易にかつ確実に行うことができ、当該処理に関する作業者の負担を削減することができる。
本発明の実施形態による音識別条件設定支援装置を示すブロック図である。 本発明の実施形態による音識別条件設定支援装置による音識別条件設定支援処理を示すフローチャートである。 図2に続く音識別条件設定支援処理を示すフローチャートである。 有異音サンプル音の波形図である。 有異音サンプル音のスペクトログラムを示すグラフである。 有異音サンプル音のスペクトログラムの1つのブロックにおける音の強度分布のヒストグラムを示すグラフである。 有異音サンプル音のスペクトログラムの他の1つのブロックにおける音の強度分布のヒストグラムを示すグラフである。 有異音サンプル音のスペクトログラムのさらに他の1つのブロックにおける音の強度分布のヒストグラムを示すグラフである。 サンプル音のスペクトログラムを20個のブロック数のブロックに分割した状態を示す説明図である。 サンプル音のスペクトログラムを30個のブロック数のブロックに分割した状態を示す説明図である。 識別関数の識別正解率の算定方法を示す説明図である。 ブロック数の各設定に対応する識別関数の識別正解率を示す説明図である。 本発明の実施形態による異音判定装置を示すブロック図である。 本発明の実施形態による異音判定装置による異音判定処理を示すフローチャートである。
以下、本発明の実施の形態につき、図面を参照しながら説明する。
(音識別条件設定支援装置による処理の概要)
図1は本発明の実施形態による音識別条件設定支援装置を示している。図1において、本発明の実施形態による音識別条件設定支援装置1は、採取音中の異音の有無を識別するための識別条件の設定を支援する装置である。採取音は、例えば、送電線または機器等に近い場所で採取した音である。異音は、例えば、送電線の周囲に住む人が不快を訴える音、または機器が正常である場合には発生しない音等である。
音識別条件設定支援装置1により行われる識別条件の設定を支援する処理(音識別条件設定支援処理)は、大まかに述べると、採取音中の異音の有無を識別することができる識別関数を生成ないし選定する処理である。この処理は、実質的にみて、異音の特徴を抽出する処理に相当する。
音識別条件設定支援装置1は、音識別条件設定支援処理として、概ね次の処理を行う。まず、処理の準備として、作業者は、有異音サンプル音の音声データおよび無異音サンプル音の音声データを用意する。有異音サンプル音とは、異音を含む採取音のサンプルである。無異音サンプル音とは、異音を含まない採取音のサンプルである。音声データは、例えば、WAV、MP3(MPEG Audio Layerー3)、AAC(Advanced Audio Coding)等の音声ファイルフォーマットを有するデジタルデータである。
作業者は、例えば次のような方法で、有異音サンプル音の音声データと無異音サンプル音の音声データをそれぞれ複数用意する。すなわち、作業者は、同じ場所で複数回録音を実行することにより複数の音声を採取し、採取した複数の音声を順次再生し、それらを聴き、各音声中の異音の有無を判断する。そして、作業者は、異音が含まれている音声に対応する音声データを有異音サンプル音の音声データに分類し、異音が含まれていない音声に対応する音声データを無異音サンプル音の音声データに分類する。
次に、作業者は、有異音サンプル音の音声データおよび無異音サンプル音の音声データを音識別条件設定支援装置1に入力する。
音識別条件設定支援装置1は、入力された複数の有異音サンプル音の音声データおよび複数の無異音サンプル音の音声データのそれぞれにつき、音声のスペクトログラムを示すスペクトログラムデータを生成する。
続いて、音識別条件設定支援装置1は、複数の有異音サンプル音のスペクトログラムデータのうち、例えば半数の有異音サンプル音のスペクトログラムデータを識別関数生成用の有異音サンプル音のスペクトログラムデータとして選択する。また、音識別条件設定支援装置1は、複数の無異音サンプル音のスペクトログラムデータのうち、例えば半数の無異音サンプル音のスペクトログラムデータを識別関数生成用の無異音サンプル音のスペクトログラムデータとして選択する。
続いて、音識別条件設定支援装置1は、選択したスペクトログラムデータのそれぞれにつき、所定の周波数範囲を、所定の規則に従って設定したブロック数のブロックに分割し、ブロックのそれぞれにつき、音の強度分布のヒストグラムを示すヒストグラムデータを生成する。上記所定の周波数範囲は、例えば一般的な可聴域である20Hz程度から20000Hz程度までの範囲である。なお、異音の周波数範囲の予想がつく場合などには、上記所定の周波数範囲を、異音の周波数範囲が含まれる、より狭い範囲に限定してもよい。
続いて、音識別条件設定支援装置1は、識別関数生成用の有異音サンプル音のスペクトログラムデータまたは識別関数生成用の無異音サンプル音のスペクトログラムデータとしてそれぞれ選択された複数のスペクトログラムデータにおけるヒストグラムデータを用いて識別関数を生成し、生成した識別関数と、この時点で設定されているブロック数を記憶部18に記憶する。
続いて、音識別条件設定支援装置1は、複数の有異音サンプル音のスペクトログラムデータのうち、例えば残りの半数の有異音サンプル音のスペクトログラムデータを識別関数検証用の有異音サンプル音のスペクトログラムデータとして選択する。また、音識別条件設定支援装置1は、複数の無異音サンプル音のスペクトログラムデータのうち、例えば残りの半数の無異音サンプル音のスペクトログラムデータを識別関数検証用の無異音サンプル音のスペクトログラムデータとして選択する。続いて、音識別条件設定支援装置1は、選択したスペクトログラムデータのそれぞれにつき、所定の周波数範囲を、所定の規則に従って設定したブロック数のブロックに分割し、ブロックのそれぞれにつき、音の強度分布のヒストグラムを示すヒストグラムデータを生成する。
続いて、音識別条件設定支援装置1は、識別関数検証用の有異音サンプル音のスペクトログラムデータまたは識別関数検証用の無異音サンプル音のスペクトログラムデータとしてそれぞれ選択された複数のスペクトログラムデータにおけるヒストグラムデータを、生成された識別関数に入力し、1つのヒストグラムデータが入力されるごとに、当該識別関数による識別を実行し、識別結果の正否を判定する。この結果、当該識別関数に入力されたヒストグラムデータの個数に対応する個数の判定結果が得られる。続いて、音識別条件設定支援装置1は、得られた複数の判定結果を用い、当該識別関数の識別正解率を算定し、算定した識別正解率を記憶部18に記憶する。識別正解率とは、識別関数が異音の有無を正しく識別する確率である。
続いて、音識別条件設定支援装置1は、所定の規則に従ってブロック数の設定を変更しながら、上述した識別関数の生成および識別正解率の算定を複数回実行する。これにより、音識別条件設定支援装置1の記憶部18には、複数のブロック数、それぞれのブロック数の設定の下で生成されたヒストグラムデータを用いて生成された複数の識別関数、これら識別関数の識別正解率が記憶される。
続いて、音識別条件設定支援装置1は、記憶部18に記憶された識別正解率に基づき、記憶部18に記憶された複数の識別関数のうち、識別正解率が最も高い識別関数およびそれに対応するブロック数を選定し、これらを確定識別関数および確定ブロック数として記憶部18に記憶する。このようにして音識別条件設定支援装置1により選定・記憶された、確定識別関数および確定ブロック数は、採取音中の異音の有無を異音判定装置21(図13参照)により判定する際に用いられる。
ここで、音のスペクトログラムおよび強度分布のヒストグラムについて図4ないし図8を参照しながら説明する。図4は有異音サンプル音の波形の具体例を示す。図4において横軸が時間であり、縦軸が音の強さである。図5は、図4に示す有異音サンプル音のスペクトログラムを示している。図5において横軸が時間であり、縦軸が周波数であり、色が音の強さを示している。なお、図5においては、音の強さが黒と白の2段階で表されており、白よりも黒の方が音の強さが大きいことを示しているが、実際のスペクトログラムのグラフは、音の強さが多段階(例えば256段階)の色(例えば色の明度)の違いで表される。
図6は、図5中のブロックF1における音の強度分布のヒストグラムを示し、図7は、図5中のブロックF2における音の強度分布のヒストグラムを示し、図8は、図5中のブロックF3における音の強度分布のヒストグラムを示している。図6ないし図8のそれぞれにおいて、縦軸が度数/全度数であり、横軸が音の強さ(強度)である。ここで、有異音サンプル音と無異音サンプル音とは、両者の長さ(開始時点から終了時点までの時間)が互いに同じであり、有異音サンプル音または無異音サンプル音の長さ(例えば1時間)を所定の単位時間(例えば1秒)で割った値が「全度数」に相当する。また、有異音サンプル音または無異音サンプル音の開始時点から終了時点までの間において、上記所定の単位時間を単位にし、音の強さが同じ程度となった回数をカウントすることにより得られた値が「度数」に相当する。
図5に示す有異音サンプル音のスペクトログラムにおいて、ブロックF1では、有異音サンプル音の開始時点から終了時点までの間において、音の強さが大きい状態がほぼ連続している。このブロックF1における音の強度分布では、図6に示すように、度数/全度数がピークとなる音の強さがP1であり、分布がP1に集中し、分布の範囲が狭い。
また、図5に示す有異音サンプル音のスペクトログラムにおいて、ブロックF2では、有異音サンプル音の開始時点から終了時点までの間において、音の強さが小さい状態がほぼ連続している。このブロックF2における音の強度分布では、図7に示すように、度数/全度数がピークとなる音の強さがP2であり、P2はP1よりも小さい値である。また、ブロックF2における音の強度分布では、分布がP2に集中し、分布の範囲が狭い。
また、図5に示す有異音サンプル音のスペクトログラムにおいて、ブロックF3では、有異音サンプル音の開始時点から終了時点までの間において、音の強さが大きい状態と音の強さが小さい状態とが混在している。このブロックF3における音の強度分布では、図8に示すように、分布の範囲が比較的広い。
このように、有異音サンプル音のスペクトログラムにおけるブロックごとの強度分布のヒストグラムによれば、有異音サンプル音におけるブロックごとの音の強さの時間的変化を表すことができる。したがって、有異音サンプル音、無異音サンプル音、被判定音といった採取音のそれぞれにつき、スペクトログラムにおけるブロックごとの音の強度分布のヒストグラムを用いることにより、採取音および採取音に含まれる異音の周波数または音の強さの時間的変化を勘案しつつ、採取音中の異音の有無を高精度に識別可能な識別関数を生成することができる。
(音識別条件設定支援装置の構成)
図1に示すように、音識別条件設定支援装置1は演算処理部11を備え、演算処理部11は、音声データからスペクトログラムデータを生成するスペクトログラム生成部12と、スペクトログラムデータを複数のブロックに分割し、各ブロックにおける音の強度分布のヒストグラムデータを生成するヒストグラム生成部13と、各ブロックにおける音の強度分布のヒストグラムデータを用いて識別関数を生成する識別関数生成部14と、識別関数の識別正解率を算定する正解率算定部15と、識別正解率の最も高い識別関数およびそれに対応するブロック数を選定する識別条件選定部16と、スペクトログラムデータの所定の周波数範囲を複数のブロックに分割する際のブロック数(すなわち所定の周波数範囲の分割数)を設定または変更する処理、および音識別条件設定支援処理の流れの制御等を行う制御部17とを備えている。さらに、音識別条件設定支援装置1は、確定識別関数、確定ブロック数、および音識別条件設定支援処理中に保持すべき種々のデータを記憶する記憶部18と、有異音サンプル音または無異音サンプル音の音声データの入力、操作入力、処理の進捗状況等の表示等を行う入出力部19とを備えている。
このような構成を有する音識別条件設定支援装置1は、例えばパーソナルコンピュータにより実現することができる。具体的に述べると、演算処理部11は、パーソナルコンピュータに内蔵されたCPU(Central Processig Unit)により実現することができる。また、スペクトログラム生成部12、ヒストグラム生成部13、識別関数生成部14、正解率算定部15、識別条件選定部16、および制御部17は、パーソナルコンピュータを音識別条件設定支援装置1として機能させるためのコンピュータプログラムをCPUに読み込ませて実行させることにより実現することができる。また、記憶部18は、パーソナルコンピュータが有する記憶装置(例えばハードディスクドライブ装置、フラッシュメモリ等)により実現することができる。また、入出力部19は、パーソナルコンピュータが有する入出力装置(例えばキーボード、マウス、モニタ等)により実現することができる。
(音識別条件設定支援処理)
図2および図3は、音識別条件設定支援装置1により行われる音識別条件設定支援処理を示している。作業者は、処理の準備として、例えば、100個の有異音サンプル音A1〜A100の音声データと、100個の無異音サンプル音B1〜B100の音声データを用意する。
続いて、作業者は、音識別条件設定支援装置1の入出力部19を操作し、有異音サンプル音A1〜A100の音声データおよび無異音サンプル音B1〜B100の音声データを音識別条件設定支援装置1に入力する。なお、これら音声データを音識別条件設定支援装置1に入力する際には、音識別条件設定支援装置1が、有異音サンプル音A1〜A100および無異音サンプル音B1〜B100の音声データを1つ1つ識別可能となるようにすると共に、音声データが有異音サンプル音の音声データであるのか無異音サンプル音の音声データであるのかを識別可能となるようにする。これを実現する方法として、例えば、各音声データに、各音声データを識別するための識別情報、および各音声データが有異音サンプル音の音声データであるのか無異音サンプル音の音声データであるのかを示す分類情報を付す方法がある。この方法は例えば音声データのファイル名の付け方を工夫することで容易に実現することができる。
続いて、作業者は、音識別条件設定支援処理を開始する旨の指示を音識別条件設定支援装置1に入力する。これに応じ、音識別条件設定支援装置1は、図2および図3に示す音識別条件設定支援処理を開始する。
音識別条件設定支援処理において、図2に示すように、まず、スペクトログラム生成部12が、有異音サンプル音A1〜A100および無異音サンプル音B1〜B100の音声データのそれぞれについてスペクトログラムデータを生成し、生成した各スペクトログラムデータを記憶部18に記憶する(ステップS1)。
続いて、制御部17が、所定の規則に従い、スペクトログラムデータの上記所定の周波数範囲を複数のブロックに分割する際のブロック数を設定する(ステップS2)。例えば、本実施形態では、上記所定の規則として、ブロック数の最小値を20とし、最大値を80とし、初回に設定するブロック数を上記最小値とし、ブロック数の設定の変更を1回行うごとにブロック数を5増加させるといった規則を採用する。
ここで、図9はブロック数を20に設定し、採取音のスペクトログラムの所定の周波数範囲をブロックGに分割した状態を示し、図10はブロック数を30に設定し、採取音のスペクトログラムの所定の周波数範囲をブロックHに分割した状態を示している。図9および図10を見るとわかる通り、ブロック数が多くなると、各ブロックの幅(周波数範囲)が小さくなる。
続いて、図2に示すように、制御部17が、有異音サンプル音A1〜A100のスペクトログラムデータの中から、未選択のスペクトログラムデータをランダムに1つ選択し、当該スペクトログラムデータを記憶部18から読み出す(ステップS3)。続いて、制御部17は、有異音サンプル音A1〜A100のスペクトログラムデータの中からどの有異音サンプル音のスペクトログラムデータを選択したかを示す履歴情報を記憶部18に記憶する。この履歴情報は、制御部17がこの後にステップS3またはS10において未選択のスペクトログラムデータを特定するために用いられる。
続いて、ヒストグラム生成部13が、選択されたスペクトログラムデータの上記所定の周波数範囲を、ステップS2において設定されたブロック数のブロックに分割し、分割した各ブロックの強度分布のヒストグラムデータを生成し、生成した各ヒストグラムデータを記憶部18に記憶する(ステップS4)。
続いて、制御部17が、有異音サンプル音A1〜A100のスペクトログラムデータのうち例えば50個のスペクトログラムデータについてヒストグラムデータを生成する処理を終えたか否かを判断する(ステップS5)。有異音サンプル音A1〜A100のスペクトログラムデータのうち50個のスペクトログラムデータについてヒストグラムデータを生成する処理を終えていない場合(ステップS5:NO)、制御部17は処理をステップS3に戻す。
一方、有異音サンプル音A1〜A100のスペクトログラムデータのうち50個のスペクトログラムデータについてヒストグラムデータを生成する処理を終えた場合には(ステップS5:YES)、制御部17が、無異音サンプル音B1〜B100のスペクトログラムデータの中から、未選択のスペクトログラムデータをランダムに1つ選択し、当該スペクトログラムデータを記憶部18から読み出す(ステップS6)。続いて、制御部17は、無異音サンプル音B1〜B100のスペクトログラムデータの中からどの無異音サンプル音のスペクトログラムデータを選択したかを示す履歴情報を記憶部18に記憶する。この履歴情報は、制御部17がこの後のステップS6またはS15において未選択のスペクトログラムデータを特定するために用いられる。
続いて、ヒストグラム生成部13が、選択されたスペクトログラムデータの上記所定の周波数範囲を、ステップS2において設定されたブロック数のブロックに分割し、分割した各ブロックの強度分布のヒストグラムデータを生成し、生成した各ヒストグラムデータを記憶部18に記憶する(ステップS7)。
続いて、制御部17が、無異音サンプル音B1〜B100のスペクトログラムデータのうち例えば50個のスペクトログラムデータについてヒストグラムデータを生成する処理を終えたか否かを判断する(ステップS8)。無異音サンプル音B1〜B100のスペクトログラムデータのうち50個のスペクトログラムデータについてヒストグラムデータを生成する処理を終えていない場合(ステップS8:NO)、制御部17は処理をステップS6に戻す。
一方、無異音サンプル音B1〜B100のスペクトログラムデータのうち50個のスペクトログラムデータについてヒストグラムデータを生成する処理を終えた場合には(ステップS8:YES)、識別関数生成部14が、ステップS4で生成された50個の有異音サンプル音における各ブロックのヒストグラムデータと、ステップS7で生成された50個の無異音サンプル音における各ブロックのヒストグラムデータを記憶部18から読み出し、これらのヒストグラムデータを用い、識別関数を生成する(ステップS9)。識別関数の生成には、例えばサポートベクターマシン等の学習モデルを用いたパターン認識手法(例えば特開2005−352997号公報参照)を採用する。なお、ニューラルネットワーク等の他の学習モデルを識別関数の生成に採用してもよい。続いて、識別関数生成部14は、生成した識別関数を、それに対応するブロック数(例えば、現在設定されているブロック数を示す数値等の情報)と共に記憶部18に記憶する。
続いて、制御部17が、有異音サンプル音A1〜A100のスペクトログラムデータの中から、未選択のスペクトログラムデータをランダムに1つ選択し、当該スペクトログラムデータを記憶部18から読み出す(ステップS10)。続いて、制御部17は、有異音サンプル音A1〜A100のスペクトログラムデータの中からどの有異音サンプル音のスペクトログラムデータを選択したかを示す履歴情報を記憶部18に記憶する。この履歴情報は、制御部17がこの後のステップS3またはS10において未選択のスペクトログラムデータを特定するために用いられる。
続いて、ヒストグラム生成部13が、選択されたスペクトログラムデータの上記所定の周波数範囲を、ステップS2において設定されたブロック数のブロックに分割し、分割した各ブロックの強度分布のヒストグラムデータを生成し、生成した各ヒストグラムデータを記憶部18に記憶する(ステップS11)。
続いて、図3に示すように、正解率算定部15が、ステップS11で生成されたヒストグラムデータを、ステップS9で生成された識別関数に入力し、当該識別関数により有異音サンプル音中の異音の有無の識別を実行する(ステップS12)。
続いて、正解率算定部15は、当該識別関数による識別の正否を判定する(ステップS13)。ステップS13の判定では、当該識別関数による識別の結果が「異音あり」である場合に正解であり、そうでない場合には不正解である。続いて、正解率算定部15は、当該判定結果(例えば判定結果を示すフラグ等の情報)を判定結果情報として記憶部18に記憶する。
続いて、制御部17が、有異音サンプル音A1〜A100のスペクトログラムデータのうち例えば50個のスペクトログラムデータを用いて識別関数による識別を実行し、当該識別関数の実行結果を判定する処理を終えたか否かを判断する(ステップS14)。有異音サンプル音A1〜A100のスペクトログラムデータのうち50個のスペクトログラムデータを用いた識別関数による識別の実行とその結果の判定を終えていない場合には(ステップS14:NO)、制御部17は処理を図2中のステップS10に戻す。
一方、有異音サンプル音A1〜A100のスペクトログラムデータのうち50個のスペクトログラムデータを用いた識別関数による識別の実行とその結果の判定を終えた場合には(ステップS14:YES)、制御部17が、無異音サンプル音B1〜B100のスペクトログラムデータの中から、未選択のスペクトログラムデータをランダムに1つ選択し、当該スペクトログラムデータを記憶部18から読み出す(ステップS15)。続いて、制御部17は、無異音サンプル音B1〜B100のスペクトログラムデータの中からどの無異音サンプル音のスペクトログラムデータを選択したかを示す履歴情報を記憶部18に記憶する。この履歴情報は、制御部17がこの後のステップS6またはS15において未選択のスペクトログラムデータを特定するために用いられる。
続いて、ヒストグラム生成部13が、選択されたスペクトログラムデータの上記所定の周波数範囲を、ステップS2において設定されたブロック数のブロックに分割し、分割した各ブロックの強度分布のヒストグラムデータを生成し、生成した各ヒストグラムデータを記憶部18に記憶する(ステップS16)。
続いて、正解率算定部15が、ステップS16で生成されたヒストグラムデータを、ステップS9で生成された識別関数に入力し、当該識別関数により無異音サンプル音中の異音の有無の識別を実行する(ステップS17)。
続いて、正解率算定部15は、当該識別関数による識別の正否を判定する(ステップS18)。ステップS18の判定では、当該識別関数による識別の結果が「異音なし」である場合に正解であり、そうでない場合には不正解である。続いて、正解率算定部15は、当該判定結果を判定結果情報として記憶部18に記憶する。
続いて、制御部17が、無異音サンプル音B1〜B100のスペクトログラムデータのうち例えば50個のスペクトログラムデータを用いて識別関数による識別を実行し、当該識別関数による識別を判定する処理を終えたか否かを判断する(ステップS19)。無異音サンプル音B1〜B100のスペクトログラムデータのうち50個のスペクトログラムデータを用いた識別関数による識別の実行とその結果の判定を終えていない場合には(ステップS19:NO)、制御部17は処理をステップS15に戻す。
一方、無異音サンプル音B1〜B100のスペクトログラムデータのうち50個のスペクトログラムデータを用いた識別関数による識別の実行とその結果の判定を終えた場合には(ステップS19:YES)、制御部17は処理をステップS20へ移行させる。
以上のステップS3〜S19の処理により、有異音サンプル音A1〜A100のスペクトログラムデータの中からランダムに選択された半数のスペクトログラムデータと、無異音サンプル音B1〜B100のスペクトログラムデータの中からランダムに選択された半数のスペクトログラムデータを用いて識別関数が生成され、当該識別関数の実行結果の正否の判定が、有異音サンプル音A1〜A100のスペクトログラムデータのうちの残りの半数のスペクトログラムデータと、無異音サンプル音B1〜B100のスペクトログラムデータのうちの残りの半数のスペクトログラムデータを用いて行われたこととなる。
続いて、ステップS20において、制御部17が、識別関数の生成およびその実行結果の判定(ステップS3〜S19)を複数回(例えば200回)繰り返したか否かを判断する。識別関数の生成およびその実行結果の判定を200回繰り返していない場合には(ステップS20:NO)、制御部17は処理をステップS3に戻し、スペクトログラムデータのランダム選択を初めからやり直すために、スペクトログラムデータの選択の履歴を示す上記履歴情報をすべて消去(初期化)する。
一方、識別関数の生成およびその実行結果の判定を200回繰り返した場合には(ステップS20:YES)、制御部17は処理をステップS21に移行させる。
以上のステップS3〜S20の処理により、識別関数の生成に用いられる50個の有異音サンプル音の組合せ、および識別関数の生成に用いられる50個の無異音サンプル音の組合せがそれぞれ200通り生成され、これら200通りの組合せを用いて200個の識別関数が生成されたことになる。さらに、ステップS3〜S20の処理により、識別関数の実行結果の判定に用いられる50個の有異音サンプル音の組合せ、および識別関数の実行結果の判定に用いられる50個の無異音サンプル音の組合せがそれぞれ200通り生成され、これら200通りの組合せを用い、各識別関数につき識別結果の判定が行われたことになる。ステップS3〜S20を200回実行し終えたとき、記憶部18には、20000個の判定結果情報が記憶されている。このように、識別関数の生成およびその実行結果の判定を繰り返し行い、多数の判定結果情報を得ることで、後にステップS21で算定される識別正解率の信頼性を高めることができる。
続いて、ステップS21において、正解率算定部15が、ステップS3〜S20において得られた20000個の判定結果情報を用い、現在設定されている1つのブロック数により生成された識別関数につき、1つの識別正解率を算定し、算定した識別正解率を記憶部18に記憶する。
ここで、図11は、ステップS21における識別正解率の算定方法の一例を示している。図11において、「○」は、ステップS13またはS18における判定結果が正解であったことを示し、「×」は、ステップS13またはS18における判定結果が不正解であったことを示す。「−」は、そのサンプル音のスペクトログラムデータが識別関数の生成に用いられ、ステップS13またはS18における識別関数による識別の正否判定には用いられなかったことを示す。図11に示すように、ステップS21における識別正解率の算定処理において、まず、サンプル音A1〜A100およびB1〜B100の各スペクトログラムデータについて識別正解率を算定する。1つのスペクトログラムデータについての識別正解率は、当該スペクトログラムデータのヒストグラムデータを識別関数に入力して得られた識別結果において、正解の個数と不正解の個数とを合わせた値で、正解の個数を割ることにより求めることができる。次に、サンプル音A1〜A100およびB1〜B100のスペクトログラムデータの識別正解率の平均値を算定し、この平均値を、現在設定されている1つのブロック数により生成された識別関数の識別正解率として用いる。
続いて、図3に示すように、制御部17が、ブロック数のすべての設定についてステップS2〜S21の処理の実行を終えたか否かを判断する(ステップS22)。ブロック数のすべての設定についてステップS2〜S21の処理の実行を終えていない場合には(ステップS22:NO)、制御部17は処理を図2中のステップS2に戻す。そして、ステップS2において、制御部17が上記所定の規則に従ってブロック数を変更し、続いて、制御部17、ヒストグラム生成部13および正解率算定部15がステップS3〜S21の処理を実行する。
一方、ブロック数のすべての設定についてステップS2〜S21の処理の実行を終えた場合には(ステップS22:YES)、制御部17は処理をステップS23に移行させる。上述したブロック数の設定についての所定の規則によれば、ブロック数の設定は全部で13通りであるので、ブロック数が変更されながらステップS2〜S21の処理が13回繰り返され、この結果、13通りのブロック数により生成された識別関数の識別正解率が算定される。13通りのブロック数の設定についてステップS2〜S21の処理の実行を終えたとき、記憶部18には、13通りにブロック数にそれぞれ対応する13個の識別正解率が記憶されている。
ここで、図12は、上記所定の規則に従って設定されたブロック数にそれぞれ対応する識別関数の識別正解率の例を示している。図12によれば、ブロック数が50の識別正解率が97%で最も高い。
続いて、図3中のステップS23において、識別条件選定部16が、記憶部18に記憶された複数の識別正解率を読み出し、それらの中から最も高い識別正解率を特定する。続いて、識別条件選定部16は、特定した識別正解率を有する識別関数に対応するブロック数を選定し、選定したブロック数を確定ブロック数として記憶部18に記憶する。
続いて、識別関数生成部14が、確定ブロック数として記憶されたブロック数の設定の下で生成された、有異音サンプル音A1〜A100および無異音サンプル音B1〜B100のすべてのスペクトログラムデータにおけるすべてのヒストグラムデータを用い、改めて識別関数を生成し、生成した識別関数を確定識別関数として記憶部18に記憶する(ステップS24)。上記確定ブロック数および確定識別関数は、後述する異音判定装置21による異音判定処理に用いられる。
以上説明した通り、本発明の実施形態による音識別条件設定支援装置1によれば、採取音中の異音の有無を高精度に識別することができる識別関数を迅速かつ容易に少ない作業負担で生成することができる。すなわち、音識別条件設定支援装置1による識別関数の生成は、音声データを入力しさえすれば自動的に行われるので、識別関数を生成する作業、すなわち異音の特徴抽出に相当する作業を、コンピュータのモニタに表示された採取音のスペクトログラムを見ながら異音の特徴を見出すといった従来の特徴抽出作業と比較し、大幅に簡単化することができる。したがって、作業時間を短縮することができ、また、作業者の負担を軽減することができる。また、サンプル音を用意すれば、音識別条件設定支援装置1により識別関数を自動的に生成することができるので、作業者の経験の多少を問わず、高精度な識別能力を有する識別関数を生成することができる。
なお、上述した実施形態における音識別条件設定支援処理では、識別関数の生成および識別関数の識別結果の判定(ステップS3〜S20)を例えば200回繰り返す場合を例にあげたが、本発明はこれに限らず、識別関数の生成および識別関数の識別結果の判定を1回ないし199回、または201回以上行うこととしてもよい。
また、上述した実施形態における音識別条件設定支援処理では、確定ブロック数を選定した後、確定ブロック数として選定されたブロック数の設定の下で生成された、有異音サンプル音A1〜A100および無異音サンプル音B1〜B100のすべてのスペクトログラムデータにおけるすべてのヒストグラムデータを用いて改めて識別関数を生成し、当該生成した識別関数を確定識別関数として選定する場合(図3中のステップS24)を例にあげたが、本発明はこれに限らず、確定ブロック数として選定されたブロック数の設定の下で図2中のステップS9において生成された識別関数を確定識別関数として選定してもよい。
また、上述した実施形態における音識別条件設定支援処理では、識別関数の生成に用いるサンプル音のスペクトログラムデータおよび識別関数の識別結果の判定に用いるサンプル音のスペクトログラムデータをそれぞれランダムに選択する場合を例にあげたが、本発明はこれに限らない。例えば、音識別条件設定支援処理を始める前に、作業者が、採取した複数のサンプル音を、識別関数の生成に用いるサンプル音と、識別関数による識別結果の判定に用いるサンプル音に分類し、音識別条件設定支援装置1は、このような作業者の分類に従い、識別関数の生成に用いるサンプル音のスペクトログラムデータおよび識別関数の識別結果の判定に用いるサンプル音のスペクトログラムデータをそれぞれ選択するようにしてもよい。
(異音判定装置の構成)
図13は、本発明の実施形態による音識別条件設定支援装置1によって生成された確定識別関数および確定ブロック数を用いて採取音中の異音の有無を判定する異音判定装置を示している。図13において、異音判定装置21は演算処理部30を備え、演算処理部30は、音声データからスペクトログラムデータを生成するスペクトログラム生成部31と、スペクトログラムデータを複数のブロックに分割し、各ブロックにおける音の強度分布のヒストグラムデータを生成するヒストグラム生成部32と、各ブロックにおけるヒストグラムデータを識別関数に入力し、異音の有無の識別を行う異音識別部33と、異音判定処理の流れの制御等を行う制御部34とを備えている。さらに、異音判定装置21は、異音判定処理中に保持すべき種々のデータを記憶する記憶部35と、被判定音の音声データの入力、操作入力、処理結果の表示等を行う入出力部36とを備えている。
異音判定装置21は例えばパーソナルコンピュータにより実現することができる。具体的には、演算処理部30は、パーソナルコンピュータに内蔵されたCPUにより実現することができる。また、スペクトログラム生成部31、ヒストグラム生成部32、異音識別部33、および制御部34は、CPUにコンピュータプログラムを読み込ませて実行することにより実現することができる。また、記憶部35は、パーソナルコンピュータが有するハードディスクドライブ装置等の記憶装置により実現することができる。また、入出力部36は、パーソナルコンピュータが有するキーボード、モニタ等の入出力装置により実現することができる。なお、音識別条件設定支援装置1と異音判定装置21とを1台のパーソナルコンピュータで同時に動作させるようにしてもよい。
(異音判定処理)
図14は異音判定装置21による異音判定処理を示している。異音判定装置21は、例えば送電線または機器等に近い場所で採取した比較的長時間(例えば24時間)に及ぶ採取音につき、異音の有無を判定することができる。この異音判定の対象となる採取音の全体を被判定音という。また、異音判定装置21による異音判定処理では、被判定音の音声データを比較的短時間(例えば1時間)のいくつかのセクションに分け、セクションごとに異音の有無の識別を行う。
異音判定処理の準備として、作業者は、音識別条件設定支援装置1により生成された確定識別関数および確定ブロック数を異音判定装置21に入力し、これらを異音判定装置21の記憶部35に記憶させる。また、作業者は、被判定音の音声データを異音判定装置21に入力し、これを異音判定装置21の記憶部35に記憶させる。続いて、作業者が異音判定処理を開始する旨の指示を異音判定装置21に入力すると、異音判定装置21は異音判定処理を開始する。
図14に示すように、異音判定処理において、まず、制御部34が、確定識別関数および確定ブロック数を記憶部35から読み出す(ステップS31)。
続いて、制御部34は、被判定音の音声データにおいて、異音の有無の識別をまだ実行していないセクションのうちの先頭のセクション(被判定音の音声データの開始時点に最も近いセクション)に対応する音声データを抽出する(ステップS32)。
続いて、スペクトログラム生成部31が、ステップS32で抽出した音声データのスペクトログラムデータを生成する(ステップS33)。
続いて、ヒストグラム生成部32が、ステップS33で生成したスペクトログラムデータにつき、所定の周波数範囲を確定ブロック数のブロックに分割し、各ブロックにつき、音の強度分布のヒストグラムデータを生成する(ステップS34)。
続いて、異音識別部33が、各ブロックのヒストグラムデータを確定識別関数に入力し、異音の有無の識別を実行し、その識別結果を記憶部35に記憶する(ステップS35)。
続いて、制御部34が、被判定音の音声データのすべてのセクションにつき、異音の有無の識別を実行し終えたか否かを判断する(ステップS36)。被判定音の音声データのすべてのセクションにつき異音の有無の識別を実行し終えていない場合には(ステップS36:NO)、ステップS32に戻り、制御部34が、次のセクションに対応する音声データを被判定音の音声データから抽出し、スペクトログラム生成部31、ヒストグラム生成部32および異音識別部33がステップS33〜S35の処理を実行する。
一方、被判定音の音声データのすべてのセクションにつき異音の有無の識別を実行し終えた場合には(ステップS36:YES)、制御部34が、被判定音についての異音の有無の識別結果をセクションごとにモニタ等に表示する(ステップS37)。作業者はモニタを見ることにより、被判定音中の異音の有無を即座に把握することができる。また、被判定音中の異音の有無をセクションごとに把握することができるので、被判定音として用いる採取音が比較的長時間に及び、かつその中に含まれる異音が比較的短時間である場合でも、当該採取音中の異音を迅速に発見することができる。
なお、本発明は、請求の範囲および明細書全体から読み取ることのできる発明の要旨または思想に反しない範囲で適宜変更可能であり、そのような変更を伴う音識別条件設定支援装置および音識別条件設定支援方法もまた本発明の技術思想に含まれる。
1 音識別条件設定支援装置
11 演算処理部
12 スペクトログラム生成部
13 ヒストグラム生成部
14 識別関数生成部
15 正解率算定部
16 識別条件選定部
17 制御部
18 記憶部
19 入出力部
21 異音判定装置
30 演算処理部
31 スペクトログラム生成部
32 ヒストグラム生成部
33 異音識別部
34 制御部
35 記憶部
36 入出力部

Claims (4)

  1. 異音の有無を識別するための識別条件の設定を支援する音識別条件設定支援装置であって、
    異音を含む複数の有異音サンプル音および異音を含まない複数の無異音サンプル音のスペクトログラムをそれぞれ示すスペクトログラムデータを受け取り、当該各スペクトログラムデータにおける所定の周波数範囲を複数のブロックに分割し、当該各ブロックにおける音の強度分布のヒストグラムを示すヒストグラムデータを生成するヒストグラム生成部と、
    前記複数の有異音サンプル音のうちのいくつかの有異音サンプル音についての各ブロックのヒストグラムデータ、および前記複数の無異音サンプル音のうちのいくつかの無異音サンプル音についての各ブロックのヒストグラムデータを用い、異音の有無を識別するための識別関数を生成する識別関数生成部と、
    前記複数の有異音サンプル音のうちの他のいくつかの有異音サンプル音についての各ブロックのヒストグラムデータ、および前記複数の無異音サンプル音のうちの他のいくつかの無異音サンプル音についての各ブロックのヒストグラムデータを前記識別関数に入力して異音の有無の識別を実行し、前記識別関数が異音の有無を正しく識別する確率である識別正解率を算定する正解率算定部とを備えていることを特徴とする音識別条件設定支援装置。
  2. 前記各スペクトログラムデータにおける所定の周波数範囲を複数のブロックに分割する際のブロック数の設定を変更しつつ、前記ヒストグラム生成部、前記識別関数生成部および前記正解率算定部による処理を複数回実行し、当該処理を複数回実行した結果、前記識別関数生成部により生成された複数の識別関数のうち前記識別正解率が最も高い識別関数および当該識別関数を生成する際に設定された前記ブロック数を前記識別条件として選定する識別条件選定部とを備えていることを特徴とする請求項1に記載の音識別条件設定支援装置。
  3. 前記有異音サンプル音または前記無異音サンプル音のスペクトログラムを示すスペクトログラムデータを生成するスペクトログラム生成部を備えていることを特徴とする請求項1または2に記載の音識別条件設定支援装置。
  4. 異音の有無を識別するための識別条件の設定を支援する音識別条件設定支援方法であって、
    異音を含む複数の有異音サンプル音および異音を含まない複数の無異音サンプル音のスペクトログラムをそれぞれ示すスペクトログラムデータのそれぞれにつき、当該スペクトログラムデータにおける所定の周波数範囲を複数のブロックに分割し、当該各ブロックにおける音の強度分布のヒストグラムを示すヒストグラムデータを生成するヒストグラム生成工程と、
    前記複数の有異音サンプル音のうちのいくつかの有異音サンプル音についての各ブロックのヒストグラムデータ、および前記複数の無異音サンプル音のうちのいくつかの無異音サンプル音についての各ブロックのヒストグラムデータを用い、異音の有無を識別するための識別関数を生成する識別関数生成工程と、
    前記複数の有異音サンプル音のうちの他のいくつかの有異音サンプル音についての各ブロックのヒストグラムデータ、および前記複数の無異音サンプル音のうちの他のいくつかの無異音サンプル音についての各ブロックのヒストグラムデータを前記識別関数に入力して異音の有無の識別を実行し、前記識別関数が異音の有無を正しく識別する確率である識別正解率を算定する正解率算定工程とを備え、
    前記各スペクトログラムデータにおける所定の周波数範囲を複数のブロックに分割する際のブロック数の設定を変更しつつ、前記ヒストグラム生成工程、前記識別関数生成工程および前記正解率算定工程を複数回実行し、これらの工程を複数回実行した結果、前記識別関数生成工程において生成された複数の識別関数のうち前記識別正解率が最も高い識別関数および当該識別関数を生成する際に設定された前記ブロック数を前記識別条件として選定することを特徴とする音識別条件設定支援方法。
JP2014053464A 2014-03-17 2014-03-17 音識別条件設定支援装置および音識別条件設定支援方法 Active JP5937125B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014053464A JP5937125B2 (ja) 2014-03-17 2014-03-17 音識別条件設定支援装置および音識別条件設定支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014053464A JP5937125B2 (ja) 2014-03-17 2014-03-17 音識別条件設定支援装置および音識別条件設定支援方法

Publications (2)

Publication Number Publication Date
JP2015175770A true JP2015175770A (ja) 2015-10-05
JP5937125B2 JP5937125B2 (ja) 2016-06-22

Family

ID=54255076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014053464A Active JP5937125B2 (ja) 2014-03-17 2014-03-17 音識別条件設定支援装置および音識別条件設定支援方法

Country Status (1)

Country Link
JP (1) JP5937125B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107086039A (zh) * 2017-05-25 2017-08-22 北京小鱼在家科技有限公司 一种音频信号处理方法及装置
JP2018205292A (ja) * 2017-06-05 2018-12-27 瀏陽 宋 時間領域・周波数領域のヒストグラムの特徴解析による状態識別法
CN112700793A (zh) * 2020-12-24 2021-04-23 国网福建省电力有限公司 一种水轮机故障碰撞的识别方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08278191A (ja) * 1995-04-06 1996-10-22 Nissan Motor Co Ltd 機械作動音の異常判定方法
JP2008008708A (ja) * 2006-06-28 2008-01-17 Omron Corp 判定知識作成装置、判定知識作成方法、プログラムおよび記録媒体
JP2008065393A (ja) * 2006-09-04 2008-03-21 Research Organization Of Information & Systems グループ判別装置及びグループ判別方法
JP2011154130A (ja) * 2010-01-26 2011-08-11 Kanazawa Univ 音声識別装置及びこれを用いた音声識別システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08278191A (ja) * 1995-04-06 1996-10-22 Nissan Motor Co Ltd 機械作動音の異常判定方法
JP2008008708A (ja) * 2006-06-28 2008-01-17 Omron Corp 判定知識作成装置、判定知識作成方法、プログラムおよび記録媒体
JP2008065393A (ja) * 2006-09-04 2008-03-21 Research Organization Of Information & Systems グループ判別装置及びグループ判別方法
JP2011154130A (ja) * 2010-01-26 2011-08-11 Kanazawa Univ 音声識別装置及びこれを用いた音声識別システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107086039A (zh) * 2017-05-25 2017-08-22 北京小鱼在家科技有限公司 一种音频信号处理方法及装置
CN107086039B (zh) * 2017-05-25 2021-02-09 北京小鱼在家科技有限公司 一种音频信号处理方法及装置
JP2018205292A (ja) * 2017-06-05 2018-12-27 瀏陽 宋 時間領域・周波数領域のヒストグラムの特徴解析による状態識別法
CN112700793A (zh) * 2020-12-24 2021-04-23 国网福建省电力有限公司 一种水轮机故障碰撞的识别方法及系统

Also Published As

Publication number Publication date
JP5937125B2 (ja) 2016-06-22

Similar Documents

Publication Publication Date Title
US8865993B2 (en) Musical composition processing system for processing musical composition for energy level and related methods
JP2011242775A (ja) 音声認識エラー予測値としての文法適合度評価のための方法およびシステム
CN108764114B (zh) 一种信号识别方法及其设备、存储介质、终端
US11688372B2 (en) Beat decomposition to facilitate automatic video editing
JP5937125B2 (ja) 音識別条件設定支援装置および音識別条件設定支援方法
EP3567586B1 (en) Voice interaction system, voice interaction method, and program
CN110634490B (zh) 一种声纹鉴定方法、装置和设备
CN111052749A (zh) 用于计量对话的机制和工具
JP4587854B2 (ja) 感情解析装置、感情解析プログラム、プログラム格納媒体
CN108091323A (zh) 用于自语音中识别情感的方法与装置
Moro-Velázquez et al. Voice pathology detection using modulation spectrum-optimized metrics
CN110111778B (zh) 一种语音处理方法、装置、存储介质及电子设备
JP5937126B2 (ja) 音識別条件設定支援装置および音識別条件設定支援方法
CN110390160B (zh) 一种时序信号的周期检测方法、装置及相关设备
JP5937127B2 (ja) 音識別条件設定支援装置および音識別条件設定支援方法
JP2013250155A (ja) 発音判定装置、発音判定方法、及びプログラム
JP5579884B2 (ja) 音識別条件選定装置および異音判定装置
JP6589040B1 (ja) 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム
CN111148005A (zh) 一种检测mic顺序的方法及装置
US20150364146A1 (en) Method for Providing Visual Feedback for Vowel Quality
CN107340054A (zh) 一种测试声学产品杂音的方法和装置
CN112352279B (zh) 便于自动视频编辑的节拍分解
EP2560357A1 (en) Analysis of calls recorded at a call centre for selecting calls for agent evaluation
JP2019148849A (ja) 理解度判定システムおよび理解度判定プログラム
JP7089648B2 (ja) 生体音解析装置、プログラム、及び生体音解析方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160511

R150 Certificate of patent or registration of utility model

Ref document number: 5937125

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250