JP2021195916A - 機械学習システム - Google Patents

機械学習システム Download PDF

Info

Publication number
JP2021195916A
JP2021195916A JP2020103447A JP2020103447A JP2021195916A JP 2021195916 A JP2021195916 A JP 2021195916A JP 2020103447 A JP2020103447 A JP 2020103447A JP 2020103447 A JP2020103447 A JP 2020103447A JP 2021195916 A JP2021195916 A JP 2021195916A
Authority
JP
Japan
Prior art keywords
machine
sound
data
vibration
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020103447A
Other languages
English (en)
Inventor
無限 太古
Mugen Tako
敏光 東
Toshimitsu Azuma
和浩 後藤
Kazuhiro Goto
雅志 佐野
Masashi Sano
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daihatsu Motor Co Ltd
Original Assignee
Daihatsu Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daihatsu Motor Co Ltd filed Critical Daihatsu Motor Co Ltd
Priority to JP2020103447A priority Critical patent/JP2021195916A/ja
Publication of JP2021195916A publication Critical patent/JP2021195916A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Combined Controls Of Internal Combustion Engines (AREA)

Abstract

【課題】学習済みモデルを生成するために必要な学習データを効率よく集積する。【解決手段】機械を運転しているときに発せられる音若しくは振動を基に生成される信号データを入力とし、そのときに同機械で特定の事象が発生しているか否かまたはその事象の強度のレベルを出力とする学習済みモデルに用いられる学習データを生成するためのものであって、機械から発せられた音若しくは振動を基に信号データを生成し、そのときに機械で特定の事象が発生していたか否かまたは発生した事象の強度のレベルを示すラベルと組にした学習データを生成するとともに、同じ音若しくは振動のうちの少なくとも一部分を逆再生したものを基に信号データを生成し、同じラベルと組にした別の学習データを生成するデータ生成部102と、データ生成部102が生成した学習データを記憶する学習データ記憶部103とを具備する機械学習システムを構成した。【選択図】図3

Description

本発明は、機械を運転しているときに特定の事象が発生しているか否か、または発生している特定の事象の強度のレベルを自動判定する人工知能を実現する機械学習システムに関する。
車両等に搭載される内燃機関の運転中には、ノッキングに代表される異常燃焼が発生し得る。異常燃焼は、ユーザに知覚されてユーザに不快感や不安感を与える。加えて、ヘビーノックと呼称される強度のノッキングが惹起されると、内燃機関がダメージを受ける懸念もある。
そこで、従来より、開発過程において、様々な運転領域(エンジン回転数やエンジン負荷率等)の下で内燃機関を試運転し、どのような条件下で異常燃焼が発生するか、またその強度を確認した上、異常燃焼が起こらないように制御パラメータを決定する適合を実施している。火花点火式内燃機関であれば、各運転領域毎に、異常燃焼を起こさずに済む点火タイミングや吸気/排気バルブタイミング等の設定を行っている。
内燃機関における異常燃焼の発生の有無またはその強度の確認は、基本的には官能試験に頼っている。即ち、内燃機関の運転中に内燃機関から発せられる音若しくは振動を人が知覚し、それに基づいて異常燃焼が発生しているか否か、または異常燃焼の強度のレベルを人が判定している(例えば、下記特許文献を参照)。
内燃機関の運転制御パラメータのマップを作成するためには、膨大な運転点について異常燃焼の発生の有無や強度を調査する必要がある。つまり、膨大な運転点について、都度人が音若しくは振動を耳で聞き分け、異常燃焼に関する判断を下し、かつその結果を逐一手入力しなければならない。これには莫大な労力がかかり、短期開発を実現する上でのボトルネックになっている。
しかも、音若しくは振動を知覚して異常燃焼の発生の有無や強度を判定する官能試験は、極めて属人的な職人芸であり、そのための人材の育成にもコストと時間を要することになる。
特開2016−164405号公報
近時、ニューラルネットワークとディープラーニング(深層学習)を組み合わせた人工知能技術が発展を見ており、これを様々な分野で活用することが試みられている。
機械の運転中に特定の事象(例えば、内燃機関におけるノッキング等の異常燃焼)が発生しているか否か、またはその特定の事象の強度のレベルを自動判定する人工知能を実現したいならば、機械から発せられる音若しくは振動を基に生成される信号データを入力とし、同機械で特定の事象が発生しているか否かまたは発生している特定の事象の強度のレベルを出力とする学習済みモデルを生成すればよい。
学習済みモデルによる自動判定の精度を高めるためには、その学習に用いられる学習データを大量に用意することが要求される。学習データは、実際に測定した音若しくは振動を基にした信号データと、それを測定したときの特定の事象の発生の有無または発生した事象の強度を示すラベルとの組である。後者のラベルは、人の手によって付されることになる。従って、大量の学習データを用意することは、大量の労力及び手間を費やすことと同義である。
本発明は、学習済みモデルを生成するために用いられる学習データを効率よく集積することを所期の目的としている。
本発明では、機械を運転しているときに機械から発せられる音若しくは振動を基に生成される信号データを入力とし、そのときに同機械で特定の事象が発生しているか否かまたは発生している特定の事象の強度のレベルを出力とする学習済みモデルを生成するために用いられる学習データを生成するためのものであって、機械を運転しているときに機械から発せられた音若しくは振動を基に信号データを生成し、そのときに機械で特定の事象が発生していたか否かまたは発生した特定の事象の強度のレベルを示すラベルと組にした学習データを生成するとともに、同じ音若しくは振動のうちの少なくとも一部分を逆再生したものを基に信号データを生成し、同じラベルと組にした別の学習データを生成するデータ生成部と、前記データ生成部が生成した学習データを記憶する学習データ記憶部とを具備する機械学習システムを構成した。
また、本発明では、機械を運転しているときに機械から発せられる音若しくは振動を基に生成される信号データを入力とし、そのときに同機械で特定の事象が発生しているか否かまたは発生している特定の事象の強度のレベルを出力とする学習済みモデルを生成するために用いられる学習データを生成するためのものであって、機械を運転しているときに機械から発せられた音若しくは振動を基に信号データを生成し、そのときに機械で特定の事象が発生していたか否かまたは発生した特定の事象の強度のレベルを示すラベルと組にした学習データを生成するとともに、同じ音若しくは振動を複数の区分に分割しそれら区分の順序を並べ替えたものを基に信号データを生成し、同じラベルと組にした別の学習データを生成するデータ生成部と、
前記データ生成部が生成した学習データを記憶する学習データ記憶部とを具備する機械学習システムを構成した。
並びに、本発明では、機械を運転しているときに機械から発せられる音若しくは振動を基に生成される信号データを入力とし、そのときに同機械で特定の事象が発生しているか否かまたは発生している特定の事象の強度のレベルを出力とする学習済みモデルを生成するために用いられる学習データを生成するためのものであって、機械を運転しているときに機械から発せられた音若しくは振動を基に信号データを生成し、そのときに機械で特定の事象が発生していたか否かまたは発生した特定の事象の強度のレベルを示すラベルと組にした学習データを生成するとともに、同じ音若しくは振動のうちの少なくとも一部を複製することで延長したものを基に信号データを生成し、同じラベルと組にした別の学習データを生成するデータ生成部と、前記データ生成部が生成した学習データを記憶する学習データ記憶部とを具備する機械学習システムを構成した。
本発明によれば、機械を運転しているときに機械から発せられる音若しくは振動を基に生成される信号データを入力とし、そのときに同機械で特定の事象が発生しているか否かまたは発生している特定の事象の強度のレベルを出力とする学習済みモデルを生成するために用いられる学習データを、効率よく集積することが可能となる。
本発明の一実施形態の機械学習システムが生成するべき学習済みモデルの概念を示す図。 同実施形態の機械学習システムが備えるハードウェア資源を示す図。 同実施形態の機械学習システムの機能ブロック図。 同実施形態の機械学習システムがプログラムに従い実行する処理の手順例を示すフロー図。 同実施形態の機械学習システムが取得する音若しくは振動の信号を例示する図。 同実施形態の機械学習システムが取得した音若しくは振動から増殖させた仮想の信号を例示する図。 同実施形態の機械学習システムが取得した音若しくは振動から増殖させた仮想の信号を例示する図。 同実施形態の機械学習システムが取得した音若しくは振動から増殖させた仮想の信号を例示する図。 同実施形態の機械学習システムが取得した音若しくは振動から増殖させた仮想の信号を例示する図。 同実施形態の機械学習システムが取得した音若しくは振動から増殖させた仮想の信号を例示する図。 同実施形態の機械学習システムが取得した音若しくは振動から増殖させた仮想の信号を例示する図。 同実施形態の機械学習システムが取得した音若しくは振動から増殖させた仮想の信号を例示する図。 同実施形態の機械学習システムが用いるメルフィルタバンクを例示する図。 同実施形態の機械学習システムが生成する信号データの要素である対数メルスペクトラムを例示する図。
本発明の一実施形態を、図面を参照して説明する。本実施形態の機械学習システムは、機械を運転しているときに特定の事象が発生したか否か、または発生した特定の事象の強度のレベルを自動判定する人工知能を実現することを企図したものである。典型的には、運転中の機械から発せられる音若しくは振動に基づく、人が(特に、聴覚を介して)知覚可能な特定の事象の発生の有無及び/またはその強度のレベルの判断を、人工知能に代理させようとしている。
本実施形態では、機械学習により生成した学習済みモデルを用いて、内燃機関を運転するときに発生し得るノッキング等の異常燃焼を自動判定することを想定している。図1に示すように、生成したい学習済みモデルは、機械即ち内燃機関から発せられる音または信号を基に生成した信号データが入力層に入力されたときに、その入力が中間層(隠れ層)を経て出力層に至り、特定の事象即ち異常燃焼の発生の有無またはその強度のレベルが出力されるニューラルネットワーク(または、深層学習型人工知能)である。
そして、上記のモデルの学習に用いる教師あり学習データは、実際に測定した音若しくは振動を基に生成した信号データと、それを測定したときに異常燃焼が発生していたか否かまたは異常燃焼の強度のレベルを示すラベルとの組である。
本実施形態の機械学習システムは、コンピュータ1、例えば汎用的なパーソナルコンピュータやワークステーション等を主体として構成する。図2に示すように、コンピュータ1は、プロセッサ(CPU(Central Processing Unit)11、GPU(Graphics Processing Unit)14)、メインメモリ12、補助記憶デバイス13、ディスプレイ15、通信インタフェース16、操作入力デバイス17、マイク18、スピーカ19等のハードウェア資源を備え、これらが連携動作するものである。
補助記憶デバイス83は、フラッシュメモリ、ハードディスクドライブ、光学ディスクドライブ等である。GPU14は、CPU11より受けた描画指示をもとに表示させるべき画面を生成しその画面信号をディスプレイ15に向けて送出するもので、これには画面や画像のデータを一時的に格納しておくビデオメモリが付随する。なお、GPU14の演算処理能力が、機械学習における学習済みモデルの学習や、学習済みモデルを用いた自動判定の処理に援用されることがある。通信インタフェース16は、コンピュータ1が外部のコンピュータその他の装置と情報通信を行うためのデバイスであり、有線接続インタフェースまたは無線トランシーバを含む。操作入力デバイス17は、人が手指で操作するキーボード、押下ボタン、ジョイスティック、マウスやタッチパネル(ディスプレイ15に重ね合わされたものであることがある)といったポインティングデバイス、その他である。
プロセッサ11、14により実行されるべきプログラムは補助記憶デバイス13に格納されており、プログラムの実行の際には補助記憶デバイス13からメインメモリ12に読み込まれ、プロセッサ11、14によって解読される。コンピュータ1は、プログラムに従いハードウェア資源を作動させて、図3に示す信号取得部101、データ生成部102、学習データ記憶部103及び学習部104としての機能を発揮する。
図4に、本実施形態の機械学習システムが教師あり学習データを収集する際に実行する処理の手順例を示す。はじめに、信号取得部101の機能として、内燃機関の運転中に内燃機関から発せられた音若しくは振動をマイク18を介して集音し、これをA/D変換即ちサンプリングして、音若しくは振動の振幅即ち音圧の大きさの時系列を得る(ステップS1)。これが、音若しくは振動の信号の大本のデータとなる。
並びに、マイク18を介して集音した音若しくは振動をスピーカ19を介して音声出力して人(内燃機関から発せられる音若しくは振動を知覚して異常燃焼の有無や強度を精確に判定する能力を有する熟練した人)に聞かせ、または内燃機関から発せられた音若しくは振動を直接人に聞かせて、そのときに内燃機関で異常燃焼が生じていたか否か、また異常燃焼が生じた場合におけるその強度のレベルを当該人に判断させる。その上で、当該人が判断した、異常燃焼の発生の有無または強度のレベルの結果を、操作入力デバイス17を介して入力させる。機械学習システムは、その入力を受け付けて、これを教師あり学習データの要素となるラベルとして得る(ステップS2)。
ステップS1及びS2を通じて、学習データの基本的な枠組み、即ち[採取した音若しくは振動の信号(入力に対応),その採取時に内燃機関で異常燃焼が生じていたか否かまたは異常燃焼の強度のレベル(音若しくは振動の信号に付与するラベル、出力に対応)]の一つの組が成立する。機械学習システムは、これをメインメモリ12または補助記憶デバイス13に一時的に記憶保持する。
次いで、データ生成部102の機能として、ステップS1にて採取した音若しくは振動の信号のデータから、ステップS2にて取得したラベルと同一のラベルを付すことができる仮想的な一または複数の信号のデータを生成する(ステップS3)。
図5ないし図12に、ステップS3の処理の内容を示す。図5は、ステップS1にて実際に測定した音若しくは振動の信号である。ステップS3では、例えば、図6に示すように、この実測の信号を時間軸を遡るように逆再生するような信号のデータを作成する。逆再生データは、音若しくは振動の振幅の値の時系列を逆順序に並べることで構成できる。
そして、人の聴覚には、図6に示すような逆再生の音若しくは振動と、図5に示すような正再生の音若しくは振動とが、同様のものに知覚される。つまり、正再生の音若しくは振動を聞いた人が異常燃焼が生じていると判定するとき、その逆再生を聞いた同人はやはり異常燃焼が生じていると判定する。正再生の音若しくは振動を聞いた人が異常燃焼は生じていないと判定するときには、その逆再生を聞いた同人もまた異常燃焼が生じていないと判定する。正再生の音若しくは振動から人が判断する異常燃焼の強度と、逆再生の音若しくは振動から人が判断する異常燃焼の強度との間に、大きな乖離は生じない。
このことを利用して、本実施形態の機械学習システムは、実測した音若しくは振動の信号の逆再生の信号のデータを生成し、そのデータに対しても正再生の信号のデータに対して付与されたラベルと同じラベルを付与する。これにより、内燃機関から発せられる音若しくは振動を測定する作業、並びに人がその音若しくは振動を聞いて異常燃焼の有無または強度を判定する作業を一度行うだけで、複数の学習データの組[音若しくは振動の信号,異常燃焼が生じていたか否かまたは異常燃焼の強度のレベル]を獲得することが可能となる。
さらに、ステップS3にて、図7ないし図9に示すように、実測の信号を複数の区分TA、TBに分割し、それら区分TA、TBのうちの一部または全部を逆再生の信号に置換したデータを生成することもできる。図7に示す例は、前半の区分TA及び後半の区分TBの各々を逆再生の信号としたものであり(区分TAと区分TBとの順序が保たれている点で、図6に例示した純粋な逆再生とは異なる)、図8に示す例は、後半の区分TBのみを逆再生の信号としたものであり、図9に示す例は、前半の区分TAのみを逆再生の信号としたものである。
上述のように一部分を逆再生とした音若しくは振動もまた、人の聴覚には、図5に示すような実測の正再生の音若しくは振動と同様に知覚される。従って、本実施形態の機械学習システムは、図7ないし図9に示すような信号のデータに、図5に示す実測の信号のデータに対して付与されたラベルと同じラベルを付与する。
加えて、ステップS3にて、図10ないし図12に示すように、実測の信号を複数の区分TA、TBに分割し、それら区分TA、TBの順序を並べ替えたデータを生成することもできる。図10に示す例は、前半の区分TAと後半の区分TBとを入れ替えたものであり(区分TA及び区分TBの信号の再生方向が何れも順方向である点で、図6に例示した逆再生とは異なる)、図11に示す例は、前半の区分TAと後半の区分TBとを入れ替えた上で区分TBを逆再生の信号としたものであり、図12に示す例は、前半の区分TAと後半の区分TBとを入れ替えた上で区分TAを逆再生の信号としたものである。
上述のように区分の順序を並べ替えた音若しくは振動もまた、人の聴覚には、図5に示すような実測の正再生の音若しくは振動と同様に知覚される。従って、本実施形態の機械学習システムは、図10ないし図12に示すような信号のデータに、図5に示す実測の信号のデータに対して付与されたラベルと同じラベルを付与する。
図5ないし図12に示している例を総括すると、一度の測定、並びに人による一度の判定作業を通じて、八つの学習データの組[音若しくは振動の信号,異常燃焼が生じていたか否かまたは異常燃焼の強度のレベル]を獲得したことになる。
なお、上掲の例では、実測した音若しくは振動の信号を時間軸上で二つの区分TA、TBに分割していたが、実測の音若しくは振動の信号を三つ以上の区分に分割し、各区分の一部または全部を逆再生の信号に置換したり、区分の順序を並べ替えたりしたりして、学習データの要素となる信号のデータを生成することも当然に許される。
また、ステップS3にて、実測の音若しくは振動の信号の全部または一部の区分を複製し、それを(正再生の信号のまま、または逆再生の信号に置換して)元の実測の信号に繋げるようにして、元の実測の信号よりも長さを延ばした音若しくは振動の信号を生成してもよい。例えば、図5に示すような実測の信号に、さらに区分TAの信号を繋げて、区分TA、TB、TAが連なる信号を生成することができる。そのような音若しくは信号もまた、人の聴覚には、元の音若しくは振動と同様に知覚される。このとき、本実施形態の機械学習システムは、延長した信号のデータに、図5に示す実測の信号のデータに対して付与されたラベルと同じラベルを付与する。
以降、データ生成部102は、ステップS1ないしS3を通じて得た複数の学習データの組[音若しくは振動の信号,異常燃焼が生じていたか否かまたは異常燃焼の強度のレベル]の各々に対して、ニューラルネットワークに入力するのに適した形に加工するための処理(ステップS4ないしS7)を施す。まず、ステップS3にて生成した音若しくは振動の信号のデータ、即ち音若しくは振動の振幅の時系列にプリエンファシスフィルタをかけて処理する(ステップS4)。プリエンファシス処理は、音若しくは振動の所定周波数以上の高域成分を、それ未満の周波数の低域成分に比して相対的に強調するための処理の一つである。プリエンファシス処理を施すことで、対象の信号のS/N比が改善される、つまりはノイズに対してより頑健になるとされる。プリエンファシス処理前の音若しくは振動の振幅の時系列をx(n)、プリエンファシス係数をp、プリエンファシス処理後の音若しくは振動の振幅の時系列をy(n)とおくと、プリエンファシスフィルタを
y(n)=x(n)−px(n−1)
と定義することができる。プリエンファシス係数は、音声認識分野では0.97が用いられることが多いが、その値は0.97に限定はされない。
なお、このプリエンファシス処理は、ステップS3により増殖させる前の元の信号、即ちステップS1にて実測した大元の信号に施してもよい。また、プリエンファシスは必須の処理ではなく、不必要であれば除外して構わない。
続いて、プリエンファシス処理した音若しくは振動の信号を高速フーリエ変換して、その振幅スペクトルを求める(ステップS5)。
しかる後、フーリエ変換により得た振幅スペクトルにメルフィルタバンクをかけて処理する(ステップS6)。フィルタバンクとは、複数のバンドパスフィルタの組のことである。図13に、本実施形態において用いるメルフィルタバンクを示す。メルフィルタバンクは、三角形状のバンドパスフィルタをオーバラップさせて並べてなる。各バンドパスフィルタの三角窓は、メル尺度(人間の音声知覚を反映した周波数軸)上で等間隔になるように配置され、低周波ほど間隔が狭く、高周波ほど間隔が広くなっており、また高周波になるほど幅が広い三角形になる。図示例のものは、チャネル数、即ち三角形状のバンドパスフィルタの数が二十である。
音声認識分野で用いられる既知のメルフィルタバンクでは、各チャネルのバンドパスフィルタの頂点のゲインが一律に1に設定される。だが、図13に示しているように、本実施形態のメルフィルタバンクでは、所定周波数以上、より具体的には約5000Hzないし6000Hz以上の領域のチャネルのバンドパスフィルタの頂点のゲインを一律に1に設定する一方で、それ未満の周波数の領域のチャネルのバンドパスフィルタの頂点のゲインを1よりも小さく設定し、かつ周波数が低くなるほどバンドパスフィルタの頂点のゲインを小さく調整している。このような特徴的なフィルタバンクを採用することにより、音若しくは振動の信号の所定周波数以上の成分を、それ未満の周波数の成分に比して相対的に強調することが可能である。
ステップS6では、振幅スペクトルに対してメルフィルタバンクが有する各チャネルのバンドパスフィルタをかけ、当該フィルタ後の振幅を足し合わせたものをチャネル毎に求める。この処理により、振幅スペクトルの次元数をメルフィルタバンクのチャネル数と同数(本実施形態では、二十)まで削減したメルスペクトラムを得ることができ、機械学習に用いる学習データとしてより好適なものになる。
そして、ステップS6にて求めたメルスペクトラムの各チャネルの値の常用対数をとる(ステップS7)。尤も、このステップS7は必須の処理ではなく、不必要であるならば除外して構わない。
図14に、ステップS3ないしS7を通じて得た音若しくは振動の信号の対数メルスペクトラムの例を示す。図14中、○点は異常燃焼が生じている場合に内燃機関から発せられた音若しくは振動の対数メルスペクトラムを表し、×点は異常燃焼が生じていない場合に内燃機関から発せられた音若しくは振動の対数メルスペクトラムを表している。このように、異常燃焼が生じている場合と生じていない場合とで、音若しくは振動のスペクトラムには明らかな差違が見て取れる。
学習データ記憶部103は、メインメモリ12または補助記憶デバイス13の所要の記憶領域を利用して、内燃機関の運転中に内燃機関から発せられた音若しくは振動を基に生成された信号データ即ち音若しくは振動の対数メルスペクトラムと、そのときに内燃機関で異常燃焼が発生していたか否かまたは発生した異常燃焼の強度のレベルを示すラベルとの組を、学習データとして記憶する(ステップS8)。
学習部104は、学習データ記憶部103に記憶し蓄積している学習データ群を用いて、学習済みモデルを生成する。即ち、学習データ記憶部103に蓄積した学習データの各組[音若しくは信号の対数メルスペクトラム,異常燃焼が生じていたか否かまたは異常燃焼の強度のレベル]を順次読み出し、ある学習データが含む対数メルスペクトラムを入力とし、異常燃焼が生じていたか否かまたは異常燃焼の強度のレベルを出力として、そのような入力に対してそのような出力をするようにニューラルネットワークを変化させる深層学習を実行する。機械学習において、機械学習システムは、GPU104の演算能力を援用することがある。
上記の機械学習を経て学習済みモデルを生成した機械学習システムは、その学習済みモデルのデータを、メインメモリ12または補助記憶デバイス13の所要の記憶領域に記憶する。
この学習済みモデルは、向後、内燃機関の運転中に異常燃焼が生じているか否か、またはその異常燃焼の強度のレベルの自動判定を実行するために用いることができる。つまり、機械学習システムが、信号取得部101を介して内燃機関から発せられる音若しくは振動の信号を取得し、取得した信号をデータ生成部102を介して対数メルスペクトラムに変換し、そのメルスペクトラムを入力として学習済みモデルのニューラルネットワークに与えることにより、内燃機関において異常燃焼が生じたか否か、または異常燃焼の強度のレベルを、出力として得ることができる。
本実施形態では、内燃機関を運転しているときに内燃機関から発せられた音若しくは振動を基に生成された信号データ(対数メルスペクトラム)と、そのときに内燃機関で異常燃焼が発生していたか否かまたは発生した異常燃焼の強度のレベルを示すラベルとの組である学習データを記憶する学習データ記憶部103と、前記学習データ記憶部103が記憶している学習データ群を用いて、内燃機関を運転しているときに内燃機関から発せられる音声または振動を基に生成される信号データを入力とし、そのときに内燃機関で異常燃焼が発生しているか否かまたは発生している異常燃焼の強度のレベルを出力とする学習済みモデルを生成する学習部104とを具備する機械学習システムを構成した。
本実施形態によれば、内燃機関の運転中に異常燃焼が発生しているか否か、または異常燃焼の強度のレベルを精度よく自動判定することが可能となる。
しかも、内燃機関を運転しているときに内燃機関から発せられた音若しくは振動に、当該音若しくは振動における所定周波数以上の成分をそれ未満の周波数の成分に比して相対的に強調するための処理(プリエンファシス処理及びメルフィルタバンク処理)を加えた上で前記信号データを生成するデータ生成部102を具備することから、前記学習済みモデルによる自動判定の精度がより一層向上する。
また、本実施形態では、機械を運転しているときに機械(内燃機関)から発せられる音若しくは振動を基に生成される信号データを入力とし、そのときに同機械で特定の事象(人が聴覚を介して知覚可能なノッキング等の異常燃焼)が発生しているか否かまたは発生している特定の事象の強度のレベルを出力とする学習済みモデルを生成するために用いられる学習データを生成するためのものであって、機械を運転しているときに機械から発せられた音若しくは振動を基に信号データを生成し、そのときに機械で特定の事象が発生していたか否かまたは発生した特定の事象の強度のレベルを示すラベルと組にした学習データを生成するとともに、同じ音若しくは振動のうちの少なくとも一部分を逆再生したもの、同じ音若しくは振動を複数の区分に分割しそれら区分の順序を並べ替えたもの、及び/または、同じ音若しくは振動のうちの少なくとも一部を複製することで延長したものを基に信号データを生成し、同じラベルと組にした別の学習データを生成するデータ生成部102と、前記データ生成部102が生成した学習データを記憶する学習データ記憶部103とを具備する機械学習システムを構成した。
本実施形態によれば、上記の学習済みモデルを生成するために用いられる学習データを、効率よく集積することが可能となる。そして、大量の学習済みモデルを与えて機械学習を行い、学習済みモデルによる自動判定の精度を高めることが容易となる。
なお、本発明は以上に詳述した実施形態に限られるものではない。例えば、音若しくは振動における所定周波数以上の成分をそれ未満の周波数の成分に比して相対的に強調するためのプリエンファシス処理は、マイク18を介して集音した音若しくは振動の信号をA/D変換する回路中で行うこともできる。
本発明の機械学習システムが自動判定の対象とする機械は内燃機関に限定されず、自動判定の対象とする事象はノッキング等の異常燃焼に限定されない。内燃機関の運転中に起こる異常燃焼以外の、人が聴覚を介して知覚可能な事象一般について、本発明を適用することが可能である。
また、信号取得部101、データ生成部102、学習データ記憶部103及び学習部104の各機能を、電気通信回線を介して相互に接続している複数基のコンピュータ1に分散させ、それらが協働して本発明に係る機械学習システムを構成する態様をとること妨げない。
その他、各部の具体的な構成や処理の手順等は、本発明の趣旨を逸脱しない範囲で種々変形が可能である。
1…コンピュータ
101…信号取得部
102…データ生成部
103…学習データ記憶部
104…学習部

Claims (3)

  1. 機械を運転しているときに機械から発せられる音若しくは振動を基に生成される信号データを入力とし、そのときに同機械で特定の事象が発生しているか否かまたは発生している特定の事象の強度のレベルを出力とする学習済みモデルを生成するために用いられる学習データを生成するためのものであって、
    機械を運転しているときに機械から発せられた音若しくは振動を基に信号データを生成し、そのときに機械で特定の事象が発生していたか否かまたは発生した特定の事象の強度のレベルを示すラベルと組にした学習データを生成するとともに、同じ音若しくは振動のうちの少なくとも一部分を逆再生したものを基に信号データを生成し、同じラベルと組にした別の学習データを生成するデータ生成部と、
    前記データ生成部が生成した学習データを記憶する学習データ記憶部と
    を具備する機械学習システム。
  2. 機械を運転しているときに機械から発せられる音若しくは振動を基に生成される信号データを入力とし、そのときに同機械で特定の事象が発生しているか否かまたは発生している特定の事象の強度のレベルを出力とする学習済みモデルを生成するために用いられる学習データを生成するためのものであって、
    機械を運転しているときに機械から発せられた音若しくは振動を基に信号データを生成し、そのときに機械で特定の事象が発生していたか否かまたは発生した特定の事象の強度のレベルを示すラベルと組にした学習データを生成するとともに、同じ音若しくは振動を複数の区分に分割しそれら区分の順序を並べ替えたものを基に信号データを生成し、同じラベルと組にした別の学習データを生成するデータ生成部と、
    前記データ生成部が生成した学習データを記憶する学習データ記憶部と
    を具備する機械学習システム。
  3. 機械を運転しているときに機械から発せられる音若しくは振動を基に生成される信号データを入力とし、そのときに同機械で特定の事象が発生しているか否かまたは発生している特定の事象の強度のレベルを出力とする学習済みモデルを生成するために用いられる学習データを生成するためのものであって、
    機械を運転しているときに機械から発せられた音若しくは振動を基に信号データを生成し、そのときに機械で特定の事象が発生していたか否かまたは発生した特定の事象の強度のレベルを示すラベルと組にした学習データを生成するとともに、同じ音若しくは振動のうちの少なくとも一部を複製することで延長したものを基に信号データを生成し、同じラベルと組にした別の学習データを生成するデータ生成部と、
    前記データ生成部が生成した学習データを記憶する学習データ記憶部と
    を具備する機械学習システム。
JP2020103447A 2020-06-16 2020-06-16 機械学習システム Pending JP2021195916A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020103447A JP2021195916A (ja) 2020-06-16 2020-06-16 機械学習システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020103447A JP2021195916A (ja) 2020-06-16 2020-06-16 機械学習システム

Publications (1)

Publication Number Publication Date
JP2021195916A true JP2021195916A (ja) 2021-12-27

Family

ID=79197582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020103447A Pending JP2021195916A (ja) 2020-06-16 2020-06-16 機械学習システム

Country Status (1)

Country Link
JP (1) JP2021195916A (ja)

Similar Documents

Publication Publication Date Title
JP4496186B2 (ja) 音源分離装置、音源分離プログラム及び音源分離方法
EP1171873B1 (en) Apparatus and methods for detecting emotions in the human voice
CN113436643B (zh) 语音增强模型的训练及应用方法、装置、设备及存储介质
US10741195B2 (en) Sound signal enhancement device
CN105448305A (zh) 语音处理装置和语音处理方法
JP7326627B2 (ja) オーディオ信号処理方法、装置、機器及びコンピュータプログラム
CN113678474B (zh) 个性化三维音频
DE102014118075A1 (de) Audio und Video synchronisierendes Wahrnehmungsmodell
US7116788B1 (en) Efficient head related transfer function filter generation
CN114974299B (zh) 语音增强模型的训练、增强方法、装置、设备、介质
Xie et al. Research and development of sound quality in portable testing and evaluation system based on self-adaptive neural network
CN112735466B (zh) 一种音频检测方法及装置
Wycisk et al. The Headphone and Loudspeaker Test–Part II: A comprehensive method for playback device screening in Internet experiments
US8838445B1 (en) Method of removing contamination in acoustic noise measurements
JP2021195916A (ja) 機械学習システム
JP2021195915A (ja) 機械学習システム
Doleschal et al. Modeling the perceptions of Rumbling, humming and booming in the context of vehicle interior sounds
US8005234B2 (en) Method for synthesizing impulse response and method for creating reverberation
US11854567B2 (en) Digital twin for microphone array system
US10717387B2 (en) Engine sound control device, engine sound control method, and non-transitory computer-readable medium
Schäfer et al. Interpolation of scheduled simulation results for real-time auralization of moving sources
JP2023033848A (ja) 異音特定装置、異音特定方法、及び、異音特定プログラム
Pendharkar Auralization of road vehicles using spectral modeling synthesis
CN108200508A (zh) 耳机夹力标定系统及方法
Quinton et al. Sonification of planetary orbits in asteroid belts

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230510

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240702