WO2020255318A1

WO2020255318A1 - 学習データ拡張装置、学習データ拡張方法、およびプログラム

Info

Publication number: WO2020255318A1
Application number: PCT/JP2019/024422
Authority: WO
Inventors: 安田　昌弘; 悠馬小泉; 登原田
Original assignee: 日本電信電話株式会社
Priority date: 2019-06-20
Filing date: 2019-06-20
Publication date: 2020-12-24
Also published as: JP7207539B2; US11886996B2; US20220383106A1; JPWO2020255318A1

Abstract

第１方向からの到来信号に対応する第１観測信号を入力とし、第１観測信号に対する角度回転操作を行って、第１方向と異なる第２方向からの到来信号に対応する第２観測信号を得、第２観測信号を学習データの集合に追加する。

Description

学習データ拡張装置、学習データ拡張方法、およびプログラム

　本発明は、学習データの拡張技術に関する。

　マイクロホンで観測した音響信号から「音響信号の種類」「音響信号の時刻」「音響信号の到来方向（音源の方向）」を推定する技術分野（例えば、何れの種類の音が、いつ（開始時刻と終了時刻）、どの方向から鳴っているかを推定する技術分野）がある（例えば、非特許文献１等参照）。

　このような技術分野では、十分な学習データを収集することが困難であるという課題がある。一般的に、機械学習において学習データが足りない場合、データ拡張（data augmentation）という手法が用いられる（例えば、非特許文献２，３等参照）。この手法では、学習データから他の新たな学習データを生成して、学習データ数を増加させる。

S. Adavanne, A. Politis, J. Nikunen, and T. Virtanen, "Sound event localization and detection of overlapping sources using convolutional recurrent neural networks," IEEE Journal of Selected Topics in Signal Processing, Vol. 13-1, pp. 34-48, 2019. T. Inoue, P. Vinayavekhin, S. Wang, D. Wood, N. Greco and R. Tachibana, "Domestic Activities Classification Based on CNN Using Shuffling and Mixing Data Augmentation," Tech. Report of DCASE 2018 task 5, 2018. M. Lasseck, "ACOUSTIC BIRD DETECTION WITH DEEP CONVOLUTIONAL NEURAL NETWORKS," Tech. Report of DCASE 2018 task 5, 2018.

　しかし、従来のデータ拡張法では、学習データから他の新たな学習データを生成する際に、元の学習データの伝達特性を破壊してしまうという問題がある。そのため、音響信号の到来方向の推定を行うモデルに、従来のデータ拡張法を適用することはできない。このような問題は、音響信号の到来方向の推定を行う場合のみならず、その他の信号の到来方向を推定する場合にも共通するものである。また、「音響信号の種類」や「音響信号の時刻」の推定を行わずに信号の到来方向を推定する場合もの共通する問題である。

　本発明はこのような点に鑑みてなされたものであり、信号の到来方向の推定モデルの学習に使用可能な学習データの数を増加させることを目的とする。

　本発明では、信号の到来方向の推定モデルの学習に使用可能な学習データの数を増加させることができる。

図１は、実施形態の学習データ拡張装置の機能構成を例示したブロック図である。図２は、実施形態の学習データ拡張装置のハードウェア構成を例示したブロック図である。図３は、実施形態の学習データ拡張方法を例示するためのフロー図である。図４Ａおよび図４Ｂは、実施形態の角度回転操作を例示するための図である。

　以下、図面を参照して本発明の実施形態を説明する。
　［原理］
　まず、原理を説明する。

　一例として、複数のマイクロホンで観測して得られた信号に基づいて「音響信号の種類」「音響信号の発生時刻」「音響信号の到来方向（方位角および仰俯角）」を推定する場合について説明する。しかし、これは本発明を限定するものではない。一例としてＭ個のマイクロホンで音響信号が観測されるとする。Ｍは２以上の整数である。ｍ番目（ｍ∈｛１，…，Ｍ｝）のマイクロホンで観測される信号を時間周波数領域に変換して得られる複素スペクトログラムをＤ^（ｍ）∈Ｃ^Ｆ×τと表現する。時間周波数領域への変換の一例は、短時間フーリエ変換（STFT）である。ただし、Ｃは複素数、Ｆは周波数インデックス数（離散周波数の個数）、τは時間インデックス数（離散時間の個数）を表し、Ｃ^Ｆ×τはＦ×τ個の複素数からなる集合を表す。周波数インデックスｆ∈｛１，…，Ｆ｝の離散周波数を「周波数ｆ」と表現し、時間インデックスｔ∈｛１，…，τ｝の離散周波数を「時間ｔ」と表現する。また、１番目からＭ番目までのＭ個のマイクロホンで観測された音響信号に対応するＤ^（１），…，Ｄ^（Ｍ）をまとめたテンソルを以下のように表現する。

また、時間ｔでｃ番目のクラスの音源が鳴っていれば１、鳴っていなければ０となる変数をｐ_ｃ，ｔ∈｛０，１｝と表現する。時刻ｔで存在するｃ番目のクラスの音源の方位角と仰俯角を表す変数をそれぞれａ_ｃ，ｔ、ｅ_ｃ，ｔとする。すると、上述した複数のマイクロホンで観測して得られた信号に基づいて「音響信号の種類」「音響信号の発生時刻」「音響信号の到来方向」を推定する問題は、Ｄからｐ_ｃ，ｔを要素に持つ行列

と、ａ_ｃ，ｔを要素に持つ行列

と、ｅ_ｃ，ｔを要素に持つ行列

を推定する関数を推定する問題として定式化できる。ここで［α．β）はα以上、β未満の範囲を表す。Ｎは自然数の集合を表し、Ｒは実数の集合を表す。この問題は、

となる関数Ｍ_σのパラメータσを学習する問題である。ただし、

は、それぞれＰ，Ａ，Ｅの推定行列を表す。Ｐの推定を音響イベント検出、Ａ，Ｅの推定を音源方向推定（音響信号の到来方向の推定）と呼ぶ。例えば、非特許文献３および参考文献１では、関数Ｍ_σをニューラルネットワークとした推定方法が提案されている。
　参考文献１：Y. Cao, Q. Kong, T. Iqbal, F. An, W. Wang, and M. D. Plumbley "Polyphonic Sound Event Detection and Localization using a Two-Stage Strategy," arXiv preprint, arXiv: 1905. 00268, 2019.
　特に参考文献１では、音響イベント検出と音源方向推定とを、以下のように別のネットワーク（関数）Ｓ_σＳ，Ｄ_σＤで推定している。

そして、Ｓ_σＳのパラメータσ_Ｓは二値化交差エントロピー（binary cross-entropy）を最小化するように学習され、Ｄ_σＤは音源が存在する区間でのＡとＡ＾の平均絶対誤差およびＥとＥ＾の平均絶対誤差を最小化するように学習している。なお「Ａ＾」「Ｅ＾」の右上添え字「＾」は、本来、それぞれ「Ａ」「Ｅ」の真上に記載すべきであるが、記載表記の制約上、「Ａ」「Ｅ」の右上にそれぞれ記載している。

　このような問題の場合、推定変数が３種類あるため、例えば、Ｍ_σをニューラルネットワークで実現する場合、多層な畳み込みニューラルネットワークやリカレントニューラルネットワークが必要になる。こういった複雑なニューラルネットワークを利用する場合、大量の学習データが必要である。学習データ量を擬似的に増加させるために（データ拡張）、音響イベント検出の分野では、非特許文献２，３などに記載されたデータ拡張法が使用される。しかし、前述したように、従来のデータ拡張法では、学習データから他の新たな学習データを生成する際に、元の学習データの伝達特性を破壊してしまうという問題がある。そのため、音響信号の到来方向の推定を行うモデルに、従来のデータ拡張法を適用することはできない。

　これに対し、学習データ数を増加させるために、新たなデータ拡張法を提案する。新たなデータ拡張法では、伝達特性を破壊することなく学習データ数を増加させるために、第１方向からの到来信号に対応する第１観測信号を入力とし、第１観測信号に対する角度回転操作を行って、第１方向と異なる第２方向からの到来信号に対応する第２観測信号を得、第２観測信号を学習データの集合に追加する。これにより、伝達特性を破壊することなく学習データ数を増加させることができる。

　ここでは、説明の簡略化のため、一次アンビソニックス方式で観測された一次アンビソニクス（ＦＯＡ：First Order Ambisonics）信号（以下、「ＦＯＡ信号」）に基づく第１観測信号を用いる例を説明する。ただし、これは本発明を限定するものではない。なお、アンビソニクスについては、参考文献２等に記載されている。
　参考文献２：西村竜一，“５章アンビソニックス，”映像情報メディア学会誌，Ｖｏｌ．６８，Ｎｏ．８，ｐｐ．６１６－６２０，Ａｕｇ，２０１４．
　一次アンビソニックス方式では、アンビソニック・マイクロホンという特殊なマイクロホンを用いて音響信号が観測される。アンビソニック・マイクロホンは、無指向性のマイクロホン（センサ）と、Ｘ軸方向に指向性を持つマイクロホンと、Ｙ軸方向に指向性を持つマイクロホンと、Ｚ軸方向に指向性を持つマイクロホンとを含む。Ｘ軸、Ｙ軸、およびＺ軸は直交座標系の座標軸である。例えば、Ｘ軸は上下方向の軸、Ｙ軸は左右方向の軸、Ｚ軸は前後方向の軸である。Ｂ－フォーマットに変換されたＦＯＡ信号は、無指向性のマイクロホンで観測された信号に基づくＷ成分Ｄ^（Ｗ）、Ｘ軸方向に指向性を持つマイクロホンで観測された信号に基づくＸ成分Ｄ^（Ｘ）、Ｙ軸方向に指向性を持つマイクロホンで観測された信号に基づくＹ成分Ｄ^（Ｙ）、およびＺ軸方向に指向性を持つマイクロホンで観測された信号に基づくＺ成分Ｄ^（Ｚ）の要素を持つ。Ｂ－フォーマットに変換されたＦＯＡ信号の空間周波数応答は以下のように表される。
Ｈ_１（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ）＝１
Ｈ_２（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ）＝√３＊ｓｉｎ(ａ_ｃ，ｔ）＊ｃｏｓ（ｅ_ｃ，ｔ）
Ｈ_３（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ）＝√３＊ｓｉｎ(ｅ_ｃ，ｔ）
Ｈ_４（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ）＝√３＊ｃｏｓ(ａ_ｃ，ｔ）＊ｃｏｓ（ｅ_ｃ，ｔ）
ここで「＊」は乗算を表し、Ｈ_１（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ），Ｈ_２（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ），Ｈ_３（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ），Ｈ_４（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ）は、Ｗ成分Ｄ^（Ｗ），Ｙ成分Ｄ^（Ｙ），Ｚ成分Ｄ^（Ｚ），Ｘ成分Ｄ^（Ｘ）にそれぞれ対応する空間周波数応答を表す（例えば、参考文献３等参照）。
　参考文献３：S. Adavanne, A. Politis, and T. Virtanen, "A multi-room reverberant dataset for sound event localization and uetection," in Submitted to Detection and Classification of Acoustic Scenes and Events 2019 Workshop (DCASE2019). 2019.

　今、Ｈ_１（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ），Ｈ_２（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ），Ｈ_３（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ），Ｈ_４（ａ_ｃ，ｔ，ｅ_ｃ，ｔ，ｆ）からｆを省略し、これらを要素とした伝達関数ベクトルＨ_ｃ，ｔを以下のように表記する。

すると、Ｂ－フォーマットに変換されたＦＯＡ信号は以下のように表現される。

ただし、Ｄ_ｔ，ｆ ^（Ｗ），Ｄ_ｔ，ｆ ^（Ｙ），Ｄ_ｔ，ｆ ^（Ｚ），Ｄ_ｔ，ｆ ^（Ｘ）は、それぞれ、時間ｔおよび周波数ｆにおける、Ｗ成分Ｄ^（Ｗ），Ｗ成分Ｄ^（Ｙ），Ｗ成分Ｄ^（Ｚ），Ｗ成分Ｄ^（Ｘ）の要素を表す。なお、Ｄ_ｔ，ｆ ^（Ｗ），Ｄ_ｔ，ｆ ^（Ｙ），Ｄ_ｔ，ｆ ^（Ｚ），Ｄ_ｔ，ｆ ^（Ｘ）の右上添え字「（Ｗ）」「（Ｙ）」「（Ｚ）」「（Ｘ）」は、本来、それぞれ右下添え字「ｔ，ｆ」の真上に記載すべきであるが、記載表記の制約上、「ｔ，ｆ」の右上に記載している。また、Ｓ_{ｃ，ｔ，ｆ}はｃ番目のクラスの音源から発せられた時間ｔおよび周波数ｆの信号を表す。以下、Ｄ_ｔ，ｆを「観測信号ベクトル」と呼ぶ。

　新たなデータ拡張法では、Ｄ_ｔ，ｆの方位角ａ_ｃ，ｔおよび／または仰俯角ｅ_ｃ，ｔの角度回転操作を行い、Ｄ_ｔ，ｆと到来方向の異なる信号

を生成する。今、Ｄ_ｔ，ｆの方位角ａ_ｃ，ｔおよび／または仰俯角ｅ_ｃ，ｔの角度回転操作を行って得られたＤ’_ｔ，ｆの伝達関数ベクトルＨ’_{ｃ，ｔ，θ，φ}を以下のように定義する。

ここで、θは方位角の回転角度を表し、φは仰俯角の回転角度を表す。θとφの少なくとも一方が０以外である。すなわち、θ≠０またはφ≠０である。

　今、伝達関数ベクトルＨ_ｃ，ｔとＨ’_{ｃ，ｔ，θ，φ}は明らかに距離減衰項を持たず、角度回転のみを表す。そのため、Ｄ_ｔ，ｆの左側から回転行列を乗じることで、Ｄ_ｔ，ｆの方位角ａ_ｃ，ｔおよび／または仰俯角ｅ_ｃ，ｔを回転させたＤ’_ｔ，ｆを得ることができる。なお、角度回転操作によってＤ_ｔ，ｆ ^（Ｗ）は変化しないため、以下では観測信号ベクトルＤ_ｔ，ｆ＝［Ｄ_ｔ，ｆ ^（Ｗ），Ｄ_ｔ，ｆ ^（Ｙ），Ｄ_ｔ，ｆ ^（Ｚ），Ｄ_ｔ，ｆ ^（Ｘ）］^Ｔのうち、Ｄ_ｔ，ｆ ^（Ｙ），Ｄ_ｔ，ｆ ^（Ｚ），Ｄ_ｔ，ｆ ^（Ｘ）の成分の回転操作のみについて説明する。便宜上、Ｄ_ｔ，ｆ ^（Ｘ），Ｄ_ｔ，ｆ ^（Ｙ），Ｄ_ｔ，ｆ ^（Ｚ）の順序で要素を配置した観測信号ベクトル

に回転行列を乗ずることを考える。しかし、これは本発明を限定するものではない。なおａ^Ｔはａの転置を表す。単純な方法としては、一般によく知られた、上下方向(roll)、左右方向(pitch)、前後方向(yaw)の回転量をそれぞれα，β，γとした回転行列Ｒ_α，β，γを、Ｋ_ｔ，ｆの左側から乗じたものをベクトル

とすればよい。以下に回転行列Ｒ_α，β，γを例示する。

　しかし、信号到来方向の方位角および仰俯角の回転だけを考えればよいため、より簡単なアルゴリズムによって必要な角度回転操作を行うことができる。以下、この新たなアルゴリズムを説明する。まず、観測信号ベクトルＫ_ｔ，ｆに方位角方向への回転操作を行う回転行列Ｒ_θは、以下のように記述できる。

ここで、観測信号ベクトルＫ_ｔ，ｆを方位角方向のみに角度θだけ回転させたベクトルをＫ_ｔ，ｆ ^θ＝Ｒ_θＫ_ｔ，ｆと置く。次にベクトルＫ_ｔ，ｆ ^θに仰俯角方向へ角度φだけ回転させることを考慮するが、注意すべき点が２つある。まずは音源方向の仰俯角の値域は［－π／２，π／２］であるため、ｅ_ｃ，ｔ＋φがその値域に収まるようにφを選択する必要がある。また、ベクトルＫ_ｔ，ｆ ^θの仰俯角方向への回転は、観測信号ベクトルＫ_ｔ，ｆの当初の直交座標系ではなく、この直交座標系を方位角方向のみに角度θだけ回転させた直交座標系で行われる。すなわち、この角度回転操作は、第１観測信号に対して第１直交座標系で方位角方向の角度θの回転操作を行って得られる方位角回転信号に対し、さらに第１直交座標系に方位角方向の角度θの回転操作を行って得られる第２直交座標系で仰俯角方向の角度φの回転操作を行う操作である。なお、第１直交座標系は３次元空間で互いに直交するＸ軸とＹ軸とＺ軸で定められ（図４Ａ：Ｘ軸－Ｙ軸－Ｚ軸）、第１直交座標系は３次元空間で互いに直交するＸ’軸とＹ’軸とＺ軸で定められる（図４Ａおよび図４Ｂ：Ｘ’軸－Ｙ’軸－Ｚ軸）。これらに注意すると、ロドリゲスの回転公式より、Ｋ_ｔ，ｆ’は以下のようになる。
K_t,f’=K_t,f ^θ・cosφ+cross(u,K_t,f ^θ)sinφ+u・dot(u,K_t,f ^θ)(1-cosφ) (3)
ここで、u=(sin(a_c,t+θ),cos(a_c,t+φ),0)^Tであり、ｃｒｏｓｓ（ａ，ｂ）がａとｂのクロス積（外積）であり、ｄｏｔ（ａ，ｂ）がａとｂのドット（内積）であり、ａ^Ｔがａの転置である。

　さらに、方位角および仰俯角を制限することで行列間の演算を行うことなく、観測信号ベクトルＫ_ｔ，ｆをベクトルＫ_ｔ，ｆ’に変換できる。すなわち式（３）において、方位角ａ_ｃ，ｔ＋θを±ａ_ｃ，ｔ＋｛－π／２，０，π／２，π｝のみに制限し、仰俯角ｅ_ｃ，ｔ＋φを±ｅ_ｃ，ｔのみに制限し、方位角ａ_ｃ，ｔ＋θと仰俯角ｅ_ｃ，ｔ＋φとの組合せを１６パターンのみに制限する。すなわち、ａ_ｃ，ｔ＋θは、ａ_ｃ，ｔ－π／２、ａ_ｃ，ｔ、ａ_ｃ，ｔ＋π／２、ａ_ｃ，ｔ＋π、－ａ_ｃ，ｔ－π／２、－ａ_ｃ，ｔ、－ａ_ｃ，ｔ＋π／２、または－ａ_ｃ，ｔ＋πの何れかであり、ｅ_ｃ，ｔ＋φは、ｅ_ｃ，ｔまたは－ｅ_ｃ，ｔである。この場合、式（３）の計算に行列間の演算は不要になり、観測信号ベクトルＫ_ｔ，ｆの要素の（Ｉ）符号反転と（ＩＩ）チャネルの入れ替えのみでＫ_ｔ，ｆ’を得ることができる。以下の表に、方位角と仰俯角との組と、Ｋ_ｔ，ｆの要素Ｄ_ｔ，ｆ ^（Ｘ），Ｄ_ｔ，ｆ ^（Ｙ），Ｄ_ｔ，ｆ ^（Ｚ）と、Ｋ’_ｔ，ｆの要素Ｄ’_ｔ，ｆ ^（Ｘ），Ｄ’_ｔ，ｆ ^（Ｙ），Ｄ’_ｔ，ｆ ^（Ｚ）との関係を示す。なお記載の簡略化のため、これらの表では下付き添え字「ｔ，ｆ」を省略している。

証明は、前述したＨ_１（ａ_ｃ，ｔ，ｅ_ｃ，ｔ）＝１，Ｈ_２（ａ_ｃ，ｔ，ｅ_ｃ，ｔ）＝√３＊ｓｉｎ(ａ_ｃ，ｔ）＊ｃｏｓ（ｅ_ｃ，ｔ），Ｈ_３（ａ_ｃ，ｔ，ｅ_ｃ，ｔ）＝√３＊ｓｉｎ(ｅ_ｃ，ｔ），Ｈ_４（ａ_ｃ，ｔ，ｅ_ｃ，ｔ）＝√３＊ｃｏｓ(ａ_ｃ，ｔ）＊ｃｏｓ（ｅ_ｃ，ｔ）、および三角関数に関する定理群より自明のため省略する。表の理解の補助のためにａ_ｃ，ｔ＋θ＝ａ_ｃ，ｔ＋π／２かつｅ_ｃ，ｔ＋φ＝－ｅ_ｃ，ｔの場合を例としてＨ_４（ａ_ｃ，ｔ＋θ，ｅ_ｃ，ｔ＋φ）を計算すると以下のようになる。

したがって、Ｄ’_ｔ，ｆ ^（Ｘ）＝－Ｄ_ｔ，ｆ ^（Ｙ）となる。

　［第１実施形態］
　次に、本発明の第１実施形態について説明する。
　＜構成＞
　図１に例示するように、本実施形態の学習データ拡張装置１は、制御部１１、記憶部１２、角度回転操作部１３、および学習データ追加部１４を有する。学習データ拡張装置１は、制御部１１の制御のもとで各処理を実行する。

　学習データ拡張装置１は、例えば、図２に例示するような汎用または専用のコンピュータ１００が所定のプログラムを実行することで構成される装置である。図２に例示するコンピュータ１００は、プロセッサ１０１、記憶部１０２、入力部１０３、出力部１０４、表示部１０５、およびバス１０６を有している。ただし、表示部１０５による情報表示が不要な場合には、表示部１０５が省略されてもよい。

　プロセッサ１０１は、例えば、ＣＰＵ（central processing unit）等である。プロセッサ１０１は、例えば、データを格納するレジスタ、演算処理を行う演算器、および演算処理やデータの読み書き等を制御する制御器を有する。プロセッサ１０１は、レジスタに読み込まれた各種プログラムに従って様々な演算処理を実行する。プロセッサ１０１は、１個のＣＰＵのみを備えていてもよいし、複数個のＣＰＵを備えていてもよい。このプログラムはコンピュータ１００にインストールされてもよいし、予め記憶部１０２等に記録されていてもよい。

　入力部１０３は、データが入力されるタッチパネル、入力ポート、キーボード、マウス、通信装置等であり、出力部１０４は、データを出力する出力ポート、通信装置等である。記憶部１０２は、ＳＲＡＭ (Static Random Access Memory)、ＤＲＡＭ (Dynamic Random Access Memory)等のＲＡＭ（Random Access Memory)等の主記憶装置、ハードディスク、ＭＯ（Magneto-Optical disc）、半導体メモリ等の補助記憶装置などである。バス１０６は、プロセッサ１０１、記憶部１０２、入力部１０３、出力部１０４、および表示部１０５を通信可能に接続している。

　＜処理＞
　次に、本実施形態の学習データ拡張方法について説明する。
　前提として、記憶部１２には、単数または複数の音源から発せられ、複数個のマイクロホンで観測された信号に基づく観測信号ベクトルＤ_ｔ，ｆ（第１方向からの到来信号に対応する第１観測信号）が格納されている。観測信号ベクトルＤ_ｔ，ｆは、モデルを学習するために用いられる学習データであり、その集合が記憶部１２に格納されている。モデルの例は、マイクロホンで観測した音響信号に基づく観測信号から音響信号の伝達特性に基づく推定を行うモデルである。このモデルは、「音響信号の種類」「音響信号の時刻」および「音響信号の到来方向」を推定するものであってもよいし、「音響信号の到来方向」のみを推定するものであってもよいし、「音響信号の到来方向」と音響信号に関するその他の情報とを推定するものであってもよい。モデルの例は、前述したニューラルネットワークに基づくモデルであるが、隠れマルコフモデルなどの確率モデルであってもよいし、ＳＶＭ（support vector machine）などの分類器であってもよい。観測信号ベクトルＤ_ｔ，ｆは、正解ラベルが付された教師有り学習データであってもよいし、正解ラベルが付されていない教師無し学習データであってもよい。学習データがそのまま機械学習に用いられてもよいし、学習データから抽出された特徴量が機械学習に用いられてもよい。

　図３に例示するように、学習データ拡張処理では、まず角度回転操作部１３が記憶部１２から観測信号ベクトルＤ_ｔ，ｆ（第１方向からの到来信号に対応する第１観測信号）を読み込み、観測信号ベクトルＤ_ｔ，ｆに対する角度回転操作を行って、観測信号ベクトルＤ_ｔ，ｆとは異なる到来方向に対応する観測信号ベクトルＤ’_ｔ，ｆ（第１方向と異なる第２方向からの到来信号に対応する第２観測信号）を得て出力する。例えば、角度回転操作部１３は、入力された観測信号ベクトルＤ_ｔ，ｆに含まれる要素Ｄ_ｔ，ｆ ^（Ｘ），Ｄ_ｔ，ｆ ^（Ｙ），Ｄ_ｔ，ｆ ^（Ｚ）からなるベクトルに回転行列を乗じ、それによって得られるＤ’_ｔ，ｆ ^（Ｘ），Ｄ’_ｔ，ｆ ^（Ｙ），Ｄ’_ｔ，ｆ ^（Ｚ）とＤ_ｔ，ｆ ^（Ｗ）とを要素とするベクトルを観測信号ベクトルＤ’_ｔ，ｆとして得て出力する。例えば、角度回転操作部１３は、入力された観測信号ベクトルＤ_ｔ，ｆに含まれる観測信号ベクトルＫ_ｔ，ｆ＝（Ｄ_ｔ，ｆ ^（Ｘ），Ｄ_ｔ，ｆ ^（Ｙ），Ｄ_ｔ，ｆ ^（Ｚ））^Ｔに左側から回転行列を乗じてベクトルＫ’_ｔ，ｆ＝（Ｄ’_ｔ，ｆ ^（Ｘ），Ｄ’_ｔ，ｆ ^（Ｙ），Ｄ’_ｔ，ｆ ^（Ｚ））^Ｔを得、ベクトルＫ’_ｔ，ｆとＤ_ｔ，ｆ ^（Ｗ）を要素とするベクトルを観測信号ベクトルＤ’_ｔ，ｆとして得て出力する。回転行列としては、例えば、前述の式（１）の回転行列Ｒ_α，β，γを例示できるが、これは本発明を限定しない。

　前述のように、角度回転操作部１３の角度回転操作は、観測信号ベクトルＤ_ｔ，ｆの方位角ａ_ｃ，ｔを方位角ａ_ｃ，ｔ＋θに変更し、仰俯角ｅ_ｃ，ｔを仰俯角ｅ_ｃ，ｔ＋φに変更する操作である。角度回転操作部１３は、予め選択された方位角θおよび仰俯角φで観測信号ベクトルＤ_ｔ，ｆに対する角度回転操作を行ってもよいし、角度回転操作部１３に入力された方位角θおよび仰俯角φで観測信号ベクトルＤ_ｔ，ｆに対する角度回転操作を行ってもよい。

　観測信号ベクトルＤ’_ｔ，ｆを構成する要素Ｄ’_ｔ，ｆ ^（Ｘ），Ｄ’_ｔ，ｆ ^（Ｙ），Ｄ’_ｔ，ｆ ^（Ｚ），Ｄ_ｔ，ｆ ^（Ｗ）の順序は、観測信号ベクトルＤ_ｔ，ｆを構成する要素の順序に対応することが望ましい。すなわち、観測信号ベクトルＤ_ｔ，ｆを構成するＷ成分Ｄ^（Ｗ），Ｗ成分Ｄ^（Ｙ），Ｗ成分Ｄ^（Ｚ），Ｗ成分Ｄ^（Ｘ）の順序が、観測信号ベクトルＤ’_ｔ，ｆを構成するＷ成分Ｄ^（Ｗ），Ｗ成分Ｄ^（Ｙ），Ｗ成分Ｄ^（Ｚ），Ｗ成分Ｄ^（Ｘ）の順序と同一であることが望ましい。しかし、後に観測信号ベクトルＤ’_ｔ，ｆを構成する要素の並べ替えが可能なのであれば、観測信号ベクトルＤ_ｔ，ｆを構成するＷ成分Ｄ^（Ｗ），Ｗ成分Ｄ^（Ｙ），Ｗ成分Ｄ^（Ｚ），Ｗ成分Ｄ^（Ｘ）の順序が、観測信号ベクトルＤ’_ｔ，ｆを構成するＷ成分Ｄ^（Ｗ），Ｗ成分Ｄ^（Ｙ），Ｗ成分Ｄ^（Ｚ），Ｗ成分Ｄ^（Ｘ）の順序と異なっていてもよい（ステップＳ１３）。

　上述のように得られた観測信号ベクトルＤ’_ｔ，ｆは学習データ追加部１４に送られる。学習データ追加部１４は、観測信号ベクトルＤ’_ｔ，ｆ（第２観測信号）を記憶部１２に格納し、学習データの集合に追加する。観測信号ベクトルＤ_ｔ，ｆが教師有り学習データである場合、学習データ追加部１４には、さらに観測信号ベクトルＤ_ｔ，ｆの正解ラベルと、方位角ａ_ｃ，ｔ＋θおよび仰俯角ｅ_ｃ，ｔ＋φ（または方位角θおよび仰俯角φ）とが入力される。学習データ追加部１４は、これらを用いて観測信号ベクトルＤ’_ｔ，ｆの正解ラベルを生成し、生成した正解ラベルを観測信号ベクトルＤ’_ｔ，ｆに付与する。すなわち、観測信号ベクトルＤ_ｔ，ｆと観測信号ベクトルＤ’_ｔ，ｆとの相違点は、音響信号の到来方向に対応する情報のみであるため、観測信号ベクトルＤ_ｔ，ｆに付された正解ラベルのうち、音響信号の到来方向に対応する情報のみを方位角ａ_ｃ，ｔ＋θおよび仰俯角ｅ_ｃ，ｔ＋φに対応する情報に置換した正解ラベルを観測信号ベクトルＤ’_ｔ，ｆに付する。この場合、正解ラベルが付された観測信号ベクトルＤ’_ｔ，ｆが学習データとして記憶部１２に格納される。一方、観測信号ベクトルＤ_ｔ，ｆが教師無し学習データである場合、観測信号ベクトルＤ’_ｔ，ｆが学習データとして記憶部１２に格納される（ステップＳ１４）。

　次に、制御部１１が、学習データの拡張処理を継続するか否かを判断する（ステップＳ１５）。拡張処理を継続するか否かの判断基準に限定はない。例えば、所望の個数の学習データが追加されるまで拡張処理を継続すると判断されてもよいし、拡張可能な学習データの上限数に達するまで拡張処理を継続すると判断されてもよいし、モデルが所望の推定精度を確保できるようになるまで拡張処理を継続すると判断されてもよい。拡張処理を継続すると判断された場合には、処理がステップＳ１３に戻る。そうでない場合には、処理を終了する。

　［第２実施形態］
　本実施形態は第１実施形態の変形例である。本実施形態の角度回転操作では、第１観測信号に対して第１直交座標系（図４Ａ：Ｘ軸－Ｙ軸－Ｚ軸）で方位角方向の角度θの回転操作を行って得られる方位角回転信号に対し、さらに第１直交座標系に方位角方向の角度θの回転操作を行って得られる第２直交座標系（図４Ａおよび図４Ｂ：Ｘ’軸－Ｙ’軸－Ｚ軸）で仰俯角方向の角度φの回転操作を行う。これによって角度回転操作に必要な演算量を削減できる。以降では、第１実施形態との相違点を中心に説明し、既に説明した事項については同じ参照番号を流用して説明を簡略化する。

　＜構成＞
　図１に例示するように、本実施形態の学習データ拡張装置２は、制御部１１、記憶部１２、角度回転操作部２３、および学習データ追加部１４を有する。学習データ拡張装置２は、制御部１１の制御のもとで各処理を実行する。学習データ拡張装置２も、例えば、図２に例示するような汎用または専用のコンピュータ１００が所定のプログラムを実行することで構成される装置である。

　＜処理＞
　第２実施形態の第１実施形態からの相違点は、前述したステップＳ１３が以下に述べるステップＳ２３に置換される点のみである。その他の事項は第１実施形態と同じであるため、説明を省略する。

　ステップＳ２３でも、角度回転操作部２３が記憶部１２から観測信号ベクトルＤ_ｔ，ｆ（第１方向からの到来信号に対応する第１観測信号）を読み込み、観測信号ベクトルＤ_ｔ，ｆに対する角度回転操作を行って、観測信号ベクトルＤ_ｔ，ｆとは異なる到来方向に対応する観測信号ベクトルＤ’_ｔ，ｆ（第１方向と異なる第２方向からの到来信号に対応する第２観測信号）を得て出力する。ただし、本実施形態の角度回転操作では、観測信号ベクトルＤ_ｔ，ｆに対して第１直交座標系で方位角方向の角度θの回転操作を行って得られる方位角回転信号に対し、さらに第１直交座標系に方位角方向の角度θの回転操作を行って得られる第２直交座標系で仰俯角方向の角度φの回転操作を行って観測信号ベクトルＤ’_ｔ，ｆを得る。前述のように、観測信号ベクトルＤ_ｔ，ｆ（第１観測信号）は、Ｘ軸方向に指向性を持つマイクロホン（センサ）で観測された信号に基づくＸ成分Ｄ^（Ｘ）、Ｙ軸方向に指向性を持つマイクロホンで観測された信号に基づくＹ成分Ｄ^（Ｙ）、およびＺ軸方向に指向性を持つマイクロホンで観測された信号に基づくＺ成分Ｄ^（Ｚ）を要素に持つ。第２直交座標系で仰俯角方向の回転操作を行う操作は、観測信号ベクトルＤ’_ｔ，ｆ（第２観測信号）の仰俯角ｅ_ｃ，ｔ＋φが－π／２以上π／２以下となるように行われる（すなわち、この操作は仰俯角の値域に収まるように行われる）。例えば、観測信号ベクトルＤ_ｔ，ｆ（第１観測信号）は、一次アンビソニックス方式で観測された信号に基づき、方位角方向の回転操作は、方位角をａ_ｃ，ｔからａ_ｃ，ｔ＋θにする回転操作であり、仰俯角方向の回転操作は、仰俯角をｅ_ｃ，ｔからｅ_ｃ，ｔ＋φにする回転操作である。観測信号ベクトルＤ_ｔ，ｆが観測信号ベクトルＫ_ｔ，ｆ＝（Ｄ_ｔ，ｆ ^（Ｘ），Ｄ_ｔ，ｆ ^（Ｙ），Ｄ_ｔ，ｆ ^（Ｚ））^Ｔを含み、方位角回転信号がＫ_ｔ，ｆ ^θ＝Ｒ_θＫ_ｔ，ｆであり、

である。角度回転操作部２３は、観測信号ベクトルＤ_ｔ，ｆから抽出した観測信号ベクトルＫ_ｔ，ｆに対し、式（３）に従ってＫ_ｔ，ｆ’＝（Ｄ’_ｔ，ｆ ^（Ｘ），Ｄ’_ｔ，ｆ ^（Ｙ），Ｄ’_ｔ，ｆ ^（Ｚ））^Ｔを得、ベクトルＫ’_ｔ，ｆの要素Ｄ’_ｔ，ｆ ^（Ｘ），Ｄ’_ｔ，ｆ ^（Ｙ），Ｄ’_ｔ，ｆ ^（Ｚ）とＤ_ｔ，ｆ ^（Ｗ）を要素とするベクトルを観測信号ベクトルＤ’_ｔ，ｆとして得て出力する。その他の処理は第１実施形態と同じである。

　［第３実施形態］
　本実施形態は第２実施形態の変形例である。本実施形態では、観測信号ベクトルＤ’_ｔ，ｆの仰俯角ａ_ｃ，ｔ＋θが、ａ_ｃ，ｔ－π／２、ａ_ｃ，ｔ、ａ_ｃ，ｔ＋π／２、ａ_ｃ，ｔ＋π、－ａ_ｃ，ｔ－π／２、－ａ_ｃ，ｔ、－ａ_ｃ，ｔ＋π／２、または－ａ_ｃ，ｔ＋πの何れかに制限され、方位角ｅ_ｃ，ｔ＋φがｅ_ｃ，ｔまたは－ｅ_ｃ，ｔに制限される。

　＜構成＞
　図１に例示するように、本実施形態の学習データ拡張装置３は、制御部１１、記憶部１２、角度回転操作部３３、および学習データ追加部１４を有する。学習データ拡張装置２は、制御部１１の制御のもとで各処理を実行する。学習データ拡張装置３も、例えば、図２に例示するような汎用または専用のコンピュータ１００が所定のプログラムを実行することで構成される装置である。

　＜処理＞
　第２実施形態の第１実施形態からの相違点は、前述したステップＳ１３が以下に述べるステップＳ３３に置換される点のみである。その他の事項は第１実施形態と同じであるため、説明を省略する。ステップＳ３３では、角度回転操作部３３が記憶部１２から読み出した観測信号ベクトルＤ_ｔ，ｆから抽出したＤ_ｔ，ｆ ^（Ｘ），Ｄ_ｔ，ｆ ^（Ｙ），Ｄ_ｔ，ｆ ^（Ｚ）に対し、［表１］［表２］に示すような仰俯角ａ_ｃ，ｔ＋θおよび方位角ｅ_ｃ，ｔ＋φの組に応じた変換を行い、Ｄ’_ｔ，ｆ ^（Ｘ），Ｄ’_ｔ，ｆ ^（Ｙ），Ｄ’_ｔ，ｆ ^（Ｚ）を得る。［表１］［表２］は角度回転操作部３３に予め設定されていてもよいし、角度回転操作部３３の外部から与えられてもよい。角度回転操作部３３は、Ｄ’_ｔ，ｆ ^（Ｘ），Ｄ’_ｔ，ｆ ^（Ｙ），Ｄ’_ｔ，ｆ ^（Ｚ）とＤ_ｔ，ｆ ^（Ｗ）を要素とするベクトルを観測信号ベクトルＤ’_ｔ，ｆとして得て出力する。その他の処理は第１実施形態と同じである。

　［実験結果］
　以下に実験結果を示す。ここでは、非特許文献１に記載されたDCASE2019 Task3 ”Sound Event Localization and Detection”に対し、第３実施形態の方法でデータ拡張された観測信号ベクトルＤ’_ｔ，ｆを適用した実行結果を示す。今回、観測信号ベクトルＤ_ｔ，ｆとして使用したデータセットは、参考文献３に記載されたTAU2019 Spatial Sound Events 2019である。本データセットにはＦＯＡ信号フォーマットで記録された１分間の４チャネルの音声データが４００個含まれている。これらは、１１クラスに分類された無残響音源を、５０４の到来方向と距離の組み合わせにおいて５種類の室内インパルス応答を用いて合成したものである。この観測信号ベクトルＤ_ｔ，ｆを第３実施形態の方法でデータ拡張して得られた観測信号ベクトルＤ’_ｔ，ｆから得られた対数メルスペクトログラムとGCC-PHAT（例えば、参考文献４）とを用い、ニューラルネットワークに基づいて音響信号の到来方向等の推定を行うモデルの機械学習を行った。以下に、このように得られたモデルを用いて音響信号の到来方向の推定を行った場合（本手法）と、このようなデータ拡張を行わずに参考文献１の手法で音響信号の到来方向の推定を行った場合（従来法）とのDOAerror（例えば、非特許文献１）の比較結果を示す。なお、DOAerrorは音響信号の到来方向の真の到来方向に対する誤りの指標である。
　　　　　　DOAerror
　　従来法：９．８５°
　　本手法：７．１２°
　このように本手法の場合、従来法に比べてDOAerrorが２．７３°減少した。これは学習データのデータ拡張に本手法が有効であることを示している。
　参考文献４：C. H. Knapp and G. Carter, “The generalized correlation method for estimation of time delay,” IEEE Transactions on Acoustics, Speech, and Signal Processing (Volume: 24 , Issue: 4 , Aug 1976), pp. 320-327.
　参考文献５：K. He, X. Zhang, S. Ren, and J. Sun, “Deep residual learning for image recognition,” Microsoft Research.

　［その他の変形例等］
　なお、本発明は上述の実施形態に限定されるものではない。例えば、上述の実施形態では、Ｂ－フォーマットに変換されたＦＯＡ信号を第１観測信号としたがこれは本発明を限定しない。音響信号を複数のマイクロホンで観測して得られた信号に基づくその他の信号を第１観測信号としてもよい。また上述の実施形態では、到来信号が音響信号であり、第１観測信号および第２観測信号が音響信号を観測して得られる信号に基づくものであった。しかしながら、到来信号が音響信号以外の時系列信号（例えば、電磁波、地震波、超音波など）であり、マイクロホンに代えてこの時系列信号を観測可能なセンサが用いられてもよい。すなわち、第１観測信号および第２観測信号が音響信号以外の時系列信号をセンサで観測して得られる信号に基づくものであってもよい。例えば、音響信号以外の時系列信号をセンサで観測して得られる信号を時間周波数領域に変換して得られる信号を第１観測信号としてもよい。また、上述の実施形態では、第１観測信号および第２観測信号が時間周波数領域の信号であったが、これらが時間領域の信号であってもよい。例えば、時系列信号をセンサで観測して得られる信号を第１観測信号としてもよい。

　また、上述の実施形態では、第１観測信号および第２観測信号が無指向性のマイクロホンで観測された信号に基づくＷ成分Ｄ^（Ｗ）を含んでいたが、第１観測信号および第２観測信号がＷ成分Ｄ^（Ｗ）を含まなくてもよい。上述の実施形態では、第１観測信号のＷ成分Ｄ^（Ｗ）を第２観測信号のＷ成分Ｄ^（Ｗ）として用いたが、第１観測信号のＷ成分Ｄ^（Ｗ）の関数値、またはその他の値を第２観測信号のＷ成分Ｄ^（Ｗ）としてもよい。

　また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

　また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は非一時的な（non-transitory）記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。

　また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
　このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

　また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

　本発明は、例えば、マイクロホンで観測した音響信号から「音響信号の種類」「音響信号の時刻」「音響信号の到来方向」を推定する分野で利用可能である。例えば、自動運転車において、どの方向から緊急車両が到来しているか等を推定するための基盤技術として利用できる。

１～３　学習データ拡張装置
１３～３３　角度回転操作部
１４　学習データ追加部

Claims

　第１方向からの到来信号に対応する第１観測信号を入力とし、前記第１観測信号に対する角度回転操作を行って、前記第１方向と異なる第２方向からの到来信号に対応する第２観測信号を得る角度回転操作部と、
　前記第２観測信号を学習データの集合に追加する学習データ追加部と、
を有する学習データ拡張装置。
　請求項１の学習データ拡張装置であって、
　前記角度回転操作は、前記第１観測信号に対して第１直交座標系で方位角方向の回転操作を行って得られる方位角回転信号に対し、さらに前記第１直交座標系に前記方位角方向の回転操作を行って得られる第２直交座標系で仰俯角方向の回転操作を行う操作である、学習データ拡張装置。
　請求項２の学習データ拡張装置であって、
　前記第１直交座標系は、３次元空間で互いに直交するＸ軸とＹ軸とＺ軸で定められ、
　前記第１観測信号は、前記Ｘ軸方向に指向性を持つセンサで観測された信号に基づくＸ成分Ｄ^（Ｘ）、前記Ｙ軸方向に指向性を持つセンサで観測された信号に基づくＹ成分Ｄ^（Ｙ）、および前記Ｚ軸方向に指向性を持つセンサで観測された信号に基づくＺ成分Ｄ^（Ｚ）を要素に持ち、
　前記第２直交座標系で仰俯角方向の回転操作を行う操作は、前記第２観測信号の仰俯角が－π／２以上π／２以下となるように行われる、学習データ拡張装置。
　請求項３の学習データ拡張装置であって、
　前記第１観測信号は、一次アンビソニックス方式で観測された信号に基づき、
　前記方位角方向の回転操作は、方位角をａ_ｃ，ｔからａ_ｃ，ｔ＋θにする回転操作であり、
　前記仰俯角方向の回転操作は、仰俯角をｅ_ｃ，ｔからｅ_ｃ，ｔ＋φにする回転操作であり、
　前記第１観測信号がＫ_ｔ，ｆ＝（Ｄ_ｔ，ｆ ^（Ｘ），Ｄ_ｔ，ｆ ^（Ｙ），Ｄ_ｔ，ｆ ^（Ｚ））^Ｔを含み、
　前記方位角回転信号がＫ_ｔ，ｆ ^θ＝Ｒ_θＫ_ｔ，ｆであり、

であり、
　前記第２観測信号がＫ_ｔ，ｆ ^θ・ｃｏｓφ＋ｃｒｏｓｓ（ｕ，Ｋ_ｔ，ｆ ^θ）ｓｉｎφ＋ｕ・ｄｏｔ（ｕ，Ｋ_ｔ，ｆ ^θ）（１－ｃｏｓφ）を含み、
　ｕ＝（ｓｉｎ（ａ_ｃ，ｔ＋θ），ｃｏｓ（ａ_ｃ，ｔ＋φ），０）^Ｔであり、ｃｒｏｓｓ（ａ，ｂ）がａとｂの外積であり、ｄｏｔ（ａ，ｂ）がａとｂの内積であり、ａ^Ｔがａの転置である、学習データ拡張装置。
　請求項４の学習データ拡張装置であって、
　ａ_ｃ，ｔ＋θは、ａ_ｃ，ｔ－π／２、ａ_ｃ，ｔ、ａ_ｃ，ｔ＋π／２、ａ_ｃ，ｔ＋π、－ａ_ｃ，ｔ－π／２、－ａ_ｃ，ｔ、－ａ_ｃ，ｔ＋π／２、または－ａ_ｃ，ｔ＋πの何れかであり、
　ｅ_ｃ，ｔ＋φは、ｅ_ｃ，ｔまたは－ｅ_ｃ，ｔである、学習データ拡張装置。
　請求項１から５の何れかの学習データ拡張装置であって、
　前記到来信号が音響信号である、学習データ拡張装置。
　第１方向からの到来信号に対応する第１観測信号を入力とし、前記第１観測信号に対する角度回転操作を行って、前記第１方向と異なる第２方向からの到来信号に対応する第２観測信号を得る角度回転操作ステップと、
　前記第２観測信号を学習データの集合に追加する学習データ追加ステップと、
を有する学習データ拡張方法。
　請求項１から６の何れかの学習データ拡張装置としてコンピュータを機能させるためのプログラム。