JP2022140916A - データ生成装置、データ生成方法及びプログラム - Google Patents
データ生成装置、データ生成方法及びプログラム Download PDFInfo
- Publication number
- JP2022140916A JP2022140916A JP2021040980A JP2021040980A JP2022140916A JP 2022140916 A JP2022140916 A JP 2022140916A JP 2021040980 A JP2021040980 A JP 2021040980A JP 2021040980 A JP2021040980 A JP 2021040980A JP 2022140916 A JP2022140916 A JP 2022140916A
- Authority
- JP
- Japan
- Prior art keywords
- data
- augmentation
- parameter
- generated
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 67
- 238000013434 data augmentation Methods 0.000 claims abstract description 151
- 238000010801 machine learning Methods 0.000 claims abstract description 12
- 230000008859 change Effects 0.000 claims description 60
- 238000013500 data storage Methods 0.000 claims description 22
- 230000007613 environmental effect Effects 0.000 claims description 12
- 238000002715 modification method Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 3
- 238000006467 substitution reaction Methods 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 24
- 238000012549 training Methods 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Electrically Operated Instructional Devices (AREA)
- Image Analysis (AREA)
- Stored Programmes (AREA)
Abstract
【課題】利用者によるデータオーギュメンテーションの方針の決定を支援する仕組みを提供する。
【解決手段】対象物に対して判断を行う機械学習におけるデータを生成するデータ生成装置であって、データオーギュメンテーションを実施する、対象物を含む第1の元データを表示部に表示するオリジナルデータ表示部と、データオーギュメンテーションに関するパラメータの入力を受け付けるパラメータ受付部と、パラメータに基づいて、第1の元データにおける対象物以外のものに対するデータオーギュメンテーションによって生成した生成データを表示部に表示する生成データ表示部と、パラメータに基づくデータオーギュメンテーションを採用するか否かを受け付ける採用可否受付部と、を備える。
【選択図】図4
【解決手段】対象物に対して判断を行う機械学習におけるデータを生成するデータ生成装置であって、データオーギュメンテーションを実施する、対象物を含む第1の元データを表示部に表示するオリジナルデータ表示部と、データオーギュメンテーションに関するパラメータの入力を受け付けるパラメータ受付部と、パラメータに基づいて、第1の元データにおける対象物以外のものに対するデータオーギュメンテーションによって生成した生成データを表示部に表示する生成データ表示部と、パラメータに基づくデータオーギュメンテーションを採用するか否かを受け付ける採用可否受付部と、を備える。
【選択図】図4
Description
本発明は、データ生成装置、データ生成方法及びプログラムに関する。
機械学習モデルを構築するためには、多くの訓練用データを用いて訓練を行う必要がある。十分な量の訓練用データを得るため、データオーギュメンテーションによってデータ量を増やす方法が利用されている。
例えば引用文献1~3には、データオーギュメンテーションによって元の訓練用データに変化を加えることにより、限られた元データから多様な訓練用データを生成する方法が記載されている。
例えば学習環境の違いに合わせて訓練データを拡張する場合などには、利用者の知見によってどのようなデータオーギュメンテーションを行うと良いかをある程度想定できることが多い。しかし従来の方法では、データオーギュメンテーションの方針を、利用者の知見に基づいて柔軟に設定することを支援する仕組みがなかった。
本発明は、上述した事情を鑑みてなされたものであり、利用者によるデータオーギュメンテーションの方針の決定を支援する仕組みを提供することを目的とする。
本発明は、上述した課題を解決するために、以下の構成を採用する。
本発明の一側面に係るデータ生成装置は、対象物に対して判断を行う機械学習におけるデータを生成するデータ生成装置であって、データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示するオリジナルデータ表示部と、前記データオーギュメンテーションに関するパラメータの入力を受け付けるパラメータ受付部と、前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する生成データ表示部と、前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける採用可否受付部と、を備えたものである。対象物とは、機械学習の利用目的となる判断の対象となるものである。例えば、画像認識における認識対象(車両認識における車両等)や、音声認識におけるノイズや環境音を除く音声データ、意味抽出におけるテキストなど、学習モデルが、データ取得環境やデータ取得条件の影響を受けずに認識できるようにすべきものが挙げられる。
本発明の一側面に係るデータ生成装置は、対象物に対して判断を行う機械学習におけるデータを生成するデータ生成装置であって、データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示するオリジナルデータ表示部と、前記データオーギュメンテーションに関するパラメータの入力を受け付けるパラメータ受付部と、前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する生成データ表示部と、前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける採用可否受付部と、を備えたものである。対象物とは、機械学習の利用目的となる判断の対象となるものである。例えば、画像認識における認識対象(車両認識における車両等)や、音声認識におけるノイズや環境音を除く音声データ、意味抽出におけるテキストなど、学習モデルが、データ取得環境やデータ取得条件の影響を受けずに認識できるようにすべきものが挙げられる。
上記構成により、利用者が指定したパラメータに基づくデータ生成の結果を確認しながら、最終的に採用するパラメータを決定することができるので、利用者の知見に基づくデータオーギュメンテーションを効率的に行うことができる。
また、前記パラメータに基づく前記データオーギュメンテーションが採用された場合には、前記生成データを保存する生成データ保存部を備えるようにしてもよい。これにより、利用者の利用目的に合った生成データを、訓練データとして保存することができる。
また、前記パラメータは、前記対象物以外のものに関する情報及び/又はデータ取得条件の変更方法としてもよい。これにより、学習モデルによる認識対象等、データオーギュメンテーションの前後で不変であるべき対象物は変化させずに、訓練データのバリエーションを増やしたり、用途に合わせた訓練データに変換したりすることができる。
また、前記パラメータは、前記パラメータは、前記変更方法の程度についての情報としてもよい。これにより、変更の程度の強弱や大小などを柔軟に変更することができる。
また、前記データオーギュメンテーションを実施した際に用いた前記第1の元データを第2の元データとして、当該データオーギュメンテーションが採用された際の前記パラメータの情報を、前記第2の元データに紐づけて記憶するパラメータ記憶部と、前記パラメータ記憶部に前記パラメータの情報が記憶されている前記第2の元データと、前記データオーギュメンテーションを実施しようとする前記第1の元データとの類似度を算出する類似度算出部とをさらに備え、前記生成データ表示部は、前記データオーギュメンテーションを実施しようとする前記第1の元データとの類似度が最も高い第2の元データに紐づけられた前記パラメータに基づいて前記データオーギュメンテーションを実施し、前記生成データを前記表示部に表示するようにしてもよい。これにより、過去の記録に基づいて、類似するデータに対しては同様のデータオーギュメンテーションのパラメータを提示することができるので、利用者の作業をさらに効率化することができる。
また、前記データオーギュメンテーションによる前記生成データの利用目的の入力を受け付ける利用目的受付部と、前記データオーギュメンテーションが採用された際の前記パラメータの情報を、前記利用目的に紐づけて記憶するパラメータ記憶部と、をさらに備え、前記生成データ表示部は、入力された前記利用目的と一致する利用目的に紐づけられた前記パラメータに基づいて前記データオーギュメンテーションを実施し、前記生成データを前記表示部に表示するようにしてもよい。これにより、訓練データを使用する学習モデルの種類等に応じて利用目的を選択し、過去の記録に基づいて効率よくデータオーギュメンテーションの方針を決定することができる。
また、前記第1の元データは画像データであり、前記パラメータは、撮影距離の変更、撮影角度の変更、撮影時刻の変更、背景画像の変更、及び撮影時の天候条件の変更のうちの少なくとも1つとしてもよい。これにより、画像認識モデル等の訓練データの生成を効率よくおこなうことができる。
また、前記第1の元データは音声データまたは波形データであり、前記パラメータは、環境音の付与、及びノイズの付与のうちの少なくとも1つの変更方法としてもよい。これにより、音声認識モデル等の訓練データの生成を効率よくおこなうことができる。
また、前記第1の元データはテキストデータであり、前記パラメータは、置換、語順交換、及び感嘆詞付与のうちの少なくとも1つの変更方法としてもよい。これにより、意味解析モデル等の訓練データの生成を効率よくおこなうことができる。
また、複数の第1の元データを含む1つ以上のデータセットを記憶するオリジナルデータ記憶部と、前記データオーギュメンテーションを実施するデータセットの指定を受け付けるデータセット指定受付部をさらに備え、前記生成データ表示部は、指定されたデータセットに含まれる複数の第1の元データの一つに実施した前記データオーギュメンテーションの結果を表示し、前記生成データ保存部は、前記データオーギュメンテーションが採用された場合には、当該データセットに含まれる全ての第1の元データについて、採用された前記データオーギュメンテーションを実施し、全ての生成データを保存するようにしてもよい。これにより、同じ環境や取得条件で得られた複数の元データに対して、一括してデータオーギュメンテーションを実施することができる。
本発明の一側面に係るデータ生成方法は、コンピュータが、対象物に対して判断を行う機械学習におけるデータを生成するデータ生成方法であって、コンピュータが、データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示する工程と、コンピュータが、前記データオーギュメンテーションに関するパラメータの入力を受け付ける工程と、コンピュータが、前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する工程と、コンピュータが、前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける工程と、を含むものである。
上記構成により、利用者が指定したパラメータに基づくデータ生成の結果を確認しながら、最終的に採用するパラメータを決定することができるので、利用者の知見に基づくデータオーギュメンテーションを効率的に行うことができる。
本発明の一側面に係るプログラムは、対象物に対して判断を行う機械学習におけるデータを生成するコンピュータを、データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示するオリジナルデータ表示部と、前記データオーギュメンテーションに関するパラメータの入力を受け付けるパラメータ受付部と、前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する生成データ表示部と、前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける採用可否受付部として、機能させるものである。
上記構成により、利用者が指定したパラメータに基づくデータ生成の結果を確認しながら、最終的に採用するパラメータを決定することができるので、利用者の知見に基づくデータオーギュメンテーションを効率的に行うことができる。
本発明によれば、利用者によるデータオーギュメンテーションの方針の決定を支援する仕組みを提供することができる。
以下、本発明の一側面に係る実施の形態(以下「本実施形態」とも表記する)を、図面に基づいて説明する。ただし、以下で説明する実施形態は、あらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。
§1 適用例
図1を用いて、本発明が適用される場面の一例について説明する。本発明に係るデータ生成装置10は、深層学習モデルの学習などに用いる訓練データをデータオーギュメンテーションによって生成する装置であり、特に、利用者がデータオーギュメンテーションの方針を決定することを支援するユーザインタフェースを提供する。なお、データオーギュメンテーションはデータ拡張と呼ばれることもある。
図1を用いて、本発明が適用される場面の一例について説明する。本発明に係るデータ生成装置10は、深層学習モデルの学習などに用いる訓練データをデータオーギュメンテーションによって生成する装置であり、特に、利用者がデータオーギュメンテーションの方針を決定することを支援するユーザインタフェースを提供する。なお、データオーギュメンテーションはデータ拡張と呼ばれることもある。
図1は、データ生成装置10によって、ディスプレイに表示されるデータ生成画面を例示する図である。利用者は、データ生成画面上で、実際に生成されたデータを確認しながら、データオーギュメンテーションの方針(パラメータ)を決定することができる。パラメータには変更方法(撮影距離、撮影時刻等)と変更の程度(距離、時刻等)が含まれる。
データ生成画面は、データセット表示領域P1、元データ表示領域P2、生成データ表示領域P3、表示ボタンP4、元データ選択部P5、変換方法選択部P6、変換レベル選択部P7、採用ボタンP8を構成として備えている。元データ選択部P5と変換方法選択部P6は例えばプルダウンメニューであり、変換レベル選択部P7は例えばスライダーである。
利用者は、データセット表示部P1に表示されたデータセットの中から、データオーギュメンテーションの対象となるデータセット(例えば、農場Aで撮影された画像のデータセット)を選択する操作を行う。さらに、元データ選択部P5を操作して対象データセットの中から、サンプルとする画像データを選択する。具体的には、プルダウンメニューに、利用者が選択した対象データセットに含まれる画像ファイルのリストが表示されるので、その中から1つのファイルを選択することができる。また、リストから選択せずに、元データとして記憶されている画像データを表示し、その中から任意の画像データを選択するようにしてもよい。
利用者が表示ボタンP4を操作すると、元データ表示領域P2に、サンプルとして選択された元データが表示される。また、初期値として設定されているパラメータに基づいて元データに対するデータオーギュメンテーションが実施され、生成された画像が生成データ表示領域P3に表示される。例えば、初期値として変更方法「撮影距離」、変更の程度「10m」が設定されていれば、撮影距離を被写体(例えば、木)から10mの距離で撮影したことを想定した画像が生成される。
利用者は、表示された生成データを確認し、データオーギュメンテーションのパラメータを調節することができる。利用者は、変更方法を変えたい場合には変換方法選択部P6を操作し、変更の程度を変えたい場合には変換レベル選択部P7を操作する。例えば、変換レベル選択部P7のスライダーを操作して撮影距離をより遠く(近く)したりすることができる。パラメータを変更後、表示ボタンP4を操作すると、変更後のパラメータに基づいて生成された画像データが生成データ表示領域P3に表示される。
利用者は、表示された生成データを確認して、変更方法や変更の程度に問題がないと判断したら、採用ボタンP8を選択する。採用ボタンP8が選択されると、対象となるデータセットに含まれる全てのデータに対して採用されたパラメータでのデータオーギュメンテーションが実施され、生成されたデータが保存される。
なお、本実施形態では、画像データの中の対象物自体(図1の例では、「木」)を変化させるデータオーギュメンテーションは行わず、対象物の周囲(背景等)や撮影条件(撮影距離、撮影角度等)を変化させるデータオーギュメンテーションを行う。これにより、画像認識などの学習モデルにおいて、認識対象は変化させず、撮影条件や撮影環境を変更した訓練データを生成することができる。
生成されたデータは、例えば、ドメイン汎化学習用の所定の構造を有するデータであり、元データと共にドメイン汎化学習の訓練データに利用される。ドメイン汎化学習は、MLDG(Meta-Learning for Domain Generalization)やMTAN(Multi-Task Adversarial Network)など、ドメイン汎化学習の手法であればどのような手法でもよい。
§2 構成例
(1.ハードウェア構成)
次に、図2を参照しながら、本実施形態に係るデータ生成装置10のハードウェア構成の一例について説明する。
データ生成装置10は、ハードウェア資源として、メモリ11と、CPU12と、ビデオアダプタ13と、シリアルポートインターフェイス14と、ハードディスクドライブインターフェイス15と、ハードディスクドライブ16とを備えるコンピュータシステムである。
(1.ハードウェア構成)
次に、図2を参照しながら、本実施形態に係るデータ生成装置10のハードウェア構成の一例について説明する。
データ生成装置10は、ハードウェア資源として、メモリ11と、CPU12と、ビデオアダプタ13と、シリアルポートインターフェイス14と、ハードディスクドライブインターフェイス15と、ハードディスクドライブ16とを備えるコンピュータシステムである。
ハードディスクドライブ16は、ディスク媒体(例えば、磁気記録媒体又は光磁気記録媒体)である。ハードディスクドライブ16には、CPU12に実行されるコンピュータプログラムや、データオーギュメンテーションの対象となる元データの他、データオーギュメンテーションに必要な素材(音声データの拡張に用いる環境音素材や、テキストデータの拡張に用いる語彙変換の対応表等)が記憶されている。
ビデオアダプタ13には、ディスプレイ51が接続されている。ディスプレイ51は、データオーギュメンテーションの対象として選択された元データと、データオーギュメンテーション後のデータ、ユーザからの指示を受け付けるためのユーザインタフェース等が表示される。
シリアルポートインターフェイス14には、マウス52とキーボード53とスピーカー24が接続されている。なお、マウス52とキーボード53の他に、タッチパッド等の他の入力デバイスが接続されていてもよい。なお、データ生成装置10のハードウェア構成は図2に示したものには限られない。
(2.機能構成)
次に、図3を用いて、本実施形態に係るデータ生成装置10の機能構成の一例を説明する。図3は、CPU12によって実行される機能モジュールを示すブロック図である。図3に示すように、機能モジュールには、データセット指定受付部101、オリジナルデータ表示部102、パラメータ受付部103、生成データ表示部104、採用可否受付部105、生成データ保存部106が含まれる。
次に、図3を用いて、本実施形態に係るデータ生成装置10の機能構成の一例を説明する。図3は、CPU12によって実行される機能モジュールを示すブロック図である。図3に示すように、機能モジュールには、データセット指定受付部101、オリジナルデータ表示部102、パラメータ受付部103、生成データ表示部104、採用可否受付部105、生成データ保存部106が含まれる。
ハードディスクドライブ16には、オリジナルデータ記憶部161と生成データ記憶部162が実装されている。オリジナルデータ記憶部161には、データオーギュメンテーションの元データがデータセット毎に記憶されている。生成データ記憶部162には、データオーギュメンテーションにより生成したデータが記憶されている。
§3 動作例
次に、本実施形態に係るデータ生成装置10によるデータ生成方法について、図1の画面図と図4のフローチャートを用いて説明する。ここでは、元データとなる画像データにデータオーギュメンテーションを実施する例について説明するが、後述するように、データオーギュメンテーションの対象は画像データに限らず、音声データ、波形データ、テキストデータ等であってもよい。
次に、本実施形態に係るデータ生成装置10によるデータ生成方法について、図1の画面図と図4のフローチャートを用いて説明する。ここでは、元データとなる画像データにデータオーギュメンテーションを実施する例について説明するが、後述するように、データオーギュメンテーションの対象は画像データに限らず、音声データ、波形データ、テキストデータ等であってもよい。
ステップS101において、データ生成装置10のオリジナルデータ表示部102は、利用者によって指定された元データをオリジナルデータ記憶部161から取得し、ディスプレイ51の元データ表示領域P2に表示する。表示される元データは、図1に示すデータ生成画面上で、利用者が元データ選択部P5を操作することにより選択された画像データである。
ステップS102において、利用者が表示ボタンP4を操作したことを検出すると、データ生成装置10の生成データ表示部104は、データオーギュメンテーションのパラメータの初期値に基づいて、指定された元データのデータオーギュメンテーションを実施し、生成した画像データを生成データ表示領域P3に表示する。パラメータの初期値は、ハードディスクドライブ16にあらかじめ記憶されている。
ステップS103において、データ生成装置10は、ステップS102におけるデータオーギュメンテーションの結果を採用するか否かを受け付ける。利用者は、結果を採用する場合には、採用ボタンP8を選択する(YES)。採用ボタンP8が選択された場合には、ステップS107へ進む。一方、利用者は、結果を採用しない場合には、変換方法選択部P6を操作して変更方法を変えたり、変換レベル選択部P7を操作して変更の程度を変えたりすることにより、パラメータを変更する。
ステップS104において、データ生成装置10のパラメータ受付部103は、変更されたパラメータを受け付ける。さらに、ステップS105において、生成データ表示部104は、変更後のパラメータに基づいてデータオーギュメンテーションを実施し、ステップS106において生成した画像データを生成データ表示領域P3に表示する。その後、再びステップS103に戻り、利用者によってデータオーギュメンテーションの結果が採用されるまで、ステップS104~ステップS106を繰り返す。
採用ボタンP8の操作によって結果が採用されると、ステップS107において、対象のデータセット全体に採用されたパラメータでのデータオーギュメンテーションが実施される。さらに、ステップS108において、生成されたデータが、生成データ記憶部162に保存される。
§4 他の実施例
(実施例1)
次に、本実施形態に係るデータ生成装置10によるデータ生成方法の他の実施例について、図5のデータ生成画面図と、図6のフローチャートを用いて説明する。実施例1では、利用者は、複数の方針でデータオーギュメンテーションを行うことができる。
(実施例1)
次に、本実施形態に係るデータ生成装置10によるデータ生成方法の他の実施例について、図5のデータ生成画面図と、図6のフローチャートを用いて説明する。実施例1では、利用者は、複数の方針でデータオーギュメンテーションを行うことができる。
図5の例では、図1のデータ生成画面の構成に加え、さらに適用ボタンP9が設けられている。ステップS101~S106においては、図4のフローチャートの例と同様に、利用者が指定したパラメータに基づいてデータオーギュメンテーションを行い、生成したデータを生成データ表示領域P3に表示する(図5(a))。
利用者は、さらに別の方法でデータに変更を加えたい場合には、適用ボタンP9を選択する。これにより、初めに指定したパラメータによる変更で生成データが一旦仮決定される。さらに、利用者は、図5(b)に示すように、2段階目の変更に関するパラメータを変換方法選択部P6と変換レベル選択部P7を操作して入力する。図5(b)の例では、変更方法として「時刻」(撮影した時間帯)を指定している。変換レベル選択部P7を右へスライドさせるほど遅い時間帯となり、画面全体が暗くなるように変更することができる。
データ生成装置10は、ステップS201において、利用者が追加のパラメータを指定したことを検知すると(YES)、ステップS202において、指定されたパラメータに基づいて、仮決定された生成データを変換し、生成したデータを生成データ表示領域P3に表示する。
その後、再びステップS103に戻り、図4のフローチャートと同様に、利用者によってデータオーギュメンテーションの結果が採用されるまで、ステップS104~ステップS202を繰り返す。
採用ボタンP8の操作によって結果が採用されると、ステップS107において、対象のデータセット全体に採用されたパラメータでのデータオーギュメンテーションが実施される。さらに、ステップS108において、生成されたデータが、生成データ記憶部162に保存される。
(実施例2)
次に、本実施形態に係るデータ生成装置10によるデータ生成方法の他の実施例について、図7の機能構成図、図8のデータ生成画面図と、図9のフローチャートを用いて説明する。実施例2では、利用者は、過去にデータオーギュメンテーションを実施したデータの中から、指定した元データと類似するものを検出し、同様のパラメータにてデータオーギュメンテーションを行うことができる。
次に、本実施形態に係るデータ生成装置10によるデータ生成方法の他の実施例について、図7の機能構成図、図8のデータ生成画面図と、図9のフローチャートを用いて説明する。実施例2では、利用者は、過去にデータオーギュメンテーションを実施したデータの中から、指定した元データと類似するものを検出し、同様のパラメータにてデータオーギュメンテーションを行うことができる。
図7に示すように、実施例2では、図3の機能モジュールに加え、類似度算出部107が含まれている。また、ハードディスクドライブ16にはパラメータ記憶部163が実装されている。パラメータ記憶部163には、図8に示すように、過去にデータオーギュメンテーションを実施した元データ(「元データ」)に紐づけて、変更方法(「拡張方針」)、変更の程度(「拡張強度」)が記録されている。
ステップS101において、データ生成装置10は、指定された元データ(第1の元データ)を元データ表示領域P2に表示する。次に、データ生成装置10の類似度算出部107は、ステップS301において、パラメータ記憶部163に過去のパラメータの情報が記録されているか否かを判断する。過去のパラメータが記録されている場合には(YES)ステップS302へ進み、過去のパラメータが記録されていない場合には(NO)、ステップS104へ進む。
ステップS302において、類似度算出部107は、指定された元データと、パラメータ記憶部163に記録されている各々の元データ(第2の元データ)を比較し類似度を算出する。類似度の算出には、特徴点マッチング等の既存の手法を利用することができる。
ステップS303において、生成データ表示部104は、最も類似度が高い元データに紐づけられているパラメータにて、指定された元データのオーギュメンテーションを実施する。
その後、ステップS103に移行し、図4のフローチャートと同様に、利用者によってデータオーギュメンテーションの結果が採用されるまで、ステップS104~ステップS106を繰り返す。
採用ボタンP8の操作によって結果が採用されると、ステップS107において、対象のデータセット全体に採用されたパラメータでのデータオーギュメンテーションが実施される。さらに、ステップS108において、生成されたデータが、生成データ記憶部162に保存される。
図8(a)は、過去に行ったデータオーギュメンテーションの例を示しており、この時の元データとパラメータの情報がパラメータ記憶部163に記録されている。利用者が、図8(b)に示す元データを指定すると、類似度算出部107によって、元データの類似度の高さにより、図8(a)の時のパラメータが選択される。その結果、図8(b)に示すように、図8(a)と同様に撮影距離を変更するデータオーギュメンテーションが実施される。利用者は、生成データを確認し、パラメータを変更したい場合には、画面を操作して変更方法や変更の程度を変えることができる。
図10のフローチャートは、図9のフローチャートのステップS303の処理を変形した例を示している。ステップS401において、生成データ表示部104は、類似度が高い上位複数(例えば、3つ)の元データに紐づけられたパラメータにてそれぞれデータオーギュメンテーションを実施し、生成データ表示領域P3に表示する。
さらに、利用者が、表示された複数の生成データのうちの1つを選択する操作を行うと、選択された生成データに対応するパラメータに絞られた上で、ステップS103に移行する。以降、図9のフローチャートと同様に、利用者によってデータオーギュメンテーションの結果が採用されるまで、ステップS104~ステップS106を繰り返す。
(実施例3)
次に、本実施形態に係るデータ生成装置10によるデータ生成方法の他の実施例について、図11の機能構成図、図12のデータ生成画面図と、図13のフローチャートを用いて説明する。実施例3では、利用者は、タスク(訓練データを用いる学習モデルの用途)を指定すると、過去に同じタスク用にデータを生成した際のパラメータを使用してデータオーギュメンテーションを行うことができる。
次に、本実施形態に係るデータ生成装置10によるデータ生成方法の他の実施例について、図11の機能構成図、図12のデータ生成画面図と、図13のフローチャートを用いて説明する。実施例3では、利用者は、タスク(訓練データを用いる学習モデルの用途)を指定すると、過去に同じタスク用にデータを生成した際のパラメータを使用してデータオーギュメンテーションを行うことができる。
図11に示すように、実施例3では、図7の機能モジュールに加え、利用目的受付部108が含まれている。また、パラメータ記憶部163には、図12に示すように、過去に実施したデータオーギュメンテーションの「タスク」の情報に紐づけて、変更方法(「拡張方針」)、変更の程度(「拡張強度」)が記録されている。また、図12に示すように、図5のデータ生成画面の構成に加え、さらにタスク入力部P10とタスク決定ボタンP11が設けられている。
図13に示すように、ステップS101において、データ生成装置10は、指定された元データを元データ表示領域P2に表示する。利用者は、タスクを指定してデータオーギュメンテーションを行う場合には、タスク入力部P10にタスク名を入力し、タスク決定ボタンP11を操作することにより、タスクを指定する。
データ生成装置10の利用目的受付部108は、ステップS501において、タスクが指定されたことを検知すると(YES)、ステップS502へ進む。タスクが指定されない場合には(NO)、ステップS104へ進む。
ステップS502において、利用目的受付部108は、パラメータ記憶部163に、指定されたタスクに紐づけられた過去のパラメータの情報が記録されているか否かを判断する。過去のパラメータが記録されている場合には(YES)ステップS503へ進み、記録されていない場合には(NO)、ステップS104へ進む。
ステップS503において、生成データ表示部104は、指定されたタスクに紐づけられた過去のパラメータにてデータオーギュメンテーションを実施し、生成データを生成データ表示領域P3に表示する。
その後、ステップS103に移行し、図4のフローチャートと同様に、利用者によってデータオーギュメンテーションの結果が採用されるまで、ステップS104~ステップS106を繰り返す。
採用ボタンP8の操作によって結果が採用されると、ステップS107において、対象のデータセット全体に採用されたパラメータでのデータオーギュメンテーションが実施される。さらに、ステップS108において、生成されたデータが、生成データ記憶部162に保存される。
図12(a)は、過去に行ったデータオーギュメンテーションの例を示しており、この時のタスクとパラメータの情報がパラメータ記憶部163に記録されている。利用者が、図12(b)に示すようにタスク名(「葉面積予測」)を指定すると、利用目的受付部108によって、過去に同じタスク名が指定された図12(a)の時のパラメータが選択される。その結果、図12(b)に示すように、図12(a)と同様に撮影時刻を変更するデータオーギュメンテーションが実施される。利用者は、生成データを確認し、パラメータを変更したい場合には、画面を操作して変更方法や変更の程度を変えることができる。
上記の実施例では、画像データのオーギュメンテーションを行っているが、対象データは画像データ以外のものであってもよい。以下、例として、本発明を音声データ、波形データ、テキストデータのデータオーギュメンテーションに適用する場合について説明する。
図14(a)、(b)は、音声データのデータオーギュメンテーションを行う際のデータ生成画面を例示する図である。図14に示すように、音声データのある時刻における周波数成分が表示される。画像データの場合と同様に、利用者が元データを指定し、パラメータとして変更方法(例えば「環境音付与(道路)」)と変更の程度を指定すると、指定されたパラメータにて変換された音声データが再生される。また、採用ボタンP8を操作すると、選択したデータセット全体に同じパラメータでのデータオーギュメンテーションが適用される。
また、図14(b)に示すように、複数のパラメータを組み合わせて2段階のデータオーギュメンテーションを行うこともできる。例えば、はじめに環境音(道路)を付与する処理を行い、次にマイクノイズを付与する処理を実施してデータを生成することができる。
環境音(車、電車、話し声、風等)を付与する場合、まず元の音声データに含まれているノイズや環境音を除去してから、あらかじめ録音した環境音を重畳するようにしてもよい。また、元データの長さに合わせて、環境音を複製・結合した上で重畳するようにしてもよい。また、変更の程度は、S/N比の大きさとすることができる。
また、マイクノイズを付与する場合には、元データに含まれているノイズや環境音を除去してから、ガウス分布や一様分布から生成した雑音を付与するようにしてもよい。変更の程度は、S/N比の大きさや音圧とすることができる。
図15(a)、(b)は、テキストデータのデータオーギュメンテーションを行う際のデータ生成画面を例示する図である。画像データの場合と同様に、利用者が元データを指定し、パラメータとして変更方法(例えば「語尾変換(です)」)を指定すると、指定されたパラメータにて変換されたテキストデータが表示される。また、採用ボタンP8を操作すると、選択したデータセット全体に同じパラメータでのデータオーギュメンテーションが適用される。
また、図15(b)に示すように、複数のパラメータを組み合わせて2段階のデータオーギュメンテーションを行うこともできる。例えば、はじめに語尾を「です」に変換する処理を行い、次に感嘆詞「うん」を付与する処理を実施してデータを生成することができる。
テキストデータの変更方法の例としては、「置換」、「語順交換」、「感嘆詞付与」等が挙げられる。「置換」は、例えば語尾を「~だ」から「~です」に変換するような処理であり、あらかじめ用意した置換表に従って置換を行うようにしてもよい。また、「語順交換」は、元のテキストデータを形態素に分け、「SOV」の語順を「OSV」に入れ替えるような処理である。また、「感嘆詞付与」は、「あ!」や「う~ん…」のような、元のテキストの意味を変えないような言葉を追加する処理である。なお、テキストデータのオーギュメンテーションには変更の程度の概念がないため、変換レベル選択部P7は表示されないようにしてもよい。
以上のように、本実施形態によれば、利用者が指定した元データと、元データに対してデータオーギュメンテーションを行った生成データとを表示し、利用者が生成データを確認しながら、データオーギュメンテーションの方針(パラメータ)を設定できるようにした。これにより、利用者が指定したパラメータに基づくデータ生成の結果を確認しながら、最終的に採用するパラメータを決定することができるので、利用者の知見に基づくデータオーギュメンテーションを効率的に行うことができる。
また、データオーギュメンテーションの方針は、変換の前後で不変であることが望ましい対象物以外のものに対して行うものを指定できるようにした。これにより、汎化学習に適した訓練データのバリエーションを増やしたり、用途に合わせた訓練データに変換したりすることができる。
また、過去の記録の中から、指定された元データと類似するデータに対して実施したデータオーギュメンテーションのパラメータを提示するようにしたので、利用者の作業をさらに効率化することができる。
また、過去の記録の中から、利用者が指定した利用目的と一致するデータオーギュメンテーションのパラメータを提示するようにしたので、利用目的に合ったデータを生成したい利用者の作業を効率化することができる。
以上、本発明の実施の形態を詳細に説明してきたが、上述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。なお、上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
(付記1)
対象物に対して判断を行う機械学習におけるデータを生成するデータ生成装置であって、
データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示するオリジナルデータ表示部と、
前記データオーギュメンテーションに関するパラメータの入力を受け付けるパラメータ受付部と、
前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する生成データ表示部と、
前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける採用可否受付部と、を備えたデータ生成装置。
対象物に対して判断を行う機械学習におけるデータを生成するデータ生成装置であって、
データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示するオリジナルデータ表示部と、
前記データオーギュメンテーションに関するパラメータの入力を受け付けるパラメータ受付部と、
前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する生成データ表示部と、
前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける採用可否受付部と、を備えたデータ生成装置。
(付記2)
前記パラメータに基づく前記データオーギュメンテーションが採用された場合には、前記生成データを保存する生成データ保存部を備えた付記1に記載のデータ生成装置。
前記パラメータに基づく前記データオーギュメンテーションが採用された場合には、前記生成データを保存する生成データ保存部を備えた付記1に記載のデータ生成装置。
(付記3)
前記パラメータは、前記対象物以外のものに関する情報及び/又はデータ取得条件の変更方法である、付記1または2に記載のデータ生成装置。
前記パラメータは、前記対象物以外のものに関する情報及び/又はデータ取得条件の変更方法である、付記1または2に記載のデータ生成装置。
(付記4)
前記パラメータは、前記変更方法の程度についての情報である、付記3に記載のデータ生成装置。
前記パラメータは、前記変更方法の程度についての情報である、付記3に記載のデータ生成装置。
(付記5)
前記データオーギュメンテーションを実施した際に用いた前記第1の元データを第2の元データとして、当該データオーギュメンテーションが採用された際の前記パラメータの情報を、前記第2の元データに紐づけて記憶するパラメータ記憶部と、
前記パラメータ記憶部に前記パラメータの情報が記憶されている前記第2の元データと、前記データオーギュメンテーションを実施しようとする前記第1の元データとの類似度を算出する類似度算出部とをさらに備え、
前記生成データ表示部は、
前記データオーギュメンテーションを実施しようとする前記第1の元データとの類似度が最も高い第2の元データに紐づけられた前記パラメータに基づいて前記データオーギュメンテーションを実施し、前記生成データを前記表示部に表示する、付記1から4のいずれか1項に記載のデータ生成装置。
前記データオーギュメンテーションを実施した際に用いた前記第1の元データを第2の元データとして、当該データオーギュメンテーションが採用された際の前記パラメータの情報を、前記第2の元データに紐づけて記憶するパラメータ記憶部と、
前記パラメータ記憶部に前記パラメータの情報が記憶されている前記第2の元データと、前記データオーギュメンテーションを実施しようとする前記第1の元データとの類似度を算出する類似度算出部とをさらに備え、
前記生成データ表示部は、
前記データオーギュメンテーションを実施しようとする前記第1の元データとの類似度が最も高い第2の元データに紐づけられた前記パラメータに基づいて前記データオーギュメンテーションを実施し、前記生成データを前記表示部に表示する、付記1から4のいずれか1項に記載のデータ生成装置。
(付記6)
前記データオーギュメンテーションによる前記生成データの利用目的の入力を受け付ける利用目的受付部と、
前記データオーギュメンテーションが採用された際の前記パラメータの情報を、前記利用目的に紐づけて記憶するパラメータ記憶部と、をさらに備え、
前記生成データ表示部は、
入力された前記利用目的と一致する利用目的に紐づけられた前記パラメータに基づいて前記データオーギュメンテーションを実施し、前記生成データを前記表示部に表示する、付記1から5のいずれか1項に記載のデータ生成装置。
前記データオーギュメンテーションによる前記生成データの利用目的の入力を受け付ける利用目的受付部と、
前記データオーギュメンテーションが採用された際の前記パラメータの情報を、前記利用目的に紐づけて記憶するパラメータ記憶部と、をさらに備え、
前記生成データ表示部は、
入力された前記利用目的と一致する利用目的に紐づけられた前記パラメータに基づいて前記データオーギュメンテーションを実施し、前記生成データを前記表示部に表示する、付記1から5のいずれか1項に記載のデータ生成装置。
(付記7)
前記第1の元データは画像データであり、
前記パラメータは、撮影距離の変更、撮影角度の変更、撮影時刻の変更、背景画像の変更、及び撮影時の天候条件の変更のうちの少なくとも1つである、付記3に記載のデータ生成装置。
前記第1の元データは画像データであり、
前記パラメータは、撮影距離の変更、撮影角度の変更、撮影時刻の変更、背景画像の変更、及び撮影時の天候条件の変更のうちの少なくとも1つである、付記3に記載のデータ生成装置。
(付記8)
前記第1の元データは音声データまたは波形データであり、
前記パラメータは、環境音の付与、及びノイズの付与のうちの少なくとも1つの変更方法である、付記3に記載のデータ生成装置。
前記第1の元データは音声データまたは波形データであり、
前記パラメータは、環境音の付与、及びノイズの付与のうちの少なくとも1つの変更方法である、付記3に記載のデータ生成装置。
(付記9)
前記第1の元データはテキストデータであり、
前記パラメータは、置換、語順交換、及び感嘆詞付与のうちの少なくとも1つの変更方法である、付記3に記載のデータ生成装置。
前記第1の元データはテキストデータであり、
前記パラメータは、置換、語順交換、及び感嘆詞付与のうちの少なくとも1つの変更方法である、付記3に記載のデータ生成装置。
(付記10)
複数の第1の元データを含む1つ以上のデータセットを記憶するオリジナルデータ記憶部と、
前記データオーギュメンテーションを実施するデータセットの指定を受け付けるデータセット指定受付部をさらに備え、
前記生成データ表示部は、
指定されたデータセットに含まれる複数の第1の元データの一つに実施した前記データオーギュメンテーションの結果を表示し、
前記生成データ保存部は、
前記データオーギュメンテーションが採用された場合には、当該データセットに含まれる全ての第1の元データについて、採用された前記データオーギュメンテーションを実施し、全ての生成データを保存する、付記2に記載のデータ生成装置。
複数の第1の元データを含む1つ以上のデータセットを記憶するオリジナルデータ記憶部と、
前記データオーギュメンテーションを実施するデータセットの指定を受け付けるデータセット指定受付部をさらに備え、
前記生成データ表示部は、
指定されたデータセットに含まれる複数の第1の元データの一つに実施した前記データオーギュメンテーションの結果を表示し、
前記生成データ保存部は、
前記データオーギュメンテーションが採用された場合には、当該データセットに含まれる全ての第1の元データについて、採用された前記データオーギュメンテーションを実施し、全ての生成データを保存する、付記2に記載のデータ生成装置。
(付記11)
コンピュータが、対象物に対して判断を行う機械学習におけるデータを生成するデータ生成方法であって、
コンピュータが、データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示する工程と、
コンピュータが、前記データオーギュメンテーションに関するパラメータの入力を受け付ける工程と、
コンピュータが、前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する工程と、
コンピュータが、前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける工程と、を含むデータ生成方法。
コンピュータが、対象物に対して判断を行う機械学習におけるデータを生成するデータ生成方法であって、
コンピュータが、データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示する工程と、
コンピュータが、前記データオーギュメンテーションに関するパラメータの入力を受け付ける工程と、
コンピュータが、前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する工程と、
コンピュータが、前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける工程と、を含むデータ生成方法。
(付記12)
対象物に対して判断を行う機械学習におけるデータを生成するコンピュータを、
データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示するオリジナルデータ表示部と、
前記データオーギュメンテーションに関するパラメータの入力を受け付けるパラメータ受付部と、
前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する生成データ表示部と、
前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける採用可否受付部として、機能させるプログラム。
対象物に対して判断を行う機械学習におけるデータを生成するコンピュータを、
データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示するオリジナルデータ表示部と、
前記データオーギュメンテーションに関するパラメータの入力を受け付けるパラメータ受付部と、
前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する生成データ表示部と、
前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける採用可否受付部として、機能させるプログラム。
10…データ生成装置、11…メモリ、12…CPU、13…ビデオアダプタ、14…シリアルポートインターフェイス、15…ハードディスクドライブインターフェイス、16…ハードディスクドライブ、51…ディスプレイ、52…マウス、53…キーボード、54…スピーカー、101…データセット指定受付部、102…オリジナルデータ表示部、103…パラメータ受付部、104…生成データ表示部、105…採用可否受付部、106…生成データ保存部、107…類似度算出部、108…利用目的受付部、161…オリジナルデータ記憶部、162…生成データ記憶部、163…パラメータ記憶部
Claims (12)
- 対象物に対して判断を行う機械学習におけるデータを生成するデータ生成装置であって、
データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示するオリジナルデータ表示部と、
前記データオーギュメンテーションに関するパラメータの入力を受け付けるパラメータ受付部と、
前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する生成データ表示部と、
前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける採用可否受付部と、を備えたデータ生成装置。 - 前記パラメータに基づく前記データオーギュメンテーションが採用された場合には、前記生成データを保存する生成データ保存部を備えた請求項1に記載のデータ生成装置。
- 前記パラメータは、前記対象物以外のものに関する情報及び/又はデータ取得条件の変更方法である、請求項1または2に記載のデータ生成装置。
- 前記パラメータは、前記変更方法の程度についての情報である、請求項3に記載のデータ生成装置。
- 前記データオーギュメンテーションを実施した際に用いた前記第1の元データを第2の元データとして、当該データオーギュメンテーションが採用された際の前記パラメータの情報を、前記第2の元データに紐づけて記憶するパラメータ記憶部と、
前記パラメータ記憶部に前記パラメータの情報が記憶されている前記第2の元データと、前記データオーギュメンテーションを実施しようとする前記第1の元データとの類似度を算出する類似度算出部とをさらに備え、
前記生成データ表示部は、
前記データオーギュメンテーションを実施しようとする前記第1の元データとの類似度が最も高い第2の元データに紐づけられた前記パラメータに基づいて前記データオーギュメンテーションを実施し、前記生成データを前記表示部に表示する、請求項1から4のいずれか1項に記載のデータ生成装置。 - 前記データオーギュメンテーションによる前記生成データの利用目的の入力を受け付ける利用目的受付部と、
前記データオーギュメンテーションが採用された際の前記パラメータの情報を、前記利用目的に紐づけて記憶するパラメータ記憶部と、をさらに備え、
前記生成データ表示部は、
入力された前記利用目的と一致する利用目的に紐づけられた前記パラメータに基づいて前記データオーギュメンテーションを実施し、前記生成データを前記表示部に表示する、請求項1から5のいずれか1項に記載のデータ生成装置。 - 前記第1の元データは画像データであり、
前記パラメータは、撮影距離の変更、撮影角度の変更、撮影時刻の変更、背景画像の変更、及び撮影時の天候条件の変更のうちの少なくとも1つである、請求項3に記載のデータ生成装置。 - 前記第1の元データは音声データまたは波形データであり、
前記パラメータは、環境音の付与、及びノイズの付与のうちの少なくとも1つの変更方法である、請求項3に記載のデータ生成装置。 - 前記第1の元データはテキストデータであり、
前記パラメータは、置換、語順交換、及び感嘆詞付与のうちの少なくとも1つの変更方法である、請求項3に記載のデータ生成装置。 - 複数の第1の元データを含む1つ以上のデータセットを記憶するオリジナルデータ記憶部と、
前記データオーギュメンテーションを実施するデータセットの指定を受け付けるデータセット指定受付部をさらに備え、
前記生成データ表示部は、
指定されたデータセットに含まれる複数の第1の元データの一つに実施した前記データオーギュメンテーションの結果を表示し、
前記生成データ保存部は、
前記データオーギュメンテーションが採用された場合には、当該データセットに含まれる全ての第1の元データについて、採用された前記データオーギュメンテーションを実施し、全ての生成データを保存する、請求項2に記載のデータ生成装置。 - コンピュータが、対象物に対して判断を行う機械学習におけるデータを生成するデータ生成方法であって、
コンピュータが、データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示する工程と、
コンピュータが、前記データオーギュメンテーションに関するパラメータの入力を受け付ける工程と、
コンピュータが、前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する工程と、
コンピュータが、前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける工程と、を含むデータ生成方法。 - 対象物に対して判断を行う機械学習におけるデータを生成するコンピュータを、
データオーギュメンテーションを実施する、前記対象物を含む第1の元データを表示部に表示するオリジナルデータ表示部と、
前記データオーギュメンテーションに関するパラメータの入力を受け付けるパラメータ受付部と、
前記パラメータに基づいて、前記第1の元データにおける前記対象物以外のものに対する前記データオーギュメンテーションによって生成した生成データを前記表示部に表示する生成データ表示部と、
前記パラメータに基づく前記データオーギュメンテーションを採用するか否かを受け付ける採用可否受付部として、機能させるプログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021040980A JP2022140916A (ja) | 2021-03-15 | 2021-03-15 | データ生成装置、データ生成方法及びプログラム |
CN202280018059.6A CN116964623A (zh) | 2021-03-15 | 2022-02-25 | 数据生成装置、数据生成方法以及程序 |
EP22771049.8A EP4310774A1 (en) | 2021-03-15 | 2022-02-25 | Data generation device, data generation method, and program |
PCT/JP2022/007911 WO2022196293A1 (ja) | 2021-03-15 | 2022-02-25 | データ生成装置、データ生成方法及びプログラム |
TW111107753A TWI814268B (zh) | 2021-03-15 | 2022-03-03 | 資料生成裝置、資料生成方法及電腦程式產品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021040980A JP2022140916A (ja) | 2021-03-15 | 2021-03-15 | データ生成装置、データ生成方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022140916A true JP2022140916A (ja) | 2022-09-29 |
Family
ID=83321235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021040980A Pending JP2022140916A (ja) | 2021-03-15 | 2021-03-15 | データ生成装置、データ生成方法及びプログラム |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP4310774A1 (ja) |
JP (1) | JP2022140916A (ja) |
CN (1) | CN116964623A (ja) |
TW (1) | TWI814268B (ja) |
WO (1) | WO2022196293A1 (ja) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8781202B2 (en) * | 2012-07-26 | 2014-07-15 | International Business Machines Corporation | Tumor classification based on an analysis of a related ultrasonic attenuation map |
US20180247227A1 (en) * | 2017-02-24 | 2018-08-30 | Xtract Technologies Inc. | Machine learning systems and methods for data augmentation |
JP7124404B2 (ja) | 2018-04-12 | 2022-08-24 | 富士通株式会社 | 機械学習プログラム、機械学習方法および機械学習装置 |
JP7014100B2 (ja) | 2018-08-27 | 2022-02-01 | 日本電信電話株式会社 | 拡張装置、拡張方法及び拡張プログラム |
JP6541920B1 (ja) * | 2018-10-11 | 2019-07-10 | 三菱電機株式会社 | 情報処理装置、プログラム及び情報処理方法 |
JP2020166397A (ja) | 2019-03-28 | 2020-10-08 | パナソニックIpマネジメント株式会社 | 画像処理装置、画像処理方法、及びプログラム |
US11113532B2 (en) * | 2019-04-16 | 2021-09-07 | Lg Electronics Inc. | Artificial intelligence apparatus for recognizing object and method therefor |
CN112132058B (zh) * | 2020-09-25 | 2022-12-27 | 山东大学 | 一种头部姿态估计方法及其实现系统、存储介质 |
-
2021
- 2021-03-15 JP JP2021040980A patent/JP2022140916A/ja active Pending
-
2022
- 2022-02-25 WO PCT/JP2022/007911 patent/WO2022196293A1/ja active Application Filing
- 2022-02-25 CN CN202280018059.6A patent/CN116964623A/zh active Pending
- 2022-02-25 EP EP22771049.8A patent/EP4310774A1/en active Pending
- 2022-03-03 TW TW111107753A patent/TWI814268B/zh active
Also Published As
Publication number | Publication date |
---|---|
EP4310774A1 (en) | 2024-01-24 |
TW202238461A (zh) | 2022-10-01 |
WO2022196293A1 (ja) | 2022-09-22 |
CN116964623A (zh) | 2023-10-27 |
TWI814268B (zh) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2632424C2 (ru) | Способ и сервер для синтеза речи по тексту | |
US6175820B1 (en) | Capture and application of sender voice dynamics to enhance communication in a speech-to-text environment | |
CN102737101B (zh) | 用于自然用户界面系统的组合式激活 | |
US8219223B1 (en) | Editing audio assets | |
CN108831437B (zh) | 一种歌声生成方法、装置、终端和存储介质 | |
US8392004B2 (en) | Automatic audio adjustment | |
US20180033434A1 (en) | System and method for eliciting open-ended natural language responses to questions to train natural language processors | |
CN105957515B (zh) | 声音合成方法、声音合成装置和存储声音合成程序的介质 | |
WO2012140468A1 (en) | Method for generating a sound effect in a piece of game software, associated computer program and data processing system for executing instructions of the computer program | |
CN112037755B (zh) | 一种基于音色克隆的语音合成方法、装置及电子设备 | |
CN108241596A (zh) | 一种演示文稿的制作方法和装置 | |
US20090177473A1 (en) | Applying vocal characteristics from a target speaker to a source speaker for synthetic speech | |
JP2021101252A (ja) | 情報処理方法、情報処理装置およびプログラム | |
Schlögl et al. | WebWOZ: a wizard of oz prototyping framework | |
JP2008145769A (ja) | 対話シナリオ生成システム,その方法およびプログラム | |
KR102072627B1 (ko) | 음성 합성 장치 및 상기 음성 합성 장치에서의 음성 합성 방법 | |
US8239199B2 (en) | Replacing an audio portion | |
WO2022196293A1 (ja) | データ生成装置、データ生成方法及びプログラム | |
US20060074676A1 (en) | Quantitative model for formant dynamics and contextually assimilated reduction in fluent speech | |
JP7331044B2 (ja) | 情報処理方法、装置、システム、電子機器、記憶媒体およびコンピュータプログラム | |
WO2021259073A1 (en) | System for voice-to-text tagging for rich transcription of human speech | |
KR102020341B1 (ko) | 악보 구현 및 음원 재생 시스템 및 그 방법 | |
JP2006189799A (ja) | 選択可能な音声パターンの音声入力方法及び装置 | |
CN112233660A (zh) | 用户画像扩充方法、装置、控制器和用户画像获取系统 | |
JP7128222B2 (ja) | 映像コンテンツに対する合成音のリアルタイム生成を基盤としたコンテンツ編集支援方法およびシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240116 |