JP6522173B1 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP6522173B1 JP6522173B1 JP2018004598A JP2018004598A JP6522173B1 JP 6522173 B1 JP6522173 B1 JP 6522173B1 JP 2018004598 A JP2018004598 A JP 2018004598A JP 2018004598 A JP2018004598 A JP 2018004598A JP 6522173 B1 JP6522173 B1 JP 6522173B1
- Authority
- JP
- Japan
- Prior art keywords
- user
- label information
- image
- information
- class name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Abstract
Description
例えば、画像から物体を認識するモデルを生成するのに必要なラベル情報として、その物体が撮影されている画像から、その物体がある位置(例えば、その物体を囲んでいる矩形の位置)とその物体の名称のペアがラベル情報となる。正解率を高めるために、機械学習に必要なラベル情報数は膨大である。そして、このラベル情報は、人間が作成する必要がある。つまり、ラベル情報の作成は、コストが高いプロセスである。
本発明は、ラベル情報の作成依頼に応じて、一般ユーザーが作成したラベル情報又はラベル情報を用いて機械学習を行った結果を提供するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
請求項1の発明は、第1のユーザーが用いる端末及び第2のユーザーが用いる端末と通信回線を介して接続されている情報処理装置であって、前記第1のユーザーから、機械学習の対象が撮影されている画像と該対象のクラス名を受け付ける第1の受付手段と、前記画像と前記クラス名を前記第2のユーザーに表示する表示手段と、前記第2のユーザーから、前記画像内で前記クラス名の対象が撮影されている領域の情報を少なくとも含むラベル情報を受け付ける第2の受付手段と、前記ラベル情報又は該ラベル情報を用いて機械学習を行った結果を前記第1のユーザーに提供する提供手段と、前記画像と同じ画像であって前記クラス名と同じクラス名についてのラベル情報が複数ある場合は、既に機械学習されたモデルを用いて、いずれかのラベル情報を選択する選択手段を有し、前記提供手段は、前記選択手段によって選択されたラベル情報又は該ラベル情報を用いて機械学習を行った結果を前記第1のユーザーに提供する、情報処理装置である。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係、ログイン等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。また、「A、B、C」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その1つのみを選んでいる場合(例えば、Aのみ)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
情報処理装置100は、第1のユーザーが用いるユーザー端末250及び第2のユーザーが用いる発注者・購入者用端末200と通信回線299を介して接続されている。
第1のユーザーとして、発注を行う者又は購入を行う者(法人等を含めてもよい)が該当する。例えば、企業における社員であって、機械学習用の学習データ(教師データ)であるラベル情報の作成を依頼する者、又は、第2のユーザーが自主的に作成したラベル情報又はそのラベル情報を用いて機械学習を行った結果を購入する者である。「ラベル情報を用いて機械学習を行った結果」とは、機械学習後のモデルをいい、認識処理、判別処理等を行う。
第2のユーザーとして、一般ユーザーであって、ラベリング処理(ラベル情報の作成処理)を行う者が該当する。
発注者・購入者管理モジュール110は、第1のユーザーである発注者又は購入者の管理を行う。
ユーザー管理モジュール115は、第2のユーザーである一般ユーザーの管理を行う。
具体的には、報酬は、ラベル情報の単価、作成したラベル情報の数を用いて算出される。また、ラベル情報の品質に応じて、報酬を算出してもよい。具体的には、ラベル情報の正確性に応じて、報酬額を高くするようにしてもよい。
第1のユーザーとして、ラベル情報の発注を行う者(法人等を含めてもよい)が該当する。例えば、企業における社員であって、機械学習用の学習データ(教師データ)であるラベル情報の作成を依頼する者である。
第2のユーザーとして、一般ユーザーであって、ラベリング処理を行う者が該当する。
情報処理装置100は、第1のユーザーの発注に応じて機械学習に必要な学習データを第2のユーザーに生成させる。
ユーザー用UIモジュール125は、画像とクラス名を第2のユーザーに表示する。つまり、第1のユーザーからの依頼を第2のユーザーに表示し、第2のユーザーは、画像からクラス名の対象物を選択するラベリング作業を行う。具体的には、第2のユーザーは、表示された素材画像に対して、指定されたクラス名の対象物を矩形で囲む処理を行う。
そして、ユーザー用UIモジュール125は、第2のユーザーから、画像内でクラス名の対象が撮影されている領域の情報を少なくとも含むラベル情報(ラベリング作業の結果)を受け付ける。
発注者・購入者用UIモジュール120は、データベース130内のラベル情報、又は、そのラベル情報を用いて学習処理モジュール140が機械学習を行った結果を第1のユーザーに提供する。
ここで「既に機械学習されたモデル」として、例えば、既に収集したラベル情報を用いて機械学習されたモデルであってもよいし、他のクラス名で機械学習されたモデルであってもよい。前者は教師データが少ない状態で機械学習が行われたモデルとなる。後者については、後述する。
また、ラベル情報処理モジュール135は、モデルによる処理結果であるラベル情報と最も近いラベル情報を生成した第2のユーザーのラベル情報を選択するようにしてもよい。
また、ラベル情報処理モジュール135は、モデルが複数ある場合は、複数のモデルによる処理結果のラベル情報の論理積を行い、その論理積の結果と最も近いラベル情報を生成した第2のユーザーのラベル情報を選択するようにしてもよい。
第1のユーザーとして、ラベル情報の購入を行う者(法人等を含めてもよい)が該当する。例えば、企業における社員であって、第2のユーザーが自主的に作成したラベル情報又はそのラベル情報を用いて機械学習を行った結果を購入する者である。
第2のユーザーとして、一般ユーザーであって、自主的にラベリング処理を行う者が該当する。
情報処理装置100は、第2のユーザーが自主的に作成したラベル情報又はそのラベル情報を用いて機械学習を行った結果を、第1のユーザーに提供することができる。
発注者・購入者用UIモジュール120は、ラベル情報を第1のユーザーに表示する。具体的には、クラス名とそのクラス名の対象物が矩形で囲まれた画像の組み合わせを、第1のユーザーに表示する。いわば、商品又は商品見本の展示に該当する。なお、表示する画像はサムネイル画像としてもよい。
そして、発注者・購入者用UIモジュール120は、第1のユーザーによる購入操作にしたがって、第1の処理例と同様に、ラベル情報又はそのラベル情報を用いて機械学習を行った結果を、その第1のユーザーに提供する。
第3の処理例は、第1の処理例と第2の処理例を組み合わせたものである。
例えば、第1の処理例において、第1のユーザーが提供した素材画像(発注者・購入者用UIモジュール120が受け付けた機械学習の対象が撮影されている画像)だけでは不足している場合、第2の処理例において示した第2のユーザーが自主的に作成したラベル情報を付加するものである。
発注者・購入者用UIモジュール120は、第1のユーザーから、機械学習の対象が撮影されている画像とその対象のクラス名を受け付ける。
ユーザー用UIモジュール125は、画像とクラス名を第2のユーザーに表示する。
ユーザー用UIモジュール125は、第2のユーザーから、画像内でクラス名の対象が撮影されている領域の情報を少なくとも含む第1のラベル情報を受け付ける。つまり、第1のユーザーからの依頼に対応するラベル情報である。
発注者・購入者用UIモジュール120は、第2のラベル情報を第1のユーザーに表示する。
発注者・購入者用UIモジュール120は、第1のユーザーによる第2のラベル情報の購入操作にしたがって、第1のラベル情報と第2のラベル情報、又は、第1のラベル情報と第2のラベル情報を用いて機械学習を行った結果を第1のユーザーに提供する。
情報処理装置100、発注者・購入者用端末200A、発注者・購入者用端末200B、発注者・購入者用端末200C、ユーザー端末250A、ユーザー端末250B、ユーザー端末250C、ユーザー端末250Dは、通信回線299を介してそれぞれ接続されている。通信回線299は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、情報処理装置100による機能は、クラウドサービスとして実現してもよい。
情報処理装置100は、第1のユーザーが用いるユーザー端末250及び第2のユーザーが用いる発注者・購入者用端末200と通信回線299を介して接続されている。
前述の第2の処理例では、例えば、第2のユーザーが用いるユーザー端末250から自主的に作成したラベル情報を受け取って、第1のユーザーが用いる発注者・購入者用端末200に渡す。
前述の第3の処理例では、例えば、第1のユーザーが用いる発注者・購入者用端末200からラベル情報の作成依頼を受け付け、第2のユーザーが用いるユーザー端末250から作成依頼のあったラベル情報と自主的に作成したラベル情報を受け取って、その発注者・購入者用端末200に渡す。
発注者・購入者用端末200においては、発注者の操作によって、情報処理装置100が提供している画面から、対象とするクラス名を選択する。図3の例では、クラス名は階層的になっており、お題(カテゴリ)340を上位(ルート)として、その下位に銅像342、さらにその下位に渋谷ハチ公344があり、対象とするクラス名として渋谷ハチ公344が選択されている。そして、発注者・購入者用端末200は、渋谷ハチ公が撮影されている素材画像をオンラインストレージサービス310又は画像共有SNS315に格納し、その場所(URL)を情報処理装置100に送信する。なお、画像記憶装置群305として、オンラインストレージサービス310、画像共有SNS315を例示したが、発注者・購入者用端末200又は情報処理装置100が有している画像記憶装置等であってもよい。
発注者・購入者用端末200は、情報処理装置100からラベル情報330のデータ購入350を行い、情報処理装置100に対して支払処理355を行う。情報処理装置100は、そのラベル情報330を作成した一般ユーザーに対して支払処理365を行う。
なお、一般ユーザーへの支払額として、以下の式を用いるようにしてもよい。
カテゴリ数×タグ数×精度(%)=支払額
まず、一般ユーザーの会員登録処理例について説明する。
ステップS402cでは、ユーザー端末250は、情報処理装置100に対して会員登録処理を行い、ステップS404bへ進む。ステップS402cの詳細については、図6の例を用いて後述する。
ステップS404bでは、情報処理装置100は、ユーザー管理処理(登録処理)を行い、ステップS410b(ステップS418b)へ進む。
ステップS402aでは、発注者・購入者用端末200は、題材登録処理を行う。例えば、後述する図6の例に示す発注者画面(発注)600で行う。そして、静止画像472(素材画像)と予算情報474を情報処理装置100に渡す。そして、ステップS408bへ進む。
ステップS408bでは、情報処理装置100は、管理画面題材管理処理を行う。具体的には、静止画像472と予算情報474をデータベース130に格納する。そして、ユーザー端末250へのラベル情報作成依頼の画面を生成する。そして、ステップS410bへ進む。
ステップS410bでは、情報処理装置100は、ラベル情報収集処理を行う。具体的には、ユーザー端末250にラベル情報作成依頼の画面(静止画像476(素材画像)、予算情報478が含まれている)を提示し、ユーザー端末250の一般ユーザーに対して、ラベル情報作成依頼を行う。
ステップS412cでは、ユーザー端末250は、一般ユーザーの操作に応じて、題材情報の閲覧処理を行う。例えば、後述する図8の例に示すユーザー画面(閲覧)800で行う。ラベル情報作成依頼を受ける場合は、ステップS414cに進む。
ステップS414cでは、ユーザー端末250は、ラベリング作業処理を行う。例えば、後述する図11の例に示すユーザー画面1100で行う。そして、ラベル情報480を情報処理装置100に送信する。
なお、第3の処理例における処理を行う場合は、ステップS416cで、図14の例に示すフローチャートのステップS1406cへ進む。
ステップS418bでは、情報処理装置100は、ラベル情報収集処理を行う。具体的には、ユーザー端末250からラベル情報480を受信し、データベース130に格納する。
ステップS420bでは、情報処理装置100は、データベース130からラベル情報の抽出処理を行い、ステップS422aへ進む。なお、ステップS420bでは、単に、データベース130内のラベル情報482を抽出するだけではなく、前述したラベル情報処理モジュール135によって、重複しているラベル情報から機械学習に適しているラベル情報482を抽出するようにしてもよい。
ステップS422aでは、発注者・購入者用端末200は、ラベル情報482のレビューを行い、そのラベル情報482でOKの場合はステップS426a、ステップS428bへ進み、NGの場合はステップS424aへ進む。例えば、このレビューを後述する図13の例に示す発注者画面(レビュー)1300で行う。
ステップS424aでは、発注者・購入者用端末200は、再ラベリング依頼処理を行い、ステップS408bへ進む。ラベル情報482が不足している、又は、ラベル情報482が不正確である等の利用によって、再度のラベリング作業の依頼を情報処理装置100を介してユーザー端末250の一般ユーザーに依頼する。
ステップS426aでは、発注者・購入者用端末200は、学習処理を行う。詳細については、図5の例を用いて後述する。
ステップS428bでは、情報処理装置100は、データベース130内のラベル情報482を用いて、管理画面における支払管理を行う。
ステップS430bでは、情報処理装置100は、支払処理を行い、ステップS432cへ進む。
ステップS432cでは、ユーザー端末250は、一般ユーザーへの報酬の受取処理を行う。
ステップS502aでは、発注者・購入者用端末200は、情報処理装置100に対して、学習開始依頼処理を行う。
ステップS504bでは、情報処理装置100は、人工知能サーバー572に、データベース130内のラベル情報482を用いて学習処理(機械学習)を行わせる。そして、学習済ファイル574(学習処理を行った結果、モデル)が人工知能サーバー572に格納される。
ステップS506aでは、発注者・購入者用端末200は、学習済ファイル574を用いた活用アプリケーションの開発等の処理を行う。
また、図17等を用いて後述するように、重複したラベル情報を選択する場合に、他のラベル情報で機械学習したニューラルネットワークモデルを用いることができるようになる。
発注者画面(発注)600には、カテゴリ欄605、題材名称欄610、素材画像欄615、要件欄620、チェックボックス(ラベルデータを公開する)欄636、チェックボックス(利用規約に同意する)欄638、「上記の内容で発注する」ボタン640を表示する。
カテゴリ欄605には、階層化されたカテゴリ(クラス名)を表示する。
題材名称欄610では、発注者の操作によって、ラベル付けのクラス名が指定される。
素材画像欄615には、発注者が用意した素材画像を表示する。例えば、オンラインストレージサービス310a、オンラインストレージサービス310b、画像共有SNS315a等から1つを選択して、URLを指定することによって素材画像群を指定する。
画像数欄622には、発注者が用意した素材画像数を表示する。
平均ラベル数欄624では、1つの素材画像内に含まれているクラス名の対象物(図6の例では、素材画像内で撮影されている車種Aの自動車)の数を指定する。
ラベル単価欄626では、ラベル情報の単価を指定する。
価格欄628には、ラベル情報全体の価格を表示する。具体的には、例えば、画像数×平均ラベル数×ラベル単価で算出した値である。
お支払総額欄630には、支払総額を表示する。具体的には、例えば、ラベル情報全体の価格と手数料を加算した値である。
作業割当数欄632では、一人の一般ユーザーが行うべき素材画像の枚数を指定する。他のユーザーと作業(矩形描画による切り取り)が重ならないようにする。1画像に1ユーザーが割り当てられる。図6の例では、一般ユーザーの一人あたり100枚の画像を割り当てている。なお、1画像を複数人の一般ユーザーに割り当てるようにしてもよい。一般ユーザー間で競わせることによって、早くラベル情報を得る、又は、正確なラベル情報を得ることができるようになる。
ユーザー欄634では、ラベリング作業を行ってもらう一般ユーザーを指定する。例えば、過去に取引をした一般ユーザーや評価の高い一般ユーザーを任意に指定して発注することが可能である。
チェックボックス(利用規約に同意する)欄638では、利用規約に同意したか否かを指定する。
「上記の内容で発注する」ボタン640が発注者に選択されることによって、ステップS408bに進む。なお、チェックボックス(ラベルデータを公開する)欄636がチェックされていない等の場合、「上記の内容で発注する」ボタン640を選択できないようにしておいてもよい。
ユーザー画面(閲覧)800には、発注内容欄805、素材画像欄810、残画像数欄815、ラベル単価欄820、希望作業枚数欄825、合計金額欄830、作業完了期限欄835、チェックボックス(利用規約に同意する)欄840、「上記の内容で作業を開始する」ボタン845を表示する。
素材画像欄810には、発注内容欄805で選択された素材画像のサムネイル画像を表示する。図8では、例えば、発注内容欄805aが選択された場合の車種Aの自動車が撮影されている写真のサムネイル画像を表示している。
残画像数欄815には、ラベリング作業が必要な残枚数を表示する。
ラベル単価欄820には、ラベリング作業の1枚あたりの単価を表示する。
希望作業枚数欄825では、一般ユーザーの操作によって、ラベリング作業を行いたい枚数が指定される。
合計金額欄830には、希望作業枚数欄825で指定された枚数のラベリング作業を完了した場合の報酬額を表示する。
作業完了期限欄835には、ラベリング作業を完了すべき期限を表示する。なお、希望する作業枚数(希望作業枚数欄825)から作業工数を見積もりし、期限日を設定するようにしてもよい。作業をしない休眠の一般ユーザーを削減するためである。
チェックボックス(利用規約に同意する)欄840では、利用規約に同意したか否かを指定する。
「上記の内容で作業を開始する」ボタン845が一般ユーザーに選択されることによって、ステップS414cに進む。なお、チェックボックス(利用規約に同意する)欄840がチェックされていない等の場合、「上記の内容で作業を開始する」ボタン845を選択できないようにしておいてもよい。
ユーザー作業情報テーブル1000は、ユーザーID欄1005、題材ID欄1010、希望作業枚数欄1015、利用規約同意情報欄1020等を有している。これらは、発注者画面(発注)600内で指定された情報に対応している。ユーザーID欄1005は、本実施の形態において、ユーザーを一意に識別するための情報(ユーザーID)を記憶している。題材ID欄1010は、題材IDを記憶している。希望作業枚数欄1015は、希望作業数を記憶している。利用規約同意情報欄1020は、利用規約同意情報を記憶している。
ユーザー画面1100には、対象画像1105、操作情報欄1120、保存するボタン1125、その他の対象画像を表示する。図11の例に示すユーザー画面1100は、題材として「渋谷ハチ公」が選択された場合の表示画面である。
対象画像1105には、渋谷ハチ公が撮影されている素材画像を表示する。一般ユーザーは、カーソルキー、指、ペン等を用いて、渋谷ハチ公を囲む矩形(描画矩形(ユーザー自身)1110)を描画する。これがラベリング作業に該当する。具体的には、矩形の対角を指定する操作である。その際に、サンプルとして、既に、他の一般ユーザーが渋谷ハチ公を囲んだ矩形(描画矩形(他ユーザー)1115)を表示してもよい。
さらに、そのラベリング作業で生成される情報として、題材、素材画像名、矩形情報(対角の座標)等を示す操作情報欄1120を表示する。
また、その他の素材画像として、既にラベリング作業済みの素材画像(対象画像(サムネイル)1135、対象画像(サムネイル)1140)、未だラベリング作業が行われていない素材画像(対象画像(サムネイル)1145)を表示する。なお、スクロールバー1130、スクロールバー1150を表示し、その他の素材画像を表示できるようにしている。
発注者画面(レビュー)1300には、題材名称欄1305、ラベル付結果画像欄1310、ベンチマーク欄1315、予約日時受付欄1320、学習予約ボタン1325を表示する。
題材名称欄1305には、題材(クラス名)を表示する。
ラベル付結果画像欄1310には、ラベリング作業が行われた結果を表示する。つまり、クラス名の対象物を囲んだ矩形を描画した素材画像のサムネイル画像を表示する。発注者は、この中で、好ましくない矩形(NG矩形)を指定可能である。NG矩形と指定されたラベル情報については、割り当てられている一般ユーザーが再度作業を実施する(ステップS424a)。
ベンチマーク欄1315には、発注者が予め用意したベンチマーク画像(評価用画像)を表示する。このベンチマーク画像を用いて、学習結果の評価を行うことが可能である。なお、ベンチマーク画像上では、認識率を表示している。認識率が悪いベンチマーク画像のラベリング作業を、再度一般ユーザーに依頼することが可能である。
また、素材画像数を増やすために、図14の例で説明する第3の処理例(セルフ方式)を組み合わせることが可能である。一般ユーザーが自主的に作成したラベル付結果画像を表示して、選択可能としてもよい。
予約日時受付欄1320では、発注者の操作によって、機械学習を行う予約日時を指定する。
発注者の操作によって、学習予約ボタン1325が選択された場合に、ステップS426a(図5の例に示すフローチャート)に進む。つまり、作成されたラベル情報に基づいて、人工知能サーバー572で「機械学習」を行わせることが可能である。この機械学習は、有償であって、例えば5,000円/回等のように定められている。また、時間帯によって、価格を変動(例えば、人工知能サーバー572が混んでいる時間帯は高値等)してもよい。
まず、一般ユーザーの会員登録処理例について説明する。
ステップS1402cでは、ユーザー端末250は、会員登録処理を行う。
ステップS1404bでは、情報処理装置100は、ユーザー管理処理を行う。
図4の例に示したステップS402c、ステップS404bと同等の処理である。
ステップS1406cでは、ユーザー端末250は、一般ユーザーが写真を撮影し、静止画の用意処理を行う。つまり、素材画像となり得る静止画像1482を撮影する。
ステップS1408cでは、ユーザー端末250は、静止画像1482に対して、ラベリング作業の処理を行う。そして、ユーザー端末250は、ラベリング作業の結果である静止画像1472、価格情報1474、ラベル情報1476を情報処理装置100に送信する。
ステップS1410bでは、情報処理装置100は、ラベル情報収集処理を行う。つまり、ユーザー端末250から、静止画像1472、価格情報1474、ラベル情報1476を受信し、データベース130に蓄積する。
ステップS1406c、ステップS1408cの処理は、例えば、後述する図15の例に示すユーザー画面(セルフ方式)1500で行う。
ステップS1412bでは、情報処理装置100は、データベース130からラベル情報の抽出処理を行い、ステップS1414aへ進む。なお、ステップS1412bでは、単に、データベース130内のラベル情報1476を抽出するだけではなく、前述したラベル情報処理モジュール135によって、重複しているラベル情報から機械学習に適しているラベル情報1476を抽出するようにしてもよい。
ステップS1414aでは、発注者・購入者用端末200は、ラベル情報の閲覧処理を行う。
ステップS1418aでは、発注者・購入者用端末200は、購入処理を行う。
ステップS1420bでは、情報処理装置100は、決済処理を行い、ステップS1422b、ステップS1426cへ進む。
ステップS1422bでは、情報処理装置100は、ダウンロード処理を行う。つまり、データベース130内から静止画像1478、ラベル情報1480を抽出し、購入者の発注者・購入者用端末200に送信する。
ステップS1424aでは、発注者・購入者用端末200は、ラベルデータ(静止画像1478、ラベル情報1480)を受信する。
ステップS1426aでは、発注者・購入者用端末200は、静止画像1478、ラベル情報1480を用いて学習処理を行う。図5の例を用いて既述した。
ステップS1426cでは、ユーザー端末250は、報酬の受取処理を行う。
ユーザー画面(セルフ方式)1500には、カテゴリ欄1505、題材名称欄1510、「題材(カテゴリ)新規作成」ボタン1515、撮影欄1520、素材画像アップロード欄1525、ラベリング結果画像欄1530、ラベル単価欄1535、「ラベルを販売する」ボタン1540を表示する。
カテゴリ欄1505には、階層化されたカテゴリ(クラス名)を表示する。
題材名称欄1510では、一般ユーザーの操作によって、ラベル付けのクラス名が指定される。
「題材(カテゴリ)新規作成」ボタン1515が一般ユーザーに選択されることによって、新たな題材(カテゴリ、クラス名)が作成される。なお、情報処理装置100が予め定められた題材のリストを提示し、そのリスト内から題材を選択するようにしてもよい。
素材画像アップロード欄1525には、一般ユーザーが撮影した画像(素材画像)の一覧を表示し、その素材画像のアップロード先であるオンラインストレージサービス310a、オンラインストレージサービス310b、画像共有SNS315a等を表示する。素材画像のアップロード先として、オンラインストレージサービス310a、オンラインストレージサービス310b、画像共有SNS315a等のいずれが選択される。
ラベリング結果画像欄1530には、ラベリング作業の結果を表示する。つまり、題材の対象物を囲んだ矩形を描画した素材画像を表示する。なお、ラベリング作業用の画面は、図11の例に示したユーザー画面1100を用いればよい。
ラベル単価欄1535では、一般ユーザーの操作によって、ラベル情報の単価が指定される。
ステップS1702では、一般ユーザーによって生成されたラベル情報をデータベース130から抽出する。
ステップS1704では、同じ素材画像で同じ題材について複数人の一般ユーザーによるラベル情報があるか否かを判断し、ある場合はステップS1706へ進み、それ以外の場合はステップS1720へ進む。つまり、重複しているラベル情報が存在しているか否かを判断している。
ステップS1712では、ラベリング処理結果内の矩形領域の論理和(矩形領域A)を算出する。
ステップS1714では、ラベリング処理結果内の矩形領域を矩形領域Aとする。
ステップS1718では、論理積の結果である面積が最も大である一般ユーザーの矩形を機械学習の教師データとして採用する。
例えば、図20は、素材画像1900に対して、車種C1814のユーザーラベリング結果2010、ユーザーラベリング結果2020(重複しているラベル情報)がある場合を示している。図19の例を用いて前述したように、複数のニューラルネットワークモデルによって、ラベリング結果(自動車)1910とラベリング結果(セダン)1920が抽出されている。ステップS1712で、ラベリング結果(自動車)1910とラベリング結果(セダン)1920の論理和(OR)処理を行う。具体的には、ラベリング結果(自動車)1910とラベリング結果(セダン)1920の両方を囲む矩形(矩形領域A)が生成されることとなる。そして、ステップS1716で、ラベリング結果(自動車)1910と矩形領域Aとの論理積(AND)を算出し、ラベリング結果(セダン)1920と矩形領域Aとの論理積(AND)を算出する。具体的には、ラベリング結果(自動車)1910と矩形領域Aとの重複領域、ラベリング結果(セダン)1920と矩形領域Aとの重複領域を生成する。そして、ステップS1718で、両方の重複領域の面積を算出し、最も大きい面積を有しているラベル情報を選択する。図20の例の場合は、ユーザーラベリング結果2010が、機械学習の教師データとして採用される。
なお、この処理は、それぞれが独立したニューラルネットワークモデルを一つの多段のニューラルネットワークモデルに再構成しているともいえる。ここでの「独立したニューラルネットワークモデル」とは、具体的に、自動車を認識するニューラルネットワークモデル、セダンを認識するニューラルネットワークモデルを指している。2つの認識結果の論理和は、多段のニューラルネットワークモデルと同等のものである。この「多段のニューラルネットワークモデル」とは、具体的に、2つのニューラルネットワークモデルを接続して、自動車又はセダンを認識するニューラルネットワークである。そして、多段のニューラルネットワークモデルの認識結果と近似するラベル情報を生成したユーザーを採用する。
(1)同一画像の、画像中の対象物(例えば、渋谷ハチ公)における、複数の矩形An(nは矩形数)の積集合(A1 and A2 and A3 .........)の重心座標を算出する。そして、その重心座標に最も近い重心を有している矩形のラベル情報を採用するようにしてもよい。
(2)人間(発注者)が一つ一つの画像と矩形を確認し、「これが一番よい矩形だ」と判断して、ラベル情報を採用するようにしてもよい。
なお、1つのラベル情報を採用するだけでなく、複数のラベル情報を採用してもよい。その場合は、買取額を異ならせるようにしてもよい。例えば、前述した選択方法によって選択されたラベル情報(機械学習に適したラベル情報)を一番高く買い取るようにしてもよい。
また、ラベル情報の価格付けは、図4の処理例では発注者側、図14の処理例では一般ユーザー側が行っているが、図14の処理例でも購入者側が行ってもよい。
なお、図21に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図21に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図21に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、パーソナルコンピュータ等の他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボットなどに組み込まれていてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
105…ユーザー管理処理モジュール
110…発注者・購入者管理モジュール
115…ユーザー管理モジュール
120…発注者・購入者用UIモジュール
125…ユーザー用UIモジュール
130…データベース
135…ラベル情報処理モジュール
140…学習処理モジュール
145…決済処理モジュール
200…発注者・購入者用端末
250…ユーザー端末
299…通信回線
Claims (7)
- 第1のユーザーが用いる端末及び第2のユーザーが用いる端末と通信回線を介して接続されている情報処理装置であって、
前記第1のユーザーから、機械学習の対象が撮影されている画像と該対象のクラス名を受け付ける第1の受付手段と、
前記画像と前記クラス名を前記第2のユーザーに表示する表示手段と、
前記第2のユーザーから、前記画像内で前記クラス名の対象が撮影されている領域の情報を少なくとも含むラベル情報を受け付ける第2の受付手段と、
前記ラベル情報又は該ラベル情報を用いて機械学習を行った結果を前記第1のユーザーに提供する提供手段と、
前記画像と同じ画像であって前記クラス名と同じクラス名についてのラベル情報が複数ある場合は、既に機械学習されたモデルを用いて、いずれかのラベル情報を選択する選択手段
を有し、
前記提供手段は、前記選択手段によって選択されたラベル情報又は該ラベル情報を用いて機械学習を行った結果を前記第1のユーザーに提供する、
情報処理装置。 - 前記選択手段は、前記クラス名と類似するクラス名を持つラベル情報を用いて機械学習されたモデルを用いる、
請求項1に記載の情報処理装置。 - 第1のユーザーが用いる端末及び第2のユーザーが用いる端末と通信回線を介して接続されている情報処理装置であって、
前記第2のユーザーから、機械学習の対象となり得る画像と、該画像内でクラス名の対象が撮影されている領域の情報を少なくとも含むラベル情報を受け付ける受付手段と、
前記ラベル情報を前記第1のユーザーに表示する表示手段と、
前記第1のユーザーによる購入操作にしたがって、前記ラベル情報又は該ラベル情報を用いて機械学習を行った結果を該第1のユーザーに提供する提供手段
を有する情報処理装置。 - 第1のユーザーが用いる端末及び第2のユーザーが用いる端末と通信回線を介して接続されている情報処理装置であって、
前記第1のユーザーから、機械学習の対象が撮影されている画像と該対象のクラス名を受け付ける第1の受付手段と、
前記画像と前記クラス名を前記第2のユーザーに表示する表示手段と、
前記第2のユーザーから、前記画像内で前記クラス名の対象が撮影されている領域の情報を少なくとも含む第1のラベル情報を受け付ける第2の受付手段と、
前記第2のユーザーから、機械学習の対象となり得る画像と、該画像内でクラス名の対象が撮影されている領域の情報を少なくとも含む第2のラベル情報を受け付ける第3の受付手段と、
前記第2のラベル情報を前記第1のユーザーに表示する表示手段と、
前記第1のユーザーによる前記第2のラベル情報の購入操作にしたがって、前記第1のラベル情報と前記第2のラベル情報、又は、該第1のラベル情報と該第2のラベル情報を用いて機械学習を行った結果を該第1のユーザーに提供する提供手段
を有する情報処理装置。 - 第1のユーザーが用いる端末及び第2のユーザーが用いる端末と通信回線を介して接続されているコンピュータを、
前記第1のユーザーから、機械学習の対象が撮影されている画像と該対象のクラス名を受け付ける第1の受付手段と、
前記画像と前記クラス名を前記第2のユーザーに表示する表示手段と、
前記第2のユーザーから、前記画像内で前記クラス名の対象が撮影されている領域の情報を少なくとも含むラベル情報を受け付ける第2の受付手段と、
前記ラベル情報又は該ラベル情報を用いて機械学習を行った結果を前記第1のユーザーに提供する提供手段と、
前記画像と同じ画像であって前記クラス名と同じクラス名についてのラベル情報が複数ある場合は、既に機械学習されたモデルを用いて、いずれかのラベル情報を選択する選択手段
として機能させ、
前記提供手段は、前記選択手段によって選択されたラベル情報又は該ラベル情報を用いて機械学習を行った結果を前記第1のユーザーに提供する、
情報処理プログラム。 - 第1のユーザーが用いる端末及び第2のユーザーが用いる端末と通信回線を介して接続されているコンピュータを、
前記第2のユーザーから、機械学習の対象となり得る画像と、該画像内でクラス名の対象が撮影されている領域の情報を少なくとも含むラベル情報を受け付ける受付手段と、
前記ラベル情報を前記第1のユーザーに表示する表示手段と、
前記第1のユーザーによる購入操作にしたがって、前記ラベル情報又は該ラベル情報を用いて機械学習を行った結果を該第1のユーザーに提供する提供手段
として機能させる情報処理プログラム。 - 第1のユーザーが用いる端末及び第2のユーザーが用いる端末と通信回線を介して接続されているコンピュータを、
前記第1のユーザーから、機械学習の対象が撮影されている画像と該対象のクラス名を受け付ける第1の受付手段と、
前記画像と前記クラス名を前記第2のユーザーに表示する表示手段と、
前記第2のユーザーから、前記画像内で前記クラス名の対象が撮影されている領域の情報を少なくとも含む第1のラベル情報を受け付ける第2の受付手段と、
前記第2のユーザーから、機械学習の対象となり得る画像と、該画像内でクラス名の対象が撮影されている領域の情報を少なくとも含む第2のラベル情報を受け付ける第3の受付手段と、
前記第2のラベル情報を前記第1のユーザーに表示する表示手段と、
前記第1のユーザーによる前記第2のラベル情報の購入操作にしたがって、前記第1のラベル情報と前記第2のラベル情報、又は、該第1のラベル情報と該第2のラベル情報を用いて機械学習を行った結果を該第1のユーザーに提供する提供手段
として機能させる情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018004598A JP6522173B1 (ja) | 2018-01-16 | 2018-01-16 | 情報処理装置及び情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018004598A JP6522173B1 (ja) | 2018-01-16 | 2018-01-16 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6522173B1 true JP6522173B1 (ja) | 2019-05-29 |
JP2019125119A JP2019125119A (ja) | 2019-07-25 |
Family
ID=66655702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018004598A Active JP6522173B1 (ja) | 2018-01-16 | 2018-01-16 | 情報処理装置及び情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6522173B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023286105A1 (ja) * | 2021-07-12 | 2023-01-19 | 株式会社ウフル | 情報処理装置、情報処理システム、情報処理プログラム、及び情報処理方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11789905B2 (en) | 2020-05-27 | 2023-10-17 | Roblox Corporation | Automated generation of game tags |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002077868A1 (en) * | 2001-03-27 | 2002-10-03 | Nikon Corporation | Method for mediating digital data |
JPWO2017159614A1 (ja) * | 2016-03-14 | 2019-01-10 | オムロン株式会社 | 学習サービス提供装置 |
EP3471049A4 (en) * | 2016-06-09 | 2019-06-19 | Sony Corporation | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING PROCESS AND PROGRAM |
-
2018
- 2018-01-16 JP JP2018004598A patent/JP6522173B1/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023286105A1 (ja) * | 2021-07-12 | 2023-01-19 | 株式会社ウフル | 情報処理装置、情報処理システム、情報処理プログラム、及び情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2019125119A (ja) | 2019-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105631700B (zh) | 内容创建、部署合作以及标记 | |
US20210049554A1 (en) | Method and system for creating step by step projects | |
JP2018519613A (ja) | オンラインマーケットプレイスにおいてアイテムを提示し評価するためのシステム及び技術 | |
JP2009181468A (ja) | 画像検索ログ収集システム、画像検索ログ収集方法、及びプログラム | |
EP2884406A1 (en) | System and method for information analysis in network transaction | |
US20160247196A1 (en) | Rendering user interfaces that dynamically present content-based information extracted from images | |
US20170337601A1 (en) | Monetization of interactive network-based information objects | |
US9336549B2 (en) | Systems and methods for performing in-store and online transactions | |
US20230230152A1 (en) | Systems and methods for generating customized augmented reality video | |
JP6522173B1 (ja) | 情報処理装置及び情報処理プログラム | |
KR101764361B1 (ko) | 소셜 네트워크 서비스 기반 쇼핑몰 서비스 제공 방법 및 이를 위한 장치 | |
AU2020260475A1 (en) | Automated generation of video-based electronic solicitations | |
US20130211956A1 (en) | Mobile Application for Capturing Inspirations | |
US20220245615A1 (en) | Mobile point-of-sale and social marketplace | |
US20200349635A1 (en) | System and method for content creation tool for use with shoppable content data | |
US10380669B2 (en) | Product browsing system and method | |
US11430051B1 (en) | System and method for automatically reordering consumer products | |
KR20120135179A (ko) | 쇼핑 정보를 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
US11928725B2 (en) | Methods for searching and obtaining design items and meta data concerning the design items | |
KR102605195B1 (ko) | 이커머스 기반의 정보 제공 방법 및 이를 수행하기 위한 컴퓨팅 장치 | |
JP7239775B1 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
US20230351654A1 (en) | METHOD AND SYSTEM FOR GENERATING IMAGES USING GENERATIVE ADVERSARIAL NETWORKS (GANs) | |
US20230316387A1 (en) | Systems and methods for providing product data on mobile user interfaces | |
US20240020914A1 (en) | System and Method for Generating 2D Images of Viritual 3D Models According to Imaging Parameters Determining From 2D Images of Other Objects | |
JP2021189518A (ja) | プログラム、電子商取引システム、電子商取引支援方法、及び電子商取引方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190409 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190423 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6522173 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |