JP6062384B2 - タスク割り当てサーバ、タスク割り当て方法およびプログラム - Google Patents

タスク割り当てサーバ、タスク割り当て方法およびプログラム Download PDF

Info

Publication number
JP6062384B2
JP6062384B2 JP2014037186A JP2014037186A JP6062384B2 JP 6062384 B2 JP6062384 B2 JP 6062384B2 JP 2014037186 A JP2014037186 A JP 2014037186A JP 2014037186 A JP2014037186 A JP 2014037186A JP 6062384 B2 JP6062384 B2 JP 6062384B2
Authority
JP
Japan
Prior art keywords
task
worker
expert
processing result
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014037186A
Other languages
English (en)
Other versions
JP2015162109A (ja
Inventor
誉宗 巻口
誉宗 巻口
大地 並河
大地 並河
正造 東
正造 東
下村 道夫
道夫 下村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014037186A priority Critical patent/JP6062384B2/ja
Publication of JP2015162109A publication Critical patent/JP2015162109A/ja
Application granted granted Critical
Publication of JP6062384B2 publication Critical patent/JP6062384B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ネットワークを介してタスク(仕事)をワーカ(労働者)に依頼するクラウドソーシング等のシステムで使用されるタスク割り当てサーバ、タスク割り当て方法およびプログラムに関するものである。
近年、インターネット等のネットワークを通じて様々なタスクを複数のワーカに依頼して処理させる仕組み(例えばクラウドソーシング等)が普及している。
しかし、クラウドソーシングにおいては、ワーカに能力差があり、タスクの内容によって処理結果の品質に差がでることがある。そのため、品質の高い処理結果を得るためには、タスクごとに適切なワーカを抽出し、割り当てる手法(タスク割り当て手法)が重要となる。
例えば、非特許文献1は、ワーカの処理結果を元にワーカの能力を推定し、能力の高いワーカの答えの優先度を高めて多数決を取り正解を得ることが提案されている。
特開2011−141666号公報
梶野 洸、他3名、"エキスパートによる訓練データとクラウドソーシングで作成した訓練データからの教師付き学習"、[online]、人工知能学会論文誌 28巻3号 SP−A (2013年)、[平成26年2月6日検索]、インターネット<URL: https://www.jstage.jst.go.jp/article/tjsai/28/3/28_243/_pdf> 鹿島 久嗣、他1名、"クラウドソーシングと機械学習"、[online]、人工知能学会論文誌 27巻4号 (2012年)、[平成26年2月6日検索]、インターネット<URL: http://www.geocities.jp/kashi_pong/publication/JSAI_crowds.pdf>
しかし、非特許文献1に記載の方法は、ワーカの能力を正しく比較するために「対象となる全てのワーカが同じタスクを処理」する必要がある。つまり、非特許文献1に記載の方法では、あるワーカが能力比較のためのタスクを処理していない場合には、そのワーカがエキスパート(熟練者)なのか否かを判断できない。また、「過去のタスクに対して高い能力を持つワーカが、新規タスクに対して同様に能力が高いとは限らない」ため、非特許文献1の方法ではエキスパートの推定の正確さが保証されない。
ここで、特許文献1には、ユーザーのログに含まれる興味情報を基にコンテンツのクラスタを作成し、そのクラスタに基づいて推薦リストを作成する技術が記載されている。この技術を用いれば、例えばワーカが過去に行ったタスク処理の種類や処理回数を元に、全てのワーカが同じタスクを処理していなくとも(スパース性、すなわちデータが疎である状態が存在しても)、ワーカの興味のあるタスクを推薦することができる。しかし、当該技術は、ワーカの「興味」を推定するものであり、ワーカの興味が新規タスクに対するワーカの能力と一致するとは限らないため、能力が高いワーカを抽出しきれない課題が残る。
また、非特許文献2には、事前に答えのわかっている一部の新規タスクをテストタスクとしてワーカに依頼し、新規タスクに対するワーカの能力を推定する手法が記載されている。非特許文献2の方法では、テストタスクをワーカに依頼することで、新規タスクに対しての能力についての推定の精度を高めることができる。しかし、「対象となる全てのワーカがテストタスクを処理」する必要があり、タスク依頼数の増加が新たな問題となり得る。
前記のような問題点に鑑みてなされた本発明の目的は、新規タスクに対する適切なワーカを抽出し、スパース性があっても対応可能なタスク割り当てサーバ、タスク割り当て方法およびプログラムを提供することにある。
前記課題を解決するため、本発明に係るタスク割り当てサーバは、ネットワークを介して、新規タスクを処理可能なワーカ群のうちエキスパートに前記新規タスクを割り当てるタスク割り当てサーバであって、前記ワーカ群の各ワーカが過去に処理したタスクの情報を少なくとも含むワーカ群情報を記憶するワーカDBと、前記ワーカ群情報に基づいて、前記ワーカ群の各ワーカを複数のクラスタのいずれかに分類するクラスタ作成機能部と、前記新規タスクの一部であるテストタスクの処理結果に基づいて、前記複数のクラスタのうちの1つに属するワーカを、前記エキスパートとする処理結果解析機能部と、前記エキスパートに前記新規タスクを依頼するタスク依頼機能部と、を備え、前記タスク依頼機能部は、前記新規タスクを依頼する前に、前記複数のクラスタのそれぞれの代表者に前記テストタスクを依頼して、受け取った前記テストタスクの処理結果を前記処理結果解析機能部へと出力する
また、本発明に係るタスク割り当て方法は、サーバによって、ネットワークを介して、新規タスクを処理可能なワーカ群のうちエキスパートに前記新規タスクを割り当てるタスク割り当て方法であって、前記サーバが、前記ワーカ群の各ワーカが過去に処理したタスクの情報を少なくとも含むワーカ群情報を記憶するステップと、前記ワーカ群情報に基づいて、前記ワーカ群の各ワーカを複数のクラスタのいずれかに分類するステップと、前記新規タスクの一部であるテストタスクの処理結果に基づいて、前記複数のクラスタのうちの1つに属するワーカを、前記エキスパートとするステップと、前記エキスパートに前記新規タスクを依頼するステップと、前記新規タスクを依頼するステップの前に、前記複数のクラスタのそれぞれの代表者に前記テストタスクを依頼して、前記テストタスクの処理結果を受け取るステップと、を含むことを特徴とする。
また、本発明に係るプログラムは、ネットワークを介して、新規タスクを処理可能なワーカ群のうちエキスパートに前記新規タスクを割り当てるタスク割り当てサーバとして機能するコンピュータに、前記ワーカ群の各ワーカが過去に処理したタスクの情報を少なくとも含むワーカ群情報を記憶するステップと、前記ワーカ群情報に基づいて、前記ワーカ群の各ワーカを複数のクラスタのいずれかに分類するステップと、前記新規タスクの一部であるテストタスクの処理結果に基づいて、前記複数のクラスタのうちの1つに属するワーカを、前記エキスパートとするステップと、前記エキスパートに前記新規タスクを依頼するステップと、前記新規タスクを依頼するステップの前に、前記複数のクラスタのそれぞれの代表者に前記テストタスクを依頼して、前記テストタスクの処理結果を受け取るステップと、を実行させることを特徴とする。
本発明に係るタスク割り当てサーバ、タスク割り当て方法およびプログラムによれば、新規タスクに対する適切なワーカを抽出し、スパース性があっても対応可能である。
第1実施形態のタスク割り当てサーバを備えるシステム構成を示す図である。 第1実施形態のタスク割り当てサーバの処理を説明するフローチャートである。 図3(A)、図3(B)は第1実施形態におけるタスクDBのデータ構成を例示する図である。 第1実施形態におけるワーカDBのデータ構成を例示する図である。 第1実施形態におけるクラスタについて説明する図である。 第1実施形態におけるシステムとしての処理結果を例示する図である。 第2実施形態におけるクラスタについて説明する図である。 第2実施形態のタスク割り当てサーバの処理を説明するフローチャートである。 新規タスク(画像ラベリング)についての実験結果を例示する図である。 別の新規タスク(固有表現ラベリング)についての実験結果を例示する図である。
(第1実施形態)
以下、本発明に係る第1実施形態について、図面を参照して説明する。図1は、本実施形態に係るタスク割り当てサーバ10の構成、およびタスク割り当てサーバ10を備えるタスク割り当てシステム1の構成を示す図である。まず、タスク割り当てシステム1について説明し、その後に、タスク割り当てサーバ10の構成を説明する。
(タスク割り当てシステム)
図1のタスク割り当てシステム1では、リクエスタ(リクエスタ端末50を操作する発注者)がタスク割り当てサーバ10に新規タスクを発注し、タスク割り当てサーバ10がインターネットを介してワーカ(ワーカ端末60A、60B、…、60Nを操作する労働者)に新規タスクを依頼して処理させる。つまり、タスク割り当てシステム1によってクラウドソーシングを実現できる。
リクエスタ端末50は、タスク割り当てサーバ10にアクセス可能でリクエスタが操作可能な機器であり、ワーカ端末60A、60B、…、60Nはインターネットに接続可能でワーカが操作可能な機器である。リクエスタ端末50およびワーカ端末60A、60B、…、60Nは、例えばPC、タブレット、スマートフォン、携帯電話等であってもよい。なお、ワーカ端末60A、60B、…、60Nの“A”、“B”、…、“N”は特定の数を表すものではなく、ワーカ端末が複数であることを示すために便宜上に付されたものであり、以下では、ワーカ端末60A、60B、…、60Nをワーカ端末60A等とも表記する。また、新規タスクは、リクエスタ端末50が依頼したタスク(仕事)であり、ワーカがワーカ端末60A等を用いて処理できる内容のタスクである。例えば画像ラベリング等が挙げられるが具体例については後述する。なお、新規タスクは、あるワーカが過去に処理したタスクと重複することもあり得るが、過去のタスクとは全く無関係にリクエスタ端末50から依頼されるものである。
タスク割り当てシステム1では、タスク割り当てサーバ10と複数のワーカ端末60A等とがインターネットを介して接続される。また、図1のタスク割り当てシステム1では、タスク割り当てサーバ10とリクエスタ端末50との接続はインターネット経由でないが、これらがインターネットを介して接続されてもよいし、タスク割り当てサーバ10がリクエスタ端末50を備える構成であってもよい。
ワーカ端末60A等は不特定多数のワーカが操作し、ワーカの数も変動し得る。ここで、タスク割り当てサーバ10が新規タスクを依頼する(割り当てる)ことが可能なワーカの集団を以下においてワーカ群と呼ぶ。換言すれば、ワーカ群は新規タスクを処理可能なワーカの集団である。例えば、タスク割り当てサーバ10にアクセス可能なワーカ端末を操作するワーカはワーカ群に含まれるが、電源がオフ状態でタスク割り当てサーバ10にアクセスできないワーカ端末を操作するワーカはワーカ群に含まれない。
なお、タスク割り当てシステム1において、リクエスタからの発注は必ずリクエスタ端末50を用いて実行され、ワーカへの新規タスクの依頼やワーカによる処理は必ずワーカ端末60A等を用いて実行される。そのため、以下の説明において特に必要がない場合には、リクエスタ端末50とリクエスタとを、また、ワーカ端末60A等とその操作者であるワーカとを区別せずに用いる。例えば、リクエスタによるリクエスタ端末50を用いての新規タスクの発注を、リクエスタ端末50からの新規タスクの発注と表記することがある。また、例えば、インターネットを介してワーカAが操作するワーカ端末60Aに新規タスクを割り当てることを、ワーカAに新規タスクを依頼する(割り当てる)と表記することがある。
(タスク割り当てサーバの構成)
タスク割り当てサーバ10は、タスク割り当てシステム1において、リクエスタ端末50からの新規タスクの依頼を受けて、ワーカ群からエキスパートを抽出して、エキスパートに新規タスクを割り当てるサーバである。なお、タスク割り当てサーバ10は、例えばワーカ端末60A等に比べて処理能力の高いコンピュータであり、このような処理をプログラムに従って実行してもよいし、一部または全部の処理をハードウェアで実行してもよい。ここで、エキスパートとは、ワーカ群に属するワーカであって、リクエスタの期待通りに新規タスクを処理すると推定されるワーカ、またはそのようなワーカの集団のことをいう。例えば、リクエスタが品質の高い処理結果を望む場合には、エキスパートは正解率が高いと推定されるワーカで構成されてもよい。また、例えばリクエスタが新規タスクに対する直感的な回答を求める場合には、エキスパートは早い処理時間で処理結果を返すと推定されるワーカ、または修正回数が少ないと推定されるワーカで構成されてもよい。なお、以下では、エキスパートは正解率が高いと推定されるワーカ、またはそのようなワーカの集団であるとして説明する。
タスク割り当てサーバ10は、タスク登録機能部12、クラスタ作成機能部14、タスク依頼機能部16、処理結果解析機能部18、タスクデータベース(タスクDB22)、ワーカデータベース(ワーカDB24)を備える。
タスク登録機能部12は、リクエスタ端末50とのインターフェース部として機能する。タスク登録機能部12は、リクエスタ端末50からの新規タスクの依頼を受けた場合には新規タスクの情報をタスクDB22に書く。また、エキスパートのそれぞれの処理結果がタスクDB22に書かれた場合には、それらを集計し、新規タスクに対するシステムとしての処理結果をリクエスタ端末50に出力する。
クラスタ作成機能部14は、ワーカDB24に書かれたワーカ群情報に基づいて、各ワーカの過去のタスク処理結果を用いて、その特徴からワーカをクラスタリング(クラスタ、すなわちグループに分類)する。なお、ワーカ群情報とは、ワーカ群の各ワーカが過去に処理したタスクの情報を少なくとも含む情報である。例えば、クラスタ作成機能部14は、後述するタスクカテゴリ等を考慮して、ワーカ群情報から過去のタスク処理結果を抽出し、その正解率等でワーカをクラスタリングしてもよい。クラスタリングの詳細については後述する。
タスク依頼機能部16は、ワーカとのインターフェース部として機能する。タスク依頼機能部16は、ワーカ群のうちの特定のワーカにタスクを依頼する。そして、タスクを依頼したワーカから処理結果を受け取る。なお、タスクを依頼するワーカは、クラスタ作成機能部14が作成したクラスタ、処理結果解析機能部18の解析結果に基づいて決定されるが、詳細は後述する。
処理結果解析機能部18は、ワーカからの処理結果を集計して様々な解析を行う。処理結果解析機能部18は、解析結果に基づいて、例えばエキスパートを判定し、依頼するタスクを選択できる。また、ワーカから得られた処理結果をワーカDB24、タスクDB22に書いて、データを更新する。
以上のように図1を参照しながらタスク割り当てサーバ10の全体構成を説明したが、以下では、リクエスタ端末50からの新規タスクの依頼を受けたタスク割り当てサーバ10が、ワーカ群からエキスパートを抽出して、エキスパートに新規タスクを割り当て、エキスパートからの処理結果に基づいてシステムとしての処理結果をリクエスタ端末50に返すまでの処理の流れを説明し、必要な場合には図を参照して特定の処理について詳細に説明する。また、以下で説明する処理は、プログラムによってコンピュータをタスク割り当てサーバ10として機能させることで実現できる。このとき、プログラムは図1で図示しない着脱可能な記憶媒体に記憶されてもよいし、図示しないネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)、またはインターネットを介して接続された他のコンピュータに記憶されてもよい。
(タスク割り当てサーバの処理)
図2は本実施形態のタスク割り当てサーバ10の処理を説明するフローチャートである。クラウドソーシングにおいては、ワーカに能力差があるため、タスクの内容によって処理結果の品質に差が生じ得る。タスク割り当てサーバ10は、フローチャートに従った処理を行うことで、新規タスクをエキスパート、すなわち新規タスクを処理して品質の高い処理結果を返すと推定されるワーカに依頼することができる。
最初に、タスク割り当てサーバ10は、リクエスタ端末50から新規タスクの依頼を受ける(ステップS1)。このとき、タスク登録機能部12は、過去のタスクと同じデータ構成で新規タスクの情報をタスクDB22に書く。そして、タスク割り当てサーバ10は、クラスタの抽出を実行する(ステップS2)。クラスタの抽出とは、新規タスクに関して、類似するワーカでクラスタをつくること、すなわちクラスタリングである。タスク割り当てサーバ10のクラスタ作成機能部14は、ワーカDB24に書かれたワーカ群情報に基づいてクラスタリングを行う。
ここで、ステップS2のクラスタの抽出について説明する前に、タスクDB22に記録されるタスクの情報、ワーカDB24のワーカ群情報について図3(A)、図3(B)、図4を参照して説明する。
図3(A)に示されるように、タスクは“タスクID”、“指示文”、“回答形式”、“選択項目”、“タスクカテゴリID”に分けてタスクDB22に記憶される。また、図3(B)に示すように、“タスクカテゴリID”は“タスクカテゴリ”と対応する形で別途タスクDB22に記憶される。
“タスクID”はタスク毎に付されたID(identification)であって、タスク割り当てサーバ10は、タスクIDが同じであれば同じタスクであると判定できる。図3(A)では、図示の都合上、一部であるT001、T002、T006の3つのタスクIDのみを示している。
“指示文”はワーカに提示するタスクの指示であり、ワーカ端末60A等に表示されるものである。“回答形式”はタスクの回答形式を指定するものである。図3(A)のCheck_box、Radio_button、Textは、それぞれ選択式のチェックボックス、選択式のラジオボタン、テキストでの自由記述を指定する。また、“選択項目”は選択式の場合の選択可能な項目である。図3(A)の例では、タスクIDをT002とするタスクがワーカに依頼された場合、そのワーカが操作する端末には「単語に当てはまるカテゴリを選択して下さい」との指示がラジオボタンとともに表示されて、ラジオボタンでname、time、othersのいずれかが選択可能である。
“タスクカテゴリID”は、“タスクカテゴリ”、すなわちリクエスタが指定するタスクのカテゴリのそれぞれに付されたIDである。図3(A)では、C001、C002、C003の3つのタスクカテゴリIDが示されている。そして、図3(B)に示されるように、“タスクカテゴリ”もタスクDB22に記憶されている。図3(B)の例では、“タスクカテゴリID”のC001、C002、C003には、それぞれ「画像ラベリング」、「固有表現ラベリング」、「音声データ書き起こし」の“タスクカテゴリ”が対応する。以上のような形式で、リクエスタ端末50からの新規タスクもタスクDB22に記憶される。
また、図4に示されるように、ワーカ群情報は、それぞれのワーカについての“ワーカID”、“処理タスクリスト”、“回答内容リスト”、“処理時間リスト”、“修正回数リスト”、“年齢”の情報を含む。
“ワーカID”はワーカ群に属するワーカ毎に付されたIDである。図4では、図示の都合上、一部であるW001、W002、W003の3つのワーカIDのみを示している。“処理タスクリスト”はそのワーカが過去に処理したタスクを、前記のタスクIDを用いて示すものである。“回答内容リスト”は、そのワーカが過去に処理したタスクへの回答内容を示すものであり、選択式の回答も自由入力の回答も含まれる。“処理時間リスト”は、そのワーカが過去にそれぞれのタスクを処理するのに要した時間を示すものであり、図4では秒(sec)単位で示されている。“修正回数リスト”は、そのワーカが過去にそれぞれのタスクの処理を完了するまでに修正した回数を示すものである。“年齢”はそのワーカの年齢を示す。なお、図4の例では、処理時間、修正回数として、それぞれ実時間、実際の回数を用いているが、相対的な数値が用いられてもよい。例えば、そのワーカのこれまでの平均値と比較した処理時間の長短や、修正回数の多少がワーカDB24に記録されてもよい。
図4の例では、ワーカIDをW001とするワーカは、過去にタスクIDをT003、T004、T006とするタスクの処理経験があり、それぞれ回答内容リストで示されるような回答をしている。また、これらのタスクをそれぞれ10、20、60秒で完了し、タスクIDをT003、T006とするタスクについて、それぞれ1回、3回の修正を行って完了している。また、このワーカの年齢は23才である。このように、タスク割り当てサーバ10は、ワーカ群情報をワーカDB24に図4のようなデータ構成で記憶している。このように、タスク割り当てサーバ10は、ワーカDB24に記憶されているワーカ群情報によって、ワーカ群に属する各ワーカの過去のタスク処理結果についても把握できる。
ここで、再び図2を参照して、ステップS2のクラスタの抽出について説明する。タスク割り当てサーバ10のクラスタ作成機能部14は、まず、タスクDB22から新規タスクの情報を取得する。通常、新規タスクは過去に処理されていないため、ワーカDB24のワーカ群情報の処理タスクリストには含まれていない。そのため、クラスタ作成機能部14は、新規タスクに最も類似する各ワーカの過去のタスク(以下、「類似タスク」とする)を選択する。タスクの類似性の判定は、例えばタスクに含まれるテキスト情報(指示文)、ワーカ群情報から得られるワーカの処理結果、新規タスクのカテゴリ(タスクカテゴリID)等を用いて行うことができる。
そして、クラスタ作成機能部14は、各ワーカの類似タスクに対する処理結果を、ワーカDB24のワーカ群情報から取得する。図4を参照して説明したように、クラスタ作成機能部14は、この処理結果として、回答の選択または自由記述の内容(回答内容リスト)、処理時間、修正回数等の複数の要素を得ることができる。例えばクラスタ作成機能部14は、この処理結果を特徴ベクトルに変換、抽象化した上で、ベクトル距離を類似度として類似ワーカを抽出する手法でクラスタリングをしてもよい。また、この手法に限らず、クラスタ作成機能部14は、グラフベースの協調フィルタリング(特許文献1参照)、特徴ベクトルに基づくK−means、ワーカ群に属する全ワーカの特徴ベクトルを行列として行列分解する手法等を用いてもよい。
図5の左図は、クラスタ作成機能部14が前記の手法によって、ワーカ群に属するワーカをクラスタ1、クラスタ2のいずれかに分類した様子を表す図である。なお、図5の左図におけるクラスタ1、クラスタ2は、図2の同名の要素に対応する。ここで、図5および図2では、説明の都合上、クラスタを2つにしているが、3つ以上のクラスタにワーカを分類してもよい。
ここで、再び図2を参照する。クラスタ1、クラスタ2は、類似タスクに対する処理結果に基づいて生成されているが、「過去のタスクに対して高い能力を持つワーカが、新規タスクに対して同様に能力が高いとは限らない」との問題がある。そこで、タスク割り当てサーバ10は、それぞれのクラスタの少なくとも一人のワーカである代表者にテストタスクを依頼する(ステップS3)。テストタスクは、新規タスクの一部のタスクであって正答(真のラベル、真の値)がわかっているタスクである。そして、タスク割り当てサーバ10は、テストタスク処理結果を取得し(ステップS4)、テストタスク処理結果から新規タスクを依頼するのに最適なクラスタ、すなわちエキスパートクラスタを選択する(ステップS5)。なお、代表者は、そのクラスタへの帰属度が高いものを選定することが好ましい。つまり、ランダムに抽出してもよいが、例えば、正解率がそのクラスタにおける平均値に近いワーカを選択する等の統計的な手法を用いることが好ましい。
ステップS3からステップS5について図1と対応させて説明すると以下のようになる。タスク依頼機能部16は、クラスタ作成機能部14からのクラスタと代表者の情報、および処理結果解析機能部18からの命令に基づいて、クラスタ1の代表者およびクラスタ2の代表者にテストタスクを依頼する(ステップS3)。そして、処理結果解析機能部18は、タスク依頼機能部16経由で、クラスタ1の代表者およびクラスタ2の代表者からのテストタスクの処理結果を受け取る(ステップS4)。処理結果解析機能部18は、処理時間や修正回数を考慮しつつ回答内容が正答か否かを判断し、クラスタ1、クラスタ2のいずれをエキスパートクラスタにすべきかの判定をする(ステップS5)。例えば、処理結果解析機能部18は、処理時間や修正回数も考慮して算出される正解率に基づいてエキスパートクラスタを定めてもよい。以下の説明では、処理結果解析機能部18は正解率の良かったクラスタ1をエキスパートクラスタに定めたとする。なお、図5の右図は、クラスタ1がエキスパートクラスタとして選ばれた様子を示すものである。
次に、タスク割り当てサーバ10は、エキスパートクラスタに本タスク、すなわちテストタスクでない新規タスクの本体を依頼する(ステップS6)。エキスパートクラスタに属するワーカから本タスクの処理結果が返されると、タスク割り当てサーバ10は、その全てを取得して(ステップS7)、処理結果を解析してデータベースに登録する(ステップS8)。そして、タスク割り当てサーバ10は、全ての処理結果からシステムとしての処理結果を計算して、リクエスタ端末50に返す(ステップS9)。
ステップS6からステップS9について図1と対応させて説明すると以下のようになる。タスク依頼機能部16は、クラスタ作成機能部14からのエキスパートクラスタに属するワーカの情報、および処理結果解析機能部18からの命令に基づいて、エキスパートクラスタの全てのワーカに本タスク(テストタスクでない新規タスクの本体)を依頼する(ステップS6)。そして、処理結果解析機能部18は、タスク依頼機能部16経由で、エキスパートクラスタの全てのワーカから本タスクの処理結果を受け取る(ステップS7)。なお、この例では、処理結果解析機能部18がエキスパートクラスタの全てのワーカを対象としているが、処理結果解析機能部18はエキスパートクラスタの一部のワーカに本タスクを依頼して処理結果を受け取ってもよい。例えば、一部のワーカに本タスクを依頼する場合、処理結果解析機能部18は、例えばエキスパートクラスタへの帰属度などに応じて、一部のワーカを選定してもよい。処理結果解析機能部18は得られた処理結果をタスクDB22、ワーカDB24に登録する(ステップS8)、このとき、処理結果解析機能部18は、その正解、不正解以外の処理結果を解析することで、ワーカが不真面目に処理したことが原因か、ワーカの能力不足が原因か、うっかり等のヒューマンエラーが原因か等を解析できる。このような解析により、今後のワーカのクラスタリングの精度(類似のワーカを適切に抽出できる精度)を高めることが可能である。そして、リクエスタ端末50は、タスクDB22に登録された本タスクの処理結果から1つのシステムとしての処理結果を計算して、リクエスタ端末50に返す(ステップS9)。例えば、リクエスタ端末50は、図6のように多数決によってシステムとしての処理結果を求めてもよい。図6の例では、エキスパートクラスタに属するワーカA、B、Cの処理結果がそれぞれ「1」、「0」、「1」であるので、多数決によりシステムとしての処理結果を「1」としている。また、クラスタへの所属度等によって多数決の重みを変えてもよい。
以上のように、本実施形態に係るタスク割り当てサーバ10、タスク割り当て方法およびプログラムによれば、ワーカを過去の処理結果によってクラスタリングすることでスパース性があっても対応可能であり、「対象となる全てのワーカが同じタスクを処理」する必要はない。また、「過去のタスクに対して高い能力を持つワーカが、新規タスクに対して同様に能力が高いとは限らない」ところ、タスク割り当てサーバ10はテストタスクによって新規タスクに対するワーカの能力を正確に測定することができる。また、テストタスクはワーカ群の一部のワーカに対して行えばよく、「対象となる全てのワーカがテストタスクを処理」する必要はない。よって、前記の実施形態に係るタスク割り当てサーバ10、タスク割り当て方法およびプログラムによれば、新規タスクに対する適切なワーカを抽出し、スパース性があっても対応可能である。
(第2実施形態)
以下、本発明に係る第2実施形態について、図面を参照して説明する。図7は、本実施形態に係るタスク割り当てサーバ10のクラスタ作成機能部14のクラスタリングについて第1実施形態と対比させて説明するための図である。第1実施形態では、エキスパートクラスタは、その前に分類したクラスタ(図5の例ではクラスタ1およびクラスタ2)の中から選択された(図2のステップS5)。しかし、本実施形態に係るタスク割り当てサーバ10は、図7のように事前にクラスタが存在しない状態からエキスパートクラスタを生成する。同時に、ワーカ群のうち、エキスパートクラスタに分類されないワーカは非エキスパートクラスタを生成することになる。
以下に、本実施形態に係るタスク割り当てサーバ10の処理の流れを、図8を参照して説明する。なお、タスク割り当てサーバ10、タスク割り当てシステム1のブロック図、ワーカDB24、タスクDB22のデータ構造、システムとしての処理結果の生成方法等は第1実施形態と同じであるため説明を省略する。
最初に、タスク割り当てサーバ10は、リクエスタ端末50から新規タスクの依頼を受ける(ステップS1)。ステップS1については第1実施形態と同じである。そして、タスク割り当てサーバ10は、ワーカ群からランダムにワーカを抽出してテストタスクを依頼する(ステップS13)。ここで、ランダムとは例えば乱数を用いた手法であってもよいし、計算式や統計に基づいて一部のワーカを選択する手法であってもよい。そして、タスク割り当てサーバ10は、テストタスク処理結果を取得し(ステップS14)、テストタスク処理結果から新規タスクを依頼するのに最適なクラスタ、すなわちエキスパートクラスタを生成する(ステップS15)。ここで、タスク割り当てサーバ10が生成するエキスパートクラスタは、テストタスク処理結果で正解率の高いワーカを含むクラスタである。
ステップS13からステップS15について図1と対応させて説明すると以下のようになる。タスク依頼機能部16は、処理結果解析機能部18からの命令に基づいて、ランダムに選択されたワーカにテストタスクを依頼する(ステップS13)。そして、処理結果解析機能部18は、タスク依頼機能部16経由で、ランダムに選択されたワーカからテストタスクの処理結果を受け取る(ステップS14)。処理結果解析機能部18は、処理時間や修正回数も考慮して算出される正解率に基づいて、正解率の高いワーカ(以下、初期エキスパートとする)の情報をワーカDB24に登録する。そして、クラスタ作成機能部14は、初期エキスパートの過去のタスクに対する処理結果を特徴ベクトルに変換、抽象化した上で、ベクトル距離を類似度として類似ワーカを抽出する手法でクラスタリングする(ステップS15)。なお、前記のように、グラフベースの協調フィルタリング等の別の手法が用いられてもよい。このようなクラスタ作成機能部14のクラスタリングによって、ワーク群に属するワーカは、エキスパートクラスタと非エキスパートクラスタとに分類される。
その後、タスク割り当てサーバ10は、エキスパートクラスタに本タスク、すなわちテストタスクでない新規タスクの本体を依頼する(ステップS16)。エキスパートクラスタに属するワーカから本タスクの処理結果が返されると、タスク割り当てサーバ10は、その全てを取得して(ステップS17)、処理結果を解析してデータベースに登録する(ステップS18)。そして、タスク割り当てサーバ10は、全ての処理結果からシステムとしての処理結果を計算して、リクエスタ端末50に返す(ステップS19)。ここで、ステップS16〜ステップS19は、それぞれ第1実施形態におけるステップS6〜ステップS9に対応するため、詳細な説明を省略する。
以上のように、本実施形態に係るタスク割り当てサーバ10、タスク割り当て方法およびプログラムによれば、第1実施形態と同様に、新規タスクに対する適切なワーカを抽出し、スパース性があっても対応可能である。さらに、本実施形態に係るタスク割り当てサーバ10等では、テストタスクの処理結果から正解率の高いワーカ(初期エキスパート)を抽出した上で、そのワーカと類似するワーカとで構成される集団をエキスパートクラスタとする(図8のステップS15)。本実施形態に係るタスク割り当てサーバ10等は、エキスパートであるワーカを把握してからクラスタリングするので、効率的にエキスパートクラスタを生成することが可能である。
(実験例)
図9、図10は、前記の実施形態のタスク割り当てサーバ10を用いての実験結果の一例を示す図である。なお、図9は新規タスクとして画像ラベリング(画像について選択肢から正答を選択するもの)を行った場合、図10は新規タスクとして固有表現ラベリング(画像以外の表現について選択肢から正答を選択するもの)を行った場合の実験結果である。
図9、図10の横軸はワーカの数を表し、縦軸は正解率を表す。この実験では、ワーカ群として33名のワーカがおり、29名以下のワーカをランダムに抽出した場合(点線R)と、前記の実施形態のタスク割り当てサーバ10でエキスパートを抽出した場合(実線C)とを比較している。なお、システムとしての処理結果は多数決によって決定している。
図9に示されるように、ランダムにワーカを抽出した場合には、ワーカの数が減少するにつれて正解率が低下しており、例えばワーカの数が5名の場合には、29名の場合にくらべて10%程度の正解率の低下がみられる。一方、前記の実施形態のタスク割り当てサーバ10でエキスパートを抽出した場合には、ワーカ(すなわち、エキスパートと推定された者)の数が5名であっても、ほとんど正解率が低下していない。
また、図10の実験結果では、ランダムにワーカを抽出した場合、その人数によらず正解率は約78%であった。一方、前記の実施形態のタスク割り当てサーバ10でエキスパートを抽出した場合には、ワーカ(すなわち、エキスパートと推定された者)の数が少なくても、80%以上の正解率を得られた。いずれの実験でも前記の実施形態の手法によって能力の高いワーカを抽出しており、ランダムにワーカを抽出した場合には多くの人数が必要な正解率(処理結果の品質)をより少ない人数で保つまたは上回ることができている。
以上のように、前記の実施形態に係るタスク割り当てサーバ10、タスク割り当て方法およびプログラムによれば、ワーカを過去の処理結果によってクラスタリングすることでスパース性があっても対応可能であり、「対象となる全てのワーカが同じタスクを処理」する必要はない。また、「過去のタスクに対して高い能力を持つワーカが、新規タスクに対して同様に能力が高いとは限らない」ところ、タスク割り当てサーバ10はテストタスクによって新規タスクに対するワーカの能力を正確に測定することができる。また、テストタスクはワーカ群の一部のワーカに対して行えばよく、「対象となる全てのワーカがテストタスクを処理」する必要はない。よって、前記の実施形態に係るタスク割り当てサーバ10、タスク割り当て方法およびプログラムによれば、新規タスクに対する適切なワーカを抽出し、スパース性があっても対応可能である。
ここで、従来のコンテンツ推薦アルゴリズムと比べると、前記の実施形態に係るタスク割り当てサーバ10等のアルゴリズム(以下、「タスク割り当てアルゴリズム」とする)は以下のような利点がある。
従来のコンテンツ推薦アルゴリズムとして、例えば「協調フィルタリング」を挙げることができる。「協調フィルタリング」は、複数のユーザーの購入履歴から類似するユーザー同士を見つけ出し、あるユーザーに対して、類似するユーザーの購入履歴から算出した商品を推薦するアルゴリズムである。従来のコンテンツ推薦アルゴリズムとタスク割り当てアルゴリズムとでは、「ユーザー」と「ワーカ」、「コンテンツ」と「タスク」、「購入履歴」と「タスク処理の正解・不正解」とを対比して考えることが可能である。
タスク割り当てアルゴリズムは、情報の粒度を細分化することで類似のワーカを精度よく抽出することができる。コンテンツ推薦アルゴリズムでは、ユーザーがコンテンツを購入したか否かという2値情報で類似のユーザーを選出する。一方、タスク割り当てアルゴリズムは、問題への正解、不正解という2値情報以外にも、回答の入力結果(テキスト入力や選択結果)や、タスク処理に要した時間、処理結果の修正回数等、タスク処理に付随する様々な情報を取得できる。また、不正解の場合であっても、処理結果解析機能部18が2値情報以外の処理結果を解析することで、ワーカが不真面目に処理したことが原因か、ワーカの能力不足が原因か、うっかり等のヒューマンエラーが原因かを判定することも可能である。そのため、タスク割り当てアルゴリズムは、コンテンツ推薦アルゴリズムと比べて、ワーカの情報をより細かく利用し、類似のワーカを精度よく抽出することができる。
また、タスク割り当てアルゴリズムは、抽出したエキスパートのフィードバック(処理結果)に基づいてアルゴリズムの調整も可能である。コンテンツ推薦アルゴリズムでは、ユーザーに推薦したコンテンツがユーザーにとって好ましいものであったかどうかのフィードバックはユーザーがそのコンテンツを購入したことでしか得られない。一方、タスク割り当てアルゴリズムは、抽出したエキスパートから新規タスクの処理結果を必ず得ることができ、その処理結果(正解、不正解や回答内容等)に基づいてエキスパートの抽出が適切であったかどうかを判定し、タスク割り当てアルゴリズムの調整(例えば内部パラメータの設定)に利用することができる。
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。また、前記実施形態では、タスク割り当てサーバ10としてコンピュータを例示したが、これらに限らずタブレット、スマートフォン、携帯電話等を用いることが可能である。また、前記実施形態では、インターネットを介してワーカにタスクを依頼するが、インターネットに代えてLAN、WAN等のネットワークが用いられてもよい。
1 タスク割り当てシステム
10 タスク割り当てサーバ
12 タスク登録機能部
14 クラスタ作成機能部
16 タスク依頼機能部
18 処理結果解析機能部
22 タスクDB
24 ワーカDB
50 リクエスタ端末
60A、60B、60N ワーカ端末

Claims (4)

  1. ネットワークを介して、新規タスクを処理可能なワーカ群のうちエキスパートに前記新規タスクを割り当てるタスク割り当てサーバであって、
    前記ワーカ群の各ワーカが過去に処理したタスクの情報を少なくとも含むワーカ群情報を記憶するワーカDBと、
    前記ワーカ群情報に基づいて、前記ワーカ群の各ワーカを複数のクラスタのいずれかに分類するクラスタ作成機能部と、
    前記新規タスクの一部であるテストタスクの処理結果に基づいて、前記複数のクラスタのうちの1つに属するワーカを、前記エキスパートとする処理結果解析機能部と、
    前記エキスパートに前記新規タスクを依頼するタスク依頼機能部と、
    を備え
    前記タスク依頼機能部は、
    前記新規タスクを依頼する前に、前記複数のクラスタのそれぞれの代表者に前記テストタスクを依頼して、
    受け取った前記テストタスクの処理結果を前記処理結果解析機能部へと出力することを特徴とするタスク割り当てサーバ。
  2. 前記クラスタ作成機能部は、
    前記新規タスクと類似する類似タスクを判定し、
    前記ワーカ群の各ワーカを、過去に処理した前記類似タスクの処理結果に基づいて、前記複数のクラスタのいずれかに分類することを特徴とする、請求項1に記載のタスク割り当てサーバ。
  3. サーバによって、ネットワークを介して、新規タスクを処理可能なワーカ群のうちエキスパートに前記新規タスクを割り当てるタスク割り当て方法であって、
    前記サーバが、
    前記ワーカ群の各ワーカが過去に処理したタスクの情報を少なくとも含むワーカ群情報を記憶するステップと、
    前記ワーカ群情報に基づいて、前記ワーカ群の各ワーカを複数のクラスタのいずれかに分類するステップと、
    前記新規タスクの一部であるテストタスクの処理結果に基づいて、前記複数のクラスタのうちの1つに属するワーカを、前記エキスパートとするステップと、
    前記エキスパートに前記新規タスクを依頼するステップと、
    前記新規タスクを依頼するステップの前に、前記複数のクラスタのそれぞれの代表者に前記テストタスクを依頼して、前記テストタスクの処理結果を受け取るステップと、
    を含むことを特徴とするタスク割り当て方法。
  4. ネットワークを介して、新規タスクを処理可能なワーカ群のうちエキスパートに前記新規タスクを割り当てるタスク割り当てサーバとして機能するコンピュータに、
    前記ワーカ群の各ワーカが過去に処理したタスクの情報を少なくとも含むワーカ群情報を記憶するステップと、
    前記ワーカ群情報に基づいて、前記ワーカ群の各ワーカを複数のクラスタのいずれかに分類するステップと、
    前記新規タスクの一部であるテストタスクの処理結果に基づいて、前記複数のクラスタのうちの1つに属するワーカを、前記エキスパートとするステップと、
    前記エキスパートに前記新規タスクを依頼するステップと、
    前記新規タスクを依頼するステップの前に、前記複数のクラスタのそれぞれの代表者に前記テストタスクを依頼して、前記テストタスクの処理結果を受け取るステップと、
    を実行させることを特徴とするプログラム。
JP2014037186A 2014-02-27 2014-02-27 タスク割り当てサーバ、タスク割り当て方法およびプログラム Active JP6062384B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014037186A JP6062384B2 (ja) 2014-02-27 2014-02-27 タスク割り当てサーバ、タスク割り当て方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014037186A JP6062384B2 (ja) 2014-02-27 2014-02-27 タスク割り当てサーバ、タスク割り当て方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2015162109A JP2015162109A (ja) 2015-09-07
JP6062384B2 true JP6062384B2 (ja) 2017-01-18

Family

ID=54185158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014037186A Active JP6062384B2 (ja) 2014-02-27 2014-02-27 タスク割り当てサーバ、タスク割り当て方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6062384B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019033419A1 (zh) * 2017-08-18 2019-02-21 深圳市华第时代科技有限公司 学习任务的自动生成方法、装置、教学服务器及存储介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7080033B2 (ja) * 2017-11-07 2022-06-03 株式会社日立製作所 タスク管理システム、タスク管理方法、及びタスク管理プログラム
JP7211735B2 (ja) * 2018-08-29 2023-01-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 寄与度決定方法、寄与度決定装置及びプログラム
WO2020240642A1 (ja) * 2019-05-27 2020-12-03 日本電気株式会社 仮想マシン制御装置、仮想マシン制御システム、仮想マシン制御方法、及び、プログラムが格納された非一時的なコンピュータ可読媒体
CN112101722A (zh) * 2020-08-11 2020-12-18 大亚湾核电运营管理有限责任公司 核电站备件盘点方法、装置、计算机设备及存储介质
CN115695432B (zh) * 2023-01-04 2023-04-07 河北华通科技股份有限公司 一种负载均衡方法、装置、电子设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004077740A (ja) * 2002-08-16 2004-03-11 Toshiba Eng Co Ltd 電子教育システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019033419A1 (zh) * 2017-08-18 2019-02-21 深圳市华第时代科技有限公司 学习任务的自动生成方法、装置、教学服务器及存储介质

Also Published As

Publication number Publication date
JP2015162109A (ja) 2015-09-07

Similar Documents

Publication Publication Date Title
JP6062384B2 (ja) タスク割り当てサーバ、タスク割り当て方法およびプログラム
CN109190043B (zh) 推荐方法及装置,存储介质,电子设备及推荐系统
CN109547814B (zh) 视频推荐方法、装置、服务器及存储介质
TWI677852B (zh) 一種圖像特徵獲取方法及裝置、電子設備、電腦可讀存儲介質
US9576248B2 (en) Record linkage sharing using labeled comparison vectors and a machine learning domain classification trainer
WO2018006727A1 (zh) 机器人客服转人工客服的方法和装置
WO2019232891A1 (zh) 用户画像获取方法、装置、计算机设备以及存储介质
JP2019185716A (ja) エンティティ推薦方法及び装置
CN110362677B (zh) 文本数据类别的识别方法及装置、存储介质、计算机设备
CN107644036B (zh) 一种数据对象推送的方法、装置及系统
CN110462607B (zh) 从梯度增强机识别原因代码
US11238132B2 (en) Method and system for using existing models in connection with new model development
CN108038208B (zh) 上下文信息识别模型的训练方法、装置和存储介质
JP2019079302A (ja) 営業活動支援システム、営業活動支援方法および営業活動支援プログラム
US11269966B2 (en) Multi-classifier-based recommendation method and device, and electronic device
CN108629358B (zh) 对象类别的预测方法及装置
CN110992124B (zh) 房源的推荐方法及房源的推荐系统
US10922725B2 (en) Automatic rule generation for recommendation engine using hybrid machine learning
US20190213610A1 (en) Evaluation device and evaluation method
CN112148986B (zh) 一种基于众包的top-N服务再推荐方法及系统
KR101922725B1 (ko) 인공지능 과제매칭 방법, 장치 및 프로그램
JP6933217B2 (ja) テーブル意味推定システム、方法およびプログラム
CN110213660B (zh) 节目的分发方法、系统、计算机设备和存储介质
CN110019563B (zh) 一种基于多维数据的肖像建模方法和装置
CN109146606B (zh) 一种品牌推荐方法、电子设备、存储介质及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161011

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161214

R150 Certificate of patent or registration of utility model

Ref document number: 6062384

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150