JP2015200985A - クラウドソーシングにおける作業者のスキルを評価するスキル評価装置、プログラム及び方法 - Google Patents
クラウドソーシングにおける作業者のスキルを評価するスキル評価装置、プログラム及び方法 Download PDFInfo
- Publication number
- JP2015200985A JP2015200985A JP2014078256A JP2014078256A JP2015200985A JP 2015200985 A JP2015200985 A JP 2015200985A JP 2014078256 A JP2014078256 A JP 2014078256A JP 2014078256 A JP2014078256 A JP 2014078256A JP 2015200985 A JP2015200985 A JP 2015200985A
- Authority
- JP
- Japan
- Prior art keywords
- task information
- work
- worker
- skill
- work task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000012358 sourcing Methods 0.000 title abstract description 6
- 230000006870 function Effects 0.000 claims description 8
- 238000013518 transcription Methods 0.000 claims description 3
- 230000035897 transcription Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 6
- 230000003247 decreasing effect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 10
- 230000001915 proofreading effect Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】クラウドソーシングのように不特定多数且つ多様な作業者の中で、高スキルの作業者を選択することができるスキル評価装置、プログラム及び方法を提供する。【解決手段】各作業者の作業タスク情報を収集する作業タスク情報収集手段と、対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する学習タスク情報推定手段と、学習タスク情報に対する類似度が所定閾値以上となる複数の作業タスク情報を選択する作業タスク情報選択手段と、選択された複数の作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成し、その学習タスク情報を、作業タスク情報選択手段へフィードバックする学習タスク情報抽出手段と、最終的に、学習タスク情報に対する類似度が高い順に複数の作業タスク情報をソートし、その順位を作業者毎のスキルとして評価する作業者スキル評価手段とを有する。【選択図】図2
Description
本発明は、作業者のスキルを評価する技術に関する。
コンピュータは、人の作業を「タスク」として実行することによって発展してきている。従来、人によって記述された文章に対して、例えばスペルチェックのように、誤記の可能性がある箇所を自動的に検出し明示する技術がある(例えば特許文献1参照)。また、映像中の人物の顔画像に対して、人物の向き毎にテンプレートを作成することによって自動的に認識する技術もある(例えば特許文献2参照)。これら技術は、有効なアルゴリズムの適用やデータベースの充実によって、ある程度の精度が期待される。
一方で、作業主体となる各個人に対して、そのスキル(Skill、作業能力)を自動的に評価する技術もある(例えば特許文献3参照)。この技術によれば、各評価対象者に対して、正解が既知である問題を出題し、その回答結果に基づいてその評価対象者のスキルを定量的に評価する。例えば、文章校正の作業の場合、誤記の箇所が既知である複数の文章に対して、作業者がそれら誤記を発見できるか否かによって判定する。各個人のスキルを評価することによって、できる限り高スキルの作業者にその作業を依頼することができる。
また、画像認識の作業によれば、単一の認識アルゴリズムでは十分な認識精度が得られない場合に、複数の認識アルゴリズムによる計算結果を統合する(例えば多数決をとる)ことによって、高い認識精度を得る技術もある(例えば特許文献4参照)。
文章校正作業や画像認識作業の場合、人間の認識や判断を必要とし、例えば特許文献1及び2に記載の技術のように、有効なアルゴリズムの適用やデータベースの充実だけでは、十分な性能を得ることが難しい。即ち、人間の認識や判断を必要とする作業に対しては、完全なマシン依存とすることが難しい。
一方で、インターネットを介して不特定多数の人(作業者)に仕事を依頼する「クラウドソーシング」が、近年、注目されてきている。人間の認識や判断を必要とする作業に対しては、結果的に、人の作業として遂行させた方が、精度の高いタスクが得られる。そのような意味でも、多数の人力を用いたクラウドソーシングは、有益な効果をもたらす。
しかしながら、作業者のスキルは、作業内容に応じて大きく異なる。また、その作業者の専門分野によっても大きく異なる。具体的には、文章校正の作業であっても、その文章に記述された専門分野によっては、作業者のスキルが低下することもなる。クラウドソーシングの場合、多数の人力を利用することができるものの、一定以上の作業品質を担保することが難しい。
また、例えば特許文献3に記載の技術のように、正解が既知である問題を、対象となる全ての作業者に予め回答させる必要がある。しかしながら、本来の作業以外の作業を発生することとなり、コスト的にも問題がある。
更に、特許文献4に記載の技術によれば、各アルゴリズムの計算結果がある程度正しい(例えば50%以上の多数決)であることが前提とされている。しかしながら、不特定多数の作業者が存在する場合の場合、少ない回答が、必ずしも誤答とは限らない。高いスキルの数人のみが、結果的に正しいタスクを出力する場合もある。クラウドソーシングのように、不特定多数の作業者のスキルを正しく評価することは更に難しい。
そこで、本発明は、クラウドソーシングのように不特定多数且つ多様な作業者の中で、高スキルの作業者を選択することができるスキル評価装置、プログラム及び方法を提供することを目的とする。
本発明によれば、「対象コンテンツ」に、作業者自ら判断した「作業タスク情報」を付加する作業について、各作業者のスキルを評価するスキル評価装置であって、
各作業者の作業タスク情報を収集する作業タスク情報収集手段と、
対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する学習タスク情報推定手段と、
学習タスク情報に対する類似度が所定閾値以上となる複数の作業タスク情報を選択する作業タスク情報選択手段と、
選択された複数の作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成し、該学習タスク情報を、作業タスク情報選択手段へフィードバックする学習タスク情報抽出手段と、
最終的に、学習タスク情報に対する類似度が高い順に複数の作業タスク情報をソートし、その順位を作業者毎のスキルとして評価する作業者スキル評価手段と
を有することを特徴とする。
各作業者の作業タスク情報を収集する作業タスク情報収集手段と、
対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する学習タスク情報推定手段と、
学習タスク情報に対する類似度が所定閾値以上となる複数の作業タスク情報を選択する作業タスク情報選択手段と、
選択された複数の作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成し、該学習タスク情報を、作業タスク情報選択手段へフィードバックする学習タスク情報抽出手段と、
最終的に、学習タスク情報に対する類似度が高い順に複数の作業タスク情報をソートし、その順位を作業者毎のスキルとして評価する作業者スキル評価手段と
を有することを特徴とする。
本発明のスキル評価装置における他の実施形態によれば、
対象コンテンツは「文章」であり、作業タスク情報は、文章に対する誤記情報である、
対象コンテンツは「画像」であり、作業タスク情報は、画像に対する指示情報である、又は、
対象コンテンツは「音声」であり、作業タスク情報は、音声に対する書き起こしのテキスト情報であることも好ましい。
対象コンテンツは「文章」であり、作業タスク情報は、文章に対する誤記情報である、
対象コンテンツは「画像」であり、作業タスク情報は、画像に対する指示情報である、又は、
対象コンテンツは「音声」であり、作業タスク情報は、音声に対する書き起こしのテキスト情報であることも好ましい。
本発明のスキル評価装置における他の実施形態によれば、
作業タスク情報選択手段について、学習タスク情報と作業タスク情報との比較における類似度は、適合率(precision)及び再現率(recall)に基づくF値(F-measure)であることも好ましい。
作業タスク情報選択手段について、学習タスク情報と作業タスク情報との比較における類似度は、適合率(precision)及び再現率(recall)に基づくF値(F-measure)であることも好ましい。
本発明のスキル評価装置における他の実施形態によれば、
クラウドソーシングサービスにおけるクラウドソーシングサーバとして機能することも好ましい。
クラウドソーシングサービスにおけるクラウドソーシングサーバとして機能することも好ましい。
本発明によれば、「対象コンテンツ」に、作業者自ら判断した「作業タスク情報」を付加する作業について、各作業者のスキルを評価する装置に搭載されたコンピュータを機能させるプログラムであって、
各作業者の作業タスク情報を収集する作業タスク情報収集手段と、
対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する学習タスク情報推定手段と、
学習タスク情報に対する類似度が所定閾値以上となる複数の作業タスク情報を選択する作業タスク情報選択手段と、
選択された複数の作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成し、該学習タスク情報を、作業タスク情報選択手段へフィードバックする学習タスク情報抽出手段と、
最終的に、学習タスク情報に対する類似度が高い順に複数の作業タスク情報をソートし、その順位を作業者毎のスキルとして評価する作業者スキル評価手段と
してコンピュータ機能させることを特徴とする。
各作業者の作業タスク情報を収集する作業タスク情報収集手段と、
対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する学習タスク情報推定手段と、
学習タスク情報に対する類似度が所定閾値以上となる複数の作業タスク情報を選択する作業タスク情報選択手段と、
選択された複数の作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成し、該学習タスク情報を、作業タスク情報選択手段へフィードバックする学習タスク情報抽出手段と、
最終的に、学習タスク情報に対する類似度が高い順に複数の作業タスク情報をソートし、その順位を作業者毎のスキルとして評価する作業者スキル評価手段と
してコンピュータ機能させることを特徴とする。
本発明によれば、「対象コンテンツ」に、作業者自ら判断した「作業タスク情報」を付加する作業について、各作業者のスキルを評価するように実行する装置のスキル評価方法であって、
各作業者の作業タスク情報を収集する第1のステップと、
対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する第2のステップと、
学習タスク情報に対する類似度が所定閾値以上となる複数の作業タスク情報を選択する第3のステップと、
選択された複数の作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成し、該学習タスク情報を、作業タスク情報選択手段へフィードバックする第4のステップと、
最終的に、学習タスク情報に対する類似度が高い順に複数の作業タスク情報をソートし、その順位を作業者毎のスキルとして評価する第5のステップと
を有することを特徴とする。
各作業者の作業タスク情報を収集する第1のステップと、
対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する第2のステップと、
学習タスク情報に対する類似度が所定閾値以上となる複数の作業タスク情報を選択する第3のステップと、
選択された複数の作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成し、該学習タスク情報を、作業タスク情報選択手段へフィードバックする第4のステップと、
最終的に、学習タスク情報に対する類似度が高い順に複数の作業タスク情報をソートし、その順位を作業者毎のスキルとして評価する第5のステップと
を有することを特徴とする。
本発明のスキル評価装置、プログラム及び方法によれば、クラウドソーシングのように不特定多数且つ多様な作業者の中で、高スキルの作業者を選択することができる。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図1は、本発明におけるシステム構成図である。
図1によれば、スキル評価装置1と、多数の作業者の端末2とが、ネットワークを介して接続されている。このシステムは、具体的には「クラウドソーシングサービス」として適用される。作業依頼者は、自らの端末3を用いて、スキル評価装置1へ、作業対象となる「対象コンテンツ」を送信する。スキル評価装置1は、作業依頼者の端末3から見て、クラウドソーシング用のAPI(Application Programming Interface)を提供するようなものである。スキル評価装置1は、この「対象コンテンツ」を、多数の作業者の端末2へ送信し、作業後、各作業者から返信された「作業タスク情報」を用いて、各作業者のスキル(Skill、作業能力)を評価する。スキル評価装置1は、対象コンテンツを用いて、最終的に、作業者をスキルの高い順にソートすることによって、各作業者のスキルを評価することができる。
作業者は、依頼された「対象コンテンツ」に対して作業し、自ら判断した「作業タスク情報」を付加する。ここでの「作業」とは、「対象コンテンツ」に「作業タスク情報」を付加するようなものである。即ち、本発明が対象とする「作業」とは、作業者に創造的に何らかのコンテンツを作成するようなものではなく、元となる「対象コンテンツ」に対して、その作業者の認識や判断によって「作業タスク情報」を付加するようなものである。
依頼作業が、元の文章から誤りを発見する「文章校正作業」である場合、例えば、元の文章(対象コンテンツ)に対して、誤記部分に下線(作業タスク情報)を付加するようなものである。
また、依頼作業が、元の画像から特定部分を発見する「画像認識作業」である場合、例えば、元の画像(対象コンテンツ)に対して、認識した顔部分に囲みマーク(作業タスク情報)を付加するようなものである。
本発明は、その他、様々な対象コンテンツに対して、様々な作業タスク情報を付加するような作業に適用することができる。
また、依頼作業が、元の画像から特定部分を発見する「画像認識作業」である場合、例えば、元の画像(対象コンテンツ)に対して、認識した顔部分に囲みマーク(作業タスク情報)を付加するようなものである。
本発明は、その他、様々な対象コンテンツに対して、様々な作業タスク情報を付加するような作業に適用することができる。
図1によれば、作業依頼者は、例えば以下のような文章(対象コンテンツ)に対する校正作業を依頼しているとする。
「近年、インターネッツを通じて不特定多数が人に仕事を依頼するクラウドソーシングに注目が集まっている。文書厚生や画像認識など、計算機の身では十分な性能を得ることが難かしく、人間の認識や判断などを必要とるタスクを推敲する上で有益となる。」
これに対し、各作業者は、スペルチェックとして、誤記と思われる部分に下線を引く作業をする。
「近年、インターネッツを通じて不特定多数が人に仕事を依頼するクラウドソーシングに注目が集まっている。文書厚生や画像認識など、計算機の身では十分な性能を得ることが難かしく、人間の認識や判断などを必要とるタスクを推敲する上で有益となる。」
これに対し、各作業者は、スペルチェックとして、誤記と思われる部分に下線を引く作業をする。
図2は、本発明のスキル評価装置における機能構成図である。
図2によれば、スキル評価装置1は、作業タスク情報収集部11と、学習タスク情報推定部12と、作業タスク情報選択部13と、学習タスク情報抽出部14と、作業者スキル評価部15とを有する。これら機能構成部は、装置に搭載されたコンピュータを実行することによって実現される。また、これら機能構成部の処理の流れは、装置を用いたスキル評価方法としても理解できる。
[作業タスク情報収集部11]
作業タスク情報収集部11は、各作業者に対して「対象コンテンツ」を送信し、各作業者によって作業された「作業タスク情報」を収集する。
作業タスク情報収集部11は、各作業者に対して「対象コンテンツ」を送信し、各作業者によって作業された「作業タスク情報」を収集する。
図3は、対象コンテンツ(文章)に対する、各作業者の作業タスク情報(誤記部分の指摘、スペルチェック)を表す説明図である。図3によれば、作業者毎に、対象コンテンツの文章に対して、誤記と自ら判断した部分に下線が引かれている。
[学習タスク情報推定部12]
学習タスク情報推定部12は、対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する。学習タスク情報推定部12は、作業に応じて様々な機械学習的に学習タスク情報を出力するものである。
具体的には、文章校正作業に対しては、前述した特許文献1に記載の自動文章構成機能であってもよい。
また、画像認識作業に対しては、前述した特許文献2に記載の自動画像認識機能であってもよい。
学習タスク情報推定部12は、対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する。学習タスク情報推定部12は、作業に応じて様々な機械学習的に学習タスク情報を出力するものである。
具体的には、文章校正作業に対しては、前述した特許文献1に記載の自動文章構成機能であってもよい。
また、画像認識作業に対しては、前述した特許文献2に記載の自動画像認識機能であってもよい。
学習タスク情報推定部12は、対象コンテンツに対して、計算機として概ね正しいと推定できる学習タスク情報を出力する。即ち、その学習タスク情報は、人間の認識や判断を完全に推定できないために、完全に正解というわけではない。
図4は、文章校正作業における学習タスク情報と作業タスク情報との比較を表す説明図である。
図4(a)によれば、学習タスク情報推定部12から出力された学習タスク情報が表されている。この学習タスク情報は、各作業者からの作業タスク情報と比較される。
[作業タスク情報選択部13]
作業タスク情報選択部13は、学習タスク情報に対する類似度が所定閾値以上となる複数の高スキルの作業タスク情報を抽出する。類似度が高い作業者ほど、少なくとも学習タスク情報以上の作業スキルを備えている可能性が高いと推定できる。尚、判定となる所定閾値は、作業内容に応じて異なる値を設定するものであってもよい。
作業タスク情報選択部13は、学習タスク情報に対する類似度が所定閾値以上となる複数の高スキルの作業タスク情報を抽出する。類似度が高い作業者ほど、少なくとも学習タスク情報以上の作業スキルを備えている可能性が高いと推定できる。尚、判定となる所定閾値は、作業内容に応じて異なる値を設定するものであってもよい。
図4(b)によれば、各作業者によって文章校正された作業タスク情報が、学習タスク情報と比較されている。例えば所定閾値60%と設定されている。即ち、類似度が60%以上の作業者は、高スキル作業者として認定されている。
作業者A->5箇所中、4箇所一致:類似度80%
○「インターネッツ」「文書厚生」「難かしく」「とる」
×「クラウドソーシング」
作業者B->5箇所中、1箇所一致:類似度20%
○「クラウドソーシング」
×「インターネッツ」「文書厚生」「難かしく」「とる」
作業者C->5箇所中、4箇所一致:類似度80%
○「インターネッツ」「文書厚生」「難かしく」「とる」
×「クラウドソーシング」
作業者D->5箇所中、0箇所一致:類似度 0%
×「インターネッツ」「クラウドソーシング」「文書厚生」「難かしく」「とる」
この場合、作業者A及び作業者Cが、類似度60%以上となり、高スキル作業者として選択される。作業タスク情報選択部13は、計算機による概ね正しいと推定される学習タスク情報を用いて、多数の作業者の中からスキルの高い可能性のある作業者を候補として選択する。
作業者A->5箇所中、4箇所一致:類似度80%
○「インターネッツ」「文書厚生」「難かしく」「とる」
×「クラウドソーシング」
作業者B->5箇所中、1箇所一致:類似度20%
○「クラウドソーシング」
×「インターネッツ」「文書厚生」「難かしく」「とる」
作業者C->5箇所中、4箇所一致:類似度80%
○「インターネッツ」「文書厚生」「難かしく」「とる」
×「クラウドソーシング」
作業者D->5箇所中、0箇所一致:類似度 0%
×「インターネッツ」「クラウドソーシング」「文書厚生」「難かしく」「とる」
この場合、作業者A及び作業者Cが、類似度60%以上となり、高スキル作業者として選択される。作業タスク情報選択部13は、計算機による概ね正しいと推定される学習タスク情報を用いて、多数の作業者の中からスキルの高い可能性のある作業者を候補として選択する。
作業タスク情報選択部13は、学習タスク情報と作業タスク情報との比較における他の実施形態として、再現率又は適合率に基づく「F値(F-measure)」を利用したものであってもよい。
「適合率(precision)」とは、作業タスク情報の箇所の集合中に、学習タスク情報の正解箇所と一致した割合を表す正確性の指標である。
適合率P=一致した箇所の数/作業タスク情報の箇所の数
「再現率(recall)」とは、学習タスク情報の箇所の集合中に、作業タスク情報の箇所と一致した割合を表す網羅性の指標である。
再現率R=一致した箇所の数/学習タスク情報の箇所の数
F値=1/2×(1/R+1/P)
ここで、適合率を上げれば再現率が下がり、再現率を上げれば適合率が下がるというトレードオフの関係にある。そのために、適合率と再現率の調和平均となるF値を用いて、検索性能を評価することも好ましい。F値が高いほど、その作業者の作業タスク情報は、学習タスク情報に近いことを意味する。このF値が所定閾値以上となる作業タスク情報のみを選択することができる。
「適合率(precision)」とは、作業タスク情報の箇所の集合中に、学習タスク情報の正解箇所と一致した割合を表す正確性の指標である。
適合率P=一致した箇所の数/作業タスク情報の箇所の数
「再現率(recall)」とは、学習タスク情報の箇所の集合中に、作業タスク情報の箇所と一致した割合を表す網羅性の指標である。
再現率R=一致した箇所の数/学習タスク情報の箇所の数
F値=1/2×(1/R+1/P)
ここで、適合率を上げれば再現率が下がり、再現率を上げれば適合率が下がるというトレードオフの関係にある。そのために、適合率と再現率の調和平均となるF値を用いて、検索性能を評価することも好ましい。F値が高いほど、その作業者の作業タスク情報は、学習タスク情報に近いことを意味する。このF値が所定閾値以上となる作業タスク情報のみを選択することができる。
[学習タスク情報抽出部14]
学習タスク情報抽出部14は、複数の高スキルの作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成する。即ち、複数の高スキルの作業タスク情報の中で、作業結果が同一である箇所は、高確度で正しい結果であると想定できるためである。
学習タスク情報抽出部14は、複数の高スキルの作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成する。即ち、複数の高スキルの作業タスク情報の中で、作業結果が同一である箇所は、高確度で正しい結果であると想定できるためである。
図5は、複数の作業タスクをマージした学習タスク情報を導出した説明図である。
図5によれば、選択された高スキル作業者A及びCの作業タスク情報を、論理積によってマージしている。
(作業者A) (作業者C) (新たな学習タスク情報)
「インターネッツ」 「インターネッツ」 「インターネッツ」
「が」 × ×
「文書厚生」 「文書厚生」 「文書厚生」
「身」 「身」 「身」
「難かしく」 「難かしく」 「難かしく」
「とる」 「とる」 「とる」
× 「推敲する」 ×
その学習タスク情報は、作業タスク情報選択部13へフィードバックされる。これによって、作業タスク情報選択部13は、新たな学習タスク情報を用いて、改めて作業タスク情報に対する類似度を算出する。
(作業者A) (作業者C) (新たな学習タスク情報)
「インターネッツ」 「インターネッツ」 「インターネッツ」
「が」 × ×
「文書厚生」 「文書厚生」 「文書厚生」
「身」 「身」 「身」
「難かしく」 「難かしく」 「難かしく」
「とる」 「とる」 「とる」
× 「推敲する」 ×
その学習タスク情報は、作業タスク情報選択部13へフィードバックされる。これによって、作業タスク情報選択部13は、新たな学習タスク情報を用いて、改めて作業タスク情報に対する類似度を算出する。
図6は、新たな学習タスク情報と作業タスク情報との比較を表す説明図である。
図6によれば、各作業者によって文章校正された作業タスク情報が、新たな学習タスク情報と比較されている。
作業者A->5箇所中、5箇所一致:類似度100%(更新前よりスコアが向上)
作業者B->5箇所中、0箇所一致:類似度0% (更新前よりスコアが低下)
作業者C->5箇所中、5箇所一致:類似度100%(更新前よりスコアが向上)
作業者D->5箇所中、0箇所一致:類似度0% (更新前と変化なし)
作業者A->5箇所中、5箇所一致:類似度100%(更新前よりスコアが向上)
作業者B->5箇所中、0箇所一致:類似度0% (更新前よりスコアが低下)
作業者C->5箇所中、5箇所一致:類似度100%(更新前よりスコアが向上)
作業者D->5箇所中、0箇所一致:類似度0% (更新前と変化なし)
作業タスク情報選択部13及び学習タスク情報抽出部14によって、学習タスク情報をフィードバックすることを1回以上、繰り返すことによって、作業者のスキル評価が高精度化していく。フィードバックする回数は、所定回数として設定するか、又は、学習タスク情報に変化がなくなった場合に終了するようにしてもよい。
[作業者スキル評価部15]
作業者スキル評価部15は、最終的に、複数の作業タスク情報を、学習タスク情報に対する類似度順にソートする。各作業者のソート順位を、その作業者のスキルとして評価する。また、最終的に得られた学習タスク情報は、作業結果の成果物として出力される。
作業者スキル評価部15は、最終的に、複数の作業タスク情報を、学習タスク情報に対する類似度順にソートする。各作業者のソート順位を、その作業者のスキルとして評価する。また、最終的に得られた学習タスク情報は、作業結果の成果物として出力される。
尚、各作業者のスキル評価は、データベースに登録され、様々な用途で使用されてもよい。また、作業毎に、各作業者のスキル評価を収集し、その平均値をその作業者のスキル評価とすることもできる。
図7は、各作業者に複数の文章校正作業を作業させた場合における平均的なスキル評価を表す説明図である。これによって、作業者毎の平均的なスキルが評価される。
尚、本発明によれば、計算機のみでは十分な性能を得ることが難しく、人間の認識や判断などを必要とする作業に適用可能である。例えば以下のような作業に適用できる。
(1)対象コンテンツは「文章」であり、作業タスク情報は、その文章に対する誤記情報である。
(2)対象コンテンツは「画像」であり、作業タスク情報は、その画像に対する指示情報である。
(3)対象コンテンツは「音声」であり、作業タスク情報は、その音声に対するテキスト情報(書き起こし)である。
即ち、本発明は、対象コンテンツに対して、何らかのタスク情報を付加するような様々な作業に適用できる。
(1)対象コンテンツは「文章」であり、作業タスク情報は、その文章に対する誤記情報である。
(2)対象コンテンツは「画像」であり、作業タスク情報は、その画像に対する指示情報である。
(3)対象コンテンツは「音声」であり、作業タスク情報は、その音声に対するテキスト情報(書き起こし)である。
即ち、本発明は、対象コンテンツに対して、何らかのタスク情報を付加するような様々な作業に適用できる。
図8は、画像認識作業における学習タスク情報と作業タスク情報との比較を表す説明図である。
図8によれば、画像認識作業の例として、対象コンテンツとしての画像中で、人の顔が含まれる箇所をマークする作業が表されている。このような作業は、動画像解析に必要となる場合がある。作業タスク情報及び学習タスク情報としては、マークの位置及び面積を比較することができる。そして、学習タスク情報のマークに対して、その位置及び面積が所定閾値以内(類似度が所定閾値以上)となる作業タスク情報を選択する。選択された高スキルの作業タスク情報の位置及び面積をマージすることによって、新たな学習タスク情報を作成する。その新たな学習タスク情報を用いて改めて作業タスク情報と比較する。これによって、最終的に得られた、学習タスク情報に対する類似度が高い作業タスク情報ほど、高スキルな作業者によって作業されたものと評価することができる。
以上、詳細に説明したように、本発明のスキル評価装置、プログラム及び方法によれば、クラウドソーシングのように不特定多数且つ多様な作業者の中で、高スキルの作業者を選択することができる。また、本発明によれば、作業者のスキル評価と同時に、そのタスクの成果物も得ることができる。特に、正解が既知である問題を解かせる必要が無しに、作業者を評価することができるので、そのコスト削減が期待される。
最後に、本発明によって得られる具体的な効果について説明する。例えば、50件の対象コンテンツを、5人の高スキルな作業者に作業させる場合を想定する。ここで、予め10人の作業者が登録されているとする。
従来技術によれば、スキル評価のため正解が既知となる20件の対象コンテンツを別途作業させる必要がある。そのために、以下のステップを要する。
(S1:スキル評価)最初に、10人の作業者に対して20件の対象コンテンツについて作業させる。
(S2:高スキル作業)次に、その中で高スキルと評価された5人に対して、50件の対象コンテンツについて作業させる。
作業工数=(20件×10人)+(50件×5人)=450件
(S1:スキル評価)最初に、10人の作業者に対して20件の対象コンテンツについて作業させる。
(S2:高スキル作業)次に、その中で高スキルと評価された5人に対して、50件の対象コンテンツについて作業させる。
作業工数=(20件×10人)+(50件×5人)=450件
これに対し、本発明によれば、以下のステップを要する。
(S1:スキル評価)最初に、10人の作業者に対して20件の対象コンテンツについて作業させる。
(S2:高スキル作業)次に、その中で高スキルと評価された5人に対して、残り30件の対象コンテンツについて作業させる。
作業工数=(20件×10人)+(30件×5人)=350件
(S1:スキル評価)最初に、10人の作業者に対して20件の対象コンテンツについて作業させる。
(S2:高スキル作業)次に、その中で高スキルと評価された5人に対して、残り30件の対象コンテンツについて作業させる。
作業工数=(20件×10人)+(30件×5人)=350件
即ち、本発明によれば、S1について作業者のスキルを評価すると共に、その成果物を得ることができる。また、スキル評価用の正解が既知となる問題に対して、別途回答させる必要がない。結果的に、以下のようなコストが削減できる。
コスト=350件(本発明)/450件(従来技術)=78%
結果的に、22%(=100−78)のコスト削減となる。
コスト=350件(本発明)/450件(従来技術)=78%
結果的に、22%(=100−78)のコスト削減となる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 スキル評価装置
11 作業タスク情報収集部
12 学習タスク情報推定部
13 作業タスク情報選択部
14 学習タスク情報抽出部
15 作業者スキル評価部
2 作業者用の端末
3 作業依頼者用の端末
11 作業タスク情報収集部
12 学習タスク情報推定部
13 作業タスク情報選択部
14 学習タスク情報抽出部
15 作業者スキル評価部
2 作業者用の端末
3 作業依頼者用の端末
Claims (6)
- 「対象コンテンツ」に、作業者自ら判断した「作業タスク情報」を付加する作業について、各作業者のスキル(Skill、作業能力)を評価するスキル評価装置であって、
各作業者の作業タスク情報を収集する作業タスク情報収集手段と、
前記対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する学習タスク情報推定手段と、
前記学習タスク情報に対する類似度が所定閾値以上となる複数の作業タスク情報を選択する作業タスク情報選択手段と、
選択された複数の作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成し、該学習タスク情報を、前記作業タスク情報選択手段へフィードバックする学習タスク情報抽出手段と、
最終的に、前記学習タスク情報に対する類似度が高い順に複数の作業タスク情報をソートし、その順位を作業者毎のスキルとして評価する作業者スキル評価手段と
を有することを特徴とするスキル評価装置。 - 前記対象コンテンツは「文章」であり、前記作業タスク情報は、前記文章に対する誤記情報である、
前記対象コンテンツは「画像」であり、前記作業タスク情報は、前記画像に対する指示情報である、又は、
前記対象コンテンツは「音声」であり、前記作業タスク情報は、前記音声に対する書き起こしのテキスト情報である
ことを特徴とする請求項1に記載のスキル評価装置。 - 前記作業タスク情報選択手段について、前記学習タスク情報と前記作業タスク情報との比較における類似度は、適合率(precision)及び再現率(recall)に基づくF値(F-measure)であることを特徴とする請求項1又は2に記載のスキル評価装置。
- クラウドソーシングサービスにおけるクラウドソーシングサーバとして機能することを特徴とする請求項1から3のいずれか1項に記載のスキル評価装置。
- 「対象コンテンツ」に、作業者自ら判断した「作業タスク情報」を付加する作業について、各作業者のスキルを評価する装置に搭載されたコンピュータを機能させるプログラムであって、
各作業者の作業タスク情報を収集する作業タスク情報収集手段と、
前記対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する学習タスク情報推定手段と、
前記学習タスク情報に対する類似度が所定閾値以上となる複数の作業タスク情報を選択する作業タスク情報選択手段と、
選択された複数の作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成し、該学習タスク情報を、前記作業タスク情報選択手段へフィードバックする学習タスク情報抽出手段と、
最終的に、前記学習タスク情報に対する類似度が高い順に複数の作業タスク情報をソートし、その順位を作業者毎のスキルとして評価する作業者スキル評価手段と
してコンピュータ機能させることを特徴とするプログラム。 - 「対象コンテンツ」に、作業者自ら判断した「作業タスク情報」を付加する作業について、各作業者のスキルを評価するように実行する装置のスキル評価方法であって、
各作業者の作業タスク情報を収集する第1のステップと、
前記対象コンテンツに対して、作業に応じて機械的に推定した「学習タスク情報」を出力する第2のステップと、
前記学習タスク情報に対する類似度が所定閾値以上となる複数の作業タスク情報を選択する第3のステップと、
選択された複数の作業タスク情報を、論理積、論理和又は多数決によってマージした新たな学習タスク情報を生成し、該学習タスク情報を、前記作業タスク情報選択手段へフィードバックする第4のステップと、
最終的に、前記学習タスク情報に対する類似度が高い順に複数の作業タスク情報をソートし、その順位を作業者毎のスキルとして評価する第5のステップと
を有することを特徴とする装置のスキル評価方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014078256A JP6306400B2 (ja) | 2014-04-04 | 2014-04-04 | クラウドソーシングにおける作業者のスキルを評価するスキル評価装置、プログラム及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014078256A JP6306400B2 (ja) | 2014-04-04 | 2014-04-04 | クラウドソーシングにおける作業者のスキルを評価するスキル評価装置、プログラム及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015200985A true JP2015200985A (ja) | 2015-11-12 |
JP6306400B2 JP6306400B2 (ja) | 2018-04-04 |
Family
ID=54552207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014078256A Active JP6306400B2 (ja) | 2014-04-04 | 2014-04-04 | クラウドソーシングにおける作業者のスキルを評価するスキル評価装置、プログラム及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6306400B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017224080A (ja) * | 2016-06-14 | 2017-12-21 | 株式会社エンルートM’s | 学習用データ作成装置、その方法及びプログラム |
JP2019067026A (ja) * | 2017-09-29 | 2019-04-25 | 富士フイルム株式会社 | 判別結果提供装置、判別結果提供装置の作動方法、判別結果提供プログラム、および判別結果提供システム |
JP2020024665A (ja) * | 2018-08-02 | 2020-02-13 | パナソニックIpマネジメント株式会社 | 情報処理方法、及び情報処理システム |
CN110908803A (zh) * | 2019-11-22 | 2020-03-24 | 神州数码融信软件有限公司 | 一种基于余弦相似度算法的作业分配方法 |
KR102138573B1 (ko) * | 2019-01-24 | 2020-07-28 | 주식회사 크라우드웍스 | 연관 조건을 이용한 어노테이터를 선별하는 방법 및 장치 |
KR102138575B1 (ko) * | 2019-03-12 | 2020-07-29 | 주식회사 크라우드웍스 | 크라우드 소싱 기반의 작업 태스크에 대한 검수를 하는 검수자의 검수 비용 산출 방법 |
KR102155839B1 (ko) * | 2019-09-26 | 2020-09-14 | 주식회사 크라우드웍스 | 작업불가 사유 기반의 작업자 모니터링 방법 및 장치 |
KR102155846B1 (ko) * | 2019-09-30 | 2020-09-14 | 주식회사 크라우드웍스 | 이전 작업의 반려율을 활용한 샘플링 검수 방법 및 장치 |
JP2021039756A (ja) * | 2019-08-30 | 2021-03-11 | クラウドワークス インコーポレイテッドCrowdWorks, Inc. | 平均差戻し率を用いた作業者熟練度測定方法及び装置 |
US11068716B2 (en) | 2018-08-02 | 2021-07-20 | Panasonic Intellectual Property Management Co., Ltd. | Information processing method and information processing system |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11182726B2 (en) * | 2019-03-28 | 2021-11-23 | Nest Global Solutions, Llc | Blockchain-based system for analyzing and tracking work performance |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009075249A (ja) * | 2007-09-19 | 2009-04-09 | Ntt Data Corp | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム |
US20120141959A1 (en) * | 2010-12-07 | 2012-06-07 | Carnegie Mellon University | Crowd-sourcing the performance of tasks through online education |
US20130006717A1 (en) * | 2011-06-29 | 2013-01-03 | David Oleson | Evaluating a worker in performing crowd sourced tasks and providing in-task training through programmatically generated test tasks |
JP2014067098A (ja) * | 2012-09-24 | 2014-04-17 | Yahoo Japan Corp | 作業評価指標生成装置 |
-
2014
- 2014-04-04 JP JP2014078256A patent/JP6306400B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009075249A (ja) * | 2007-09-19 | 2009-04-09 | Ntt Data Corp | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム |
US20120141959A1 (en) * | 2010-12-07 | 2012-06-07 | Carnegie Mellon University | Crowd-sourcing the performance of tasks through online education |
US20130006717A1 (en) * | 2011-06-29 | 2013-01-03 | David Oleson | Evaluating a worker in performing crowd sourced tasks and providing in-task training through programmatically generated test tasks |
JP2014067098A (ja) * | 2012-09-24 | 2014-04-17 | Yahoo Japan Corp | 作業評価指標生成装置 |
Non-Patent Citations (4)
Title |
---|
巻口 誉宗、外4名: "ヒューマンコンピュテーションにおける非負値行列因子分解を用いたタスク割り当て手法の提案", 情報処理学会 研究報告 ヒューマンコンピュータインタラクション(HCI) 2014−HCI−157, JPN6018007311, 7 March 2014 (2014-03-07), JP, pages 1 - 6, ISSN: 0003749247 * |
芦川 将之、外1名: "クラウドソーシングを用いたアノテーション", 人工知能, vol. 第29巻,第1号, JPN6018007314, 1 January 2014 (2014-01-01), JP, pages 54 - 59, ISSN: 0003749249 * |
馬場 雪乃、外4名: "機械学習による不適切なクラウドソーシングタスクの検出", 第5回データ工学と情報マネジメントに関するフォーラム (第11回日本データベース学会年次大会), JPN6018007313, 5 June 2013 (2013-06-05), JP, pages 1 - 8, ISSN: 0003749248 * |
鹿島 久嗣 外1名: "クラウドソーシングと機械学習", 人工知能学会誌, vol. 第27巻 第4号, JPN6017034556, 1 July 2012 (2012-07-01), JP, pages 381 - 388, ISSN: 0003749246 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017224080A (ja) * | 2016-06-14 | 2017-12-21 | 株式会社エンルートM’s | 学習用データ作成装置、その方法及びプログラム |
JP2019067026A (ja) * | 2017-09-29 | 2019-04-25 | 富士フイルム株式会社 | 判別結果提供装置、判別結果提供装置の作動方法、判別結果提供プログラム、および判別結果提供システム |
JP2020024665A (ja) * | 2018-08-02 | 2020-02-13 | パナソニックIpマネジメント株式会社 | 情報処理方法、及び情報処理システム |
JP7236694B2 (ja) | 2018-08-02 | 2023-03-10 | パナソニックIpマネジメント株式会社 | 情報処理方法、及び情報処理システム |
US11068716B2 (en) | 2018-08-02 | 2021-07-20 | Panasonic Intellectual Property Management Co., Ltd. | Information processing method and information processing system |
KR102138573B1 (ko) * | 2019-01-24 | 2020-07-28 | 주식회사 크라우드웍스 | 연관 조건을 이용한 어노테이터를 선별하는 방법 및 장치 |
WO2020153698A1 (ko) * | 2019-01-24 | 2020-07-30 | 주식회사 크라우드웍스 | 연관 조건을 이용한 어노테이터를 선별하는 방법 및 장치 |
KR102138575B1 (ko) * | 2019-03-12 | 2020-07-29 | 주식회사 크라우드웍스 | 크라우드 소싱 기반의 작업 태스크에 대한 검수를 하는 검수자의 검수 비용 산출 방법 |
JP2021039756A (ja) * | 2019-08-30 | 2021-03-11 | クラウドワークス インコーポレイテッドCrowdWorks, Inc. | 平均差戻し率を用いた作業者熟練度測定方法及び装置 |
KR102155839B1 (ko) * | 2019-09-26 | 2020-09-14 | 주식회사 크라우드웍스 | 작업불가 사유 기반의 작업자 모니터링 방법 및 장치 |
KR102155846B1 (ko) * | 2019-09-30 | 2020-09-14 | 주식회사 크라우드웍스 | 이전 작업의 반려율을 활용한 샘플링 검수 방법 및 장치 |
CN110908803B (zh) * | 2019-11-22 | 2022-07-05 | 神州数码融信软件有限公司 | 一种基于余弦相似度算法的作业分配方法 |
CN110908803A (zh) * | 2019-11-22 | 2020-03-24 | 神州数码融信软件有限公司 | 一种基于余弦相似度算法的作业分配方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6306400B2 (ja) | 2018-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6306400B2 (ja) | クラウドソーシングにおける作業者のスキルを評価するスキル評価装置、プログラム及び方法 | |
KR101582108B1 (ko) | 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램 | |
CN107330011A (zh) | 多策略融合的命名实体的识别方法及装置 | |
CN106777957B (zh) | 不平衡数据集上生物医学多参事件抽取的新方法 | |
CN104471568A (zh) | 对自然语言问题的基于学习的处理 | |
Layton et al. | Recentred local profiles for authorship attribution | |
US20210390513A1 (en) | Document Analysis Using Machine Learning And Neural Networks | |
CN112765974B (zh) | 一种业务辅助方法、电子设备及可读存储介质 | |
Elayidom et al. | Text classification for authorship attribution analysis | |
CN113591463B (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN108399525A (zh) | 一种基于数据挖掘和机器学习的人才评估方法 | |
CN110689078A (zh) | 基于人格分类模型的人机交互方法、装置及计算机设备 | |
CN109409433A (zh) | 一种社交网络用户的人格识别系统和方法 | |
CN114647713A (zh) | 基于虚拟对抗的知识图谱问答方法、设备及存储介质 | |
CN116401464A (zh) | 一种职业用户画像的构建方法、装置、设备及存储介质 | |
JP2018097468A (ja) | 文分類学習装置、文分類装置、文分類学習方法、及び文分類学習プログラム | |
WO2020199590A1 (zh) | 情绪检测分析方法及相关装置 | |
US11045340B2 (en) | Adding accessibility properties to a software application | |
CN106462614B (zh) | 信息分析系统、信息分析方法以及信息分析程序 | |
JP2015102914A (ja) | 不理解文判定モデル学習方法、不理解文判定方法、装置、及びプログラム | |
CN114238768A (zh) | 资讯信息的推送方法、装置、计算机设备和存储介质 | |
CN108154382B (zh) | 评价装置、评价方法及存储介质 | |
JP5506482B2 (ja) | 固有表現抽出装置、文字列−固有表現クラス対データベース作成装置、固有表現抽出方法、文字列−固有表現クラス対データベース作成方法、プログラム | |
JP7409731B1 (ja) | テキスト動画分類モデルを用いた事象判定方法、判定装置、及び判定プログラム | |
CN112989037B (zh) | 用于识别职业压力源的信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180301 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6306400 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |