JP5946073B2 - 推定方法、推定システム、コンピュータ・システムおよびプログラム - Google Patents
推定方法、推定システム、コンピュータ・システムおよびプログラム Download PDFInfo
- Publication number
- JP5946073B2 JP5946073B2 JP2014226645A JP2014226645A JP5946073B2 JP 5946073 B2 JP5946073 B2 JP 5946073B2 JP 2014226645 A JP2014226645 A JP 2014226645A JP 2014226645 A JP2014226645 A JP 2014226645A JP 5946073 B2 JP5946073 B2 JP 5946073B2
- Authority
- JP
- Japan
- Prior art keywords
- worker
- work
- work result
- tasks
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 59
- 230000010354 integration Effects 0.000 claims description 26
- 230000001143 conditioned effect Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 3
- 238000012015 optical character recognition Methods 0.000 description 33
- 238000012545 processing Methods 0.000 description 22
- 230000000052 comparative effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000001915 proofreading effect Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06398—Performance of employee with respect to a job function
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- General Factory Administration (AREA)
Description
本発明は、複数のワーカが行った作業結果を統合する処理に関し、より詳細には、複数のワーカが行った作業結果を統合する処理におけるワーカの能力を推定するための推定方法、推定システム、コンピュータ・システムおよびプログラムに関する。
近年、不特定多数のワーカに作業を委託する、クラウドソーシングが注目されている。クラウドソーシングでは、多数のワーカに同一のタスクを行ってもらい、その作業結果を統合して、タスクの統合された作業結果を得る。適切に統合を行うことにより、より高い品質の作業結果を得ることができる。
多数のワーカからの答えを統合して正しい答えを得ようとする場合、簡便には、多数決によって答えを決定する方法が考えられる。しかしながら、単なる多数決では、各ワーカの正解率の差が無視されることになる。そこで、ワーカのスキル(例えば正解率)やタスク難易度を見積もることにより、重み付け統合を行い、得られる答えの精度を改善する技術が提案されている(非特許文献1,非特許文献2,特許文献1)。
しかしながら、上記非特許文献1、非特許文献2および特許文献1に開示される従来技術では、個々のワーカがタスクに対して最初から答えを作成することが前提となっている。したがって、前段のワーカの作業結果に基づいて後段のワーカが作業するような順次的なワークフローには、充分に対応することができなかった。例えば、非特許文献3では、音声または映像に対する書き起こしの業務に関して、ASR(Automatic Speech Recognition)の結果に基づいて修正するモードが開示されている。非特許文献4では、書籍の電子化の作業に関して、OCR(Optical Character Recognition)の結果を人が修正するようなワークフローが開示されている。
上述したワークフローでは、前段ワーカの答えが目に入ることによって、後段のワーカが影響を受ける可能性がある。例えば、自動認識結果を信じやすく誤認識を修正しない傾向のあるワーカや、反対に、疑い深く正しい認識をも過剰に修正してしまう傾向のあるワーカが存在することが考えられる。
上述した背景から、同一のタスクに関し、前段ワーカの作業結果に基づいて後段ワーカが作業し、これらのワーカの作業結果を統合するワークフローにおいて、ワーカの振る舞いおよびスキルをより正確に推定し、より精度の高い統合を行える技術の開発が求められていた。
A. P. Dawid, et al.,"Maximum Likelihood Estimation of Observer Error-Rates Using the EM Algorithm.",Applied Statistics,20-28,1979.
J. Whitehill, et al.,"Whose Vote Should Count More?: Optimal Integration of Labels from Labelers of Unknown Expertise.",NIPS,Vol. 22,pp. 2035-2043,2009,December.
H. Kacorri, et al.,"Introducing Game Elements in Crowdsourced Video Captioning by Non-Experts.",Proceedings of the 11th Web for All Conference,p. 29,ACM, 2014 April.
M. Kobayashi, et al.,"Age-Based Task Specialization for Crowd sourced Proofreading.", Universal Access in Human-Computer Interaction. User and Context Diversity, pp. 104-112,Springer Berlin Heidelberg,2013.
本発明は、上記従来技術における不充分な点に鑑みてなされたものであり、本発明は、前段ワーカの作業結果の品質に応じて変動し得る後段ワーカの能力を推定することができる、推定方法、推定システム、コンピュータ・システムおよびプログラムを提供することを目的とする。本発明の他の目的は、前段ワーカの作業結果の品質に応じて変動し得る後段ワーカの能力を推定しながら、複数のワーカの作業結果を統合する処理を行うためのプログラムを提供することである。
本発明は、上記課題を解決するために、下記特徴を有する推定方法を提供する。推定方法では、コンピュータ・システムは、1以上のタスク各々に関し、前段のワーカの作業結果と、該前段のワーカの作業結果に基づいて作業する後段のワーカの作業結果とを取得する。そして、コンピュータ・システムは、上記1以上のタスク各々に関して得られた複数の作業結果に基づき、前段のワーカの作業結果の品質で条件付けられた後段のワーカの能力がパラメータとして導入された確率モデルの複数のパラメータを推定する。これにより、同一のタスクに関する複数のワーカの作業結果を統合する処理におけるワーカの能力を推定する。
また、本発明によれば、同一のタスクに関する複数のワーカの作業結果を統合する処理におけるワーカの能力を推定するための推定システムが提供される。推定システムは、1以上のタスク各々に関し、前段のワーカの作業結果と、該前段のワーカの作業結果に基づいて作業する後段のワーカの作業結果とを取得する取得部を含み構成される。推定システムは、上記1以上のタスク各々に関して得られた複数の作業結果に基づき、前段のワーカの作業結果の品質で条件付けられた後段のワーカの能力がパラメータとして導入された確率モデルの複数のパラメータを推定する推定部をさらに含み構成される。
さらに、本発明によれば、プロセッサと、プロセッサと通信するメモリとを含む、同一のタスクに関する複数のワーカの作業結果を統合する処理におけるワーカの能力を推定するためのコンピュータ・システムが提供される。コンピュータ・システムのプロセッサは、1以上のタスク各々に関し、前段のワーカの作業結果と、後段のワーカの作業結果とを取得し、これらの複数の作業結果に基づき、前段のワーカの作業結果の品質で条件付けられた後段のワーカの能力がパラメータとして導入された確率モデルの複数のパラメータを推定するよう構成される。さらにまた、本発明によれば、同一のタスクに関する複数のワーカの作業結果を統合する処理におけるワーカの能力を推定するためのコンピュータ可読なプログラムが提供される。
また、さらに本発明によれば、同一のタスクに関する複数のワーカの作業結果を統合するためのコンピュータ可読なプログラムが提供される。本プログラムは、コンピュータ・システムを、タスクに関し、前段のワーカの作業結果を1以上の後段のワーカに対し提示するとともに、1以上の後段のワーカ各々からの作業結果を受け付ける受付部、および、前段のワーカの作業結果の品質で条件付けられた後段のワーカの能力がパラメータとして導入された確率モデルに基づいて、複数のワーカの作業結果を統合した結果として、タスクに対し得られるべき作業結果を推定する結果統合部として機能させる。
上記構成により、前段ワーカの作業結果の品質に応じて変動し得る後段ワーカの能力を推定することができるようになる。さらに、前段ワーカの作業結果の品質に応じて変動し得る後段ワーカの能力を推定しながら、複数のワーカの作業結果を統合する処理を行うことができるようになる。
なお、本発明の他の効果および利点は、添付の図面と併せて説明される以下の詳細な説明から把握されるであろう。
以下、本発明の実施形態について説明するが、本発明の実施形態は、以下に説明する実施形態に限定されるものではない。なお、以下に説明する実施形態では、推定システムとして、ワーカの能力を推定するとともに、複数のワーカの作業結果の統合を行う作業結果統合システム100を一例として説明する。
図1は、本発明の実施形態による作業結果統合システム100のネットワーク構成を例示する図である。図1に示す作業結果統合システム100は、ネットワーク102を介して1以上のワーカ端末104a〜104zと通信する管理サーバ110を含み構成される。ここで、ネットワーク102は、LAN(Local Area Network)、WAN(Wide Area Network)、3G回線網、LTE(Long Term Evolution)回線網、インターネットなどの有線または無線の如何なるネットワークを含むことができる。
ワーカ端末104は、それぞれ、管理サーバ110から振り分けられたタスクを処理するワーカが操作する端末である。ワーカ端末104は、特に限定されるものではないが、パーソナル・コンピュータ、タブレット・コンピュータ、スマートフォンなどの情報端末とすることができる。
管理サーバ110は、ワーカ各々に対しタスクを振り分け、ワーカ各々からのタスクに対する作業結果を収集する。説明する実施形態では、管理サーバ110は、同一タスクを複数のワーカに冗長に振り分け、複数のワーカ各々からの作業結果を統合し、タスクに対する最終的な作業結果を生成することができる。
ここで、タスクは、特に限定されるものではないが、画像処理タスク、音声処理タスク、テキスト処理タスクなどの種々の情報処理タスクとすることができる。画像処理タスクとしては、例えば、画像から文字やテキストを抽出する文字認識タスクや、画像の種類を分類する画像分類タスクなどを挙げることができる。音声処理タスクとしては、音声データや動画データなどの音声付きデータから文字やテキストを書き起こす音声認識タスクや、音声の種類を分類する音声分類タスクなどを挙げることができる。テキスト処理タスクとしては、文章の校正タスクや、言語間の翻訳タスクやメッセージや記事などの情報にメタデータを付与するメタデータ付与タスクなどを挙げることができる。
管理サーバ110は、ワーカに振り分けるためのタスクを記述するタスクデータ112を格納する。上述した文字認識タスクを例に説明すると、タスクデータには、書籍等からスキャンした文字やテキストが含まれる画像部分の画像データが含まれる。また音声認識タスクを例に説明すると、タスクデータには、通話音声や講義映像などを収録した発話を含む音声部分の音声データが含まれる。他の種類のタスクについては、これ以上詳細には立ち入らない。
管理サーバ110は、ワーカ端末104各々から送信されたタスクに対する作業結果を受信すると、タスクログ114として格納する。タスクログ114は、1以上のタスク各々について、1以上のワーカ各々から得られた作業結果を含む。文字認識タスクを例に説明すると、作業結果には、画像データから認識された文字やテキストなどが含まれる。また、音声認識タスクを例に説明すると、音声付きデータから書き起こされた文字やテキストなどが作業結果に含まれる。
管理サーバ110は、タスクログ114に含まれるタスク各々の複数のワーカの作業結果を統合し、該当タスクを担当したワーカの総意として、統合された作業結果を生成し、成果物データ116として格納する。成果物データ116には、文字認識タスクや音声認識タスクを例に説明すると、総意として推定された文字やテキストが含まれる。
図1に示す作業結果統合システム100では、管理サーバ110には、さらに、ネットワーク102を介して、1以上のエンドユーザ端末106a,106bが接続されている。エンドユーザ端末106は、それぞれ、成果物データ116を利用するエンドユーザが操作する端末である。エンドユーザは、エンドユーザ端末106を操作し、成果物データ116にアクセスすることにより、成果物を利用することができる。一例では、エンドユーザは、書籍を電子化して得られたテキスト付き画像データとして構成された成果物データ116を利用することができる。
上述したような、複数のワーカからの同一タスクに対する冗長な複数の作業結果を統合し、最終的な成果物を得るシステムでは、ワーカの能力を適切に推定することが重要となる。ワーカによって、作業結果の品質にばらつきがあるためである。
複数の作業結果を統合する方法としては、多数決や、ワーカの能力に応じた重み付け評価などを行うことができる。例えば、ワーカ毎の正解率として、ワーカの能力を推定することができる。しかしながら、前段ワーカの作業結果に基づいて後段ワーカが作業するような順次的なワークフローでは、上述したワーカ毎の正解率では、ワーカの能力や振る舞いを充分に評価しきれない可能性がある。前段ワーカの作業結果が目に入ることによって、後段のワーカの作業結果が影響を受ける可能性があるためである。このため、上述した影響を適切にモデル化することが、統合された作業結果の品質を向上する上で重要となる。
例えば、前段ワーカの作業結果を信じやすく誤りを修正しない傾向のあるワーカや、反対に、疑い深く正しい結果に対しても過剰に修正してしまう傾向のあるワーカが存在する可能性がある。前段作業結果の影響を受けてしまう後段ワーカの能力を、前段ワーカの作業結果の品質に応じて見積もり、上述した傾向のあるワーカの振る舞いを適切にモデル化することで、より精度の高い統合が行える可能性がある。
そこで、本発明の実施形態による作業結果統合システム100では、管理サーバ110は、前段ワーカの作業結果の品質で条件付けた後段ワーカの能力をパラメータとして導入した確率モデルを用いて、前段作業結果の品質に応じて変動し得る後段ワーカの能力を推定する。これにより、前段作業結果の品質に依存した後段ワーカの振る舞いおよびスキルをより正確に推定し、統合の精度向上を図る。
以下、図2を参照しながら、本発明の実施形態による作業結果統合システム100における作業結果統合処理について説明する。
図2は、本発明の実施形態による作業結果統合システム100の構成を示すブロック図である。図2に示すように、作業結果統合システム100の機能ブロック200は、自動認識部210と、作業結果受付部220と、作業結果統合部230とを含み構成される。図2に示す機能部210,220,230は、典型的には、管理サーバ110上で実現される。
自動認識部210は、コンピュータの演算能力によりタスクデータを自動認識処理し、作業結果受付部220に対し自動認識結果を出力する。自動認識部210は、文字認識タスクであれば、OCR(Optical Character Recognition)エンジンであり、音声認識タスクであればASR(Automatic Speech Recognition)エンジンである。自動認識部210は、説明する実施形態では、前段ワーカとして動作することができる。
作業結果受付部220は、ワーカが操作するワーカ端末104がアクセスし、ワーカがタスクを処理する作業を行うためのユーザ・インタフェースを提供する。ワーカ端末104のワーカは、前段ワーカまたは後段ワーカのいずれかまたは両方となることができる。
作業結果受付部220は、ワーカ端末104に対し振り分けるタスクデータ112を送信し、そのワーカに対し、タスクに対する作業を依頼する。その際に、作業結果受付部220は、ワーカ端末104に対し、該当タスクについて既に得られている前段ワーカの作業結果(自動認識部210による自動認識結果を含む。)を提示することができる。作業結果受付部220は、ワーカ端末104からのタスクに対する作業結果を受け付け、ワーカを識別する識別情報に紐付けてタスクログ114として格納する。作業結果受付部220は、また、自動認識部210から入力される自動認識結果を受け付けると、前段ワーカからの作業結果として、タスクログ114に記録する。
作業結果統合部230は、蓄積された1以上のタスクのタスクログ114を読み出し、所定の確率モデルに基づいて、ワーカの能力を推定するとともに、タスクに対し得られるべき作業結果を推定し、成果物データ116を生成する。作業結果統合部230は、より詳細には、取得部232と、パラメータ推定部234と、出力部236とを含み構成される。
取得部232は、蓄積されたタスクログ114を読み出して、1以上のタスク各々に関する前段ワーカおよび後段ワーカの作業結果を取得する。パラメータ推定部234は、1以上のタスク各々に関して得られた複数の作業結果に基づき、所定の確率モデルのパラメータセットを推定する。出力部236は、1以上のタスク各々に関し、推定されたパラメータセットに基づき、タスクに対し得られるべき作業結果を推定し、出力する。出力部236は、1以上のタスク各々に対する得られるべき作業結果に加えて、ワーカの能力などを含むパラメータセットを出力することもできる。確率モデルやパラメータ推定については、詳細を後述する。
なお、上述までの説明では、図2に示す機能部210,220,230が単一のコンピュータである管理サーバ110上で実現されるものとして説明した。しかしながら、この態様に限定されるものではなく、1以上のコンピュータを含み構成されるコンピュータ・システムにおいて、如何なる態様で並列分散実装されてもよい。例えば、他の実施形態では、機能部210,220,230をそれぞれ異なるコンピュータに分散実装してもよく、またより膨大なデータを処理するために、機能部210,220,230それぞれを複数のコンピュータで並列実装することを妨げるものではない。
以下、図3〜図6を参照しながら、本発明の実施形態による作業結果統合システム100において実行される、確率モデルを用いたパラメータ推定処理について、より詳細に説明する。上述したようにタスクは、如何なる情報処理タスクであってもよいが、以下に説明する実施形態では、文字認識タスクを一例として取扱うものとする。
図3および図4は、特定の実施形態においてワーカ端末104に表示される作業画面を例示する。図3は、日本語の文字認識結果の校正を行っている文字校正インタフェース画面を例示し、図4は、英字の文字認識結果の校正を行っている文字校正インタフェース画面を例示する。
図3に示す画面300は、前段ワーカの作業結果であるOCR自動認識結果が表示される表示ボックス302と、文字画像配列ボックス304とを含む。文字画像配列ボックス304には、その共通の自動認識結果を与えた1以上のオリジナル文字画像が配列して表示される。図3に示す表示ボックス302には、ひらがなの「ぱ」という自動認識結果が示されており、文字画像配列ボックス304には、自動認識によってひらがなの「ぱ」として認識された1または複数の文字画像が示されている。
また、図4に示す画面310も、前段ワーカの作業結果であるOCR自動認識結果が表示される表示ボックス312と、文字画像配列ボックス314とを含む。文字画像配列ボックス314には、その共通の自動認識結果を与えた1以上のオリジナル文字画像が配列して表示される。図4に示す表示ボックス312には、アルファベットの「c」という自動認識結果が示されており、文字画像配列ボックス314には、自動認識によってアルファベット「c」として認識された1または複数の文字画像が示されている。
つまり、図3および図4に示した画面300,310には、文字画像配列ボックス304,314に示された文字画像の数分だけの複数のタスクが含まれている。ワーカに課された作業は、表示ボックス302,312に示される前段ワーカのOCR自動認識結果を参照しながら、文字画像配列ボックス304,314に示された1または複数の文字画像のうちから、誤っていると認められるものを指定し、自らが正しい考える認識結果に修正することである。
例えば、図3においてボックス306で囲まれた文字画像は、ひらがなを理解できる人間が見れば「は」と認識されるべき画像であるが、機械による自動認識結果では「ぱ」と誤認識されている。この場合、ワーカは、画面300において、ボックス306で示す文字画像を選択し、正しい文字「は」を入力するという操作を行うことになる。
同様に、図4においてボックス316で囲まれた文字画像は、アルファベットを理解できる人間が見れば「e」と認識されるべき画像であるが、機械による自動認識結果では「c」と誤認識されている。この場合、ワーカは、画面310において、ボックス316で示す文字画像を選択して、正しい文字「e」を入力するという操作を行うことになる。
以下の説明では、図3および図4に示すような文字校正インタフェース画面を介して、前段ワーカの作業結果としてOCR自動認識結果が後段ワーカに提示され、人である後段ワーカが、OCR認識結果に対し、必要に応じて修正を施す、という順次的ワークフローを一例として説明する。したがって、上述したワーカの作業結果とは、文字認識タスクに対するワーカの認識した文字の解答であり、統合結果として得られるべき作業結果とは、文字認識タスクの画像が表す文字の真の正解である。
図5は、本発明の実施形態による作業結果統合システム100で用いられる、上述した順次的ワークフローをモデル化した確率的生成モデルを説明する図である。図5(A)は、説明する実施形態で用いる生成モデルのグラフィカル表現を示す。ここで、生成モデル(Generative Model)とは、観測結果がどのような潜在的な原因から生成されたかを説明するための確率モデルをいう。この生成モデルを図として表したものがグラフィカル表現またはグラフィカルモデルと参照される。図5(B)は、説明する実施形態で用いる生成モデルを構成する後段ワーカの能力の定式化を説明する図である。
図5(A)は、各タスクについての生成モデルを示しており、生成モデルは、観測変数(図5(A)中で実線の丸で表す。)として、前段ワーカであるOCRエンジンの解答otと、後段ワーカの解答yitとを含み、潜在変数(図5(A)中で点線の丸で表す。)として、得られるべき真の正解ztを含む。
ここで、tは、タスクを識別するインデックスであり、n個あるとする。iは、後段ワーカを識別するインデックスであり、m人いるとする。各タスクに対して必ずしもワーカ全員が解答するというわけではなく、タスクtを行った後段ワーカの集合をWtで表す。また、タスクは、それぞれ他のタスクとは独立であり、真の正解zt,前段ワーカの解答otが与えられたとき、後段ワーカ各々の解答yitは互いに独立であるとする。
前段ワーカの解答otおよび後段ワーカの解答yitは、あらゆる文字を含んだ解答集合Xに元として含まれる(ot∈X,yit∈X)。これら、あるタスクtに関して、前段ワーカの解答otおよび後段ワーカの解答yit(i∈Wt)に含まれる固有の解答数をKt個とする。タスクtの正解がKt個の固有の解答k(k=1,…,Kt)の中に存在するとして、見えざる真の正解zt(zt∈X)を推定することが目標となる。
生成モデルに対しては、複数のパラメータが与えられており、図5(A)に示す生成モデルでは、真の正解ztの事前確率πtkと、前段ワーカの正解率γと、後段ワーカiの2種類の正解率αi,βiとがパラメータとして与えられる。真の正解ztの事前確率πtkは、下記式(1)で表され、各々のタスクtの得られるべき真の正解ztが、Kt個の固有の解答のうちの解答kである事前確率である。前段ワーカの正解率γは、下記式(2)で表され、前段ワーカの能力を表す。
図5(A)に示す生成モデルにおけるグレイの矢印(条件付き確率を表す。)が、前段ワーカの作業結果の品質の影響を考慮した、本発明の実施形態における生成モデルの特徴的な部分である。後段ワーカiの2種類の正解率αi,βiは、図5(B)に示す通りに表され、前段ワーカが正解しているか否かで条件付けた後段ワーカの能力を表す。正解率αiは、前段ワーカの解答が正解である条件(ot=zt)で後段ワーカiが正解(yit=zt)を与える確率を表す。これに対して、正解率βiは、前段ワーカの解答が不正解である条件(ot≠zt)で後段ワーカiが正解(yit=zt)を与える確率を表す。
図5に示すように、本発明の実施形態では、前段ワーカの解答が正解であるか不正解であるかで後段ワーカの正解を与える確率(能力)が変動するようなモデルを構築している。これにより、前段ワーカの解答を信じやすい傾向のあるワーカや、前段ワーカの解答に対し疑い深いワーカの傾向を捉えることが可能となる。
そして、本発明の実施形態によるパラメータ推定方法では、1以上のタスク(t=1,…,n)各々について与えられた解答ot,yitに基づいて、図5に示す生成モデルのパラメータセット(αi,βi,γ,πtk)を推定するとともに、1以上のタスク各々の真の正解ztを推定する。
以下、図6を参照しながら、本発明の実施形態におけるパラメータ推定方法について、より詳細に説明する。図6は、本発明の実施形態における作業結果統合システム100において実行される、パラメータ推定方法を示すフローチャートである。なお、図6は、図5に示すような潜在変数およびパラメータセットを導入した生成モデルに基づき、EMアルゴリズムを適用してパラメータセットを最大事後確率(Maximum A Posteriori;MAP)推定し、得られたパラメータセットを用いてタスクの真の正解ztを推定する具体的なフローを示すものである。
ここで、図6に示す処理のフローを説明する前に、図5に示した生成モデルに基づくMAP推定について説明する。MAP推定は、下記式(3)のように定式化することができ、観測変数Dが与えられたときのパラメータの事後確率p(θ|D)を最大にするパラメータセットθの値を推定する手法である。ここで、パラメータセットθは、上述したすべてのパラメータ(αi,βi,γ,πtk)を集めたベクトルである。説明する実施形態においては、下記式(3)から、ベイズの定理に基づき、下記式(4)を導くことができる。下記式(4)において、Σp(D,Z|θ)は尤度を表し、p(θ)はパラメータセットθの事前分布を表す。
上記式(4)中、パラメータセットθ、観測変数Dおよび潜在変数Zは、下記式(5)〜(7)で表される。
上記式(4)中の事前分布p(θ)は、それぞれのパラメータにつき、下記式(8)〜(10)に示すベータ分布および下記式(11)に示すディリクレ分布で表すことができる。下記式(8)〜(11)中のa1,a2,b1,b2,g1,g2,ρは、ハイパーパラメータであり、事前に適切な値が与えられるものとする。潜在変数の事前分布πtkは、説明する実施形態では、同じ値のパラメータがKt個の対称ディリクレ分布で表しており、Kt=2である場合は、ベータ分布に一致することになる。
つまり、説明する実施形態においては、n個の各タスク各々に対する前段ワーカの解答otおよび後段ワーカの解答yitに基づいて、参加するm人の後段ワーカの正解率αi,βi、前段ワーカの正解率γ、およびn個のタスク各々のKt個の各解答kの事前確率πtkを推定するとともに、n個のタスク各々に対する真の正解ztを推定するという問題として定式化される。
上記式(4)に示されるような問題の最適解の計算は、対数の中に和があるため計算量が大きく、通常困難である。そこで、説明する実施形態では、EMアルゴリズムを適用して、反復計算によりパラメータ推定を行う。以下、図6に示すフローチャートを参照しながら、EMアルゴリズムを適用してパラメータセットθをMAP推定し、得られたパラメータセットθを用いてタスクの真の正解ztを推定するまでの具体的な処理について説明する。
図6に示すパラメータ推定方法は、例えば、所定数のタスクログを対象とした処理開始の指示が行われたことに応答して、ステップS100から開始される。ステップS101では、取得部232は、タスクログ格納領域からタスクログDを取得し、作業領域に展開する。上述したハイパーパラメータもここで読み出される。
ステップS102では、パラメータ推定部234は、まず、取得されたn個の各タスクtについて、潜在変数ztの事後分布μtkの初期値を計算する。潜在変数ztの事後分布μtkの初期値は、固有の解答数Ktで均等としてもよいが、反復計算をより早期に収束させる観点からは、好ましくは、下記式(12)で表すように、多数決で決定することができる。なお、下記式(12)中のδは、クロネッカーのデルタである。
ステップS103では、パラメータ推定部234は、潜在変数の事後分布μtkの初期値から、パラメータセットθ(αi,βi,γ,πtk)の初期値を計算する。事後分布μtkからのパラメータセットθの計算方法は、後述するEMアルゴリズムのMステップで用いる下記式(17)〜(20)を用いて計算することができる。
ステップS104で、ループが開始され、ステップS107で所定の収束条件を満たすと判断されるまで、ステップS105で示すE(Expectation)ステップおよびステップS106で示すM(Maximization)ステップを交互に反復する。
ステップS105では、パラメータ推定部234は、EMアルゴリズムにおけるEステップを実行する。通常、EMアルゴリズムにおけるEステップでは、パラメータセットの現在値θ〜(上付きのチルダ)を用いて、下記式(13)で表されるパラメータの事後確率の期待値R(θ||θ〜)を計算する。下記式(13)は、対数尤度ln p(D,θ)の下界を求めることに対応する。そして、続くMステップでは、Eステップで求めた期待値(下界)を最大化するパラメータを新たに求め、EステップおよびMステップを繰り返すことにより、事後確率を最大化するパラメータを求める。下記式(13)を、より具体的に表すと、下記式(14)のように表すことができる。
上記式(14)中のμtkは、観測データ(Dt={{yit}i∈Wt,ot})およびパラメータセットθ〜が与えられたときの潜在変数ztの事後分布であり、下記式(15)で計算することができる。
上記式(16)に示すrtk(θ)は、全ワーカの能力を勘案した上で現在のパラメータの値から正解の確率を推定している箇所である。式(15)は、タスクtに関し、与えられた前段および後段のワーカ各々の作業結果(yit,ot)の下、前段および後段のワーカの能力(γ,αi,βi;i∈Wt)で、与えられた1以上の固有の解答k各々を重み付け評価することに相当する。なお、上記式(16)中のδは、クロネッカーのデルタである。
なお、本発明の実施形態では、続くMステップでは、後述するように事後分布μtkからパラメータセットθを陽に求めることができる。このため、ステップS105では、パラメータ推定部234は、パラメータセットの現在値θ〜を用いて、1以上のタスク(t=1,…,n)各々に対する真の正解ztの事後分布μtkを計算すればよいということになる。
ステップS106では、パラメータ推定部234は、EMアルゴリズムにおけるMステップを実行する。通常、EMアルゴリズムにおけるMステップでは、Eステップで求められた、パラメータセットθの関数である事後確率の期待値R(θ||θ〜)を最大するパラメータの更新値θを算出する。上述した式(14)で表される事後確率の期待値Rを、各パラメータαi,βi,γ,πtkについて偏微分して0とおくと、各パラメータの更新式は、下記式(17)〜(20)に示すような閉じた形に整理できる。なお、下記式(17)および(18)中のTiは、ワーカiが行ったタスクの集合を表す。下記式(17)中のδは、同様に、クロネッカーのデルタである。
つまり、ステップS106では、パラメータ推定部234は、計算された新しい潜在変数の事後分布μtkから、事後確率の期待値Rを最大化するパラメータセットの更新値θを、上記更新式(17)〜(20)を用いて陽に計算すればよいということになる。
ステップS107では、所定の収束条件が満たされたか否かを判断し、所定の収束条件が満たされるまで、ステップS104へループを繰り返す。ステップS107で、所定の収束条件が満たされた場合は、ループを抜けて、ステップS108へ処理が進められる。
収束判定は、例えば下記式(21)で表されるような、対数尤度Lに対する条件とすることができる。下記式(21)中、L(・)は、対数尤度を表し、θoldは、パラメータの前回の値を意味し、θnewは、パラメータの最新の値を意味する。対数尤度の最初のθoldは、例えば−∞に設定すればよい。下記式(21)により、対数尤度が一定ε以上改善しないようになると、収束したものとみなされる。
ステップS108では、パラメータ推定部234は、パラメータセットの収束後の推定値θを用いて、上記式(15)に従って、1以上のタスク(1,…,n)各々に対して、最終的な潜在変数の事後分布μtk(k=1,…,Kt)を計算する。ステップS109では、出力部236は、下記式(22)に従って、1以上のタスク各々について、事後確率μtkが最大となる解答kを、真の正解zt^(上付きのハット)として選択する。つまり、所与の観測下の潜在変数の最頻値が選ばれる。同じ最大値をとるものが複数ある場合は、例えばランダムに選べばよい。
ステップS110では、出力部236は、得られた1以上のタスク各々の真の正解ztおよびパラメータセットθ(後段ワーカの能力を表す正解率αi,βiを含む。)を出力し、ステップS111で、本終了が終了する。
以上説明した構成により、順次的なワークフローにおいて、前段ワーカの作業結果の品質に応じて変動し得る後段ワーカの能力を適切に推定することが可能となる。これにより、前段ワーカの作業結果が目に入ることによって影響を受けてしまう後段ワーカの振る舞いを適切にモデル化することができ、ひいては、作業結果の統合の精度を向上させることができる。
このように推定されたワーカの能力の知見は、例えば、あるタスクを次にどのワーカに行わせるか、あるワーカに次にどのタスクを行わせるかなどを決定する際にも活用することができる。さらに、上述した実施形態では、EMアルゴリズムのMステップで、パラメータの更新式が陽に求まるという利点がある。さらに、モデルに導入されるパラメータ数も比較的少ないため、データの疎性に対してもロバストであり、計算時間も短くて済むという利点もある。
なお、上述した前段ワーカが誤答したタスクを、単にタスク難易度が高いものとして解釈して、例えば非特許文献2のモデルに組み込む方法も考えられる。しかしながら、その場合、難易度の高いタスクでは、ワーカの能力の推定値が正解率の差に反映されにくくなる傾向があり、重み付け多数決がより一層普通の多数決に近い形となってしまう。これに対して、前段ワーカの作業結果の品質に応じて条件付けたワーカの能力のパラメータを生成モデルに導入することにより、前段ワーカの作業結果の品質がワーカの能力のばらつきを打ち消す方向に働く影響をなくし、これにより、ワーカの能力に応じた重み付け多数決を可能とする。
なお、上述した実施形態によるパラメータ推定方法では、事前に準備されたn個のタスクログを用いて、n個の全タスクに対する真の正解ztおよびパラメータセットθを推定するというものであった。しかしながら、このような一括学習の実施形態に限定されるものではない。他の実施形態では、逐次、タスクに対する前段ワーカおよび後段ワーカからの作業結果が発生する状況の下、データが与えられる毎に、パラメータセットθを更新しながらタスクに対する真の正解ztを推定する、いわゆる逐次学習またはオンライン学習を行う態様とすることもできる。
また、上述した実施形態における、図5に示した生成モデルでは、OCRエンジンである自動認識部210が前段ワーカとしてはたらき、ワーカ端末104各々を操作するワーカ(通常は人である。)が後段ワーカとしてはたらくものとして説明した。上述した実施形態では、また、説明の便宜上、すべてのタスクにおいて、前段ワーカが同一であるとして、タスク非依存の前段ワーカの正解率γをパラメータとして導入した。
しかしながら、上述した具体的なワークフローに限定されるものではない。例えば、他の実施形態では、前段ワーカは、ワーカ端末104を操作するワーカであってもよい。また、他の実施形態では、タスク毎に異なる前段ワーカとし、タスク毎の前段ワーカの正解率γtをパラメータとして導入してもよい。
さらに、図5に示した生成モデルは、後段ワーカの能力として、ワーカ毎の正解率αi,βiを用いるものであった。ワーカの能力を詳細にモデル化するという観点からは、ワーカ毎の能力を異なるパラメータで表した方が好ましいが、他の実施形態では、ワーカ全体として一様な能力を表す正解率α,βを用いるようにモデル化を行ってもよい。さらに、他の実施形態では、ワーカの能力をより詳細にモデル化するという観点から、ワーカ毎かつタスク毎の能力を表す正解率αit,βitを用いるようモデル化を行ってもよい。
また、上述した実施形態では、前段ワーカの解答が正解であるか不正解であるかで条件付けて後段ワーカの能力を表す2種類の正解率α,βを導入した。しかしながら、後段ワーカの能力の条件付けは、このような態様に限定されるものではない。他の実施形態では、後段ワーカの能力は、さらに、前段ワーカの種類および個体またはこれらのいずれかに応じて条件付けることができる。例えば、前段ワーカが機械であるか、人であるかで条件付けた後段ワーカの能力を表すパラメータを導入することもできる。例えば、前段ワーカが、いずれの自動認識エンジンであるか、あるいはいずれの人であるかで、条件付けた後段ワーカの能力を表すパラメータを導入することもできる。さらに、前段ワーカの解答が正解であるか不正解であるかの2段階で条件付けるほか、他の実施形態では、3以上の段階で条件付けることを妨げるものではない。
また、図5に示した生成モデルでは、1の前段ワーカの作業結果に基づいて1以上の後段ワーカが作業するワークフローを一例として説明した。しかしながら、他の実施形態では、複数の前段ワーカの作業結果に基づいて1以上の後段ワーカが作業するワークフローであってもよいし、第1のワーカの作業結果に基づいて、第2のワーカが作業を行い、第2のワーカの作業結果に基づいて、第3のワーカが作業を行うような段階的なワークフローであることを妨げない。
また、図6を参照した説明では、図5に示すような潜在変数およびパラメータセットを導入した生成モデルに基づき、EMアルゴリズムを適用してMAP推定するものであった。MAP推定は、より安定して解が求まるという利点があるが、しかしながら、MAP推定の実施形態に限定されるものではない。他の実施形態では、生成モデルに基づき、EMアルゴリズムを適用して最尤(Maximum likelihood,ML)推定を行うこともできる。
さらに、上述した実施形態では、タスク難易度は、考慮されていなかった。しかしながら、他の実施形態では、各タスクtに対するタスク難易度dtのパラメータを導入し、タスク難易度dtを合わせて推定するよう構成することもできる。あるいは、非特許文献2に開示されるタスク難易度を推定するアルゴリズムに対し、前段ワーカの作業結果の品質で条件付けられた後段ワーカの能力をパラメータとして導入することもできる。その場合は、ワーカの正解率p(yit=zt)を、前段ワーカが正解した場合と、不正解であった場合とで条件付けてワーカのスキルをαi,βiとし、下記式(23)および(24)で表すことができる。
以下、上記実施形態による管理サーバ110を実現するコンピュータ装置について説明する。図7は、本発明の実施形態による管理サーバ110を実現するコンピュータ装置の概略的なハードウェア構成を示す。図7に示すコンピュータ装置10は、プロセッサである中央処理装置(CPU)12と、CPU12が使用するデータの高速アクセスを可能とするL1およびL2などのレベルを有するキャッシュ・メモリ14と、CPU12の処理を可能とするDRAMなどの固体メモリ素子から形成されるシステム・メモリ16とを備えている。
CPU12、キャッシュ・メモリ14およびシステム・メモリ16は、システム・バス18を介して、他のデバイスまたはドライバ、例えば、グラフィックス・ドライバ20およびネットワーク・インタフェース・カード(NIC)22へと接続されている。グラフィックス・ドライバ20は、バスを介して外部のディスプレイ24に接続されて、CPU12による処理結果をディスプレイ画面上に表示させることができる。また、NIC22は、物理層レベルおよびデータリンク層レベルでコンピュータ装置10を、TCP/IPなどの適切な通信プロトコルを使用するネットワーク102へと接続している。
システム・バス18には、さらにI/Oバス・ブリッジ26が接続されている。I/Oバス・ブリッジ26の下流側には、PCIなどのI/Oバス28を介して、IDE、ATA、ATAPI、シリアルATA、SCSI、USBなどにより、ハードディスク装置30が接続されている。ハードディスク装置30は、例えばタスクデータ112、タスクログ114および成果物データ116を格納することができる。また、I/Oバス28には、USBなどのバスを介して、キーボードおよびマウスなどのポインティング・デバイスなどの入力装置32が接続されていて、この入力装置32によりユーザ・インタフェースが提供される。
コンピュータ装置のCPU12としては、いかなるシングルコア・プロセッサまたはマルチコア・プロセッサを用いることができる。コンピュータ装置は、WINDOWS(登録商標)200X、UNIX(登録商標)、LINUX(登録商標)などのオペレーティング・システム(以下、OSとして参照する。)により制御される。コンピュータ装置は、上記OSの管理の下、システム・メモリ16上などにプログラムを展開し、プログラムを実行し、各ハードウェア資源を動作制御することによって、上述した機能部の構成および処理をコンピュータ上に実現する。
(実験)
以下、前段のOCR認識結果に対し後段のワーカが誤認識の修正を施した実際のタスクログを用いて実験を行った。まず、2台のOCRエンジンにより書籍の画像データを文字認識し、2台のOCRエンジン間で解答が異なる文字画像を抽出した。そして、図3および図4に示すような文字校正インタフェース画面を介して、OCR認識結果と、抽出された共通のOCR認識結果が与えられた複数の文字画像を表示し、ワーカに対し、正しい認識結果を入力させた。文字校正インタフェースには、2台のうちの片方のOCRの解答を表示させた。
以下、前段のOCR認識結果に対し後段のワーカが誤認識の修正を施した実際のタスクログを用いて実験を行った。まず、2台のOCRエンジンにより書籍の画像データを文字認識し、2台のOCRエンジン間で解答が異なる文字画像を抽出した。そして、図3および図4に示すような文字校正インタフェース画面を介して、OCR認識結果と、抽出された共通のOCR認識結果が与えられた複数の文字画像を表示し、ワーカに対し、正しい認識結果を入力させた。文字校正インタフェースには、2台のうちの片方のOCRの解答を表示させた。
ワーカは、42名であり、39176個のユニークタスクをタスク当たり1〜3名のワーカに振り分け、のべ116662個のタスクに対する作業結果を得た。上述した文字校正のログデータには、どのワーカがどの文字をどう直したかがログ形式で記録されており、116662行相当あり、その基本統計量を下記表1に示す。なお、本実験では、文字画像が表している真の正解は既知であり、したがって、パラメータ推定された各種推定値は、実測値と比較可能である。
(実験例1)
パーソナル・コンピュータを用いて、図6に示したパタメータ推定方法を実装した管理サーバ110を構築した。上述したタスクログに対して、ワーカ毎の正解率αi,βiをパラメータとして導入した図5に示す生成モデルを用いて、パタメータ推定処理を実行し、推定された解答が既知の真の正解に対して一致する精度を評価した。精度(Accuracy)は、推定された解答が真の正解と一致した回数を計数し、その回数をタスク総数nで割ることにより算出した。実験例1について全タスクについて計算したところ、精度は、0.9691であった。さらに、ワーカ間で回答が割れたタスクを抽出し、全39176タスク中の抽出された2344タスクについて精度を算出したところ、0.7509であった。図8に、実験例1における、ワーカ間で回答が割れたタスク集合について求めた精度を示す。実験例1は、実施例を構成する。
パーソナル・コンピュータを用いて、図6に示したパタメータ推定方法を実装した管理サーバ110を構築した。上述したタスクログに対して、ワーカ毎の正解率αi,βiをパラメータとして導入した図5に示す生成モデルを用いて、パタメータ推定処理を実行し、推定された解答が既知の真の正解に対して一致する精度を評価した。精度(Accuracy)は、推定された解答が真の正解と一致した回数を計数し、その回数をタスク総数nで割ることにより算出した。実験例1について全タスクについて計算したところ、精度は、0.9691であった。さらに、ワーカ間で回答が割れたタスクを抽出し、全39176タスク中の抽出された2344タスクについて精度を算出したところ、0.7509であった。図8に、実験例1における、ワーカ間で回答が割れたタスク集合について求めた精度を示す。実験例1は、実施例を構成する。
(実験例2)
実験例1と同一のコンピュータを用いて、ワーカの正解率が一様である点、つまり、ワーカ非依存の正解率α,βをパラメータとしている点を除き実験例1と同一のパタメータ推定方法を実装した管理サーバ110を構築した。上述したタスクログに対してパタメータ推定方法を実行し、精度を算出した。全タスクでの精度は、0.9664であった。ワーカ間で回答が割れた実験例1と同一のタスク集合について精度を求めたところ、0.7108であった。図8に、実験例2における、ワーカ間で回答が割れたタスク集合について求めた精度を示す。実験例2は、実施例を構成する。
実験例1と同一のコンピュータを用いて、ワーカの正解率が一様である点、つまり、ワーカ非依存の正解率α,βをパラメータとしている点を除き実験例1と同一のパタメータ推定方法を実装した管理サーバ110を構築した。上述したタスクログに対してパタメータ推定方法を実行し、精度を算出した。全タスクでの精度は、0.9664であった。ワーカ間で回答が割れた実験例1と同一のタスク集合について精度を求めたところ、0.7108であった。図8に、実験例2における、ワーカ間で回答が割れたタスク集合について求めた精度を示す。実験例2は、実施例を構成する。
(実験例3)
実験例1と同一のコンピュータを用いて、OCR認識結果の正誤での条件付けは行わず、ワーカ毎の一種類の正解率si=p(yit=zt)をパラメータとして導入した点を除き、実験例1と同一のパタメータ推定方法を実装した管理サーバ110を構築した。これは、非特許文献1のモデルを単純化したものに相当し、単純化潜在クラスモデル(LC)と参照する。また、このようなモデルでは、OCRエンジンの認識結果をワーカの解答として考慮することもできるが、実験例3では、OCRエンジンは、ワーカには含めず、人のワーカの結果のみを統合した。上述したタスクログに対してパタメータ推定方法を実行し、ワーカ間で回答が割れた実験例1と同一のタスク集合について精度を求めた。実験例3における、ワーカ間で回答が割れたタスク集合について求めた精度を図8に示す。実験例3は、比較例を構成する。
実験例1と同一のコンピュータを用いて、OCR認識結果の正誤での条件付けは行わず、ワーカ毎の一種類の正解率si=p(yit=zt)をパラメータとして導入した点を除き、実験例1と同一のパタメータ推定方法を実装した管理サーバ110を構築した。これは、非特許文献1のモデルを単純化したものに相当し、単純化潜在クラスモデル(LC)と参照する。また、このようなモデルでは、OCRエンジンの認識結果をワーカの解答として考慮することもできるが、実験例3では、OCRエンジンは、ワーカには含めず、人のワーカの結果のみを統合した。上述したタスクログに対してパタメータ推定方法を実行し、ワーカ間で回答が割れた実験例1と同一のタスク集合について精度を求めた。実験例3における、ワーカ間で回答が割れたタスク集合について求めた精度を図8に示す。実験例3は、比較例を構成する。
(実験例4)
実験例4は、OCR認識結果をワーカの解答として含めて、OCRエンジンを含むワーカの結果を統合したことを除き、実験例3と同一である。実験例4における、ワーカ間で回答が割れたタスク集合について求めた精度を図8に示す。実験例4は、比較例を構成する。
実験例4は、OCR認識結果をワーカの解答として含めて、OCRエンジンを含むワーカの結果を統合したことを除き、実験例3と同一である。実験例4における、ワーカ間で回答が割れたタスク集合について求めた精度を図8に示す。実験例4は、比較例を構成する。
(実験例5)
実験例1と同一のコンピュータを用いて、多数決でタスクを統合するプログラムを実装し、上述したタスクログに対して、多数決で決定された解答が既知の真の正解に対して一致する精度を評価した。なお、実験例5では、OCRエンジンは、ワーカには含めず、人のワーカの結果のみを統合した。全タスクでの精度は、0.9662であった。ワーカ間で回答が割れた実験例1と同一のタスク集合について精度を求めたところ、0.6791であった。図8に、実験例5における、ワーカ間で回答が割れたタスク集合について求めた精度を示す。実験例5は、比較例を構成する。
実験例1と同一のコンピュータを用いて、多数決でタスクを統合するプログラムを実装し、上述したタスクログに対して、多数決で決定された解答が既知の真の正解に対して一致する精度を評価した。なお、実験例5では、OCRエンジンは、ワーカには含めず、人のワーカの結果のみを統合した。全タスクでの精度は、0.9662であった。ワーカ間で回答が割れた実験例1と同一のタスク集合について精度を求めたところ、0.6791であった。図8に、実験例5における、ワーカ間で回答が割れたタスク集合について求めた精度を示す。実験例5は、比較例を構成する。
(実験例6)
実験例6は、OCR認識結果をワーカの解答として含めて、OCRエンジンを含むワーカの結果を統合したことを除き、実験例5と同一である。実験例6における、ワーカ間で回答が割れたタスク集合について求めた精度を図8に示す。実験例6は、比較例を構成する。
実験例6は、OCR認識結果をワーカの解答として含めて、OCRエンジンを含むワーカの結果を統合したことを除き、実験例5と同一である。実験例6における、ワーカ間で回答が割れたタスク集合について求めた精度を図8に示す。実験例6は、比較例を構成する。
(実験例7)
OCRの解答をそのまま正解として推定し、既知の真の正解に対して一致する精度を評価した。全タスクでの精度は、0.7499であり、ワーカ間で回答が割れた実験例1と同一のタスク集合での精度は、0.0858であった。図8に、実験例7における、ワーカ間で回答が割れたタスク集合について求めた精度を示す。実験例7は、比較例を構成する。
OCRの解答をそのまま正解として推定し、既知の真の正解に対して一致する精度を評価した。全タスクでの精度は、0.7499であり、ワーカ間で回答が割れた実験例1と同一のタスク集合での精度は、0.0858であった。図8に、実験例7における、ワーカ間で回答が割れたタスク集合について求めた精度を示す。実験例7は、比較例を構成する。
(実験例1〜実験例7の比較)
実験例1〜実験例7の実験結果を比較すると、実験例1では、実験例3〜実験例7のうちの最良であった実験例5と比較しても、全タスク集合での精度が0.3%程度改善した。図8を参照すると、特にワーカ間で回答が割れたタスク集合に絞ると、実験例1では、比較例の最良の実験例5と比較しても、7%以上精度が改善されていることが理解される。実験例2でも、比較例の最良の実験例5と比較して、3%以上精度が改善されていることが理解される。つまり、ワーカの能力を、前段の作業結果の品質で条件付けることにより、より高精度に真の正解を推定でき、またワーカ間で解答が割れるような難易度の高いタスクで精度が大きく向上することが示された。
実験例1〜実験例7の実験結果を比較すると、実験例1では、実験例3〜実験例7のうちの最良であった実験例5と比較しても、全タスク集合での精度が0.3%程度改善した。図8を参照すると、特にワーカ間で回答が割れたタスク集合に絞ると、実験例1では、比較例の最良の実験例5と比較しても、7%以上精度が改善されていることが理解される。実験例2でも、比較例の最良の実験例5と比較して、3%以上精度が改善されていることが理解される。つまり、ワーカの能力を、前段の作業結果の品質で条件付けることにより、より高精度に真の正解を推定でき、またワーカ間で解答が割れるような難易度の高いタスクで精度が大きく向上することが示された。
(実験例8)
上述したログデータにおいて、全ワーカ中、OCRエンジンが既知の真の正解と一致する解答を行ったタスクを200以上行い、かつ、OCRエンジンが不正解したタスクを200以上行うという条件を満たしたワーカを抽出したところ、全42人中19人のワーカが抽出された。
上述したログデータにおいて、全ワーカ中、OCRエンジンが既知の真の正解と一致する解答を行ったタスクを200以上行い、かつ、OCRエンジンが不正解したタスクを200以上行うという条件を満たしたワーカを抽出したところ、全42人中19人のワーカが抽出された。
上記19人のワーカについて、実験例1のパラメータ推定方法により推定されたOCRが正解しているときの正解率αiの推定値と実測値とを比較した結果を図9(B)に示す。同様に、OCRが不正解しているときの正解率βiの推定値と実測値とを比較した結果を、図9(C)に示す。さらに、実験例8で計算したOCRが正解の場合の正解率αiの推定値の実測値に対する推定の良さを評価するため、RMSE(Root-Mean-Square Error)を計算したところ、0.0045であった。同様に、順位相関係数を計算したところ、0.9211であった。実験例8で計算したOCRが不正解の場合の正解率βiの推定値の実測値に対する推定の良さを評価するため、RMSEおよび順位相関係数を計算したところ、それぞれ、0.0522および0.8649であった。実験例8は、実施例を構成する。
(実験例9)
上記実験例8と同じワーカ集合に対し、上記実験例3の単純化潜在クラスモデルで推定した各ワーカの正解率siの推定値と実測値とを比較した結果を図9(A)に示す。さらに、実験例9で計算した正解率siの推定値の実測値に対する推定の良さを評価するため、RMSEおよび順位相関係数を計算したところ、0.0584および0.3228であった。実験例9は、比較例を構成する。
上記実験例8と同じワーカ集合に対し、上記実験例3の単純化潜在クラスモデルで推定した各ワーカの正解率siの推定値と実測値とを比較した結果を図9(A)に示す。さらに、実験例9で計算した正解率siの推定値の実測値に対する推定の良さを評価するため、RMSEおよび順位相関係数を計算したところ、0.0584および0.3228であった。実験例9は、比較例を構成する。
(実験例8および実験例9の比較)
図9(A)に示すように実験例9では、ワーカ毎の正解率siを高い精度で得られないケースがあった。例えば、図9(A)を参照すると、ワーカ92およびワーカ225では、実際値よりも過大な正解率siを推定していることが分かる。これに対して、実験例8では、図9(B)および図9(C)を参照すると明らかなように、対象となるすべてのワーカに対して、正解率αi,βiが高い精度で見積もられていることが分かる。
図9(A)に示すように実験例9では、ワーカ毎の正解率siを高い精度で得られないケースがあった。例えば、図9(A)を参照すると、ワーカ92およびワーカ225では、実際値よりも過大な正解率siを推定していることが分かる。これに対して、実験例8では、図9(B)および図9(C)を参照すると明らかなように、対象となるすべてのワーカに対して、正解率αi,βiが高い精度で見積もられていることが分かる。
これは、ワーカ92は、OCRが正解しているときの正解率が低く、反対にワーカ225は、OCRが不正解のときの正解率が低いことに起因すると考えられる。
さらに、RMSEおよび順位相関係数についてみると、RMSEは、推定と実際との絶対的な誤差を表すため、0に近いほど良い推定と言え、順位相関係数は、推定値および実際値によるランク付けの類似度を表し、1に近いほど良い推定と言える。実験例8および実験例9で、RMSEおよび順位相関係数を比較すると、前段が正解した場合の正解率αiに関しては、RMSEも順位相関係数も大きく改善していることが分かる。前段が不正解した場合の正解率βiを比較すると、RMSEは、実験例9と同等であるが、順位相関係数が改善していることがわかる。実験例9では、実際の正解率が低いワーカを過大評価する傾向にあり、回答数の多く正解率の高いワーカに正解率が引きずられることが原因であると考えられる。これに対して、実験例8では、解答数の減少に伴い引きずられる効果が軽減されていると考えることができる。
以上説明したように、本発明の実施形態によれば、前段ワーカの作業結果の品質に応じて変動し得る後段ワーカの能力を推定することができる、推定方法、推定システム、コンピュータ・システムおよびプログラムを提供するができる。さらに、本発明の実施形態によれば、前段ワーカの作業結果の品質に応じて変動し得る後段ワーカの能力を推定しながら、複数のワーカの作業結果を統合する処理を行うためのプログラムを提供することができる。
上述した推定方法等は、クラウドソーシングなどの複数のワーカの作業結果を統合する処理における品質管理のみならず、複数のワーカの推定された能力をフィードバックするなどにより、ワーカの教育にも適用可能である。
なお、本発明につき、発明の理解を容易にするために各機能部および各機能部の処理を記述したが、本発明は、上述した特定の機能部が特定の処理を実行するほか、処理効率や実装上のプログラミングなどの効率を考慮して、いかなる機能部に、上述した処理を実行するための機能を割当てることができる。
本発明の上記機能は、C++、Java(登録商標)、Java(登録商標)Beans、Java(登録商標)Applet、JavaScript(登録商標)、Perl、Python,Rubyなどのオブジェクト指向プログラミング言語などで記述された装置実行可能なプログラムにより実現でき、装置可読な記録媒体に格納して頒布または伝送して頒布することができる。
これまで本発明を、特定の実施形態をもって説明してきたが、本発明は、実施形態に限定されるものではなく、他の実施形態、追加、変更、削除など、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。
100…作業結果統合システム、102…ネットワーク、104…ワーカ端末、106…エンドユーザ端末、110…管理サーバ、112…タスクデータ、114…タスクログ、116…成果物データ、200…機能ブロック、210…自動認識部、220…作業結果受付部、230…作業結果統合部、232…取得部、234…パラメータ推定部、236…出力部、300,310…画面、302,312…表示ボックス、304,314…文字画像配列ボックス、306,316…ボックス、12…CPU、14…キャッシュ・メモリ、16…システム・メモリ、18…システム・バス、20…グラフィックス・ドライバ、22…NIC、24…ディスプレイ、26…I/Oバス・ブリッジ、28…I/Oバス、30…ハードディスク装置、32…入力装置
Claims (20)
- 同一のタスクに関する複数のワーカの作業結果を統合する処理におけるワーカの能力を推定する方法であって、コンピュータ・システムが、
1以上のタスク各々に関し、前段のワーカの作業結果と、該前段のワーカの作業結果に基づいて作業する後段のワーカの作業結果とを取得するステップと、
前記1以上のタスク各々に関して得られた複数の作業結果に基づき、前段のワーカの作業結果の品質で条件付けられた後段のワーカの能力がパラメータとして導入された確率モデルの複数のパラメータを推定するステップと
を含む、推定方法。 - 前記確率モデルは、前記1以上のタスク各々に関し、第1の観測変数として、1以上の前段のワーカ各々の作業結果と、第2の観測変数として、1以上の後段のワーカ各々の作業結果と、潜在変数として、得られるべき作業結果とを含む生成モデルである、請求項1に記載の推定方法。
- 前記推定方法は、前記コンピュータ・システムが、
前記確率モデルの前記複数のパラメータ各々の推定値に基づき、前記1以上のタスク各々に関し、与えられた1以上の固有の作業結果各々が前記得られるべき作業結果である事後確率を計算するステップと、
前記1以上のタスク各々に関し、前記与えられた1以上の固有の作業結果のうちから事後確率が最大化される作業結果を、前記得られるべき作業結果として出力するステップと
をさらに含む、請求項2に記載の推定方法。 - 前記条件付けられた後段のワーカの能力は、条件毎に、ワーカ全体としての能力、ワーカ毎の能力、または、タスク毎ワーカ毎の能力を含む、請求項2または3に記載の推定方法。
- 前記条件付けられた後段のワーカの能力は、条件毎に、ワーカ毎の能力を含む、請求項2または3に記載の推定方法。
- 前記ワーカの作業結果は、タスクに対するワーカの解答であり、
前記得られるべき作業結果は、タスクの真の正解であり、
前記条件付けられた後段のワーカの能力は、前段のワーカの解答が正解である条件で後段のワーカが正解を与える確率と、前段のワーカの解答が不正解である条件で後段のワーカが正解を与える確率とを含む、請求項2〜5のいずれか1項に記載の推定方法。 - 前記条件付けられた後段のワーカの能力は、さらに、前段のワーカの種類および個体またはこれらのいずれかに応じて条件付けられる、請求項2〜6のいずれか1項に記載の推定方法。
- 前記確率モデルの複数のパラメータは、さらに、前段のワーカの能力と、前記1以上のタスク各々に関し、与えられた1以上の固有の作業結果各々が前記得られるべき作業結果である事前確率とを含む、請求項2〜7のいずれか1項に記載の推定方法。
- 前記確率モデルの複数のパラメータは、さらに、タスク難易度を含む、請求項2〜8のいずれか1項に記載の推定方法。
- 前記複数のパラメータを推定するステップは、前記1以上のタスク各々に関する前段および後段のワーカの作業結果が与えられたときの複数のパラメータの事後確率を最大にする前記複数のパラメータ各々の値を推定するステップである、請求項2〜9のいずれか1項に記載の推定方法。
- 前記複数のパラメータを推定するステップは、前記コンピュータ・システムが、
前記複数のパラメータ各々の現在値に基づいて、前記1以上のタスク各々に関し、前記得られるべき作業結果を計算するステップと、
計算された前記1以上のタスク各々に関する前記得られるべき作業結果に基づいて、前記複数のパラメータ各々の新たな値を計算するステップと、
収束条件が満たされたか否かを判定するステップと
を含む、請求項2〜10のいずれか1項に記載の推定方法。 - 前記得られるべき作業結果を計算するステップは、前記コンピュータ・システムが、
タスク各々に関し、与えられた前段および後段のワーカ各々の作業結果の下、前段および後段のワーカ全体の能力で、与えられた1以上の固有の作業結果各々を重み付け評価するステップ、
を含む、請求項11に記載の推定方法。 - 前記複数のパラメータ各々の新たな値を計算するステップは、前記コンピュータ・システムが、
少なくとも前記条件付けられた後段のワーカの能力を表す複数のパラメータに関して、前記得られるべき作業結果を計算するステップで事後分布の形で計算された前記得られるべき作業結果から、新たな値を陽に求めるステップ
を含む、請求項11または12に記載の推定方法。 - 前段のワーカは、機械または人であり、後段のワーカは、人である、請求項1〜13のいずれか1項に記載の推定方法。
- 同一のタスクに関する複数のワーカの作業結果を統合する処理におけるワーカの能力を推定するための推定システムであって、
1以上のタスク各々に関し、前段のワーカの作業結果と、該前段のワーカの作業結果に基づいて作業する後段のワーカの作業結果とを取得する取得部と、
前記1以上のタスク各々に関して得られた複数の作業結果に基づき、前段のワーカの作業結果の品質で条件付けられた後段のワーカの能力がパラメータとして導入された確率モデルの複数のパラメータを推定する推定部と
を含む、推定システム。 - 前記確率モデルは、前記1以上のタスク各々に関し、第1の観測変数として、前段のワーカ各々の作業結果と、第2の観測変数として、1以上の後段のワーカ各々の作業結果と、潜在変数として、得られるべき作業結果とを含む生成モデルであり、前記推定システムは、
前記1以上のタスク各々に関し、与えられた1以上の固有の作業結果のうちから、前記複数のパラメータ各々の推定値に基づき計算される事後確率が最大化される作業結果を、前記得られるべき作業結果として出力する出力部
をさらに含む、請求項15に記載の推定システム。 - プロセッサと、
前記プロセッサと通信するメモリと
を含む、同一のタスクに関する複数のワーカの作業結果を統合する処理におけるワーカの能力を推定するためのコンピュータ・システムであって、前記プロセッサは、
1以上のタスク各々に関し、前段のワーカの作業結果と、該前段のワーカの作業結果に基づいて作業する後段のワーカの作業結果とを取得し、
前記1以上のタスク各々に関して得られた複数の作業結果に基づき、前段のワーカの作業結果の品質で条件付けられた後段のワーカの能力がパラメータとして導入された確率モデルの複数のパラメータを推定する
よう構成される、コンピュータ・システム。 - 同一のタスクに関する複数のワーカの作業結果を統合する処理におけるワーカの能力を推定するためのコンピュータ可読なプログラムであって、コンピュータ・システムを、
1以上のタスク各々に関し、前段のワーカの作業結果と、該前段のワーカの作業結果に基づいて作業する後段のワーカの作業結果とを取得する取得部、および、
前記1以上のタスク各々に関して得られた複数の作業結果に基づき、前段のワーカの作業結果の品質で条件付けられた後段のワーカの能力がパラメータとして導入された確率モデルの複数のパラメータを推定する推定部
として機能させるためのプログラム。 - 同一のタスクに関する複数のワーカの作業結果を統合するためのコンピュータ可読なプログラムであって、コンピュータ・システムを、
タスクに関し、前段のワーカの作業結果を1以上の後段のワーカに対し提示するとともに、前記1以上の後段のワーカ各々からの作業結果を受け付ける受付部、および、
前段のワーカの作業結果の品質で条件付けられた後段のワーカの能力がパラメータとして導入された確率モデルに基づいて、複数のワーカの作業結果を統合した結果として、前記タスクに対し得られるべき作業結果を推定する結果統合部
として機能させるためのプログラム。 - 前記結果統合部は、
1以上のタスク各々に関し、前記前段のワーカの作業結果と、前記後段のワーカの作業結果とを取得する取得部と、
前記1以上のタスク各々に関して得られた複数の作業結果に基づき、前記確率モデルの複数のパラメータを推定する推定部と
を含む、請求項19に記載のプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014226645A JP5946073B2 (ja) | 2014-11-07 | 2014-11-07 | 推定方法、推定システム、コンピュータ・システムおよびプログラム |
US14/869,308 US9721221B2 (en) | 2014-11-07 | 2015-09-29 | Skill estimation method in machine-human hybrid crowdsourcing |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014226645A JP5946073B2 (ja) | 2014-11-07 | 2014-11-07 | 推定方法、推定システム、コンピュータ・システムおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016091395A JP2016091395A (ja) | 2016-05-23 |
JP5946073B2 true JP5946073B2 (ja) | 2016-07-05 |
Family
ID=55912482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014226645A Expired - Fee Related JP5946073B2 (ja) | 2014-11-07 | 2014-11-07 | 推定方法、推定システム、コンピュータ・システムおよびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9721221B2 (ja) |
JP (1) | JP5946073B2 (ja) |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6744025B2 (ja) * | 2016-06-21 | 2020-08-19 | 日本電気株式会社 | 作業支援システム、管理サーバ、携帯端末、作業支援方法およびプログラム |
JP6744026B2 (ja) * | 2016-08-04 | 2020-08-19 | 日本電気株式会社 | 携帯端末、管理サーバ、作業引継支援システム、作業引継支援方法、およびプログラム |
US11042161B2 (en) | 2016-11-16 | 2021-06-22 | Symbol Technologies, Llc | Navigation control method and apparatus in a mobile automation system |
US10521738B2 (en) * | 2016-11-29 | 2019-12-31 | Ca, Inc. | Automated collaboration workflow generation in thing-sourcing environments |
CA3051013A1 (en) | 2017-02-18 | 2018-08-23 | Mmodal Ip Llc | Computer-automated scribe tools |
US10663590B2 (en) | 2017-05-01 | 2020-05-26 | Symbol Technologies, Llc | Device and method for merging lidar data |
US11449059B2 (en) | 2017-05-01 | 2022-09-20 | Symbol Technologies, Llc | Obstacle detection for a mobile automation apparatus |
US10591918B2 (en) | 2017-05-01 | 2020-03-17 | Symbol Technologies, Llc | Fixed segmented lattice planning for a mobile automation apparatus |
AU2018261257B2 (en) | 2017-05-01 | 2020-10-08 | Symbol Technologies, Llc | Method and apparatus for object status detection |
US10726273B2 (en) | 2017-05-01 | 2020-07-28 | Symbol Technologies, Llc | Method and apparatus for shelf feature and object placement detection from shelf images |
US10949798B2 (en) | 2017-05-01 | 2021-03-16 | Symbol Technologies, Llc | Multimodal localization and mapping for a mobile automation apparatus |
WO2018204342A1 (en) | 2017-05-01 | 2018-11-08 | Symbol Technologies, Llc | Product status detection system |
US11367092B2 (en) | 2017-05-01 | 2022-06-21 | Symbol Technologies, Llc | Method and apparatus for extracting and processing price text from an image set |
WO2018201423A1 (en) | 2017-05-05 | 2018-11-08 | Symbol Technologies, Llc | Method and apparatus for detecting and interpreting price label text |
US10572763B2 (en) | 2017-09-07 | 2020-02-25 | Symbol Technologies, Llc | Method and apparatus for support surface edge detection |
US10521914B2 (en) | 2017-09-07 | 2019-12-31 | Symbol Technologies, Llc | Multi-sensor object recognition system and method |
WO2019073712A1 (ja) * | 2017-10-13 | 2019-04-18 | Necソリューションイノベータ株式会社 | スキル推定装置、学習支援装置、スキル推定方法およびプログラム |
US10740911B2 (en) | 2018-04-05 | 2020-08-11 | Symbol Technologies, Llc | Method, system and apparatus for correcting translucency artifacts in data representing a support structure |
US10823572B2 (en) | 2018-04-05 | 2020-11-03 | Symbol Technologies, Llc | Method, system and apparatus for generating navigational data |
US10832436B2 (en) | 2018-04-05 | 2020-11-10 | Symbol Technologies, Llc | Method, system and apparatus for recovering label positions |
US10809078B2 (en) | 2018-04-05 | 2020-10-20 | Symbol Technologies, Llc | Method, system and apparatus for dynamic path generation |
US11327504B2 (en) | 2018-04-05 | 2022-05-10 | Symbol Technologies, Llc | Method, system and apparatus for mobile automation apparatus localization |
US11010920B2 (en) | 2018-10-05 | 2021-05-18 | Zebra Technologies Corporation | Method, system and apparatus for object detection in point clouds |
US11506483B2 (en) | 2018-10-05 | 2022-11-22 | Zebra Technologies Corporation | Method, system and apparatus for support structure depth determination |
US11003188B2 (en) | 2018-11-13 | 2021-05-11 | Zebra Technologies Corporation | Method, system and apparatus for obstacle handling in navigational path generation |
US11090811B2 (en) | 2018-11-13 | 2021-08-17 | Zebra Technologies Corporation | Method and apparatus for labeling of support structures |
RU2743898C1 (ru) | 2018-11-16 | 2021-03-01 | Общество С Ограниченной Ответственностью "Яндекс" | Способ выполнения задач |
US11079240B2 (en) | 2018-12-07 | 2021-08-03 | Zebra Technologies Corporation | Method, system and apparatus for adaptive particle filter localization |
US11416000B2 (en) | 2018-12-07 | 2022-08-16 | Zebra Technologies Corporation | Method and apparatus for navigational ray tracing |
US11100303B2 (en) | 2018-12-10 | 2021-08-24 | Zebra Technologies Corporation | Method, system and apparatus for auxiliary label detection and association |
US11015938B2 (en) * | 2018-12-12 | 2021-05-25 | Zebra Technologies Corporation | Method, system and apparatus for navigational assistance |
US10731970B2 (en) | 2018-12-13 | 2020-08-04 | Zebra Technologies Corporation | Method, system and apparatus for support structure detection |
CA3028708A1 (en) | 2018-12-28 | 2020-06-28 | Zih Corp. | Method, system and apparatus for dynamic loop closure in mapping trajectories |
RU2744032C2 (ru) | 2019-04-15 | 2021-03-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для определения результата выполнения задачи в краудсорсинговой среде |
RU2744038C2 (ru) | 2019-05-27 | 2021-03-02 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для определения результата для задачи, выполняемой в краудсорсинговой среде |
US11960286B2 (en) | 2019-06-03 | 2024-04-16 | Zebra Technologies Corporation | Method, system and apparatus for dynamic task sequencing |
US11662739B2 (en) | 2019-06-03 | 2023-05-30 | Zebra Technologies Corporation | Method, system and apparatus for adaptive ceiling-based localization |
US11402846B2 (en) | 2019-06-03 | 2022-08-02 | Zebra Technologies Corporation | Method, system and apparatus for mitigating data capture light leakage |
US11200677B2 (en) | 2019-06-03 | 2021-12-14 | Zebra Technologies Corporation | Method, system and apparatus for shelf edge detection |
US11341663B2 (en) | 2019-06-03 | 2022-05-24 | Zebra Technologies Corporation | Method, system and apparatus for detecting support structure obstructions |
US11080566B2 (en) | 2019-06-03 | 2021-08-03 | Zebra Technologies Corporation | Method, system and apparatus for gap detection in support structures with peg regions |
US11151743B2 (en) | 2019-06-03 | 2021-10-19 | Zebra Technologies Corporation | Method, system and apparatus for end of aisle detection |
RU2019128272A (ru) | 2019-09-09 | 2021-03-09 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для определения производительности пользователя в компьютерной краудсорсинговой среде |
RU2019135532A (ru) | 2019-11-05 | 2021-05-05 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для выбора метки из множества меток для задачи в краудсорсинговой среде |
US11507103B2 (en) | 2019-12-04 | 2022-11-22 | Zebra Technologies Corporation | Method, system and apparatus for localization-based historical obstacle handling |
US11107238B2 (en) | 2019-12-13 | 2021-08-31 | Zebra Technologies Corporation | Method, system and apparatus for detecting item facings |
RU2020107002A (ru) | 2020-02-14 | 2021-08-16 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система приема метки для цифровой задачи, исполняемой в краудсорсинговой среде |
US11822333B2 (en) | 2020-03-30 | 2023-11-21 | Zebra Technologies Corporation | Method, system and apparatus for data capture illumination control |
US11450024B2 (en) | 2020-07-17 | 2022-09-20 | Zebra Technologies Corporation | Mixed depth object detection |
US11593915B2 (en) | 2020-10-21 | 2023-02-28 | Zebra Technologies Corporation | Parallax-tolerant panoramic image generation |
US11392891B2 (en) | 2020-11-03 | 2022-07-19 | Zebra Technologies Corporation | Item placement detection and optimization in material handling systems |
US11847832B2 (en) | 2020-11-11 | 2023-12-19 | Zebra Technologies Corporation | Object classification for autonomous navigation systems |
JP6989186B1 (ja) * | 2021-04-09 | 2022-01-05 | ジャングルX株式会社 | プログラム、情報処理装置及び方法 |
US11954882B2 (en) | 2021-06-17 | 2024-04-09 | Zebra Technologies Corporation | Feature-based georegistration for mobile computing devices |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2728450B2 (ja) * | 1988-09-05 | 1998-03-18 | 株式会社日立製作所 | プロジェクト管理診断システム |
JPH10261122A (ja) * | 1997-03-18 | 1998-09-29 | Sumitomo Wiring Syst Ltd | 作業配分最適化方法 |
JP2001243341A (ja) * | 2000-03-01 | 2001-09-07 | Yamatake Corp | ファンクションブロックモデル作成方法及び装置 |
JP2004151895A (ja) * | 2002-10-29 | 2004-05-27 | Ikeda Godo Kk | 作業人員配置システム |
JP2007026135A (ja) * | 2005-07-19 | 2007-02-01 | Shimizu Corp | プログラムマネジメントチャート作成支援システム |
JP2008084051A (ja) * | 2006-09-28 | 2008-04-10 | Toshiba Corp | プラント総合エンジニアリング支援システム |
US20090287546A1 (en) * | 2008-05-16 | 2009-11-19 | Trx, Inc. | System and method for organizing hotel-related data |
US20120029978A1 (en) * | 2010-07-31 | 2012-02-02 | Txteagle Inc. | Economic Rewards for the Performance of Tasks by a Distributed Workforce |
US9396184B2 (en) * | 2012-08-01 | 2016-07-19 | Xerox Corporation | Method for translating documents using crowdsourcing and lattice-based string alignment technique |
JP2014074966A (ja) | 2012-10-02 | 2014-04-24 | International Business Maschines Corporation | タスク処理方法、プログラム及びシステム |
US9767419B2 (en) * | 2014-01-24 | 2017-09-19 | Microsoft Technology Licensing, Llc | Crowdsourcing system with community learning |
GR20140100091A (el) * | 2014-02-21 | 2015-09-29 | Google Inc, | Αναγνωριση αποτελεσματικων συνεισφεροντων πληθοπορισμου και συνεισφορες υψηλης ποιοτητας |
US20150356488A1 (en) * | 2014-06-09 | 2015-12-10 | Microsoft Corporation | Evaluating Workers in a Crowdsourcing Environment |
-
2014
- 2014-11-07 JP JP2014226645A patent/JP5946073B2/ja not_active Expired - Fee Related
-
2015
- 2015-09-29 US US14/869,308 patent/US9721221B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2016091395A (ja) | 2016-05-23 |
US9721221B2 (en) | 2017-08-01 |
US20160132815A1 (en) | 2016-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5946073B2 (ja) | 推定方法、推定システム、コンピュータ・システムおよびプログラム | |
US10958748B2 (en) | Resource push method and apparatus | |
US11941527B2 (en) | Population based training of neural networks | |
US11501161B2 (en) | Method to explain factors influencing AI predictions with deep neural networks | |
CN110472675B (zh) | 图像分类方法、图像分类装置、存储介质与电子设备 | |
JP5506722B2 (ja) | マルチクラス分類器をトレーニングするための方法 | |
CN108280757B (zh) | 用户信用评估方法及装置 | |
WO2015103964A1 (en) | Method, apparatus, and device for determining target user | |
CN113378940B (zh) | 神经网络训练方法、装置、计算机设备及存储介质 | |
EP3542319A1 (en) | Training neural networks using a clustering loss | |
US11526696B2 (en) | Model maintenance device, pattern recognition system, model maintenance method, and computer program product | |
WO2012132418A1 (ja) | 属性推定装置 | |
US11115359B2 (en) | Method and apparatus for importance filtering a plurality of messages | |
US20200394448A1 (en) | Methods for more effectively moderating one or more images and devices thereof | |
US11080348B2 (en) | System and method for user-oriented topic selection and browsing | |
US11868440B1 (en) | Statistical model training systems | |
CN110930017A (zh) | 数据处理的方法及装置 | |
WO2016200408A1 (en) | Hybrid classification system | |
JPWO2019092868A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN107644042B (zh) | 软件程序点击率预估排序方法及服务器 | |
CN116894242A (zh) | 轨迹验证码的识别方法、装置、电子设备及存储介质 | |
CN110362831B (zh) | 目标用户识别方法、装置、电子设备及存储介质 | |
Kurup et al. | Aggregating unstructured submissions for reliable answers in crowdsourcing systems | |
JP2020071737A (ja) | 学習方法、学習プログラム及び学習装置 | |
US11900327B2 (en) | Evaluation adjustment factoring for bias |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160502 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20160506 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5946073 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |