JP2015166975A - 注釈情報付与プログラム及び情報処理装置 - Google Patents

注釈情報付与プログラム及び情報処理装置 Download PDF

Info

Publication number
JP2015166975A
JP2015166975A JP2014041519A JP2014041519A JP2015166975A JP 2015166975 A JP2015166975 A JP 2015166975A JP 2014041519 A JP2014041519 A JP 2014041519A JP 2014041519 A JP2014041519 A JP 2014041519A JP 2015166975 A JP2015166975 A JP 2015166975A
Authority
JP
Japan
Prior art keywords
information
annotation
annotator
input person
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014041519A
Other languages
English (en)
Other versions
JP6421421B2 (ja
Inventor
茂之 榊
Shigeyuki Sakaki
茂之 榊
康秀 三浦
Yasuhide Miura
康秀 三浦
圭悟 服部
Keigo Hattori
圭悟 服部
幸寛 坪下
Yukihiro Tsuboshita
幸寛 坪下
大熊 智子
Tomoko Okuma
智子 大熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2014041519A priority Critical patent/JP6421421B2/ja
Priority to US14/509,394 priority patent/US20150254223A1/en
Priority to AU2015200401A priority patent/AU2015200401B2/en
Priority to SG10201501148YA priority patent/SG10201501148YA/en
Publication of JP2015166975A publication Critical patent/JP2015166975A/ja
Application granted granted Critical
Publication of JP6421421B2 publication Critical patent/JP6421421B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Abstract

【課題】複数の対象となる情報に付与されるアノテーションの信頼性を均一にする注釈情報付与プログラム及び情報処理装置を提供する。【解決手段】情報処理装置1は、一のアノテーターの入力に基づき、アノテーション対象情報111のアノテーション対象にアノテーションを付与するアノテーション付与手段100と、他のアノテーターによりアノテーション対象に過去に付与されたアノテーションと、一のアノテーターにより付与されたアノテーションとを比較し、一のアノテーター及び他のアノテーターの信頼性を評価するアノテーター評価手段101と、一のアノテーター及び他のアノテーターの信頼性に基づいて、一のアノテーターにアノテーションの付与を依頼するアノテーション対象情報111を決定するアノテーション範囲決定手段102とを有する。【選択図】図1

Description

本発明は、注釈情報付与プログラム及び情報処理装置に関する。
従来の技術として、ヒューマンコンピュテーションの品質を管理する方法が提案されている(例えば、非特許文献1参照)。
非特許文献1に開示された方法は、クラウドソーシングを用いて複数の人間に仕事を依頼して結果を受け取り、それをさらに大きな計算過程において活用するヒューマンコンピュテーションにおいて、仕事を依頼した人間(以下、「ワーカー」という。)から得られる結果は一般的に信頼できる特定のワーカーに仕事を依頼した場合と異なり不確実性が大きくなるが、能力の高いワーカーを抽出する、タスクの難しさも考慮してワーカーを評価する、ワーカーの自分の作業品質を自己申告させる、ゲームを取り入れワーカーにまじめに働いてもらう、ワーカーの作業工程をモニタリングする、多数決をとる、ワーカーの能力で票に重みを付ける等の手法を採用することで、個々の人間の仕事の精度を高めたり、タスク選択を効率化する等の手法を採用することで個々のワーカーが間違ったとしても全体としての精度に影響を与えないようにする。
小山 聡著、「ヒューマンコンピュテーションの品質管理」、人工知能、29巻1号、2014年1月、p.27−33
本発明の目的は、複数の対象となる情報に付与されるアノテーションの信頼性を均一にする注釈情報付与プログラム及び情報処理装置を提供することにある。
本発明の一態様は、上記目的を達成するため、以下の注釈情報付与プログラム及び情報処理装置を提供する。
[1]コンピュータを、
一の入力者の入力に基づき、複数の対象を含む対象情報に注釈情報を付与する付与手段と、
他の入力者により前記複数の対象の一部に付与済みの注釈情報と、前記一の入力者により付与された注釈情報とを比較し、前記一の入力者及び前記他の入力者の信頼性を評価する評価手段と、
前記一の入力者及び前記他の入力者の信頼性に基づいて、前記一の入力者に注釈情報の付与を依頼する前記対象情報の対象の範囲を決定する決定手段として機能させるための注釈情報付与プログラム。
[2]前記決定手段は、前記他の入力者の信頼度が予め定めた閾値以上である場合、当該他の入力者が注釈情報を付与した対象以外を、前記一の入力者に注釈情報の付与を依頼する前記対象情報の対象の範囲に決定する前記[1]に記載の注釈情報付与プログラム。
[3]前記決定手段は、複数の前記他の入力者の信頼度が予め定めた第1の閾値より低いが予め定めた第2の閾値以上である場合、複数の当該他の入力者が注釈情報を付与した対象以外を、前記一の入力者に注釈情報の付与を依頼する前記対象情報の対象の範囲に決定する前記[1]に記載の注釈情報付与プログラム。
[4]機械学習用の情報として、少なくとも、前記対象情報の対象と、前記付与手段によって付与された注釈情報と、当該注釈情報を付与した入力者の信頼性とを有する情報を生成する生成手段としてさらに機能させる前記[1]−[3]のいずれかに記載の注釈情報付与プログラム。
[5]前記生成手段の生成する情報を用いて機械学習を行う機械学習手段としてさらに機能させる前記[4]に記載の注釈情報付与プログラム。
[6]一の入力者の入力に基づき、複数の対象を含む対象情報に注釈情報を付与する付与手段と、
他の入力者により前記複数の対象の一部に付与済みの注釈情報と、前記一の入力者により付与された注釈情報とを比較し、前記一の入力者及び前記他の入力者の信頼性を評価する評価手段と、
前記一の入力者及び前記他の入力者の信頼性に基づいて、前記一の入力者に注釈情報の付与を依頼する前記対象情報の対象の範囲を決定する決定手段とを有する情報処理装置。
請求項1又は6に係る発明によれば、複数の対象となる情報に付与される注釈情報の信頼性を均一にすることができる。
請求項2に係る発明によれば、複数人に注釈情報の付与を依頼する場合に、信頼性の高い注釈情報が重複して付与されることを抑制することができる。
請求項3に係る発明によれば、複数人に注釈情報の付与を依頼する場合に、複数の注釈情報を処理することによって信頼性の高い注釈情報が得られるとき、対象に信頼性の高い注釈情報が重複して付与されることを抑制することができる。
請求項4に係る発明によれば、機械学習に用いる情報に注釈情報の信頼性を含む情報を生成することができる。
請求項5に係る発明によれば、注釈情報の信頼性を考慮して機械学習を実行することができる。
図1は、第1の実施の形態に係る情報処理装置の構成例を示すブロック図である。 図2は、アノテーション対象情報及びアノテーション情報の構成の一例を示す概略図である。 図3は、アノテーター情報の構成の一例を示す概略図である。 図4は、アノテーション対象情報とアノテーション情報の構成の一例を示す概略図である。 図5は、情報処理装置の動作の一例を示すフローチャートである。 図6は、アノテーター情報に付加されるアノテーターメタ情報の構成の一例を示す概略図である。 図7は、アノテーション対象情報とアノテーション情報の構成の一例を示す概略図である。 図8は、第2の実施の形態に係る情報処理装置の構成例を示すブロック図である。 図9は、学習用情報の構成の一例を示す概略図である。
[第1の実施の形態]
(情報処理装置の構成)
図1は、第1の実施の形態に係る情報処理装置の構成例を示すブロック図である。
情報処理装置1は、通信部12を介して外部ネットワークに接続されており、クラウドソーシングにより、外部ネットワーク上に接続された端末等の利用者に、文書情報、画像情報、音声情報等のアノテーション対象情報111に当該情報の特徴等を示す注釈情報であるアノテーションの付与を依頼するものである(以下、アノテーションを付与する利用者を入力者としての「アノテーター」と呼ぶ。)。また、情報処理装置1は、アノテーターからアノテーションの入力を受け付けてアノテーション対象情報111にアノテーションを付与するものである。なお、アノテーションは、「ポジティブ」と「ネガティブ」のように二値のものでもよいし、複数のカテゴリを用意して多値に分類されるものであってもよい。
情報処理装置1は、CPU(Central Processing Unit)等から構成され、各部を制御するとともに、各種のプログラムを実行する制御部10と、フラッシュメモリ等の記憶媒体から構成され情報を記憶する記憶部11と、ネットワークを介して外部と通信する通信部12とを備える。
制御部10は、後述するアノテーション付与プログラム110を実行することで、アノテーション付与手段100、アノテーター評価手段101及びアノテーション範囲決定手段102等として機能する。
アノテーション付与手段100は、アノテーターからアノテーションの入力を受け付けて、複数のアノテーション対象を有するアノテーション対象情報111のうち、いくつかのアノテーション対象にアノテーションを付与する。付与されたアノテーションはアノテーション対象と関連付けられてアノテーション情報112として記憶部11に格納される。
アノテーター評価手段101は、同一のアノテーション対象に対し、現在アノテーターが付与しているアノテーションと、他のアノテーターが過去に付与したアノテーションとを比較してアノテーション付与中のアノテーター及び過去にアノテーションを付与したアノテーターの信頼性の評価を行う。評価方法の詳細は後述する。評価結果はアノテーター情報113として記憶部11に格納される。
アノテーション範囲決定手段102は、アノテーター評価手段101の評価結果であるアノテーター情報113に基づいてアノテーション付与中のアノテーターに依頼するアノテーション対象情報111中のアノテーション対象の範囲、つまりいずれのアノテーション対象に対してアノテーションの付与を依頼するのかを決定する。範囲の決定方法については後述する。
記憶部11は、制御部10を上述した各手段101−102として動作させるアノテーション付与プログラム110、アノテーション対象情報111、アノテーション情報112及びアノテーター情報113等を記憶する。
図2は、アノテーション対象情報111及びアノテーション情報112の構成の一例を示す概略図である。
アノテーション対象情報111aは、アノテーション対象情報111の一例であり、言語情報に対してアノテーションを行うことを想定した例であり、アノテーション対象として「今日は晴れ。いい天気だ。」といったようなテキストを複数含む文書情報である。
アノテーション情報112aは、アノテーション情報112の一例であり、アノテーション対象情報111aのそれぞれのアノテーション対象に対して付与されたアノテーションである。
図2に示す例では、アノテーション対象情報111aの各テキストにアノテーションの付与を依頼するアノテーターの数は3人であって、各アノテーターがアノテーションを付与するアノテーション対象の数は3つである。また、付与するアノテーションはポジティブを表す「ポジ」かネガティブを表す「ネガ」のいずれかである。
図3は、アノテーター情報113の構成の一例を示す概略図である。
アノテーター情報113aは、アノテーター情報113の一例であり、アノテーターを識別するアノテーター欄と、アノテーターの信頼性を示す信頼性欄と、アノテーターがアノテーションを付与したアノテーション対象情報111中のアノテーション対象の範囲を示すアノテーション付与範囲欄とを有する。
(情報処理装置の動作)
次に、第1の実施の形態の作用を、図1−図5を参照しつつ、説明する。
図4は、アノテーション対象情報111とアノテーション情報112の構成の一例を示す概略図である。また、図5は、情報処理装置の動作の一例を示すフローチャートである。
以下に説明する例では、「アノテーターA」及び「アノテーターC」によるアノテーションが既に付与されており、「アノテーターB」にアノテーションの付与を依頼する場合について説明する。また、アノテーション対象情報111bの各アノテーション対象にアノテーションの付与を依頼するアノテーターの数は3人であるものとし、各アノテーターは7つのアノテーション対象にアノテーションを付与するものとする。
まず、アノテーション範囲決定手段102は、図4に示すアノテーション対象情報111bのうち「教師データ1」〜「教師データ4」及び「教師データT+1」〜「教師データT+3」の7つのアノテーション対象を、アノテーションを付与する範囲100b及び100bに決定する(S1)。
次に、アノテーション付与手段100は、当該範囲100b及び100bの一部について、例えば、範囲100bの「教師データ1」〜「教師データ4」について「アノテーターB」にアノテーションの付与を依頼し、「アノテーターB」からアノテーションの入力を受け付けると「教師データ1」〜「教師データ4」にアノテーションの付与を行う(S2)。この時点でアノテーション情報112bは図4に示す状態となる。
次に、アノテーター評価手段101は、「アノテーターB」が付与している範囲100bのアノテーションと、「アノテーターA」が過去に付与した範囲100aのアノテーション及び「アノテーターC」が過去に付与した範囲100cのアノテーションとを比較して、「アノテーターA」、「アノテーターB」及び「アノテーターC」の信頼性の評価を行う(S3)。
図4に示す例では、範囲100aのアノテーションと範囲100bのアノテーションとが一致し、範囲100cのアノテーションが「教師データ3」以外で一致しないため、アノテーター評価手段101はアノテーター情報113aの「アノテーターA」及び「アノテーターB」の信頼性を上げ、「アノテーターC」の信頼性を下げる。この時点で図3のアノテーター情報113aに示すように「アノテーターA」及び「アノテーターB」の信頼性が「80%」、「アノテーターC」の信頼性が「50%」になったものとする。
次に、アノテーション範囲決定手段102は、アノテーター情報113aを参照し、「アノテーターA」及び「アノテーターB」の信頼性が予め定めた閾値以上である場合、例えば70%以上である場合(S4;Yes)、「アノテーターB」に依頼するアノテーション対象情報111bの範囲を、信頼性の高い「アノテーターA」がアノテーションを付与している範囲100aと重なる範囲100bを避け、アノテーションを付与していない範囲100bに設定する(S5)。
これは、信頼性の高い「アノテーターA」と同じ範囲に、同様に信頼性の高い「アノテーターB」にアノテーションの付与を依頼しても重複した信頼性の高いアノテーションの付与になる可能性が高いためである。また、同時に信頼性の低い「アノテーターC」と同じ範囲に、信頼性の高い「アノテーターB」にアノテーションの付与を依頼することで信頼性の低いアノテーションの付与が重複することを避けることができるためである。
なお、アノテーション付与手段100は、「アノテーターA」と「アノテーターB」のように2人のアノテーションが一致した場合に信頼性が高いと評価したが、n人(n≧3)のアノテーションが一致した場合に信頼性が高いと評価してもよい。
次に、アノテーション付与手段100は、当該範囲100b、つまり、「教師データU+1」〜「教師データU+3」について「アノテーターB」にアノテーションの付与を依頼し、「アノテーターB」からアノテーションの入力を受け付けると範囲100bにアノテーションの付与を行う(S6)。
また、ステップS4において、アノテーション範囲決定手段102は、アノテーター情報113aを参照し、他のアノテーターの信頼性が予め定めた閾値より小さい場合、例えば70%より小さい場合(S4;No)、当初に決定した「教師データ1」〜「教師データ4」及び「教師データT+1」〜「教師データT+3」の7つのテキストを、アノテーションを付与する範囲のままとする(S7)。
(第1の実施の形態の効果)
上記した第1の実施の形態によると、現在入力中のアノテーションと過去に入力されたアノテーションとに基づきアノテーターの信頼性を評価し、信頼性の高いアノテーターが過去にアノテーションを付与している場合、アノテーション対象情報111の当該範囲を現在アノテーションを付与中のアノテーターのアノテーション付与範囲から外すようにしたため、複数人にアノテーションの付与を依頼する場合に、信頼性の高いアノテーションが重複して付与されることを抑制することができる。
[変形例1]
上記した第1の実施の形態のアノテーター情報113に、以下に示すメタ情報を追加し、当該情報に基づいてアノテーター評価手段101がアノテーターの評価を行うようにしてもよい。
図6は、アノテーター情報113に付加されるアノテーターメタ情報の構成の一例を示す概略図である。
アノテーターメタ情報113Aは、アノテーターを識別するアノテーター欄と、アノテーターの性別を示す性別欄と、アノテーターの年齢を示す年齢欄と、アノテーターの国籍を示す国籍欄と、アノテーターの居住地を示す居住地欄とを有する。
アノテーター評価手段101は、例えば、アノテーション対象情報111の内容が日本の流行に関する内容であれば、居住地欄が「日本」である「アノテーターA」及び「アノテーターB」が信頼性の高いアノテーションを付与することを前提に、第1の実施の形態で説明したようにアノテーションを比較して、その一致又は不一致に基づいて「アノテーターA」及び「アノテーターB」の評価を行うようにしてもよい。
[変形例2]
上記した第1の実施の形態のように、アノテーションの一致又は不一致によりアノテーターを比較する他に、アノテーター評価手段101は、以下に示すように単一のアノテーターについて評価を行ってもよい。この方法は、第1の実施の形態の評価方法と組み合わせてもよいし、独立して行うものであってもよい。
アノテーター評価手段101は、例えば、あるアノテーターが付与したアノテーション情報112のエントロピーを計算する。これは、不真面目なアノテーターは単一のアノテーションを全てのデータに付与することがあると考えられるためであり、計算されたエントロピーが小さい場合、信頼性が低いと評価することができる。
また、上記した変形例1、2の他にも、「アノテーターに自分の作業品質を自己申告させる」、「アノテーターの作業工程をモニタリングする」、「過去の別のアノテーション作業において評価したアノテーターの信頼性を利用する」といったような従来技術を組み合わせて信頼性の評価をしてもよく、これにより評価精度を向上することができるのはもちろんである。
[変形例3]
上記した第1の実施の形態において説明したアノテーション範囲決定手段102の動作に加え、以下に説明するようにアノテーション範囲決定手段102を動作させてもよい。
図7は、アノテーション対象情報111とアノテーション情報112の構成の一例を示す概略図である。
アノテーション対象情報111cに対しアノテーション情報112cが付与されている場合において、範囲100e、100f及び100fのアノテーションがそれぞれ「教師データ3」、「教師データ4」及び「教師データT+3」のアノテーションとしては誤りであるものとする。
また、「アノテーターD」、「アノテーターE」、「アノテーターF」の信頼性は、予め定めた閾値(70%)より小さく、予め定めた第2の閾値(60%)以上の信頼性であるとする。
以上の条件において、信頼性の高いアノテーター(70%以上)に比べて信頼性が劣るが、ある程度信頼性が保障されているアノテーター(60%以上)の場合であって、アノテーションが所定の数、例えば、3つ付与されている場合、アノテーション範囲決定手段102は、アノテーション情報112cの「教師データ1」〜「教師データT+3」の範囲には、さらなるアノテーションが不要と判断し、現在アノテーションを付与中のアノテーターに対し他の範囲のアノテーション付与を依頼するようにしてもよい。
[第2の実施の形態]
以下に第2の実施の形態に係る情報処理装置1Aについて説明する。第2の実施の形態は、第1の実施の形態と比べて、アノテーション対象情報111、アノテーション情報112及びアノテーター情報113に基づき機械学習に用いる情報を生成し、当該情報を用いて機械学習を行う点で異なる。なお、第1の実施の形態と共通の構成については同一の符号を付している。
図8は、第2の実施の形態に係る情報処理装置の構成例を示すブロック図である。
情報処理装置1Aは、第1の実施の形態の情報処理装置1と比べて、学習用情報生成手段103、機械学習手段104及び学習用情報114をさらに有する。
学習用情報生成手段103は、アノテーション対象情報111、アノテーション情報112及びアノテーター情報113に基づいて学習用情報114を生成する。
機械学習手段104は、学習用情報114を用いて機械学習を実行する。
図9は、学習用情報114の構成の一例を示す概略図である。
学習用情報114aは、学習用情報114の一例であり、アノテーション欄と、アノテーター欄と、信頼性欄と、アノテーション対象情報欄とを有する。
(情報処理装置の動作)
次に、第2の実施の形態の作用を説明する。
情報処理装置1Aは、各手段100〜102によりアノテーション対象情報111にアノテーション情報112を付与するとともに、アノテーター情報113を生成する。
次に、学習用情報生成手段103は、アノテーション対象情報111とアノテーション情報112とから構成される一般的な機械学習用の情報に、アノテーター情報113に含まれる項目をさらに追加して学習用情報114とする。図9に示す例では、学習用情報114dは、一般的な機械学習用の情報としてアノテーション対象情報111に対応するアノテーション対象情報欄と、アノテーション情報112に対応するアノテーション欄とを有し、さらにアノテーター情報113に含まれるアノテーター欄と、信頼性欄とを有する。
次に、機械学習手段104は、学習用情報114aを用いて機械学習を行う。この際に信頼性欄の値を考慮して学習用情報114aのそれぞれについて重み付けを行ってもよい。また、さらにアノテーターメタ情報113Aを用いて重み付けを行ってもよい。
(第2の実施の形態の効果)
上記した第2の実施の形態によれば、機械学習用の情報として用いられる情報は通常アノテーション対象とアノテーションのみであるが、当該機械学習用の情報にアノテーターの信頼性を追加したものとしたため、アノテーションの信頼性を考慮した機械学習用の情報を生成することができ、アノテーションの信頼性を考慮した機械学習を実行することができる。
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。
上記実施の形態では制御部10の各手段100〜104の機能をプログラムで実現したが、各手段の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD−ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。
1、1A 情報処理装置
10 制御部
11 記憶部
12 通信部
100 アノテーション付与手段
101 アノテーター評価手段
102 アノテーション範囲決定手段
103 学習用情報生成手段
104 機械学習手段
110 アノテーション付与プログラム
111 アノテーション対象情報
112 アノテーション情報
113 アノテーター情報
113A アノテーターメタ情報
114 学習用情報

Claims (6)

  1. コンピュータを、
    一の入力者の入力に基づき、複数の対象を含む対象情報に注釈情報を付与する付与手段と、
    他の入力者により前記複数の対象の一部に付与済みの注釈情報と、前記一の入力者により付与された注釈情報とを比較し、前記一の入力者及び前記他の入力者の信頼性を評価する評価手段と、
    前記一の入力者及び前記他の入力者の信頼性に基づいて、前記一の入力者に注釈情報の付与を依頼する前記対象情報の対象の範囲を決定する決定手段として機能させるための注釈情報付与プログラム。
  2. 前記決定手段は、前記他の入力者の信頼度が予め定めた閾値以上である場合、当該他の入力者が注釈情報を付与した対象以外を、前記一の入力者に注釈情報の付与を依頼する前記対象情報の対象の範囲に決定する請求項1に記載の注釈情報付与プログラム。
  3. 前記決定手段は、複数の前記他の入力者の信頼度が予め定めた第1の閾値より低いが予め定めた第2の閾値以上である場合、複数の当該他の入力者が注釈情報を付与した対象以外を、前記一の入力者に注釈情報の付与を依頼する前記対象情報の対象の範囲に決定する請求項1に記載の注釈情報付与プログラム。
  4. 機械学習用の情報として、少なくとも、前記対象情報の対象と、前記付与手段によって付与された注釈情報と、当該注釈情報を付与した入力者の信頼性とを有する情報を生成する生成手段としてさらに機能させる請求項1−3のいずれか1項に記載の注釈情報付与プログラム。
  5. 前記生成手段の生成する情報を用いて機械学習を行う機械学習手段としてさらに機能させる請求項4に記載の注釈情報付与プログラム。
  6. 一の入力者の入力に基づき、複数の対象を含む対象情報に注釈情報を付与する付与手段と、
    他の入力者により前記複数の対象の一部に付与済みの注釈情報と、前記一の入力者により付与された注釈情報とを比較し、前記一の入力者及び前記他の入力者の信頼性を評価する評価手段と、
    前記一の入力者及び前記他の入力者の信頼性に基づいて、前記一の入力者に注釈情報の付与を依頼する前記対象情報の対象の範囲を決定する決定手段とを有する情報処理装置。
JP2014041519A 2014-03-04 2014-03-04 注釈情報付与プログラム及び情報処理装置 Active JP6421421B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2014041519A JP6421421B2 (ja) 2014-03-04 2014-03-04 注釈情報付与プログラム及び情報処理装置
US14/509,394 US20150254223A1 (en) 2014-03-04 2014-10-08 Non-transitory computer readable medium, information processing apparatus, and annotation-information adding method
AU2015200401A AU2015200401B2 (en) 2014-03-04 2015-01-28 Annotation-information adding program, information processing apparatus, and annotation-information adding method
SG10201501148YA SG10201501148YA (en) 2014-03-04 2015-02-13 Annotation-information adding program, information processing apparatus, and annotation-information adding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014041519A JP6421421B2 (ja) 2014-03-04 2014-03-04 注釈情報付与プログラム及び情報処理装置

Publications (2)

Publication Number Publication Date
JP2015166975A true JP2015166975A (ja) 2015-09-24
JP6421421B2 JP6421421B2 (ja) 2018-11-14

Family

ID=54017523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014041519A Active JP6421421B2 (ja) 2014-03-04 2014-03-04 注釈情報付与プログラム及び情報処理装置

Country Status (4)

Country Link
US (1) US20150254223A1 (ja)
JP (1) JP6421421B2 (ja)
AU (1) AU2015200401B2 (ja)
SG (1) SG10201501148YA (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018106662A (ja) * 2016-12-22 2018-07-05 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
WO2019003485A1 (ja) * 2017-06-30 2019-01-03 株式会社Abeja 機械学習又は推論のための計算機システム及び方法
JP2019096319A (ja) * 2017-11-21 2019-06-20 クラウドワークス インコーポレイテッドCrowdWorks, Inc. データラベリング作業検査方法及びプログラム
WO2019187421A1 (ja) * 2018-03-29 2019-10-03 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2022078060A (ja) * 2021-06-17 2022-05-24 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ラベリング能力情報決定方法、関連する装置、電子デバイス、コンピュータ可読記憶媒体およびコンピュータプログラム
JP2022549652A (ja) * 2019-09-24 2022-11-28 アプライド マテリアルズ インコーポレイテッド 組織セグメンテーションのための機械学習モデルの双方向トレーニング
WO2023181228A1 (ja) * 2022-03-24 2023-09-28 三菱電機株式会社 二項分類装置及び二項分類装置のアノテーション補正方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9916296B2 (en) * 2015-09-24 2018-03-13 International Business Machines Corporation Expanding entity and relationship patterns to a collection of document annotators using run traces
CN110796156A (zh) * 2018-08-02 2020-02-14 松下知识产权经营株式会社 信息处理方法及信息处理系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090164462A1 (en) * 2006-05-09 2009-06-25 Koninklijke Philips Electronics N.V. Device and a method for annotating content
JP2009282686A (ja) * 2008-05-21 2009-12-03 Toshiba Corp 分類モデル学習装置および分類モデル学習方法
US9275291B2 (en) * 2013-06-17 2016-03-01 Texifter, LLC System and method of classifier ranking for incorporation into enhanced machine learning

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8438499B2 (en) * 2005-05-03 2013-05-07 Mcafee, Inc. Indicating website reputations during user interactions
US7757163B2 (en) * 2007-01-05 2010-07-13 International Business Machines Corporation Method and system for characterizing unknown annotator and its type system with respect to reference annotation types and associated reference taxonomy nodes
JP5349032B2 (ja) * 2008-12-19 2013-11-20 Kddi株式会社 情報選別装置
US9262390B2 (en) * 2010-09-02 2016-02-16 Lexis Nexis, A Division Of Reed Elsevier Inc. Methods and systems for annotating electronic documents
US8732181B2 (en) * 2010-11-04 2014-05-20 Litera Technology Llc Systems and methods for the comparison of annotations within files
US20130091161A1 (en) * 2011-10-11 2013-04-11 International Business Machines Corporation Self-Regulating Annotation Quality Control Mechanism
WO2013136792A1 (ja) * 2012-03-15 2013-09-19 パナソニック株式会社 コンテンツ処理装置、コンテンツ処理方法およびプログラム
US9355359B2 (en) * 2012-06-22 2016-05-31 California Institute Of Technology Systems and methods for labeling source data using confidence labels
US9183466B2 (en) * 2013-06-15 2015-11-10 Purdue Research Foundation Correlating videos and sentences

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090164462A1 (en) * 2006-05-09 2009-06-25 Koninklijke Philips Electronics N.V. Device and a method for annotating content
JP2009536390A (ja) * 2006-05-09 2009-10-08 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンテンツに注釈付けする装置及び方法
JP2009282686A (ja) * 2008-05-21 2009-12-03 Toshiba Corp 分類モデル学習装置および分類モデル学習方法
US9275291B2 (en) * 2013-06-17 2016-03-01 Texifter, LLC System and method of classifier ranking for incorporation into enhanced machine learning

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
アイゼンバーグ ナタリー 外3名: "MEDLINE概要文の役割分類のための信頼度の異なるデータを用いた学習", 電子情報通信学会 第18回データ工学ワークショップ論文集 [ONLINE], JPN6018007379, 1 June 2007 (2007-06-01), JP, pages 1 - 8, ISSN: 0003752072 *
後藤 真介 外3名: "クラウドソーシングへの黒板アーキテクチャの適用", 電子情報通信学会技術研究報告, vol. 第113巻第376号, JPN6018007373, 3 January 2014 (2014-01-03), JP, pages 13 - 18, ISSN: 0003752069 *
渡邉 俊大 外1名: "クラウドソーシングによるラベル付けにおける多数派の少数ワーカー近似:ラベル補完アプローチ", 電子情報通信学会技術研究報告, vol. 第113巻第476号, JPN6018007377, 27 February 2014 (2014-02-27), JP, pages 47 - 53, ISSN: 0003752071 *
芦川 将之 外1名: "クラウドソーシングを用いたアノテーション", 人工知能, vol. 第29巻第1号, JPN6018007376, 1 January 2014 (2014-01-01), JP, pages 54 - 59, ISSN: 0003752070 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018106662A (ja) * 2016-12-22 2018-07-05 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
US11531909B2 (en) 2017-06-30 2022-12-20 Abeja, Inc. Computer system and method for machine learning or inference
WO2019003485A1 (ja) * 2017-06-30 2019-01-03 株式会社Abeja 機械学習又は推論のための計算機システム及び方法
JPWO2019003485A1 (ja) * 2017-06-30 2020-04-30 株式会社Abeja 機械学習又は推論のための計算機システム及び方法
JP7409622B2 (ja) 2017-06-30 2024-01-09 株式会社Abeja 計算機システム及び方法
JP7122713B2 (ja) 2017-06-30 2022-08-22 株式会社Abeja 機械学習又は推論のための計算機システム及び方法
JP2022160544A (ja) * 2017-06-30 2022-10-19 株式会社Abeja 計算機システム及び方法
JP2019096319A (ja) * 2017-11-21 2019-06-20 クラウドワークス インコーポレイテッドCrowdWorks, Inc. データラベリング作業検査方法及びプログラム
WO2019187421A1 (ja) * 2018-03-29 2019-10-03 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
CN111902829A (zh) * 2018-03-29 2020-11-06 索尼公司 信息处理设备、信息处理方法和程序
JP2022549652A (ja) * 2019-09-24 2022-11-28 アプライド マテリアルズ インコーポレイテッド 組織セグメンテーションのための機械学習モデルの双方向トレーニング
JP7434537B2 (ja) 2019-09-24 2024-02-20 アプライド マテリアルズ インコーポレイテッド 組織セグメンテーションのための機械学習モデルの双方向トレーニング
JP2022078060A (ja) * 2021-06-17 2022-05-24 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ラベリング能力情報決定方法、関連する装置、電子デバイス、コンピュータ可読記憶媒体およびコンピュータプログラム
WO2023181228A1 (ja) * 2022-03-24 2023-09-28 三菱電機株式会社 二項分類装置及び二項分類装置のアノテーション補正方法
JP7466808B2 (ja) 2022-03-24 2024-04-12 三菱電機株式会社 二項分類装置及び二項分類装置のアノテーション補正方法

Also Published As

Publication number Publication date
SG10201501148YA (en) 2015-10-29
AU2015200401B2 (en) 2017-02-02
AU2015200401A1 (en) 2015-09-24
JP6421421B2 (ja) 2018-11-14
US20150254223A1 (en) 2015-09-10

Similar Documents

Publication Publication Date Title
JP6421421B2 (ja) 注釈情報付与プログラム及び情報処理装置
JP7200311B2 (ja) 人工知能およびユーザ入力を用いて発達進度を判定するための方法および装置
EP3525096A1 (en) Resource load balancing control method and cluster scheduler
US10068175B2 (en) Question resolution processing in deep question answering systems
JP7316453B2 (ja) オブジェクト推薦方法及び装置、コンピュータ機器並びに媒体
US9977829B2 (en) Combinatorial summarizer
WO2015103964A1 (en) Method, apparatus, and device for determining target user
CN109313490A (zh) 使用神经网络的眼睛注视跟踪
WO2016053685A1 (en) Determining and localizing anomalous network behavior
US10984794B1 (en) Information processing system, information processing apparatus, information processing method, and recording medium
US10204307B1 (en) Classification of members in a social networking service
Lorimer et al. Exploring relapse through a network analysis of residual depression and anxiety symptoms after cognitive behavioural therapy: A proof-of-concept study
US11188517B2 (en) Annotation assessment and ground truth construction
US11294884B2 (en) Annotation assessment and adjudication
JP7128311B2 (ja) 文書種別の推奨方法、装置、電子機器、可読記憶媒体及びコンピュータプログラム製品
US10313457B2 (en) Collaborative filtering in directed graph
US10108906B2 (en) Avoiding supporting evidence processing when evidence scoring does not affect final ranking of a candidate answer
Stripelis et al. Accelerating federated learning in heterogeneous data and computational environments
US20230274818A1 (en) Image analysis and insight generation
US20180218268A1 (en) System, method and computer program product for sensory stimulation to ameliorate a cognitive state
JP7218633B2 (ja) 情報処理装置及びプログラム
US8856634B2 (en) Compensating for gaps in workload monitoring data
CN110929163A (zh) 课程推荐方法、装置、计算机设备及存储介质
JP2021077206A (ja) 学習方法、評価装置、及び評価システム
TW202101478A (zh) 患病機率預測方法與電子裝置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180423

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20180423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180918

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181001

R150 Certificate of patent or registration of utility model

Ref document number: 6421421

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350