JP2010182291A - 知識注釈結果検査方法および知識注釈結果検査システム - Google Patents

知識注釈結果検査方法および知識注釈結果検査システム Download PDF

Info

Publication number
JP2010182291A
JP2010182291A JP2009279845A JP2009279845A JP2010182291A JP 2010182291 A JP2010182291 A JP 2010182291A JP 2009279845 A JP2009279845 A JP 2009279845A JP 2009279845 A JP2009279845 A JP 2009279845A JP 2010182291 A JP2010182291 A JP 2010182291A
Authority
JP
Japan
Prior art keywords
knowledge annotation
tag
knowledge
engine
registration database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009279845A
Other languages
English (en)
Other versions
JP5137936B2 (ja
Inventor
Qiangze Feng
フェン クアンゼ
Toshikazu Fukushima
トシカズ フクシマ
Hongwei Qi
ザイ ホンウェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC China Co Ltd
Original Assignee
NEC China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC China Co Ltd filed Critical NEC China Co Ltd
Publication of JP2010182291A publication Critical patent/JP2010182291A/ja
Application granted granted Critical
Publication of JP5137936B2 publication Critical patent/JP5137936B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】 不整合なタグ情報を検出できる知識注釈結果検査システムの解決法を提供する。
【解決手段】 本発明は知識注釈結果検査システムおよび方法を開示する。知識注釈結果検査システムは、知識注釈結果を受信するための受信ユニットと、受信した知識注釈結果をタグ登録データベース内の情報と比較して比較情報を取得するための検査ユニットとを備える。本発明によれば、不整合タグ情報を検出することが可能となる。
【選択図】 図1A

Description

本発明は、知識抽出分野に関し、特に、知識注釈結果の検査方法およびシステムに関する。
知識抽出とは、非構造化情報から構造化情報を抽出することであり、その一例としては、HTMLファイルから企業情報や製品情報等を抽出することが挙げられる。知識抽出タスクには、1つ以上の知識注釈エンジンが関与する場合がある。各知識注釈エンジンは、ソース情報を、互いに関連する1つ以上のタグとして注釈付けする。例えば、「NECは最新のストレージ製品であるStorage Dシリーズを提案した」というテキストがあったとすると、企業注釈エンジンがテキスト内の「NEC」を「企業」タグとして注釈付けし、製品注釈エンジンが同じテキスト内の「Storage D」を「製品」タグとして注釈付けすることができる。
しかし、知識注釈エンジンに100%の精度を要求することは不可能であり、知識注釈エンジンが不整合なタグを出力する可能性は常にある。例えば、企業注釈エンジンが、本来は製品注釈エンジンが出力すべき「価格」タグを出力することは多い。
そのため、不整合なタグ情報を検出できる知識注釈結果検査システムの解決法が望まれている。
当該技術に関連する特許や研究はすでにいくつか存在している。
特許文献1(米国特許第20040243554号)では、非構造化情報管理およびテキスト解析システムが開示されている。このシステムは、特にテキストを注釈付けする方法に重点を置き、一連の知識注釈エンジンを提供している。
特許文献2(特許第2003167879号)では、注釈情報を検索および表示する装置が開示されている。この装置は注釈結果の提示方法に重点を置き、具体的にはこの方法は、注釈付き文書から対応する注釈結果を抽出するステップと、ユーザからのクエリ要求に基づいてそれを表示するステップとで構成される。
特許文献3(特許第2008021139号)では、意味注釈モデルを構築する装置が開示されている。この装置は特にテキストを注釈付けする方法に重点を置き、具体的には、オントロジと統計的手法を用いて、テキストへの意味的注釈付けを高精度に行う。
米国特許第20040243554号 特許第2003167879号 特許第2008021139号
しかし、上述した特許文献に記載される関連技術では、テキストの注釈付けと注釈結果の提示を行う方法にのみ重点が置かれており、注釈結果を自動的に検査する解決法は提供されていない。
本発明は、不整合なタグ情報を検出できる知識注釈結果検査システムの解決法を提供する。
本発明の一態様によれば、知識注釈結果検査システムであって、知識注釈結果を受信するための受信ユニットと、受信した知識注釈結果をタグ登録データベース内の情報と比較して比較情報を取得するための検査ユニットとを備えることを特徴とする知識注釈結果検査システムが提供される。
本発明の一態様によれば、知識注釈結果検査方法であって、知識注釈結果を受信し、受信した知識注釈結果をタグ登録データベース内の情報と比較して比較情報を取得することを特徴とする知識注釈結果検査方法が提供される。
本発明によれば、不整合タグ情報を検出することが可能となる。
以下の図面を参照して本発明を完全に理解することにより、他の目的と効果がより明確でかつ利用可能となるであろう。
本発明の一実施例による知識注釈結果検査システムのブロック図を示す。 本発明の他の実施例による知識注釈結果検査システムのブロック図を示す。 本発明のさらに他の実施例による知識注釈結果検査システムのブロック図を示す。 タグと知識注釈エンジンとで構成される、データベースに格納されるエントリを示す。 知識注釈結果検査の例を示す。 オントロジリポジトリの例を示す。 本発明の一実施例による登録インターフェースを示す。 データベースおよびオントロジリポジトリの訂正例を示す。 本発明の一実施例による知識注釈結果検索方法のフローチャートを示す。 本発明の他の実施例による知識注釈結果検索方法のフローチャートを示す。 本発明のさらに他の実施例による知識注釈結果検索方法のフローチャートを示す。
図面で使用される同一の参照番号は、同一、類似、または対応する特徴もしくは機能を示す。
図1Aは、本発明の一実施例による知識注釈結果検索システムのブロック図を示す。
図1Aに示すように、知識注釈結果検査システム100Aは、知識注釈結果を受信するための受信ユニット105と、対応する情報を格納するためのタグ登録データベース110と、受信した知識注釈結果をタグ登録データベース内の情報と比較して比較情報を取得するための検査ユニット120とを備える。知識注釈結果は少なくともタグと知識注釈とで構成され、タグ登録データベース110は、タグと、これらのタグを使用する知識注釈エンジンとで構成される。検査ユニット120は、少なくとも、知識注釈結果内のタグおよび知識注釈エンジンを、タグ登録データベース110内のタグおよび知識注釈エンジンと比較することにより、比較情報を取得する。比較情報は不整合なタグ情報である。
図2に、タグと、これらのタグを使用する知識注釈エンジンとから成り、タグ登録データベース110内に格納される情報を示す。各エントリ(各行)は、「タグ」(列210)と「知識注釈エンジン」(列212)とで構成され、各列はそれぞれ、タグ名とそのタグを使用する知識注釈エンジン名を示す。例えば、「企業」タグを使用する知識注釈エンジンは「企業注釈エンジン」であり、「製品」タグを使用する知識注釈エンジンは「製品注釈エンジン」である。
検査ユニット120のタスクは、知識注釈結果が、タグ登録データベース110内のタグおよび知識注釈エンジンから成るエントリと不整合なタグ情報を含むかどうかをチェックすることである。
知識注釈結果内のタグがタグ登録データベース110内に存在しない場合には、不整合タイプが「新規タグ」である不整合タグ情報が存在する。
知識注釈結果内のタグに対応するタグ登録データベース110内の知識注釈エンジンが、そのタグに対応する知識注釈結果内の知識注釈エンジンを含まない場合には、不整合タイプが「タグ使用エラー」である不整合タグ情報が存在する。
図3に、知識注釈結果検査の例を示す。
知識注釈結果310において、製品注釈エンジンは「製品」、「製品」、「重量」という3つのタグを出力し、企業注釈エンジンは「企業」、「価格」、「社長」という3つのタグを出力している。「製品」タグに対応するタグ登録データベース110内の知識注釈エンジンも「製品注釈エンジン」なので、検査ユニット120はそれを整合なタグと判定する。「重量」に対応するタグ登録データベース110内の知識注釈エンジンは「企業注釈エンジン」なので、検査ユニット120はそれを不整合タイプが「タグ使用エラー」である不整合タグと判定する。「企業」に対応するタグ登録データベース110内の知識注釈エンジンも「企業注釈エンジン」なので、検査ユニット120はそれを整合なタグと判定する。「価格」に対応するタグ登録データベース110内の知識注釈エンジンは「企業注釈エンジン」なので、検査ユニット120はそれを、不整合タイプが「タグ使用エラー」である不整合タグと判定する。「社長」に対応するタグ登録データベース110内の知識注釈エンジンは存在しないため、検査ユニット120はそれを、不整合タイプが「新規タグ」である不整合タグと判定する。
検査ユニット120はユーザに不整合タグ情報を通知することができる。
図1Bに、本発明の他の実施例による知識注釈結果検査システムのブロック図を示す。
本実施例の知識注釈結果検査システム100Bと上記の知識注釈結果検査システム100Aとの相違点は、知識注釈結果検査システム100Bはさらに、各知識注釈エンジンが使用するタグをタグ登録データベース110に登録する登録ユニット130と、ドメイン知識を格納するオントロジリポジトリ140とを備えることである。
図4にオントロジリポジトリの例を示す。オントロジリポジトリ140は、クラス部410、プロパティ部420、関係部430、個体部440、公理部450という5つの部分で構成される。
クラス部410は、企業や製品等のすべてのドメインクラスを含む。「クラス」は実在のエンティティではなく、抽象化された概念である。各クラスは、そのクラスの親クラスを示す、「である」(is a/an)という項目を有する。例えば、「企業」の親クラスは「地理的エンティティ」なので、「企業は地理的エンティティである」となる。例えば、「製品」の親クラスは「品目」なので、「製品は品目である」となる。
プロパティ部420内のプロパティは、クラスのプロパティを定義する。各プロパティは、少なくとも、「ドメイン」および「値域」という2つの項目を有する。「ドメイン」はそのプロパティがどのクラスに該当するか(すなわち、どのクラスがそのプロパティを有するか)を示し、「値域」はプロパティの値型を示す。例えば、プロパティ「住所」はクラス「企業」に適しており、プロパティ値は文字列である。もう1つ例を挙げると、「価格」はクラス「企業」に適しており、プロパティ値は数値である。
関係部430内の関係は、クラス間の様々な関連性を記述するものである。各関係は、少なくとも、「ドメイン」と「値域」という2つの項目を含み、2者間の関係がどのクラスに該当するかを示す。例えば、任意のクラスもしくは個体と任意のクラスの間には「である」(is a/an)関係が存在しうる(例:製品と企業の間には「製造される」(is manufactured)という関係が存在しうる)。
個体部440内の個体は、実在のエンティティである。各個体は何らかのクラスに属し、プロパティの値と関係の値を記述する。例えば、「IBM T61 7664−BB1」は製品クラスに属し、IBMによって製造され、その価格は12000〜15000元である。
公理部450は、クラス、個体、関係間のルールを踏まえて実行される推論である。これは、「(x,y)である&(y,z)である→(x,z)である」(is a (x,y)&is a(y,z)→is a(x,z))の形式をとる。推論は、例えば、「IBM T61 7664−BB1は製品であり、製品は品目であり、よってIBM T61 7664−BB1もまた品目である」というように行われる。公理部内のルールは通常は限定的であり、必要に応じて展開することが可能である。
オントロジリポジトリ140は、ドメイン開発者によって自動あるいは手動で構築され、維持される。
本発明の本実施例においては、登録ユニット130が、知識注釈エンジンの機能の記述または名称(知識注釈エンジンの開発者によって提供される)に従って、知識注釈エンジンを、オントロジリポジトリ140内の対応するクラスにマッピングする。例えば、知識注釈エンジンの機能の記述は注釈「製品」情報なので、知識注釈エンジンはオントロジリポジトリ140内の「製品」クラスにマッピングされる。また他の例として、知識注釈エンジンの名称は「企業注釈エンジン」なので、知識注釈エンジンはオントロジリポジトリ140内の「企業」クラスにマッピングされる。登録ユニット130はさらに、個々の知識注釈エンジンが使用するタグをタグ登録データベース110に登録するために、オントロジリポジトリ内の対応するクラスと、対応するクラスのすべてのプロパティとを、知識注釈エンジンが出力可能なタグ集合として抽出する。
本発明の他の実施例においては、登録ユニット130は、知識注釈エンジンの機能の記述または名称に従って、知識注釈エンジンをオントロジリポジトリ140内の対応するクラスにマッピングし、オントロジリポジトリ140内の対応するクラスと、対応するクラスのすべてのプロパティとを、知識注釈エンジンが出力可能で、かつユーザに提供される候補タグ集合として抽出し、ユーザが選択した候補タグ集合内のタグに基づいて、個々の知識注釈エンジンが使用するタグをタグ登録デ―タベース110に登録する。図5は、本実施例による登録インターフェースを示す。製品注釈エンジンを登録する際には、システムはまず、オントロジリポジトリ、製品、および価格に基づいて2つの候補タグをユーザに提示する。ユーザはそれを基に製品注釈エンジンに適したタグを選択し、最後に「OK」ボタンをクリックしてその登録情報を送信する。
さらに他の実施例においては、登録ユニット130は、知識注釈エンジンにより出力可能で、かつオントロジリポジトリ140を参照してユーザによって提供されるタグ集合に従って、個々の知識注釈エンジンにより使用されるタグをタグ登録データベース110に登録する。
図1Cに、本発明のさらに他の実施例による知識注釈結果検査システムのブロック図を示す。
本実施例の知識注釈結果検査システム100Cと上記の知識注釈結果検査システム100Bとの相違点は、知識注釈結果検査システム100Cはさらに、比較情報に関するユーザのフィードバックに基づいて、タグ登録データベース110内かオントロジリポジトリ140内(またはその両方)のタグと知識注釈エンジン間の対応を訂正するための訂正ユニット150を備えることである。
ユーザが不整合タグ情報は正しい(すなわち、タグ登録データベース110とオントロジリポジトリ140は正しい)と判断した場合には、タグ登録データベース110とオントロジリポジトリを訂正する必要はない。しかし、ユーザが不整合タグ情報は不正である(すなわち、タグ登録データベース110とオントロジリポジトリ140は不正である)と判断した場合には、タグ登録データベース110とオントロジリポジトリ140を訂正する必要がある。
図6は、タグ登録データベース110およびオントロジリポジトリ140の訂正例である。ユーザは、「(企業注釈エンジン,価格)」、「(企業注釈エンジン,社長)」、および「(製品注釈エンジン,重量)」という不整合タグ情報のうち最後の2つを正しいとみなし、不整合タグ情報内に出現すべきではないと判断した。そのため、訂正ユニット150は、「企業」クラスの新規プロパティ「社長」をオントロジリポジトリ140に追加し、新規エントリ「社長、企業注釈製品」をタグ登録データベース110に追加し、オントロジリポジトリ140内のプロパティ「重量」のドメインを「企業」から「製品」に修正し、さらに、タグ登録データベース110において、タグ「重量」に対応する知識注釈エンジンを「企業注釈エンジン」から「製品注釈エンジン」に修正する。
図7Aは、本発明の一実施例による知識注釈結果検索方法のフローチャートである。
図7Aに示すように、方法700Aは、知識注釈結果を受信し(ステップS710)、受信した知識注釈結果をタグ登録データベース内の情報と比較して比較情報を取得する(ステップS720)。知識注釈結果は少なくともタグと知識注釈とで構成され、タグ登録データベースは、タグと、これらのタグを使用する知識注釈エンジンとで構成される。比較情報は、少なくとも、知識注釈結果内のタグおよび知識注釈エンジンを、タグ登録データベース内のタグおよび知識注釈エンジンと比較することにより取得される。比較情報は不整合なタグ情報である。
図7Bは、本発明の他の実施例による知識注釈結果検索方法のフローチャートである。
本実施例の知識注釈結果検査方法700Bと上記の知識注釈結果検査方法700Aとの相違点は、知識注釈結果検査方法700Bは、さらにステップS710の前に、各知識注釈エンジンが使用するタグをタグ登録データベースに登録する(ステップS705)ことである。
本発明の本実施例においては、知識注釈エンジンが、知識注釈エンジンの機能の記述または名称に従って、オントロジリポジトリ内の対応するクラスにマッピングされると共に、オントロジリポジトリ内の対応するクラスと、対応するクラスのすべてのプロパティとが、個々の知識注釈エンジンが使用するタグをタグ登録データベースに登録するための知識注釈エンジンのタグ集合として抽出される。
本発明の他の実施例においては、知識注釈エンジンが、知識注釈エンジンの機能の記述または名称に従って、オントロジリポジトリ内の対応するクラスにマッピングされると共に、オントロジリポジトリ内の対応するクラスと、対応するクラスのすべてのプロパティとが、ユーザに提供される知識注釈エンジンの候補タグ集合として抽出され、さらには、ユーザが選択した候補タグ集合内のタグに基づいて、個々の知識注釈エンジンが使用するタグが前記タグ登録データベースに登録される。
本発明のさらに他の実施例においては、知識注釈エンジンにより出力可能で、かつオントロジリポジトリを参照してユーザによって提供されるタグ集合に従って、個々の知識注釈エンジンにより使用されるタグがタグ登録データベースに登録される。
図7Cは、本発明の他の実施例による知識注釈結果検索方法のフローチャートである。
本実施例の知識注釈結果検査方法700Cと上記の知識注釈結果検査方法700Bとの相違点は、知識注釈結果検査方法700Cはさらに、比較情報に関するユーザのフィードバックに基づいて、タグ登録データベース内かオントロジリポジトリ内(またはその両方)のタグと知識注釈エンジン間の対応を訂正することである。
本発明の説明は例示のみを目的とし、すべての可能性を網羅しているわけではなく、本発明は開示された形態に限定されない。当該技術に精通した当業者には、その他多数の変更および改変が可能なことは明らかであろう。また、当業者には、本発明の実施例における方法および装置は、ソフトウェア、ハードウェア、ファームウェア、またはその組み合わせとして実装できることもまた理解されるであろう。例えば、本発明は、コンピュータ可読媒体上に格納され、コンピュータ上で起動されたときに本発明の実施例による方法を実行するプログラムコードで構成される、コンピュータプログラム製品として具現化することが可能である。
よって上記の実施例は本発明の原理とその実際の用途をより明確に説明するために選択および説明されたものであり、すべての変更および改変は、本発明の本質から乖離することなく、請求項に定義される本発明の保護範囲内に含まれることは当業者には明らかである。
105:受信ユニット
120:検査ユニット
110:タグ登録データベース
130:登録ユニット
140:オントロジリポジトリ
150:訂正ユニット
210:タグ
212:知識注釈エンジン
310:知識注釈結果
410:クラス部
420:プロパティ部
430:関係部
440:個体部
450:公理部

Claims (18)

  1. 知識注釈結果検査システムであって、
    知識注釈結果を受信するための受信ユニットと、
    受信した前記知識注釈結果をタグ登録データベース内の情報と比較して比較情報を取得するための検査ユニットと
    を備えることを特徴とする知識注釈結果検査システム。
  2. 前記知識注釈結果が、少なくともタグおよび知識注釈エンジンを含み、
    前記タグ登録データベースが、複数のタグと、当該タグを使用する知識注釈エンジンを含むことを特徴とする請求項1に記載の知識注釈結果検査システム。
  3. 前記検査ユニットは、少なくとも前記知識注釈結果のタグおよび知識注釈エンジンを、前記タグ登録データベース内のタグおよび知識注釈エンジンと比較することにより、前記比較情報を取得することを特徴とする請求項2に記載の知識注釈結果検査システム。
  4. 前記比較情報が、不整合タグ情報であることを特徴とする請求項1又は請求項3に記載の知識注釈結果検査システム。
  5. 前記タグ登録データベースに、各知識注釈エンジンによって使用されるタグを登録する登録ユニットをさらに備えることを特徴とする請求項1に記載の知識注釈結果検査システム。
  6. ドメイン知識を格納するオントロジリポジトリをさらに備え、
    前記登録ユニットは、前記知識注釈エンジンの機能の記述又は名称に従って、前記知識注釈エンジンを前記オントロジリポジトリ内の対応するクラスにマッピングし、各知識注釈エンジンによって使用されるタグを前記タグ登録データベースに登録するために、前記オントロジリポジトリ内の対応するクラスと、対応するクラスのすべてのプロパティとを、前記知識注釈エンジンのタグ集合として抽出することを特徴とする請求項5に記載の知識注釈結果検査システム。
  7. ドメイン知識を格納するオントロジリポジトリをさらに備え、
    前記登録ユニットは、前記知識注釈エンジンの機能の記述又は名称に従って、前記知識注釈エンジンを前記オントロジリポジトリ内の対応するクラスにマッピングし、前記オントロジリポジトリ内の対応するクラスと対応するクラスのすべてのプロパティとをユーザに提供される知識注釈エンジンの候補タグ集合として抽出し、ユーザが選択した候補タグ集合内のタグに基づいて、各知識注釈エンジンが使用するタグを前記タグ登録データベースに登録することを特徴とする請求項5に記載の知識注釈結果検査システム。
  8. ドメイン知識を格納するオントロジリポジトリをさらに備え、
    前記登録するユニットは、前記知識注釈エンジンにより出力可能で、かつ前記オントロジリポジトリを参照してユーザによって提供されるタグ集合に従って、個々の知識注釈エンジンにより使用されるタグを前記タグ登録データベースに登録することを特徴とする請求項5に記載の知識注釈結果検査システム。
  9. 前記比較情報に関するユーザのフィードバックに基づいて、前記タグ登録データベースと前記オントロジリポジトリの少なくとも一方のタグと前記知識注釈エンジン間の対応を修正する修正ユニットをさらに備えることを特徴とする請求項6から請求項8の何れかに記載の知識注釈結果検査システム。
  10. 知識注釈結果検査方法であって、
    知識注釈結果を受信するステップと、
    受信した前記知識注釈結果をタグ登録データベース内の情報と比較して比較情報を取得するステップと
    を含むことを特徴とする知識注釈結果検査方法。
  11. 前記知識注釈結果が、少なくともタグおよび知識注釈エンジンを含み、
    前記タグ登録データベースが、複数のタグと、当該タグを使用する知識注釈エンジンを含むことを特徴とする請求項10に記載の知識注釈結果検査方法。
  12. 少なくとも知識注釈結果のタグおよび知識注釈エンジンを、タグ登録データベース内のタグおよび知識注釈エンジンと比較することにより、前記比較情報を取得することを特徴とする請求項11に記載の知識注釈結果検査方法。
  13. 前記比較情報が、不整合タグ情報であることを特徴とする請求項10又は請求項12に記載の知識注釈結果検査方法。
  14. 前記タグ登録データベースに、各知識注釈エンジンによって使用されるタグを登録することを特徴とする請求項10に記載の知識注釈結果検査方法。
  15. 前記知識注釈エンジンの機能の記述又は名称に従って、前記知識注釈エンジンを、オントロジリポジトリ内の対応するクラスにマッピングし、各知識注釈エンジンによって使用されるタグを前記タグ登録データベースに登録するために、前記オントロジリポジトリ内の対応するクラスと、対応するクラスのすべてのプロパティとを、前記知識注釈エンジンのタグ集合として抽出することを特徴とする請求項14に記載の知識注釈結果検査方法。
  16. 前記知識注釈エンジンの機能の記述又は名称に従って、前記知識注釈エンジンを、オントロジリポジトリ内の対応するクラスにマッピングし、前記オントロジリポジトリ内の対応するクラスと対応するクラスのすべてのプロパティとをユーザに提供される知識注釈エンジンの候補タグ集合として抽出し、ユーザが選択した候補タグ集合内のタグに基づいて、各知識注釈エンジンが使用するタグを前記タグ登録データベースに登録することを特徴とする請求項14に記載の知識注釈結果検査方法。
  17. 前記知識注釈エンジンにより出力可能で、かつオントロジリポジトリを参照してユーザによって提供されるタグ集合に従って、個々の知識注釈エンジンにより使用されるタグを前記タグ登録データベースに登録することを特徴とする請求項14に記載の知識注釈結果検査方法。
  18. 前記比較情報に関するユーザのフィードバックに基づいて、前記タグ登録データベースと前記オントロジリポジトリの少なくとも一方のタグと前記知識注釈エンジン間の対応を修正することを特徴とする請求項15から請求項17の何れかに記載の知識注釈結果検査方法。
JP2009279845A 2009-02-03 2009-12-09 知識注釈結果検査方法および知識注釈結果検査システム Expired - Fee Related JP5137936B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200910005716XA CN101794282B (zh) 2009-02-03 2009-02-03 知识标注结果检查方法和系统
CN200910005716.X 2009-02-03

Publications (2)

Publication Number Publication Date
JP2010182291A true JP2010182291A (ja) 2010-08-19
JP5137936B2 JP5137936B2 (ja) 2013-02-06

Family

ID=42398546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009279845A Expired - Fee Related JP5137936B2 (ja) 2009-02-03 2009-12-09 知識注釈結果検査方法および知識注釈結果検査システム

Country Status (3)

Country Link
US (1) US8423503B2 (ja)
JP (1) JP5137936B2 (ja)
CN (1) CN101794282B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8463053B1 (en) 2008-08-08 2013-06-11 The Research Foundation Of State University Of New York Enhanced max margin learning on multimodal data mining in a multimedia database
US9959326B2 (en) 2011-03-23 2018-05-01 International Business Machines Corporation Annotating schema elements based on associating data instances with knowledge base entities
CN108229772A (zh) * 2016-12-14 2018-06-29 北京国双科技有限公司 标注处理方法及装置
CN107491479B (zh) * 2017-07-05 2020-11-24 上海大学 一种基于本体库的标签管理方法
US11586820B2 (en) * 2020-08-10 2023-02-21 Ebay Inc. Techniques for enhancing the quality of human annotation

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162518A (ja) * 2001-11-26 2003-06-06 Canon Inc 文書種別判定方法
JP2003167879A (ja) * 2001-12-04 2003-06-13 Fujitsu Ltd タグ付き情報表示方法,タグ付き情報表示プログラム,及びタグ付き情報表示装置
US20040243554A1 (en) * 2003-05-30 2004-12-02 International Business Machines Corporation System, method and computer program product for performing unstructured information management and automatic text analysis
JP2005038050A (ja) * 2003-07-16 2005-02-10 Toshiba Corp 文書変換装置及び文書変換方法
JP2006031010A (ja) * 2004-07-15 2006-02-02 Robert Bosch Gmbh 固有名称又は部分的な固有名称の認識を提供する方法及び装置
JP2006215823A (ja) * 2005-02-03 2006-08-17 Advanced Telecommunication Research Institute International 辞書作成システム
JP2007094855A (ja) * 2005-09-29 2007-04-12 Toshiba Corp 文書処理装置及び文書処理方法
JP2008021139A (ja) * 2006-07-13 2008-01-31 National Institute Of Information & Communication Technology 意味タグ付け用モデル構築装置、意味タグ付け装置及びコンピュータプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321258B1 (en) * 1997-12-11 2001-11-20 Hewlett-Packard Company Administration of networked peripherals using particular file system
CN100533431C (zh) * 2005-09-21 2009-08-26 富士通株式会社 一种基于语素标注的自然语言成分识别、校正装置及方法
CN101281525B (zh) * 2007-11-23 2010-06-02 北京九城网络软件有限公司 一种互联网上基于知识库的搜索系统和方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162518A (ja) * 2001-11-26 2003-06-06 Canon Inc 文書種別判定方法
JP2003167879A (ja) * 2001-12-04 2003-06-13 Fujitsu Ltd タグ付き情報表示方法,タグ付き情報表示プログラム,及びタグ付き情報表示装置
US20040243554A1 (en) * 2003-05-30 2004-12-02 International Business Machines Corporation System, method and computer program product for performing unstructured information management and automatic text analysis
JP2005038050A (ja) * 2003-07-16 2005-02-10 Toshiba Corp 文書変換装置及び文書変換方法
JP2006031010A (ja) * 2004-07-15 2006-02-02 Robert Bosch Gmbh 固有名称又は部分的な固有名称の認識を提供する方法及び装置
JP2006215823A (ja) * 2005-02-03 2006-08-17 Advanced Telecommunication Research Institute International 辞書作成システム
JP2007094855A (ja) * 2005-09-29 2007-04-12 Toshiba Corp 文書処理装置及び文書処理方法
JP2008021139A (ja) * 2006-07-13 2008-01-31 National Institute Of Information & Communication Technology 意味タグ付け用モデル構築装置、意味タグ付け装置及びコンピュータプログラム

Also Published As

Publication number Publication date
JP5137936B2 (ja) 2013-02-06
US20100198831A1 (en) 2010-08-05
US8423503B2 (en) 2013-04-16
CN101794282A (zh) 2010-08-04
CN101794282B (zh) 2013-11-06

Similar Documents

Publication Publication Date Title
Färber et al. Linked data quality of dbpedia, freebase, opencyc, wikidata, and yago
Vandenbussche et al. Linked Open Vocabularies (LOV): a gateway to reusable semantic vocabularies on the Web
EP2527991B1 (en) Analysis method, analysis device, and analysis program
JP4878624B2 (ja) 文書処理装置および文書処理方法
JP4767694B2 (ja) 不正ハイパーリンク検出装置及びその方法
US20130110839A1 (en) Constructing an analysis of a document
US20080147642A1 (en) System for discovering data artifacts in an on-line data object
US20110029491A1 (en) Dynamically detecting near-duplicate documents
US20090070322A1 (en) Browsing knowledge on the basis of semantic relations
US20080147578A1 (en) System for prioritizing search results retrieved in response to a computerized search query
JP2010501096A (ja) ラッパー生成およびテンプレート検出の協同最適化
KR100980579B1 (ko) 온톨로지에 대한 자연어 질의 검색 방법 및 시스템
US20080147641A1 (en) Method for prioritizing search results retrieved in response to a computerized search query
JP5137936B2 (ja) 知識注釈結果検査方法および知識注釈結果検査システム
Huang et al. Overview of INEX 2007 link the wiki track
Stolz et al. PCS2OWL: a generic approach for deriving web ontologies from product classification systems
CN110209659A (zh) 一种简历过滤方法、系统和计算机可读存储介质
Färber et al. The data set knowledge graph: Creating a linked open data source for data sets
CN108536664A (zh) 商品领域的知识融合方法
Hu et al. A bootstrapping approach to entity linkage on the Semantic Web
Scriney et al. Automating data mart construction from semi-structured data sources
Kungas et al. Cost-effective semantic annotation of XML schemas and web service interfaces
Liu et al. Radar station: Using kg embeddings for semantic table interpretation and entity disambiguation
Byrne et al. Automatic extraction of archaeological events from text
Neumaier et al. Data integration for open data on the web

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120515

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121017

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121113

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151122

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees