JP4242794B2 - メタデータ生成装置 - Google Patents

メタデータ生成装置 Download PDF

Info

Publication number
JP4242794B2
JP4242794B2 JP2004067417A JP2004067417A JP4242794B2 JP 4242794 B2 JP4242794 B2 JP 4242794B2 JP 2004067417 A JP2004067417 A JP 2004067417A JP 2004067417 A JP2004067417 A JP 2004067417A JP 4242794 B2 JP4242794 B2 JP 4242794B2
Authority
JP
Japan
Prior art keywords
metadata
word
concept
extracted
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004067417A
Other languages
English (en)
Other versions
JP2005258659A (ja
Inventor
美樹 境
宏之 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004067417A priority Critical patent/JP4242794B2/ja
Publication of JP2005258659A publication Critical patent/JP2005258659A/ja
Application granted granted Critical
Publication of JP4242794B2 publication Critical patent/JP4242794B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明は、主語、述語及び目的語からなるメタデータを生成するメタデータ生成装置に関する。
従来において、コンピュータの記憶装置に主語、述語及び目的語からなるメタデータを予め蓄積し、コンピュータがこのデータを用いることで、様々な応用が可能となる。また、メタデータ制約定義を用いることで、ある概念の取りうる範囲が限定でき、情報が扱いやすくなる。
例えば、「A店」が「クリーニングする」商品を知りたいと利用者が考えた場合、主語が「A店」、述語が「クリーニングする」と一致するメタデータを取得すれば良い。また、「Yシャツ」を「クリーニングする」店舗が知りたい場合は、述語が「クリーニングする」、目的語が「Yシャツ」のメタデータを検索すれば良い。
このように、主語、述語及び目的語からなるメタデータを用いれば、必要とする情報の取得が容易になる。
このような、技術の前提となる技術としては 下記の特許文献1に記載のものがある。
また、本発明では、例えば、メタデータにRDF(Resource Description Framework)文を用いることができるが、このRDF文についての技術が下記の非特許文献1及び2に記載されている。
特開2002−251311号公報 「Resource Description Framework(RDF)Model and Syntax Specification」, Ora Lassia, Ralph R.Swick編,[online], インターネット<URL:http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/> 「RDF Vocabulary Description Language 1.0: RDF Schema」, Dan Brickley, R.V.Guha編,[online], インターネット<URL:http://www.w3.org/TR/rdf-schema/>
ところで、例えば、「A店がスーツをクリーニングする」ことが分かった場合には、主語「A店」、述語「クリーニングする」及び目的語「スーツ」からなるメタデータが生成されて記憶される。
しかし、メタデータの追加は、メタデータ管理者等が、メタデータを記憶するコンピュータを操作することにより行われる。
そのため、A店と同様に「スーツ」を「クリーニングする」店舗が存在するのに操作ミスや見落とし等により、メタデータが正しく記憶されなかったり、入力漏れが起こる事がある。
本発明は、従来の課題に鑑みてなされたものであり、その目的とするところは、実存するデータを基にメタデータを自動で生成できるメタデータ生成装置を提供することにある。
上記の課題を解決するために、請求項1の本発明は、主語、述語及び目的語からなるメタデータを生成するメタデータ生成装置であって、主語、述語及び目的語からなるメタデータと、語と該語の概念である語概念とからなるメタデータとを記憶するメタデータ記憶手段と、主語の概念である主語概念と当該主語に対応する述語及び目的語の概念である目的語概念からなるメタデータ制約定義を記憶するメタデータ制約定義記憶手段が前記メタデータ生成装置または他の装置に設けられ、前記メタデータ生成装置は、主語概念及び主語を含む文書を入力し、該文書から主語概念を取り出し、この主語概念を含むメタデータ制約定義を前記メタデータ制約定義記憶手段から検索し、当該検索されたメタデータ制約定義から目的語概念を取り出し、該取り出した目的語概念に等しい語概念を含むメタデータを前記メタデータ記憶手段から検索し、該メタデータから語を取り出し、該語を前記文書から検索し、当該語が当該文書にあった場合に、文書から取り出した主語、検索されたメタデータ制約定義から取り出した述語、並びに、メタデータから取り出した当該語に等しい目的語からなるメタデータを生成することを特徴とするメタデータ生成装置をもって解決手段とする。
請求項2の本発明は、メタデータから取り出した前記目的語が前記文書においてどのように配置されているかを調べ、当該目的語と同様に配置されている語を前記文書から取り出し、文書から取り出した前記主語、検索されたメタデータ制約定義から取り出した前記述語、並びに、文書から取り出した当該語に等しい目的語からなるメタデータを生成することを特徴とする請求項1記載のメタデータ生成装置をもって解決手段とする。
請求項3の本発明は、文書から取り出した前記主語概念、検索されたメタデータ制約定義から取り出した前記述語、並びに、文書から取り出した前記語に等しい目的語概念からなるメタデータ制約定義が前記メタデータ制約定義記憶手段にない場合に、当該メタデータ制約定義を生成して、当該メタデータ制約定義記憶手段に記憶させることを特徴とする請求項2記載のメタデータ生成装置をもって解決手段とする。
請求項4の本発明は、文書から取り出した前記語でない語を文書から取り出し、該語を目的語候補とし、文書から取り出した前記主語と当該目的語候補の組を予め設けられた目的語候補記憶手段に記憶しておき、主語、述語及び目的語からなるメタデータを入力し、該メタデータから目的語を取り出し、該目的語に等しい目的語概念を含むメタデータ制約定義がメタデータ制約定義記憶手段にない場合は、入力した前記メタデータから主語を取り出し、当該主語に等しい語を含むメタデータをメタデータ記憶手段から検索し、検索されたメタデータから語概念を取り出し、該語概念を含むメタデータをメタデータ記憶手段から検索し、該メタデータから語を取り出し、該語に等しい主語と、入力されたメタデータから取り出した前記目的語に等しい目的語候補からなる組が前記目的語候補記憶手段に記憶されている場合、当該組を削除し、入力されたメタデータから述語を取り出し、読み出したメタデータから取り出した語に等しい当該主語、入力されたメタデータから取り出した当該述語、並びに、入力されたメタデータから取り出した当該目的語に等しい目的語概念からなるメタデータを生成することを特徴とする請求項2または3記載のメタデータ生成装置をもって解決手段とする。
請求項5の本発明は、読み出したメタデータから主語概念を取り出し、該主語概念、入力されたメタデータから取り出した前記述語、並びに、入力されたメタデータから取り出した目的語に等しい前記目的語概念からなるメタデータ制約定義が前記メタデータ制約定義記憶手段にない場合に、当該メタデータ制約定義を生成して、当該メタデータ制約定義記憶手段に記憶させることを特徴とする請求項4記載のメタデータ生成装置をもって解決手段とする。
請求項6の本発明は、主語、述語及び目的語からなるメタデータを生成するメタデータ生成装置が行うメタデータ生成方法であって、主語、述語及び目的語からなるメタデータと、語と該語の概念である語概念とからなるメタデータとを記憶するメタデータ記憶手段と、主語の概念である主語概念と当該主語に対応する述語及び目的語の概念である目的語概念からなるメタデータ制約定義を記憶するメタデータ制約定義記憶手段が前記メタデータ生成装置または他の装置に設けられ、前記メタデータ生成方法は、主語概念及び主語を含む文書を入力し、該文書から主語概念を取り出し、この主語概念を含むメタデータ制約定義を前記メタデータ制約定義記憶手段から検索し、当該検索されたメタデータ制約定義から目的語概念を取り出し、該取り出した目的語概念に等しい語概念を含むメタデータを前記メタデータ記憶手段から検索し、該メタデータから語を取り出し、該語を前記文書から検索し、当該語が当該文書にあった場合に、文書から取り出した主語、検索されたメタデータ制約定義から取り出した述語、並びに、メタデータから取り出した当該語に等しい目的語からなるメタデータを生成することを特徴とするメタデータ生成方法をもって解決手段とする。
請求項7の本発明は、メタデータから取り出した前記目的語が前記文書においてどのように配置されているかを調べ、当該目的語と同様に配置されている語を前記文書から取り出し、文書から取り出した前記主語、検索されたメタデータ制約定義から取り出した前記述語、並びに、文書から取り出した当該語に等しい目的語からなるメタデータを生成することを特徴とする請求項6記載のメタデータ生成方法をもって解決手段とする。
請求項8の本発明は、文書から取り出した前記主語概念、検索されたメタデータ制約定義から取り出した前記述語、並びに、文書から取り出した前記語に等しい目的語概念からなるメタデータ制約定義が前記メタデータ制約定義記憶手段にない場合に、当該メタデータ制約定義を生成して、当該メタデータ制約定義記憶手段に記憶させることを特徴とする請求項7記載のメタデータ生成方法をもって解決手段とする。
請求項9の本発明は、文書から取り出した前記語でない語を文書から取り出し、該語を目的語候補とし、文書から取り出した前記主語と当該目的語候補の組を予め設けられた目的語候補記憶手段に記憶しておき、主語、述語及び目的語からなるメタデータを入力し、該メタデータから目的語を取り出し、該目的語に等しい目的語概念を含むメタデータ制約定義がメタデータ制約定義記憶手段にない場合は、入力した前記メタデータから主語を取り出し、当該主語に等しい語を含むメタデータをメタデータ記憶手段から検索し、検索されたメタデータから語概念を取り出し、該語概念を含むメタデータをメタデータ記憶手段から検索し、該メタデータから語を取り出し、該語に等しい主語と、入力されたメタデータから取り出した前記目的語に等しい目的語候補からなる組が前記目的語候補記憶手段に記憶されている場合、当該組を削除し、入力されたメタデータから述語を取り出し、読み出したメタデータから取り出した語に等しい当該主語、入力されたメタデータから取り出した当該述語、並びに、入力されたメタデータから取り出した当該目的語に等しい目的語概念からなるメタデータを生成することを特徴とする請求項7または8記載のメタデータ生成方法をもって解決手段とする。
請求項10の本発明は、読み出したメタデータから主語概念を取り出し、該主語概念、入力されたメタデータから取り出した前記述語、並びに、入力されたメタデータから取り出した目的語に等しい前記目的語概念からなるメタデータ制約定義が前記メタデータ制約定義記憶手段にない場合に、当該メタデータ制約定義を生成して、当該メタデータ制約定義記憶手段に記憶させることを特徴とする請求項9記載のメタデータ生成方法をもって解決手段とする。
請求項11の本発明は、請求項6乃至10のいずれかに記載のメタデータ生成方法をコンピュータにより実行させるコンピュータプログラムをもって解決手段とする。
請求項12の本発明は、請求項6乃至10のいずれかに記載のメタデータ生成方法をコンピュータにより実行させるコンピュータプログラムが格納された記録媒体をもって解決手段とする。
本発明によれば、主語概念及び主語を含む文書を入力し、該文書から主語概念を取り出し、この主語概念を含むメタデータ制約定義をメタデータ制約定義記憶手段から検索し、当該検索されたメタデータ制約定義から目的語概念を取り出し、該取り出した目的語概念に等しい語概念を含むメタデータをメタデータ記憶手段から検索し、該メタデータから語を取り出し、該語を前記文書から検索し、当該語が当該文書にあった場合に、当該文書から主語を取り出し、当該検索されたメタデータ制約定義から述語を取り出し、文書から取り出した当該主語、検索されたメタデータ制約定義から取り出した当該述語、並びに、メタデータから取り出した当該語に等しい目的語からなるメタデータを生成するので、実存するデータを基にメタデータを自動的に生成することができる。
以下、本発明の実施の形態を図面を参照して説明する。
図1は、本発明の実施の形態に係るメタデータ生成装置の構成を示すブロック図である。メタデータ生成装置1は、主語と該主語の概念である主語概念と文書内容からなる文書を記憶する文書記憶部11と、文書を解析する文書解析部12と、主語、述語及び目的語からなるメタデータ、語と該語の概念である語概念とからなるメタデータを記憶するメタデータ記憶部13と、主語の概念である主語概念、当該主語に対応する述語、並びに当該主語と述語に対応する目的語の概念である目的語概念とからなるメタデータ制約定義を記憶するメタデータ制約定義記憶部14と、主語、並びに目的語の候補である目的語候補の組を記憶する目的語候補記憶部15、これらを用いてメタデータを生成するメタデータ生成部16とを備えるコンピュータシステムであり、ユーザ装置2と通信可能に接続されている。
図2は、文書記憶部11に記憶された文書の中の文書111の構成を示す図である。
文書111は、主語概念「クリーニング店」と主語「A店」と文書内容(タイトルとボディ)からなるものである。文書内容は、そのボディに「メニュー」、「一般衣料」、「スーツ」、「ワイシャツ」、…、「特殊品」、「和服」、…を含んでいる。主語概念「クリーニング店」と主語「A店」で1つのRDF文が構成される。主語「A店」とタイトル「価格表」で1つのRDF文が構成される。主語「A店」とボディで1つのRDF文が構成される。
図3は、メタデータ制約定義記憶部14に記憶されたメタデータ制約定義を示す図である。
メタデータ制約定義記憶部14には、主語概念「クリーニング店」、述語「クリーニングする」及び目的語概念「衣類」からなるメタデータ制約定義が記憶されている。主語概念「クリーニング店」と述語「クリーニングする」で1つのRDF文が構成される。述語「クリーニングする」と目的語概念「衣類」で1つのRDF文が構成される。
図4は、メタデータ記憶部13に記憶されたメタデータを示す図である。
メタデータ記憶部13には、語「A店」及びこの概念である語概念「クリーニング店」からなるメタデータと、語「B店」及び語概念「クリーニング店」からなるメタデータと、語「ワイシャツ」及び語概念「衣類」からなるメタデータが記憶されている。これらのメタデータにあっては、1つのメタデータで1つのRDF文が構成される。
次に、メタデータ生成装置1の動作を説明する。
図5は、メタデータ生成装置1の第1のシーケンス図である。
先ず、メタデータ生成部16は、文書記憶部11から文書111を入力し(S1)、文書111から主語概念「クリーニング店」を取り出し(S3)、この主語概念「クリーニング店」を含むメタデータ制約定義をメタデータ制約定義記憶部14から検索する(S5)ことで、主語概念「クリーニング店」、述語「クリーニングする」及び目的語概念「衣類」からなるメタデータ制約定義を読み出す(S7)。
メタデータ生成部16は、読み出したメタデータ制約定義から目的語概念「衣類」を取り出し(S11)、取り出した目的語概念「衣類」に等しい語概念を含むメタデータをメタデータ記憶部13から検索する(S13)ことで、語「ワイシャツ」及び語概念「衣類」からなるメタデータを読み出す(S15)。
そして、読み出したメタデータから語「ワイシャツ」を取り出し(S17)、取り出した語「ワイシャツ」と文書111を文書解析部12に与える(S19)。
文書解析部12は、与えられた語「ワイシャツ」を文書111から検索し(S21)、当該語が文書111にあった場合に、その旨をメタデータ記憶部13に通知する(S23)。
メタデータ生成部16は、語「ワイシャツ」が文書111にあった旨の通知があった場合に、S1で入力した文書111から主語「A店」を取り出し(S25)、そしてS7で読み出したメタデータ制約定義から述語「クリーニングする」を取り出す(S27)。
そして、図6に示すように、S25で取り出した主語「A店」と、S27で取り出した述語「クリーニングする」と、S17で取り出した語に等しい目的語「ワイシャツ」からなるメタデータを生成する(S28)。主語、述語及び目的語からなるメタデータは、前述の語と語概念からなるメタデータと同様に1つのRDF文で構成することができ(図6の上側に示したメタデータ)、またブランクノード(図6の下側に示したメタデータの「クリーニングする」と「品」を結ぶ円)を設けて、2つのRDF文で構成することもできる。そして、メタデータはメタデータ記憶部13に記憶される(S29)。
図7は、メタデータ生成装置1の第2のシーケンス図である。
また、文書解析部12は、S19で与えられた語「ワイシャツ」が文書111においてどのように配置されているかを、例えば当該語「ワイシャツ」の前後の文字(前後文字という)を取り出すことにより調べ(S31)、当該目的語と同様に配置されている語として、前後文字を前後にもつ文字列(例えば、スーツ、ネクタイ、ブラウスなど)を文書111から取り出し(S33)、この語をメタデータ生成部16に返却する(S35)。
メタデータ生成部16は、図8に示すように、例えば、S25で取り出した主語「A店」、S27で取り出した述語「クリーニングする」、並びに、S35で返却された語に等しい目的語「スーツ」からなるメタデータを生成し(S37)、メタデータ記憶部13に記憶させる(S39)。
また、メタデータ生成部16は、S3で取り出した主語概念、S27で取り出した述語、並びに、S35で返却された語に等しい目的語概念からなるメタデータ制約定義がメタデータ制約定義記憶部14にない場合には、図9に示すように、例えば主語概念「クリーニング店」、述語「クリーニングする」及び目的語概念「ブラウス」からなるメタデータ制約定義を生成し(S41)、メタデータ制約定義記憶部14に記憶させる(S43)。
また、文書解析部12は、文書111から、語「ワイシャツ」と同様に配置されていない語として、前後文字を前後にもたない語(例えば、メニュー、一般衣料、スキーウェア、和服など)を取り出し(S51)、該語をメタデータ生成部16に返却する(S53)。
メタデータ生成部16は、返却された語を目的語候補とし、図10に示すように、S25で取り出した主語「A店」と各目的語候補の組を生成して(S55)、目的語候補記憶部15に記憶させる(S57)。
図11は、メタデータ生成装置1の第3のシーケンス図である。
メタデータ生成部16は、ユーザ装置2から、図12に示すような、主語「B店」、述語「クリーニングする」及び目的語「スキーウェア」からなるメタデータを入力し(S61)、該メタデータから目的語を取り出し(S63)、取り出した目的語「スキーウェア」に等しい目的語概念を含むメタデータ制約定義を検索する(S64)。
目的語概念「スキーウェア」を含むメタデータ制約定義がなかった場合、入力したメタデータから主語「B店」を取り出す(S65)。
そして、この主語「B店」に等しい語を含むメタデータをメタデータ記憶部13から検索する(S67)ことにより、語「B店」及び語概念「クリーニング店」からなるメタデータを読み出し(S69)、そのメタデータから語概念「クリーニング店」を取り出し(S70)、取り出した語概念を含むメタデータを検索する(S71)することにより、語「C店」及び語概念「クリーニング店」からなるメタデータを読み出す(S73)。
メタデータ生成部16は、読み出したメタデータから語「C店」を取り出し(S75)、この語に等しい主語と、S63で取り出した目的語「スキーウェア」に等しい目的語候補とからなる組を目的語候補記憶部15から検索する(S77)。
目的語候補記憶部15にその組があった場合は、その組を目的語候補記憶部15から削除する(S79)。
S63で入力したメタデータから述語「クリーニングする」を取り出す(S80)。そして、図12に示すように、S65で取り出した主語「B店」、S80で取り出した述語「クリーニングする」、S63で取り出した目的語に等しい目的語概念「スキーウェア」からなるメタデータを生成し(S81)、メタデータ記憶部13に記憶させる(S83)。
また、メタデータ生成部16は、S69で読み出したメタデータ制約定義から主語概念「クリーニング店」を取り出し(S85)、この主語概念、S63で取り出した述語並びにS63で取り出した目的語に等しい目的語概念からなるメタデータ制約定義がメタデータ制約定義記憶部14になければ、図13に示すように、S65で取り出した主語概念「クリーニング店」、S80で取り出した述語「クリーニングする」、S63で取り出した目的語に等しい目的語概念「スキーウェア」からなるメタデータ制約定義を生成し(S87)、これをメタデータ制約定義記憶部14に記憶させる(S89)。
以上のように、本実施の形態のメタデータ生成装置は、主語、述語及び目的語からなるメタデータと、語と該語の概念である語概念とからなるメタデータとを記憶するメタデータ記憶手段(13)と、主語の概念である主語概念と当該主語に対応する述語及び目的語の概念である目的語概念からなるメタデータ制約定義を記憶するメタデータ制約定義記憶手段(14)を備え、主語概念及び主語を含む文書を入力し(S1)、該文書から主語概念を取り出し(S3)、この主語概念を含むメタデータ制約定義を前記メタデータ制約定義記憶手段から検索し(S5)、当該検索されたメタデータ制約定義から目的語概念を取り出し(S11)、該取り出した目的語概念に等しい語概念を含むメタデータを前記メタデータ記憶手段(13)から検索し(S13)、該メタデータから語を取り出し(S17)、該語を前記文書から検索し(S21)、当該語が当該文書にあった場合に、当該文書から主語を取り出し(S25)、当該検索されたメタデータ制約定義から述語を取り出し(S27)、文書から取り出した当該主語、検索されたメタデータ制約定義から取り出した当該述語、並びに、メタデータから取り出した当該語に等しい目的語からなるメタデータを生成する(S28)ので、実存するデータを基にメタデータを自動的に生成することができる。
また、メタデータから取り出した前記目的語が前記文書においてどのように配置されているかを調べ(S31)、当該目的語と同様に配置されている語を前記文書から取り出し、文書から取り出した前記主語、検索されたメタデータ制約定義から取り出した前記述語、並びに、文書から取り出した当該語に等しい目的語からなるメタデータを生成する(S37)ことで、実存するデータを基にさらに多くのメタデータを自動的に生成できるようになる。
また、文書から取り出した前記主語概念、検索されたメタデータ制約定義から取り出した前記述語、並びに、文書から取り出した語に等しい前記目的語概念からなるメタデータ制約定義が前記メタデータ制約定義記憶手段にない場合に、当該メタデータ制約定義を生成して(S41)、当該メタデータ制約定義記憶手段に記憶させることで、実存するデータを基にしたメタデータ生成に必要なメタデータ制約定義を生成することができるようになる。
また、文書から取り出した前記語でない語を文書から取り出し(S51)、該語を目的語候補とし、文書から取り出した前記主語と当該目的語候補の組を記憶しておき(S57)、主語、述語及び目的語からなるメタデータを入力し(S61)、該メタデータから目的語を取り出し(S63)、該目的語に等しい目的語概念を含むメタデータ制約定義がメタデータ制約定義記憶手段にない場合は(S64)、入力した前記メタデータから主語を取り出し(S65)、当該主語に等しい語を含むメタデータをメタデータ記憶手段から検索し(S67)、検索されたメタデータから語概念を取り出し(S70)、該語概念を含むメタデータをメタデータ記憶手段から検索し(S71)、該メタデータから語を取り出し(S75)、該語に等しい主語と、入力されたメタデータから取り出した前記目的語に等しい目的語候補からなる組が記憶されている場合、当該組を削除し(S79)、入力されたメタデータから述語を取り出し(S80)、読み出したメタデータから取り出した語に等しい当該主語、入力されたメタデータから取り出した当該述語、並びに、入力されたメタデータから取り出した当該目的語に等しい目的語概念からなるメタデータを生成する(S81)ことで、実存するデータを基にさらに多くのメタデータを自動的に生成できるようになる。
また、読み出したメタデータから主語概念を取り出し(S65)、該主語概念、入力されたメタデータから取り出した前記述語、並びに、入力されたメタデータから取り出した目的語に等しい前記目的語概念からなるメタデータ制約定義が前記メタデータ制約定義記憶手段にない場合に、当該メタデータ制約定義を生成して(S87)、当該メタデータ制約定義記憶手段に記憶させる(S89)ことで、実存するデータを基にしたメタデータ生成に必要なメタデータ制約定義をさらに多く生成することができるようになる。
なお、文書記憶部11、文書解析部12、メタデータ記憶部13、メタデータ制約定義記憶部14、目的語候補記憶部15のいずれか1以上を別の装置に設け、その装置と通信することで情報のやりとりを行ってもよい。
また、上記説明したメタデータ生成装置が行う方法(メタデータ生成方法)を当該装置1に実行させるコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に格納したり、インターネットなどの通信網を介して伝送させて、広く流通させることができる。
本発明の実施の形態に係るメタデータ生成装置の構成を示すブロック図である。 文書記憶部11に記憶された文書の中の文書111の構成を示す図である。 メタデータ制約定義記憶部14に記憶されたメタデータ制約定義を示す図である。 メタデータ記憶部13に記憶されたメタデータを示す図である。 メタデータ生成装置1の第1のシーケンス図である。 S28で生成されたメタデータを示す図である。 メタデータ生成装置1の第2のシーケンス図である。 S37で生成されたメタデータを示す図である。 S41で生成されたメタデータ制約定義を示す図である。 S55で生成された主語と目的語候補の組を示す図である。 メタデータ生成装置1の第3のシーケンス図である。 S61で生成されたメタデータを示す図である。 S87で生成されたメタデータ制約定義を示す図である。
符号の説明
1…メタデータ生成装置
2…ユーザ装置
11…文書記憶部
12…文書解析部
13…メタデータ記憶部
14…メタデータ制約定義記憶部
15…目的語候補記憶部
16…メタデータ生成部
111…文書

Claims (12)

  1. 主語、述語及び目的語からなるメタデータを生成するメタデータ生成装置であって、
    主語、述語及び目的語からなるメタデータと、語と該語の概念である語概念とからなるメタデータとを記憶するメタデータ記憶手段と、主語の概念である主語概念と当該主語に対応する述語及び目的語の概念である目的語概念からなるメタデータ制約定義を記憶するメタデータ制約定義記憶手段が前記メタデータ生成装置または他の装置に設けられ、
    前記メタデータ生成装置は、
    主語概念及び主語を含む文書を入力し、該文書から主語概念を取り出し、この主語概念を含むメタデータ制約定義を前記メタデータ制約定義記憶手段から検索し、当該検索されたメタデータ制約定義から目的語概念を取り出し、該取り出した目的語概念に等しい語概念を含むメタデータを前記メタデータ記憶手段から検索し、該メタデータから語を取り出し、該語を前記文書から検索し、当該語が当該文書にあった場合に、文書から取り出した主語、検索されたメタデータ制約定義から取り出した述語、並びに、メタデータから取り出した当該語に等しい目的語からなるメタデータを生成することを特徴とするメタデータ生成装置。
  2. メタデータから取り出した前記目的語が前記文書においてどのように配置されているかを調べ、当該目的語と同様に配置されている語を前記文書から取り出し、文書から取り出した前記主語、検索されたメタデータ制約定義から取り出した前記述語、並びに、文書から取り出した当該語に等しい目的語からなるメタデータを生成することを特徴とする請求項1記載のメタデータ生成装置。
  3. 文書から取り出した前記主語概念、検索されたメタデータ制約定義から取り出した前記述語、並びに、文書から取り出した前記語に等しい目的語概念からなるメタデータ制約定義が前記メタデータ制約定義記憶手段にない場合に、当該メタデータ制約定義を生成して、当該メタデータ制約定義記憶手段に記憶させることを特徴とする請求項2記載のメタデータ生成装置。
  4. 文書から取り出した前記語でない語を文書から取り出し、該語を目的語候補とし、文書から取り出した前記主語と当該目的語候補の組を予め設けられた目的語候補記憶手段に記憶しておき、主語、述語及び目的語からなるメタデータを入力し、該メタデータから目的語を取り出し、該目的語に等しい目的語概念を含むメタデータ制約定義がメタデータ制約定義記憶手段にない場合は、入力した前記メタデータから主語を取り出し、当該主語に等しい語を含むメタデータをメタデータ記憶手段から検索し、検索されたメタデータから語概念を取り出し、該語概念を含むメタデータをメタデータ記憶手段から検索し、該メタデータから語を取り出し、該語に等しい主語と、入力されたメタデータから取り出した前記目的語に等しい目的語候補からなる組が前記目的語候補記憶手段に記憶されている場合、当該組を削除し、入力されたメタデータから述語を取り出し、読み出したメタデータから取り出した語に等しい当該主語、入力されたメタデータから取り出した当該述語、並びに、入力されたメタデータから取り出した当該目的語に等しい目的語概念からなるメタデータを生成することを特徴とする請求項2または3記載のメタデータ生成装置。
  5. 読み出したメタデータから主語概念を取り出し、該主語概念、入力されたメタデータから取り出した前記述語、並びに、入力されたメタデータから取り出した目的語に等しい前記目的語概念からなるメタデータ制約定義が前記メタデータ制約定義記憶手段にない場合に、当該メタデータ制約定義を生成して、当該メタデータ制約定義記憶手段に記憶させることを特徴とする請求項4記載のメタデータ生成装置。
  6. 主語、述語及び目的語からなるメタデータを生成するメタデータ生成装置が行うメタデータ生成方法であって、
    主語、述語及び目的語からなるメタデータと、語と該語の概念である語概念とからなるメタデータとを記憶するメタデータ記憶手段と、主語の概念である主語概念と当該主語に対応する述語及び目的語の概念である目的語概念からなるメタデータ制約定義を記憶するメタデータ制約定義記憶手段が前記メタデータ生成装置または他の装置に設けられ、
    前記メタデータ生成方法は、
    主語概念及び主語を含む文書を入力し、該文書から主語概念を取り出し、この主語概念を含むメタデータ制約定義を前記メタデータ制約定義記憶手段から検索し、当該検索されたメタデータ制約定義から目的語概念を取り出し、該取り出した目的語概念に等しい語概念を含むメタデータを前記メタデータ記憶手段から検索し、該メタデータから語を取り出し、該語を前記文書から検索し、当該語が当該文書にあった場合に、文書から取り出した主語、検索されたメタデータ制約定義から取り出した述語、並びに、メタデータから取り出した当該語に等しい目的語からなるメタデータを生成することを特徴とするメタデータ生成方法。
  7. メタデータから取り出した前記目的語が前記文書においてどのように配置されているかを調べ、当該目的語と同様に配置されている語を前記文書から取り出し、文書から取り出した前記主語、検索されたメタデータ制約定義から取り出した前記述語、並びに、文書から取り出した当該語に等しい目的語からなるメタデータを生成することを特徴とする請求項6記載のメタデータ生成方法。
  8. 文書から取り出した前記主語概念、検索されたメタデータ制約定義から取り出した前記述語、並びに、文書から取り出した前記語に等しい目的語概念からなるメタデータ制約定義が前記メタデータ制約定義記憶手段にない場合に、当該メタデータ制約定義を生成して、当該メタデータ制約定義記憶手段に記憶させることを特徴とする請求項7記載のメタデータ生成方法。
  9. 文書から取り出した前記語でない語を文書から取り出し、該語を目的語候補とし、文書から取り出した前記主語と当該目的語候補の組を予め設けられた目的語候補記憶手段に記憶しておき、主語、述語及び目的語からなるメタデータを入力し、該メタデータから目的語を取り出し、該目的語に等しい目的語概念を含むメタデータ制約定義がメタデータ制約定義記憶手段にない場合は、入力した前記メタデータから主語を取り出し、当該主語に等しい語を含むメタデータをメタデータ記憶手段から検索し、検索されたメタデータから語概念を取り出し、該語概念を含むメタデータをメタデータ記憶手段から検索し、該メタデータから語を取り出し、該語に等しい主語と、入力されたメタデータから取り出した前記目的語に等しい目的語候補からなる組が前記目的語候補記憶手段に記憶されている場合、当該組を削除し、入力されたメタデータから述語を取り出し、読み出したメタデータから取り出した語に等しい当該主語、入力されたメタデータから取り出した当該述語、並びに、入力されたメタデータから取り出した当該目的語に等しい目的語概念からなるメタデータを生成することを特徴とする請求項7または8記載のメタデータ生成方法。
  10. 読み出したメタデータから主語概念を取り出し、該主語概念、入力されたメタデータから取り出した前記述語、並びに、入力されたメタデータから取り出した目的語に等しい前記目的語概念からなるメタデータ制約定義が前記メタデータ制約定義記憶手段にない場合に、当該メタデータ制約定義を生成して、当該メタデータ制約定義記憶手段に記憶させることを特徴とする請求項9記載のメタデータ生成方法。
  11. 請求項6乃至10のいずれかに記載のメタデータ生成方法をコンピュータにより実行させるコンピュータプログラム。
  12. 請求項6乃至10のいずれかに記載のメタデータ生成方法をコンピュータにより実行させるコンピュータプログラムが格納された記録媒体。
JP2004067417A 2004-03-10 2004-03-10 メタデータ生成装置 Expired - Fee Related JP4242794B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004067417A JP4242794B2 (ja) 2004-03-10 2004-03-10 メタデータ生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004067417A JP4242794B2 (ja) 2004-03-10 2004-03-10 メタデータ生成装置

Publications (2)

Publication Number Publication Date
JP2005258659A JP2005258659A (ja) 2005-09-22
JP4242794B2 true JP4242794B2 (ja) 2009-03-25

Family

ID=35084332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004067417A Expired - Fee Related JP4242794B2 (ja) 2004-03-10 2004-03-10 メタデータ生成装置

Country Status (1)

Country Link
JP (1) JP4242794B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9330175B2 (en) 2004-11-12 2016-05-03 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
JP2008538016A (ja) 2004-11-12 2008-10-02 メイク センス インコーポレイテッド 概念または項目を用いて知識相関を構成することによる知識発見技術
US8126890B2 (en) 2004-12-21 2012-02-28 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US8898134B2 (en) 2005-06-27 2014-11-25 Make Sence, Inc. Method for ranking resources using node pool
US8140559B2 (en) 2005-06-27 2012-03-20 Make Sence, Inc. Knowledge correlation search engine
US8024653B2 (en) 2005-11-14 2011-09-20 Make Sence, Inc. Techniques for creating computer generated notes
WO2007061451A1 (en) * 2005-11-14 2007-05-31 Make Sence, Inc. A knowledge correlation search engine
JP4709671B2 (ja) * 2006-03-20 2011-06-22 日本放送協会 知識メタデータ生成装置及び知識メタデータ生成プログラム
US8244769B2 (en) * 2007-05-31 2012-08-14 Nec Corporation System and method for judging properties of an ontology and updating same
JP6557959B2 (ja) 2014-10-30 2019-08-14 富士通株式会社 情報提示プログラム、情報提示方法及び情報提示装置
JP7124961B2 (ja) * 2019-05-09 2022-08-24 富士通株式会社 情報処理装置、情報処理システムおよび情報処理プログラム

Also Published As

Publication number Publication date
JP2005258659A (ja) 2005-09-22

Similar Documents

Publication Publication Date Title
US11556697B2 (en) Intelligent text annotation
CN1815477B (zh) 用于提供基于标记语言的限定词的方法和系统
US6823325B1 (en) Methods and apparatus for storing and retrieving knowledge
US20050060306A1 (en) Apparatus, method, and program for retrieving structured documents
US8560518B2 (en) Method and apparatus for building sales tools by mining data from websites
US9323834B2 (en) Semantic and contextual searching of knowledge repositories
KR101523450B1 (ko) 관련어 등록 장치, 관련어 등록 방법, 기록 매체 및, 관련어 등록 시스템
JP4242794B2 (ja) メタデータ生成装置
JP5237353B2 (ja) 検索装置、検索システム、検索方法、検索プログラム、及び検索プログラムを記憶するコンピュータ読取可能な記録媒体
CN116955674B (zh) 一种通过LLM生成图数据库语句的方法及web装置
US20150106376A1 (en) Document tagging and retrieval using entity specifiers
Tran et al. V-first: A flexible interactive retrieval system for video at vbs 2022
US20110270862A1 (en) Information processing apparatus and information processing method
JP4010058B2 (ja) 文書関連付け装置、文書閲覧装置、文書関連付けプログラムを記録したコンピュータ読み取り可能な記録媒体及び文書閲覧プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2021064143A (ja) 文作成装置、文作成方法および文作成プログラム
Hoang-Xuan et al. V-first 2.0: video event retrieval with flexible textual-visual intermediary for VBS 2023
KR100433584B1 (ko) 온토로지와 규칙정보를 이용한, 인터넷 쇼핑몰 상품에관한 상세 정보 추출 방법
Phueaksri et al. Towards captioning an image collection from a combined scene graph representation approach
JP2002297662A (ja) 構造化文書編集方法および構造化文書編集装置および端末装置およびプログラム
JP4413796B2 (ja) 一覧情報生成システムおよび方法、プログラム
Yamamoto et al. An editable browser for reranking web search results
Makineni et al. Vijjana: A collaborative agent model for creating a knowledge advantage machine
Loskyll et al. UbisEditor 3.0: Collaborative ontology development on the Web
JP2006172029A (ja) 検索結果提示方法
JP2005018172A (ja) 情報コンテンツ作成方法、情報コンテンツ作成プログラムおよび情報コンテンツ作成プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050711

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080909

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081225

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130109

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees