JP2010134844A - フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2010134844A
JP2010134844A JP2008312322A JP2008312322A JP2010134844A JP 2010134844 A JP2010134844 A JP 2010134844A JP 2008312322 A JP2008312322 A JP 2008312322A JP 2008312322 A JP2008312322 A JP 2008312322A JP 2010134844 A JP2010134844 A JP 2010134844A
Authority
JP
Japan
Prior art keywords
relationship
phrase
instance
analysis
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008312322A
Other languages
English (en)
Other versions
JP5270324B2 (ja
Inventor
Makoto Nakatsuji
真 中辻
Akimichi Tanaka
明通 田中
Masashi Uchiyama
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008312322A priority Critical patent/JP5270324B2/ja
Publication of JP2010134844A publication Critical patent/JP2010134844A/ja
Application granted granted Critical
Publication of JP5270324B2 publication Critical patent/JP5270324B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】所定のインスタンスとの関係がオントロジ上での特定の関係に該当するフレーズを、入力された解析対象記事から抽出するに際して、該抽出に係る再現率および適合率の向上が図られるようにする。
【解決手段】関係解析部10によって、所定のインスタンスとの関係がオントロジ上での特定の関係に該当するフレーズを解析対象記事から抽出すると共に、間接的関係解析部20によって、所定のインスタンスとの関係がオントロジ上での特定の間接的関係に該当する間接的関係フレーズを解析対象記事から抽出する。
【選択図】 図1

Description

本発明は、ブログや新聞などの文書集合を対象として、該文書集合中からオントロジによって規定される或るインスタンスと関係があるフレーズを抽出して解析するに有効なフレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
近年、ブログや新聞などの文書集合を対象として、該文書集合中から特定のフレーズを自動的に抽出して解析する技術が進展しつつある。
例えば、文章内に現れる「は」や「が」などの助詞や接続詞の位置や、フレーズの出現順序を考慮し、経験的に関係を解析するのに良いとされる「Centering Theory」を用い、センテンス内のみならず、センテンスを跨った場合にも有効な、フレーズ間の関係解析を行う手法なども提案されている(非特許文献1参照)。
また、オントロジ上で定義される各クラス内のインスタンスに対し関係を持つ感性語の解析を行う手法が提案されている(非特許文献2参照)。
この方法では、まずクラスごとに関係を持つ可能性のあるフレーズ集合を抽出し、その上で各クラスに属するインスタンスと関係するフレーズを、インスタンスの出現する文書を解析することによって抽出する。
title: Detecting Semantic Relations between Named Entities in Text Using Contextual Features authors: Hirano, Toru, Matsumoto,Yoshihiko, Kikui,Genichiro venue: ACL-Demos title: 話題対象のクラス知識を活用したCGMからの感性解析技術authors: 中辻 真, 吉田 誠, 平野 美貴venue: DBSJ Letters Vol.6,No.1year: 2007
しかしながら、非特許文献1に開示の技術では、フレーズの属するドメインが何れかといった視点や、そのドメインにおいてフレーズがどのようなクラスに所属するかといったオントロジにおけるような視点を持たず、そのフレーズと関係すると思われる他のフレーズを入力された文章から自動抽出するのみである。
また、文書中でクラスとインスタンスとが入り混じって記述されている場合には、この技術では、或るフレーズが複数のインスタンスと入り混じった関係を持つと解析されてしまう。
一方、非特許文献2に開示の技術では、複数のインスタンスが同じ記事の中に出現した場合、所定のフレーズに対し何れのインスタンスが紐付けされるかを解析するものではない。
また、オントロジ上で関係を持つと定義されるインスタンス関係を利用した間接的関係を有するフレーズまで抽出の対象とするといった視点は開示されていない。
さらに、クラス間の関係によるインスタンスの特定の組み合わせに関しオントロジ上で規定される特定の解析の観点に基づいて該観点に係るインスタンスの組合せに該当するフレーズを識別しようといった発展的な解析手法については特段の論及がない。
上述のような状況にあるため、何れの先行技術文献所載の技術についても、或るインスタンスとオントロジ上での特定の関係を有するフレーズの抽出に関し、再現率および適合率の更なる向上が待たれる。
本発明はこのような状況に鑑みてなされたものであり、所定のクラスまたはインスタンスとの関係がオントロジ上での特定の関係に該当するフレーズを、入力された解析対象記事から抽出するに際して、該抽出に係る再現率および適合率の向上が図られるフレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体を提供することを目的とする。
上記課題を解決するべく、本願では次に列記するような技術を提案する。
(1)所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析部と、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析部と、
を含んで構成されていることを特徴とするフレーズ間関係解析装置。
上記(1)のフレーズ間関係解析装置では、所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報が適宜の記憶手段等において保持され、入力された解析対象記事について、所定のクラスまたはインスタンスとの関係が前記保持されている特定の関係に該当するフレーズの抽出処理が関係解析部において実行される。
また、前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、前記解析対象記事から間接的関係フレーズとして抽出する処理が間接的関係解析部において実行される。
関係解析部および間接的関係解析部において上述のように各該当するフレーズの抽出が行われることによって、フレーズの抽出に係る再現率および適合率の向上が図られる。
(2)前記クラス間の関係によるインスタンスの特定の組み合わせに関しオントロジ上で規定される特定の解析の観点を表す観点特定情報を保持し、該特定の解析の観点に係るインスタンスの組合せに該当するフレーズを識別するクラス間観点解析部を更に備えていることを特徴とする(1)のフレーズ間関係解析装置。
上記(2)のフレーズ間関係解析装置では(1)のフレーズ間関係解析装置において特に、フレーズ間関係解析装置によって、前記クラス間の関係によるインスタンスの特定の組み合わせに関しオントロジ上で規定される特定の解析の観点を表す観点特定情報が保持され、該特定の解析の観点に係るインスタンスの組合せに該当するフレーズが識別される。
(3)所定の定義によるインスタンス間の特定の関係を表すインスタンス関係情報を保持し、該インスタンス間の特定の関係と前記解析対象記事内のインスタンスとの比較に基づいて前記解析対象記事において欠損しているインスタンスを類推するインスタンス類推部を更に備えていることを特徴とする(1)のフレーズ間関係解析装置。
上記(3)のフレーズ間関係解析装置では(1)のフレーズ間関係解析装置において特に、インスタンス類推部によって、所定の定義によるインスタンス間の特定の関係を表すインスタンス関係情報が保持され、該インスタンス間の特定の関係と前記解析対象記事内のインスタンスとの比較に基づいて前記解析対象記事において欠損しているインスタンスが類推される。
(4)前記関係解析部は、
外部から供給される記事集合からフレーズ間の関係を解析する対象とする解析対象記事を抽出する解析対象記事抽出部と、
所定のドメインにおけるクラスと該クラスに属するインスタンスとのオントロジ上での特定の関係に該当する各インスタンスを、それらの所属クラスを表す所属クラス情報をそれぞれ伴なう該当インスタンスとして、これら該当インスタンスの集合である該当インスタンス集合を得るインスタンス関係解析部と、
前記解析対象記事抽出部で抽出された解析対象記事から所定のインスタンスとの関係が前記特定の関係に該当するフレーズを抽出する関係フレーズ集合取得部と、
を含んで構成されていることを特徴とする(1)、(2)、および、(3)の何れか一のフレーズ間関係解析装置。
上記(4)のフレーズ間関係解析装置では、(1)、(2)、および、(3)の何れか一のフレーズ間関係解析装置において特に、前記関係解析部が、外部から供給される記事集合からフレーズ間の関係を解析する対象とする解析対象記事を抽出する解析対象記事抽出部と、所定のドメインにおけるクラスと該クラスに属するインスタンスとのオントロジ上での特定の関係に該当する各インスタンスをそれらの所属クラスを表す所属クラス情報をそれぞれ伴なう該当インスタンスとしてこれら該当インスタンスの集合である該当インスタンス集合を得るインスタンス関係解析部と、前記解析対象記事抽出部で抽出された解析対象記事から所定のインスタンスとの関係が前記特定の関係に該当するフレーズを抽出する関係フレーズ集合取得部と、を含んで構成されている。
前記インスタンス関係解析部によって、所定のドメインにおけるクラスと該クラスに属するインスタンスとのオントロジ上での特定の関係に各該当し所属クラス情報をそれぞれ伴なう各該当インスタンスの集合である該当インスタンス集合が取得される。
更に、関係フレーズ集合取得部によって、所定のインスタンスとの関係が前記特定の関係に該当するフレーズが前記解析対象記事抽出部で抽出された解析対象記事から抽出される。
(5)前記間接的関係解析部は、所定のクラスまたはインスタンスとオントロジ上での所定の関係を有するインスタンスの集合のうち前記所定のクラスまたはインスタンスに所定の影響を与える影響インスタンスによる影響インスタンス集合を識別し該識別された影響インスタンス集合のうち前記所定のクラスまたはインスタンスと同じ記事中に出現する影響インスタンス集合を抽出し、該影響インスタンス集合に紐付けられた間接的関係フレーズ集合を抽出することを特徴とする(1)、(2)、および、(3)の何れか一のフレーズ間関係解析装置。
上記(5)のフレーズ間関係解析装置では、(1)、(2)、および、(3)の何れか一のフレーズ間関係解析装置において特に、前記間接的関係解析部によって、所定のクラスまたはインスタンスとオントロジ上での所定の関係を有するインスタンスの集合のうち前記所定のクラスまたはインスタンスに所定の影響を与える影響インスタンスによる影響インスタンス集合が識別が識別される。
更に、該識別された影響インスタンス集合のうち前記所定のクラスまたはインスタンスと同じ記事中に出現する影響インスタンス集合が抽出され、該影響インスタンス集合に紐付けられた間接的関係フレーズ集合が取得される。
(6)前記関係フレーズ集合取得部は、前記特定の関係に該当するフレーズを抽出するに際し前記所定のインスタンスと該抽出の対象とする各フレーズとの関係の近さを表すスコアが付随するようにして抽出し、該抽出された各フレーズのうち付随するスコアに基づいて最も関係が近いと判定されるフレーズを前記所定のインスタンスと紐付けることを特徴とする(4)のフレーズ間関係解析装置。
上記(6)のフレーズ間関係解析装置では、(4)のフレーズ間関係解析装置において特に、前記関係フレーズ集合取得部によって、前記特定の関係に該当するフレーズを抽出するに際し前記所定のインスタンスと該抽出の対象とする各フレーズとの関係の近さを表すスコアが付随するようにして抽出し、該抽出された各フレーズのうち付随するスコアに基づいて最も関係が近いと判定されるフレーズが前記所定のインスタンスと紐付けられる。
(7)所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析ステップと、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを間接的関係フレーズとして前記解析対象記事から抽出する間接的関係解析ステップと、
を含むことを特徴とするフレーズ間関係解析方法。
上記(7)のフレーズ間関係解析方法では、
所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報が適宜の記憶手段等において保持され、入力された解析対象記事について、所定のクラスまたはインスタンスとの関係が前記保持されている特定の関係に該当するフレーズの抽出処理が関係解析部ステップおいて実行される。
また、前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、前記解析対象記事から間接的関係フレーズとして抽出する処理が間接的関係解析ステップにおいて実行される。
関係解析ステップおよび間接的関係解析ステップにおいて上述のように各該当するフレーズの抽出が行われることによって、フレーズの抽出に係る再現率および適合率の向上が図られる。
(8)コンピュータに、
所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析手順と、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析手順と、
を含む手順を実行させるためのフレーズ間関係解析プログラム。
上記(8)フレーズ間関係解析プログラムがコンピュータに適用されることによって、該コンピュータは、
所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析手順と、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析手順と、
を実行する。
(9)コンピュータに、所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析手順と、前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析手順と、を含む手順を実行させるためのフレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体。
上記(9)のフレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体に記録されたフレーズ間関係解析プログラムがコンピュータに適用されることによって、該コンピュータは、
所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析手順と、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析手順と、
を実行する。
本発明によれば、所定のクラスまたはインスタンスとの関係がオントロジ上での特定の関係に該当するフレーズを、入力された解析対象記事から抽出するに際して、該抽出に係る再現率および適合率の向上が図られるフレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体が実現される。
以下、図面を参照して本発明の実施の形態について詳述することにより本発明を明らかにする。
先ず、図1を参照して本発明の実施の形態としてのフレーズ間関係解析装置の構成を概観し、次いで、このフレーズ間関係解析装置1によるフレーズ間関係解析について図2乃至図6を参照しつつ説明し、更に、図1に戻って上記構成について詳述する。
(本発明の実施の形態としてのフレーズ間関係解析装置の概要)
図1は、本発明の一つの実施の形態としてのフレーズ間関係解析装置の構成を表す機能ブロック図である。
図1において、本発明の実施の形態としてのフレーズ間関係解析装置1は、後述する関係解析部10、間接的関係解析部20、クラス間観点解析部30、インスタンス類推部40、入力部50、出力部60、操作部70、データベース80が、バス91を通してシステム管理部90に接続されている。
システム管理部90は上述の各部およびデータベースを含む系全体を統括的に管理して、上述の各個の機能部が十全にそれらの所定の機能を果たすように、動作のタイミングとデータの授受を行い得るように管理する。
従って、関係解析部10、間接的関係解析部20、クラス間観点解析部30、インスタンス類推部40も、それら各部がシステム管理部90の管理下で本来の機能を果たすものであり、一点鎖線による枠線の部分は敢えて各部の機能が端的に理解され易いように描いたものである。
(フレーズ間の関係解析について)
次に、本発明の実施の形態としてのフレーズ間関係解析装置1の各部について詳細に説明する前に、本発明を適用して行うフレーズ間の関係解析について説明する。
(オントロジを利用した高精度なフレーズ間の関係解析)
先ず、或るドメインで重要な意味を持つ概念であるクラスと、その概念の例示であるインスタンス、および、クラス間のオントロジ上での関係を予め整理して、オントロジ上での或る特定の関係を定義しておく。
このような定義を行う過程においては、クラスおよびインスタンスに該当するそれぞれの事象に係るメタデータを用いて関係の整理を行うなどして作業が進められる。
次いで、ブログや新聞などの文書集合に対して、或る文書の中でインスタンスが記述されている場合、その記述の中で、インスタンスと上記定義された特定の関係を持つフレーズを検索すると、オントロジ上で関係を定義しない従来の方法におけるよりも高い再現率および適合率で意図したフレーズの検索を行うことができる。
また、オントロジ上での関係において、インスタンスBがインスタンスAに影響を与えている関係にあるとき、インスタンスBに関係するフレーズをインスタンスAに間接的に関係するフレーズとして組み込むことによって再現率を向上させることが可能になる。
以上におけるインスタンスは、オントロジ上での特定の関係を規定するという観点からはインスタンスとして捉えられるが、文書集合の中では或るフレーズとして利用されるものである。
即ち、本発明の技術思想は、フレーズ間の関係解析のうち、特に、オントロジ上で定義されるインスタンスに焦点を当てたものであると見ることができる。
(クラス間の関係の観点から見た関係解析)
例えば、図2に示すように、あるクラスAと他のクラスBが関係を持つとき、クラスAに所属するインスタンスの観点に焦点を当て、他のクラスBに所属するインスタンスとの関係を解析することができる。
図3に上記の関係の一例が示されている。即ち、映画ドメインにおいては、映画タイトル、監督、および、役者が重要な概念である。
ここでクラス間の関係として、映画タイトルとそのタイトルの映画を作製した監督という関係(図3における"directed By"関係)と、映画タイトルとそのタイトルの映画に出演した役者という関係(図3における"actored By"関係)をオントロジ上での特定の関係として予め定義してあるものと仮定する。
この関係のインスタンスとしては、図4に例示されたように、映画タイトルAとそのタイトルの映画を作製した監督Aという関係(図4における"directed By"関係)と、映画タイトルAとそのタイトルAの映画に出演した役者Aという関係(図4における"actored By"関係)などが該当する。
更に、上述におけるようなインスタンスとして、第5図に示されたように、映画タイトルBとそのタイトルBの映画を作製した監督Bという関係(図5における"directed By"関係)や、タイトルBの映画に出演した役者Aという関係(図5における"actored By"関係)もオントロジ上での特定の関係として予め定義してあるものと仮定する。
以上の仮定の下では、「役者Aと或る映画タイトルAという関係」の観点から見た役者Aと関係を持つフレーズと、「役者Aと或る映画タイトルBという関係」の観点から見た役者Aと関係を持つフレーズとを区分して解析することが可能である。
例えば、役者Aは或る映画タイトルBでは「渋い」という関係を持つが、他の映画タイトルAでは「コミカル」といった関係を持つといったように、タイトル毎に役者の特性を細かく分析することが可能である。
更にまた、図6におけるように、映画タイトルCとそのタイトルCの映画を作製した監督という関係(図6における"directed By"関係)や、タイトルCの映画に出演した役者Aという関係(図6における"actored By"関係)もオントロジ上での特定の関係として予め定義してあるものと仮定する。
図4および図6の例に着目すると、「役者Aと監督A」という関係の観点で、映画タイトルAと映画タイトルCは同条件であり、当該組み合わせにおける役者Aや監督Aと関係をもつフレーズを詳細に解析することが可能である。
(フレーズ間関係解析装置の構成の詳細)
以下、図1に戻って、フレーズ間関係解析装置1の構成について詳述する。
関係解析部10は、所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する。
ここに解析対象記事は、例えば、本装置のユーザによる操作部70への操作に応じて入力部50から供給される。
関係解析部10は、解析対象記事抽出部111と、インスタンス関係解析部112と、関係フレーズ集合取得部113とを含んで構成されている。
関係解析部10におけるこれら各部のうち解析対象記事抽出部111は、上述のように、例えば、入力部50から供給される解析対象記事中の解析対象とする記事集合Eを表す情報を受けて、この記事集合Eからフレーズ間の関係を解析するために適用する解析対象記事Eiを抽出する。
また、インスタンス関係解析部112は、例えば、本装置のユーザによる操作部70への操作に応じて入力部50から供給される或るインスタンスIiを表す情報を受けて、このインスタンスIiとオントロジ上で関係するインスタンス集合Iを、このインスタンス集合Iに属する各インスタンスがその所属クラスを表す情報を伴なっている形で取得する。
上述における「オントロジ上で関係する」とは、既述の図4の例におけるような、映画タイトルA、監督A、および、役者Aの関係等である。
即ち、インスタンスIiを役者Aとすると、インスタンス集合Iは監督Aおよび映画タイトルAを含む。
尚、映画タイトルAは、図3の例における映画タイトルというクラスに属し、映画タイトルというクラスは監督というクラスや役者というクラスとdirected Byやactored Byという関係で紐付けられている。
この「関係」のインスタンスが、図4に例示されたような監督A、タイトルA、役者Aの関係である。
更に、関係フレーズ集合取得部113は、解析対象記事抽出部111で抽出された解析対象記事Eiを解析して、或るインスタンスIiに関係するフレーズを抽出し、フレーズ集合F(Ii)を得る。
更に、インスタンスIiと最も近い関係にあるフレーズfiを抽出して両者を関連付ける(紐付ける)。
次に、フローチャートを伴なって関係フレーズ集合取得部113の動作について更に説明する。
図7は、関係解析部10の関係フレーズ集合取得部113の動作を説明するためのフローチャートである。関係フレーズ集合取得部113は関係解析部10における出力を得るための枢要な機能部である。
関係フレーズ集合取得部113では、先ず、処理の繰り返し回数の計数値を0にしておき(ステップS701)、次いで、解析対象記事抽出部111で抽出された解析対象記事Eiについて、インスタンスIiに関係する関係フレーズf(Ii)を、関係の近さを表すスコアS(Ii)を伴なって抽出し、該抽出された関係フレーズf(Ii)による関係フレーズ集合F(Ii)を得る(ステップS702)。
既述のシステム管理部90の管理下で、インスタンス集合Iに含まれている全インスタンス(ここでは全数をmとする)に対し、ステップS701の処理を繰り返し実行する(ステップS702〜ステップS704)。
ステップS702〜ステップS704によって、インスタンスに関係する各フレーズf(Ii)がその関係の近さを表す各スコアS(Ii)を伴なって抽出される。
次いで、ステップS702〜ステップS704によって抽出された各関係フレーズf(Ii)によるフレーズ集合Fの各フレーズf付随するスコアS(Ii)の値を相互に比較して、スコア値が最大であるフレーズfiを探索する(ステップS705)。
ステップS705の処理において、(ユーザによって特定された)或るインスタンスIi、フレーズfi、インスタンス集合I、上記インスタンスIiに関係する関係フレーズf(Ii)の関係の近さを表すスコアをスコアS(Ii)と表記する。
そして、インスタンス集合I内のインスタンスIi内でIiに関係する関係フレーズf(Ii)と関係をもつインスタンス集合I(f(Ii))、および、インスタンス集合I(f(Ii))内の各インスタンスとf(Ii)との関係の近さを表すスコアS(I(f(Ii)))が供給されると、上記スコアS(Ii)と比較される。
スコアS(Ii)とスコアS(I(f(Ii)))との比較判定の結果、スコアS(Ii)が最も大きいときのインスタンスIiとフレーズfiとを紐付ける(ステップS706)。
以上、関係解析部10の構成および作用について説明したが、このフレーズ間関係解析操作1は、更に、間接的関係解析部20を含んで構成されている。
間接的関係解析部20は所定のクラスまたはインスタンスとの関係がオントロジ上で既述の特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、解析対象記事から抽出する。
従って、間接的関係解析部20の構成は、外部から供給される記事集合からフレーズ間の関係を解析する対象とする解析対象記事を抽出する解析対象記事抽出部については、既述の関係解析部10における解析対象記事抽出部111が利用され得る。
また、所定のドメインにおけるクラスと該クラスに属するインスタンスとのオントロジ上での特定の関係に該当する各インスタンスを、それらの所属クラスを表す所属クラス情報をそれぞれ伴なう該当インスタンスとして、これら該当インスタンスの集合である該当インスタンス集合を得るインスタンス関係解析部についても、既述の関係解析部10におけるインスタンス関係解析部112が利用され得る。
尚、上述におけるような解析対象記事抽出部111およびインスタンス関係解析部112を間接的関係解析部20にも共用する機能は、システム管理部90がこれら各部の動作を管理することによって実現される。
一方、間接的関係解析部20の枢要な機能部としての間接的関係フレーズ集合取得部121については、既述の関係解析部10における関係フレーズ集合取得部113とは異なる特徴的機能を有する。
即ち、上述のような特定のインスタンスIi、および、このインスタンスIiとオントロジ上で関係するインスタンス集合Iが供給されると、このインスタンスIiとインスタンス集合Iとの関係を解析し、該解析された関係に間接的に該当するフレーズを抽出して、これら間接的に関係するフレーズによる間接的関係フレーズ集合F(in)を得る。
このような間接的関係フレーズ集合取得部121の機能の詳細について、以下に、図8のフローチャートを参照して詳述する。
図8は、フレーズ間関係解析装置1における間接的関係解析部20の間接的関係フレーズ集合取得部121の動作を説明するためのフローチャートである。
上述のように例えばユーザによって選択された或る特定のインスタンスIiに関係するインスタンス集合の中で特に、図4乃至図6を参照して例示的に説明した“directed By”或いは“actored By”のような形でインスタンスIiに影響を与える影響インスタンス集合I(Ii)を抽出する(ステップS801)。
尚、インスタンスIiは、既述のように、システム管理部90の管理下で、この間接的関係フレーズ集合取得部121に供給される。
ステップS801の処理は、より具体的には例えば次のように示される。即ち、
(1)インスタンスIiが所属するクラスCとオントロジ上で関係しているクラスCRを抽出する。例えば、図3においてインスタンスIiがクラス映画タイトルに所属しているとすると、CRには、役者クラスと監督クラスが該当する。
(2)クラスCRの中のクラスに対しクラスCに影響を与える関係にある影響クラスCIを選択する。この選択作業はオントロジ上のクラス間の関係の定義を確認し、人手を介して行われ得る。図3の例では、監督や役者は映画タイトルを作製(directed By)したり、出演(actored By)したりという関係であるため、映画タイトルに影響を与える関係であるとも考えることができる。
(3)影響クラスCI内のクラスに含まれるインスタンスIiと関係のあるインスタンスを抽出する。図4において、インスタンスIiが映画タイトルAであるとすると、影響を与える関係のあるクラスに含まれインスタンスIiと関係するインスタンスは、監督Aと役者Aである。
(4)以上のようにして、影響インスタンス集合I(in)を出力する。
次いで、ステップS801で抽出された影響インスタンス集合I(Ii)の中で、インスタンスIiと同じ記事Ei内に出現するインスタンス集合I(in2)に関係があるとして紐付けられたフレーズ集合F(in2)を抽出する(ステップS802)。
ステップS802で抽出されたフレーズ集合F(in2)を間接的関係を有する間接的フレーズ集合としてインスタンスIiに紐付ける(ステップS803)。
尚、関係解析部10および間接的関係解析部20における上述の各処理において供給される処理対象とされるデータ、処理の中で基準として用いられるデータは、例えば、操作部70に対するユーザの操作に応じて、予め入力部50から入力されてデータベース80に格納され、システム管理部90による管理下で、所定のタイミングで処理に供される。
また、或る処理の実行、処理の繰り返しの起動や終了などに係る管理もシステム管理部90による管理下で所定の通りに実行される。
上記繰り返しの結果として、上述のインスタンスIiに関係付けられた関係フレーズ集合F(Ii)、および、上述のインスタンスIiに間接的に関係する間接的関係フレーズ集合F(in)がそれぞれ出力される。
それらの関係フレーズ集合F(Ii)および間接的関係フレーズ集合F(in)に各包摂されるフレーズは、各有限の発現回数を持つ。
システム管理部90による管理下で、繰り返された処理によって上述のインスタンスIiと所定回数α以上関係付けられたフレーズf、および、所定回数α以上間接的に関係付けられたフレーズfを、インスタンスIiに関係する関係フレーズ、および、インスタンスIiに間接的に関係する間接的関係フレーズとして識別し、上述のインスタンスIiに対する関係フレーズ集合F(Ii)および上述のインスタンスIiに対する間接的関係フレーズ集合F(Ii)として処理結果を得る。
更に、処理結果は、システム管理部90による管理下で、データベース80の所定領域に格納され、或いはまた、出力部60から出力される。
従って、このフレーズ間関係解析装置1によれば、オントロジにおける関係を利用せず且つ間接的関係にあるフレーズを抽出対象としない従来の技術に比し、再現率および適合率の高い分析が可能である。
一方、既述の通り、本実施の形態のフレーズ間関係解析装置1は、更に、クラス間観点解析部30を備えている。
このクラス間観点解析部30は、クラス間の関係によるインスタンスの特定の組み合わせに関しオントロジ上で規定される特定の解析の観点を表す観点特定情報を保持し、該特定の解析の観点に係るインスタンスの組合せに該当するフレーズを識別する該当フレーズ識別部131を備えている。
該当フレーズ識別部131で実行される処理は、概括的には、ユーザが解析を希望する観点となるインスタンスの組合せが供給されると、このインスタンスの組合せ、および、タクソノミ上のクラスに分類された解析対象記事のユーザIDを表す情報を受けて、当前記インスタンスの組合せに係るインスタンス関係に該当するフレーズを識別する処理である。
このような該当フレーズ識別部131の機能の詳細について、以下に、図9のフローチャートを参照して詳述する。
図9は、フレーズ間関係解析装置1におけるクラス間観点解析部30の該当フレーズ識別部131の動作を説明するためのフローチャートである。
先ず、ユーザが解析を希望する観点となる(ユーザが制約として与えたい)インスタンスの組合せ(関係)I(C)に関し、オントロジ上で規定される特定の解析の観点である観点特定情報を保持しておく(ステップS901)。
上記インスタンスの組合せ(関係)I(C)についてオントロジ上で当該指定による組合せ(関係)I(C)に該当するインスタンス関係を抽出し、この関係に該当するインスタンスによるインスタンス集合I(R)を得る(ステップS902)。
ステップS902の処理は、より具体的には例えば次のように示される。即ち、
(1)インスタンスの組合せ(関係)I(C)が所属するクラスCとオントロジ上で関係するクラスCRを抽出する。例えば図3においてインスタンスIiがクラス映画タイトルに所属しているとすると、クラスCRには役者クラスと監督クラスとが入る。
(2)クラスCRの中のクラスに対しクラスCに包含される関係にあるクラスCIを選択する。この選択作業はオントロジ上のクラス間の関係の定義を確認し、人手を介して行われ得る。例えば、図3の例では、監督や役者は映画タイトルを作製(directed By)したり、出演(actored By)したりという関係であるため、映画タイトルに影響を与える関係であるとも考えることができる。
(3)クラスCI内のクラスに含まれるインスタンスIiと関係のあるインスタンスを抽出する。図4において、インスタンスIiが映画タイトルAであるとすると、影響を与える関係のあるクラスに含まれインスタンスIiと関係するインスタンスは、監督Aと役者Aである。
(4)以上のようにして、インスタンス集合I(R)を出力する。
次いで、観点特定情報によるインスタンスの組合せ(関係)I(C)内のインスタンスIが、或る文書Ei内に同時に現れた場合に、同時にインスタンス集合I(R)内のインスタンスの記述が存在するかをチェックする。存在すれば、そのインスタンスをI(R2)とする(ステップS903)。
更に、既述のステップS701〜ステップS706と同様の手順で、インスタンスI(R2)内の各インスタンスに関係するフレーズを抽出する(ステップS904)。
ステップS904で抽出されたフレーズを、インスタンスの組合せ(関係)I(C)という観点に該当するインスタンス集合I(R)に関係するフレーズとして出力する。これらのフレーズは所属するクラス名をそれぞれ伴なって出力される(ステップS905)。
ステップS901〜ステップS905の手順により、例えば図2に示されたように、あるクラスAと他クラスBが関係を持つとき、クラスAに所属するインスタンスの観点に焦点を当て、他クラスBに所属するインスタンスとの関係を解析することができる。
以下、例示的に説明する。例えば、映画ドメインにおいては、映画タイトル、監督、および、役者が重要な概念である。
クラス間の関係として、映画タイトルとそのタイトルの映画を作製した監督という関係(図3における“directed By”関係)と、その映画タイトルとそのタイトルの映画に出演した役者という関係(図3における“actored By”関係)を予め規定していたとする。
また、その関係のインスタンスとしては、図4に示すように映画タイトルAとそのタイトルAの映画を作製した監督Aという関係や、その映画タイトルAとそのタイトルAの映画に出演した役者Aという関係などがある。
また、上述のようなインスタンスとして図5に示すように、映画タイトルBとそのタイトルBの映画を作製した監督Bという関係や、その映画タイトルBとそのタイトルBの映画に出演した役者Aという関係も予め規定されていたとする。
このような関係を踏まえ、解析すると、「役者Aと或るタイトルAという関係」の観点からみた役者Aと関係を持つフレーズと、「役者Aと或るタイトルBという関係」の観点からみた役者Aと関係を持つフレーズとを、別々に解析できる。
これにより、例えば、役者Aは或るタイトルBでは「渋い」という関係を持つが、タイトルAでは「コミカル」といった関係を持つといように、タイトル毎に役者の特性を細かく分析できる。
尚、上述のような特定のインスタンスIiと関係のあるインスタンスには、暗黙的に予想し得るインスタンスも含まれることは一つの留意点である。
本実施の形態としてのフレーズ間関係解析装置1では、このような点に着目して、インスタンス類推部40において、暗黙的に予想し得るインスタンスを得るようにしている。
インスタンス類推部40は、所定の定義によるインスタンス間の特定の関係を表すインスタンス関係情報を保持し、該インスタンス間の特定の関係と解析対象記事内のインスタンスとの比較に基づいてこの解析対象記事において欠損しているインスタンスを類推する。
インスタンス類推部40における上述のような暗黙的に予想し得るインスタンスの類推処理は、例えば感性解析エンジンとして構成され得るインスタンス類推処理部141において実行される。
上記に例示の感性解析エンジンにおける処理について、既述の図6の例に基づいて説明する。
図6の例では、ユーザが制約として与えたいインスタンスの組合せ(関係)I(C)が例えばインスタンス“役者A”のみから構成されていても、オントロジ上で“役者A”と関係のあるインスタンス“映画タイトルC”を経由して“役者A”は“役者B”や“監督A”とも関係を持つ。
図10は上述のインスタンス類推処理部141として適用可能な感性解析エンジンを表す概念図である。
この感性解析エンジン1000は、ドメイン判定部1001、ドメイン辞書作成部1002、関係判定部1003、関係比較部1004、フィルタリング・復元処理部1005、関係付け感性解析部1006、記憶部1007、および、インターフェース部1008がそれぞれシステムコントローラ1009と結ばれて構成されている。
上述の各部は、この感性解析エンジン1000の系全体を統括的に管理するシステムコントローラ1009の管理下で各所定の機能を営む。
ドメイン判定部1001は、図4乃至図6に例示されているような形で定義されるインスタンス間の関係を表す情報に依拠して、解析対象記事たるブログエントリの集合であるブログエントリ集合から、特定のドメイン(この例では映画ドメイン)の記事を抽出する。
この抽出では、例えば、概念検索とタクソノミによるフィルタリング処理が併用される。
ドメイン辞書作成部1002では、クラスおよびインスタンス毎に特徴的な辞書を作成する。このように作成された辞書は、例えば、記憶部1007に格納される。
関係判定部1003では、インスタンスと感性語との関係の判定が実行される。この判定にはタクソノミによるジャンル別特徴分析の手法が適用され得る。
関係比較部1004は、インスタンス間で感性語との関係の強さを比較する。
フィルタリング・復元処理部1005では、上述のような関係の定義を利用して、フレーズの抽出に関する適合率の向上を図ると共に、解析対象記事たるブログエントリの集合であるブログエントリ集合には明示的に含まれていない、謂わば隠れた関係にあるフレーズを復元する。
関係付け感性解析部1006では、上述のような関係の定義に基づいて、暗黙的な関係を構築する。
以上説明した本発明の技術は、図11に示すようなフレーズ間関係解析方法の技術として観念され得る。
図11は、本発明の実施の形態としてのフレーズ間関係解析方法を表す概念図である。
即ち、本発明の実施の形態としてのフレーズ間関係解析方法1100は、所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを入力された解析対象記事から抽出する関係解析ステップ(ステップS1101)と、前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを間接的関係フレーズとして前記解析対象記事から抽出する間接的関係解析ステップ(ステップS1102)と、を含む。
ステップS1101とステップS1102とは、上記の順に実行されてもよいが、必ずしもこの順に実行されることを必須とするものではない。
一方、図12は、本発明の実施の形態としてのフレーズ間関係解析プログラムを表す図であり、このフレーズ間関係解析プログラムによるコンピュータの処理手順を表している。
このフレーズ間関係解析プログラムによるコンピュータの処理手順1200では、上記コンピュータは、関係解析手順であるステップS1201において、所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを入力された解析対象記事から抽出する。
また、上記コンピュータは、間接的関係解析手順であるステップS1202において、前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを間接的関係フレーズとして前記解析対象記事から抽出する。
また、上述のフレーズ間関係解析プログラムはコンピュータ読み取り可能な記録媒体1300に記録されて、本発明の実施の形態としてのフレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体を構成する。
本発明は、所定のクラスまたはインスタンスとの関係がオントロジ上での特定の関係に該当するフレーズを、入力された解析対象記事から抽出するに際して、該抽出に係る再現率および適合率の向上が図られるフレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体の実現に利用することができる。
本発明の一つの実施の形態としてのフレーズ間関係解析装置の構成を表す機能ブロック図である。 本発明によるフレーズ間関係解析の説明に供する図である。 本発明によるフレーズ間関係解析の説明に供する図である。 本発明によるフレーズ間関係解析の説明に供する図である。 本発明によるフレーズ間関係解析の説明に供する図である。 本発明によるフレーズ間関係解析の説明に供する図である。 図1のフレーズ間関係解析装置における関係解析部の関係フレーズ集合取得部の動作を説明するためのフローチャートである。 図1のフレーズ間関係解析装置における関係解析部の間接的関係フレーズ集合取得部の動作を説明するためのフローチャートである。 図1のフレーズ間関係解析装置におけるクラス間観点解析部の該当フレーズ識別部の動作を説明するためのフローチャートである。 図1のフレーズ間関係解析装置における。 本発明の実施の形態としてのフレーズ間関係解析方法を表す概念図である。 本発明の実施の形態としてのフレーズ間関係解析プログラム、および、このプログラムを記録したコンピュータ読み取り可能な記録媒体を表す概念図である。
符号の説明
1…フレーズ間関係解析装置
10…関係解析部
20…間接的関係解析部
30…クラス間観点解析部
40…インスタンス類推部
50…入力部
60…出力部
70…操作部
80…データベース
90…システム管理部
91…バス
111…解析対象記事抽出部
112…解析対象記事抽出部
113…関係フレーズ集合取得部
121…間接的関係フレーズ集合取得部
131… 該当フレーズ識別部
141…インスタンス類推処理部
1000…感性解析エンジン
1001…ドメイン判定部
1002…ドメイン辞書作成部
1003…関係判定部
1004…関係比較部
1005…フィルタリング・復元処理部
1006…関係付け感性解析部
1007…記憶部
1008…インターフェース部
1009…システムコントローラ

Claims (9)

  1. 所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析部と、
    前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析部と、
    を含んで構成されていることを特徴とするフレーズ間関係解析装置。
  2. 前記クラス間の関係によるインスタンスの特定の組み合わせに関しオントロジ上で規定される特定の解析の観点を表す観点特定情報を保持し、該特定の解析の観点に係るインスタンスの組合せに該当するフレーズを識別するクラス間観点解析部を更に備えていることを特徴とする請求項1に記載のフレーズ間関係解析装置。
  3. 所定の定義によるインスタンス間の特定の関係を表すインスタンス関係情報を保持し、該インスタンス間の特定の関係と前記解析対象記事内のインスタンスとの比較に基づいて前記解析対象記事において欠損しているインスタンスを類推するインスタンス類推部を更に備えていることを特徴とする請求項1に記載のフレーズ間関係解析装置。
  4. 前記関係解析部は、
    外部から供給される記事集合からフレーズ間の関係を解析する対象とする解析対象記事を抽出する解析対象記事抽出部と、
    所定のドメインにおけるクラスと該クラスに属するインスタンスとのオントロジ上での特定の関係に該当する各インスタンスを、それらの所属クラスを表す所属クラス情報をそれぞれ伴なう該当インスタンスとして、これら該当インスタンスの集合である該当インスタンス集合を得るインスタンス関係解析部と、
    前記解析対象記事抽出部で抽出された解析対象記事から所定のインスタンスとの関係が前記特定の関係に該当するフレーズを抽出する関係フレーズ集合取得部と、
    を含んで構成されていることを特徴とする請求項1、2、および、3の何れか一項に記載のフレーズ間関係解析装置。
  5. 前記間接的関係解析部は、所定のクラスまたはインスタンスとオントロジ上での所定の関係を有するインスタンスの集合のうち前記所定のクラスまたはインスタンスに所定の影響を与える影響インスタンスによる影響インスタンス集合を識別し該識別された影響インスタンス集合のうち前記所定のクラスまたはインスタンスと同じ記事中に出現する影響インスタンス集合を抽出し、該影響インスタンス集合に紐付けられた間接的関係フレーズ集合を抽出することを特徴とする請求項1、2、および、3の何れか一項に記載のフレーズ間関係解析装置。
  6. 前記関係フレーズ集合取得部は、前記特定の関係に該当するフレーズを抽出するに際し前記所定のインスタンスと該抽出の対象とする各フレーズとの関係の近さを表すスコアが付随するようにして抽出し、該抽出された各フレーズのうち付随するスコアに基づいて最も関係が近いと判定されるフレーズを前記所定のインスタンスと紐付けることを特徴とする請求項4に記載のフレーズ間関係解析装置。
  7. 所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析ステップと、
    前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析ステップと、
    を含むことを特徴とするフレーズ間関係解析方法。
  8. コンピュータに、
    所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析手順と、
    前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析手順と、
    を含む手順を実行させるためのフレーズ間関係解析プログラム。
  9. コンピュータに、所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析手順と、前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析手順と、を含む手順を実行させるためのフレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2008312322A 2008-12-08 2008-12-08 フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体 Active JP5270324B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008312322A JP5270324B2 (ja) 2008-12-08 2008-12-08 フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008312322A JP5270324B2 (ja) 2008-12-08 2008-12-08 フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2010134844A true JP2010134844A (ja) 2010-06-17
JP5270324B2 JP5270324B2 (ja) 2013-08-21

Family

ID=42346057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008312322A Active JP5270324B2 (ja) 2008-12-08 2008-12-08 フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP5270324B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012159983A (ja) * 2011-01-31 2012-08-23 Meiji Univ 類推装置、類推方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001014348A (ja) * 1999-07-01 2001-01-19 Chishiki System Kenkyusho:Kk 計算機共有技術辞書
WO2008088722A2 (en) * 2007-01-17 2008-07-24 International Business Machines Corporation Querying data and an associated ontology in a database management system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001014348A (ja) * 1999-07-01 2001-01-19 Chishiki System Kenkyusho:Kk 計算機共有技術辞書
WO2008088722A2 (en) * 2007-01-17 2008-07-24 International Business Machines Corporation Querying data and an associated ontology in a database management system
JP2010517137A (ja) * 2007-01-17 2010-05-20 インターナショナル・ビジネス・マシーンズ・コーポレーション データベース管理システム内のデータ及び関連付けられたオントロジの問い合わせ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012159983A (ja) * 2011-01-31 2012-08-23 Meiji Univ 類推装置、類推方法及びプログラム

Also Published As

Publication number Publication date
JP5270324B2 (ja) 2013-08-21

Similar Documents

Publication Publication Date Title
US9542477B2 (en) Method of automated discovery of topics relatedness
CN104252533B (zh) 搜索方法和搜索装置
US20150074112A1 (en) Multimedia Question Answering System and Method
JP4953468B2 (ja) オントロジーデータのインポート/エクスポートのための方法および装置
US9424524B2 (en) Extracting facts from unstructured text
KR20160107187A (ko) 검색 결과에서의 논리적인 질문 응답 기법
KR20160124742A (ko) 비정형 텍스트내의 특징들의 중의성을 해소하는 방법
JP2010170529A (ja) オブジェクト分類方法およびオブジェクト分類システム
WO2022001682A1 (zh) 一种车载系统的控件对象查询方法和装置
Vakulenko et al. Measuring semantic coherence of a conversation
KR20110117440A (ko) 문서 간 유사도 계산 시스템 및 방법
US20120317125A1 (en) Method and apparatus for identifier retrieval
JP2016536659A (ja) 内容ベースの医療マクロのソート及び検索システムのためのシステム及び方法
KR101607468B1 (ko) 콘텐츠에 대한 키워드 태깅 방법 및 시스템
Gul et al. Context-based extraction of concepts from unstructured textual documents
van Veen et al. Linking named entities in Dutch historical newspapers
JP5199768B2 (ja) タグ付け支援方法とその装置、プログラム及び記録媒体
JP5270324B2 (ja) フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体
Im et al. STAG: semantic image annotation using relationships between tags
WO2010119794A1 (en) Information processing apparatus and information processing method
JP6303148B2 (ja) 文書素性抽出装置、文書素性抽出方法、文書分類装置、文書分類方法、文書検索装置、文書検索方法、コンピュータプログラム、および、コンピュータプログラムを記録した記録媒体
CN111046168A (zh) 用于生成专利概述信息的方法、装置、电子设备和介质
Battistelli et al. Detecting salient events in large corpora by a combination of NLP and data mining techniques
KR20190097496A (ko) 콘텐츠의 토픽 유사도를 결정하는 시스템 및 방법
CN109710844A (zh) 基于搜索引擎的快速准确定位文件的方法和设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121204

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130509

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5270324

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350