JP2010134844A - フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP2010134844A JP2010134844A JP2008312322A JP2008312322A JP2010134844A JP 2010134844 A JP2010134844 A JP 2010134844A JP 2008312322 A JP2008312322 A JP 2008312322A JP 2008312322 A JP2008312322 A JP 2008312322A JP 2010134844 A JP2010134844 A JP 2010134844A
- Authority
- JP
- Japan
- Prior art keywords
- relationship
- phrase
- instance
- analysis
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】関係解析部10によって、所定のインスタンスとの関係がオントロジ上での特定の関係に該当するフレーズを解析対象記事から抽出すると共に、間接的関係解析部20によって、所定のインスタンスとの関係がオントロジ上での特定の間接的関係に該当する間接的関係フレーズを解析対象記事から抽出する。
【選択図】 図1
Description
例えば、文章内に現れる「は」や「が」などの助詞や接続詞の位置や、フレーズの出現順序を考慮し、経験的に関係を解析するのに良いとされる「Centering Theory」を用い、センテンス内のみならず、センテンスを跨った場合にも有効な、フレーズ間の関係解析を行う手法なども提案されている(非特許文献1参照)。
この方法では、まずクラスごとに関係を持つ可能性のあるフレーズ集合を抽出し、その上で各クラスに属するインスタンスと関係するフレーズを、インスタンスの出現する文書を解析することによって抽出する。
また、文書中でクラスとインスタンスとが入り混じって記述されている場合には、この技術では、或るフレーズが複数のインスタンスと入り混じった関係を持つと解析されてしまう。
一方、非特許文献2に開示の技術では、複数のインスタンスが同じ記事の中に出現した場合、所定のフレーズに対し何れのインスタンスが紐付けされるかを解析するものではない。
さらに、クラス間の関係によるインスタンスの特定の組み合わせに関しオントロジ上で規定される特定の解析の観点に基づいて該観点に係るインスタンスの組合せに該当するフレーズを識別しようといった発展的な解析手法については特段の論及がない。
上述のような状況にあるため、何れの先行技術文献所載の技術についても、或るインスタンスとオントロジ上での特定の関係を有するフレーズの抽出に関し、再現率および適合率の更なる向上が待たれる。
(1)所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析部と、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析部と、
を含んで構成されていることを特徴とするフレーズ間関係解析装置。
関係解析部および間接的関係解析部において上述のように各該当するフレーズの抽出が行われることによって、フレーズの抽出に係る再現率および適合率の向上が図られる。
上記(2)のフレーズ間関係解析装置では(1)のフレーズ間関係解析装置において特に、フレーズ間関係解析装置によって、前記クラス間の関係によるインスタンスの特定の組み合わせに関しオントロジ上で規定される特定の解析の観点を表す観点特定情報が保持され、該特定の解析の観点に係るインスタンスの組合せに該当するフレーズが識別される。
上記(3)のフレーズ間関係解析装置では(1)のフレーズ間関係解析装置において特に、インスタンス類推部によって、所定の定義によるインスタンス間の特定の関係を表すインスタンス関係情報が保持され、該インスタンス間の特定の関係と前記解析対象記事内のインスタンスとの比較に基づいて前記解析対象記事において欠損しているインスタンスが類推される。
外部から供給される記事集合からフレーズ間の関係を解析する対象とする解析対象記事を抽出する解析対象記事抽出部と、
所定のドメインにおけるクラスと該クラスに属するインスタンスとのオントロジ上での特定の関係に該当する各インスタンスを、それらの所属クラスを表す所属クラス情報をそれぞれ伴なう該当インスタンスとして、これら該当インスタンスの集合である該当インスタンス集合を得るインスタンス関係解析部と、
前記解析対象記事抽出部で抽出された解析対象記事から所定のインスタンスとの関係が前記特定の関係に該当するフレーズを抽出する関係フレーズ集合取得部と、
を含んで構成されていることを特徴とする(1)、(2)、および、(3)の何れか一のフレーズ間関係解析装置。
更に、関係フレーズ集合取得部によって、所定のインスタンスとの関係が前記特定の関係に該当するフレーズが前記解析対象記事抽出部で抽出された解析対象記事から抽出される。
更に、該識別された影響インスタンス集合のうち前記所定のクラスまたはインスタンスと同じ記事中に出現する影響インスタンス集合が抽出され、該影響インスタンス集合に紐付けられた間接的関係フレーズ集合が取得される。
上記(6)のフレーズ間関係解析装置では、(4)のフレーズ間関係解析装置において特に、前記関係フレーズ集合取得部によって、前記特定の関係に該当するフレーズを抽出するに際し前記所定のインスタンスと該抽出の対象とする各フレーズとの関係の近さを表すスコアが付随するようにして抽出し、該抽出された各フレーズのうち付随するスコアに基づいて最も関係が近いと判定されるフレーズが前記所定のインスタンスと紐付けられる。
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを間接的関係フレーズとして前記解析対象記事から抽出する間接的関係解析ステップと、
を含むことを特徴とするフレーズ間関係解析方法。
所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報が適宜の記憶手段等において保持され、入力された解析対象記事について、所定のクラスまたはインスタンスとの関係が前記保持されている特定の関係に該当するフレーズの抽出処理が関係解析部ステップおいて実行される。
関係解析ステップおよび間接的関係解析ステップにおいて上述のように各該当するフレーズの抽出が行われることによって、フレーズの抽出に係る再現率および適合率の向上が図られる。
所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析手順と、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析手順と、
を含む手順を実行させるためのフレーズ間関係解析プログラム。
所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析手順と、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析手順と、
を実行する。
所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析手順と、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析手順と、
を実行する。
先ず、図1を参照して本発明の実施の形態としてのフレーズ間関係解析装置の構成を概観し、次いで、このフレーズ間関係解析装置1によるフレーズ間関係解析について図2乃至図6を参照しつつ説明し、更に、図1に戻って上記構成について詳述する。
図1は、本発明の一つの実施の形態としてのフレーズ間関係解析装置の構成を表す機能ブロック図である。
図1において、本発明の実施の形態としてのフレーズ間関係解析装置1は、後述する関係解析部10、間接的関係解析部20、クラス間観点解析部30、インスタンス類推部40、入力部50、出力部60、操作部70、データベース80が、バス91を通してシステム管理部90に接続されている。
従って、関係解析部10、間接的関係解析部20、クラス間観点解析部30、インスタンス類推部40も、それら各部がシステム管理部90の管理下で本来の機能を果たすものであり、一点鎖線による枠線の部分は敢えて各部の機能が端的に理解され易いように描いたものである。
次に、本発明の実施の形態としてのフレーズ間関係解析装置1の各部について詳細に説明する前に、本発明を適用して行うフレーズ間の関係解析について説明する。
(オントロジを利用した高精度なフレーズ間の関係解析)
先ず、或るドメインで重要な意味を持つ概念であるクラスと、その概念の例示であるインスタンス、および、クラス間のオントロジ上での関係を予め整理して、オントロジ上での或る特定の関係を定義しておく。
このような定義を行う過程においては、クラスおよびインスタンスに該当するそれぞれの事象に係るメタデータを用いて関係の整理を行うなどして作業が進められる。
また、オントロジ上での関係において、インスタンスBがインスタンスAに影響を与えている関係にあるとき、インスタンスBに関係するフレーズをインスタンスAに間接的に関係するフレーズとして組み込むことによって再現率を向上させることが可能になる。
以上におけるインスタンスは、オントロジ上での特定の関係を規定するという観点からはインスタンスとして捉えられるが、文書集合の中では或るフレーズとして利用されるものである。
即ち、本発明の技術思想は、フレーズ間の関係解析のうち、特に、オントロジ上で定義されるインスタンスに焦点を当てたものであると見ることができる。
例えば、図2に示すように、あるクラスAと他のクラスBが関係を持つとき、クラスAに所属するインスタンスの観点に焦点を当て、他のクラスBに所属するインスタンスとの関係を解析することができる。
図3に上記の関係の一例が示されている。即ち、映画ドメインにおいては、映画タイトル、監督、および、役者が重要な概念である。
この関係のインスタンスとしては、図4に例示されたように、映画タイトルAとそのタイトルの映画を作製した監督Aという関係(図4における"directed By"関係)と、映画タイトルAとそのタイトルAの映画に出演した役者Aという関係(図4における"actored By"関係)などが該当する。
以上の仮定の下では、「役者Aと或る映画タイトルAという関係」の観点から見た役者Aと関係を持つフレーズと、「役者Aと或る映画タイトルBという関係」の観点から見た役者Aと関係を持つフレーズとを区分して解析することが可能である。
更にまた、図6におけるように、映画タイトルCとそのタイトルCの映画を作製した監督という関係(図6における"directed By"関係)や、タイトルCの映画に出演した役者Aという関係(図6における"actored By"関係)もオントロジ上での特定の関係として予め定義してあるものと仮定する。
図4および図6の例に着目すると、「役者Aと監督A」という関係の観点で、映画タイトルAと映画タイトルCは同条件であり、当該組み合わせにおける役者Aや監督Aと関係をもつフレーズを詳細に解析することが可能である。
以下、図1に戻って、フレーズ間関係解析装置1の構成について詳述する。
関係解析部10は、所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する。
関係解析部10は、解析対象記事抽出部111と、インスタンス関係解析部112と、関係フレーズ集合取得部113とを含んで構成されている。
関係解析部10におけるこれら各部のうち解析対象記事抽出部111は、上述のように、例えば、入力部50から供給される解析対象記事中の解析対象とする記事集合Eを表す情報を受けて、この記事集合Eからフレーズ間の関係を解析するために適用する解析対象記事Eiを抽出する。
上述における「オントロジ上で関係する」とは、既述の図4の例におけるような、映画タイトルA、監督A、および、役者Aの関係等である。
即ち、インスタンスIiを役者Aとすると、インスタンス集合Iは監督Aおよび映画タイトルAを含む。
この「関係」のインスタンスが、図4に例示されたような監督A、タイトルA、役者Aの関係である。
更に、関係フレーズ集合取得部113は、解析対象記事抽出部111で抽出された解析対象記事Eiを解析して、或るインスタンスIiに関係するフレーズを抽出し、フレーズ集合F(Ii)を得る。
更に、インスタンスIiと最も近い関係にあるフレーズfiを抽出して両者を関連付ける(紐付ける)。
図7は、関係解析部10の関係フレーズ集合取得部113の動作を説明するためのフローチャートである。関係フレーズ集合取得部113は関係解析部10における出力を得るための枢要な機能部である。
関係フレーズ集合取得部113では、先ず、処理の繰り返し回数の計数値を0にしておき(ステップS701)、次いで、解析対象記事抽出部111で抽出された解析対象記事Eiについて、インスタンスIiに関係する関係フレーズf(Ii)を、関係の近さを表すスコアS(Ii)を伴なって抽出し、該抽出された関係フレーズf(Ii)による関係フレーズ集合F(Ii)を得る(ステップS702)。
ステップS702〜ステップS704によって、インスタンスに関係する各フレーズf(Ii)がその関係の近さを表す各スコアS(Ii)を伴なって抽出される。
ステップS705の処理において、(ユーザによって特定された)或るインスタンスIi、フレーズfi、インスタンス集合I、上記インスタンスIiに関係する関係フレーズf(Ii)の関係の近さを表すスコアをスコアS(Ii)と表記する。
スコアS(Ii)とスコアS(I(f(Ii)))との比較判定の結果、スコアS(Ii)が最も大きいときのインスタンスIiとフレーズfiとを紐付ける(ステップS706)。
間接的関係解析部20は所定のクラスまたはインスタンスとの関係がオントロジ上で既述の特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、解析対象記事から抽出する。
従って、間接的関係解析部20の構成は、外部から供給される記事集合からフレーズ間の関係を解析する対象とする解析対象記事を抽出する解析対象記事抽出部については、既述の関係解析部10における解析対象記事抽出部111が利用され得る。
一方、間接的関係解析部20の枢要な機能部としての間接的関係フレーズ集合取得部121については、既述の関係解析部10における関係フレーズ集合取得部113とは異なる特徴的機能を有する。
このような間接的関係フレーズ集合取得部121の機能の詳細について、以下に、図8のフローチャートを参照して詳述する。
上述のように例えばユーザによって選択された或る特定のインスタンスIiに関係するインスタンス集合の中で特に、図4乃至図6を参照して例示的に説明した“directed By”或いは“actored By”のような形でインスタンスIiに影響を与える影響インスタンス集合I(Ii)を抽出する(ステップS801)。
尚、インスタンスIiは、既述のように、システム管理部90の管理下で、この間接的関係フレーズ集合取得部121に供給される。
(1)インスタンスIiが所属するクラスCとオントロジ上で関係しているクラスCRを抽出する。例えば、図3においてインスタンスIiがクラス映画タイトルに所属しているとすると、CRには、役者クラスと監督クラスが該当する。
(2)クラスCRの中のクラスに対しクラスCに影響を与える関係にある影響クラスCIを選択する。この選択作業はオントロジ上のクラス間の関係の定義を確認し、人手を介して行われ得る。図3の例では、監督や役者は映画タイトルを作製(directed By)したり、出演(actored By)したりという関係であるため、映画タイトルに影響を与える関係であるとも考えることができる。
(4)以上のようにして、影響インスタンス集合I(in)を出力する。
次いで、ステップS801で抽出された影響インスタンス集合I(Ii)の中で、インスタンスIiと同じ記事Ei内に出現するインスタンス集合I(in2)に関係があるとして紐付けられたフレーズ集合F(in2)を抽出する(ステップS802)。
ステップS802で抽出されたフレーズ集合F(in2)を間接的関係を有する間接的フレーズ集合としてインスタンスIiに紐付ける(ステップS803)。
また、或る処理の実行、処理の繰り返しの起動や終了などに係る管理もシステム管理部90による管理下で所定の通りに実行される。
上記繰り返しの結果として、上述のインスタンスIiに関係付けられた関係フレーズ集合F(Ii)、および、上述のインスタンスIiに間接的に関係する間接的関係フレーズ集合F(in)がそれぞれ出力される。
それらの関係フレーズ集合F(Ii)および間接的関係フレーズ集合F(in)に各包摂されるフレーズは、各有限の発現回数を持つ。
更に、処理結果は、システム管理部90による管理下で、データベース80の所定領域に格納され、或いはまた、出力部60から出力される。
従って、このフレーズ間関係解析装置1によれば、オントロジにおける関係を利用せず且つ間接的関係にあるフレーズを抽出対象としない従来の技術に比し、再現率および適合率の高い分析が可能である。
このクラス間観点解析部30は、クラス間の関係によるインスタンスの特定の組み合わせに関しオントロジ上で規定される特定の解析の観点を表す観点特定情報を保持し、該特定の解析の観点に係るインスタンスの組合せに該当するフレーズを識別する該当フレーズ識別部131を備えている。
該当フレーズ識別部131で実行される処理は、概括的には、ユーザが解析を希望する観点となるインスタンスの組合せが供給されると、このインスタンスの組合せ、および、タクソノミ上のクラスに分類された解析対象記事のユーザIDを表す情報を受けて、当前記インスタンスの組合せに係るインスタンス関係に該当するフレーズを識別する処理である。
図9は、フレーズ間関係解析装置1におけるクラス間観点解析部30の該当フレーズ識別部131の動作を説明するためのフローチャートである。
先ず、ユーザが解析を希望する観点となる(ユーザが制約として与えたい)インスタンスの組合せ(関係)I(C)に関し、オントロジ上で規定される特定の解析の観点である観点特定情報を保持しておく(ステップS901)。
上記インスタンスの組合せ(関係)I(C)についてオントロジ上で当該指定による組合せ(関係)I(C)に該当するインスタンス関係を抽出し、この関係に該当するインスタンスによるインスタンス集合I(R)を得る(ステップS902)。
(1)インスタンスの組合せ(関係)I(C)が所属するクラスCとオントロジ上で関係するクラスCRを抽出する。例えば図3においてインスタンスIiがクラス映画タイトルに所属しているとすると、クラスCRには役者クラスと監督クラスとが入る。
(2)クラスCRの中のクラスに対しクラスCに包含される関係にあるクラスCIを選択する。この選択作業はオントロジ上のクラス間の関係の定義を確認し、人手を介して行われ得る。例えば、図3の例では、監督や役者は映画タイトルを作製(directed By)したり、出演(actored By)したりという関係であるため、映画タイトルに影響を与える関係であるとも考えることができる。
(4)以上のようにして、インスタンス集合I(R)を出力する。
次いで、観点特定情報によるインスタンスの組合せ(関係)I(C)内のインスタンスIが、或る文書Ei内に同時に現れた場合に、同時にインスタンス集合I(R)内のインスタンスの記述が存在するかをチェックする。存在すれば、そのインスタンスをI(R2)とする(ステップS903)。
更に、既述のステップS701〜ステップS706と同様の手順で、インスタンスI(R2)内の各インスタンスに関係するフレーズを抽出する(ステップS904)。
ステップS901〜ステップS905の手順により、例えば図2に示されたように、あるクラスAと他クラスBが関係を持つとき、クラスAに所属するインスタンスの観点に焦点を当て、他クラスBに所属するインスタンスとの関係を解析することができる。
クラス間の関係として、映画タイトルとそのタイトルの映画を作製した監督という関係(図3における“directed By”関係)と、その映画タイトルとそのタイトルの映画に出演した役者という関係(図3における“actored By”関係)を予め規定していたとする。
また、上述のようなインスタンスとして図5に示すように、映画タイトルBとそのタイトルBの映画を作製した監督Bという関係や、その映画タイトルBとそのタイトルBの映画に出演した役者Aという関係も予め規定されていたとする。
これにより、例えば、役者Aは或るタイトルBでは「渋い」という関係を持つが、タイトルAでは「コミカル」といった関係を持つといように、タイトル毎に役者の特性を細かく分析できる。
本実施の形態としてのフレーズ間関係解析装置1では、このような点に着目して、インスタンス類推部40において、暗黙的に予想し得るインスタンスを得るようにしている。
インスタンス類推部40は、所定の定義によるインスタンス間の特定の関係を表すインスタンス関係情報を保持し、該インスタンス間の特定の関係と解析対象記事内のインスタンスとの比較に基づいてこの解析対象記事において欠損しているインスタンスを類推する。
インスタンス類推部40における上述のような暗黙的に予想し得るインスタンスの類推処理は、例えば感性解析エンジンとして構成され得るインスタンス類推処理部141において実行される。
図6の例では、ユーザが制約として与えたいインスタンスの組合せ(関係)I(C)が例えばインスタンス“役者A”のみから構成されていても、オントロジ上で“役者A”と関係のあるインスタンス“映画タイトルC”を経由して“役者A”は“役者B”や“監督A”とも関係を持つ。
図10は上述のインスタンス類推処理部141として適用可能な感性解析エンジンを表す概念図である。
上述の各部は、この感性解析エンジン1000の系全体を統括的に管理するシステムコントローラ1009の管理下で各所定の機能を営む。
この抽出では、例えば、概念検索とタクソノミによるフィルタリング処理が併用される。
ドメイン辞書作成部1002では、クラスおよびインスタンス毎に特徴的な辞書を作成する。このように作成された辞書は、例えば、記憶部1007に格納される。
関係比較部1004は、インスタンス間で感性語との関係の強さを比較する。
フィルタリング・復元処理部1005では、上述のような関係の定義を利用して、フレーズの抽出に関する適合率の向上を図ると共に、解析対象記事たるブログエントリの集合であるブログエントリ集合には明示的に含まれていない、謂わば隠れた関係にあるフレーズを復元する。
関係付け感性解析部1006では、上述のような関係の定義に基づいて、暗黙的な関係を構築する。
図11は、本発明の実施の形態としてのフレーズ間関係解析方法を表す概念図である。
即ち、本発明の実施の形態としてのフレーズ間関係解析方法1100は、所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを入力された解析対象記事から抽出する関係解析ステップ(ステップS1101)と、前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを間接的関係フレーズとして前記解析対象記事から抽出する間接的関係解析ステップ(ステップS1102)と、を含む。
一方、図12は、本発明の実施の形態としてのフレーズ間関係解析プログラムを表す図であり、このフレーズ間関係解析プログラムによるコンピュータの処理手順を表している。
このフレーズ間関係解析プログラムによるコンピュータの処理手順1200では、上記コンピュータは、関係解析手順であるステップS1201において、所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを入力された解析対象記事から抽出する。
また、上述のフレーズ間関係解析プログラムはコンピュータ読み取り可能な記録媒体1300に記録されて、本発明の実施の形態としてのフレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体を構成する。
10…関係解析部
20…間接的関係解析部
30…クラス間観点解析部
40…インスタンス類推部
50…入力部
60…出力部
70…操作部
80…データベース
90…システム管理部
91…バス
111…解析対象記事抽出部
112…解析対象記事抽出部
113…関係フレーズ集合取得部
121…間接的関係フレーズ集合取得部
131… 該当フレーズ識別部
141…インスタンス類推処理部
1000…感性解析エンジン
1001…ドメイン判定部
1002…ドメイン辞書作成部
1003…関係判定部
1004…関係比較部
1005…フィルタリング・復元処理部
1006…関係付け感性解析部
1007…記憶部
1008…インターフェース部
1009…システムコントローラ
Claims (9)
- 所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析部と、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析部と、
を含んで構成されていることを特徴とするフレーズ間関係解析装置。 - 前記クラス間の関係によるインスタンスの特定の組み合わせに関しオントロジ上で規定される特定の解析の観点を表す観点特定情報を保持し、該特定の解析の観点に係るインスタンスの組合せに該当するフレーズを識別するクラス間観点解析部を更に備えていることを特徴とする請求項1に記載のフレーズ間関係解析装置。
- 所定の定義によるインスタンス間の特定の関係を表すインスタンス関係情報を保持し、該インスタンス間の特定の関係と前記解析対象記事内のインスタンスとの比較に基づいて前記解析対象記事において欠損しているインスタンスを類推するインスタンス類推部を更に備えていることを特徴とする請求項1に記載のフレーズ間関係解析装置。
- 前記関係解析部は、
外部から供給される記事集合からフレーズ間の関係を解析する対象とする解析対象記事を抽出する解析対象記事抽出部と、
所定のドメインにおけるクラスと該クラスに属するインスタンスとのオントロジ上での特定の関係に該当する各インスタンスを、それらの所属クラスを表す所属クラス情報をそれぞれ伴なう該当インスタンスとして、これら該当インスタンスの集合である該当インスタンス集合を得るインスタンス関係解析部と、
前記解析対象記事抽出部で抽出された解析対象記事から所定のインスタンスとの関係が前記特定の関係に該当するフレーズを抽出する関係フレーズ集合取得部と、
を含んで構成されていることを特徴とする請求項1、2、および、3の何れか一項に記載のフレーズ間関係解析装置。 - 前記間接的関係解析部は、所定のクラスまたはインスタンスとオントロジ上での所定の関係を有するインスタンスの集合のうち前記所定のクラスまたはインスタンスに所定の影響を与える影響インスタンスによる影響インスタンス集合を識別し該識別された影響インスタンス集合のうち前記所定のクラスまたはインスタンスと同じ記事中に出現する影響インスタンス集合を抽出し、該影響インスタンス集合に紐付けられた間接的関係フレーズ集合を抽出することを特徴とする請求項1、2、および、3の何れか一項に記載のフレーズ間関係解析装置。
- 前記関係フレーズ集合取得部は、前記特定の関係に該当するフレーズを抽出するに際し前記所定のインスタンスと該抽出の対象とする各フレーズとの関係の近さを表すスコアが付随するようにして抽出し、該抽出された各フレーズのうち付随するスコアに基づいて最も関係が近いと判定されるフレーズを前記所定のインスタンスと紐付けることを特徴とする請求項4に記載のフレーズ間関係解析装置。
- 所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析ステップと、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析ステップと、
を含むことを特徴とするフレーズ間関係解析方法。 - コンピュータに、
所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析手順と、
前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析手順と、
を含む手順を実行させるためのフレーズ間関係解析プログラム。 - コンピュータに、所定のドメインにおける複数のクラス間のオントロジ上での関係、および、当該各クラスとそれらのクラスに属するインスタンスとのオントロジ上での関係のうちの少なくとも何れかに該当するオントロジ上での特定の関係を表す関係特定情報を保持し、所定のクラスまたはインスタンスとの関係が前記特定の関係に該当するフレーズを、入力された解析対象記事から抽出する関係解析手順と、前記所定のクラスまたはインスタンスとの関係がオントロジ上で前記特定の関係と関連を持つ特定の間接的関係に該当するフレーズを、間接的関係フレーズとして、前記解析対象記事から抽出する間接的関係解析手順と、を含む手順を実行させるためのフレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008312322A JP5270324B2 (ja) | 2008-12-08 | 2008-12-08 | フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008312322A JP5270324B2 (ja) | 2008-12-08 | 2008-12-08 | フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010134844A true JP2010134844A (ja) | 2010-06-17 |
JP5270324B2 JP5270324B2 (ja) | 2013-08-21 |
Family
ID=42346057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008312322A Active JP5270324B2 (ja) | 2008-12-08 | 2008-12-08 | フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5270324B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012159983A (ja) * | 2011-01-31 | 2012-08-23 | Meiji Univ | 類推装置、類推方法及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001014348A (ja) * | 1999-07-01 | 2001-01-19 | Chishiki System Kenkyusho:Kk | 計算機共有技術辞書 |
WO2008088722A2 (en) * | 2007-01-17 | 2008-07-24 | International Business Machines Corporation | Querying data and an associated ontology in a database management system |
-
2008
- 2008-12-08 JP JP2008312322A patent/JP5270324B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001014348A (ja) * | 1999-07-01 | 2001-01-19 | Chishiki System Kenkyusho:Kk | 計算機共有技術辞書 |
WO2008088722A2 (en) * | 2007-01-17 | 2008-07-24 | International Business Machines Corporation | Querying data and an associated ontology in a database management system |
JP2010517137A (ja) * | 2007-01-17 | 2010-05-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベース管理システム内のデータ及び関連付けられたオントロジの問い合わせ |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012159983A (ja) * | 2011-01-31 | 2012-08-23 | Meiji Univ | 類推装置、類推方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5270324B2 (ja) | 2013-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9542477B2 (en) | Method of automated discovery of topics relatedness | |
CN104252533B (zh) | 搜索方法和搜索装置 | |
US20150074112A1 (en) | Multimedia Question Answering System and Method | |
JP4953468B2 (ja) | オントロジーデータのインポート/エクスポートのための方法および装置 | |
US9424524B2 (en) | Extracting facts from unstructured text | |
KR20160107187A (ko) | 검색 결과에서의 논리적인 질문 응답 기법 | |
KR20160124742A (ko) | 비정형 텍스트내의 특징들의 중의성을 해소하는 방법 | |
JP2010170529A (ja) | オブジェクト分類方法およびオブジェクト分類システム | |
WO2022001682A1 (zh) | 一种车载系统的控件对象查询方法和装置 | |
Vakulenko et al. | Measuring semantic coherence of a conversation | |
KR20110117440A (ko) | 문서 간 유사도 계산 시스템 및 방법 | |
US20120317125A1 (en) | Method and apparatus for identifier retrieval | |
JP2016536659A (ja) | 内容ベースの医療マクロのソート及び検索システムのためのシステム及び方法 | |
KR101607468B1 (ko) | 콘텐츠에 대한 키워드 태깅 방법 및 시스템 | |
Gul et al. | Context-based extraction of concepts from unstructured textual documents | |
van Veen et al. | Linking named entities in Dutch historical newspapers | |
JP5199768B2 (ja) | タグ付け支援方法とその装置、プログラム及び記録媒体 | |
JP5270324B2 (ja) | フレーズ間関係解析装置、フレーズ間関係解析方法、フレーズ間関係解析プログラム、および、フレーズ間関係解析プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Im et al. | STAG: semantic image annotation using relationships between tags | |
WO2010119794A1 (en) | Information processing apparatus and information processing method | |
JP6303148B2 (ja) | 文書素性抽出装置、文書素性抽出方法、文書分類装置、文書分類方法、文書検索装置、文書検索方法、コンピュータプログラム、および、コンピュータプログラムを記録した記録媒体 | |
CN111046168A (zh) | 用于生成专利概述信息的方法、装置、电子设备和介质 | |
Battistelli et al. | Detecting salient events in large corpora by a combination of NLP and data mining techniques | |
KR20190097496A (ko) | 콘텐츠의 토픽 유사도를 결정하는 시스템 및 방법 | |
CN109710844A (zh) | 基于搜索引擎的快速准确定位文件的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121204 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130312 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130509 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5270324 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |