JP2008250388A - 情報検索装置、情報検索方法及び情報検索プログラム - Google Patents

情報検索装置、情報検索方法及び情報検索プログラム Download PDF

Info

Publication number
JP2008250388A
JP2008250388A JP2007087389A JP2007087389A JP2008250388A JP 2008250388 A JP2008250388 A JP 2008250388A JP 2007087389 A JP2007087389 A JP 2007087389A JP 2007087389 A JP2007087389 A JP 2007087389A JP 2008250388 A JP2008250388 A JP 2008250388A
Authority
JP
Japan
Prior art keywords
syntax tree
sentence
replacement
partial
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007087389A
Other languages
English (en)
Other versions
JP5160120B2 (ja
Inventor
Yoshimi Saito
佳美 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007087389A priority Critical patent/JP5160120B2/ja
Publication of JP2008250388A publication Critical patent/JP2008250388A/ja
Application granted granted Critical
Publication of JP5160120B2 publication Critical patent/JP5160120B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】入力文の類似文を高い精度で特定する。
【解決手段】入力文の入力を受け付ける入力部と、検索対象文と当該検索対象文における自立語を木構造のノードとした自立語間の係り受け構造を保持する構文木とを対応付けて記憶する検索対象文記憶部と、入力文から構文木を生成する構文解析部と、複数の自立語間の係り受け構造を示す対象パタンと、対象パタンよりノード数が少ない置換パタンと、対象パタンを置換パタンに置換する置換条件と、を対応付けて記憶する置換ルール記憶部と、検索対象文の部分構文木が置換条件に一致するか否か判断する判断部と、一致すると判断した場合に、当該置換条件に対応付けられた対象パタンと一致する検索対象文の部分構文木を、置換パタンで置き換える置換部と、入力文の構文木と、置換後の検索対象文の構文木との類似度を判定する類似度判定部と、判定結果と共に置換前の検索対象文を表示する表示処理部と、を備える。
【選択図】 図1

Description

この発明は、入力された文と類似する文を出力する情報検索装置、情報検索方法及び情報検索プログラムに関するものである。
従来から、データを検索するために様々な検索技術が提供され、広く普及している。例えば、インターネットの検索エンジンでは、利用者の検索条件に適合する文書を検索し、検索した文書を類似度に応じてランキングしている。
この文書検索では、利用者により入力されたキーワード、又は入力文から切り出されたキーワードに基づいて、文書を検索している。しかしながら、自然言語では、これらキーワードと同じ意味を別の言葉で表現することが可能である。
例えば、利用者から「読みを送信する」という検索要求文を含む文書の検索要求が行った場合、この「読みを送信する」という検索要求文を言い換えた「読みを付与し送信を実行する」(以下、文Aとする)という文を含む文書については検出されないことになる。このため、利用者は、「読みを送信する」という検索要求文のうち、「読み」と「送信」を検索キーワードとして文書を検索することもあり得る。この場合、確かに「読みを付与し送信を実行する」(文A)という文を含む文書については検出されるが、「読みを文字列から生成し、音声の送信を実行する」(以下、文Bとする)という「読みを送信する」と全く意味が異なる文を含む文書についても検出されることになる。この場合、利用者が意図しない文書も検出されることになるため、利用者が所望する文書を特定することが困難になる。このように、キーワードによる検索では、文Aと文Bとを区別することが難しいという問題がある。
以下、上述した「読みを送信する」を、「読みを文字列に付与し送信を実行する」のような同じ意味内容であって異なる表現にする変換を、「パラフレーズ」と呼ぶ。
そして、ある表現から、同じ意味内容であって別の表現(=パラフレーズ表現)の候補を生成することをパラフレーズ表現の生成手法と呼ぶ。このパラフレーズ表現の生成手法としては、予め保持している置換ルールに基づいて、ある表現を部分的に置換して別の表現を生成する手法がある。例えば、特許文献1に記載された技術では、複数の置換ルールを適用して置換候補を生成するという手法が提案されている。これにより、複雑なパラフレーズを実現することができる。そして、このパラフレーズ表現の生成手法を検索に応用することも考えられる。つまり、パラフレーズ表現の生成手法を用いて、検索要求文から検索対象文を生成して、当該検索対象文が検索要求文と類似していると判断した場合に、当該検索対象文を用いて検索を行うという手法が考えられる。
特開2003−76687号公報
しかしながら、特許文献1に記載されている技術は、書き換えルールにより、文言の変更を行っているが、自立語の数が変わるような複雑なパラフレーズを行ってはいない。このため、「読みを送信する」と「読みを文字列に付与し送信を実行する」との間のパラフレーズを行うことはできないという問題がある。
本発明は、上記に鑑みてなされたものであって、適切にパラフレーズ(置換)された文を取得可能な情報検索装置、情報検索方法及び情報検索プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明の情報検索装置は、入力文の入力を受け付ける入力手段と、前記入力文による検索の対象となる検索対象文と、当該検索対象文における、文節毎の自立語と、前記自立語を木構造のノードとした自立語間の係り受け構造を保持する構文木と、を対応付けて記憶する文記憶手段と、前記入力文を構文解析して、当該入力文の自立語間の係り受け構造を保持する構文木を生成する構文木生成手段と、複数の自立語間の係り受け構造を示す第1の部分構文木パタンと、前記第1の部分構文木の言い換えとなる自立語間の係り受け構造を示す部分構文木パタンであって前記第1の部分構文木より前記ノードの数が少ない第2の部分構文木パタンと、前記第1の部分構文木パタンを前記第2の構文木パタンに置換する置換条件と、を対応付けて記憶する構文木パタン記憶手段と、前記文記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記構文木パタン記憶手段が記憶する前記置換条件に一致するか否か判断する判断手段と、前記置換条件に一致すると判断した場合に、当該置換条件に対応付けられた前記第1の部分構文木パタンと一致する前記検索対象文に含まれている前記部分構文木を、当該置換条件と対応付けられた前記第2の部分構文木パタンで置き換える置換手段と、前記構文木生成手段により生成された前記入力文の前記構文木と、前記置換手段により置き換えられた前記検索対象文の構文木との類似度を判定する類似度判定手段と、判定された前記類似度が所定の条件を満たす場合、前記置換手段により置換される前の前記検索対象文を、検索結果として出力する出力手段と、を備えることを特徴とする。
また、本発明の情報検索方法は、入力文の入力を受け付ける入力ステップと、前記入力文による検索の対象となる検索対象文と、当該検索対象文における、文節毎の自立語と、前記自立語を木構造のノードとした自立語間の係り受け構造を保持する構文木と、を対応付けて記憶部に記憶する文記憶ステップと、前記入力文を構文解析して、当該入力文の自立語間の係り受け構造を保持する構文木を生成する構文木生成ステップと、前記記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記第1の部分構文木パタンを前記第2の構文木パタンに置換する置換条件に一致するか否か判断する判断ステップと、前記置換条件に一致すると判断した場合に、複数の自立語間の係り受け構造を示す部分構文木であって前記置換条件と対応付けられている第1の部分構文木パタンと一致する、前記検索対象文に含まれている前記部分構文木を、当該第1の部分構文木パタンと対応付けられていると共に前記第1の部分構文木の言い換えとなる自立語間の係り受け構造を示す部分構文木パタンであって前記第1の部分構文木より前記ノードの数が少ない第2の部分構文木パタンで置き換える置換ステップと、前記構文木生成ステップにより生成された前記入力文の前記構文木と、前記置換ステップにより置き換えられた前記検索対象文の構文木との類似度を判定する類似度判定ステップと、判定された前記類似度が所定の基準値以上の場合、前記置換ステップにより置換される前の前記検索対象文を、検索結果として出力する出力ステップと、を有することを特徴とする。
また、本発明の情報検索プログラムは、入力文の入力を受け付ける入力ステップと、前記入力文による検索の対象となる検索対象文と、当該検索対象文における、文節毎の自立語と、前記自立語を木構造のノードとした自立語間の係り受け構造を保持する構文木と、を対応付けて記憶部に記憶する文記憶ステップと、前記入力文を構文解析して、当該入力文の自立語間の係り受け構造を保持する構文木を生成する構文木生成ステップと、前記記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記第1の部分構文木パタンを前記第2の構文木パタンに置換する置換条件に一致するか否か判断する判断ステップと、前記置換条件に一致すると判断した場合に、複数の自立語間の係り受け構造を示す部分構文木であって前記置換条件と対応付けられている第1の部分構文木パタンと一致する、前記検索対象文に含まれている前記部分構文木を、当該第1の部分構文木パタンと対応付けられていると共に前記第1の部分構文木の言い換えとなる自立語間の係り受け構造を示す部分構文木パタンであって前記第1の部分構文木より前記ノードの数が少ない第2の部分構文木パタンで置き換える置換ステップと、前記構文木生成ステップにより生成された前記入力文の前記構文木と、前記置換ステップにより置き換えられた前記検索対象文の構文木との類似度を判定する類似度判定ステップと、判定された前記類似度が所定の条件を満たす場合、前記置換ステップにより置換される前の前記検索対象文を、検索結果として出力する出力ステップと、をコンピュータに実行させる。
本発明によれば、入力された文と類似する検索対象文を高い精度で特定できるという効果を奏する。
以下に添付図面を参照して、この発明にかかる情報検索装置、情報検索方法及び情報検索プログラムを情報検索装置に適用した最良な実施の形態を詳細に説明する。
(第1の実施の形態)
図1に示すように、情報検索装置100は、検索対象文記憶部101と、置換ルール記憶部102と、置換順序記憶部103と、置換履歴格納部104と、入力部105と、構文解析部106と、文節特定部111と、判断部107と、置換部108と、類似度判定部109と、表示処理部110と、検索要求文一致文節記憶部112とを備える。
検索対象文記憶部101は、利用者により入力された検索要求文による検索の対象となる検索対象文についての構文解析結果を予め記憶している。図2に示すように、検索対象文管理テーブルでは、文IDと、検索対象文と、文節IDと、文節の自立語と、当該自立語の品詞と、親IDと、次の文節との関係と、一致文節IDとを対応付けて保持している。
文IDは、検索対象文毎に割り当てられたIDとする。文節IDは、検索対象文の文節毎に割り当てられたIDとする。関係は、次の文節との関係が格納されており、例えば、「の」、「を」、「並列」、「隣」等とする。なお、一致文節IDは初期状態では空欄としておき、後述する処理を行う際に利用される。親IDは、親の文節を示す文節IDを格納する。つまり、検索対象文管理テーブルでは、この親IDにより、検索対象文の構文解析結果となる構文木の構造を格納している。次に符号201で示される文ID“1”の構文木の構造について示す。
図3に示す文ID“1”の構文木は、文ID“1”についての構文木であり、図2に示された検索対象文管理テーブルのフィールド情報である親IDに基づいて構文木構造を実現している。図3に示すように、「実行(文節ID“4”)」の下に、「付与(文節ID“2”)」と、「送信(文節ID“3”)」と、が関連付けされている。さらに、「付与(文節ID“2”)」の下に「読み(文節ID“1”)」が関連付けされている。後述する処理では、このような構文木構造を用いてパラフレーズ処理を行うものとしている。
置換ルール記憶部102は、後述する置換部108が行うパラフレーズに用いる置換ルールを格納している。当該置換ルールに従って、検索対象文のパラフレーズが行われる。図4に示すように、置換ルール管理テーブルは、分類IDと、ルールIDと、対象パタンと、置換パタンと、係り受け条件と、品詞条件と、一致条件とを対応付けて保持している。なお、分類とは、文の区切りとなる所定のまとまりをいう。本実施の形態では分類として、名詞句、動詞句、格共有等とする。
分類IDは、上述した分類毎に割り当てられたIDとする。ルールIDは、分類毎に設定された各置換ルールに割り当てられたIDとする。そして、ルールIDの数が小さい方については、係り受け構造等が複雑な置換ルールが設定されており、ルールIDの数が大きい方については、係り受け構造等が簡単な置換ルールが設定されているものする。つまり、検索対象文において複雑な置換ルールに一致すれば当該置換ルールと対応付けられた置換を行い、複雑な置換ルールに一致しなかった場合には単純な置換ルールと一致するか否か判断を行い、当該単純な置換ルールと一致した場合に当該置換ルールと対応付けられた置換を行うことになる。このように複雑な置換ルールから順に一致するか否か判断することで、構文木を置換する精度を向上させることができる。
対象パタンは、検索対象文に対して適用する自立語間の係り受け構造を示す構文木のパタンとする。置換パタンは、検索対象文に含まれている部分構文木が対象パタンと一致するとともに後述する置換条件を満足した場合に実行する置換処理後の構文木のパタンとする。対象パタン及び置換パタンの「−」は2つの単語間に係り受け関係が存在していることを示している。図4に示すように対象パタンより置換パタンの方がノード数を少なく設定されている。なお、対象パタンの構文木と置換パタンの構文木は、ノード数こそ異なるが意味的には言い換えとなるものである。これにより、当該複数のパタンを用いて検索対象文を置換しても言い換え関係が成立することになる。
図5に示す例は、図4のレコード401の対象パタンの構文木と、置換パタンの構文木とを示した例であり、所定の条件を満たした場合に、対象文に含まれている対象パタンの構文木が、置換パタンの構文木に置換される。
図4に戻り、置換ルール管理テーブルの係り受け条件、品詞条件、一致条件は、検索対象文において、検索要求文が有する自立語を残すと共に対象パタンを置換パタンに置換するための置換条件として設定されている。これら全ての置換条件を満たした場合、検索対象文に対して置換処理が行われることになる。係り受け条件は、文節間の係り受け(関係)についての条件が示されている。例えばレコード401を用いた場合、後述する判断部107は、文節B―A間の係り受けが「の」又は「隣」の場合に条件を満たしていると判断する。品詞条件は、各文節の自立語の品詞の条件が示されている。一致条件は、検索対象文の各文節の自立語が、検索要求文の文節の自立語と一致しているか否かを条件として設定されている。「不一致」は検索要求文の文節の自立語と一致していないことを示し、「一致」は検索要求文の文節の自立語と一致していることを示している。
つまり、レコード401の分類ID=2、ルールID=1の置換ルールは、名詞Bが名詞Aに係り、名詞Aが単語(品詞は任意のものとする)Cに係るパタンを検索対象文に含まれている場合に、後述する判断部107は、これら文節間において名詞Bと名詞Aの関係が「の」又は「隣」であり、名詞Bは検索要求文の文節と一致し、名詞Aは検索要求文の文節と不一致したのであれば、置換条件を満たしていると判断する。そして、後述する置換部108は、検索対象文の名詞Bが名詞Aに係り、名詞Aが単語Cに係るパタンを、名詞Bが単語Cに係るパタンに置換する。
置換順序記憶部103は、上述した置換ルールが設定されている分類の呼び出し順序を保持する置換順序管理テーブルを格納している。図6に示すように、置換順序管理テーブルは、分類IDと、ルール分類とを対応付けて保持している。そして、本実施の形態にかかる情報検索装置100では、当該置換順序管理テーブルの上のレコードから順に、置換処理を行うこととする。つまり、最初に動詞句の置換ルールで処理を行い、次に名詞句の置換ルールで処理を行い、最後に格共有の置換ルールで処理を行うことになる。
入力部105は、利用者から検索要求文の入力を受け付け、入力された検索要求文の入力処理を行う。
構文解析部106は、入力部105が入力処理した検索要求文に対して構文解析を行い、当該検索要求文の文節毎の自立語間の係り受け構造を示した構文木を生成する。また、各文節の自立語の品詞の判定処理も行う。次に、入力部105が「読みを送信する」という検索要求文を入力処理した場合に、構文解析部106が行った構文解析結果について説明する。
図7に示すように構文解析部106は、検索要求文が2つの文節を含み、これら文節である名詞「読み」と、動詞「送信する」との間に係り受け関係が存在していると解析する。構文解析部106は、さらに当該係り受けの関係を「を」と解析する。
文節特定部111は、検索対象文と検索要求文との間で一致(または類義にあたる単語として別途登録されている単語と一致)する自立語を含む文節を特定する。そして、文節特定部111は、一致する自立語を含む文節を特定した場合に、一致した自立語を含む検索要求文の文節を示す文節IDを、一致文節IDとして検索対象文記憶部101の検索対象文管理テーブルに格納する。なお、詳細な処理手順については後述する。
また、文節特定部111は、一致する自立語を含む文節を特定した場合に、一致した自立語を含む検索対象文の文節を示す文節IDを、検索要求文の一致文節IDとして検索要求文一致文節記憶部112の検索要求文一致文節管理テーブルに格納する。
検索要求文一致文節記憶部112は、検索要求文一致文節管理テーブルを記憶する。検索要求文一致文節管理テーブルは、検索要求文の文節毎に、検索対象文の一致した文節を対応付けて保持する。なお、検索要求文一致文節管理テーブルのテーブル構造については後述する。
判断部107は、置換順序記憶部103に格納されている分類順に、文節特定部111に自立語が一致すると特定された文節、及び置換ルール記憶部102に記憶された当該分類の置換ルールを用いて、対象パタンを置換パタンに置換する置換条件を満たしているか否か判断する。なお、詳細な処理手順については後述する。
置換部108は、判断部107により置換条件を満たしていると判断された場合に、検索対象文に含まれている部分構文木のうち、置換ルール記憶部102に格納されている対象パタンに一致する部分構文木を、置換パタンとして示されている部分構文木に置換する処理を行う。そして、置換部108は、置換処理したあとの検索対象文を後述する置換履歴格納部104に格納する。なお、詳細な処理手順については後述する。
また、本実施の形態では、判断部107及び置換部108は、検索対象文記憶部101に格納されている全ての検索対象文に対して処理を行うが、このような処理に制限するものではない。例えば、検索要求文に類似しそうな検索対象文を予め抽出してから、判断部107及び置換部108による処理を行ってもよい。
置換履歴格納部104は、置換部108により行われた置換処理後の検索対象文を処理ステップ毎に格納している。なお、格納された後のデータ等については後述する。
類似度判定部109は、置換履歴格納部104に格納された置換処理後の検索対象文と、利用者により入力された検索要求文との間の類似度を判定する。詳細な類似度判定手法については後述する。
表示処理部110は、検索対象文を、類似度判定部109による判定結果と共に、検索対象文を表示処理、つまり後述する表示部に出力する処理を行う。また、表示処理部110は、検索対象文を表示処理する際、置換履歴格納部104に格納された分類毎の置換結果を表示処理する。
次に、図1に示す情報検索装置100が行う全体の処理手順について、図8を用いて説明する。
まず、入力部105は、検索要求文の入力処理を行う(ステップS801)。次に、構文解析部106は、入力処理された検索対象文に対して構文解析を行い、検索対象文の構文木を生成する(ステップS802)。
そして、文節特定部111は、検索対象文と検索要求文との間で一致する自立語を含む文節を特定する(ステップS803)。そして、文節特定部111は、一致する自立語を含む文節を特定した場合に、一致した自立語を含む検索要求文の文節を示す文節IDを、一致文節IDとして検索対象文記憶部101の検索対象文管理テーブルに格納する。
次に、判断部107及び置換部108は、検索対象文に含まれる部分構文木の置換処理を行う(ステップS804)。
そして、類似度判定部109は、ステップS804で置換された検索対象文と、検索要求文との間で類似度を判定する(ステップS805)。
そして、表示処理部110は、類似度判定部109による判定結果に基づいて、検索対象文の表示処理を行う(ステップS806)。
次に、図8のステップS803に示した文節特定部111における検索対象文と検索要求文との間で一致する自立語を含む文節を特定する処理手順について、図9を用いて説明する。
まず、文節特定部111は、変数i及び変数jに初期値として‘1’を設定する(ステップS901)。
次に、文節特定部111は、検索要求文の文節ID“i”の自立語と、現在処理対象である検索対象文の文節ID“j”の自立語とが一致するか否か判断する(ステップS902)。また、文節特定部111は、一致しないと判断した場合(ステップS902:No)、これら文節ID間について特に設定処理を行わない。
そして、文節特定部111は、各自立語が一致すると判断した場合(ステップS902:Yes)、検索要求文の文節ID“i”の一致文節IDとして“j”を設定する(ステップS903)。そして、文節特定部111は、当該一致文節IDを、検索要求文一致文節管理テーブルに登録する。
図10に示すように、検索要求文一致文節管理テーブルは、検索要求文の各文節IDに対して、検索対象文の文ID毎に一致した文節IDである一致文節IDを格納している。
図9に戻り、文節特定部111は、検索対象文の文節ID“j”の一致文節IDとして“i”を設定する(ステップS904)。そして、文節特定部111は、当該一致文節IDを、検索対象文管理テーブルに登録する。
図11に示すように、各検索対象文の文節IDと対応付けられた一致文節IDに、一致した検索要求文の文節IDを登録している。
図9に戻り、文節特定部111は、検索対象文に処理を行っていない文節があるか否か判断する(ステップS905)。あると判断した場合(ステップS905:Yes)、変数jに“1”追加し(ステップS906)、再びステップS902から処理を行う。
そして、文節特定部111は検索対象文の全ての文節に対して処理を行ったと判断した場合(ステップS905:No)、検索要求文に処理を行っていない文節があるか否か判断する(ステップS907)。あると判断した場合(ステップS907:Yes)、検索対象文の処理対象の文節IDを示す変数jに初期値‘1’を設定すると共に、変数iに“1”追加し(ステップS908)、再びステップS902から処理を行う。
次に、文節特定部111は、検索要求文の全ての文節に対して処理を行ったと判断した場合(ステップS907:No)、処理を行っていない検索対象文があるか否か判断する(ステップS909)。あると判断した場合(ステップS909:Yes)、文節特定部111は、処理を行っていない検索対象文を、処理対象に設定し(ステップS910)、再びステップS901から処理を行うこととする。
そして、文節特定部111は、全ての検索対象文に対して処理を行ったと判断した場合(ステップS909:No)、処理を終了する。
上述した処理手順により、検索対象文の文節と、検索要求文の文節とについて、同じ自立語を含む文節間で対応付けられたことになる。
次に、図8のステップS804に示した判断部107及び置換部108による検索対象文に含まれる部分構文木の置換処理手順について、図12を用いて説明する。
まず、判断部107は、検索対象文記憶部101の最初(文ID=1)の検索対象文の第1の文節(文節ID=1)を処理対象として設定する(ステップS1201)。なお、判断部107は、置換順序記憶部103に記憶された順序に従って分類ID“1”から順に処理を行うこととする。
次に、判断部107は、処理対象の文節を含む構文木において、当該分類の所定の置換ルール(最初はルールID‘1’の置換ルール)の条件と一致するか否か判断する(ステップS1202)。図4に示した置換ルール管理テーブルでは、処理対象として着目されている文節を対象パタンのAの相当しているものとする。そして、判断部107は、対象パタンの係り受け構造が成り立つと共に、当該対象パタンと対応付けられている係り受け条件、品詞条件、及び一致条件を満足している場合に置換ルールの条件と一致していると判断する。
そして、判断部107が置換ルールの条件と一致していないと判断した場合(ステップS1202:No)、当該分類において他の置換ルールがあるか否か判断する(ステップS1203)。そして、判断部107は、他の置換ルールがあると判断した場合(ステップS1203:Yes)、当該他の置換ルールを次に用いる置換ルールとして設定する(ステップS1204)。図4に示した置換ルールでは、例えば分類ID‘1’においては2つの置換ルールが存在するため、ルールID‘1’の条件に一致しなかった場合に、ルールID‘2’の条件に一致するか否かの判断が行われることになる。このように小さい数のルールIDから順に一致するか否かを判断していくことになる。
そして、置換ルール管理テーブルでは、数が小さいルールIDほど、置換条件が複雑なものであり、ルールIDの数が大きくなるほど置換条件が単純になるように設定している(例えば分類ID=3の置換ルール参照)。これにより、複雑な置換条件に一致した場合に当該複雑な置換条件と対応付けられた置換処理が適用され、単純な置換条件と対応付けられた置換処理は適用されないことになる。このように置換ルールに優先順位を設定したことで、本実施の形態にかかる情報検索装置100では、検索対象文の構文木に対して、より適切な置換(パラフレーズ)が可能となる。
また、判断部107は、置換ルールで設定されている置換条件と一致していると判断した場合(ステップS1202:Yes)、置換部108は、検索対象文において、当該所定の置換ルールと対応付けられた対象パタンと一致する部分構文木を、当該所定の置換ルールと対応付けられた置換パタンに一致する構文木に置換する処理を行う(ステップS1205)。
そして、置換部108は、置換履歴格納部104に対して、当該置換履歴格納部104に格納されていない文節のうち、置換された構文木までの文節を格納する(ステップS1206)。
判断部107が当該分類において他の置換ルールがないと判断した場合(ステップS1203:No)又はステップS1206の処理が終了した後、判断部107は、処理対象の検索対象文中に処理を行っていない文節があるか否かを判断する(ステップS1207)。処理を行っていない文節があると判断した場合(ステップS1207:Yes)、処理対象であった文節の次の文節を、処理対象として設定する(ステップS1208)。そして、再びステップS1202から処理を行う。
そして、判断部107が全ての文節について処理が終了したと判断した場合(ステップS1207:No)、置換されなかったため当該置換履歴格納部104に格納されていない文節を、置換履歴格納部104に格納する(ステップS1209)。
次に、判断部107は、当該検索対象文に対して、処理を行っていない分類があるか否か判断する(ステップS1210)。そして、判断部107は処理を行っていない分類があると判断した場合(ステップS1210:Yes)、置換順序記憶部103に記憶された分類の順序に従って、次の分類を処理対象として設定する(ステップS1211)。
また、判断部107は全ての分類において処理を行ったと判断した場合(ステップS1210:No)、処理を行っていない検索対象文があるか否か判断する(ステップS1212)。そして、処理を行っていない検索対象文があると判断した場合(ステップS1212:Yes)、処理を行っていない検索対象文を次の処理対象として設定する(ステップS1213)。さらに、判断部107は、置換順序記憶部103で設定された最初の分類の最初の置換ルールを用いてステップS1202から処理を再開する。
そして、判断部107は、処理を行っていない検索対象文がないと判断した場合(ステップS1212:Yes)、処理を終了する。
図13−1〜図13−4に示すように、検索対象文毎に、置換順序記憶部103に記憶された分類順に置換された後の検索対象文の構文木が格納されている。このように処理ステップ(分類)毎に置換された履歴が格納されているので、分類毎にどのような置換が行われたのか特定することができる。
次に、図8のステップS805に示した類似度判定部109による置換された検索対象文と、検索要求文との間で類似度を判定処理手順について、図14を用いて説明する。なお、図14の示す処理手順は、検索対象文毎に行われるものとする。
まず、類似度判定部109は、変数iに初期値として‘1’を設定する(ステップS1401)。次に、類似度判定部109は、リンク一致数に初期値として‘0’を設定する(ステップS1402)。また、リンク一致数とは、置換処理後の検索対象文と検索要求文との間で文節に含まれる自立語と、当該文節の親の文節に含まれる自立語とが一致した数を示したものである。当該リンク一致数が所定の基準値以上の場合に、検索対象文と検索要求文とが類似しているものと判断する。
そして、類似度判定部109は、検索要求文一致文節管理テーブルを参照して、検索要求文の文節ID“i”で一致文節IDがあるか否かを判断する(ステップS1403)。この際、類似度判定部109は一致文節IDがあると判断した場合(ステップS1403:Yes)、当該一致文節IDを変数“j”に設定する(ステップS1404)。
次に、類似度判定部109は、検索要求文の文節ID“i”の親文節IDの一致文節IDが、置換部108により置換された後の検索対象文の文節ID“j”の親文節IDと一致するか否か判断する(ステップS1405)。一致しないと判断した場合(ステップS1405:No)、特に処理を行わない。
そして、類似度判定部109は、一致すると判断した場合(ステップS1405:Yes)、リンク一致数に1追加する(ステップS1406)。
次に、類似度判定部109は、検索要求文に上述した処理を行っていない文節があるか否か判断する(ステップS1407)。そして、文節があると判断した場合(ステップS1407:Yes)、変数iに‘1’追加して(ステップS1408)、ステップS1403から処理を再開する。
また、類似度判定部109は、全ての文節に対して上述した処理を行ったと判断した場合(ステップS1207:No)、現在のリンク一致数を類似度判定結果として設定した後(ステップS1409)、処理を終了する。
上述した処理を行うことで、検索対象文毎に、算出されたリンク一致数を類似度判定結果として取得したことになる。そして、表示処理部110は、当該類似度検索結果が所定の基準値以上の場合に類似していると判断し、類似していることを視認できるように表示処理する。
本実施の形態では、所定の基準値を‘1’とする。そして、図13―1〜図13−4に示した置換された後の検索対象文に対して、図14に示した処理を行うと、文ID=1、3及び4の類似度判定結果が‘1’以上となるが、文ID=2の類似度判定結果は‘0’となる。
そこで、表示処理部110は、文ID=1、3及び4の検索対象文については類似する旨を表示し、文ID=2の検索対象文については非類似である旨を表示する。
図15に示すように、表示処理部110は、類似している文ID=1、3及び4に対しては類似している旨を示す‘○’を表示し、文ID=2に対しては非類似である旨を示す‘×’を表示する。さらに表示処理部110は、置換履歴格納部104を参照して、分類毎の置換過程を表示する。
図15の例に示すように、表示処理部110は、文ID‘1’の文に対して、「読みを付与し、送信を実行する」から、「読みを付与し、送信する」を経由して「読みを送信する」までの置換過程の表示を行う。
また、表示処理部110は、文ID‘2’の文に対して、「読みを生成し、音声の送信を実行する」から「読みを生成し、音声を送信する」までの置換過程の表示を行う。
また、表示処理部110は、文ID‘3’の文に対して、「漢字の読み情報を付与し、送信する」から、「読みを付与し、送信する」を経由して「読みを送信する」までの置換過程の表示を行う。
また、表示処理部110は、文ID‘4’の文に対して、「漢字の読み情報を付与し、送信を実行する」から、「漢字の読み情報を付与し、送信する」を経由して、「読みを付与し、送信する。」までの置換過程の表示を行う。
本実施の形態では、置換順序記憶部103に格納された分類順(動詞句、名詞句、格共有)に置換を行うこととした。これは、最初に動詞句について置換を行うことで、不要な自立語を含む文節を削除した後で、名詞句、格共有の順にパラフレーズを行うことを目的としたものである。
ここで仮に、置換順序記憶部103において、分類の呼出順序で、動詞句と格共有との呼出順序を反対にした場合、格共有の処理が先に行われることになる。その場合、文ID‘1’の文において、不要な文節が削除されていないため、格共有処理を行うための条件を満たさなくなる。このため、文ID‘1’の検索対象文「読みを付与し、送信を実行する」は、格共有の分類による置換が行われることなく処理が終了する。
上述した実施の形態にかかる情報検索装置100では、高い精度で検索要求文に類似する検索対象文を特定することが可能となる。これにより、例えば、利用者により入力された検索要求文を言い換えた検索対象文を含む文書を検索することが可能となる。
また、本実施の形態にかかる情報検索装置100では、置換順序記憶部103において、分類の呼出順序を置換するために適切な順序で設定しているため、より高い精度で置換することを可能としている。
また、本実施の形態にかかる情報検索装置100では、分類毎の置換過程をひとまとめにして表示処理している。これに対して、置換過程をひとまとめに表示しない場合、文ID‘4’の文では、検索対象文「漢字の読み情報を付与し、送信を実行する」から、置換過程として、「漢字の読み情報を付与し、送信する」、「読み情報を付与し、送信する。」、「読みを付与し、送信する。」が表示された後、置換結果として「読みを送信する」を表示することになる。この場合、表示が煩雑になるので、処理の過程を利用者が容易に認識することが困難となる。これに対して本実施の形態にかかる情報検索装置100では、分類語との置換過程をひとまとめで表示しているので、置換過程の表示が煩雑になることを防止し、置換過程を利用者が容易に認識することが可能となる。
このように、本実施の形態にかかる情報検索装置100では、置換ルール記憶部102に置換ルールを分類毎に記憶し、置換処理についても分類毎に行うこととした。このため、置換ルールの適用順序の制御を可能とすると共に、置換ルールを用いた置換過程を適切な粒度毎にまとめて表示することを可能としている。
これにより、検索要求文を言い換えた多様なパラフレーズ表現の検索と、当該検索結果の妥当性を容易に確認することができる。
なお、本実施の形態にかかる情報検索装置100では、検索対象文をすべて表示しているが、このような表示形式に限らず、例えば上述した処理により類似すると判定された検索対象文のみを表示してもよい。さらに、本発明はその趣旨を逸脱しない範囲内で種々の応用が可能である。
図16に示すように、情報検索装置100は、ハードウェア構成として、上述した処理を行う情報出力プログラムなどが格納されているROM1602と、ROM1602内のプログラムに従って当該装置の各部を制御するCPU1601と、当該装置の制御に必要な種々のデータを記憶するRAM(Random Access Memory)1603と、上述した処理結果等を表示する表示部1605と、ネットワークに接続する通信I/F1604と、ハードディスクなどの外部記憶装置1606と、利用者が入力する際に用いる入力デバイス1607と、各部を接続するバス1608と、を備えている。また、情報検索装置100は、上述した構成を備えた一般的なコンピュータに適用することができる。
上述した実施の形態にかかる情報検索装置100で実行される情報出力プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
この場合には、情報出力プログラムは、情報検索装置100の各装置において上記記録媒体から読み出して実行することにより主記憶装置上にロードされ、上記ソフトウェア構成で説明した各部が主記憶装置上に生成されるようになっている。
また、上述した実施の形態にかかる情報検索装置100で実行される情報出力プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、上述した実施の形態にかかる情報検索装置100で実行される情報出力プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
また、本実施形態の情報出力プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
第1の実施の形態にかかる情報検索装置の構成を示すブロック図である。 検索対象文記憶部が記憶する検索対象文管理テーブルのテーブル構造を示した図である。 検索対象文管理テーブルに格納された文ID“1”の構文木のツリー構造を示した図である。 置換ルール記憶部が保持する置換ルール管理テーブルのテーブル構造を示した図である。 置換前に部分構文木に対応する対象パタンの構文木と、置換後の部分構文木に対応する置換パタンの構文木とを示した説明図である。 置換順序管理テーブルのテーブル構造を示した図である。 構文解析部による検索要求文「読みを送信する」の構文解析結果を示した図である。 情報検索装置が行う全体の処理手順を示すフローチャートである。 文節特定部における検索対象文と検索要求文との間で一致する自立語を含む文節を特定する処理手順を示すフローチャートである。 検索要求文一致文節管理テーブルのテーブル構造を示した図である。 一致文節IDを追加した後の検索対象文管理テーブルを示した図である。 判断部及び置換部による検索対象文に含まれる部分構文木の置換処理手順を示すフローチャートである。 分類毎に置換された文ID“1”の検索対象文を、置換履歴格納部に格納したテーブル構造の例を示した図である。 分類毎に置換された文ID“2”の検索対象文を、置換履歴格納部に格納したテーブル構造の例を示した図である。 分類毎に置換された文ID“3”の検索対象文を、置換履歴格納部に格納したテーブル構造の例を示した図である。 分類毎に置換された文ID“4”の検索対象文を、置換履歴格納部に格納したテーブル構造の例を示した図である。 類似度判定部による置換された検索対象文と、検索要求文との間で類似度の判定処理手順を示すフローチャートである。 表示処理部が表示する検索結果の例を示す図である。 情報検索装置のハードウェア構成を示す図である。
符号の説明
100 情報検索装置
101 検索対象文記憶部
102 置換ルール記憶部
103 置換順序記憶部
104 置換履歴格納部
105 入力部
106 構文解析部
107 判断部
108 置換部
109 類似度判定部
110 表示処理部
111 文節特定部
112 検索要求文一致文節記憶部
1601 CPU
1602 ROM
1603 RAM
1604 通信I/F
1605 表示部
1606 外部記憶装置
1607 入力デバイス
1608 バス

Claims (8)

  1. 入力文の入力を受け付ける入力手段と、
    前記入力文による検索の対象となる検索対象文と、当該検索対象文における、文節毎の自立語と、前記自立語を木構造のノードとした自立語間の係り受け構造を保持する構文木と、を対応付けて記憶する文記憶手段と、
    前記入力文を構文解析して、当該入力文の自立語間の係り受け構造を保持する構文木を生成する構文木生成手段と、
    複数の自立語間の係り受け構造を示す第1の部分構文木パタンと、前記第1の部分構文木の言い換えとなる自立語間の係り受け構造を示す部分構文木パタンであって前記第1の部分構文木より前記ノードの数が少ない第2の部分構文木パタンと、前記第1の部分構文木パタンを前記第2の構文木パタンに置換する置換条件と、を対応付けて記憶する構文木パタン記憶手段と、
    前記文記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記構文木パタン記憶手段が記憶する前記置換条件に一致するか否か判断する判断手段と、
    前記置換条件に一致すると判断した場合に、当該置換条件に対応付けられた前記第1の部分構文木パタンと一致する前記検索対象文に含まれている前記部分構文木を、当該置換条件と対応付けられた前記第2の部分構文木パタンで置き換える置換手段と、
    前記構文木生成手段により生成された前記入力文の前記構文木と、前記置換手段により置き換えられた前記検索対象文の構文木との類似度を判定する類似度判定手段と、
    判定された前記類似度が所定の条件を満たす場合、前記置換手段により置換される前の前記検索対象文を、検索結果として出力する出力手段と、
    を備えることを特徴とする情報検索装置。
  2. 前記構文木パタン記憶手段は、文の区切りとなる所定のまとまり毎に、前記第1の部分構文木パタンと、前記第2の部分構文木パタンと、前記置換条件と、を対応付けて記憶し、
    前記判断手段は、前記所定のまとまり毎に、前記文記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記構文木パタン記憶手段が記憶する前記置換条件に一致するか否か判断すること、
    を特徴とする請求項1に記載の情報検索装置。
  3. 前記所定のまとまり毎に前記判断手段により判断を行う順序を記憶する順序記憶手段と、をさらに備え、
    前記判断手段は、前記順序記憶手段に記憶された順序で前記所定のまとまり毎に、前記文記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記構文木パタン記憶手段が記憶する前記置換条件に一致するか否か判断すること、
    を特徴とする請求項2に記載の情報検索装置。
  4. 前記構文木パタン記憶手段は、前記所定のまとまり毎に、前記置換条件について複雑な係り受け構造を満たした場合に一致すると判断される複雑条件から、単純な係り受け構造を満たした場合に一致すると判断される単純条件まで複数個記憶し、
    前記判断手段は、さらに、前記置換条件について前記複雑条件から前記単純条件の順に一致するか否か判断すること、
    を特徴とする請求項1乃至3のいずれか一つに記載の情報検索装置。
  5. 前記出力手段は、さらに、前記置換手段により前記所定のまとまり毎に、前記置換手段により前記構文木を置き換えられた前記検索対象文を出力すること、
    を特徴とする請求項1乃至4のいずれか一つに記載の情報検索装置。
  6. 前記構文木パタン記憶手段は、前記置換条件として、前記第1の部分構文木パタンと構造が一致する前記検索対象文の前記部分構文木に含まれるノードにおいて前記入力文が有する前記自立語を含むノードの位置の条件、及び前記部分構文木のノード間の接続関係の条件のうちいずれか一つ以上設定されていること、
    を特徴とする請求項1乃至5のいずれか一つに記載の情報検索装置。
  7. 入力文の入力を受け付ける入力ステップと、
    前記入力文による検索の対象となる検索対象文と、当該検索対象文における、文節毎の自立語と、前記自立語を木構造のノードとした自立語間の係り受け構造を保持する構文木と、を対応付けて記憶部に記憶する文記憶ステップと、
    前記入力文を構文解析して、当該入力文の自立語間の係り受け構造を保持する構文木を生成する構文木生成ステップと、
    前記記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記第1の部分構文木パタンを前記第2の構文木パタンに置換する置換条件に一致するか否か判断する判断ステップと、
    前記置換条件に一致すると判断した場合に、複数の自立語間の係り受け構造を示す部分構文木であって前記置換条件と対応付けられている第1の部分構文木パタンと一致する、前記検索対象文に含まれている前記部分構文木を、当該第1の部分構文木パタンと対応付けられていると共に前記第1の部分構文木の言い換えとなる自立語間の係り受け構造を示す部分構文木パタンであって前記第1の部分構文木より前記ノードの数が少ない第2の部分構文木パタンで置き換える置換ステップと、
    前記構文木生成ステップにより生成された前記入力文の前記構文木と、前記置換ステップにより置き換えられた前記検索対象文の構文木との類似度を判定する類似度判定ステップと、
    判定された前記類似度が所定の基準値以上の場合、前記置換ステップにより置換される前の前記検索対象文を、検索結果として出力する出力ステップと、
    を有することを特徴とする情報検索方法。
  8. 入力文の入力を受け付ける入力ステップと、
    前記入力文による検索の対象となる検索対象文と、当該検索対象文における、文節毎の自立語と、前記自立語を木構造のノードとした自立語間の係り受け構造を保持する構文木と、を対応付けて記憶部に記憶する文記憶ステップと、
    前記入力文を構文解析して、当該入力文の自立語間の係り受け構造を保持する構文木を生成する構文木生成ステップと、
    前記記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記第1の部分構文木パタンを前記第2の構文木パタンに置換する置換条件に一致するか否か判断する判断ステップと、
    前記置換条件に一致すると判断した場合に、複数の自立語間の係り受け構造を示す部分構文木であって前記置換条件と対応付けられている第1の部分構文木パタンと一致する、前記検索対象文に含まれている前記部分構文木を、当該第1の部分構文木パタンと対応付けられていると共に前記第1の部分構文木の言い換えとなる自立語間の係り受け構造を示す部分構文木パタンであって前記第1の部分構文木より前記ノードの数が少ない第2の部分構文木パタンで置き換える置換ステップと、
    前記構文木生成ステップにより生成された前記入力文の前記構文木と、前記置換ステップにより置き換えられた前記検索対象文の構文木との類似度を判定する類似度判定ステップと、
    判定された前記類似度が所定の条件を満たす場合、前記置換ステップにより置換される前の前記検索対象文を、検索結果として出力する出力ステップと、
    をコンピュータに実行させる情報検索プログラム。
JP2007087389A 2007-03-29 2007-03-29 情報検索装置、情報検索方法及び情報検索プログラム Expired - Fee Related JP5160120B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007087389A JP5160120B2 (ja) 2007-03-29 2007-03-29 情報検索装置、情報検索方法及び情報検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007087389A JP5160120B2 (ja) 2007-03-29 2007-03-29 情報検索装置、情報検索方法及び情報検索プログラム

Publications (2)

Publication Number Publication Date
JP2008250388A true JP2008250388A (ja) 2008-10-16
JP5160120B2 JP5160120B2 (ja) 2013-03-13

Family

ID=39975307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007087389A Expired - Fee Related JP5160120B2 (ja) 2007-03-29 2007-03-29 情報検索装置、情報検索方法及び情報検索プログラム

Country Status (1)

Country Link
JP (1) JP5160120B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010256977A (ja) * 2009-04-21 2010-11-11 Toshiba Corp 情報検索装置およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108583A (ja) * 2001-09-27 2003-04-11 Seiko Epson Corp 言語文を用いた検索装置、検索システム、検索方法、プログラム、および記録媒体
JP2003167898A (ja) * 2001-12-04 2003-06-13 Tokyo Soft Kk 情報検索システム
JP2007041767A (ja) * 2005-08-02 2007-02-15 Nec Corp テキストマイニング装置、テキストマイニング方法、テキストマイニングプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108583A (ja) * 2001-09-27 2003-04-11 Seiko Epson Corp 言語文を用いた検索装置、検索システム、検索方法、プログラム、および記録媒体
JP2003167898A (ja) * 2001-12-04 2003-06-13 Tokyo Soft Kk 情報検索システム
JP2007041767A (ja) * 2005-08-02 2007-02-15 Nec Corp テキストマイニング装置、テキストマイニング方法、テキストマイニングプログラム

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CSNG200200707001; 松村敦: '構造化インデクスを用いた情報検索システム' アドバンスト・データベース・シンポジウム'97 Vol.97,No.11, 19971215, pp.151-158, 社団法人情報処理学会 *
CSNG200800048001; 乾健太郎: '言語表現を言い換える技術' 言語処理学会第8回年次大会チュートリアル資料 , 20020317, pp.1-21, 言語処理学会 *
CSNJ200910070046; 永松健司: '係り受け構造を持つ表現に対する類似度判定手法の提案' 第55回(平成9年後期)全国大会講演論文集(2) 人工知能と認知科学 , 19970924, pp.2-87〜2-88, 社団法人情報処理学会 *
JPN6012011973; 松村敦: '構造化インデクスを用いた情報検索システム' アドバンスト・データベース・シンポジウム'97 Vol.97,No.11, 19971215, pp.151-158, 社団法人情報処理学会 *
JPN6012011975; 永松健司: '係り受け構造を持つ表現に対する類似度判定手法の提案' 第55回(平成9年後期)全国大会講演論文集(2) 人工知能と認知科学 , 19970924, pp.2-87〜2-88, 社団法人情報処理学会 *
JPN6012011979; 乾健太郎: '言語表現を言い換える技術' 言語処理学会第8回年次大会チュートリアル資料 , 20020317, pp.1-21, 言語処理学会 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010256977A (ja) * 2009-04-21 2010-11-11 Toshiba Corp 情報検索装置およびプログラム

Also Published As

Publication number Publication date
JP5160120B2 (ja) 2013-03-13

Similar Documents

Publication Publication Date Title
US10169337B2 (en) Converting data into natural language form
JP4645242B2 (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US20100287162A1 (en) method and system for text summarization and summary based query answering
JP6828335B2 (ja) 検索プログラム、検索装置および検索方法
JPWO2007099812A1 (ja) 質問回答装置、質問回答方法および質問回答用プログラム
JP2007323671A (ja) 中国語テキストにおける単語分割
US9218336B2 (en) Efficient implementation of morphology for agglutinative languages
JP5447368B2 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
JP5160120B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラム
JP4745417B2 (ja) 情報検索装置およびプログラム
KR101835994B1 (ko) 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치
JP6787755B2 (ja) 文書検索装置
JP5085584B2 (ja) 記事特徴語抽出装置、記事特徴語抽出方法及びプログラム
JP4476609B2 (ja) 中国語解析装置、中国語解析方法および中国語解析プログラム
JP4646328B2 (ja) 関係情報抽出装置及びその方法
JP2008026967A (ja) 文書検索システム及びプログラム
JP2009104475A (ja) 類似文書検索装置、類似文書検索方法およびプログラム
JP2001101184A (ja) 構造化文書生成方法及び装置及び構造化文書生成プログラムを格納した記憶媒体
JP2006243976A (ja) 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置
JP5038881B2 (ja) 情報検索装置
JP2005157823A (ja) 知識ベースシステム、および同システムにおける単語間の意味関係判別方法、ならびにそのコンピュータプログラム
JP2005234800A (ja) 用例機械翻訳装置及び用例翻訳コンピュータプログラム、並びに用例検索装置及び用例検索コンピュータプログラム
KR101450795B1 (ko) 대용어 복원 장치 및 방법
JP4060832B2 (ja) 自然言語解析装置及び方法、自然言語解析プログラム
JP2020191099A (ja) 文書検索装置、文書検索方法およびコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100323

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20100323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121212

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5160120

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151221

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees