JP2008129662A - 情報抽出装置、情報抽出方法、情報抽出プログラム - Google Patents

情報抽出装置、情報抽出方法、情報抽出プログラム Download PDF

Info

Publication number
JP2008129662A
JP2008129662A JP2006310777A JP2006310777A JP2008129662A JP 2008129662 A JP2008129662 A JP 2008129662A JP 2006310777 A JP2006310777 A JP 2006310777A JP 2006310777 A JP2006310777 A JP 2006310777A JP 2008129662 A JP2008129662 A JP 2008129662A
Authority
JP
Japan
Prior art keywords
syntax tree
parent
key
condition
child
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006310777A
Other languages
English (en)
Inventor
Motohiro Akaishizawa
元博 赤石沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006310777A priority Critical patent/JP2008129662A/ja
Publication of JP2008129662A publication Critical patent/JP2008129662A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】部分木のマッチングを高速に行うことができる情報抽出装置等を提供すること
【解決手段】情報抽出装置は、単語辞書と、テキストの各文の構文木を生成する解析部と、構文木から単語間の親子関係を抽出し、親子関係を表すキーを作成し、そのキーを構文木を特定する構文木IDおよび親子関係を構成する単語の構文木におけるノードID列と対応づけて親子インデックスを生成する親子インデックス作成部と、ルール条件構文木とアクションを含む情報抽出ルールを読み込み、検索条件のルール条件構文木からから親子インデックスと同形式の検索キーを生成し、この検索キーにより親子インデックスを検索してルール条件構文木と構文木のマッチングを行って構文木IDから対象構文木を絞り込み、ノードID列を利用して構文木とルール条件構文木でノード間のマッピングを行うことにより、対象構文木から抽出対象を特定し、特定された対象に対してアクションを行う抽出部を有している。
【選択図】図1

Description

本発明は、情報抽出に関し、特に部分木のマッチングに関する。
現在、電子メール等、大量の電子化されたテキストデータがあふれており、それらを効率的に処理するための便利なツールが必要とされている。その1つが情報抽出技術であり、一般の文字列検索とは異なり、単語がもつ属性や単語間の係り受け関係等を条件にして、必要な部分を抽出(マーク)することができる。
特許文献1にはテキストを構文解析し開発者と製品の関係を抽出する例が記載されている。
特開平7−85071号公報
情報抽出では単語間の係り受け関係も条件とすることができるが、構文解析結果に対する部分木のマッチングを行うため、抽出に時間がかかってしまう。
そこで、本発明は、部分木のマッチングを高速に行うことができる情報抽出装置等を提供することを目的とする。
本発明の情報抽出装置は、単語と各単語の統語情報を記憶する単語辞書と、単語辞書を利用して情報抽出の対象となるテキストを1文ごとに形態素解析と構文解析を行い各文の構文木を生成する解析部と、構文木から単語間の親子関係を抽出し、親子関係を表すキーを作成し、そのキーを構文木を特定する構文木IDおよび親子関係を構成する単語の構文木におけるノードID列と対応づけて親子インデックスを生成する親子インデックス作成部と、検索条件を表わすルール条件構文木と条件が満たされる場合のアクションを含む情報抽出ルールを読み込み、検索条件のルール条件構文木からから親子インデックスと同形式の検索キーを生成し、この検索キーにより親子インデックスを検索してルール条件構文木と構文木のマッチングを行って構文木IDから対象構文木を絞り込み、ノードID列を利用して構文木とルール条件構文木でノード間のマッピングを行うことにより、対象構文木から抽出対象を特定し、特定された対象に対してアクションを行う抽出部を有している(請求項1ないし請求項5)。
上記情報抽出装置によれば、親子インデックスを検索して検索キーにマッチするノードを含む構文木を対象構文木として特定する。そして、親子インデックスに含まれるノードID列によりノード間のマッピングを行い抽出対象を特定する。
そのため、部分木のマッチングに要する時間を削減することができる。
上記情報抽出装置において、単語辞書は、情報抽出ルールの検索条件となる属性情報を含むようにしてもよい(請求項2)。
上記情報抽出装置において、親子インデックス生成部は、構文木の2個または3個のノードを一組としてキーを生成するようにしてもよい(請求項3)。
上記情報抽出装置において、抽出部は、2個のノードから成り3個のノードから成る検索キーに含まれる検索キーが生成された場合には、当該検索キーをマッチングに用いないようにしてもよい(請求項4)。
上記情報抽出装置において、抽出部は、検索キーが複数得られた場合には、すべての検索キーを含む構文木を対象構文木とするようにしてもよい(請求項5)。
本発明の情報抽出方法は、 単語と各単語の統語情報を記憶する単語辞書を利用して情報抽出の対象となるテキストを1文ごとに形態素解析と構文解析を行い各文の構文木を生成する解析工程と、構文木から単語間の親子関係を抽出し、親子関係を表すキーを作成し、そのキーを構文木を特定する構文木IDおよび親子関係を構成する単語の構文木におけるノードID列と対応づけて親子インデックスを生成する親子インデックス作成工程と、検索条件を表わすルール条件構文木と条件が満たされる場合のアクションを含む情報抽出ルールを読み込み、検索条件のルール条件構文木からから親子インデックスと同形式の検索キーを生成し、この検索キーにより親子インデックスを検索してルール条件構文木と構文木のマッチングを行って構文木IDから対象構文木を絞り込み、ノードID列を利用して構文木とルール条件構文木でノード間のマッピングを行うことにより、対象構文木から抽出対象を特定し、特定された対象に対してアクションを行う抽出工程により情報抽出を行う(請求項6ないし請求項10)。
本発明の情報抽出プログラムは、コンピュータに、単語と各単語の統語情報を記憶する単語辞書を利用して情報抽出の対象となるテキストを1文ごとに形態素解析と構文解析を行い各文の構文木を生成する解析処理と、構文木から単語間の親子関係を抽出し、親子関係を表すキーを作成し、そのキーを構文木を特定する構文木IDおよび親子関係を構成する単語の構文木におけるノードID列と対応づけて親子インデックスを生成する親子インデックス作成処理と、検索条件を表わすルール条件構文木と条件が満たされる場合のアクションを含む情報抽出ルールを読み込み、検索条件のルール条件構文木からから親子インデックスと同形式の検索キーを生成し、この検索キーにより親子インデックスを検索してルール条件構文木と構文木のマッチングを行って構文木IDから対象構文木を絞り込み、ノードID列を利用して構文木とルール条件構文木でノード間のマッピングを行うことにより、対象構文木から抽出対象を特定し、特定された対象に対してアクションを行う抽出処理を実行させる(請求項11ないし請求項15)。
上記情報抽出方法と情報抽出プログラムによっても上記情報抽出装置と同様に課題を解決することができる。
第1の効果は、無駄な部分木のマッチング時間を削減できることである。
その理由は、単語間の親子関係を親子インデックスを用いて検索し、情報抽出の対象となる構文木を絞り込み、さらに対応するノードの情報を用いて、ルール条件構文木と対象構文木のノード間の対応づけを行うことによる。
次に、本発明の実施の形態について図面を参照して詳細に説明する。
図1に本発明の一実施形態である情報抽出装置1のブロック図が記述されている。
情報抽出装置1は、例えばパーソナルコンピュータであり、解析部11、親子インデックス作成部12、抽出部13、単語辞書14を備えている。情報抽出装置1は、入力されたテキスト21を抽出ルール24に含まれる条件で検索し、条件に合致する部分に対して抽出ルール24に含まれるアクションを実行し、抽出結果25を出力する。
単語辞書14は、自然言語で書かれたテキストを解析するための辞書であり、解析に必要な品詞等の統語情報が記録されている。その他、情報抽出ルールの条件となる属性情報(意味情報など)もこの辞書に入れることができる。
解析部11は、テキスト21に含まれる1文を入力とし、単語辞書14を用いて形態素解析(単語への分解)を行い、さらに、構文解析(各単語の係り受けの決定)を行う。出力結果は、構文解析木または構文木と呼ばれ、単語をノードとする木構造を表現するデータである。解析結果22には、解析部11により生成された各文の構文木が格納される。
親子インデックス作成手部12は、解析部11により生成された構文木から単語の係り受け関係で親子関係にある単語のセットからキーを作成し、このキーと構文木IDおよびキーを構成する単語のノードIDのセットと対応づける親子インデックス23を作成し、記憶装置に格納する。
抽出部13は、抽出ルール24に係り受け関係が存在するとき、その係り受け関係から親子インデックス作成部12と同じ形式で検索キーを作成し、親子インデックスを検索する。そして、その親子関係が存在する構文木を取得し、対応するノードIDを用いて、ルール条件木と構文木のノードの対応づけを行い、条件が満たされていればルールに従ったアクション(例えば抽出)を行う。
上記の各部は、情報抽出装置1のCPU(Central Processing Unit)がコンピュータプログラムを実行して情報抽出装置1のハードウェアを制御することにより実現される。
図1の全体図の各構成要素の動作を説明する。
解析部11は、1文のテキストを入力として受け取る。単語辞書14を利用して形態素解析、構文解析を行う。形態素解析、構文解析に関しては、既知の技術であるので詳細は省略する。結果として、入力文「彼が昨日カレーを食べた。」に対しては、図2に示されるような構文木を出力する。図2では、単語がひとつ割り当てられた楕円31は単語ノード、二つのノードを結ぶ矢印32は係り受け関係を示している。
図3は、同じ構文木をデータとして記述したものである。IDは各ノードのIDで、それを用いて親、子、次のノード間の関係を表現している。親は、親ノードのIDで、-1のときは親がないことを示す。子は、一番左の子ノードのIDで、-1のときは子がないことを示す。次は、右隣の兄弟のノード(共通のノードを親とするノード)のIDで、-1のときは右に兄弟がいないことを示す。また、各ノードの単語の属性として品詞と意味が記述されている。
解析部14の出力データは、文毎にファイルに格納することとする。
次に、親子インデックス作成部13の動作を説明する。構文木のデータを読み込み、親子関係にあるノードを最大3個を1組にしてキーを作成する。図3の構文木を例にとって説明する。「彼」の親に1とあるので、IDが1の「が」が「彼」の親であることが分かる。そこで、「彼\tが」(「\t」はタブを示す)という2個のノードを組にしたキーを作成できる。親子キーは、それぞれの単語の見出しをタブでつないだ文字列とする。キーに対応するデータレコードは、入力ファイル名(構文木IDとして使用)と、キーになったノードのID列とする。この場合のノードIDは、「彼」が0、「が」が1なので、"0,1"である。最大3個のノードを組としたキーを作成するので、「が」の親をさらに調べる。「が」の親のところに5とあるので、IDが5の「食べる」が親であることが分かる。従って、「彼\tが\t食べる」という3個のノードを組にしたキーが作成できる。同様にして、次のノード「が」から同じことを繰り返す。入力ファイル名を1.outとすると表1に示すデータができあがる。
なお、親子インデックスは、4個以上のノードから構成するようにしてもよい。
Figure 2008129662
各構文木ファイルに対して同じようなデータができあがり、1つのキーに対して複数データレコードが対応する可能性がある。キー部分は、ハッシュやBTREE(B木)などを用いて、高速に検索ができ、かつ容易に追加等が行えるようにしておく。一般の単語辞書等とほぼ同じしくみで実現可能であるので、詳細の説明は省略する。
次に、抽出部13の動作を説明する。図4は抽出ルールの例である。このルールは、「彼」が食べた料理をすべて抽出しようとするものである。コンディションは構文木の部分木となっている。この木から、親子インデックス作成部と同じ方法で親子関係のキーを作成する。ただし、ノード2(料理)のように、必ずしも単語の「見出し」を条件としないノードが存在するので、その部分はノードが存在しないものとして処理することとする。さらに、3個のノードを組としたキーが作成できた場合、それに含まれる2個のノードを組としたキーは不要なので削除する。その結果、
「彼\tが\t食べる」
「を\t食べる」
の2つのキーが得られる。これで、親子インデックスを検索すると、表2に示す構文木のファイル名とノードID列が得られる。
Figure 2008129662
両方のキーが存在する解析木は、1.outと10.outなので、この2つの構文木を対象として詳細なマッチングを行えば良い。
ここでは、1.out(図3の解析木)で動作を解説する。まずルールのノードと構文木のノードの対応づけを行う。検索されたデータレコードに構文木の対応するノードIDが記述されているので、対象解析木をトラバースして、マッチングをとる必要はない。
まずは、「彼\tが\t食べる」を対応させる。検索されたデータレコードに「"1.out",0,1,5」とあるので、
ルールの「彼」(0)→構文木のノード0
ルールの「が」(1)→構文木のノード1
ルールの「食べる」(4)→構文木のノード5
と対応させることができる。次に、「を\t食べる」を対応させる。
ルールの「を」(3)→構文木のノード4
ルールの「食べる」(4)→構文木のノード5
このとき、以下の2つの条件をチェックする必要がある。
・同じノードIDをもつルールノードは、構文木でも同じノードIDに対応づけられる
・違うノードIDをもつルールノードは、構文木でも違うノードIDに対応づけられる
この場合、ルールの「食べる」は同じノード(ID=4)で、構文木上でも同じノード(ID=5)に対応づけられており、その他に同一ノードに対応づけられているものはないので、条件を満たしている。「彼がA定食を食べ、彼女がB定食を食べた」などという文があった場合、「を\t食べる」が2つ出てくるので、1箇所に対応づけるべきレコードが複数ある場合がある。そのような場合は、組み合わせを尽くして、上記の2つ条件を満たす対応づけを全て見つける必要がる。
次に、ルール上存在するノードで親子インデックスでまだ対応づけられていないノードを対応づける。すでに対応づけられているノードからたどっていけば容易に対応づけることができる。ルールノード(ID=2)は「を」の子供であり、「を」は構文木ノード(ID=4)に対応づけられている。図3より、「を」の一番左の子供は、ID=3で、ID=3のノードの次(右隣りの兄弟)は-1なので、ノード(ID=3)のみが対応することが分かる。子供が複数いる場合は、1つずつ選んで、それぞれの組み合わせを調べる必要がある。
この例の場合は、対応づけのパターンは、
ルールの「彼」(0)→構文木のノード0
ルールの「が」(1)→構文木のノード1
ルールの「」(2)→構文木のノード3
ルールの「を」(3)→構文木のノード4
ルールの「食べる」(4)→構文木のノード5
の1つのみである。
ノードの対応を取ったところで、次に属性条件をチェックする。ノード2に意味(料理)という条件がある。ノード2に対応する構文木でのノードは3であり、図3のデータを見ると、ノード3には意味(料理)という属性が付いているので条件が満たされている。従って、アクションを実行し、抽出結果として、ノード2に対応する構文木のノード3の単語「カレー」を出力する。同様に10.outが条件を満たせば、さらに「野菜炒め」などが出力され、「彼が食べた料理」の全リストが抽出される。
上記の実施例では、説明を簡単にするために、親子インデックスのキーを作成する際、「が」などの助詞も見出しに使用したが、通常、このような機能語は、抽象度の高い概念に置き換えられる。例えば、「が」→「動作主」、「を」→「対象」などである。親子インデックスのキーの作り方と抽出部13が検索するときのキーの作り方が一貫していれば、特に単語の見出しを使う必要はなく、「彼\t動作主\t食べる」などとすることもでる。
次に、情報抽出装置1の効果について説明する。
第1の効果は、無駄なマッチング時間を削減することである。
その理由は、抽出部13が、単語間の親子関係を親子インデックス作成部12により作成された親子インデックスを用いて検索し、情報抽出の対象となる構文木を絞り込み、さらに対応するノードの情報を用いて、ルール条件木と構文木のノード間の対応づけを行うことによる。
本発明の一実施形態である情報抽出装置の機能ブロック図である。 構文木の例を示す図である。 構文木のデータ形式の例を示す図である。 抽出ルールのデータ形式の例を示す図である。
符号の説明
1 情報抽出装置
11 解析部
12 親子インデックス作成部
13 抽出部
14 単語辞書
21 テキスト
22 解析結果
23 親子インデックス
24 抽出ルール
25 抽出結果

Claims (15)

  1. 単語と各単語の統語情報を記憶する単語辞書と、
    前記単語辞書を利用して情報抽出の対象となるテキストを1文ごとに形態素解析と構文解析を行い各文の構文木を生成する解析部と、
    前記構文木から単語間の親子関係を抽出し、親子関係を表すキーを作成し、そのキーを構文木を特定する構文木IDおよび親子関係を構成する単語の前記構文木におけるノードID列と対応づけて親子インデックスを生成する親子インデックス作成部と、
    検索条件を表わすルール条件構文木と前記条件が満たされる場合のアクションを含む情報抽出ルールを読み込み、前記検索条件のルール条件構文木からから前記親子インデックスと同形式の検索キーを生成し、この検索キーにより前記親子インデックスを検索して前記ルール条件構文木と前記構文木のマッチングを行って前記構文木IDから対象構文木を絞り込み、前記ノードID列を利用して前記構文木と前記ルール条件構文木でノード間のマッピングを行うことにより、前記対象構文木から抽出対象を特定し、特定された対象に対して前記アクションを行う抽出部を有する情報抽出装置。
  2. 前記単語辞書は、前記情報抽出ルールの前記検索条件となる属性情報を含むことを特徴とした請求項1に記載の情報抽出装置。
  3. 前記親子インデックス生成部は、前記構文木の2個または3個のノードを一組として前記キーを生成することを特徴とした請求項1または請求項2に記載の情報抽出装置。
  4. 前記抽出部は、2個のノードから成り3個のノードから成る検索キーに含まれる検索キーが生成された場合には、当該検索キーを前記マッチングに用いないことを特徴とした請求項1ないし請求項3のいずれかひとつに記載の情報抽出装置。
  5. 前記抽出部は、前記検索キーが複数得られた場合には、すべての検索キーを含む前記構文木を前記対象構文木とすることを特徴とした請求項1ないし請求項4のいずれかひとつに記載の情報抽出装置。
  6. 単語と各単語の統語情報を記憶する単語辞書を利用して情報抽出の対象となるテキストを1文ごとに形態素解析と構文解析を行い各文の構文木を生成する解析工程と、
    前記構文木から単語間の親子関係を抽出し、親子関係を表すキーを作成し、そのキーを構文木を特定する構文木IDおよび親子関係を構成する単語の前記構文木におけるノードID列と対応づけて親子インデックスを生成する親子インデックス作成工程と、
    検索条件を表わすルール条件構文木と前記条件が満たされる場合のアクションを含む情報抽出ルールを読み込み、前記検索条件のルール条件構文木からから前記親子インデックスと同形式の検索キーを生成し、この検索キーにより前記親子インデックスを検索して前記ルール条件構文木と前記構文木のマッチングを行って前記構文木IDから対象構文木を絞り込み、前記ノードID列を利用して前記構文木と前記ルール条件構文木でノード間のマッピングを行うことにより、前記対象構文木から抽出対象を特定し、特定された対象に対して前記アクションを行う抽出工程を有する情報抽出方法。
  7. 前記単語辞書は、前記情報抽出ルールの前記検索条件となる属性情報を含むことを特徴とした請求項6に記載の情報抽出方法。
  8. 前記親子インデックス生成工程では、前記構文木の2個または3個のノードを一組として前記キーを生成することを特徴とした請求項6または請求項7に記載の情報抽出方法。
  9. 前記抽出工程では、2個のノードから成り3個のノードから成る検索キーに含まれる検索キーが生成された場合には、当該検索キーを前記マッチングに用いないことを特徴とした請求項6ないし請求項8のいずれかひとつに記載の情報抽出方法。
  10. 前記抽出工程では、前記検索キーが複数得られた場合には、すべての検索キーを含む前記構文木を前記対象構文木とすることを特徴とした請求項6ないし請求項9のいずれかひとつに記載の情報抽出方法。
  11. コンピュータに、
    単語と各単語の統語情報を記憶する単語辞書を利用して情報抽出の対象となるテキストを1文ごとに形態素解析と構文解析を行い各文の構文木を生成する解析処理と、
    前記構文木から単語間の親子関係を抽出し、親子関係を表すキーを作成し、そのキーを構文木を特定する構文木IDおよび親子関係を構成する単語の前記構文木におけるノードID列と対応づけて親子インデックスを生成する親子インデックス作成処理と、
    検索条件を表わすルール条件構文木と前記条件が満たされる場合のアクションを含む情報抽出ルールを読み込み、前記検索条件のルール条件構文木からから前記親子インデックスと同形式の検索キーを生成し、この検索キーにより前記親子インデックスを検索して前記ルール条件構文木と前記構文木のマッチングを行って前記構文木IDから対象構文木を絞り込み、前記ノードID列を利用して前記構文木と前記ルール条件構文木でノード間のマッピングを行うことにより、前記対象構文木から抽出対象を特定し、特定された対象に対して前記アクションを行う抽出処理を実行させる情報抽出プログラム。
  12. 前記単語辞書は、前記情報抽出ルールの前記検索条件となる属性情報を含むことを特徴とした請求項11に記載の情報抽出プログラム。
  13. 前記親子インデックス生成処理では、前記構文木の2個または3個のノードを一組として前記キーを生成することを特徴とした請求項11または請求項12に記載の情報抽出プログラム。
  14. 前記抽出処理では、2個のノードから成り3個のノードから成る検索キーに含まれる検索キーが生成された場合には、当該検索キーを前記マッチングに用いないことを特徴とした請求項11ないし請求項13のいずれかひとつに記載の情報抽出プログラム。
  15. 前記抽出処理では、前記検索キーが複数得られた場合には、すべての検索キーを含む前記構文木を前記対象構文木とすることを特徴とした請求項11ないし請求項14のいずれかひとつに記載の情報抽出プログラム。
JP2006310777A 2006-11-16 2006-11-16 情報抽出装置、情報抽出方法、情報抽出プログラム Withdrawn JP2008129662A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006310777A JP2008129662A (ja) 2006-11-16 2006-11-16 情報抽出装置、情報抽出方法、情報抽出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006310777A JP2008129662A (ja) 2006-11-16 2006-11-16 情報抽出装置、情報抽出方法、情報抽出プログラム

Publications (1)

Publication Number Publication Date
JP2008129662A true JP2008129662A (ja) 2008-06-05

Family

ID=39555437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006310777A Withdrawn JP2008129662A (ja) 2006-11-16 2006-11-16 情報抽出装置、情報抽出方法、情報抽出プログラム

Country Status (1)

Country Link
JP (1) JP2008129662A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3432161A1 (en) 2017-07-20 2019-01-23 Hitachi, Ltd. Information processing system and information processing method
CN110597959A (zh) * 2019-09-17 2019-12-20 北京百度网讯科技有限公司 文本信息抽取方法、装置以及电子设备
CN113139183A (zh) * 2020-01-17 2021-07-20 深信服科技股份有限公司 一种检测方法、装置、设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3432161A1 (en) 2017-07-20 2019-01-23 Hitachi, Ltd. Information processing system and information processing method
US11301441B2 (en) 2017-07-20 2022-04-12 Hitachi, Ltd. Information processing system and information processing method
CN110597959A (zh) * 2019-09-17 2019-12-20 北京百度网讯科技有限公司 文本信息抽取方法、装置以及电子设备
CN113139183A (zh) * 2020-01-17 2021-07-20 深信服科技股份有限公司 一种检测方法、装置、设备及存储介质
CN113139183B (zh) * 2020-01-17 2023-12-29 深信服科技股份有限公司 一种检测方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
JP2011118689A (ja) 検索方法及びシステム
JP3372532B2 (ja) 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体
JP6952967B2 (ja) 自動翻訳装置
US7684975B2 (en) Morphological analyzer, natural language processor, morphological analysis method and program
US11301441B2 (en) Information processing system and information processing method
JP5441760B2 (ja) 文書間距離算出器および文章検索器
US11281865B1 (en) Methods and systems for generating linguistic rules
JP2008129662A (ja) 情報抽出装置、情報抽出方法、情報抽出プログラム
JP6305630B2 (ja) 文書検索装置、方法及びプログラム
JP2007164635A (ja) 同義語彙獲得方法及び装置及びプログラム
JP7122773B2 (ja) 辞書構築装置、辞書の生産方法、およびプログラム
JP2008077512A (ja) 文書解析装置、および文書解析方法、並びにコンピュータ・プログラム
JP2009129176A (ja) 構造化文書検索装置、方法およびプログラム
JP7227705B2 (ja) 自然言語処理装置、検索装置、自然言語処理方法、検索方法およびプログラム
JP5733285B2 (ja) 検索装置、検索方法及びプログラム
JP2004334382A (ja) 構造化文書要約装置、プログラムおよび記録媒体
Saadatfar et al. Best Practice for DSDL-based Validation
JP6639038B2 (ja) 知識処理装置およびプログラム
JP2007042028A (ja) 辞書の妥当性を評価する装置、方法およびプログラム
JP4635585B2 (ja) 質問応答システム、質問応答方法及び質問応答プログラム
US20230409620A1 (en) Non-transitory computer-readable recording medium storing information processing program, information processing method, information processing device, and information processing system
JP2004133510A (ja) 技術文献検索システム
JP4206266B2 (ja) 全文検索装置、処理方法、処理プログラム及び記録媒体
JP2011059843A (ja) 検索式生成装置、検索式生成方法、およびプログラム
JP5995219B2 (ja) 対訳辞書生成装置、方法、及びプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100202