JP2003108582A - 類義語抽出方法および文書検索装置 - Google Patents

類義語抽出方法および文書検索装置

Info

Publication number
JP2003108582A
JP2003108582A JP2001297599A JP2001297599A JP2003108582A JP 2003108582 A JP2003108582 A JP 2003108582A JP 2001297599 A JP2001297599 A JP 2001297599A JP 2001297599 A JP2001297599 A JP 2001297599A JP 2003108582 A JP2003108582 A JP 2003108582A
Authority
JP
Japan
Prior art keywords
search
synonym
document
condition
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001297599A
Other languages
English (en)
Inventor
Ryuichi Kobune
隆一 小船
Hiroyoshi Konaka
裕喜 小中
Shinichiro Tsudaka
新一郎 津高
Hidekazu Arita
英一 有田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001297599A priority Critical patent/JP2003108582A/ja
Publication of JP2003108582A publication Critical patent/JP2003108582A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 検索の対象となる文書集合から類義語を抽出
し、検索条件の中のキーワードの拡張を行った場合に高
い検索精度での検索を可能にする。 【解決手段】 文書記憶部100に記憶された検索対象
の文書集合から係り受けの情報を抽出するインデックス
作成部102、抽出された係り受けの情報を格納する係
り受け検索インデックス101、検索条件と識別名を組
にして格納する類義語情報データベース106、検索条
件の識別名、検索対象の文書集合の識別名、類義語とし
て扱う検索結果の語句の集合を組にして格納する類義語
キャッシュ107、検索条件と識別名を入力する類義語
検索条件入力部104、検索要求に対して係り受け検索
インデックスを参照して類義語として意味的に近い語句
の集合を抽出する検索処理部103、検索処理部とのや
りとりにより類義語情報データベースおよび類義語キャ
ッシュを管理する類義語情報管理部105を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、検索キーとなる
語句を関連する他の語句に展開するための類義語を抽出
して管理する類義語抽出方法およびその類義語抽出方法
を用いた文書検索装置に関するものである。
【0002】
【従来の技術】文書集合から特定の文書を検索する文書
検索装置は、一般に、検索式や検索文等の検索条件を入
力し、入力した検索条件に該当する文書を文書集合から
検索するものである。
【0003】一般の文書検索装置では、入力した検索条
件に指示された語句により検索を行うため、指示された
語句と同じ語句を持つ文書しか検索条件に該当せず、類
義語を持つ文書は検索結果から漏れてしまう。
【0004】類義語を持つ文書が検索結果から漏れてし
まうことを防ぐために、類義語の情報を参照し、検索条
件に指示された語句を拡張して検索を行う文書検索装置
が提案されている。
【0005】類義語の情報の抽出に関して、例えば特開
平10−207910号公報に記載されているものがあ
る。これは、文書集合の各文書に対して形態素解析と係
り受け関係の解析を行い、同一の動詞語句に対して係り
受け関係を有する複数の名詞語句を互いに関連する語句
として登録するものである。
【0006】
【発明が解決しようとする課題】しかしながら、類義語
のデータベースの作成は、人手により語句の分類を行っ
ているため、その構築と保守のコストが高い。また、対
象とする文書の分野により類義語の判定基準が異なり、
必要とする分野の類義語のデータベースの構築が難し
い。さらに、類義語の判定基準が類義語の利用者の想定
からずれている場合に、利用者が求める適切な類義語が
出て来ない。
【0007】また、特開平10−207910号公報に
おいては、関連語とは一つの文の中で一つの動詞語句に
係る名詞語句の集合を意味し、意味として近い語句が集
まるわけではない。検索においては、単に関連する可能
性のある語句に検索のキーワードから拡張すると検索精
度が大きく低下するという問題点がある。
【0008】この発明は上述した点に鑑みてなされたも
ので、検索の対象となる文書集合から意味として近い語
句を抽出し類義語としてまとめ、検索条件の中のキーワ
ードの拡張を行った場合に高い検索精度での検索が可能
な類義語抽出方法と文書検索装置を提供することを目的
とする。
【0009】
【課題を解決するための手段】この発明に係る類義語抽
出方法は、検索対象の文書集合から係り受け解析を行い
係り受けの情報を抽出して係り受け検索インデックスに
格納し、検索条件に基づいて前記係り受け検索インデッ
クスの情報を参照して類義語を抽出し、その検索条件と
抽出された語句を類義語情報として管理することを特徴
とするものである。
【0010】また、検索条件により抽出された語句に対
して重み付けを行い、類義語情報に追加することを特徴
とするものである。
【0011】また、この発明に係る文書検索装置は、検
索対象の文書集合を記憶する文書記憶部と、前記文書記
憶部に記憶された検索対象の文書集合から係り受け解析
を行い係り受けの情報を抽出するインデックス作成部
と、前記インデックス作成部により抽出された係り受け
の情報を格納する係り受け検索インデックスと、検索条
件とその識別名を組にして格納する類義語情報データベ
ースと、検索条件の識別名、検索対象の文書集合の識別
名、類義語として扱う検索結果の語句の集合を組にして
格納する類義語キャッシュと、類義語として抽出したい
語句のための検索条件と検索条件を識別するための識別
名を入力する類義語検索条件入力部と、入力される検索
要求に対して、前記係り受け検索インデックスの情報を
参照して類義語として意味的に近い語句の集合を抽出す
る検索処理部と、前記類義語検索条件入力部からの検索
条件を検索要求として前記検索処理部に出力すると共
に、検索条件とその識別名を組にして前記類義語情報デ
ータベースに格納し、検索条件の識別名、検索対象の文
書集合の識別名、類義語として扱う検索結果の語句の集
合を組にして前記類義語キャッシュに格納する類義語情
報管理部とを備えたものである。
【0012】また、前記文書記憶部は、複数の文書集合
を格納し、前記インデックス作成部は、検索対象の文章
集合に対して識別子を与え、識別子によりインデックス
データを係り受け検索インデックスで管理し、前記類義
語キャッシュは、文書集合の識別子に対応した類義語の
管理を行い、検索対象の文書集合の内容が変更された場
合に、前記インデックス作成部は、前記係り受け検索イ
ンデックスを更新し、前記類義語情報管理部は、前記類
義語情報データベースから類義語情報の検索条件を取得
し、前記検索処理部に検索要求を送り、検索結果の語句
の集合により、前記類義語キャッシュの情報を更新する
ことを特徴とするものである。
【0013】また、前記類義語情報管理部は、前記検索
処理部の検索結果の語句に対して重み付けを用いて並び
変えることを特徴とするものである。
【0014】さらに、入力された文章を構文解析して係
り受けの関係に変換しその係り受けパターンを検索条件
として出力する検索条件入力部と、前記検索条件入力部
からの検索条件内の語句の類義語を前記類義語キャッシ
ュから取り出して適切な語句を選択し、類義語検索条件
内の語句の拡張を行い、ORの条件で処理された検索条
件内の拡張された類義語の組み合わせを検索条件として
前記検索処理部に出力する検索条件拡張部と、前記検索
処理部により処理された検索条件に適合する文を持つ文
書の表題と検索条件に適合する文を列挙して利用者に提
示する検索結果表示部とをさらに備えたことを特徴とす
るものである。
【0015】
【発明の実施の形態】まず、この発明の概略について述
べる。この発明は、検索条件として語句の係り受けの組
み合わせを指示できる文書検索装置を用いて、意味とし
て近い語句を抽出し、その検索条件と抽出された語句を
類義語情報として管理し、文書検索装置での検索条件内
の語句の拡張に利用できるようにしたものである。
【0016】「XXX」を未確定の語句とし「XXXの
改革を推進する」というような語句の係り受けの組み合
わせを検索条件として「XXX」に対応する語句を検索
する文書検索装置を用いると、「改革を推進する」対象
として例えば新聞記事のような文書集合内にある「政
治」、「経済」、「構造」、「組織」といった語句が抽
出される。これらの語句は、係り受けのパターンにより
規定され、その語句の出現する文脈において意味的に近
いものである。
【0017】この発明に係る類義語抽出方法は、上記の
検索を可能とする文書検索装置を用い、類義語を規定す
る検索条件とその検索条件の検索結果の語句を類義語情
報として管理する手段を持つ。検索対象の文書集合が更
新される、あるいは、別の文書集合に切り替わった場合
には、類義語情報に残された検索条件により、再度類義
語に相当する語句を検索し、類義語情報を検索対象の文
書集合に適合したものにすることができる。類義語情報
が利用者の意図する類義語を提供していない場合は、利
用者が類義語情報の検索条件を編集することにより、利
用者の求める類義語情報を得ることができる。
【0018】上記の類義語抽出方法により検索対象の文
書集合から意味として近い類義語を容易に抽出すること
ができ、その類義語の情報を用いた文書検索装置は、利
用者の指定した検索条件内の語彙を検索対象の文書集合
内の語彙に適切に拡張し、類義語によるキーワードの拡
張を行っても精度の高い検索を行うことが可能になる。
以下、具体的な実施の形態について説明する。
【0019】実施の形態1.図1は、この発明を実施す
るための実施の形態1による類義語抽出方法を説明する
ための文章検索装置の構成を示すブロック図である。文
書記憶部100は、磁気ディスク装置などの情報を記憶
する装置を有し、検索対象の文書集合のテキストデータ
を構文解析し、XML(eXtensible Markup Language)
などの計算処理が容易なデータ形式で文書を記憶する。
日本語の構文解析は、「情報処理」(Vol.41,N
o.11,2000)の「結構やるな,KNP」に記載
されている構文解析プログラムなどで実現でき、構文解
析の結果を「GDA日本語タギングマニュアル」(ht
tp://www.i−content.org/gd
a/tagman.html)に記載のXMLのタグ規
約に従うXMLデータに容易に変換できる。
【0020】インデックス作成部102は、文書記憶部
100の中の検索対象の文書集合の各文書の係り受け解
析を行い、係り受けの情報を抽出して、係り受け検索イ
ンデックス101に係り受けの情報を格納する。図2
に、XMLデータとして格納される文の一例を示す。こ
のような形式で格納される文書の情報について、文中の
語句間の依存関係、すなわち係り受けの関係を単語間の
関係に変換して抽出する。XMLのデータのノード間の
関係を単語間の関係に変換する際、ノードが複数の語を
支配している場合は、基本的にその中の主辞を関連する
語として抽出する。
【0021】図2の例において、suエレメントに着目
して子ノード間の依存関係を抽出すると、「僕は」→
「行く」、「今日」→「行く」、「君と」→「行く」、
「車で」→「行く」、「東京へ」→「行く」となる。抽
出されたノードの関係から、自立語を抽出して単語間の
依存関係に変換すると、「僕」→「行く」、「今日」→
「行く」、「君」→「行く」、「車」→「行く」、「東
京」→「行く」となる。このように抽出された依存関係
を、係り元の単語をキーとして、単語が含まれる文書
名、係り元の単語の文書内の位置、係り先の単語とその
位置を値とするインデックス情報に変換して係り受け検
索インデックス101に格納する。
【0022】類義語検索条件入力部104は、類義語と
して抽出したい語句のための検索条件とする係り受けパ
ターンと検索条件を識別するための識別名の入力手段を
有し、類義語情報管理部105は、その検索条件を受け
取り、検索処理部103に対して検索要求として送り、
検索処理部103は、検索条件(検索要求)に基づいて
係り受け検索インデックス101の情報を参照して類義
語として意味的に近い語句の集合を抽出し類義語情報管
理部105に返す。検索情報管理部105は、検索条件
の識別名、検索条件を組にして類義語情報データベース
106に格納し、検索条件の識別名、検索対象の文書集
合の識別名、類義語として扱う検索結果の語句の集合を
組にして、類義語キャッシュ107に格納する。
【0023】係り受け検索インデックス101には、例
えば「XX首相が、経済の改革を推進する」と行った文
章から抽出される「XX→首相」、「首相→推進」、
「経済→改革」、「改革→推進」といった係り受けの関
係が、どの文書においてどの場所の語句についての関係
かを示す情報として格納される。類義語検索条件入力部
104で、「改革推進の対象となるもの」という識別名
で、「XXXの改革を推進する」のような検索条件を入
力したとすると、検索処理部103は、この検索条件に
対して、係り受け検索インデックス101の情報を参照
し、「改革→推進」の係り受け関係を持つ語句「改革」
に対して「XXX→改革」の係り受け関係を持つXXX
を抽出する。
【0024】検索結果としては、「政治、経済、構造、
組織」のように語句が抽出され、類義語情報管理部10
5は、識別名「改革推進の対象となるもの」、検索条件
「XXXの改革を推進する」の組を類義語情報データベ
ース106に格納し、識別名「改革推進の対象となるも
の」と検索対象の文書集合の識別子、たとえば「200
1年度新聞記事」、検索結果の語句の集合「政治、経
済、構造、組織」を組にして類義語キャッシュ107に
格納する。類義語の検索は、類義語キャッシュ107に
対して行い、検索対象の文書集合に対応したデータから
類義語を検索したいキーワードを含むすべての検索結果
の語句の集合をマージして類義語の語句の集合を返す。
【0025】なお、類義語情報データベース106と類
義語キャッシュ107は、1つづつしか図にはないが、
利用者ごとに類義語情報データベースと類義語キャッシ
ュを設けてもよい。利用者ごとに類義語を管理すること
により、利用者の検索意図に合わせた類義語の選択が可
能になる。
【0026】文書記憶部100内の検索対象の文書集合
の内容が変更される、あるいは、複数の文書集合を格納
し検索対象の文書集合が切り替わる場合には、文書記憶
部100内の複数の検索対象の文書集合に対して識別子
を与え、識別子によりインデックスデータを係り受け検
索インデックス101で管理し、類義語キャッシュ10
7において文書集合の識別子に対応した類義語の管理を
行う。類義語キャッシュ107は、検索対象を切り替え
た際に類義語の集合を切り替える。
【0027】検索対象の文書集合の内容が変更された場
合は、インデックス作成部102は、係り受け検索イン
デックス101を更新し、類義語情報管理部105は、
類義語情報データベース106から類義語情報の検索条
件を取得し、検索処理部103に検索要求を送り、検索
結果の語句の集合により、類義語キャッシュ107の情
報を更新する。
【0028】従って、上記実施の形態1によれば、依存
関係による検索により抽出された語句は、文の中の意味
を反映して意味として近い語句が抽出され、適切な類義
語を容易に収集できる。また、検索対象の文書の集合を
変え、検索の実行、類義語の抽出を行うことにより、対
象とする文書の集合に適した類義語を用意することがで
きる。
【0029】実施の形態2.上記実施の形態1におい
て、前記類義語情報管理部105により、検索処理部1
03の検索結果の語句に、出現頻度、検索条件の係り受
けパターンの語句からの距離などの情報を考慮して重み
を付けて類義語情報に付加し、その重み付けを用いて検
索処理部103の検索結果の語句を並び変えることで、
検索対象の文書集合内での語句の傾向によるランキング
が可能になる。
【0030】新聞記事などでは、実施の形態1で例示し
た検索条件で抽出されるであろう語句の集合「政治、経
済、構造、組織」のうち「政治」、「経済」の出現頻度
は高いであろうことが予想される。その頻度を検索対象
の文書集合での類義語としての重要度とすることができ
る。また、「経済の構造の改革を推進する」というよう
な文章が検索条件に適合する場合、「経済」と「構造」
を検索結果の語句として取り出し、それぞれの語句と
「改革」の距離を類義語としての意味的な重要度とする
ことができる。このような重み付けを用いることによ
り、検索対象の文書集合内での語句の傾向によるランキ
ングが可能になる。
【0031】実施の形態3.図3は、この発明を実施す
るための実施の形態3による類義語抽出方法を説明する
ための文章検索装置の構成を示すブロック図である。図
3に示す構成を備える実施の形態3では、上述した図1
に示す構成を備える実施の形態1および実施の形態2に
対して、検索条件入力部108と検索条件拡張部109
及び検索結果表示部110をさらに備えたものである。
【0032】検索条件入力部108では、「経済の改革
を推進する」といった文章の入力手段とその文章から
「経済→改革→推進」といった係り受けの関係に変換す
る構文解析手段を有すると共に、係り受けの関係を語句
の関係として直接指示する入力手段を持し、係り受けの
パターンを検索条件として検索条件拡張部109に渡
す。検索条件拡張部109は、検索条件入力部108で
入力された検索条件内の語句の類義語を類義語キャッシ
ュ107から取り出し、利用者が適切であると判断した
語句を選択する手段を持ち、類義語検索要求内の語句の
拡張を行う。検索条件内の拡張された語句は、ORの条
件で処理され、検索条件内の拡張された類義語の組み合
わせを検索条件として検索処理部103に渡される。
【0033】検索結果表示部109は、検索条件に適合
する文を持つ文書の表題と検索条件に適合する文を列挙
して利用者に提示する。さらに、列挙された文書を選択
する機能を持ち、検索条件に適合する文を強調して選択
された文書の内容を提示する。なお、実施の形態2の類
義語抽出方法を持つ場合は、検索条件に適合する文書を
列挙する際に、類義語の重みをたとえば積をとるなどし
て、文書の重みに反映させて表示する。
【0034】従って、上記実施の形態3によれば、利用
者が類義語抽出のための検索要求を修正または新規に作
成することにより、利用者の求める類義語を用意するこ
とができる。また、この類義語により検索条件内の語を
検索対象の文書集合の語彙に適合した検索条件に拡張で
き、精度の高い検索を行うことができる。
【0035】
【発明の効果】以上ように、この発明によれば、検索の
対象となる文書集合から意味として近い語句を抽出し類
義語としてまとめ、検索条件の中のキーワードの拡張を
行った場合に高い検索精度での検索が可能になるという
効果を奏する。
【図面の簡単な説明】
【図1】 この発明の実施の形態1および2の類義語抽
出方法を説明するための文章検索装置の構成を示すブロ
ック図である。
【図2】 XML形式の文のデータの例を示す図であ
る。
【図3】 この発明の実施の形態3の類義語抽出方法を
説明するための文章検索装置の構成を示すブロック図で
ある。
【符号の説明】
100 文書記憶部、101 係り受け検索インデック
ス、102 インデックス作成部、103 検索処理
部、104 類義語検索条件入力部、105 類義語情
報管理部、106 類義語情報データベース、107
類義語キャッシュ、108 検索条件入力部、109
検索条件拡張部、110 検索結果表示部。
フロントページの続き (72)発明者 津高 新一郎 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 (72)発明者 有田 英一 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 Fターム(参考) 5B075 ND03 NK35 PR06 PR08 UU05

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 検索対象の文書集合から係り受け解析を
    行い係り受けの情報を抽出して係り受け検索インデック
    スに格納し、 検索条件に基づいて前記係り受け検索インデックスの情
    報を参照して類義語を抽出し、 その検索条件と抽出された語句を類義語情報として管理
    することを特徴とする類義語抽出方法。
  2. 【請求項2】 請求項1に記載の類義語抽出方法におい
    て、 検索条件により抽出された語句に対して重み付けを行
    い、類義語情報に追加することを特徴とする類義語抽出
    方法。
  3. 【請求項3】 検索対象の文書集合を記憶する文書記憶
    部と、 前記文書記憶部に記憶された検索対象の文書集合から係
    り受け解析を行い係り受けの情報を抽出するインデック
    ス作成部と、 前記インデックス作成部により抽出された係り受けの情
    報を格納する係り受け検索インデックスと、 検索条件とその識別名を組にして格納する類義語情報デ
    ータベースと、 検索条件の識別名、検索対象の文書集合の識別名、類義
    語として扱う検索結果の語句の集合を組にして格納する
    類義語キャッシュと、 類義語として抽出したい語句のための検索条件と検索条
    件を識別するための識別名を入力する類義語検索条件入
    力部と、 入力される検索要求に対して、前記係り受け検索インデ
    ックスの情報を参照して類義語として意味的に近い語句
    の集合を抽出する検索処理部と、 前記類義語検索条件入力部からの検索条件を検索要求と
    して前記検索処理部に出力すると共に、検索条件とその
    識別名を組にして前記類義語情報データベースに格納
    し、検索条件の識別名、検索対象の文書集合の識別名、
    類義語として扱う検索結果の語句の集合を組にして前記
    類義語キャッシュに格納する類義語情報管理部とを備え
    た文書検索装置。
  4. 【請求項4】 請求項3に記載の文書検索装置におい
    て、 前記文書記憶部は、複数の文書集合を格納し、 前記インデックス作成部は、検索対象の文章集合に対し
    て識別子を与え、識別子によりインデックスデータを係
    り受け検索インデックスで管理し、 前記類義語キャッシュは、文書集合の識別子に対応した
    類義語の管理を行い、 検索対象の文書集合の内容が変更された場合に、前記イ
    ンデックス作成部は、前記係り受け検索インデックスを
    更新し、前記類義語情報管理部は、前記類義語情報デー
    タベースから類義語情報の検索条件を取得し、前記検索
    処理部に検索要求を送り、検索結果の語句の集合によ
    り、前記類義語キャッシュの情報を更新することを特徴
    とする文書検索装置。
  5. 【請求項5】 請求項3または4に記載の文書検索装置
    において、 前記類義語情報管理部は、前記検索処理部の検索結果の
    語句に対して重み付けを用いて並び変えることを特徴と
    する文書検索装置。
  6. 【請求項6】 請求項3ないし5のいずれかに記載の文
    書検索装置において、 入力された文章を構文解析して係り受けの関係に変換し
    その係り受けパターンを検索条件として出力する検索条
    件入力部と、 前記検索条件入力部からの検索条件内の語句の類義語を
    前記類義語キャッシュから取り出して適切な語句を選択
    し、類義語検索条件内の語句の拡張を行い、ORの条件
    で処理された検索条件内の拡張された類義語の組み合わ
    せを検索条件として前記検索処理部に出力する検索条件
    拡張部と、 前記検索処理部により処理された検索条件に適合する文
    を持つ文書の表題と検索条件に適合する文を列挙して利
    用者に提示する検索結果表示部とをさらに備えたことを
    特徴とする文書検索装置。
JP2001297599A 2001-09-27 2001-09-27 類義語抽出方法および文書検索装置 Pending JP2003108582A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001297599A JP2003108582A (ja) 2001-09-27 2001-09-27 類義語抽出方法および文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001297599A JP2003108582A (ja) 2001-09-27 2001-09-27 類義語抽出方法および文書検索装置

Publications (1)

Publication Number Publication Date
JP2003108582A true JP2003108582A (ja) 2003-04-11

Family

ID=19118638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001297599A Pending JP2003108582A (ja) 2001-09-27 2001-09-27 類義語抽出方法および文書検索装置

Country Status (1)

Country Link
JP (1) JP2003108582A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005031950A (ja) * 2003-07-11 2005-02-03 Canon Inc 情報検索装置、情報検索方法およびプログラム
JP2007317139A (ja) * 2006-05-29 2007-12-06 Fuji Xerox Co Ltd 文書データ解析装置および方法
JP2012048291A (ja) * 2010-08-24 2012-03-08 Dainippon Printing Co Ltd 同義語辞書生成装置、データ解析装置、データ検出装置、同義語辞書生成方法及び同義語辞書生成プログラム
JP2017062618A (ja) * 2015-09-24 2017-03-30 富士通株式会社 プログラム、情報処理装置及び情報処理方法
JP2018180844A (ja) * 2017-04-11 2018-11-15 健太 戸原 文献検索システム
JP2021015562A (ja) * 2019-07-16 2021-02-12 Kpmgコンサルティング株式会社 情報処理装置、サーバ装置、ユーザ端末、方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259480A (ja) * 1993-03-10 1994-09-16 Hitachi Ltd 文書検索方法
JPH10207910A (ja) * 1997-01-16 1998-08-07 Fuji Xerox Co Ltd 関連語辞書作成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259480A (ja) * 1993-03-10 1994-09-16 Hitachi Ltd 文書検索方法
JPH10207910A (ja) * 1997-01-16 1998-08-07 Fuji Xerox Co Ltd 関連語辞書作成装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005031950A (ja) * 2003-07-11 2005-02-03 Canon Inc 情報検索装置、情報検索方法およびプログラム
JP4557513B2 (ja) * 2003-07-11 2010-10-06 キヤノン株式会社 情報検索装置、情報検索方法およびプログラム
JP2007317139A (ja) * 2006-05-29 2007-12-06 Fuji Xerox Co Ltd 文書データ解析装置および方法
JP2012048291A (ja) * 2010-08-24 2012-03-08 Dainippon Printing Co Ltd 同義語辞書生成装置、データ解析装置、データ検出装置、同義語辞書生成方法及び同義語辞書生成プログラム
JP2017062618A (ja) * 2015-09-24 2017-03-30 富士通株式会社 プログラム、情報処理装置及び情報処理方法
JP2018180844A (ja) * 2017-04-11 2018-11-15 健太 戸原 文献検索システム
JP2021015562A (ja) * 2019-07-16 2021-02-12 Kpmgコンサルティング株式会社 情報処理装置、サーバ装置、ユーザ端末、方法及びプログラム

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US6101492A (en) Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis
US7567902B2 (en) Generating speech recognition grammars from a large corpus of data
CA2617527C (en) Processor for fast contextual matching
JP2000315216A (ja) 自然言語検索方法および装置
JPH0424869A (ja) 文書処理システム
JPH08255172A (ja) 文書検索システム
JP2008084070A (ja) 構造化文書検索装置およびプログラム
JP3178421B2 (ja) テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006227823A (ja) 情報処理装置及びその制御方法
JP3612769B2 (ja) 情報検索装置および情報検索方法
JPH09198395A (ja) 文書検索装置
JP4065346B2 (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3617096B2 (ja) 関係表現抽出装置および関係表現検索装置、関係表現抽出方法、関係表現検索方法
JP2003108582A (ja) 類義語抽出方法および文書検索装置
JP4378106B2 (ja) 文書検索装置、文書検索方法及びプログラム
KR100504632B1 (ko) 비구조 문서에서 사용자가 요구하는 정보를 추출하는 장치및 그 방법
JP3851712B2 (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5019315B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2004220226A (ja) 検索文書のための文書分類方法及び装置
JP2007011892A (ja) 語彙獲得方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2007257149A (ja) 文書処理装置及び文書処理方法
KR20200122089A (ko) 지역 색인을 이용한 전자문서 검색 방법 및 장치
JPH07325826A (ja) 日本語処理システム
JP2001101207A (ja) 文書要約装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100521

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100720