JP2003308324A - 検索語処理装置及び文書検索装置 - Google Patents

検索語処理装置及び文書検索装置

Info

Publication number
JP2003308324A
JP2003308324A JP2002111169A JP2002111169A JP2003308324A JP 2003308324 A JP2003308324 A JP 2003308324A JP 2002111169 A JP2002111169 A JP 2002111169A JP 2002111169 A JP2002111169 A JP 2002111169A JP 2003308324 A JP2003308324 A JP 2003308324A
Authority
JP
Japan
Prior art keywords
document
search
term
word
search word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002111169A
Other languages
English (en)
Inventor
Tomoaki Kawauchi
友明 川内
Shinpei Watanabe
新平 渡辺
Naoto Ishikawa
直人 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YOMIURI SHIMBUN
Original Assignee
YOMIURI SHIMBUN
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YOMIURI SHIMBUN filed Critical YOMIURI SHIMBUN
Priority to JP2002111169A priority Critical patent/JP2003308324A/ja
Publication of JP2003308324A publication Critical patent/JP2003308324A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 携帯端末などから文書データベースに記憶さ
れている文書を効率よく検索できようにする。 【解決手段】 文書検索装置10は、携帯端末30よ
り、予め記憶されている検索語を示すようにとの要求を
取得すると、予め記憶されている検索語を示す検索語情
報を生成し、生成された検索語情報を要求元の携帯端末
30に送信する。文書検索装置10は、検索語情報で示
された検索語の中から指定された検索語を携帯端末30
より受信し、取得した検索語により検索される文書のタ
イトルを備える文書タイトル情報を生成し、生成した文
書タイトル情報を携帯端末30に送信する。次ぎに、文
書検索装置10は、送信した文書タイトル情報に示され
た文書のタイトルの中から指定された文書のタイトル
を、携帯端末30より取得すると、記憶されている文書
のタイトルを備える文書を、携帯端末30に送信する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文書の検索技術
及び文書の検索語を処理する技術に関する。
【0002】
【従来の技術】文書データベースに記憶されている文書
を検索する方法として、シソーラス辞書を利用する方法
が、例えば、特許第2850952号公報,特許第25
19121号公報、特開平5−151273号公報、特
開平5−250416号公報、特開平7−200608
号公報、特開2000−331012号公報等に開示さ
れている。
【0003】
【発明が解決しようとする課題】特許第2850952
号公報に開示された検索手法は、シソーラス辞書と共起
データベースとを用いて、検索語を抽出するため、抽出
される検索語が多くなりすぎ、文書を絞りこむことが困
難になるという問題がある。また、特開平5−1512
73号公報に開示された検索手法は、入力されたキーワ
ードと同義語を検索に使用するにすぎず、ヒット率が低
い。特開平5−250416号公報には、キーワードを
一定の変換規則により変換して代表語に置き換え、置き
換え後のキーワードを用いて、文書を検索している。し
かし、この手法では、様々なキーワードを代表語に置き
換えて共通のキーワードとするため、多数の雑多な文書
が検索されてしまい、適切な文書を検索することが困難
である。
【0004】特開平7−200608号公報には、キー
ワードを連想的に発展させて検索を行う手法が開示され
ている。しかし、この手法では、キーワードの種類が発
散してしまい、無関係な文書を検索する可能性が高く、
ノイズの多い検索結果となる。特開2000−3310
12号公報等に開示された検索手法は、検索対象分野別
のシソーラス辞書を使用して、キーワードを抽出して、
文書を検索する技術を開示する。しかし、この手法で
は、検索対象分野毎に固有のシソーラス辞書を用意し、
検索の度に、シソーラスの分野を指定しなければならな
い。
【0005】このように、従来のシソーラスを用いる検
索手法は、いずれも、的確なキーワード(検索語)を用
いて所望の文書を的確に抽出するのが困難であるという
問題があった。
【0006】また、従来の文書検索方法では、キーワー
ドをキーボード等から入力する必要があり、例えば、携
帯電話などの文字入力が比較的難しい小型携帯端末機器
を用いて、文書を検索してダウンロードするといったこ
とが困難であった。
【0007】この発明は、上述した問題点に鑑み、文書
を的確に効率よく検索可能とすることを目的とする。ま
た、この発明は、文書を簡易な操作で検索可能とするこ
とを他の目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、この発明の第1の観点に係る検索語処理装置は、文
書に該文書を検索するための検索語を付加する装置であ
って、文書を解析して検索語を抽出する手段と、複数の
語彙について、重要度が高い所定数のリードタームと、
該リードタームの同義語と、該リードタームの狭義語と
に分類分けして記憶する辞書と、抽出された検索語が前
記辞書上でリードタームに該当する場合にはその同義語
を検索語に追加し、抽出された検索語が同義語に相当す
る場合には、抽出された検索語に対応するリードターム
を検索語として追加し、検索語が、リードタームの狭義
語に相当する場合には、対応するリードタームと該リー
ドタームの同義語と検索語として追加する検索語展開手
段と、を備え、文書中に存在しない検索語によっても該
文書を検索可能としたことを特徴とする。
【0009】また、この発明の第2の観点に係る文書検
索装置は、端末からの要求に対応する文書を検索して供
給する文書検索装置であって、文書記憶手段に記憶され
ている文書を検索するための検索語を記憶する検索語記
憶手段と、端末群からの要求に応答して、前記検索語記
憶手段に記憶されている検索語のいずれかを選択するた
めの選択情報を、要求元の端末に送信する検索語選択情
報送信手段と、送信した検索語選択情報を用いて選択さ
れた検索語を特定する検索語特定情報を前記端末より受
信し、検索語特定情報が示す検索語を用いて文書記憶手
段に記憶されている文書を検索し、検索した文書の一覧
情報を、前記端末に送信する一覧情報送信手段と、送信
した一覧情報を用いて選択された文書を示す文書特定情
報を前記端末より受信し、文書特定情報が示す文書を、
前記端末に送信する文書送信手段と、を備える、ことを
特徴とする。
【0010】また、この発明の第3の観点に係る文書検
索装置は、1)文書と、2)a)該文書を検索するための
ものであって、各文書に含まれている所定の単語と、
b)該文書に含まれている各単語が重要度が高い所定数
のリードタームに該当する場合の該リードタームの同義
語と、該文書に含まれている検索語がリードタームの同
義語に該当する場合の該リードタームと、該文書に含ま
れている単語がリードタームの狭義語に該当する場合の
該リードタームとその同義語と、を含む検索語と、を対
応付けて記憶する記憶手段と、検索語を特定する検索語
特定情報を入力し、検索語特定情報が示す検索語を用い
て文書記憶手段に記憶されている各文書に対応付けられ
ている検索語を用いて文書を検索する検索手段と、前記
検索手段による検索結果を出力する手段と、を備えるこ
とを特徴とする。
【0011】また、この発明の第4の観点に係る文書検
索装置は、文書を検索するための検索語を特定する検索
語特定情報を入力する手段と、入力した検索語特定情報
により特定される検索語が、検索語として重要度が高い
所定数のリードタームのいずれかに相当する場合には、
検索語特定情報により特定される検索語と同義語とを用
いて文書を検索し、検索語特定情報により特定される検
索語が、リードタームの同義語に相当する場合には、入
力された検索語と対応するリードタームとを用いて文書
を検索し、検索語特定情報により特定される検索語が、
リードタームの狭義語に相当する場合には、選択された
検索語と対応するリードタームと該リードタームの同義
語とを用いて文書を検索する検索手段と、前記検索手段
による検索結果を出力する手段と、を備えることを特徴
とする。
【0012】さらに、コンピュータをこの上記実施の形
態の文書検索装置又は文書解析装置として動作させるプ
ログラムを伝送したり、記録媒体に格納して配布した
り、コンピュータにインストールして実行させたりして
もよい。
【0013】
【発明の実施の形態】以下、この発明の実施の形態に係
る文書検索システムを図面を参照して説明する。 <第1の実施形態>図1は、この発明の第1実施の形態
に係る文書検索システムの構成を示すブロック図であ
る。図1に示すように、この実施形態に係る文書検索シ
ステムは、文書検索装置10と、文書解析装置20と、
複数の携帯端末30〜30(nは携帯端末の総数で
ある。以下、携帯端末30という)から構成され、それ
ぞれが公衆回線網40及びインターネット50を介して
接続されている。
【0014】文書検索装置10は、図2に示すように、
制御部11と、記憶部12と、入力部13と、表示部1
4と、文書DB(データベース)15と、文書検索ファ
イル16と、通信制御部17とから構成され、各部はバ
ス18に接続されている。
【0015】制御部11は、CPU(Central Processi
ng Unit)等から構成され、制御プログラムの制御に従
い、後述する文書検索処理を行う。記憶部12は、RA
M(Random Access Memory)、ROM(Read Only Memor
y)、ハードディスク装置等から構成され、上記制御プロ
グラムを記憶するとともに、制御部11の作業領域に使
用される。
【0016】入力部13は、キーボード、マウス、記録
媒体読取装置等を備え、操作者の操作により押下された
キーボードの押下信号、マウスの操作信号や、記録媒体
から読み取ったデータを制御部11に出力する。表示部
14は、CRT(Cathode Ray Tube)、液晶表示装置等
により構成され、制御部11から出力された表示データ
等を表示する。
【0017】文書DB15は、ハードディスク装置、補
助磁気ディスク装置、光ディスク装置等により構成さ
れ、新聞等に掲載された文書と、この文書を指定する文
書IDとが対に記憶されている。
【0018】文書検索ファイル16は、文書DB15に
記憶されている文書を検索する際に使用されるファイル
であって、図3に示すように、検索語と、その検索語に
より検索される文書の数と、複数の検索語のうちでその
検索語を最適な検索語とする文書の文書IDと、その文
書(記事)の掲載分野と、その文書のタイトルと、文書
が新聞等に掲載された日付け等の情報と、を対応付けて
記憶する。なお、文書検索ファイル16の内容は、文書
DB15に新たな文書が追加される際に、後述する分析
・解析処理に基づいて設定される。
【0019】通信制御部17は、文書解析装置20とピ
ア・ツー・ピアで情報を伝送し、また、公衆回線網40
及びインターネット50を介して携帯端末30との間で
情報を伝送する。
【0020】図1に示す文書解析装置20は、図4に示
すように、制御部21と、記憶部22と、入力部23
と、表示部24と、文書記憶部25と、検索用語辞書2
6と、通信制御部27とから構成され、各部はバス28
に接続されている。
【0021】制御部21は、CPU等から構成され、制
御プログラムの制御に従い、後述する解析処理を行う。
記憶部22は、RAM、ROM、ハードディスク装置等
から構成され、上記制御プログラムを記憶するととも
に、制御部21の作業領域に使用される。入力部23
は、キーボード、マウス等を備え、操作者の操作により
押下されたキーボードの押下信号、マウスの操作信号を
制御部21に出力する。表示部24は、CRT、液晶表
示装置等により構成され、制御部21から出力された表
示データ等を表示する。
【0022】文書記憶部25は、文書検索装置10の文
書DB15に登録予定の文書(解析対象の文書)を記憶
する。検索用語辞書26は、文書を検索する際に使用さ
れるキーワード(検索語)のリストが記憶されている。
【0023】通信制御部27は、文書検索装置10に、
文書のデータとその文書に含まれている検索語のリスト
とを含む文書データを文書検索装置10に送信する。
【0024】図1に示す携帯端末30は、ブラウザ機能
を有しており、新聞等に掲載された文書を表示画面に表
示する。携帯端末30は、制御部、記憶部、入力部、表
示部、通信制御部等を備える。制御部は、CPU等から
構成され、制御プログラムの制御に従い、文書検索装置
10との間で後述する文書検索処理を行う。記憶部は、
RAM、ROM等から構成され、上記制御プログラムを
記憶するとともに、制御部の作業領域に使用される。入
力部は、テンキー等からなる作業キーを備え、操作者の
操作により押下された押下信号を制御部に出力する。表
示部は、液晶表示装置等により構成され、制御部から出
力された表示データ等を表示する。通信制御部は、公衆
回線網40及びインターネット50を介して文書検索装
置10との間の情報の伝送を制御する。
【0025】次に、この実施形態の文書検索システムの
動作を図面を参照して説明する。まず、文書検索装置1
0の文書DB15に文書を新規に登録する際の処理につ
いて、図5のフローチャートを参照して説明する。
【0026】操作者は、文書DB15に登録する予定の
文書を、入力部23又は通信制御部27から入力し、文
書記憶部25に記憶させる。次に、操作者は、記憶部2
2に記憶されている解析プログラムを起動させる。制御
部21は、図5(a)に示す処理を開始し、文書記憶部
25に記憶された文書を形態素解析し、助詞等を排除し
た単語を抽出する(ステップS11)。
【0027】制御部21は、抽出した単語のうち、検索
用語辞書26に記憶されているもの(検索語)に該当す
るものを抽出する(ステップS12)。
【0028】制御部21は、このようにして抽出した複
数の検索語を、文書本文と共に表示部24に表示する
(ステップS13)。操作者は、複数の検索語のうち、
その文書の内容を最も端的・的確に表していると考えら
れる1又は複数の単語を最適検索語として入力部23に
より選択する(ステップS14)。続いて、制御部21
は、文書データ(文書テキスト+最適検索語)を文書検
索装置10に通信制御部27から送信する(ステップS
15)。
【0029】文書検索装置10の制御部11は、文書解
析装置20からの文書データを通信制御部17を介して
受信し、図5(b)の処理を開始する。制御部11は、
受信した文書データ中の文書(テキスト)を文書DB1
5に登録する(ステップS16)。さらに、制御部11
は、その文書に関する情報を、文書検索ファイル16
(図3)のその文書の最適検索語の項に追加する。即
ち、その最適検索語について、文書検索ファイル16に
その文書の文書IDと掲載分野とタイトルと掲載日時と
を含むレコードを追加する。さらに、その最適検索語が
検索する文書数を+1する(ステップS17)。なお、
1つの文書に最適検索語が複数設定されている場合に
は、各最適検索語について、上述の処理を行う。
【0030】次に、検索動作について図6のフローチャ
ートを参照して、新聞のニュース記事を検索する場合を
例に説明する。携帯端末30は、操作者の操作に応答し
て、文書を検索するための検索画面を表示する(ステッ
プS21)。携帯端末30は、操作者の操作に応答し
て、検索画面から検索要求を、公衆回線網40及びイン
ターネット50を介して文書検索装置10に送信する
(ステップS22)。
【0031】文書検索装置10の制御部11は、検索要
求を受信すると、文書検索ファイル16を参照し、各最
適検索語が検索する記事(文書)の数を判別する(ステ
ップS23)。文書検索装置10は、最適検索語を、そ
の検索語が割り当てられている記事の数が多い順にソー
トし、例えば、図7(a)又は図7(b)に示すような
最適検索語一覧画面を生成し、生成した最適検索語一覧
画面を携帯端末30に送信する(ステップS24)。な
お、深夜等に、バッチ処理でこの検索語一覧画面を予め
作成して用意しておいてもよい。また、単純に検索され
る文書の数だけでなく、他の要素(注目度等)により、
マニュアルで一覧の順番を調整してもよい。
【0032】図7(a)に示す最適検索語一覧画面は、
各検索語ついて、その検索語を最適検索語とする記事数
が多い順に羅列したものである。また、図7(b)に示
す最適検索語一覧画面は、各検索語ついて、その検索語
を最適検索語とする記事の数が多い順に、検索語とその
検索語を最適検索語とする最新の記事のタイトルとの対
を一覧にして表示するものである。
【0033】携帯端末30は、最適検索語一覧画面を受
信すると、これを表示部に表示する(ステップS2
5)。
【0034】携帯端末30の操作者は、自己が検索した
い記事のキーワードとして最適と思われる最適検索語又
は対応するタイトルを選択する。携帯端末30は、選択
された最適検索語及び/又はタイトルを文書検索装置1
0に通知する(ステップS26)。
【0035】文書検索装置10は、上記表示項目の内容
を受信すると、文書検索ファイル16から、選択された
検索語を最適検索語とする文書のタイトルを抽出し、日
付順にソートして、タイトル一覧画面を生成し、この画
面を携帯端末30に送信する(ステップS27)。例え
ば、図7(a)の画面で検索語の「火災」が選択される
と、或いは、図7(b)の画面で、検索語の「火災」又
は対応するタイトルが選択されると、「火災」を最適検
索語とする文書のタイトルが文書検索ファイル16から
抽出され、図8(a)に示すようなタイトルの一覧が形
成される。なお、各文書(記事)の掲載分野に応じて、
表示色や字体を等の表示対象を異ならせて、掲載分野を
一見して認識できるようにすることが望ましい。
【0036】携帯端末30は、受信したタイトルの一覧
を表示する(ステップS28)。携帯端末30は、操作
者の操作により、任意のタイトルが選択(クリック)さ
れると、選択されたタイトルを文書検索装置10に送信
する(ステップS29)。
【0037】文書検索装置10は、選択されたタイトル
を受信すると、文書検索ファイル16からこのタイトル
有する文書の文書IDを読み出し(ステップS30)、
その文書IDで特定される文書を文書DB15から読み
出し、携帯端末30に送信する(ステップS31)。
【0038】携帯端末30は、文書検索装置10より上
記表示データを受信すると、表示部に記事表示画面を表
示し(ステップS32)、処理を終了する。
【0039】この文書検索システムによれば、携帯端末
30に表示される表示事項を指定していけば、操作者の
希望する記事(文書)を携帯端末30に表示させること
ができる。従って、入力操作が比較的困難な携帯端末3
0を使用する場合でも、簡単に希望する文書を検索して
表示させることができる。また、この文書検索システム
によれば、文書を検索するための検索語として最適検索
語を使用しているので、迅速に的確な文書を検索するこ
とができる。
【0040】<第1の実施の形態の応用例1>最適検索
語により選択抽出されるタイトルの数が多すぎる場合に
は、例えば、所定の検索期間等の他の検索条件を設定
し、タイトル数が所定数以上にならないようにしてもよ
い。
【0041】<第1の実施の形態の応用例2>上記実施
の形態においては、最適検索語による検索を行ったが、
他の検索語を用いて検索することも可能である。例え
ば、階層化された検索語の一覧を携帯端末30で表示
し、これを順次選択することにより、任意の検索語を選
択し、この検索語を用いて各文書を検索するようにして
もよい。
【0042】この場合には、タイトル一覧画面を表示す
る際に、検索に使用された検索語が文書の最適検索語に
指定されているか否かを理解できる態様でタイトル一覧
を生成することが望ましい。例えば、図8(b)に例示
するように、検索に使用した検索語が最適検索語に設定
されている文書のタイトルを斜体・太字・赤で表示し、
他の文書のタイトルを通常の態様で表示する。また、文
字入力用の選択メニューを階層化し、テンキー等の小サ
イズの入力キーを用いて、「か→さ→い」或いは、「k
→a→s→a→i」というよう順に文字を選択すること
で、「火災」を入力し、これで検索を行うようにするこ
とも可能である。
【0043】<第2実施形態>図9はこの発明の第2の
実施の形態に係る文書検索システムの構成を示すブロッ
ク図である。図9に示すように、この実施の形態に係る
文書検索システムは、文書検索装置10と、文書解析装
置20と、複数のユーザ端末60〜60(nはユー
ザ端末の総数である。なお、以下、ユーザ端末60とい
う)から構成され、公衆回線網40及びインターネット
50を介して接続されている。
【0044】文書検索装置10と文書解析装置20と
は、それぞれ図2と図4に示す構成を有する。但し、文
書解析装置20の検索用語辞書26には、第1実施の実
施形態と異なり、図10(a)に示すように、検索語辞
書26aと類義語辞書26bとが格納されている。
【0045】検索語辞書26aには、検索語のリストが
格納されている。検索語は、文書を検索するための単語
であり、例えば、1万〜5万語が設定されている。
【0046】類義語辞書26bには、図10(b)に例
示するように、検索語が、「リードターム(LT)」、
各リードタームの「同義語(EQ)」、「狭義語
(N)」、「関連語(R)」に分類されて記憶されてい
る。
【0047】「リードターム」は、一般によく知られ、
単語として流通し、認知されている言葉であり、約3千
〜1万語が設定されている。「同義語」は、リードター
ムと同一の意味を有する単語であって、リードタームと
同様に一般に知られ、かつ、単語として流通している単
語である。狭義語は、リードタームを具体的に説明する
際に使用される狭義の単語である。関連語は、リードタ
ームと意味は異なるが関連する言葉である。なお、リー
ドタームと同義語は辞書の中でだぶって登録さえること
はないが、狭義語、関連語は、それぞれリードタームと
して或いはそのリードタームの同義語、狭義語、関連語
として登録されることもある。
【0048】図10(b)の例では、リードタームとし
て「火災」、その同義語として「火事」、狭義語として
「出火」、「放火」、「大火」、関連語として「発
火」、「もらい火」、「飛び火」が登録されている。ま
た、リードタームとして「BSE」、同義語として「狂
牛病」、[牛海綿状脳症」、狭義語として「異常プリオ
ン」、関連語として「肉骨粉」、「配合飼料」、
「牛」、「水牛」、「牛肉」、「神経症状」等が登録さ
れている。なお、例えば、リードターム「BSE」の関
連語として登録されている単語「牛」や「水牛」は、リ
ードターム「牛」、その狭義語「水牛」というように登
録されている可能性もある。
【0049】また、この実施の形態では、図2に示す文
書検索装置10の文書検索ファイル16には、図11に
示す検索情報と、図12に示す文書情報と、図10に示
した類義語辞書26bが格納される。
【0050】図11に示す検索情報は、文書DB15に
記憶されている文書を特定する文書ID、及びこの文書
IDで特定される文書を検索するため検索語とを含む文
書検索データを含む。なお各検索語にその検索語の属性
を示す情報を付属させてもよい。「検索語の属性」と
は、例えば、その検索語が、「リードターム」、「同義
語」、「狭義語」、類義語辞書26bに登録されていな
い検索語のいずれに該当するかを示す情報や、その検索
語が文書に元々含まれていた単語であるか、解析処理に
より加えられた検索語であるかの別を示す情報である。
【0051】一方、図12に示す文書情報は、検索対象
の文書(文書DB15に格納されている文書)の文書I
D、掲載分野、タイトル、掲載日等の情報を含む。な
お、図12で、掲載日、「20011214TYM01
4AJ010」は、該当する文書が「2001」年「1
2」月「14」日において、発行社が「TYM」で、
「014AJ010」の箇所に掲載されていることを示
す。
【0052】図9に示すユーザ端末60は、ブラウザ機
能がインストールされ、通信機能を備えるパーソナルコ
ンピュータ等から構成され、テキストの入力が比較的容
易な装置である。
【0053】次に、この実施形態の文書検索システムの
動作を説明する。
【0054】まず、図13を参照し、新規に文書を文書
DB15に登録する際に、その文書から検索語を抽出
し、文書検索ファイル16を生成するまでの処理を説明
する。ここでは、この処理を具体的に説明するため、下
記の参照文書を用いて説明する。
【0055】参照文書 「 民家で出火、81歳女性死亡 14日午前1時50分ごろ、東京都港区白金6の無職土
井静江さん方から出火、木造モルタル2階建て住宅延べ
約80平方メートルのうち約30平方メートルを焼い
た。土井さんは1階の寝室付近で倒れているところを発
見され、病院に運ばれたが、まもなく死亡した。」
【0056】文書解析装置20の文書記憶部25にこの
文書が登録され、解析プログラムが起動されると、制御
部21は、図13の処理を開始する。まず、制御部21
は、文書から、検索語辞書26aの内容を参照して検索
語を抽出する(ステップS41)。これにより、上記文
書より、例えば、民家、出火、女性、死亡、東京都、港
区、白金、無職、土井静江、土井、静江、木造、モルタ
ル、住宅、寝室、病院、等の検索語を抽出する。
【0057】制御部21は、検索語を示すポインタnを
1にセットし(ステップS42)、n番目の検索語が類
義語辞書26bに登録されているか否かを判別する(ス
テップS43)。n番目の検索語が類義語辞書26bに
登録されていない場合には(ステップ43;No)、その
検索語を「辞書無し語」として、文書検索データに追加
する(ステップS48)。n番目の検索語が類義語辞書
26bに登録されている場合には(ステップ43;Ye
s)、その検索語が、「リードターム」、「同義語」、
「狭義語」のいずれに該当するかを判別する(ステップ
S44)。
【0058】その検索語がリードタームに該当する場合
には、リードターム(n番目の検索語)と対応する同義
語とを文書検索データに追加する(ステップS45)。
その検索語が同義語に該当する場合には、その同義語
(n番目の検索語)と対応するリードタームとを文書検
索データに追加する(ステップS46)。その検索語が
狭義語に該当する場合には、その狭義語(n番目の検索
語)と対応するリードタームとさらにそのリードターム
に対応する同義語とを文書検索データに追加する(ステ
ップS47)。この関係を模式的に示すと、図18
(a)に示すようになる。
【0059】次に、全ての検索語について、処理が終了
したか否かを判別し(ステップS49)、終了していな
ければ(ステップS49;No)、ポインタnを更新して
(ステップS50)、ステップS43に戻り、残りの検
索語について、同様の処理を繰り返す。
【0060】このような処理により、例えば、第1番目
の検索語「民家」は、例えば、リードターム「住宅」の
同義語と判断され、「民家」と「住宅」とが文書検索デ
ータに追加される。第2番目の検索語「出火」は、図1
0(b)に示す類義語辞書の例に従えば、リードターム
「火災」の狭義語と判断され、リードターム「火災」と
同義語「火事」とが文書検索データに追加される。
【0061】全ての検索語について以上の処理が完了す
ると(ステップS49:Yes)、制御部11は、付加さ
れた検索語と文書に元々含まれていた検索語とで重複し
ているものを、所定の優先度で1つに限定する(ステッ
プS51)。例えば、「民家」の類義語として付加され
たリードターム「住宅」と、元々文書に含まれている検
索語「住宅」とが重複するので、いずれか一方のみが残
される。
【0062】このようにして、「火災」、「火事」、
「女」、「死去」、等の検索語が、文書に元々含まれて
いる検索語に追加される。即ち、検索語辞書26aを用
いて抽出された検索語(元々文書に含まれてていた検索
語)と類義語辞書26bを用いて付加された検索語とが
マージされる。
【0063】続いて、制御部21は、最適検索語を抽出
させるため、文書と共にこれらの検索語の一覧を表示部
24に表示して、操作者に提示する。このとき、各検索
語の種類(リードターム、同義語、類義語)の区別がつ
く態様(文字サイズ、字体、色)で表示するようにして
もよい。例えば、文書に元々含まれていた検索語を斜体
で、付加した検索語を通常の字体で表示してもよい。ま
た、表示されている検索語のうち、リードタームを太字
で表示し、類義語辞書26bに登録されていない検索語
をイタリック体で表示する等してもよい。
【0064】操作者は、提示された検索語の中で、最も
端的にこの文書を表現していると考えられる1又は複数
(通常1つ)の検索語を最適検索語(最重要検索語)と
して指定する。この文書の例では、例えば、「火災」を
最適検索語として指定する(ステップS52)。
【0065】制御部21は、このようにして生成された
検索データを文書データと共に文書検索装置10に送信
する(ステップS53)。
【0066】文書検索装置10の制御部11は、文書解
析装置20からの文書データ及び検索データを通信制御
部17を介して受信し、図5(b)の処理を実行する。
即ち、制御部11は、受信した文書データ中の文書デー
タを文書DB15に登録する(ステップS16)。さら
に、制御部11は、受信した検索データに基づいて、文
書検索ファイル16を更新する(ステップS17)。即
ち、その文書の文書IDと検索語とその種別とを対応付
けて検索情報として図11に示すように検索情報に追加
する。また、図12に示すように、文書IDと掲載分野
と文書タイトルと掲載日などを対応付けて文書情報に追
加する。
【0067】以上のようにして、文書DB15に格納さ
れている各文書について、検索用の情報が準備されて文
書検索ファイル16に登録される。
【0068】次に、ユーザが所望する文書を検索する処
理を、図14と図15のフローチャートを参照して説明
する。
【0069】端末60は、ユーザの操作により、図16
に示す検索語(検索用キーワード)入力画面を表示する
(図14、ステップS61)。ユーザは、任意の検索語
を入力欄にキーボードなどから入力し又はリストや履歴
から選択し、「OK」ボタンをクリックする。ユーザ端
末60は、入力された検索語を文書検索装置10に送信
する(ステップS62)。
【0070】文書検索装置10は、ユーザ端末60から
検索語を受信すると、類義語辞書26bに受信した検索
語が記憶されているか否かを判断する(ステップS6
3)。
【0071】文書検索装置10は、受信した検索語が類
義語辞書26bに記憶されていると判断した場合には
(ステップS63;YES)、類義語辞書26bの内容
に従って、検索語を展開する(ステップS64)。
【0072】即ち、ユーザにより指定された検索語に対
応するリードタームを検出し、そのリードタームとその
同義語、狭義語、関連語を検索語の候補とする。
【0073】例えば、ユーザ端末60より受信した検索
語が「放火」である場合には、図10(b)の類義語辞
書26bの内容に従って、受信した検索語「放火」とそ
のリードターム「火災」、リードターム「火災」の同義
語の「火事」、リードタームの狭義語「出火」、「大
火」、リードタームの関連語「発火」、「もらい火」、
「飛び火」を検索語の候補とする。
【0074】次に、文書検索装置10は、文書検索ファ
イル16内の検索情報(図11)を参照し、各検索語の
候補について、データ(レコード)の件数を算出する。
即ち、その検索語の候補を文書検索データに含んでいる
文書の数を求める。
【0075】文書検索装置10は、検索語と求めた文書
数とを対応付けて表示する展開検索結果画面を生成し、
ユーザ端末60に送信する(ステップS65)。例え
ば、上述の例で、各検索語の候補と文書数とが、「火
災」で1000件、「火事」で1000件(文書解析装
置20の処理により、リードタームとその同義語で検索
される文書の数は同数となる)、「出火」で700件、
「放火」で160件、「大火」で10件、「発火」で4
0件、「もらい火」で30件、「飛び火」で60件とす
ると、文書検索装置10は、図17に示す展開検索結果
表示画面の表示データを生成し、ユーザ端末60に送信
する。
【0076】ユーザ端末60は、上記表示データを文書
検索装置10から受信すると、展開検索結果表示画面を
表示部に表示する(ステップS66)。ユーザは、文書
数などを参考にして、検索に使用する検索語を「検索語
入力」ボタン(図17中の「検索」と表示されているボ
タン)をクリックすることにより指定(選択)する。ま
た、希望するならば、検索期間入力欄に検索期間を入力
したのち、「検索語入力」ボタンをクリックする。ユー
ザ端末60は、これらの入力事項を、文書検索装置10
に送信する(ステップS67)。
【0077】文書検索装置10は、ユーザ端末60より
選択された検索語を受信すると、文書検索ファイル16
内の検索情報(図11)からその検索語を含む文書を判
別し、その文書の文書IDを読み出す(ステップS6
8)。
【0078】次に、文書検索装置10は、文書情報(図
12)を参照し、先に読み出した文書IDの文書タイト
ルを読み出し(ステップS69)、読み出した文書タイ
トルを一覧表示する文書タイトル表示画面の表示データ
を生成し(ステップS70)、ユーザ端末60に送信す
る(ステップS71)。なお、検索期間が指定されてい
る場合には、指定された期間内に掲載された文書のタイ
トルのみを抽出する。
【0079】ユーザ端末60は、文書検索装置10から
の文書タイトル一覧を受信し、表示する(ステップS7
2)。ユーザ端末60は、ユーザの操作により、表示さ
れている文書タイトルのいずれかが選択されると、選択
された文書タイトルを文書検索装置10に送信する(ス
テップS73)。
【0080】文書検索装置10は、ユーザ端末60よ
り、指定された文書タイトルを受信すると、文書検索フ
ァイル16内の文書情報(図12)からこのタイトルを
備える文書の文書IDを読み出す(ステップS74)。
その後、文書検索装置10は、その文書IDで特定され
る文書を文書DB15から読み出し(ステップS7
5)、表示データを生成し(ステップS76)、生成し
た表示データをユーザ端末60に送信する(ステップS
77)。
【0081】ユーザ端末60は、文書検索装置10より
上記表示データを受信すると、表示部にユーザが所望す
る文書を表示し(ステップS78)、処理を終了する。
【0082】一方、ステップS63において、受信した
検索語が類義語辞書に記憶されていないと判断した場合
には(ステップS63;NO)、検索語を展開する処理
を行わずに、その検索語を含む文書の文書IDを文書検
索ファイル16内の検索情報(図11)から判別し、ス
テップS68に移行し、上述したと同様の処理を行う。
【0083】この実施形態に係る文書検索システムによ
れば、検索操作に習熟していない者であっても、文書を
効率よく且つ的確に検索することができる。
【0084】<第2の実施の形態の変形例1>この発明
は、第2の実施の形態に限定されず、種々の変形及び応
用が可能である。例えば、図11に示す検索情報が作成
済みの状態において、入力された検索語をそのまま使用
して、ヒットする文書があるか否かを判別するようにし
てもよい。この場合、例えば、火災関連で「放火」とい
う語彙しか現れない文書についても、そのリードターム
である「火災」、その類義語である「火事」が図13の
文書解析装置20の処理で検索語として付与されてい
る。従って、例えば、ユーザが検索語として「火災」を
指定した場合でも、この記事を検索することができる。
【0085】<第2の実施の形態の変形例2>上記実施
の形態においては、ユーザが入力した検索語を図14の
ステップS64で類義語辞書26bを使用して展開し、
リードターム、同義語、狭義語、関連語について、文書
数を求めてユーザに提示し(ステップS66)、ユーザ
が任意の単語を選択したが、他の手法を使用することも
可能である。例えば、図14のステップS64で、図1
8(a)の展開図に示すように、ユーザの入力した検索
語がリードターム又は同義語に該当する場合にはリード
タームとその同義語で文書数を判別し(同数になる)、
入力された検索語が狭義語に相当する場合には、その検
索語とそのリードタームと同義語とで文書数を判別し、
図18(b)に示すように文書数を表示するようにして
もよい。そして、文書数を表示するタイミング又は文書
を実際に検索・表示した後等に、図18(c)に示すよ
うな関連語をユーザに通知する画面を表示し、関連語を
ユーザに選択可能として関連語による検索を可能として
もよい。
【0086】<第3の実施の形態>この発明は、第1及
び第2の実施の形態に限定されず、種々の変形及び応用
が可能である。例えば、第2の実施の形態では、文書に
含まれている検索語以外の検索語を類義語辞書26bを
用いて検索情報(図11)に追加したが、検索情報を文
書に含まれている検索語のみから構成し、検索を行う際
に、ユーザが指定した検索語を類義語辞書26bで加工
するようにしてもよい。
【0087】この場合、例えば、図13のステップS4
2〜S51の処理を削除し、検索語辞書により検索語を
抽出した後、最適語を選択する処理を行って、検索デー
タと文書データを文書検索装置10に送信する。上述の
第2の実施の形態の文書の例では、検索語辞書26aの
内容を参照して、検索語として、民家、出火、女性、死
亡、東京都、港区、白金、無職、土井静江、土井、静
江、木造、モルタル、住宅、寝室、病院、等の単語を抽
出し、検索データとして文書検索装置10に伝達する。
この段階では、例えば、文書中に存在する検索語「出
火」に対応するリードターム「火災」とその同義語「火
事」とを検索語に追加するような処理は行わない。
【0088】文書検索装置10は、文書を実際に検索す
る段階で、ユーザが検索語を指定すると、ステップS6
4の段階で、図18(a)の展開図に従って、検索語を
展開してOR(論理和)検索を行う。そして、適当なタ
イミングで、リードターム「火災」の関連語をユーザに
提示して、関連語による検索を行うか否かを問い合わ
せ、行うと指定された場合に、指定された関連語での検
索を行うようにしてもよい。
【0089】例えば、ユーザが検索語として「出火」を
指定したとする、すると、ステップS64で、図15
(b)の類義語辞書の内容と図18(a)に示す展開パ
ターンに従って、「出火」をリードターム「火災」の狭
義語と判断し、「出火」+「火災」+「火事」(+:論
理和)で文書を検索する。従って、例えば、文書中に、
「出火」のみならず、「火災」や「火事」を含む文書も
検索することが可能となる。
【0090】<第3の実施の形態の変形例>第1の実施
の形態においても、ユーザが携帯端末30上で選択又は
入力した単語を、類義語辞書の内容に従って展開して、
展開した検索語を用いて文書を検索するようにしてもよ
い。例えば、文書検索装置10が検索語の一覧を携帯端
末30に送信し、ユーザが携帯端末30でいずれかの検
索語を選択すると、文書検索装置10は、選択された検
索語を、図18(a)に示すパターンで、類義語辞書を
用いて展開し、展開後の複数の検索語を用いて文書の検
索を行う。
【0091】<第4の実施の形態>上記実施の形態にお
いては、1つの検索語を用いて文書を検索する例を主に
説明したが、この発明は、複数の検索語の組み合わせに
より検索を行う場合にも適用可能である。例えば、「出
火」*「BSE」とユーザが検索式を設定した場合に
は、図10(b)の類義語辞書26bの内容に従って、
(「出火」+「火災」+「火事」)*(「BSE」+
「狂牛病」+「牛海綿状脳症」)というような検索式に
変更して、「出火」と「火災」と「火事」とのいずれか
の単語と、「BSE」と「狂牛病」と「牛海綿状脳症」
とのいずれかの単語の両方を含む文書を検索することが
可能となり、「出火」*「BSE」で検索する場合より
も的確な文書を検索することができる。
【0092】なお、文書解析装置20により、各文書に
図11に示すような検索情報を付加する場合(主に、第
1及び第2の実施の形態)には、各文書にはリードター
ムと同義語が必ず、付与されている。従って、リードタ
ームと同義語の論理積及び論理和をとって検索を行う処
理は無駄であり、これらの演算式が設定された場合に
は、リードタームのみ或いは同義語のみを検索語として
検索を行う。リードタームと狭義語、同義語と狭義語、
リードタームと同義語と狭義語、リードタームと関連
語、同義語と関連語、リードタームと同義語と関連語と
が指定されたような場合も同様であり、リードターム又
は同義語で検索をおこなえばよい。
【0093】その他、この発明は上記実施の形態に限定
されず、様々な応用が可能である。例えば、以上説明し
たシステム構成や回路構成は一例にすぎず、同様の機能
を達成できるならば、任意の構成を採用可能である。ま
た、動作のフローチャートも任意に変更可能である。
【0094】さらに、コンピュータをこの上記実施の形
態の文書検索装置又は文書解析装置として動作させるプ
ログラムを伝送したり、記録媒体に格納して配布した
り、コンピュータにインストールして実行させたりして
もよい。
【0095】
【発明の効果】以上この発明によれば、文書を効率よく
的確に検索することができる。
【図面の簡単な説明】
【図1】この発明の第1の実施の形態に係る文書検索シ
ステムの構成を示すブロック図である。
【図2】図1中の文書検索装置の構成を示す図である。
【図3】図2中の文書検索ファイルの構成を示す図であ
る。
【図4】図1中の文書解析装置の構成を示す図である。
【図5】図1に示す文書解析装置及び文書検索装置の動
作を示す図である。
【図6】図1に示す文書検索システムの動作を示す図で
ある。
【図7】図1中の携帯端末に表示される表示画面の例を
示す図である。
【図8】図1中の携帯端末に表示される表示画面の例を
示す図である。
【図9】この発明の第2の実施の形態に係る文書検索シ
ステムの構成を示すブロック図である。
【図10】(a)は、図9中の文書解析装置に格納され
る検索用語辞書の構成を示す図であり、(b)は、
(a)の類義語辞書の内容の例を示す図である。
【図11】文書検索装置の文書検索ファイルに格納され
る検索情報の例を示す図である。
【図12】文書検索装置の文書検索ファイルに格納され
る文書情報の例を示す図である。
【図13】図9に示す文書検索システムの文書解析装置
の動作を説明するためのフローチャートである。
【図14】図9に示す文書検索システムの文書検索装置
の動作を説明するためのフローチャートである。
【図15】図9に示す文書検索システムの文書検索装置
の動作を説明するためのフローチャートである。
【図16】検索語入力画面を示す図である。
【図17】展開検索結果表示画面の一例を示す図であ
る。
【図18】文書検索システムの変形例を説明するための
図である。
【符号の説明】
10 文書検索装置 11 制御部 12 記憶部 13 入力部 14 表示部 15 文書データベース(DB) 16 文書検索ファイル 17 通信制御部 18 バス 20 文書解析装置 21 制御部 22 記憶部 23 入力部 24 表示部 25 文書記憶部 26 検索用語辞書 26a 検索語辞書 26b 類義語辞書 27 通信制御部 28 バス 30 携帯端末 60 ユーザ端末
フロントページの続き (72)発明者 石川 直人 東京都千代田区大手町1丁目7番1号 株 式会社読売新聞社内 Fターム(参考) 5B075 ND03 NK02 NK35 PQ02 PQ46 QP03 UU06

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】文書に該文書を検索するための検索語を付
    加する装置であって、 文書を解析して検索語を抽出する抽出手段と、 複数の語彙を、重要度が高い所定数のリードタームと、
    該リードタームの同義語と、該リードタームの狭義語と
    に分類して記憶する辞書と、 抽出された検索語が前記辞書上でリードタームに該当す
    る場合にはその同義語を検索語に追加し、抽出された検
    索語が同義語に相当する場合には、抽出された検索語に
    対応するリードタームを検索語として追加し、検索語
    が、リードタームの狭義語に相当する場合には、対応す
    るリードタームと該リードタームの同義語とを検索語と
    して追加する検索語展開手段と、 を備え、文書中に存在しない検索語によっても該文書を
    検索可能としたことを特徴とする検索語処理装置。
  2. 【請求項2】前記抽出手段により抽出された検索語と検
    索語展開手段により追加された検索語のうち、文書の内
    容を最も適正に表現しうる1又は複数の検索語を最適検
    索語として指定する手段をさらに備える、ことを特徴と
    する請求項1に記載の検索語処理装置。
  3. 【請求項3】端末からの要求に対応する文書を検索して
    供給する文書検索装置であって、 文書記憶手段に記憶されている文書を検索するための検
    索語を記憶する検索語記憶手段と、 端末からの要求に応答して、前記検索語記憶手段に記憶
    されている検索語のいずれかを選択するための選択情報
    を、要求元の端末に送信する検索語選択情報送信手段
    と、 送信した検索語選択情報を用いて選択された検索語を特
    定する検索語特定情報を前記端末より受信し、検索語特
    定情報が示す検索語を用いて文書記憶手段に記憶されて
    いる文書を検索し、検索した文書の一覧情報を、前記端
    末に送信する文書一覧情報送信手段と、 送信した文書一覧情報を用いて選択された文書を示す文
    書特定情報を前記端末より受信し、文書特定情報が示す
    文書を、前記端末に送信する文書送信手段と、を備える
    ことを特徴とする文書検索装置。
  4. 【請求項4】前記文書一覧情報送信手段は、選択された
    検索語が、検索語として重要度が高い所定数のリードタ
    ームのいずれかに相当する場合には、選択された検索語
    と同義語とを用いて文書を検索し、選択された検索語
    が、リードタームの同義語に相当する場合には、選択さ
    れた検索語と対応するリードタームとを用いて文書を検
    索し、選択された検索語が、リードタームの狭義語に相
    当する場合には、選択された検索語と対応するリードタ
    ームと該リードタームの同義語とを用いて文書を検索
    し、検索した文書のタイトルの一覧情報を前記端末に送
    信する、ことを特徴とする請求項3に記載の文書検索装
    置。
  5. 【請求項5】各文書は、文書に含まれている検索語と、
    文書に含まれている検索語が重要度が高い所定数のリー
    ドタームに該当する場合に追加された該リードタームの
    同義語と、文書に含まれている検索語がリードタームの
    同義語に該当する場合に追加された該リードタームと、
    文書に含まれている検索語がリードタームの狭義語に該
    当する場合に追加された該リードタームとその同義語と
    を検索語として備えており、 前記文書一覧情報送信手段は、各文書に付加されている
    検索語を用いて文書を検索し、検索した文書のタイトル
    の一覧情報を前記端末に送信する、 ことを特徴とする請求項3又は4に記載の文書検索装
    置。
  6. 【請求項6】文書記憶手段に記憶されている各文書に
    は、その文書の内容を最も適切に表す最適検索語が予め
    割り当てられており、 前記文書一覧情報送信手段は、選択された検索語が最適
    検索語として設定されている文書を検索し、そのタイト
    ルの一覧を生成して送信する、 ことを特徴とする請求項3乃至5のいずれか1項に記載
    の文書検索装置。
  7. 【請求項7】1)文書と、2)a)該文書を検索するため
    のものであって、各文書に含まれている所定の単語と、
    b)該文書に含まれている各単語が重要度が高い所定数
    のリードタームに該当する場合の該リードタームの同義
    語と、該文書に含まれている検索語がリードタームの同
    義語に該当する場合の該リードタームと、該文書に含ま
    れている単語がリードタームの狭義語に該当する場合の
    該リードタームとその同義語と、を含む検索語と、を対
    応付けて記憶する記憶手段と、 検索語を特定する検索語特定情報を入力し、検索語特定
    情報が示す検索語を用いて文書記憶手段に記憶されてい
    る各文書に対応付けられている検索語を用いて文書を検
    索する検索手段と、 前記検索手段による検索結果を出力する手段と、 を備えることを特徴とする文書検索装置。
  8. 【請求項8】文書を検索するための検索語を特定する検
    索語特定情報を入力する手段と、 入力した検索語特定情報により特定される検索語が、検
    索語として重要度が高い所定数のリードタームのいずれ
    かに相当する場合には、検索語特定情報により特定され
    る検索語と同義語とを用いて文書を検索し、検索語特定
    情報により特定される検索語が、リードタームの同義語
    に相当する場合には、入力された検索語と対応するリー
    ドタームとを用いて文書を検索し、検索語特定情報によ
    り特定される検索語が、リードタームの狭義語に相当す
    る場合には、選択された検索語と対応するリードターム
    と該リードタームの同義語とを用いて文書を検索する検
    索手段と、 前記検索手段による検索結果を出力する手段と、 を備えることを特徴とする文書検索装置。
  9. 【請求項9】前記検索手段は、前記検索語特定情報によ
    り特定される検索語に対応するリードタームの関連語を
    検索語として文書を検索する手段をさらに備えることを
    特徴とする請求項7又は8に記載の文書検索装置。
  10. 【請求項10】前記検索手段は、 前記指定された検索語又は該指定された検索語に対応す
    るリードタームの関連語又は該リードタームの同義語の
    関連語を示す関連語情報をユーザに提示する関連語提示
    手段と、 関連語情報からユーザにより選択された関連語を用いて
    文書を検索する手段と、 を備えることを特徴とする請求項7、8又は9に記載の
    文書検索装置。
  11. 【請求項11】さらに、検索手段で検索された文書のタ
    イトルの一覧を、検索手段によるヒットの態様を示す形
    態で形成する手段と、 前記生成したタイトルの一覧をユーザの使用する端末に
    送信する手段と、 、をさらに備えることを特徴とする請求項7乃至10の
    いずれか1項に記載の文書検索装置。
  12. 【請求項12】コンピュータを、請求項1乃至11のい
    ずれかに記載の検索語処理装置又は文書検索装置として
    機能させるコンピュータプログラム。
JP2002111169A 2002-04-12 2002-04-12 検索語処理装置及び文書検索装置 Pending JP2003308324A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002111169A JP2003308324A (ja) 2002-04-12 2002-04-12 検索語処理装置及び文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002111169A JP2003308324A (ja) 2002-04-12 2002-04-12 検索語処理装置及び文書検索装置

Publications (1)

Publication Number Publication Date
JP2003308324A true JP2003308324A (ja) 2003-10-31

Family

ID=29394085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002111169A Pending JP2003308324A (ja) 2002-04-12 2002-04-12 検索語処理装置及び文書検索装置

Country Status (1)

Country Link
JP (1) JP2003308324A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169924A (ja) * 2007-12-18 2009-07-30 Nippon Telegr & Teleph Corp <Ntt> 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01112331A (ja) * 1987-10-26 1989-05-01 Nippon Telegr & Teleph Corp <Ntt> キーワード重要度自動評価装置
JPH01217623A (ja) * 1988-02-26 1989-08-31 Nippon Telegr & Teleph Corp <Ntt> キーワード自動生成装置
JPH05314182A (ja) * 1992-05-13 1993-11-26 Fujitsu Ltd 情報検索装置
JPH06309362A (ja) * 1993-04-27 1994-11-04 Fujitsu Ltd 情報検索方法
JPH08263521A (ja) * 1995-03-24 1996-10-11 Fuji Xerox Co Ltd 文書登録検索システム
JPH08314974A (ja) * 1995-05-22 1996-11-29 Mainichi Shinbunsha:Kk キーワード自動抽出装置および文書検索装置
JPH1153384A (ja) * 1997-08-05 1999-02-26 Mitsubishi Electric Corp キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2000285122A (ja) * 1999-03-30 2000-10-13 Japan Research Institute Ltd シソーラス生成装置および方法,ならびにシソーラス生成プログラムを記録した記録媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01112331A (ja) * 1987-10-26 1989-05-01 Nippon Telegr & Teleph Corp <Ntt> キーワード重要度自動評価装置
JPH01217623A (ja) * 1988-02-26 1989-08-31 Nippon Telegr & Teleph Corp <Ntt> キーワード自動生成装置
JPH05314182A (ja) * 1992-05-13 1993-11-26 Fujitsu Ltd 情報検索装置
JPH06309362A (ja) * 1993-04-27 1994-11-04 Fujitsu Ltd 情報検索方法
JPH08263521A (ja) * 1995-03-24 1996-10-11 Fuji Xerox Co Ltd 文書登録検索システム
JPH08314974A (ja) * 1995-05-22 1996-11-29 Mainichi Shinbunsha:Kk キーワード自動抽出装置および文書検索装置
JPH1153384A (ja) * 1997-08-05 1999-02-26 Mitsubishi Electric Corp キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2000285122A (ja) * 1999-03-30 2000-10-13 Japan Research Institute Ltd シソーラス生成装置および方法,ならびにシソーラス生成プログラムを記録した記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169924A (ja) * 2007-12-18 2009-07-30 Nippon Telegr & Teleph Corp <Ntt> 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体

Similar Documents

Publication Publication Date Title
JP4962967B2 (ja) Webページ検索サーバ及びクエリ推薦方法
US7096218B2 (en) Search refinement graphical user interface
US8001135B2 (en) Search support apparatus, computer program product, and search support system
US6636853B1 (en) Method and apparatus for representing and navigating search results
JP3717808B2 (ja) 情報検索システム
US8745044B2 (en) Generating descriptions of matching resources based on the kind, quality, and relevance of available sources of information about the matching resources
US8983965B2 (en) Document rating calculation system, document rating calculation method and program
JP2007219722A (ja) 文書検索サーバおよび文書検索方法
JP2009009461A (ja) キーワードの入力支援システム、コンテンツ検索システム、コンテンツ登録システム、コンテンツ検索・登録システム、およびこれらの方法、並びにプログラム
JP2010257392A (ja) 文字入力装置、文字入力方法、コンピュータ読取可能なプログラムおよび記録媒体
JP6787755B2 (ja) 文書検索装置
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP2003308324A (ja) 検索語処理装置及び文書検索装置
JP2008102790A (ja) 検索システム
JP4417497B2 (ja) 情報検索装置及びプログラムを記憶した記憶媒体
JP2010015394A (ja) リンク先提示装置およびコンピュータプログラム
JP2008250893A (ja) 情報検索装置、情報検索方法およびそのプログラム
JP2939841B2 (ja) データベース検索装置
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JP2001022778A (ja) 検索装置及び検索方法
KR20190043961A (ko) 연관 용어의 시각화와 사용자 상호작용을 통한 전자정보 검색 시스템 및 방법과 이를 저장한 기록매체
JP2019057060A (ja) 情報検索装置、情報検索方法、及び情報検索プログラム
JP7022789B2 (ja) 文書検索装置、文書検索方法およびコンピュータプログラム
JP3444223B2 (ja) データベース登録装置
JP2943748B2 (ja) データベース検索装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050329

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050920

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060131