JPH05135107A - 文書検索装置 - Google Patents

文書検索装置

Info

Publication number
JPH05135107A
JPH05135107A JP3326557A JP32655791A JPH05135107A JP H05135107 A JPH05135107 A JP H05135107A JP 3326557 A JP3326557 A JP 3326557A JP 32655791 A JP32655791 A JP 32655791A JP H05135107 A JPH05135107 A JP H05135107A
Authority
JP
Japan
Prior art keywords
document
keyword
information
unit
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3326557A
Other languages
English (en)
Inventor
Masako Bosu
雅子 望主
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3326557A priority Critical patent/JPH05135107A/ja
Publication of JPH05135107A publication Critical patent/JPH05135107A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 文書登録の条件や検索の条件を指定可能にす
ることで多様な検索に対応する。 【構成】 ユーザが文書の登録を指示したのち、文書を
言語解析部3で単語の区切りと品詞を認定し、付属語を
削除し、品詞情報と品詞以外の意味や頻度や出現位置な
どの情報を解析して付与する。キーワード条件指定部4
においてユーザが登録したいキーワードの条件を入力す
る。言語解析部3で付与された情報のうち、指定された
条件に一致した情報をもつ単語だけをキーワードとして
抽出し、キーワードファイル7、文書ファイル6に登録
する。文書検索部5はユーザの指定した条件に基づき条
件に一致するキーワードが付与された文書を検索する。

Description

【発明の詳細な説明】
【0001】
【技術分野】本発明は、文書検索装置に関する。
【0002】
【従来技術】文書にキーワードを付与して文書登録・検
索を行う装置において、キーワードを自動的に付与する
システムがある。例えば「言語処理を用いたキーワード
自動抽出」(NTT 木本晴夫 昭和62年度人工知能
学会全国大会予稿集p389〜392)は言語処理を用いてキ
ーワード自動抽出を行っている。これはキーワードとす
るか否かの条件に以下のような言語的なルールを採用し
ている。 並列表現を削除する(「や」「、」による列挙な
ど) 連体修飾語を削除する(但し、被連体修飾語がサ変
名詞でなく、連体修飾語が人間でない場合に限る。「夢
の超特急」) 初出現位置が86文字以降の語は削除する しかし、この方法によれば、キーワードとするか否かの
選択の条件が固定であり、多様な文書の性質に適応でき
ない。キーワードとするかどうかの判定は付属語のよう
な誰の目にもならないものもあるが、それ以外の語は文
書の性質によって大きく変わるものである。検索はユー
ザの興味や目的やその他さまざまな要因によって非常に
多様である。登録時のキーワードの選択、検索時の条件
はこの多様な目的によっても大きく変わる。
【0003】例えば、以下の新聞記事を先の方法でキー
ワードを抽出した場合、 ==================================== 米商務省、中小企業の育成のために8州に補助金を支給。 米商務省の研究機関、米標準技術研究所(NIST)は米国の八つの州に対し て、中小企業の競争力強化のための補助金を支給することを決めた。 同研究所は88年に民間の技術開発を担当することになった。 補助金支給はその一環である。支給対象はマサチューセッツ、アーカンソー、フ ロリダ、ミシシッピ、モンタナ、オクラホマ、オレゴン、テキサスの八州を選ん だ。 ==================================== 並列表現でありかつ初出現位置が76文字以降の「マサ
チューセッツ」以下の州の名前はキーワードにならな
い。また、「中小企業の競争力強化」の「中小企業」が
削除される。
【0004】この方法では文書の要点にあたる「中小企
業」が登録されない。これは言語ルールがかならずしも
対象文書の性質にあっていないためである。またユーザ
によっては「アメリカのテキサス州についてどんなこと
でもよいから知りたい」と思ったときには先の方法では
「テキサス」という地名は登録されないので、検索もで
きないことになる。また、キーワードの候補をシステム
が自動的に抽出し、最終的にユーザが選択する方法も考
えられるが、システムが候補を抽出する際にシステム側
の設定した基準である程度絞り込むのでユーザの付与し
たいキーワードが落ちることもある。またすべての語を
キーワード候補とする場合は落ちはないが、大量のキー
ワード候補をユーザがみることになり非常に面倒であ
り、非効率的である。
【0005】
【目的】本発明は、上述のごとき実情に鑑みなされたも
ので、文書登録の条件や検索の条件を指定可能にするこ
とで多様な検索に対応できる文書検索装置を提供するこ
とを目的としてなされたものである。
【0006】
【構成】本発明は、上記目的を達成するために、(1)
文書からキーワードを抽出し、該文書と対応づけて登録
する文書登録部と、指定のキーワードと合致する文書を
検索する文書検索部とからなる文書検索装置において、
日本語文の単語の区切りと品詞と品詞以外の情報を同定
する言語解析部と、キーワード登録時にユーザによりキ
ーワードとして登録する語の条件を指定するキーワード
条件指定部と、該キーワード条件指定部で指定された条
件に合致する語をキーワードとするキーワード登録部と
を有すること、更には、(2)前記文書検索部におい
て、検索時に検索した文書と該文書のキーワードとキー
ワード条件とを表示するキーワード条件表示部を有する
こと、更には、(3)文書登録時に、前記言語解析部に
より得た文書中の単語の品詞と品詞以外の情報とを表示
するキーワード条件表示部を有すること、或いは、
(4)文書からキーワードを抽出し、該文書と対応づけ
て登録する文書登録部と、指定のキーワードと合致する
文書を検索する文書検索部とからなる文書検索装置にお
いて、日本語文の単語の区切りと品詞と品詞以外の情報
を同定する言語解析部と、キーワードとキーワード以外
の情報とを登録する文書登録部と、検索時にキーワード
とキーワード以外の情報を指定するキーワード関連情報
指定部とを有すること、更には、(5)前記(4)にお
いて、検索時にキーワードとキーワード以外の情報を表
示するキーワード関連情報表示部を有することを特徴と
したものである。以下、本発明の実施例に基づいて説明
する。
【0007】図1は、本発明による文書検索装置の一実
施例(請求項1)を説明するための構成図で、図中、1
は文書、2は文書登録部、3は言語解析部、4はキーワ
ード条件指定部、5は文書検索部、6は文書ファイル、
7はキーワードファイルである。文書登録部2は、文書
1からキーワードを抽出し、該文書と対応づけて登録す
る。文書検索部5は指定のキーワードと合致する文書を
検索する。言語解析部3は日本語文の単語の区切りと品
詞と品詞以外の情報を同定する。キーワード条件指定部
4は、キーワード登録時にユーザによりキーワードとし
て登録する語の条件を指定する。キーワードファイル7
は、前記キーワード条件指定部で指定された条件に合致
する語をキーワードする。
【0008】図2は、文書登録部の動作を説明するため
のフローチャートである。以下、各ステップに従って順
に説明する。ユーザが文書の登録を指示したのち、文書
を言語解析部3で単語の区切りと品詞を認定し、付属語
を削除し、品詞情報と品詞以外の意味や頻度や出現位置
などの情報を解析して付与する(step1)。キーワード
条件指定部4においてユーザが登録したいキーワードの
条件を入力する(step2)。言語解析部3で付与された
情報のうち、指定された条件に一致した情報をもつ単語
だけをキーワードとして抽出し(step3)、キーワード
ファイル7、文書ファイル6に登録する(step4)。文
書検索部5はユーザの指定した条件に基づき条件に一致
するキーワードが付与された文書を検索する。
【0009】以下に具体例を示す。以下の文書を例に考
えた場合、 ==================================== 米商務省、中小企業の育成のために8州に補助金を支給。 米商務省の研究機関、米標準技術研究所(NIST)は米国の八つの州に対し て、中小企業の競争力強化のための補助金を支給することを決めた。 同研究所は88年に民間の技術開発を担当することになった。 補助金支給はその一環である。支給対象はマサチューセッツ、アーカンソー、フ ロリダ、ミシシッピ、モンタナ、オクラホマ、オレゴン、テキサスの八州を選ん だ。 ==================================== ユーザがアメリカの州についてどんな些細なことでも知
りたいという場合の例を示す。まず、本記事を言語解析
で解析して語の表記、品詞、頻度、出現位置などの情報
を保持しておき、キーワード条件指定部においてキーワ
ードの登録条件を以下のように入力する。 ・州名 ・頻度が2以上 ・タイトルに出現 ・表記が「米国」
【0010】条件に一致する語だけをキーワードとして
キーワードファイルに格納する。この文書には以下のキ
ーワードが付与される。(米商務省、中小企業、補助
金、研究所、支給、育成、マサチューセッツ、アンカー
ソー、フロリダ、ミシシッピ、モンタナ、オクラホマ、
オレゴン、テキサス) 検索時においてはテキサス州のことをなんでもいいから
知りたいという場合にキーワードを「テキサス」と指定
する。文書検索部においてキーワードファイルと文書フ
ァイルを検索し、「テキサス」が付与された文書を検索
する。上記の文書を検索することができる。
【0011】図3は、本発明による文書検索装置の他の
実施例(請求項2)を示す図で、図中、8はキーワード
条件表示部で、その他、図1と同じ作用をする部分は同
一の符号を付してある。キーワード条件表示部は、文書
検索部において、検索時に検索した文書と該文書のキー
ワードとキーワード条件とを表示する。
【0012】図4は、図3に示した文書検索装置におけ
る文書登録部の動作を説明するためのフローチャートで
ある。以下、各ステップに従って順に説明する。ユーザ
が文書の登録を指示したのち、文書を言語解析部3で単
語の区切りと品詞を認定し、付属語を削除し、品詞情報
と品詞以外の意味や頻度や出現位置などの情報を解析し
て付与する(step1)。キーワード条件指定部4におい
てユーザが登録したいキーワードの条件を入力する(st
ep2)。言語解析部3で付与された情報のうち、指定さ
れた条件に一致した情報をもつ単語だけをキーワードと
して抽出し(step3)、キーワードファイル7、文書フ
ァイルに文書6、キーワード、キーワード条件を格納す
る(step4)。
【0013】図5は、図3に示した文書検索装置におけ
る文書検索部の動作を説明するためのフローチャートで
ある。以下、各ステップに従って順に説明する。文書検
索部5はユーザの指定した条件に基づき、条件に一致す
るキーワードが付与された文書を検索する。まず、検索
条件を入力し(step1)、条件に一致する文書を検索す
る(step2)。そして文書とキーワードと登録したとき
のキーワード条件とを表示する(step3)。ユーザは検
索された文書、キーワードをみてキーワード条件を変更
するかどうか指示する(step4)。変更する場合は再度
文書登録部2でこの文書を登録する(step5)。
【0014】以下に具体例を示す。以下の文書を例に考
えた場合、 ==================================== 米商務省、中小企業の育成のために8州に補助金を支給。 米商務省の研究機関、米標準技術研究所(NIST)は米国の八つの州に対し て、中小企業の競争力強化のための補助金を支給することを決めた。 同研究所は88年に民間の技術開発を担当することになった。 補助金支給はその一環である。支給対象はマサチューセッツ、アーカンソー、フ ロリダ、ミシシッピ、モンタナ、オクラホマ、オレゴン、テキサスの八州を選ん だ。 ==================================== ユーザが登録の時にはアメリカの州のことなどを詳細に
知りたいとする。上記の文を登録する。キーワード条件
指定部においてキーワードの登録条件を以下のように入
力する。 ・州名 ・頻度が2以上 ・タイトルに出現 ・「米国」
【0015】文書登録部によってこの文書には以下のキ
ーワードが付与される。(米商務省、中小企業、補助
金、研究所、支給、育成、マサチューセッツ、アーカン
ソー、フロリダ、ミシシッピ、モンタナ、オクラホマ、
オレゴン、テキサス、米国) 検索時においてテキサスの研究所について検索したい場
合、条件として「テキサス」「研究所」と指定する。文
書検索部においてキーワードファイルと文書ファイルを
検索し、これらの語が付与された文書を検索する。上記
の文書を検索し、文書とキーワードとキーワード条件が
表示される。ユーザーがキーワードとキーワード条件を
みて変更したいと考えた場合(たとえば本記事は「テキ
サスの研究所」という内容とはずれていると判断した場
合)、キーワードやキーワード条件を変更する。
【0016】再び文書登録部で前のキーワード条件を変
え、「州名かつタイトルに出現」と変更する。本条件に
一致するキーワードは以下の通りとなる。(米商務省、
中小企業、補助金、支給、育成) このキーワードが文書に対応づけられて格納され、「テ
キサスの研究所」というキーワードでは検索されなくな
る。このようにユーザの検索の目的、基準が変更された
場合にキーワードを付与した条件をみることでより適切
な変更が可能になる。
【0017】図6は、本発明による文書検索装置の更に
他の実施例(請求項3)に示す図である。図3に示した
文書検索装置との相違は、図3においてはキーワード条
件表示部が文書検索部のもとに設けられているのに対
し、図6においては文書登録部のもとに設けられている
点である。すなわち、キーワード条件表示部8は、文書
登録時に言語解析部により得た文書中の単語の品詞と品
詞以外の情報とを表示する。
【0018】図7は、図6に示した文書検索装置におけ
る文書登録部の動作を説明するためのフローチャートで
ある。以下、各ステップに従って順に説明する。ユーザ
が文書の登録を指示したのち、文書を言語解析部3で単
語の区切りと品詞を認定し、付属語を削除し、品詞情報
と品詞以外の意味や頻度や出現位置などの情報を解析し
て付与する(step1)。キーワード条件表示部8によっ
て言語解析部3で得られた品詞、頻度、位置などの情報
の属性あるいは属性と値の候補、範囲を表示する(step
2)。キーワード条件指定部4において、ユーザが表示
のキーワードの条件にもとづき所望の条件を入力する
(step3)。文書登録部2で言語解析部3で付与された
情報のうち、指定された条件に一致した情報をもつ単語
だけをキーワードとして抽出して(step4)、キーワー
ドファイル7、文書ファイル6に登録する(step5)。
【0019】図8はキーワード条件の表示の例である。
言語情報の属性名と属性値、範囲が表示される。文書を
解析した結果に基づき、文書中に出現した品詞、出現位
置、頻度、意味などの属性とその値を表示する。ユーザ
はこれをみてキーワード条件をこの中から選択できる。
【0020】以下に具体例を示す。以下の文書を例に考
えた場合、 ==================================== 米商務省、中小企業の育成のために8州に補助金を支給。 米商務省の研究機関、米標準技術研究所(NIST)は米国の八つの州に対し て、中小企業の競争力強化のための補助金を支給することを決めた。 同研究所は88年に民間の技術開発を担当することになった。 補助金支給はその一環である。支給対象はマサチューセッツ、アーカンソー、フ ロリダ、ミシシッピ、モンタナ、オクラホマ、オレゴン、テキサスの八州を選ん だ。 ==================================== 上記の文書を登録する。言語解析部により文書を解析
し、付属語以外の語について品詞や品詞以外の頻度、位
置、意味などの情報を付与する。キーワード条件表示部
において単語の情報の属性と値の候補を表示する。ユー
ザが表示に基づきキーワード条件指定部においてキーワ
ードの登録条件を以下のように入力する。たとえばユー
ザが地名からいろいろな情報を検索したい場合、以下の
ように入力する。 ・品詞{地名} ・頻度{2以上} ・位置{タイトル}
【0021】これらを条件としてこれに一致する語をキ
ーワードとする。文書登録部によってこの文書には以下
のキーワードが付与される。(米商務省、中小企業、補
助金、研究所、支給、育成、マサチューセッツ、アーカ
ンソー、フロリダ、ミシシッピ、モンタナ、オクラホ
マ、オレゴン、テキサス) 検索時においてはある州のことをどんな些細なことでも
知りたいという場合、条件として「モンタナ」と指定す
ると文書検索部においてキーワードファイルと文書ファ
イルを検索し、「モンタナ」の付与された文書を検索す
る。上記の文書を検索することができる。
【0022】図9は、本発明による文書検索装置の更に
他の実施例(請求項4)を示す図で、図中、9はキーワ
ード関連情報指定部で、その他、図1と同じ作用をする
部分は同一の符号を付してある。キーワード関連情報指
定部9は、検索時にキーワードとキーワード以外の情報
を指定する。
【0023】図10は、図9に示した文書検索装置にお
ける文書登録部の動作を説明するためのフローチャート
である。以下、各ステップに従って順に説明する。ユー
ザが文書の登録を指示したのち、文書を言語解析部3で
単語の区切りと品詞を認定し、付属語を削除し、キーワ
ードとキーワード以外の情報、品詞情報や品詞以外の意
味や頻度や出現位置などの情報、文書全体の情報を解析
する(step1)。そして、文書登録部2では文書とキー
ワードとキーワードに関連する情報、文書全体に関する
情報をキーワードファイル7、文書ファイル6に格納す
る(step2)。
【0024】図11は、図9に示した文書検索装置にお
ける文書検索部の動作を説明するためのフローチャート
である。以下、各ステップに従って順に説明する。文書
検索部5はユーザの指定した条件に基づき条件に一致す
るキーワードが付与された文書を検索する。まず、検索
条件を入力するが、検索条件にはキーワード以外にその
キーワードに関するその他の条件、文書の条件(長さな
ど)を入力する(step1)。キーワードと入力されたキ
ーワードに関する条件の両方が一致する文書を検索する
(step2)。
【0025】図12は、キーワドファイルの一部であ
る。文書番号、キーワードと品詞、出現位置、頻度など
を保持する。
【0026】以下に具体例を示す。以下の文書を例に考
えた場合、 ==================================== 米商務省、中小企業の育成のために8州に補助金を支給。 米商務省の研究機関、米標準技術研究所(NIST)は米国の八つの州に対し て、中小企業の競争力強化のための補助金を支給することを決めた。 同研究所は88年に民間の技術開発を担当することになった。 補助金支給はその一環である。支給対象はマサチューセッツ、アーカンソー、フ ロリダ、ミシシッピ、モンタナ、オクラホマ、オレゴン、テキサスの八州を選ん だ。 ==================================== 上記の文書を登録する。言語解析部で単語の区切りと品
詞と品詞以外の情報を付与する。文書登録部では付属語
以外の語をキーワードとし、キーワードと品詞、出現状
況を付与する(図12)。検索時はユーザが「米国の中
小企業」について特に詳しく知りたい場合は検索条件と
して、表1に示すキーワードを指定する。
【0027】
【表1】
【0028】キーワードとそれに関する情報が一致する
文書を検索する。上記の文書を検索することができる。
またユーザがテキサス州のどんな些細な記事もさがした
い場合は(「テキサス」、出現位置はどこでもよい。頻
度は1以上)と指定する。この条件に一致する文書を検
索する。上記の文書を検索することができる。
【0029】図13は、本発明による文書検索装置の更
に他の実施例(請求項5)を示す図で、図中、10はキ
ーワード関連情報表示部で、その他、図9と同じ作用を
する部分は同一の符号を付してある。キーワード関連情
報表示部10は、検索時にキーワードとキーワード以外
の情報を表示する。図14は、図13に示した文書検索
装置における文書登録部の動作を説明するためのフロー
チャートである。以下、各ステップに従って順に説明す
る。ユーザが文書の登録を指示したのち、文書を言語解
析部3で単語の区切りと品詞を認定し、付属語を削除
し、キーワードとキーワード以外の情報、品詞情報や品
詞以外の意味や頻度や出現位置などの情報、文書全体の
情報を解析する(step1)。そして、文書登録部2では
文書とキーワードとキーワードに関連する情報、文書全
体に関する情報をキーワードファイル7、文書ファイル
6に格納する(step2)。
【0030】図15は、図13に示した文書検索装置に
おける文書検索部の動作を説明するためのフローチャー
トである。以下、各ステップに従って順に説明する。キ
ーワード関連情報を表示する。キーワードファイル7、
文書ファイル6をもとにユーザが指定し得るキーワード
に関する情報を表示する(step1)。ユーザはこれをみ
てキーワードとキーワード関連情報とを指定する(step
2)。そしてキーワードとキーワード関連情報の両方を
満たす文書を検索する。キーワードが指定されずキーワ
ード関連情報のみ指定された場合はキーワード関連情報
に一致する文書を検索する(step3)。逆も同様であ
る。
【0031】図16はキーワード関連情報の表示の一例
である。文書ファイル、キーワードファイルに基づき文
書に関する情報、キーワードに関する情報で条件として
指定し得るものを表示する。情報の属性名と値からな
る。値は文書ファイル、キーワードファイルに基づく値
である。つまり、実際に解析した文書の属性と値であ
る。
【0032】以下の具体例を示す。以下の文書を例に考
えた場合、 ==================================== 米商務省、中小企業の育成のために8州に補助金を支給。 米商務省の研究機関、米標準技術研究所(NIST)は米国の八つの州に対し て、中小企業の競争力強化のための補助金を支給することを決めた。 同研究所は88年に民間の技術開発を担当することになった。 補助金支給はその一環である。支給対象はマサチューセッツ、アーカンソー、フ ロリダ、ミシシッピ、モンタナ、オクラホマ、オレゴン、テキサスの八州を選ん だ。 ==================================== まずキーワード関連情報を表示する。ユーザはアメリカ
の補助金について詳細に知りたいが、長さの短い文書を
所望しているとする。表示された関連情報に基づき、以
下の表2に示す検索条件を入力する。
【0033】
【表2】
【0034】と検索条件を入力する。キーワードとキー
ワード以外の条件の両方に合致する文書を検索する。上
記の文書が検索される。またユーザがアメリカの州の文
書がみたい場合は以下の表3のキーワードを指定する。
【0035】
【表3】
【0036】上記の文書を検索できる。
【0037】
【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。 (1)請求項1に対応する効果;文書登録時にユーザの
目的・興味に応じてキーワードの条件を選択できるので
よりユーザに対応したキーワードづけができ、ユーザの
満足度の高い登録・検索が可能になる。 (2)請求項2に対応する効果;文書登録時ユーザの目
的・興味に応じてキーワードを選択できるのでよりユー
ザに対応したキーワードづけができ、また検索された文
書のキーワード条件をみることができるので、それに基
づき、よりユーザに対応したキーワードづけと検索が可
能になる。検索の目的の変更に対して簡単に対応でき
る。 (3)請求項3に対応する効果;文書登録時にユーザの
目的・興味に応じてキーワードを選択できるのでよりユ
ーザに対応したキーワードづけができ、また登録の際に
文書の解析された結果を品詞やそのほかの詳細な観点か
らみることができるのでそれにもとづき、より文書の性
質とユーザの目的に対応した登録・検索が可能になる。 (4)請求項4に対応する効果;登録時はユーザが介入
せず簡便であり、かつ検索時にはキーワードとキーワー
ド以外の検索条件を設定することでユーザの目的にかな
った検索が可能である。 (5)請求項5に対応する効果;文書登録はユーザが介
入せず簡便で、かつ検索時にはキーワードとキーワード
以外の検索条件を設定することでユーザの目的にかなっ
た検索が可能である。文書集合中のキーワードやキーワ
ード以外の情報をみることができるので文書集合の性質
をふまえた上での、よりユーザの目的にかなった検索が
可能である。
【図面の簡単な説明】
【図1】 本発明による文書検索装置の一実施例(請求
項1)を説明するための構成図である。
【図2】 文書登録部の動作を説明するためのフローチ
ャートを示す図である。
【図3】 本発明による文書検索装置の他の実施例(請
求項2)を示す図である。
【図4】 図3の文書検索装置における文書登録部の動
作を説明するためのフローチャートを示す図である。
【図5】 図3の文書検索装置における文書検索部の動
作を説明するためのフローチャートを示す図である。
【図6】 本発明による文書検索装置の更に他の実施例
(請求項3)を示す図である。
【図7】 図6の文書検索装置における文書登録部の動
作を説明するためのフローチャートを示す図である。
【図8】 キーワード条件の表示の例を示す図である。
【図9】 本発明による文書検索装置の更に他の実施例
(請求項4)を示す図である。
【図10】 図9の文書検索装置における文書登録部の
動作を説明するためのフローチャートを示す図である。
【図11】 図9の文書検索装置における文書検索部の
動作を説明するためのフローチャートを示す図である。
【図12】 キーワードファイルの一部を示す図であ
る。
【図13】 本発明による文書検索装置の更に他の実施
例(請求項5)を示す図である。
【図14】 図13の文書検索装置における文書登録部
の動作を説明するためのフローチャートを示す図であ
る。
【図15】 図13の文書検索装置における文書登録部
の動作を説明するためのフローチャートを示す図であ
る。
【図16】 キーワード関連情報の表示の一例を示す図
である。
【符号の説明】
1…文書、2…文書登録部、3…言語解析部、4…キー
ワード条件指定部、5…文書検索部、6…文書ファイ
ル、7…キーワードファイル。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文書からキーワードを抽出し、該文書と
    対応づけて登録する文書登録部と、指定のキーワードと
    合致する文書を検索する文書検索部とからなる文書検索
    装置において、日本語文の単語の区切りと品詞と品詞以
    外の情報を同定する言語解析部と、キーワード登録時に
    ユーザによりキーワードとして登録する語の条件を指定
    するキーワード条件指定部と、該キーワード条件指定部
    で指定された条件に合致する語をキーワードとするキー
    ワード登録部とを有することを特徴とする文書検索装
    置。
  2. 【請求項2】 前記文書検索部において、検索時に検索
    した文書と該文書のキーワードとキーワード条件とを表
    示するキーワード条件表示部を有することを特徴とする
    請求項1記載の文書検索装置。
  3. 【請求項3】 文書登録時に、前記言語解析部により得
    た文書中の単語の品詞と品詞以外の情報とを表示するキ
    ーワード条件表示部を有することを特徴とする請求項1
    記載の文書検索装置。
  4. 【請求項4】 文書からキーワードを抽出し、該文書と
    対応づけて登録する文書登録部と、指定のキーワードと
    合致する文書を検索する文書検索部とからなる文書検索
    装置において、日本語文の単語の区切りと品詞と品詞以
    外の情報を同定する言語解析部と、キーワードとキーワ
    ード以外の情報とを登録する文書登録部と、検索時にキ
    ーワードとキーワード以外の情報を指定するキーワード
    関連情報指定部とを有することを特徴とする文書検索装
    置。
  5. 【請求項5】 検索時にキーワードとキーワード以外の
    情報を表示するキーワード関連情報表示部を有すること
    を特徴とする請求項4記載の文書検索装置。
JP3326557A 1991-11-14 1991-11-14 文書検索装置 Pending JPH05135107A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3326557A JPH05135107A (ja) 1991-11-14 1991-11-14 文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3326557A JPH05135107A (ja) 1991-11-14 1991-11-14 文書検索装置

Publications (1)

Publication Number Publication Date
JPH05135107A true JPH05135107A (ja) 1993-06-01

Family

ID=18189157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3326557A Pending JPH05135107A (ja) 1991-11-14 1991-11-14 文書検索装置

Country Status (1)

Country Link
JP (1) JPH05135107A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0785101A (ja) * 1993-09-20 1995-03-31 Fujitsu F I P Kk キーワード抽出処理装置
JPH1125108A (ja) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0785101A (ja) * 1993-09-20 1995-03-31 Fujitsu F I P Kk キーワード抽出処理装置
JPH1125108A (ja) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム

Similar Documents

Publication Publication Date Title
US7783644B1 (en) Query-independent entity importance in books
US6564210B1 (en) System and method for searching databases employing user profiles
US6286000B1 (en) Light weight document matcher
JPH08190564A (ja) 情報検索方法及びシステム
EP1716511A1 (en) Intelligent search and retrieval system and method
JPH0778182A (ja) キーワード付与システム
JPS603056A (ja) 情報整理装置
WO2000075809A1 (fr) Procede de triage d'informations, trieur d'informations, support enregistre sur lequel le programme de triage d'informations est enregistre
JPH08305616A (ja) データ管理システム
US8510325B1 (en) Supplementing search results with information of interest
US20040158558A1 (en) Information processor and program for implementing information processor
JPH0486950A (ja) 文書検索方法
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
JPH06348755A (ja) 文書分類方法およびそのシステム
TWI290687B (en) System and method for search information based on classifications of synonymous words
JPH08161343A (ja) 関連語辞書作成装置
JPH05128152A (ja) 文書検索支援方法
JPH0944523A (ja) 関連語提示装置
JPH05135107A (ja) 文書検索装置
JPH0934911A (ja) 情報検索装置
JPH0581326A (ja) データベース検索装置
JP2003208447A (ja) 文書検索装置、文書検索方法、文書検索プログラム及び文書検索プログラムを記録した媒体
CA1276728C (en) Information retrieval system and method
JP4426893B2 (ja) 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
JP2018073309A (ja) 文書検索方法及び装置