JP3135422B2 - Document retrieval apparatus and method - Google Patents

Document retrieval apparatus and method

Info

Publication number
JP3135422B2
JP3135422B2 JP05173117A JP17311793A JP3135422B2 JP 3135422 B2 JP3135422 B2 JP 3135422B2 JP 05173117 A JP05173117 A JP 05173117A JP 17311793 A JP17311793 A JP 17311793A JP 3135422 B2 JP3135422 B2 JP 3135422B2
Authority
JP
Japan
Prior art keywords
search
document
name
history
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05173117A
Other languages
Japanese (ja)
Other versions
JPH0728845A (en
Inventor
隆也 上田
史朗 伊藤
泰夫 奥谷
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP05173117A priority Critical patent/JP3135422B2/en
Publication of JPH0728845A publication Critical patent/JPH0728845A/en
Application granted granted Critical
Publication of JP3135422B2 publication Critical patent/JP3135422B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、文書検索装置、特に全
文を対象にして検索を行なう全文検索装置に関するもの
である。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document search apparatus, and more particularly to a full-text search apparatus for performing a search on all text.

【0002】[0002]

【従来の技術】文書データベースの普及と、計算機処理
能力の向上により、大量の文書データベースから、指定
されたキーワードを含む文書を検索する文書検索装置が
用いられるようになってきている。
2. Description of the Related Art With the spread of a document database and an improvement in computer processing capability, a document retrieval apparatus for retrieving a document including a specified keyword from a large number of document databases has been used.

【0003】特に最近では、検索の際の柔軟性を向上さ
せるために、あらかじめ文書につけられたキーワードを
使って検索するのでなく、全文を対象にして検索するこ
とにより、自由なキーワードを指定できるようにした全
文検索の方式が用いられるようになってきている。この
方式には、どのようなキーワードを使わなければならな
いという制約がないので誰にでも検索することができる
という特徴がある。
[0003] In particular, recently, in order to improve the flexibility in searching, a free keyword can be specified by searching the entire text instead of using a keyword attached to a document in advance. The full text search method has been used. This method has a feature that anyone can search because there is no restriction that any keyword must be used.

【0004】全文検索においては、ユーザが指定したキ
ーワード(以下、検索語と呼ぶ)の表す概念が別の表現
として文書中にあらわれることがあるので、検索システ
ム側が同義語辞書や異表記語辞書を使って、検索語とし
て同義語・異表記語を追加して(これを検索語展開と呼
ぶ)から検索を行なうのが普通である。
In a full-text search, a concept represented by a keyword specified by a user (hereinafter, referred to as a search word) may appear as another expression in a document. It is common practice to add a synonym / heterograph as a search word and use it (this is called a search word expansion) to perform a search.

【0005】[0005]

【発明が解決しようとする課題】ところで固有名詞で表
される事物を検索することを考えると、その名称は時期
によって変更されることがある。例えば会社名や国名が
変更される場合である。また、人物を検索する場合を考
えると、その姓名は変更されなくても、役職についてい
る人物はフルネームで言及されるよりも姓+役職名また
は役職名のみで言及されることのほうが多く、そのよう
な表現形式については時期によって役職が異なること
で、名称が変わることになる。
By the way, when searching for an object represented by a proper noun, its name may be changed depending on time. For example, when a company name or a country name is changed. Also, when searching for a person, even if their first and last names are not changed, people who hold a position are often referred to by their last name + title or title only, rather than their full names. In such an expression form, the title changes depending on the position at different times.

【0006】従来の同義語辞書はこのように時期によっ
て変更される名称には対応していなかった。これに対処
するために過去に使われた全ての名称を同義語として登
録することも考えられるが、そうすると、ある名称が使
われていない時期の文書についてもその名称を使って検
索することになり、不要な文書まで得られてしまう危険
性がある。また、人物の場合は姓だけを検索語にするこ
とも考えられるが、同姓の他の人も検索されてしまい、
やはり検索の際のノイズが増える。いずれにせよ、従来
の文書検索装置の場合、時期によって変更される名称を
持つ事物については検索精度が下がってしまうという問
題点があった。
[0006] The conventional synonym dictionary does not support such names that change with time. In order to deal with this, it is conceivable to register all names used in the past as synonyms, but if you do so, documents that have not been used at a certain time will be searched using that name. However, there is a risk that unnecessary documents may be obtained. In addition, in the case of a person, it is conceivable to use only the last name as a search term, but other people with the same last name will also be searched,
After all, the noise at the time of search increases. In any case, in the case of the conventional document search apparatus, there is a problem that the search accuracy is reduced for an object having a name that changes depending on the time.

【0007】本発明の目的は、上述の欠点を除去し、文
書検索装置の検索精度を向上させることにある。
An object of the present invention is to eliminate the above-mentioned drawbacks and improve the search accuracy of a document search device.

【0008】[0008]

【課題を解決するための手段】上記課題を解決するため
に、本発明の文書検索装置は、文書を該文書に対する日
付情報とともに記憶する文書記憶手段と、事物の名称の
履歴を、各名称を該名称の使用期間と対応づけて記憶す
る名称履歴記憶手段と、検索語を入力する入力手段と、
該入力手段より入力された検索語と、前記文書記憶手段
に記憶された検索対象文書の日付情報とに基づいて、前
記名称履歴記憶手段を参照し、前記検索語を展開する検
索語展開手段と、該検索語展開手段によって展開された
検索語により、前記検索対象文書を検索する検索手段と
を具える。
In order to solve the above problems, a document search apparatus according to the present invention includes a document storage means for storing a document together with date information for the document, a history of names of objects, and a record of each name. Name history storage means for storing in association with the use period of the name, input means for inputting a search word,
A search term expansion unit that expands the search word by referring to the name history storage unit based on the search word input from the input unit and the date information of the search target document stored in the document storage unit; Search means for searching the search target document by the search word expanded by the search word expansion means.

【0009】また、本発明の他の態様によれば、文書を
該文書に対する日付情報とともに記憶する文書ファイル
中の文書を、検索語を用いて検索する文書検索方法にお
いて、事物の名称の履歴を、各名称を該名称の使用期間
と対応づけて名称履歴メモリに記憶させておき、検索語
を入力し、該入力された検索語と、前記文書ファイルに
記憶された検索対象文書の日付情報とに基づいて、前記
名称履歴メモリを参照して、前記検索語を展開し、該展
開された検索語により、前記検索対象文書を検索するこ
とを特徴とする。
According to another aspect of the present invention, in a document search method for searching for a document in a document file that stores the document together with date information for the document by using a search term, a history of an object name is stored. Each name is stored in the name history memory in association with the use period of the name, a search word is input, and the input search word and the date information of the search target document stored in the document file are stored. , The search word is expanded by referring to the name history memory, and the search target document is searched by the expanded search word.

【0010】[0010]

【作用】上記文書検索装置は、入力手段より入力された
検索語と、文書記憶手段に記憶された検索対象文書の日
付情報とに基づいて、名称履歴記憶手段を参照して、検
索語展開手段により前記検索語を展開し、展開された検
索語によって、検索手段が前記検索対象文書を検索す
る。
The above-mentioned document search device refers to the name history storage means based on the search word input from the input means and the date information of the search target document stored in the document storage means, and searches the search word expansion means. And the search means searches the search target document based on the expanded search word.

【0011】また、上記文書検索方法によれば、事物の
名称の履歴を、各名称を該名称の使用期間と対応づけて
名称履歴メモリに記憶させておき、検索語を入力し、該
入力された検索語と、前記文書ファイルに記憶された検
索対象文書の日付情報とに基づいて、前記名称履歴メモ
リを参照して、前記検索語を展開し、該展開された検索
語により、前記検索対象文書を検索する。
According to the above document search method, a history of names of things is stored in a name history memory in which each name is associated with a use period of the name, and a search word is input. The search term is expanded by referring to the name history memory based on the search term and the date information of the search target document stored in the document file, and the search target is expanded by the expanded search term. Search for documents.

【0012】[0012]

【実施例】以下、図面を参照して本発明を詳細に説明す
る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described below in detail with reference to the drawings.

【0013】図1は本発明の一実施例に係る装置の構成
を示すブロック図である。本実施例では人名の検索を行
なう場合を例にとる。
FIG. 1 is a block diagram showing the configuration of an apparatus according to one embodiment of the present invention. In this embodiment, a case where a search for a personal name is performed is taken as an example.

【0014】同図において、101は検索語を入力する
検索語入力部、102は入力された検索語に同義語等を
追加する検索語展開部、103は展開された語を含めて
検索語を保持する検索語保持部、104は検索語展開に
用いる同義語辞書である。105は各人物について役職
の履歴を記述した役職履歴データベース、106は検索
対象になっている人物について役職の履歴を保持する役
職履歴保持部、107は文書中に検索語が含まれている
かどうか調べる検索処理部、108は文書を格納した文
書データベース、109は文書の日付を調べる文書日付
判定部、110は検索の結果得られた文書が正しいかど
うかを調べる検索結果判定部、111は役職名に関して
検索結果が正しいかどうかを判定するための規則を保持
する役職判定規則保持部、112は検索結果を保持する
検索結果保持部である。
In FIG. 1, reference numeral 101 denotes a search word input unit for inputting a search word, 102 denotes a search word expansion unit for adding a synonym or the like to the input search word, and 103 denotes a search word including the expanded word. The retained search term storage unit 104 is a synonym dictionary used for search term expansion. 105 is a job history database describing the history of jobs for each person; 106 is a job history holding unit that holds the job history of the person to be searched; 107 is whether or not the document contains a search term A search processing unit, 108 is a document database storing documents, 109 is a document date determination unit that checks the date of the document, 110 is a search result determination unit that checks whether the document obtained as a result of the search is correct, and 111 is a post name. A post determination rule storage unit 112 for storing rules for determining whether the search result is correct is a search result storage unit for storing search results.

【0015】図2は本発明をさらに具体的に説明するも
のである。
FIG. 2 illustrates the present invention more specifically.

【0016】同図において、201は図3に示す制御手
順を記憶する制御メモリである。これはROMであって
もよいし、RAMであってもよい。202は制御メモリ
201に記憶されている制御手順にしたがって処理を行
なう中央処理装置である。203はメモリで、検索語保
持部103・検索結果保持部112・役職履歴保持部1
06・役職判定規則保持部111として利用されるエリ
アを有する。204はキーボードであり、検索語をユー
ザが入力するのに用いる。205はディスク装置であ
り、文書データベース・役職履歴データベース・同義語
辞書を有する。206はディスプレイで、CRTあるい
は液晶ディスプレイなどである。これは検索結果を表示
するのに用いる。207はバスである。
In FIG. 1, reference numeral 201 denotes a control memory for storing the control procedure shown in FIG. This may be a ROM or a RAM. Reference numeral 202 denotes a central processing unit that performs processing according to a control procedure stored in the control memory 201. Reference numeral 203 denotes a memory, a search word holding unit 103, a search result holding unit 112, and a post history holding unit 1.
06. There is an area used as the post determination rule holding unit 111. A keyboard 204 is used by a user to input a search word. A disk device 205 has a document database, a post history database, and a synonym dictionary. Reference numeral 206 denotes a display, such as a CRT or a liquid crystal display. This is used to display search results. 207 is a bus.

【0017】図3は、図1に示した装置における動作の
処理手順を示すフローチャートである。本図を参照しな
がら本発明の一実施例の動作を説明する。ここでは入力
される検索語が1語のみの場合について説明する。ま
た、文書データベース108には文書が時間順に格納さ
れているものとする。
FIG. 3 is a flowchart showing a processing procedure of the operation in the apparatus shown in FIG. The operation of the embodiment of the present invention will be described with reference to FIG. Here, a case will be described in which only one search word is input. It is also assumed that documents are stored in the document database 108 in chronological order.

【0018】まず、ステップS301では、検索語入力
部101から入力された検索語について役職履歴データ
ベース105を検索し、検索の結果得られた検索語の人
物の役職の履歴を役職履歴保持部106に保持する。役
職履歴データベース105には、例えば図4のように期
間と役職(もしくは肩書き)が記述されている。この中
で「前首相」「元首相」というのは役職名ではないが肩
書きとして用いられるものであるので、このようなもの
も記述しておく。
First, in step S301, the position history database 105 is searched for the search word input from the search word input unit 101, and the position history of the person of the search word obtained as a result of the search is stored in the position history holding unit 106. Hold. In the post history database 105, for example, a period and a post (or title) are described as shown in FIG. Among them, "previous prime minister" and "former prime minister" are not titles but are used as titles, so such a prime minister is also described.

【0019】次にステップS302で検索語保持部10
3の初期化を行なう。検索語保持部103には役職履歴
の有無と期間と検索語を保持する。役職履歴があった場
合は、記載されているうちで最も古い役職の開始日の前
日までを期間の初期値とし、役職をつけない姓名を検索
語の初期値とする。例えば「竹下登」の最も古い役職の
開始日が1958/05/21だとすると、図5の
(1)のように役所履歴“有”、期間を「−1959/
05/20]、検索語を「竹下登」とする。役職履歴が
なかった場合は検索語をそのまま入れる。例えば「日本
太郎」の役職履歴がない場合は、図5の(2)のように
役職履歴を“無”、検索語を「日本太郎」とする。
Next, in step S302, the retrieval word holding unit 10
3 is initialized. The search word holding unit 103 holds the presence / absence, period, and search word of the post history. If there is a post history, the date up to the day before the start date of the oldest post is described as the initial value of the period, and the first and last name without the post is used as the initial value of the search word. For example, if the start date of the oldest post of "Noboru Takeshita" is 05/21/1958, as shown in (1) of FIG.
05/20], and the search term is “Takeshita Noboru”. If there is no post history, enter the search word as it is. For example, when there is no post history of "Taro Nippon", the post history is set to "none" and the search word is "Taro Nippon" as shown in (2) of FIG.

【0020】ステップS303では、文書データベース
108から文書を一つ取り出す。次にステップS304
において、検索語保持部103で役職履歴が“有”にな
っているかどうかを調べる。役職履歴がない場合は通常
の検索を行なえばいいので、ステップS311に移り、
文書に検索語が含まれているかどうかを調べる検索処理
を行なう。
In step S303, one document is extracted from the document database 108. Next, step S304
In the search word holding unit 103, it is checked whether or not the post history is "present". If there is no post history, a normal search may be performed, and the process proceeds to step S311.
A search process is performed to check whether a search term is included in the document.

【0021】ステップS304で役職履歴がある場合は
ステップS305に移り、文書日付判定部109で、現
在注目している文書の日付が、検索語保持部103に保
持されている期間に入っているかどうかを調べる。期間
に入っていた場合はステップS307に移り、現在検索
語保持部103に保持されている検索語で検索処理を行
なう。期間に入っていなければ役職名を変更する必要が
あるので、ステップS306に移り、文書の日付に対応
した役職名を役職履歴保持部106から取り出し、さら
に検索語の展開を行なう。検索語展開の際には、同義語
辞書104で役職名の同義語を調べ、それぞれを<姓+
役職名>と<役職名>に展開する。展開した結果と元の
検索語<姓名>は期間とともに検索語保持部103に保
持する。そしてステップS307で検索処理を行なう。
このステップS307の検索処理はステップS311の
検索処理と同じであり、検索語保持部103に保持され
た検索語が文書中に存在するかどうかを調べる。この手
法は、一般に知られている文字列照合アルゴリズムにし
たがってもよいし、あらかじめインデクスを用意してお
き、それを使って検索してもよい。
If there is a post history in step S304, the process proceeds to step S305, and the document date determination unit 109 determines whether the date of the document of interest is within the period held in the search word holding unit 103. Find out. If it is within the period, the process moves to step S307, and a search process is performed using the search word currently held in the search word holding unit 103. If it is not within the period, the job title needs to be changed, so the process moves to step S306, where the job title corresponding to the date of the document is extracted from the job history holding unit 106, and the search term is further expanded. When the search word is expanded, the synonym dictionary 104 is used to look up synonyms of the job title, and each is searched for <surname +
Expands to <title> and <title>. The expanded result and the original search word <first name and last name> are held in the search word holding unit 103 together with the period. Then, a search process is performed in step S307.
The search processing in step S307 is the same as the search processing in step S311. It is checked whether the search term held in the search term holding unit 103 exists in the document. This method may be in accordance with a generally known character string collation algorithm, or an index may be prepared in advance and searched using the index.

【0022】ステップS308では、文書中に検索語が
存在した場合に、役職名のみの語があるかどうか調べ
る。なければステップS310に移る。あった場合は、
ステップS309で検索結果が正しいかどうかを判定す
る。<姓+役職名>の場合は検索結果が誤っていること
は少ないが、<役職名>だけの場合は検索結果に誤りが
あることが少なくない。例えば、図8に示す例では、
「(竹下)首相」が検索語の場合、(1)は問題ない
が、(2)は誤りである。そこで、役職判定規則保持部
111に役職名に関する判定規則を入れておき、検索結
果が正しいかどうかを判定する。この規則は例えば「役
職名の前に検索語の<姓>以外の人名が来ているものは
正しくない」というようなものである。正しくないと判
定された結果は検索結果保持部112から削除する。そ
してステップS310に移る。
In step S308, if there is a search word in the document, it is checked whether or not there is a word having only the title. If not, the process moves to step S310. If there is
In step S309, it is determined whether the search result is correct. In the case of <last name + post name>, the search result is rarely wrong, but in the case of only <post name>, the search result often has errors. For example, in the example shown in FIG.
If “(Takeshita) Prime Minister” is a search term, (1) is OK, but (2) is incorrect. Therefore, a determination rule relating to the title is entered in the title determination rule holding unit 111, and it is determined whether the search result is correct. This rule is, for example, "It is not correct that a person's name other than the search term <surname> comes before the post name." The result determined to be incorrect is deleted from the search result holding unit 112. Then, control goes to a step S310.

【0023】ステップS310では文書が残っているか
どうかを調べ、残っていればステップS303に戻って
処理を繰り返す。残っていなければ処理を終了する。
In step S310, it is checked whether or not a document remains, and if so, the process returns to step S303 to repeat the processing. If not, the process ends.

【0024】次に、実例を示して、本実施例のさらなる
説明を行なう。検索語として「竹下登」が与えられたと
する。この検索語に対応する役職履歴データベース10
5の内容は図4のようになる。そこでこれを役職履歴保
持部106に保持する。また、検索語保持部103の初
期状態は図5の(1)に示すようになる。
Next, the present embodiment will be further described with reference to an actual example. Suppose that "Noboru Takeshita" is given as a search word. Post history database 10 corresponding to this search term
5 is as shown in FIG. Therefore, this is held in the post history holding unit 106. Also, the initial state of the search word holding unit 103 is as shown in (1) of FIG.

【0025】一つ目の文書を取り出したときに日付が1
987年1月1日だったとする。これは検索語保持部1
03に記述されている期間「−1958/05/20」
に含まれないので、この日付に対応する役職名を役職履
歴保持部106で調べ「幹事長」を得る。検索語展開の
際には<姓+役職名>と<役職名>に展開するので、
「幹事長」の同義語がなかった場合は図6に示すように
「竹下幹事長」「幹事長」「竹下登」の3語に展開し、
その期間「1986/07/22−1987/11/0
5]とあわせて検索語保持部103に保持する。
When the first document is taken out, the date is 1
Suppose it was January 1, 987. This is the search term holder 1
03 “1958/05/20” described in 03
, The position title corresponding to this date is checked by the position history holding unit 106 to obtain the “secretary general”. When expanding the search term, it expands to <last name + title> and <title>
If there is no synonym for "secretary general", it is expanded to three words "secretary general Takeshita", "general secretary general" and "Noboru Takeshita" as shown in FIG.
During that period, "1986/07 / 22-1987 / 11/0
5] together with the search word storage unit 103.

【0026】以後、文書の日付が1987年11月5日
までの場合は、この検索語をそのまま使うことができる
が、例えば日付が1987年11月6日になった場合
は、検索語保持部103に保持された期間におさまらな
いことになる。そこで、再び役職履歴保持部106で調
べて「首相」を得る。同義語辞書104で同義語を調べ
て「総理大臣」「総理」が得られたとしたら、前と同様
にして図7に示すように「竹下首相」「竹下総理」「竹
下総理大臣」「首相」「総理」「総理大臣」「竹下登」
の7語に展開して検索語保持部103の内容を変更す
る。
Thereafter, when the date of the document is until November 5, 1987, this search word can be used as it is. For example, when the date is November 6, 1987, the search word holding unit The period held at 103 will not be satisfied. Then, the position history holding unit 106 checks again to obtain the “Prime Minister”. Assuming that "Prime Minister" and "Prime" are obtained by looking up synonyms in the synonym dictionary 104, "Prime Minister Takeshita", "Prime Minister Takeshita", "Prime Minister Takeshita""PrimeMinister" is performed as shown in FIG. "Prime Minister""PrimeMinister""NoboruTakeshita"
And changes the content of the search term holding unit 103.

【0027】(他の実施例) 1.上記実施例では役職名を伴う人名を検索する場合に
ついて説明したが、国名や組織名など名称そのものが変
化するものを検索する場合は、役職履歴データベースの
代わりに、それぞれの名称の履歴を格納したデータベー
スを用意し、期間によって検索語を切り替えるようにす
ればよい。
(Other Embodiments) In the above embodiment, the case of searching for a person name accompanied by a position name has been described.However, when searching for a name that changes itself such as a country name or an organization name, a history of each name is stored instead of the position history database. A database may be prepared, and the search term may be switched depending on the period.

【0028】2.上記実施例では検索語が1語の場合に
ついて説明したが、検索語が複数ある場合でも検索語保
持部に複数の検索語を保持し、個々の語について同様の
処理を行なえばよい。
2. In the above embodiment, the case where one search word is used has been described. However, even when there are a plurality of search words, a plurality of search words may be held in the search word holding unit, and the same processing may be performed for each word.

【0029】3.上記実施例では同時に二つ以上の役職
についていない場合について説明したが、同時に複数の
役職につくような場合は、いずれかの役職が変化する日
付が来るたびに検索語の変更を行なうようにすればよ
い。
3. In the above embodiment, a case where two or more positions are not simultaneously described has been described.However, in a case where a plurality of positions are simultaneously taken, a search term is changed every time a date at which any position changes is reached. I just need.

【0030】4.上記実施例では文書が時間順に文書デ
ータベースに格納されている場合について説明したが、
文書が時間順に格納されていない場合は、個々の文書の
日付に応じて検索語を切り替えるようにすれば同様に実
施できる。
4. In the above embodiment, the case where the documents are stored in the document database in chronological order has been described.
If the documents are not stored in chronological order, the same can be implemented by switching the search term according to the date of each document.

【0031】5.上記実施例では名称変更の日付と文書
の日付が一致した時に検索語を切り替えるようにした
が、文書に遅れがあるような場合(例えば週刊誌や月刊
誌)は、その遅れの分を考慮して検索語を切り替えるよ
うにしてもよい。
5. In the above embodiment, the search term is switched when the date of the name change and the date of the document match. However, when there is a delay in the document (for example, weekly magazine or monthly magazine), the delay is taken into account. May be used to switch the search term.

【0032】[0032]

【発明の効果】以上説明したように、本発明によれば、
固有名詞の検索を行なう場合、時期による名称の変更を
気にかけることなく目的の文書を得ることができるよう
になると期待できるので、文書検索装置の検索精度が向
上するという効果がある。
As described above, according to the present invention,
When performing a search for proper nouns, it is expected that a target document can be obtained without worrying about a change in the name due to the time. Therefore, the search accuracy of the document search device is improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例に係る装置の基本構成を示す
図である。
FIG. 1 is a diagram showing a basic configuration of an apparatus according to an embodiment of the present invention.

【図2】本発明の一実施例に係るシステム構成を示すブ
ロック図である。
FIG. 2 is a block diagram illustrating a system configuration according to an embodiment of the present invention.

【図3】本発明の一実施例に係る検索処理手順を示すフ
ローチャートである。
FIG. 3 is a flowchart illustrating a search processing procedure according to an embodiment of the present invention.

【図4】役職履歴データベースおよび役職履歴保持部内
容の例を示す図である。
FIG. 4 is a diagram illustrating an example of a post history database and post history holding unit contents.

【図5】検索語保持部の初期状態の例を示す図である。FIG. 5 is a diagram illustrating an example of an initial state of a search word holding unit;

【図6】検索語保持部の内容の例を示す図である。FIG. 6 is a diagram illustrating an example of contents of a search term holding unit.

【図7】検索語保持部の内容の例を示す図である。FIG. 7 is a diagram illustrating an example of contents of a search term holding unit.

【図8】検索結果を説明するための実例である。FIG. 8 is an actual example for explaining a search result.

【符号の説明】[Explanation of symbols]

101 検索語入力部 102 検索語展開部 103 検索語保持部 104 同義語辞書 105 役職履歴データベース 106 役職履歴保持部 107 検索処理部 108 文書データベース 109 文書日付判定部 110 検索結果判定部 111 役職判定規則保持部 112 検索結果保持部 101 search word input unit 102 search word expansion unit 103 search word holding unit 104 synonym dictionary 105 post history database 106 post history storage unit 107 search processing unit 108 document database 109 document date judgment unit 110 search result judgment unit 111 post judgment rule holding Part 112 Search result holding part

───────────────────────────────────────────────────── フロントページの続き (72)発明者 藤田 稔 東京都大田区下丸子3丁目30番2号キヤ ノン株式会社内 (56)参考文献 特開 平4−350768(JP,A) 特開 平5−28199(JP,A) 高木、安田、島崎、池原,「日本語処 理における固有名詞実在性検定方式の検 討」,情報処理学会第35回(昭和62年後 期)全国大会講演論文集,No.2,昭 和63年9月28日,p.1293−1294 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06F 12/00 520 JICSTファイル(JOIS)────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Minoru Fujita 3-30-2 Shimomaruko, Ota-ku, Tokyo Inside Canon Inc. (56) References JP-A-4-350768 (JP, A) JP-A-5 −28199 (JP, A) Takagi, Yasuda, Shimazaki, Ikehara, “Examination of proper noun existence test method in Japanese processing”, Proc. Of the 35th IPSJ Annual Conference (late 1987) , No. 2, September 28, 1988, p. 1293-1294 (58) Field surveyed (Int. Cl. 7 , DB name) G06F 17/30 G06F 12/00 520 JICST file (JOIS)

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 文書を該文書に対する日付情報とともに
記憶する文書記憶手段と、 事物の名称の履歴を、各名称を該名称の使用期間と対応
づけて記憶する名称履歴記憶手段と、 検索語を入力する入力手段と、 該入力手段より入力された検索語と、前記文書記憶手段
に記憶された検索対象文書の日付情報とに基づいて、前
記名称履歴記憶手段を参照し、前記検索語を展開する検
索語展開手段と、 該検索語展開手段によって展開された検索語により、前
記検索対象文書を検索する検索手段とを具えたことを特
徴とする情報検索装置。
1. A document storage means for storing a document together with date information for the document; a name history storage means for storing a history of names of objects in association with each name in use of the name; Based on input means for inputting, a search term input from the input means, and date information of a search target document stored in the document storage means, referencing the name history storage means and expanding the search term An information search apparatus comprising: a search word expanding unit that performs search; and a search unit that searches for the search target document based on the search word expanded by the search word expanding unit.
【請求項2】 前記名称履歴記憶手段が、人物の名称の
履歴として該人物の肩書きとその使用期間を記憶するこ
とを特徴とする請求項1記載の文書検索装置。
2. The document search apparatus according to claim 1, wherein the name history storage means stores the title of the person and the period of use as the history of the name of the person.
【請求項3】 文書を該文書に対する日付情報とともに
記憶する文書ファイル中の文書を、検索語を用いて検索
する文書検索方法において、 事物の名称の履歴を、各名称を該名称の使用期間と対応
づけて名称履歴メモリに記憶させておき、 検索語を入力し、 該入力された検索語と、前記文書ファイルに記憶された
検索対象文書の日付情報とに基づいて、前記名称履歴メ
モリを参照して、前記検索語を展開し、 該展開された検索語により、前記検索対象文書を検索す
ることを特徴とする情報検索方法。
3. A document retrieval method for retrieving a document in a document file which stores the document together with date information on the document using a retrieval term, wherein a history of a name of an object is stored in each file by a use period of the name. A search term is input in association with the name history memory, and the name search memory is referred to based on the input search term and the date information of the search target document stored in the document file. And expanding the search term, and searching the search target document by the expanded search term.
JP05173117A 1993-07-13 1993-07-13 Document retrieval apparatus and method Expired - Fee Related JP3135422B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05173117A JP3135422B2 (en) 1993-07-13 1993-07-13 Document retrieval apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05173117A JP3135422B2 (en) 1993-07-13 1993-07-13 Document retrieval apparatus and method

Publications (2)

Publication Number Publication Date
JPH0728845A JPH0728845A (en) 1995-01-31
JP3135422B2 true JP3135422B2 (en) 2001-02-13

Family

ID=15954460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05173117A Expired - Fee Related JP3135422B2 (en) 1993-07-13 1993-07-13 Document retrieval apparatus and method

Country Status (1)

Country Link
JP (1) JP3135422B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6797212B2 (en) 2002-04-18 2004-09-28 Medarray, Inc. Method for forming hollow fibers

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4253134B2 (en) * 2001-02-14 2009-04-08 株式会社リコー Document processing apparatus, document processing method, program, and recording medium
JP2007199987A (en) * 2006-01-26 2007-08-09 Hitachi Ltd Patent information retrieval system
JP5010228B2 (en) * 2006-10-12 2012-08-29 アルパイン株式会社 Facility search device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高木、安田、島崎、池原,「日本語処理における固有名詞実在性検定方式の検討」,情報処理学会第35回(昭和62年後期)全国大会講演論文集,No.2,昭和63年9月28日,p.1293−1294

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6797212B2 (en) 2002-04-18 2004-09-28 Medarray, Inc. Method for forming hollow fibers

Also Published As

Publication number Publication date
JPH0728845A (en) 1995-01-31

Similar Documents

Publication Publication Date Title
US7440947B2 (en) System and method for identifying query-relevant keywords in documents with latent semantic analysis
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
US6523030B1 (en) Sort system for merging database entries
US5893094A (en) Method and apparatus using run length encoding to evaluate a database
JPH0418673A (en) Method and device for extracting text information
JPH06309362A (en) Information retrieving method
KR20020005427A (en) System and method for improved spell checking
JP3135422B2 (en) Document retrieval apparatus and method
JP3281639B2 (en) Document search system
JPH0773197A (en) Supporting system for preparing different notation word dictionary
US5682543A (en) Dictionary editing apparatus
JP2894301B2 (en) Document search method and apparatus using context information
JP3385913B2 (en) Related word presentation device and medium recording related word presentation program
KR970010030B1 (en) Picture search system
KR100452024B1 (en) Searching engine and searching method
JPH07134720A (en) Method and device for presenting relative information in sentence preparing system
JP3343941B2 (en) Example sentence search system
JP3187671B2 (en) Electronic dictionary display
JPH02108157A (en) Information retrieving method
JPH01307865A (en) Character string retrieving system
JPH05181912A (en) Document retrieving device
JPH05135112A (en) Information processor
JPH08153112A (en) Device and method for document preparation
JPH07152778A (en) Document retrieval device
JPH08161353A (en) Information retrieving device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001114

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081201

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees