JPH056398A - Document register and document retrieving device - Google Patents

Document register and document retrieving device

Info

Publication number
JPH056398A
JPH056398A JP3158139A JP15813991A JPH056398A JP H056398 A JPH056398 A JP H056398A JP 3158139 A JP3158139 A JP 3158139A JP 15813991 A JP15813991 A JP 15813991A JP H056398 A JPH056398 A JP H056398A
Authority
JP
Japan
Prior art keywords
document
keyword
code
search
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3158139A
Other languages
Japanese (ja)
Inventor
Shiyou Imasato
詔 今郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3158139A priority Critical patent/JPH056398A/en
Publication of JPH056398A publication Critical patent/JPH056398A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To automatically extract a keyword without using excess data such as a dictionary by providing this document registering/retrieving device with a document coding means, a document registering means and a document index storing means for storing corresponding relation between a superimposed code and a document. CONSTITUTION:The document coding means 1 converts a document to be registered or a keyword applied to the document into a superimposed code. When the document is an object to be registered, the keyword is automatically allocated and manual keyword application is unnecessary. The document registering means 2 allows a bit string obtained by the means 1 to correspond to the document and stores the correspondence in the document index storing means 3. The means 3 correspondingly stores the bit string and the document. Since the keyword is automatically allocated, labor for registering the document can be reduced, and since large data such as a word dictionary are not used, the number of memories or disks to be driven can be reduced.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文書に自動的にキーワ
ードを付けて保存しておき、そのキーワードの入力によ
って対応する文書を検索するような文書登録装置及び文
書検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document registration device and a document search device which automatically save a document with a keyword attached thereto and retrieve the corresponding document by inputting the keyword.

【0002】[0002]

【従来の技術】従来、電子的な文書をファイリングする
場合、キーワードを付けて登録しておき、後でそのキー
ワードを指定して対応する文書を取り出すのが一般的に
行われている。この場合、どのようにキーワードを「付
与」し、また、キーワードを使ってどうように「検索」
するのかという問題がある。
2. Description of the Related Art Conventionally, in the case of filing an electronic document, it is generally performed that a keyword is added and registered, and then the keyword is designated to retrieve the corresponding document. In this case, how to "grant" the keyword and how to "search" using the keyword
There is the question of whether to do it.

【0003】まず、キーワードの付与は、人間が行うの
が一般的であるが、文書の内容から自動的にキーワード
を付与するようなシステムもある。すなわち、単語辞書
を使って文書中からすべての名詞を抽出し、その中から
不要語と呼ばれるキーワードにならないと予め定めてお
いた語を除くという方法である。また、キーワードによ
る検索は、転置ファイルと呼ばれるキーワードに対して
文書を対応付けたファイルを用いて行うのが一般的であ
る。
[0003] First of all, a human is generally given a keyword, but there is also a system in which a keyword is automatically given from the contents of a document. That is, a method is used in which all nouns are extracted from a document using a word dictionary, and words that have been previously determined not to be keywords called unnecessary words are removed from the nouns. Further, a search by a keyword is generally performed by using a file called a transposed file in which a document is associated with a keyword.

【0004】また、他の方法として、例えば、特開平2
−297193号公報に「辞書引き装置」として開示さ
れているように、スーパーインポーズドコードを使用す
る方法もある。すなわち、これは、キーワードを特定の
長さのビット列にハッシュして、1つの文書に対応する
キーワードすべてのビット列の論理和をとったビット列
を文書と対応付けて記憶させておく方法である。また、
検索時は、検索キーワードを特定の長さのビット列にハ
ッシュして、そのビット列を検索キーとし、文書に対応
しているビット列との論理積が検索キーに等しいような
文書を検索する。検索キーワードが複数指定されている
場合でも、それぞれのビット列の論理和を検索キーとす
れば、簡単に検索することができる。
As another method, for example, Japanese Unexamined Patent Publication (Kokai) 2
There is also a method of using a superposed code, as disclosed as a “dictionary lookup device” in Japanese Patent Publication No. 297193. That is, this is a method in which a keyword is hashed into a bit string of a specific length, and the bit string obtained by logically adding the bit strings of all the keywords corresponding to one document is stored in association with the document. Also,
At the time of a search, a search keyword is hashed into a bit string of a specific length, the bit string is used as a search key, and a document whose logical product with the bit string corresponding to the document is equal to the search key is searched. Even when a plurality of search keywords are specified, if the logical sum of each bit string is used as the search key, the search can be performed easily.

【0005】[0005]

【発明が解決しようとする課題】上述したような従来の
キーワードの付与と検索とにおいては、以下に述べるよ
うな問題が生じる。まず、その第一の問題として、キー
ワード自動付与時に大規模な辞書データが必要となると
いうことである。すなわち、従来の方法においては、キ
ーワードの自動抽出のためには単語辞書や文法辞書など
の大規模なデータが必要であった。このことは、システ
ムを動作させるのに必要なメモリ或いはディスクの量が
増大すると共に、処理速度が遅いという問題がある。ま
た、辞書データの作成と維持に膨大な手間を要し、シス
テム作成のためのコストがかさむという問題がある。
In the above-described conventional keyword assignment and retrieval, the following problems occur. First, the first problem is that large-scale dictionary data is required when automatically adding keywords. That is, in the conventional method, large-scale data such as a word dictionary and a grammar dictionary are required for automatic keyword extraction. This increases the amount of memory or disk required to operate the system and slows down the processing speed. In addition, there is a problem that enormous effort is required to create and maintain dictionary data, and the cost for creating the system is high.

【0006】また、その第二の問題として、付与したキ
ーワードと完全に同じキーワードを入力しないと検索で
きないということである。すなわち、従来の方法におい
ては、付与したキーワードをそのままインデックスとし
て使用しているために少しでも異なったキーワードでは
検索できないという問題がある。一例として、「情報装
置」というキーワードを付与して登録した文書は、“情
報検索”や“検索装置”というようなキーワードでは検
索できないということである。
The second problem is that the keyword cannot be searched unless the same keyword as the given keyword is input. That is, the conventional method has a problem in that the added keyword is used as it is as an index, so that it is impossible to search with a slightly different keyword. As an example, a document registered by adding the keyword “information device” cannot be searched for by a keyword such as “information search” or “search device”.

【0007】[0007]

【課題を解決するための手段】請求項1記載の発明で
は、文書又は付与されたキーワードを字種の変化点で区
切りそれぞれの区間の文字列内の連続するすべての2文
字の組をスーパーインポーズドコードに変換する文書符
号化手段を設け、前記スーパーインポーズドコードと前
記文書との対応関係を登録する文書登録手段を設け、前
記スーパーインポーズドコードと前記文書との対応関係
を保持する文書インデックス保持手段を設けた。
According to a first aspect of the present invention, a document or an assigned keyword is delimited by a change point of a character type, and all consecutive two character groups in a character string of each section are superposed. A document encoding means for converting into a paused code is provided, a document registration means for registering a correspondence relationship between the superposed code and the document is provided, and a correspondence relationship between the superposed code and the document is held. A document index holding means is provided.

【0008】請求項2記載の発明では、請求項1記載の
発明において、文書符号化手段は、平仮名の区間はコー
ド化しないようにした。
According to a second aspect of the invention, in the first aspect of the invention, the document encoding means does not encode the hiragana section.

【0009】請求項3記載の発明では、キーワードを字
種の変化点で区切り、それぞれの区間の文字列内の連続
するすべての2文字の組をスーパーインポーズドコード
に変換するキーワード符号化手段を設け、前記スーパー
インポーズドコードに対応する文書を取り出す文書検索
手段を設け、前記スーパーインポーズドコードと前記文
書との対応関係を保持する文書インデックス保持手段を
設けた。
According to the third aspect of the present invention, the keyword encoding means is provided for delimiting the keywords at the changing points of the character type and converting all two consecutive character sets in the character string of each section into a superposed code. And a document search means for retrieving a document corresponding to the superposed code, and a document index holding means for holding a correspondence relationship between the superposed code and the document.

【0010】請求項4記載の発明では、請求項3記載の
発明において、キーワード符号化手段は、平仮名の区間
はコード化しないようにした。
According to a fourth aspect of the invention, in the third aspect of the invention, the keyword encoding means does not encode the hiragana section.

【0011】[0011]

【作用】請求項1記載の発明においては、キーワードを
動的に付与するため、文書登録の手間を減らすことがで
き、また、単語辞書などの大規模データを使用しないた
め、動作の必要なメモリやディスクが少なくて済む。
According to the first aspect of the present invention, since the keywords are dynamically added, the labor of document registration can be reduced, and since a large-scale data such as a word dictionary is not used, a memory that requires an operation is required. And less disks are required.

【0012】請求項2記載の発明においては、文章の大
きな部分を占める平仮名文字列を処理対象としないの
で、処理速度がさらに速くなり、また、使用頻度の高い
文字をハッシュの対象としなくて済むので、ハッシュ関
数の設計が容易となる。
According to the second aspect of the present invention, since the hiragana character string that occupies a large part of the sentence is not processed, the processing speed is further increased, and it is not necessary to use frequently used characters for hashing. Therefore, the design of the hash function becomes easy.

【0013】請求項3記載の発明においては、キーワー
ドを分解して検索することになり、付与したキーワード
と同じ形でなくとも検索が可能となる。
According to the third aspect of the present invention, the keyword is decomposed and the search is performed, and the search is possible even if the keyword is not the same as the added keyword.

【0014】請求項4記載の発明においては、文章の大
きな部分を占める平仮名文字列を処理対象としないた
め、処理速度がさらに早くなり、また、使用頻度の高い
文字をハッシュの対象としなくて済むため、ハッシュ関
数の設計が容易となる。
According to the fourth aspect of the present invention, since the hiragana character string that occupies a large part of the sentence is not targeted for processing, the processing speed is further increased, and the frequently used characters are not targeted for hashing. Therefore, the hash function can be easily designed.

【0015】[0015]

【実施例】本発明の一実施例を図面に基づいて説明す
る。図1は本装置の全体構成を示すものであり、文書符
号化手段1と、文書登録手段2と、文書インデックス保
持手段3と、キーワード符号化手段4と、文書検索手段
5とよりなっている。図2は文書登録時の処理の流れを
示し、また、図3は文書検索時の処理の流れを示すもの
であり、これらのフローを参照しながら、以下、各部の
構成について順次説明していく。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described with reference to the drawings. FIG. 1 shows the overall configuration of this apparatus, which comprises a document encoding means 1, a document registration means 2, a document index holding means 3, a keyword encoding means 4, and a document search means 5. . 2 shows the flow of processing at the time of document registration, and FIG. 3 shows the flow of processing at the time of document search. The configuration of each unit will be sequentially described below with reference to these flows. .

【0016】まず、文書符号化手段1について説明す
る。これは、登録する文書、又は、文書に対して付与さ
れたキーワードをスーパーインポーズドコードに変換す
るものである。この場合、文書を対象とすると、キーワ
ードを自動的に付与することになり、人間が付与する必
要はない。また、どちらを対象としても動作は同じなの
で、ここでは文書を符号化する方法について説明する。
すなわち、以下に述べるように各stepを順次とる。
First, the document encoding means 1 will be described. This is to convert a document to be registered or a keyword given to the document into a superimposed code. In this case, when a document is targeted, a keyword is automatically added, and it is not necessary for a human to add the keyword. Since the operation is the same for both of them, a method of encoding a document will be described here.
That is, as described below, each step is sequentially taken.

【0017】〔step1〕として、文書を字種の変化
点で分割する。字種の変化点とは、平仮名→漢字や、ア
ルファベット→カタカナとなるような点である。例え
ば、“きのう情報検索装置を開発した”という文書は、
“/きのう/情報検索装置/を/開発/した/”という
ように分割できる。以後の動作は分割した区間を単位と
して行う。ただし、平仮名からなる区間に対しては何も
処理を行わない。
As [step 1], the document is divided at the character type change points. The change point of the character type is such a point that it becomes hiragana → kanji or alphabet → katakana. For example, the document “I developed an information retrieval device yesterday”
It can be divided into "/ yes / information retrieval device / developed / developed /". Subsequent operations are performed in units of divided sections. However, no processing is performed on the section consisting of hiragana.

【0018】〔step2〕として、区間内の文字列か
らすべての2文字の組を抽出する。例えば、“情報検索
装置”という区間からは‘情報’‘報検’‘検索’‘索
装’‘装置’という5種類の2文字組が抽出できる。
As [step 2], all sets of two characters are extracted from the character string in the section. For example, from the section "information retrieval device", five types of two-character sets "information", "inspection", "search", "search" and "device" can be extracted.

【0019】〔step3〕として、2文字組の文字コ
ードをキーとして、予め定めておいたハッシュ関数によ
って、予め定めておいた長さのビット列に変換する。こ
の時、変換後のビット列の1の数が同じになるようにハ
ッシュ関数を定めておく。例えば、長さ32のビット列
のうちの4ビットに変換するようにハッシュ関数が定め
られたとすると、
As [step 3], the character code of the two-character set is used as a key and converted into a bit string of a predetermined length by a predetermined hash function. At this time, the hash function is set so that the number of 1s in the converted bit string is the same. For example, if the hash function is defined to convert 4 bits of a bit string of length 32,

【0020】[0020]

【表1】 [Table 1]

【0021】というようになる(実際にどういうビット
列が得られるかはハッシュ関数の設計によって変わ
る)。
(The actual bit string that can be obtained depends on the design of the hash function).

【0022】〔step4〕として、step3で求め
たビット列すべての論理和をとる。上述した例の場合、
5つのビット列の論理和をとり、次のビット列が得られ
る。
As [step 4], the logical sum of all the bit strings obtained in step 3 is calculated. In the example above,
The next bit string is obtained by taking the logical sum of the five bit strings.

【0023】[0023]

【表2】 [Table 2]

【0024】〔step5〕として、それぞれの区間に
対応するビット列すべての論理和をとる。これが、その
文書に対応するスーパーインポーズドコードとなる。
As [step 5], the logical sum of all bit strings corresponding to each section is calculated. This is the superposed code corresponding to the document.

【0025】次に、文書登録手段2について説明する。
これは、文書符号化手段1で得られたビット列と文書と
を対応付けて文書インデックス保持手段3に格納すると
いうものである。
Next, the document registration means 2 will be described.
This is to store the bit string obtained by the document encoding means 1 and the document in the document index holding means 3 in association with each other.

【0026】次に、文書インデックス保持手段3につい
て説明する。これは、ビット列と文書とを対応付けて記
憶しているものである。例えば、次のようになる。
Next, the document index holding means 3 will be described. This stores a bit string and a document in association with each other. For example:

【0027】[0027]

【表3】 [Table 3]

【0028】次に、キーワード符号化手段4について説
明する。これは、検索キーとして指定されたキーワード
をスーパーインポーズドコードに変換するものである。
この場合、その動作は文書符号化手段1と全く同じであ
る。もし、AND検索のために複数のキーワードが指定
された場合は、それぞれのキーワードに対するスーパー
インポーズドコードの論理和をとったものが検索キーに
対応するコードとなる。その一例として、“情報検索”
という検索キーワードは次のように符号化される。
Next, the keyword encoding means 4 will be described. This converts a keyword specified as a search key into a superposed code.
In this case, the operation is exactly the same as the document encoding means 1. If a plurality of keywords are specified for the AND search, the logical sum of the superimposed code for each keyword becomes the code corresponding to the search key. One example is “information retrieval”
The search keyword is encoded as follows.

【0029】[0029]

【表4】 [Table 4]

【0030】最後に、文書検索手段5について説明す
る。これは、キーワード符号化手段4で得られた検索キ
ーにマッチする文書を文書インデックス保持手段3から
検索するというものである。すなわち、以下に述べるよ
うなstepをとる。
Finally, the document retrieval means 5 will be described. This is to search the document index holding unit 3 for a document that matches the search key obtained by the keyword encoding unit 4. That is, the following steps are taken.

【0031】〔step1〕として、それぞれの文書に
対応するスーパーインポーズドコードと検索キーとの論
理積をとる。
As [step 1], the logical product of the superposed code and the search key corresponding to each document is calculated.

【0032】〔step2〕として、step1で得ら
れた論理積が検索キーに等しければその文書は検索キー
にマッチし、等しくなければマッチしないと判定する。
As [step 2], it is determined that the document matches the search key if the logical product obtained in step 1 is equal to the search key, and does not match if they are not equal.

【0033】例えば、検索キーが、For example, if the search key is

【0034】[0034]

【表5】 [Table 5]

【0035】である場合、その“情報検索”と文書1と
の論理積1は、
, The logical product 1 of the "information search" and the document 1 is

【0036】[0036]

【表6】 [Table 6]

【0037】となり、検索キーに等しい。従って、文書
1は検索キーにマッチすると判定される。
And is equal to the search key. Therefore, it is determined that the document 1 matches the search key.

【0038】また、“情報検索”と文書2との論理積2
は、
Further, the logical product 2 of "information retrieval" and document 2
Is

【0039】[0039]

【表7】 [Table 7]

【0040】となり、検索キーとは異なる。従って、文
書2は検索キーとはマッチしないと判定される。
And is different from the search key. Therefore, it is determined that the document 2 does not match the search key.

【0041】[0041]

【発明の効果】請求項1記載の発明は、文書又は付与さ
れたキーワードを字種の変化点で区切りそれぞれの区間
の文字列内の連続するすべての2文字の組をスーパーイ
ンポーズドコードに変換する文書符号化手段を設け、前
記スーパーインポーズドコードと前記文書との対応関係
を登録する文書登録手段を設け、前記スーパーインポー
ズドコードと前記文書との対応関係を保持する文書イン
デックス保持手段を設けたので、キーワードを動的に付
与するため、文書登録の手間を減らすことができ、ま
た、単語辞書などの大規模データを使用しないため、動
作の必要なメモリやディスクが少なくて済み、さらに、
単純な動作であるため処理を高速で行うことができるも
のである。
According to the first aspect of the present invention, a document or a given keyword is separated by a change point of a character type and all consecutive two character sets in a character string of each section are made into a superposed code. A document index holding means for holding a correspondence relationship between the superposed code and the document is provided with a document encoding means for converting, and a document registration means for registering the correspondence relationship between the superposed code and the document. Since a means is provided, keywords can be dynamically added to reduce the trouble of document registration, and since large-scale data such as word dictionaries are not used, less memory and disk are required for operation. ,further,
Since it is a simple operation, the processing can be performed at high speed.

【0042】請求項2記載の発明は、請求項1記載の発
明において、文書符号化手段は、平仮名の区間はコード
化しないようにしたので、文章の大きな部分を占める平
仮名文字列を処理対象としないため処理速度がさらに速
くなり、また、使用頻度の高い文字をハッシュの対象と
しなくて済むためハッシュ関数の設計が容易となるもの
である。
According to a second aspect of the present invention, in the first aspect of the present invention, the document encoding means does not encode the hiragana section, so that the hiragana character string that occupies a large part of the sentence is processed. Since it does not, the processing speed is further increased, and since the frequently used characters do not have to be the object of hashing, the hash function can be easily designed.

【0043】請求項3記載の発明は、キーワードを字種
の変化点で区切り、それぞれの区間の文字列内の連続す
るすべての2文字の組をスーパーインポーズドコードに
変換するキーワード符号化手段を設け、前記スーパーイ
ンポーズドコードに対応する文書を取り出す文書検索手
段を設け、前記スーパーインポーズドコードと前記文書
との対応関係を保持する文書インデックス保持手段を設
けたので、キーワードを分解して検索することになり、
付与したキーワードと同じ形でなくとも検索ができるも
のである。
According to a third aspect of the present invention, the keyword encoding means divides a keyword at a character type change point, and converts all consecutive two character sets in a character string of each section into a superimposed code. Is provided, and a document search means for retrieving a document corresponding to the superposed code is provided, and a document index holding means for holding a correspondence relationship between the superposed code and the document is provided. Will be searched
It is possible to search even if it does not have the same shape as the given keyword.

【0044】請求項4記載の発明は、請求項3記載の発
明において、キーワード符号化手段は、平仮名の区間は
コード化しないようにしたので、文章の大きな部分を占
める平仮名文字列を処理対象としないため処理速度がさ
らに早くなり、また、使用頻度の高い文字をハッシュの
対象としなくて済むためハッシュ関数の設計が容易とな
り、さらに、助詞や動詞語尾は平仮名であるため“情報
を検索する装置”のように句の形で入力されたキーワー
ドに対しても、平仮名の除去により特別な操作なしに検
索することができるものである。
In the invention according to claim 4, in the invention according to claim 3, since the keyword encoding means does not encode the hiragana section, the hiragana character string occupying a large part of the sentence is targeted for processing. The processing speed is further increased because it is not necessary, and the hash function can be easily designed because the frequently used characters do not have to be the object of hashing. Furthermore, since the particle and the verb ending are hiragana, the “information retrieval device A keyword entered in the form of a phrase such as "can be searched without special operation by removing the hiragana.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing an embodiment of the present invention.

【図2】文書登録時の処理の流れを示すフローチャート
である。
FIG. 2 is a flowchart showing a flow of processing at the time of document registration.

【図3】文書検索時の処理の流れを示すフローチャート
である。
FIG. 3 is a flowchart showing the flow of processing at the time of document search.

【符号の説明】[Explanation of symbols]

1 文書符号化手段 2 文書登録手段 3 文書インデックス保持手段 4 キーワード符号化手段 5 文書検索手段 1 Document encoding means 2 Document registration means 3 Document index holding means 4 Keyword Encoding Means 5 Document search means

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 文書又は付与されたキーワードを字種の
変化点で区切りそれぞれの区間の文字列内の連続するす
べての2文字の組をスーパーインポーズドコードに変換
する文書符号化手段と、前記スーパーインポーズドコー
ドと前記文書との対応関係を登録する文書登録手段と、
前記スーパーインポーズドコードと前記文書との対応関
係を保持する文書インデックス保持手段とよりなること
を特徴とする文書登録装置。
1. A document encoding means for separating a document or an attached keyword at a change point of a character type and converting all consecutive two character sets in a character string of each section into a superimposed code. Document registration means for registering a correspondence relationship between the superposed code and the document;
A document registration apparatus comprising: a document index holding unit that holds a correspondence relationship between the superposed code and the document.
【請求項2】 文書符号化手段は、平仮名の区間はコー
ド化しないことを特徴とする請求項1記載の文書登録装
置。
2. The document registration device according to claim 1, wherein the document encoding means does not encode the hiragana section.
【請求項3】 キーワードを字種の変化点で区切りそれ
ぞれの区間の文字列内の連続するすべての2文字の組を
スーパーインポーズドコードに変換するキーワード符号
化手段と、前記スーパーインポーズドコードに対応する
文書を取り出す文書検索手段と、前記スーパーインポー
ズドコードと前記文書との対応関係を保持する文書イン
デックス保持手段とよりなることを特徴とする文書検索
装置。
3. A keyword encoding means for dividing a keyword at a character type change point and converting all consecutive two character sets in a character string of each section into a superimposed code, and the superimposed code. A document retrieval device comprising document retrieval means for retrieving a document corresponding to a code, and document index retaining means for retaining a correspondence relationship between the superposed code and the document.
【請求項4】 キーワード符号化手段は、平仮名の区間
はコード化しないことを特徴とする請求項3記載の文書
検索装置。
4. The document retrieval device according to claim 3, wherein the keyword encoding means does not encode the hiragana section.
JP3158139A 1991-06-28 1991-06-28 Document register and document retrieving device Pending JPH056398A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3158139A JPH056398A (en) 1991-06-28 1991-06-28 Document register and document retrieving device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3158139A JPH056398A (en) 1991-06-28 1991-06-28 Document register and document retrieving device

Publications (1)

Publication Number Publication Date
JPH056398A true JPH056398A (en) 1993-01-14

Family

ID=15665123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3158139A Pending JPH056398A (en) 1991-06-28 1991-06-28 Document register and document retrieving device

Country Status (1)

Country Link
JP (1) JPH056398A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221443A (en) * 1995-02-17 1996-08-30 Fujitsu Ltd Method and device for retrieving text including kanji
JPH09114854A (en) * 1995-10-20 1997-05-02 D I S:Kk Document retrieving system
JPH10134065A (en) * 1996-10-29 1998-05-22 Nec Corp Index information generation device, index information generation method and storage medium storing index information generation program
JPH10134077A (en) * 1996-11-05 1998-05-22 Tokkyo Joho Shuppan:Kk Word processing system and storage medium
JPH11143902A (en) * 1997-11-11 1999-05-28 Hitachi Ltd Similar document retrieval method using n-gram
JP2010256951A (en) * 2009-04-21 2010-11-11 Data Henkan Kenkyusho:Kk Similar data retrieval device and program for the same
WO2012176374A1 (en) * 2011-06-21 2012-12-27 日本電気株式会社 Numeric range search device, numeric range search method, and numeric range search program

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221443A (en) * 1995-02-17 1996-08-30 Fujitsu Ltd Method and device for retrieving text including kanji
JPH09114854A (en) * 1995-10-20 1997-05-02 D I S:Kk Document retrieving system
JPH10134065A (en) * 1996-10-29 1998-05-22 Nec Corp Index information generation device, index information generation method and storage medium storing index information generation program
JPH10134077A (en) * 1996-11-05 1998-05-22 Tokkyo Joho Shuppan:Kk Word processing system and storage medium
JPH11143902A (en) * 1997-11-11 1999-05-28 Hitachi Ltd Similar document retrieval method using n-gram
JP2010256951A (en) * 2009-04-21 2010-11-11 Data Henkan Kenkyusho:Kk Similar data retrieval device and program for the same
WO2012176374A1 (en) * 2011-06-21 2012-12-27 日本電気株式会社 Numeric range search device, numeric range search method, and numeric range search program
JPWO2012176374A1 (en) * 2011-06-21 2015-02-23 日本電気株式会社 Numerical range search device, numerical range search method, and numerical range search program
US9465838B2 (en) 2011-06-21 2016-10-11 Nec Corporation Numeric range search device, numeric range search method, and numeric range search program

Similar Documents

Publication Publication Date Title
US4959785A (en) Character processing system with spelling check function that utilizes condensed word storage and indexed retrieval
US5748953A (en) Document search method wherein stored documents and search queries comprise segmented text data of spaced, nonconsecutive text elements and words segmented by predetermined symbols
CN1008016B (en) Imput process system
JPH0689304A (en) Method and apparatus for preparing text used by text processing system
EP0775963B1 (en) Indexing a database by finite-state transducer
US5560037A (en) Compact hyphenation point data
JPH056398A (en) Document register and document retrieving device
JPS63244259A (en) Keyword extractor
US6731229B2 (en) Method to reduce storage requirements when storing semi-redundant information in a database
JP3253657B2 (en) Document search method
JPH03116375A (en) Information retriever
JPS61248160A (en) Document information registering system
JPH0140372B2 (en)
JPH07182354A (en) Method for generating electronic document
JPH0140370B2 (en)
JPH10177582A (en) Method and device for retrieving longest match
JPH07282040A (en) Japanese information compression system
KR100289332B1 (en) Automatic Word Construction System for Electronic Documents and Method
KR19990084950A (en) Data partial retrieval device using inverse file and its method
JP2001202388A (en) Method and device for full text search
JP4061283B2 (en) Apparatus, method and program for converting lexical data to data
JPH11120186A (en) Method and device for generating database, medium recording its program, method and device for retrieving database and medium recording its program
JPH0721212A (en) Word processor
JP2005275880A (en) Device, method and program for converting word and phrase into data
JPH0969113A (en) Document management system