JPH06309369A - Information retrieving device - Google Patents

Information retrieving device

Info

Publication number
JPH06309369A
JPH06309369A JP5117623A JP11762393A JPH06309369A JP H06309369 A JPH06309369 A JP H06309369A JP 5117623 A JP5117623 A JP 5117623A JP 11762393 A JP11762393 A JP 11762393A JP H06309369 A JPH06309369 A JP H06309369A
Authority
JP
Japan
Prior art keywords
search
character string
retrieval
character
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5117623A
Other languages
Japanese (ja)
Inventor
Toshinori Hirano
俊典 平野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5117623A priority Critical patent/JPH06309369A/en
Publication of JPH06309369A publication Critical patent/JPH06309369A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To perform efficient retrieval matching the intention of a user by handling a number part as a numeral at the time of range specified retrieval for a character string index consisting of a non-number part and a number part. CONSTITUTION:A retrieval condition analyzing means 2 analyzes a retrieval condition character string inputted from a retrieval condition input means 1, converts it into a parameter in form which can instruct retrieval processing, and sends the parameter to a retrieval process executing means 3. The means 3 operates on the basis of the parameter supplied from the means 2 to retrieve a database stored in an index information storing means 4 and a display means 6 to which a retrieval result is sent reads image data on a retrieved list out of an image information storage means 5 and displays the data. Namely, a character string showing retrieval conditions and a character string to be retrieved are processed divisionally as non-number parts and number parts respectively. Consequently, the large-small relation between the number parts can be obtained by comparison by a method different from the non-number parts as the user intends.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、電子ファイリング・シ
ステム等のインデックスの中から指定した範囲のものを
検索する情報検索装置に関し、特に、ユーザの意図する
インデックスを的確に検索できるように構成したもので
ある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information retrieving apparatus for retrieving a designated range of indexes from an electronic filing system or the like, and in particular, it is constructed so that an index intended by a user can be retrieved accurately. It is a thing.

【0002】[0002]

【従来の技術】電子ファイリング・システムでは、ファ
イルの内容を識別するために、ユーザの好みに応じて、
数字の文字列から成るインデックスや、数字と英文字等
とを組合わせた文字列のインデックスが付与されてデー
タが格納される。電子ファイリング・システムからファ
イルを呼び出すときは、このインデックスを検索して目
的のファイルを見付ける。
2. Description of the Related Art In an electronic filing system, in order to identify the contents of a file, according to the user's preference,
Data is stored with an index formed of a character string of numbers or an index of a character string combining numbers and English characters. When calling a file from the electronic filing system, search this index to find the desired file.

【0003】また、インデックスの検索の仕方には、二
つの文字列を入力して、その範囲内に含まれるインデッ
クスの全てを取り出す方法がある。この範囲指定検索
は、例えば、インデックスがA、A1、A2、A11、
B1、B2、B3、1、3および10の10個であると
き、検索範囲として"B1"〜"B3"を入力することによ
って、B1、B2およびB3を取り出そうとするもので
ある。
As a method of searching for an index, there is a method of inputting two character strings and extracting all the indexes included in the range. In this range designation search, for example, the indexes are A, A1, A2, A11,
When there are ten B1, B2, B3, 1, 3, and 10, B1, B2, and B3 are to be taken out by inputting "B1" to "B3" as the search range.

【0004】この範囲指定検索では、まず、文字列で表
現された検索対象のインデックスのリストを、インデッ
クス文字列を構成する文字コードの大小関係に基づいて
ソートし、次いで、ソートしたリスト上で、検索範囲に
指定された二つの文字列の文字コードと大小関係を比較
して、二つの文字列の間に位置する文字列を検索結果と
して表示する。
In this range-specified search, first, a list of indexes to be searched, which is expressed by a character string, is sorted based on the magnitude relation of the character codes forming the index character string, and then, on the sorted list, The character code of the two character strings specified in the search range is compared with the magnitude relationship, and the character string located between the two character strings is displayed as the search result.

【0005】文字コードの大きさは、小さいほうか
ら、'0'、'1'、…、'8'、'9'、'A'、'B'、'…、'
Y'、'Z'、'a'、'b'、'…'、'y'、'z'の順序に決
められている。(なお、文字コードはシングル・オート
で囲み'O'のように表記する。)また、漢字は、これら
の英数文字よりも大きい文字コードを有し、記号は、英
数文字の前後の大きさの文字コードを有する。
From the smallest character code size, "0", "1", ..., "8", "9", "A", "B", "...,"
The order is Y ',' Z ',' a ',' b ',' ... ',' y ',' z '. (Note that character codes are enclosed in single auto and written as'O '.) Also, Kanji has a character code larger than these alphanumeric characters, and symbols have a size before and after the alphanumeric character. It has a character code of Sa.

【0006】また、文字列を文字コードの大小関係に基
づいてソートする場合には、文字列の先頭文字から順に
文字コードの大小関係を比較する「左詰め」と、逆に、
文字列の後方の文字から文字コードの大小関係を比較す
る「右詰め」との2つの方法があり、英文字や漢字等を
先頭に付与することの多いインデックスでは、「左詰
め」を用いてソートするのが一般的である。
When the character strings are sorted based on the size relation of the character codes, in contrast to "left justification" in which the size relations of the character codes are compared in order from the first character of the character string, conversely,
There are two methods, "right justification", which compares the size of character codes from the character after the character string, and "Left justification" is used for the index that often adds English characters or Chinese characters at the beginning. It is common to sort.

【0007】「左詰め」ソートでは、文字列の先頭文字
から順に文字コードの大小関係を比較するため、10個
の文字列を含むリストが、A、A1、A2、A11、B
1、B2、B3、1、3、10であるとき、ソートした
結果は、1、10、3、A、A1、A11、A2、B
1、B2、B3の順序となる。
In the "left-justified" sort, since the magnitude relations of the character codes are compared in order from the first character of the character string, a list including 10 character strings is A, A1, A2, A11, B.
When 1, B2, B3, 1, 3, 10, the sorted results are 1, 10, 3, A, A1, A11, A2, B.
The order is 1, B2, B3.

【0008】この様にソートされたリスト上で、検索範
囲として指定された二つの文字列との大小関係が比較さ
れ、その二つの文字列の間に位置する文字列が求める結
果として表示される。
On the list sorted in this way, the magnitude relationship between the two character strings specified as the search range is compared, and the character string located between the two character strings is displayed as the result obtained. .

【0009】[0009]

【発明が解決しようとする問題点】このように従来の範
囲検索では、文字コードによって「左詰め」ソートされ
るため、文字列に含まれる数字部分については、利用者
の期待する結果を与えるとは限らなかった。例えば、"
10"は"3"よりも上位に配列されるため、検索範囲を"
1"〜"3"として指定すると、検索結果に"10"が含ま
れ、また、"A1"〜"A2"と指定すると、"A1"、"A
11"および"A2"が検索結果として表示される。その
ため、利用者は、これに戸惑い、装置を活用できない場
合が多かった。(なお、文字列はダブル・クオートで囲
み、"ABC"のように表記する。)そこで、これを防ぐ
ため、"001"、"002"、"010"等のように、'0'
を上位桁に補足して桁数(文字数)を揃え、数値として
の大小関係を保つという方法が採られることもある。し
かし、予めインデックス付与時にこの注意深い配慮が必
要であり、膨大なデータを蓄積する必要のあるデータベ
ース作成においては、運用上の負担となっていた。
As described above, in the conventional range search, since the character code is "left-justified", the numerical part included in the character string is expected to give the result expected by the user. Was not always. For example, "
Since 10 "is arranged higher than" 3 ", the search range is"
If specified as 1 "to" 3 "," 10 "is included in the search results, and if specified as" A1 "to" A2 "," A1 "and" A "
11 "and" A2 "are displayed as search results. Therefore, users were often confused by this and could not utilize the device. (Note that the character string is enclosed in double quotes, such as" ABC ". Therefore, in order to prevent this, "0", such as "001", "002", "010", etc.
There is also a method of supplementing the upper digit with aligning the number of digits (number of characters) and maintaining the magnitude relationship as a numerical value. However, this careful consideration must be taken when assigning an index in advance, which is an operational burden in creating a database that needs to store a huge amount of data.

【0010】本発明は、こうした従来の問題点を解決す
るものであり、数字の大小関係について、ユーザの意図
する通りに判断して、的確に文字列の検索を行なうこと
ができる情報検索装置を提供することを目的としてい
る。
The present invention solves these conventional problems, and provides an information retrieval device capable of accurately searching a character string by judging the magnitude relationship of numbers as intended by the user. It is intended to be provided.

【0011】[0011]

【課題を解決するための手段】そこで、本発明では、検
索開始条件および検索終了条件を表わす文字列が入力さ
れたとき、これらの検索条件の間に含まれる文字列を検
索対象文字列リストから検出する情報検索装置におい
て、検索条件を表わす文字列における非数字文字と数字
文字との組合せのパターンを解析する検索条件解析手段
と、この検索条件解析手段によって解析されたパターン
と一致するパターンを有する各文字列を検索対象文字列
リストから取り出す文字列取出手段と、検索対象文字列
を、非数字と数字とに分離して大小関係を比較する大小
比較手段と、文字列取出手段によって取り出された各文
字列を大小比較手段を用いてソートするソート手段と、
ソート手段によってソートされた各文字列から検索条件
の間に含まれる文字列を大小比較手段を用いて抽出する
サーチ手段とを設けている。
Therefore, according to the present invention, when a character string representing a search start condition and a search end condition is input, a character string included between these search conditions is searched from the search target character string list. The information retrieval device for detection has a retrieval condition analysis means for analyzing a pattern of a combination of non-numeric characters and numeric characters in a character string representing a retrieval condition, and a pattern matching the pattern analyzed by the retrieval condition analysis means. The character string extraction means that extracts each character string from the search target character string list, the size comparison means that separates the search target character string into non-numeric characters and numerical values, and the size relationship, and the character string extraction device. Sorting means for sorting each character string using the magnitude comparison means,
The search means is provided for extracting the character strings included between the search conditions from each of the character strings sorted by the sorting means by using the magnitude comparison means.

【0012】また、前記大小関係比較手段が、大小関係
の比較において、分離した数字の文字列を数値として扱
うように構成している。
Further, the magnitude relationship comparing means is configured to treat the separated character strings of numbers as numerical values in the magnitude relationship comparison.

【0013】[0013]

【作用】本発明の情報検索装置では、検索条件を表わす
文字列および検索対象の文字列を、それぞれ非数字部分
と数字部分とに分けて処理している。そのため、数字部
分については、非数字部分とは異なる方法により、ユー
ザの意図に適なう形で大小関係を比較することが可能に
なる。
In the information retrieving apparatus of the present invention, the character string representing the retrieval condition and the character string to be retrieved are separately processed into the non-numeric part and the numerical part. Therefore, it is possible to compare the magnitude relationship of the numeric part by a method different from that of the non-numeric part in a manner suitable for the user's intention.

【0014】この数字部分を数値として扱う場合には、
例えば"10"は"3"より大きい値として処理されるた
め、通常のユーザの認識に一致する検索を行なうことが
できる。
When handling this numerical part as a numerical value,
For example, "10" is processed as a value larger than "3", so that a search matching the normal user recognition can be performed.

【0015】[0015]

【実施例】図1には、実施例として、本発明の情報検索
装置を電子ファイリング・システムに適用した場合の構
成を示している。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 shows, as an embodiment, a configuration in which the information retrieval apparatus of the present invention is applied to an electronic filing system.

【0016】この装置は、検索条件を英文字・数字・記
号等で入力する検索条件入力手段(キーボード)1と、
入力された検索条件文字列を解析する検索条件解析手段
2と、検索を実行する検索処理実行手段3と、検索対象
の文書のインデックス情報を管理するインデックス情報
格納手段4と、画像データを頁単位に管理する画像情報
格納手段5と、検索された画像を利用者が要求する形態
で表示する表示手段6とを備えている。
This device comprises search condition input means (keyboard) 1 for inputting search conditions in English letters, numbers, symbols, etc.,
Search condition analysis means 2 for analyzing the input search condition character string, search processing execution means 3 for executing the search, index information storage means 4 for managing the index information of the document to be searched, and image data in page units. The image information storage means 5 managed by the user and the display means 6 for displaying the retrieved image in a form requested by the user.

【0017】検索条件解析手段2は、検索条件入力手段
1から入力された検索条件文字列を解析し、検索処理を
指示できる形のパラメータに変換して、検索処理実行手
段3に伝え、検索処理実行手段3は、検索条件解析手段
2から与えられたパラメータをもとに作動して、インデ
ックス情報格納手段4に格納されたデータベースを検索
し、検索結果が伝えられた表示手段6は、検索されたリ
ストの画像データを画像情報格納手段5から読み出して
表示する。
The search condition analysis means 2 analyzes the search condition character string input from the search condition input means 1, converts the search condition character string into a parameter capable of instructing the search process, and transmits it to the search process execution means 3 to perform the search process. The executing means 3 operates based on the parameters given by the search condition analyzing means 2 to search the database stored in the index information storing means 4, and the display means 6 to which the search result is transmitted is searched. The image data of the list is read from the image information storage means 5 and displayed.

【0018】各手段の動作をさらに詳しく説明する。The operation of each means will be described in more detail.

【0019】検索条件入力手段1は、操作端末上に表示
された入力パネルの所定の入力枠をポインティング・デ
バイスで選択した後、キーボードを使用して検索条件文
字列を入力する。
The search condition input means 1 selects a predetermined input frame of the input panel displayed on the operation terminal with a pointing device and then inputs a search condition character string using the keyboard.

【0020】図2には、このときの検索条件を入力する
パネルの様子を示している。操作端末の表示部分には、
画像表示手段6と共用できるビットマップ・ディスプレ
イを使用する。このディスプレイ上には、範囲検索用の
検索条件入力パネル21が表示され、その内部には「画像
名」に関する検索条件入力枠22、23が2個用意されてい
る。なお、「画像名」とは、一枚の画像に付与された検
索のためのインデックス情報名を指す。このインデック
ス情報のデータ・タイプは文字列である。
FIG. 2 shows a state of a panel for inputting search conditions at this time. In the display part of the operating terminal,
A bitmap display that can be shared with the image display means 6 is used. A search condition input panel 21 for range search is displayed on this display, and two search condition input frames 22 and 23 relating to the "image name" are provided inside the search condition input panel 21. The “image name” refers to the index information name given to one image for searching. The data type of this index information is a character string.

【0021】入力枠22は検索開始条件入力用、入力枠23
は検索終了条件入力用であり、図2では、開始条件が"
A1"、終了条件が"B10"の場合を示している。
The input frame 22 is for inputting search start conditions, and the input frame 23
Is for inputting the search end condition, and in FIG. 2, the start condition is "
The case where A1 "and the end condition are" B10 "is shown.

【0022】画面には、さらに、「実行」ボタン24と
「取消」ボタン25とが表示され、「実行」ボタン24をポ
インティング・デバイスで指示すると、入力された検索
条件に基づいて検索を開始すべく、次の検索条件解析手
段3を起動する。また、「取消」ボタン25をポインティ
ング・デバイスで指示すると、この検索条件入力パネル
21を閉じ、画面をひとつ前の状態に戻す。なお、検索条
件入力手段1には、本実施例のようにギットマップ・デ
ィスプレイを用いずに、キャラクタ端末上で対話的な入
力処理を行なっても何等支障がない。
Further, an "execute" button 24 and a "cancel" button 25 are displayed on the screen, and when the "execute" button 24 is instructed with a pointing device, a search is started based on the input search conditions. Therefore, the next search condition analysis means 3 is activated. Also, if you point the "Cancel" button 25 with your pointing device, this search condition input panel will appear.
Close 21 and return the screen to the previous state. It should be noted that there is no problem even if interactive input processing is performed on the character terminal without using the Gitmap display as the search condition input means 1 as in the present embodiment.

【0023】次に、検索条件解析手段2における処理に
ついて説明する。検索条件入力手段1からは検索開始条
件と検索終了条件の2つの文字列がパラメータとして渡
される。
Next, the processing in the search condition analysis means 2 will be described. From the search condition input means 1, two character strings of a search start condition and a search end condition are passed as parameters.

【0024】ここでは、それぞれについて、これに数字
が含まれているかどうか、さらに、数字が「非数字」文
字と共にどのような形で文字列を形成しているかを解析
し、3つのパターンに分類する。
Here, for each, it is analyzed whether or not the numeral is included, and how the numeral forms the character string together with the "non-numeric" character, and it is classified into three patterns. To do.

【0025】第1のパターンは「非数字+数字」で、例
えば"AC4040"、"AU807"、"SA0032"等
のように先頭に非数字の文字列部分が在り、これに続い
て数字部分がある場合である。
The first pattern is "non-numeric + numeral", which has a non-numeric character string portion at the beginning such as "AC4040", "AU807", "SA0032", etc., followed by a numeric portion. In some cases.

【0026】第2のパターンは「数字のみ」で、例え
ば"10"、"607"、"0078"といった'0'、'
1'、'2'・・・'9'の10文字で構成される文字列で
ある。
The second pattern is "only numbers", for example "0", "" such as "10", "607", "0078".
It is a character string composed of 10 characters of 1 ',' 2 '...' 9 '.

【0027】第3のパターンは「その他すべて」であ
り、例えば"KS33A"、"666"等である。
The third pattern is "all others", for example, "KS33A", "666", etc.

【0028】この分類処理は、文字列の先頭文字から順
に一文字ずつその文字コードを調べることにより容易に
実現できる。分類した結果、第1のパターンのときは検
索条件パターン番号1として、第2のパターンのときは
検索条件パターン番号2として、また、第3のパターン
のときは検索条件パターン番号3として保持する。
This classification processing can be easily realized by checking the character code of each character in order from the first character of the character string. As a result of the classification, the search condition pattern number 1 is stored for the first pattern, the search condition pattern number 2 is stored for the second pattern, and the search condition pattern number 3 is stored for the third pattern.

【0029】次に、検索処理実行手段3における動作に
ついて説明する。この検索処理実行手段3は、文字列取
出、大小比較、ソートおよびサーチの各手段としての動
作を実行する。この検索処理実行手段の範囲指定検索に
おける動作を図3のフローチャートにしたがって説明す
る。
Next, the operation of the search processing execution means 3 will be described. The search processing execution means 3 performs operations as means for extracting character strings, comparing sizes, sorting, and searching. The operation in the range designation search of this search processing execution means will be described with reference to the flowchart of FIG.

【0030】まず、1次検索31において、検索条件解析
手段2から渡された検索条件パターン番号を調べ、これ
が1であればインデックス格納手段4を参照し、データ
ベースの検索用インデックス・リストから「非数字+数
字」のパターンに該当するものをそのデータIDと共に
すべて取り出し、1次検索リストを作成する。
First, in the primary search 31, the search condition pattern number passed from the search condition analysis means 2 is checked, and if it is 1, the index storage means 4 is referred to and the "non-display" is selected from the search index list of the database. All that correspond to the pattern of "numerical figures + numerals" are extracted together with their data IDs, and a primary search list is created.

【0031】図4は、インデックス情報格納手段4に格
納された検索用インデックス・リストの構造を示してお
り、一つのデータは、リストでの通し番号であるデータ
IDと、検索対象文字列であるインデックスと、データ
実体である画像に対するポインタとの3つの要素で構成
される。
FIG. 4 shows the structure of the search index list stored in the index information storage means 4. One data is a data ID which is a serial number in the list and an index which is a search target character string. And a pointer to an image which is a data entity.

【0032】また、図5(a)は、1次検索によって得
られた1次検索リストの構造図であり、そのデータは、
インデックスとそのデータIDとを要素としている。
FIG. 5 (a) is a structural diagram of the primary search list obtained by the primary search, and its data is
The index and its data ID are elements.

【0033】1次検索31に引き続き、インデックス・リ
ストのソートやインデックス文字列と検索条件との比較
等により本発明に特徴的な検索を行なう訳であるが、そ
れに先立ち、「非数字文字+数字」のパターンに属する
インデックス文字列の大小関係の定義について説明す
る。
Following the primary search 31, a search characteristic of the present invention is carried out by sorting the index list or comparing the index character string with the search condition. The definition of the size relation of the index character strings belonging to the pattern "will be described.

【0034】まず、2つの文字列AとBの大小関係を次
のように定義する。(ここで、A、Bは、先頭文字から
順に文字コードを格納した配列であり、文字列を表現し
ている。)
First, the magnitude relation between the two character strings A and B is defined as follows. (Here, A and B are arrays in which character codes are stored in order from the first character, and represent character strings.)

【0035】まず、両者の文字数をそれぞれ求め、小さ
い方をNとする。次に、文字列の先頭文字の文字コード
A(1)とB(1)とを比較し、この値が大きい方が文
字列として大であるとする。もし同じであれば、両者の
次の文字コードA(i)とB(i)とを順に比較する。
このようにして、文字列のN番目の文字コードA(N)
とB(N)とを比較して、等しいならば、文字数の多い
ほうを文字列として大であるとする。また、この時、両
者の文字数が等しい場合は、文字列は完全に一致してお
り文字列としての大きさは等しいことになる。これは、
従来例で説明した文字列ソートの厳密な定義でもある。
First, the numbers of both characters are obtained, and the smaller one is N. Next, the character codes A (1) and B (1) of the first character of the character string are compared, and it is assumed that the larger the value, the larger the character string. If they are the same, the next character codes A (i) and B (i) of both are compared in order.
In this way, the Nth character code A (N) of the character string
And B (N) are compared, and if they are equal, the one with the larger number of characters is regarded as the larger character string. Further, at this time, when the numbers of characters of both are equal, the character strings are completely matched and the sizes of the character strings are equal. this is,
It is also a strict definition of the character string sort explained in the conventional example.

【0036】次に、本発明における「非数字文字+数
字」の構成をもつインデックス文字列間の大小関係を以
下のように定義する。
Next, the magnitude relation between the index character strings having the structure of "non-numeric characters + numerals" in the present invention is defined as follows.

【0037】・非数字文字部が異なる場合は、非数字文
字部の文字列を前記の文字列大小関係定義に従って比較
し、この結果をもって大小関係とする。
When the non-numeric character parts are different, the character strings of the non-numeric character parts are compared according to the above-mentioned character string size relationship definition, and the result is regarded as the size relationship.

【0038】・非数字文字部が等しい場合は、数字部を
数値に変換して比較し、その大小関係を結果とする。
If the non-numeric character parts are the same, the numeric part is converted into a numerical value and compared, and the magnitude relationship is taken as the result.

【0039】図3の1次検索リスト・ソート32において
は、1次検索リストを先に述べたインデックス値の大小
関係に基づいてソートする。この結果、1次検索リスト
は、まず、非数字文字部、次に数値として扱われた数字
部の大小関係に従ってソートされ、図5(b)のように
なる。このとき、数字部は、数値として比較されるた
め、例えば"A11"は、"A2"より大きいものとして位
置付けられる。
In the primary search list sort 32 of FIG. 3, the primary search list is sorted on the basis of the magnitude relation of the index values described above. As a result, the primary search list is first sorted according to the size relation of the non-numeric character portion and then the numeric portion treated as a numerical value, as shown in FIG. 5 (b). At this time, since the numerical part is compared as a numerical value, for example, “A11” is positioned as being larger than “A2”.

【0040】続く第1検索データサーチ33および最終検
索データサーチ34においては、検索開始条件、検索終了
条件を用いて、この2つの条件で定められる範囲に属す
るデータを検索する。
In the subsequent first search data search 33 and final search data search 34, the search start condition and the search end condition are used to search for data belonging to the range defined by these two conditions.

【0041】第1検索データサーチ33では、次の手順に
よって「第1検索結果データ」を検出する。まず検索開
始文字列と一次検索リストのデータとを、リストの先頭
データから順に大小比較し、検索開始条件に等しいか、
検索開始条件よりも大きい初めてのデータを検出する。
次に、この検出したインデックス値を検索終了条件と比
較し、条件値に等しいか、より小さければ、これを第1
検索結果データと設定する。このようなインデックスが
リストの最後まで検出されなかった場合は、検索の該当
件数を0として処理を終了する。
In the first search data search 33, the "first search result data" is detected by the following procedure. First, the search start character string and the data of the primary search list are compared in order from the first data of the list, and whether the search start condition is equal to the search start condition,
The first data that is larger than the search start condition is detected.
Next, the detected index value is compared with the search end condition, and if it is equal to or smaller than the condition value,
Set as search result data. If such an index is not detected up to the end of the list, the number of hits in the search is set to 0 and the process ends.

【0042】次に、最終検索データサーチ34では、次の
手順で「最終検索結果データ」を検出する。まず、検索
終了条件と1次検索リストのデータのインデックス値と
を、第1検索データサーチ33で得られた第1検索結果デ
ータの次のデータから順に大小比較し、インデックス値
が初めて検索終了条件よりも大になったデータを求め
る。このデータの一つ手前、即ち、このデータの次に大
きいデータが最終検索結果データとなる。なお、このよ
うなデータがリストの最後まで検出されなかった場合
は、リストの最終データを最終検索結果データとする。
Next, in the final search data search 34, "final search result data" is detected by the following procedure. First, the search end condition and the index value of the data of the primary search list are compared in order from the data next to the first search result data obtained by the first search data search 33, and the index value is the first search end condition. Ask for bigger data than. The data immediately before this data, that is, the next largest data after this data is the final search result data. If such data is not detected up to the end of the list, the final data of the list will be the final search result data.

【0043】なお、第1検索データサーチ33および最終
検索データサーチ34によって求めた第一検索結果データ
と最終検索結果データとは、一致することがあり得る。
The first search result data and the final search result data obtained by the first search data search 33 and the final search data search 34 may coincide with each other.

【0044】次に、検索結果リスト作成35により、検索
結果をそのデータIDリストとして作成する。即ち、第
1検索データサーチ33と最終検索データサーチ34で得ら
れた第1検索結果データと最終検索結果データの間に位
置する全てのデータのデータIDを取り出し、図5
(c)に示すような検索結果IDリストを作成し、これ
を表示手段6に渡す。
Next, the search result list creation 35 creates the search result as its data ID list. That is, the data IDs of all the data located between the first search result data and the final search result data obtained by the first search data search 33 and the final search data search 34 are extracted, and
A search result ID list as shown in (c) is created and passed to the display means 6.

【0045】表示手段6は、検索された画像データを、
例えば、検索結果IDリストの先頭メンバーから順に連
続的に表示する。そのために、データIDを、インデッ
クス情報格納手段4を用いて、データ実体の所在を表わ
すポインタに変換する。具体的には、図4のインデック
ス情報リストにおいて、データIDとポインタとの対応
を読み取ることになる。
The display means 6 displays the retrieved image data
For example, the search result ID list is continuously displayed from the top member. For that purpose, the data ID is converted into a pointer representing the location of the data entity using the index information storage means 4. Specifically, the correspondence between the data ID and the pointer is read in the index information list of FIG.

【0046】画像データ実体へのポインタを得た後、画
像情報格納手段5に画像へのポインタを渡してこれにア
クセスし、所望の画像データを読み出し、表示手段6に
送って画像を表示する。なお、検索結果の表示方法は、
システムや利用者の目的に応じて様々なものが考えられ
る。
After obtaining the pointer to the image data entity, the pointer to the image is passed to the image information storage means 5 to access it, and the desired image data is read out and sent to the display means 6 to display the image. The display method of the search result is
Various things can be considered depending on the purpose of the system and the user.

【0047】また、検索条件解析手段2から検索処理実
行手段3に渡される検索条件パターン番号が2の「数字
のみ」の場合は、検索処理実行手段3に対し、パラメー
タとして検索開始数値と検索終了数値のみが与えられ
る。
If the search condition pattern number passed from the search condition analysis means 2 to the search processing execution means 3 is “only numbers”, the search processing execution means 3 will be provided with a search start numerical value and a search end as parameters. Only numbers are given.

【0048】このときは、検索処理実行手段3は、まず
インデックス情報リストから数字のみで構成される文字
列を取り出して、1次検索リストを作成する。次に、イ
ンデックス文字列を数値として扱い、このリストをソー
トし、検索開始数値以上でかつ検索終了数値以下のもの
を検索結果IDリストに格納する。
At this time, the search processing execution means 3 first takes out a character string consisting of only numbers from the index information list and creates a primary search list. Next, the index character string is treated as a numerical value, this list is sorted, and those that are equal to or higher than the search start numerical value and equal to or lower than the search end numerical value are stored in the search result ID list.

【0049】また、検索文字列パターン番号が3の「そ
の他」場合は、従来方式で範囲指定検索を行なえばよ
い。
When the search character string pattern number is "other", the range designation search may be performed by the conventional method.

【0050】[0050]

【発明の効果】以上の実施例の説明から明らかなよう
に、本発明の情報検索装置では、非数字部と数字部で構
成された文字列インデックスに対する範囲指定検索にお
いて、数字部を数値として扱っているので、ユーザの意
図に適った効率のよい検索が実現できる。
As is apparent from the above description of the embodiments, in the information retrieval apparatus of the present invention, the numeric part is treated as a numeric value in the range designation search for the character string index composed of the non-numeric part and the numeric part. Therefore, an efficient search suitable for the user's intention can be realized.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例における画像データ検索装置
のブロック構成図、
FIG. 1 is a block configuration diagram of an image data search device according to an embodiment of the present invention,

【図2】実施例の装置における検索条件入力手段の入力
画面、
FIG. 2 is an input screen of search condition input means in the apparatus of the embodiment,

【図3】実施例の検索処理実行手段における動作を示す
フローチャート図、
FIG. 3 is a flowchart showing the operation of the search processing execution means of the embodiment.

【図4】実施例のインデックス情報格納手段に格納され
たデータの構造、
FIG. 4 is a structure of data stored in an index information storage unit of the embodiment,

【図5】実施例の検索処理実行手段において検索中に格
納するデータの構造を示す図である。
FIG. 5 is a diagram showing a structure of data stored during a search by a search process executing means of the embodiment.

【符号の説明】[Explanation of symbols]

1 検索条件入力手段 2 検索条件解析手段 3 検索処理実行手段 4 インデックス情報格納手段 5 画像情報格納手段 6 画像表示手段 21 検索条件入力パネル 22 検索開始条件入力枠 23 検索終了条件入力枠 24 実行ボタン 25 取消ボタン 1 search condition input means 2 search condition analysis means 3 search processing execution means 4 index information storage means 5 image information storage means 6 image display means 21 search condition input panel 22 search start condition input frame 23 search end condition input frame 24 execute button 25 Cancel button

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 検索開始条件および検索終了条件を表わ
す文字列が入力されたとき、これらの検索条件の間に含
まれる文字列を検索対象文字列リストから検出する情報
検索装置において、 前記検索条件を表わす文字列における非数字文字と数字
文字との組合せのパターンを解析する検索条件解析手段
と、 該検索条件解析手段によって解析されたパターンと一致
するパターンを有する各文字列を前記検索対象文字列リ
ストから取り出す文字列取出手段と、 検索対象文字列を、非数字と数字とに分離して大小関係
を比較する大小比較手段と、 前記文字列取出手段によって取り出された各文字列を前
記大小比較手段を用いてソートするソート手段と、 前記ソート手段によってソートされた各文字列から前記
検索条件の間に含まれる文字列を前記大小比較手段を用
いて抽出するサーチ手段とを設けたことを特徴とする情
報検索装置。
1. An information search apparatus for detecting a character string included between these search conditions from a search target character string list when a character string representing a search start condition and a search end condition is input. Search condition analyzing means for analyzing a pattern of a combination of non-numeric characters and numeric characters in a character string representing, and each character string having a pattern matching the pattern analyzed by the search condition analyzing means is the search target character string. A character string extracting means for extracting from the list, a size comparing means for separating the search target character string into non-numeric characters and numbers and comparing the size relationship, and each character string extracted by the character string extracting means for the size comparison. Sorting means for sorting using the means, and the character strings included between the search conditions from the respective character strings sorted by the sorting means. Information retrieval apparatus characterized by providing a search means for extracting with comparison means.
【請求項2】 前記大小関係比較手段が、大小関係の比
較において、分離した前記数字の文字列を数値として扱
うことを特徴とする請求項1に記載の情報検索装置。
2. The information retrieving apparatus according to claim 1, wherein the magnitude relation comparing means treats the separated character strings of the numbers as numerical values in the magnitude relation comparison.
JP5117623A 1993-04-22 1993-04-22 Information retrieving device Pending JPH06309369A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5117623A JPH06309369A (en) 1993-04-22 1993-04-22 Information retrieving device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5117623A JPH06309369A (en) 1993-04-22 1993-04-22 Information retrieving device

Publications (1)

Publication Number Publication Date
JPH06309369A true JPH06309369A (en) 1994-11-04

Family

ID=14716332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5117623A Pending JPH06309369A (en) 1993-04-22 1993-04-22 Information retrieving device

Country Status (1)

Country Link
JP (1) JPH06309369A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006226A (en) * 2001-06-20 2003-01-10 Honda Motor Co Ltd Drawing administration system equipped with fuzzy reference
WO2008047432A1 (en) * 2006-10-19 2008-04-24 Fujitsu Limited Information retrieval program, recording media having the program recorded therein, information retrieving method, and information retrieving device
CN110929113A (en) * 2018-09-19 2020-03-27 珠海金山办公软件有限公司 Method, system and terminal for sorting mixed character string table

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006226A (en) * 2001-06-20 2003-01-10 Honda Motor Co Ltd Drawing administration system equipped with fuzzy reference
WO2008047432A1 (en) * 2006-10-19 2008-04-24 Fujitsu Limited Information retrieval program, recording media having the program recorded therein, information retrieving method, and information retrieving device
JP4707198B2 (en) * 2006-10-19 2011-06-22 富士通株式会社 INFORMATION SEARCH PROGRAM, RECORDING MEDIUM CONTAINING THE PROGRAM, INFORMATION SEARCH METHOD, AND INFORMATION SEARCH DEVICE
US8131721B2 (en) 2006-10-19 2012-03-06 Fujitsu Limited Information retrieval method, information retrieval apparatus, and computer product
US9081874B2 (en) 2006-10-19 2015-07-14 Fujitsu Limited Information retrieval method, information retrieval apparatus, and computer product
CN110929113A (en) * 2018-09-19 2020-03-27 珠海金山办公软件有限公司 Method, system and terminal for sorting mixed character string table

Similar Documents

Publication Publication Date Title
JP3457061B2 (en) Attribute mixed character string sorting device and attribute mixed character string sorting method
JPH08166959A (en) Picture processing method
JPH06309369A (en) Information retrieving device
JPH1021253A (en) Device and method for dictionary retrieval
JP2004342016A (en) Information retrieval program and medium having information retrieval program recorded thereon
JP3242224B2 (en) Handwritten character recognition device
JP4922030B2 (en) Character string search apparatus, method and program
JPH0944521A (en) Index generating device and document retrieval device
JPH0514304B2 (en)
JPH09160907A (en) Document processor and method therefor
JPH07262199A (en) Retrieval result sorter
JPS6149283A (en) Character input device
JPH01259448A (en) Kanji input system
JPH117492A (en) Method and device for editing key entry
JPH1011430A (en) Character input device
JPH09269952A (en) Document retrieval device/method
JP2719996B2 (en) Kanji search method and kanji search device
JP2000067070A (en) Method for retrieving information and method for preparing retrieval file and device for retrieving information
JP2967995B2 (en) Document processing apparatus and document processing method
JP2760432B2 (en) Character processor
JPH08147416A (en) Information processing method
JPH04151761A (en) Character input device
JPH04369758A (en) Kanji input system for handy terminal
JPH08263509A (en) Software utilization device
JPH08292941A (en) Chinese information processor