JP3058275B1 - Search device - Google Patents

Search device

Info

Publication number
JP3058275B1
JP3058275B1 JP11057829A JP5782999A JP3058275B1 JP 3058275 B1 JP3058275 B1 JP 3058275B1 JP 11057829 A JP11057829 A JP 11057829A JP 5782999 A JP5782999 A JP 5782999A JP 3058275 B1 JP3058275 B1 JP 3058275B1
Authority
JP
Japan
Prior art keywords
search
information
target information
sentence
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11057829A
Other languages
Japanese (ja)
Other versions
JP2000259642A (en
Inventor
和史 杉浦
Original Assignee
有限会社 杉浦技術士事務所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 有限会社 杉浦技術士事務所 filed Critical 有限会社 杉浦技術士事務所
Priority to JP11057829A priority Critical patent/JP3058275B1/en
Application granted granted Critical
Publication of JP3058275B1 publication Critical patent/JP3058275B1/en
Publication of JP2000259642A publication Critical patent/JP2000259642A/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

【要約】 【課題】 自然な文章の検索文による検索を簡易な構成
で精度良く行う。 【解決手段】 自然な文章の検索文が検索文入力領域4
2に入力されると(S21)、特記語句テーブルの各エ
ントリの特記語句を順次に読み出して、この読み出した
特記語句で入力検索文を全文検索する(S22)。ヒッ
トした場合には、その特記語句を含む情報を検索結果と
して出力する(S23)。つぎに検索文から自動的に語
句を抽出する(S24)。自動的に抽出した語句を自動
抽出語句テーブルを用いて表引きし、ヒットしたエント
リに含まれる情報を検索結果として出力する(S2
5)。ヒットした情報のカテゴリ情報をヒット情報一覧
表示領域44に表示する(S26)。ユーザは一覧表示
領域44の表示を見て所望の情報を選び詳細情報を表示
する(S27)。
An object of the present invention is to accurately perform a natural sentence search using a search sentence with a simple configuration. SOLUTION: The search sentence of a natural sentence is a search sentence input area 4
2 (S21), the special words of each entry of the special words phrase table are sequentially read, and the input search text is full-text searched using the read special words (S22). When a hit is found, information including the special term is output as a search result (S23). Next, words and phrases are automatically extracted from the search sentence (S24). The automatically extracted words are tabulated using the automatically extracted words table, and the information contained in the hit entry is output as a search result (S2).
5). The category information of the hit information is displayed in the hit information list display area 44 (S26). The user looks at the display in the list display area 44, selects desired information, and displays detailed information (S27).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、自然な文章から
なる検索文を用いて検索を行う検索装置に関し、とく
に、構文解析や意味解析等の複雑な処理を行うことな
く、簡易に、しかも精度良く検索を行えるようにしたも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a search device for performing a search using a search sentence composed of natural sentences, and more particularly, to a simple and accurate search without performing complicated processing such as syntax analysis and semantic analysis. This makes it possible to search well.

【0002】[0002]

【従来の技術】1つまたは複数のキーワードについて検
索式を作成し検索を行うことが長らく行われてきた。し
かしながら、ユーザの使い勝手を考慮した場合、自然な
文章を検索文として入力してそのまま検索を行えるよう
にすることが望まれている。このような検索はファジー
検索とも呼ばれる。このような自然な文章を入力して検
索を行う場合、従来では、検索文を構文解析し、さらに
必要な場合には意味解析を行って適切なキーワードを抽
出し、検索式を作成する必要があり、コンピュータの負
荷が大きくなっていた。また、このような複雑な処理を
行っても十分に精度の高い検索を行えないというのが現
状であった。
2. Description of the Related Art It has long been performed to create a search formula for one or more keywords and perform a search. However, in consideration of the usability of the user, it is desired that a natural sentence can be input as a search sentence and the search can be performed as it is. Such a search is also called a fuzzy search. Conventionally, when performing a search by entering such a natural sentence, it is necessary to parse the search sentence and, if necessary, perform a semantic analysis to extract appropriate keywords and create a search expression. There was a heavy load on the computer. Further, at present, it is impossible to perform a search with sufficiently high accuracy even if such complicated processing is performed.

【0003】なお、この発明と関連する技術としては、
特開昭61−11846号公報、特開昭63−2174
18号公報および特開昭64−28770号公報に開示
された技術がある。これら公報に開示された記述は、デ
ータベースにデータを登録する際に、そのデータまたは
そのデータの一部から文字種に基づいて登録するキーワ
ードを絞り込もうとするものである。ただし、これらの
技術は自然な文章を検索文として検索を行うものではな
い。
[0003] As a technology related to the present invention,
JP-A-61-11846, JP-A-63-2174
No. 18 and Japanese Patent Application Laid-Open No. 64-28770. The descriptions disclosed in these publications are intended to narrow down keywords to be registered based on character types from the data or a part of the data when registering the data in the database. However, these techniques do not search using natural sentences as search sentences.

【0004】なお、ここでは、主語、述語等が完結した
もののみを自然な文章と呼ぶのではなく、一連の単語が
有意味に連結されたものをいい、名詞止めされた文章、
体言止めされた文章、主語のみのもの、述語のみのもの
等、種々の表現のものが自然な文章に含まれる。
[0004] It should be noted that, here, a sentence in which a series of words are meaningfully connected is not called a natural sentence only a sentence in which the subject, predicate, etc. are completed, and a sentence in which nouns are stopped,
Natural sentences include various types of expressions, such as a sentence stopped, a subject only, and a predicate only.

【0005】[0005]

【発明が解決しようとする課題】この発明は、以上の事
情を考慮してなされたものであり、簡単な処理で精度高
く自然な文章の検索文による検索を行える検索装置を提
供することを目的としている。
SUMMARY OF THE INVENTION The present invention has been made in view of the above circumstances, and has as its object to provide a retrieval apparatus capable of performing a retrieval of a natural sentence by a simple process with high accuracy by a simple process. And

【0006】[0006]

【課題を解決するための手段】この発明によれば、上述
の目的を達成するために、検索装置に:自然な文章から
なる検索文を入力する手段と;入力された検索文から、
文字種および同一文字種の連続する長さに基づいて語句
を抽出する手段と;上記抽出した語句に基づいてデータ
ベースを検索する手段とを設けるようにしている。
According to the present invention, in order to achieve the above object, a search device includes: a means for inputting a search sentence composed of natural sentences;
Means for extracting words and phrases based on the character type and the continuous length of the same character type; and means for searching a database based on the extracted words and phrases are provided.

【0007】この構成においては、構文解析や、意味解
析を行うことなく、単に文字種および文字列の長さに基
づいて機械的に語句を抽出しているので、簡易に少ない
計算量で、自然な文章の検索文による検索を行える。し
かも、簡単な構成でありながら、高精度の検索を行え
た。
In this configuration, since a phrase is mechanically extracted based on a character type and a length of a character string without performing syntax analysis or semantic analysis, natural amounts can be easily calculated with a small amount of calculation. You can search by text search sentence. In addition, a highly accurate search could be performed with a simple configuration.

【0008】また、この発明によれば、上述の目的を達
成するために、検索装置に:検索対象情報ごとに、検索
対象情報本体と、検索対象情報本体から取得したテキス
トから文字種および同一文字種の連続する長さに基づい
て抽出した第1の語句と、上記検索対象情報本体の登録
者が指定した第2の語句とを保持するデータベース手段
と;自然な文章からなる検索文を入力する手段と;入力
された検索文から、文字種および同一文字種の連続する
長さに基づいて語句を抽出する手段と;上記抽出した語
句が上記第1の語句として登録されている検索対象情報
を検索する手段と;上記検索文を上記第2の語句の各々
について検索し、上記検索文に含まれる第2の語句が登
録されている検索対象情報を検索する手段とを設けるよ
うにしている。
Further, according to the present invention, in order to achieve the above object, a search apparatus includes: for each piece of search target information, a search target information body, and a character type and the same character type from a text acquired from the search target information body. Database means for holding a first word extracted based on the continuous length and a second word specified by the registrant of the search target information body; means for inputting a search sentence consisting of natural sentences Means for extracting a word from the input search sentence based on the character type and the continuous length of the same character type; means for searching for search target information in which the extracted word is registered as the first word Means for searching the search sentence for each of the second phrases, and searching for search target information in which the second phrase included in the search sentence is registered.

【0009】この構成においても、簡単な構成でありな
がら、自然な文章の検索文による検索を高精度に行うこ
とができる。とくに、登録者が第2の語句として自分の
ノウハウ等を踏まえて特記語句を登録するようにし、こ
の特記語句で入力検索文を全文検索して該当するかどう
かを判別するようにしているので検索対象に合致した木
目細かな検索が可能となる。しかも、特記語句自体は多
くないので入力検索文を全文検索しても計算量をさほど
増大させることがない。
[0009] Also in this configuration, it is possible to perform a natural sentence search with a high accuracy while using a simple sentence. In particular, the registrant registers a special word as a second word based on his / her know-how, etc., and uses this special word to search the input search sentence in full text to determine whether or not it is applicable. A fine-grained search matching the target can be performed. In addition, since there are not many special words and phrases, even if the full text search is performed on the input search sentence, the calculation amount does not increase much.

【0010】また、この構成においては、上記第1の語
句は2文字以上の漢字からなる文字列または3文字以上
のカタカナからなる文字列とすることができる。このよ
うな設定は、データベースが対象とする情報の特性に応
じて変化させることが好ましい。
In this configuration, the first phrase can be a character string composed of two or more Chinese characters or a character string composed of three or more katakana characters. Such a setting is preferably changed according to the characteristics of the information targeted by the database.

【0011】また、検索装置に、さらに、検索結果の一
覧を表示する手段を設けてもよい。もちろん検索件数を
表示してもよい。
[0011] The search device may further include means for displaying a list of search results. Of course, the number of searches may be displayed.

【0012】また、上記検索結果の一覧中の複数のエン
トリが選択されたときに上記検索対象情報をタイル上に
配置されたサブウィンドウにそれぞれ表示するようにし
てもよい。このようにすれば複数の情報を比較対照させ
ながら見ることができる。
[0012] When a plurality of entries in the list of search results are selected, the search target information may be displayed in sub windows arranged on tiles. In this way, a plurality of pieces of information can be compared and viewed.

【0013】また、上記検索装置に、さらに、1の検索
対象情報を他の検索対象情報に関連付ける手段を設け、
他の検索対象情報が検索されて表示されたときに上記1
の検索対象情報も連結して表示されるようにしてもよ
い。
[0013] Further, the retrieval apparatus further comprises means for associating one retrieval target information with another retrieval target information,
When the other search target information is searched and displayed, the above 1
May be displayed in a linked manner.

【0014】このようにすると、本来1つのエンティテ
ィとして登録すべき情報を合体させるようにでき情報を
整理して扱えるとともに情報量を徐々に補強することが
できる。
[0014] In this way, information that should be registered as one entity can be combined, information can be organized and handled, and the amount of information can be reinforced gradually.

【0015】また、上記他の検索対象情報と上記1の検
索対象情報とは上下に連結された領域に表示されるよう
にしてもよい。
Further, the other search target information and the first search target information may be displayed in a vertically connected area.

【0016】また、上記関連付ける手段は検索対象情報
のカテゴリ情報に基づいて自動的に関連付けを行うよう
にしてもよい。もちろん、ユーザの指示により情報を合
致するようにしてもよい。なお、情報の合体は、ユーザ
に対して合体してみえればよく、合体した情報自体がデ
ータベース管理上は別個のエンティティであってもよ
い。もちろん、データベース管理上も1つのエンティテ
ィに合成してもよい。
Further, the associating means may automatically perform the association based on the category information of the search target information. Of course, the information may be matched according to a user's instruction. It should be noted that the information may be merged with the user, and the merged information itself may be a separate entity in database management. Of course, it may be combined into one entity for database management.

【0017】[0017]

【発明の実施の態様】以下、この発明を画像情報検索シ
ステムに適用した実施例について説明する。この画像情
報検索システムは、商品パンフレット、商品広告、雑誌
記事、新聞記事等を画像情報として検索できるようにし
たものである。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment in which the present invention is applied to an image information retrieval system will be described below. This image information search system is designed to search for product brochures, product advertisements, magazine articles, newspaper articles, and the like as image information.

【0018】図1は、この実施例が実現されるコンピュ
ータ処理環境を示しており、この図において、実施例の
情報検索システムは、LAN10に接続された検索サー
バ11、検索クライアント12、データベースシステム
13、アクセスサーバ14等を含んで構成されている。
検索クライアント12は、画像情報の登録、検索等を検
索サーバ11に要求するものであり、検索サーバ11
は、検索クライアント12の要求に基づいて画像情報の
登録や検索をデータベースシステム13のデータを操作
する。データベースシステム13は、画像情報に関連し
て生成されたテキスト情報等も保持する。これについて
は後述する。アクセスサーバ14は、LAN10が構成
するネットワークの外部からのアクセスを実現するもの
であり、このアクセスサーバ14により、営業担当者が
顧客先等から電話回線等を利用して検索サーバ11にア
クセスし、所望の画像情報を取得することができる。
FIG. 1 shows a computer processing environment in which this embodiment is realized. In this figure, an information search system according to this embodiment includes a search server 11, a search client 12, and a database system 13 connected to a LAN 10. , Access server 14 and the like.
The search client 12 requests registration and search of image information to the search server 11.
Operates the data of the database system 13 for registration and search of image information based on the request of the search client 12. The database system 13 also holds text information and the like generated in association with the image information. This will be described later. The access server 14 is for realizing access from outside the network configured by the LAN 10. The access server 14 allows a salesperson to access the search server 11 from a customer or the like using a telephone line or the like. Desired image information can be obtained.

【0019】この実施例の情報検索システムでは情報の
登録および検索を行う。以下では、情報の登録および検
索について順を追って説明する。なお、この実施例の情
報検索システムは、情報の登録時に自動的に語句を抽出
して語句登録を行う自動語句登録の手順と、ユーザ(登
録者)が特別に指示して手作業で登録する特記語句登録
の手順とを行うようになっている。さらに情報のカテゴ
リ情報(属性情報)をユーザが登録する。また情報検索
時には、自然な文章の検索文が入力される。そして、特
記語句の各々について、検索文を全文検索し、特記語句
が検出されると、対応する情報を検索結果としてまず選
ぶ(図8参照)。さらに検索文から自動的に語句を抽出
し、検索文中の自動抽出語句を、自らの自動抽出語句と
する情報を検索結果として選ぶようになっている(図9
参照)。
The information retrieval system of this embodiment registers and retrieves information. Hereinafter, registration and search of information will be described step by step. The information retrieval system according to the present embodiment automatically extracts words and phrases at the time of registering information and registers the words automatically. The user (registrant) manually designates and registers the information. The procedure for registering special words is performed. Further, the user registers information category information (attribute information). At the time of information search, a natural sentence search sentence is input. Then, for each of the special words, the search sentence is full-text searched. When the special words are detected, the corresponding information is first selected as a search result (see FIG. 8). Further, words are automatically extracted from the search sentence, and information to be used as the automatically extracted words in the search sentence is selected as a search result (FIG. 9).
reference).

【0020】図2は、情報の登録の手順を示す。情報の
登録には例えば図3に示すようなユーザインタフェース
が用いられる。すなわち、画像表示領域21、テキスト
表示領域22、カテゴリ情報登録領域23および特記語
句登録領域24がユーザインタフェースとして表示され
る。なお、情報の登録・検索の双方を行えるユーザと、
情報の検索のみを行えるユーザとを分けるようにしても
よい。
FIG. 2 shows a procedure for registering information. For registering information, for example, a user interface as shown in FIG. 3 is used. That is, the image display area 21, the text display area 22, the category information registration area 23, and the special word / phrase registration area 24 are displayed as a user interface. In addition, the user who can both register and search information,
You may make it separate from the user who can only search information.

【0021】図2において、登録したい紙の原稿をスキ
ャンし、所定のフォーマット(例えばJPEG)にした
後、画像データをストアする(S11、S12)。この
のち、OCR(光学的文字認識システム)を用いて原稿
に含まれているテキストを認識し、ストアする(S1
3、S14)。もちろん、電子的な原稿を当初から入手
できるときには電子的な原稿をそのまま利用してもよ
い。この状態でユーザには図3に示すユーザインタフェ
ースの画像表示領域21およびテキスト表示領域22に
画像およびテキストが表示される。ユーザはテキスト表
示領域22のテキストを見て、とくに語句登録したい語
句を特記語句として特記語句登録領域24に転記する
(S15)。また、ユーザは情報のカテゴリ情報をカテ
ゴリ情報登録領域23に入力する(S16)。このカテ
ゴリ情報は扱う情報の種類により異なるが、例えば、製
造メーカ名、シリーズ名、製品名等である。
In FIG. 2, an original on a paper to be registered is scanned and formatted into a predetermined format (for example, JPEG), and then image data is stored (S11, S12). Thereafter, the text contained in the document is recognized and stored using the OCR (optical character recognition system) (S1).
3, S14). Of course, when an electronic document can be obtained from the beginning, the electronic document may be used as it is. In this state, the image and the text are displayed to the user in the image display area 21 and the text display area 22 of the user interface shown in FIG. The user looks at the text in the text display area 22 and transcribes a word to be registered as a special word into the special word registration area 24 as a special word (S15). Further, the user inputs the category information to the category information registration area 23 (S16). The category information varies depending on the type of information to be handled, and includes, for example, a manufacturer name, a series name, and a product name.

【0022】また、テキストは文字種に基づいて自動的
に語句が抽出され、登録される(S17)。この例で
は、2文字以上の漢字、3文字以上のカタカナを自動的
に切り出して語句登録する。数字、単位文字、特殊文字
は、定性情報で低領地を検索したり常識的な値をもって
検索するときに用いることができ、これも保存される。
In the text, words are automatically extracted and registered based on the character type (S17). In this example, two or more Chinese characters and three or more katakana characters are automatically cut out and registered as words. Numerals, unit characters, and special characters can be used when searching for low territory with qualitative information or searching with common sense values, and these are also saved.

【0023】漢字1文字を含む語句は動詞であることが
多く、通常、一般的な情報のみを担う。したがって、漢
字2文字以上とすることにより、重要な情報のみを取出
すことができる。かりに、漢字1文字のみを含む語句
が、例外的に、重要な場合には、先の特記語句としても
れなく登録することもできる。
A phrase containing one kanji character is often a verb, and usually carries only general information. Therefore, by using two or more Chinese characters, only important information can be extracted. By the way, if a phrase containing only one kanji character is exceptionally important, it can be registered without exception as the above-mentioned special phrase.

【0024】図4は、登録された情報の各要素の関連性
を示すものであり、この図において、情報エンティティ
30は画像情報31、テキスト情報32、カテゴリ情報
33、特記語句情報34、自動抽出語句情報35を含ん
で構成される。画像情報31は、紙の原稿をスキャンし
て得たものである。テキスト情報32は、画像情報をO
CR処理して得たものである。カテゴリ情報33は情報
の属性についてユーザが入力したものである。特記語句
情報34もユーザが入力したものである。自動抽出語句
情報35は自動的に抽出されたものである。画像情報3
1およびテキスト情報32はそれぞれ情報エンティティ
ごとに個別のファイルとして管理され、カテゴリ情報3
3、特記語句情報34、自動抽出語句情報35はそれぞ
れカテゴリ情報テーブル33a、特記語句テーブル34
aおよび自動抽出語句テーブル35aにそれぞれ管理さ
れる。
FIG. 4 shows the relevance of each element of the registered information. In this figure, the information entity 30 includes image information 31, text information 32, category information 33, special word information 34, automatic extraction. It is configured to include the phrase information 35. The image information 31 is obtained by scanning a paper document. The text information 32 includes image information
It was obtained by CR processing. The category information 33 is input by the user regarding the attribute of the information. The special word / phrase information 34 is also input by the user. The automatically extracted word / phrase information 35 is automatically extracted. Image information 3
1 and text information 32 are managed as individual files for each information entity, and category information 3
3. The special word information 34 and the automatically extracted word information 35 are the category information table 33a and the special word table 34, respectively.
a and the automatically extracted phrase table 35a.

【0025】図5は、特記語句テーブル34aの構成例
を示しており、特記語句ごとにそれを含む情報エンティ
ティIDが列挙されている。たとえば、特記語句aを含
むものは情報A、Cである。図6は、自動抽出語句テー
ブル35aの構成例を示しており、自動抽出語句ごとに
それを含む情報が列挙されている。
FIG. 5 shows an example of the configuration of the special expression phrase table 34a, in which information entity IDs including the special expression phrases are listed. For example, information A and C include special words a. FIG. 6 shows a configuration example of the automatic extraction word table 35a, and information including the automatic extraction word table is listed for each automatic extraction word table.

【0026】図7は、情報の検索の手順を示しており、
図8は検索時のインタフェースを示している。検索時の
インタフェースはカテゴリ指定領域41、検索文入力領
域42、ヒット件数表示領域43、ヒット情報一覧領域
44を含んでいる。図7において、自然な文章の検索文
が検索文入力領域42に入力されると(S21)、特記
語句テーブルの各エントリの特記語句を順次に読み出し
てこの読み出した特記語句で入力検索文を全文検索する
(S22)。ヒットした場合には、その特記語句を含む
情報を検索結果として出力する(S23)。図9は、特
記語句による検索例を模式的に示している。この例で
は、特記語句としてa,b,c,e,g,rがあり、こ
れらについて順次に検索文を全文検索する。この例では
検索文に、b,e,aがこの順に含まれており、この結
果、情報A,B,Cがヒットする。
FIG. 7 shows a procedure for searching for information.
FIG. 8 shows an interface at the time of search. The search interface includes a category designation area 41, a search sentence input area 42, a hit count display area 43, and a hit information list area 44. In FIG. 7, when a search sentence of a natural sentence is input to the search sentence input area 42 (S21), the special words of each entry of the special words table are sequentially read, and the input search sentence is converted into the full text by the read special words. Search (S22). When a hit is found, information including the special term is output as a search result (S23). FIG. 9 schematically shows an example of a search using special words. In this example, there are a, b, c, e, g, and r as special words, and a full-text search is sequentially performed on the search sentences for these. In this example, b, e, and a are included in the search sentence in this order, and as a result, information A, B, and C are hit.

【0027】つぎに検索文から自動的に語句を抽出する
(図7、S24)。この例では、情報登録時と同じに2
文字以上の漢字、3文字以上のカタカナを自動的に抽出
する。そして自動的に抽出した語句を自動抽出語句テー
ブル(図6)を用いて表引きし、ヒットしたエントリに
含まれる情報を検索結果として出力する(S25)。図
10は、自動抽出語句による検索例を模式的に示してい
る。この例では、抽出規則に基づいて、語句a,b,
e,gが自動的に抽出される。そしてテーブルを参照し
て該当する情報を選ぶ。
Next, words and phrases are automatically extracted from the search sentence (FIG. 7, S24). In this example, 2
Automatically extract more than Chinese characters and three or more katakana characters. Then, the automatically extracted words are tabulated using the automatically extracted word table (FIG. 6), and the information contained in the hit entry is output as a search result (S25). FIG. 10 schematically shows a search example using an automatically extracted phrase. In this example, words a, b,
e and g are automatically extracted. Then, the corresponding information is selected with reference to the table.

【0028】なお、特記語句としてどのようなものを選
ぶかは登録者が任意に決定できる。極端な場合、自動抽
出規則に合致する語句を特記語句として選んでもよい。
この場合、特記語句を用いるメリットが少なくなってし
まう。特記語句としては、抽出規則では漏れてしまう語
句、例えば、ひらがなからなる語句、漢字1文字のみを
含む語句を選択する。また、語句と語句とを複合してな
る複合語句を1つの語句として登録してもよい。場合に
よっては、特記語句のみによる検索や、自動抽出語句の
みによる検索を行うようにしてもよい。
Note that the registrant can arbitrarily determine what special words are to be selected. In extreme cases, words that match the automatic extraction rules may be selected as special words.
In this case, the merit of using the special words is reduced. As the special words, words that are leaked by the extraction rule, for example, words composed of hiragana and words that include only one kanji character are selected. Further, a compound word composed of a word and a word may be registered as one word. In some cases, a search using only special words or a search using only automatically extracted words may be performed.

【0029】ステップS23およびステップS25で出
力した検索結果の論理和をとって、該当する情報のカテ
ゴリ情報をヒット情報一覧表示領域44に表示する(S
26)。例えば、ヒットしたエントリごとに、製造メー
カ、シリーズ名、製品名、販売開始時期、用途、価格等
を表示する。なお、ヒット件数表示領域43にはヒット
した情報の件数が表示される。ヒットした件数が多く
て、エントリすべてを一覧表示領域44に表示きれない
場合にはスクロールを行う。
The logical sum of the search results output in steps S23 and S25 is obtained, and the category information of the corresponding information is displayed in the hit information list display area 44 (S
26). For example, a manufacturer, a series name, a product name, a sales start time, a use, a price, and the like are displayed for each hit entry. The number-of-hits display area 43 displays the number of hits. If the number of hits is large and not all entries can be displayed in the list display area 44, scrolling is performed.

【0030】ユーザは一覧表示領域44の表示を見て所
望の情報を選び表示する(S27)。情報の表示は、表
示態様を選択して複数の態様で表示可能である。例え
ば、画像情報のみを表示してもよいし、テキスト情報
や、カテゴリ情報を付加して表示してもよいし、また特
記語句等を付加して表示してもよい。
The user looks at the display of the list display area 44 and selects and displays desired information (S27). Information can be displayed in a plurality of modes by selecting a display mode. For example, only the image information may be displayed, the text information or the category information may be added and displayed, or the special information phrase or the like may be added and displayed.

【0031】なお、この検索においては、カテゴリ指定
領域41を用いてカテゴリ情報を指定して検索対象範囲
を絞り込むようにすることができる。例えば、製造メー
カ、製品名、販売開始時期、用途、価格等で絞り込みを
行える。価格や販売開始時期問うは不等式等を用いた範
囲指定が可能である。
In this search, it is possible to narrow down the search range by designating category information using the category designation area 41. For example, it is possible to narrow down by manufacturer, product name, sales start time, application, price, and the like. The range of the price and the sales start time can be specified using an inequality or the like.

【0032】また、数字や特殊記号を用いて自動抽出語
句の検索を行うこともできるので、数字や特殊記号に合
致した奇抜な情報検索も可能となる。
Further, since a search for an automatically extracted word can be performed using a number or a special symbol, it is possible to search for unusual information matching the number or a special symbol.

【0033】つぎにこの実施例の付加的な特徴について
説明する。
Next, additional features of this embodiment will be described.

【0034】図11は、関連事項辞書を示している。こ
の辞書は、シソーラス等に含まれる類義語や関連情報を
相互に変換するためのものである。この辞書は、検索文
が入力され、語句分割されたときに、表引きされ、オリ
ジナルの語句とともに変換結果も抽出語句として受け取
り入力検索文の揺らぎを吸収するものである。また、特
記語句についても同様に変換されオリジナルの特記語句
とともに、変換結果も検索文の全文検索の対象となる。
FIG. 11 shows a related item dictionary. This dictionary is for mutually converting synonyms and related information included in a thesaurus and the like. When the search sentence is input and the words are divided, the dictionary is looked up, receives the conversion result together with the original word as an extracted word, and absorbs the fluctuation of the input search sentence. The special words are also converted in the same manner, and the conversion result is also subjected to full-text search of the search sentence along with the original special words.

【0035】また、この実施例では、情報と情報とをマ
ージすることができる。あるいは所定の情報に他の情報
を追加することができる。図12は、カテゴリ情報に基
づいて自動的に情報を追加する手順を示すものである。
この例では、カテゴリが一致した場合、イメージ情報や
テキスト情報をマージする。実際には、追加先の情報に
追加情報を含むことを示すマークと追加情報の宛先とを
表示する。このようにすることにより、関連する情報
を、あたかも1つのエンティティとして扱うことができ
る。この場合、イメージは上下に連結するようにしてい
る。このようにすると、上下のスクロールにより多くの
イメージを見ることになる。ユーザは左右のスクロール
より上下のスクロールの方が扱いやすい。
In this embodiment, information can be merged with information. Alternatively, other information can be added to the predetermined information. FIG. 12 shows a procedure for automatically adding information based on category information.
In this example, when the categories match, image information and text information are merged. Actually, a mark indicating that the additional information is included in the additional information and the destination of the additional information are displayed. By doing so, related information can be treated as if it were one entity. In this case, the images are connected vertically. In this way, more images will be viewed by scrolling up and down. The user can handle up and down scrolling more easily than left and right scrolling.

【0036】カテゴリのどのレベルまで、あるいはどの
項目が一致したらマージするのかは情報の種類により異
なる。
The level of the category, or the item to be merged when the items match, differs depending on the type of information.

【0037】また、カテゴリ情報の不一致の場合にも
に、情報を追加したいことともある。したがって、ユー
ザの指示により情報を追加するようにしてもよい。例え
ば、所定の情報を登録する際に予め追加先の情報を表示
しておき、追加の指示を行い、登録対象の情報を入力し
て追加を行ってもよいし、情報の登録中に、検索操作に
より情報を検索しヒットした情報を追加先として追加を
行ってもよい。追加には、テキストの追加と、画像の追
加とを個別に指定できるようにしてもよい。もちろん双
方を一緒に追加してもよい。このような指定は、自動的
に追加する場合にも予め設定しておくことができる。
Further, there is a case where it is desired to add information even when the category information does not match. Therefore, information may be added according to a user's instruction. For example, when registering predetermined information, information of an addition destination may be displayed in advance, an addition instruction may be given, information to be registered may be input, and addition may be performed. Information may be searched for by operation, and the hit information may be added as an addition destination. In addition, addition of text and addition of an image may be individually specified. Of course, both may be added together. Such a designation can be set in advance even when it is automatically added.

【0038】情報の追加は1つのみでなく複数個順次追
加できる。すなわち、3つ以上の情報が連結されていて
もよい。
Information can be added not only one but also a plurality of pieces sequentially. That is, three or more pieces of information may be linked.

【0039】なお、この発明は上述の実施例に限定され
るものではなく、その趣旨を逸脱しない範囲で種々変更
が可能である。たとえば、上述実施例では、画像情報検
索に用いたが、テキストのみの検索に用いてもよい。こ
の場合、テキストの所定の部分のテキスト情報(要約、
先頭部分、終了部分等、情報を多く含む部分)のみから
自動語句抽出を行うようにしてもよい。また、音声や、
モーションピクチャーの検索に用いてもよい。また、上
述の実施例ではクライアント・サーバ環境において適用
したが、スタンドアローンの検索システムとしてもよ
い。また、文字種や同一文字種の文字列長の制限につい
ても、漢字2文字以上、3文字以上のカタカナに限定さ
れず、種々変更が可能である。
It should be noted that the present invention is not limited to the above-described embodiment, and various changes can be made without departing from the gist of the present invention. For example, in the above-described embodiment, the search is performed for image information, but the search may be performed for only text. In this case, the text information (summary,
Automatic phrase extraction may be performed only from the top part, the end part, etc. (a part containing a lot of information). Also, voice,
It may be used for searching for a motion picture. In the above-described embodiment, the present invention is applied to a client-server environment. However, a standalone search system may be used. Also, the restrictions on the character type and the character string length of the same character type are not limited to katakana of two or more Chinese characters and three or more characters, and various changes are possible.

【0040】[0040]

【発明の効果】以上説明したように、この発明によれ
ば、簡単な構成でありながら、自然な文章の検索文を用
いた検索を精度高く行うことができる。
As described above, according to the present invention, a search using a natural sentence search sentence can be performed with high accuracy while having a simple structure.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 この発明の実施例が実現されるコンピュータ
処理環境を示すシステムズである。
FIG. 1 is a system illustrating a computer processing environment in which an embodiment of the present invention is realized.

【図2】 上述実施例の情報登録の手順を説明するフロ
ーチャートである。
FIG. 2 is a flowchart illustrating a procedure of information registration according to the embodiment.

【図3】 上述実施例の情報登録のインタフェースを示
す図である。
FIG. 3 is a diagram illustrating an information registration interface according to the embodiment.

【図4】 上述実施例の情報登録される要素を説明する
図である。
FIG. 4 is a diagram illustrating elements registered as information according to the embodiment.

【図5】 上述実施例の特記語句テーブルを説明する図
である。
FIG. 5 is a diagram illustrating a special-word phrase table according to the embodiment.

【図6】 上述実施例の自動抽出語句テーブルを説明す
る図である。
FIG. 6 is a diagram illustrating an automatically extracted word / phrase table according to the embodiment.

【図7】 上述実施例の情報検索の手順を説明するフロ
ーチャートである。
FIG. 7 is a flowchart illustrating a procedure of an information search according to the embodiment.

【図8】 上述実施例の情報登録のインタフェースを示
す図である。
FIG. 8 is a diagram illustrating an information registration interface according to the embodiment.

【図9】 上述実施例の特記語句による検索例を説明す
る図である。
FIG. 9 is a diagram illustrating a search example using special words in the above embodiment.

【図10】 上述実施例の自動抽出語句による検索例を
説明する図である。
FIG. 10 is a diagram illustrating an example of a search using an automatically extracted phrase in the above embodiment.

【図11】 上述実施例の関連事項辞書を説明する図で
ある。
FIG. 11 is a diagram illustrating a related item dictionary according to the embodiment.

【図12】 上述実施例の情報追加を説明する図であ
る。
FIG. 12 is a diagram for explaining information addition in the above embodiment.

【符号の説明】[Explanation of symbols]

10 LAN 11 検索サーバ 12 検索クライアント 13 データベースシステム 14 アクセスサーバ 21 画像表示領域 22 テキスト表示領域 23 カテゴリ情報登録領域 24 特記語句登録領域 30 情報エンティティ 31 画像情報 32 テキスト情報 33 カテゴリ情報 33a カテゴリ情報テーブル 34 特記語句情報 34a 特記語句テーブル 35 自動抽出語句 35a 自動抽出語句テーブル35a 41 カテゴリ指定領域 42 検索文入力領域 43 ヒット件数表示領域 44 ヒット情報一覧表示領域 Reference Signs List 10 LAN 11 search server 12 search client 13 database system 14 access server 21 image display area 22 text display area 23 category information registration area 24 special words / phrase registration area 30 information entity 31 image information 32 text information 33 category information 33a category information table 34 special notes Phrase information 34a Special word table 35 Automatically extracted words 35a Automatically extracted word table 35a 41 Category designation area 42 Search sentence input area 43 Hit number display area 44 Hit information list display area

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平7−182370(JP,A) 特開 平7−230468(JP,A) 特開 平8−221440(JP,A) 特開 平8−30627(JP,A) 特開 平10−187736(JP,A) 特開 平10−11460(JP,A) 「ネット・サーフィンの電話代と接続 料を賢く節約」日経パソコン,1996年10 月21日号,p.204−209 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-7-182370 (JP, A) JP-A-7-230468 (JP, A) JP-A 8-221440 (JP, A) JP-A 8- 30627 (JP, A) JP-A-10-187736 (JP, A) JP-A-10-11460 (JP, A) "Smart saving of telephone charges and connection fees for Internet surfing" Nikkei Personal Computer, October 21, 1996 JP, p. 204-209 (58) Field surveyed (Int. Cl. 7 , DB name) G06F 17/30 JICST file (JOIS)

Claims (7)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 検索対象情報ごとに、検索対象情報本体
と、検索対象情報本体から取得したテキストから文字種
および同一文字種の連続する長さに基づいて抽出した第
1の語句と、上記検索対象情報本体の登録者が指定した
第2の語句とを保持するデータベース手段と、 自然な文章からなる検索文を入力する手段と、 入力された検索文から、文字種および同一文字種の連続
する長さに基づいて語句を抽出する手段と、 上記抽出した語句が上記第1の語句として登録されてい
る検索対象情報を検索する手段と、 上記検索文を上記第2の語句の各々について検索し、上
記検索文に含まれる第2の語句が登録されている検索対
象情報を検索する手段とを有することを特徴とする検索
装置。
For each piece of search target information, a search target information body, a first phrase extracted from a text acquired from the search target information body based on a character type and a continuous length of the same character type, and the search target information Database means for holding the second phrase specified by the registrant of the main body; means for inputting a search sentence composed of natural sentences; and, based on the input search sentence, a character type and a continuous length of the same character type. Means for extracting a search term, a search means for searching for search target information in which the extracted word is registered as the first word, a search for the search sentence for each of the second words, Means for searching for search target information in which a second phrase included in the search term is registered.
【請求項2】 上記第1の語句は2文字以上の漢字から
なる文字列または3文字以上のカタカナからなる文字列
とする請求項1記載の検索装置。
Wherein said first word search device according to claim 1 wherein the string of strings or 3 or more characters katakana consisting of two or more characters Kanji.
【請求項3】 検索結果の一覧を表示する手段を有する
請求項1または2記載の検索装置。
3. A means for displaying a list of search results.
The search device according to claim 1 .
【請求項4】 上記検索結果の一覧中の複数のエントリ
が選択されたときに上記検索対象情報をタイル上に配置
されたサブウィンドウにそれぞれ表示する請求項3記載
の検索装置。
4. The search device according to claim 3 , wherein when a plurality of entries in the list of the search results are selected, the search target information is displayed in sub windows arranged on tiles.
【請求項5】 1の検索対象情報を他の検索対象情報に
関連付ける手段を有し、他の検索対象情報が検索されて
表示されたときに上記1の検索対象情報も連結して表示
されるようにした請求項1、2、3または4記載の検索
装置。
5. A means for associating one search target information with another search target information, and when the other search target information is searched and displayed, the one search target information is also displayed in a linked manner. The retrieval device according to claim 1, 2, 3, or 4, wherein
【請求項6】 上記他の検索対象情報と上記1の検索対
象情報とは上下に連結された領域に表示される請求項5
記載の検索装置。
6. The claims and the other search target information and the search target information for the 1 displayed on the linked vertically region 5
Search device as described.
【請求項7】 上記関連付ける手段は検索対象情報のカ
テゴリ情報に基づいて自動的に関連付けを行う請求項5
または6記載の検索装置。
Claim 7. wherein said correlating means performs automatic association based on the category information of the search target information 5
Or the search device according to 6 .
JP11057829A 1999-03-05 1999-03-05 Search device Expired - Fee Related JP3058275B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11057829A JP3058275B1 (en) 1999-03-05 1999-03-05 Search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11057829A JP3058275B1 (en) 1999-03-05 1999-03-05 Search device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2000005018A Division JP2000259675A (en) 2000-01-01 2000-01-04 Retrieving device

Publications (2)

Publication Number Publication Date
JP3058275B1 true JP3058275B1 (en) 2000-07-04
JP2000259642A JP2000259642A (en) 2000-09-22

Family

ID=13066835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11057829A Expired - Fee Related JP3058275B1 (en) 1999-03-05 1999-03-05 Search device

Country Status (1)

Country Link
JP (1) JP3058275B1 (en)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
「ネット・サーフィンの電話代と接続料を賢く節約」日経パソコン,1996年10月21日号,p.204−209

Also Published As

Publication number Publication date
JP2000259642A (en) 2000-09-22

Similar Documents

Publication Publication Date Title
US6957213B1 (en) Method of utilizing implicit references to answer a query
JP4544674B2 (en) A system that provides information related to the selected string
JP4467184B2 (en) Semantic analysis and selection of documents with knowledge creation potential
US8676820B2 (en) Indexing and search query processing
JP3695191B2 (en) Translation support apparatus and method and computer-readable recording medium
US7647303B2 (en) Document processing apparatus for searching documents, control method therefor, program for implementing the method, and storage medium storing the program
JPH03172966A (en) Similar document retrieving device
JP4200834B2 (en) Information search system, information search method, and information search program
JP4967037B2 (en) Information search device, information search method, terminal device, and program
JPH09198395A (en) Document retrieval device
WO2001088662A2 (en) Answering natural language queries
JP2010266971A (en) Terminal equipment
JP3058275B1 (en) Search device
JP2000259675A (en) Retrieving device
JP2009104475A (en) Similar document retrieval device, and similar document retrieval method and program
JP2529418B2 (en) Document search device
JP2002183195A (en) Concept retrieving system
JPH07296005A (en) Japanese text registration/retrieval device
JP4024906B2 (en) Tagged document search system
JP2005228033A (en) Document search device and method
WO2001024053A9 (en) System and method for automatic context creation for electronic documents
JP2005044071A (en) Electronic dictionary
JP2000076254A (en) Keyword extraction device, similar document retrieval device using the same, keyword extraction method and record medium
JP2004287696A (en) Retrieval system and retrieval program
JP2001092831A (en) Device and method for document retrieval

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees