JP2003122780A - Device and method for retrieving information and program - Google Patents

Device and method for retrieving information and program

Info

Publication number
JP2003122780A
JP2003122780A JP2001320720A JP2001320720A JP2003122780A JP 2003122780 A JP2003122780 A JP 2003122780A JP 2001320720 A JP2001320720 A JP 2001320720A JP 2001320720 A JP2001320720 A JP 2001320720A JP 2003122780 A JP2003122780 A JP 2003122780A
Authority
JP
Japan
Prior art keywords
search
keyword
user
information
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001320720A
Other languages
Japanese (ja)
Inventor
Masato Namiki
正人 並木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2001320720A priority Critical patent/JP2003122780A/en
Publication of JP2003122780A publication Critical patent/JP2003122780A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To efficiently retrieve a Web page having electronic information which a user desires. SOLUTION: An information retrieving device 100 obtains a retrieval character string for retrieving electronic information which the user desires from a user terminal 20. A plurality of keywords for retrieving the Web page having electronic information is extracted from the obtained retrieval character string by referring to an index file 21. Then the information retrieving device 100 transmits a retrieval screen by which the user performs designation among the extracted keywords to the user terminal 20 via the Internet 30, generates a retrieval result list indicating the retrieval result of the obtained keyword when the keyword designated by the user is obtained from the user terminal 20 and, then, supplies the generated retrieval result list to the user terminal 20.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】この発明は、ユーザが希望す
る電子情報を有するWebページの検索を支援する情報
検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information retrieval device that assists a user in retrieving a Web page having electronic information desired by the user.

【0002】[0002]

【従来の技術】近年、インターネットが普及したことに
より、インターネットを介して電子情報としてのWeb
ページを簡単に入手することができるようになってき
た。ユーザは、希望するWebページを入手するには、
検索画面にWebページを指定するための検索文字列を
入力したのち、入力した検索文字列を検索サイトに送信
する。検索サイトは、受信した検索文字列をもとにし
て、候補となるWebページを検索し、検索したWeb
ページの一覧(以下、検索結果一覧という)を生成し
て、ユーザに提供する。ユーザは、ユーザ端末に表示さ
れた検索結果一覧を参照し、任意のWebページを指定
することで、希望するWebページを取得する。ところ
で、検索サイトを利用して希望する電子情報を有するW
ebページを検索する方法には、(1)複数のキーワー
ドが含まれている検索用の文字列(以下、検索文字列と
いう)による検索方法と、(2)ユーザが選択した多数
のキーワードをAND条件で結合して行う検索方法とが
ある。
2. Description of the Related Art In recent years, with the spread of the Internet, the Web as electronic information has passed through the Internet.
Pages are becoming easy to obtain. The user can obtain the desired Web page by
After inputting a search character string for designating a Web page on the search screen, the input search character string is transmitted to the search site. The search site searches for a candidate web page based on the received search character string and searches the searched web page.
Generate a list of pages (hereinafter referred to as a search result list) and provide it to the user. The user acquires a desired web page by referring to the search result list displayed on the user terminal and designating an arbitrary web page. By the way, W that has the desired electronic information using the search site
The method for searching the eb page includes (1) a search method using a search character string including a plurality of keywords (hereinafter referred to as a search character string), and (2) ANDing a large number of keywords selected by the user. There is a search method that combines the conditions.

【0003】(1)複数のキーワードが含まれている検
索文字列による検索方法の場合 この検索方法の場合には、キーワードを予め規定し、規
定したキーワード単位にそのキーワードを含むWebペ
ージの管理番号と、そのWebページをアクセスするた
めのURL(Uniform Resource Locator)とを対応付け
たインデックスデータを記憶するインデックスファイル
を、検索サイトに設置されている情報検索装置に予め保
存しておく。情報検索装置は、ユーザ端末から検索文字
列を受信すると、受信した検索文字列についてキーワー
ド解析し、キーワードを自動的に特定する。その後、情
報検索装置は、特定したキーワードについて、上記イン
デックスファイルを参照し、そのキーワードを含むWe
bページの検索結果一覧を生成する。
(1) In the case of a search method using a search character string containing a plurality of keywords In the case of this search method, keywords are defined in advance, and a management number of a Web page containing the keywords in defined keyword units. And an index file that stores index data in which a URL (Uniform Resource Locator) for accessing the Web page is associated with each other is stored in advance in the information search device installed at the search site. When receiving the search character string from the user terminal, the information search device performs keyword analysis on the received search character string and automatically identifies the keyword. After that, the information search device refers to the index file for the specified keyword, and the We including the keyword
Generate a list of search results for page b.

【0004】(2)ユーザが選択した多数のキーワード
をAND条件で結合して行う検索方法の場合 この検索方法の場合は、検索サイトに設置されている情
報検索装置に、(1)の場合の検索方法と同様なインデ
ックスファイルを備えている。情報検索装置は、ユーザ
が選択した多数のキーワードをユーザ端末から受信する
と、インデックスファイルを参照して、受信した多数の
キーワードの全てを含むWebページの検索結果一覧を
生成する。
(2) In the case of a search method in which a large number of keywords selected by the user are combined under an AND condition In the case of this search method, the information search device installed at the search site is used in the case of (1). It has the same index file as the search method. When receiving a large number of keywords selected by the user from the user terminal, the information search device refers to the index file and generates a search result list of Web pages including all of the received large numbers of keywords.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、(1)
の場合の検索手法では、検索サイトに設置されている情
報検索装置が、ユーザが希望しないWebページも検索
結果一覧に表示させてしまうので、ユーザは、その検索
結果一覧から希望する電子情報を有するWebページを
閲覧するに際して、無駄な閲覧行為を行わざる得ず、検
索効率を悪いという問題点があった。また、(2)の場
合の検索手法では、検索サイトに設置されている情報検
索装置が、ユーザが選択したキーワードの全てを含むW
ebページの検索結果一覧を表示するので、検索結果一
覧にユーザが希望しないWebページが含まれることが
なくなるという利点があるが、ユーザが希望する電子情
報を有するWebページが検索結果一覧に表示されない
という問題点があった。
[Problems to be Solved by the Invention] However, (1)
In the case of the search method, since the information search device installed at the search site causes the Web page that the user does not want to be displayed in the search result list, the user has the desired electronic information from the search result list. When browsing the Web page, there is a problem that the browsing efficiency is inevitable because the browsing action is unnecessary. In the search method in the case of (2), the information search device installed at the search site includes W including all of the keywords selected by the user.
Since the search result list of the eb page is displayed, there is an advantage that the search result list does not include a web page that the user does not want, but a web page having electronic information desired by the user is not displayed in the search result list. There was a problem.

【0006】この発明は上述した問題点に鑑み、ユーザ
にとって希望する電子情報を有するWebページを効率
良く検索できる情報検索装置等を提供することを目的と
する。
In view of the above-mentioned problems, it is an object of the present invention to provide an information search device and the like which can efficiently search a Web page having electronic information desired by a user.

【0007】[0007]

【課題を解決するための手段】この発明の第1の観点に
係る情報検索装置は、ユーザが希望する電子情報を検索
するための検索文字列を取得する検索文字列取得手段
と、前記検索文字列取得手段により取得した前記検索文
字列から、前記電子情報を検索するための複数のキーワ
ードを抽出するキーワード抽出手段と、前記キーワード
抽出手段により抽出された複数のキーワードを、ユーザ
に提示するキーワード提示手段と、ユーザに提示したキ
ーワードのうち、ユーザにより選択されたキーワードを
取得するキーワード取得手段と、前記キーワード取得手
段により取得したキーワードによる検索を指示する検索
指示手段と、を備えることを特徴とする。
An information retrieval apparatus according to a first aspect of the present invention is a retrieval character string obtaining means for obtaining a retrieval character string for retrieving electronic information desired by a user, and the retrieval character string. Keyword presenting means for presenting to the user the keyword extracting means for extracting a plurality of keywords for searching the electronic information from the search character string acquired by the column acquiring means, and the plurality of keywords extracted by the keyword extracting means Means, a keyword acquiring means for acquiring a keyword selected by the user among the keywords presented to the user, and a search instructing means for instructing a search by the keyword acquired by the keyword acquiring means. .

【0008】このような構成によれば、ユーザにとって
希望する電子情報を有するWebページを効率良く検索
できる。
With such a configuration, a Web page having electronic information desired by the user can be efficiently searched.

【0009】検索指示手段により指示されたキーワード
についての検索結果を示す検索結果一覧を生成する検索
結果一覧生成手段と、前記検索結果一覧生成手段により
生成された前記検索結果一覧をユーザに提供する検索結
果提供手段と、を備えるようにしてもよい。
[0009] A search result list generating means for generating a search result list showing a search result for a keyword designated by the search instructing means, and a search for providing the user with the search result list generated by the search result list generating means. Result providing means may be provided.

【0010】前記キーワードを登録するキーワード登録
手段をさらに備え、前記キーワード抽出手段は、前記検
索文字列より、前記キーワード登録手段に登録されたキ
ーワードを抽出する、ことを特徴とする。
It is further characterized in that it further comprises a keyword registration means for registering the keyword, and the keyword extraction means extracts the keyword registered in the keyword registration means from the search character string.

【0011】前記キーワードと、該キーワードの電子情
報にアクセスするためのアクセス情報と、該電子情報の
一致度を示す情報と、を対応づけた検索データを登録す
る検索データ登録手段を備え、前記検索結果一覧生成手
段は、前記検索データ登録手段から、前記キーワード取
得手段により取得したキーワードについての検索データ
を読み出す読出し手段と、読出し手段により読み出され
た前記検索データをもとにして、検索の一致度が高い順
に表示された前記検索結果一覧を生成する生成手段と、
備えるようにしてもよい。
The search data registration means for registering search data in which the keyword, the access information for accessing the electronic information of the keyword, and the information indicating the degree of coincidence of the electronic information are registered is provided, and the search is performed. The result list generation means is a read means for reading the search data for the keyword acquired by the keyword acquisition means from the search data registration means, and a search match based on the search data read by the read means. Generating means for generating the search result list displayed in descending order of frequency;
It may be provided.

【0012】また、この発明の第2の観点に係る情報検
索方法は、ユーザが希望する電子情報を検索するための
検索文字列を取得し、取得した前記検索文字列から、前
記電子情報を検索するための複数のキーワードを抽出
し、抽出された複数の前記キーワードを、ユーザに提示
し、ユーザに提示したキーワードのうち、ユーザにより
選択されたキーワードを取得し、取得したキーワードに
よる検索を指示する、ことを特徴とする。
In the information retrieval method according to the second aspect of the present invention, a retrieval character string for retrieving electronic information desired by a user is acquired, and the electronic information is retrieved from the acquired retrieval character string. Extracting a plurality of keywords for performing, presenting the plurality of extracted keywords to the user, acquiring a keyword selected by the user from the keywords presented to the user, and instructing a search by the acquired keyword , Is characterized.

【0013】このような構成によれば、ユーザにとって
希望する電子情報を有するWebページを効率良く検索
できる。
With such a configuration, it is possible to efficiently search the Web page having the electronic information desired by the user.

【0014】指示されたキーワードについての検索結果
を示す検索結果一覧を生成し、生成した前記検索結果一
覧をユーザに提供するようにしてもよい。
It is also possible to generate a search result list showing search results for the designated keyword and provide the generated search result list to the user.

【0015】前記検索文字列より、予め登録されたキー
ワードを抽出するようにしてもよい。
A keyword registered in advance may be extracted from the search character string.

【0016】また、第3の観点に係るプログラムは、コ
ンピュータに、ユーザが希望する電子情報を検索するた
めの検索文字列を取得する手順、取得した前記検索文字
列から、前記電子情報を検索するための複数のキーワー
ドを抽出する手順、抽出された複数の前記キーワード
を、ユーザに提示する手順、ユーザに提示したキーワー
ドのうち、ユーザにより選択されたキーワードを取得す
る手順、取得したキーワードによる検索を指示する手
順、を実行させる。
The program according to the third aspect is a procedure for acquiring a search character string for searching electronic information desired by a user on a computer, and searching the electronic information from the acquired search character string. For extracting a plurality of keywords for, a procedure for presenting the extracted plurality of keywords to the user, a procedure for acquiring a keyword selected by the user among the keywords presented to the user, and a search by the acquired keyword. Perform the procedure to instruct.

【0017】このような構成によれば、ユーザにとって
希望する電子情報を有するWebページを効率良く検索
できる。
With such a configuration, it is possible to efficiently search the Web page having the electronic information desired by the user.

【0018】[0018]

【発明の実施の形態】以下、この発明の実施の形態を説
明する。 <第1の実施形態>図1は、この発明の第1の実施形態
に係る情報検索装置の構成を示すブロック図である。図
1に示すように、この実施形態に係る情報検索装置10
0は、検索処理装置1と外部記憶装置2とから構成され
ており、これらの装置は互いにバス3で接続されてい
る。検索処理装置1は、CPU11と、記憶部12と、
表示部13と、入力部14と、伝送制御部15とを備え
ており、これら各構成部は内部バス16に接続されてい
る。外部記憶装置2は、インデックスファイル21と、
検索データファイル22とを備える。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below. <First Embodiment> FIG. 1 is a block diagram showing the arrangement of an information retrieval apparatus according to the first embodiment of the present invention. As shown in FIG. 1, the information search device 10 according to this embodiment.
Reference numeral 0 is composed of a search processing device 1 and an external storage device 2, and these devices are connected to each other by a bus 3. The search processing device 1 includes a CPU 11, a storage unit 12,
The display unit 13, the input unit 14, and the transmission control unit 15 are provided, and these respective components are connected to the internal bus 16. The external storage device 2 includes an index file 21 and
And a search data file 22.

【0019】検索処理装置1を構成するCPU11は、
WWW(Word Wide Web)プログラム、オペレーションシ
ステム(OS)プログラム、情報検索するための各種の
アプリケーションプログラム等をからなる制御プログラ
ムに従い、後述する検索処理を実行する。
The CPU 11 constituting the search processing device 1 is
A search process described later is executed according to a control program including a WWW (Word Wide Web) program, an operation system (OS) program, various application programs for information retrieval, and the like.

【0020】記憶部12は、ハードディスク装置、RA
M(Random Access Memory)を備え、上記制御プログラ
ムを記憶する。また、記憶部12は、CPU11により
生成されたデータを一時的に記憶するワークエリアを備
える。また、記憶部12は、ユーザが希望するWebペ
ージを検索するために入力した検索文字列を記憶する。
また、記憶部12は、検索文字列を解析して得た検索用
のキーワードと、このキーワードにより検索されたWe
bページの検索結果を示す検索結果一覧を記憶する。
The storage unit 12 includes a hard disk device and RA.
An M (Random Access Memory) is provided to store the control program. The storage unit 12 also includes a work area for temporarily storing the data generated by the CPU 11. The storage unit 12 also stores a search character string input to search for a web page desired by the user.
The storage unit 12 also searches for a keyword obtained by analyzing the search character string and the We searched for by this keyword.
A search result list showing search results for page b is stored.

【0021】表示部13は、CRT(Cathode Ray Tub
e)、液晶表示装置を備え、例えば、この実施形態の情報
検索装置の稼働状態等を表示する。入力部14は、入力
キー等からなるキーボードを備え、例えば、この実施形
態の情報検索装置の稼働状態を設定するための入力信号
をCPU11に出力する。伝送制御部15は、CPU1
1の制御に従い、ユーザ端末20との間で送受信するデ
ータ通信を制御する。
The display unit 13 is a CRT (Cathode Ray Tub).
e) A liquid crystal display device is provided to display, for example, the operating state of the information search device of this embodiment. The input unit 14 includes a keyboard including input keys, and outputs, for example, an input signal for setting the operating state of the information search device of this embodiment to the CPU 11. The transmission control unit 15 includes the CPU 1
According to the control of No. 1, the data communication transmitted to and received from the user terminal 20 is controlled.

【0022】外部記憶装置2のインデックスファイル2
1は、検索文字列から抽出するキーワードを記憶する。
検索データファイル22は、図1に示すように、キーワ
ードと、このキーワードを含むWebページの見出し
と、そのWebページをアクセスするためのURLと、
このWebページの一致度を示すスコアとを対応付けた
検索データを記憶する。スコアは、Webページ中にキ
ーワードが出現する回数TF(Term Frequency)と、こ
のキーワードを含むWebページが出現する回数DF
(Document Frequency)とから、下記の数式を用いて算
出した値であり、数値が高ければ高いほどWebページ
の一致度が高いことを示す。
Index file 2 of external storage device 2
1 stores the keyword extracted from the search character string.
As shown in FIG. 1, the search data file 22 includes a keyword, a headline of a web page including the keyword, a URL for accessing the web page,
The search data associated with the score indicating the degree of coincidence of the Web page is stored. The score is the number of times a keyword appears TF (Term Frequency) in a web page and the number of times a web page containing this keyword appears DF.
It is a value calculated from (Document Frequency) using the following mathematical expression, and the higher the numerical value, the higher the matching degree of the Web pages.

【数1】SCORE ={1.0+log10(T
F)}×Log10(NDOC/DF) ここで、上記「NDOC」は検索対象となるWebペー
ジ数である。
## EQU1 ## SCORE = {1.0 + log 10 (T
F)} × Log 10 (NDOC / DF) Here, the “NDOC” is the number of Web pages to be searched.

【0023】ユーザ端末20は、CPU、入力部、表示
部、記憶部及び伝送制御部を備えている。CPUは、制
御プログラムに従った処理を実行する。入力部は、入力
キー等からなるキーボード等を備え、キー入力された入
力信号をCPU11に出力する。
The user terminal 20 comprises a CPU, an input unit, a display unit, a storage unit and a transmission control unit. The CPU executes processing according to the control program. The input unit includes a keyboard including input keys and the like, and outputs an input signal input by the key to the CPU 11.

【0024】表示部は、情報検索装置より受信したWe
bページで構成された表示画面を表示する。上記表示画
面には、図2(a)に示すように、検索を希望する検索
文字列を入力する検索画面200、図2(b)に示すよ
うに、キーワードを選択するための検索画面250、図
3に示すように、検索結果一覧を表示する検索画面30
0がある。
The display unit displays the We received from the information retrieval device.
Display a display screen composed of page b. On the display screen, as shown in FIG. 2A, a search screen 200 for inputting a search character string desired to be searched, and as shown in FIG. 2B, a search screen 250 for selecting a keyword, As shown in FIG. 3, a search screen 30 displaying a list of search results
There is 0.

【0025】上記検索画面200は、検索したい検索文
字列を入力する検索文字列入力欄201と、「OK」ボ
タン202を備えている。上記検索画面250は、入力
された検索文字列を表示する検索文字列表示欄251
と、情報検索装置100により抽出されたキーワード
「NTTデータ」及び「NTT」を指定するためのボタ
ン252、253と、「OK」ボタン254と、「キャ
ンセル」ボタン255とを備えている。上記検索画面3
00は、入力された検索文字列を表示する検索文字列表
示欄301と、情報検索装置100により抽出されたキ
ーワード「NTTデータ」及び「NTT」を指定したこ
とを示す表示欄302、303と、「OK」ボタン30
4と、「キャンセル」ボタン305と、検索結果一覧3
06を備えている。検索結果一覧306は、情報検索装
置により抽出した複数のキーワードの中からユーザが選
択したキーワードを含むWebページの一覧である。こ
の検索結果一覧306は、ユーザが選択したキーワード
についての見出し表示欄306Aを備える。見出し表示
欄306Aは、ユーザが選択したキーワードを表示する
欄306a、検索するWebページの概略内容を表示す
る欄306b、及びこのWebページのヒット率を表示
する欄306cを備えている。
The search screen 200 is provided with a search character string input field 201 for inputting a search character string to be searched, and an "OK" button 202. The search screen 250 has a search character string display field 251 for displaying the input search character string.
And buttons 252 and 253 for designating the keywords “NTT data” and “NTT” extracted by the information search apparatus 100, an “OK” button 254, and a “cancel” button 255. Search screen 3 above
00 is a search character string display field 301 that displays the input search character string, and display fields 302 and 303 that indicate that the keywords “NTT data” and “NTT” extracted by the information search apparatus 100 have been designated. "OK" button 30
4, "Cancel" button 305, and search result list 3
It is equipped with 06. The search result list 306 is a list of Web pages including the keyword selected by the user from the plurality of keywords extracted by the information search device. The search result list 306 includes a headline display field 306A for the keyword selected by the user. The headline display column 306A includes a column 306a for displaying the keyword selected by the user, a column 306b for displaying the outline content of the Web page to be searched, and a column 306c for displaying the hit rate of this Web page.

【0026】記憶部は、上記制御プログラムを記憶する
とともに、上記検索画面200,250,300を構成
するWebページを記憶する。伝送制御部は、情報検索
装置との間のデータの送受信についての通信を制御す
る。
The storage section stores the control program and also stores the Web pages constituting the search screens 200, 250, 300. The transmission control unit controls communication for sending and receiving data to and from the information search device.

【0027】次に、この実施形態の情報検索装置100
の動作を、図4に示すフローチャートを参照して説明す
る。ユーザの操作により、ユーザ端末20は、検索文字
列を入力するための検索画面を構成するWebページを
送信するようにとの指示を、情報検索装置100に送信
する。
Next, the information search device 100 of this embodiment.
The operation will be described with reference to the flowchart shown in FIG. In response to a user operation, the user terminal 20 sends an instruction to the information search device 100 to send a web page that forms a search screen for inputting a search character string.

【0028】情報検索装置100は、ユーザ端末20よ
り、上記Webページを送信するようにとの指示を受け
ると、図2(a)に示す検索画面200を構成するWe
bページを生成し(予め生成されたものであってもよ
い)、生成したWebページをユーザ端末20に送信す
る(ステップS1)。
When the information retrieval apparatus 100 receives an instruction from the user terminal 20 to transmit the Web page, the We configuring the retrieval screen 200 shown in FIG.
The page b is generated (may be generated in advance), and the generated web page is transmitted to the user terminal 20 (step S1).

【0029】ユーザ端末20は、上記Webページを受
信すると、このWebページにより構成される検索画面
200を表示部に表示する。ユーザの操作作により、検
索画面200中の検索文字列入力欄201に、検索した
いWebページを特定するための任意の文字列が入力さ
れ、続いて、「OK」ボタン202がクリックされる
と、ユーザ端末20は、検索文字入力欄201に入力さ
れた検索文字列を、インターネット30を介して情報検
索装置100に送信する。この例では、ユーザが「NT
Tデータ」と入力したとする。
When the user terminal 20 receives the web page, the user terminal 20 displays the search screen 200 including the web page on the display unit. When an arbitrary character string for specifying the Web page to be searched is input in the search character string input field 201 in the search screen 200 by the operation of the user, and then the "OK" button 202 is clicked, The user terminal 20 transmits the search character string input to the search character input box 201 to the information search device 100 via the Internet 30. In this example, the user
"T data" is input.

【0030】情報検索装置100は、検索文字列を受信
すると、受信した検索文字例のキーワード解析を行い、
検索文字列に含まれている、インデックスファイル21
に記憶されているキーワードを抽出する(ステップS
2)。前述のように、検索文字列が「NTTデータ」
で、インデックスファイル21にキーワードとして、
「NTT」と「NTTデータ」とが登録されているとす
れば、情報検索装置100は、検索文字列「NTTデー
タ」中に、キーワードとして、「NTTデータ」と「N
TT」とを見つけ出す。なお、「NT」、「データ」、
や「デー」等が、インデックスファイル21にキーワー
ドとして記憶されていれば、これらの文字の存在も検出
される。
Upon receiving the search character string, the information search device 100 analyzes the keyword of the received search character example,
Index file 21 included in the search string
Extract the keywords stored in (step S
2). As mentioned above, the search string is "NTT data".
Then, as a keyword in the index file 21,
If "NTT" and "NTT data" are registered, the information search apparatus 100 will search for "NTT data" and "N" as keywords in the search character string "NTT data".
"TT". In addition, "NT", "data",
The presence of these characters is also detected if "," or the like is stored as a keyword in the index file 21.

【0031】情報検索装置100は、検出したキーワー
ド、即ち、検索文字列から抽出されたキーワードを指定
するための検索画面を構成するWebページを生成し、
インターネット30を介して、検索文字列を送信してき
たユーザー端末20に送信する(ステップS3)。この
例では、情報検索装置100は、図2(b)に示すよう
な、キーワード「NTTデータ」及び「NTT」のいず
れかを選択するためのボタン252、253を備える検
索画面250を構成するWebページを生成し、生成し
たWebページを、ユーザー端末20に送信する。
The information search apparatus 100 generates a Web page that constitutes a search screen for designating the detected keyword, that is, the keyword extracted from the search character string,
The search character string is transmitted to the user terminal 20 that has transmitted it via the Internet 30 (step S3). In this example, the information search apparatus 100 is a Web forming a search screen 250 including buttons 252 and 253 for selecting one of the keywords “NTT data” and “NTT” as shown in FIG. 2B. A page is generated and the generated Web page is transmitted to the user terminal 20.

【0032】ユーザ端末20は、上記Webページを受
信すると、上記検索画面250を表示部に表示する。ユ
ーザの操作により、表示部に表示されている検索画面2
50に表示されているキーワードを選択するボタン25
2、253のいずれかがクリックされ、「OK」ボタン
254がクリックされると、ユーザ端末20は、クリッ
クされたボタンにより選択されたキーワードを指定した
旨を情報検索装置100に送信する。この例では、「N
TTデータ」を指定するためのボタン252がクリック
され、「OK」254がクリックされたので、ユーザ端
末20は、「NTTデータ」を指定する旨を情報検索装
置100に送信する。なお、「キャンセル」ボタン25
5がクリックされた場合には、ユーザ端末20は、いま
までの処理がなかった旨を示す情報を情報検索装置10
0に送信する。
Upon receiving the Web page, the user terminal 20 displays the search screen 250 on the display unit. Search screen 2 displayed on the display unit by the user's operation
Button 25 for selecting keywords displayed in 50
When any of 2, 2, 253 is clicked and the “OK” button 254 is clicked, the user terminal 20 transmits to the information retrieval device 100 that the keyword selected by the clicked button has been designated. In this example, "N
Since the button 252 for designating “TT data” has been clicked and the “OK” 254 has been clicked, the user terminal 20 transmits to the information retrieval device 100 that “NTT data” has been designated. In addition, "Cancel" button 25
When 5 is clicked, the user terminal 20 retrieves information indicating that there has been no processing up to now, from the information retrieval device 10
Send to 0.

【0033】情報検索装置100は、ユーザ端末20か
ら選択されたキーワードをインターネット30を介して
受信すると、検索データファイル22から、受信したキ
ーワードを含むWebページについての検索データの全
てを順次読み出し、これらの検索データを記憶部12の
ワークエリアに記憶する(ステップS4)。この例で
は、前記検索データファイル22からキーワード「NT
Tデータ」を含むWebページについての検索データを
全て順次読み出し、これらの全文検索データを記憶部1
2に記憶する。
When the information retrieval apparatus 100 receives the keyword selected from the user terminal 20 via the Internet 30, the information retrieval apparatus 100 sequentially reads out all the retrieval data for the Web page including the received keyword from the retrieval data file 22, The search data of is stored in the work area of the storage unit 12 (step S4). In this example, the keyword “NT” is extracted from the search data file 22.
All search data for Web pages including "T data" are sequentially read, and these full-text search data are stored in the storage unit 1.
Store in 2.

【0034】次に、情報検索装置100は、記憶部12
のワークエリアに記憶されている全文検索データについ
てスコアで降順にソートする(ステップS5)。
Next, the information retrieval device 100 includes the storage unit 12
The full-text search data stored in the work area is sorted in descending order by score (step S5).

【0035】続いて、情報検索装置100は、スコアで
降順にソートされた検索データを順次読み出し、図3に
示す、検索結果一覧を示す検索画面300を構成するW
ebページを生成し(ステップS6)、生成したWeb
ページをインターネットを介してユーザ端末20に送信
する(ステップS7)。
Subsequently, the information search apparatus 100 sequentially reads the search data sorted in descending order by the score, and forms the search screen 300 showing the search result list shown in FIG.
eb page is generated (step S6), and the generated Web
The page is transmitted to the user terminal 20 via the Internet (step S7).

【0036】ユーザ端末20は、上記Webページを受
信し、表示部に図3に示す検索画面300を表示する。
ユーザ端末20は、ユーザの操作により、表示部に表示
されている検索結果一覧中の見出し欄をクリックする
と、この見出し欄にリンクされているURLに指定され
た箇所に記憶されているWebページを読み出し、読み
出したWebページを表示部に表示する。この例では、
ユーザ端末20は、図3中の検索画面に表示されている
検索結果一覧中のスコア「95%」の見出し表示欄30
6Aがユーザによりクリックされると、クリックした見
出し表示欄306AのWebページを表示部に表示す
る。
The user terminal 20 receives the Web page and displays the search screen 300 shown in FIG. 3 on the display unit.
When the user terminal 20 clicks the heading column in the search result list displayed on the display unit by the user's operation, the Web page stored in the location designated by the URL linked to this heading column is displayed. The read web page is displayed on the display unit. In this example,
The user terminal 20 displays the index display column 30 of the score “95%” in the search result list displayed on the search screen in FIG.
When 6A is clicked by the user, the Web page of the clicked headline display field 306A is displayed on the display unit.

【0037】なお、先に検索したWebページがユーザ
が希望しないものである場合には、ユーザは、異なる見
出欄し再度クリックすることで、希望する電子情報を有
するWebページを読み出す。
When the previously searched Web page is not desired by the user, the user reads the Web page having the desired electronic information by clicking in a different heading and clicking again.

【0038】この実施形態の情報検索装置100によれ
ば、インデックスファイル21に登録されているキーワ
ードを参照して、ユーザから受信した検索文字列から、
複数のキーワードを抽出し、ユーザがこの抽出したキー
ワードから検索用の1つのキーワードを指定するので、
ユーザが希望しない電子情報を有するWebページが検
索結果一覧に表示されることがなくなり、ユーザにとっ
て希望する電子情報を有するWebページを効率良く検
索できる。
According to the information retrieval apparatus 100 of this embodiment, the keyword registered in the index file 21 is referred to, and the retrieval character string received from the user
Since a plurality of keywords are extracted and the user specifies one keyword for search from the extracted keywords,
A web page having electronic information that the user does not want is not displayed in the search result list, and a web page having electronic information that the user desires can be efficiently searched.

【0039】<第2実施形態>第2の実施形態の情報検
索装置は、図示しないが、第1の実施形態の情報検索装
置の構成と同様な構成を備えている。しかし、この実施
形態の情報検索装置は、第1の実施形態の情報検索装置
と異なり、ユーザ端末20から受信した検索文字列から
抽出した複数のキーワードのうち、複数のキーワードが
ユーザにより指定され、かつ、指定された複数のキーワ
ードをAND又はORで結合した検索結果一覧をユーザ
端末20に送信するものである。
<Second Embodiment> Although not shown, the information retrieval apparatus of the second embodiment has the same configuration as that of the information retrieval apparatus of the first embodiment. However, the information search device of this embodiment is different from the information search device of the first embodiment in that, of the plurality of keywords extracted from the search character string received from the user terminal 20, a plurality of keywords are designated by the user, Moreover, the search result list obtained by combining a plurality of designated keywords with AND or OR is transmitted to the user terminal 20.

【0040】例えば、この実施形態の情報検索装置が、
図5に示すように、検索文字列「西洋みつばち」から抽
出したキーワードとして、「西洋」、「密」及び「みつ
ばち」のうちから、ユーザ端末20より、「西洋」と
「みつばち」とのキーワードが選択され、かつ、選択さ
れた「西洋」と「みつばち」とのキーワードについて
「AND」結合したWebページの検索結果一覧を表示
するようにとの指示をユーザ端末20より受けると、
「西洋」と「みつばち」とをAND結合した検索結果一
覧407Aを表示する検索画面400を構成するWeb
ページをユーザ端末20に送信する。
For example, the information retrieval apparatus of this embodiment is
As shown in FIG. 5, as keywords extracted from the search character string “Western honeybee”, from the “Western”, “Dense”, and “Mitsumachi”, the keywords “Western” and “Mitsumachi” are displayed from the user terminal 20. Is selected, and when the user terminal 20 receives an instruction to display a search result list of Web pages combined with "AND" for the selected keywords "Western" and "Mitsubachi",
A web forming a search screen 400 displaying a search result list 407A in which “West” and “mitsubachi” are AND-combined.
The page is transmitted to the user terminal 20.

【0041】第1及び第2の実施形態の情報検索装置1
00では、キーワード解析を、予めキーワードが登録さ
れているインデックスファイルを参照して行うように構
成されているが、これ以外として、ユーザ端末20から
受信した検索文字列を、例えば、辞書ファイルに登録さ
れている単語に分解し、分解した単語をキーワードとし
てもよい。
Information Retrieval Device 1 of First and Second Embodiments
In 00, the keyword analysis is performed by referring to the index file in which the keywords are registered in advance, but in addition to this, the search character string received from the user terminal 20 is registered in the dictionary file, for example. The words may be decomposed into the defined words and the decomposed words may be used as keywords.

【0042】[0042]

【発明の効果】以上この発明によれば、希望する電子情
報を有するWebページを効率良く検索できる。
As described above, according to the present invention, a Web page having desired electronic information can be efficiently searched.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の第1の実施形態に係る情報検索装置
の構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of an information search device according to a first embodiment of the present invention.

【図2】ユーザ端末に表示される検索画面を示す図であ
る。
FIG. 2 is a diagram showing a search screen displayed on a user terminal.

【図3】ユーザ端末に表示される検索画面を示す図であ
る。
FIG. 3 is a diagram showing a search screen displayed on a user terminal.

【図4】第1の実施形態に係る情報検索装置の動作を示
すフローチャートである。
FIG. 4 is a flowchart showing an operation of the information search device according to the first embodiment.

【図5】第2の実施形態に係る情報検索装置により生成
された検索画面の例を示す図である。
FIG. 5 is a diagram showing an example of a search screen generated by the information search device according to the second embodiment.

【符号の説明】[Explanation of symbols]

100 情報検索装置 1 検索処理装置 11 CPU 12 記憶部 13 表示部 14 入力部 15 伝送制御部 2 外部記憶装置 21 インデックスファイル 22 検索データファイル 20 ユーザ端末 30 インターネット 100 information retrieval device 1 Search processing device 11 CPU 12 Memory 13 Display 14 Input section 15 Transmission control unit 2 External storage device 21 Index File 22 Search data file 20 user terminals 30 Internet

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】ユーザが希望する電子情報を検索するため
の検索文字列を取得する検索文字列取得手段と、 前記検索文字列取得手段により取得した前記検索文字列
から、前記電子情報を検索するための複数のキーワード
を抽出するキーワード抽出手段と、 前記キーワード抽出手段により抽出された複数のキーワ
ードを、ユーザに提示するキーワード提示手段と、 ユーザに提示したキーワードのうち、ユーザにより選択
されたキーワードを取得するキーワード取得手段と、 前記キーワード取得手段により取得したキーワードによ
る検索を指示する検索指示手段と、 を備えることを特徴とする情報検索装置。
1. A search character string acquiring unit for acquiring a search character string for searching electronic information desired by a user, and searching the electronic information from the search character string acquired by the search character string acquiring unit. For extracting a plurality of keywords for, a plurality of keywords extracted by the keyword extraction means, a keyword presenting means for presenting to the user, among the keywords presented to the user, the keyword selected by the user An information search apparatus comprising: a keyword acquisition unit that acquires the keyword; and a search instruction unit that instructs a search by the keyword acquired by the keyword acquisition unit.
【請求項2】検索指示手段により指示されたキーワード
についての検索結果を示す検索結果一覧を生成する検索
結果一覧生成手段と、 前記検索結果一覧生成手段により生成された前記検索結
果一覧をユーザに提供する検索結果提供手段と、 を備えることを特徴とする請求項1に記載の情報検索装
置。
2. A search result list generation means for generating a search result list showing a search result for a keyword designated by the search designation means, and a user are provided with the search result list generated by the search result list generation means. The information retrieval device according to claim 1, further comprising:
【請求項3】前記キーワードを登録するキーワード登録
手段をさらに備え、 前記キーワード抽出手段は、 前記検索文字列より、前記キーワード登録手段に登録さ
れたキーワードを抽出する、 ことを特徴とする請求項1又は2に記載の情報検索装
置。
3. A keyword registration unit for registering the keyword is further provided, and the keyword extraction unit extracts the keyword registered in the keyword registration unit from the search character string. Alternatively, the information search device described in 2.
【請求項4】前記キーワードと、該キーワードの電子情
報にアクセスするためのアクセス情報と、該電子情報の
一致度を示す情報と、を対応づけた検索データを登録す
る検索データ登録手段を備え、 前記検索結果一覧生成手段は、 前記検索データ登録手段から、前記キーワード取得手段
により取得したキーワードについての検索データを読み
出す読出し手段と、 読出し手段により読み出された前記検索データをもとに
して、検索の一致度が高い順に表示された前記検索結果
一覧を生成する生成手段と、 備えることを特徴とする請求項2乃至3のいずれか1項
に記載の情報検索装置。
4. A search data registration means for registering search data in which the keyword, access information for accessing electronic information of the keyword, and information indicating a degree of coincidence of the electronic information are registered. The search result list generation means, based on the search data read by the read means for reading the search data for the keyword acquired by the keyword acquisition means from the search data registration means, based on the search data read by the read means 4. The information search device according to claim 2, further comprising: a generation unit that generates the search result list displayed in descending order of matching degree.
【請求項5】ユーザが希望する電子情報を検索するため
の検索文字列を取得し、 取得した前記検索文字列から、前記電子情報を検索する
ための複数のキーワードを抽出し、 抽出された複数の前記キーワードを、ユーザに提示し、 ユーザに提示したキーワードのうち、ユーザにより選択
されたキーワードを取得し、 取得したキーワードによる検索を指示する、 ことを特徴とする情報検索方法。
5. A search character string for searching electronic information desired by a user is acquired, a plurality of keywords for searching the electronic information is extracted from the acquired search character string, and a plurality of extracted keywords The information retrieval method, wherein the keyword is presented to the user, the keyword selected by the user is acquired from the keywords presented to the user, and a search by the acquired keyword is instructed.
【請求項6】指示されたキーワードについての検索結果
を示す検索結果一覧を生成し、 生成した前記検索結果一覧をユーザに提供する、 ことを特徴とする請求項5に記載の情報検索方法。
6. The information search method according to claim 5, wherein a search result list showing search results for the designated keyword is generated, and the generated search result list is provided to the user.
【請求項7】前記キーワードを登録するキーワード登録
手段をさらに備え、 前記キーワード抽出手段は、 前記検索文字列より、前記キーワード登録手段に登録さ
れたキーワードを抽出する、 ことを特徴とする請求項5又は6に記載の情報検索方
法。
7. The keyword registration means for registering the keyword is further provided, and the keyword extraction means extracts the keyword registered in the keyword registration means from the search character string. Alternatively, the information search method described in item 6.
【請求項8】コンピュータに、 ユーザが希望する電子情報を検索するための検索文字列
を取得する手順、 取得した前記検索文字列から、前記電子情報を検索する
ための複数のキーワードを抽出する手順、 抽出された複数の前記キーワードを、ユーザに提示する
手順、 ユーザに提示したキーワードのうち、ユーザにより選択
されたキーワードを取得する手順、 取得したキーワードによる検索を指示する手順、 を実行させるプログラム。
8. A procedure for acquiring a search character string for searching electronic information desired by a user on a computer, and a procedure for extracting a plurality of keywords for searching the electronic information from the acquired search character string. A program for executing a procedure of presenting the extracted plurality of keywords to the user, a procedure of acquiring a keyword selected by the user among the keywords presented to the user, and a procedure of instructing a search by the acquired keywords.
JP2001320720A 2001-10-18 2001-10-18 Device and method for retrieving information and program Pending JP2003122780A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001320720A JP2003122780A (en) 2001-10-18 2001-10-18 Device and method for retrieving information and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001320720A JP2003122780A (en) 2001-10-18 2001-10-18 Device and method for retrieving information and program

Publications (1)

Publication Number Publication Date
JP2003122780A true JP2003122780A (en) 2003-04-25

Family

ID=19138064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001320720A Pending JP2003122780A (en) 2001-10-18 2001-10-18 Device and method for retrieving information and program

Country Status (1)

Country Link
JP (1) JP2003122780A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348727A (en) * 2003-05-16 2004-12-09 Sap Ag Computer system, search method therein, computer program product, and manufacturing goods

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528199A (en) * 1991-07-18 1993-02-05 Canon Inc Document retrieval device
JPH05314181A (en) * 1992-05-13 1993-11-26 Fujitsu Ltd Information retrieving device
JPH05314182A (en) * 1992-05-13 1993-11-26 Fujitsu Ltd Information retrieving device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528199A (en) * 1991-07-18 1993-02-05 Canon Inc Document retrieval device
JPH05314181A (en) * 1992-05-13 1993-11-26 Fujitsu Ltd Information retrieving device
JPH05314182A (en) * 1992-05-13 1993-11-26 Fujitsu Ltd Information retrieving device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348727A (en) * 2003-05-16 2004-12-09 Sap Ag Computer system, search method therein, computer program product, and manufacturing goods
JP4597577B2 (en) * 2003-05-16 2010-12-15 エスエイピー エイジー Computer system, search method, computer program, and storage medium

Similar Documents

Publication Publication Date Title
US20070043706A1 (en) Search history visual representation
US20080065617A1 (en) Search entry system with query log autocomplete
WO2007078768A1 (en) Providing predicted search queries and predictive search results
WO2006014835B1 (en) Search systems and methods using in-line contextual queries
JP2009169541A (en) Web page retrieval server and query recommendation method
JPH10269237A (en) Document browsing system
JP2003208434A (en) Information retrieval system, and information retrieval method using the same
JP5296014B2 (en) Search device, method and program
JP2005346495A (en) Information processing system, information processing method, and information processing program
JP2004246422A (en) Information retrieval support device
JP2003122780A (en) Device and method for retrieving information and program
KR100907342B1 (en) Method, apparatus and computer-readable recording medium for search with image input device
JP2006236221A (en) Management server for web page retrieval
JPH0581326A (en) Data base retrieving device
JPH11154164A (en) Adaptability calculating method in whole sentence search processing and storage medium storing program related to the same
US20090216756A1 (en) Recording medium carrying data search program, data search apparatus, and data search method
JPH11306187A (en) Method and device for presenting retrieval result of document with category
JP5002631B2 (en) Word information collection device, word information collection method, and word information collection program
JP2009230483A (en) Information retrieving method, program and device
JP5843235B2 (en) WEB information processing apparatus, WEB information processing method, and program
JPH10260992A (en) Database processor and storage medium
JP2011508305A (en) A network search method that provides a search window when running application programs
JP2008262442A (en) Method for displaying retrieval key data, and server
JP3359951B2 (en) Database search device
JP2003122795A (en) Device, method and program for displaying information, and computer readable recording medium stored with information display program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041130

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050712