JP2002297661A - Web retrieving device - Google Patents

Web retrieving device

Info

Publication number
JP2002297661A
JP2002297661A JP2001099964A JP2001099964A JP2002297661A JP 2002297661 A JP2002297661 A JP 2002297661A JP 2001099964 A JP2001099964 A JP 2001099964A JP 2001099964 A JP2001099964 A JP 2001099964A JP 2002297661 A JP2002297661 A JP 2002297661A
Authority
JP
Japan
Prior art keywords
search
web
information
attribute
url
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001099964A
Other languages
Japanese (ja)
Inventor
Masanori Nakamura
正規 中村
Keizo Uchiyama
恵三 内山
Itsuko Tezuka
伊津子 手塚
Akio Yasuda
明夫 保田
Misa Onuma
美佐 大沼
Naoko Makita
尚子 牧田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HEIWA INFORMATION CENTER CO Ltd
Tokyo Electric Power Company Holdings Inc
Original Assignee
HEIWA INFORMATION CENTER CO Ltd
Tokyo Electric Power Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HEIWA INFORMATION CENTER CO Ltd, Tokyo Electric Power Co Inc filed Critical HEIWA INFORMATION CENTER CO Ltd
Priority to JP2001099964A priority Critical patent/JP2002297661A/en
Publication of JP2002297661A publication Critical patent/JP2002297661A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a Web retrieving device which makes it possible to grasp the trends, correlations, etc., of retrieved information and to perform data mining by performing the retrieval by using a plurality of attributes and presenting the retrieval result multi-dimensionally. SOLUTION: This device is equipped with: a retrieving means 3a which retrieves the information of an object Web page to be retrieved by using a plurality of attributes as retrieval conditions; and a presenting means 3b which presents the retrieval result multi-dimensionally according to the values of the attributes.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、インターネット等
で提供されるWebページを迅速且つ的確に検索するた
めのWeb検索装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a Web search apparatus for quickly and accurately searching Web pages provided on the Internet or the like.

【0002】[0002]

【従来の技術】インターネット上には情報が大量にアッ
プロードされており、この中から必要な情報を取得する
ためには、検索サイトにてキーワード検索を行うか、検
索サイトが用意しているカテゴリによる条件の絞り込み
を行うのが一般的である。
2. Description of the Related Art A large amount of information is uploaded on the Internet, and necessary information can be obtained by performing a keyword search on a search site or by using a category provided by the search site. In general, conditions are narrowed down.

【0003】また、キーワードによる全文検索エンジン
への不満から最近多くのメタ検索サイトが立ち上げられ
ている。メタ検索とは複数の検索エンジンに対して平行
して検索を行い、統合した結果を表示するというもので
あり、ロボット型やディレクトリ型のサーチエンジンを
バックエンドとして利用するものである。
[0003] In addition, many meta search sites have recently been launched due to dissatisfaction with full-text search engines due to keywords. The meta search is to search a plurality of search engines in parallel and display the integrated result, and to use a robot type or directory type search engine as a back end.

【0004】このようなサイトでは、検索エンジンや、
書籍・CD等の検索サービスを目的別に分類し、キーワ
ードを適したエンジンに振って検索を行うものが多く、
得られた結果をHTML文書に埋め込んでユーザーに提
示する。
[0004] In such sites, search engines,
Many search services, such as books and CDs, are classified according to purpose and search is performed by assigning keywords to an appropriate engine.
The obtained result is embedded in an HTML document and presented to the user.

【0005】この検索結果を提示する際に、検索サイト
のスコアを正規化したデータでの順位付け、ヒット件数
や参照回数などを基準にソートできる機能を提供してい
るサイトも多い。
[0005] When presenting the search results, many sites provide a function of ranking search data by normalized scores and sorting based on the number of hits, the number of references, and the like.

【0006】ページ内容に関しては、検索エンジンの情
報をそのまま返してくるもの、実際のページを取得して
何らかのフィルタをかけた情報を返してくるものがあ
る。
[0006] Regarding the page contents, there are those that return the information of the search engine as it is, and those that obtain the actual page and return some filtered information.

【0007】[0007]

【発明が解決しようとする課題】上記のような検索エン
ジンを用いて検索を行う場合、利用者(検索者)は複数
の検索サイトの特徴を把握して使い分けたり、複雑かつ
詳細な検索オプションを設定して検索を何度も繰り返さ
なければならないことが多い。
When performing a search using the above-described search engine, a user (searcher) grasps the characteristics of a plurality of search sites and uses them properly, or uses a complicated and detailed search option. Often it is necessary to set and repeat the search.

【0008】そして、大量に検索されたWebページか
ら目的とする情報を取得するためには、重複したWeb
ページや不必要な情報を除外しなければならない。
[0008] In order to obtain desired information from Web pages searched in large numbers, duplicate Web pages are required.
Pages and unnecessary information must be excluded.

【0009】一方、メタ検索サイトでは、複雑な検索式
を指定しなくても、サイトが用意するカテゴリで検索が
行われるが、このようなカテゴリは画一的に分類された
ものであり、必ずしも所望の情報が見つかるとは限らな
い。また、検索サイトのカテゴリは、人手をかけて作っ
ており、大量の情報を瞬時に適切に分類するのには限界
があった。更に、作成者の恣意が入る可能性もあった。
On the other hand, in a meta search site, a search is performed in a category prepared by the site without specifying a complicated search formula. Such a category is uniformly classified, and is not necessarily classified. The desired information is not always found. In addition, search site categories are manually created, and there is a limit to quickly and appropriately classifying a large amount of information. In addition, there was the possibility that the creator would enter into it.

【0010】また、Webページから関連するWebペ
ージの情報をたどる際には、Webページに記載された
固定的なリンク情報しかなく、目的や用途に従ったWe
bページの参照ができなかった。
When tracing the information of a related Web page from a Web page, there is only fixed link information described in the Web page, and the Web according to the purpose and use is provided.
Page b could not be referenced.

【0011】そこで本発明は、かかる実情に鑑み、複数
の属性を用いて検索を行い、検索結果を多次元で提示す
ることにより、検索した情報の傾向や相関等が把握で
き、データマイニングを行うことが可能なWeb検索装
置の提供を目的としている。
In view of such circumstances, the present invention performs data mining by performing a search using a plurality of attributes and presenting the search results in a multi-dimensional manner so that the tendency and correlation of the searched information can be grasped. The purpose of the present invention is to provide a Web search device that can perform the search.

【0012】また、URL(Uniform Resource Locato
r)の属性を用いて検索を行うことにより、迅速且つ的
確に検索を行うことが可能なWeb検索装置の提供を目
的としている。
Also, a URL (Uniform Resource Locato)
An object of the present invention is to provide a Web search device capable of performing a search quickly and accurately by performing a search using the attribute of r).

【0013】[0013]

【課題を解決するための手段】上記課題を達成するため
に本発明は、次の手段を採用した。
To achieve the above object, the present invention employs the following means.

【0014】本発明のWeb検索装置は、複数の属性を
用いてWebページの検索を行い、検索結果を多次元で
提示するものであり、検索結果の把握を容易にしてい
る。
The Web search apparatus of the present invention searches for a Web page using a plurality of attributes and presents the search results in a multidimensional manner, making it easy to grasp the search results.

【0015】また、URLに含まれる属性を用いたこと
により、複数の属性による検索を迅速に行うことを可能
にしている。
Further, by using the attributes included in the URL, it is possible to quickly perform a search using a plurality of attributes.

【0016】本発明のWeb検索装置は、複数の属性を
検索条件に用いて検索対象とするWebページの情報を
検索する検索手段と、前記検索結果をその属性の値に応
じて多次元で提示する提示手段とを備える。
[0016] A Web search apparatus of the present invention provides a search means for searching for information of a Web page to be searched using a plurality of attributes as search conditions, and presents the search result in a multi-dimensional manner in accordance with the value of the attribute. And a presentation unit that performs

【0017】これにより、迅速且つ的確に検索を行うこ
とが可能なWeb検索装置を達成している。
As a result, a Web search device capable of performing a search quickly and accurately is achieved.

【0018】上記Web検索装置においては、前記属性
として、URL(Uniform ResourceLocator)の属性で
あるディレクトリ名、ファイル名、組織名称、組織アド
レス、組織分類、組織所在地の少なくとも1つを用いる
のが好適である。
In the Web search device, it is preferable to use, as the attribute, at least one of a directory name, a file name, an organization name, an organization address, an organization classification, and an organization location, which are attributes of a URL (Uniform Resource Locator). is there.

【0019】例えば、このURLのディレクトリ名やフ
ァイル名は、格納されている情報の内容を示しているこ
とが多く、この属性の値としては、news,prod
ucts,books,reports等があり、それ
ぞれニュース、製品、書籍、報告書等の情報を有してい
るとみなせる。
For example, the directory name and file name of the URL often indicate the contents of the stored information, and the value of this attribute is news, prod.
ucs, books, reports, etc., and can be regarded as having information such as news, products, books, and reports.

【0020】従ってURLの属性を用いて検索を行うこ
とにより、適切な検索結果が迅速に得られる。
Therefore, by performing a search using the URL attribute, an appropriate search result can be obtained quickly.

【0021】また、上記Web検索装置においては、前
記属性として、キーワード、タグ情報、リンク先UR
L、リンク元URL、リンク名称、更新日の少なくとも
1つを用いることが好適である。
In the Web search device, the attributes include a keyword, tag information, and a link destination UR.
It is preferable to use at least one of L, link source URL, link name, and update date.

【0022】また、上記Web検索装置においては、前
記検索手段が、検索対象とするWebページの情報をキ
ーワード検索し、このキーワード検索の結果を対象にし
て前記属性を用いた検索を行う構成としても良い。
Further, in the Web search apparatus, the search means may perform a keyword search on information of a Web page to be searched, and perform a search using the attribute on a result of the keyword search. good.

【0023】これにより、任意のキーワードで絞り込ん
だ情報について多次元表示を行うことができ、例えば対
象技術用語に関する各企業の取り組み状況を評価するこ
とができる。
[0024] Thus, multi-dimensional display can be performed on the information narrowed down by an arbitrary keyword, and for example, it is possible to evaluate an approach situation of each company regarding the target technical term.

【0024】また、上記Web検索装置において、前記
提示手段が、前記多次元で示される検索結果のうち、検
索者によって選択された情報のURLを提示する構成と
すると良い。
[0024] In the Web search device, it is preferable that the presenting means presents a URL of information selected by a searcher among the search results shown in the multi-dimension.

【0025】これにより多次元で示された検索結果のう
ち、必要な情報を検索者が選択した場合に、この情報の
URLを提示し、このURLに基づく必要なWebペー
ジの閲覧を可能としている。
Thus, when the searcher selects necessary information from the search results shown in multi-dimensions, the URL of this information is presented, and the necessary Web page based on the URL can be browsed. .

【0026】また、上記Web検索装置において、前記
提示手段が、前記属性を用いた検索結果をその属性の一
部を用いて提示し、提示に用いる属性を任意に切り換え
可能とする。
In the Web search device, the presenting means presents a search result using the attribute by using a part of the attribute, and enables the attribute used for the presentation to be arbitrarily switched.

【0027】これにより視点を変えて多次元で示された
検索結果を評価できるようにしている。
Thus, it is possible to evaluate a search result shown in multiple dimensions from different viewpoints.

【0028】本発明において、以上の各構成要素は、可
能な限り組み合わせることができる。
In the present invention, the above-mentioned components can be combined as much as possible.

【0029】[0029]

【発明の実施の形態】以下、本発明の実施の形態を図示
例と共に説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0030】図1は本発明のWeb検索装置を用いた検
索の概念図、図2はWeb検索装置による検索結果の表
示例を示す図である。
FIG. 1 is a conceptual diagram of a search using the Web search device of the present invention, and FIG. 2 is a diagram showing a display example of search results by the Web search device.

【0031】図1に示すWebサーバ1は、国内外を問
わずインターネットを介してWebページを提供するも
のである。キーワード抽出装置2は、前記Webサーバ
1にアクセスし、Webページの情報からキーワードを
抽出するキーワード抽出手段2aと、このキーワードを
抽出されたWebページのURLと対応つけて記憶する
記憶手段2bとを備えている。
The Web server 1 shown in FIG. 1 provides a Web page via the Internet regardless of domestic and overseas. The keyword extracting device 2 includes a keyword extracting unit 2a that accesses the Web server 1 and extracts a keyword from information of a Web page, and a storage unit 2b that stores the keyword in association with the URL of the extracted Web page. Have.

【0032】そしてWeb検索装置3は、少なくともU
RLの属性を含む複数の属性を用いてWebページを検
索する検索手段と、この検索結果を多次元的に提示する
提示手段とを備えている。
Then, the Web search device 3 has at least U
A search unit for searching for a Web page using a plurality of attributes including an RL attribute, and a presentation unit for presenting the search results in a multidimensional manner are provided.

【0033】前記WebページのURLは、例えば「h
ttp://www.○○○○○.co.jp/new
s/zisin/higai.hml/」のように「ア
クセス手段://ホスト名.ドメイン名/パス名(ディ
レクトリ名)/ファイル名/」のようになっている。
The URL of the Web page is, for example, “h
http: // www. ○○○○○. co. jp / new
s / zisin / higai. html / ", access means: // host name.domain name / path name (directory name) / file name /".

【0034】上記ドメイン名は、主に国名を表す第1レ
ベルドメインと、主に業種や団体を表す 第2レベ
ルドメインと、主に組織名を表す第3レベルドメイン等
からなっている。従って、このドメイン名からどのよう
な組織がこのWebページを提供しているのかを判別で
き、上記の例では○○○○○という日本の企業が提供し
ていることがわかる。
The domain names include a first level domain mainly representing a country name, a second level domain mainly representing a business type or an organization, a third level domain mainly representing an organization name, and the like. Therefore, it is possible to determine from the domain name which organization provides this Web page, and in the above example, it can be seen that the Japanese company XXX is providing this Web page.

【0035】また、ドメイン名以下のディレクトリ名や
ファイル名は、格納されている情報の内容を示している
ことが多い。上記の例では、news=ニュース、zi
sin=地震、higai=被害、であるから、地震の
被害のニュースに関するファイルであることがわかる。
Further, directory names and file names below the domain name often indicate the contents of stored information. In the above example, news = news, zi
Since sin = earthquake and higai = damage, it is understood that the file is related to the news of the damage caused by the earthquake.

【0036】そこで本例のWeb検索装置は、このよう
なWebページの性質を示す下記の属性を用いて検索結
果の評価を行っている。 (1)URL情報の属性と属性値([属性:属性値]) [ドメイン名:トップページのURL] [第3以上のドメイン:会社名、団体名などの組織名
称] [第2ドメイン:co、go、ne、acなどの組織区
分] [第1ドメイン:jp、ukなど所在地] [内容:製品、書籍、報告書、リンク集など] (2)ページ内情報の属性と属性値 [キーワード:タイトルや本文中のキーワード] [更新日:更新日時] [リンク先URL:リンク先として記述されたURL] [リンク元URL:他のページにリンク先として記述さ
れたURL] [リンク名称:アンカータグで囲まれた文字列] [タグ情報:HTMLやXMLファイルのタグを使って
記載された内容及びタグ自体(具体例については後述す
る)] (3)検索結果の属性と属性値 [ヒット数:他の属性に基づいて検索し、ヒットしたペ
ージの数] [リンク数(ポータル度):検索結果のページに含まれ
るリンクの数] [被リンク数(人気度):検索結果のページをリンク先
として指定するリンクの数] [更新日によるソート:検索結果のページの更新日時] なお、URLは、英数字と特定の記号で記述されている
ので、属性値は英語やローマ字、略語などで示される場
合が多く、属性値として漢字やかなを用いる場合には、
[news=ニュース][products,seihin=製品][book
s,hon=書籍][touden,tepco=東京電力]などのよう
に、英数字及び記号による表記と漢字やかなの単語とを
対応付けた辞書を予め作成し、この辞書と照合して判別
する。ニュースサイトなど、サイト毎にHTMLタグの
フォーマットが統一されているものについては、タグを
利用することによりWebページの様々な属性を取得す
ることが可能である。
Therefore, the Web search apparatus of the present embodiment evaluates the search results using the following attributes indicating the properties of the Web page. (1) Attribute and attribute value of URL information ([Attribute: Attribute value]) [Domain name: URL of top page] [Third and higher domains: Organization names such as company name, organization name] [Second domain: co , Go, ne, ac, etc.] [First domain: location of jp, uk, etc.] [Contents: products, books, reports, links, etc.] (2) Attributes and attribute values of in-page information [Keywords: [Keyword in title or text] [Update date: update date] [Link destination URL: URL described as link destination] [Link source URL: URL described as link destination on another page] [Link name: anchor tag] [Character string enclosed in []] [Tag information: Contents described using tags of HTML and XML files and tags themselves (specific examples will be described later)] (3) Attributes and attribute values of search results [Number of hits: Number of pages searched and hit based on other attributes] [Number of links (portal level): Number of links included in pages of search results] [Number of linked (popularity): Number of links The number of links that specify the page as the link destination] [Sort by update date: update date and time of the search result page] Since the URL is described with alphanumeric characters and specific symbols, the attribute value is English or Roman characters, Abbreviations are often used, and when using kanji or kana as attribute values,
[News = news] [products, seihin = products] [book
s, hon = book] [touden, tepco = TEPCO], etc., a dictionary is created in advance that associates notation with alphanumeric characters and symbols with words in kanji and kana, and discriminates against this dictionary. . For HTML sites that have a uniform HTML tag format, such as news sites, various attributes of Web pages can be acquired by using tags.

【0037】[0037]

【外1】 上記のHTMLから次に述べるタグを用いることによ
り、様々な属性を得ることができる。
[Outside 1] Various attributes can be obtained from the above HTML by using the tags described below.

【外2】 従って、種々の属性つきデータ(XMLファイル)を取
得できる。
[Outside 2] Therefore, data with various attributes (XML files) can be obtained.

【0038】○取得属性(XMLファイル) <データ> <ジャンル> <タイトル> <発信元> <掲載日> <本文> <見出し> <記事に掲載されている組織の情報(URL、TELな
ど)> また、一般的なWebページにおいても「見出しタグ」
<h1>等や、フォント・色などの表示方式の指定タグ
を用いている文字列により、本文を読まなくてもある程
度ページの中身を推測することが可能である。また、何
秒後かに自動的に次のページへ飛ぶように設定されてい
ればあまり意味のないページとして扱う。イメージが埋
め込まれているか否かで重いページか否かという属性付
けが可能である。 〈実施例1〉次に本例装置において、検索対象とする技
術用語(キーワード)に関し、カテゴリ別及び競合企業
のドメイン別にヒット件数を集約し、多次元的に表示し
て評価を行った例を説明する。先ずキーワード抽出装置
2により、インターネットを介してWebサーバ1にア
クセスし、キーワード抽出手段2aにて各Webページ
のキーワードと各Webページ本文の先頭部分を抽出
し、このキーワード及び本文先頭とWebページのUR
Lを対応付けて記憶手段2bに蓄積しておく。そしてW
eb検索装置3の検索手段3aに検索条件を入力する。
○ Acquisition attribute (XML file) <Data><Genre><Title><Origin><Publishingdate><Text><Heading><Information information (URL, TEL, etc.) published in the article> Also, in general Web pages, "heading tags"
It is possible to guess the contents of the page to some extent without reading the text by using a character string using <h1> or the like or a tag specifying a display method such as font or color. If it is set to automatically jump to the next page a few seconds later, it is treated as a meaningless page. It is possible to assign an attribute as to whether the page is heavy or not depending on whether the image is embedded. <Example 1> Next, in the present example apparatus, the number of hits for technical terms (keywords) to be searched is classified by category and by domain of a competitor, and is evaluated by displaying it in a multidimensional manner. explain. First, the keyword extracting device 2 accesses the Web server 1 via the Internet, and the keyword extracting means 2a extracts the keyword of each Web page and the head of each Web page text. UR
L is stored in the storage unit 2b in association with L. And W
A search condition is input to the search means 3a of the eb search device 3.

【0039】図2はこの検索条件の入力画面の表示例で
あり、例えば、検索対象語(キーワード)として「カメ
ラ」を設定し、多次元的に評価を行う場合の次元軸のひ
とつであるx軸にメーカー名(組織名)「X社,Y社,
Z社」を設定し、z軸(次元軸)に、情報の内容「製
品,オープンソース,標準化,技術文書,研究開発」を
設定し、y軸(次元軸)に、ヒット数を設定する。
FIG. 2 shows a display example of the search condition input screen. For example, "camera" is set as a search target word (keyword), and x is one of the dimension axes when multidimensional evaluation is performed. On the axis is the manufacturer name (organization name) "Company X, Company Y,
"Company Z" is set, the content of information "product, open source, standardization, technical document, R &D" is set on the z axis (dimension axis), and the number of hits is set on the y axis (dimension axis).

【0040】このときカテゴリ(情報の内容)の選択
は、人手により行っているが、Webページ内の情報等
により自動生成しても良い。
At this time, the category (contents of information) is manually selected, but may be automatically generated based on information in a Web page.

【0041】例えば、企業などのトップページ上に「製
品情報」「FAQ」「ニュース」などのボタンがあれ
ば、このボタンのリンク先URLの情報は、ボタン名の
カテゴリに属する情報であることが分かるので、該ボタ
ン名をカテゴリとして選択し、リンク先URLの情報を
このカテゴリの情報として抽出する。
For example, if there are buttons such as "product information", "FAQ", and "news" on the top page of a company or the like, the information of the link destination URL of this button may be information belonging to the category of the button name. Since the user can understand, the button name is selected as a category, and information on the link destination URL is extracted as information on this category.

【0042】また、Webページのタイトルや、ページ
の先頭部分に含まれる単語(キーワード)をカテゴリと
して自動抽出しても良い。これらの条件で記憶手段2b
に記憶された情報を検索した場合には、先ずキーワード
に「カメラ」を含む情報を全て抽出する。そしてこの情
報を各次元軸に設定した属性の組み合せ毎に分類する。
本例では、x軸の属性値とz軸の属性値の組み合せ「X
社,製品」「Y社,製品」「Z社,製品」「X社,オー
プンソース」「Y社,オープンソース」・・・でand
検索を行い、そのヒット数をy軸の値とし、この検索結
果を多次元的に表示する。図3は、この表示例である。
これにより検索対象語(カメラ)に関しての各企業に対
する取り組み状況を把握することができる。このx,z
軸の属性値の組み合せ毎に示されたバーのうち、必要な
情報を含んでいると思われるバーを検索者が選択(クリ
ック)すると、提示手段3bが該当するWebページの
URLと、その本文の先頭部分をモニタ3c上に一覧表
示する。そして検索者が、各ページの先頭部分を読み、
必要なページを選択した場合、提示手段3bはそのUR
Lに基づきインターネットを介してWebサーバに1に
接続して目的とするWebページの情報を取得し、モニ
タ3cに表示する。このときWebページの表示は、提
示手段3b自体が行っても良いが、特定されたURLを
他のWeb閲覧ソフト(ブラウザ)にわたし、このWe
b閲覧ソフトで表示させても良い。以上のように本実施
形態では、適切なカテゴリで分類し、関連する情報の全
体像を把握しながら、目的のページを探すことができ
る。
The title of a Web page or a word (keyword) included in the head of the page may be automatically extracted as a category. Under these conditions, the storage unit 2b
When the information stored in is searched, first, all the information including "camera" in the keyword is extracted. Then, this information is classified for each combination of attributes set for each dimension axis.
In this example, the combination of the attribute value of the x-axis and the attribute value of the z-axis “X
Company, product, company Y, product, company Z, product, company X, open source, company Y, open source, and
A search is performed, and the number of hits is set as a y-axis value, and the search result is displayed in a multidimensional manner. FIG. 3 is an example of this display.
As a result, it is possible to grasp the status of the approach to each company regarding the search target word (camera). This x, z
When the searcher selects (clicks) a bar that seems to contain necessary information from among the bars indicated for each combination of the attribute values of the axis, the presentation unit 3b displays the URL of the corresponding Web page and the body of the URL. Are displayed in a list on the monitor 3c. The searcher then reads the top of each page,
When a necessary page is selected, the presentation unit 3b sets the UR
Based on L, a connection is made to a Web server 1 via the Internet to acquire information on a target Web page and display it on the monitor 3c. At this time, the display of the Web page may be performed by the presentation unit 3b itself, but the specified URL is transmitted to another Web browsing software (browser), and the Web page is displayed.
b It may be displayed by browsing software. As described above, in the present embodiment, it is possible to search for a target page while classifying the information into appropriate categories and grasping the overall image of related information.

【0043】特に、情報の相関や構造を視覚的に表示す
る等、多くの情報を端的に提示でき、少ない検索回数
(ほぼ一度)で適切な検索結果が得られる。
In particular, a large amount of information can be presented in a simple manner, such as by visually displaying the correlation and structure of information, and an appropriate search result can be obtained with a small number of searches (almost once).

【0044】また、各企業に対する取り組み状況等、検
索した情報のなかから、一定のパターンや、トレンド
(傾向)、モデル、データ相互の相関といった事実や構
造を把握することができる。即ち、データマイニングを
行うことができる。なお、本例では、検索対象語による
検索結果を多次元表示したが、これに限らず、記憶手段
2bに記憶された情報全てを対象にして多次元表示さ
せ、この次元軸に設定した属性の組み合わせのみにより
抽出された結果を利用しても良いし、更にこの属性の組
み合わせにより抽出された結果をキーワード検索するな
ど、他の検索手法と組み合わせて用いても良い。また、
本例では、各次元軸に属性値を設定したが、属性を指定
しておき、対象の情報から属性値を抽出して用いても良
い。例えばx軸に具体的な社名(属性値)ではなく、
「組織名」と設定し、対象とする情報のURLに含まれ
る組織名(第3レベル以上のドメイン)を抽出し、この
ヒット数順に上位何社かを[Y社,X社,Q社,その
他]のように採用する。 〈実施例2〉次に検索対象語に関して、その技術を手が
けている企業などのドメインのサイトマップをカテゴリ
別に示した例について説明する。本例は上記の実施例1
と比べてキーワード検索後の多次元表示方法と、多次元
表示後のURLの選択方法が異なっており、その他の構
成は同じである。なお、実施例1と同一の構成について
は一部説明を省略している。図4は検索条件の入力画面
の表示例であり、例えば、検索対象語(キーワード)と
して「printer」を設定し、空間の上下、即ちy
軸(次元軸)に「内容」の属性を設定し、空間の左右、
即ちx軸(次元軸)に組織名「xxx」「yyy」「z
zz」を設定し、空間の前後、即ちz軸(次元軸)に、
「更新日によるソート」を設定し、新しいものは手前
に、古いものは奥に表示されるように設定した。これら
の条件で記憶手段2bに記憶された情報を検索した場
合、先ずキーワードに「printer」を含む情報を
全て抽出する。次いで抽出した情報のURLから「内
容」の属性値となるディレクトリ名とファイル名を抽出
する。本例では、product,papers,ar
ticle,rd,std,news,report,
priceなどが抽出された。そしてx軸の属性値とz
軸の属性値の組み合せ「xxx,product」「y
yy,product」「zzz,product」
「xxx,papers」「yyy,papers」・
・・でand検索を行い、抽出されたページの更新日を
y軸の値とし、この検索結果を多次元的に表示する。図
5は、この表示例である。なお、実際にはサイト毎に別
の色が割り当てられている。また、見易さを考慮してU
RLをそのまま表示するのではなく、サイトの名前(組
織名)/カテゴリ(内容)という形式で表示している。
図では、papersカテゴリに注目した例を示してい
る。この上下にはproduct,article,r
d,stdカテゴリも表示されているが、この他のカテ
ゴリについても閲覧するには、注目するカテゴリを切り
替え、3次元空間をワークスルー(視点の切り替え)し
て目的のカテゴリを探す。
Further, facts and structures such as a certain pattern, a trend (trend), a model, and a correlation between data can be grasped from the retrieved information such as the status of an approach to each company. That is, data mining can be performed. In this example, the search result based on the search target word is displayed in a multidimensional manner. However, the present invention is not limited to this. All the information stored in the storage unit 2b is displayed in a multidimensional manner, The result extracted by only the combination may be used, or the result extracted by the combination of the attributes may be used in combination with another search method such as a keyword search. Also,
In this example, an attribute value is set for each dimension axis. However, an attribute may be specified, and an attribute value may be extracted from target information and used. For example, instead of a specific company name (attribute value) on the x-axis,
"Organization name" is set, and the organization names (domains at the third level or higher) included in the URL of the target information are extracted, and some of the top companies in the order of the number of hits are [Y company, X company, Q company, Others]. <Embodiment 2> Next, a description will be given of an example in which a site map of a domain, such as a company that is engaged in the technology, for each search target word is shown for each category. This example is the first embodiment described above.
The method for displaying the keyword after the keyword search is different from the method for selecting the URL after the keyword search, and the other configurations are the same. The description of the same configuration as that of the first embodiment is partially omitted. FIG. 4 is a display example of a search condition input screen. For example, “printer” is set as a search target word (keyword), and the upper and lower sides of the space, that is, y are set.
Set the "content" attribute on the axis (dimension axis),
That is, the organization names “xxx”, “yyy”, and “z” are displayed on the x-axis (dimension axis).
zz ”is set, and before and after the space, that is, on the z axis (dimension axis),
"Sort by update date" was set so that new items are displayed in the foreground and old ones are displayed in the back. When the information stored in the storage unit 2b is searched under these conditions, first, all information including "printer" as a keyword is extracted. Next, a directory name and a file name as attribute values of “contents” are extracted from the URL of the extracted information. In this example, product, papers, ar
title, rd, std, news, report,
price etc. were extracted. And the attribute value of the x axis and z
Combination of axis attribute values "xxx, product", "y"
yy, product "," zzz, product "
"Xxx, papers", "yyy, papers"
And search is performed, and the update date of the extracted page is set as the y-axis value, and the search result is displayed in a multidimensional manner. FIG. 5 is an example of this display. Actually, different colors are assigned to each site. In addition, U
The RL is not displayed as it is, but in the form of site name (organization name) / category (content).
The figure shows an example where attention is paid to the papers category. Above and below the product, article, r
Although the d and std categories are also displayed, in order to browse other categories as well, the category of interest is switched, and the target category is searched by working through the three-dimensional space (switching the viewpoint).

【0045】また、z軸に設定したように、検索結果の
属性を設定している場合には、これを切り替えて表示さ
せるように構成しても良い。例えば、y軸の属性を更新
日によるソートから、リンク数や被リンク数に切り替え
て表示し、ポータル度や人気度を評価しても良い。所望
のカテゴリが見つかった場合には、この「サイト名/カ
テゴリ」を選択することで、提示手段3bがそのURL
に基づきインターネットを介してWebサーバに1に接
続し、目的とするWebページの情報を取得してモニタ
3cに表示する。以上のように本実施形態では、視点を
代えて検索結果を表示し、対象のサイトにかかるカテゴ
リの構成(サイトマップ)を詳細に把握できるようにし
て、検索性を向上させている。
When the attribute of the search result is set as set on the z-axis, the attribute may be switched and displayed. For example, the attribute of the y-axis may be switched from the sorting by the update date to the number of links or the number of links to be displayed, and the portal degree or the popularity degree may be evaluated. If a desired category is found, by selecting this "site name / category", the presentation means 3b displays the URL
Then, it connects to the Web server 1 via the Internet based on, acquires the information of the target Web page, and displays it on the monitor 3c. As described above, in the present embodiment, the search results are displayed from different viewpoints, and the configuration of the category (site map) relating to the target site can be grasped in detail, thereby improving the searchability.

【0046】特に、多くの情報を種々の見地から表示す
ることができ、少ない検索回数(ほぼ一度)で適切な検
索結果が得られる。
In particular, a large amount of information can be displayed from various viewpoints, and an appropriate search result can be obtained with a small number of searches (almost once).

【0047】また、検索した情報を多次元表示したこと
により、該情報の中から一定のパターンや、トレンド
(傾向)、モデル、データ相互の相関といった事実や構
造を把握することができる。即ち、データマイニングを
行うことができる。 〈その他の実施形態〉以上の実施形態では、インターネ
ット上のWebページについて説明したが、本発明はこ
れに限らずイントラネット等、URLによって情報を特
定できるネットワークであれば、同様に適用できる。ま
た、URLは上述のように予めキーワード抽出装置で抽
出しておくのが望ましいが、これに限らずWeb検索装
置でWebサーバーを直接検索しても良い。更に、上記
の実施形態では、検索結果を3次元で示したが、本発明
はこれに限らず、2次元(例えば上述のx,y,z軸の
うち2つを用いたもの)や、4次元(例えば、ヒット数
や更新日等を色の濃淡や大きさの大小などで表現する次
元を上述のx,y,z軸で示す3つの次元に加えたも
の)でも良い。尚、本発明のWeb検索装置は、上述の
図示例にのみ限定されるものではなく、本発明の要旨を
逸脱しない範囲内において種々変更を加え得ることは勿
論である。
Further, by displaying the retrieved information in a multi-dimensional manner, facts and structures such as a certain pattern, a trend (trend), a model and a correlation between data can be grasped from the information. That is, data mining can be performed. <Other Embodiments> In the above embodiments, Web pages on the Internet have been described. However, the present invention is not limited to this, and may be applied to any network such as an intranet that can specify information by URL. Further, it is desirable that the URL is previously extracted by the keyword extracting device as described above, but the present invention is not limited to this, and the Web search device may directly search the Web server. Furthermore, in the above-described embodiment, the search result is shown in three dimensions, but the present invention is not limited to this, and two-dimensional (for example, one using two of the above-described x, y, and z axes), Dimensions (for example, dimensions obtained by expressing the number of hits, the update date, and the like in terms of color shading, size, and the like, in addition to the three dimensions indicated by the x, y, and z axes described above) may be used. It should be noted that the Web search device of the present invention is not limited to the illustrated example described above, and it goes without saying that various changes can be made without departing from the spirit of the present invention.

【0048】[0048]

【発明の効果】以上、説明したように本発明によれば、
複数の属性を用いて検索を行い、検索結果を多次元で提
示することにより、検索した情報の傾向や相関等が把握
でき、データマイニングを行うことが可能なWeb検索
装置を提供できる。
As described above, according to the present invention,
By performing a search using a plurality of attributes and presenting the search results in a multi-dimensional manner, it is possible to provide a Web search device capable of grasping trends and correlations of the searched information and performing data mining.

【0049】また、URLの属性を用いて検索を行うこ
とにより、迅速且つ的確に検索を行うことが可能なWe
b検索装置を提供できる。
Further, by performing a search using the attribute of the URL, it is possible to perform a search quickly and accurately.
b A search device can be provided.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の検索装置を用いたWeb検索の説明
FIG. 1 is an explanatory diagram of a Web search using a search device of the present invention.

【図2】 実施例1の検索条件を入力する画面の例を示
す図
FIG. 2 is a diagram illustrating an example of a screen for inputting search conditions according to the first embodiment.

【図3】 実施例1の検索結果を多次元表示した例を示
す図
FIG. 3 is a diagram illustrating an example in which search results of the first embodiment are displayed in a multi-dimensional manner.

【図4】 実施例2の検索条件を入力する画面の例を示
す図
FIG. 4 is a diagram illustrating an example of a screen for inputting search conditions according to the second embodiment.

【図5】 実施例2の検索結果を多次元表示した例を示
す図
FIG. 5 is a diagram showing an example in which search results of the second embodiment are displayed in a multidimensional manner.

【符号の説明】[Explanation of symbols]

1 Webサーバ 2 キーワード抽出装置 2a キーワード抽出手段 2b 記憶手段 3 検索装置 3a 検索手段 3b 提示手段 3c モニタ Reference Signs List 1 Web server 2 Keyword extraction device 2a Keyword extraction device 2b Storage device 3 Search device 3a Search device 3b Presentation device 3c Monitor

───────────────────────────────────────────────────── フロントページの続き (72)発明者 内山 恵三 東京都千代田区内幸町一丁目1番3号 東 京電力株式会社内 (72)発明者 手塚 伊津子 東京都千代田区内幸町一丁目1番3号 東 京電力株式会社内 (72)発明者 保田 明夫 東京都新宿区西新宿6−14−1新宿グリー ンタワービル19F 株式会社平和情報セン ター内 (72)発明者 大沼 美佐 東京都新宿区西新宿6−14−1新宿グリー ンタワービル19F 株式会社平和情報セン ター内 (72)発明者 牧田 尚子 東京都新宿区西新宿6−14−1新宿グリー ンタワービル19F 株式会社平和情報セン ター内 Fターム(参考) 5B075 NK02 NK31 NK46 PP22 PQ02 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Keizo Uchiyama 1-3-1 Uchisaiwaicho, Chiyoda-ku, Tokyo Tokyo Electric Power Company (72) Inventor Itzuko Tsuzuka 1-1-3 Uchisaiwaicho, Chiyoda-ku, Tokyo East Inside Keio Electric Power Company (72) Inventor Akio Yasuda 6-14-1 Nishi-Shinjuku, Shinjuku-ku, Tokyo Shinjuku Green Tower Building 19F Inside the Peace Information Center Co., Ltd. (72) Misa Onuma 6-14 Nishi-Shinjuku, Shinjuku-ku, Tokyo -1 Shinjuku Green Tower Building 19F Peace Information Center Co., Ltd. (72) Inventor Naoko Makita 6-14-1, Nishi Shinjuku, Shinjuku-ku, Tokyo Shinjuku Green Tower Building 19F Peace Information Center Co., Ltd. F-term (reference) 5B075 NK02 NK31 NK46 PP22 PQ02

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 複数の属性を検索条件に用いて検索対象
とするWebページの情報を検索する検索手段と、前記
検索結果をその属性の値に応じて多次元で提示する提示
手段とを備えたことを特徴とするWeb検索装置。
A search unit that searches for information of a Web page to be searched using a plurality of attributes as search conditions; and a presentation unit that presents the search result in a multi-dimensional manner in accordance with the value of the attribute. Web search device characterized by the following.
【請求項2】 前記属性として、URL(Uniform Reso
urce Locator)の属性であるディレクトリ名、ファイル
名、組織名称、組織アドレス、組織分類、組織所在地の
少なくとも1つを用いたことを特徴とする請求項1に記
載のWeb検索装置。
2. The method according to claim 1, wherein the attribute is a URL (Uniform Reso
2. The Web search device according to claim 1, wherein at least one of a directory name, a file name, an organization name, an organization address, an organization classification, and an organization location, which are attributes of the urce locator, is used.
【請求項3】 前記属性として、キーワード、タグ情
報、リンク先URL、リンク元URL、リンク名称、更
新日の少なくとも1つを用いたことを特徴とする請求項
1又は2に記載のWeb検索装置。
3. The Web search device according to claim 1, wherein at least one of a keyword, tag information, a link destination URL, a link source URL, a link name, and an update date is used as the attribute. .
【請求項4】 前記検索手段が、検索対象とするWeb
ページの情報をキーワード検索し、このキーワード検索
の結果を対象にして前記属性を用いた検索を行うことを
特徴とする請求項1から3の何れかに記載のWeb検索
装置。
4. The method according to claim 1, wherein the search unit searches for a Web to be searched.
4. The Web search device according to claim 1, wherein a keyword search is performed on page information, and a search using the attribute is performed on a result of the keyword search.
【請求項5】 前記提示手段が、前記多次元で示される
検索結果のうち、検索者によって選択された情報のUR
Lを提示することを特徴とする請求項1から4の何れか
に記載のWeb検索装置。
5. The UR of information selected by a searcher among the search results shown in the multidimensional,
5. The Web search device according to claim 1, wherein L is presented. 6.
【請求項6】 前記提示手段が、前記属性を用いた検索
結果をその属性の一部を用いて提示し、提示に用いる属
性を任意に切り換え可能としたことを特徴とする請求項
1から5の何れかに記載のWeb検索装置。
6. The method according to claim 1, wherein the presenting means presents a search result using the attribute by using a part of the attribute, and enables the attribute used for the presentation to be arbitrarily switched. Web search device according to any one of the above.
JP2001099964A 2001-03-30 2001-03-30 Web retrieving device Pending JP2002297661A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001099964A JP2002297661A (en) 2001-03-30 2001-03-30 Web retrieving device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001099964A JP2002297661A (en) 2001-03-30 2001-03-30 Web retrieving device

Publications (1)

Publication Number Publication Date
JP2002297661A true JP2002297661A (en) 2002-10-11

Family

ID=18953450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001099964A Pending JP2002297661A (en) 2001-03-30 2001-03-30 Web retrieving device

Country Status (1)

Country Link
JP (1) JP2002297661A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6761348B2 (en) 2001-08-08 2004-07-13 Robert Bosch Gmbh Throttle devices housing with flexible compensation elements for internal combustion engines
CN100371932C (en) * 2004-03-23 2008-02-27 南京大学 Expandable and customizable theme centralized universile-web net reptile setup method
JP2009259248A (en) * 2008-04-11 2009-11-05 Nhn Corp Method and unit for tagging images included in web page and providing web retrieval service by using the result and computer-readable recording medium
JP2012113434A (en) * 2010-11-22 2012-06-14 Internatl Business Mach Corp <Ibm> Method and computer program for displaying multiple contributions (groups of data) in real time on computer screen along multiple axes
WO2015114785A1 (en) * 2014-01-30 2015-08-06 楽天株式会社 Attribute display system, attribute display method, and attribute display program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6761348B2 (en) 2001-08-08 2004-07-13 Robert Bosch Gmbh Throttle devices housing with flexible compensation elements for internal combustion engines
CN100371932C (en) * 2004-03-23 2008-02-27 南京大学 Expandable and customizable theme centralized universile-web net reptile setup method
JP2009259248A (en) * 2008-04-11 2009-11-05 Nhn Corp Method and unit for tagging images included in web page and providing web retrieval service by using the result and computer-readable recording medium
JP2012113434A (en) * 2010-11-22 2012-06-14 Internatl Business Mach Corp <Ibm> Method and computer program for displaying multiple contributions (groups of data) in real time on computer screen along multiple axes
US9513767B2 (en) 2010-11-22 2016-12-06 International Business Machines Corporation Displaying posts in real time along axes on a computer screen
WO2015114785A1 (en) * 2014-01-30 2015-08-06 楽天株式会社 Attribute display system, attribute display method, and attribute display program
JP5792913B1 (en) * 2014-01-30 2015-10-14 楽天株式会社 Attribute display system, attribute display method, and attribute display program
US10331730B2 (en) 2014-01-30 2019-06-25 Rakuten, Inc. Attribute display system, attribute display method, and attribute display program

Similar Documents

Publication Publication Date Title
US7162493B2 (en) Systems and methods for generating and providing previews of electronic files such as web files
US6304870B1 (en) Method and apparatus of automatically generating a procedure for extracting information from textual information sources
JP5531033B2 (en) Methods and systems
US20060123042A1 (en) Block importance analysis to enhance browsing of web page search results
US20090254455A1 (en) System and method for virtual canvas generation, product catalog searching, and result presentation
US20060200455A1 (en) Search engine result reporter
US20090172514A1 (en) Method and system for searching text-containing documents
KR20110085995A (en) Providing search results
CN101356528A (en) Displaying compact and expanded data items
US20070239692A1 (en) Logo or image based search engine for presenting search results
JP2000029906A (en) System for managing document information
JP2003281093A (en) Method and device for browsing link destination information in browser
JP2002297661A (en) Web retrieving device
US8447748B2 (en) Processing digitally hosted volumes
JP2008191982A (en) Retrieval result output device
JP5423470B2 (en) Name identification check support device, name identification check support program, and name identification check support method
US8131752B2 (en) Breaking documents
JP4505389B2 (en) Advertisement content transmission system and advertisement content transmission method
JP2004054918A (en) Information processing system, information display device, computer program, and recording medium
JP2004157965A (en) Search support device and method, program and recording medium
JP2004086849A (en) Information processing device and method therefor
JP2005099964A (en) Retrieval classifying system, retrieval classifying server, program and recording medium
JP2003108796A (en) Document sales system
JP2002073685A (en) Method and device for supplying retrieval result
KR101057997B1 (en) Search engines and search methods using initial text

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060530

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061128