JP4527770B2 - Information retrieval apparatus, computer program, and storage medium - Google Patents

Information retrieval apparatus, computer program, and storage medium Download PDF

Info

Publication number
JP4527770B2
JP4527770B2 JP2007506942A JP2007506942A JP4527770B2 JP 4527770 B2 JP4527770 B2 JP 4527770B2 JP 2007506942 A JP2007506942 A JP 2007506942A JP 2007506942 A JP2007506942 A JP 2007506942A JP 4527770 B2 JP4527770 B2 JP 4527770B2
Authority
JP
Japan
Prior art keywords
information
search
user
search result
user data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007506942A
Other languages
Japanese (ja)
Other versions
JPWO2006095409A1 (en
Inventor
信也 武井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MARS FLAG CORPORATION
Original Assignee
MARS FLAG CORPORATION
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MARS FLAG CORPORATION filed Critical MARS FLAG CORPORATION
Publication of JPWO2006095409A1 publication Critical patent/JPWO2006095409A1/en
Application granted granted Critical
Publication of JP4527770B2 publication Critical patent/JP4527770B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Description

本発明は、ユーザから入力されたキーワードに基づいてインターネット上のWEBサイトを検索する情報検索装置、情報検索方法及びその方法をコンピュータに実行させるプログラムに関する。     The present invention relates to an information search apparatus, an information search method, and a program for causing a computer to execute the method for searching a WEB site on the Internet based on a keyword input by a user.

ユーザの検索指示によりインターネット上のWEBサイト(WEBページ)を全文検索する検索エンジンとしては、ロボット型検索エンジンやディレクトリ型検索エンジンが従来から一般的に知られている。   Conventionally known robotic search engines and directory type search engines are known as search engines for full-text search of WEB sites (WEB pages) on the Internet according to user search instructions.

ロボット型検索エンジンは、検索したい情報に関連するキーワードを指定すると、WEBロボットやスパイダーと呼ばれる WWW探索プログラムを用いて,インターネット上で見つけることのできる全WWWサーバ上の情報を定期的に収集し、その情報の索引付けを自動的に行うものである。このロボット型検索エンジンは,コンピュータによって自動的に全世界のWEBサイトのデータを収集しているため、情報量が多いという利点を有している。   When a keyword related to information to be searched is specified, the robot-type search engine periodically collects information on all WWW servers that can be found on the Internet using a WWW search program called a WEB robot or spider. The information is automatically indexed. Since this robot type search engine automatically collects data of WEB sites all over the world by a computer, it has an advantage of a large amount of information.

ディレクトリ型検索エンジンは、作業者が予めWEBサイトのURL(Uniform Resource Locator)を、芸術、ビジネス、教育等のように分野別に人為的に分類しておき、ユーザは分野別にキーワードを指定して検索するものである。このディレクトリ型検索エンジンでは情報を分野別に分類しているので、ユーザは職業別電話帳のような使い方ができ、分野を決めてから探す場合に便利であるという利点を有している。   The directory-type search engine allows the operator to categorize the URL (Uniform Resource Locator) of the WEB site in advance, such as art, business, education, etc., and the user can search by specifying keywords for each field. To do. Since this directory type search engine classifies information by field, the user can use it like an occupational telephone book, and has the advantage that it is convenient when searching after determining a field.

しかしながら、このような従来の検索エンジンには次のような問題がある。ロボット型検索エンジンの場合には、収集した情報量が多いという利点をもつ反面、検索ロボットは収集したWEBサイト情報に出てくる単語から単純に索引付けを行うため、キーワード検索した場合にWEBサイトが何万件と出てしまう場合が多い。このため、ユーザとは本来関係無いようなサイトまで検索結果として表示されてしまい、検索結果の品質が低く、ユーザは目的のWEBサイトを絞り込むのに膨大な時間を要してしまうという問題がある。   However, such a conventional search engine has the following problems. In the case of a robot-type search engine, there is an advantage that a large amount of information is collected. On the other hand, since the search robot simply indexes the words that appear in the collected WEB site information, the WEB site In many cases, there are tens of thousands of cases. For this reason, there is a problem that a site that is not originally related to the user is displayed as a search result, the quality of the search result is low, and the user needs an enormous amount of time to narrow down the target WEB site. .

また、検索ロボットが検索を行うので、異なるユーザが検索した場合でも同一キーワードで検索する限り常に同じ検索結果しか得られず、異なるプロフィールや嗜好を有するユーザの全てに対して満足のいく検索結果が得られることは少ないという問題がある。   In addition, since the search robot performs a search, even if different users search, as long as the search is performed with the same keyword, only the same search result is always obtained, and a satisfactory search result is obtained for all users having different profiles and preferences. There is a problem that it is rarely obtained.

ディレクトリ型検索エンジンの場合には、WEBサイトのデータ入力及び分類を基本的に人手で行っているため、ロボット型検索エンジンによるサービスと比較して情報量が2、3桁少なく、有名なWEBサイト以外を探すことが出来ないという問題がある。また、WEBサイトのデータ入力と分類を作業者の事務処理能力に頼っているため、情報量を増大するのにも限界がある。   In the case of a directory-type search engine, the data input and classification of the WEB site is basically performed manually, so the amount of information is two to three orders of magnitude less than the service provided by the robot-type search engine. There is a problem that you can not find anything other than. In addition, since the data input and classification of the WEB site depend on the business processing ability of the worker, there is a limit in increasing the amount of information.

また、ディレクトリ型エンジンの場合には、単に収集したWEBサイトの情報を分野別に分類しているだけなので、ロボット型検索エンジンと同様に、異なるユーザが検索した場合でも同一キーワードで検索する限り常に同じ検索結果しか得られず、異なるプロフィールや嗜好等を有するユーザの全てに対して満足のいく検索結果が得られることは少ないという問題がある。   In the case of a directory-type engine, the collected WEB site information is simply classified according to the field. Therefore, as with the robot-type search engine, even if a different user searches, the same keyword is always used. There is a problem that only search results can be obtained, and satisfactory search results are rarely obtained for all users having different profiles and preferences.

これに対して、ユーザの嗜好にあわせた検索結果を提供するシステムが提案されている(特許文献1を参照。)このシステムでは、ユーザが情報を取り扱うために当該情報を特定するための識別情報をユーザの操作に基づいてブックマーク登録するとともに、ユーザの意図に基づいてカテゴリを付与して分類可能としている。さらに、各カテゴリ内の情報のユーザ間での一致度を求めることにより、そのユーザと他のユーザとの嗜好の類似度を評価判定し、前記類似度が高いと判定された他のユーザが評価した情報を前記ユーザに紹介することができる。これによれば、ユーザは、嗜好が類似した他のユーザが評価した情報をシステムから紹介されるため、情報を探すための時間及び費用が節約できる。
特願2000−187666号公報
On the other hand, a system that provides a search result according to the user's preference has been proposed (see Patent Document 1). In this system, identification information for specifying the information so that the user can handle the information. Are registered as bookmarks based on user operations, and categories are assigned based on the user's intentions. Further, by determining the degree of coincidence between users of information in each category, the similarity of preference between the user and other users is evaluated and determined, and other users who are determined to have high similarity are evaluated. The information can be introduced to the user. According to this, since the user introduces information evaluated by other users with similar preferences from the system, time and cost for searching for information can be saved.
Japanese Patent Application No. 2000-187666

しかしながら、従来のシステムではユーザの嗜好の類似度に基づいて、提供を受けるユーザに未知の情報を提供することはできたが、キーワード検索時において、嗜好の共通するユーザの動向(例えば、共通の趣味を有するユーザがどのページを数多く参照しているか等)や、当該ページの直近の動向(例えば、直近に更新されたかどうか、あるいは、最近特に人気を集めているか等)を指標として、提供する情報を選別することはできない。   However, in the conventional system, it is possible to provide unknown information to the user who receives the provision based on the similarity of the user's preference. However, at the time of keyword search, the trend of the user having the common preference (for example, the common preference) Provide as an index the number of pages that a user with a hobby refers to) and the latest trend of the page (for example, whether it has been updated recently, or has recently become particularly popular) Information cannot be sorted out.

本発明はこのような問題点に鑑みてなされたものであり、キーワード検索時における検索結果をユーザにとってより価値のあるものとすることを目的とする。   The present invention has been made in view of such a problem, and an object thereof is to make a search result at the time of keyword search more valuable to a user.

以上の課題を解決するための本発明は、クライアント端末から入力された検索情報に基づいてインターネット上のWebページの情報を検索し、検索結果を前記クライアント端末に送信する情報検索装置であって、
Webページに関する登録情報を格納する登録情報格納手段と、
前記クライアント端末から前記検索情報を受信する受信手段と、
前記検索情報に含まれるキーワードに関連するWebページを検索用情報から検索し、第1の検索結果を生成する第1の検索結果生成手段と、
前記クライアント端末のユーザに固有のデータであって、対応するユーザについて、少なくとも、年齢、性別、地域属性、職種、未既婚、住居形態、年収、車の所有、及び、趣味のいずれかの種別に関する情報を含むユーザデータを、ユーザ毎に格納するユーザデータ格納手段と、
前記検索情報から、前記ユーザを特定するための識別情報を抽出する抽出手段と、
前記ユーザデータ格納手段に格納されたユーザデータのうち、前記識別情報に対応する第1のユーザデータを取得するユーザデータ取得手段と、
前記登録情報格納手段に格納された、前記第1の検索結果に含まれるWebページに関する登録情報から、前記検索情報に含まれる前記登録情報の利用の有無に関する設定情報と、前記第1のユーザデータとを利用して第1の登録情報を選択する選択手段と、
前記第1の登録情報に基づいて、前記第1の検索結果に含まれるWebページの重み付け値を、該Webページ毎に算出する算出手段と、
Webページ毎に算出された前記重み付け値に基づき、前記第1の検索結果に含まれるWebページの順位を決定する順位決定手段と、
決定された前記順位により前記第1の検索結果に含まれるWebページをソートして第2の検索結果を生成する第2の検索結果生成手段と、
前記第2の検索結果を前記クライアント端末に送信する送信手段と
を備え、
前記登録情報には、前記Webページについて、少なくとも、複数のユーザにより参照された回数の前記ユーザデータの種別毎の総計、直近の所定期間内に複数のユーザにより参照された回数の前記ユーザデータの種別毎の合計、該Webページをブックマークに登録している前記ユーザデータの種別毎のユーザ数のいずれかが含まれ、
前記設定情報は、前記重み付け値を算出するために利用する前記登録情報を指定する情報であって、
前記選択手段は、前記設定情報において指定された前記登録情報のうち、少なくとも前記第1のユーザデータに含まれる各種別に関する情報に対応する登録情報を、前記第1の登録情報として選択する。
The present invention for solving the above problems is an information search apparatus for searching for information on a web page on the Internet based on search information input from a client terminal and transmitting a search result to the client terminal.
Registration information storage means for storing registration information relating to a web page;
Receiving means for receiving the search information from the client terminal;
First search result generating means for searching a Web page related to a keyword included in the search information from search information and generating a first search result;
It is data specific to the user of the client terminal, and for the corresponding user, at least regarding age, gender, regional attribute, occupation, unmarried, dwelling form, annual income, car ownership, and hobby User data storage means for storing user data including information for each user;
Extraction means for extracting identification information for identifying the user from the search information;
Among user data stored in the user data storage means, user data acquisition means for acquiring first user data corresponding to the identification information;
From registration information relating to the Web page included in the first search result stored in the registration information storage means, setting information relating to presence / absence of use of the registration information included in the search information, and the first user data Selecting means for selecting the first registration information using
Calculating means for calculating, for each Web page, a weight value of the Web page included in the first search result based on the first registration information;
Rank determining means for determining the rank of the Web page included in the first search result based on the weighting value calculated for each Web page;
Second search result generation means for generating a second search result by sorting Web pages included in the first search result according to the determined order;
Transmitting means for transmitting the second search result to the client terminal;
Wherein the registration information for the Web page, at least, the sum of each of the user data of the number of times referenced by the plurality of user type, the user data of the number of times referenced by a plurality of users within a latest predetermined period the total for each type, one of the number of users of each type of the user data that has registered the Web page in the bookmark is included,
The setting information is information for specifying the registration information used for calculating the weighting value,
The selection unit selects, as the first registration information, registration information corresponding to at least various types of information included in the first user data among the registration information specified in the setting information.

以上のように、本発明によれば、キーワード検索時における検索結果をユーザにとってより価値のあるものとすることができる。本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。   As described above, according to the present invention, the search result at the time of keyword search can be made more valuable to the user. Other features and advantages of the present invention will become apparent from the following description with reference to the accompanying drawings. In the accompanying drawings, the same or similar components are denoted by the same reference numerals.

添付図面は明細書に含まれ、その一部を構成し、本発明の実施の形態を示し、その記述と共に本発明の原理を説明するために用いられる。
本発明の実施形態に対応するシステムの全体構成の一例に対応する図である。 本発明の実施形態に対応するクライアント101の構成の一例に対応する図である。 本発明の実施形態に対応するサーバ103の構成の一例に対応する図である。 本発明の実施形態に対応するユーザデータベース104の登録内容の一例を示す図である。 本発明の実施形態に対応するブックマークデータベース105の登録内容の一例を示す図である。 本発明の実施形態に対応するURLデータベース106の登録内容の一例を示す図である。 本発明の実施形態に対応するURLデータベース106の登録内容の他の一例を示す図である。 本発明の実施形態に対応する、オンラインブックマークが利用される際のクライアント101・サーバ103間における処理の一例に対応するフローチャートである。 本発明の実施形態に対応するクライアント101のディスプレイ207に表示される表示画面の一例を示す図である。 本発明の実施形態に対応するクライアント101のディスプレイ207に表示される表示画面の他の一例を示す図である。 本発明の実施形態に対応するクライアント101のディスプレイ207に表示される表示画面の更に他の一例を示す図である。 本発明の実施形態に対応する検索処理が実行される際の、クライアント101・サーバ103間における処理の一例に対応するフローチャートである。 本発明の実施形態に対応する、サーバ103における検索処理の一例に対応するフローチャートである。
The accompanying drawings are included in the specification, constitute a part thereof, show an embodiment of the present invention, and are used to explain the principle of the present invention together with the description.
It is a figure corresponding to an example of the whole system configuration corresponding to an embodiment of the present invention. It is a figure corresponding to an example of composition of client 101 corresponding to an embodiment of the present invention. It is a figure corresponding to an example of composition of server 103 corresponding to an embodiment of the present invention. It is a figure which shows an example of the registration content of the user database 104 corresponding to embodiment of this invention. It is a figure which shows an example of the registration content of the bookmark database 105 corresponding to embodiment of this invention. It is a figure which shows an example of the registration content of the URL database 106 corresponding to embodiment of this invention. It is a figure which shows another example of the registration content of the URL database 106 corresponding to embodiment of this invention. It is a flowchart corresponding to an example of the process between the client 101 and the server 103 when an online bookmark is used, corresponding to the embodiment of the present invention. It is a figure which shows an example of the display screen displayed on the display 207 of the client 101 corresponding to embodiment of this invention. It is a figure which shows another example of the display screen displayed on the display 207 of the client 101 corresponding to embodiment of this invention. It is a figure which shows another example of the display screen displayed on the display 207 of the client 101 corresponding to embodiment of this invention. It is a flowchart corresponding to an example of the process between the client 101 and the server 103 when the search process corresponding to the embodiment of the present invention is executed. It is a flowchart corresponding to an example of the search process in the server 103 corresponding to the embodiment of the present invention.

以下に、添付する図面を参照して本発明の実施形態を説明する。ただし、この実施の形態に記載されている構成要素はあくまでも例示であり、この発明の範囲をそれらのみに限定する趣旨のものではない。   Embodiments of the present invention will be described below with reference to the accompanying drawings. However, the constituent elements described in this embodiment are merely examples, and are not intended to limit the scope of the present invention only to them.

<システム構成>
図1は、本実施形態に対応する検索システムの全体構成を示すブロック図である。ユーザが操作してコンテンツの閲覧を行うクライアント101a、101b、101c(以下、これらを総称して「クライアント101」という。)、検索を行うサーバ103、コンテンツを公開するコンテンツサーバ108が、それぞれインターネット102に接続されている。また、サーバ103には、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107が接続されている。
<System configuration>
FIG. 1 is a block diagram showing the overall configuration of a search system corresponding to this embodiment. Clients 101 a, 101 b, 101 c (hereinafter collectively referred to as “client 101”) that are operated by the user to browse content, a server 103 that performs search, and a content server 108 that publishes content are respectively connected to the Internet 102. It is connected to the. In addition, a user database 104, a bookmark database 105, a URL database 106, and a search database 107 are connected to the server 103.

クライアント101は、ユーザが操作して、インターネット上に公開されたコンテンツを閲覧可能なクライアント端末としての情報処理装置であり、ノートパソコン、デスクトップパソコン、携帯情報端末、携帯電話等を含む。クライアント101には、所定のページ記述言語(例えば、HTML、XML、PDF或いはPS等)で記載されたコンテンツを表示画面上に表示可能なソフトウェアがインストールされているものとする。以下の本実施形態では、簡単のために、当該ソフトウェアとして、所謂インターネット・ブラウザがインストールされている場合を例として説明する。   The client 101 is an information processing apparatus as a client terminal that can be operated by a user and browse content published on the Internet, and includes a notebook personal computer, a desktop personal computer, a portable information terminal, a mobile phone, and the like. It is assumed that software capable of displaying content described in a predetermined page description language (for example, HTML, XML, PDF, PS, etc.) on the display screen is installed in the client 101. In the following embodiment, for the sake of simplicity, a case where a so-called Internet browser is installed as the software will be described as an example.

クライアント101は、イーサネット(登録商標)等のネットワークケーブルを含むアクセス手段であるLANによってインターネット102に接続されている。尚、ネットワーク102へのアクセス手段はイーサネット(登録商標)ケーブルに限定されるものではなく、例えば、RS232Cインタフェースに準じた通信ケーブルや、無線LAN等の無線通信手段によって構成されていてもよい。後述するサーバ103、コンテンツサーバ108も同様のアクセス手段を備えているものとする。   The client 101 is connected to the Internet 102 by a LAN which is an access means including a network cable such as Ethernet (registered trademark). Note that the access means to the network 102 is not limited to the Ethernet (registered trademark) cable, and may be constituted by a communication cable conforming to the RS232C interface, or a wireless communication means such as a wireless LAN. It is assumed that the server 103 and the content server 108 described later include similar access means.

インターネット102は、世界中のネットワークが互いに接続されたネットワークであるが、例えば、イントラネットのように特定の組織内においてのみ接続可能なネットワークであってもよい。   The Internet 102 is a network in which networks all over the world are connected to each other, but may be a network that can be connected only within a specific organization, such as an intranet.

サーバ103は、クライアント101に検索サービスを提供する情報検索装置としての情報処理装置であり、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107に格納されている情報を管理している。サーバ103は、インターネット102上で閲覧可能なWebサイトに定期的にアクセスして、そこに含まれるURL、タイトル、全文データを収集し、URLデータベース106や検索用データベース107を更新する。   The server 103 is an information processing apparatus as an information search apparatus that provides a search service to the client 101, and manages information stored in the user database 104, bookmark database 105, URL database 106, and search database 107. . The server 103 periodically accesses a website that can be browsed on the Internet 102, collects the URL, title, and full-text data included therein, and updates the URL database 106 and the search database 107.

また、ブックマークデーベース105の更新を監視し、ユーザブックマークに新たなURLが追加されたり、削除されたりした場合には、対応するURLデータベース106に登録されている情報の更新を行う。また、クライアント101における、ブックマークに登録されたURLの選択動作を監視し、各ユーザの参照回数を記録している。サーバ103は、例えば、LANによって、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107に接続されている。   Further, the update of the bookmark database 105 is monitored, and when a new URL is added to or deleted from the user bookmark, information registered in the corresponding URL database 106 is updated. In addition, the selection operation of the URL registered in the bookmark in the client 101 is monitored, and the reference count of each user is recorded. The server 103 is connected to a user database 104, a bookmark database 105, a URL database 106, and a search database 107 by, for example, a LAN.

ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107は、それぞれ所定のデータベース・ソフトウェアがインストールされた情報処理装置であり、各種データの管理を行う。ユーザデータベース104は、ユーザデータの情報を管理する。ブックマークデータベース105は、各ユーザのブックマークデータを管理する。URLデータベース106は、各ユーザがブックマークに登録しているページに関する登録情報を統一的に管理する。検索用データベース107は、検索処理用の情報を管理する。   The user database 104, the bookmark database 105, the URL database 106, and the search database 107 are information processing apparatuses in which predetermined database software is installed, and manage various data. The user database 104 manages user data information. The bookmark database 105 manages bookmark data for each user. The URL database 106 uniformly manages registration information regarding pages registered by each user in bookmarks. The search database 107 manages information for search processing.

コンテンツサーバ108は、ウェブページ等のコンテンツを提供する情報処理装置であり、例えば、ウェブサーバ等のソフトウェアがインストールされている。   The content server 108 is an information processing apparatus that provides content such as a web page. For example, software such as a web server is installed.

尚、本明細書では、便宜上、サーバ103、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、及び、検索用データベース107は、それぞれ物理的に独立した情報処理装置によって実現されるものとして説明するが、本発明の実施形態はこれに限られるものではない。例えば、これらが単一の情報処理装置によって実現されてもよい。また、ユーザデータベース104、ブックマークデータベース105、URLデータベース106及び検索用データベース107は、サーバ103とLAN等によって接続されているものとして説明するが、例えば、インターネット102や非図示のイントラネット経由でサーバ103と通信可能な形態をとってもよい。   In this specification, for the sake of convenience, the server 103, the user database 104, the bookmark database 105, the URL database 106, and the search database 107 are described as being realized by physically independent information processing apparatuses. The embodiment of the present invention is not limited to this. For example, these may be realized by a single information processing apparatus. The user database 104, bookmark database 105, URL database 106, and search database 107 are described as being connected to the server 103 via a LAN or the like. For example, the user database 104, bookmark database 105, URL database 106, and search database 107 are connected to the server 103 via the Internet 102 or an unshown intranet. The form which can communicate may be taken.

<情報処理装置の構成>
次に、本実施形態に対応する検索システムを構成する情報処理装置の概略について説明する。図2は、クライアント101のハードウェア構成の一例を示すブロック図である。上述した情報処理装置としてのユーザデータベース104、ブックマークデータベース105、URLデータベース106及び検索用データベース107も、同様或いは同等のハードウェア構成として構成しても良い。
<Configuration of information processing apparatus>
Next, an outline of the information processing apparatus constituting the search system corresponding to the present embodiment will be described. FIG. 2 is a block diagram illustrating an example of the hardware configuration of the client 101. The user database 104, the bookmark database 105, the URL database 106, and the search database 107 as the information processing apparatus described above may be configured in the same or equivalent hardware configuration.

図2において、200はCPUであり、ハードディスク装置(以下、HDと呼ぶ)205に格納されているアプリケーションプログラム、オペレーティングシステム(OS)や制御プログラム等を実行し、RAM202にプログラムの実行に必要な情報、ファイル等を一時的に格納する制御を行う。   In FIG. 2, reference numeral 200 denotes a CPU that executes application programs, operating systems (OS), control programs, and the like stored in a hard disk device (hereinafter referred to as HD) 205, and information necessary for executing the programs in the RAM 202. Control to temporarily store files and the like.

201はROMであり、内部には基本I/Oプログラム等のプログラム、文書処理の際に使用するフォントデータ、テンプレート用データ等の各種データを記憶する。202は各種データを一時記憶するためのRAMであり、CPU200の主メモリ、ワークエリア等として機能する。   A ROM 201 stores therein various data such as a program such as a basic I / O program, font data used for document processing, and template data. A RAM 202 temporarily stores various data, and functions as a main memory, a work area, and the like of the CPU 200.

203は記録媒体へのアクセスを実現するための外部記憶ドライブであり、メディア(記録媒体)204に記憶されたプログラム等を本コンピュータシステムにロードすることができる。尚、メディア204は、例えば、フレキシブルディスク(FD)、CD−ROM、CD−R、CD−RW、PCカード、DVD、ICメモリカード、MO、メモリスティック等を利用することができる。   Reference numeral 203 denotes an external storage drive for realizing access to a recording medium, and a program or the like stored in the medium (recording medium) 204 can be loaded into the computer system. As the medium 204, for example, a flexible disk (FD), a CD-ROM, a CD-R, a CD-RW, a PC card, a DVD, an IC memory card, an MO, a memory stick, or the like can be used.

205は外部記憶装置であり、本実施形態では大容量メモリとして機能するHDを用いている。HD205には、アプリケーションプログラム、OS、制御プログラム、関連プログラム等が格納される。   Reference numeral 205 denotes an external storage device, which uses an HD functioning as a large-capacity memory in this embodiment. The HD 205 stores application programs, OS, control programs, related programs, and the like.

206は指示入力装置であり、キーボードやポインティングデバイス(マウス等)、タッチパネル等がこれに相当する。指示入力装置206を用いて、ユーザは、クライアント101に対して、装置を制御するコマンド等を入力指示する。   Reference numeral 206 denotes an instruction input device, which corresponds to a keyboard, a pointing device (such as a mouse), a touch panel, or the like. Using the instruction input device 206, the user instructs the client 101 to input a command or the like for controlling the device.

207はディスプレイであり、指示入力装置206から入力したコマンドや、それに対するクライアント101の応答出力等を表示したりするものである。   A display 207 displays a command input from the instruction input device 206, a response output of the client 101 in response thereto, and the like.

209はシステムバスであり、情報処理装置内のデータの流れを司るものである。208はインターフェイス(以下、I/Fという)であり、このI/F208を介して外部装置とのデータのやり取りを行う。   A system bus 209 manages the flow of data in the information processing apparatus. Reference numeral 208 denotes an interface (hereinafter referred to as I / F), which exchanges data with an external device via the I / F 208.

尚、以上の各装置と同等の機能を実現するソフトウェアにより、ハードウェア装置の代替として構成することもできる。   In addition, it can also be comprised as an alternative of a hardware apparatus with the software which implement | achieves a function equivalent to the above each apparatus.

本実施形態では、メディア204から本実施形態に係るプログラム及び関連データを直接RAM202にロードして実行させる例を示すが、これ以外にも、本実施形態に係るプログラムを動作させる度に、既にプログラムがインストールされているHD205からRAM202にロードするようにしてもよい。また、本実施形態に係るプログラムをROM201に記録しておき、これをメモリマップの一部をなすように構成し、直接CPU200で実行することも可能である。   In the present embodiment, an example is shown in which the program and related data according to the present embodiment are directly loaded from the medium 204 to the RAM 202 and executed. However, every time the program according to the present embodiment is operated, the program is already executed. May be loaded into the RAM 202 from the HD 205 in which is installed. It is also possible to record the program according to the present embodiment in the ROM 201, configure it as a part of the memory map, and execute it directly by the CPU 200.

図3は、サーバ103の機器構成を示すブロック図である。CPU300、ROM301、RAM302、外部記憶ドライブ303、メディア304、HD305、指示入力装置306、ディスプレイ307、I/F308、システムバス309の機能及び用途、更には、これらの関係は、図2を用いて説明したものと同様或いは同等である。図3では、データベース310がシステムバス309に接続されていることに留意する。ここで、データベース310は、ユーザデータベース104、ブックマークデータベース105、URLデータベース106及び検索用データベース107を総称するものである。   FIG. 3 is a block diagram illustrating a device configuration of the server 103. Functions and applications of the CPU 300, ROM 301, RAM 302, external storage drive 303, media 304, HD 305, instruction input device 306, display 307, I / F 308, system bus 309, and their relationship will be described with reference to FIG. Similar or equivalent to Note that in FIG. 3, database 310 is connected to system bus 309. Here, the database 310 is a generic term for the user database 104, the bookmark database 105, the URL database 106, and the search database 107.

<ユーザデータの構造>
図4Aは、ユーザデータベース104に格納されているユーザデータの構造の一例を説明する図である。ユーザデータは、個々のユーザの特徴や属性に関する種々の情報によって構成される。
<User data structure>
FIG. 4A is a diagram for explaining an example of the structure of user data stored in the user database 104. The user data is composed of various information relating to the characteristics and attributes of individual users.

図4Aにおいて、401はユーザIDであり、各ユーザを一意に識別するためにユニークに与えられた識別子である。402はパスワードであり、各ユーザが登録された個人情報にアクセスしたり、ブックマークを利用する際の認証に利用される。403はユーザ名、404はユーザのメールアドレス、405は年齢、406は性別、407は、ユーザが活動又は居住する地域属性、408は職種、409は未既婚、410は住居形態、411は年収、412は自家用車の所有、413は趣味である。それぞれのデータは予めユーザから提供されて、ユーザデータとして登録される。また、上記の内容はユーザデータの一例として上げたものであって、これら全てが登録されている必要はないし、また、これら以外にもユーザを特徴づける情報を登録しても良い。   In FIG. 4A, 401 is a user ID, which is an identifier uniquely assigned to uniquely identify each user. A password 402 is used for authentication when each user accesses personal information registered or uses a bookmark. 403 is the user name, 404 is the user's email address, 405 is the age, 406 is the gender, 407 is the region attribute where the user is active or resides, 408 is the occupation, 409 is unmarried, 410 is the residence type, 411 is the annual income, 412 is a private car ownership, and 413 is a hobby. Each data is provided in advance by the user and registered as user data. Further, the above contents are given as an example of user data, and it is not necessary that all of them are registered, and other information that characterizes the user may be registered.

<ブックマークの構成>
本実施形態においてブックマークはユーザにより作成・更新されるが、ブックマークデータはすべてサーバ103に接続されたブックマークデータベース105に各ユーザ毎に格納されており、ユーザがクライアント101においてウェブブラウザを起動した際に、クライアント101にダウンロードされて、ウェブブラウザ上に表示される。
<Bookmark structure>
In this embodiment, bookmarks are created and updated by the user, but all bookmark data is stored in the bookmark database 105 connected to the server 103 for each user, and when the user starts a web browser on the client 101. , Downloaded to the client 101 and displayed on the web browser.

ブックマークは、公知のディレクトリ構造において、URL及び当該URLを特定のまとまりとして格納するフォルダにより構成される。即ち、各URLはユーザごとのディレクトリツリー(以下、ブックマークディレクトリという)の中に登録され、ブックマークディレクトリの直下であっても、任意に作成されたフォルダ内にあってもよい。   The bookmark is composed of a URL and a folder that stores the URL as a specific unit in a known directory structure. That is, each URL is registered in a directory tree for each user (hereinafter referred to as a bookmark directory), and may be directly under the bookmark directory or in an arbitrarily created folder.

図4Bは、ブックマーク内に登録されたページに関する情報の管理の一例を示す図である。図4Bにおいて、ユーザIDは当該ブックマークを利用するユーザの識別子であり、図4AにおけるユーザID401と対応する。これによりユーザとブックマークとの対応をとることができる。422には、登録対象となるWebページを識別するための情報が登録される。本実施形態ではURLデータベース106を利用して、各ページに関する情報を統一的に管理しているので、ユーザの個々のブックマークには対応するページのURLは格納されない。その代わりに、URLデータベース106において当該ページを管理するための識別番号(URL−ID)が格納される。なお、URLデータベース106を利用しない場合には、URLそのものを登録しても良い。   FIG. 4B is a diagram illustrating an example of management of information related to a page registered in a bookmark. In FIG. 4B, the user ID is an identifier of a user who uses the bookmark, and corresponds to the user ID 401 in FIG. 4A. Thereby, the correspondence between the user and the bookmark can be taken. In 422, information for identifying the Web page to be registered is registered. In the present embodiment, the URL database 106 is used to manage information about each page in a unified manner, so that the URL of the corresponding page is not stored in each bookmark of the user. Instead, the URL database 106 stores an identification number (URL-ID) for managing the page. If the URL database 106 is not used, the URL itself may be registered.

423は各ページに与えられたブックマーク名である。このブックマーク名423は、ユーザがブックマーク登録する際に、任意に設定した名称であっても良いし、当該ページに本来割り当てられている名称であっても良い。424は、当該ページが作成された日時(ネットワーク102上で初めて公開された日時に相当する。)を示す。425は、当該ページが最新に更新された日時を示す。426は、ユーザが最新に当該ページを参照した日時を示す。427は、ユーザによる当該ページの総参照回数を示す。総参照回数とは、ユーザがこれまでに当該ページを参照した回数の総計をいう。428は、ユーザによる当該ページの直近の参照回数を示す。ここで、直近の参照回数とは、直近の所定期間(例えば、1週間、1ヶ月など)において当該ページがユーザにより参照された回数の合計をいう。   Reference numeral 423 denotes a bookmark name given to each page. The bookmark name 423 may be a name arbitrarily set when the user registers a bookmark, or may be a name originally assigned to the page. Reference numeral 424 denotes the date and time when the page was created (corresponding to the date and time when the page was first published on the network 102). Reference numeral 425 indicates the date and time when the page was updated to the latest. Reference numeral 426 indicates the date and time when the user referred to the page most recently. Reference numeral 427 denotes the total number of times the user refers to the page. The total number of times of reference refers to the total number of times the user has referred to the page so far. Reference numeral 428 denotes the number of times the user has referred to the page recently. Here, the most recent reference count refers to the total number of times the page has been referred to by the user in the most recent predetermined period (for example, one week, one month, etc.).

なお、ブックマークに登録された各ページ間の関係や、当該ページを格納するフォルダに関する情報は、図4Bに示すテーブルとは別に、ブックマークデータベース105内にディレクトリテーブルが用意され、そこに格納される。   In addition to the table shown in FIG. 4B, a directory table is prepared in the bookmark database 105 and stored therein regarding the relationship between the pages registered in the bookmark and information on the folder storing the page.

ここで、サーバ103は、上述の通りブックマーク登録されている各ページの更新を定期的に監視しており、更新があった場合には425の更新日時の内容を更新する。   Here, as described above, the server 103 periodically monitors the update of each page registered as a bookmark, and updates the contents of the update date and time 425 when there is an update.

<URLデータベースの構成>
URLデータベース106は、ブックマークデータベース105に登録されているURL−ID422に対応するページに関する情報を登録している。図4Cは、URLデータベース106におけるページに関する情報の管理の一例を示す図である。
<Configuration of URL database>
The URL database 106 registers information related to the page corresponding to the URL-ID 422 registered in the bookmark database 105. FIG. 4C is a diagram illustrating an example of management of information regarding pages in the URL database 106.

図4Cにおいて、422は、URLに与えられたID(識別子)を表しており、図4BにおけるURL−ID422と対応する。429は、URL−ID422が与えられたURLを示す。430は、URLに対応するWebコンテンツが本来有するタイトルを示す。作成日時、更新日時は図4Bと同様である。431は、最終参照日時を示し、複数のブックマークユーザのいずれかが最新に、当該ページを参照した日時を示す。432は、複数のユーザの総参照回数427の合計、即ち、複数のユーザにより当該ページが参照された回数の総計を表す。   4C, reference numeral 422 represents an ID (identifier) given to the URL, and corresponds to the URL-ID 422 in FIG. 4B. Reference numeral 429 denotes a URL to which a URL-ID 422 is given. Reference numeral 430 denotes a title inherent to the Web content corresponding to the URL. The creation date / time and update date / time are the same as in FIG. 4B. Reference numeral 431 denotes the last reference date and time, which indicates the date and time when one of the bookmark users referred to the page most recently. Reference numeral 432 denotes the total of the total reference counts 427 of a plurality of users, that is, the total number of times the page is referred to by a plurality of users.

直近参照回数433は、複数のユーザの直近参照回数428の合計、即ち、直近の所定期間内に複数のユーザにより当該ページが参照された回数の合計を表す。従って、「直近の所定期間」については、図4Bの場合と同様である。例えば、最近立ち上げられたばかりであるが人気のあるページは、この直近参照回数433が高くなるので、ページ毎に直近の人気の度合いを判定することが可能となる。434は、増加アンカー数であって、当該ページについて直近の所定期間内に追加されたアンカー数を示す。本実施形態においてアンカーとは、ページ内に埋め込まれた、他のページへのリンク情報を言う。また、「直近の所定期間」については上記と同様である。また、435は、ブックマーク登録数であって、当該ページをブックマークに登録しているユーザ数を示す。   The latest reference count 433 represents the total of the latest reference counts 428 of a plurality of users, that is, the total number of times the page is referred to by a plurality of users within the latest predetermined period. Therefore, “the most recent predetermined period” is the same as in FIG. 4B. For example, since a recently-launched but popular page has the most recent reference count 433, it is possible to determine the most popular degree for each page. Reference numeral 434 denotes the number of increased anchors, which indicates the number of anchors added within the most recent predetermined period for the page. In this embodiment, the anchor refers to link information to another page embedded in the page. Further, “the most recent predetermined period” is the same as described above. Reference numeral 435 denotes the number of bookmarks registered, which indicates the number of users who have registered the page in the bookmark.

また、URLデータベース106は、ページをブックマークに登録しているユーザのユーザデータ毎の参照回数や、ブックマーク登録数を管理している。図4Dは、URLデータベース106におけるページに関する情報の管理の他の一例を示す図である。   Further, the URL database 106 manages the reference count and the bookmark registration count for each user data of the user who registers the page in the bookmark. FIG. 4D is a diagram illustrating another example of management of information regarding pages in the URL database 106.

図4Dでは、各ページ毎に、ユーザデータの詳細に対応する総参照回数、直近参照回数及びブックマーク登録数を登録している。422は、各ページに割り当てられたURL−IDを示す。440は、ユーザデータであり、図4Aに示した個々のユーザデータが登録される。441は総参照回数であり、ユーザデータ毎に集計された当該ページに対する参照回数の総計が登録される。442は、直近参照回数であって、ユーザデータ毎に集計された当該URLに対する直近の所定期間における参照回数の合計が登録される。「直近の所定期間」については、上記と同様である。また、443は、ブックマーク登録数であり、当該ページをブックマークに登録しているユーザ数をユーザデータ毎に合計した値が登録される。   In FIG. 4D, the total reference count, the latest reference count, and the bookmark registration count corresponding to the details of the user data are registered for each page. Reference numeral 422 denotes a URL-ID assigned to each page. Reference numeral 440 denotes user data, in which individual user data shown in FIG. 4A is registered. Reference numeral 441 denotes the total number of times of reference, and the total number of times of reference with respect to the page, which is totaled for each user data, is registered. Reference numeral 442 denotes the latest reference count, and the total of the reference counts in the most recent predetermined period for the URL, which is counted for each user data, is registered. The “predetermined predetermined period” is the same as described above. Reference numeral 443 denotes the number of bookmarks registered, and a value obtained by totaling the number of users who have registered the page in the bookmark for each user data is registered.

図4Dでは、ユーザデータ440について、年齢405、趣味413、職種408が登録例を記載しているが、年齢405を参酌すると、「10代」、「20代」等のように一定の年齢層毎に総参照回数441、直近参照回数442、及び、ブックマーク登録数443が登録されている。つまり、10代のユーザが当該URLを参照した合計は100回であり、20代のユーザが当該URLを参照した合計は300回であることが、図4Dから読みとれる。   In FIG. 4D, for user data 440, age 405, hobby 413, and job type 408 are described as registered examples. When age 405 is taken into account, a certain age group such as “10's”, “20's”, etc. For each, a total reference count 441, a latest reference count 442, and a bookmark registration count 443 are registered. In other words, it can be read from FIG. 4D that the total of the teenage users referring to the URL is 100 times, and that the total of the 20-year users referring to the URL is 300 times.

また、直近の参照回数については、10代が30回であり、20代が20回であることが読みとれる。即ち、このURLに対応するWebコンテンツには、全体的には20代のユーザが、10代のユーザよりも関心を強く示している一方、直近だけを見た場合には10代のユーザの関心が強くなっていることが分かる。また、ブックマーク登録数443を参照すれば、10代から40代などにおいて、どの年齢層がどれだけブックマーク登録しているかを把握することができる。   As for the most recent reference count, it can be read that teenagers are 30 times and 20s are 20 times. That is, the Web content corresponding to this URL is generally more interested by users in their 20s than users in their teens. It can be seen that is getting stronger. Further, by referring to the bookmark registration number 443, it is possible to grasp how many bookmarks are registered by which age group in their teens to 40s.

図4Aに示したとおり、ユーザデータ440には「年齢」、「趣味」、「職種」以外にも複数含まれており、これらのユーザデータそれぞれについて、総参照回数441、直近参照回数442及びブックマーク登録数443が登録されている。このようなユーザデータ毎の総参照回数441、直近参照回数442及びブックマーク登録数443のデータは、図4A及び図4Bに示したデータを利用すれば得られる。   As shown in FIG. 4A, the user data 440 includes a plurality of items other than “age”, “hobby”, and “job type”. For each of these user data, the total reference count 441, the latest reference count 442, and the bookmark The registered number 443 is registered. The data of the total reference count 441, the latest reference count 442, and the bookmark registration count 443 for each user data can be obtained by using the data shown in FIGS. 4A and 4B.

なお、本実施形態では、図4Aから図4Dまでに例示したデータベースの個々の登録内容のことを登録情報と称する。   In the present embodiment, each registered content of the database exemplified in FIGS. 4A to 4D is referred to as registration information.

<検索用データベースの構成>
検索用データベース107は、ユーザから提供されるキーワードに関連するWebページを検索するための検索用情報として検索処理用の情報を管理するものであり、インターネット102上のWebサイトから収集された検索データが登録される。検索データは、主として各検索データの識別子、キーワード、属性、データ取得時間、データ取得URL、URLのタイトル、全文データ(Description)等から構成されるが、この他のデータを含めてもよい。
<Configuration of search database>
The search database 107 manages information for search processing as search information for searching for a Web page related to a keyword provided by a user. Search data collected from a Web site on the Internet 102 Is registered. The search data mainly includes an identifier, a keyword, an attribute, a data acquisition time, a data acquisition URL, a URL title, a full text data (Description), and the like of each search data, but may include other data.

<オンラインブックマーク>
図5は、クライアント101においてオンラインブックマークが利用される際の、クライアント101・サーバ103間における処理の一例に対応するフローチャートである。まず、クライアント101においてWebブラウザが起動されると(ステップS551において「YES」)、ブックマークデータ要求がユーザID401と共にサーバ103に通知され(501)、サーバ103では、通知されたユーザID401に基づいて、ブックマークデータベース105を検索し、当該ユーザのブックマークデータを選択する(ステップS552)。選択されたブックマークデータはサーバ103からクライアント101に対して送信される(502)。
<Online bookmark>
FIG. 5 is a flowchart corresponding to an example of processing between the client 101 and the server 103 when an online bookmark is used in the client 101. First, when a Web browser is started in the client 101 (“YES” in step S551), a bookmark data request is notified to the server 103 together with the user ID 401 (501), and the server 103 is based on the notified user ID 401. The bookmark database 105 is searched and bookmark data of the user is selected (step S552). The selected bookmark data is transmitted from the server 103 to the client 101 (502).

クライアント101では、起動されたWebブラウザをディスプレイ207上に表示し、Webブラウザのブックマーク表示領域にサーバ103から送信されたブックマークデータに基づくブックマーク情報を表示する(ステップS553)。   The client 101 displays the activated web browser on the display 207, and displays bookmark information based on the bookmark data transmitted from the server 103 in the bookmark display area of the web browser (step S553).

その後、クライアント101ではユーザからのブックマークに対する操作を受け付けたかどうかを監視し、もし操作を受け付けた場合には(ステップS554で「YES」)、サーバ103に対してブックマーク操作内容を通知する(503)。ここで、ユーザから受け付けるブックマークの操作には、例えば、ブックマークに登録されているURLの選択、新たなURLの追加、登録済みのURLの情報の編集(削除を含む)等がある。   Thereafter, the client 101 monitors whether or not an operation for the bookmark from the user has been accepted. If the operation has been accepted (“YES” in step S554), the bookmark operation content is notified to the server 103 (503). . Here, the bookmark operation received from the user includes, for example, selection of a URL registered in the bookmark, addition of a new URL, editing of registered URL information (including deletion), and the like.

クライアント101からブックマーク操作内容を受信すると、サーバ103では、受信した内容に基づいて各データベースを更新する。当該通知が、例えばユーザがあるURLを選択した通知であった場合には、対応するURLについての参照日時426、総参照回数427、直近参照回数428、最終参照日時431、総参照回数432、直近参照回数433、総参照回数441、直近参照回数442をそれぞれ更新する。   When the bookmark operation content is received from the client 101, the server 103 updates each database based on the received content. If the notification is, for example, a notification that a user has selected a URL, the reference date and time 426, the total reference count 427, the latest reference count 428, the last reference date and time 431, the total reference count 432, and the latest reference for the corresponding URL. The reference count 433, the total reference count 441, and the latest reference count 442 are updated.

また、ユーザがWebブラウザの閲覧を終了する場合には、クライアント101からサーバ103に対して終了通知が送信され(504)、サーバ103からは終了応答が返される(505)。   When the user finishes browsing the Web browser, a termination notification is transmitted from the client 101 to the server 103 (504), and a termination response is returned from the server 103 (505).

以上により、サーバ103が管理するブックマークデータベース105及びURLデータベース106は、常にユーザから受け付けた操作に基づいて内容が更新されることとなる。   As described above, the contents of the bookmark database 105 and the URL database 106 managed by the server 103 are always updated based on the operation received from the user.

<検索処理その1(検索画面)>
次に、本実施形態におけるサーバ103を利用してクライアント101がWebページの検索処理を実行する場合の処理について具体的に説明する。
<Search process 1 (Search screen)>
Next, a specific description will be given of processing when the client 101 executes Web page search processing using the server 103 in the present embodiment.

図6A乃至図6Cは、ユーザがクライアント101において検索処理を実行する場合に、ディスプレイ207に表示される画面の一例を示す図である。ユーザが検索処理を実行しようとする場合には、所定のURLを指定してサーバ103が提供する検索ページにアクセスする。この時最初にディスプレイ207に表示される画面が、図6A乃至図6Cに示すような画面600である。画面600は、検索画面601とブックマーク表示領域606とに大きく分割される。ブックマーク表示領域606には、前述のサーバ103から提供されたブックマークデータに基づくブックマーク表示がなされており、ユーザはブックマークに登録されたページを選択して、閲覧することができる。   6A to 6C are diagrams illustrating an example of a screen displayed on the display 207 when the user executes a search process in the client 101. FIG. When a user intends to execute a search process, a predetermined URL is designated and a search page provided by the server 103 is accessed. At this time, the first screen displayed on the display 207 is a screen 600 as shown in FIGS. 6A to 6C. The screen 600 is largely divided into a search screen 601 and a bookmark display area 606. In the bookmark display area 606, bookmark display based on the bookmark data provided from the server 103 is performed, and the user can select and browse a page registered in the bookmark.

図6Aに示すごとく、サーバ103は「○×△サーチ」という名称で検索サービスを提供しており、検索画面601には、キーワード入力領域602、検索実行ボタン603、オプション604、及び設定ボタン605が表示される。キーワード入力領域602は、ユーザが検索したいキーワードの入力を受け付ける領域である。検索実行ボタン603は、入力されたキーワードについて、設定されたオプションの内容に従った検索処理をサーバ103に指示するためのボタンである。オプション604では、図6Cに示すような、ページ情報や、ユーザデータに基づく検索結果のソーティングを行うかどうかの指示をユーザから受け付ける。即ち、「利用する」が選択されると、オプションとして設定された内容を利用した検索が行われる。一方、「利用しない」が選択されると、オプションとして設定された内容は利用せずに、通常の検索処理が実行され、この検索結果がクライアント101に通知される。   As shown in FIG. 6A, the server 103 provides a search service with the name “XX search”, and the search screen 601 includes a keyword input area 602, a search execution button 603, an option 604, and a setting button 605. Is displayed. The keyword input area 602 is an area for receiving an input of a keyword that the user wants to search. The search execution button 603 is a button for instructing the server 103 to perform a search process according to the content of the set option for the input keyword. In option 604, an instruction is received from the user as to whether or not to sort search results based on page information and user data as shown in FIG. 6C. That is, when “use” is selected, a search using the contents set as an option is performed. On the other hand, when “not use” is selected, normal search processing is executed without using the content set as an option, and the search result is notified to the client 101.

図6Aの場合では、「利用する」が選択されているので、オプションの設定内容を利用した検索が行われることとなる。また、「利用する」が選択された場合には、設定ボタン605がアクティブになり、この設定ボタン605の選択を受け付けると、図6Bに示すようなユーザID入力画面が表示され、検索を行おうするユーザがユーザデータベース104に登録されているか否かの確認が行われる。この確認の後、図6Cに示すようなオプションの設定画面が表示される。一方、「利用しない」が選択された場合には、設定ボタン605はグレーアウトされ、図6B及び図6Cのような表示画面は提供されない。   In the case of FIG. 6A, since “use” is selected, a search using option setting contents is performed. When “use” is selected, the setting button 605 is activated. When the selection of the setting button 605 is accepted, a user ID input screen as shown in FIG. 6B is displayed and a search is performed. It is confirmed whether or not the user to be registered is registered in the user database 104. After this confirmation, an option setting screen as shown in FIG. 6C is displayed. On the other hand, when “not use” is selected, the setting button 605 is grayed out, and the display screens as shown in FIGS. 6B and 6C are not provided.

次に、図6Bについて説明する。図6Bは、図6Aにおいて設定ボタン605が選択された場合に、ディスプレイ207に表示される画面である。この画面は、ユーザがユーザデータベース104に登録されているか否かを確認するための画面である。
画面610において、611は、検索を行おうとするユーザから、ユーザ登録の有無に関する入力を受け付ける表示欄である。ここでは、「あり」、「なし」のいずれかが選択可能となっている。「あり」が選択された場合には、「ユーザ名」及び「パスワード」の入力を受け付ける入力欄612及び613が表示される。一方、「なし」が選択された場合には、これらの入力欄612及び613はグレーアウトされるか、全く表示されない。
Next, FIG. 6B will be described. FIG. 6B is a screen displayed on the display 207 when the setting button 605 is selected in FIG. 6A. This screen is a screen for confirming whether or not the user is registered in the user database 104.
In the screen 610, reference numeral 611 denotes a display field that accepts an input regarding the presence / absence of user registration from a user who wants to perform a search. Here, either “Yes” or “No” can be selected. When “Yes” is selected, input fields 612 and 613 for receiving input of “user name” and “password” are displayed. On the other hand, when “none” is selected, these input fields 612 and 613 are grayed out or not displayed at all.

また、614は、決定ボタンであって、入力内容を確定する場合に操作される。615はキャンセルボタンであって、ユーザが図6Aの画面に戻りたい場合に操作される。決定ボタン614が操作された際に、ユーザ登録611が「なし」の設定の場合には、サーバへのデータ送信は行わずに、画面を図6Cに切り替える。一方、ユーザ登録611が「あり」の設定で、「ユーザ名」及び「パスワード」を受け付けていれば、該受け付けたデータがサーバ103へ送信される。   Reference numeral 614 denotes a determination button, which is operated when confirming input contents. A cancel button 615 is operated when the user wants to return to the screen of FIG. 6A. If the user registration 611 is set to “none” when the enter button 614 is operated, the screen is switched to FIG. 6C without transmitting data to the server. On the other hand, if the user registration 611 is set to “Yes” and “user name” and “password” are accepted, the accepted data is transmitted to the server 103.

サーバ103では、クライアント101から受信した「ユーザ名」及び「パスワード」と一致するユーザ名403及びパスワード402をユーザデータベース104から検索する。一致する「ユーザ名」が登録されている場合には、ユーザデータベース104に登録されているユーザデータの有無及びユーザID401がサーバ103からクライアント101に通知される。クライアント101では、サーバ103からの該通知を受信すると、図6Cの画面を表示する。一方、一致する「ユーザ名」が登録されていない場合には、エラーメッセージがサーバ103からクライアント101に通知される。クライアント101では、サーバ103からの該エラーメッセージを受信すると、図6Bの画面を表示して、再度「ユーザ名」及び「パスワード」の入力を受け付ける。   The server 103 searches the user database 104 for a user name 403 and a password 402 that match the “user name” and “password” received from the client 101. If a matching “user name” is registered, the server 103 notifies the client 101 of the presence / absence of user data registered in the user database 104 and the user ID 401. Upon receiving the notification from the server 103, the client 101 displays the screen in FIG. 6C. On the other hand, if a matching “user name” is not registered, an error message is notified from the server 103 to the client 101. Upon receiving the error message from the server 103, the client 101 displays the screen of FIG. 6B and accepts input of “user name” and “password” again.

次に、図6Cについて説明する。図6Cは、図6Bにおいて決定ボタン614が選択された後に、ディスプレイ207に表示される画面である。また、この画面は、サーバ103における検索の際に利用されるオプション情報の設定、より具体的には、検索結果に含まれる各ページの重み付け値を算出するために利用する登録情報の指定を受け付けるための画面でもある。   Next, FIG. 6C will be described. FIG. 6C is a screen displayed on the display 207 after the enter button 614 is selected in FIG. 6B. In addition, this screen accepts setting of option information used in the search in the server 103, more specifically, designation of registration information used to calculate the weight value of each page included in the search result. It is also a screen for.

オプション入力画面620には、大別すると、ページ情報621、ユーザデータ622及びおまかせ623が示される。ページ情報621について設定可能な項目には、更新日時、総参照回数、直近の参照回数、増加アンカー数、ブックマーク登録数がある。これらの項目は、URLデータベース106に登録されている図4Cの更新日時425、総参照回数432、直近参照回数433、増加アンカー数434、ブックマーク登録数435の登録情報にそれぞれ対応している。よって、これらの項目のいずれかが選択された場合、対応する登録情報は、(図8と対応して後述するように)サーバ103における検索結果に含まれるページついて、表示順を決定する際に利用される。   The option input screen 620 roughly shows page information 621, user data 622, and entrusted 623. Items that can be set for the page information 621 include an update date and time, a total reference count, the latest reference count, an increased anchor count, and a bookmark registration count. These items correspond to the registration information of the update date and time 425, the total reference count 432, the latest reference count 433, the increased anchor count 434, and the bookmark registration count 435 of FIG. 4C registered in the URL database 106, respectively. Therefore, when any of these items is selected, the corresponding registration information is used when determining the display order of the pages included in the search result in the server 103 (as will be described later with reference to FIG. 8). Used.

また、ユーザデータ622について設定可能な項目には、年齢、性別、地域属性、職種、未既婚、年収、車の有無、趣味がある。これらの項目は、URLデータベース106に登録されている図4Dの総参照回数441、直近参照回数442、ブックマーク登録数443についての登録情報のうち、指定されたユーザデータに関連するものにそれぞれ対応している。   Items that can be set for the user data 622 include age, sex, regional attributes, occupation, unmarried, annual income, presence of a car, and hobbies. These items correspond to items related to the specified user data among the registered information about the total reference count 441, the latest reference count 442, and the bookmark registration count 443 in FIG. 4D registered in the URL database 106, respectively. ing.

例えば、ユーザデータ622のうち年齢が選択された場合には、図4Dにおけるユーザデータ440の年齢のうち、当該指定を行ったユーザの年齢に基づいて当該ユーザが属する世代が決定され、対応する登録情報が特定される。よって、これらの項目のいずれかが選択された場合、対応する登録情報は、(図8と対応して後述するように)サーバ103における検索結果に含まれるページついて、表示順を決定する際に利用される。   For example, when the age is selected from the user data 622, the generation to which the user belongs is determined based on the age of the user who made the designation out of the age of the user data 440 in FIG. 4D, and the corresponding registration Information is identified. Therefore, when any of these items is selected, the corresponding registration information is used when determining the display order of the pages included in the search result in the server 103 (as will be described later with reference to FIG. 8). Used.

また、おまかせ623は、ユーザ側でページ情報621やユーザデータ622の指定を行わない場合に選択できる。おまかせ623が選択された場合には、例えば、全てのオプション情報を利用して検索を行っても良いし、あるいは、特定のページ情報621とユーザデータ622とを予め設定しておき、当該設定を利用した検索を行っても良い。   The entrusting 623 can be selected when the user does not specify the page information 621 or the user data 622. When the entrusting 623 is selected, for example, the search may be performed using all option information, or specific page information 621 and user data 622 are set in advance, and the setting is performed. You may search using it.

なお、オプションにおける設定項目は、上記のものに限定されることなく、当然にこれら以外が含まれても良い。
また、図6Bに示す画面では、ページ情報621とユーザデータ622とについて設定可能な項目が表示されているが、このような表示は、ユーザデータベース104に登録され、かつ、ユーザデータ622の各設定項目について図4Aに示すようにユーザデータを漏れなく登録していなければ意味がない。
The setting items in the options are not limited to those described above, and other items may naturally be included.
In the screen shown in FIG. 6B, items that can be set for the page information 621 and the user data 622 are displayed. Such display is registered in the user database 104 and each setting of the user data 622 is set. As shown in FIG. 4A, it is meaningless if user data is not registered without omission.

例えば、ユーザによっては、ユーザデータベース104に登録されていない者もいるかもしれない。このような場合、ユーザデータ622の設定項目について設定を受け付けても、検索に利用することはできない。また、このようなユーザは、図6Bの画面において、ユーザ登録611を「なし」に設定しているはずである。そこで、係る設定内容に対応して、画面620にはページ情報621のみを表示し、ユーザデータ622はグレーアウトするのが好ましい。これによれば、ユーザデータベースに登録されていないユーザであっても、少なくともページの更新日時や直近の参照回数を利用した検索が可能となる。   For example, some users may not be registered in the user database 104. In such a case, even if a setting is received for the setting item of the user data 622, it cannot be used for the search. Such a user should have set the user registration 611 to “none” on the screen of FIG. 6B. Therefore, it is preferable that only the page information 621 is displayed on the screen 620 and the user data 622 is grayed out corresponding to the setting contents. According to this, even a user who is not registered in the user database can be searched using at least the page update date and time and the latest reference count.

また、一部のユーザデータのみを登録し、他のユーザデータは登録していない者もいるかもしれない。このような場合、登録していない項目について設定を受け付けても、検索に利用することはできない。そこで、サーバ103から受け付けたユーザデータベース104に登録されているユーザデータの有無に関する通知に基づき、ユーザデータ622の設定項目のうち、ユーザデータベース104に登録されているユーザデータに対応する項目のみを表示し、他をグレーアウトすることが好ましい。これによれば、ユーザは少なくとも自分の登録したユーザデータを用いた検索は可能となる。   Further, there may be a person who registers only part of user data and does not register other user data. In such a case, even if a setting is received for an item that is not registered, it cannot be used for a search. Therefore, only items corresponding to the user data registered in the user database 104 among the setting items of the user data 622 are displayed based on the notification regarding the presence / absence of the user data registered in the user database 104 received from the server 103. However, it is preferable to gray out the others. According to this, a user can perform a search using at least user data registered by the user.

ユーザはオプション入力を終了すると、決定ボタン624により入力したオプションの内容を確定することができる。決定ボタン624が選択されると、検索画面601は図6Aに示す内容に戻る。また、キャンセルボタン625を選択した場合は、図6Aの画面に戻る。その際、オプションの設定内容はリセットされても良いし、それまでの入力内容を保持したままでも良い。   When the user finishes option input, the user can confirm the contents of the option input by the enter button 624. When the determination button 624 is selected, the search screen 601 returns to the contents shown in FIG. 6A. If the cancel button 625 is selected, the screen returns to the screen of FIG. 6A. At that time, the option setting contents may be reset, or the input contents so far may be retained.

<検索処理その2(検索処理)>
次に、実際に検索を実行する際の処理の流れについて、図7のフローチャートを参照して説明する。
<Search process 2 (search process)>
Next, the flow of processing when actually executing a search will be described with reference to the flowchart of FIG.

まず、クライアント101において、サーバ103が提供する検索サービスのページのURLが選択されると(ステップS751において「YES」)、クライアント101からサーバ103に対して、検索画面情報の要求が通知される(701)。サーバ103では、クライアント101からの検索画面情報の要求に応じて、クライアント101において後述する検索情報を生成するための検索情報生成情報としての検索画面情報を送信する(702)。クライアント101は、サーバ103から検索画面情報を受信すると、ディスプレイ207上に図6Aの検索画面601に示すような検索画面を表示する(ステップS752)。   First, when the URL of the page of the search service provided by the server 103 is selected in the client 101 (“YES” in step S751), the client 101 notifies the server 103 of a request for search screen information ( 701). In response to the request for search screen information from the client 101, the server 103 transmits search screen information as search information generation information for generating search information described later in the client 101 (702). Upon receiving the search screen information from the server 103, the client 101 displays a search screen as shown in the search screen 601 in FIG. 6A on the display 207 (step S752).

次に、ユーザからキーワードやオプション設定をするか否かなどの入力を受け付け(ステップS753)、オプション設定がなされる場合には図6Bの画面を表示して、ユーザ登録ありと設定されたか否かを判定する(ステップS754)。もし、オプション設定がなされない場合には、以下のステップS753からS756をスキップしてステップS757へ移行する。   Next, an input such as whether or not to set a keyword or an option is received from the user (step S753). When option setting is performed, the screen of FIG. 6B is displayed to determine whether or not user registration is set. Is determined (step S754). If option setting is not made, the following steps S753 to S756 are skipped and the process proceeds to step S757.

図6Bに表示する画面において、ユーザ登録611が「なし」と設定された場合には、「ユーザ登録あり」と設定されたこととならないので(ステップS754において「NO」)、ステップS756に移行する。一方、ユーザ登録611が「あり」と設定され、入力欄612及び613に「ユーザ名」及び「パスワード」が入力された場合には、「ユーザ登録あり」と設定されたこととなる(ステップS754において「YES」)ので、これらの入力情報をユーザ認証用情報としてサーバ103に送信する(703)。   When the user registration 611 is set to “none” on the screen displayed in FIG. 6B, “user registration is not present” is not set (“NO” in step S754), and the process proceeds to step S756. . On the other hand, when the user registration 611 is set as “present” and “user name” and “password” are input in the input fields 612 and 613, “user registration is present” is set (step S754). Therefore, the input information is transmitted to the server 103 as user authentication information (703).

サーバ103では、クライアントから送信された「ユーザ名」及び「パスワード」を含むユーザ認証用情報を利用してユーザ認証、即ち、該ユーザがユーザデータベース104に登録されているユーザであるかを検証する(ステップS755)。検証の結果、該ユーザが登録されている場合には、該ユーザについて、ユーザID401とユーザデータベース104に登録されているユーザデータの有無に関する情報とを含むユーザ認証結果がクライアント101へ送信される(704)。また、該ユーザが登録されていない場合には、エラーメッセージを含むユーザ認証結果がクライアント101へ送信される(704)。   The server 103 uses the user authentication information including the “user name” and “password” transmitted from the client to verify user authentication, that is, whether the user is a user registered in the user database 104. (Step S755). If the user is registered as a result of the verification, a user authentication result including the user ID 401 and information on the presence / absence of user data registered in the user database 104 is transmitted to the client 101 for the user ( 704). If the user is not registered, a user authentication result including an error message is transmitted to the client 101 (704).

次に、ステップS756では、図6Cに示すようなオプション入力画面を表示して、オプション入力を受け付ける。続いて、検索実行ボタン603の選択による検索実行指示を受け付ける(ステップS757)。検索実行ボタン603が選択されると、サーバ103に対して、ステップS753及びS756で入力を受け付けたキーワードやオプション設定の内容と、ユーザ認証結果(704)を受信している場合には、そこに含まれていたユーザID401とを含む検索情報を送信する(705)。ここで、検索を行おうとするユーザが未登録ユーザの場合には、未登録であることを示す所定のコードをユーザID401の代わりに検索情報に含めて送信しても良い。   Next, in step S756, an option input screen as shown in FIG. 6C is displayed and option input is accepted. Subsequently, a search execution instruction by selection of the search execution button 603 is accepted (step S757). When the search execution button 603 is selected, if the server 103 has received the keyword and the option setting content received in steps S753 and S756 and the user authentication result (704), the search is performed there. Search information including the included user ID 401 is transmitted (705). Here, when the user who performs the search is an unregistered user, a predetermined code indicating that the user is not registered may be included in the search information instead of the user ID 401 and transmitted.

サーバ103では、クライアント101から送信された検索情報を受信すると、キーワードに基づいて検索処理を行い、オプション設定の内容に基づいて検索結果を作成し(ステップS758)、検索結果をクライアント101へ送信する(706)。クライアント101は、サーバ103から検索結果を受信すると、受信した検索結果をディスプレイ207の検索画面601に表示する(ステップS759)。   Upon receiving the search information transmitted from the client 101, the server 103 performs a search process based on the keyword, creates a search result based on the contents of the option setting (step S758), and transmits the search result to the client 101. (706). Upon receiving the search result from the server 103, the client 101 displays the received search result on the search screen 601 of the display 207 (step S759).

その後、ユーザからの入力に従って検索を再度実行する場合は、ステップS751からの処理を再開する。もし、ユーザがWebブラウザの閲覧を終了する場合には(ステップS760で「YES」)、クライアント101からサーバ103に対して終了通知が送信され(707)、サーバ103からは終了応答が返される(708)。   Thereafter, when the search is executed again according to the input from the user, the processing from step S751 is resumed. If the user ends browsing of the Web browser (“YES” in step S760), an end notification is transmitted from the client 101 to the server 103 (707), and an end response is returned from the server 103 ( 708).

次に、図8を参照して、図7のステップS758における処理の詳細を説明する。図8は、サーバ103における検索処理の一例に対応するフローチャートである。   Next, details of the process in step S758 of FIG. 7 will be described with reference to FIG. FIG. 8 is a flowchart corresponding to an example of search processing in the server 103.

まず、ステップS801において、サーバ103は、クライアント101から送信された検索情報を受信すると共に、受信した検索情報の中から、検索を依頼したユーザ(検索依頼ユーザ)のユーザID401を抽出する。次に、ステップS802において、抽出されたユーザID401に基づいて、ユーザデータベース104からユーザデータを取得する。
なお、検索依頼ユーザがユーザデータベース104に未登録であった場合には、未登録ユーザを示すコードは含まれていても、ユーザID401は検索情報に含まれていない。また、ユーザデータベース104に本来は登録されているユーザであっても、図6Aにおいてオプション設定604を「利用しない」に設定した場合には、図7のユーザ認証結果(704)を受信しないので、検索情報にユーザID401が含まれていない。これらのユーザについては、ユーザデータの取得は当然に行われない。
次に、ステップS803において、検索情報に含まれるキーワードに基づいて公知の手法で検索用データベース107を検索し、ステップS804においてキーワードに基づく検索条件に合致するデータを検索結果1として取得する。この検索結果1は、検索処理によって得られた検索結果であって、ユーザデータ(即ち、検索依頼ユーザの職業や年齢など)や、ページの情報(更新日時や、参照回数等)とは無関係に、専らページ内に指定されたキーワードや当該キーワードに類似する語をどれだけ含むか、といった基準によりキーワードとの関連の度合いを決定し、その関連性の順にページを並べたものとして得られる。
First, in step S801, the server 103 receives the search information transmitted from the client 101, and extracts the user ID 401 of the user who requested the search (search request user) from the received search information. Next, in step S802, user data is acquired from the user database 104 based on the extracted user ID 401.
If the search requesting user is not registered in the user database 104, the user ID 401 is not included in the search information even though a code indicating the unregistered user is included. Further, even if the user is originally registered in the user database 104, if the option setting 604 in FIG. 6A is set to “not use”, the user authentication result (704) in FIG. 7 is not received. The search information does not include the user ID 401. For these users, acquisition of user data is naturally not performed.
Next, in step S803, the search database 107 is searched by a known method based on the keyword included in the search information. In step S804, data matching the search condition based on the keyword is acquired as the search result 1. This search result 1 is a search result obtained by the search process, regardless of the user data (that is, the occupation or age of the search requesting user) and the page information (update date and time, reference count, etc.). The degree of association with the keyword is determined based on the criteria such as the keyword specified in the page or how many words are similar to the keyword, and the pages are arranged in the order of the association.

ステップS805では、検索情報に基づいて、検索依頼ユーザのオプション設定604の内容を識別する。もし、オプション設定604においてオプションを「利用しない」と設定されていた場合には、ステップS816に移行して検索結果1をクライアント101へ送信する。一方、「利用する」と設定されていた場合には、ステップS806へ移行して、検索結果1の順位に基づいて各ページのポイントPsを算出する。例えば、検索結果1に100件のページが含まれていたとすると、その順位に基づいて頭からポイントを100、99、98・・・1のように付加することができる。また、上位10件のみに100、90、80・・10のポイントをそれぞれ与えても良い。いずれにしても、検索結果1の順位に基づく重み付けを、Psとして検索結果1に含まれる各ページについて与える。   In step S805, the contents of the option setting 604 of the search requesting user are identified based on the search information. If the option is set to “not use” in the option setting 604, the process proceeds to step S816, and the search result 1 is transmitted to the client 101. On the other hand, if “use” is set, the process proceeds to step S806, and the point Ps of each page is calculated based on the rank of the search result 1. For example, if 100 pages are included in the search result 1, points from the head can be added as 100, 99, 98... 1 based on the ranking. In addition, points of 100, 90, 80... 10 may be given to only the top 10 cases. In any case, a weight based on the rank of the search result 1 is given to each page included in the search result 1 as Ps.

次に、ステップS807では検索結果1に含まれるページの順位をNuとして、Nuを1に設定する。次に、ステップS808において、検索結果1における順位がNu番目のページを選択し、当該ページのURLに基づいて、当該ページについてURLデータベース106に情報が登録されていれば、該登録されている登録情報を全て取得する。次に、ステップS809において、検索情報において設定されたオプション設定の内容と、ステップS802において取得されているユーザデータがある場合には当該ユーザデータとに基づいて、取得した登録情報の中から、当該ページの重み付けに利用する登録情報を絞り込む。   In step S807, the order of pages included in the search result 1 is set to Nu, and Nu is set to 1. Next, in step S808, if a page with the Nu rank in the search result 1 is selected and information is registered in the URL database 106 for the page based on the URL of the page, the registered registration is performed. Get all the information. Next, in step S809, based on the contents of the option setting set in the search information and the user data acquired in step S802, based on the user data, the registration information acquired Narrow down the registration information used for page weighting.

例えば、図6Cの場合、ページ情報621は「直近の参照回数」のみが選択されており、ユーザデータ622については「年齢」と「職種」が選択されている。よって、図4C及び図4Dに示す登録情報のうち、直近参照回数433と、検索依頼ユーザの年齢及び職種に対応した総参照回数441、直近参照回数442、ブックマーク登録数443が選択され、これらの登録情報のみに絞り込みが行われる。   For example, in the case of FIG. 6C, only “recent reference count” is selected as the page information 621, and “age” and “job type” are selected as the user data 622. 4C and 4D, the most recent reference count 433, the total reference count 441, the most recent reference count 442, and the bookmark registration count 443 corresponding to the age and job type of the search requesting user are selected. Only the registration information is narrowed down.

ここでは図4C及び図4Dに記載された登録情報をそれぞれ利用して絞り込みを行う場合を説明したが、どの登録情報を利用するかは、オプション設定の内容に基づいて決定されるため、図4C又は図4Dの一方のみを利用して絞り込みを行うことも当然に可能である。   Here, a case has been described in which the registration information described in FIGS. 4C and 4D is used for narrowing down, but since which registration information is used is determined based on the contents of the option setting, FIG. Alternatively, it is naturally possible to perform the narrowing down using only one of FIGS.

なお、ステップS808及びステップS809においては、一旦登録情報を全て読み出し、その後で絞り込みをかけているが、これは一例として説明しただけである。即ち、検索情報において設定されたオプション設定の内容と、ユーザデータとに基づいて直接対応する登録情報をURLデータベース106から取得するようにしても良い。   In step S808 and step S809, all registration information is once read and then narrowed down, but this is only described as an example. In other words, the corresponding registration information may be acquired directly from the URL database 106 based on the contents of the option settings set in the search information and the user data.

次に、ステップS810では、絞り込まれた登録情報をPr、重み付け値をPwとして、登録情報に基づくポイント:Puを算出する(Pu=Pr×Pw)。
ここで、当該ページ自体がURLデータベース106に登録されていなかった場合や、当該ページ自体は登録されているものの、絞り込まれた登録情報に対応する情報が登録されていなかった場合(例えば、該ページには特定の趣味以外の人はアクセスしない場合もあり得る。)には、Pr=0として計算する。本発明では、このポイントPuを利用することで、当該ページと検索依頼ユーザとの関連性や、当該ページの情報の有用性を検索結果に反映させることが可能となる。即ち、総参照回数441や直近参照回数442、ブックマーク登録数443を利用することで、検索依頼ユーザと同種の職業を選択した他のユーザが数多く参照しているページや、ブックマークに登録しているページを検索結果の上位にランクさせることが可能となる。また、総参照回数432、直近参照回数433、増加アンカー数434、ブックマーク登録数435を利用することで、ユーザの職業や、趣味といった枠を越えて、幅広くユーザに支持されているページや、アンカーを増やして積極的に情報を更新しているページを検索結果の上位にランクさせることが可能となる。
Next, in step S810, the narrowed registration information is Pr and the weighting value is Pw, and a point based on the registration information: Pu is calculated (Pu = Pr × Pw).
Here, when the page itself is not registered in the URL database 106, or when the page itself is registered, but information corresponding to the narrowed registration information is not registered (for example, the page May be accessed by a person other than a specific hobby). In the present invention, by using this point Pu, it is possible to reflect the relevance between the page and the search requesting user and the usefulness of the information on the page in the search result. That is, by using the total reference count 441, the latest reference count 442, and the bookmark registration count 443, it is registered in a page or bookmark that many other users who have selected the same type of occupation as the search requesting user refer to. The page can be ranked higher in the search result. In addition, by using the total reference count 432, the latest reference count 433, the increased anchor count 434, and the bookmark registration count 435, pages and anchors that are widely supported by the user beyond the user's occupation and hobbies. It is possible to rank pages that are actively updating information by increasing the number of search results.

ここで、Prは総参照回数など、カウントされた数値情報である場合にはそのまま数値として利用することができる。しかし、更新日時425のように、数値として直接には使えない情報については、現在の日時からの差分を求め、さらにその逆数を求めることにより、Pr値とすることができる。いずれにしても、現在の日時に近くなるほどPrの値が大きくなるように変換できればよい。また、重み付け値Pwについては、全ての登録情報について均一に与えられても良いし、特定の登録情報についてより高い値が与えられても良い。例えば、同じ総参照回数にしても、総参照回数441の重み付け値Pwを100とし、総参照回数432の重み付け値を10とする、といった方法もある。また、更新日時425のように、直接Pr値として用いることができない登録情報については、他の登録情報とは異なる重み付け値を用意しても良い。   Here, Pr can be used as a numerical value as it is when it is counted numerical information such as the total number of times of reference. However, for information that cannot be directly used as a numerical value, such as the update date and time 425, the Pr value can be obtained by obtaining a difference from the current date and time, and further obtaining the reciprocal thereof. In any case, it suffices if conversion can be performed so that the value of Pr becomes larger as it approaches the current date and time. In addition, the weighting value Pw may be given uniformly for all registration information, or a higher value may be given for specific registration information. For example, there is a method in which the weighting value Pw of the total reference count 441 is set to 100 and the weighting value of the total reference count 432 is set to 10 even with the same total reference count. For registration information that cannot be directly used as a Pr value, such as the update date and time 425, a weighting value different from other registration information may be prepared.

次に、ステップS811では、ステップS810において算出された各登録情報についてのポイントPuを合計してPustを算出する。このポイントPustが登録情報に基づいて各ページに与えられた重み付けとなる。   Next, in step S811, the point Pu for each piece of registration information calculated in step S810 is summed to calculate a paste. This point Post is a weight given to each page based on the registration information.

ステップS812では、全てのページについてPustが算出されたかどうかが判定され、残っているページがある場合(ステップS812において「NO」)にはNuをインクリメントしてステップS808に戻りポイントPustの算出のための処理を継続する。一方、全てのページについてPustが算出された場合(ステップS812において「YES」)には、ステップS814に移行して各ページ毎に、検索結果2を決定するためのポイント:PuallをPuall=Ps+Pustにより算出する。これにより、検索結果と検索依頼ユーザのオプション設定内容との両方を反映した検索結果を得ることができる。尚、本実施形態ではPsとPustを単純に足し合わせる場合を記載したが、ここで更に重み付けを行って、例えばPuall=Ps+Pust・N(Nは所定数)としても良い。このようにすれば、ユーザのオプション設定の内容が生成される検索結果に更に反映されることとなる。また、検索結果1の順位を全く考慮しなくても良い。この場合は、ステップS806におけるPsの算出工程と、本工程とがスキップされ、Puall=Pustとなる。   In step S812, it is determined whether or not the paste has been calculated for all pages. If there is a remaining page (“NO” in step S812), Nu is incremented and the process returns to step S808 to calculate the point Past. Continue processing. On the other hand, if the paste is calculated for all pages (“YES” in step S812), the process proceeds to step S814, and the point for determining the search result 2 for each page: Puall is Puall = Ps + Pust. calculate. Thereby, it is possible to obtain a search result reflecting both the search result and the option setting contents of the search requesting user. In this embodiment, the case where Ps and Past are simply added is described. However, further weighting may be performed here, for example, Puall = Ps + Pust · N (N is a predetermined number). In this way, the contents of the user option settings are further reflected in the generated search results. Further, the ranking of the search result 1 may not be considered at all. In this case, the process of calculating Ps in step S806 and this process are skipped, and Puall = Pust.

次にステップS815では、ステップS814において算出されたPuallの値に基づいてPuallが大きい順にページの順位を決定し、検索結果1の並び順をソートして検索結果2を作成する。ステップS816では、検索結果2(ステップS805から直接移行してきた場合は検索結果1)をクライアント101へ送信する。   Next, in step S815, the order of pages is determined in descending order based on the value of Pull calculated in step S814, and the search result 2 is created by sorting the order of the search results 1. In step S816, search result 2 (search result 1 if directly transferred from step S805) is transmitted to the client 101.

以上のように、本実施形態に対応するサーバ103では、検索依頼ユーザのユーザデータやページの内容以外の情報に基づいて検索処理を行い、検索結果を作成することができる。   As described above, the server 103 corresponding to the present embodiment can perform a search process based on information other than the user data of the search requesting user and the contents of the page, and create a search result.

より具体的には、職業、年齢、趣味といったユーザ個人の情報を独立した項目として取り扱い、項目の共通するユーザの統計的情報(例えば、10代のユーザの総参照回数や、ゴルフを趣味とするユーザの直近の参照回数など)を利用して、検索依頼ユーザに提供する価値のある検索結果を作成することができる。   More specifically, user's personal information such as occupation, age, and hobby is handled as an independent item, and statistical information of users with common items (for example, the total number of reference of teenage users and golf as a hobby) It is possible to create a search result worth providing to the search requesting user using the user's most recent reference count).

また、検索に際しては、利用するユーザデータをオプション設定604によりユーザが予め指定することができる。これにより、積極的に利用すべきユーザデータの絞り込みをユーザ自らが行うこととなり、ユーザが本来意図したキーワードと関連性の高いページを高い確率で絞り込むことが可能となる。   In searching, user data to be used can be designated in advance by option setting 604. As a result, the user himself / herself narrows down user data that should be actively used, and it is possible to narrow down pages that are highly relevant to the keyword originally intended by the user with a high probability.

例えば、趣味が「ゴルフ」で、職種が「コンピュータプログラマ」であるようなユーザが、キーワードとして「ドライバー」を入力した場合、ユーザが「趣味」と「職種」のどちらを優先的に扱うかを指定しなければ、ゴルフにおける「ドライバー」に関連するページと、コンピュータプログラムに関連する「ドライバー」に関連するページとが混合して検索結果に含まれることとなる。しかし、ユーザが予めオプション設定604において「趣味」を選択していれば、「職種」に関連するページは重み付けの対象から除外されるので、ゴルフにおける「ドライバー」と関連するページが確実に検索結果の上位にランクされるようになる。   For example, when a user whose hobby is “golf” and whose occupation is “computer programmer” inputs “driver” as a keyword, the user decides whether to treat “hobby” or “profession” preferentially. If not specified, a page related to “driver” in golf and a page related to “driver” related to the computer program are mixed and included in the search result. However, if the user has previously selected “hobby” in the option setting 604, the page related to “job type” is excluded from the weighting target, so that the page related to “driver” in golf is surely retrieved. Will be ranked higher.

また、本実施形態では、直近参照回数に基づいてページに重み付けを行っているので、最近立ち上げられたばかりで総参照回数はあまり大きくないページであっても、人気のあるページであれば、当然に直近の参照回数が大きくなり、他のページよりもポイント(Pu)が高くなる。従って、このようなページが検索結果の上位にランクされるようになる。また、リンク切れしているページがあっても、そのようなページは、直近参照回数が伸びないのが通常であるから、この直近参照回数を利用することで、検索結果から除外することが可能となる。   Further, in this embodiment, the pages are weighted based on the most recent reference count. Therefore, even if the page has just been recently launched and the total reference count is not so large, it is of course necessary if the page is a popular page. The number of the latest references increases, and the point (Pu) becomes higher than other pages. Accordingly, such a page is ranked higher in the search results. Also, even if there is a page with a broken link, such a page usually does not increase in the number of the latest references, so it is possible to exclude it from the search results by using this latest number of references. It becomes.

更に、増加アンカー数を利用すれば、ブログ(ウェブログ)等において、積極的に情報を収集し、公開しているようなページを検索結果の上位にランクすることが可能となる。   Furthermore, if the increased number of anchors is used, it is possible to actively collect information on a blog (web log) or the like, and rank a page that is open to the top of the search results.

[その他の実施形態]
以上の処理(例えば上記図5、図7又は図8に示したフローチャートに従った処理等)をプログラムとしてCD−R、ROMやDVD−ROM、MO等の記憶媒体に記憶させ、この記憶媒体に記憶されているプログラムをコンピュータに読み込ませる(インストール、もしくはコピーさせる)、或いは、ネットワークを介して所定のサーバからダウンロードすることで、このコンピュータは以上の処理を行うことができる。よって、この記憶媒体も本発明の範疇にあることは明白である。本発明は上記実施の形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために、以下の請求項を添付する。
[Other embodiments]
The above processing (for example, processing according to the flowchart shown in FIG. 5, FIG. 7 or FIG. 8 above) is stored as a program in a storage medium such as a CD-R, ROM, DVD-ROM, or MO, and is stored in this storage medium. The computer can perform the above processing by causing the computer to read (install or copy) the stored program or to download the program from a predetermined server via a network. Therefore, it is obvious that this storage medium is also within the scope of the present invention. The present invention is not limited to the above-described embodiments, and various changes and modifications can be made without departing from the spirit and scope of the present invention. Therefore, in order to make the scope of the present invention public, the following claims are attached.

Claims (7)

クライアント端末から入力された検索情報に基づいてインターネット上のWebページの情報を検索し、検索結果を前記クライアント端末に送信する情報検索装置であって、
Webページに関する登録情報を格納する登録情報格納手段と、
前記クライアント端末から前記検索情報を受信する受信手段と、
前記検索情報に含まれるキーワードに関連するWebページを検索用情報から検索し、第1の検索結果を生成する第1の検索結果生成手段と、
前記クライアント端末のユーザに固有のデータであって、対応するユーザについて、少なくとも、年齢、性別、地域属性、職種、未既婚、住居形態、年収、車の所有、及び、趣味のいずれかの種別に関する情報を含むユーザデータを、ユーザ毎に格納するユーザデータ格納手段と、
前記検索情報から、前記ユーザを特定するための識別情報を抽出する抽出手段と、
前記ユーザデータ格納手段に格納されたユーザデータのうち、前記識別情報に対応する第1のユーザデータを取得するユーザデータ取得手段と、
前記登録情報格納手段に格納された、前記第1の検索結果に含まれるWebページに関する登録情報から、前記検索情報に含まれる前記登録情報の利用の有無に関する設定情報と、前記第1のユーザデータとを利用して第1の登録情報を選択する選択手段と、
前記第1の登録情報に基づいて、前記第1の検索結果に含まれるWebページの重み付け値を、該Webページ毎に算出する算出手段と、
Webページ毎に算出された前記重み付け値に基づき、前記第1の検索結果に含まれるWebページの順位を決定する順位決定手段と、
決定された前記順位により前記第1の検索結果に含まれるWebページをソートして第2の検索結果を生成する第2の検索結果生成手段と、
前記第2の検索結果を前記クライアント端末に送信する送信手段と
を備え、
前記登録情報には、前記Webページについて、少なくとも、複数のユーザにより参照された回数の前記ユーザデータの種別毎の総計、直近の所定期間内に複数のユーザにより参照された回数の前記ユーザデータの種別毎の合計、該Webページをブックマークに登録している前記ユーザデータの種別毎のユーザ数のいずれかが含まれ、
前記設定情報は、前記重み付け値を算出するために利用する前記登録情報を指定する情報であって、
前記選択手段は、前記設定情報において指定された前記登録情報のうち、少なくとも前記第1のユーザデータに含まれる各種別に関する情報に対応する登録情報を、前記第1の登録情報として選択することを特徴とする情報検索装置。
An information search device that searches information on a Web page on the Internet based on search information input from a client terminal, and transmits a search result to the client terminal.
Registration information storage means for storing registration information relating to a web page;
Receiving means for receiving the search information from the client terminal;
First search result generating means for searching a Web page related to a keyword included in the search information from search information and generating a first search result;
It is data specific to the user of the client terminal, and for the corresponding user, at least regarding age, gender, regional attribute, occupation, unmarried, dwelling form, annual income, car ownership, and hobby User data storage means for storing user data including information for each user;
Extraction means for extracting identification information for identifying the user from the search information;
Among user data stored in the user data storage means, user data acquisition means for acquiring first user data corresponding to the identification information;
From the registration information regarding the Web page included in the first search result stored in the registration information storage means, setting information regarding whether to use the registration information included in the search information, and the first user data Selecting means for selecting the first registration information using
Calculation means for calculating, for each Web page, a weighting value of the Web page included in the first search result based on the first registration information;
Rank determining means for determining the rank of the Web page included in the first search result based on the weighting value calculated for each Web page;
Second search result generation means for generating a second search result by sorting Web pages included in the first search result according to the determined order;
Transmission means for transmitting the second search result to the client terminal,
Wherein the registration information for the Web page, at least, the sum of each of the user data of the number of times referenced by the plurality of user type, the user data of the number of times referenced by a plurality of users within a latest predetermined period the total for each type, one of the number of users of each type of the user data that has registered the Web page in the bookmark is included,
The setting information is information for specifying the registration information used for calculating the weighting value,
The selecting means selects, as the first registration information, registration information corresponding to at least information relating to each type included in the first user data among the registration information specified in the setting information. A characteristic information retrieval device.
前記登録情報には、前記Webページについて、少なくとも、複数のユーザにより参照された回数の総計、直近の所定期間内に複数のユーザにより参照された回数の合計、該Webページをブックマークに登録しているユーザ数、直近の所定期間内に追加されたアンカー数のいずれかが更に含まれ
ることを特徴とする請求項1に記載の情報検索装置。
The registration information includes at least the total number of times the Web page has been referred to by a plurality of users, the total number of times the Web pages have been referred to within a predetermined period, and the Web page registered in a bookmark. The information search apparatus according to claim 1, further comprising any one of the number of existing users and the number of anchors added within a most recent predetermined period.
前記算出手段は、前記第1の検索結果に含まれるWebページの該第1の検索結果における順位に更に基づいて、前記重み付けを算出することを特徴とする請求項1または2に記載の情報検索装置。  3. The information search according to claim 1, wherein the calculation unit calculates the weight based further on a rank of the Web page included in the first search result in the first search result. apparatus. 前記設定情報に、前記重み付けを算出するために利用する前記登録情報の指定が無かった場合には、前記選択手段は前記第1の登録情報を選択せず、
前記送信手段は、前記第1の検索結果を前記クライアント端末へ送信することを特徴とする請求項1乃至3のいずれか1項に記載の情報検索装置。
When the setting information does not specify the registration information used to calculate the weight, the selection unit does not select the first registration information,
4. The information search apparatus according to claim 1, wherein the transmission unit transmits the first search result to the client terminal. 5.
前記クライアント端末へ、前記検索情報を生成するための検索情報生成情報を送信する生成情報送信手段を更に備え、
前記クライアント端末では、前記検索情報生成情報を利用して前記キーワードの入力と、前記登録情報の利用の有無に関する設定入力とが受け付けられることを特徴とする請求項1乃至4のいずれか1項に記載の情報検索装置。
Further comprising generation information transmission means for transmitting search information generation information for generating the search information to the client terminal;
The said client terminal receives the input of the said keyword using the said search information production | generation information, and the setting input regarding the presence or absence of the utilization of the said registration information, The any one of Claim 1 thru | or 4 characterized by the above-mentioned. The information retrieval device described.
コンピュータを、請求項1乃至5のいずれか1項に記載の情報検索装置として機能させるためのコンピュータプログラム。  A computer program for causing a computer to function as the information search device according to any one of claims 1 to 5. 請求項6に記載のコンピュータプログラムを格納したコンピュータで読み取り可能な記憶媒体。  A computer-readable storage medium storing the computer program according to claim 6.
JP2007506942A 2005-03-07 2005-03-07 Information retrieval apparatus, computer program, and storage medium Active JP4527770B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2005/003928 WO2006095409A1 (en) 2005-03-07 2005-03-07 Information retrieving device, computer program, and recording medium

Publications (2)

Publication Number Publication Date
JPWO2006095409A1 JPWO2006095409A1 (en) 2008-08-14
JP4527770B2 true JP4527770B2 (en) 2010-08-18

Family

ID=36953020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007506942A Active JP4527770B2 (en) 2005-03-07 2005-03-07 Information retrieval apparatus, computer program, and storage medium

Country Status (2)

Country Link
JP (1) JP4527770B2 (en)
WO (1) WO2006095409A1 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4648455B2 (en) * 2005-05-06 2011-03-09 エヌエイチエヌ コーポレーション Personalized search method and personalized search system
US20080010252A1 (en) * 2006-01-09 2008-01-10 Google, Inc. Bookmarks and ranking
US20080104042A1 (en) * 2006-10-25 2008-05-01 Microsoft Corporation Personalized Search Using Macros
JP2009003520A (en) * 2007-06-19 2009-01-08 Mic 9 Co Ltd Database server device, method of providing search service, and related method
JP5014252B2 (en) * 2008-05-20 2012-08-29 ヤフー株式会社 Method, server, and program for managing index data for searching content

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032401A (en) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp Method and device for document retrieval and computer- readable recording medium with recorded program making computer actualize method for document retrieving
JP2002215671A (en) * 2001-01-16 2002-08-02 Nippon Hoso Kyokai <Nhk> Information retrieval device and information retrieval method
JP2002351916A (en) * 2001-05-30 2002-12-06 Bevoid Corporation Ltd Device and method for retrieving web information and program making computer execute this method
JP2003281179A (en) * 2002-03-22 2003-10-03 Hitachi Information Systems Ltd Retrieval site server device, retrieval information display control method, program and recording medium

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4011906B2 (en) * 2001-12-13 2007-11-21 富士通株式会社 Profile information search method, program, recording medium, and apparatus

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032401A (en) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp Method and device for document retrieval and computer- readable recording medium with recorded program making computer actualize method for document retrieving
JP2002215671A (en) * 2001-01-16 2002-08-02 Nippon Hoso Kyokai <Nhk> Information retrieval device and information retrieval method
JP2002351916A (en) * 2001-05-30 2002-12-06 Bevoid Corporation Ltd Device and method for retrieving web information and program making computer execute this method
JP2003281179A (en) * 2002-03-22 2003-10-03 Hitachi Information Systems Ltd Retrieval site server device, retrieval information display control method, program and recording medium

Also Published As

Publication number Publication date
WO2006095409A1 (en) 2006-09-14
JPWO2006095409A1 (en) 2008-08-14

Similar Documents

Publication Publication Date Title
US20210026811A1 (en) Generating file usage information
US6865568B2 (en) Method, apparatus, and computer-readable medium for searching and navigating a document database
KR101130420B1 (en) System and method for a unified and blended search
EP2894579B1 (en) A system and a method for presenting multiple sets of search results for a single query
JP2008513881A (en) Method, system, and computer program product for searching personal web documents, navigating between documents, and ranking documents
US20070157100A1 (en) System and method for organization and retrieval of files
AU2020221062B2 (en) Generating and provisioning of additional content for source perspective(s) of a document
US20090204589A1 (en) Document management apparatus, method, system, medium storing a program thereof
JP4527770B2 (en) Information retrieval apparatus, computer program, and storage medium
JP2003281179A (en) Retrieval site server device, retrieval information display control method, program and recording medium
JP2011203964A (en) Document management system and method
US8244704B2 (en) Recording medium recording object contents search support program, object contents search support method, and object contents search support apparatus
JP2009265754A (en) Information providing system, information providing method, and information providing program
JP4344596B2 (en) Content search system, content search program, and recording medium
JP4445849B2 (en) File search method, file search device, and file search program
CN110235121B (en) System and method for enhanced online research
WO2020179537A1 (en) Labeling support method, labeling support device, and program
JP4571648B2 (en) WEB information providing apparatus, method thereof, and program
US20090083259A1 (en) Information providing system, information providing method and information providing record medium
JP2009093554A (en) Search support method, search support system, application server, and search support program
JP4528202B2 (en) File search method, file search device, and file search program
JP2018169770A (en) Information management system, information management method and information management program
JP2006127029A (en) Document retrieval system, program, and recording medium
JP2002041524A (en) System and method for document retrieval
JP2007249551A (en) Information management method, program, information management device

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100517

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100603

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4527770

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160611

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250