JP4527770B2 - Information retrieval apparatus, computer program, and storage medium - Google Patents
Information retrieval apparatus, computer program, and storage medium Download PDFInfo
- Publication number
- JP4527770B2 JP4527770B2 JP2007506942A JP2007506942A JP4527770B2 JP 4527770 B2 JP4527770 B2 JP 4527770B2 JP 2007506942 A JP2007506942 A JP 2007506942A JP 2007506942 A JP2007506942 A JP 2007506942A JP 4527770 B2 JP4527770 B2 JP 4527770B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- search
- user
- search result
- user data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Description
本発明は、ユーザから入力されたキーワードに基づいてインターネット上のWEBサイトを検索する情報検索装置、情報検索方法及びその方法をコンピュータに実行させるプログラムに関する。 The present invention relates to an information search apparatus, an information search method, and a program for causing a computer to execute the method for searching a WEB site on the Internet based on a keyword input by a user.
ユーザの検索指示によりインターネット上のWEBサイト(WEBページ)を全文検索する検索エンジンとしては、ロボット型検索エンジンやディレクトリ型検索エンジンが従来から一般的に知られている。 Conventionally known robotic search engines and directory type search engines are known as search engines for full-text search of WEB sites (WEB pages) on the Internet according to user search instructions.
ロボット型検索エンジンは、検索したい情報に関連するキーワードを指定すると、WEBロボットやスパイダーと呼ばれる WWW探索プログラムを用いて,インターネット上で見つけることのできる全WWWサーバ上の情報を定期的に収集し、その情報の索引付けを自動的に行うものである。このロボット型検索エンジンは,コンピュータによって自動的に全世界のWEBサイトのデータを収集しているため、情報量が多いという利点を有している。 When a keyword related to information to be searched is specified, the robot-type search engine periodically collects information on all WWW servers that can be found on the Internet using a WWW search program called a WEB robot or spider. The information is automatically indexed. Since this robot type search engine automatically collects data of WEB sites all over the world by a computer, it has an advantage of a large amount of information.
ディレクトリ型検索エンジンは、作業者が予めWEBサイトのURL(Uniform Resource Locator)を、芸術、ビジネス、教育等のように分野別に人為的に分類しておき、ユーザは分野別にキーワードを指定して検索するものである。このディレクトリ型検索エンジンでは情報を分野別に分類しているので、ユーザは職業別電話帳のような使い方ができ、分野を決めてから探す場合に便利であるという利点を有している。 The directory-type search engine allows the operator to categorize the URL (Uniform Resource Locator) of the WEB site in advance, such as art, business, education, etc., and the user can search by specifying keywords for each field. To do. Since this directory type search engine classifies information by field, the user can use it like an occupational telephone book, and has the advantage that it is convenient when searching after determining a field.
しかしながら、このような従来の検索エンジンには次のような問題がある。ロボット型検索エンジンの場合には、収集した情報量が多いという利点をもつ反面、検索ロボットは収集したWEBサイト情報に出てくる単語から単純に索引付けを行うため、キーワード検索した場合にWEBサイトが何万件と出てしまう場合が多い。このため、ユーザとは本来関係無いようなサイトまで検索結果として表示されてしまい、検索結果の品質が低く、ユーザは目的のWEBサイトを絞り込むのに膨大な時間を要してしまうという問題がある。 However, such a conventional search engine has the following problems. In the case of a robot-type search engine, there is an advantage that a large amount of information is collected. On the other hand, since the search robot simply indexes the words that appear in the collected WEB site information, the WEB site In many cases, there are tens of thousands of cases. For this reason, there is a problem that a site that is not originally related to the user is displayed as a search result, the quality of the search result is low, and the user needs an enormous amount of time to narrow down the target WEB site. .
また、検索ロボットが検索を行うので、異なるユーザが検索した場合でも同一キーワードで検索する限り常に同じ検索結果しか得られず、異なるプロフィールや嗜好を有するユーザの全てに対して満足のいく検索結果が得られることは少ないという問題がある。 In addition, since the search robot performs a search, even if different users search, as long as the search is performed with the same keyword, only the same search result is always obtained, and a satisfactory search result is obtained for all users having different profiles and preferences. There is a problem that it is rarely obtained.
ディレクトリ型検索エンジンの場合には、WEBサイトのデータ入力及び分類を基本的に人手で行っているため、ロボット型検索エンジンによるサービスと比較して情報量が2、3桁少なく、有名なWEBサイト以外を探すことが出来ないという問題がある。また、WEBサイトのデータ入力と分類を作業者の事務処理能力に頼っているため、情報量を増大するのにも限界がある。 In the case of a directory-type search engine, the data input and classification of the WEB site is basically performed manually, so the amount of information is two to three orders of magnitude less than the service provided by the robot-type search engine. There is a problem that you can not find anything other than. In addition, since the data input and classification of the WEB site depend on the business processing ability of the worker, there is a limit in increasing the amount of information.
また、ディレクトリ型エンジンの場合には、単に収集したWEBサイトの情報を分野別に分類しているだけなので、ロボット型検索エンジンと同様に、異なるユーザが検索した場合でも同一キーワードで検索する限り常に同じ検索結果しか得られず、異なるプロフィールや嗜好等を有するユーザの全てに対して満足のいく検索結果が得られることは少ないという問題がある。 In the case of a directory-type engine, the collected WEB site information is simply classified according to the field. Therefore, as with the robot-type search engine, even if a different user searches, the same keyword is always used. There is a problem that only search results can be obtained, and satisfactory search results are rarely obtained for all users having different profiles and preferences.
これに対して、ユーザの嗜好にあわせた検索結果を提供するシステムが提案されている(特許文献1を参照。)このシステムでは、ユーザが情報を取り扱うために当該情報を特定するための識別情報をユーザの操作に基づいてブックマーク登録するとともに、ユーザの意図に基づいてカテゴリを付与して分類可能としている。さらに、各カテゴリ内の情報のユーザ間での一致度を求めることにより、そのユーザと他のユーザとの嗜好の類似度を評価判定し、前記類似度が高いと判定された他のユーザが評価した情報を前記ユーザに紹介することができる。これによれば、ユーザは、嗜好が類似した他のユーザが評価した情報をシステムから紹介されるため、情報を探すための時間及び費用が節約できる。
しかしながら、従来のシステムではユーザの嗜好の類似度に基づいて、提供を受けるユーザに未知の情報を提供することはできたが、キーワード検索時において、嗜好の共通するユーザの動向(例えば、共通の趣味を有するユーザがどのページを数多く参照しているか等)や、当該ページの直近の動向(例えば、直近に更新されたかどうか、あるいは、最近特に人気を集めているか等)を指標として、提供する情報を選別することはできない。 However, in the conventional system, it is possible to provide unknown information to the user who receives the provision based on the similarity of the user's preference. However, at the time of keyword search, the trend of the user having the common preference (for example, the common preference) Provide as an index the number of pages that a user with a hobby refers to) and the latest trend of the page (for example, whether it has been updated recently, or has recently become particularly popular) Information cannot be sorted out.
本発明はこのような問題点に鑑みてなされたものであり、キーワード検索時における検索結果をユーザにとってより価値のあるものとすることを目的とする。 The present invention has been made in view of such a problem, and an object thereof is to make a search result at the time of keyword search more valuable to a user.
以上の課題を解決するための本発明は、クライアント端末から入力された検索情報に基づいてインターネット上のWebページの情報を検索し、検索結果を前記クライアント端末に送信する情報検索装置であって、
Webページに関する登録情報を格納する登録情報格納手段と、
前記クライアント端末から前記検索情報を受信する受信手段と、
前記検索情報に含まれるキーワードに関連するWebページを検索用情報から検索し、第1の検索結果を生成する第1の検索結果生成手段と、
前記クライアント端末のユーザに固有のデータであって、対応するユーザについて、少なくとも、年齢、性別、地域属性、職種、未既婚、住居形態、年収、車の所有、及び、趣味のいずれかの種別に関する情報を含むユーザデータを、ユーザ毎に格納するユーザデータ格納手段と、
前記検索情報から、前記ユーザを特定するための識別情報を抽出する抽出手段と、
前記ユーザデータ格納手段に格納されたユーザデータのうち、前記識別情報に対応する第1のユーザデータを取得するユーザデータ取得手段と、
前記登録情報格納手段に格納された、前記第1の検索結果に含まれるWebページに関する登録情報から、前記検索情報に含まれる前記登録情報の利用の有無に関する設定情報と、前記第1のユーザデータとを利用して第1の登録情報を選択する選択手段と、
前記第1の登録情報に基づいて、前記第1の検索結果に含まれるWebページの重み付け値を、該Webページ毎に算出する算出手段と、
Webページ毎に算出された前記重み付け値に基づき、前記第1の検索結果に含まれるWebページの順位を決定する順位決定手段と、
決定された前記順位により前記第1の検索結果に含まれるWebページをソートして第2の検索結果を生成する第2の検索結果生成手段と、
前記第2の検索結果を前記クライアント端末に送信する送信手段と
を備え、
前記登録情報には、前記Webページについて、少なくとも、複数のユーザにより参照された回数の前記ユーザデータの種別毎の総計、直近の所定期間内に複数のユーザにより参照された回数の前記ユーザデータの種別毎の合計、該Webページをブックマークに登録している前記ユーザデータの種別毎のユーザ数のいずれかが含まれ、
前記設定情報は、前記重み付け値を算出するために利用する前記登録情報を指定する情報であって、
前記選択手段は、前記設定情報において指定された前記登録情報のうち、少なくとも前記第1のユーザデータに含まれる各種別に関する情報に対応する登録情報を、前記第1の登録情報として選択する。
The present invention for solving the above problems is an information search apparatus for searching for information on a web page on the Internet based on search information input from a client terminal and transmitting a search result to the client terminal.
Registration information storage means for storing registration information relating to a web page;
Receiving means for receiving the search information from the client terminal;
First search result generating means for searching a Web page related to a keyword included in the search information from search information and generating a first search result;
It is data specific to the user of the client terminal, and for the corresponding user, at least regarding age, gender, regional attribute, occupation, unmarried, dwelling form, annual income, car ownership, and hobby User data storage means for storing user data including information for each user;
Extraction means for extracting identification information for identifying the user from the search information;
Among user data stored in the user data storage means, user data acquisition means for acquiring first user data corresponding to the identification information;
From registration information relating to the Web page included in the first search result stored in the registration information storage means, setting information relating to presence / absence of use of the registration information included in the search information, and the first user data Selecting means for selecting the first registration information using
Calculating means for calculating, for each Web page, a weight value of the Web page included in the first search result based on the first registration information;
Rank determining means for determining the rank of the Web page included in the first search result based on the weighting value calculated for each Web page;
Second search result generation means for generating a second search result by sorting Web pages included in the first search result according to the determined order;
Transmitting means for transmitting the second search result to the client terminal;
Wherein the registration information for the Web page, at least, the sum of each of the user data of the number of times referenced by the plurality of user type, the user data of the number of times referenced by a plurality of users within a latest predetermined period the total for each type, one of the number of users of each type of the user data that has registered the Web page in the bookmark is included,
The setting information is information for specifying the registration information used for calculating the weighting value,
The selection unit selects, as the first registration information, registration information corresponding to at least various types of information included in the first user data among the registration information specified in the setting information.
以上のように、本発明によれば、キーワード検索時における検索結果をユーザにとってより価値のあるものとすることができる。本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。 As described above, according to the present invention, the search result at the time of keyword search can be made more valuable to the user. Other features and advantages of the present invention will become apparent from the following description with reference to the accompanying drawings. In the accompanying drawings, the same or similar components are denoted by the same reference numerals.
添付図面は明細書に含まれ、その一部を構成し、本発明の実施の形態を示し、その記述と共に本発明の原理を説明するために用いられる。
以下に、添付する図面を参照して本発明の実施形態を説明する。ただし、この実施の形態に記載されている構成要素はあくまでも例示であり、この発明の範囲をそれらのみに限定する趣旨のものではない。 Embodiments of the present invention will be described below with reference to the accompanying drawings. However, the constituent elements described in this embodiment are merely examples, and are not intended to limit the scope of the present invention only to them.
<システム構成>
図1は、本実施形態に対応する検索システムの全体構成を示すブロック図である。ユーザが操作してコンテンツの閲覧を行うクライアント101a、101b、101c(以下、これらを総称して「クライアント101」という。)、検索を行うサーバ103、コンテンツを公開するコンテンツサーバ108が、それぞれインターネット102に接続されている。また、サーバ103には、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107が接続されている。<System configuration>
FIG. 1 is a block diagram showing the overall configuration of a search system corresponding to this embodiment.
クライアント101は、ユーザが操作して、インターネット上に公開されたコンテンツを閲覧可能なクライアント端末としての情報処理装置であり、ノートパソコン、デスクトップパソコン、携帯情報端末、携帯電話等を含む。クライアント101には、所定のページ記述言語(例えば、HTML、XML、PDF或いはPS等)で記載されたコンテンツを表示画面上に表示可能なソフトウェアがインストールされているものとする。以下の本実施形態では、簡単のために、当該ソフトウェアとして、所謂インターネット・ブラウザがインストールされている場合を例として説明する。
The
クライアント101は、イーサネット(登録商標)等のネットワークケーブルを含むアクセス手段であるLANによってインターネット102に接続されている。尚、ネットワーク102へのアクセス手段はイーサネット(登録商標)ケーブルに限定されるものではなく、例えば、RS232Cインタフェースに準じた通信ケーブルや、無線LAN等の無線通信手段によって構成されていてもよい。後述するサーバ103、コンテンツサーバ108も同様のアクセス手段を備えているものとする。
The
インターネット102は、世界中のネットワークが互いに接続されたネットワークであるが、例えば、イントラネットのように特定の組織内においてのみ接続可能なネットワークであってもよい。
The
サーバ103は、クライアント101に検索サービスを提供する情報検索装置としての情報処理装置であり、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107に格納されている情報を管理している。サーバ103は、インターネット102上で閲覧可能なWebサイトに定期的にアクセスして、そこに含まれるURL、タイトル、全文データを収集し、URLデータベース106や検索用データベース107を更新する。
The
また、ブックマークデーベース105の更新を監視し、ユーザブックマークに新たなURLが追加されたり、削除されたりした場合には、対応するURLデータベース106に登録されている情報の更新を行う。また、クライアント101における、ブックマークに登録されたURLの選択動作を監視し、各ユーザの参照回数を記録している。サーバ103は、例えば、LANによって、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107に接続されている。
Further, the update of the
ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107は、それぞれ所定のデータベース・ソフトウェアがインストールされた情報処理装置であり、各種データの管理を行う。ユーザデータベース104は、ユーザデータの情報を管理する。ブックマークデータベース105は、各ユーザのブックマークデータを管理する。URLデータベース106は、各ユーザがブックマークに登録しているページに関する登録情報を統一的に管理する。検索用データベース107は、検索処理用の情報を管理する。
The
コンテンツサーバ108は、ウェブページ等のコンテンツを提供する情報処理装置であり、例えば、ウェブサーバ等のソフトウェアがインストールされている。
The
尚、本明細書では、便宜上、サーバ103、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、及び、検索用データベース107は、それぞれ物理的に独立した情報処理装置によって実現されるものとして説明するが、本発明の実施形態はこれに限られるものではない。例えば、これらが単一の情報処理装置によって実現されてもよい。また、ユーザデータベース104、ブックマークデータベース105、URLデータベース106及び検索用データベース107は、サーバ103とLAN等によって接続されているものとして説明するが、例えば、インターネット102や非図示のイントラネット経由でサーバ103と通信可能な形態をとってもよい。
In this specification, for the sake of convenience, the
<情報処理装置の構成>
次に、本実施形態に対応する検索システムを構成する情報処理装置の概略について説明する。図2は、クライアント101のハードウェア構成の一例を示すブロック図である。上述した情報処理装置としてのユーザデータベース104、ブックマークデータベース105、URLデータベース106及び検索用データベース107も、同様或いは同等のハードウェア構成として構成しても良い。<Configuration of information processing apparatus>
Next, an outline of the information processing apparatus constituting the search system corresponding to the present embodiment will be described. FIG. 2 is a block diagram illustrating an example of the hardware configuration of the
図2において、200はCPUであり、ハードディスク装置(以下、HDと呼ぶ)205に格納されているアプリケーションプログラム、オペレーティングシステム(OS)や制御プログラム等を実行し、RAM202にプログラムの実行に必要な情報、ファイル等を一時的に格納する制御を行う。
In FIG. 2,
201はROMであり、内部には基本I/Oプログラム等のプログラム、文書処理の際に使用するフォントデータ、テンプレート用データ等の各種データを記憶する。202は各種データを一時記憶するためのRAMであり、CPU200の主メモリ、ワークエリア等として機能する。
A
203は記録媒体へのアクセスを実現するための外部記憶ドライブであり、メディア(記録媒体)204に記憶されたプログラム等を本コンピュータシステムにロードすることができる。尚、メディア204は、例えば、フレキシブルディスク(FD)、CD−ROM、CD−R、CD−RW、PCカード、DVD、ICメモリカード、MO、メモリスティック等を利用することができる。
205は外部記憶装置であり、本実施形態では大容量メモリとして機能するHDを用いている。HD205には、アプリケーションプログラム、OS、制御プログラム、関連プログラム等が格納される。
206は指示入力装置であり、キーボードやポインティングデバイス(マウス等)、タッチパネル等がこれに相当する。指示入力装置206を用いて、ユーザは、クライアント101に対して、装置を制御するコマンド等を入力指示する。
207はディスプレイであり、指示入力装置206から入力したコマンドや、それに対するクライアント101の応答出力等を表示したりするものである。
A
209はシステムバスであり、情報処理装置内のデータの流れを司るものである。208はインターフェイス(以下、I/Fという)であり、このI/F208を介して外部装置とのデータのやり取りを行う。
A
尚、以上の各装置と同等の機能を実現するソフトウェアにより、ハードウェア装置の代替として構成することもできる。 In addition, it can also be comprised as an alternative of a hardware apparatus with the software which implement | achieves a function equivalent to the above each apparatus.
本実施形態では、メディア204から本実施形態に係るプログラム及び関連データを直接RAM202にロードして実行させる例を示すが、これ以外にも、本実施形態に係るプログラムを動作させる度に、既にプログラムがインストールされているHD205からRAM202にロードするようにしてもよい。また、本実施形態に係るプログラムをROM201に記録しておき、これをメモリマップの一部をなすように構成し、直接CPU200で実行することも可能である。
In the present embodiment, an example is shown in which the program and related data according to the present embodiment are directly loaded from the medium 204 to the
図3は、サーバ103の機器構成を示すブロック図である。CPU300、ROM301、RAM302、外部記憶ドライブ303、メディア304、HD305、指示入力装置306、ディスプレイ307、I/F308、システムバス309の機能及び用途、更には、これらの関係は、図2を用いて説明したものと同様或いは同等である。図3では、データベース310がシステムバス309に接続されていることに留意する。ここで、データベース310は、ユーザデータベース104、ブックマークデータベース105、URLデータベース106及び検索用データベース107を総称するものである。
FIG. 3 is a block diagram illustrating a device configuration of the
<ユーザデータの構造>
図4Aは、ユーザデータベース104に格納されているユーザデータの構造の一例を説明する図である。ユーザデータは、個々のユーザの特徴や属性に関する種々の情報によって構成される。<User data structure>
FIG. 4A is a diagram for explaining an example of the structure of user data stored in the
図4Aにおいて、401はユーザIDであり、各ユーザを一意に識別するためにユニークに与えられた識別子である。402はパスワードであり、各ユーザが登録された個人情報にアクセスしたり、ブックマークを利用する際の認証に利用される。403はユーザ名、404はユーザのメールアドレス、405は年齢、406は性別、407は、ユーザが活動又は居住する地域属性、408は職種、409は未既婚、410は住居形態、411は年収、412は自家用車の所有、413は趣味である。それぞれのデータは予めユーザから提供されて、ユーザデータとして登録される。また、上記の内容はユーザデータの一例として上げたものであって、これら全てが登録されている必要はないし、また、これら以外にもユーザを特徴づける情報を登録しても良い。
In FIG. 4A, 401 is a user ID, which is an identifier uniquely assigned to uniquely identify each user. A
<ブックマークの構成>
本実施形態においてブックマークはユーザにより作成・更新されるが、ブックマークデータはすべてサーバ103に接続されたブックマークデータベース105に各ユーザ毎に格納されており、ユーザがクライアント101においてウェブブラウザを起動した際に、クライアント101にダウンロードされて、ウェブブラウザ上に表示される。<Bookmark structure>
In this embodiment, bookmarks are created and updated by the user, but all bookmark data is stored in the
ブックマークは、公知のディレクトリ構造において、URL及び当該URLを特定のまとまりとして格納するフォルダにより構成される。即ち、各URLはユーザごとのディレクトリツリー(以下、ブックマークディレクトリという)の中に登録され、ブックマークディレクトリの直下であっても、任意に作成されたフォルダ内にあってもよい。 The bookmark is composed of a URL and a folder that stores the URL as a specific unit in a known directory structure. That is, each URL is registered in a directory tree for each user (hereinafter referred to as a bookmark directory), and may be directly under the bookmark directory or in an arbitrarily created folder.
図4Bは、ブックマーク内に登録されたページに関する情報の管理の一例を示す図である。図4Bにおいて、ユーザIDは当該ブックマークを利用するユーザの識別子であり、図4AにおけるユーザID401と対応する。これによりユーザとブックマークとの対応をとることができる。422には、登録対象となるWebページを識別するための情報が登録される。本実施形態ではURLデータベース106を利用して、各ページに関する情報を統一的に管理しているので、ユーザの個々のブックマークには対応するページのURLは格納されない。その代わりに、URLデータベース106において当該ページを管理するための識別番号(URL−ID)が格納される。なお、URLデータベース106を利用しない場合には、URLそのものを登録しても良い。
FIG. 4B is a diagram illustrating an example of management of information related to a page registered in a bookmark. In FIG. 4B, the user ID is an identifier of a user who uses the bookmark, and corresponds to the
423は各ページに与えられたブックマーク名である。このブックマーク名423は、ユーザがブックマーク登録する際に、任意に設定した名称であっても良いし、当該ページに本来割り当てられている名称であっても良い。424は、当該ページが作成された日時(ネットワーク102上で初めて公開された日時に相当する。)を示す。425は、当該ページが最新に更新された日時を示す。426は、ユーザが最新に当該ページを参照した日時を示す。427は、ユーザによる当該ページの総参照回数を示す。総参照回数とは、ユーザがこれまでに当該ページを参照した回数の総計をいう。428は、ユーザによる当該ページの直近の参照回数を示す。ここで、直近の参照回数とは、直近の所定期間(例えば、1週間、1ヶ月など)において当該ページがユーザにより参照された回数の合計をいう。
なお、ブックマークに登録された各ページ間の関係や、当該ページを格納するフォルダに関する情報は、図4Bに示すテーブルとは別に、ブックマークデータベース105内にディレクトリテーブルが用意され、そこに格納される。
In addition to the table shown in FIG. 4B, a directory table is prepared in the
ここで、サーバ103は、上述の通りブックマーク登録されている各ページの更新を定期的に監視しており、更新があった場合には425の更新日時の内容を更新する。
Here, as described above, the
<URLデータベースの構成>
URLデータベース106は、ブックマークデータベース105に登録されているURL−ID422に対応するページに関する情報を登録している。図4Cは、URLデータベース106におけるページに関する情報の管理の一例を示す図である。<Configuration of URL database>
The
図4Cにおいて、422は、URLに与えられたID(識別子)を表しており、図4BにおけるURL−ID422と対応する。429は、URL−ID422が与えられたURLを示す。430は、URLに対応するWebコンテンツが本来有するタイトルを示す。作成日時、更新日時は図4Bと同様である。431は、最終参照日時を示し、複数のブックマークユーザのいずれかが最新に、当該ページを参照した日時を示す。432は、複数のユーザの総参照回数427の合計、即ち、複数のユーザにより当該ページが参照された回数の総計を表す。
4C,
直近参照回数433は、複数のユーザの直近参照回数428の合計、即ち、直近の所定期間内に複数のユーザにより当該ページが参照された回数の合計を表す。従って、「直近の所定期間」については、図4Bの場合と同様である。例えば、最近立ち上げられたばかりであるが人気のあるページは、この直近参照回数433が高くなるので、ページ毎に直近の人気の度合いを判定することが可能となる。434は、増加アンカー数であって、当該ページについて直近の所定期間内に追加されたアンカー数を示す。本実施形態においてアンカーとは、ページ内に埋め込まれた、他のページへのリンク情報を言う。また、「直近の所定期間」については上記と同様である。また、435は、ブックマーク登録数であって、当該ページをブックマークに登録しているユーザ数を示す。
The
また、URLデータベース106は、ページをブックマークに登録しているユーザのユーザデータ毎の参照回数や、ブックマーク登録数を管理している。図4Dは、URLデータベース106におけるページに関する情報の管理の他の一例を示す図である。
Further, the
図4Dでは、各ページ毎に、ユーザデータの詳細に対応する総参照回数、直近参照回数及びブックマーク登録数を登録している。422は、各ページに割り当てられたURL−IDを示す。440は、ユーザデータであり、図4Aに示した個々のユーザデータが登録される。441は総参照回数であり、ユーザデータ毎に集計された当該ページに対する参照回数の総計が登録される。442は、直近参照回数であって、ユーザデータ毎に集計された当該URLに対する直近の所定期間における参照回数の合計が登録される。「直近の所定期間」については、上記と同様である。また、443は、ブックマーク登録数であり、当該ページをブックマークに登録しているユーザ数をユーザデータ毎に合計した値が登録される。
In FIG. 4D, the total reference count, the latest reference count, and the bookmark registration count corresponding to the details of the user data are registered for each page.
図4Dでは、ユーザデータ440について、年齢405、趣味413、職種408が登録例を記載しているが、年齢405を参酌すると、「10代」、「20代」等のように一定の年齢層毎に総参照回数441、直近参照回数442、及び、ブックマーク登録数443が登録されている。つまり、10代のユーザが当該URLを参照した合計は100回であり、20代のユーザが当該URLを参照した合計は300回であることが、図4Dから読みとれる。
In FIG. 4D, for
また、直近の参照回数については、10代が30回であり、20代が20回であることが読みとれる。即ち、このURLに対応するWebコンテンツには、全体的には20代のユーザが、10代のユーザよりも関心を強く示している一方、直近だけを見た場合には10代のユーザの関心が強くなっていることが分かる。また、ブックマーク登録数443を参照すれば、10代から40代などにおいて、どの年齢層がどれだけブックマーク登録しているかを把握することができる。
As for the most recent reference count, it can be read that teenagers are 30 times and 20s are 20 times. That is, the Web content corresponding to this URL is generally more interested by users in their 20s than users in their teens. It can be seen that is getting stronger. Further, by referring to the
図4Aに示したとおり、ユーザデータ440には「年齢」、「趣味」、「職種」以外にも複数含まれており、これらのユーザデータそれぞれについて、総参照回数441、直近参照回数442及びブックマーク登録数443が登録されている。このようなユーザデータ毎の総参照回数441、直近参照回数442及びブックマーク登録数443のデータは、図4A及び図4Bに示したデータを利用すれば得られる。
As shown in FIG. 4A, the
なお、本実施形態では、図4Aから図4Dまでに例示したデータベースの個々の登録内容のことを登録情報と称する。 In the present embodiment, each registered content of the database exemplified in FIGS. 4A to 4D is referred to as registration information.
<検索用データベースの構成>
検索用データベース107は、ユーザから提供されるキーワードに関連するWebページを検索するための検索用情報として検索処理用の情報を管理するものであり、インターネット102上のWebサイトから収集された検索データが登録される。検索データは、主として各検索データの識別子、キーワード、属性、データ取得時間、データ取得URL、URLのタイトル、全文データ(Description)等から構成されるが、この他のデータを含めてもよい。<Configuration of search database>
The
<オンラインブックマーク>
図5は、クライアント101においてオンラインブックマークが利用される際の、クライアント101・サーバ103間における処理の一例に対応するフローチャートである。まず、クライアント101においてWebブラウザが起動されると(ステップS551において「YES」)、ブックマークデータ要求がユーザID401と共にサーバ103に通知され(501)、サーバ103では、通知されたユーザID401に基づいて、ブックマークデータベース105を検索し、当該ユーザのブックマークデータを選択する(ステップS552)。選択されたブックマークデータはサーバ103からクライアント101に対して送信される(502)。<Online bookmark>
FIG. 5 is a flowchart corresponding to an example of processing between the
クライアント101では、起動されたWebブラウザをディスプレイ207上に表示し、Webブラウザのブックマーク表示領域にサーバ103から送信されたブックマークデータに基づくブックマーク情報を表示する(ステップS553)。
The
その後、クライアント101ではユーザからのブックマークに対する操作を受け付けたかどうかを監視し、もし操作を受け付けた場合には(ステップS554で「YES」)、サーバ103に対してブックマーク操作内容を通知する(503)。ここで、ユーザから受け付けるブックマークの操作には、例えば、ブックマークに登録されているURLの選択、新たなURLの追加、登録済みのURLの情報の編集(削除を含む)等がある。
Thereafter, the
クライアント101からブックマーク操作内容を受信すると、サーバ103では、受信した内容に基づいて各データベースを更新する。当該通知が、例えばユーザがあるURLを選択した通知であった場合には、対応するURLについての参照日時426、総参照回数427、直近参照回数428、最終参照日時431、総参照回数432、直近参照回数433、総参照回数441、直近参照回数442をそれぞれ更新する。
When the bookmark operation content is received from the
また、ユーザがWebブラウザの閲覧を終了する場合には、クライアント101からサーバ103に対して終了通知が送信され(504)、サーバ103からは終了応答が返される(505)。
When the user finishes browsing the Web browser, a termination notification is transmitted from the
以上により、サーバ103が管理するブックマークデータベース105及びURLデータベース106は、常にユーザから受け付けた操作に基づいて内容が更新されることとなる。
As described above, the contents of the
<検索処理その1(検索画面)>
次に、本実施形態におけるサーバ103を利用してクライアント101がWebページの検索処理を実行する場合の処理について具体的に説明する。<Search process 1 (Search screen)>
Next, a specific description will be given of processing when the
図6A乃至図6Cは、ユーザがクライアント101において検索処理を実行する場合に、ディスプレイ207に表示される画面の一例を示す図である。ユーザが検索処理を実行しようとする場合には、所定のURLを指定してサーバ103が提供する検索ページにアクセスする。この時最初にディスプレイ207に表示される画面が、図6A乃至図6Cに示すような画面600である。画面600は、検索画面601とブックマーク表示領域606とに大きく分割される。ブックマーク表示領域606には、前述のサーバ103から提供されたブックマークデータに基づくブックマーク表示がなされており、ユーザはブックマークに登録されたページを選択して、閲覧することができる。
6A to 6C are diagrams illustrating an example of a screen displayed on the
図6Aに示すごとく、サーバ103は「○×△サーチ」という名称で検索サービスを提供しており、検索画面601には、キーワード入力領域602、検索実行ボタン603、オプション604、及び設定ボタン605が表示される。キーワード入力領域602は、ユーザが検索したいキーワードの入力を受け付ける領域である。検索実行ボタン603は、入力されたキーワードについて、設定されたオプションの内容に従った検索処理をサーバ103に指示するためのボタンである。オプション604では、図6Cに示すような、ページ情報や、ユーザデータに基づく検索結果のソーティングを行うかどうかの指示をユーザから受け付ける。即ち、「利用する」が選択されると、オプションとして設定された内容を利用した検索が行われる。一方、「利用しない」が選択されると、オプションとして設定された内容は利用せずに、通常の検索処理が実行され、この検索結果がクライアント101に通知される。
As shown in FIG. 6A, the
図6Aの場合では、「利用する」が選択されているので、オプションの設定内容を利用した検索が行われることとなる。また、「利用する」が選択された場合には、設定ボタン605がアクティブになり、この設定ボタン605の選択を受け付けると、図6Bに示すようなユーザID入力画面が表示され、検索を行おうするユーザがユーザデータベース104に登録されているか否かの確認が行われる。この確認の後、図6Cに示すようなオプションの設定画面が表示される。一方、「利用しない」が選択された場合には、設定ボタン605はグレーアウトされ、図6B及び図6Cのような表示画面は提供されない。
In the case of FIG. 6A, since “use” is selected, a search using option setting contents is performed. When “use” is selected, the
次に、図6Bについて説明する。図6Bは、図6Aにおいて設定ボタン605が選択された場合に、ディスプレイ207に表示される画面である。この画面は、ユーザがユーザデータベース104に登録されているか否かを確認するための画面である。
画面610において、611は、検索を行おうとするユーザから、ユーザ登録の有無に関する入力を受け付ける表示欄である。ここでは、「あり」、「なし」のいずれかが選択可能となっている。「あり」が選択された場合には、「ユーザ名」及び「パスワード」の入力を受け付ける入力欄612及び613が表示される。一方、「なし」が選択された場合には、これらの入力欄612及び613はグレーアウトされるか、全く表示されない。Next, FIG. 6B will be described. FIG. 6B is a screen displayed on the
In the
また、614は、決定ボタンであって、入力内容を確定する場合に操作される。615はキャンセルボタンであって、ユーザが図6Aの画面に戻りたい場合に操作される。決定ボタン614が操作された際に、ユーザ登録611が「なし」の設定の場合には、サーバへのデータ送信は行わずに、画面を図6Cに切り替える。一方、ユーザ登録611が「あり」の設定で、「ユーザ名」及び「パスワード」を受け付けていれば、該受け付けたデータがサーバ103へ送信される。
サーバ103では、クライアント101から受信した「ユーザ名」及び「パスワード」と一致するユーザ名403及びパスワード402をユーザデータベース104から検索する。一致する「ユーザ名」が登録されている場合には、ユーザデータベース104に登録されているユーザデータの有無及びユーザID401がサーバ103からクライアント101に通知される。クライアント101では、サーバ103からの該通知を受信すると、図6Cの画面を表示する。一方、一致する「ユーザ名」が登録されていない場合には、エラーメッセージがサーバ103からクライアント101に通知される。クライアント101では、サーバ103からの該エラーメッセージを受信すると、図6Bの画面を表示して、再度「ユーザ名」及び「パスワード」の入力を受け付ける。
The
次に、図6Cについて説明する。図6Cは、図6Bにおいて決定ボタン614が選択された後に、ディスプレイ207に表示される画面である。また、この画面は、サーバ103における検索の際に利用されるオプション情報の設定、より具体的には、検索結果に含まれる各ページの重み付け値を算出するために利用する登録情報の指定を受け付けるための画面でもある。
Next, FIG. 6C will be described. FIG. 6C is a screen displayed on the
オプション入力画面620には、大別すると、ページ情報621、ユーザデータ622及びおまかせ623が示される。ページ情報621について設定可能な項目には、更新日時、総参照回数、直近の参照回数、増加アンカー数、ブックマーク登録数がある。これらの項目は、URLデータベース106に登録されている図4Cの更新日時425、総参照回数432、直近参照回数433、増加アンカー数434、ブックマーク登録数435の登録情報にそれぞれ対応している。よって、これらの項目のいずれかが選択された場合、対応する登録情報は、(図8と対応して後述するように)サーバ103における検索結果に含まれるページついて、表示順を決定する際に利用される。
The
また、ユーザデータ622について設定可能な項目には、年齢、性別、地域属性、職種、未既婚、年収、車の有無、趣味がある。これらの項目は、URLデータベース106に登録されている図4Dの総参照回数441、直近参照回数442、ブックマーク登録数443についての登録情報のうち、指定されたユーザデータに関連するものにそれぞれ対応している。
Items that can be set for the
例えば、ユーザデータ622のうち年齢が選択された場合には、図4Dにおけるユーザデータ440の年齢のうち、当該指定を行ったユーザの年齢に基づいて当該ユーザが属する世代が決定され、対応する登録情報が特定される。よって、これらの項目のいずれかが選択された場合、対応する登録情報は、(図8と対応して後述するように)サーバ103における検索結果に含まれるページついて、表示順を決定する際に利用される。
For example, when the age is selected from the
また、おまかせ623は、ユーザ側でページ情報621やユーザデータ622の指定を行わない場合に選択できる。おまかせ623が選択された場合には、例えば、全てのオプション情報を利用して検索を行っても良いし、あるいは、特定のページ情報621とユーザデータ622とを予め設定しておき、当該設定を利用した検索を行っても良い。
The entrusting 623 can be selected when the user does not specify the
なお、オプションにおける設定項目は、上記のものに限定されることなく、当然にこれら以外が含まれても良い。
また、図6Bに示す画面では、ページ情報621とユーザデータ622とについて設定可能な項目が表示されているが、このような表示は、ユーザデータベース104に登録され、かつ、ユーザデータ622の各設定項目について図4Aに示すようにユーザデータを漏れなく登録していなければ意味がない。The setting items in the options are not limited to those described above, and other items may naturally be included.
In the screen shown in FIG. 6B, items that can be set for the
例えば、ユーザによっては、ユーザデータベース104に登録されていない者もいるかもしれない。このような場合、ユーザデータ622の設定項目について設定を受け付けても、検索に利用することはできない。また、このようなユーザは、図6Bの画面において、ユーザ登録611を「なし」に設定しているはずである。そこで、係る設定内容に対応して、画面620にはページ情報621のみを表示し、ユーザデータ622はグレーアウトするのが好ましい。これによれば、ユーザデータベースに登録されていないユーザであっても、少なくともページの更新日時や直近の参照回数を利用した検索が可能となる。
For example, some users may not be registered in the
また、一部のユーザデータのみを登録し、他のユーザデータは登録していない者もいるかもしれない。このような場合、登録していない項目について設定を受け付けても、検索に利用することはできない。そこで、サーバ103から受け付けたユーザデータベース104に登録されているユーザデータの有無に関する通知に基づき、ユーザデータ622の設定項目のうち、ユーザデータベース104に登録されているユーザデータに対応する項目のみを表示し、他をグレーアウトすることが好ましい。これによれば、ユーザは少なくとも自分の登録したユーザデータを用いた検索は可能となる。
Further, there may be a person who registers only part of user data and does not register other user data. In such a case, even if a setting is received for an item that is not registered, it cannot be used for a search. Therefore, only items corresponding to the user data registered in the
ユーザはオプション入力を終了すると、決定ボタン624により入力したオプションの内容を確定することができる。決定ボタン624が選択されると、検索画面601は図6Aに示す内容に戻る。また、キャンセルボタン625を選択した場合は、図6Aの画面に戻る。その際、オプションの設定内容はリセットされても良いし、それまでの入力内容を保持したままでも良い。
When the user finishes option input, the user can confirm the contents of the option input by the
<検索処理その2(検索処理)>
次に、実際に検索を実行する際の処理の流れについて、図7のフローチャートを参照して説明する。<Search process 2 (search process)>
Next, the flow of processing when actually executing a search will be described with reference to the flowchart of FIG.
まず、クライアント101において、サーバ103が提供する検索サービスのページのURLが選択されると(ステップS751において「YES」)、クライアント101からサーバ103に対して、検索画面情報の要求が通知される(701)。サーバ103では、クライアント101からの検索画面情報の要求に応じて、クライアント101において後述する検索情報を生成するための検索情報生成情報としての検索画面情報を送信する(702)。クライアント101は、サーバ103から検索画面情報を受信すると、ディスプレイ207上に図6Aの検索画面601に示すような検索画面を表示する(ステップS752)。
First, when the URL of the page of the search service provided by the
次に、ユーザからキーワードやオプション設定をするか否かなどの入力を受け付け(ステップS753)、オプション設定がなされる場合には図6Bの画面を表示して、ユーザ登録ありと設定されたか否かを判定する(ステップS754)。もし、オプション設定がなされない場合には、以下のステップS753からS756をスキップしてステップS757へ移行する。 Next, an input such as whether or not to set a keyword or an option is received from the user (step S753). When option setting is performed, the screen of FIG. 6B is displayed to determine whether or not user registration is set. Is determined (step S754). If option setting is not made, the following steps S753 to S756 are skipped and the process proceeds to step S757.
図6Bに表示する画面において、ユーザ登録611が「なし」と設定された場合には、「ユーザ登録あり」と設定されたこととならないので(ステップS754において「NO」)、ステップS756に移行する。一方、ユーザ登録611が「あり」と設定され、入力欄612及び613に「ユーザ名」及び「パスワード」が入力された場合には、「ユーザ登録あり」と設定されたこととなる(ステップS754において「YES」)ので、これらの入力情報をユーザ認証用情報としてサーバ103に送信する(703)。
When the
サーバ103では、クライアントから送信された「ユーザ名」及び「パスワード」を含むユーザ認証用情報を利用してユーザ認証、即ち、該ユーザがユーザデータベース104に登録されているユーザであるかを検証する(ステップS755)。検証の結果、該ユーザが登録されている場合には、該ユーザについて、ユーザID401とユーザデータベース104に登録されているユーザデータの有無に関する情報とを含むユーザ認証結果がクライアント101へ送信される(704)。また、該ユーザが登録されていない場合には、エラーメッセージを含むユーザ認証結果がクライアント101へ送信される(704)。
The
次に、ステップS756では、図6Cに示すようなオプション入力画面を表示して、オプション入力を受け付ける。続いて、検索実行ボタン603の選択による検索実行指示を受け付ける(ステップS757)。検索実行ボタン603が選択されると、サーバ103に対して、ステップS753及びS756で入力を受け付けたキーワードやオプション設定の内容と、ユーザ認証結果(704)を受信している場合には、そこに含まれていたユーザID401とを含む検索情報を送信する(705)。ここで、検索を行おうとするユーザが未登録ユーザの場合には、未登録であることを示す所定のコードをユーザID401の代わりに検索情報に含めて送信しても良い。
Next, in step S756, an option input screen as shown in FIG. 6C is displayed and option input is accepted. Subsequently, a search execution instruction by selection of the
サーバ103では、クライアント101から送信された検索情報を受信すると、キーワードに基づいて検索処理を行い、オプション設定の内容に基づいて検索結果を作成し(ステップS758)、検索結果をクライアント101へ送信する(706)。クライアント101は、サーバ103から検索結果を受信すると、受信した検索結果をディスプレイ207の検索画面601に表示する(ステップS759)。
Upon receiving the search information transmitted from the
その後、ユーザからの入力に従って検索を再度実行する場合は、ステップS751からの処理を再開する。もし、ユーザがWebブラウザの閲覧を終了する場合には(ステップS760で「YES」)、クライアント101からサーバ103に対して終了通知が送信され(707)、サーバ103からは終了応答が返される(708)。
Thereafter, when the search is executed again according to the input from the user, the processing from step S751 is resumed. If the user ends browsing of the Web browser (“YES” in step S760), an end notification is transmitted from the
次に、図8を参照して、図7のステップS758における処理の詳細を説明する。図8は、サーバ103における検索処理の一例に対応するフローチャートである。
Next, details of the process in step S758 of FIG. 7 will be described with reference to FIG. FIG. 8 is a flowchart corresponding to an example of search processing in the
まず、ステップS801において、サーバ103は、クライアント101から送信された検索情報を受信すると共に、受信した検索情報の中から、検索を依頼したユーザ(検索依頼ユーザ)のユーザID401を抽出する。次に、ステップS802において、抽出されたユーザID401に基づいて、ユーザデータベース104からユーザデータを取得する。
なお、検索依頼ユーザがユーザデータベース104に未登録であった場合には、未登録ユーザを示すコードは含まれていても、ユーザID401は検索情報に含まれていない。また、ユーザデータベース104に本来は登録されているユーザであっても、図6Aにおいてオプション設定604を「利用しない」に設定した場合には、図7のユーザ認証結果(704)を受信しないので、検索情報にユーザID401が含まれていない。これらのユーザについては、ユーザデータの取得は当然に行われない。
次に、ステップS803において、検索情報に含まれるキーワードに基づいて公知の手法で検索用データベース107を検索し、ステップS804においてキーワードに基づく検索条件に合致するデータを検索結果1として取得する。この検索結果1は、検索処理によって得られた検索結果であって、ユーザデータ(即ち、検索依頼ユーザの職業や年齢など)や、ページの情報(更新日時や、参照回数等)とは無関係に、専らページ内に指定されたキーワードや当該キーワードに類似する語をどれだけ含むか、といった基準によりキーワードとの関連の度合いを決定し、その関連性の順にページを並べたものとして得られる。First, in step S801, the
If the search requesting user is not registered in the
Next, in step S803, the
ステップS805では、検索情報に基づいて、検索依頼ユーザのオプション設定604の内容を識別する。もし、オプション設定604においてオプションを「利用しない」と設定されていた場合には、ステップS816に移行して検索結果1をクライアント101へ送信する。一方、「利用する」と設定されていた場合には、ステップS806へ移行して、検索結果1の順位に基づいて各ページのポイントPsを算出する。例えば、検索結果1に100件のページが含まれていたとすると、その順位に基づいて頭からポイントを100、99、98・・・1のように付加することができる。また、上位10件のみに100、90、80・・10のポイントをそれぞれ与えても良い。いずれにしても、検索結果1の順位に基づく重み付けを、Psとして検索結果1に含まれる各ページについて与える。
In step S805, the contents of the option setting 604 of the search requesting user are identified based on the search information. If the option is set to “not use” in the option setting 604, the process proceeds to step S816, and the
次に、ステップS807では検索結果1に含まれるページの順位をNuとして、Nuを1に設定する。次に、ステップS808において、検索結果1における順位がNu番目のページを選択し、当該ページのURLに基づいて、当該ページについてURLデータベース106に情報が登録されていれば、該登録されている登録情報を全て取得する。次に、ステップS809において、検索情報において設定されたオプション設定の内容と、ステップS802において取得されているユーザデータがある場合には当該ユーザデータとに基づいて、取得した登録情報の中から、当該ページの重み付けに利用する登録情報を絞り込む。
In step S807, the order of pages included in the
例えば、図6Cの場合、ページ情報621は「直近の参照回数」のみが選択されており、ユーザデータ622については「年齢」と「職種」が選択されている。よって、図4C及び図4Dに示す登録情報のうち、直近参照回数433と、検索依頼ユーザの年齢及び職種に対応した総参照回数441、直近参照回数442、ブックマーク登録数443が選択され、これらの登録情報のみに絞り込みが行われる。
For example, in the case of FIG. 6C, only “recent reference count” is selected as the
ここでは図4C及び図4Dに記載された登録情報をそれぞれ利用して絞り込みを行う場合を説明したが、どの登録情報を利用するかは、オプション設定の内容に基づいて決定されるため、図4C又は図4Dの一方のみを利用して絞り込みを行うことも当然に可能である。 Here, a case has been described in which the registration information described in FIGS. 4C and 4D is used for narrowing down, but since which registration information is used is determined based on the contents of the option setting, FIG. Alternatively, it is naturally possible to perform the narrowing down using only one of FIGS.
なお、ステップS808及びステップS809においては、一旦登録情報を全て読み出し、その後で絞り込みをかけているが、これは一例として説明しただけである。即ち、検索情報において設定されたオプション設定の内容と、ユーザデータとに基づいて直接対応する登録情報をURLデータベース106から取得するようにしても良い。
In step S808 and step S809, all registration information is once read and then narrowed down, but this is only described as an example. In other words, the corresponding registration information may be acquired directly from the
次に、ステップS810では、絞り込まれた登録情報をPr、重み付け値をPwとして、登録情報に基づくポイント:Puを算出する(Pu=Pr×Pw)。
ここで、当該ページ自体がURLデータベース106に登録されていなかった場合や、当該ページ自体は登録されているものの、絞り込まれた登録情報に対応する情報が登録されていなかった場合(例えば、該ページには特定の趣味以外の人はアクセスしない場合もあり得る。)には、Pr=0として計算する。本発明では、このポイントPuを利用することで、当該ページと検索依頼ユーザとの関連性や、当該ページの情報の有用性を検索結果に反映させることが可能となる。即ち、総参照回数441や直近参照回数442、ブックマーク登録数443を利用することで、検索依頼ユーザと同種の職業を選択した他のユーザが数多く参照しているページや、ブックマークに登録しているページを検索結果の上位にランクさせることが可能となる。また、総参照回数432、直近参照回数433、増加アンカー数434、ブックマーク登録数435を利用することで、ユーザの職業や、趣味といった枠を越えて、幅広くユーザに支持されているページや、アンカーを増やして積極的に情報を更新しているページを検索結果の上位にランクさせることが可能となる。Next, in step S810, the narrowed registration information is Pr and the weighting value is Pw, and a point based on the registration information: Pu is calculated (Pu = Pr × Pw).
Here, when the page itself is not registered in the
ここで、Prは総参照回数など、カウントされた数値情報である場合にはそのまま数値として利用することができる。しかし、更新日時425のように、数値として直接には使えない情報については、現在の日時からの差分を求め、さらにその逆数を求めることにより、Pr値とすることができる。いずれにしても、現在の日時に近くなるほどPrの値が大きくなるように変換できればよい。また、重み付け値Pwについては、全ての登録情報について均一に与えられても良いし、特定の登録情報についてより高い値が与えられても良い。例えば、同じ総参照回数にしても、総参照回数441の重み付け値Pwを100とし、総参照回数432の重み付け値を10とする、といった方法もある。また、更新日時425のように、直接Pr値として用いることができない登録情報については、他の登録情報とは異なる重み付け値を用意しても良い。
Here, Pr can be used as a numerical value as it is when it is counted numerical information such as the total number of times of reference. However, for information that cannot be directly used as a numerical value, such as the update date and
次に、ステップS811では、ステップS810において算出された各登録情報についてのポイントPuを合計してPustを算出する。このポイントPustが登録情報に基づいて各ページに与えられた重み付けとなる。 Next, in step S811, the point Pu for each piece of registration information calculated in step S810 is summed to calculate a paste. This point Post is a weight given to each page based on the registration information.
ステップS812では、全てのページについてPustが算出されたかどうかが判定され、残っているページがある場合(ステップS812において「NO」)にはNuをインクリメントしてステップS808に戻りポイントPustの算出のための処理を継続する。一方、全てのページについてPustが算出された場合(ステップS812において「YES」)には、ステップS814に移行して各ページ毎に、検索結果2を決定するためのポイント:PuallをPuall=Ps+Pustにより算出する。これにより、検索結果と検索依頼ユーザのオプション設定内容との両方を反映した検索結果を得ることができる。尚、本実施形態ではPsとPustを単純に足し合わせる場合を記載したが、ここで更に重み付けを行って、例えばPuall=Ps+Pust・N(Nは所定数)としても良い。このようにすれば、ユーザのオプション設定の内容が生成される検索結果に更に反映されることとなる。また、検索結果1の順位を全く考慮しなくても良い。この場合は、ステップS806におけるPsの算出工程と、本工程とがスキップされ、Puall=Pustとなる。
In step S812, it is determined whether or not the paste has been calculated for all pages. If there is a remaining page (“NO” in step S812), Nu is incremented and the process returns to step S808 to calculate the point Past. Continue processing. On the other hand, if the paste is calculated for all pages (“YES” in step S812), the process proceeds to step S814, and the point for determining the
次にステップS815では、ステップS814において算出されたPuallの値に基づいてPuallが大きい順にページの順位を決定し、検索結果1の並び順をソートして検索結果2を作成する。ステップS816では、検索結果2(ステップS805から直接移行してきた場合は検索結果1)をクライアント101へ送信する。
Next, in step S815, the order of pages is determined in descending order based on the value of Pull calculated in step S814, and the
以上のように、本実施形態に対応するサーバ103では、検索依頼ユーザのユーザデータやページの内容以外の情報に基づいて検索処理を行い、検索結果を作成することができる。
As described above, the
より具体的には、職業、年齢、趣味といったユーザ個人の情報を独立した項目として取り扱い、項目の共通するユーザの統計的情報(例えば、10代のユーザの総参照回数や、ゴルフを趣味とするユーザの直近の参照回数など)を利用して、検索依頼ユーザに提供する価値のある検索結果を作成することができる。 More specifically, user's personal information such as occupation, age, and hobby is handled as an independent item, and statistical information of users with common items (for example, the total number of reference of teenage users and golf as a hobby) It is possible to create a search result worth providing to the search requesting user using the user's most recent reference count).
また、検索に際しては、利用するユーザデータをオプション設定604によりユーザが予め指定することができる。これにより、積極的に利用すべきユーザデータの絞り込みをユーザ自らが行うこととなり、ユーザが本来意図したキーワードと関連性の高いページを高い確率で絞り込むことが可能となる。 In searching, user data to be used can be designated in advance by option setting 604. As a result, the user himself / herself narrows down user data that should be actively used, and it is possible to narrow down pages that are highly relevant to the keyword originally intended by the user with a high probability.
例えば、趣味が「ゴルフ」で、職種が「コンピュータプログラマ」であるようなユーザが、キーワードとして「ドライバー」を入力した場合、ユーザが「趣味」と「職種」のどちらを優先的に扱うかを指定しなければ、ゴルフにおける「ドライバー」に関連するページと、コンピュータプログラムに関連する「ドライバー」に関連するページとが混合して検索結果に含まれることとなる。しかし、ユーザが予めオプション設定604において「趣味」を選択していれば、「職種」に関連するページは重み付けの対象から除外されるので、ゴルフにおける「ドライバー」と関連するページが確実に検索結果の上位にランクされるようになる。 For example, when a user whose hobby is “golf” and whose occupation is “computer programmer” inputs “driver” as a keyword, the user decides whether to treat “hobby” or “profession” preferentially. If not specified, a page related to “driver” in golf and a page related to “driver” related to the computer program are mixed and included in the search result. However, if the user has previously selected “hobby” in the option setting 604, the page related to “job type” is excluded from the weighting target, so that the page related to “driver” in golf is surely retrieved. Will be ranked higher.
また、本実施形態では、直近参照回数に基づいてページに重み付けを行っているので、最近立ち上げられたばかりで総参照回数はあまり大きくないページであっても、人気のあるページであれば、当然に直近の参照回数が大きくなり、他のページよりもポイント(Pu)が高くなる。従って、このようなページが検索結果の上位にランクされるようになる。また、リンク切れしているページがあっても、そのようなページは、直近参照回数が伸びないのが通常であるから、この直近参照回数を利用することで、検索結果から除外することが可能となる。 Further, in this embodiment, the pages are weighted based on the most recent reference count. Therefore, even if the page has just been recently launched and the total reference count is not so large, it is of course necessary if the page is a popular page. The number of the latest references increases, and the point (Pu) becomes higher than other pages. Accordingly, such a page is ranked higher in the search results. Also, even if there is a page with a broken link, such a page usually does not increase in the number of the latest references, so it is possible to exclude it from the search results by using this latest number of references. It becomes.
更に、増加アンカー数を利用すれば、ブログ(ウェブログ)等において、積極的に情報を収集し、公開しているようなページを検索結果の上位にランクすることが可能となる。 Furthermore, if the increased number of anchors is used, it is possible to actively collect information on a blog (web log) or the like, and rank a page that is open to the top of the search results.
[その他の実施形態]
以上の処理(例えば上記図5、図7又は図8に示したフローチャートに従った処理等)をプログラムとしてCD−R、ROMやDVD−ROM、MO等の記憶媒体に記憶させ、この記憶媒体に記憶されているプログラムをコンピュータに読み込ませる(インストール、もしくはコピーさせる)、或いは、ネットワークを介して所定のサーバからダウンロードすることで、このコンピュータは以上の処理を行うことができる。よって、この記憶媒体も本発明の範疇にあることは明白である。本発明は上記実施の形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために、以下の請求項を添付する。[Other embodiments]
The above processing (for example, processing according to the flowchart shown in FIG. 5, FIG. 7 or FIG. 8 above) is stored as a program in a storage medium such as a CD-R, ROM, DVD-ROM, or MO, and is stored in this storage medium. The computer can perform the above processing by causing the computer to read (install or copy) the stored program or to download the program from a predetermined server via a network. Therefore, it is obvious that this storage medium is also within the scope of the present invention. The present invention is not limited to the above-described embodiments, and various changes and modifications can be made without departing from the spirit and scope of the present invention. Therefore, in order to make the scope of the present invention public, the following claims are attached.
Claims (7)
Webページに関する登録情報を格納する登録情報格納手段と、
前記クライアント端末から前記検索情報を受信する受信手段と、
前記検索情報に含まれるキーワードに関連するWebページを検索用情報から検索し、第1の検索結果を生成する第1の検索結果生成手段と、
前記クライアント端末のユーザに固有のデータであって、対応するユーザについて、少なくとも、年齢、性別、地域属性、職種、未既婚、住居形態、年収、車の所有、及び、趣味のいずれかの種別に関する情報を含むユーザデータを、ユーザ毎に格納するユーザデータ格納手段と、
前記検索情報から、前記ユーザを特定するための識別情報を抽出する抽出手段と、
前記ユーザデータ格納手段に格納されたユーザデータのうち、前記識別情報に対応する第1のユーザデータを取得するユーザデータ取得手段と、
前記登録情報格納手段に格納された、前記第1の検索結果に含まれるWebページに関する登録情報から、前記検索情報に含まれる前記登録情報の利用の有無に関する設定情報と、前記第1のユーザデータとを利用して第1の登録情報を選択する選択手段と、
前記第1の登録情報に基づいて、前記第1の検索結果に含まれるWebページの重み付け値を、該Webページ毎に算出する算出手段と、
Webページ毎に算出された前記重み付け値に基づき、前記第1の検索結果に含まれるWebページの順位を決定する順位決定手段と、
決定された前記順位により前記第1の検索結果に含まれるWebページをソートして第2の検索結果を生成する第2の検索結果生成手段と、
前記第2の検索結果を前記クライアント端末に送信する送信手段と
を備え、
前記登録情報には、前記Webページについて、少なくとも、複数のユーザにより参照された回数の前記ユーザデータの種別毎の総計、直近の所定期間内に複数のユーザにより参照された回数の前記ユーザデータの種別毎の合計、該Webページをブックマークに登録している前記ユーザデータの種別毎のユーザ数のいずれかが含まれ、
前記設定情報は、前記重み付け値を算出するために利用する前記登録情報を指定する情報であって、
前記選択手段は、前記設定情報において指定された前記登録情報のうち、少なくとも前記第1のユーザデータに含まれる各種別に関する情報に対応する登録情報を、前記第1の登録情報として選択することを特徴とする情報検索装置。An information search device that searches information on a Web page on the Internet based on search information input from a client terminal, and transmits a search result to the client terminal.
Registration information storage means for storing registration information relating to a web page;
Receiving means for receiving the search information from the client terminal;
First search result generating means for searching a Web page related to a keyword included in the search information from search information and generating a first search result;
It is data specific to the user of the client terminal, and for the corresponding user, at least regarding age, gender, regional attribute, occupation, unmarried, dwelling form, annual income, car ownership, and hobby User data storage means for storing user data including information for each user;
Extraction means for extracting identification information for identifying the user from the search information;
Among user data stored in the user data storage means, user data acquisition means for acquiring first user data corresponding to the identification information;
From the registration information regarding the Web page included in the first search result stored in the registration information storage means, setting information regarding whether to use the registration information included in the search information, and the first user data Selecting means for selecting the first registration information using
Calculation means for calculating, for each Web page, a weighting value of the Web page included in the first search result based on the first registration information;
Rank determining means for determining the rank of the Web page included in the first search result based on the weighting value calculated for each Web page;
Second search result generation means for generating a second search result by sorting Web pages included in the first search result according to the determined order;
Transmission means for transmitting the second search result to the client terminal,
Wherein the registration information for the Web page, at least, the sum of each of the user data of the number of times referenced by the plurality of user type, the user data of the number of times referenced by a plurality of users within a latest predetermined period the total for each type, one of the number of users of each type of the user data that has registered the Web page in the bookmark is included,
The setting information is information for specifying the registration information used for calculating the weighting value,
The selecting means selects, as the first registration information, registration information corresponding to at least information relating to each type included in the first user data among the registration information specified in the setting information. A characteristic information retrieval device.
ることを特徴とする請求項1に記載の情報検索装置。 The registration information includes at least the total number of times the Web page has been referred to by a plurality of users, the total number of times the Web pages have been referred to within a predetermined period, and the Web page registered in a bookmark. The information search apparatus according to claim 1, further comprising any one of the number of existing users and the number of anchors added within a most recent predetermined period.
前記送信手段は、前記第1の検索結果を前記クライアント端末へ送信することを特徴とする請求項1乃至3のいずれか1項に記載の情報検索装置。When the setting information does not specify the registration information used to calculate the weight, the selection unit does not select the first registration information,
4. The information search apparatus according to claim 1, wherein the transmission unit transmits the first search result to the client terminal. 5.
前記クライアント端末では、前記検索情報生成情報を利用して前記キーワードの入力と、前記登録情報の利用の有無に関する設定入力とが受け付けられることを特徴とする請求項1乃至4のいずれか1項に記載の情報検索装置。Further comprising generation information transmission means for transmitting search information generation information for generating the search information to the client terminal;
The said client terminal receives the input of the said keyword using the said search information production | generation information, and the setting input regarding the presence or absence of the utilization of the said registration information, The any one of Claim 1 thru | or 4 characterized by the above-mentioned. The information retrieval device described.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2005/003928 WO2006095409A1 (en) | 2005-03-07 | 2005-03-07 | Information retrieving device, computer program, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006095409A1 JPWO2006095409A1 (en) | 2008-08-14 |
JP4527770B2 true JP4527770B2 (en) | 2010-08-18 |
Family
ID=36953020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007506942A Active JP4527770B2 (en) | 2005-03-07 | 2005-03-07 | Information retrieval apparatus, computer program, and storage medium |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4527770B2 (en) |
WO (1) | WO2006095409A1 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4648455B2 (en) * | 2005-05-06 | 2011-03-09 | エヌエイチエヌ コーポレーション | Personalized search method and personalized search system |
US20080010252A1 (en) * | 2006-01-09 | 2008-01-10 | Google, Inc. | Bookmarks and ranking |
US20080104042A1 (en) * | 2006-10-25 | 2008-05-01 | Microsoft Corporation | Personalized Search Using Macros |
JP2009003520A (en) * | 2007-06-19 | 2009-01-08 | Mic 9 Co Ltd | Database server device, method of providing search service, and related method |
JP5014252B2 (en) * | 2008-05-20 | 2012-08-29 | ヤフー株式会社 | Method, server, and program for managing index data for searching content |
JP2023078847A (en) * | 2021-11-26 | 2023-06-07 | 三菱電機Itソリューションズ株式会社 | Document management device, document management method, and document management program |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002032401A (en) * | 2000-07-18 | 2002-01-31 | Mitsubishi Electric Corp | Method and device for document retrieval and computer- readable recording medium with recorded program making computer actualize method for document retrieving |
JP2002215671A (en) * | 2001-01-16 | 2002-08-02 | Nippon Hoso Kyokai <Nhk> | Information retrieval device and information retrieval method |
JP2002351916A (en) * | 2001-05-30 | 2002-12-06 | Bevoid Corporation Ltd | Device and method for retrieving web information and program making computer execute this method |
JP2003281179A (en) * | 2002-03-22 | 2003-10-03 | Hitachi Information Systems Ltd | Retrieval site server device, retrieval information display control method, program and recording medium |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4011906B2 (en) * | 2001-12-13 | 2007-11-21 | 富士通株式会社 | Profile information search method, program, recording medium, and apparatus |
-
2005
- 2005-03-07 JP JP2007506942A patent/JP4527770B2/en active Active
- 2005-03-07 WO PCT/JP2005/003928 patent/WO2006095409A1/en not_active Application Discontinuation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002032401A (en) * | 2000-07-18 | 2002-01-31 | Mitsubishi Electric Corp | Method and device for document retrieval and computer- readable recording medium with recorded program making computer actualize method for document retrieving |
JP2002215671A (en) * | 2001-01-16 | 2002-08-02 | Nippon Hoso Kyokai <Nhk> | Information retrieval device and information retrieval method |
JP2002351916A (en) * | 2001-05-30 | 2002-12-06 | Bevoid Corporation Ltd | Device and method for retrieving web information and program making computer execute this method |
JP2003281179A (en) * | 2002-03-22 | 2003-10-03 | Hitachi Information Systems Ltd | Retrieval site server device, retrieval information display control method, program and recording medium |
Also Published As
Publication number | Publication date |
---|---|
WO2006095409A1 (en) | 2006-09-14 |
JPWO2006095409A1 (en) | 2008-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11669493B2 (en) | Generating file usage information | |
US6718365B1 (en) | Method, system, and program for ordering search results using an importance weighting | |
US6865568B2 (en) | Method, apparatus, and computer-readable medium for searching and navigating a document database | |
KR101130420B1 (en) | System and method for a unified and blended search | |
US12008323B2 (en) | Generating and provisioning of additional content for source perspective(s) of a document | |
US20130151500A1 (en) | Lateral search | |
JP2008513881A (en) | Method, system, and computer program product for searching personal web documents, navigating between documents, and ranking documents | |
US20070157100A1 (en) | System and method for organization and retrieval of files | |
JP4527770B2 (en) | Information retrieval apparatus, computer program, and storage medium | |
US8171012B2 (en) | Document management apparatus, method, system, medium storing a program thereof | |
JP2003281179A (en) | Retrieval site server device, retrieval information display control method, program and recording medium | |
JP2011203964A (en) | Document management system and method | |
JP2009265754A (en) | Information providing system, information providing method, and information providing program | |
JP4344596B2 (en) | Content search system, content search program, and recording medium | |
CN110235121B (en) | System and method for enhanced online research | |
JP4445849B2 (en) | File search method, file search device, and file search program | |
WO2020179537A1 (en) | Labeling support method, labeling support device, and program | |
US8190603B2 (en) | Information providing system, information providing method and information providing record medium | |
WO2006064573A1 (en) | Web information providing device, method, and program | |
JP2009093554A (en) | Search support method, search support system, application server, and search support program | |
JP7501066B2 (en) | Information processing device and program | |
JP2018169770A (en) | Information management system, information management method and information management program | |
JP2004086332A (en) | Knowledge sharing system, knowledge management supporting system, and condition retrieving method of shared document | |
JP2006127029A (en) | Document retrieval system, program, and recording medium | |
JP2002041524A (en) | System and method for document retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080828 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100517 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100603 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130611 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4527770 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160611 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |