JP4842237B2 - Search device and search method - Google Patents

Search device and search method Download PDF

Info

Publication number
JP4842237B2
JP4842237B2 JP2007274695A JP2007274695A JP4842237B2 JP 4842237 B2 JP4842237 B2 JP 4842237B2 JP 2007274695 A JP2007274695 A JP 2007274695A JP 2007274695 A JP2007274695 A JP 2007274695A JP 4842237 B2 JP4842237 B2 JP 4842237B2
Authority
JP
Japan
Prior art keywords
search
web page
ranking
information
link information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007274695A
Other languages
Japanese (ja)
Other versions
JP2009104356A (en
Inventor
英之 前川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2007274695A priority Critical patent/JP4842237B2/en
Publication of JP2009104356A publication Critical patent/JP2009104356A/en
Application granted granted Critical
Publication of JP4842237B2 publication Critical patent/JP4842237B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、検索装置および検索方法に関し、特に、ネットワーク上に公開された情報の取得を希望するユーザの多様な嗜好を幅広く満たすことができる検索装置および検索方法に関する。   The present invention relates to a search device and a search method, and more particularly to a search device and a search method that can satisfy a wide variety of preferences of users who desire to acquire information published on a network.

現在、例えばインターネットなどのネットワーク上に公開された情報の中から所望の情報を得るために、検索サイトが利用されるのが一般的である。検索サイトは、インターネット上で公開されているため、ユーザがブラウザを介して気軽に利用することが可能となっており、ユーザが所望の情報に関連するキーワードを入力すると、このキーワードを含むウェブページなどが検索され、該当するウェブページの一覧が検索結果としてユーザへ提供される。この検索結果においては、それぞれのウェブページのURL(Uniform Resource Locator)やキーワード部分の抜粋などが表示されるとともに、これらのウェブページへのリンクが張られている。したがって、ユーザは、検索結果を閲覧した上で、所望の情報に関連していると思われるウェブページのリンクを辿ることにより、ウェブページから所望の情報を取得することができる。   Currently, a search site is generally used to obtain desired information from information disclosed on a network such as the Internet. Since the search site is published on the Internet, the user can easily use it via a browser, and when the user inputs a keyword related to desired information, a web page including the keyword And a list of corresponding web pages is provided to the user as a search result. In this search result, URLs (Uniform Resource Locators) of the respective web pages, excerpts of keyword portions, and the like are displayed, and links to these web pages are provided. Therefore, the user can obtain desired information from the web page by browsing the search result and following the link of the web page that seems to be related to the desired information.

また、近年では、インターネット上に公開されたウェブページ数が増大しているため、検索サイトにおいて入力されたキーワードを含むウェブページの数も必然的に多くなっている。結果として、検索結果として表示されるウェブページの一覧の中に、所望の情報との関連性があまりないウェブページも含まれてしまうことがある。そこで、ウェブページ検索におけるユーザの便宜を図るために、例えば特許文献1に記載されたように、ウェブページ間のリンク関係に基づいて各ウェブページの重要性をランク付けし、ランクが高いウェブページほど目立つ位置(例えばウェブページの一覧の先頭部分)に配置して検索結果を提供することが行われている。   Further, in recent years, since the number of web pages published on the Internet has increased, the number of web pages including keywords input on a search site has inevitably increased. As a result, a list of web pages displayed as search results may include web pages that are not very relevant to the desired information. Therefore, for the convenience of the user in web page search, as described in Patent Document 1, for example, the importance of each web page is ranked based on the link relationship between the web pages, and the web page with high rank A search result is provided by placing it in a conspicuous position (for example, the top part of a list of web pages).

他にも、例えば非特許文献1に記載されたように、Google(登録商標)と呼ばれる検索サイトでは、ウェブページのリンク・被リンクの関係からそれぞれのウェブページに対する評価値を算出し、評価値が大きいウェブページほど目立つ位置に配置して検索結果を提供することが行われている。非特許文献1に記載された評価値は、他のウェブページからのリンクが多いほど良質なウェブページであり、かつリンク元のウェブページが良質であるほどリンク先のウェブページも良質であるとの考え方に基づいて算出されている。   In addition, as described in Non-Patent Document 1, for example, in a search site called Google (registered trademark), an evaluation value for each web page is calculated from the link / linked relationship of the web page, and the evaluation value Web pages that are larger in size are placed in more prominent positions to provide search results. The evaluation value described in Non-Patent Document 1 is that the more links from other web pages, the better the web page, and the better the link source web page, the better the linked web page. It is calculated based on the idea.

特開2006−127529号公報JP 2006-127529 A 馬場肇、“Googleの秘密−PageRank徹底解説”、平成13年2月1日掲載、[online]、[平成19年10月2日検索]、インターネット<URL:http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html>Satoshi Baba, “Google's Secret-A Complete Description of PageRank”, published on February 1, 2001, [online], [searched on October 2, 2007], Internet <URL: http://www.kusastro.kyoto -u.ac.jp/~baba/wais/pagerank.html>

上述した従来技術のように、ウェブページ間のリンク関係に基づいてウェブページの評価値が決定され、評価値が大きい順にウェブページの一覧が提供されると、多くのユーザによって、評価値が大きいウェブページのみが閲覧されることになる。換言すれば、多くのウェブページからリンクされた注目度の高いウェブページが頻繁に閲覧されることになる。   As in the related art described above, when web page evaluation values are determined based on the link relationship between web pages and a list of web pages is provided in descending order of evaluation values, the evaluation value is large by many users. Only web pages will be viewed. In other words, a web page with a high degree of attention linked from many web pages is frequently browsed.

しかしながら、例えばあまり注目されていない情報や話題を取得したいユーザにとっては、従来のランク付けが施された検索結果から所望のウェブページに辿り着くのが困難になるという問題がある。すなわち、多くの人に知られている情報ではなく、目立たない優良な情報をネットワークから取得したいユーザにとっては、既存の方法でウェブページがランキングされた検索結果は、所望の情報を取得するのに適していない。このように、従来の検索サイトにおいては、ユーザの好みによっては、必ずしも満足できる検索結果が得られないのが実情である。   However, there is a problem that it is difficult for a user who wants to acquire information and topics that are not attracting much attention to reach a desired web page from a search result that has been conventionally ranked. In other words, for users who want to acquire not-so-conspicuous and excellent information from the network, but not the information known to many people, the search results in which the web pages are ranked by the existing method are used to acquire the desired information. Not suitable. As described above, in the conventional search site, a satisfactory search result is not always obtained depending on the preference of the user.

本発明はかかる点に鑑みてなされたものであり、ネットワーク上に公開された情報の取得を希望するユーザの多様な嗜好を幅広く満たすことができる検索装置および検索方法を提供することを目的とする。   The present invention has been made in view of such points, and an object of the present invention is to provide a search device and a search method that can satisfy a wide variety of preferences of users who desire to acquire information published on a network. .

上記課題を解決するために、本発明に係る検索装置は、ウェブページに係る情報を記憶するデータベースを検索して、ユーザが指定する検索キーワードに合致するウェブページへのリンク情報および当該ウェブページの注目度を示す評価値を取得する取得手段と、前記取得手段によって取得された評価値の逆数を算出する算出手段と、前記算出手段によって算出された逆数に応じて、前記取得手段によってリンク情報および評価値が取得されたすべてのウェブページをランキングするランキング手段と、前記ランキング手段によるランキングの結果に従って、ランクが高いウェブページへのリンク情報ほど目立つ位置に配置された検索結果表示用ウェブページを生成する生成手段と、前記検索キーワードを指定したユーザの識別情報に対応付けて、過去に前記取得手段によって取得されたリンク情報を検索履歴情報として記憶する検索履歴記憶手段と、を有し、前記ランキング手段は、前記算出手段によって算出された逆数が等しいウェブページが複数ある場合、当該複数のウェブページのうち、リンク情報が前記検索履歴情報に含まれないウェブページのランクを、リンク情報が前記検索履歴情報に含まれるウェブページのランクよりも高くすることを特徴とする。 In order to solve the above-described problem, a search device according to the present invention searches a database storing information related to a web page, links information to a web page that matches a search keyword specified by the user, and the web page An acquisition unit that acquires an evaluation value indicating a degree of attention; a calculation unit that calculates a reciprocal of the evaluation value acquired by the acquisition unit; and link information and a link information by the acquisition unit according to the reciprocal calculated by the calculation unit A ranking means for ranking all web pages from which evaluation values have been obtained, and a search result display web page that is arranged in a more conspicuous position as the link information to the higher-ranking web page is generated according to the ranking result by the ranking means. generation means for, with corresponding to the identification information of the user specified the search keyword Search history storage means for storing the link information acquired by the acquisition means in the past as search history information, and the ranking means has a plurality of web pages having the same reciprocal number calculated by the calculation means. In this case, among the plurality of web pages, the rank of the web page whose link information is not included in the search history information is set higher than the rank of the web page whose link information is included in the search history information. .

この構成によれば、注目度を示す評価値による通常のランキングとは逆の順序でウェブページがランキングされ、注目度が低いウェブページへのリンク情報ほど目立つ位置に配置された検索結果が得られるため、通常の検索では閲覧される機会が少なく一般的には注目されていない情報を優先的にユーザへ提供することができ、ネットワーク上に公開された情報の取得を希望するユーザの多様な嗜好を幅広く満たすことができる。また、評価値の逆数のみではウェブページのランキングができない場合に、各ウェブページが過去にも検索されたか否かによってランクを決定するため、一般的には注目されておらず、かつユーザ個人が過去に注目していないウェブページのランクを相対的に高くすることができる。 According to this configuration, the web pages are ranked in the reverse order to the normal ranking based on the evaluation value indicating the degree of attention, and the search result is obtained in which the link information to the web page with the lower degree of attention is arranged at a more prominent position. For this reason, it is possible to preferentially provide users with information that is rarely viewed in ordinary searches and is not generally attracting attention, and various preferences of users who wish to obtain information published on the network Can satisfy a wide range. In addition, when the ranking of the web page cannot be performed only by the reciprocal of the evaluation value, the rank is determined depending on whether or not each web page has been searched in the past. The rank of a web page that has not been noticed in the past can be made relatively high.

また、本発明に係る検索装置は、上記構成において、前記取得手段は、注目度が低いウェブページを優先させる検索を希望するか否かを示すランキング種別情報を検索キーワードとともにユーザ端末から受信する受信手段を含み、前記算出手段は、前記受信手段によって受信されたランキング種別情報が注目度が低いウェブページを優先させる検索希望の旨を示す場合にのみ、評価値の逆数を算出する構成を採る。   In the search device according to the present invention, in the configuration described above, the acquisition unit receives, from the user terminal, ranking type information indicating whether or not a search for giving priority to a web page with a low degree of attention is desired together with a search keyword. The calculation means employs a configuration for calculating the reciprocal of the evaluation value only when the ranking type information received by the receiving means indicates a search request that prioritizes a web page with a low degree of attention.

この構成によれば、ユーザの希望がある場合にのみ評価値の逆数を算出するため、注目度が低いウェブページを優先させる検索の希望がない場合には、元の評価値をそのまま用いてウェブページをランキングすることができ、ユーザの希望に応じて検索結果のランキング方法を切り替えることができる。   According to this configuration, since the reciprocal of the evaluation value is calculated only when there is a user's request, when there is no desire to search for a web page with a low degree of attention, the original evaluation value is used as it is. Pages can be ranked, and the ranking method of search results can be switched according to the user's wishes.

また、本発明に係る検索装置は、上記構成において、前記生成手段は、前記受信手段によって受信されたランキング種別情報が注目度が低いウェブページを優先させる検索希望の旨を示す場合にのみ、ウイルスが仕込まれたウェブページのリンク情報を除外した検索結果表示用ウェブページを生成することを特徴とする。 In the search device according to the present invention, in the configuration described above, the generation unit may detect a virus only when the ranking type information received by the reception unit indicates a search request that prioritizes a web page with low attention. A search result display web page is generated by excluding the link information of the web page in which is stored.

また、本発明に係る検索装置は、上記構成において、前記生成手段は、前記受信手段によって受信されたランキング種別情報が注目度が低いウェブページを優先させる検索希望の旨を示す場合にのみ、不特定多数のユーザへの広告配信のためにユーザのメールアドレスを収集することを目的とするウェブページのリンク情報を除外した検索結果表示用ウェブページを生成することを特徴とする。In the search device according to the present invention, in the configuration described above, the generation unit may be disabled only when the ranking type information received by the reception unit indicates a search request that prioritizes a web page with low attention. A search result display web page is generated that excludes link information of a web page for the purpose of collecting user e-mail addresses for advertisement distribution to a specific number of users.

また、本発明に係る検索装置は、上記構成において、ユーザが指定する検索キーワードに関連する広告データを取得する広告データ取得手段をさらに有し、前記生成手段は、検索結果表示用ウェブページの余白に前記広告データ取得手段によって取得された広告データを配置する構成を採る。   The search device according to the present invention further includes advertisement data acquisition means for acquiring advertisement data related to a search keyword specified by a user in the above configuration, wherein the generation means includes a margin of a search result display web page. The advertisement data acquired by the advertisement data acquisition means is arranged in the configuration.

この構成によれば、ユーザが関心を持つキーワードに関連する広告データが検索結果表示用ウェブページに配置されるため、広告データの訴求力を高めることができる。   According to this configuration, since the advertisement data related to the keyword that the user is interested in is arranged on the search result display web page, the appealing power of the advertisement data can be enhanced.

また、本発明に係る検索方法は、ウェブページに係る情報を記憶するデータベースを検索して、ユーザが指定する検索キーワードに合致するウェブページへのリンク情報および当該ウェブページの注目度を示す評価値を取得する取得ステップと、前記取得ステップにて取得された評価値の逆数を算出する算出ステップと、前記算出ステップにて算出された逆数に応じて、前記取得ステップにてリンク情報および評価値が取得されたすべてのウェブページをランキングするランキングステップと、前記ランキングステップにおけるランキングの結果に従って、ランクが高いウェブページへのリンク情報ほど目立つ位置に配置された検索結果表示用ウェブページを生成する生成ステップと、前記検索キーワードを指定したユーザの識別情報に対応付けて、過去に前記取得ステップにて取得されたリンク情報を検索履歴情報として検索履歴記憶手段に記憶する検索履歴記憶ステップと、を有し、前記ランキングステップは、前記算出ステップによって算出された逆数が等しいウェブページが複数ある場合、当該複数のウェブページのうち、リンク情報が前記検索履歴情報に含まれないウェブページのランクを、リンク情報が前記検索履歴情報に含まれるウェブページのランクよりも高くすることを特徴とする。 Further, the search method according to the present invention searches a database storing information related to a web page, and evaluates the link information to the web page that matches the search keyword specified by the user and the attention level of the web page. In accordance with the reciprocal number calculated in the calculating step, the calculating step calculating the reciprocal number of the evaluation value acquired in the acquiring step, the link information and the evaluation value in the acquiring step A ranking step for ranking all the acquired web pages, and a generation step for generating a search result display web page arranged in a more conspicuous position according to the ranking result in the ranking step, the link information to the web page having a higher rank. If, corresponding to the identification information of the user specified the search keyword And a search history storage step of storing the link information acquired in the acquisition step in the past as search history information in the search history storage means, and the ranking step is an inverse number calculated by the calculation step. When there are a plurality of web pages with the same web page, the rank of the web pages in which the link information is not included in the search history information is more than the rank of the web pages in which the link information is included in the search history information. It is characterized by being raised .

また、本発明にかかる検索プログラムは、コンピュータによって実行される検索プログラムであって、前記コンピュータに、ウェブページに係る情報を記憶するデータベースを検索して、ユーザが指定する検索キーワードに合致するウェブページへのリンク情報および当該ウェブページの注目度を示す評価値を取得する取得ステップと、前記取得ステップにて取得された評価値の逆数を算出する算出ステップと、前記算出ステップにて算出された逆数に応じて、前記取得ステップにてリンク情報および評価値が取得されたすべてのウェブページをランキングするランキングステップと、前記ランキングステップにおけるランキングの結果に従って、ランクが高いウェブページへのリンク情報ほど目立つ位置に配置された検索結果表示用ウェブページを生成する生成ステップと、前記検索キーワードを指定したユーザの識別情報に対応付けて、過去に前記取得ステップにて取得されたリンク情報を検索履歴情報として検索履歴記憶手段に記憶する検索履歴記憶ステップと、を実行させ、前記ランキングステップにおいて、前記コンピュータに、前記算出ステップによって算出された逆数が等しいウェブページが複数ある場合、当該複数のウェブページのうち、リンク情報が前記検索履歴情報に含まれないウェブページのランクを、リンク情報が前記検索履歴情報に含まれるウェブページのランクよりも高くするステップを実行させることを特徴とする。 The search program according to the present invention is a search program executed by a computer, and searches the computer storing a database storing information related to the web page in the computer to match a search keyword specified by a user. An acquisition step of acquiring an evaluation value indicating the degree of attention of the link information and the web page, a calculation step of calculating an inverse number of the evaluation value acquired in the acquisition step, and an inverse number calculated in the calculation step In accordance with the ranking step of ranking all the web pages from which the link information and the evaluation value have been acquired in the acquisition step, and according to the ranking result in the ranking step, the position where the link information to the higher-ranked web page is more conspicuous Search result display web located in A generating step of generating over di-, in association with the identification information of the user specified the search keyword, the search history stored in the search-history storage means link information acquired by the acquisition step in the past as search log information And in the ranking step, when there are a plurality of web pages having the same reciprocal number calculated in the calculation step in the ranking step, link information is included in the search history information among the plurality of web pages. The step of causing the rank of the web page not included to be higher than the rank of the web page whose link information is included in the search history information is executed .

これらによれば、注目度を示す評価値による通常のランキングとは逆の順序でウェブページがランキングされ、注目度が低いウェブページへのリンク情報ほど目立つ位置に配置された検索結果が得られるため、通常の検索では閲覧される機会が少なく一般的には注目されていない情報を優先的にユーザへ提供することができ、ネットワーク上に公開された情報の取得を希望するユーザの多様な嗜好を幅広く満たすことができる。   According to these, the web pages are ranked in the reverse order to the normal ranking based on the evaluation value indicating the attention level, and the link information to the web page with the lower attention degree is obtained in a more conspicuous position. In general search, it is possible to preferentially provide users with information that is rarely viewed and is generally not attracting attention, and to satisfy various preferences of users who wish to obtain information published on the network. Can satisfy a wide range.

本発明によれば、ネットワーク上に公開された情報の取得を希望するユーザの多様な嗜好を幅広く満たすことができる。   ADVANTAGE OF THE INVENTION According to this invention, the various preference of the user who desires the acquisition of the information disclosed on the network can be satisfied widely.

本発明の骨子は、ユーザが入力したキーワードに対して検索された各ウェブページについて、リンク関係や閲覧された回数などに応じた注目度の高さを示す評価値の逆数を算出し、算出された逆数が大きい順にウェブページのランキングを行い、注目されていないウェブページのランクを高くすることである。以下、本発明の一実施の形態について、図面を参照して詳細に説明する。   The gist of the present invention is calculated by calculating the reciprocal of the evaluation value indicating the degree of attention according to the link relationship or the number of times of browsing for each web page searched for the keyword input by the user. The ranking of web pages is performed in descending order of reciprocal numbers, and the rank of web pages that are not attracting attention is increased. Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.

図1は、本発明の一実施の形態に係る検索システムの構成を示すブロック図である。同図に示す検索システムは、ユーザ端末100−1〜100−m(mは1以上の整数)、情報検索装置200、インデックスデータベース(以下「インデックスDB」と略記する)300、および広告データベース(以下「広告DB」と略記する)400を有している。   FIG. 1 is a block diagram showing a configuration of a search system according to an embodiment of the present invention. The search system shown in FIG. 1 includes user terminals 100-1 to 100-m (m is an integer of 1 or more), an information search device 200, an index database (hereinafter abbreviated as “index DB”) 300, and an advertisement database (hereinafter referred to as “index database”). 400 (abbreviated as “advertisement DB”).

ユーザ端末100−1〜100−mは、それぞれユーザが使用するパーソナルコンピュータなどの端末装置であり、ネットワークNを介して情報検索装置200に接続されている。本実施の形態においては、ユーザ端末100−1〜100―mは、ユーザが入力した検索キーワードを含む検索要求をネットワークNを介して情報検索装置200へ送信し、検索キーワードに関連するウェブページの一覧を含む検索結果をネットワークNを介して情報検索装置200から受信する。   Each of the user terminals 100-1 to 100-m is a terminal device such as a personal computer used by the user, and is connected to the information search device 200 via the network N. In the present embodiment, the user terminals 100-1 to 100-m transmit a search request including the search keyword input by the user to the information search apparatus 200 via the network N, and the web page related to the search keyword is transmitted. A search result including the list is received from the information search apparatus 200 via the network N.

情報検索装置200は、ユーザ端末100−1〜100−mから検索要求を受信し、検索要求に含まれる検索キーワードに関連するウェブページをインデックスDB300から検索する。そして、情報検索装置200は、検索により得られたウェブページのURLなどを一覧可能な検索の結果ページを生成し、検索結果として検索要求送信元のユーザ端末100−1〜100−mへ送信する。情報検索装置200の詳細な構成および動作については、後に詳述する。   The information search apparatus 200 receives a search request from the user terminals 100-1 to 100-m, and searches the index DB 300 for a web page related to the search keyword included in the search request. Then, the information search apparatus 200 generates a search result page capable of listing URLs of web pages obtained by the search, and transmits the search result page to the user terminals 100-1 to 100-m that are the search request transmission sources. . The detailed configuration and operation of the information search apparatus 200 will be described later in detail.

インデックスDB300は、例えばインターネットなどのネットワーク上に公開されたウェブページごとに、ページ内容の見出しとなるインデックスやURLなどを記憶する。具体的には、例えば図2に示すように、インデックスDB300は、ウェブページごとに、ページ内容を示すインデックス、インデックスの取得日時、URL、および評価値を記憶している。   The index DB 300 stores, for example, an index or a URL serving as a heading for page contents for each web page published on a network such as the Internet. Specifically, for example, as illustrated in FIG. 2, the index DB 300 stores an index indicating page content, an index acquisition date, URL, and an evaluation value for each web page.

インデックスは、所謂ディレクトリ型検索サイトにおいては、ウェブページの作者がページを代表する単語として登録した見出し語などである。また、所謂ロボット型検索サイトにおいては、所定のプログラムによるクローリングと呼ばれる巡回によって収集されたウェブページごとのインデックスが記憶されている。なお、本実施の形態においては、インデックスDB300は、ウェブページの作者が登録したインデックスおよびクローリングによって収集されたインデックスの双方を記憶していても良い。また、インデックスDB300は、1つのウェブページに対応付けて複数のインデックスを記憶していても良い。   In the so-called directory type search site, the index is a headword or the like registered as a word representing the page by the author of the web page. In the so-called robot-type search site, an index for each web page collected by patrol called crawling by a predetermined program is stored. In the present embodiment, the index DB 300 may store both the index registered by the creator of the web page and the index collected by crawling. Further, the index DB 300 may store a plurality of indexes in association with one web page.

インデックスの取得日時は、インデックスがインデックスDB300に記憶された日時を示している。すなわち、インデックスがウェブページの作者により登録されたものであれば、その登録日時が記憶されており、インデックスがクローリングにより収集されたものであれば、クローリングの実行日時が記憶されている。   The acquisition date and time of the index indicates the date and time when the index was stored in the index DB 300. That is, if the index is registered by the author of the web page, the registration date / time is stored, and if the index is collected by crawling, the execution date / time of crawling is stored.

URLは、それぞれのウェブページのネットワーク上での位置を示すアドレス情報である。それぞれのウェブページには、固有のURLが付与されているため、URLによって各ウェブページを特定することが可能である。   The URL is address information indicating the position of each web page on the network. Since each web page is given a unique URL, each web page can be specified by the URL.

評価値は、それぞれのウェブページの注目度を示している。すなわち、評価値は、例えば多くのウェブページからリンクされているなどのように、注目されているウェブページほど大きな値となる。また、評価値を決定する指標としては、ユーザによる閲覧数などがある。具体的には、多くのユーザが閲覧しているウェブページほど評価値が大きくなる。このようなウェブページごとの評価値は、インデックスDB300または図示しない処理装置によって各ウェブページのリンク関係が解析されたりリンクのクリックログが解析されたりすることにより算出され、インデックス300に記憶される。   The evaluation value indicates the attention level of each web page. That is, the evaluation value becomes larger as the web page attracts attention, such as being linked from many web pages. In addition, the index for determining the evaluation value includes the number of browsing by the user. Specifically, the evaluation value increases as the web page is browsed by many users. Such an evaluation value for each web page is calculated by analyzing the link relation of each web page or analyzing the link click log by the index DB 300 or a processing device (not shown), and is stored in the index 300.

なお、インデックスDB300は、上述したウェブページごとのインデックスやURL以外に、ウェブページ全体のキャッシュやウェブページのインデックス部分の抜粋などを記憶していても良い。   The index DB 300 may store a cache of the entire web page, an excerpt of the index portion of the web page, and the like in addition to the index and URL for each web page described above.

図1に戻って、広告DB400は、検索結果を表示する結果ページに挿入する広告データを記憶する。具体的には、例えば図3に示すように、広告DB400は、様々な広告ジャンルに対応づけてリンク先のバナーなどの広告データを記憶している。広告ジャンルは、広告の内容に関連する単語などであり、広告を提供する広告主が自由に設定することができる。広告データは、例えば広告主のウェブページへのリンクなどを含むバナー画像である。このように広告ジャンルと広告データを関連付けておくことにより、例えばユーザが検索するキーワードに一致した広告ジャンルの広告データを結果ページに挿入することができ、広告の訴求力を高めることができる。   Returning to FIG. 1, the advertisement DB 400 stores advertisement data to be inserted into a result page that displays search results. Specifically, for example, as shown in FIG. 3, the advertisement DB 400 stores advertisement data such as linked banners in association with various advertisement genres. The advertisement genre is a word related to the content of the advertisement, and can be freely set by an advertiser who provides the advertisement. The advertisement data is a banner image including, for example, a link to an advertiser's web page. By associating the advertisement genre with the advertisement data in this way, for example, advertisement data of the advertisement genre that matches the keyword searched by the user can be inserted into the result page, and the appeal of the advertisement can be enhanced.

図4は、本実施の形態に係る情報検索装置200の内部構成を示すブロック図である。同図に示す情報検索装置200は、検索要求受信部201、インデックス検索部202、履歴保持部203、ランキング部204、広告選択部205、結果ページ生成部206、および検索結果送信部207を有している。   FIG. 4 is a block diagram showing an internal configuration of information search apparatus 200 according to the present embodiment. The information search apparatus 200 shown in the figure includes a search request receiving unit 201, an index search unit 202, a history holding unit 203, a ranking unit 204, an advertisement selection unit 205, a result page generation unit 206, and a search result transmission unit 207. ing.

検索要求受信部201は、ユーザ端末100−1〜100−mから送信された検索要求を受信する。検索要求受信部201が受信する検索要求には、例えば図5に示すように、ユーザ(端末)識別情報、検索キーワード、およびランキング種別が含まれている。   The search request receiving unit 201 receives search requests transmitted from the user terminals 100-1 to 100-m. The search request received by the search request receiving unit 201 includes user (terminal) identification information, a search keyword, and a ranking type, for example, as shown in FIG.

ユーザ(端末)識別情報は、ユーザ端末100−1〜100−mを使用するユーザの識別情報やユーザ端末100−1〜100−mそのものの識別情報であり、ユーザがログイン状態である場合には、例えばユーザIDが識別情報に相当し、ユーザが非ログイン状態である場合には、例えばユーザ端末100−1〜100−mのIPアドレスが識別情報に相当する。   The user (terminal) identification information is identification information of a user who uses the user terminals 100-1 to 100-m or identification information of the user terminals 100-1 to 100-m itself. When the user is in a login state, For example, when the user ID corresponds to the identification information and the user is in a non-login state, for example, the IP addresses of the user terminals 100-1 to 100-m correspond to the identification information.

検索キーワードは、ユーザがユーザ端末100−1〜100−mにおいて入力したキーワードであり、ユーザが希望する情報に関連する単語である。検索キーワードは、1つの単語でも良く、複数の単語でも良い。また、単なる単語のみではなく、所定の演算ルールに従って複数の単語を組み合わせた演算式などでも良い。   The search keyword is a keyword input by the user on the user terminals 100-1 to 100-m, and is a word related to information desired by the user. The search keyword may be a single word or a plurality of words. Moreover, not only a simple word but an arithmetic expression combining a plurality of words according to a predetermined arithmetic rule may be used.

ランキング種別は、検索結果であるウェブページの一覧を表示する際に、ユーザが希望するウェブページの配列方法を示すフラグである。すなわち、ランキング種別は、注目度が高いウェブページを上位に配列する通常検索と、あまり注目されていないウェブページを上位に配列するテール検索とのどちらをユーザが希望するかを示している。ここで、テール検索とは、ウェブページごとの注目度のヒストグラムを注目度が高い順に並べた際に、注目度の度数が低く、ヒストグラム全体の輪郭が尻尾のような形状に長く伸びた部分のウェブページを優先的に上位にランク付けする検索のことである。すなわち、「テール」とは、一般的にあまり注目されていないウェブページのことを指し、テール検索は、このテールに相当するウェブページを優先的に検索する方法を示す。   The ranking type is a flag indicating a web page arrangement method desired by the user when displaying a list of web pages as search results. That is, the ranking type indicates whether the user desires a normal search in which web pages with a high degree of attention are arranged at the top or a tail search in which web pages that are not attracting much attention are arranged at the top. Here, tail search refers to the portion of the attention level for each web page that is arranged in descending order of attention level, and the degree of attention level is low, and the entire histogram has a contour that extends long like a tail. A search that ranks web pages preferentially. That is, “tail” refers to a web page that is generally not attracting much attention, and tail search indicates a method of preferentially searching for a web page corresponding to this tail.

検索要求受信部201は、上記のような情報を含む検索要求を受信すると、ユーザ(端末)識別情報(以下、単に「識別情報」という)およびランキング種別を履歴保持部203へ出力し、検索キーワードをインデックス検索部202へ出力する。   When the search request receiving unit 201 receives a search request including the above information, the search request receiving unit 201 outputs user (terminal) identification information (hereinafter simply referred to as “identification information”) and a ranking type to the history holding unit 203, and the search keyword Is output to the index search unit 202.

インデックス検索部202は、検索要求受信部201から検索キーワードが入力されると、インデックスDB300を検索し、検索キーワードに一致するインデックスに対応するすべてのウェブページのURLおよび評価値を取得する。このとき、インデックスDB300において、ウェブページ全体のキャッシュやインデックス部分の抜粋などが記憶されている場合には、インデックス検索部202は、URLおよび評価値とともにウェブページのキャッシュや抜粋などを取得しても良い。   When a search keyword is input from the search request receiving unit 201, the index search unit 202 searches the index DB 300 and acquires URLs and evaluation values of all web pages corresponding to the index that matches the search keyword. At this time, if the index DB 300 stores a cache of the entire web page, an excerpt of the index portion, or the like, the index search unit 202 may acquire the cache or excerpt of the web page together with the URL and the evaluation value. good.

また、検索キーワードに複数の単語が含まれている場合や、検索キーワードが演算式である場合には、インデックス検索部202は、所定の検索方法に従って、インデックスDB300から適切なウェブページのURLおよび評価値を取得する。具体的に例を挙げると、例えば検索キーワードが「単語A 単語B」などとなっている場合には、インデックス検索部202は、インデックスに「単語A」および「単語B」を含むウェブページをインデックス300から検索し、該当するウェブページのURLおよび評価値を取得する。また、例えば検索キーワードが「単語A−単語B」などとなっている場合には、インデックス検索部202は、インデックスに「単語A」を含み、かつインデックスに「単語B」を含まないウェブページをインデックスDB300から検索し、該当するウェブページのURLおよび評価値を取得する。   In addition, when the search keyword includes a plurality of words or when the search keyword is an arithmetic expression, the index search unit 202 performs an appropriate web page URL and evaluation from the index DB 300 according to a predetermined search method. Get the value. Specifically, for example, when the search keyword is “word A word B” or the like, the index search unit 202 indexes a web page including “word A” and “word B” in the index. Search from 300 and obtain the URL and evaluation value of the corresponding web page. For example, when the search keyword is “word A-word B”, the index search unit 202 includes a web page that includes “word A” in the index and does not include “word B” in the index. A search is performed from the index DB 300, and the URL and evaluation value of the corresponding web page are acquired.

そして、インデックス検索部202は、取得したURLを履歴保持部203へ出力するとともに、取得したURLおよび評価値をランキング部204へ出力する。また、URLおよび評価値とともにウェブページのキャッシュや抜粋が取得された場合には、インデックス検索部202は、これらのすべての情報をランキング部204へ出力する。   Then, the index search unit 202 outputs the acquired URL to the history holding unit 203 and outputs the acquired URL and evaluation value to the ranking unit 204. When a web page cache or excerpt is acquired together with the URL and the evaluation value, the index search unit 202 outputs all of the information to the ranking unit 204.

履歴保持部203は、検索要求受信部201から入力される識別情報とインデックス検索部202から入力されるURLとを対応付けて記憶する。換言すれば、履歴保持部203は、ユーザ(端末)ごとの検索結果の履歴を保持する。具体的には、例えば図6に示すように、履歴保持部203は、ユーザIDまたはIPアドレスなどの識別情報に対応付けて、検索により得られたウェブページのURLを記憶する。したがって、履歴保持部203は、検索要求受信部201から入力された識別情報と履歴URLが既に履歴保持部203に登録済みであれば、インデックス検索部202から入力されたURLを履歴URLとして追加登録する。なお、履歴保持部203は、最後に検索を要求してから所定時間が経過したユーザ(端末)に関しては、このユーザ(端末)の検索結果の履歴を削除するようにしても良い。   The history holding unit 203 stores the identification information input from the search request receiving unit 201 and the URL input from the index search unit 202 in association with each other. In other words, the history holding unit 203 holds a search result history for each user (terminal). Specifically, for example, as illustrated in FIG. 6, the history holding unit 203 stores the URL of the web page obtained by the search in association with identification information such as a user ID or an IP address. Therefore, if the identification information and the history URL input from the search request receiving unit 201 have already been registered in the history holding unit 203, the history holding unit 203 additionally registers the URL input from the index search unit 202 as the history URL. To do. The history holding unit 203 may delete the history of search results of the user (terminal) for a user (terminal) that has passed a predetermined time since the last search request.

また、履歴保持部203は、検索要求受信部201からランキング種別が入力されると、ランキング種別がテール検索である場合には、検索要求受信部201から入力された識別情報に対応する履歴URLをランキング部204へ出力する。このとき、履歴保持部203は、インデックス検索部202から新たに入力されたURLを追加登録する前に、履歴URLをランキング部204へ出力する。したがって、履歴保持部203は、ユーザが指定するランキング種別がテール検索である場合には、このユーザの前回までの検索結果に含まれる履歴URLをランキング部204へ出力する。   In addition, when the ranking type is input from the search request receiving unit 201, the history holding unit 203 sets the history URL corresponding to the identification information input from the search request receiving unit 201 when the ranking type is tail search. The data is output to the ranking unit 204. At this time, the history holding unit 203 outputs the history URL to the ranking unit 204 before additionally registering the URL newly input from the index search unit 202. Therefore, when the ranking type designated by the user is tail search, the history holding unit 203 outputs the history URL included in the search results of the user up to the previous time to the ranking unit 204.

ランキング部204は、インデックス検索部202からURLと評価値が入力されると、評価値に基づいて検索結果のURLのランキングを行う。具体的には、ランキング部204は、ランキング種別が通常検索である場合には、評価値が大きい順にURLをランキングする。   When a URL and an evaluation value are input from the index search unit 202, the ranking unit 204 ranks URLs of search results based on the evaluation value. Specifically, when the ranking type is normal search, the ranking unit 204 ranks URLs in descending order of evaluation value.

一方、ランキング部204は、ランキング種別がテール検索である場合には、URLごとの評価値の逆数を算出し、算出された逆数が大きい順にURLをランキングする。また、ランキング部204は、複数のURLについて算出された逆数が等しい場合に、履歴保持部203から出力される履歴URLと検索結果のURLとを比較し、履歴URLに一致しないURLのランクを高くする。すなわち、ランキング部204は、評価値の逆数のみではURLのランキングが決定されない場合に、過去に検索されていないウェブページのURLを優先して高ランクにランキングする。   On the other hand, when the ranking type is tail search, the ranking unit 204 calculates the reciprocal of the evaluation value for each URL, and ranks the URLs in descending order of the calculated reciprocal. The ranking unit 204 compares the history URL output from the history holding unit 203 with the URL of the search result when the reciprocals calculated for a plurality of URLs are equal, and increases the rank of the URL that does not match the history URL. To do. That is, when the ranking of the URL is not determined only by the reciprocal of the evaluation value, the ranking unit 204 preferentially ranks the URL of the web page that has not been searched in the past to the high rank.

そして、ランキング部204は、ランキングの結果を結果ページ生成部206へ出力するとともに、インデックス検索部202における検索に用いられた検索キーワードを広告選択部205へ出力する。   The ranking unit 204 outputs the ranking result to the result page generation unit 206 and outputs the search keyword used for the search in the index search unit 202 to the advertisement selection unit 205.

広告選択部205は、ランキング部204から検索キーワードが入力されると、広告DB400を検索し、検索キーワードに一致する広告ジャンルに対応する広告データを取得する。そして、広告選択部205は、広告データを結果ページ生成部206へ出力する。   When a search keyword is input from the ranking unit 204, the advertisement selection unit 205 searches the advertisement DB 400 and acquires advertisement data corresponding to an advertisement genre that matches the search keyword. Then, the advertisement selection unit 205 outputs the advertisement data to the result page generation unit 206.

結果ページ生成部206は、ランキング部204から入力されるランキング結果と広告選択部205から入力される広告データとをウェブページに配置して、ユーザへ検索結果を提示する結果ページを生成する。具体的には、結果ページ生成部206は、ランクが高いURLほど、例えばウェブページのタイトル付近などの目立つ位置に配置し、広告データを所定の余白に配置する。したがって、通常検索が行われた場合には、結果ページ生成部206は、評価値が大きく注目度が高いウェブページのURLが目立つ位置に配置された結果ページを生成する。一方、テール検索が行われた場合には、結果ページ生成部206は、評価値の逆数が大きく注目度が低いウェブページのURLが目立つ位置に配置された結果ページを生成する。   The result page generation unit 206 arranges the ranking result input from the ranking unit 204 and the advertisement data input from the advertisement selection unit 205 on a web page, and generates a result page that presents the search result to the user. Specifically, the result page generation unit 206 arranges the advertisement data in a predetermined margin by placing the URL having a higher rank in a conspicuous position, for example, near the title of the web page. Therefore, when a normal search is performed, the result page generation unit 206 generates a result page arranged at a position where the URL of a web page with a high evaluation value and a high degree of attention is conspicuous. On the other hand, when the tail search is performed, the result page generation unit 206 generates a result page in which the URL of a web page with a large reciprocal of the evaluation value and a low degree of attention is arranged at a conspicuous position.

なお、結果ページ生成部206は、テール検索が行われた場合に、例えばウイルスが仕込まれたウェブページや不特定多数のユーザへの広告配信(スパム)のためにユーザのメールアドレスを収集する目的のウェブページなど、有害なウェブページのURLを検索結果から除去するなどの処理を行っても良い。   When the tail search is performed, the result page generation unit 206 collects a user's e-mail address for advertisement delivery (spam) to, for example, a web page loaded with a virus or an unspecified number of users. A process such as removing URLs of harmful web pages such as web pages from search results may be performed.

検索結果送信部207は、結果ページ生成部206によって生成された結果ページを検索要求送信元のユーザ端末100−1〜100−mへ送信する。   The search result transmission unit 207 transmits the result page generated by the result page generation unit 206 to the user terminals 100-1 to 100-m that are the search request transmission source.

次いで、上記のように構成された情報検索装置200による情報検索処理について、図7に示すフロー図を参照しながら説明する。以下においては、ユーザがユーザ端末100−1を使用して検索を実行するものとして説明する。   Next, information search processing by the information search apparatus 200 configured as described above will be described with reference to the flowchart shown in FIG. In the following description, it is assumed that the user performs a search using the user terminal 100-1.

ユーザがユーザ端末100−1に所望の検索キーワードおよびランキング種別を入力すると、これらの情報にユーザまたはユーザ端末100−1の識別情報が付加された検索要求がユーザ端末100−1から送信される。送信された検索要求は、ネットワークNを介して情報検索装置200の検索要求受信部201によって受信される(ステップS101)。そして、受信された検索要求に含まれる識別情報およびランキング種別は、履歴保持部203へ出力される一方、検索キーワードは、インデックス検索部202へ出力される。   When the user inputs a desired search keyword and ranking type to the user terminal 100-1, a search request in which identification information of the user or the user terminal 100-1 is added to these information is transmitted from the user terminal 100-1. The transmitted search request is received by the search request receiving unit 201 of the information search device 200 via the network N (step S101). The identification information and the ranking type included in the received search request are output to the history holding unit 203, while the search keyword is output to the index search unit 202.

インデックス検索部202に検索キーワードが入力されると、インデックスDB300が検索され、検索キーワードに一致するインデックスに対応するすべてのウェブページのURLおよび評価値が取得される(ステップS102)。ここでの検索は、単に検索キーワードとインデックスの単語とが一致するウェブページの検索に限られず、所定の演算子などを含む検索キーワードから条件に合致するウェブページを検索する場合なども含まれる。インデックス検索部202によって取得された検索結果のURLおよび評価値は、ランキング部204へ出力される。また、検索結果のURLは、履歴保持部203へも出力される。   When a search keyword is input to the index search unit 202, the index DB 300 is searched, and URLs and evaluation values of all web pages corresponding to the index that matches the search keyword are acquired (step S102). The search here is not limited to a search for a web page where the search keyword and the word in the index match, but also includes a case where a web page matching the condition is searched from a search keyword including a predetermined operator. The URL and the evaluation value of the search result acquired by the index search unit 202 are output to the ranking unit 204. The URL of the search result is also output to the history holding unit 203.

また、履歴保持部203に識別情報およびランキング種別が入力されると、ランキング種別がテール検索であるか否かが判断され(ステップS103)、ランキング種別が通常検索である場合は(ステップS103No)、インデックス検索部202から履歴保持部203へ入力された検索結果のURLが履歴URLとして追加登録される。また、ランキング部204によって、評価値が大きい順に検索結果のURLがランキングされる(ステップS104)。   When the identification information and the ranking type are input to the history holding unit 203, it is determined whether or not the ranking type is a tail search (step S103). When the ranking type is a normal search (No in step S103), The URL of the search result input from the index search unit 202 to the history holding unit 203 is additionally registered as a history URL. The ranking unit 204 ranks the URLs of the search results in descending order of evaluation value (step S104).

一方、ランキング種別がテール検索である場合は(ステップS103Yes)、ランキング種別とともに履歴保持部203へ入力された識別情報に対応する履歴URLがランキング部204によって取得される(ステップS105)。ここでランキング部204によって取得される履歴URLは、検索要求を送信したユーザまたはユーザ端末100−1によって前回実行された検索までの過去の検索結果である。そして、ランキング部204によって履歴URLが取得された後に、今回実行された検索の検索結果が履歴保持部203に追加登録される。   On the other hand, if the ranking type is tail search (Yes in step S103), the history URL corresponding to the identification information input to the history holding unit 203 together with the ranking type is acquired by the ranking unit 204 (step S105). Here, the history URL acquired by the ranking unit 204 is a past search result until the previous search performed by the user who transmitted the search request or the user terminal 100-1. Then, after the history URL is acquired by the ranking unit 204, the search result of the search executed this time is additionally registered in the history holding unit 203.

履歴保持部203からランキング部204へ履歴URLが出力されるのと同時に、ランキング部204によって、インデックス検索部202から出力された評価値の逆数が算出される(ステップS106)。そして、ランキング部204によって、算出された評価値の逆数と履歴URLとが用いられて、検索結果のURLのランクを決定するランキング処理が実行される(ステップS107)。このランキング処理については、図8を参照しながら後に詳述する。   At the same time when the history URL is output from the history holding unit 203 to the ranking unit 204, the ranking unit 204 calculates the reciprocal of the evaluation value output from the index search unit 202 (step S106). Then, the ranking unit 204 uses the reciprocal of the calculated evaluation value and the history URL to perform ranking processing for determining the rank of the URL of the search result (step S107). This ranking process will be described in detail later with reference to FIG.

ランキング部204によって、検索結果のURLのランキングが完了すると、ランキング結果が結果ページ生成部206へ出力されるとともに、検索に用いられた検索キーワードが広告選択部205へ出力される。そして、広告選択部205によって、広告DB400に記憶された広告データの中から、検索キーワードに合致する広告データが選択される(ステップS108)。選択された広告データは、結果ページ生成部206へ出力される。   When the ranking of the search result URL is completed by the ranking unit 204, the ranking result is output to the result page generation unit 206 and the search keyword used for the search is output to the advertisement selection unit 205. Then, the advertisement selection unit 205 selects advertisement data that matches the search keyword from the advertisement data stored in the advertisement DB 400 (step S108). The selected advertisement data is output to the result page generation unit 206.

そして、結果ページ生成部206によって、検索結果のURLがランキング順に並べて配置され、所定の余白に広告データが配置された結果ページが生成される(ステップS109)。この結果ページにおいては、ランキングが高いウェブページのURLほど目立つ位置に配置されており、結果ページを閲覧したユーザは、ランキングが高いウェブページへのリンクを容易に辿ることができる。生成された結果ページは、検索結果送信部207から送信され(ステップS110)、ネットワークNを介してユーザ端末100−1に受信される。   Then, the result page generation unit 206 generates a result page in which URLs of search results are arranged in order of ranking and advertisement data is arranged in a predetermined margin (step S109). In the result page, the URL of a web page with a higher ranking is arranged in a more conspicuous position, and a user who has viewed the result page can easily follow a link to a web page with a higher ranking. The generated result page is transmitted from the search result transmission unit 207 (step S110), and is received by the user terminal 100-1 via the network N.

次に、本実施の形態に係るテール検索が行われる場合のランキング処理について、図8に示すフロー図を参照しながら説明する。以下に説明するランキング処理は、ランキング部204によって実行される。   Next, ranking processing when tail search according to the present embodiment is performed will be described with reference to the flowchart shown in FIG. The ranking process described below is executed by the ranking unit 204.

まず、ランキング部204によって、検索結果のURLごとの評価値の逆数が大きい順に並べられる(ステップS201)。このとき、評価値の逆数が等しいURLがあるか否かが判断され(ステップS202)、すべてのURLの評価値の逆数が互いに異なっていれば(ステップS202No)、評価値の逆数が大きい順に並べられたランキング結果が結果ページ生成部206へ出力されてランキング処理が完了する。   First, the ranking unit 204 arranges the evaluation results for each URL in the search result in descending order (step S201). At this time, it is determined whether there are URLs having the same reciprocal evaluation value (step S202). If the reciprocal evaluation values of all URLs are different from each other (No in step S202), the reciprocal evaluation values are arranged in descending order. The ranking result is output to the result page generation unit 206, and the ranking process is completed.

また、複数のURLの評価値の逆数が等しければ(ステップS202Yes)、さらにこれらのURLと履歴保持部203から取得された履歴URLとが比較される(ステップS203)。そして、検索結果のURLと履歴URLとが一致しない場合、換言すれば、評価値の逆数が等しいURLがいずれも過去の検索結果となっていない場合は(ステップS203No)、便宜的にいずれかのURLが上位にランキングされ、ランキング結果が結果ページ生成部206へ出力されてランキング処理が完了する。   If the reciprocals of the evaluation values of the plurality of URLs are equal (Yes in step S202), these URLs are compared with the history URL acquired from the history holding unit 203 (step S203). If the URL of the search result and the history URL do not match, in other words, if no URL with the same reciprocal of the evaluation value is a past search result (No in step S203), either The URLs are ranked higher, and the ranking result is output to the result page generation unit 206 to complete the ranking process.

一方、検索結果のURLと履歴URLとが一致する場合、換言すれば、評価値の逆数が等しいURLのいずれかが過去の検索結果となっている場合は(ステップS203Yes)、過去の検索結果となっているURLがより下位にランキングされ(ステップS204)、ランキング結果が結果ページ生成部206へ出力されてランキング処理が完了する。すなわち、評価値の逆数が等しく、この逆数のみではランキング不可能なURLがある場合には、このURLが履歴URLと比較され、過去の検索結果に含まれないURLが上位にランキングされる。これは、本実施の形態に係るテール検索では、一般的にも注目度が低く、かつユーザ個人もまだ注目していないウェブページほど上位にランキングするとの考え方によっている。すなわち、履歴URLは、ユーザによる過去の検索で得られた検索結果であるため、ユーザによって少なくとも一度は閲覧されており、このようなURLは、評価値の逆数が同じであれば、より下位にランキングされる。   On the other hand, if the URL of the search result matches the history URL, in other words, if any of the URLs having the same reciprocal evaluation value is a past search result (step S203 Yes), the past search result and The ranking URL is ranked lower (step S204), the ranking result is output to the result page generation unit 206, and the ranking process is completed. In other words, when there are URLs whose reciprocal evaluation values are equal and cannot be ranked only with this reciprocal number, this URL is compared with the history URL, and URLs not included in past search results are ranked higher. This is based on the idea that in the tail search according to the present embodiment, a web page that generally has a low level of attention and that has not been noticed by individual users is ranked higher. In other words, since the history URL is a search result obtained by a past search by the user, the history URL is browsed at least once by the user. Such a URL is lower if the reciprocal of the evaluation value is the same. Ranked.

このようなテール検索が実行された場合には、例えば図9に示すような結果ページがユーザ端末100−1に表示される。この結果ページにおいては、評価値の逆数が最も大きく、かつユーザの過去の検索結果にも含まれないウェブページのURLが上位に表示されている。すなわち、図9の例では、「△△商店」のウェブページは、一般的な注目度が最も低く、かつユーザ個人の過去の検索結果にも含まれないウェブページである。したがって、ユーザは、このような結果ページを閲覧しつつリンクを辿ることにより、今まで注目されていなかったものの、良質な情報を掲載しているウェブページを発見することができる。なお、図9において、紙面向かって右方の「激安家電」は、検索キーワードである「洗濯機」に適合するものとして選択された広告データである。   When such a tail search is executed, for example, a result page as shown in FIG. 9 is displayed on the user terminal 100-1. In the result page, the URL of the web page that has the largest reciprocal of the evaluation value and is not included in the user's past search results is displayed at the top. That is, in the example of FIG. 9, the web page of “ΔΔ store” is the web page that has the lowest general attention and is not included in the past search results of the individual user. Therefore, the user can discover a web page on which high-quality information is posted, although it has not been noticed so far, by following the link while browsing the result page. In FIG. 9, “discount home appliance” on the right side of the page is advertisement data selected to match the search keyword “washing machine”.

以上のように、本実施の形態によれば、ユーザが注目度の低いウェブページを優先する検索を希望する場合には、検索キーワードから検索されたURLの評価値の逆数を算出し、算出された逆数が大きく、かつユーザによって過去に検索されていないURLほど高ランクにランキングする。そして、ランキングが高いURLほど目立つ位置に配置された検索結果のウェブページがユーザへ提供される。このため、一般的に注目されているウェブページばかりではなく、注目されていないウェブページを優先的に検索することもでき、ネットワーク上に公開された情報の取得を希望するユーザの多様な嗜好を幅広く満たすことができる。   As described above, according to the present embodiment, when a user desires a search that prioritizes a web page with a low degree of attention, the reciprocal of the evaluation value of the URL searched from the search keyword is calculated and calculated. URLs that have a large reciprocal number and have not been searched by the user in the past are ranked higher. Then, a search result web page is provided to the user, which is arranged at a more prominent position as the URL has a higher ranking. For this reason, it is possible to search not only web pages that are generally attracting attention but also web pages that are not attracting attention, giving various preferences to users who wish to obtain information published on the network. Can satisfy a wide range.

なお、上記一実施の形態において説明した情報検索方法をコンピュータが実行可能な形式で記述した検索プログラムを生成し、この検索プログラムをコンピュータに実行させることにより本発明の検索装置および検索方法を実現することも可能である。このとき、検索プログラムをコンピュータが読み取り可能な記録媒体に記憶させ、記録媒体を用いてコンピュータに検索プログラムを導入することも可能である。   Note that a search program in which the information search method described in the above embodiment is described in a computer-executable format is generated, and the search program and search method of the present invention are realized by causing the computer to execute the search program. It is also possible. At this time, the search program can be stored in a computer-readable recording medium, and the search program can be introduced into the computer using the recording medium.

本発明は、ネットワーク上に公開された情報の取得を希望するユーザの多様な嗜好を幅広く満たす場合に適用することができる。   The present invention can be applied to a case where a wide range of various preferences of users who desire to acquire information published on a network are satisfied.

一実施の形態に係る検索システムの構成を示すブロック図である。It is a block diagram which shows the structure of the search system which concerns on one embodiment. 一実施の形態に係るインデックスDBの例を示す図である。It is a figure which shows the example of index DB which concerns on one embodiment. 一実施の形態に係る広告DBの例を示す図である。It is a figure which shows the example of advertisement DB which concerns on one embodiment. 一実施の形態に係る情報検索装置の内部構成を示すブロック図である。It is a block diagram which shows the internal structure of the information search device which concerns on one embodiment. 一実施の形態に係る検索要求の例を示す図である。It is a figure which shows the example of the search request which concerns on one embodiment. 一実施の形態に係る検索履歴の例を示す図である。It is a figure which shows the example of the search log | history which concerns on one embodiment. 一実施の形態に係る情報検索処理を示すフロー図である。It is a flowchart which shows the information search process which concerns on one embodiment. 一実施の形態に係るランキング処理を示すフロー図である。It is a flowchart which shows the ranking process which concerns on one embodiment. 一実施の形態に係る結果ページの例を示す図である。It is a figure which shows the example of the result page which concerns on one embodiment.

符号の説明Explanation of symbols

201 検索要求受信部
202 インデックス検索部
203 履歴保持部
204 ランキング部
205 広告選択部
206 結果ページ生成部
207 検索結果送信部
201 Search Request Reception Unit 202 Index Search Unit 203 History Holding Unit 204 Ranking Unit 205 Advertisement Selection Unit 206 Result Page Generation Unit 207 Search Result Transmission Unit

Claims (7)

ウェブページに係る情報を記憶するデータベースを検索して、ユーザが指定する検索キーワードに合致するウェブページへのリンク情報および当該ウェブページの注目度を示す評価値を取得する取得手段と、
前記取得手段によって取得された評価値の逆数を算出する算出手段と、
前記算出手段によって算出された逆数に応じて、前記取得手段によってリンク情報および評価値が取得されたすべてのウェブページをランキングするランキング手段と、
前記ランキング手段によるランキングの結果に従って、ランクが高いウェブページへのリンク情報ほど目立つ位置に配置された検索結果表示用ウェブページを生成する生成手段と
前記検索キーワードを指定したユーザの識別情報に対応付けて、過去に前記取得手段によって取得されたリンク情報を検索履歴情報として記憶する検索履歴記憶手段と、を有し、
前記ランキング手段は、
前記算出手段によって算出された逆数が等しいウェブページが複数ある場合、当該複数のウェブページのうち、リンク情報が前記検索履歴情報に含まれないウェブページのランクを、リンク情報が前記検索履歴情報に含まれるウェブページのランクよりも高くすることを特徴とする検索装置。
An acquisition unit that searches a database that stores information related to a web page, acquires link information to a web page that matches a search keyword specified by a user, and an evaluation value that indicates a degree of attention of the web page;
Calculating means for calculating the reciprocal of the evaluation value acquired by the acquiring means;
Ranking means for ranking all web pages for which link information and evaluation values have been acquired by the acquisition means according to the reciprocal calculated by the calculation means;
According to the ranking result by the ranking means , generating means for generating a search result display web page arranged at a position where the link information to the web page having a higher rank is more conspicuous ;
Search history storage means for storing link information acquired by the acquisition means in the past as search history information in association with identification information of a user who specified the search keyword;
The ranking means includes
When there are a plurality of web pages having the same reciprocal number calculated by the calculation means, among the plurality of web pages, the rank of the web page in which the link information is not included in the search history information, the link information is the search history information. A search device characterized in that the rank is higher than the rank of the included web page .
前記取得手段は、
注目度が低いウェブページを優先させる検索を希望するか注目度がウェブページを優先させる検索を希望する否かを示すランキング種別情報を検索キーワードとともにユーザ端末から受信する受信手段を含み、
前記算出手段は、
前記受信手段によって受信されたランキング種別情報が注目度が低いウェブページを優先させる検索希望の旨を示す場合にのみ、評価値の逆数を算出することを特徴とする請求項1記載の検索装置。
The acquisition means includes
Receiving means for receiving, from a user terminal, ranking type information indicating whether or not a search for giving priority to a web page with a low degree of attention is desired or a search for giving priority to a web page with a degree of attention is desired;
The calculating means includes
2. The search device according to claim 1 , wherein the reciprocal of the evaluation value is calculated only when the ranking type information received by the receiving unit indicates that a search request that prioritizes a web page with a low degree of attention is desired. .
前記生成手段は、The generating means includes
前記受信手段によって受信されたランキング種別情報が注目度が低いウェブページを優先させる検索希望の旨を示す場合にのみ、ウイルスが仕込まれたウェブページのリンク情報を除外した検索結果表示用ウェブページを生成することを特徴とする請求項2に記載の検索装置。Only when the ranking type information received by the receiving means indicates that the web page with low attention is given priority to search, the search result display web page excluding the link information of the web page loaded with the virus is displayed. The search device according to claim 2, wherein the search device is generated.
前記生成手段は、The generating means includes
前記受信手段によって受信されたランキング種別情報が注目度が低いウェブページを優先させる検索希望の旨を示す場合にのみ、不特定多数のユーザへの広告配信のためにユーザのメールアドレスを収集することを目的とするウェブページのリンク情報を除外した検索結果表示用ウェブページを生成することを特徴とする請求項2又は3に記載の検索装置。Only when the ranking type information received by the receiving means indicates a search request that prioritizes a web page with a low level of attention, the user's e-mail address is collected for advertisement distribution to an unspecified number of users. The search apparatus according to claim 2 or 3, wherein a search result display web page is generated by excluding link information of a web page for the purpose.
ユーザが指定する検索キーワードに関連する広告データを取得する広告データ取得手段をさらに有し、
前記生成手段は、
検索結果表示用ウェブページの余白に前記広告データ取得手段によって取得された広告データを配置することを特徴とする請求項1〜4のいずれか1項に記載の検索装置。
It further has advertisement data acquisition means for acquiring advertisement data related to the search keyword specified by the user,
The generating means includes
The search device according to any one of claims 1 to 4 , wherein the advertisement data acquired by the advertisement data acquisition means is arranged in a margin of a search result display web page.
ウェブページに係る情報を記憶するデータベースを検索して、ユーザが指定する検索キーワードに合致するウェブページへのリンク情報および当該ウェブページの注目度を示す評価値を取得する取得ステップと、
前記取得ステップにて取得された評価値の逆数を算出する算出ステップと、
前記算出ステップにて算出された逆数に応じて、前記取得ステップにてリンク情報および評価値が取得されたすべてのウェブページをランキングするランキングステップと、
前記ランキングステップにおけるランキングの結果に従って、ランクが高いウェブページへのリンク情報ほど目立つ位置に配置された検索結果表示用ウェブページを生成する生成ステップと
前記検索キーワードを指定したユーザの識別情報に対応付けて、過去に前記取得ステップにて取得されたリンク情報を検索履歴情報として検索履歴記憶手段に記憶する検索履歴記憶ステップと、を有し、
前記ランキングステップは、
前記算出ステップによって算出された逆数が等しいウェブページが複数ある場合、当該複数のウェブページのうち、リンク情報が前記検索履歴情報に含まれないウェブページのランクを、リンク情報が前記検索履歴情報に含まれるウェブページのランクよりも高くすることを特徴とする検索方法。
An acquisition step of searching a database storing information related to a web page and obtaining an evaluation value indicating link information to the web page that matches a search keyword specified by the user and an attention level of the web page;
A calculation step of calculating the reciprocal of the evaluation value acquired in the acquisition step;
In accordance with the reciprocal calculated in the calculating step, a ranking step ranking all the web pages from which the link information and the evaluation value are acquired in the acquiring step;
In accordance with the ranking result in the ranking step , a generation step of generating a search result display web page arranged at a position where the link information to the web page having a higher rank is more conspicuous ;
A search history storage step of storing the link information acquired in the acquisition step in the past as search history information in search history storage means in association with the identification information of the user who specified the search keyword;
The ranking step includes:
When there are a plurality of web pages having the same reciprocal number calculated in the calculating step, the rank of the web page in which the link information is not included in the search history information among the plurality of web pages, and the link information in the search history information The search method characterized by making it higher than the rank of the web page contained .
コンピュータによって実行される検索プログラムであって、
前記コンピュータに、
ウェブページに係る情報を記憶するデータベースを検索して、ユーザが指定する検索キーワードに合致するウェブページへのリンク情報および当該ウェブページの注目度を示す評価値を取得する取得ステップと、
前記取得ステップにて取得された評価値の逆数を算出する算出ステップと、
前記算出ステップにて算出された逆数に応じて、前記取得ステップにてリンク情報および評価値が取得されたすべてのウェブページをランキングするランキングステップと、
前記ランキングステップにおけるランキングの結果に従って、ランクが高いウェブページへのリンク情報ほど目立つ位置に配置された検索結果表示用ウェブページを生成する生成ステップと
前記検索キーワードを指定したユーザの識別情報に対応付けて、過去に前記取得ステップにて取得されたリンク情報を検索履歴情報として検索履歴記憶手段に記憶する検索履歴記憶ステップと、を実行させ
前記ランキングステップにおいて、前記コンピュータに、前記算出ステップによって算出された逆数が等しいウェブページが複数ある場合、当該複数のウェブページのうち、リンク情報が前記検索履歴情報に含まれないウェブページのランクを、リンク情報が前記検索履歴情報に含まれるウェブページのランクよりも高くするステップを実行させることを特徴とする検索プログラム。
A search program executed by a computer,
In the computer,
An acquisition step of searching a database storing information related to a web page and obtaining an evaluation value indicating link information to the web page that matches a search keyword specified by the user and an attention level of the web page;
A calculation step of calculating the reciprocal of the evaluation value acquired in the acquisition step;
In accordance with the reciprocal calculated in the calculating step, a ranking step ranking all the web pages from which the link information and the evaluation value are acquired in the acquiring step;
In accordance with the ranking result in the ranking step , a generation step of generating a search result display web page arranged at a position where the link information to the web page having a higher rank is more conspicuous ;
In association with the identification information of the user who specified the search keyword, the search history storage step of storing the link information acquired in the acquisition step in the past as search history information in the search history storage means is executed ,
In the ranking step, when there are a plurality of web pages having the same reciprocal number calculated in the calculation step in the computer, the rank of the web page in which the link information is not included in the search history information among the plurality of web pages A search program for executing the step of making the link information higher than the rank of the web page included in the search history information .
JP2007274695A 2007-10-23 2007-10-23 Search device and search method Expired - Fee Related JP4842237B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007274695A JP4842237B2 (en) 2007-10-23 2007-10-23 Search device and search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007274695A JP4842237B2 (en) 2007-10-23 2007-10-23 Search device and search method

Publications (2)

Publication Number Publication Date
JP2009104356A JP2009104356A (en) 2009-05-14
JP4842237B2 true JP4842237B2 (en) 2011-12-21

Family

ID=40705974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007274695A Expired - Fee Related JP4842237B2 (en) 2007-10-23 2007-10-23 Search device and search method

Country Status (1)

Country Link
JP (1) JP4842237B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101689757B1 (en) * 2010-12-17 2016-12-26 네이버 주식회사 System and method for providing targeting advertisement between different kind of media
CN104166707B (en) * 2014-08-08 2017-10-31 百度在线网络技术(北京)有限公司 Search for recommendation method and search recommendation apparatus

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10334120A (en) * 1997-05-30 1998-12-18 Omron Corp Browser for internet, address specifying method for browser for internet and storage medium
JP2001216316A (en) * 2000-02-02 2001-08-10 Nec Corp System and method for electronic manual retrieval and recording medium
JP4222075B2 (en) * 2003-03-20 2009-02-12 セイコーエプソン株式会社 Electronic bulletin board system, information providing method by electronic bulletin board, and computer program
JP4344596B2 (en) * 2003-12-12 2009-10-14 日本電信電話株式会社 Content search system, content search program, and recording medium
JP2007049661A (en) * 2005-08-10 2007-02-22 Nippon Television Network Corp Advertisement apparatus and method employing retrieval technique in moving image distribution service
JP2007213200A (en) * 2006-02-08 2007-08-23 Hitachi Electronics Service Co Ltd Information processor having file search function, and program, method, and system for changing file search result priority

Also Published As

Publication number Publication date
JP2009104356A (en) 2009-05-14

Similar Documents

Publication Publication Date Title
US12001490B2 (en) Systems for and methods of finding relevant documents by analyzing tags
KR101708448B1 (en) Predictive query suggestion caching
JP4961043B2 (en) Sorting user browser history based on relevance
US8626768B2 (en) Automated discovery aggregation and organization of subject area discussions
US9355185B2 (en) Infinite browse
CN108681604B (en) Navigating to popular search results
US8423610B2 (en) User interface for web comments
US10185750B2 (en) Synthesizing directories, domains, and subdomains
JP5222581B2 (en) System and method for annotating documents
US20080082486A1 (en) Platform for user discovery experience
US8326836B1 (en) Providing time series information with search results
US20110078140A1 (en) Method and system for user guided search navigation
US20110047136A1 (en) Method For One-Click Exclusion Of Undesired Search Engine Query Results Without Clustering Analysis
EP2131290A1 (en) Method of displaying related keyword and system as the same
JP2008204453A (en) System and method for annotating document
WO2008097856A2 (en) Search result delivery engine
EP1897001A1 (en) Systems and methods for providing search results
CN105760527B (en) Third-party page display method and device
WO2009031759A1 (en) Method and system for generating search collection of query
JP2011192102A (en) Device and method for creating summary, and program
JP2010128928A (en) Retrieval system and retrieval method
US8843488B1 (en) Nested display of contextual search results
JP4842237B2 (en) Search device and search method
JP2009015589A (en) System and program for presenting related document
JP2009205588A (en) Page search system and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090616

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110927

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111005

R150 Certificate of patent or registration of utility model

Ref document number: 4842237

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141014

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350