JP5068338B2 - Search server, system and method - Google Patents

Search server, system and method Download PDF

Info

Publication number
JP5068338B2
JP5068338B2 JP2010089680A JP2010089680A JP5068338B2 JP 5068338 B2 JP5068338 B2 JP 5068338B2 JP 2010089680 A JP2010089680 A JP 2010089680A JP 2010089680 A JP2010089680 A JP 2010089680A JP 5068338 B2 JP5068338 B2 JP 5068338B2
Authority
JP
Japan
Prior art keywords
snippet
query
search
list
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010089680A
Other languages
Japanese (ja)
Other versions
JP2011221755A (en
Inventor
祐 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2010089680A priority Critical patent/JP5068338B2/en
Publication of JP2011221755A publication Critical patent/JP2011221755A/en
Application granted granted Critical
Publication of JP5068338B2 publication Critical patent/JP5068338B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、検索サーバ、システム及び方法に関する。   The present invention relates to a search server, a system, and a method.

インデックスデータベースやWebページのアーカイブデータベースを備えた検索サーバが、クエリを送信した端末に対して応答する場合、検索サーバは、インデックス検索や、全文検索等の検索処理を行い、当該クエリに関連度の高い複数のWebページを特定し、特定したWebページの一覧を端末に返す。Webページの一覧には、個々のWebページのタイトルやURL等とともに、Webページの概要や、ヒットしたクエリを含む文章の断片等で構成される概要文(以下、「スニペット」という。)が付される。これにより、ユーザが得たい情報がどのWebページに含まれているのかを推測するにあたり、タイトルやURLの表示だけでは不足する場合であっても、スニペットに示された文章やフレーズ、或いは画像のサムネイル等を閲覧することにより補うことができる。   When a search server having an index database or an archive database of web pages responds to the terminal that sent the query, the search server performs a search process such as an index search or a full-text search, A plurality of high Web pages are specified, and a list of the specified Web pages is returned to the terminal. The list of Web pages is accompanied by a summary sentence (hereinafter referred to as “snippet”) composed of an outline of the Web page, a sentence fragment including the hit query, and the title and URL of each Web page. Is done. As a result, even if it is not sufficient to display only the title or URL when guessing which Web page contains the information that the user wants to obtain, the text, phrase, or image of the snippet is displayed. It can be supplemented by browsing thumbnails.

従来、スニペットの生成にあたり、検索サーバが特定したWebページの先頭から特定の文字数の文章を一律に抽出する手法がある。しかし、文頭の記載だけでは概要を把握できない場合も多いため、Webページの先頭から一律に文章を抽出するだけでは、ユーザに対してスニペットを提示しても、ユーザは、十分な情報を得られない場合がある。   Conventionally, when generating a snippet, there is a method of uniformly extracting a specific number of characters from the top of a Web page specified by a search server. However, since there are many cases where the outline cannot be grasped only by the description at the beginning of the sentence, the user can obtain sufficient information even if the snippet is presented to the user only by extracting the sentences uniformly from the top of the Web page. There may not be.

このような問題を解決する手法として、スニペットを4つの類型に区分し、ユーザの操作にしたがって、適宜選択された類型のスニペットを生成することが提案されている(例えば、非特許文献1参照)。この手法によると、サーバが特定したWebページが同一であっても、ユーザが選択するスニペットの類型により、スニペットの表現を異ならせることができるので、一律の方法で生成されたスニペットとは異なり、ユーザが検索の目的に応じて適当な類型のスニペットを使い分けられる場合がある。   As a technique for solving such a problem, it has been proposed to classify snippets into four types and generate snippets of appropriately selected types according to user operations (see, for example, Non-Patent Document 1). . According to this method, even if the web page specified by the server is the same, the expression of the snippet can be made different depending on the type of snippet selected by the user. Therefore, unlike the snippet generated by a uniform method, There are cases where the user can use different types of snippets depending on the purpose of the search.

上述の非特許文献1が示す技術の適用例として、ユーザが「京都」、「湯豆腐」というクエリを入力し、これら「京都」、「湯豆腐」に対応するWebページを検索サーバが特定した場合について説明する。例えば、ユーザが、4つの類型のうち、I型、すなわち、クエリにヒットしたことにより検索サーバが特定した個々のWebページから得られる情報をそれぞれ独立して用い、かつ、クエリを含む断片だけを集約する型を選択した場合について説明する。この場合、検索サーバは、その検索サーバ自体が特定したそれぞれのWebページに対し、「京都で湯豆腐を食べるなら○○がおすすめ」や、「京都の××では、湯豆腐に嵐山の□□というお店の豆腐が」といった、手掛かりとして入力されたクエリを含む周辺情報を要約したスニペットを生成する。一方、ユーザが、4つの類型のうち、III型、すなわち、検索サーバが特定した複数のWebページの集合から得られる情報を用い、かつ、クエリを含む断片だけを集約する型を選択した場合について説明する。この場合、検索サーバは、同じWebページに対し、「京都で○○が食べられるのは当店だけ」といった、他のWebページには存在しない特徴的な部分を含む断片を抽出したスニペットを生成する。その結果、ユーザは、検索の目的にあわせてスニペットの生成手法を使い分けることにより、希望の情報により効率的にアプローチすることができる。   As an application example of the technique shown in Non-Patent Document 1 described above, a user inputs a query “Kyoto” and “Yudofu” and the search server specifies a Web page corresponding to these “Kyoto” and “Yudofu”. explain. For example, the user can independently use information obtained from each Web page specified by the search server by hitting the query, and type I of four types, and only a fragment including the query. A case where the types to be aggregated are selected will be described. In this case, for each Web page specified by the search server itself, the search server will say “If you eat yudofu in Kyoto, XX is recommended” or “In Kyoto xx, you will find Arimayama's □□. Generate a snippet that summarizes the surrounding information including the query entered as a clue, such as “Tofu at the store”. On the other hand, when the user selects type III among four types, that is, a type that uses information obtained from a set of a plurality of Web pages specified by the search server and aggregates only fragments including a query. explain. In this case, the search server generates, for the same Web page, a snippet that extracts a fragment including a characteristic part that does not exist in other Web pages, such as “Only our shop can eat XX in Kyoto”. . As a result, the user can approach the desired information more efficiently by using different snippet generation methods according to the purpose of the search.

日本データベース学会論文誌、日本、日本データベース学会、6巻、2号、33〜36頁、2007年9月28日Journal of the Database Society of Japan, Japan, Database Society of Japan, Vol. 6, No. 2, 33-36, September 28, 2007

しかし、この技術では、類型をユーザ自身で選択しなければならない、という問題がある。そのため、ユーザの選択操作によらなくても、ユーザの検索意図を推定して自動的にスニペットの生成手法を切り替えることができる検索サーバを提供することが求められている。   However, this technique has a problem that the user has to select the type by himself. Therefore, it is required to provide a search server that can estimate the user's search intention and automatically switch the snippet generation method without relying on the user's selection operation.

本発明は、ユーザの選択操作によらなくても、ユーザの検索意図を推定して自動的にスニペットの生成手法を切り替えることができる検索サーバ、システム及び方法を提供することを目的とする。   An object of the present invention is to provide a search server, a system, and a method capable of estimating a user's search intention and automatically switching a snippet generation method without depending on a user's selection operation.

本発明では、以下のような解決手段を提供する。   The present invention provides the following solutions.

(1) 端末からクエリを受信するクエリ受信手段と、前記クエリとの関連度が高いWebページを検索して特定する検索手段と、前記検索手段によって特定されたWebページのコンテンツを参照し、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数以上である場合に固定的と判定する判定手段と、前記判定手段によって固定的と判定された場合は、前記固定的と判定されなかった場合に比べて検索結果として一度に表示するスニペットのリストの数を減少させるとともに、当該リストを構成するスニペットあたりの文字数を増加させてスニペットを生成するスニペット生成手段と、前記スニペット生成手段により生成されたスニペットを前記リストとともに前記端末に送信するスニペット送信手段とを備える検索サーバ。   (1) Query receiving means for receiving a query from a terminal, search means for searching and specifying a Web page having a high degree of association with the query, and contents of the Web page specified by the search means, If the number of the same words, synonyms or synonyms included in the number of Web pages in common is determined to be fixed when the number is equal to or greater than the upper limit reference number, and the determination means determines that the number is fixed Snippet generation means for generating a snippet by reducing the number of lists of snippets displayed at a time as a search result as compared to a case where the list is not determined to be fixed and increasing the number of characters per snippet constituting the list And a snippet transmission that transmits the snippet generated by the snippet generation means to the terminal together with the list Search server and a stage.

(1)に記載の発明によれば、判定手段は、検索手段によって特定されたWebページのコンテンツを参照し、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数以上である場合は固定的と判定し、スニペット生成手段は、判定手段が固定的と判定した場合は、そうでない場合に比べて検索結果として一度に表示するスニペットのリストの数を減少させるとともに、当該リストを構成するスニペットあたりの文字数を増加させてスニペットを生成する。そして、スニペット送信手段は、スニペット生成手段が生成したスニペットをリストとともに端末に送信する。これにより、ユーザの端末の表示画面には、リストの数は少ないものの、一つ一つのスニペットの情報量を豊富なものとすることができる。したがって、ユーザは、豊富な情報量のスニペットを閲覧することにより、より的確に所望のWebページにたどり着く可能性が高くなるばかりか、最終的にWebページを参照しなくてもスニペットを閲覧するだけで所望の情報が得られることも期待できる。このようにして、ユーザの選択操作によらなくても、ユーザの検索意図を推定して自動的にスニペットの生成手法を切り替えることができる検索サーバを提供できる。   According to the invention described in (1), the determination unit refers to the content of the Web page specified by the search unit, and the number of identical phrases, synonym phrases, or synonym phrases that are commonly included in a predetermined number of Web pages. Is determined to be fixed when the number is equal to or greater than the upper reference number, and the snippet generation means determines the number of snippet lists to be displayed at once as a search result when the determination means determines that it is fixed. The snippet is generated by decreasing the number of characters per snippet constituting the list and increasing the number of characters. Then, the snippet transmission means transmits the snippet generated by the snippet generation means together with the list to the terminal. Thereby, although the number of lists is small on the display screen of the user terminal, the information amount of each snippet can be made rich. Therefore, by browsing a snippet with a large amount of information, the user is not only more likely to reach a desired web page more accurately, but also only by browsing the snippet without referring to the web page in the end. It can also be expected that desired information can be obtained. In this way, it is possible to provide a search server that can estimate the user's search intention and automatically switch the snippet generation method without depending on the user's selection operation.

また、ユーザがスニペットを表示するページだけで所望の情報が得られる場合には、スニペットを表示するページが、従来よりも長い時間閲覧される可能性があるとともに、当該ページの印刷頻度が高くなる可能性がある。このような場合には、スニペットを表示するページに付す広告の価値が高まるという効果も奏する。   In addition, when the user can obtain desired information only by the page displaying the snippet, the page displaying the snippet may be browsed for a longer time than before, and the printing frequency of the page is increased. there is a possibility. In such a case, there is also an effect that the value of the advertisement attached to the page displaying the snippet is increased.

(2) (1)に記載のサーバであって、前記判定手段は、さらに、前記所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が下限基準数以下である場合に変動的と判定し、前記スニペット生成手段は、前記変動的と判定された場合は、一度に表示するスニペットのリストの数を増加させるとともに、当該リストを構成するスニペットあたりの文字数を減少させて、数を増加させた前記リストに含まれるWebページに共通して含まれる同一語句、同義語句又は類義語句を上位から一回のみ抽出し、さらに前記リストに含まれるWebページの特徴語を、前記変動的と判定されなかった場合よりも多く抽出して、これら抽出した語句を用いてスニペットを生成する検索サーバ。   (2) The server according to (1), wherein the determination unit further has a number of identical phrases, synonyms or synonyms included in the predetermined number of Web pages in common not more than a lower limit reference number. The snippet generation means increases the number of snippet lists to be displayed at a time and decreases the number of characters per snippet constituting the list. The same phrase, synonym phrase, or synonym phrase that is commonly included in the Web pages included in the list increased in number is extracted only once from the top, and the characteristic words of the Web page included in the list are further extracted. A search server that extracts more than the case where it is not determined to be variable and generates a snippet using these extracted phrases.

(2)に記載の発明によれば、検索サーバは、スニペットを閲覧したユーザに、数が増加したリストに含まれるWebページに共通して含まれる語句を一回のみ閲覧させ、さらに、当該Webページの特徴語を閲覧させることができる。したがって、ユーザは、様々な話題がヒットするようなクエリを入力した場合に、同じ語句や話題を複数回閲覧する可能性を抑制しつつ、スニペットを一見するだけで幅広い情報を得ることができる。その結果、スニペットを閲覧したユーザは、リンクされたWebページの内容を直接見ることなく、所望の情報の概略をつかむことができる場合もあり、その場合には、ユーザはリンク先をクリックして閲覧する必要がない。このようにして、ユーザの選択操作によらなくても、ユーザの検索意図を推定して自動的にスニペットの生成手法を切り替えることができる検索サーバを提供できる。   According to the invention described in (2), the search server allows the user who browsed the snippet to browse the phrase included in the web page included in the list increased in number only once, and further, the web You can browse the feature words of the page. Therefore, when a query that hits various topics is input, the user can obtain a wide range of information just by looking at the snippet while suppressing the possibility of browsing the same phrase or topic multiple times. As a result, the user who viewed the snippet may be able to grasp the outline of the desired information without directly viewing the contents of the linked web page, in which case the user clicks on the link destination. There is no need to browse. In this way, it is possible to provide a search server that can estimate the user's search intention and automatically switch the snippet generation method without depending on the user's selection operation.

(3) クエリを送信する端末と、前記クエリに対して応答する検索サーバとを備えるシステムであって、前記端末は、クエリを送信するクエリ送信手段を有し、前記検索サーバは、前記端末から前記クエリを受信するクエリ受信手段と、前記クエリとの関連度が高いWebページを検索して特定する検索手段と、前記検索手段によって特定されたWebページのコンテンツを参照し、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数以上である場合に固定的と判定する判定手段と、前記判定手段によって固定的と判定された場合は、前記固定的と判定されなかった場合に比べて検索結果として一度に表示するスニペットのリストの数を減少させるとともに、当該リストを構成するスニペットあたりの文字数を増加させてスニペットを生成するスニペット生成手段と、前記スニペット生成手段によって生成されたスニペットを前記リストとともに前記端末に送信するスニペット送信手段とを有し、前記端末は、前記スニペット生成手段によって送信されたスニペットを前記リストとともに表示するスニペット表示手段をさらに有するシステム。   (3) A system including a terminal that transmits a query and a search server that responds to the query, wherein the terminal includes query transmission means for transmitting a query, and the search server includes: A query receiving means for receiving the query, a search means for searching and specifying a Web page having a high degree of association with the query, and a predetermined number of Web pages by referring to the content of the Web page specified by the search means Determining means that determines that the number of the same phrase, synonym phrase, or synonym phrase that is included in common is greater than or equal to the upper limit reference number, and if the determination means determines that the number is fixed, Compared to the case where it is not determined, the number of snippet lists displayed as search results at one time is reduced, and the snippets constituting the list are A snippet generating means for generating a snippet by increasing the number of characters of the snippet, and a snippet transmitting means for transmitting the snippet generated by the snippet generating means together with the list to the terminal. A system further comprising snippet display means for displaying the transmitted snippet together with the list.

(4) クエリを送信した端末に対し、検索サーバが応答する方法であって、前記検索サーバは、前記端末からクエリを受信するクエリ受信工程と、前記クエリとの関連度が高いWebページを検索して特定する検索工程と、前記検索工程で特定したWebページのコンテンツを参照し、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数以上である場合に固定的と判定する判定工程と、前記判定工程で固定的と判定した場合は、前記固定的と判定しなかった場合に比べて検索結果として一度に表示するスニペットのリストの数を減少させるとともに、当該リストを構成するスニペットあたりの文字数を増加させてスニペットを生成するスニペット生成工程と、前記スニペット生成工程で生成したスニペットを前記リストとともに前記端末に送信するスニペット送信工程とを含む方法。   (4) A method in which a search server responds to a terminal that has transmitted a query, wherein the search server searches for a Web page that has a high degree of relevance between the query receiving step of receiving a query from the terminal and the query. The number of the same words, synonyms or synonyms included in a predetermined number of Web pages is greater than or equal to the upper limit reference number with reference to the search step specified and the content of the Web page specified in the search step. If the determination step is determined to be fixed, and the determination step determines that it is fixed, the number of snippet lists displayed as search results at a time is reduced as compared to the case where the determination is not fixed. In addition, a snippet generation process for generating a snippet by increasing the number of characters per snippet constituting the list, and the snippet generation process Methods including snippets transmission step of transmitting to the terminal a pet with said list.

(3)に記載のシステムによれば、当該システムに係る発明を実施することにより、(1)と同様の効果が期待できる。(4)に記載の方法によれば、当該方法に係る発明を実施することにより、(1)と同様の効果が期待できる。   According to the system described in (3), the same effect as in (1) can be expected by implementing the invention relating to the system. According to the method described in (4), the same effect as in (1) can be expected by implementing the invention according to the method.

本発明によれば、ユーザの選択操作によらなくても、ユーザの検索意図を推定して自動的にスニペットの生成手法を切り替えることができる検索サーバ、システム及び方法を提供できる。   According to the present invention, it is possible to provide a search server, a system, and a method that can estimate a user's search intention and automatically switch a snippet generation method without depending on a user's selection operation.

本実施形態に係るシステム1を説明するための全体構成を示す図である。It is a figure which shows the whole structure for demonstrating the system 1 which concerns on this embodiment. 本実施形態に係るインデックスDB31を示す図である。It is a figure which shows index DB31 concerning this embodiment. 本実施形態に係るアーカイブDB32を示す図である。It is a figure which shows archive DB32 which concerns on this embodiment. 本実施形態に係る検索サーバ3のフローチャートである。It is a flowchart of the search server 3 which concerns on this embodiment. 本実施形態に係る検索サーバ3による固定・変動判定処理のフローチャートである。It is a flowchart of the fixed / variation determination process by the search server 3 according to the present embodiment. 本実施形態に係る検索サーバ3によるスニペット生成処理のフローチャートである。It is a flowchart of the snippet production | generation process by the search server 3 which concerns on this embodiment. クエリが「○○タワー」である場合のスニペットの表示例を示す図である。It is a figure which shows the example of a display of a snippet when a query is "XX tower." クエリが「三平方の定理とは」である場合のスニペットの表示例を示す図である。It is a figure which shows the example of a display of a snippet in case a query is "what is a three square theorem." クエリが「○○事務所 ニュース」である場合のスニペットの表示例を示す図である。It is a figure which shows the example of a display of a snippet when a query is "XX office news".

以下、本発明の実施形態について図を参照しながら説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

[全体構成]
図1は、本実施形態に係るシステム1及び検索サーバ3を説明するための全体構成を示す図である。システム1は、クエリを送信する端末2と、この端末2から受信したクエリに対して応答する検索サーバ3とを備える。
[overall structure]
FIG. 1 is a diagram showing an overall configuration for explaining a system 1 and a search server 3 according to the present embodiment. The system 1 includes a terminal 2 that transmits a query and a search server 3 that responds to a query received from the terminal 2.

まず、検索サーバ3の構成について説明する。検索サーバ3は、制御部20と、記憶部30とを備える。制御部20は、検索サーバ3に係る各機能を統括的に制御する部分であり、クエリ受信部21、検索部22、判定部23、スニペット生成部24及びスニペット送信部を備える。一方、記憶部30は、検索サーバ3として機能させるための各種プログラム(図示省略)やデータベース(以下「DB」という。)を記憶する部分であり、インデックスDB31及びアーカイブDB32を備える。   First, the configuration of the search server 3 will be described. The search server 3 includes a control unit 20 and a storage unit 30. The control unit 20 is a part that comprehensively controls each function related to the search server 3, and includes a query reception unit 21, a search unit 22, a determination unit 23, a snippet generation unit 24, and a snippet transmission unit. On the other hand, the storage unit 30 is a part that stores various programs (not shown) and a database (hereinafter referred to as “DB”) for functioning as the search server 3, and includes an index DB 31 and an archive DB 32.

クエリ受信部21は、端末2からクエリを受信する部分であり、クエリ受信手段として機能する。   The query receiving unit 21 is a part that receives a query from the terminal 2 and functions as a query receiving unit.

検索部22は、Webサイトの内容が予め記憶されたインデックスDB31を参照し、クエリ受信部21が受け付けたクエリとの関連度が高いWebページを検索して特定する部分であり、検索手段として機能する。   The search unit 22 refers to the index DB 31 in which the contents of the Web site are stored in advance, and searches for and specifies a Web page having a high degree of association with the query received by the query receiving unit 21, and functions as a search unit. To do.

インデックスDB31は、例えば、国際公開第2002/044946号に記載されているように、クローラと呼ばれる巡回ロボットが取得したWebページのURLやキーワードを抽出することによって構築されたデータベースである。クローラとは、インデックスDB31を作成するために世界中のあらゆるWebサーバに記憶されたWebページを回収するプログラムをいう。インデックスDB31は、図2に例示され、クローラがアクセスしたWebサイトに接続するためのURLを示す「URL」フィールドと、そのWebサイトから抽出したキーワードを示す「インデックスキーワード」フィールドとを有する。   For example, as described in International Publication No. 2002/044946, the index DB 31 is a database constructed by extracting URLs and keywords of Web pages acquired by a patrol robot called a crawler. The crawler refers to a program that collects Web pages stored in any Web server in the world in order to create the index DB 31. The index DB 31 is exemplified in FIG. 2 and includes a “URL” field indicating a URL for connecting to a website accessed by the crawler and an “index keyword” field indicating a keyword extracted from the website.

図1に戻り、判定部23は、検索部22が特定したWebページのコンテンツを参照し、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数によって、検索結果が固定的か、変動的か、中間的かを判定する部分であり、判定手段として機能する。「所定数」は、検索結果が中間的である場合に、検索結果として、端末2に一度に(例えば、1ページに)表示させるスニペットのリストの数である。本実施形態では、「所定数」は「10」であるが、これに限られるものではない。   Returning to FIG. 1, the determination unit 23 refers to the content of the Web page specified by the search unit 22, and the search result is determined according to the number of identical phrases, synonyms or synonyms included in a predetermined number of Web pages. This is a part for determining whether it is fixed, variable, or intermediate, and functions as a determination means. The “predetermined number” is the number of snippet lists to be displayed on the terminal 2 at once (for example, on one page) as a search result when the search result is intermediate. In the present embodiment, the “predetermined number” is “10”, but is not limited thereto.

判定部23は、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数以上である場合に固定的と判定する。本実施形態では、上限基準数を「20」としているが、これに限られるものではない。   The determination unit 23 determines that the number is the same when the number of the same phrase, synonym phrase, or synonym phrase that is commonly included in the predetermined number of Web pages is equal to or greater than the upper limit reference number. In the present embodiment, the upper limit reference number is “20”, but is not limited to this.

また、判定部23は、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が下限基準数以下である場合に変動的と判定する。本実施形態では、下限基準数を「5」としているが、これに限られるものではない。   The determination unit 23 determines that the number of the same words, synonyms or synonyms included in a predetermined number of Web pages in common is not more than the lower limit reference number. In the present embodiment, the lower limit reference number is “5”, but is not limited to this.

そして、判定部23は、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数以上でなく、下限基準数以下でもない場合は、中間的と判定する。なお、上限基準数および下限基準数は同一であることを妨げず、その場合には、判定部23は、変動的か、或いは固定的かのいずれかの判定を行う。   And the determination part 23 determines as intermediate | middle, when the number of the same phrase, synonym phrase, or synonym phrase contained in common in a predetermined number of Web pages is not more than an upper limit reference number, and is not less than a lower limit reference number. . Note that the upper limit reference number and the lower limit reference number are not prevented from being the same, and in that case, the determination unit 23 determines whether the number is variable or fixed.

判定部23は、検索結果が固定的か、変動的か、中間的かの判定を、アーカイブDB32を参照して行う。   The determination unit 23 determines whether the search result is fixed, variable, or intermediate with reference to the archive DB 32.

アーカイブDB32は、クローラやフィーダと呼ばれるプログラムを実行することによって受信した、Webページのコンテンツを記憶したデータベースである。フィーダとは、自ら運営するWebサーバや提携先の運営するWebサーバ等のように、クローラによる回収の必要がないWebページのデータをアーカイブDB32に入力するプログラムをいう。アーカイブDB32は、図3に例示され、Webサイトに接続するためのURLを示す「URL」フィールドと、そのWebサイトのコンテンツを示す「コンテンツ」フィールドとを有する。   The archive DB 32 is a database that stores Web page contents received by executing a program called a crawler or a feeder. A feeder refers to a program that inputs data of a Web page that does not need to be collected by a crawler to the archive DB 32, such as a Web server that is operated by itself or a Web server that is operated by a partner. The archive DB 32 is exemplified in FIG. 3 and includes a “URL” field indicating a URL for connecting to a Web site and a “content” field indicating the content of the Web site.

図1に戻り、スニペット生成部24は、判定部23が固定的と判定した場合は、検索結果として端末2に一度に(例えば、1ページに)表示するスニペットのリストの数を「10」から「3」に減少させるとともに、当該リストを構成するスニペットあたりの文字数を「100」から「300」に増加させてスニペットを生成する。また、スニペット生成部24は、判定部23が変動的と判定した場合は、検索結果として端末2に一度に(例えば、1ページに)表示するスニペットのリストの数を「10」から「20」に増加させるとともに、当該リストを構成するスニペットあたりの文字数を「100」から「50」に減少させて、数を「20」に増加させたリストに含まれるWebページに共通して含まれる同一語句、同義語句又は類義語句を上位から一回のみ抽出し、さらに当該リストに含まれるWebページの特徴語を、変動的と判定されなかった場合よりも多く抽出して、これら抽出した語句を用いてスニペットを生成する。スニペット生成部24は、スニペット生成手段として機能する。   Returning to FIG. 1, if the determination unit 23 determines that the determination unit 23 is fixed, the snippet generation unit 24 sets the number of snippet lists to be displayed on the terminal 2 as a search result at one time (for example, on one page) from “10”. The snippet is generated by decreasing the number to “3” and increasing the number of characters per snippet constituting the list from “100” to “300”. Further, when the determination unit 23 determines that the snippet generation unit 24 is variable, the snippet generation unit 24 changes the number of snippet lists to be displayed on the terminal 2 at once (for example, on one page) as a search result from “10” to “20”. In addition, the number of characters per snippet constituting the list is decreased from “100” to “50”, and the number is increased to “20”, and the same phrase included in the Web pages included in the list The synonym phrase or synonym phrase is extracted only once from the top, and more characteristic words of the Web page included in the list are extracted than when not determined to be variable, and these extracted phrases are used. Generate a snippet. The snippet generator 24 functions as a snippet generator.

スニペット送信部25は、スニペット生成部24が生成したスニペットをリストとともに端末2に送信する。このスニペット送信部25は、スニペット送信手段として機能する。   The snippet transmission unit 25 transmits the snippet generated by the snippet generation unit 24 to the terminal 2 together with the list. The snippet transmission unit 25 functions as a snippet transmission unit.

端末2の制御部10は、スニペット生成部24が送信したスニペットをリストとともに表示するスニペット表示部12を備える。このスニペット表示部12は、スニペット表示手段として機能する。   The control unit 10 of the terminal 2 includes a snippet display unit 12 that displays the snippet transmitted by the snippet generation unit 24 together with a list. The snippet display unit 12 functions as a snippet display unit.

[本実施形態のハードウェア及びソフトウェアの構成]
本実施形態のハードウェア及びソフトウェアの構成について説明する。端末2及び検索サーバ3のハードウェアには、制御装置(制御部)としてのCPUの他、記憶装置(記憶部)、通信装置(通信部)、表示装置(表示部)及び入力装置(入力部)が含まれる。記憶装置(記憶部)としては、例えば、メモリ(RAM、ROM等)、ハードディスクドライブ(HDD)又は光ディスク(CD、DVD等)ドライブ等が挙げられる。通信装置(通信部)としては、例えば、各種有線又は無線インターフェース装置等が挙げられる。表示装置(表示部)としては、例えば、液晶ディスプレイ又はプラズマディスプレイ等の各種ディスプレイが挙げられる。入力装置(入力部)としては、例えば、キーボード、ポインティング・デバイス(マウス等)又はリモコン装置等が挙げられる。
[Hardware and Software Configuration of this Embodiment]
The hardware and software configurations of this embodiment will be described. The hardware of the terminal 2 and the search server 3 includes a storage device (storage unit), a communication device (communication unit), a display device (display unit), and an input device (input unit) in addition to a CPU as a control device (control unit). ) Is included. Examples of the storage device (storage unit) include a memory (RAM, ROM, etc.), a hard disk drive (HDD), an optical disk (CD, DVD, etc.) drive, and the like. Examples of the communication device (communication unit) include various wired or wireless interface devices. Examples of the display device (display unit) include various displays such as a liquid crystal display or a plasma display. Examples of the input device (input unit) include a keyboard, a pointing device (such as a mouse), a remote control device, and the like.

端末2及び検索サーバ3のソフトウェアには、上記ハードウェアを制御するプログラムやデータが含まれる。プログラムやデータは、記憶装置(記憶部)により記憶され、制御装置(制御部)により適宜実行、参照される。また、コンピュータ・プログラムやデータは、電磁的方法により配布することも可能であり、CD−ROM等のコンピュータ可読媒体に記録して配布することも可能である。   The software of the terminal 2 and the search server 3 includes programs and data for controlling the hardware. Programs and data are stored in a storage device (storage unit), and are appropriately executed and referenced by a control device (control unit). Further, the computer program and data can be distributed by an electromagnetic method, or can be recorded and distributed on a computer-readable medium such as a CD-ROM.

[フローチャート]
図4〜図6は、本実施形態に係る検索サーバ3のフローチャートである。
[flowchart]
4 to 6 are flowcharts of the search server 3 according to the present embodiment.

ステップS1では、クエリ受信部21は、端末2からクエリを受信するクエリ受信処理を実行する。ステップS2では、検索部22は、Webサイトのインデックスキーワード等が予め記憶されたインデックスDB31を参照し、クエリ受信部21が受け付けたクエリとの関連度が高いWebページを検索して特定する検索処理を実行する。   In step S <b> 1, the query receiving unit 21 executes a query receiving process for receiving a query from the terminal 2. In step S <b> 2, the search unit 22 refers to the index DB 31 in which the index keywords of the Web site are stored in advance, and searches for and specifies a Web page having a high degree of association with the query received by the query receiving unit 21. Execute.

ステップS3では、判定部23は、後に図5を参照して説明する固定・変動判定処理を実行する。ステップS4では、スニペット生成部24は、後に図6を参照して説明するスニペット生成処理を実行する。ステップS5では、スニペット送信部25は、スニペット生成部24がスニペット生成処理を実行して生成したスニペットをそのスニペットのリストとともに端末2に送信するスニペット送信処理を実行し、一連の処理を終了する。   In step S3, the determination unit 23 executes a fixing / variation determination process which will be described later with reference to FIG. In step S4, the snippet generator 24 executes a snippet generation process which will be described later with reference to FIG. In step S5, the snippet transmission unit 25 executes a snippet transmission process in which the snippet generation unit 24 transmits the snippet generated by executing the snippet generation process together with the snippet list to the terminal 2, and ends the series of processes.

図5は、本実施形態に係る固定・変動判定処理のフローチャートである。   FIG. 5 is a flowchart of fixed / variation determination processing according to the present embodiment.

ステップS11では、判定部23は、アーカイブDB32を参照し、検索部22が特定した10個のWebページに共通して含まれる同一語句、同義語句、類義語句の数を計数する。   In step S <b> 11, the determination unit 23 refers to the archive DB 32 and counts the number of the same words / synonyms / synonyms / phrases included in common in the 10 Web pages specified by the search unit 22.

ステップS12では、判定部23は、ステップS11で計数した数が20以上か否かを判別する。この判別がYESのときは、判定部23は、処理をステップS13に移し、NOのときは、判定部23は、処理をステップS14に移す。ステップS13では、判定部23は、検索結果が固定的であると判定し、固定・変動判定処理を終了する。   In step S12, the determination unit 23 determines whether the number counted in step S11 is 20 or more. When this determination is YES, the determination unit 23 moves the process to step S13, and when NO, the determination unit 23 moves the process to step S14. In step S13, the determination unit 23 determines that the search result is fixed, and ends the fixed / variation determination process.

ステップS14では、判定部23は、ステップS11で計数した数が5以下か否かを判別する。この判別がYESのときは、判定部23は、処理をステップS15に移し、NOのときは、判定部23は、処理をステップS16に移す。ステップS15では、判定部23は、検索結果が変動的であると判定し、固定・変動判定処理を終了する。ステップS16では、判定部23は、検索結果が中間的であると判定し、固定・変動判定処理を終了する。   In step S14, the determination unit 23 determines whether or not the number counted in step S11 is 5 or less. When this determination is YES, the determination unit 23 moves the process to step S15, and when NO, the determination unit 23 moves the process to step S16. In step S15, the determination unit 23 determines that the search result is variable, and ends the fixing / variation determination process. In step S16, the determination unit 23 determines that the search result is intermediate, and ends the fixing / variation determination process.

図6は、本実施形態に係るスニペット生成処理のフローチャートである。   FIG. 6 is a flowchart of snippet generation processing according to the present embodiment.

ステップS21では、スニペット生成部24は、判定部23が固定的と判定したか否かを判別する。この判別がYESのときは、スニペット生成部24は、処理をステップS22に移し、NOのときは、スニペット生成部24は、処理をステップS24に移す。   In step S <b> 21, the snippet generation unit 24 determines whether the determination unit 23 determines that it is fixed. When this determination is YES, the snippet generation unit 24 moves the process to step S22, and when NO, the snippet generation unit 24 moves the process to step S24.

ステップS22では、スニペット生成部24は、検索結果として端末2に一度に(例えば、1ページに)表示するスニペットのリストの数を「10」から「3」に減少させる。ステップS23では、スニペット生成部24は、当該リストを構成するスニペットあたりの文字数を「100」から「300」に増加させる。   In step S22, the snippet generation unit 24 decreases the number of snippet lists to be displayed on the terminal 2 as a search result at once (for example, on one page) from “10” to “3”. In step S23, the snippet generation unit 24 increases the number of characters per snippet constituting the list from “100” to “300”.

ステップS24では、スニペット生成部24は、判定部23が変動的と判定したか否かを判別する。この判別がYESのときは、スニペット生成部24は、処理をステップS25に移し、NOのときは、スニペット生成部24は、処理をステップS29に移す。   In step S24, the snippet generator 24 determines whether or not the determination unit 23 has determined that it is variable. When this determination is YES, the snippet generation unit 24 moves the process to step S25, and when NO, the snippet generation unit 24 moves the process to step S29.

ステップS25では、スニペット生成部24は、検索結果として端末2に一度に(例えば、1ページに)表示するスニペットのリストの数を「10」から「20」に増加させる。ステップS26では、スニペット生成部24は、当該リストを構成するスニペットあたりの文字数を「100」から「50」に減少させる。ステップS27では、スニペット生成部24は、数を「20」に増加させたリストに含まれるWebページに共通して含まれる同一語句、同義語句又は類義語句を上位から一回のみ抽出する。ステップS28では、スニペット生成部24は、これら20個のリストに含まれるWebページの特徴語を、変動的と判定されなかった場合よりも多く抽出する。   In step S25, the snippet generation unit 24 increases the number of snippet lists to be displayed on the terminal 2 as a search result at once (for example, on one page) from “10” to “20”. In step S26, the snippet generation unit 24 reduces the number of characters per snippet constituting the list from “100” to “50”. In step S27, the snippet generation unit 24 extracts the same phrase, synonym phrase, or synonym phrase included in common in the Web pages included in the list whose number is increased to “20” from the top only once. In step S28, the snippet generation unit 24 extracts more feature words of the Web page included in these 20 lists than when it is not determined to be variable.

ステップS29では、スニペット生成部24は、スニペットを生成して、スニペット生成処理を終了する。   In step S29, the snippet generation unit 24 generates a snippet and ends the snippet generation process.

[本実施形態に係るシステム1の実施例]
図7〜図9は、本実施形態に係るシステム1、検索サーバ3及び方法を実施したときの端末2の画面40での表示例を示す図である。より詳しくは、図7は、クエリが「○○タワー」である場合のスニペットの表示例を示す図である。図8は、クエリが「三平方の定理とは」である場合のスニペットの表示例を示す図である。図9は、クエリが「○○事務所 ニュース」である場合のスニペットの表示例を示す図である。
[Example of system 1 according to this embodiment]
7-9 is a figure which shows the example of a display on the screen 40 of the terminal 2 when the system 1, the search server 3, and method which concern on this embodiment are implemented. More specifically, FIG. 7 is a diagram illustrating a display example of a snippet when the query is “XX tower”. FIG. 8 is a diagram illustrating a display example of a snippet when the query is “What is the three-square theorem”? FIG. 9 is a diagram illustrating a display example of a snippet when the query is “XX office news”.

以下では、図7〜図9について詳細に説明する。   Hereinafter, FIGS. 7 to 9 will be described in detail.

まず、図7について説明する。クエリ受信部21は、端末2から「○○タワー」というクエリを受信する。そして、検索部22は、図2に例示されるインデックスDB31を参照し、クエリ受信部21が受け付けたクエリ「○○タワー」との関連度が高いWebページを検索し、「http:www.jkl.・・・」、「http:www.mno.・・・」、「http:www.pqr.・・・」等を特定する。続いて、判定部23は、図3に例示されるアーカイブDB32に記憶された、検索部22が特定したWebページ「http:www.jkl.・・・」、「http:www.mno.・・・」、「http:www.pqr.・・・」等のコンテンツを参照し、10個のWebページに共通して含まれる同一語句、同義語句又は類義語句の数によって、検索結果が固定的か、変動的か、中間的かを判定する。クエリが「○○タワー」である場合、「○○タワー」、「観光」等が同一語句、同義語句又は類義語句にあたる。ここでは、判定部23は、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数である20以上でなく、下限基準数である5以下でもなく、中間的と判定したものとして説明する。   First, FIG. 7 will be described. The query receiving unit 21 receives a query “XX tower” from the terminal 2. Then, the search unit 22 refers to the index DB 31 illustrated in FIG. 2, searches for a Web page having a high degree of association with the query “XX tower” received by the query reception unit 21, and reads “http: www.jkl”. ... ”,“ Http: www.mno .... ”,“ http: www.pqr. Subsequently, the determination unit 23 stores the web pages “http: www.jkl....”, “Http: www.mno....”, Which are stored in the archive DB 32 illustrated in FIG. . ”,“ Http: www.pqr .... ”, etc., whether the search result is fixed depending on the number of the same phrases, synonyms or synonyms included in 10 Web pages in common Determine if it is variable or intermediate. When the query is “XX tower”, “XX tower”, “sightseeing” and the like correspond to the same phrase, synonym phrase or synonym phrase. Here, the determination unit 23 does not have the number of the same words, synonyms or synonyms included in the predetermined number of Web pages in common not more than 20 which is the upper limit reference number and not less than 5 which is the lower limit reference number. The description will be made assuming that it is determined as intermediate.

スニペット生成部24は、判定部23が中間的と判定しているため、検索結果として端末2に一度に(例えば、1ページに)表示するスニペットのリストの数を「10」とし、当該リストを構成するスニペットあたりの文字数を「100」として、スニペットを生成する。そして、スニペット送信部25は、スニペット生成部24が生成したスニペットをリストとともに端末2に送信する。   Since the determination unit 23 determines that the determination unit 23 is intermediate, the snippet generation unit 24 sets the number of snippet lists to be displayed on the terminal 2 as a search result at once (for example, on one page) as “10”, and the list is displayed. A snippet is generated by setting the number of characters per snippet to be “100”. Then, the snippet transmission unit 25 transmits the snippet generated by the snippet generation unit 24 to the terminal 2 together with the list.

図7は、このときの画面40での表示例である。画面40の左上方には、クエリを入力するクエリ入力部41が設けられ、このクエリ入力部41には「○○タワー」と表示されている。そして、クエリ入力部41の下方には、「ウェブ検索結果」と表示され、検索条件が「○○タワー」であること、この検索条件では約100万件の結果が得られたこと、検索結果として端末2に一度に(例えば、1ページに)表示するスニペットのリストの数が「10」であることを示している。そして、各々の検索結果として、アーカイブDB32のコンテンツを要約した100文字のスニペットが示されている。   FIG. 7 is a display example on the screen 40 at this time. A query input unit 41 for inputting a query is provided at the upper left of the screen 40, and the query input unit 41 displays “XX Tower”. And below the query input part 41, “Web search result” is displayed, the search condition is “XX tower”, about 1 million results were obtained under this search condition, the search result The number of snippets displayed on the terminal 2 at one time (for example, on one page) is “10”. Each search result shows a snippet of 100 characters that summarizes the contents of the archive DB 32.

次に、図8について説明する。クエリ受信部21は、端末2から「三平方の定理とは」というクエリを受信する。そして、検索部22は、図2に例示されるインデックスDB31を参照し、クエリ受信部21が受け付けたクエリ「三平方の定理とは」との関連度が高いWebページを検索し、「http:www.abc.・・・」、「http:www.def.・・・」、「http:www.ghi.・・・」等を特定する。続いて、判定部23は、図3に例示されるアーカイブDB32に記憶された、検索部22が特定したWebページ「http:www.abc.・・・」、「http:www.def.・・・」、「http:www.ghi.・・・」等のコンテンツを参照し、10個のWebページに共通して含まれる同一語句、同義語句又は類義語句の数によって、検索結果が固定的か、変動的か、中間的かを判定する。クエリが「三平方の定理とは」である場合、「直角三角形」、「三平方の定理」、「ピタゴラス」等が同一語句、同義語句又は類義語句にあたる。ここでは、判定部23は、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数である20以上であり、検索結果が固定的と判定したものとして説明する。   Next, FIG. 8 will be described. The query receiving unit 21 receives a query “What is the three-square theorem” from the terminal 2. Then, the search unit 22 refers to the index DB 31 illustrated in FIG. 2 and searches for a Web page having a high degree of association with the query “What is the three-square theorem” received by the query reception unit 21. "www.abc ....", "http: www.def ....", "http: www.ghi ....", etc. Subsequently, the determination unit 23 stores the web pages “http: www.abc....”, “Http: www.def ....” specified by the search unit 22, which are stored in the archive DB 32 illustrated in FIG. . ”,“ Http: www.ghi .... ”, etc., whether the search result is fixed depending on the number of the same phrases, synonyms or synonyms included in 10 Web pages in common Determine if it is variable or intermediate. When the query is “what is the three-square theorem”, “right triangle”, “three-square theorem”, “Pythagoras”, etc. are equivalent phrases, synonyms or synonyms. Here, it is assumed that the determination unit 23 determines that the number of identical phrases, synonym phrases, or synonym phrases that are commonly included in a predetermined number of Web pages is 20 or more that is the upper limit reference number, and that the search result is fixed. explain.

スニペット生成部24は、判定部23が固定的と判定しているため、検索結果として端末2に一度に(例えば、1ページに)表示するスニペットのリストの数を「3」とし、当該リストを構成するスニペットあたりの文字数を「300」として、スニペットを生成する。そして、スニペット送信部25は、スニペット生成部24が生成したスニペットをリストとともに端末2に送信する。   Since the determination unit 23 determines that the snippet generation unit 24 is fixed, the number of snippet lists to be displayed on the terminal 2 as a search result at once (for example, on one page) is set to “3”. A snippet is generated by setting the number of characters per snippet to be “300”. Then, the snippet transmission unit 25 transmits the snippet generated by the snippet generation unit 24 to the terminal 2 together with the list.

図8は、このときの画面40での表示例である。クエリ入力部41には「三平方の定理とは」と表示されている。そして、「ウェブ検索結果」として、検索条件が「三平方の定理とは」であること、この検索条件では約15万件の結果が得られたこと、検索結果として端末2に一度に(例えば、1ページに)表示するスニペットのリストの数が「3」であることを示している。そして、各々の検索結果として、アーカイブDB32のコンテンツを要約した300文字のスニペットが示されている。   FIG. 8 is a display example on the screen 40 at this time. The query input unit 41 displays “What is the three-square theorem?”. As the “web search result”, the search condition is “what is the three-square theorem”, about 150,000 results are obtained under this search condition, and the search result is sent to the terminal 2 at once (for example, This indicates that the number of snippet lists to be displayed is “3” on one page. Each search result includes a 300-character snippet that summarizes the contents of the archive DB 32.

次に、図9について説明する。クエリ受信部21は、端末2から「○○事務所 ニュース」というクエリを受信する。そして、検索部22は、図2に例示されるインデックスDB31を参照し、クエリ受信部21が受け付けたクエリ「○○事務所 ニュース」との関連度が高いWebページを検索し、「http:www.stu.・・・」、「http:www.vwx.・・・」、「http:www.yz.・・・」等を特定する。続いて、判定部23は、図3に例示されるアーカイブDB32に記憶された、検索部22が特定したWebページ「http:www.stu.・・・」、「http:www.vwx.・・・」、「http:www.yz.・・・」等のコンテンツを参照し、10個のWebページに共通して含まれる同一語句、同義語句又は類義語句の数によって、検索結果が固定的か、変動的か、中間的かを判定する。クエリが「○○事務所 ニュース」である場合、「○○事務所」、「ニュース」等が同一語句、同義語句又は類義語句にあたる。ここでは、判定部23は、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が下限基準数である5以下であり、検索結果が変動的と判定したものとして説明する。   Next, FIG. 9 will be described. The query receiving unit 21 receives a query “XX office news” from the terminal 2. Then, the search unit 22 refers to the index DB 31 illustrated in FIG. 2, searches for a Web page having a high degree of association with the query “XX office news” received by the query reception unit 21, and reads “http: www .Stu .... "," http: www.vwx .... "," http: www.yz .... ", etc. Subsequently, the determination unit 23 stores the web pages “http: www.stu....”, “Http: www.vwx....”, “Http: www.vwx....”, Which are stored in the archive DB 32 illustrated in FIG. . ”,“ Http: www.yz.... ”, Etc., and whether the search result is fixed depending on the number of the same phrases, synonyms or synonyms included in 10 Web pages in common Determine if it is variable or intermediate. When the query is “XX office news”, “XX office”, “news” and the like correspond to the same phrase, synonym phrase or synonym phrase. Here, it is assumed that the determination unit 23 determines that the number of identical phrases, synonym phrases, or synonym phrases that are commonly included in a predetermined number of Web pages is five or less, which is the lower limit reference number, and that the search result is variable. explain.

スニペット生成部24は、判定部23が変動的と判定しているため、検索結果として端末2に一度に(例えば、1ページに)表示するスニペットのリストの数を「20」とし、当該リストを構成するスニペットあたりの文字数を「50」とし、そのリストに含まれるWebページに共通して含まれる同一語句、同義語句又は類義語句を上位から一回のみ抽出し、さらにリストに含まれるWebページの特徴語を、変動的と判定されなかった場合よりも多く抽出して、これら抽出した語句を用いてスニペットを生成する。そして、スニペット送信部25は、スニペット生成部24が生成したスニペットをリストとともに端末2に送信する。   Since the determination unit 23 determines that the snippet generation unit 24 is variable, the number of snippet lists displayed on the terminal 2 as a search result at once (for example, on one page) is set to “20”, and the list is displayed. The number of characters per snippet is set to “50”, the same phrase, synonym phrase or synonym phrase included in common in the Web page included in the list is extracted only once from the top, and the Web page included in the list is extracted. More feature words are extracted than when not determined to be variable, and a snippet is generated using these extracted words. Then, the snippet transmission unit 25 transmits the snippet generated by the snippet generation unit 24 to the terminal 2 together with the list.

図9は、このときの画面40での表示例である。クエリ入力部41には「○○事務所 ニュース」と表示されている。そして、「ウェブ検索結果」として、検索条件が「○○事務所 ニュース」であること、この検索条件では約50万件の結果が得られたこと、検索結果として端末2に一度に(例えば、1ページに)表示するスニペットのリストの数が「20」であることを示している。そして、各々の検索結果として、アーカイブDB32のコンテンツを要約した50文字のスニペットが示されている。   FIG. 9 is a display example on the screen 40 at this time. The query input unit 41 displays “XX office news”. Then, as the “web search result”, the search condition is “XX office news”, about 500,000 results are obtained under this search condition, and the search result is sent to the terminal 2 at once (for example, This indicates that the number of snippet lists to be displayed is “20” on one page. Each search result includes a 50-character snippet that summarizes the contents of the archive DB 32.

本実施例によると、判定部23は、検索部22によって特定されたWebページのコンテンツを参照し、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数以上である場合は固定的と判定し、スニペット生成部24は、判定部23が固定的と判定した場合は、そうでない場合に比べて検索結果として一度に(例えば、1ページに)表示するスニペットのリストの数を減少させるとともに、当該リストを構成するスニペットあたりの文字数を増加させてスニペットを生成する。そして、スニペット送信部25は、スニペット生成部24が生成したスニペットをリストとともに端末2に送信する。これにより、ユーザの端末2の表示画面には、リストの数は少ないものの、一つ一つのスニペットの情報量を豊富なものとすることができる。したがって、ユーザは、豊富な情報量のスニペットを閲覧することにより、より的確に所望のWebページにたどり着く可能性が高くなるばかりか、最終的にWebページを参照しなくてもスニペットを閲覧するだけで所望の情報が得られることも期待できる。このようにして、ユーザの選択操作によらなくても、ユーザの検索意図を推定して自動的にスニペットの生成手法を切り替えることができる検索サーバ3を提供できる。   According to this embodiment, the determination unit 23 refers to the content of the Web page specified by the search unit 22, and the number of identical phrases, synonym phrases, or synonym phrases that are commonly included in a predetermined number of Web pages is the upper limit criterion. If the number is more than the number, it is determined to be fixed, and the snippet generation unit 24 displays the search result at a time (for example, on one page) when the determination unit 23 determines that the number is fixed, compared to the case where it is not. A snippet is generated by reducing the number of snippet lists and increasing the number of characters per snippet constituting the list. Then, the snippet transmission unit 25 transmits the snippet generated by the snippet generation unit 24 to the terminal 2 together with the list. Thereby, although the number of lists is small on the display screen of the user's terminal 2, the information amount of each snippet can be made rich. Therefore, by browsing a snippet with a large amount of information, the user is not only more likely to reach a desired web page more accurately, but also only by browsing the snippet without referring to the web page in the end. It can also be expected that desired information can be obtained. In this way, it is possible to provide the search server 3 capable of estimating the user's search intention and automatically switching the snippet generation method without depending on the user's selection operation.

また、ユーザがスニペットを表示するページだけで所望の情報が得られる場合には、スニペットを表示するページが、従来よりも長い時間閲覧される可能性があるとともに、当該ページの印刷頻度が高くなる可能性がある。このような場合には、スニペットを表示するページに付す広告の価値が高まるという効果も奏する。   In addition, when the user can obtain desired information only by the page displaying the snippet, the page displaying the snippet may be browsed for a longer time than before, and the printing frequency of the page is increased. there is a possibility. In such a case, there is also an effect that the value of the advertisement attached to the page displaying the snippet is increased.

また、本実施例によると、判定部23は、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が下限基準数以下である場合に変動的と判定し、スニペット生成部24は、変動的と判定された場合は、一度に(例えば、1ページに)表示するスニペットのリストの数を増加させるとともに、当該リストを構成するスニペットあたりの文字数を減少させて、数を増加させた前記リストに含まれるWebページに共通して含まれる同一語句、同義語句又は類義語句を上位から一回のみ抽出し、さらに前記リストに含まれるWebページの特徴語を、前記変動的と判定されなかった場合よりも多く抽出して、これら抽出した語句を用いてスニペットを生成する。これにより、検索サーバ3は、スニペットを閲覧したユーザに、数が増加したリストに含まれるWebページに共通して含まれる語句を一回のみ閲覧させ、さらに、当該Webページの特徴語を閲覧させることができる。したがって、ユーザは、様々な話題がヒットするようなクエリを入力した場合に、同じ語句や話題を複数回閲覧する可能性を抑制しつつ、スニペットを一見するだけで幅広い情報を得ることができる。その結果、スニペットを閲覧したユーザは、リンクされたWebページの内容を直接見ることなく、所望の情報の概略をつかむことができる場合もあり、その場合には、ユーザはリンク先をクリックして閲覧する必要がない。このようにして、ユーザの選択操作によらなくても、ユーザの検索意図を推定して自動的にスニペットの生成手法を切り替えることができる検索サーバ3を提供できる。   Further, according to the present embodiment, the determination unit 23 determines that the number of identical words, synonyms or synonyms included in a predetermined number of Web pages in common is less than or equal to the lower limit reference number, and the snippet When it is determined that the variable is variable, the generation unit 24 increases the number of lists of snippets to be displayed at one time (for example, on one page), and decreases the number of characters per snippet constituting the list. The same phrase, synonym phrase, or synonym phrase that is commonly included in the Web pages included in the list in which the list is increased is extracted only once from the top, and the characteristic words of the Web page included in the list are extracted as the variable More than the case where it is not determined, a snippet is generated using these extracted words. Thereby, the search server 3 allows the user who browsed the snippet to browse the phrase included in the web page included in the list increased in number only once, and further browse the characteristic words of the web page. be able to. Therefore, when a query that hits various topics is input, the user can obtain a wide range of information just by looking at the snippet while suppressing the possibility of browsing the same phrase or topic multiple times. As a result, the user who viewed the snippet may be able to grasp the outline of the desired information without directly viewing the contents of the linked web page, in which case the user clicks on the link destination. There is no need to browse. In this way, it is possible to provide the search server 3 capable of estimating the user's search intention and automatically switching the snippet generation method without depending on the user's selection operation.

なお、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。   In addition, the effect described in this embodiment only enumerated the most suitable effect which arises from this invention, and the effect by this invention is not limited to what was described in this embodiment.

1 システム
2 端末
3 検索サーバ
10 端末の制御部
11 クエリ送信部
12 スニペット表示部
20 検索サーバの制御部
21 クエリ受信部
22 検索部
23 判定部
24 スニペット生成部
25 スニペット送信部
30 検索サーバの制御部
31 インデックスDB
32 アーカイブDB
DESCRIPTION OF SYMBOLS 1 System 2 Terminal 3 Search server 10 Terminal control part 11 Query transmission part 12 Snippet display part 20 Search server control part 21 Query reception part 22 Search part 23 Judgment part 24 Snippet generation part 25 Snippet transmission part 30 Search server control part 31 Index DB
32 Archive DB

Claims (4)

端末からクエリを受信するクエリ受信手段と、
前記クエリとの関連度が高いWebページを検索して特定する検索手段と、
前記検索手段によって特定されたWebページのコンテンツを参照し、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数以上である場合に固定的と判定する判定手段と、
前記判定手段によって固定的と判定された場合は、前記固定的と判定されなかった場合に比べて検索結果として一度に表示するスニペットのリストの数を減少させるとともに、当該リストを構成するスニペットあたりの文字数を増加させてスニペットを生成するスニペット生成手段と、
前記スニペット生成手段により生成されたスニペットを前記リストとともに前記端末に送信するスニペット送信手段とを備える検索サーバ。
Query receiving means for receiving a query from a terminal;
A search means for searching and specifying a Web page having a high degree of association with the query;
The content of the Web page specified by the search means is referred to, and when the number of the same words, synonyms or synonyms included in a predetermined number of Web pages is equal to or more than the upper limit reference number, it is determined to be fixed A determination means;
When the determination means determines that the list is fixed, the number of snippets displayed at a time as a search result is reduced as compared to the case where the determination is not fixed, and the number of snippets constituting the list is reduced. Snippet generation means for generating a snippet by increasing the number of characters,
A search server comprising snippet transmission means for transmitting the snippet generated by the snippet generation means together with the list to the terminal.
請求項1に記載のサーバであって、
前記判定手段は、さらに、前記所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が下限基準数以下である場合に変動的と判定し、
前記スニペット生成手段は、前記変動的と判定された場合は、一度に表示するスニペットのリストの数を増加させるとともに、当該リストを構成するスニペットあたりの文字数を減少させて、数を増加させた前記リストに含まれるWebページに共通して含まれる同一語句、同義語句又は類義語句を上位から一回のみ抽出し、さらに前記リストに含まれるWebページの特徴語を、前記変動的と判定されなかった場合よりも多く抽出して、これら抽出した語句を用いてスニペットを生成する検索サーバ。
The server according to claim 1,
The determination means further determines that the number of the same phrase, synonym phrase, or synonym phrase that is commonly included in the predetermined number of Web pages is less than or equal to the lower limit reference number, and is variable.
The snippet generation means increases the number of snippet lists to be displayed at a time and decreases the number of characters per snippet constituting the list and increases the number when determined to be variable. The same phrase, synonym phrase, or synonym phrase that is commonly included in the Web pages included in the list is extracted only once from the top, and the characteristic words of the Web page included in the list are not determined to be variable. A search server that extracts more than the case and generates snippets using these extracted phrases.
クエリを送信する端末と、前記クエリに対して応答する検索サーバとを備えるシステムであって、
前記端末は、クエリを送信するクエリ送信手段を有し、
前記検索サーバは、
前記端末から前記クエリを受信するクエリ受信手段と、
前記クエリとの関連度が高いWebページを検索して特定する検索手段と、
前記検索手段によって特定されたWebページのコンテンツを参照し、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数以上である場合に固定的と判定する判定手段と、
前記判定手段によって固定的と判定された場合は、前記固定的と判定されなかった場合に比べて検索結果として一度に表示するスニペットのリストの数を減少させるとともに、当該リストを構成するスニペットあたりの文字数を増加させてスニペットを生成するスニペット生成手段と、
前記スニペット生成手段によって生成されたスニペットを前記リストとともに前記端末に送信するスニペット送信手段とを有し、
前記端末は、前記スニペット生成手段によって送信されたスニペットを前記リストとともに表示するスニペット表示手段をさらに有するシステム。
A system comprising a terminal that transmits a query and a search server that responds to the query,
The terminal has query transmission means for transmitting a query,
The search server
Query receiving means for receiving the query from the terminal;
A search means for searching and specifying a Web page having a high degree of association with the query;
The content of the Web page specified by the search means is referred to, and when the number of the same words, synonyms or synonyms included in a predetermined number of Web pages is equal to or more than the upper limit reference number, it is determined to be fixed A determination means;
When the determination means determines that the list is fixed, the number of snippets displayed at a time as a search result is reduced as compared to the case where the determination is not fixed, and the number of snippets constituting the list is reduced. Snippet generation means for generating a snippet by increasing the number of characters,
Snippet transmission means for transmitting the snippet generated by the snippet generation means to the terminal together with the list;
The terminal further includes snippet display means for displaying the snippet transmitted by the snippet generation means together with the list.
クエリを送信した端末に対し、検索サーバが応答する方法であって、
前記検索サーバは、
前記端末からクエリを受信するクエリ受信工程と、
前記クエリとの関連度が高いWebページを検索して特定する検索工程と、
前記検索工程で特定したWebページのコンテンツを参照し、所定数のWebページに共通して含まれる同一語句、同義語句又は類義語句の数が上限基準数以上である場合に固定的と判定する判定工程と、
前記判定工程で固定的と判定した場合は、前記固定的と判定しなかった場合に比べて検索結果として一度に表示するスニペットのリストの数を減少させるとともに、当該リストを構成するスニペットあたりの文字数を増加させてスニペットを生成するスニペット生成工程と、
前記スニペット生成工程で生成したスニペットを前記リストとともに前記端末に送信するスニペット送信工程とを含む方法。
The search server responds to the terminal that sent the query,
The search server
A query receiving step of receiving a query from the terminal;
A search step for searching and specifying a Web page having a high degree of association with the query;
Judgment that refers to the content of the Web page specified in the search step, and determines that it is fixed when the number of the same phrase, synonym phrase, or synonym phrase that is commonly included in a predetermined number of Web pages is equal to or greater than the upper limit reference number Process,
When it is determined that the determination is fixed, the number of snippet lists displayed at a time as a search result is reduced as compared to the case where the determination is not fixed, and the number of characters per snippet constituting the list is reduced. A snippet generation process for generating a snippet by increasing
A snippet transmission step of transmitting the snippet generated in the snippet generation step together with the list to the terminal.
JP2010089680A 2010-04-08 2010-04-08 Search server, system and method Active JP5068338B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010089680A JP5068338B2 (en) 2010-04-08 2010-04-08 Search server, system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010089680A JP5068338B2 (en) 2010-04-08 2010-04-08 Search server, system and method

Publications (2)

Publication Number Publication Date
JP2011221755A JP2011221755A (en) 2011-11-04
JP5068338B2 true JP5068338B2 (en) 2012-11-07

Family

ID=45038675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010089680A Active JP5068338B2 (en) 2010-04-08 2010-04-08 Search server, system and method

Country Status (1)

Country Link
JP (1) JP5068338B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6104729B2 (en) * 2013-06-17 2017-03-29 株式会社Nttドコモ Content search system, content search method, and content search program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079809A (en) * 2008-09-29 2010-04-08 Sanyo Electric Co Ltd System and program for listing and displaying search result

Also Published As

Publication number Publication date
JP2011221755A (en) 2011-11-04

Similar Documents

Publication Publication Date Title
KR101708448B1 (en) Predictive query suggestion caching
KR101273126B1 (en) System, method, and/or apparatus for reordering search results
US9996620B2 (en) Continuous content refinement of topics of user interest
JP6062929B2 (en) Presenting related searches on the toolbar
US8275759B2 (en) Contextual query suggestion in result pages
CN101911042B (en) The relevance ranking of the browser history of user
EP2473937B1 (en) Table of contents for search query refinement
JP6099046B2 (en) Apparatus and method for retrieving sentences
US20080082486A1 (en) Platform for user discovery experience
US20150088846A1 (en) Suggesting keywords for search engine optimization
US10282358B2 (en) Methods of furnishing search results to a plurality of client devices via a search engine system
AU2008311937A1 (en) System and method for searching for documents
US20150186153A1 (en) Identifying help information based on application context
US20150169576A1 (en) Dynamic Search Results
WO2014014807A2 (en) Search query suggestions based in part on a prior search and searches based on such suggestions
EP2386088A1 (en) Systems and methods for detecting network resource interaction and improved search result reporting
JP2011192102A (en) Device and method for creating summary, and program
US20150339387A1 (en) Method of and system for furnishing a user of a client device with a network resource
WO2014028406A1 (en) Smart user-centric information aggregation
JP5320835B2 (en) Search result display method, program for realizing search result display function, and search result display system
WO2016135534A1 (en) System and method for operating a browsing application
JP5044707B1 (en) Information processing system, information processing apparatus, and program
JP5248655B2 (en) Information processing apparatus and program
JP5068338B2 (en) Search server, system and method
JP2008117134A (en) Period extraction device, period extraction method, period extraction program implementing the method, and recording medium storing its program

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120724

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120814

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150824

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5068338

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350