JP2010117925A - Device and method for searching document data - Google Patents
Device and method for searching document data Download PDFInfo
- Publication number
- JP2010117925A JP2010117925A JP2008291194A JP2008291194A JP2010117925A JP 2010117925 A JP2010117925 A JP 2010117925A JP 2008291194 A JP2008291194 A JP 2008291194A JP 2008291194 A JP2008291194 A JP 2008291194A JP 2010117925 A JP2010117925 A JP 2010117925A
- Authority
- JP
- Japan
- Prior art keywords
- search
- document data
- site
- word
- data group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 11
- 230000006870 function Effects 0.000 claims description 6
- 230000010354 integration Effects 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Abstract
Description
本発明は、文書データを検索する装置及び方法に関する。特に、本発明は、複数の検索語に基づいて文書データを検索する装置及び方法に関する。 The present invention relates to an apparatus and method for retrieving document data. In particular, the present invention relates to an apparatus and method for searching document data based on a plurality of search terms.
近年、多くのウェブサイト(以下、単に「サイト」という)で、検索フォームを有するウェブページ(以下、単に「ページ」という)が設けられ、自サイト内のコンテンツの検索(サイト内検索)をこのページ(サイト内検索ページ)を用いて行うことが可能となっている。
ここで、サイト内検索に関する従来技術として、サイト内検索サーバの識別子を検索結果と共に表示するものはあった(例えば、特許文献1参照)。この特許文献1では、入力された検索式に対応するサイトサーバの識別子を検索し、この識別子に関連づけられた変換プログラムにより、サイトサーバに付属するサイト内検索サーバの識別子を生成し、この識別子を含む入力された検索式に対応する検索結果を生成している。
In recent years, many websites (hereinafter simply referred to as “sites”) have provided web pages (hereinafter simply referred to as “pages”) having a search form. This can be done using a page (site search page).
Here, as a related art regarding site search, there is one that displays an identifier of a site search server together with a search result (see, for example, Patent Document 1). In this
ところで、インターネット上の情報を検索するには、一般に、検索エンジンが用いられる。この検索エンジンには、ロボット型検索エンジンと、ディレクトリ型検索エンジンとがある。ロボット型検索エンジンとは、クローラがハイパーリンク(リンク)を辿りながら自動的にインターネット上のコンテンツにアクセスしてコンテンツのインデックス情報を蓄積し、クライアントから検索要求があるとインデックス情報に基づいて検索結果を返す検索エンジンである。ディレクトリ型検索エンジンとは、管理者がコンテンツを適切なディレクトリに登録し、クライアントから検索要求があるとその登録された情報に基づいて検索結果を返す検索エンジンである。 By the way, a search engine is generally used to search information on the Internet. This search engine includes a robot type search engine and a directory type search engine. A robotic search engine is a crawler that automatically accesses content on the Internet while following hyperlinks (links) and accumulates index information for the content. When a client requests a search, the search results are based on the index information. Is a search engine that returns A directory-type search engine is a search engine in which an administrator registers contents in an appropriate directory and returns a search result based on the registered information when a search request is received from a client.
このうち、ロボット型検索エンジンは、リンクを辿ってアクセスできるページであれば、クローラがそのページの情報を収集できるので、検索要求に応じた検索の対象とすることができる。しかしながら、上述したサイト内検索で検索されるページは、サイト内検索ページから直接検索できるために他サイトからリンクが張られていないことがあり、そのようなページを検索の対象とすることができないという問題点があった。
ここで、特許文献1の発明は、サイト内検索サーバの識別子を表示するだけであり、サイト内検索で検索されるページをサイト外からの検索の対象とするものではない。
Among these, the robot type search engine can collect information on a page that can be accessed by following a link, and can therefore be a target of a search according to a search request. However, since the pages searched by the above-described site search can be directly searched from the site search page, there are cases where links are not made from other sites, and such pages cannot be targeted for search. There was a problem.
Here, the invention of
本発明の目的は、文書データ群(例えば、サイト)内で検索される文書データ(例えば、ページ)を、文書データ群外からの検索の対象とすることにある。 An object of the present invention is to make document data (for example, a page) searched in a document data group (for example, a site) an object of search from outside the document data group.
かかる目的のもと、本発明は、複数の検索語に基づいて文書データを検索する装置であって、複数の検索語のうちの第1の検索語に関連する複数の文書データ群であって、各文書データ群が各文書データ群内の検索のための検索用文書データを含む複数の文書データ群を決定する決定部と、決定部により決定された複数の文書データ群の各文書データ群に含まれる検索用文書データを用いて、各文書データ群から、複数の検索語のうちの第1の検索語とは異なる第2の検索語に関連する複数の文書データを検索する検索部と、検索部により検索された複数の文書データに関する情報を出力する出力部とを備えた、装置を提供する。 For this purpose, the present invention is an apparatus for searching document data based on a plurality of search terms, and a plurality of document data groups related to a first search term among the plurality of search terms. Each document data group determining a plurality of document data groups including search document data for searching in each document data group, and each document data group of the plurality of document data groups determined by the determination unit A search unit for searching a plurality of document data related to a second search word different from the first search word among the plurality of search words from each document data group using the search document data included in And an output unit that outputs information on a plurality of document data searched by the search unit.
ここで、決定部は、第1の検索語と、検索用文書データを検索するための語として予め定められた特定の検索語とを検索エンジンに投入し、検索エンジンから返された検索結果に基づいて、複数の文書データ群を決定する、ものであってよい。決定部は、検索結果に含まれる各文書データ群の所定の性質の程度に基づいて、複数の文書データ群を決定する、ものであってよい。また、決定部は、第1の検索語を検索エンジンに投入し、検索エンジンから返された検索結果における特定の文字列の有無に基づいて、複数の文書データ群を決定する、ものであってよい。
また、出力部は、複数の文書データに関する情報として、決定部により決定された複数の文書データ群の各文書データ群と、検索部により各文書データ群から検索された複数の文書データとを関連付けて表示するための表示情報を出力する、ものであってよい。その場合、検索部は、複数の文書データ群の各文書データ群内の検索のための各検索エンジンに第2の検索語を投入することにより、各文書データ群から、複数の文書データを検索し、出力部は、各検索エンジンから返された各検索結果に基づいて表示情報のレイアウトを決定し、レイアウトの表示情報を出力する、ものであってよい。また、出力部は、各検索結果に含まれる複数の文書データの数に基づいてレイアウトを決定する、ものでもよいし、各検索結果に含まれる複数の文書データのそれぞれの所定の性質の程度の集計結果に基づいてレイアウトを決定する、ものでもよい。
Here, the determination unit inputs the first search word and a specific search word predetermined as a word for searching the search document data into the search engine, and adds the search result to the search result returned from the search engine. Based on this, a plurality of document data groups may be determined. The determination unit may determine a plurality of document data groups based on a predetermined property level of each document data group included in the search result. The determining unit inputs the first search term into the search engine, and determines a plurality of document data groups based on the presence or absence of a specific character string in the search result returned from the search engine. Good.
The output unit associates each document data group of the plurality of document data groups determined by the determination unit as information on the plurality of document data and a plurality of document data searched from each document data group by the search unit. Output display information for display. In that case, the retrieval unit retrieves a plurality of document data from each document data group by inputting the second search word to each search engine for retrieval in each document data group of the plurality of document data groups. The output unit may determine the layout of the display information based on each search result returned from each search engine and output the display information of the layout. The output unit may determine the layout based on the number of the plurality of document data included in each search result, or the degree of a predetermined property of each of the plurality of document data included in each search result. The layout may be determined based on the total result.
また、本発明は、複数の検索語に基づいて文書データを検索する装置であって、複数の検索語のうちの第1の検索語に関連し、文書データ群内の検索のための第1の検索用文書データを含む第1の文書データ群と、複数の検索語のうちの第1の検索語とは異なる第2の検索語に関連し、文書データ群内の検索のための第2の検索用文書データを含む第2の文書データ群とを決定する決定部と、決定部により決定された第1の文書データ群から、第1の検索用文書データを用いて、第2の検索語に関連する第1の文書データを検索し、決定部により決定された第2の文書データ群から、第2の検索用文書データを用いて、第1の検索語に関連する第2の文書データを検索する検索部と、検索部により検索された第1の文書データと第2の文書データとに関する情報を出力する出力部とを備えた、装置も提供する。 The present invention is also an apparatus for searching document data based on a plurality of search terms, which is related to a first search term among the plurality of search terms and is a first for searching in a document data group. A first document data group including a plurality of search document data and a second search word that is related to a second search word different from the first search word among the plurality of search words, and is used for searching in the document data group. A second search unit that uses the first search document data from the determination unit that determines the second document data group including the search document data and the first document data group that is determined by the determination unit The first document data related to the word is searched, and the second document related to the first search word is searched using the second search document data from the second document data group determined by the determination unit. A search unit for searching for data, and the first document data and the second document data searched by the search unit; And an output unit for outputting information about the data, apparatus is also provided.
ここで、決定部は、第1の検索語と、文書データ群内の検索のための検索用文書データを検索するための語として予め定められた特定の検索語とを検索エンジンに投入し、検索エンジンから返された第1の検索結果に基づいて、第1の文書データ群を決定し、第2の検索語と特定の検索語とを検索エンジンに投入し、検索エンジンから返された第2の検索結果に基づいて、第2の文書データ群を決定する、ものであってよい。決定部は、第1の検索結果に含まれる各文書データ群の所定の性質の程度と、第1の検索語に関連する文書データのうちの特定の検索語に関連する文書データに関する所定の数値とから得られる第1の指標、及び、第2の検索結果に含まれる各文書データ群の所定の性質の程度と、第2の検索語に関連する文書データのうちの特定の検索語に関連する文書データに関する所定の数値とから得られる第2の指標に基づいて、第1の文書データ群及び第2の文書データ群を決定する、ものであってよい。また、決定部は、第1の検索語を検索エンジンに投入し、検索エンジンから返された第1の検索結果における特定の文字列の有無に基づいて、第1の文書データ群を決定し、第2の検索語を検索エンジンに投入し、検索エンジンから返された第2の検索結果における特定の文字列の有無に基づいて、第2の文書データ群を決定する、ものであってよい。
また、出力部は、第1の文書データと第2の文書データとに関する情報として、決定部により決定された第1の文書データ群と、検索部により検索された第1の文書データとを関連付けて表示するための第1の表示情報、及び、決定部により決定された第2の文書データ群と、検索部により検索された第2の文書データとを関連付けて表示するための第2の表示情報を出力する、ものであってよい。
Here, the determination unit inputs the first search word and a specific search word predetermined as a word for searching the search document data for searching in the document data group to the search engine, The first document data group is determined based on the first search result returned from the search engine, the second search word and the specific search word are input to the search engine, and the first search data returned from the search engine is returned. The second document data group may be determined based on the second search result. The determination unit is configured to determine a predetermined property level of each document data group included in the first search result and a predetermined numerical value related to document data related to a specific search word among the document data related to the first search word. The first index obtained from the above, the degree of the predetermined property of each document data group included in the second search result, and the specific search word of the document data related to the second search word The first document data group and the second document data group may be determined based on a second index obtained from a predetermined numerical value regarding the document data to be processed. The determining unit inputs the first search term into the search engine, determines the first document data group based on the presence or absence of the specific character string in the first search result returned from the search engine, The second search term may be input to the search engine, and the second document data group may be determined based on the presence or absence of a specific character string in the second search result returned from the search engine.
The output unit associates the first document data group determined by the determination unit and the first document data searched by the search unit as information related to the first document data and the second document data. First display information for display and a second display for displaying the second document data group determined by the determination unit and the second document data searched by the search unit in association with each other It may be one that outputs information.
また、本発明は、複数の検索語に基づいて文書データを検索する装置であって、複数の検索語のうちの第1の検索語及び第2の検索語をそれぞれ検索エンジンに投入することにより、複数の文書データを検索し、第1の検索語と予め定められた特定の検索語とを含む第1の検索語列、及び、第2の検索語と特定の検索語とを含む第2の検索語列をそれぞれ検索エンジンに投入することにより、文書データ群内の検索のための複数の検索用文書データを検索する第1の検索部と、第1の検索語列及び第2の検索語列をそれぞれ検索エンジンに投入して第1の検索部により検索された複数の検索用文書データの中から、複数の検索用文書データに検索エンジンが与えたスコアと、第1の検索語を検索エンジンに投入して第1の検索部により検索された複数の文書データのうちの第1の検索語列を検索エンジンに投入して第1の検索部により検索された複数の検索用文書データの比率とから得られる第1の指標、及び、複数の検索用文書データに検索エンジンが与えたスコアと、第2の検索語を検索エンジンに投入して第1の検索部により検索された複数の文書データのうちの第2の検索語列を検索エンジンに投入して第1の検索部により検索された複数の検索用文書データの比率とから得られる第2の指標に基づいて、第1の文書データ群内の検索のための第1の検索用文書データ、及び、第2の文書データ群内の検索のための第2の検索用文書データを決定する決定部と、決定部により決定された第1の検索用文書データを用いて、第1の文書データ群から、第2の検索語に関連する第1の文書データを検索し、決定部により決定された第2の検索用文書データを用いて、第2の文書データ群から、第1の検索語に関連する第2の文書データを検索する第2の検索部と、決定部により決定された第1の検索用文書データと、第2の検索部により検索された第1の文書データとを関連付けて表示するための第1の表示情報、及び、決定部により決定された第2の検索用文書データと、第2の検索部により検索された第2の文書データとを関連付けて表示するための第2の表示情報を出力する出力部とを備えた、装置も提供する。 Further, the present invention is an apparatus for searching document data based on a plurality of search terms, and by inputting a first search term and a second search term among the plurality of search terms to a search engine. , A plurality of document data, a first search word string including a first search word and a predetermined specific search word, and a second search word including a second search word and a specific search word The first search unit for searching a plurality of search document data for search in the document data group, the first search word string, and the second search Each of the word strings is input to the search engine, and the score given by the search engine to the plurality of search document data and the first search word are selected from the plurality of search document data searched by the first search unit. Search the search engine and search by the first search unit A first index obtained from the ratio of the plurality of search document data searched by the first search unit by inputting a first search word string of the plurality of document data into the search engine, and a plurality of The search engine gives the score given by the search engine and the second search word to the search engine and searches the second search word string among the plurality of document data searched by the first search unit. A first search for searching in the first document data group based on a second index obtained from the ratio of a plurality of search document data input to the engine and searched by the first search unit A first search document data determined by the determination unit determining the second search document data for searching in the second document data group and the second document data group, and the first search document data determined by the determination unit, Related to the second search term from one document data group The first document data is searched, and the second document data related to the first search word is searched from the second document data group using the second search document data determined by the determination unit. First search information for associating and displaying the second search unit, the first search document data determined by the determination unit, and the first document data searched by the second search unit, and And an output unit for outputting second display information for displaying the second search document data determined by the determination unit and the second document data searched by the second search unit in association with each other. An apparatus is also provided.
更に、本発明は、複数の検索語に基づいて文書データを検索する方法であって、複数の検索語のうちの第1の検索語に関連する複数の文書データ群であって、各文書データ群が各文書データ群内の検索のための検索用文書データを含む複数の文書データ群を決定するステップと、決定された複数の文書データ群の各文書データ群に含まれる検索用文書データを用いて、各文書データ群から、複数の検索語のうちの第1の検索語とは異なる第2の検索語に関連する複数の文書データを検索するステップと、検索された複数の文書データに関する情報を出力するステップとを含む、方法も提供する。 Furthermore, the present invention is a method for searching for document data based on a plurality of search terms, wherein a plurality of document data groups related to a first search term among the plurality of search terms, each document data A step of determining a plurality of document data groups including search document data for search within each document data group, and search document data included in each document data group of the determined plurality of document data groups And a step of searching a plurality of document data related to a second search word different from the first search word among the plurality of search words from each document data group, and the plurality of searched document data A method comprising: outputting information.
更にまた、本発明は、複数の検索語に基づいて文書データを検索する装置としてコンピュータを機能させるプログラムであって、コンピュータを、複数の検索語のうちの第1の検索語に関連する複数の文書データ群であって、各文書データ群が各文書データ群内の検索のための検索用文書データを含む複数の文書データ群を決定する決定部と、決定部により決定された複数の文書データ群の各文書データ群に含まれる検索用文書データを用いて、各文書データ群から、複数の検索語のうちの第1の検索語とは異なる第2の検索語に関連する複数の文書データを検索する検索部と、検索部により検索された複数の文書データに関する情報を出力する出力部として機能させる、プログラムも提供する。 Furthermore, the present invention is a program for causing a computer to function as an apparatus for searching for document data based on a plurality of search terms, wherein the computer includes a plurality of search terms related to a first search term among the plurality of search terms. A document data group, each document data group determining a plurality of document data groups including search document data for searching in each document data group, and a plurality of document data determined by the determination unit A plurality of document data related to a second search word different from the first search word out of the plurality of search words from each document data group using the search document data included in each document data group of the group There is also provided a program that functions as a search unit that searches for information and an output unit that outputs information on a plurality of document data searched by the search unit.
本発明によれば、文書データ群内で検索される文書データを、文書データ群外からの検索の対象とすることができる。 According to the present invention, document data searched in a document data group can be a search target from outside the document data group.
以下、添付図面を参照して、本発明を実施するための最良の形態(以下、「実施の形態」という)について詳細に説明する。
まず、本実施の形態が適用されるコンピュータシステムについて説明する。
図1は、このようなコンピュータシステムの全体構成例を示した図である。
図示するように、このコンピュータシステムは、クライアント10a,10bと、検索エンジン20と、サイト内検索装置30とが、ネットワーク80を介して接続されている。
The best mode for carrying out the present invention (hereinafter referred to as “embodiment”) will be described in detail below with reference to the accompanying drawings.
First, a computer system to which this embodiment is applied will be described.
FIG. 1 is a diagram showing an example of the overall configuration of such a computer system.
As shown in the figure, in this computer system, clients 10a and 10b, a
クライアント10a,10bは、ユーザが使用するPC等の端末装置である。より詳しくは、ウェブブラウザがインストールされており、各ユーザがウェブブラウザから検索エンジン20に対して検索クエリ(以下、単に「クエリ」という)を入力すると、ネットワーク80に接続されたウェブサーバ(図示せず)のURIが検索結果として表示される。尚、図では、クライアント10a,10bを示したが、これらを区別する必要がない場合は、クライアント10と称することもある。また、図には、2台のクライアント10しか示していないが、3台以上のクライアント10を設けてもよい。
The clients 10a and 10b are terminal devices such as PCs used by users. More specifically, when a web browser is installed and each user inputs a search query (hereinafter simply referred to as “query”) to the
検索エンジン20は、クローラがリンクを辿りながら自動的にインターネット上のコンテンツにアクセスしてそのコンテンツのインデックス情報を蓄積し、クライアントから検索要求があるとインデックス情報に基づいて検索結果を返すロボット型の検索エンジンである。
The
サイト内検索装置30は、検索エンジン20にクエリが入力された場合に、検索エンジン20からそのクエリを受け取ってサイト内検索を行い、サイト内検索の結果を検索エンジン20に返す。
尚、ここでは、検索エンジン20とサイト内検索装置30とを別個の装置として示したが、これらは1つの装置内に設けられていてもよい。
ネットワーク80は、情報の送受信に用いる通信手段である。このネットワーク80としては、インターネットやLAN(Local Area Network)が例示される。
When a query is input to the
Although the
The network 80 is a communication means used for transmitting / receiving information. Examples of the network 80 include the Internet and a LAN (Local Area Network).
このような構成を有するコンピュータシステムの概略動作を説明する。
図2は、このような概略動作を示した図である。尚、図1では、検索エンジン20がクライアント10からクエリを受け付け、サイト内検索装置30によるサイト内検索の結果をクライアント10に返すようにしたが、ここでは、サイト内検索装置30が直接クライアント10からクエリを受け付け、サイト内検索の結果を直接クライアント10に返すようにしている。
The general operation of the computer system having such a configuration will be described.
FIG. 2 is a diagram showing such a schematic operation. In FIG. 1, the
図において、ユーザは、検索ワード1,2,3に関連するページを探したいという要望を持っているものとする。そこで、まず、ユーザはクライアント10を用いて検索ワード1,2,3をサイト内検索装置30に投入し、サイト内検索装置30が、サイト内検索を行うサイトを決定する(1)。即ち、サイト内検索装置30は、まず、検索エンジン20に検索ワード1を投入することにより、検索ワード1に関連するサイトA,B,Cを検索結果300として取得する。次に、ここで取得した検索結果300に含まれるサイトの中から一定の基準によりサイト内検索の対象のサイトを選択する。ここでは、検索結果300に含まれるサイトA,B,Cのうち、サイトB,Cが、サイト内検索の対象のサイトに決定されたものとする。
In the figure, it is assumed that the user has a desire to search for pages related to
次に、サイト内検索装置30は、(1)で決定されたサイトにおけるサイト内検索ページに検索ワード2,3を投入することにより、サイト内検索を行う(2)。ここでは、サイトB,Cをサイト内検索の対象のサイトとして決定したので、サイトBから検索結果350bを、サイトCから検索結果350cを得ている。
その後、サイト内検索装置30は、検索結果350b,350cを統合し、再ランキングを実行し、その結果をクライアント10に出力することにより、ユーザに提示する(3)。
尚、図には、3つの検索ワードしか示していないが、3つ以上の検索ワードを用いてもよい。
Next, the site search device 30 performs a site search (2) by inserting the
Thereafter, the in-site search device 30 integrates the search results 350b and 350c, executes re-ranking, and outputs the result to the
Although only three search words are shown in the figure, three or more search words may be used.
次に、このような概略動作を行うサイト内検索装置30の機能構成について説明する。
図3は、サイト内検索装置30の機能構成例を示したブロック図である。
図示するように、サイト内検索装置30は、クエリ受付部31と、サイト検索部32と、クエリ記憶部33と、ワードスコア記憶部34と、サイト検索結果記憶部35とを備える。また、サイト決定部36と、サイトスコア記憶部37と、サイト内検索部38と、サイト内検索結果記憶部39と、検索結果統合部40とを備える。
Next, a functional configuration of the in-site search device 30 that performs such a general operation will be described.
FIG. 3 is a block diagram illustrating a functional configuration example of the site search device 30.
As shown in the figure, the in-site search device 30 includes a
クエリ受付部31は、検索エンジン20から複数の検索ワードを含むクエリを受け付ける。
サイト検索部32は、クエリ受付部31が受け付けたクエリをクエリ記憶部33に記憶すると共に、クエリに含まれる1つの検索ワードを検索エンジン20に投入してページを検索し、クエリに含まれる1つの検索ワードと特殊ワード(後述)とを検索エンジン20に投入してサイト内検索ページを検索する。そして、その検索の結果に基づいて、検索ワードのスコア(以下、「ワードスコア」という)をワードスコア記憶部34に記憶し、サイトの検索結果に関する情報(サイト検索結果)をサイト検索結果記憶部35に記憶する。本実施の形態では、文書データの一例として、ページを用い、検索用文書データの一例として、サイト内検索ページを用いている。また、文書データ及び検索用文書データを検索する第1の検索部の一例として、サイト検索部32を設けている。
The
The
クエリ記憶部33は、クエリ受付部31が受け付けたクエリを記憶する。
ワードスコア記憶部34は、サイト検索部32が算出したワードスコアに関する情報(ワードスコア情報)を記憶する。
サイト検索結果記憶部35は、サイト検索部32が取得したサイト検索結果を記憶する。
The
The word
The site search
サイト決定部36は、ワードスコア記憶部34に記憶されたワードスコア情報と、サイト検索結果記憶部35に記憶されたサイト検索結果とに基づいて、サイト内検索を行うサイトを決定し、決定されたサイトのスコア(以下、「サイトスコア」という)をサイトスコア記憶部37に記憶する。本実施の形態では、文書データ群の一例として、サイトを用いている。また、文書データ群を決定する決定部、及び、検索用文書データを決定する決定部の一例として、サイト決定部36を設けている。
The
サイト内検索部38は、サイトスコア記憶部37にサイトスコアに関する情報(サイトスコア情報)が記憶されたサイトを対象としてサイト内検索を行う。その際、クエリ記憶部33に記憶されたクエリに含まれる検索ワードのうち、サイト内検索を行うサイトを検索するのにサイト検索部32が使わなかった検索ワードを用いる。そして、サイト内検索の結果に関する情報(サイト内検索結果)をサイト内検索結果記憶部39に記憶する。本実施の形態では、文書データ群から文書データを検索する検索部及び第2の検索部の一例として、サイト内検索部38を設けている。
検索結果統合部40は、サイト内検索結果記憶部39に記憶されたサイト内検索結果に基づいて、検索結果を統合する。本実施の形態では、文書データに関する情報を出力する出力部の一例として、検索結果統合部40を設けている。
The site search unit 38 performs a site search for a site in which information related to the site score (site score information) is stored in the site
The search
尚、これらの各機能部は、ソフトウェアとハードウェア資源とが協働することにより実現される。具体的には、サイト内検索装置30のCPU90a(図13参照)が、クエリ受付部31、サイト検索部32、サイト決定部36、サイト内検索部38、検索結果統合部40の各機能部を実現するプログラムを磁気ディスク装置90g(図13参照)からメインメモリ90c(図13参照)に読み込んで処理を行う。また、クエリ記憶部33、ワードスコア記憶部34、サイト検索結果記憶部35、サイトスコア記憶部37、サイト内検索結果記憶部39は、例えば、磁気ディスク装置90g(図13参照)によって実現される。
Each of these functional units is realized by cooperation of software and hardware resources. Specifically, the
次いで、本実施の形態の動作について詳細に説明する。
まず、ユーザは、複数の検索ワードをand条件で結合したクエリを検索エンジン20に投入する。この場合、検索エンジン20が提供するクエリを入力するためのページ上に、サイト内検索を行うことを指示するためのチェックボックスを設けてもよい。即ち、検索エンジン20は、チェックボックスにチェックがされていなければ、このクエリに基づく通常の検索結果をクライアント10に返し、チェックボックスにチェックがされていれば、サイト内検索装置30にクエリを渡して、このクエリに基づくサイト内検索の結果をクライアント10に返すようにしてもよい。
Next, the operation of the present embodiment will be described in detail.
First, the user inputs a query in which a plurality of search words are combined under the “and” condition to the
以下、このようなサイト内検索の結果を得る処理について説明する。
サイト内検索装置30では、まず、クエリ受付部31が、検索エンジン20からクエリを受け付け、サイト検索部32に受け渡す。そして、サイト検索部32の動作が開始する。
Hereinafter, a process for obtaining the result of such in-site search will be described.
In the in-site search device 30, first, the
図4は、このときのサイト検索部32の動作を示したフローチャートである。
まず、サイト検索部32は、クエリ受付部31からクエリを取得し、クエリ記憶部33に記憶する(ステップ301)。
そして、サイト検索部32は、クエリ記憶部33に記憶されたクエリに含まれる複数の検索ワードの中から1つの検索ワードを切り出す(ステップ302)。
次に、サイト検索部32は、切り出した検索ワードを検索エンジン20に投入する(ステップ303)。そして、検索結果として得られたページの数(検索結果数)を取得し、この検索結果数をワードスコア記憶部34に記憶する(ステップ304)。
FIG. 4 is a flowchart showing the operation of the
First, the
And the
Next, the
また、サイト検索部32は、ステップ302で切り出した検索ワードに特殊ワードを付加したクエリを検索エンジン20に投入して再度検索を行う(ステップ305)。ここで、検索ワードに付加する特殊ワードは、サイト内検索ページを含むサイトを探すためのキーワードであり、例えば、「検索」、「検索フォーム」、「サイト内検索」、「search」等が考えられる。但し、このようにして検索したページの中には、検索ワード及び特殊ワードを含むものの、サイト内検索ページではないページも含まれる。そこで、サイト検索部32は、ステップ305での検索で得られたページを、<form>タグから</form>タグまでの間に特殊ワードが含まれるページに絞り込む(ステップ306)。ここでの特殊ワードとしても、例えば、「検索」、「検索フォーム」、「サイト内検索」、「search」等が考えられる。そして、サイト検索部32は、サイト内検索ページの数(サイト内検索ページ数)を取得し、このサイト内検索ページ数をワードスコア記憶部34に記憶する(ステップ307)。
Further, the
更に、サイト検索部32は、以下の式により、ワードスコアを算出し、ワードスコア記憶部34に記憶する(ステップ308)。
ワードスコア=サイト内検索ページ数/検索結果数
尚、この計算方法は、ウェブ全体に対する検索を抽象的な検索ワードで行った後、サイト内検索を具体的な検索ワードで行うことで、サイト内の目的のページに到達する、という仮定に基づいている。
或いは、ワードスコアは、特殊ワードに関連するページの総数、特殊ワードに関連するページのスコア(PageRank(登録商標)、検索ワードとの関連度等)の総和、もしくは比率であってもよい。即ち、ページに関する所定の数値であれば、如何なるものを採用してもよい。
そして、サイト検索部32は、ステップ302で切り出した検索ワードに対して、サイト内検索ページのURLと、検索エンジン20がそのサイト内検索ページに付与したスコア(以下、「サイト検索スコア」という)とを、サイト検索結果記憶部35に記憶する(ステップ309)。ここで、サイト検索スコアとしては、ページの内容と検索ワードとの関連度を示すスコアや、PageRank(登録商標)のように検索ワードとは独立したページの重要度等を示すスコアが考えられるが、ページの所定の性質の程度を示すスコアであれば、如何なるスコアを採用してもよい。
Further, the
Word score = number of search pages in site / number of search results Note that this calculation method is to search the entire web with an abstract search word, and then perform a search within the site with a specific search word. Based on the assumption that the target page of
Alternatively, the word score may be the total number or the ratio of the total number of pages related to the special word, the score of the page related to the special word (PageRank (registered trademark), the degree of association with the search word, etc.), or the ratio. That is, any numerical value may be adopted as long as it is a predetermined numerical value relating to the page.
Then, the
その後、サイト検索部32は、ステップ302で検索ワードを切り出した後のクエリに、まだ検索ワードが残っているかどうかを判定する(ステップ310)。そして、検索ワードが残っていると判定されれば、ステップ302〜309を繰り返す。また、検索ワードが残っていないと判定されれば、処理を終了する。
尚、この動作例では、ステップ305で、検索ワードに特殊ワードを付加したクエリを検索エンジン20に投入して検索を行い、この検索で得られたページを、ステップ306で、<form>タグから</form>タグまでに特殊ワードを含むページに絞り込んだ。しかしながら、ステップ305で、検索ワードだけを検索エンジン20に投入して検索を行い、この検索で得られたページを、ステップ306で、<form>タグから</form>タグまでに特殊ワードを含むページに絞り込むようにしてもよい。
また、この動作例では、ステップ306で、<form>タグから</form>タグまでに特殊ワードを含むページに絞り込んだが、<form>の有無等、他の文字列の有無に基づいてページを絞り込むようにしてもよい。
Thereafter, the
In this operation example, in step 305, a query in which a special word is added to the search word is input to the
Also, in this example of operation, in step 306, the pages were narrowed down to pages containing special words from the <form> tag to the </ form> tag, but the page was changed based on the presence or absence of other character strings such as the presence or absence of <form>. You may make it narrow down.
ここで、ステップ304、307、308で情報が記憶されるワードスコア記憶部34について説明する。
図5は、ワードスコア記憶部34に記憶される情報の一例を示した図である。
図示するように、ワードスコア記憶部34には、検索ワードごとに、検索結果数と、サイト内検索ページ数と、サイト内検索ページ数/検索結果数によって得られるワードスコア(単位は%)とが記憶されている。
例えば、検索ワード「ブログ」を検索エンジン20に投入することにより、183000件のページがヒットし、検索ワード「ブログ」に特殊ワード「検索」を付加したクエリを検索エンジン20に投入することにより、50000件のページがサイト内検索ページと判定され、その結果、検索ワード「ブログ」にワードスコア「27」が付与されたことが示されている。
Here, the word
FIG. 5 is a diagram illustrating an example of information stored in the word
As shown in the figure, the word
For example, by inputting the search word “blog” to the
また、ステップ309で情報が記憶されるサイト検索結果記憶部35について説明する。
図6は、サイト検索結果記憶部35に記憶される情報の一例を示した図である。
図示するように、サイト検索結果記憶部35には、検索ワードごとに、サイト内検索ページのURLと、サイト検索スコアとが対応付けられて記憶されている。
サイト内検索ページのURLは、図4のステップ305で検索ワードに特殊ワードを付加して検索することにより得られたURLである。
サイト検索スコアは、上述したように、図4のステップ305での検索により、検索エンジン20がページに付与したスコアである。
The site search
FIG. 6 is a diagram illustrating an example of information stored in the site search
As shown in the figure, the site search
The URL of the search page in the site is the URL obtained by performing a search by adding a special word to the search word in step 305 in FIG.
As described above, the site search score is a score given to the page by the
(a)では、検索ワード「ブログ」を用いて求められたサイト内検索ページのURLとサイト検索スコアとを検索ワード「ブログ」用の記憶領域に記憶している。ここでは、上から順に、サイトA,B,C,D,E,…が、検索ワード「ブログ」を用いて求められているものとする。
(b)では、検索ワード「旅行」を用いて求められたサイト内検索ページのURLとサイト検索スコアとを検索ワード「旅行」用の記憶領域に記憶している。ここでは、上から順に、サイトF,G,…が、検索ワード「旅行」を用いて求められているものとする。
(c)では、検索ワード「ギリシャ」を用いて求められたサイト内検索ページのURLとサイト検索スコアとを検索ワード「ギリシャ」用の記憶領域に記憶している。ここでは、サイトH,…が、検索ワード「ギリシャ」を用いて求められているものとする。
尚、本明細書では、各サイトをサイトA,B,C,D,E,F,G,Hとして言及するが、図面では、各サイトを具体的なURLで示すものとする。
In (a), the URL of the in-site search page obtained using the search word “blog” and the site search score are stored in the storage area for the search word “blog”. Here, it is assumed that the sites A, B, C, D, E,... Are obtained in order from the top using the search word “blog”.
In (b), the URL of the in-site search page obtained using the search word “travel” and the site search score are stored in the storage area for the search word “travel”. Here, it is assumed that the sites F, G,... Are obtained in order from the top using the search word “travel”.
In (c), the URL of the in-site search page obtained using the search word “Greece” and the site search score are stored in the storage area for the search word “Greece”. Here, it is assumed that the site H,... Is obtained using the search word “Greece”.
In this specification, each site is referred to as sites A, B, C, D, E, F, G, and H. In the drawings, each site is indicated by a specific URL.
このように、図では、各検索ワードを用いて求めたサイト内検索ページのURLとサイト検索スコアとを各検索ワードに対応する記憶領域に記憶するようにした。しかしながら、各検索ワードを用いて求めたサイト内検索ページのURLとサイト検索スコアとを記憶する形態は、これには限らない。例えば、各検索ワードを用いて求めたサイト内検索ページのURLとサイト検索スコアとを同一の記憶領域に記憶するようにしてもよい。その場合、サイト内検索ページのURL、サイト検索スコアに加え、検索ワードを項目として追加し、サイト内検索ページのURLとサイト検索スコアとがどの検索ワードを用いて得られたものかを明示しておけばよい。 In this way, in the figure, the URL of the in-site search page obtained using each search word and the site search score are stored in the storage area corresponding to each search word. However, the form of storing the URL of the in-site search page obtained using each search word and the site search score is not limited to this. For example, the URL of the in-site search page obtained using each search word and the site search score may be stored in the same storage area. In that case, in addition to the URL of the site search page and the site search score, a search word is added as an item, and the search word used to obtain the URL of the site search page and the site search score is clearly indicated. Just keep it.
このように、ワードスコア記憶部34及びサイト検索結果記憶部35に情報が記憶されると、サイト決定部36が、サイト内検索を行う対象のサイトを決定する。
図7は、このときのサイト決定部36の動作例を示したフローチャートである。
まず、サイト決定部36は、サイト検索結果記憶部35に記憶されたサイト検索結果のうちのある検索ワードに対する検索結果から1行のレコードを読み込む(ステップ321)。また、その検索ワードのワードスコアをワードスコア記憶部34から取得する(ステップ322)。そして、ステップ321で読み込んだ検索結果に含まれるサイト検索スコアと、ステップ322で取得したワードスコアとを掛け合わせて、サイトスコアを算出する(ステップ323)。即ち、各検索ワードに基づく検索結果(サイト)には、検索エンジン20によりサイト検索スコアが付与されているので、本実施の形態ではこれを再利用し、以下の式のように、ステップ322で求めた各検索ワードのワードスコアを掛け合わせて、サイトスコアを再計算している。
サイトスコア=そのサイトを探すために用いた検索ワードのワードスコア×検索エンジン20がそのサイトに付与したサイト検索スコア
As described above, when information is stored in the word
FIG. 7 is a flowchart showing an operation example of the
First, the
Site score = word score of a search word used for searching the site × site search score assigned to the site by the
これにより、サイト決定部36は、サイト内検索ページのURLと、サイトスコアと、検索ワードとを、サイトスコア記憶部37にスコア順に整列された状態で記憶する(ステップ324)。即ち、これらの情報からなるレコードをサイトスコア記憶部37に記憶しようとした際に、既にレコードがあれば、これから記憶しようとするレコードを、そのレコードに含まれるサイトスコアよりも大きいサイトスコアを含むレコードの次で、かつ、そのレコードに含まれるサイトスコアよりも小さいサイトスコアを含むレコードの前のレコードとして記憶する。その際、新たに記憶したレコードよりも後のレコードは、順番が1つずつ繰り下がることになる。
Thereby, the
その後、サイト決定部36は、現在着目している検索ワードに対応するサイト検索結果からN行のレコードを読み込んだかどうかを判定する(ステップ325)。尚、ここで、Nは、サイト内検索を行う対象のサイトの数としてユーザが指定した自然数である。
その結果、まだN行のレコードを読み込んでいないと判定されれば、ステップ321〜324を繰り返す。一方、N行のレコードを読み込んだと判定されれば、未処理の検索ワードが他にあるかどうかを判定する(ステップ326)。そして、未処理の検索ワードが他にあると判定されれば、ステップ321〜325を繰り返す。また、未処理の検索ワードが他にないと判定されれば、処理を終了する。
Thereafter, the
As a result, if it is determined that N rows of records have not yet been read, steps 321 to 324 are repeated. On the other hand, if it is determined that N rows of records have been read, it is determined whether there are other unprocessed search words (step 326). If it is determined that there are other unprocessed search words, steps 321 to 325 are repeated. If it is determined that there are no other unprocessed search words, the process is terminated.
ここで、ステップ324で情報が記憶されるサイトスコア記憶部37について説明する。
図8は、サイトスコア記憶部37に記憶される情報の一例を示した図である。
図示するように、サイトスコア記憶部37には、サイト内検索ページのURLと、サイトスコアと、検索ワードとが対応付けられて記憶されている。
ここでは、上から順に、サイトA,B,F,G,C,H,D,Eにおけるサイトスコア情報を例示している。つまり、これは、サイト内検索を行う対象のサイトの数としてユーザが指定したNが「8」のときの例である。
例えば、サイト内検索ページのURLが「http://aaablog.jp/」のサイトAの場合、このサイトを検索するのに用いた検索ワード「ブログ」のワードスコアは、図5に示すように「27」であり、このサイトを検索した時に検索エンジン20が付与したサイト検索スコアは、図6(a)に示すように「20」である。従って、これらのスコアを掛け合わせることにより、サイトスコア「540」が記憶されている。
Here, the site
FIG. 8 is a diagram illustrating an example of information stored in the site
As shown in the figure, the site
Here, the site score information in the sites A, B, F, G, C, H, D, and E is illustrated in order from the top. That is, this is an example when N designated by the user as the number of sites to be searched in the site is “8”.
For example, in the case of the site A whose URL of the search page in the site is “http://aaablog.jp/”, the word score of the search word “blog” used for searching this site is as shown in FIG. The site search score given by the
このように、サイトスコア記憶部37に情報が記憶されると、サイト内検索部38が、ここで記憶されたサイトを対象として、サイト内検索を行う。
図9は、このときのサイト内検索部38の動作例を示したフローチャートである。
まず、サイト内検索部38は、サイトスコア記憶部37に記憶されたサイトスコア情報から1行のレコードを読み込む(ステップ341)。また、読み込んだレコードに含まれる検索ワード以外の検索ワードをクエリ記憶部33から取得する(ステップ342)。そして、ステップ341で読み込んだレコードに含まれるサイト内検索ページに対して、ステップ342で取得した検索ワードを投入することにより、サイト内検索を行う(ステップ343)。
As described above, when information is stored in the site
FIG. 9 is a flowchart showing an operation example of the site search unit 38 at this time.
First, the site search unit 38 reads a line of records from the site score information stored in the site score storage unit 37 (step 341). Further, a search word other than the search word included in the read record is acquired from the query storage unit 33 (step 342). The site search is performed by inputting the search word acquired in step 342 to the site search page included in the record read in step 341 (step 343).
尚、このとき、サイトを探すために用いた検索ワードをサイト内検索で用いないのは、サイト内検索ページを探す検索ワードは、具体的な検索を目的とするサイト内検索の検索ワードとしては適さないと考えられるからである。 At this time, the search word used for searching the site is not used in the search in the site. The search word for searching the search page in the site is a search word for the search in the site for a specific search. This is because it is considered unsuitable.
また、サイト内検索は、例えば、以下のように実現される。
1.サイト内検索ページから、次のような<form>タグを見つける。
<form method="get" name="sample" action="http://www.aaa.com/">
<input type="radio" name="site" value="site" checked>サイト内検索
<input type="radio" name="site" value="web">Web検索
<input type="text" name="search_word">
<input type="submit" value="検索">
</form>
2.< type="text" ...>に相当する入力に、サイト内検索で用いる検索ワードを代入する。
この場合、精度を向上するために必要があれば、知識ベースで処理を行う。
また、例えば、サイト内検索及びウェブ検索の何れかをラジオボタンで選択するような場合、「サイト」という文字列が含まれている側にチェックを切り替える。
3.次のようなJavaスクリプト(「Java」は登録商標)を実行する。尚、これは、「旅行 ギリシャ」という検索ワードでサイト内検索を行う場合の例である。
document.sample.search_word.value = "旅行 ギリシャ";
document.sample.submit();
In addition, the site search is realized as follows, for example.
1. From the search page in the site, find the following <form> tag.
<form method = "get" name = "sample" action = "http://www.aaa.com/">
<input type = "radio" name = "site" value = "site"checked> Site search
<input type = "radio" name = "site" value = "web"> Web search
<input type = "text" name = "search_word">
<input type = "submit" value = "search">
</ form>
2. A search word used in the site search is substituted into an input corresponding to <type = "text"...>.
In this case, if necessary to improve accuracy, processing is performed in a knowledge base.
Also, for example, when selecting either in-site search or web search with a radio button, the check is switched to the side including the character string “site”.
3. The following Java script ("Java" is a registered trademark) is executed. This is an example in the case of performing a site search using the search word “travel Greece”.
document.sample.search_word.value = "Travel Greece";
document.sample.submit ();
これにより、サイト内検索部38は、サイト内検索の結果を取得し、ステップ341で読み込んだレコードに含まれるサイトスコアや検索ワードと共にサイト内検索結果記憶部39に記憶する(ステップ344)。ここで、サイト内検索の結果には、サイト内検索で見つかったページのURLを含むページのURL(サイト内検索結果のURL)と、サイト内検索で見つかったページの数(サイト内検索結果数)とがある。尚、サイト内検索結果数は、サイトに依存した方法で取得する。そのためには、知識ベースのテキスト解析等を用いるとよい。例えば、多くのサイトでは、「××件中」という文字列が含まれているので、その文字列をキーにして取得することができる。
Thereby, the site search unit 38 acquires the result of the site search, and stores it in the site search
その後、サイト内検索部38は、サイトスコア情報からN行のレコードを読み込んだかどうかを判定する(ステップ345)。尚、ここでも、Nは、サイト内検索を行う対象のサイトの数としてユーザが指定した自然数である。
その結果、まだN行のレコードを読み込んでいないと判定されれば、ステップ341〜344を繰り返す。一方、N行のレコードを読み込んだと判定されれば、サイト内検索スコアを算出し、サイト内検索結果記憶部39に記憶する(ステップ346)。ここで、サイト内検索スコアは、以下の式により求められる。
サイト内検索スコア=対象サイトでのサイト内検索結果数/全てのサイトでのサイト内検索結果数
尚、この式の分母の「全てのサイト」とは、対象サイトの検索に用いた検索ワードを用いてサイト内検索を行う対象に決定された全てのサイトを意味する。
或いは、サイト内検索スコアは、各検索結果における検索ワードとの関連度の総和や、各検索結果におけるPageRank(登録商標)のように検索ワードと独立したスコアの総和であってもよい。即ち、ページの所定の性質の程度の集計結果を示すスコアであれば、如何なるスコアを採用してもよい。
Thereafter, the site search unit 38 determines whether or not N rows of records have been read from the site score information (step 345). In this case, N is a natural number designated by the user as the number of sites to be searched in the site.
As a result, if it is determined that N rows of records have not yet been read, steps 341 to 344 are repeated. On the other hand, if it is determined that N rows of records have been read, an in-site search score is calculated and stored in the in-site search result storage unit 39 (step 346). Here, the site search score is obtained by the following equation.
Site search score = number of site search results on the target site / number of site search results on all sites Note that the denominator “all sites” is the search word used to search the target site. It means all the sites that have been determined to be used for site search.
Alternatively, the in-site search score may be a total sum of relevance with the search word in each search result or a sum of scores independent of the search word like PageRank (registered trademark) in each search result. In other words, any score may be adopted as long as it is a score indicating a total result of a predetermined level of the page.
また、サイト内検索部38は、最終的なユーザへの検索結果の提示順序を決定するための最終スコアを算出して、サイト内検索結果記憶部39に記憶し、最終スコアの高い順に情報を並べ替える(ステップ347)。ここで、最終スコアは、図7のステップ324で得られたサイトスコアに、上記のサイト内検索スコアを加味して求めるとよい。単純な例としては、サイトスコアとサイト内検索スコアとを掛け合わせることにより最終スコアを算出することが考えられる。
Further, the site search unit 38 calculates a final score for determining the order of presentation of the search results to the final user, stores it in the site search
ここで、ステップ344、346、347で情報が記憶されるサイト内検索結果記憶部39について説明する。
図10は、サイト内検索結果記憶部39に記憶される情報の一例を示した図である。
図示するように、サイト内検索結果記憶部39には、サイト内検索結果のURLと、サイトスコアと、検索ワードと、サイト内検索結果数と、サイト内検索スコアと、最終スコアとが対応付けられて記憶されている。
ここでは、上から順に、サイトB,A,F,G,H,C,D,Eにおけるサイト内検索結果の情報を例示している。
Here, the in-site search
FIG. 10 is a diagram illustrating an example of information stored in the site search
As shown in the figure, the site search
Here, in the order from the top, information on the search results in the sites B, A, F, G, H, C, D, E is illustrated.
例えば、1行目には、次のような情報が示されている。即ち、サイト内検索結果のURLとして、サイトBのサイト内検索ページに「旅行 ギリシャ」を入力してサイト内検索を行うことによって得られる検索結果ページのURLが示されている。また、サイトスコアとして、サイトBのサイトスコア「486」が示されており、検索ワードとして、サイトBを検索するのに用いられた検索ワード「ブログ」が示されており、サイト内検索結果数として、検索結果ページにURLが記述されたページの数「50」が示されている。更に、サイト検索スコアとして、検索ワード「ブログ」で検索されたサイトにおけるサイト内検索数の中で、サイトBにおけるサイト内検索結果数が占める割合が示されている。この例の場合、「0.50(=50/(50+40+5+3+2))」である。そして、最終スコアとして、「243(=486×0.50)」が示されている。 For example, the following information is shown in the first line. That is, the URL of the search result page obtained by inputting “travel Greece” to the search page in the site B and performing the search in the site is shown as the URL of the search result in the site. Further, the site score “486” of the site B is shown as the site score, the search word “blog” used to search the site B is shown as the search word, and the number of search results in the site The number “50” of pages in which the URL is described in the search result page is shown. Furthermore, as the site search score, the ratio of the number of search results in the site B to the number of search results in the site in the site searched by the search word “blog” is shown. In this example, it is “0.50 (= 50 / (50 + 40 + 5 + 3 + 2))”. Then, “243 (= 486 × 0.50)” is shown as the final score.
また、2行目には、次のような情報が示されている。即ち、サイト内検索結果のURLとして、サイトAのサイト内検索ページに「旅行 ギリシャ」を入力してサイト内検索を行うことによって得られる検索結果ページのURLが示されている。また、サイトスコアとして、サイトAのサイトスコア「540」が示されており、検索ワードとして、サイトBを検索するのに用いられた検索ワード「ブログ」が示されており、サイト内検索結果数として、検索結果ページにURLが記述されたページの数「40」が示されている。更に、サイト検索スコアとして、検索ワード「ブログ」で検索されたサイトにおけるサイト内検索数の中で、サイトAにおけるサイト内検索結果数が占める割合が示されている。この例の場合、「0.40(=40/(50+40+5+3+2))」である。そして、最終スコアとして、「216(=540×0.40)」が示されている。 In the second line, the following information is shown. That is, the URL of the search result page obtained by inputting “travel Greece” to the search page of the site A and performing the search in the site is shown as the URL of the search result of the site. Further, the site score “540” of the site A is shown as the site score, the search word “blog” used to search the site B is shown as the search word, and the number of search results in the site As shown, the number “40” of pages in which the URL is described in the search result page is shown. Further, as the site search score, the ratio of the number of search results in the site A to the number of search results in the site in the site searched by the search word “blog” is shown. In this example, “0.40 (= 40 / (50 + 40 + 5 + 3 + 2))”. Then, “216 (= 540 × 0.40)” is shown as the final score.
尚、図8に示すように、検索ワード「ブログ」を用いて求められたサイトのうち、サイトAのサイトスコアは「540」、サイトBのサイトスコアは「486」であった。この結果だけに基づけば、サイトAの方が上に表示されるようにスコアが付与されるはずである。しかしながら、サイトA及びサイトBに対して、サイト内検索用クエリ「旅行 ギリシャ」でサイト内検索をしたところ、サイトAからは40件、サイトBからは50件の検索結果が得られている。そこで、このサイト内検索結果を受けて、サイトAよりもサイトBの方が上に表示されるように、最終スコアはサイトBの方が高くなっている。 As shown in FIG. 8, among the sites obtained using the search word “blog”, the site score of the site A was “540”, and the site score of the site B was “486”. Based only on this result, a score should be given so that site A is displayed above. However, when the site A and the site B are searched by the site search query “travel Greece”, 40 search results from the site A and 50 search results from the site B are obtained. Therefore, the final score is higher for the site B so that the site B is displayed higher than the site A in response to the search result in the site.
このように、サイト内検索結果記憶部39に情報が記憶されると、検索結果統合部40が、検索エンジン20が検索結果に含めるサイト内検索結果の情報を生成する。
図11は、このときの検索結果統合部40の動作例を示したフローチャートである。
まず、検索結果統合部40は、サイト内検索結果記憶部39に記憶されたサイト内検索結果から1行のレコードを読み込む(ステップ361)。そして、読み込んだレコードに含まれるサイト内検索結果のURLをセットしたフレームを生成する(ステップ362)。例えば、<frame>タグのsrc属性にサイト内検索結果のURLをセットすることにより、フレームを生成すればよい。また、読み込んだレコードに含まれるサイト内検索結果数に応じたフレームの高さを所定の計算式で算出し、算出したフレームの高さもフレームの付随情報としてセットする(ステップ363)。ここで、所定の計算式としては、例えば、サイト内検索結果数に対して、1つの検索結果を表示するのに適切な高さとして予め定められた高さを乗ずる計算式が考えられる。また、このように求めたフレームの高さは、例えば、<frameset>タグのrows属性にセットするとよい。
As described above, when information is stored in the in-site search
FIG. 11 is a flowchart showing an operation example of the search
First, the search
その後、検索結果統合部40は、サイト内検索結果からN行のレコードを読み込んだかどうかを判定する(ステップ364)。尚、ここでも、Nは、サイト内検索を行う対象のサイトの数としてユーザが指定した自然数である。
その結果、まだN行のレコードを読み込んでいないと判定されれば、ステップ361〜363を繰り返す。一方、N行のレコードを読み込んだと判定されれば、検索結果統合部40は、ステップ362〜363で情報がセットされたフレームの集合(フレームセット)を検索エンジン20に受け渡す(ステップ365)。
Thereafter, the search
As a result, if it is determined that N rows of records have not yet been read, steps 361 to 363 are repeated. On the other hand, if it is determined that N rows of records have been read, the search
これにより、検索エンジン20は、検索結果を表示するページにフレームセットをはめ込んだページを生成し、クライアント10に送信する。
そして、クライアント10に検索結果が表示される。
図12は、このときにクライアント10に表示される検索結果の一例である。
この検索結果では、サイトAである「aaaブログ」におけるサイト内検索結果を含むフレーム401と、サイトBである「bbbブログ」におけるサイト内検索結果を含むフレーム402とが表示されている。
尚、ここでは、サイトに対応するフレーム内にサイト内検索結果を表示するようにしたが、これはあくまで一例であり、他の表示形態を採用してもよい。例えば、どのサイトでのサイト内検索結果であるかを明示せずに、単純にサイト内検索結果のみを表示するようにしてもよい。
As a result, the
Then, the search result is displayed on the
FIG. 12 is an example of the search result displayed on the
In this search result, a
Here, the search result in the site is displayed in the frame corresponding to the site. However, this is merely an example, and other display forms may be adopted. For example, it is possible to simply display the in-site search result without clearly indicating which site the in-site search result is.
以上、本実施の形態について説明してきた。
ところで、本実施の形態において、サイトはある特定のドメインの配下にあるページ群である必要はない。より一般化して、ドメイン等に関係なく、複数の文書データからなる文書データ群として捉えてもよい。
The present embodiment has been described above.
By the way, in this embodiment, the site does not have to be a group of pages under a specific domain. More generally, it may be regarded as a document data group composed of a plurality of document data regardless of the domain or the like.
また、本実施の形態において、図8に示したサイトスコアは、そのサイトを検索するのに用いた検索ワードのワードスコアを加味したものとなっているが、必ずしもそのような形態には限らない。例えば、ワードスコアを加味せずに、検索エンジン20が各サイトに付与したサイト検索スコアをそのままサイトスコアとして採用してもよい。その場合は、ユーザが指定した複数の検索ワードのうち、どの検索ワードが例えば「ブログ」のように抽象度の高い検索ワードであるかの情報を別途与えておき、サイト内検索を行う対象のサイトを検索する場合には、この抽象度の高い検索ワードを用いるようにするのが好ましい。
更に、本実施の形態では、サイト内検索の対象のサイトを決定するのに用いた検索ワードとは異なる検索ワードを用いて、サイト内検索を行うようにしたが、サイト内検索を行うのに用いる検索ワードの中に、サイト内検索の対象のサイトを決定するのに用いた検索ワードが含まれていても構わない。
Further, in the present embodiment, the site score shown in FIG. 8 takes into account the word score of the search word used for searching the site, but is not necessarily limited to such a form. . For example, the site search score assigned to each site by the
Furthermore, in the present embodiment, the site search is performed using a search word different from the search word used to determine the site to be searched in the site. The search word to be used may include the search word used to determine the site to be searched in the site.
以上説明したように、本実施の形態では、複数の検索ワードを検索エンジン20に投入すると、サイト内検索装置30が、サイト内検索を行うサイトを決定し、そのサイトを対象として自動的にサイト内検索を行うようにした。これにより、検索フォームを設置しているサイトを検索することができ、従来のロボット型検索では検索できないデータ(特定のサーバから検索することでのみ得られるデータ)を検索対象にすることができるようになった。
また、サイトスコア及びサイト内検索スコアを考慮し、総合的に検索結果を表示するようにした。これにより、検索したい情報がどのサイトの中に存在しているかを判断する際の利便性が向上した。
更に、ウェブベースの統計情報を利用して算出したワードスコアを加味して、サイトスコアを算出するようにした。これにより、ユーザが指定した複数の検索ワードのうち、どの検索ワードを用いて、サイト内検索を行う対象のサイトを検索すればよいかを、ユーザが意識しなくてすむようになった。
As described above, in this embodiment, when a plurality of search words are input to the
In addition, the search results are comprehensively displayed in consideration of the site score and the search score in the site. As a result, the convenience in determining which site the information to be searched exists in is improved.
Furthermore, the site score is calculated in consideration of the word score calculated using the web-based statistical information. As a result, the user does not need to be aware of which search word should be used to search the target site to be searched in the site among the plurality of search words specified by the user.
尚、本実施の形態は、次のような事例に応用可能である。
(事例1)
製品の情報を調べたい場合
メーカの製品情報等は、一度、そのメーカのサイトを経由し、再度検索を行わなければならない。しかし、本実施の形態によれば、そのメーカ内のサイトに設置してある検索フォームに自動的に検索ワードを入力し、最初の検索一覧に表示することができる。
(事例2)
サイトが管理している情報の特徴を知りたい場合
情報が様々なサイトやメーリングリスト等で運営されている場合、そのサイト内検索を行った結果を最初の検索一覧に表示することで、迅速にサイトの特徴と良い情報を管理しているサイトを知ることができる。
The present embodiment can be applied to the following cases.
(Case 1)
When it is desired to check the product information, the manufacturer's product information and the like must be searched once again via the manufacturer's site. However, according to the present embodiment, a search word can be automatically input to a search form installed on a site in the manufacturer and displayed on the first search list.
(Case 2)
When you want to know the characteristics of the information managed by the site If the information is operated on various sites or mailing lists, the site search results are displayed in the initial search list, allowing you to quickly You can know the site that manages the features and good information.
最後に、本実施の形態を適用するのに好適なコンピュータのハードウェア構成について説明する。図13は、このようなコンピュータのハードウェア構成の一例を示した図である。図示するように、コンピュータは、演算手段であるCPU(Central Processing Unit)90aと、M/B(マザーボード)チップセット90bを介してCPU90aに接続されたメインメモリ90cと、同じくM/Bチップセット90bを介してCPU90aに接続された表示機構90dとを備える。また、M/Bチップセット90bには、ブリッジ回路90eを介して、ネットワークインターフェイス90fと、磁気ディスク装置(HDD)90gと、音声機構90hと、キーボード/マウス90iと、フレキシブルディスクドライブ90jとが接続されている。
Finally, a hardware configuration of a computer suitable for applying this embodiment will be described. FIG. 13 is a diagram showing an example of the hardware configuration of such a computer. As shown in the figure, the computer includes a CPU (Central Processing Unit) 90a which is a calculation means, a
尚、図13において、各構成要素は、バスを介して接続される。例えば、CPU90aとM/Bチップセット90bの間や、M/Bチップセット90bとメインメモリ90cの間は、CPUバスを介して接続される。また、M/Bチップセット90bと表示機構90dとの間は、AGP(Accelerated Graphics Port)を介して接続されてもよいが、表示機構90dがPCI Express対応のビデオカードを含む場合、M/Bチップセット90bとこのビデオカードの間は、PCI Express(PCIe)バスを介して接続される。また、ブリッジ回路90eと接続する場合、ネットワークインターフェイス90fについては、例えば、PCI Expressを用いることができる。また、磁気ディスク装置90gについては、例えば、シリアルATA(AT Attachment)、パラレル転送のATA、PCI(Peripheral Components Interconnect)を用いることができる。更に、キーボード/マウス90i、及び、フレキシブルディスクドライブ90jについては、USB(Universal Serial Bus)を用いることができる。
In FIG. 13, each component is connected via a bus. For example, the
ここで、本発明は、全てハードウェアで実現してもよいし、全てソフトウェアで実現してもよい。また、ハードウェア及びソフトウェアの両方により実現することも可能である。また、本発明は、コンピュータ、データ処理システム、コンピュータプログラムとして実現することができる。このコンピュータプログラムは、コンピュータにより読取り可能な媒体に記憶され、提供され得る。ここで、媒体としては、電子的、磁気的、光学的、電磁的、赤外線又は半導体システム(装置又は機器)、或いは、伝搬媒体が考えられる。また、コンピュータにより読取り可能な媒体としては、半導体、ソリッドステート記憶装置、磁気テープ、取り外し可能なコンピュータディスケット、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、リジッド磁気ディスク、及び光ディスクが例示される。現時点における光ディスクの例には、コンパクトディスク−リードオンリーメモリ(CD−ROM)、コンパクトディスク−リード/ライト(CD−R/W)及びDVDが含まれる。 Here, the present invention may be realized entirely by hardware or entirely by software. It can also be realized by both hardware and software. The present invention can be realized as a computer, a data processing system, and a computer program. This computer program may be stored and provided on a computer readable medium. Here, the medium may be an electronic, magnetic, optical, electromagnetic, infrared, or semiconductor system (apparatus or equipment), or a propagation medium. Examples of computer-readable media include semiconductors, solid state storage devices, magnetic tape, removable computer diskettes, random access memory (RAM), read-only memory (ROM), rigid magnetic disks, and optical disks. The Current examples of optical disks include compact disk-read only memory (CD-ROM), compact disk-read / write (CD-R / W) and DVD.
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態には限定されない。本発明の精神及び範囲から逸脱することなく様々に変更したり代替態様を採用したりすることが可能なことは、当業者に明らかである。 As mentioned above, although this invention was demonstrated using embodiment, the technical scope of this invention is not limited to the said embodiment. It will be apparent to those skilled in the art that various modifications and alternative embodiments can be made without departing from the spirit and scope of the invention.
10…クライアント、20…検索エンジン、30…サイト内検索装置、31…クエリ受付部、32…サイト検索部、33…クエリ記憶部、34…ワードスコア記憶部、35…サイト検索結果記憶部、36…サイト決定部、37…サイトスコア記憶部、38…サイト内検索部、39…サイト内検索結果記憶部、40…検索結果統合部
DESCRIPTION OF
Claims (16)
前記複数の検索語のうちの第1の検索語に関連する複数の文書データ群であって、各文書データ群が当該各文書データ群内の検索のための検索用文書データを含む複数の文書データ群を決定する決定部と、
前記決定部により決定された前記複数の文書データ群の各文書データ群に含まれる前記検索用文書データを用いて、当該各文書データ群から、前記複数の検索語のうちの前記第1の検索語とは異なる第2の検索語に関連する複数の文書データを検索する検索部と、
前記検索部により検索された前記複数の文書データに関する情報を出力する出力部と
を備えた、装置。 An apparatus for searching document data based on a plurality of search terms,
A plurality of document data groups related to a first search word among the plurality of search words, wherein each document data group includes search document data for search in each document data group. A determination unit for determining a data group;
Using the search document data included in each document data group of the plurality of document data groups determined by the determination unit, the first search of the plurality of search terms from each document data group A search unit for searching for a plurality of document data related to a second search word different from the word;
And an output unit that outputs information on the plurality of document data searched by the search unit.
前記出力部は、各検索エンジンから返された各検索結果に基づいて前記表示情報のレイアウトを決定し、当該レイアウトの当該表示情報を出力する、請求項5の装置。 The search unit inserts the second search word into each search engine for searching in each document data group of the plurality of document data groups, so that the plurality of document data are extracted from each document data group. Search for
The apparatus according to claim 5, wherein the output unit determines a layout of the display information based on each search result returned from each search engine, and outputs the display information of the layout.
前記複数の検索語のうちの第1の検索語に関連し、文書データ群内の検索のための第1の検索用文書データを含む第1の文書データ群と、前記複数の検索語のうちの当該第1の検索語とは異なる第2の検索語に関連し、文書データ群内の検索のための第2の検索用文書データを含む第2の文書データ群とを決定する決定部と、
前記決定部により決定された前記第1の文書データ群から、前記第1の検索用文書データを用いて、前記第2の検索語に関連する第1の文書データを検索し、前記決定部により決定された前記第2の文書データ群から、前記第2の検索用文書データを用いて、前記第1の検索語に関連する第2の文書データを検索する検索部と、
前記検索部により検索された前記第1の文書データと前記第2の文書データとに関する情報を出力する出力部と
を備えた、装置。 An apparatus for searching document data based on a plurality of search terms,
A first document data group that is related to a first search word among the plurality of search words and includes first search document data for searching in the document data group; and among the plurality of search words A determination unit that determines a second document data group that includes a second search document data for searching in the document data group, related to a second search word different from the first search word ,
First document data related to the second search word is searched from the first document data group determined by the determination unit using the first search document data, and the determination unit A search unit for searching for second document data related to the first search word from the determined second document data group using the second search document data;
An apparatus comprising: an output unit that outputs information related to the first document data and the second document data searched by the search unit.
前記複数の検索語のうちの第1の検索語及び第2の検索語をそれぞれ検索エンジンに投入することにより、複数の文書データを検索し、当該第1の検索語と予め定められた特定の検索語とを含む第1の検索語列、及び、当該第2の検索語と当該特定の検索語とを含む第2の検索語列をそれぞれ前記検索エンジンに投入することにより、文書データ群内の検索のための複数の検索用文書データを検索する第1の検索部と、
前記第1の検索語列及び前記第2の検索語列をそれぞれ前記検索エンジンに投入して前記第1の検索部により検索された前記複数の検索用文書データの中から、当該複数の検索用文書データに前記検索エンジンが与えたスコアと、前記第1の検索語を前記検索エンジンに投入して前記第1の検索部により検索された複数の文書データのうちの当該第1の検索語列を前記検索エンジンに投入して前記第1の検索部により検索された複数の検索用文書データの比率とから得られる第1の指標、及び、当該複数の検索用文書データに前記検索エンジンが与えたスコアと、前記第2の検索語を前記検索エンジンに投入して前記第1の検索部により検索された複数の文書データのうちの当該第2の検索語列を前記検索エンジンに投入して前記第1の検索部により検索された複数の検索用文書データの比率とから得られる第2の指標に基づいて、第1の文書データ群内の検索のための第1の検索用文書データ、及び、第2の文書データ群内の検索のための第2の検索用文書データを決定する決定部と、
前記決定部により決定された前記第1の検索用文書データを用いて、前記第1の文書データ群から、前記第2の検索語に関連する第1の文書データを検索し、前記決定部により決定された前記第2の検索用文書データを用いて、前記第2の文書データ群から、前記第1の検索語に関連する第2の文書データを検索する第2の検索部と、
前記決定部により決定された前記第1の検索用文書データと、前記第2の検索部により検索された前記第1の文書データとを関連付けて表示するための第1の表示情報、及び、前記決定部により決定された前記第2の検索用文書データと、前記第2の検索部により検索された前記第2の文書データとを関連付けて表示するための第2の表示情報を出力する出力部と
を備えた、装置。 An apparatus for searching document data based on a plurality of search terms,
A plurality of document data is searched by inputting a first search word and a second search word of the plurality of search words to a search engine, respectively, and the first search word and a specific predetermined A first search word string including a search word and a second search word string including the second search word and the specific search word are respectively input to the search engine, so that the document data group includes A first search unit for searching a plurality of search document data for searching
The first search word string and the second search word string are respectively input to the search engine, and the plurality of search document data are searched from the plurality of search document data searched by the first search unit. The score given by the search engine to the document data, and the first search word string of the plurality of document data searched by the first search unit by inputting the first search word into the search engine. Is input to the search engine, and the search engine gives the first index obtained from the ratio of the plurality of search document data searched by the first search unit, and the plurality of search document data And the second search word string among a plurality of document data searched by the first search unit by inputting the second search word and the second search word into the search engine. The first search Based on the second index obtained from the ratio of the plurality of search document data searched by the first search document data for search in the first document data group, and the second document A determination unit for determining second search document data for search in the data group;
Using the first search document data determined by the determination unit, first document data related to the second search word is searched from the first document data group, and the determination unit A second search unit for searching the second document data group related to the first search word from the second document data group using the determined second search document data;
First display information for displaying the first search document data determined by the determination unit and the first document data searched by the second search unit in association with each other; and An output unit that outputs second display information for displaying the second search document data determined by the determination unit in association with the second document data searched by the second search unit And a device.
前記複数の検索語のうちの第1の検索語に関連する複数の文書データ群であって、各文書データ群が当該各文書データ群内の検索のための検索用文書データを含む複数の文書データ群を決定するステップと、
決定された前記複数の文書データ群の各文書データ群に含まれる前記検索用文書データを用いて、当該各文書データ群から、前記複数の検索語のうちの前記第1の検索語とは異なる第2の検索語に関連する複数の文書データを検索するステップと、
検索された前記複数の文書データに関する情報を出力するステップと
を含む、方法。 A method for searching document data based on a plurality of search terms,
A plurality of document data groups related to a first search word among the plurality of search words, wherein each document data group includes search document data for search in each document data group. Determining a data set;
Using the search document data included in each document data group of the determined plurality of document data groups, the first search word out of the plurality of search words is different from each document data group. Retrieving a plurality of document data related to the second search term;
Outputting information relating to the retrieved plurality of document data.
前記コンピュータを、
前記複数の検索語のうちの第1の検索語に関連する複数の文書データ群であって、各文書データ群が当該各文書データ群内の検索のための検索用文書データを含む複数の文書データ群を決定する決定部と、
前記決定部により決定された前記複数の文書データ群の各文書データ群に含まれる前記検索用文書データを用いて、当該各文書データ群から、前記複数の検索語のうちの前記第1の検索語とは異なる第2の検索語に関連する複数の文書データを検索する検索部と、
前記検索部により検索された前記複数の文書データに関する情報を出力する出力部と
して機能させる、プログラム。 A program that causes a computer to function as a device that retrieves document data based on a plurality of search terms,
The computer,
A plurality of document data groups related to a first search word among the plurality of search words, wherein each document data group includes search document data for search in each document data group. A determination unit for determining a data group;
Using the search document data included in each document data group of the plurality of document data groups determined by the determination unit, the first search of the plurality of search terms from each document data group A search unit for searching for a plurality of document data related to a second search word different from the word;
A program that functions as an output unit that outputs information on the plurality of document data searched by the search unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008291194A JP5226471B2 (en) | 2008-11-13 | 2008-11-13 | Apparatus and method for retrieving document data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008291194A JP5226471B2 (en) | 2008-11-13 | 2008-11-13 | Apparatus and method for retrieving document data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010117925A true JP2010117925A (en) | 2010-05-27 |
JP5226471B2 JP5226471B2 (en) | 2013-07-03 |
Family
ID=42305558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008291194A Expired - Fee Related JP5226471B2 (en) | 2008-11-13 | 2008-11-13 | Apparatus and method for retrieving document data |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5226471B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004264928A (en) * | 2003-02-28 | 2004-09-24 | Nippon Telegr & Teleph Corp <Ntt> | In-web site retrieval method and device, in-web site retrieval program, and storage medium recording the program |
JP2006099279A (en) * | 2004-09-28 | 2006-04-13 | Newswatch Inc | Search device and search program |
JP2007323394A (en) * | 2006-06-01 | 2007-12-13 | Ritsumeikan | Meta retrieval system and meta retrieval method, user terminal to be used for the same, and program |
JP2008165785A (en) * | 2006-12-27 | 2008-07-17 | Nhn Corp | Retrieval system and method thereof |
-
2008
- 2008-11-13 JP JP2008291194A patent/JP5226471B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004264928A (en) * | 2003-02-28 | 2004-09-24 | Nippon Telegr & Teleph Corp <Ntt> | In-web site retrieval method and device, in-web site retrieval program, and storage medium recording the program |
JP2006099279A (en) * | 2004-09-28 | 2006-04-13 | Newswatch Inc | Search device and search program |
JP2007323394A (en) * | 2006-06-01 | 2007-12-13 | Ritsumeikan | Meta retrieval system and meta retrieval method, user terminal to be used for the same, and program |
JP2008165785A (en) * | 2006-12-27 | 2008-07-17 | Nhn Corp | Retrieval system and method thereof |
Non-Patent Citations (1)
Title |
---|
JPN7011000642; 専門検索サイトの動的統合による次世代検索システムの研究開発 , 2002 * |
Also Published As
Publication number | Publication date |
---|---|
JP5226471B2 (en) | 2013-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5110201B2 (en) | Search processing method and apparatus | |
KR101721338B1 (en) | Search engine and implementation method thereof | |
US8001135B2 (en) | Search support apparatus, computer program product, and search support system | |
US8150846B2 (en) | Content searching and configuration of search results | |
US9195717B2 (en) | Image result provisioning based on document classification | |
US20160210300A1 (en) | System and method for completing a user query and for providing a query response | |
JP2003178092A (en) | Information retrieval system, information providing device, information retrieving method and program | |
JP2010097461A (en) | Document search apparatus, document search method, and document search program | |
JP5020716B2 (en) | Multimedia data search system, multimedia data search apparatus, multimedia data search method, and program | |
JP4824070B2 (en) | Search processing apparatus, search processing method and program for selecting seed of crawler for specialized search using click log | |
JP2007334590A (en) | Method, device and program for information ranking, and computer readable recording medium | |
JP2001265774A (en) | Method and device for retrieving information, recording medium with recorded information retrieval program and hypertext information retrieving system | |
JP2006236221A (en) | Management server for web page retrieval | |
JP5226471B2 (en) | Apparatus and method for retrieving document data | |
JP2010055164A (en) | Sentence retrieval device, sentence retrieval method, sentence retrieval program and its storage medium | |
JP5286007B2 (en) | Document search device, document search method, and document search program | |
JP2017072964A (en) | Information analyzing apparatus and information analyzing method | |
JP2003162540A (en) | Data retrieval device and data retrieval method | |
JP7309669B2 (en) | Information processing device, information processing method, and information processing program | |
JP2010140411A (en) | Category presentation device | |
JP4859891B2 (en) | Server, system and method for providing information related to contents | |
JP2010122932A (en) | Document retrieval device, document retrieval method, and document retrieval program | |
JP2009059195A (en) | Information provision server and information provision method | |
JP2003263457A (en) | Facility information retrieval device based on desire or situation expression | |
JP5544401B2 (en) | Document data evaluation method, document data evaluation device, document data selection method, document data selection device, database generation method, database generation device, and computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110906 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130226 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20130226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5226471 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160322 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |