JP2016015179A - Search device and search method - Google Patents

Search device and search method Download PDF

Info

Publication number
JP2016015179A
JP2016015179A JP2015212240A JP2015212240A JP2016015179A JP 2016015179 A JP2016015179 A JP 2016015179A JP 2015212240 A JP2015212240 A JP 2015212240A JP 2015212240 A JP2015212240 A JP 2015212240A JP 2016015179 A JP2016015179 A JP 2016015179A
Authority
JP
Japan
Prior art keywords
query
score
document
search
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015212240A
Other languages
Japanese (ja)
Other versions
JP6174099B2 (en
JP2016015179A5 (en
Inventor
秀平 宇野
Shuhei Uno
秀平 宇野
中島 泰
Yasushi Nakajima
泰 中島
洋平 森下
Yohei Morishita
洋平 森下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2015212240A priority Critical patent/JP6174099B2/en
Publication of JP2016015179A publication Critical patent/JP2016015179A/en
Publication of JP2016015179A5 publication Critical patent/JP2016015179A5/ja
Application granted granted Critical
Publication of JP6174099B2 publication Critical patent/JP6174099B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a search device and a search method capable of returning an appropriate search result even when a negative value is used in a WAND algorithm.SOLUTION: A search device 10 for searching a desired document from a plurality of documents on the basis of queries includes: query acquisition means 131 for acquiring the queries and query scores; a storage part 12 for storing indexes where document scores indicating degrees of association between the documents and the queries are recorded for each query and document, and the minimum value of the document scores is recorded for each query; and search means 133 for searching the predetermined number of documents with respect to the queries on the basis of total scores calculated from the query scores and the document scores. The search means 133 determines the document as the target of the calculation of the total scores by using the query scores and the minimum value when the query scores are negative values.

Description

本発明は、WANDアルゴリズムを用いた検索装置、及び検索方法に関する。   The present invention relates to a search device and a search method using a WAND algorithm.

従来、ユーザのクエリに対して検索結果を返す検索アルゴリズムとして、WAND検索アルゴリズムが知られている(例えば、非特許文献1参照)。
非特許文献1に記載のように、WAND検索アルゴリズムでは、各ドキュメントは、クエリに対するスコアを有し、インデックスにそのスコア最大値が記録されている。そして、クエリに設定されたクエリスコアと、インデックスに記録されたスコア最大値とに基づいて、検索目標数(Top−k)の検索結果を得る。
ここで、インデックスに設定されたクエリに対するスコアと、クエリに設定されたクエリスコアとの積をクエリ毎に算出して、算出された積を加算して、当該ドキュメントに対するトータルスコアとする。この際、WANDアルゴリズムでは、上記のように、インデックスに各ドキュメントのクエリに対する最大スコアが記録されているので、1つのドキュメントに対するトータルスコアが算出されると、そのトータルスコアを閾値として、他のドキュメントに対するトータルスコアの算出をスキップ可能か否かを判定できる。
Conventionally, a WAND search algorithm is known as a search algorithm that returns a search result in response to a user query (see, for example, Non-Patent Document 1).
As described in Non-Patent Document 1, in the WAND search algorithm, each document has a score for a query, and the maximum score value is recorded in the index. Then, based on the query score set for the query and the maximum score recorded in the index, the search result of the search target number (Top-k) is obtained.
Here, the product of the score for the query set in the index and the query score set for the query is calculated for each query, and the calculated product is added to obtain the total score for the document. At this time, in the WAND algorithm, as described above, the maximum score for each query of the document is recorded in the index. Therefore, when the total score for one document is calculated, the total score for other documents is set with the total score as a threshold value. It can be determined whether or not the calculation of can be skipped.

例えば、クエリAに対するクエリスコアが「1」、クエリBに対するクエリスコアが「2」であり、ドキュメント1〜5に対して、以下の表1に示すように、クエリAに対するスコア、クエリBに対するスコアが設定されているとする。なお、説明の簡略のため、k=1とする(最もスコアが高いもの1つを抽出する)。   For example, the query score for the query A is “1”, the query score for the query B is “2”, and the documents 1 to 5 are scored for the query A and the score for the query B as shown in Table 1 below. Is set. For simplicity of explanation, k = 1 is set (one with the highest score is extracted).

Figure 2016015179
Figure 2016015179

上記のような例では、インデックスとして、クエリAに対するスコア最大値「4」、クエリBに対するスコア最大値「3」が記録される。
そして、WANDアルゴリズムでは、ドキュメント1に対してクエリA,Bに対するトータルスコアが、1・2+2・1=4として算出される。ここで、閾値が4として設定される。クエリAに対するスコア最大値は「4」であり、クエリスコアが「1」であるため、クエリAのみを含むドキュメントでは、閾値「4」を超えることができない。したがって、クエリAに対するスコアのみを有するドキュメント2はスキップされる。
一方、クエリBに対する最大値は「3」であり、クエリスコアが「2」であるため、クエリBのみを含むドキュメントにおいては、閾値「4」を超える可能性がある。しかしながら、クエリBのみを含むドキュメントでは、スコアが3以上でなければ閾値を越えないので、ドキュメント3もスキップされる。
ドキュメント4は、クエリA,Bに対してスコアを有し、かつ、ドキュメント1よりもスコアが高いため、トータルスコアを算出する価値があると判定される。その結果、ドキュメント4に対してトータルスコア「7」が算出される。ここで、閾値「4」が「7」に更新される。以降、同様にして、残りのドキュメントに対して、スキップの判定が実施され、スキップされない場合は、トータルスコアが算出される。
In the above example, the maximum score value “4” for query A and the maximum score value “3” for query B are recorded as indexes.
In the WAND algorithm, the total score for queries A and B for document 1 is calculated as 1.multidot.2 + 2.multidot.1 = 4. Here, the threshold is set as 4. Since the maximum score value for the query A is “4” and the query score is “1”, the document including only the query A cannot exceed the threshold value “4”. Therefore, document 2 having only a score for query A is skipped.
On the other hand, since the maximum value for the query B is “3” and the query score is “2”, the document including only the query B may exceed the threshold “4”. However, in the document including only the query B, the threshold is not exceeded unless the score is 3 or more, so the document 3 is also skipped.
Since the document 4 has scores for the queries A and B and has a higher score than the document 1, it is determined that the document 4 is worth calculating the total score. As a result, a total score “7” is calculated for the document 4. Here, the threshold “4” is updated to “7”. Thereafter, in the same manner, skip determination is performed on the remaining documents, and if not skipped, a total score is calculated.

”Deepak Agarwal”,”Maxim Gurevich”、” Fast top-k retrieval for model based recommendation”、 ”WSDM '12 Proceedings of the fifth ACM international conference on Web search and data mining”、アメリカ合衆国、”ACM New York”、 2012年2月8日、483頁〜492頁“Deepak Agarwal”, “Maxim Gurevich”, “Fast top-k retrieval for model based recommendation”, “WSDM '12 Proceedings of the fifth ACM international conference on Web search and data mining”, USA, “ACM New York”, 2012 February 8, 2012, pages 483-492

ところで、近年、ユーザに対してより最適な検索結果を返すために、クエリのスコアや、当該クエリに対するドキュメントのスコアとして負値が用いられることがある。例えば、クエリBを検索に含ませたくない場合、クエリBのスコアを負値とし、クエリBに対するスコアが低いドキュメントを検索する。
しかしながら、上述したようなWANDアルゴリズムでは、負値のスコアを用いると最適な検索結果を返すことができない場合がある。
By the way, in recent years, in order to return a more optimal search result to the user, a negative value may be used as a query score or a document score for the query. For example, when query B is not desired to be included in the search, the score of query B is set to a negative value, and a document with a low score for query B is searched.
However, in the WAND algorithm as described above, an optimal search result may not be returned if a negative score is used.

例えば、クエリAに対するスコアが「1」、クエリBに対するスコアが「−1」であり、ドキュメント1〜2に対して、以下の表2に示すように、クエリAに対するスコア、クエリBに対するスコアが設定されているとする。なお、説明の簡略のため、k=1とする(最もスコアが高いもの1つを抽出する)。   For example, the score for the query A is “1”, the score for the query B is “−1”, and the scores for the query A and the score for the query B are as shown in Table 2 below for the documents 1 and 2. Suppose that it is set. For simplicity of explanation, k = 1 is set (one with the highest score is extracted).

Figure 2016015179
Figure 2016015179

上記のような例においてWANDアルゴリズムによるTop−1検索を実施すると、ドキュメント1に対してクエリA,Bに対するトータルスコアが1・3+(−1)・(−1)=4として算出される。一方、閾値が「4」となるので、従来のWANDアルゴリズムでは、クエリAのスコア最大値「3」、クエリBのスコア最大値「−1」を超えるドキュメントがないため、ドキュメント2に対するトータルスコアの算出がスキップされることになる。
しかしながら、実際のドキュメント2に対するスコアは、1・1+(−1)・(−6)=7であり、ドキュメント1よりもスコアが高いものであり、本来ドキュメント1よりも上位に検索されるべきものとなる。
このように、スコアに負値が含まれる場合では、WANDアルゴリズムを用いた検索では、適切な検索結果を返すことができないという課題がある。
When the Top-1 search by the WAND algorithm is performed in the above example, the total score for the queries A and B is calculated as 1 · 3 + (− 1) · (−1) = 4 for the document 1. On the other hand, since the threshold value is “4”, in the conventional WAND algorithm, since there is no document that exceeds the maximum score “3” of query A and the maximum score “−1” of query B, the total score for document 2 is calculated. Will be skipped.
However, the score for the actual document 2 is 1 · 1 + (− 1) · (−6) = 7, which is higher than the document 1 and should be searched higher than the document 1 originally. It becomes.
Thus, when a negative value is included in the score, there is a problem that an appropriate search result cannot be returned by a search using the WAND algorithm.

本発明は、WANDアルゴリズムにおいて負値が用いられた場合でも、適切な検索結果を返すことができる検索装置、及び検索方法を提供することを目的する。   An object of the present invention is to provide a search device and a search method capable of returning an appropriate search result even when a negative value is used in the WAND algorithm.

本発明の検索装置は、クエリに基づいて、複数のドキュメントから所望のドキュメントを検索する検索装置であって、前記クエリ、及び前記クエリの重み付けであるクエリスコアを取得するクエリ取得手段と、前記ドキュメントの前記クエリに対する関連度を示すドキュメントスコアが、前記クエリ毎及び前記ドキュメント毎に記録され、かつ、クエリ毎に前記ドキュメントスコアの最小値が記録されたインデックスを記憶するインデックス記憶手段と、前記クエリスコア及び前記ドキュメントスコアにより算出されるトータルスコアに基づいて、クエリに対する所定数のドキュメントを検索する検索手段と、を備え、前記検索手段は、前記クエリスコアが負値である場合に、当該クエリスコア及び前記最小値を用いて、前記トータルスコアを算出する対象のドキュメントを判断することを特徴とする。   The search device of the present invention is a search device that searches a desired document from a plurality of documents based on a query, the query acquisition means for acquiring the query and a query score that is a weight of the query, and the document An index storage means for storing an index in which a document score indicating a degree of relevance to the query is recorded for each query and each document, and a minimum value of the document score is recorded for each query; and the query score And a search means for searching a predetermined number of documents for the query based on the total score calculated by the document score, and the search means, when the query score is a negative value, Using the minimum value, the total score Characterized in that to determine the subject of the document to be calculated.

本発明では、クエリスコアが負値の場合に、ドキュメントスコアの最小値を用いて、WANDアルゴリズムによる検索処理を実施するため、クエリに対して正確な順位でドキュメントを検索でき、適切な検索結果を返すことができる。   In the present invention, when the query score is a negative value, the search processing by the WAND algorithm is performed using the minimum value of the document score. Therefore, the document can be searched in an accurate rank with respect to the query, and an appropriate search result is obtained. Can return.

第一実施形態の検索装置の概略を示すブロック図。The block diagram which shows the outline of the search device of 1st embodiment. 第一実施形態の検索処理(検索方法)を示すフローチャート。The flowchart which shows the search process (search method) of 1st embodiment. 図2におけるスキップ判定処理を示すフローチャート。The flowchart which shows the skip determination process in FIG. 第二実施形態に係る広告検索システムの概略を示す図。The figure which shows the outline of the advertisement search system which concerns on 2nd embodiment.

[第一実施形態]
以下、本発明に係る一実施形態の検索装置に関し、図面に基づいて説明する。
[検索装置の構成]
図1は、本実施形態の検索装置を示すブロック図である。
本実施形態の検索装置10は、コンピュータであり、通信部11と、記憶部12と、制御部13と、等を含んで構成されている。
通信部11は、例えばLAN等を介してネットワークに接続されており、ネットワーク上の他の機器と通信する。
[First embodiment]
Hereinafter, a search device according to an embodiment of the present invention will be described with reference to the drawings.
[Configuration of search device]
FIG. 1 is a block diagram showing the search device of this embodiment.
The search device 10 of this embodiment is a computer, and includes a communication unit 11, a storage unit 12, a control unit 13, and the like.
The communication unit 11 is connected to a network via, for example, a LAN and communicates with other devices on the network.

記憶部12は、例えばメモリ、ハードディスク等により構成されたデータ記録装置であり、本発明におけるインデックス記憶部を構成する。
この記憶部12は、検索装置を制御するための各種プログラムや各種データを記憶する。また、記憶部12には、インデックス記憶手段として機能し、検索処理の対象であるドキュメントのインデックスが記憶される。
なお、検索処理の対象となるドキュメントは、ネットワーク上の所定のサーバ装置に記憶されていてもよく、検索装置10の記憶部12に記憶されていてもよい。
The storage unit 12 is a data recording device constituted by, for example, a memory, a hard disk, etc., and constitutes an index storage unit in the present invention.
The storage unit 12 stores various programs and various data for controlling the search device. In addition, the storage unit 12 functions as an index storage unit and stores an index of a document to be searched.
Note that the document to be searched may be stored in a predetermined server device on the network or may be stored in the storage unit 12 of the search device 10.

このインデックスは、例えばユーザ等から要求されたクエリ(キーワード等の検索条件)に対する最適なドキュメントを迅速に検索するための索引情報であり、例えば表3に示すようなデータが記録される。   This index is index information for quickly searching for an optimum document for a query requested by a user or the like (search conditions such as keywords), and data as shown in Table 3 is recorded, for example.

Figure 2016015179
Figure 2016015179

表3に示すように、インデックスには、ドキュメントIDと、ドキュメントスコアと、Maxスコアと、Minスコアとが含まれる。
ドキュメントIDは、ドキュメントを特定する識別データである。
ドキュメントスコアは、所定のクエリに対してそれぞれ設定されており、クエリに対する関連度を示す。例えば、クエリとして検索キーワードが設定される場合では、ドキュメントに含まれる当該キーワード数、若しくは当該キーワード数に基づいて算出された数値がドキュメントスコアとして記録される。
また、クエリBに対するドキュメントスコアに示すように、ドキュメントスコアが負値を設定してもよい。例えば、「男性向け」とのクエリに対して、「女性向け」のドキュメントのドキュメントスコアを負値に設定することで、検索順位を低くすることができる。
Maxスコアは、各クエリに対するドキュメントスコアの最大値であり、Minスコアは、各クエリに対するドキュメントスコアの最小値である。
また、インデックスとしては、その他、ドキュメントIDにて特定されるドキュメントの所在等(例えばURL等)が記録されていてもよい。
As shown in Table 3, the index includes a document ID, a document score, a Max score, and a Min score.
The document ID is identification data that identifies a document.
The document score is set for each predetermined query and indicates the degree of relevance to the query. For example, when a search keyword is set as a query, the number of keywords included in the document or a numerical value calculated based on the number of keywords is recorded as the document score.
Further, as shown in the document score for the query B, the document score may set a negative value. For example, with respect to the query “for men”, the document ranking of the document “for women” is set to a negative value, so that the search order can be lowered.
The Max score is the maximum document score for each query, and the Min score is the minimum document score for each query.
In addition, as the index, the location of the document identified by the document ID (for example, URL) may be recorded.

制御部13は、CPU等の演算回路、RAM等の記憶回路により構成され、記憶部12等に記憶されているプログラム(ソフトウェア)をRAMに展開し、RAMに展開されたプログラムとの協働で、各種処理を実行する。そして、制御部13は、上記各種処理を実行することで、図1に示すように、クエリ取得手段131、インデックス取得手段132、及び検索手段133等として機能する。   The control unit 13 includes an arithmetic circuit such as a CPU and a storage circuit such as a RAM. The control unit 13 expands a program (software) stored in the storage unit 12 or the like in the RAM, and cooperates with the program expanded in the RAM. Various processes are executed. And the control part 13 functions as the query acquisition means 131, the index acquisition means 132, the search means 133, etc. as shown in FIG. 1 by performing the said various processes.

クエリ取得手段131は、例えばネットワーク上の端末装置(ユーザ端末)から送信されたクエリ、及び当該クエリの重み付け値であるクエリスコアを取得する。なお、本実施形態では、ネットワーク上の端末装置からクエリ及びクエリスコアを取得する例を示すが、これに限定されない。例えば、検索装置10がキーボードやマウス等の入力装置を備え、検索装置10の利用者が入力装置を介してクエリやクエリスコアを入力してもよい。その他、クエリ及びクエリスコアが記憶部12に記憶されており、クエリ取得手段131は、例えば端末装置や入力装置からのクエリ指定要求に従って、記憶部12に記憶された当該クエリ及びクエリスコアを取得する構成などとしてもよい。   The query acquisition unit 131 acquires, for example, a query transmitted from a terminal device (user terminal) on the network and a query score that is a weight value of the query. In this embodiment, an example in which a query and a query score are acquired from a terminal device on the network is shown, but the present invention is not limited to this. For example, the search device 10 may include an input device such as a keyboard and a mouse, and a user of the search device 10 may input a query and a query score via the input device. In addition, the query and the query score are stored in the storage unit 12, and the query acquisition unit 131 acquires the query and the query score stored in the storage unit 12 according to a query designation request from a terminal device or an input device, for example. It is good also as a structure.

インデックス取得手段132は、記憶部12に記憶されたインデックスを取得する。なお、本実施形態では、記憶部12にインデックスが記憶される例を示すが、例えば、ネットワーク上のその他のサーバ装置からインデックスを取得する構成などとしてもよい。   The index acquisition unit 132 acquires an index stored in the storage unit 12. In this embodiment, an example in which an index is stored in the storage unit 12 is shown. However, for example, the index may be obtained from another server device on the network.

検索手段133は、クエリ、クエリスコア、及びインデックスに基づいて、クエリに対して最適なドキュメントを、WANDアルゴリズムを用いて検索する。具体的には、検索手段133は、スコア算出手段134、閾値設定手段135、スキップ判定手段136、及び抽出手段137として機能する。   Based on the query, the query score, and the index, the search unit 133 searches for an optimal document for the query using a WAND algorithm. Specifically, the search unit 133 functions as a score calculation unit 134, a threshold setting unit 135, a skip determination unit 136, and an extraction unit 137.

スコア算出手段134は、クエリスコア及びドキュメントスコアに基づいて、所定のドキュメントの所定のクエリに対するスコア(トータルスコア)を算出する。
閾値設定手段135は、WANDアルゴリズムによる検索処理を実施する上での閾値を設定する。
スキップ判定手段136は、インデックスのMaxスコア、Minスコア、クエリスコア、閾値に基づいて、スコア算出手段134によりドキュメントのトータルスコアを算出するか否かを判定する。
抽出手段137は、算出されたトータルスコアに基づき、Top−kの検索対象のドキュメントIDを抽出する。すなわち、トータルスコアが高い上位k個のドキュメントIDを検索結果として抽出する。
なお、各機能構成の詳細な説明は後述する。
The score calculation unit 134 calculates a score (total score) for a predetermined query of a predetermined document based on the query score and the document score.
The threshold value setting unit 135 sets a threshold value for performing a search process using the WAND algorithm.
The skip determination unit 136 determines whether or not the total score of the document is calculated by the score calculation unit 134 based on the Max score, Min score, query score, and threshold value of the index.
The extracting unit 137 extracts the document ID to be searched for Top-k based on the calculated total score. That is, the top k document IDs with the highest total scores are extracted as search results.
A detailed description of each functional configuration will be described later.

[検索方法]
次に、上記のような検索装置10におけるTop−kのドキュメントの検索方法(検索処理)について、図面に基づいて説明する。図2は、本実施形態における検索処理のフローチャートである。
図2に示すように、本実施形態におけるWANDアルゴリズムに基づく検索処理では、まず、クエリ取得手段131は、クエリQ={q,q,q…q}、及び、これらのクエリQに対するクエリスコアS={SQ1,SQ2,SQ3…SQN}を取得する(ステップS1)。
なお、ステップS1では、クエリ取得手段131は、例えば上述したように、ネットワークを介してユーザ端末等の端末装置から入力されるクエリQ及びクエリスコアSQnを取得してもよく、端末装置からの要求に従い、記憶部12に記憶されているクエリQ及びクエリスコアSQnを取得してもよい。
[retrieval method]
Next, a Top-k document search method (search process) in the search apparatus 10 as described above will be described with reference to the drawings. FIG. 2 is a flowchart of search processing in the present embodiment.
As shown in FIG. 2, in the search processing based on the WAND algorithm in the present embodiment, first, the query acquisition unit 131 uses a query Q = {q 1 , q 2 , q 3 ... Q N } and these queries Q. Query score S Q = {S Q1 , S Q2 , S Q3 ... S QN } is acquired (step S1).
In step S1, the query acquisition unit 131 may acquire a query Q and a query score S Qn input from a terminal device such as a user terminal via a network, for example, as described above. According to the request, the query Q and the query score S Qn stored in the storage unit 12 may be acquired.

この後、インデックス取得手段132は、記憶部12に記憶されたインデックスを読み込む(ステップS2)。なお、本実施形態では、記憶部12に記憶されたインデックスを読み込むが、上述したように、ネットワークを介してインデックスを取得してもよい。   Thereafter, the index acquisition unit 132 reads the index stored in the storage unit 12 (step S2). In the present embodiment, the index stored in the storage unit 12 is read. However, as described above, the index may be acquired via a network.

この後、検索処理における各種パラメータを初期化する(ステップS3)。
ここで、以降の説明にあたり、ドキュメントIDに係るパラメータをi、検索より得たいドキュメントの数(k)に係るパラメータをj、閾値をXとする。ステップS3では、i=1、j=0、X=0として各パラメータを初期化する。
Thereafter, various parameters in the search process are initialized (step S3).
Here, in the following description, it is assumed that the parameter relating to the document ID is i, the parameter relating to the number of documents (k) to be obtained from the search is j, and the threshold is X. In step S3, each parameter is initialized with i = 1, j = 0, and X = 0.

この後、検索手段133のスコア算出手段134は、ドキュメントID(図2,3では、DocIDと表記)iのドキュメントに対するトータルスコアS(i,Q)を下記式(1)により算出する(ステップS4)。式(1)において、S(i,q)は、ドキュメントIDがiのドキュメントのクエリqに対するドキュメントスコアであり、SQnは、クエリqのクエリスコアである。 Thereafter, the score calculation means 134 of the search means 133 calculates the total score S T (i, Q) for the document ID (denoted as DocID in FIGS. 2 and 3) i by the following equation (1) (step S4). ). In Expression (1), S D (i, q n ) is a document score for a query q n of a document whose document ID is i, and S Qn is a query score of the query q n .

Figure 2016015179
Figure 2016015179

次に、検索手段133は、パラメータjに「1」を加算し(ステップS5)、当該パラメータjが検索処理により得たいドキュメントの数(k)になったか否かを判定する(ステップS6)。
ステップS6において、「No」と判定された場合、検索手段133は、パラメータiに「1」を加算し(ステップS7)、ステップS4の処理に戻る。
Next, the search unit 133 adds “1” to the parameter j (step S5), and determines whether or not the parameter j has reached the number of documents (k) to be obtained by the search process (step S6).
If it is determined as “No” in step S6, the search unit 133 adds “1” to the parameter i (step S7), and returns to the process of step S4.

また、ステップS6において、「Yes」と判定された場合、閾値設定手段135は、WANDアルゴリズムにおける閾値Xを設定する(ステップS8)。具体的には、閾値設定手段135は、ステップS4〜7の繰り返しにより算出されたk個のドキュメントに対するトータルスコアS(i,Q)のうちの最小値を、閾値Xとして設定する。
ステップS8の後、パラメータiに「1」を加算し(ステップS9)、スキップ判定処理(ステップS10)を実施する。
If it is determined as “Yes” in step S6, the threshold setting unit 135 sets the threshold X in the WAND algorithm (step S8). Specifically, the threshold setting unit 135 sets the minimum value of the total scores S T (i, Q) for k documents calculated by repeating Steps S4 to S7 as the threshold X.
After step S8, “1” is added to the parameter i (step S9), and a skip determination process (step S10) is performed.

[スキップ判定処理]
図3は、スキップ判定処理におけるフローチャートである。
図3に示すように、スキップ判定処理では、スキップ判定手段136は、まずクエリに関するパラメータnを初期化(n=1)する(ステップS101)。
次に、スキップ判定手段136は、クエリqのクエリスコアSQnが負値(0未満)であるか否かを判定する(ステップS102)。
ステップS102において、「Yes」と判定された場合、スキップ判定手段136は、ドキュメントID:iのクエリqに対するドキュメントスコアのMinスコアSDi(Min)、及びクエリqのクエリスコアSQnを用いて、当該ドキュメントのクエリqに対する一部スコアS(i,q)を下記式(2)により算出する(ステップS103)。
[Skip judgment processing]
FIG. 3 is a flowchart of the skip determination process.
As shown in FIG. 3, in the skip determination process, the skip determination unit 136 first initializes a parameter n related to a query (n = 1) (step S101).
Next, the skip determination means 136 determines whether or not the query score S Qn of the query q n is a negative value (less than 0) (step S102).
If it is determined as “Yes” in step S102, the skip determination unit 136 uses the document score Min score S Di (Min) for the query q n of the document ID: i and the query score S Qn of the query q n. Then, a partial score S n (i, q n ) for the query q n of the document is calculated by the following equation (2) (step S103).

Figure 2016015179
Figure 2016015179

一方、ステップS102において、「No」と判定された場合は、クエリqのクエリスコアSQnが正値(0より大きい)であるか否かを判定する(ステップS104)。
ステップS104において、「Yes」と判定された場合、スキップ判定手段136は、ドキュメントID:iのクエリqに対するドキュメントスコアのMaxスコアSDi(Max)、及びクエリqのクエリスコアSQnを用いて、当該ドキュメントのクエリqに対する一部スコアS(i,q)を下記式(3)により算出する(ステップS105)。
On the other hand, in step S102, if it is determined as "No", the query score S Qn query q n determines whether it is positive value (greater than 0) (step S104).
If it is determined as “Yes” in step S104, the skip determination unit 136 uses the document score Max score S Di (Max) for the query q n of the document ID: i and the query score S Qn of the query q n. Then, a partial score S n (i, q n ) for the query q n of the document is calculated by the following equation (3) (step S105).

Figure 2016015179
Figure 2016015179

一方、ステップS104において、「No」と判定された場合、スキップ判定手段136は、ドキュメントID:iのクエリqに対するドキュメントスコアがない(0である)と判定する。この場合、スキップ判定手段136は、ドキュメントID:iのクエリqに対する一部スコアS(i,q)を0とする(ステップS106)。 On the other hand, if “No” is determined in step S104, the skip determining unit 136 determines that there is no document score (0) for the query q n of the document ID: i. In this case, the skip determination unit 136 sets the partial score S n (i, q n ) for the query q n of the document ID: i to 0 (step S106).

この後、スキップ判定手段136は、パラメータnが、クエリの最大数N以上であるか否かを判定する(ステップS107)。
ステップS107において、「No」と判定されると、スキップ判定手段136は、パラメータnに「1」を加算し(ステップS108)、ステップS102に戻る。すなわち、ステップS1において取得された各クエリQに対するドキュメントID:iの一部スコアS(i,q)を取得する。
ステップS107において「Yes」と判定されると、スキップ判定手段136は、下記式(4)のように、各クエリqに対して算出された一部スコアS(i,q)を加算して、ドキュメントID:iに対する仮スコアS(i,Q)を算出する(ステップS109)。
Thereafter, the skip determination unit 136 determines whether or not the parameter n is equal to or greater than the maximum number N of queries (step S107).
If it is determined as “No” in step S107, the skip determination means 136 adds “1” to the parameter n (step S108), and returns to step S102. That is, a partial score S n (i, q n ) of the document ID: i for each query Q acquired in step S1 is acquired.
If it is determined as “Yes” in step S107, the skip determination unit 136 adds the partial scores S n (i, q n ) calculated for each query q n as shown in the following equation (4). Then, a provisional score SF (i, Q) for the document ID: i is calculated (step S109).

Figure 2016015179
Figure 2016015179

そして、スキップ判定手段136は、算出された仮スコアS(i,Q)が閾値Xより大きいか否かを判定する(ステップS110)。ステップS110において、「No」と判定された場合、スキップ判定手段136は、ドキュメントID:iをスキップ対象とする(ステップS111)。また、ステップS110において、「Yes」と判定された場合、スキップ判定手段136は、ドキュメントID:iをスキップ対象としない(評価対象とする)(ステップS112)。 Then, the skip determination unit 136 determines whether or not the calculated provisional score S F (i, Q) is larger than the threshold value X (step S110). When it is determined “No” in step S110, the skip determination unit 136 sets document ID: i as a skip target (step S111). If it is determined as “Yes” in step S110, the skip determination unit 136 does not set the document ID: i as a skip target (is set as an evaluation target) (step S112).

上記スキップ判定処理について、下記表4に示す具体例に用いて説明する。   The skip determination process will be described using specific examples shown in Table 4 below.

Figure 2016015179
Figure 2016015179

本例では、k=1とする。また、クエリAに対するクエリスコアが「1」、クエリBに対するクエリスコアが「−1」であるとする。
上記のような例では、ドキュメント1に対してトータルスコアS(1,Q)が、1・3+(−1)・(−1)=4として算出され、閾値が「4」と設定される。
スキップ判定手段136は、ドキュメント2に対して、クエリAのクエリスコアが正値であるので、Maxスコア「3」を用いて、クエリAに対する一部スコアを1・3=3と算出し、クエリBのクエリスコアが負値であるので、Minスコア「−6」を用いて、(−1)・(−6)=6と算出する。したがって、ドキュメント2に対する仮スコアは、S(2,Q)=9と算出される。これにより、ドキュメント2は、仮スコアが閾値「4」を超えるものであり、評価対象(スキップしない)と判定される。
In this example, k = 1. Further, it is assumed that the query score for the query A is “1” and the query score for the query B is “−1”.
In the above example, the total score S T (1, Q) for the document 1 is calculated as 1 · 3 + (− 1) · (−1) = 4, and the threshold is set to “4”.
Since the query score of query A is a positive value for document 2, skip determination means 136 calculates a partial score for query A as 1 · 3 = 3 using Max score “3”. Since the query score of B is a negative value, (−1) · (−6) = 6 is calculated using the Min score “−6”. Therefore, the provisional score for the document 2 is calculated as S F (2, Q) = 9. Thereby, the document 2 has a provisional score exceeding the threshold “4”, and is determined as an evaluation target (not skipped).

図2に戻り、ステップS10のスキップ判定処理の後、検索手段133は、スキップ判定手段136によりドキュメントID:iがスキップ対象とされたか否かを判断する(ステップS11)。
ステップS11において、「No」と判定された場合(評価すると判定された場合)、スコア算出手段134は、ステップS4と同様の処理により、ドキュメントID:iのドキュメントに対するトータルスコアS(i,Q)を算出する(ステップS12)。
そして、閾値設定手段135は、ステップS12において算出されたトータルスコアS(i,Q)が、閾値Xより大きいか否かを判定し(ステップS13)、大きいと判定した場合は、閾値Xを再設定する(ステップS14)。つまり、閾値設定手段135は、算出されたトータルスコアS(i,Q)のうち、上位k個を抽出し、その最低値を閾値Xとする。
Returning to FIG. 2, after the skip determination process in step S10, the search unit 133 determines whether or not the document ID: i is a skip target by the skip determination unit 136 (step S11).
When it is determined as “No” in Step S11 (when it is determined to be evaluated), the score calculation unit 134 performs the same processing as in Step S4, and the total score S T (i, Q) for the document with the document ID: i. Is calculated (step S12).
Then, the threshold setting unit 135 determines whether or not the total score S T (i, Q) calculated in step S12 is larger than the threshold X (step S13). Set (step S14). That is, the threshold setting means 135 extracts the upper k pieces from the calculated total score S T (i, Q), and sets the lowest value as the threshold X.

一方、ステップS11において「Yes」と判定された場合(スキップ対象と判定された場合)は、上記ステップS11〜ステップS14の処理はスキップされる。
つまり、ステップS11において「Yes」と判定された場合、ステップS13において「No」と判定された場合(トータルスコアS(i,Q)が閾値Xを超えない場合)、及びステップS14の後、検索手段133は、パラメータiに「1」を加算し(ステップS15)、パラメータiが最大値Iを超えたか否かを判定する(ステップS16)。つまり、全てのドキュメントに対して、ステップS1〜ステップS14の処理が実施されたか否かを判定する。ステップS16において、「No」と判定された場合、ステップS10の処理に戻る。
On the other hand, when it is determined as “Yes” in Step S11 (when it is determined as a skip target), the processes of Steps S11 to S14 are skipped.
That is, if “Yes” is determined in step S11, “No” is determined in step S13 (when the total score S T (i, Q) does not exceed the threshold value X), and the search is performed after step S14. The means 133 adds “1” to the parameter i (step S15) and determines whether the parameter i exceeds the maximum value I (step S16). That is, it is determined whether or not the processing in steps S1 to S14 has been performed on all documents. If it is determined “No” in step S16, the process returns to step S10.

また、ステップS16において、「Yes」と判定された場合、抽出手段137は、算出されたトータルスコアS(i,Q)のうち、上位k個を抽出し、抽出したトータルスコアS(i,Q)に対応したドキュメントIDのドキュメントを検索結果とする(ステップS17)。 If it is determined as “Yes” in step S16, the extraction unit 137 extracts the top k out of the calculated total scores S T (i, Q), and extracts the extracted total scores S T (i, Q). ) As a search result (step S17).

[本実施形態の作用効果]
本実施形態では、インデックスとして、各クエリに対するドキュメントスコアのMaxスコア及びMinスコアが記録されている。
そして、検索手段133は、ステップS102からステップS103に示すように、クエリスコアが負値である場合に、Minスコアを用い、クエリスコアが正値である場合に、Maxスコアを用いて、WANDアルゴリズムに基づいた検索処理を実施する。
一般に、Maxスコアのみを用いてWANDアルゴリズムを用いた場合では、トータルスコアの算出をスキップされるべきではないドキュメントに対しても、スキップされるおそれがある。これに対して、本実施形態では、上記のようなインデックスを用いてWANDアルゴリズムに基づく検索処理を実施することで、トータルスコアの算出をスキップしてよいか否かを精度よく判定することができる。したがって、クエリに対して正確なランク付けでドキュメントの検索結果を返すことができる。
[Operational effects of this embodiment]
In the present embodiment, the Max score and Min score of the document score for each query are recorded as indexes.
Then, as shown in steps S102 to S103, the search unit 133 uses the Min score when the query score is negative, and uses the Max score when the query score is positive. The search process based on
In general, when the WAND algorithm is used by using only the Max score, there is a possibility that the calculation of the total score should be skipped even for a document that should not be skipped. On the other hand, in this embodiment, it is possible to accurately determine whether or not the calculation of the total score may be skipped by performing a search process based on the WAND algorithm using the above-described index. Therefore, the search result of the document can be returned with an accurate ranking with respect to the query.

[第二実施形態]
次に、本発明における第二実施形態について、図面に基づいて説明する。
本実施形態では、上記第一実施形態に示す検索装置を用いた検索処理の一例として、広告検索処理について説明する。
図4は、広告検索を実施する広告検索システムの概略を示す図である。なお、第一実施形態と同様の構成については同符号を付し、その説明を省略又は簡略化する。
図4に示すように、広告検索システム100は、上述した検索装置10と、ユーザにより操作される端末装置(ユーザ端末20)と、広告主により操作される端末装置(広告主端末30)と、を備え、これらの装置10,20,30がネットワークを介して通信可能に接続されている。
[Second Embodiment]
Next, 2nd embodiment in this invention is described based on drawing.
In the present embodiment, an advertisement search process will be described as an example of a search process using the search device shown in the first embodiment.
FIG. 4 is a diagram showing an outline of an advertisement search system that performs advertisement search. In addition, about the structure similar to 1st embodiment, the same code | symbol is attached | subjected and the description is abbreviate | omitted or simplified.
As illustrated in FIG. 4, the advertisement search system 100 includes the search device 10 described above, a terminal device operated by a user (user terminal 20), a terminal device operated by an advertiser (advertiser terminal 30), These devices 10, 20, and 30 are communicably connected via a network.

[ユーザ端末]
ユーザ端末20は、コンピュータであり、図示は省略するが、キーボード等により構成される入力装置、メモリ等により構成される記憶装置、CPU等により構成される演算装置、及びディスプレイを備えている。
そして、ユーザ端末20は、ユーザが入力装置を操作することで、ユーザデータを取得し、取得したユーザデータをクエリとして検索装置10に送信する。
ここで、ユーザデータとしては、例えば、性別、年齢、居住地域等のユーザ個人のデータであってもよく、ユーザの興味データ等の所望の広告配信を受けるための条件や、広告配信を受けたくない条件等であってもよい。
[User terminal]
Although not shown, the user terminal 20 is a computer, and includes an input device configured with a keyboard and the like, a storage device configured with a memory and the like, an arithmetic device configured with a CPU and the like, and a display.
Then, the user terminal 20 acquires user data when the user operates the input device, and transmits the acquired user data to the search device 10 as a query.
Here, the user data may be, for example, user personal data such as gender, age, residence area, etc., and it is desired to receive conditions for receiving desired advertisement distribution such as user interest data, and advertisement distribution. There may be no conditions.

また、ユーザ端末20は、ユーザが入力装置を操作することで、クエリとして配信されるユーザデータに対する優先度をクエリスコアとして取得し、検索装置10に送信する。
例えば、広告配信を受けたい条件に対して正値の優先度を設定し、広告配信を受けたくないデータに対して負値の優先度を設定することが可能となる。
上記のようなユーザデータ(クエリ)及びクエリスコアの一例を表5に示す。
In addition, the user terminal 20 obtains a priority for user data distributed as a query as a query score when the user operates the input device, and transmits the query score to the search device 10.
For example, it is possible to set a positive priority for a condition for receiving advertisement distribution and to set a negative priority for data for which advertisement distribution is not desired.
An example of the user data (query) and query score as described above is shown in Table 5.

Figure 2016015179
Figure 2016015179

[広告主端末]
広告主端末30は、コンピュータであり、図示は省略するが、キーボード等により構成される入力装置、メモリ等により構成される記憶装置、CPU等により構成される演算装置、及びディスプレイを備えている。
そして、広告主端末30の記憶装置には、ユーザ端末20に配信する本発明におけるドキュメントである広告(広告データ)が記憶されている。また、広告主端末30は、例えば、広告主が入力装置を操作することで、広告配信データを取得する。この広告配信データは、ユーザデータ(クエリ)に対応した配信条件と、当該配信条件に対する広告の関連度を示すスコア(すなわち、ドキュメントスコア)とを関連付けたデータとなる。そして、広告主端末30は、取得した広告配信データをドキュメントスコアとして検索装置に送信する。
なお、広告主端末30は、記憶装置に記憶された広告を検索装置10に送信してもよい。
表6に広告主端末30から検索装置10に送信される広告配信データの一例を示す。
[Advertiser terminal]
The advertiser terminal 30 is a computer and includes an input device configured with a keyboard and the like, a storage device configured with a memory and the like, an arithmetic device configured with a CPU and the like, and a display (not shown).
The storage device of the advertiser terminal 30 stores an advertisement (advertisement data) that is a document in the present invention to be distributed to the user terminal 20. Moreover, the advertiser terminal 30 acquires advertisement delivery data, for example, when an advertiser operates an input device. This advertisement distribution data is data in which a distribution condition corresponding to user data (query) and a score (that is, document score) indicating the degree of association of the advertisement with the distribution condition are associated with each other. Then, the advertiser terminal 30 transmits the acquired advertisement distribution data as a document score to the search device.
Note that the advertiser terminal 30 may transmit the advertisement stored in the storage device to the search device 10.
Table 6 shows an example of advertisement distribution data transmitted from the advertiser terminal 30 to the search device 10.

Figure 2016015179
Figure 2016015179

[検索装置]
検索装置10は、上述した第一実施形態と略同様の構成を有する。検索装置10の制御部13は、記憶部12に記憶されたプログラムを読み込み実行することで、クエリ取得手段131、インデックス取得手段132、及び検索手段133として機能する。
クエリ取得手段131は、ユーザ端末20から上述した表5に示すようなユーザデータ、クエリスコアを取得し、記憶部12に記憶する。
インデックス取得手段132は、広告主端末30から上述した表6に示すような広告配信データを取得する。そして、インデックス取得手段132は、複数の広告主端末30から送信された広告配信データを統合し、広告IDをドキュメントIDとして新規に振り直して、インデックスとして記憶部12に記憶する。この際、インデックス取得手段132は、各クエリ(ユーザデータ)に対するドキュメントスコアの最大値をMaxスコア、最小値をMinスコアとしてインデックスに記憶する。また、新規に広告配信データを取得すると、当該取得した広告配信データをインデックスに追加し、かつ、Maxスコア及びMinスコアを再算出する。
[Search device]
The search device 10 has substantially the same configuration as that of the first embodiment described above. The control unit 13 of the search device 10 functions as a query acquisition unit 131, an index acquisition unit 132, and a search unit 133 by reading and executing a program stored in the storage unit 12.
The query acquisition unit 131 acquires user data and query scores as shown in Table 5 described above from the user terminal 20 and stores them in the storage unit 12.
The index acquisition unit 132 acquires advertisement distribution data as shown in Table 6 described above from the advertiser terminal 30. Then, the index acquisition unit 132 integrates the advertisement distribution data transmitted from the plurality of advertiser terminals 30, newly reassigns the advertisement ID as the document ID, and stores the advertisement ID in the storage unit 12 as an index. At this time, the index acquisition means 132 stores the maximum document score for each query (user data) in the index as the Max score and the minimum value as the Min score. When new advertisement distribution data is acquired, the acquired advertisement distribution data is added to the index, and the Max score and Min score are recalculated.

これにより、検索装置10は、ユーザデータをクエリ、ユーザデータに関連付けらえたクエリスコア、インデックスを用い、上述した第一実施形態と同様のWANDアルゴリズムに基づいた検索処理を実施することができ、各ユーザデータ(クエリ)に対して最適なドキュメントIDを抽出することができる。
検索装置10は、抽出されたドキュメントIDに対応した広告データの配信元(広告主端末30)のURLをユーザ端末20に送信する。また、記憶部12に広告データが記憶されている場合、検索装置10は、抽出されたドキュメントIDに対応した広告データを記憶部12から読み出し、ユーザ端末20に送信する。これにより、各ユーザ端末20に、ユーザに対して最適な広告データが配信することができる。
Thereby, the search device 10 can execute the search processing based on the WAND algorithm similar to the first embodiment described above using the query, the index associated with the user data, the user data, and the index. An optimal document ID can be extracted for user data (query).
The search device 10 transmits the URL of the distribution source (advertiser terminal 30) of the advertisement data corresponding to the extracted document ID to the user terminal 20. When advertisement data is stored in the storage unit 12, the search device 10 reads out advertisement data corresponding to the extracted document ID from the storage unit 12 and transmits it to the user terminal 20. Thereby, optimal advertisement data can be distributed to each user terminal 20 for the user.

[変形例]
第二実施形態において、検索装置10は、広告主端末30から広告配信データを、ネットワークを介して取得し、取得した広告配信データに基づいてインデックスを作成する例を示したが、例えば検索装置10を操作することで、インデックスを作成する等してもよい。
[Modification]
In 2nd embodiment, although the search apparatus 10 acquired the advertisement delivery data from the advertiser terminal 30 via a network, the example which produces an index based on the acquired advertisement delivery data was shown, for example, the search apparatus 10 An index may be created by operating.

第一実施形態の検索装置10の適用例として、広告配信システムを例示したが、これに限定されない。本発明は、クエリを用いた検索処理を実施する装置やシステムに適用でき、例えば、検索キーワード等のクエリに基づいたコンテンツやファイルの検索、店舗等の施設検索等、様々な検索用途に適用することができる。   As an application example of the search device 10 of the first embodiment, an advertisement distribution system has been illustrated, but is not limited thereto. The present invention can be applied to an apparatus or a system that performs a search process using a query. For example, the present invention is applied to various search uses such as a search for contents and files based on a query such as a search keyword and a facility search for a store. be able to.

その他、本発明の実施の際の具体的な構造および手順は、本発明の目的を達成できる範囲で他の構造などに適宜変更できる。   In addition, the specific structure and procedure for carrying out the present invention can be appropriately changed to other structures and the like within a range in which the object of the present invention can be achieved.

10…検索装置、12…記憶部(インデックス記憶手段)、13…制御部、20…ユーザ端末、30…広告主端末、100…広告検索システム、131…クエリ取得手段、132…インデックス取得手段、133…検索手段、134…スコア算出手段、135…閾値設定手段、136…スキップ判定手段、137…抽出手段。   DESCRIPTION OF SYMBOLS 10 ... Search apparatus, 12 ... Memory | storage part (index storage means), 13 ... Control part, 20 ... User terminal, 30 ... Advertiser terminal, 100 ... Advertisement search system, 131 ... Query acquisition means, 132 ... Index acquisition means, 133 ... Search means, 134 ... Score calculation means, 135 ... Threshold setting means, 136 ... Skip determination means, 137 ... Extraction means.

Claims (5)

クエリに基づいて、複数のドキュメントから所望のドキュメントを検索する検索装置であって、
前記クエリ、及び前記クエリの重み付けであるクエリスコアを取得するクエリ取得手段と、
前記ドキュメントの前記クエリに対する関連度を示すドキュメントスコアが、前記クエリ毎及び前記ドキュメント毎に記録され、かつ、クエリ毎に前記ドキュメントスコアの最小値が記録されたインデックスを記憶するインデックス記憶手段と、
前記クエリスコア及び前記ドキュメントスコアにより算出されるトータルスコアに基づいて、前記クエリに対する所定数のドキュメントを検索する検索手段と、を備え、
前記検索手段は、前記クエリスコアが負値である場合に、当該クエリスコア及び前記最小値を用いて、前記トータルスコアを算出する対象のドキュメントを判断する
を備えたことを特徴とする検索装置。
A search device for searching a desired document from a plurality of documents based on a query,
Query acquisition means for acquiring a query score that is a weight of the query and the query;
An index storage unit that stores an index in which a document score indicating a degree of relevance of the document to the query is recorded for each query and each document, and in which a minimum value of the document score is recorded for each query;
Search means for searching a predetermined number of documents for the query based on a total score calculated from the query score and the document score;
The search device, comprising: when the query score is a negative value, using the query score and the minimum value to determine a target document for calculating the total score.
請求項1に記載の検索装置において、
前記インデックスには、クエリ毎の前記ドキュメントスコアの最大値が記録され、
前記検索手段は、前記クエリスコアが正値である場合に、当該クエリスコア及び前記最大値を用いて、前記トータルスコアを算出する対象のドキュメントを判断する
ことを特徴とする検索装置。
The search device according to claim 1,
The maximum value of the document score for each query is recorded in the index,
The search device, when the query score is a positive value, uses the query score and the maximum value to determine a target document for calculating the total score.
請求項2に記載の検索装置において、
前記検索手段は、各ドキュメントに対して、前記ドキュメントスコアがない場合は「0」を、前記クエリスコアが正値の場合に当該クエリスコア及び前記最大値の積を、前記クエリスコアが負値の場合では当該クエリスコア及び前記最小値の積を、前記クエリに対する一部スコアとして算出し、全クエリに対して算出された前記一部スコアの和が、所定の閾値以下である場合に、当該ドキュメントの前記トータルスコアの算出をスキップする
ことを特徴とする検索装置。
The search device according to claim 2, wherein
For each document, the search means sets “0” when there is no document score, a product of the query score and the maximum value when the query score is positive, and a negative value for the query score. In some cases, the product of the query score and the minimum value is calculated as a partial score for the query, and when the sum of the partial scores calculated for all queries is equal to or less than a predetermined threshold, the document The search device characterized by skipping the calculation of the total score.
請求項1から請求項3のいずれかに記載の検索装置において、
前記クエリは、ユーザに関するユーザデータであり、
前記ドキュメントは、広告データであり、
前記インデックス記憶手段は、前記ユーザデータの前記広告データに対する関連度を前記ドキュメントスコアとした広告配信データを前記インデックスとして記憶する
ことを特徴とする検索装置。
The search device according to any one of claims 1 to 3,
The query is user data about the user;
The document is advertising data;
The index storage means stores, as the index, advertisement distribution data in which the relevance of the user data to the advertisement data is the document score.
コンピュータにより、クエリに基づいて複数のドキュメントから所望のドキュメントを検索する検索方法であって、
前記コンピュータは、前記ドキュメントの前記クエリに対する関連度を示すドキュメントスコアが、前記クエリ毎及び前記ドキュメント毎に記録され、かつ、クエリ毎に前記ドキュメントスコアの最小値が記録されたインデックスを記憶するインデックス記憶手段を有し、
前記検索方法において、前記コンピュータは、
前記クエリ、及び前記クエリの重み付けであるクエリスコアを取得し、
前記クエリスコア及び前記ドキュメントスコアにより算出されるトータルスコアに基づいて、前記クエリに対する所定数のドキュメントを検索し、
前記トータルスコアの算出に際し、前記クエリスコアが負値である場合に、当該クエリスコア及び前記最小値を用いて、前記トータルスコアを算出する対象のドキュメントを判断する
ことを特徴とする検索方法。
A search method for searching a desired document from a plurality of documents based on a query by a computer,
The computer stores an index in which a document score indicating a degree of relevance of the document to the query is recorded for each query and each document, and an index in which a minimum value of the document score is recorded for each query is stored. Having means,
In the search method, the computer includes:
Obtaining a query score that is a weight of the query and the query;
Based on the total score calculated by the query score and the document score, a predetermined number of documents for the query are searched,
In the calculation of the total score, when the query score is a negative value, a document for which the total score is calculated is determined using the query score and the minimum value.
JP2015212240A 2015-10-28 2015-10-28 Search device and search method Active JP6174099B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015212240A JP6174099B2 (en) 2015-10-28 2015-10-28 Search device and search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015212240A JP6174099B2 (en) 2015-10-28 2015-10-28 Search device and search method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014007626A Division JP5833150B2 (en) 2014-01-20 2014-01-20 Search device and search method

Publications (3)

Publication Number Publication Date
JP2016015179A true JP2016015179A (en) 2016-01-28
JP2016015179A5 JP2016015179A5 (en) 2016-03-10
JP6174099B2 JP6174099B2 (en) 2017-08-02

Family

ID=55231252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015212240A Active JP6174099B2 (en) 2015-10-28 2015-10-28 Search device and search method

Country Status (1)

Country Link
JP (1) JP6174099B2 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1069490A (en) * 1996-08-28 1998-03-10 Toshiba Corp Device and method for document narrowing-down retrieval, and document retrieval device
JP2008538149A (en) * 2005-03-18 2008-10-09 ウィンク テクノロジ−ズ インコ−ポレイテッド Rating method, search result organizing method, rating system, and search result organizing system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1069490A (en) * 1996-08-28 1998-03-10 Toshiba Corp Device and method for document narrowing-down retrieval, and document retrieval device
JP2008538149A (en) * 2005-03-18 2008-10-09 ウィンク テクノロジ−ズ インコ−ポレイテッド Rating method, search result organizing method, rating system, and search result organizing system

Also Published As

Publication number Publication date
JP6174099B2 (en) 2017-08-02

Similar Documents

Publication Publication Date Title
JP4972358B2 (en) Document search apparatus, document search method, document search program, and recording medium.
CN106095738B (en) Recommending form fragments
US8805755B2 (en) Decomposable ranking for efficient precomputing
EP3345104A1 (en) Pmedia unit retrieval and related processes
JP5673336B2 (en) Information processing method, display method, information processing apparatus, display apparatus, information processing program, display program
US20160283564A1 (en) Predictive visual search enginge
WO2017173801A1 (en) Personalized multimedia recommendation method and apparatus
JP2002215659A (en) Information retrieval support method and information retrieval support system
KR20120092756A (en) Method and system for searching mobile application using human activity knowledge database
JP2016042213A (en) Extraction device, retrieval server, information processing device, extraction system, extraction method, and extraction program
JP5579140B2 (en) Document search apparatus, method, and program
KR20140060806A (en) Similar contents searching apparatus based on user preference and similar contents searching method thereof
US20030195882A1 (en) Homepage searching method using similarity recalculation based on URL substring relationship
JP6174099B2 (en) Search device and search method
JP2016076115A (en) Information processing device, information processing method and program
JP5833150B2 (en) Search device and search method
CN114528478A (en) User query recommendation method and device, electronic equipment and storage medium
JP2010055164A (en) Sentence retrieval device, sentence retrieval method, sentence retrieval program and its storage medium
JP2011022624A (en) System, method, server and program for retrieving web page
WO2014027415A1 (en) Information provision device, information provision method, and program
TWI639093B (en) Object set and processing method and device thereof
JP5741242B2 (en) Profile updating apparatus, control method therefor, and profile updating program
JP5813559B2 (en) Search condition presentation device, method, and program
JP2000293531A (en) Method and device for retrieving information
KR101453623B1 (en) Method and system for inferencing item preference using search keyword of user in recommendation system

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160915

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170705

R150 Certificate of patent or registration of utility model

Ref document number: 6174099

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350