JP2020030634A - Search device, search method, and search program - Google Patents
Search device, search method, and search program Download PDFInfo
- Publication number
- JP2020030634A JP2020030634A JP2018156035A JP2018156035A JP2020030634A JP 2020030634 A JP2020030634 A JP 2020030634A JP 2018156035 A JP2018156035 A JP 2018156035A JP 2018156035 A JP2018156035 A JP 2018156035A JP 2020030634 A JP2020030634 A JP 2020030634A
- Authority
- JP
- Japan
- Prior art keywords
- result data
- search result
- search
- data
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、検索装置、検索方法及び検索プログラムに関する。 The present invention relates to a search device, a search method, and a search program.
検索装置は、複数の検索対象データから検索条件に合致する検索結果データを抽出し、抽出した検索結果データをディスプレイに表示させる。また、検索装置は、検索条件に適合する複数の検索結果データが存在する場合は、複数の検索結果データをディスプレイに表示させる。 The search device extracts search result data that matches a search condition from a plurality of search target data, and displays the extracted search result data on a display. In addition, when there is a plurality of search result data that match the search condition, the search device causes the display to display the plurality of search result data.
複数の検索結果データをディスプレイに表示させる場合は、ユーザが得たい検索結果データを上位に表示させることが期待される。 When a plurality of search result data is displayed on the display, it is expected that the search result data desired by the user is displayed at a higher position.
特許文献1に記載された検索エンジンソーティング方法においては、ユーザが、検索結果の表示リストにおいて同意、好き、同意せず、反対等の意見を示すことですべての情報及び検索結果に対して評点を行う(要約)。また、評点値の高低に応じて自動的にソーティングが行われ、評点の高いものが上位に表示される(要約)。
In the search engine sorting method described in
特許文献2に記載された文書検索システムにおいては、ユーザの検索履歴データに基づき、当該ユーザが業務上閲覧する可能性がある文書ファイルと、その可能性の無い文書ファイルとを区別する処理が行われる(要約)。また、その後のユーザ検索処理において、可能性の無い文書ファイルを合致度の算出対象から外す選択処理が行われる。その際には、潜在的に上位にランキングされる可能性を評価した上で選択が行われる(要約)。
In the document search system described in
従来の検索装置は、ユーザが得たい検索結果データが上位に表示されない場合があるという問題を有する。 The conventional search device has a problem that search result data desired by a user may not be displayed at a higher position.
例えば、特許文献1に記載された検索エンジンソーティング方法においては、ユーザが評価点を高める意見を示していない検索結果が上位に表示されない。このため、特許文献1に記載された検索エンジンソーティング方法においては、ユーザが得たい検索結果が上位に表示されない場合がある。
For example, in the search engine sorting method described in
また、特許文献2に記載された文書検索システムにおいては、ユーザの検索履歴データに基づいて特定された、ユーザが業務上閲覧する可能性の無い文書ファイルが上位に表示されない。このため、特許文献2に記載された文書検索システムにおいては、ユーザの検索履歴データによっては、ユーザが得たい検索結果が上位に表示されない場合がある。
Further, in the document search system described in
本発明は、これらの問題に鑑みてなされた。本発明が解決しようとする課題は、ユーザが得たい検索結果データが上位に表示される可能性を高くする検索装置、検索方法及び検索プログラムを提供することである。 The present invention has been made in view of these problems. An object of the present invention is to provide a search device, a search method, and a search program that increase the possibility that search result data desired by a user is displayed at a higher position.
本発明は、検索装置に向けられる。 The present invention is directed to a search device.
複数の検索対象データから検索条件に合致する複数の検索結果データが抽出される。複数の検索結果データは、出力機器により出力される。 A plurality of search result data matching the search condition is extracted from the plurality of search target data. The plurality of search result data is output by the output device.
複数の検索結果データから選択された検索結果データへの肯定的評価の付与が受け付けられる。 Assignment of a positive evaluation to the search result data selected from the plurality of search result data is accepted.
複数の検索対象データに含まれる各検索対象データに類似する検索対象データを特定する類似情報が生成される。 Similarity information that specifies search target data similar to each search target data included in the plurality of search target data is generated.
複数の検索結果データを出力機器に出力させる際の複数の検索結果データの出力順位が決定される。付与された肯定的評価の数が第1の基準数以上である第1の検索結果データ、及び類似情報に基づいて特定される、第1の検索結果データに類似する第2の検索結果データの出力順位が、付与された肯定的評価の数が第1の基準数より少なく第1の検索結果データに類似しない第3の検索結果データの出力順位より上位にされる。 The output order of the plurality of search result data when outputting the plurality of search result data to the output device is determined. The first search result data in which the number of assigned positive evaluations is equal to or greater than the first reference number, and the second search result data similar to the first search result data specified based on the similarity information The output order is set higher than the output order of the third search result data in which the number of assigned positive evaluations is smaller than the first reference number and is not similar to the first search result data.
本発明は、検索方法及び検索プログラムにも向けられる。 The present invention is also directed to a search method and a search program.
本発明によれば、多数の肯定的評価が付与されている第1の検索結果データ、及び当該第1の検索結果データに類似する第2の検索結果データが上位に表示される。このため、ユーザが得たい検索結果データが上位に表示される可能性が高くなる。 According to the present invention, the first search result data to which a large number of positive evaluations are given and the second search result data similar to the first search result data are displayed at the top. Therefore, there is a high possibility that the search result data desired by the user is displayed at the top.
この発明の目的、特徴、局面、及び利点は、以下の詳細な説明と添付図面とによって、より明白となる。 The objects, features, aspects and advantages of the present invention will become more apparent from the following detailed description and the accompanying drawings.
1 検索装置のハードウェア
図1は、第1実施形態の検索装置のハードウェアを図示するブロック図である。
1. Hardware of Search Device FIG. 1 is a block diagram illustrating hardware of the search device according to the first embodiment.
図1に図示される検索装置1000は、検索プログラム1020がインストールされたパーソナルコンピューター(PC)である。検索装置1000は、中央処理装置(CPU)1040、メモリー1042、ハードディスクドライブ1044、入力機器1046及び出力機器1048を備える。検索装置1000がこれらの要素以外の要素を備えてもよい。
The
ハードディスクドライブ1044には、検索プログラム1020がインストールされる。ハードディスクドライブ1044への検索プログラム1020のインストールは、コンパクトディスク(CD)、デジタル多目的ディスク(DVD)、ユニバーサルシリアルバス(USB)メモリー等の外部記憶媒体1060から読み出したデータをハードディスクドライブ1044に書き込むことにより行われてもよいし、ネットワーク1080を経由して受信したデータをハードディスクドライブ1044に書き込むことにより行われてもよい。ハードディスクドライブ1044が他の種類の補助記憶装置に置き換えられてもよい。例えば、ハードディスクドライブ1044がソリッドステートドライブ、ランダムアクセスメモリー(RAM)ディスクに置き換えられてもよい。ハードディスクドライブ1044、外部記憶媒体1060、ソリッドステートドライブ、RAMディスク等は、検索プログラム1020を記録したコンピュータ読み取り可能な記録媒体である。
A
CPU1040は、検索プログラム1020をメモリー1042にロードし、ロードした検索プログラム1020を実行する。これにより、PCは、検索装置1000として機能する。
The
入力機器1046は、キーボード、マウス、タッチパッド、トラックボール、タッチパネル、スイッチ、ダイヤル、マイクロフォン等である。
The
出力機器1048は、ディスプレイ、プリンタ、スピーカ等である。以下では、出力機器1048がディスプレイであり、データの出力がディスプレイへのデータの表示により行われるとして説明が進められる。
The
2 検索装置
図2は、第1実施形態の検索装置を図示するブロック図である。
2 Search Device FIG. 2 is a block diagram illustrating a search device according to the first embodiment.
検索装置1000は、図2に図示されるように、入力機器1046、出力機器1048、取得部1200、記憶部1202、検索部1204、出力制御部1206、受け付け部1208、生成部1210及び決定部1212を備える。検索装置1000がこれらの要素以外の要素を備えてもよい。
As illustrated in FIG. 2, the
取得部1200、検索部1204、出力制御部1206、受け付け部1208、生成部1210及び決定部1212は、CPU1040に検索プログラム1020を実行させることにより構成される。記憶部1202は、メモリー1042及びハードディスクドライブ1044の少なくとも一方により構成される。
The
CPU1040により行われる処理の全部又は一部が他の種類の処理装置により行われてもよい。例えば、CPU1040により行われる処理の全部又は一部がグラフィックス処理装置(GPU)により行われてもよい。CPU1040により行われる処理の全部又は一部がプログラムを実行しないハードウェアにより行われてもよい。
All or part of the processing performed by the
取得部1200は、複数の検索対象データ1220を取得し、取得した複数の検索対象データ1220を記憶部1202に記憶させる。
The
検索部1204は、記憶部1202に記憶されている複数の検索対象データ1220から検索条件に合致する検索結果データを抽出する。以下では、検索条件に合致する複数の検索結果データ1240が存在し、検索部1204が複数の検索対象データ1220から複数の検索結果データ1240を抽出するとして、説明が進められる。検索部1204が、検索装置1000にネットワーク1080を介して接続されたコンピュータに備えられる記憶部に記憶された複数の検索対象データから複数の検索結果データ1240を抽出してもよい。
The
出力制御部1206は、抽出された複数の検索結果データ1240を出力機器1048に出力させる。出力制御部1206が、複数の検索結果データ1240を、検索装置1000にネットワーク1080を介して接続されたコンピュータに備えられる出力機器に出力させてもよい。
The
以下では、出力機器1048がディスプレイであり、出力制御部1206が表示制御部であり、複数の検索結果データ1240を出力機器1048に出力させることが複数の検索結果データ1240をディスプレイに表示させることであり、複数の検索結果データ1240の出力順位が複数の検索結果データ1240の表示順位であるとして、説明が進められる。
In the following, the
受け付け部1208は、表示された複数の検索結果データ1240から選択された検索結果データへの「いいね」の付与を要求する操作が入力機器1046に対して行われたことを検出した場合に、当該検索結果データへの「いいね」の付与を受け付ける。また、受け付け部1208は、表示された複数の検索結果データ1240から選択された検索結果データへの「わるいね」の付与を要求する操作が入力機器1046に対して行われたことを検出した場合に、当該検索結果データへの「わるいね」の付与を受け付ける。また、受け付け部1208は、表示された複数の検索結果データ1240から選択された検索結果データへの「いいね」の付与の取り消しを要求する操作が入力機器1046に対して行われたことを検出した場合に、当該検索結果データへの「いいね」の付与の取り消しを受け付ける。受け付け部1208が、「いいね」の付与を要求する操作が検索装置1000にネットワーク1080を介して接続されたコンピュータに備えられる入力機器に対して行われたことを検出した場合に、「いいね」の付与を受け付けてもよい。「わるいね」の付与、及び「いいね」の付与の取り消しについても同様である。また、受け付け部1208は、「いいね」の付与、「いいね」の付与の取り消し、及び「わるいね」の付与の内容を示すフィードバック1260を生成する。
If the
「いいね」の付与を要求する操作は、例えば「いいね」ボタンを押す操作である。「わるいね」の付与を要求する操作は、例えば「わるいね」ボタンを押す操作である。「いいね」の付与の取り消しを要求する操作は、例えば「いいね取り消し」ボタンを押下する操作である。「いいね」が他の種類の肯定的評価に置き換えられてもよい。例えば、「いいね」が「投票」、「あげ」等に置き換えられてもよい。「わるいね」が他の種類の否定的評価に置き換えられてもよい。例えば、「わるいね」が「反対投票」、「さげ」等に置き換えられてもよい。 The operation for requesting the addition of “like” is, for example, an operation of pressing a “like” button. The operation for requesting the “bad” is, for example, an operation of pressing a “bad” button. An operation for requesting cancellation of “like” is, for example, an operation of pressing a “like cancellation” button. Likes may be replaced by other types of positive ratings. For example, "like" may be replaced with "vote", "age", and the like. "Issue" may be replaced by another type of negative evaluation. For example, “bad” may be replaced with “opposite voting”, “sage”, and the like.
生成部1210は、記憶部1202に記憶されている複数の検索対象データ1220に含まれる各検索対象データに類似する検索対象データを特定する類似情報1280を生成する。各検索対象データに類似する検索対象データは、記憶部1202に記憶されている複数の検索対象データ1220に含まれる、各検索対象データ以外の検索対象データである。
The
決定部1212は、複数の検索結果データ1240の表示順位スコアを計算し、計算した複数の検索結果データ1240の表示順位スコアに基づいて複数の検索結果データ1240をディスプレイ1048に表示させる際の複数の検索結果データ1240の表示順位1290を決定する。
The
また、決定部1212は、複数の検索結果データ1240の表示順位1290を決定する際に、生成されたフィードバック1260を学習し、学習したフィードバック1260に応じて複数の検索結果データ1240の表示順位1290を変化させる。
Further, when determining the
3 フィードバックの学習による複数の検索結果データの表示順位の変化
図3は、第1実施形態の検索装置におけるフィードバックの学習前後の複数の検索結果データの表示順位の変化の例を図示する図である。
3. Change in Display Order of Plural Search Result Data Due to Feedback Learning FIG. 3 is a diagram illustrating an example of change in display order of a plurality of search result data before and after feedback learning in the search device of the first embodiment. .
以下では、検索結果データに付与された「いいね」及び「わるいね」の数をそれぞれ検索結果データの「いいね」回数及び「わるいね」回数という。 In the following, the numbers of “likes” and “bad” given to the search result data are referred to as “likes” and “bad” times of the search result data, respectively.
図3に図示される検索結果データD1,D2,D3,D4,D5,・・・,Dn−1,Dnは、検索部1204により抽出された複数の検索結果データ1240である。検索結果データD1,D2,D3,D4,D5,・・・,Dn−1,Dnは、「いいね」回数が3回である検索結果データD1、「いいね」回数が1回である検索結果データD2、及び「いいね」回数が0回である検索結果データD3,D4,D5,・・・,Dn−1,Dnを含む。また、検索結果データD1,D2,D3,D4,D5,・・・,Dn−1,Dnは、検索結果データD1に類似する検索結果データD3及びD4を含む。また、検索結果データD1,D2,D3,D4,D5,・・・,Dn−1,Dnは、「わるいね」回数が1回である検索結果データDn、及び「わるいね」回数が0回である検索結果データD1,D2,D3,D4,D5,・・・・,Dn−1を含む。
The search result data D 1 , D 2 , D 3 , D 4 , D 5 ,..., D n−1 , D n illustrated in FIG. 3 are a plurality of
決定部1212は、図3に図示されるように、「いいね」回数が1回以上である第1の検索結果データD1及びD2、並びに第1の検索結果データD1に類似する第2の検索結果データD3及びD4の表示順位を、「いいね」回数が1回より少なく第1の検索結果データD1に類似しない第3の検索結果データD5,・・・,Dn−1,Dnの表示順位より上位にする。これにより、「いいね」回数が多い第1の検索結果データD1及びD2、並びに第1の検索結果データD1に類似する第2の検索結果データD3及びD4が互いに紐づけられた状態で上位に表示される。このため、ユーザが得たい検索結果データが上位に表示される可能性が高くなり、容易かつ効率的に検索を実行することができる。第1の検索結果データD1に類似する第2の検索結果データD3及びD4は、生成された類似情報1280に基づいて特定される。例えば、第1の検索結果データD1と第2の検索結果データD3との類似度が基準類似度以上である場合は第2の検索結果データD3が第1の検索結果データD1に類似すると判定され、当該類似度が基準類似度より低い場合は第2の検索結果データD3が第1の検索結果データD1に類似しないと判定される。「いいね」回数と比較される第1の基準数が、1回以外であってもよい。
As illustrated in FIG. 3, the
また、決定部1212は、図3に図示されるように複数の第1の検索結果データD1及びD2が存在する場合に、複数の第1の検索結果データD1及びD2に含まれる各第1の検索結果データの「いいね」回数が多くなるほど各第1の検索結果データの表示順位を上位にする。したがって、決定部1212は、「いいね」回数が3回である第1の検索結果データD1の表示順位を、「いいね」回数が1回である第1の検索結果データD2の表示順位より上位にする。
Further,
また、決定部1212は、図3に図示されるように複数の第2の検索結果データD3及びD4が存在する場合に、第1の検索結果データD1と複数の第2の検索結果データD3及びD4に含まれる各第2の検索結果データとの類似度が高くなるほど各第2の検索結果データの表示順位を上位にする。したがって、決定部1212は、第1の検索結果データD1と相対的に高い類似度を有する第2の検索結果データD3の表示順位を、第1の検索結果データD1と相対的に低い類似度を有する第2の検索結果データD4の表示順位より上位にする。
Further, as shown in FIG. 3, when there are a plurality of second search result data D 3 and D 4 , the
また、決定部1212は、図3に図示されるように、第1の検索結果データD1及びD2の表示順位を、第2の検索結果データD3及びD4の表示順位より上位にする。第1の検索結果データD1の表示順位が第2の検索結果データD3及びD4の表示順位より上位にされ、第1の検索結果データD2の表示順位が第2の検索結果データD3及びD4の表示順位より下位にされてもよい。第1の検索結果データD1及びD2の表示順位と第2の検索結果データD3及びD4の表示順位との関係は、下述する表示順位スコアの計算アルゴリズムにより調整することができる。
Further,
また、決定部1212は、図3に図示されるように、「わるいね」回数が1回以上である第3の検索結果データDnの表示順位を、第1の検索結果データD1及びD2並びに第2の検索結果データD3及びD4の表示順位より下位にする。これにより、「わるいね」回数が多い第4の検索結果データDnが下位に表示される。このため、不要な検索結果データが下位に表示される可能性が高くなる。「わるいね」回数と比較される第2の基準数が、1回以外であってもよい。
Further,
4 複数の検索対象データの取得、及び類似する検索対象データの学習
図4は、第1実施形態の検索装置において行われる複数の検索対象データの取得、及び類似する検索対象データの学習の流れを図示するフローチャートである。
4. Acquisition of a plurality of search target data and learning of similar search target data FIG. 4 shows a flow of acquisition of a plurality of search target data and learning of similar search target data performed in the search device of the first embodiment. It is a flowchart illustrated.
図4に図示されるステップS101においては、取得部1200が、全データの取得のトリガーが入力されたか否かを判定する。全データの取得のトリガーは、あらかじめ定められたスケジュールにしたがって入力されてもよいし、手動で入力されてもよい。全データの取得のトリガーが入力されたと判定された場合は、ステップS102、S103及びS104が順次に実行されてからステップS105が実行される。一方、全データの取得のトリガーが入力されていないと判定された場合は、ステップS102、S103及びS104が実行されることなくステップS105が実行される。
In step S101 illustrated in FIG. 4, the
ステップS102においては、取得部1200が、全データクロールを開始する。取得部1200は、全データクロール中に、全データを取得し、取得した全データを記憶部1202に記憶させる。記憶させられた全データは、複数の検索対象データ1220に含められる。また、取得部1200は、取得した全データの検索インデックスを作成する。
In step S102, the
ステップS103においては、生成部1210が、記憶部1202に記憶された複数の検索対象データ1220に含まれる各検索対象データに類似する検索対象データを学習し、各検索対象データに類似する検索対象データを特定する類似情報1280を生成する。生成される類似情報1280は、各検索対象データと各検索対象データに類似する検索対象データとの類似度を示す類似度スコアを含む。
In step S103, the
ステップS104においては、生成部1210が、ステップS103において生成した類似情報1280を記憶部1202により構成されるデータベース(DB)に登録する。
In step S104, the
ステップS105においては、取得部1200が、差分データの取得のトリガーが入力されたか否かを判定する。差分データの取得のトリガーは、あらかじめ定められたスケジュールにしたがって入力されてもよいし、手動で入力されてもよい。差分データの取得のトリガーが入力されたと判定された場合は、ステップS106、S107、S108及びS109が順次に実行されてからステップS110が実行される。一方、差分データの取得のトリガーが入力されていないと判定された場合は、ステップS106、S107、S108及びS109が実行されることなくステップS110が実行される。
In step S105, the
ステップS106においては、取得部1200が、差分クロールを開始する。取得部1200は、差分クロール中に、差分データを取得する。差分データは、追加データ、削除データ及び更新データを含む。
In step S106, the
ステップS107においては、取得部1200が、取得した差分データにしたがって複数の検索対象データ1220を更新する。生成部1210は、複数の検索対象データ1220を更新する際に、追加データを複数の検索対象データ1220に追加し、削除データを複数の検索対象データ1220から削除し、更新データで複数の検索対象データ1220に含まれる検索対象データを置換する。
In step S107, the
ステップS108においては、生成部1210が、更新された検索対象データに類似する検索対象データを学習し、更新された検索対象データに類似する検索対象データを特定する類似情報1280を生成する。生成される類似情報1280は、更新された検索対象データと更新された検索対象データに類似する検索対象データとの類似度を示す類似度スコアを含む。また、生成部1210は、削除データに類似する検索対象データを特定する類似情報1280を削除する。
In step S108, the
ステップS109においては、生成部1210が、ステップS108において生成した類似情報1280を記憶部1202により構成されるDBに登録する。
In step S109, the
ステップS110においては、検索装置1000が終了したか否かが判定される。検索装置1000が終了していないと判定された場合は、ステップS101が再び実行される。検索装置1000が終了したと判定された場合は、ステップS101が実行されることなく複数の検索対象データの取得、及び類似する検索対象データの学習が終了する。これにより、検索装置1000が終了するまでの間はステップS101からS109までが繰り返し実行される。
In step S110, it is determined whether or not search
ステップS101からS110までによれば、複数の検索対象データ1220が取得された後に、複数の検索対象データ1220が更新される。このため、複数の検索対象データ1220を最新の状態に保つことができる。また、複数の検索対象データ1220に含まれる各検索対象データに類似する検索対象データを特定する類似情報1280を最新の状態に保つことができる。
According to steps S101 to S110, after the plurality of
5 フィードバックの学習
図5は、第1実施形態の検索装置において行われるフィードバックの学習の流れを図示するフローチャートである。
5. Feedback Learning FIG. 5 is a flowchart illustrating a flow of feedback learning performed in the search device of the first embodiment.
図5に図示されるステップS121においては、検索部1204が、記憶部1202に記憶されている複数の検索対象データ1220に対して検索を実行し、複数の検索対象データ1220から検索条件に合致する複数の検索結果データ1240を抽出する。
In step S121 illustrated in FIG. 5, the
続くステップS122においては、表示制御部1206が、抽出された複数の検索結果データ1240をディスプレイ1048に表示させる。
In subsequent step S122,
続くステップS123においては、受け付け部1208が、ディスプレイ1048に表示された複数の検索結果データ1240から選択された検索結果データへの「いいね」の付与を要求する操作が入力機器1046に対して行われたか否かを判定する。また、ステップS124においては、受け付け部1208が、当該検索結果データへの「いいね」の付与の取り消しを要求する操作が入力機器1046に対して行われたか否かを判定する。ステップS125においては、受け付け部1208が、当該検索結果データへの「わるいね」の付与を要求する操作が入力機器1046に対して行われたか否かを判定する。
In subsequent step S123, receiving
「いいね」の付与を要求する操作、又は「いいね」の付与の取り消しを要求する操作が行われたと判定された場合は、ステップS126、S127及びS128が順次に実行された後にステップS131及びS132が順次に実行される。「わるいね」の付与を要求する操作が行われたと判定された場合は、ステップS129及びS130が順次に実行された後にステップS131及びS132が順次に実行される。「いいね」の付与を要求する操作、「いいね」の付与の取り消しを要求する操作、及び「わるいね」の付与を要求する操作のいずれも行われていないと判定された場合は、ステップS132が実行される。 If it is determined that an operation requesting the provision of “like” or an operation requesting cancellation of the provision of “like” is performed, steps S126, S127, and S128 are sequentially performed, and then steps S131 and S128 are performed. S132 is executed sequentially. When it is determined that the operation requesting the “bad” is performed, steps S129 and S130 are sequentially performed, and then steps S131 and S132 are sequentially performed. If it is determined that none of the operation requesting the grant of the "like", the operation requesting the cancellation of the grant of the "like", and the operation requesting the grant of the "bad" are performed, S132 is executed.
ステップS126においては、決定部1212が、選択された検索結果データの「いいね」回数を更新する。決定部1212は、「いいね」の付与を要求する操作が行われたと判定された場合は、「いいね」回数を1回分増加させる。一方、決定部1212は、「いいね」の付与の取り消しを要求する操作が行われたと判定された場合は、「いいね」回数を1回分減少させる。
In step S126, the
ステップS127においては、決定部1212が、選択された検索結果データに類似する検索結果データの表示順位スコアを再計算する。再計算される表示順位スコアには、選択された検索結果データの「いいね回数」、及び選択された検索結果データと選択された検索結果データに類似する検索結果データとの類似度を示す類似度スコアが反映される。
In step S127, the
ステップS128においては、決定部1212が、選択された検索結果データの表示順位スコアを計算する。計算される表示順位スコアには、選択された検索結果データの「いいね」回数、及び選択された検索結果データに類似する検索結果データの表示順位スコアが反映される。
In step S128,
ステップS129においては、決定部1212が、選択された検索結果データの「わるいね」回数を更新する。決定部1212は、「わるいね」の付与を要求する操作が行われたと判定された場合は、「わるいね」回数を1回分増加させる。
In step S129, the
ステップS130においては、決定部1212が、選択された検索結果データの表示順位スコアを計算する。計算される表示順位スコアには、選択された検索結果データの「わるいね回数」が反映される。
In step S130,
ステップS131においては、決定部1212が、計算された複数の検索結果データ1240の表示順位スコアに基づいて複数の検索結果データ1240の表示順位1290を決定する。これにより、次に検索が実行された際には、決定された複数の検索結果データ1240の表示順位1290にしたがって複数の検索結果データ1240がディスプレイ1048に表示される。表示される複数の検索結果データ1240の表示順位1290には、ユーザからのフィードバック1260が反映されている。
In step S131, the
ステップS132においては、ユーザが検索装置1000からログアウトしたか否かが判定される。ユーザがログアウトしていないと判定された場合は、ステップS121が再び実行される。ユーザがログアウトしたと判定された場合は、ステップS121が実行されることなくフィードバックの学習が終了する。これにより、ユーザが検索装置1000からログアウトするまで、ステップS121からS131までが繰り返し実行される。
In step S132, it is determined whether or not the user has logged out of
ステップS121からS132までによれば、「いいね」の付与を要求する操作、「いいね」の付与の取り消しを要求する操作、又は「わるいね」の付与を要求する操作が行われるごとに、複数の検索結果データ1240の表示順位1290が更新される。
According to steps S121 to S132, every time an operation requesting the grant of “like”, an operation requesting cancellation of the grant of “like”, or an operation requesting the grant of “bad” is performed, The
6 検索装置において用いられるテーブルの例
図6、図7及び図8は、第1実施形態の検索装置において検索対象文書の管理に用いられるテーブルの例を図示する図である。
6. Example of Table Used in Search Apparatus FIGS. 6, 7, and 8 are diagrams illustrating examples of tables used in managing search target documents in the search apparatus of the first embodiment.
図6、図7及び図8に図示されるテーブルは、複数の検索対象データ1220が複数の検索対象文書である場合に用いられるテーブルである。
The tables illustrated in FIGS. 6, 7, and 8 are tables used when the plurality of
図6に図示されるテーブル1300には、複数の文書識別子(ID)1320、複数の文書名1322、複数の文書ユニフォームリソースロケータ(URL)1324、複数の「いいね」回数1326、及び複数の「わるいね」回数1328が記述される。複数の文書名1322は、それぞれ複数の文書ID1320に対応づけられる。複数の文書URL1324は、それぞれ複数の文書ID1320に対応づけられる。複数の「いいね」回数1326は、それぞれ複数の文書ID1320に対応づけられる。複数の「わるいね」回数1328は、それぞれ複数の文書ID1320に対応づけられる。
The table 1300 illustrated in FIG. 6 includes a plurality of document identifiers (IDs) 1320, a plurality of
複数の文書ID1320は、それぞれ複数の検索対象文書を識別する。複数の文書名1322に含まれる各文書名は、各文書名が対応づけられた文書IDにより識別される文書の名である。複数の文書URL1324に含まれる各文書URLは、各文書URLが対応づけられた文書IDにより識別される文書のURLである。複数の「いいね」回数1326に含まれる各「いいね」回数は、各「いいね」回数が対応づけられた文書IDにより識別される文書の「いいね」回数である。複数の「わるいね」回数1328に含まれる各「わるいね」回数は、各「わるいね」回数が対応づけられた文書IDにより識別される文書の「わるいね」回数である。複数の「いいね」回数1326、及び複数の「わるいね」回数1328は、フィードバック1260の学習において用いられる。
The plurality of
複数の「いいね」回数1326、及び複数の「わるいね」回数1328は、複数のユーザで共有される。これにより、得たい情報が複数のユーザで共有され、十分な知見を有しないユーザが得たい情報を得ることができるようになる。
The plurality of “like”
図7に図示されるテーブル1400には、複数の文書ファイルパス1420が記述される。複数の文書ファイルパス1420は、それぞれ複数の検索対象文書が記載されたファイルのパスである。
In a table 1400 shown in FIG. 7, a plurality of
図8に図示されるテーブル1500には、複数の形態素解析結果ファイルのパス1520が記述される。複数の形態素解析結果ファイルのパス1520は、それぞれ複数の検索対象文書の形態素解析結果が記載されたファイルのパスである。複数の検索対象文書の形態素解析結果は、類似する検索対象データの学習に用いられる。
In a table 1500 illustrated in FIG. 8,
図9は、第1実施形態の検索装置において類似文書の管理に用いられるテーブルの例を図示する図である。 FIG. 9 is a diagram illustrating an example of a table used for managing similar documents in the search device of the first embodiment.
図9に図示されるテーブル1600は、複数の検索対象データ1220が複数の検索対象文書である場合に用いられるテーブルである。
The table 1600 illustrated in FIG. 9 is a table used when the plurality of
図9に図示されるテーブル1600には、複数の文書ID1620、複数の類似文書ID1622及び複数の類似度1624が記述される。複数の類似文書ID1620は、それぞれ複数の文書ID1620に対応づけられる。複数の類似度1624は、それぞれ複数の文書ID1620に対応づけられる。
The table 1600 illustrated in FIG. 9 describes a plurality of
複数の類似文書ID1620に含まる各類似文書IDは、各類似文書IDが対応づけられた文書IDにより識別される文書に類似する文書を識別する文書IDである。複数の類似度1624に含まれる各類似度は、各類似度が対応づけられた文書IDにより識別される文書と、各類似度が対応づけられた文書IDに対応づけられた類似文書IDにより識別される文書との類似度である。
Each similar document ID included in the plurality of
図10は、第1実施形態の検索装置において類似文書の閲覧に用いられるテーブルの例を図示する。 FIG. 10 illustrates an example of a table used for browsing similar documents in the search device of the first embodiment.
図10に図示されるテーブル1700は、複数の検索対象データ1220が複数の検索対象文書である場合に用いられるテーブルである。
The table 1700 illustrated in FIG. 10 is a table used when the plurality of
図10に図示されるテーブル1700には、複数の文書ID1720、複数の類似文書ID1722、複数の文書URL1724、複数の類似文書URL1726及び複数の類似度1728が記述されている。複数の文書ID1720、複数の類似文書ID1722及び複数の類似度1728は、それぞれ図9に図示される複数の文書ID1620、複数の類似文書ID1622及び複数の類似度1624と同様のものである。複数の文書URL1724は、それぞれ複数の文書ID1720に対応づけられる。複数の類似文書URL1726は、それぞれ複数の類似文書ID1720に対応づけられる。複数の文書URL1724に含まれる各文書URLは、各文書URLが対応づけられた文書IDにより識別される文書のURLである。複数の類似文書URL1726に含まれる各類似文書URLは、各類似文書URLが対応づけられた類似文書IDにより識別される文書のURLである。
A table 1700 illustrated in FIG. 10 describes a plurality of
この発明は詳細に説明されたが、上記した説明は、すべての局面において、例示であって、この発明がそれに限定されるものではない。例示されていない無数の変形例が、この発明の範囲から外れることなく想定され得るものと解される。 Although the present invention has been described in detail, the above description is illustrative in all aspects and the present invention is not limited thereto. It is understood that innumerable modifications that are not illustrated can be assumed without departing from the scope of the present invention.
1000 検索装置
1046 入力機器
1048 出力機器(ディスプレイ)
1200 取得部
1202 記憶部
1204 検索部
1206 出力制御部(表示制御部)
1208 受け付け部
1210 生成部
1212 決定部
1220 複数の検索対象データ
1240 複数の検索結果データ
1260 フィードバック
1280 類似情報
1290 表示順位
D1,D2,D3,D4,D5,・・・,Dn−1,Dn 検索結果データ
1000
1200
1208
Claims (10)
前記複数の検索結果データを出力機器に出力させる出力制御部と、
前記複数の検索結果データから選択された検索結果データへの肯定的評価の付与を受け付ける受け付け部と、
前記複数の検索対象データに含まれる各検索対象データに類似する検索対象データを特定する類似情報を生成する生成部と、
前記複数の検索結果データを前記出力機器に出力させる際の前記複数の検索結果データの出力順位を決定し、付与された肯定的評価の数が第1の基準数以上である第1の検索結果データ、及び前記類似情報に基づいて特定される、前記第1の検索結果データに類似する第2の検索結果データの出力順位を、付与された肯定的評価の数が前記第1の基準数より少なく前記第1の検索結果データに類似しない第3の検索結果データの出力順位より上位にする決定部と、
を備える検索装置。 A search unit that extracts a plurality of search result data that match a search condition from a plurality of search target data;
An output control unit that outputs the plurality of search result data to an output device,
An accepting unit that accepts the assignment of a positive evaluation to the search result data selected from the plurality of search result data,
A generation unit that generates similar information that specifies search target data similar to each search target data included in the plurality of search target data,
A first search result in which the output order of the plurality of search result data when outputting the plurality of search result data to the output device is determined, and the number of positive evaluations given is equal to or greater than a first reference number. The output rank of the second search result data similar to the first search result data, which is specified based on the data and the similarity information, is set such that the number of positive evaluations given is greater than the first reference number. A determining unit that ranks higher than the output order of the third search result data that is at least not similar to the first search result data;
A search device comprising:
請求項1の検索装置。 2. The search device according to claim 1, wherein the accepting unit accepts cancellation of assignment of a positive evaluation to search result data selected from the plurality of search result data. 3.
前記決定部は、付与された否定的評価の数が第2の基準数以上である第4の検索結果データの出力順位を、前記第1の検索結果データ及び前記第2の検索結果データの出力順位より下位にする
請求項1又は2の検索装置。 The receiving unit receives a negative evaluation given to search result data selected from the plurality of search result data,
The determining unit may determine the output order of the fourth search result data in which the number of assigned negative evaluations is equal to or greater than a second reference number, by outputting the first search result data and the second search result data. 3. The search device according to claim 1, wherein the search device is lower than the order.
請求項1から3までのいずれかの検索装置。 The determining unit, when there are a plurality of first search result data, sets an output order of each of the first search result data as the number of positive evaluations given to each first search result data increases. 4. The search device according to claim 1, wherein the search device is a higher rank device.
請求項1から4までのいずれかの検索装置。 The determining unit, when there are a plurality of second search result data, the higher the similarity between the first search result data and each second search result data, the higher the similarity between each second search result data. The search device according to any one of claims 1 to 4, wherein the output order is set higher.
前記複数の検索結果データの表示順位スコアを計算し、
前記複数の検索結果データに含まれる検索結果データに付与された肯定的評価の数、及び前記検索結果データと前記検索結果データに類似する検索結果データとの類似度を、前記検索結果データに類似する検索結果データの表示順位スコアに反映し、
前記検索結果データに付与された肯定的評価の数、及び前記検索結果データに類似する検索結果データの表示順位スコアを、前記検索結果データの表示順位スコアに反映し、
前記複数の検索結果データの表示順位スコアに基づいて前記複数の検索結果データの出力順位を決定する
請求項1から5までのいずれかの検索装置。 The determining unit includes:
Calculating a display ranking score of the plurality of search result data;
The number of positive evaluations given to the search result data included in the plurality of search result data, and the similarity between the search result data and the search result data similar to the search result data are similar to the search result data. Of the search result data to be displayed,
The number of positive evaluations given to the search result data, and the display rank score of search result data similar to the search result data, reflected in the display rank score of the search result data,
The search device according to any one of claims 1 to 5, wherein an output order of the plurality of search result data is determined based on a display order score of the plurality of search result data.
前記決定部は、前記検索結果データに付与された否定的評価の数を前記検索結果データの表示順位スコアに反映する
請求項6の検索装置。 The receiving unit receives a negative evaluation given to search result data selected from the plurality of search result data,
The search device according to claim 6, wherein the determining unit reflects the number of negative evaluations given to the search result data in a display rank score of the search result data.
請求項1から7までのいずれかの検索装置。 8. The search device according to claim 1, wherein the determination unit sets the output order of the first search result data higher than the output order of the second search result data. 9.
b) 前記複数の検索結果データを出力機器に出力させる工程と、
c) 前記複数の検索結果データから選択された検索結果データへの肯定的評価の付与を受け付ける工程と、
d) 前記複数の検索対象データに含まれる各検索対象データに類似する検索対象データを特定する類似情報を生成する工程と、
e) 前記複数の検索結果データを前記出力機器に出力させる際の前記複数の検索結果データの出力順位を決定し、付与された肯定的評価の数が第1の基準数以上である第1の検索結果データ、及び前記類似情報に基づいて特定される、前記第1の検索結果データに類似する第2の検索結果データの出力順位を、付与された肯定的評価の数が前記第1の基準数より少なく前記第1の検索結果データに類似しない第3の検索結果データの出力順位より上位にする工程と、
を備える検索方法。 a) extracting a plurality of search result data that match a search condition from a plurality of search target data;
b) outputting the plurality of search result data to an output device;
c) receiving a positive evaluation given to the search result data selected from the plurality of search result data;
d) generating similarity information identifying search target data similar to each search target data included in the plurality of search target data,
e) determining the output order of the plurality of search result data when outputting the plurality of search result data to the output device, wherein the number of assigned positive evaluations is equal to or greater than a first reference number; The output order of the second search result data similar to the first search result data, which is specified based on the search result data and the similarity information, is determined based on the number of positive evaluations assigned to the first reference. Raising the output order of third search result data that is less than the number and is not similar to the first search result data;
A search method comprising:
b) 前記複数の検索結果データを出力機器に出力させる工程と、
c) 前記複数の検索結果データから選択された検索結果データへの肯定的評価の付与を受け付ける工程と、
d) 前記複数の検索対象データに含まれる各検索対象データに類似する検索対象データを特定する類似情報を生成する工程と、
e) 前記複数の検索結果データを前記出力機器に出力させる際の前記複数の検索結果データの出力順位を決定し、付与された肯定的評価の数が第1の基準数以上である第1の検索結果データ、及び前記類似情報に基づいて特定される、前記第1の検索結果データに類似する第2の検索結果データの出力順位を、付与された肯定的評価の数が前記第1の基準数より少なく前記第1の検索結果データに類似しない第3の検索結果データの出力順位より上位にする工程と、
をコンピュータに実行させる検索プログラム。 a) extracting a plurality of search result data that match a search condition from a plurality of search target data;
b) outputting the plurality of search result data to an output device;
c) receiving a positive evaluation given to the search result data selected from the plurality of search result data;
d) generating similarity information identifying search target data similar to each search target data included in the plurality of search target data,
e) determining the output order of the plurality of search result data when outputting the plurality of search result data to the output device, wherein the number of assigned positive evaluations is equal to or greater than a first reference number; The output order of the second search result data similar to the first search result data, which is specified based on the search result data and the similarity information, is determined based on the number of positive evaluations assigned to the first reference. Raising the output order of third search result data that is less than the number and is not similar to the first search result data;
A search program that causes a computer to execute.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018156035A JP2020030634A (en) | 2018-08-23 | 2018-08-23 | Search device, search method, and search program |
PCT/JP2019/024937 WO2020039730A1 (en) | 2018-08-23 | 2019-06-24 | Retrieval device, retrieval method, and retrieval program |
TW108122658A TWI743504B (en) | 2018-08-23 | 2019-06-27 | Search device, search method, and computer readable recording medium with search program recorded thereon |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018156035A JP2020030634A (en) | 2018-08-23 | 2018-08-23 | Search device, search method, and search program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020030634A true JP2020030634A (en) | 2020-02-27 |
Family
ID=69593086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018156035A Pending JP2020030634A (en) | 2018-08-23 | 2018-08-23 | Search device, search method, and search program |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2020030634A (en) |
TW (1) | TWI743504B (en) |
WO (1) | WO2020039730A1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7394513B2 (en) | 2022-02-18 | 2023-12-08 | Lineヤフー株式会社 | Information processing device, information processing method, and information processing program |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101169797B (en) * | 2007-11-30 | 2010-04-07 | 朱廷劭 | Searching method |
US8150843B2 (en) * | 2009-07-02 | 2012-04-03 | International Business Machines Corporation | Generating search results based on user feedback |
CN103679462B (en) * | 2012-08-31 | 2019-01-15 | 阿里巴巴集团控股有限公司 | A kind of comment data treating method and apparatus, a kind of searching method and system |
CN105808685B (en) * | 2016-03-02 | 2021-09-28 | 腾讯科技(深圳)有限公司 | Promotion information pushing method and device |
CN107423356A (en) * | 2017-05-31 | 2017-12-01 | 北京京东尚科信息技术有限公司 | The processing method and processing device of evaluation information, computer-readable medium, electronic equipment |
JP2019003406A (en) * | 2017-06-15 | 2019-01-10 | 株式会社日立ソリューションズ | Information collecting device, information collecting method, and information collecting program |
-
2018
- 2018-08-23 JP JP2018156035A patent/JP2020030634A/en active Pending
-
2019
- 2019-06-24 WO PCT/JP2019/024937 patent/WO2020039730A1/en active Application Filing
- 2019-06-27 TW TW108122658A patent/TWI743504B/en active
Also Published As
Publication number | Publication date |
---|---|
TW202009740A (en) | 2020-03-01 |
TWI743504B (en) | 2021-10-21 |
WO2020039730A1 (en) | 2020-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100974906B1 (en) | System and method for identifying authoritative documents related to a location | |
US8117211B2 (en) | Information processing device and method, and program | |
US9418128B2 (en) | Linking documents with entities, actions and applications | |
US7769771B2 (en) | Searching a document using relevance feedback | |
US8332426B2 (en) | Indentifying referring expressions for concepts | |
US8396879B1 (en) | Ranking authors and their content in the same framework | |
AU2011239618B2 (en) | Ascribing actionable attributes to data that describes a personal identity | |
US9244919B2 (en) | Organizing books by series | |
JP2019057082A (en) | Data retrieval system, data retrieving method, and program | |
JP4832952B2 (en) | Database analysis system, database analysis method and program | |
US9552415B2 (en) | Category classification processing device and method | |
JP4973503B2 (en) | File search program, method and apparatus | |
JP2012038066A (en) | Data processor and data processing method and program | |
WO2020039730A1 (en) | Retrieval device, retrieval method, and retrieval program | |
US11645312B2 (en) | Attribute extraction apparatus and attribute extraction method | |
JP5179564B2 (en) | Query segment position determination device | |
CN111737397A (en) | Information processing apparatus, document management system, recording medium, and information processing method | |
JP5416552B2 (en) | Ranking function generation device, ranking function generation method, ranking function generation program | |
JP5127553B2 (en) | Information processing apparatus, information processing method, program, and recording medium | |
JP2005010848A (en) | Information retrieval device, information retrieval method, information retrieval program and recording medium | |
US20090319505A1 (en) | Techniques for extracting authorship dates of documents | |
US11417133B2 (en) | Drawing management apparatus and system | |
JP2011103020A (en) | Device, method, and program for recommending retrieval condition | |
JP2009129202A (en) | Data processor, data processing method, and program | |
CN113590736B (en) | Index management method, device, electronic equipment and readable storage medium |