JP2013054606A - 文書検索装置及び方法及びプログラム - Google Patents
文書検索装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP2013054606A JP2013054606A JP2011193353A JP2011193353A JP2013054606A JP 2013054606 A JP2013054606 A JP 2013054606A JP 2011193353 A JP2011193353 A JP 2011193353A JP 2011193353 A JP2011193353 A JP 2011193353A JP 2013054606 A JP2013054606 A JP 2013054606A
- Authority
- JP
- Japan
- Prior art keywords
- query
- search
- user
- bookmark
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 本発明は、検索ログ記憶手段から指定された期間内の検索ログを抽出し、選択済み検索ログ記憶手段に格納し、検索ログ記憶手段の検索ログからユーザIDとクエリを選択し、該ユーザIDと該クエリに対応するレコードを該検索ログ記憶手段から取得して、該レコードをURL毎に集約し、該ユーザIDのユーザが該クエリにおいて、当該URL(ページ)をクリックした回数を取得して、該ユーザが該クエリにおけるクリックの偏りを求め、所定の条件を満たす場合に、{ユーザID,クエリ,ページ}の組をブックマーククエリ記憶手段に出力する。ユーザからユーザIDと検索クエリが入力されると、ブックマーククエリ記憶手段を参照して、該検索クエリがブックマーククエリである場合は対象ページへの遷移を行う。
【選択図】 図1
Description
検索ログ記憶手段から指定された期間内の検索ログを抽出し、選択済み検索ログ記憶手段に格納するログ期間選択手段と、
前記検索ログ記憶手段の検索ログからユーザIDとクエリを選択し、該ユーザIDと該クエリに対応するレコードを該検索ログ記憶手段から取得して、該レコードをURL毎に集約し、該ユーザIDのユーザが該クエリにおいて、当該URL(ページ)をクリックした回数を取得して、該ユーザが該クエリにおけるクリックの偏りを求め、所定の条件を満たす場合に、{ユーザID,クエリ,ページ}の組をブックマーククエリ記憶手段に出力するブックマーククエリ選択手段と、
ユーザからユーザIDと検索クエリが入力されると、前記ブックマーククエリ記憶手段を参照して、該検索クエリがブックマーククエリである場合は対象ページへの遷移を行う検索手段と、を有する。
前記クリックの偏りが最大のとき多様なページをクリックしているとし、小さいほど特定のページをクリックしているものとするクリックエントロピーを求め、該クリックエントロピーが、所定の閾値A以下で、かつ、クエリにおいて最もクリックされたページのクリック回数が所定の閾値B以上のであれば、前記{ユーザID,クエリ,ページ}の組をブックマーククエリとして、ブックマーククエリ記憶手段に出力する手段を含む。
前記検索クエリがブックマーククエリでない場合は、
M個のスコア要因を用いて、文書インデクス記憶手段から文書を取得して該文書のスコアの要因値行列を求めるスコア処理手段と、
前記要因値行列から各文書の検索スコアを計算する検索スコア計算手段と、
前記検索スコアの降順に、入力された前記検索クエリに対する検索結果を表示する検索結果出力手段と、を含む。
本実施の形態では、後述する第2の実施の形態の文書検索装置において入力される検索クエリとのマッチングを行うためのブックマーククエリDBを生成する処理を示す。
次に、本実施の形態では、上記の第1の実施の形態のブックマーククエリ抽出装置1により出力されたブックマーククエリDB30を用いて検索を行う場合について説明する。
sk=wTdk (5)
によって算出する。
2 文書検索装置
10 検索ログDB
20 ブックマーククエリ抽出部
30 ブックマーククエリDB
40 ログ期間選択部
50 選択済み検索ログDB
60 文書インデクスDB
70 クエリ処理部
80 検索スコア計算部
90 検索結果提示部
100 ブックマーククエリ処理部
Claims (7)
- 入力されたクエリに対して目的とするページを検索するための文書検索装置であって、
検索ログ記憶手段から指定された期間内の検索ログを抽出し、選択済み検索ログ記憶手段に格納するログ期間選択手段と、
前記検索ログ記憶手段の検索ログからユーザIDとクエリを選択し、該ユーザIDと該クエリに対応するレコードを該検索ログ記憶手段から取得して、該レコードをURL毎に集約し、該ユーザIDのユーザが該クエリにおいて、当該URL(ページ)をクリックしたクリック回数を取得して、該ユーザが該クエリにおけるクリックの偏りを求め、所定の条件を満たす場合に、{ユーザID,クエリ,ページ}の組をブックマーククエリ記憶手段に出力するブックマーククエリ選択手段と、
ユーザからユーザIDと検索クエリが入力されると、前記ブックマーククエリ記憶手段を参照して、該検索クエリがブックマーククエリである場合は対象ページへの遷移を行う検索手段と、
を有することを特徴とする文書検索装置。 - 前記ブックマーククエリ選択手段は、
前記クリックの偏りが最大のとき多様なページをクリックしているとし、小さいほど特定のページをクリックしているものとするクリックエントロピーを求め、該クリックエントロピーが、所定の閾値A以下で、かつ、クエリにおいて最もクリックされたページのクリック回数が所定の閾値B以上のであれば、前記{ユーザID,クエリ,ページ}の組をブックマーククエリとして、ブックマーククエリ記憶手段に出力する手段を含む
請求項1記載の文書検索装置。 - 前記検索手段は、
前記検索クエリがブックマーククエリでない場合は、
M個のスコア要因を用いて、文書インデクス記憶手段から文書を取得して該文書のスコアの要因値行列を求めるスコア処理手段と、
前記要因値行列から各文書の検索スコアを計算する検索スコア計算手段と、
前記検索スコアの降順に、入力された前記検索クエリに対する検索結果を表示する検索結果出力手段と、
を含む請求項1記載の文書検索装置。 - 入力されたクエリに対して目的とするページを検索するための文書検索方法であって、
ログ期間選択手段が、検索ログ記憶手段から指定された期間内の検索ログを抽出し、選択済み検索ログ記憶手段に格納するログ期間選択ステップと、
ブックマーククエリ選択手段が、前記検索ログ記憶手段の検索ログからユーザIDとクエリを選択し、該ユーザIDと該クエリに対応するレコードを該検索ログ記憶手段から取得して、該レコードをURL毎に集約し、該ユーザIDのユーザが該クエリにおいて、当該URL(ページ)をクリックした回数を取得して、該ユーザが該クエリにおけるクリックの偏りを求め、所定の条件を満たす場合に、{ユーザID,クエリ、ページ}の組をブックマーククエリ記憶手段に出力するブックマーククエリ選択ステップと、
を有するブックマーククエリ抽出過程と、
検索手段が、ユーザからユーザIDと検索クエリが入力されると、前記ブックマーククエリ記憶手段を参照して、該検索クエリがブックマーククエリである場合は対象ページへの遷移を行う検索過程と、
を有することを特徴とする文書検索方法。 - 前記ブックマーククエリ選択ステップにおいて、
前記クリックの偏りが最大のとき多様なページをクリックしているとし、小さいほど特定のページをクリックしているものとするクリックエントロピーを求め、該クリックエントロピーが、所定の閾値A以下で、かつ、クエリにおいて最もクリックされたページのクリック回数が所定の閾値B以上のであれば、前記{ユーザID,クエリ、ページ}の組をブックマーククエリとして、ブックマーククエリ記憶手段に出力する
請求項4記載の文書検索方法。 - 前記検索過程において、
前記検索クエリがブックマーククエリでない場合は、
M個のスコア要因を用いて、文書インデクス記憶手段から文書を取得して該文書のスコアの要因値行列を求めるスコア処理ステップと、
前記要因値行列から各文書の検索スコアを計算する検索スコア計算ステップと、
前記検索スコアの降順に、入力された前記検索クエリに対する検索結果を表示する検索結果出力ステップと、
を含む請求項4記載の文書検索方法。 - コンピュータを、
請求項1乃至3のいずれか1項に記載の文書検索装置の各手段として機能させるための文書検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011193353A JP5579140B2 (ja) | 2011-09-05 | 2011-09-05 | 文書検索装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011193353A JP5579140B2 (ja) | 2011-09-05 | 2011-09-05 | 文書検索装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013054606A true JP2013054606A (ja) | 2013-03-21 |
JP5579140B2 JP5579140B2 (ja) | 2014-08-27 |
Family
ID=48131520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011193353A Expired - Fee Related JP5579140B2 (ja) | 2011-09-05 | 2011-09-05 | 文書検索装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5579140B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016139423A (ja) * | 2016-03-11 | 2016-08-04 | デジタル・アドバタイジング・コンソーシアム株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP2018516421A (ja) * | 2016-02-24 | 2018-06-21 | 平安科技(深▲せん▼)有限公司 | ネットワークアクセス動作識別方法、サーバ及び記憶媒体 |
CN111767252A (zh) * | 2020-06-30 | 2020-10-13 | 平安科技(深圳)有限公司 | 日志查询方法、装置、计算机设备和存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105404501B (zh) * | 2015-09-24 | 2019-02-01 | 国网山东省电力公司 | 基于sap平台的规则库解析方法与系统 |
CN107798135B (zh) * | 2017-11-22 | 2020-06-16 | 阿里巴巴集团控股有限公司 | 分页查询方法及装置和电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009116422A (ja) * | 2007-11-02 | 2009-05-28 | Yahoo Japan Corp | クエリ抽出方法、クエリ抽出装置およびクエリ抽出プログラム |
JP2009193219A (ja) * | 2008-02-13 | 2009-08-27 | Nippon Telegr & Teleph Corp <Ntt> | インデックス作成装置、その方法、プログラム及び記録媒体 |
JP2009294836A (ja) * | 2008-06-04 | 2009-12-17 | Yahoo Japan Corp | Web検索において選択的に擬似フィードバック処理を適用する検索処理装置、方法及びプログラム |
JP2010049498A (ja) * | 2008-08-21 | 2010-03-04 | Fujitsu Ltd | 情報検索装置、情報検索方法及び情報検索プログラム |
JP2010146332A (ja) * | 2008-12-19 | 2010-07-01 | Nec Corp | 情報処理装置、情報提供システム、情報提供方法、情報提供プログラム及び記録媒体 |
JP2011085992A (ja) * | 2009-10-13 | 2011-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索装置、文書検索方法、文書検索プログラム |
-
2011
- 2011-09-05 JP JP2011193353A patent/JP5579140B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009116422A (ja) * | 2007-11-02 | 2009-05-28 | Yahoo Japan Corp | クエリ抽出方法、クエリ抽出装置およびクエリ抽出プログラム |
JP2009193219A (ja) * | 2008-02-13 | 2009-08-27 | Nippon Telegr & Teleph Corp <Ntt> | インデックス作成装置、その方法、プログラム及び記録媒体 |
JP2009294836A (ja) * | 2008-06-04 | 2009-12-17 | Yahoo Japan Corp | Web検索において選択的に擬似フィードバック処理を適用する検索処理装置、方法及びプログラム |
JP2010049498A (ja) * | 2008-08-21 | 2010-03-04 | Fujitsu Ltd | 情報検索装置、情報検索方法及び情報検索プログラム |
JP2010146332A (ja) * | 2008-12-19 | 2010-07-01 | Nec Corp | 情報処理装置、情報提供システム、情報提供方法、情報提供プログラム及び記録媒体 |
JP2011085992A (ja) * | 2009-10-13 | 2011-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索装置、文書検索方法、文書検索プログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018516421A (ja) * | 2016-02-24 | 2018-06-21 | 平安科技(深▲せん▼)有限公司 | ネットワークアクセス動作識別方法、サーバ及び記憶媒体 |
JP2016139423A (ja) * | 2016-03-11 | 2016-08-04 | デジタル・アドバタイジング・コンソーシアム株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN111767252A (zh) * | 2020-06-30 | 2020-10-13 | 平安科技(深圳)有限公司 | 日志查询方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5579140B2 (ja) | 2014-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9436707B2 (en) | Content-based image ranking | |
JP5612731B2 (ja) | 関心領域についての関連情報の決定 | |
JP5572596B2 (ja) | 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ | |
US7475074B2 (en) | Web search system and method thereof | |
JP4746439B2 (ja) | 文書検索サーバおよび文書検索方法 | |
JP5084858B2 (ja) | サマリ作成装置、サマリ作成方法及びプログラム | |
JP6033697B2 (ja) | 画像評価装置 | |
JP2007507801A (ja) | ウェブ検索の個人化 | |
KR20150036117A (ko) | 쿼리 확장 | |
WO2016187705A1 (en) | System and method for ranking search results | |
CN108572971B (zh) | 一种用于挖掘与检索词相关的关键词的方法和装置 | |
JP2017525026A (ja) | 文脈検索の提示の生成 | |
JP5579140B2 (ja) | 文書検索装置及び方法及びプログラム | |
JP4875911B2 (ja) | コンテンツ特定方法及び装置 | |
JP2010128928A (ja) | 検索システム及び検索方法 | |
JP5341847B2 (ja) | 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム | |
JP5406794B2 (ja) | 検索クエリ推薦装置及び検索クエリ推薦プログラム | |
US8838616B2 (en) | Server device for creating list of general words to be excluded from search result | |
JP2006318398A (ja) | ベクトル生成方法及び装置及び情報分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記憶媒体 | |
JP2010123036A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
CN105243073A (zh) | 一种书签访问方法、装置及终端 | |
KR20110023304A (ko) | 개념 네트워크 기반 사용자 프로파일 구성 방법 및 시스템과 이를 이용한 개인화 질의 확장 시스템 | |
JP4759600B2 (ja) | 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体 | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP6034584B2 (ja) | 特許調査支援装置、特許調査支援方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130910 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131004 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140609 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140701 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140708 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5579140 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |