JP5286162B2 - 情報検索サーバ、情報検索方法及び情報検索プログラム - Google Patents
情報検索サーバ、情報検索方法及び情報検索プログラム Download PDFInfo
- Publication number
- JP5286162B2 JP5286162B2 JP2009136429A JP2009136429A JP5286162B2 JP 5286162 B2 JP5286162 B2 JP 5286162B2 JP 2009136429 A JP2009136429 A JP 2009136429A JP 2009136429 A JP2009136429 A JP 2009136429A JP 5286162 B2 JP5286162 B2 JP 5286162B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- score
- search
- document data
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、図1〜7を用いて、第1実施形態に係る情報検索サーバ1の機能及び構成を説明する。
f(q,d)=
wTF×TF(q,d)+wPOS×POS(q,d)
+wCPV×CPV(q,d)+wCUU×CUU(q,d)
ここで、wTF,wPOS,wCPV,wCUUは、それぞれTF(q,d),POS(q,d),CPV(q,d),CUU(q,d)の重み係数である。
g(d)=
wDL×DL(d)+wUL×UL(d)+wNL×NL(d)
+wPV×PV(d)+wUU×UU(d)+wDT×DT(d)
ここで、wDL,wUL,wNL,wPV,wUU,wDTは、それぞれDL(d),UL(d),NL(d),PV(d),UU(d),DT(d)の重み係数である。
R(q,d)=wf×f(q,d)+wg×g(d)
ここで、wf,wgは、それぞれf(q,d),g(d)の重み係数である。
VPV(d)=PV(d)/PVprev(d)
VCPV(q,d)=CPV(q,d)/CPVprev(q,d)
上記第1実施形態では2個の閾値Vmax,Vminを用いて再計算の要否を判定したが、ドキュメント間の変動率の大小関係に基づいて再計算するドキュメントを決定してもよい。このような処理を図11を用いて説明する。
上記第1実施形態では、依存スコアf(q,d)及び非依存スコアg(d)を再計算したが、検索語依存のログパラメータの変動が大きい場合には依存スコアf(q,d)のみを再計算し、検索語非依存のログパラメータの変動が大きい場合には非依存スコアg(d)のみを再計算してもよい。このような処理を図12を用いて説明する。
指示部16は、変動率だけでなく、前回検索スコアを算出した時からの経過時間も考慮して、再計算するドキュメントを決定してもよい。このような処理を図13を用いて説明する。
T(d)=CTIME−TPREV(d)
ここで、CTIMEは現在時刻、TPREV(d)は前回の算出時刻である。
EM(d)=wVpv×VPV(d)+wVcpv×maxq(VCPV(q,d))
+wT*T(d)
ここでmaxq(VCPV(q,d))は、全検索語qに対して最大値となるVCPV(q,d)である。また、wVpv、wVcpv、wTは、それぞれVPV(d),maxq(VCPV(q,d)),T(d)に対する重み係数である。
上記第1実施形態では各ドキュメントについて再計算の要否を判定したが、ドキュメントの所定の集約単位(例えばドメイン単位)でログパラメータを算出し、そのパラメータの変動が大きい場合にそのドメイン下の各ドキュメントの検索スコアを再計算してもよい。このような処理を図14を用いて説明する。
VPV(D)=PV(D)/PVprev(D)
指示部16は、検索語qに関する変動率を算出し、変動の大きい検索語に関連するドキュメントdについてスコアの再計算を指示してもよい。このような処理を図15を用いて説明する。
VPV(q)=PV(q)/PVprev(q)
ここで、PVprev(q)は前回算出し保持している検索語qの検索数である。
次に、図17を用いて、第2実施形態に係る情報検索サーバ2を説明する。情報検索サーバ2は機能的構成要素としてドキュメントデータベース11、非ドキュメントデータベース12、スコア計算部21、スコアデータベース22、検索部23及び指示部16を備えている。情報検索サーバ2は、第1実施形態における情報検索サーバ1と比較して、主に検索スコアの算出及びドキュメント検索に関する処理手順が異なる。以下では第1実施形態と異なる点について説明する。
fd(q,d)=wTF×TF(q,d)+wPOS×POS(q,d)
ここで、wTF,wPOSは、それぞれTF(q,d),POS(q,d)の重み係数である。
gd(d)=wDL×DL(d)+wUL×UL(d)+wNL×NL(d)
ここでwDL,wUL,wNLは、それぞれDL(d),UL(d),NL(d)の重み係数である。
fl(q,d)=wCPV×CPV(q,d)+wCUU×CUU(q,d)
ここでwCPV、wCUUは、それぞれCPV(q,d),CUU(q,d)の重み係数である。
gl(d)=wPV×PV(d)+wUU×UU(d)+wDT×DT(d)
ここでwPV、wUU、wDTは、それぞれPV(d),UU(d),DT(d)の重み係数である。
R’(q,d)=wfd×fd(q,d)+wgd×gd(d)
+wfl×fl(q,d)+wgl×gl(d)
ここで、wfd,wgd,wfl,wglは、それぞれfd(q,d),gd(d),fl(q,d),gl(d)の重み付け係数である。
次に、図18を用いて、第3実施形態に係る情報検索サーバ3を説明する。情報検索サーバ3は機能的構成要素としてドキュメントデータベース11、非ドキュメントデータベース12、スコア計算部13、スコアデータベース14、検索部15、クローラ31、及び指示部32を備えている。情報検索サーバ3は、第1実施形態における情報検索サーバ1と比較して、スコア計算部13だけでなくクローラ31にも再実行を指示する点が異なる。以下では第1実施形態と異なる点について説明する。
VPV(d)=PV(d)/PVprev(d)
ここで、PVprev(d)は前回算出し保持している総ページビュー数である。
Claims (11)
- 入力された検索語とスコアデータベースに記憶されている検索スコアとに基づいて、該検索語に関連するドキュメントを検索する情報検索サーバであって、
複数のドキュメントデータに関する複数の非ドキュメント情報を記憶する非ドキュメントデータベースと、
前記ドキュメントデータに対応する前記検索スコアを算出し、該検索スコアを前記スコアデータベースに記憶するスコア算出手段と、
前記検索スコアの再計算を前記スコア算出手段に指示する指示手段と、
を備え、
前記スコア算出手段が、
前記ドキュメントデータで示されるドキュメントの内容に関する所定のドキュメントパラメータを算出する第1算出手段と、
前記ドキュメントデータに関する非ドキュメント情報を前記非ドキュメントデータベースから読み出し、該非ドキュメント情報に基づいて該ドキュメントデータへのアクセスに関する所定の非ドキュメントパラメータを算出する第2算出手段と、
前記ドキュメントパラメータ及び前記非ドキュメントパラメータに基づいて前記検索スコアを算出する第3算出手段と、
を備え、
前記指示手段が、前記各ドキュメントデータについて前記非ドキュメントパラメータの変動率を算出し、該変動率が所定の水準以上であるドキュメントデータについて前記検索スコアの再計算を指示する、
ことを特徴とする情報検索サーバ。 - 前記指示手段が、前記各ドキュメントデータについて算出した前記変動率をソートし、上位の所定の件数又は下位の所定の件数のドキュメントデータについて前記検索スコアの再計算を指示する、
ことを特徴とする請求項1に記載の情報検索サーバ。 - 前記指示手段が、前記各ドキュメントデータについて、前記検索スコアを前回算出した時からの経過時間を算出し、該経過時間が所定の時間以上であるドキュメントデータについて前記検索スコアの再計算を指示する、
ことを特徴とする請求項1又は2に記載の情報検索サーバ。 - 入力された検索語とスコアデータベースに記憶されている検索スコアとに基づいて、該検索語に関連するドキュメントを検索する情報検索サーバであって、
複数のドキュメントデータに関する複数の非ドキュメント情報を記憶する非ドキュメントデータベースと、
前記ドキュメントデータに対応する前記検索スコアを算出し、該検索スコアを前記スコアデータベースに記憶するスコア算出手段と、
前記検索スコアの再計算を前記スコア算出手段に指示する指示手段と、
を備え、
前記スコア算出手段が、
前記ドキュメントデータで示されるドキュメントの内容に関する所定のドキュメントパラメータを算出する第1算出手段と、
前記ドキュメントデータに関する非ドキュメント情報を前記非ドキュメントデータベースから読み出し、該非ドキュメント情報に基づいて該ドキュメントデータへのアクセスに関する所定の非ドキュメントパラメータを算出する第2算出手段と、
前記ドキュメントパラメータ及び前記非ドキュメントパラメータに基づいて前記検索スコアを算出する第3算出手段と、
を備え、
前記指示手段が、前記複数のドキュメントデータをドメイン又はディレクトリ毎に集約し、該ドメイン又はディレクトリ毎に前記非ドキュメントパラメータの変動率を算出し、該変動率が所定の水準以上であるドメイン又はディレクトリ内のドキュメントデータについて前記検索スコアの再計算を指示する、
ことを特徴とする情報検索サーバ。 - 前記指示手段が、前記各ドメイン又は前記各ディレクトリから一つずつ選択したドキュメントデータ毎に前記変動率を算出し、該変動率が所定の水準以上であるドキュメントデータが所属する前記ドメイン又は前記ディレクトリ内のドキュメントデータについて前記検索スコアの再計算を指示する、
ことを特徴とする請求項4に記載の情報検索サーバ。 - 入力された検索語とスコアデータベースに記憶されている検索スコアとに基づいて、該検索語に関連するドキュメントを検索する情報検索サーバであって、
複数のドキュメントデータに関する複数の非ドキュメント情報を記憶する非ドキュメントデータベースと、
前記ドキュメントデータに対応する前記検索スコアを算出し、該検索スコアを前記スコアデータベースに記憶するスコア算出手段と、
前記検索スコアの再計算を前記スコア算出手段に指示する指示手段と、
を備え、
前記スコア算出手段が、
前記ドキュメントデータで示されるドキュメントの内容に関する所定のドキュメントパラメータを算出する第1算出手段と、
前記ドキュメントデータに関する非ドキュメント情報を前記非ドキュメントデータベースから読み出し、該非ドキュメント情報に基づいて該ドキュメントデータへのアクセスに関する所定の非ドキュメントパラメータを算出する第2算出手段と、
前記ドキュメントパラメータ及び前記非ドキュメントパラメータに基づいて前記検索スコアを算出する第3算出手段と、
を備え、
前記非ドキュメント情報が、前記ドキュメントデータと前記検索語とが関連付けられた情報であり、
前記指示手段が、前記各検索語について前記非ドキュメントパラメータの変動率を算出し、該変動率が所定の水準以上である検索語に関連付けられたドキュメントデータについて前記検索スコアの再計算を指示する、
ことを特徴とする情報検索サーバ。 - 前記検索スコアが、検索語に依存する依存スコアと検索語に依存しない非依存スコアとを含み、
前記非ドキュメントパラメータが、検索語に依存する依存非ドキュメントパラメータと検索語に依存しない非依存非ドキュメントパラメータとを含み、
前記指示手段が、前記依存非ドキュメントパラメータに関する前記変動率が所定の水準以上であるドキュメントデータについて前記依存スコアの再計算を指示し、前記非依存非ドキュメントパラメータに関する前記変動率が所定の水準以上であるドキュメントデータについて前記非依存スコアの再計算を指示する、
ことを特徴とする請求項1又は2に記載の情報検索サーバ。 - 入力された検索語とスコアデータベースに記憶されている検索スコアとに基づいて、該検索語に関連するドキュメントを検索する情報検索サーバであって、
複数のドキュメントデータに関する複数の非ドキュメント情報を記憶する非ドキュメントデータベースと、
前記ドキュメントデータに対応する前記検索スコアを算出し、該検索スコアを前記スコアデータベースに記憶するスコア算出手段と、
前記検索スコアの再計算を前記スコア算出手段に指示する指示手段と、
を備え、
前記スコア算出手段が、
前記ドキュメントデータで示されるドキュメントの内容に関する所定のドキュメントパラメータを算出する第1算出手段と、
前記ドキュメントデータに関する非ドキュメント情報を前記非ドキュメントデータベースから読み出し、該非ドキュメント情報に基づいて該ドキュメントデータへのアクセスに関する所定の非ドキュメントパラメータを算出する第2算出手段と、
前記ドキュメントパラメータに基づいてドキュメント由来の検索スコアを算出する第3算出手段と、
前記非ドキュメントパラメータに基づいてログ由来の検索スコアを算出する第4算出手段と、
を備え、
前記指示手段が、前記各ドキュメントデータについて前記非ドキュメントパラメータの変動率を算出し、該変動率が所定の水準以上であるドキュメントデータについて、前記ドキュメント由来の検索スコアの再計算を指示することなく、前記ログ由来の検索スコアの再計算を指示する、
ことを特徴とする情報検索サーバ。 - 前記ドキュメントデータをネットワークから収集してドキュメントデータベースに記憶する収集手段を更に備え、
前記指示手段が、更に、前記変動率が所定の水準以上であるドキュメントデータの再収集を前記収集手段に指示する、
ことを特徴とする請求項1又は2に記載の情報検索サーバ。 - 入力された検索語とスコアデータベースに記憶されている検索スコアとに基づいて該検索語に関連するドキュメントを検索する検索手段と、複数のドキュメントデータに関する複数の非ドキュメント情報を記憶する非ドキュメントデータベースとを備える情報検索サーバ、により実行される情報検索方法であって、
スコア算出手段が、前記ドキュメントデータに対応する前記検索スコアを算出し、該検索スコアを前記スコアデータベースに記憶するスコア算出ステップと、
前記検索スコアの再計算を前記スコア算出手段に指示する指示ステップと、
を含み、
前記スコア算出ステップが、
前記ドキュメントデータで示されるドキュメントの内容に関する所定のドキュメントパラメータを算出する第1算出ステップと、
前記ドキュメントデータに関する非ドキュメント情報を前記非ドキュメントデータベースから読み出し、該非ドキュメント情報に基づいて該ドキュメントデータへのアクセスに関する所定の非ドキュメントパラメータを算出する第2算出ステップと、
前記ドキュメントパラメータ及び前記非ドキュメントパラメータに基づいて前記検索スコアを算出する第3算出ステップと、
を含み、
前記指示ステップでは、前記各ドキュメントデータについて前記非ドキュメントパラメータの変動率を算出し、該変動率が所定の水準以上であるドキュメントデータについて前記検索スコアの再計算を指示する、
ことを特徴とする情報検索方法。 - コンピュータを、入力された検索語とスコアデータベースに記憶されている検索スコアとに基づいて該検索語に関連するドキュメントを検索する情報検索サーバとして機能させるための情報検索プログラムであって、
前記コンピュータを、
複数のドキュメントデータに関する複数の非ドキュメント情報を記憶する非ドキュメントデータベースと、
前記ドキュメントデータに対応する前記検索スコアを算出し、該検索スコアを前記スコアデータベースに記憶するスコア算出手段と、
前記検索スコアの再計算を前記スコア算出手段に指示する指示手段と、
して機能させ、
前記スコア算出手段が、
前記ドキュメントデータで示されるドキュメントの内容に関する所定のドキュメントパラメータを算出する第1算出手段と、
前記ドキュメントデータに関する非ドキュメント情報を前記非ドキュメントデータベースから読み出し、該非ドキュメント情報に基づいて該ドキュメントデータへのアクセスに関する所定の非ドキュメントパラメータを算出する第2算出手段と、
前記ドキュメントパラメータ及び前記非ドキュメントパラメータに基づいて前記検索スコアを算出する第3算出手段と、
を備え、
前記指示手段が、前記各ドキュメントデータについて前記非ドキュメントパラメータの変動率を算出し、該変動率が所定の水準以上であるドキュメントデータについて前記検索スコアの再計算を指示する、
ことを特徴とする情報検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009136429A JP5286162B2 (ja) | 2009-06-05 | 2009-06-05 | 情報検索サーバ、情報検索方法及び情報検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009136429A JP5286162B2 (ja) | 2009-06-05 | 2009-06-05 | 情報検索サーバ、情報検索方法及び情報検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010282495A JP2010282495A (ja) | 2010-12-16 |
JP5286162B2 true JP5286162B2 (ja) | 2013-09-11 |
Family
ID=43539157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009136429A Expired - Fee Related JP5286162B2 (ja) | 2009-06-05 | 2009-06-05 | 情報検索サーバ、情報検索方法及び情報検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5286162B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5535385A (en) * | 1995-05-19 | 1996-07-09 | At&T Corp. | Dealing with side effects of transactions in data base systems using a multi-set algebra |
JP4211627B2 (ja) * | 2004-02-12 | 2009-01-21 | 日本電気株式会社 | ファイル記録方法およびファイルシステム |
US7688228B2 (en) * | 2004-07-29 | 2010-03-30 | Hitachi, Ltd. | Map data delivering device, communication terminal, and map delivering method |
JP2006072626A (ja) * | 2004-09-01 | 2006-03-16 | Fuji Xerox Co Ltd | 文書管理装置および方法およびプログラム |
JP2007140973A (ja) * | 2005-11-18 | 2007-06-07 | National Institute Of Information & Communication Technology | ページリランキング装置、ページリランキングプログラム |
JP5235730B2 (ja) * | 2009-03-10 | 2013-07-10 | 日本電信電話株式会社 | 文書検索装置、文書検索方法および文書検索プログラム |
-
2009
- 2009-06-05 JP JP2009136429A patent/JP5286162B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010282495A (ja) | 2010-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5047959B2 (ja) | ユーザインタラクションについての離れに基づく相対的検索結果 | |
US8521717B2 (en) | Propagating information among web pages | |
US8335785B2 (en) | Ranking results for network search query | |
US20080140641A1 (en) | Knowledge and interests based search term ranking for search results validation | |
US20100082637A1 (en) | Web Page and Web Site Importance Estimation Using Aggregate Browsing History | |
JP5379978B2 (ja) | 検索システム及び検索方法 | |
WO2008133368A1 (en) | Information search ranking system and method based on users' attention levels | |
CN102622238A (zh) | 移动设备的界面布局方法及装置 | |
US11392589B2 (en) | Multi-vertical entity-based search system | |
JP4824070B2 (ja) | クリックログを利用して専門検索用クローラのシード選択を行う検索処理装置、検索処理方法及びプログラム | |
US20060149606A1 (en) | System and method for agent assisted information retrieval | |
JP5286162B2 (ja) | 情報検索サーバ、情報検索方法及び情報検索プログラム | |
JP2011154466A (ja) | 検索結果順位付け方法および検索結果順位付けシステム | |
JP5286007B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JPWO2016075832A1 (ja) | ページ自動編集方法、ページ自動編集プログラムおよびページ自動編集装置 | |
JP5072792B2 (ja) | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ | |
JP4477931B2 (ja) | 検索リクエスト装置、検索リクエスト方法、検索リクエストプログラムおよび検索リクエストプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP5386548B2 (ja) | 急上昇ワード抽出装置及び方法 | |
JP5777663B2 (ja) | 検索支援装置及び検索支援プログラム | |
JP5519406B2 (ja) | サーバ装置、ジャンルスコア算出方法およびプログラム | |
JP5147790B2 (ja) | クローラ調整装置及びクローラ調整方法 | |
JP6991265B2 (ja) | コンテンツ収集装置、コンテンツ収集方法およびコンテンツ収集プログラム | |
RU2775824C2 (ru) | Способ и система для определения аномальных посещений веб-сайтов | |
JP2017146924A (ja) | コンテンツ収集装置、コンテンツ収集方法およびコンテンツ収集プログラム | |
JP6696018B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120227 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130603 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5286162 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |