JP4992973B2 - スコア算出プログラム、スコア算出方法およびスコア算出装置 - Google Patents
スコア算出プログラム、スコア算出方法およびスコア算出装置 Download PDFInfo
- Publication number
- JP4992973B2 JP4992973B2 JP2009520230A JP2009520230A JP4992973B2 JP 4992973 B2 JP4992973 B2 JP 4992973B2 JP 2009520230 A JP2009520230 A JP 2009520230A JP 2009520230 A JP2009520230 A JP 2009520230A JP 4992973 B2 JP4992973 B2 JP 4992973B2
- Authority
- JP
- Japan
- Prior art keywords
- importance
- keyword
- document set
- score
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
11 入力部
12 出力部
13 通信制御部
14 入出力制御I/F部
15 記憶部
15a 履歴記憶部
15b 重要度記憶部
15c 文書集合記憶部
15d スコア記憶部
16 処理部
16a 重要度算出部
16b スコア算出部
20 プロキシサーバ
まず最初に、図1および図2を用いて、実施例1におけるスコア算出装置の主たる特徴を具体的に説明する。図1は、実施例1におけるスコア算出装置の概要を説明するための図であり、図2は、実施例1におけるスコア算出装置の特徴を説明するための図である。
次に、図3〜8を用いて、実施例1におけるスコア算出装置を説明する。図3は、実施例1におけるスコア算出装置の構成を示すブロック図であり、図4は、実施例1における履歴記憶部を説明するための図であり、図5は、実施例1における重要度算出部を説明するための図であり、図6は、実施例1における重要度記憶部を説明するための図であり、図7は、実施例1におけるスコア算出部を説明するための図であり、図8は、実施例1におけるスコア記憶部を説明するための図である。
次に、図9〜11を用いて、実施例1におけるスコア算出装置10による処理を説明する。図9は、実施例1におけるスコア算出装置の出現回数取得処理を説明するための図であり、図10は、実施例1におけるスコア算出装置の重要度算出処理を説明するための図であり、図11は、実施例1におけるスコア算出装置のスコア算出処理を説明するための図である。
図9に示すように、まず、実施例1におけるスコア算出装置10は、設定された所定の期間(例えば、一ヶ月)が経過すると(ステップS901肯定)、通信制御部13を介して、プロキシサーバ20から新規履歴(Pj)を取得する(ステップS902)。例えば、スコア算出装置10は、「2007年の4月1日」において、「2007年の3月1日から3月31日」の間にプロキシサーバ20に格納された新規履歴(m個の履歴)を取得して、履歴記憶部15aに追加更新して格納する。
図10に示すように、まず、実施例1におけるスコア算出装置10は、履歴情報から出現回数が取得されると(ステップS1001肯定)、重要度算出部16aは、引き続き、出現キーワードごとに重要度を算出し(ステップS1002)、処理を終了する。例えば、重要度算出部16aは、図5の(B)に示す数式に従って、出現キーワードごとの重要度を算出する。
図11に示すように、まず、実施例1におけるスコア算出装置10は、重要度算出部16aによって出現キーワードすべてに対して重要度が算出されると(ステップS1101肯定)、スコア算出部16bは、文書集合記憶部15cから「第一文書集合」に含まれる文書「DL、(L=1〜k、k個)」と、重要度記憶部15bから出現キーワード「Wi、(i=1〜n、n個)」を読み込む(ステップS1102)。
上記したように、実施例1によれば、「特定集団:ABC株式会社」に所属する社員(検索者)が社内検索サービスの保持する「第一文書集合」を検索する際に用いた検索キーワードの履歴である第一履歴情報、および、「特定集団:ABC株式会社」に所属する社員(検索者)が社外検索サービスの保持する「第二文書集合;比較文書集合」を検索する際に用いた検索キーワードの履歴である第二履歴情報を用いて、第一履歴情報および第二履歴情報に少なくともいずれかに出現するすべての検索キーワードである出現キーワードそれぞれに対して、第一履歴情報において登場するものほど、および、第二履歴情報において登場しないものほど重要度が高くなるように、「特定集団:ABC株式会社」における重要度を算出し、算出された出現キーワードごとの重要度を用いて、「第一文書集合」を構成する文書ごとに「特定集団:ABC株式会社」におけるスコアを算出するので、対象となる「第一文書集合」以外の文書集合(「第二文書集合;比較文書集合」)を検索した履歴を利用することで、「特定集団:ABC株式会社」が「第一文書集合」に対して特に要望する重要な検索キーワードを抽出して文書のスコア付けを行なうことができ、容易に「特定集団:ABC株式会社」の嗜好に沿った文書検索の結果を提供することが可能となる。すなわち、「特定集団:ABC株式会社」の嗜好に沿ったランキングに基づく検索結果の一覧を、当該特定集団に所属する検索者に表示することが可能となる。
上記の実施例1においては、出現回数の差分情報に基づいて、重要度算出部16aが出現キーワードごとの重要度を算出する場合について説明したが、本発明はこれに限定されるものではなく、「第一文書集合」において出現キーワードを含む文書数と、「第二文書集合:比較文書集合」において当該出現キーワードを含む文書数との差分情報に基づいて、重要度算出部16aが、出現キーワードそれぞれに対して「特定集団:ABC株式会社」における重要度を算出する場合であってもよい。例えば、図3に示す文書集合記憶部15cが、「第一文書集合」を構成する文書に加えて、「第二文書集合」を構成する文書も記憶しており、重要度算出部16aは、「第一文書集合」を構成する文書において「出現キーワード:Wi」を含む文書の数を「CA(Wi)」として算出し、「第二文書集合」を構成する文書において「出現キーワード:Wi」を含む文書の数を「CB(Wi)」として算出し、この「CA(Wi)」と「CB(Wi)」とを、例えば、図5の(B)に示す数式に対して用いることで、「出現キーワード:Wi」の重要度を算出する場合であってもよい。
上記の実施例1において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動でおこなうこともでき(例えば、一定期間ごとにスコアを算出するのではなく、スコア算出装置10の管理者がスコア算出要求を手動で入力して指示するなど)、あるいは、手動的におこなうものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に更新することができる。例えば、図11に示すスコア算出処理において、文書単位で、すべての出現キーワードにおけるスコアを算出するのではなく、出現キーワード単位で、すべての文書におけるスコアを算出してもよい。
ところで上記の実施例1では、ハードウェアロジックによって各種の処理を実現する場合を説明したが、本発明はこれに限定されるものではなく、あらかじめ用意されたプログラムをコンピュータで実行するようにしてもよい。そこで以下では、図12を用いて、上記の実施例1に示したスコア算出装置10と同様の機能を有するスコア算出プログラムを実行するコンピュータの一例を説明する。図12は、実施例1のスコア算出プログラムを実行するコンピュータを示す図である。
Claims (6)
- 検索者から受け付けた検索キーワードに基づいて所定の文書集合から検索された文書それぞれに対してランキングを付与するために、当該所定の文書集合を構成する文書ごとに当該検索者が所属する集団である特定集団における重要性を示すスコアを算出するスコア算出方法をコンピュータに実行させるスコア算出プログラムであって、
前記特定集団に所属する検索者が前記所定の文書集合を検索する際に用いた検索キーワードの履歴である第一履歴情報および/または当該特定集団に所属する検索者が別の文書集合である比較文書集合を検索する際に用いた検索キーワードの履歴である第二履歴情報を記憶する履歴記憶部を参照して、前記第一履歴情報および前記第二履歴情報に少なくともいずれかに出現するすべての検索キーワードである出現キーワードそれぞれに対して、前記第一履歴情報において登場するものほど、および/または、前記第二履歴情報において登場しないものほど重要度が高くなるように、前記特定集団における重要度を算出する重要度算出手順と、
前記重要度算出手順によって算出された前記出現キーワードごとの重要度を用いて、前記所定の文書集合を構成する文書ごとに前記特定集団における前記スコアを算出するスコア算出手順と、
をコンピュータに実行させることを特徴とするスコア算出プログラム。 - 前記重要度算出手順は、前記出現キーワードそれぞれが前記第一履歴情報に出現した回数と前記第二履歴情報に出現した回数との差分情報から、前記出現キーワードそれぞれに対して前記特定集団における重要度を算出することを特徴とする請求項1に記載のスコア算出プログラム。
- 前記重要度算出手順は、前記所定の文書集合において前記出現キーワードを含む文書数と、前記比較文書集合において当該出現キーワードを含む文書数との差分情報から、前記出現キーワードそれぞれに対して前記特定集団における重要度を算出することを特徴とする請求項1に記載のスコア算出プログラム。
- 前記スコア算出手順は、前記出現キーワードごとに前記所定の文書集合を検索し、前記出現キーワードを含む文書において、当該出現キーワードの周辺に存在する前記出現キーワードである周辺存在キーワードを収集し、前記重要度算出手順によって算出された当該出現キーワードの重要度と前記周辺存在キーワードの重要度から当該文書の前記特定集団におけるスコアを算出することを特徴とする請求項1〜3のいずれか一つに記載のスコア算出プログラム。
- 検索者から受け付けた検索キーワードに基づいて所定の文書集合から検索された文書それぞれに対してランキングを付与するために、当該所定の文書集合を構成する文書ごとに当該検索者が所属する集団である特定集団における重要性を示すスコアを算出するスコア算出方法であって、
コンピュータが、
前記特定集団に所属する検索者が前記所定の文書集合を検索する際に用いた検索キーワードの履歴である第一履歴情報および/または当該特定集団に所属する検索者が別の文書集合である比較文書集合を検索する際に用いた検索キーワードの履歴である第二履歴情報を記憶する履歴記憶部を参照して、前記第一履歴情報および前記第二履歴情報に少なくともいずれかに出現するすべての検索キーワードである出現キーワードそれぞれに対して、前記第一履歴情報において登場するものほど、および/または、前記第二履歴情報において登場しないものほど重要度が高くなるように、前記特定集団における重要度を算出する重要度算出工程と、
前記重要度算出工程によって算出された前記出現キーワードごとの重要度を用いて、前記所定の文書集合を構成する文書ごとに前記特定集団における前記スコアを算出するスコア算出工程と、
を含んだことを特徴とするスコア算出方法。 - 検索者から受け付けた検索キーワードに基づいて所定の文書集合から検索された文書それぞれに対してランキングを付与するために、当該所定の文書集合を構成する文書ごとに当該検索者が所属する集団である特定集団における重要性を示すスコアを算出するスコア算出装置であって、
前記特定集団に所属する検索者が前記所定の文書集合を検索する際に用いた検索キーワードの履歴である第一履歴情報および/または当該特定集団に所属する検索者が別の文書集合である比較文書集合を検索する際に用いた検索キーワードの履歴である第二履歴情報を用いて、前記第一履歴情報および前記第二履歴情報に少なくともいずれかに出現するすべての検索キーワードである出現キーワードそれぞれに対して、前記第一履歴情報において登場するものほど、および/または、前記第二履歴情報において登場しないものほど重要度が高くなるように、前記特定集団における重要度を算出する重要度算出手段と、
前記重要度算出手段によって算出された前記出現キーワードごとの重要度を用いて、前記所定の文書集合を構成する文書ごとに前記特定集団における前記スコアを算出するスコア算出手段と、
を備えたことを特徴とするスコア算出装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2007/062693 WO2009001428A1 (ja) | 2007-06-25 | 2007-06-25 | スコア算出プログラム、スコア算出方法およびスコア算出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009001428A1 JPWO2009001428A1 (ja) | 2010-08-26 |
JP4992973B2 true JP4992973B2 (ja) | 2012-08-08 |
Family
ID=40185262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009520230A Expired - Fee Related JP4992973B2 (ja) | 2007-06-25 | 2007-06-25 | スコア算出プログラム、スコア算出方法およびスコア算出装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4992973B2 (ja) |
WO (1) | WO2009001428A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001306612A (ja) * | 2000-04-26 | 2001-11-02 | Sharp Corp | 情報提供装置、情報提供方法およびその方法を実現するプログラムを記録した機械読取可能な記録媒体 |
JP2005293149A (ja) * | 2004-03-31 | 2005-10-20 | Kddi Corp | プロファイル更新装置及びコンピュータプログラム |
JP2005536814A (ja) * | 2002-08-30 | 2005-12-02 | ソニー インターナショナル (ヨーロッパ) ゲゼルシャフト ミット ベシュレンクテル ハフツング | ユーザプロファイルの作成方法、及び、ユーザの次の選択に対する提案を特定する方法 |
WO2009048130A1 (ja) * | 2007-10-12 | 2009-04-16 | Nec Corporation | 文書重要度算出システム、文書重要度算出方法およびプログラム |
JP2009122940A (ja) * | 2007-11-14 | 2009-06-04 | Nec Corp | 文書関連度算出システム、文書関連度算出方法および文書関連度算出プログラム |
-
2007
- 2007-06-25 WO PCT/JP2007/062693 patent/WO2009001428A1/ja active Application Filing
- 2007-06-25 JP JP2009520230A patent/JP4992973B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001306612A (ja) * | 2000-04-26 | 2001-11-02 | Sharp Corp | 情報提供装置、情報提供方法およびその方法を実現するプログラムを記録した機械読取可能な記録媒体 |
JP2005536814A (ja) * | 2002-08-30 | 2005-12-02 | ソニー インターナショナル (ヨーロッパ) ゲゼルシャフト ミット ベシュレンクテル ハフツング | ユーザプロファイルの作成方法、及び、ユーザの次の選択に対する提案を特定する方法 |
JP2005293149A (ja) * | 2004-03-31 | 2005-10-20 | Kddi Corp | プロファイル更新装置及びコンピュータプログラム |
WO2009048130A1 (ja) * | 2007-10-12 | 2009-04-16 | Nec Corporation | 文書重要度算出システム、文書重要度算出方法およびプログラム |
JP2009122940A (ja) * | 2007-11-14 | 2009-06-04 | Nec Corp | 文書関連度算出システム、文書関連度算出方法および文書関連度算出プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2009001428A1 (ja) | 2008-12-31 |
JPWO2009001428A1 (ja) | 2010-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4638439B2 (ja) | ウェブ検索の個人化 | |
US7636714B1 (en) | Determining query term synonyms within query context | |
KR100645608B1 (ko) | 사용자 방문 유알엘 로그를 이용한 정보 검색 서비스 제공 서버 및 그 방법 | |
CN102722498B (zh) | 搜索引擎及其实现方法 | |
US20100241647A1 (en) | Context-Aware Query Recommendations | |
CN102722501B (zh) | 搜索引擎及其实现方法 | |
JP5084858B2 (ja) | サマリ作成装置、サマリ作成方法及びプログラム | |
WO2007078768A1 (en) | Providing predicted search queries and predictive search results | |
CN103488681A (zh) | 斜线标签 | |
CN102722499B (zh) | 搜索引擎及其实现方法 | |
JP2010129061A (ja) | インデックス生成システム、情報検索システム、及びインデックス生成方法 | |
JP5504595B2 (ja) | 情報処理装置、情報検索システム、情報処理方法およびプログラム | |
CN105550206B (zh) | 结构化查询语句的版本控制方法及装置 | |
JP2007256992A (ja) | コンテンツ特定方法及び装置 | |
JP2009122807A (ja) | 連想検索システム | |
JP2010055155A (ja) | サーバ装置、情報処理方法およびプログラム | |
JP2008299842A (ja) | 広告執行による反応情報提供方法、コンピュータ読み取り可能な記録媒体、広告執行による反応情報提供システム | |
JP2007128367A (ja) | 情報検索ノウハウ管理システム | |
JP5639549B2 (ja) | 情報検索装置及び方法及びプログラム | |
JP5321258B2 (ja) | 情報収集システムおよび情報収集方法ならびにそのプログラム | |
KR100975510B1 (ko) | 웹 페이지 색인 업데이트 방법 및 시스템 | |
JP4992973B2 (ja) | スコア算出プログラム、スコア算出方法およびスコア算出装置 | |
JP5613536B2 (ja) | 利用者の要求に応じて動的にもっとも適したイメージを抽出して提供するための方法、システム及びコンピューター判読可能な記録媒体 | |
JP5777663B2 (ja) | 検索支援装置及び検索支援プログラム | |
JP2010072909A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120131 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120410 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120423 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |