JP2006085563A - 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム - Google Patents
情報処理装置、および情報処理方法、並びにコンピュータ・プログラム Download PDFInfo
- Publication number
- JP2006085563A JP2006085563A JP2004271456A JP2004271456A JP2006085563A JP 2006085563 A JP2006085563 A JP 2006085563A JP 2004271456 A JP2004271456 A JP 2004271456A JP 2004271456 A JP2004271456 A JP 2004271456A JP 2006085563 A JP2006085563 A JP 2006085563A
- Authority
- JP
- Japan
- Prior art keywords
- content
- search
- score
- information
- hit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】 クライアントからの検索要求に基づいて、ヒットコンテンツの情報を取得し、ヒットコンテンツの属するコンテナ(フォルダ、カテゴリ、サイトなど)全体に含まれるヒットコンテンツのスコア分布を計算し、計算されたスコア分布情報を、ヒットコンテンツ情報とともにクライアントに提示する構成とした。本構成により、クライアント側のユーザは、興味のある有効情報が含まれるコンテナを効率的に判定することが可能となり、コンテナ指定の検索などによって目的とするコンテンツを効率的に取得することを可能とした検索システムが実現される。
【選択図】 図1
Description
データ検索処理を実行する情報処理装置であり、
検索条件に従った検索処理を実行し、検索条件に対応するヒットコンテンツの抽出処理を実行する検索部と、
前記検索部の検索結果に基づいて、前記ヒットコンテンツの検索条件適応度としてのコテンツスコアを算出するコンテンツスコア算出部と、
前記コンテンツスコア算出部の算出したコンテンツスコアを、前記ヒットコンテンツの所属集合であるコンテナ単位のスコア分布情報として集計するコンテナ評価部と、
前記コンテナ評価部の集計データであるスコア分布情報を含む検索結果データを表示データとして生成する表示情報生成部と、
を有することを特徴とする情報処理装置にある。
データ検索処理をコンピュータ上で実行させるコンピュータ・プログラムであり、
検索条件に従った検索処理を実行し、検索条件に対応するヒットコンテンツの抽出処理を実行する検索ステップと、
前記検索ステップにおける検索結果に基づいて、前記ヒットコンテンツの検索条件適応度としてのコテンツスコアを算出するコンテンツスコア算出ステップと、
前記コンテンツスコア算出ステップにおいて算出したコンテンツスコアを、前記ヒットコンテンツの所属集合であるコンテナ単位のスコア分布情報として集計するコンテナ評価ステップと、
前記コンテナ評価ステップにおける集計データであるスコア分布情報を含む検索結果データを表示データとして生成する表示情報生成ステップと、
を有することを特徴とするコンピュータ・プログラムにある。
データ検索処理を実行する情報処理方法であり、
検索部において検索条件に従った検索処理を実行し、検索条件に対応するヒットコンテンツの抽出処理を実行する検索ステップと、
コンテンツスコア算出部における処理であり、前記検索ステップにおける検索結果に基づいて、前記ヒットコンテンツの検索条件適応度としてのコテンツスコアを算出するコンテンツスコア算出ステップと、
コンテナ評価部における処理であり、前記コンテンツスコア算出ステップにおいて算出したコンテンツスコアを、前記ヒットコンテンツの所属集合であるコンテナ単位のスコア分布情報として集計するコンテナ評価ステップと、
表示情報生成部における処理であり、前記コンテナ評価ステップにおける集計データであるスコア分布情報を含む検索結果データを表示データとして生成する表示情報生成ステップと、
を有することを特徴とする情報処理方法にある。
(1)キーワードに基づいて、文書ID、日付データ、出現頻度の情報を取得可能としたインデックス1
(2)文書IDに基づいて、文書名、フォルダ名(コンテナ)、更新日付、要約などの書誌情報を取得可能としたインデックス2
これら2つのインデックス情報がある。
N:全文書数
f:キーワード[A]を含むコンテンツ数
としたとき、
idf=log(N/f)
を算出するステップである。
コンテンツスコア=tf×idf
としてコンテンツスコアを算出する。
コンテンツスコア=tf×idf×f(日付)
としてコンテンツスコアを算出する。
1.xxx.doc
2.xxx.xls
3.xxx.ppt
の順番で、スコア順に設定されたコンテンツリストを提示した例を示している。スコアは、前述したように、ユーザの検索式に含まれるキーワードの出現回数、文書の新旧、あるいはアクセス頻度の高低など、検索システムの適用しているロジックに従って決定される。
コンテナ名323は、リストアップされた各ヒットコンテンツの属するコンテナ、例えば、フォルダ、カテゴリ、サイトなどの識別情報である。
高スコア:12コンテンツ
中スコア:44コンテンツ
低スコア:1コンテンツ
であることを示している。
高スコア:12コンテンツ
中スコア:44コンテンツ
低スコア:1コンテンツ
である。
111 検索部
112 インデックス格納部
113 通信部
114 表示情報生成部
115 コンテナ評価部
116 コンテンツスコア算出部
117 記憶部
118 登録部
120 データ管理サーバ
121 通信部
123〜125 データベース
131〜134 クライアント
140 収集サーバ
141 通信部
142 収集部
150 ネットワーク
320 検索結果
321 コンテンツ名
322 要約
323 コンテナ名
324 スコア分布
340 検索結果
341 ヒットコンテンツ表示部
342 コンテナリスト表示部
345 コンテンツ名
346 要約
347 コンテナン名
348 スコア分布
501 CPU(Central Processing Unit)
502 ROM(Read-Only-Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器
Claims (17)
- データ検索処理を実行する情報処理装置であり、
検索条件に従った検索処理を実行し、検索条件に対応するヒットコンテンツの抽出処理を実行する検索部と、
前記検索部の検索結果に基づいて、前記ヒットコンテンツの検索条件適応度としてのコテンツスコアを算出するコンテンツスコア算出部と、
前記コンテンツスコア算出部の算出したコンテンツスコアを、前記ヒットコンテンツの所属集合であるコンテナ単位のスコア分布情報として集計するコンテナ評価部と、
前記コンテナ評価部の集計データであるスコア分布情報を含む検索結果データを表示データとして生成する表示情報生成部と、
を有することを特徴とする情報処理装置。 - 前記コンテンツスコア算出部は、
検索条件として設定された検索キーワードの各ヒットコンテンツにおける出現頻度と、
前記キーワードを含むコンテンツの、全コンテンツ数に対する存在割合の逆数に基づく値として算出するインバース・ドキュメント頻度とをパラメータとして含む算出式を適用してコンテンツスコアを算出する構成であることを特徴とする請求項1に記載の情報処理装置。 - 前記コンテンツスコア算出部は、
検索条件として設定された検索キーワードの各ヒットコンテンツにおける出現頻度と、
前記キーワードを含むコンテンツの、全コンテンツ数に対する存在割合の逆数に基づく値として算出するインバース・ドキュメント頻度と、コンテンツ更新日付の新しいものを大きな値として算出する日付に基づく関数算出値をパラメータとして含む算出式を適用してコンテンツスコアを算出する構成であることを特徴とする請求項1に記載の情報処理装置。 - 前記コンテナ評価部は、
前記ヒットコンテンツの所属集合であるコンテナ単位のスコア分布情報を、n段階(nは整数)に区分した集計情報として生成する構成であることを特徴とする請求項1に記載の情報処理装置。 - 前記コンテナ評価部は、
前記ヒットコンテンツの所属集合であるコンテナ単位のスコア分布情報を、グラフィカルデータとして生成する構成であることを特徴とする請求項1に記載の情報処理装置。 - 前記表示情報生成部は、
ヒットコンテンツのリスト表示部に表示される各コンテンツに対応付けて、前記スコア分布情報を設定した表示情報の生成処理を行なう構成であることを特徴とする請求項1に記載の情報処理装置。 - 前記表示情報生成部は、
ヒットコンテンツのリスト表示部と、前記スコア分布情報の表示部とを区分した表示情報の生成処理を行なう構成であることを特徴とする請求項1に記載の情報処理装置。 - 前記検索部は、
コンテンツに対応するインデックス情報に基づく検索処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。 - データ検索処理をコンピュータ上で実行させるコンピュータ・プログラムであり、
検索条件に従った検索処理を実行し、検索条件に対応するヒットコンテンツの抽出処理を実行する検索ステップと、
前記検索ステップにおける検索結果に基づいて、前記ヒットコンテンツの検索条件適応度としてのコテンツスコアを算出するコンテンツスコア算出ステップと、
前記コンテンツスコア算出ステップにおいて算出したコンテンツスコアを、前記ヒットコンテンツの所属集合であるコンテナ単位のスコア分布情報として集計するコンテナ評価ステップと、
前記コンテナ評価ステップにおける集計データであるスコア分布情報を含む検索結果データを表示データとして生成する表示情報生成ステップと、
を有することを特徴とするコンピュータ・プログラム。 - 前記コンテンツスコア算出ステップは、
検索条件として設定された検索キーワードの各ヒットコンテンツにおける出現頻度と、
前記キーワードを含むコンテンツの、全コンテンツ数に対する存在割合の逆数に基づく値として算出するインバース・ドキュメント頻度とをパラメータとして含む算出式を適用してコンテンツスコアを算出するステップであることを特徴とする請求項9に記載のコンピュータ・プログラム。 - 前記コンテンツスコア算出ステップは、
検索条件として設定された検索キーワードの各ヒットコンテンツにおける出現頻度と、
前記キーワードを含むコンテンツの、全コンテンツ数に対する存在割合の逆数に基づく値として算出するインバース・ドキュメント頻度と、コンテンツ更新日付の新しいものを大きな値として算出する日付に基づく関数算出値をパラメータとして含む算出式を適用してコンテンツスコアを算出するステップであることを特徴とする請求項9に記載のコンピュータ・プログラム。 - 前記コンテナ評価ステップは、
前記ヒットコンテンツの所属集合であるコンテナ単位のスコア分布情報を、n段階(nは整数)に区分した集計情報として生成することを特徴とする請求項9に記載のコンピュータ・プログラム。 - 前記コンテナ評価ステップは、
前記ヒットコンテンツの所属集合であるコンテナ単位のスコア分布情報を、グラフィカルデータとして生成することを特徴とする請求項9に記載のコンピュータ・プログラム。 - 前記表示情報生成ステップは、
ヒットコンテンツのリスト表示部に表示される各コンテンツに対応付けて、前記スコア分布情報を設定した表示情報の生成処理を行なうことを特徴とする請求項9に記載のコンピュータ・プログラム。 - 前記表示情報生成ステップは、
ヒットコンテンツのリスト表示部と、前記スコア分布情報の表示部とを区分した表示情報の生成処理を行なうことを特徴とする請求項9に記載のコンピュータ・プログラム。 - 前記検索ステップは、
コンテンツに対応するインデックス情報に基づく検索処理を実行することを特徴とする請求項9に記載のコンピュータ・プログラム。 - データ検索処理を実行する情報処理方法であり、
検索部において検索条件に従った検索処理を実行し、検索条件に対応するヒットコンテンツの抽出処理を実行する検索ステップと、
コンテンツスコア算出部における処理であり、前記検索ステップにおける検索結果に基づいて、前記ヒットコンテンツの検索条件適応度としてのコテンツスコアを算出するコンテンツスコア算出ステップと、
コンテナ評価部における処理であり、前記コンテンツスコア算出ステップにおいて算出したコンテンツスコアを、前記ヒットコンテンツの所属集合であるコンテナ単位のスコア分布情報として集計するコンテナ評価ステップと、
表示情報生成部における処理であり、前記コンテナ評価ステップにおける集計データであるスコア分布情報を含む検索結果データを表示データとして生成する表示情報生成ステップと、
を有することを特徴とする情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004271456A JP2006085563A (ja) | 2004-09-17 | 2004-09-17 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004271456A JP2006085563A (ja) | 2004-09-17 | 2004-09-17 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006085563A true JP2006085563A (ja) | 2006-03-30 |
Family
ID=36164000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004271456A Pending JP2006085563A (ja) | 2004-09-17 | 2004-09-17 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006085563A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008077163A (ja) * | 2006-09-19 | 2008-04-03 | Fuji Xerox Co Ltd | 検索システム、検索方法及び検索プログラム |
JP2015095180A (ja) * | 2013-11-13 | 2015-05-18 | Kddi株式会社 | 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10288365A (ja) * | 1997-04-16 | 1998-10-27 | Matsushita Seiko Co Ltd | レンジフード |
JPH11338887A (ja) * | 1998-03-23 | 1999-12-10 | Minolta Co Ltd | 検索装置,検索方法およびプログラム記録媒体 |
JP2004164555A (ja) * | 2002-09-17 | 2004-06-10 | Fuji Xerox Co Ltd | 検索装置および方法ならびにそのインデクス構築装置および方法 |
JP2004240996A (ja) * | 1999-03-19 | 2004-08-26 | Hitachi Ltd | 類似文書検索配送方法および装置並びに類似文書検索配送プログラムを格納した記憶媒体 |
-
2004
- 2004-09-17 JP JP2004271456A patent/JP2006085563A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10288365A (ja) * | 1997-04-16 | 1998-10-27 | Matsushita Seiko Co Ltd | レンジフード |
JPH11338887A (ja) * | 1998-03-23 | 1999-12-10 | Minolta Co Ltd | 検索装置,検索方法およびプログラム記録媒体 |
JP2004240996A (ja) * | 1999-03-19 | 2004-08-26 | Hitachi Ltd | 類似文書検索配送方法および装置並びに類似文書検索配送プログラムを格納した記憶媒体 |
JP2004164555A (ja) * | 2002-09-17 | 2004-06-10 | Fuji Xerox Co Ltd | 検索装置および方法ならびにそのインデクス構築装置および方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008077163A (ja) * | 2006-09-19 | 2008-04-03 | Fuji Xerox Co Ltd | 検索システム、検索方法及び検索プログラム |
JP2015095180A (ja) * | 2013-11-13 | 2015-05-18 | Kddi株式会社 | 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4962986B2 (ja) | コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム | |
US7769771B2 (en) | Searching a document using relevance feedback | |
JP3717808B2 (ja) | 情報検索システム | |
US20090089278A1 (en) | Techniques for keyword extraction from urls using statistical analysis | |
US20090287676A1 (en) | Search results with word or phrase index | |
US20110264658A1 (en) | Web object retrieval based on a language model | |
JP2004062446A (ja) | 情報収集システム、アプリケーションサーバ、情報収集方法、およびプログラム | |
KR101818717B1 (ko) | 컨셉 키워드 확장 데이터 셋을 이용한 검색방법, 장치 및 컴퓨터로 판독 가능한 기록매체 | |
JP2004341753A (ja) | 検索支援装置、検索支援方法、およびプログラム | |
JP2005107688A (ja) | 情報表示方法及びシステム及び情報表示プログラム | |
JP5010624B2 (ja) | 検索装置 | |
JP2009122807A (ja) | 連想検索システム | |
JP2007164633A (ja) | コンテンツ検索方法及び装置及びプログラム | |
JP2011203776A (ja) | 類似画像検索装置、方法及びプログラム | |
JP2003173352A (ja) | 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体 | |
JP5321258B2 (ja) | 情報収集システムおよび情報収集方法ならびにそのプログラム | |
JP2011154466A (ja) | 検索結果順位付け方法および検索結果順位付けシステム | |
JP2010123036A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP4189387B2 (ja) | 知識検索システム、知識検索方法及びプログラム | |
KR101818716B1 (ko) | 컨셉 키워드 확장 데이터 셋 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체 | |
JP5518665B2 (ja) | 特許検索装置、特許検索方法、およびプログラム | |
JP2006085563A (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
JP2006185020A (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
JP2007188134A (ja) | 索引ファイルを用いた文書検索の方法 | |
JP2006092023A (ja) | 文書管理用コンピュータプログラムならびに文書管理装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090825 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090916 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100223 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100317 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100608 |