JP2012123647A - 文書特徴量算出装置、文書特徴量算出方法、及び、文書特徴量算出プログラム - Google Patents
文書特徴量算出装置、文書特徴量算出方法、及び、文書特徴量算出プログラム Download PDFInfo
- Publication number
- JP2012123647A JP2012123647A JP2010274267A JP2010274267A JP2012123647A JP 2012123647 A JP2012123647 A JP 2012123647A JP 2010274267 A JP2010274267 A JP 2010274267A JP 2010274267 A JP2010274267 A JP 2010274267A JP 2012123647 A JP2012123647 A JP 2012123647A
- Authority
- JP
- Japan
- Prior art keywords
- document
- feature amount
- information
- amount calculation
- document feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】文書特徴量算出装置100は、文書の特徴を表す文書特徴量として、当該文書に含まれる情報の変化しやすさの程度を表す情報流動度を算出する情報流動度算出部101を備える。これによれば、文書特徴量算出装置100は、情報流動度を文書特徴量として算出する。これにより、文書特徴量算出装置100は、文書が含む情報がユーザにとって重要である程度を高い精度にて表す文書特徴量を算出することができる。
【選択図】図7
Description
文書の特徴を表す文書特徴量として、当該文書に含まれる情報の変化しやすさの程度を表す情報流動度を算出する情報流動度算出手段を備える。
文書の特徴を表す文書特徴量として、当該文書に含まれる情報の変化しやすさの程度を表す情報流動度を算出する方法である。
情報処理装置に、
文書の特徴を表す文書特徴量として、当該文書に含まれる情報の変化しやすさの程度を表す情報流動度を算出する情報流動度算出手段を実現させるためのプログラムである。
(構成)
図1に示したように、第1実施形態に係る文書検索システム1は、端末装置10と、文書検索装置(文書特徴量算出装置)20と、文書レポジトリ30と、を含む。端末装置10、文書検索装置20、及び、文書レポジトリ30は、通信回線(本例では、インターネット)NWを介して、互いに通信可能に接続されている。
図1は、上記のように構成された文書検索システム1の機能を表すブロック図である。
端末装置10の機能は、ユーザインタフェース部11を含む。
その後、文書取得部21は、新たに生成された検索インデックス情報を今回検索インデックス記憶部22に記憶させる。
次に、上述した文書検索システム1の作動について説明する。
文書検索装置20は、図4にフローチャートにより示した文書特徴量算出プログラムを実行するようになっている。
その後、文書検索装置20は、ステップS201へ戻り、ステップS201〜ステップS204の処理を繰り返し実行する。
次に、本発明の第2実施形態に係る文書検索システムについて説明する。第2実施形態に係る文書検索システムは、上記第1実施形態に係る文書検索システムに対して、文書検索装置20が、情報流動度の大きさの順に並べて、文書のリストを出力する点において相違している。従って、以下、かかる相違点を中心として説明する。
第2実施形態に係る抽出条件情報は、文書本文に対する抽出条件を表す情報である。抽出条件は、文書本文に含まれる文字列を定める条件である。
次に、上述した文書検索システム1の作動について説明する。
第2実施形態に係る文書検索装置20は、図4に示した文書特徴量算出プログラムと同一の処理を実行する。
また、第2実施形態に係る文書検索装置20は、図5に示した検索処理プログラムから、ステップS202の処理を除いた処理を実行する。
更に、第2実施形態に係る文書検索装置20は、算出された情報流動度の大きさの順に並べて、文書のリストを出力する。
次に、本発明の第3実施形態に係る文書特徴量算出装置について図7を参照しながら説明する。
第3実施形態に係る文書特徴量算出装置100は、
文書の特徴を表す文書特徴量として、当該文書に含まれる情報の変化しやすさの程度を表す情報流動度を算出する情報流動度算出部(情報流動度算出手段)101を備える。
上記実施形態の一部又は全部は、以下の付記のように記載され得るが、以下には限られない。
文書の特徴を表す文書特徴量として、当該文書に含まれる情報の変化しやすさの程度を表す情報流動度を算出する情報流動度算出手段を備える文書特徴量算出装置。
付記1に記載の文書特徴量算出装置であって、
前記情報流動度算出手段は、前記文書の更新量を複数の時点のそれぞれにて取得し、当該文書に対して取得された更新量の総和が大きくなるほど大きくなる値を前記情報流動度として算出するように構成された文書特徴量算出装置。
付記1又は付記2に記載の文書特徴量算出装置であって、
前記情報流動度算出手段は、前記文書の更新の間隔が長くなるほど大きくなる値を有する更新間隔パラメータを複数の時点のそれぞれにて取得し、当該文書に対して取得された更新間隔パラメータの総和が大きくなるほど小さくなる値を前記情報流動度として算出するように構成された文書特徴量算出装置。
付記3に記載の文書特徴量算出装置であって、
前記情報流動度算出手段は、前記文書に対して、前記更新間隔パラメータを取得する時点と、当該時点において当該文書が最後に更新された時点と、の間の時間に比例した値を、当該更新間隔パラメータとして取得するように構成された文書特徴量算出装置。
付記1乃至付記4のいずれか一項に記載の文書特徴量算出装置であって、
前記情報流動度に対する抽出条件を表す抽出条件情報を受け付ける抽出条件情報受付手段と、
前記算出された情報流動度が、前記受け付けられた抽出条件情報が表す抽出条件を満足する文書を抽出する文書抽出手段と、
を備える文書特徴量算出装置。
付記1乃至付記5のいずれか一項に記載の文書特徴量算出装置であって、
前記算出された情報流動度の大きさの順に並べて、文書のリストを出力する文書リスト出力手段を備える文書特徴量算出装置。
文書の特徴を表す文書特徴量として、当該文書に含まれる情報の変化しやすさの程度を表す情報流動度を算出する、文書特徴量算出方法。
付記7に記載の文書特徴量算出方法であって、
前記文書の更新量を複数の時点のそれぞれにて取得し、当該文書に対して取得された更新量の総和が大きくなるほど大きくなる値を前記情報流動度として算出する、文書特徴量算出方法。
付記7又は付記8に記載の文書特徴量算出方法であって、
前記文書の更新の間隔が長くなるほど大きくなる値を有する更新間隔パラメータを複数の時点のそれぞれにて取得し、当該文書に対して取得された更新間隔パラメータの総和が大きくなるほど小さくなる値を前記情報流動度として算出する、文書特徴量算出方法。
情報処理装置に、
文書の特徴を表す文書特徴量として、当該文書に含まれる情報の変化しやすさの程度を表す情報流動度を算出する情報流動度算出手段を実現させるための文書特徴量算出プログラム。
付記10に記載の文書特徴量算出プログラムであって、
前記情報流動度算出手段は、前記文書の更新量を複数の時点のそれぞれにて取得し、当該文書に対して取得された更新量の総和が大きくなるほど大きくなる値を前記情報流動度として算出するように構成された文書特徴量算出プログラム。
付記10又は付記11に記載の文書特徴量算出プログラムであって、
前記情報流動度算出手段は、前記文書の更新の間隔が長くなるほど大きくなる値を有する更新間隔パラメータを複数の時点のそれぞれにて取得し、当該文書に対して取得された更新間隔パラメータの総和が大きくなるほど小さくなる値を前記情報流動度として算出するように構成された文書特徴量算出プログラム。
10 端末装置
11 ユーザインタフェース部
20 文書検索装置(文書特徴量算出装置)
21 文書取得部
22 今回検索インデックス記憶部
23 前回検索インデックス記憶部
24 情報流動度基礎パラメータ算出部
25 情報流動度基礎パラメータ記憶部
26 検索処理実行部
30 文書レポジトリ
100 文書特徴量算出装置
101 情報流動度算出部
Claims (10)
- 文書の特徴を表す文書特徴量として、当該文書に含まれる情報の変化しやすさの程度を表す情報流動度を算出する情報流動度算出手段を備える文書特徴量算出装置。
- 請求項1に記載の文書特徴量算出装置であって、
前記情報流動度算出手段は、前記文書の更新量を複数の時点のそれぞれにて取得し、当該文書に対して取得された更新量の総和が大きくなるほど大きくなる値を前記情報流動度として算出するように構成された文書特徴量算出装置。 - 請求項1又は請求項2に記載の文書特徴量算出装置であって、
前記情報流動度算出手段は、前記文書の更新の間隔が長くなるほど大きくなる値を有する更新間隔パラメータを複数の時点のそれぞれにて取得し、当該文書に対して取得された更新間隔パラメータの総和が大きくなるほど小さくなる値を前記情報流動度として算出するように構成された文書特徴量算出装置。 - 請求項3に記載の文書特徴量算出装置であって、
前記情報流動度算出手段は、前記文書に対して、前記更新間隔パラメータを取得する時点と、当該時点において当該文書が最後に更新された時点と、の間の時間に比例した値を、当該更新間隔パラメータとして取得するように構成された文書特徴量算出装置。 - 請求項1乃至請求項4のいずれか一項に記載の文書特徴量算出装置であって、
前記情報流動度に対する抽出条件を表す抽出条件情報を受け付ける抽出条件情報受付手段と、
前記算出された情報流動度が、前記受け付けられた抽出条件情報が表す抽出条件を満足する文書を抽出する文書抽出手段と、
を備える文書特徴量算出装置。 - 請求項1乃至請求項5のいずれか一項に記載の文書特徴量算出装置であって、
前記算出された情報流動度の大きさの順に並べて、文書のリストを出力する文書リスト出力手段を備える文書特徴量算出装置。 - 文書の特徴を表す文書特徴量として、当該文書に含まれる情報の変化しやすさの程度を表す情報流動度を算出する、文書特徴量算出方法。
- 請求項7に記載の文書特徴量算出方法であって、
前記文書の更新量を複数の時点のそれぞれにて取得し、当該文書に対して取得された更新量の総和が大きくなるほど大きくなる値を前記情報流動度として算出する、文書特徴量算出方法。 - 請求項7又は請求項8に記載の文書特徴量算出方法であって、
前記文書の更新の間隔が長くなるほど大きくなる値を有する更新間隔パラメータを複数の時点のそれぞれにて取得し、当該文書に対して取得された更新間隔パラメータの総和が大きくなるほど小さくなる値を前記情報流動度として算出する、文書特徴量算出方法。 - 情報処理装置に、
文書の特徴を表す文書特徴量として、当該文書に含まれる情報の変化しやすさの程度を表す情報流動度を算出する情報流動度算出手段を実現させるための文書特徴量算出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010274267A JP5673051B2 (ja) | 2010-12-09 | 2010-12-09 | 文書特徴量算出装置、文書特徴量算出方法、及び、文書特徴量算出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010274267A JP5673051B2 (ja) | 2010-12-09 | 2010-12-09 | 文書特徴量算出装置、文書特徴量算出方法、及び、文書特徴量算出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012123647A true JP2012123647A (ja) | 2012-06-28 |
JP5673051B2 JP5673051B2 (ja) | 2015-02-18 |
Family
ID=46505012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010274267A Active JP5673051B2 (ja) | 2010-12-09 | 2010-12-09 | 文書特徴量算出装置、文書特徴量算出方法、及び、文書特徴量算出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5673051B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004264927A (ja) * | 2003-02-28 | 2004-09-24 | Nippon Telegr & Teleph Corp <Ntt> | Webサイト検索方法と装置、Webサイト検索プログラムおよびこのプログラムを記録した記録媒体 |
US20050071741A1 (en) * | 2003-09-30 | 2005-03-31 | Anurag Acharya | Information retrieval based on historical data |
JP2006215998A (ja) * | 2005-02-07 | 2006-08-17 | Keyence Corp | データ収集システム |
JP2008129645A (ja) * | 2006-11-16 | 2008-06-05 | Canon Inc | 文書管理システム |
-
2010
- 2010-12-09 JP JP2010274267A patent/JP5673051B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004264927A (ja) * | 2003-02-28 | 2004-09-24 | Nippon Telegr & Teleph Corp <Ntt> | Webサイト検索方法と装置、Webサイト検索プログラムおよびこのプログラムを記録した記録媒体 |
US20050071741A1 (en) * | 2003-09-30 | 2005-03-31 | Anurag Acharya | Information retrieval based on historical data |
WO2005033978A1 (en) * | 2003-09-30 | 2005-04-14 | Google Inc. | Information retrieval based on historical data |
JP2007507798A (ja) * | 2003-09-30 | 2007-03-29 | グーグル・インク | ドキュメントをスコア付けするための方法、ドキュメントをランク付けするための方法及びドキュメントをスコア付けするためのシステム |
JP2007128547A (ja) * | 2003-09-30 | 2007-05-24 | Google Inc | ドキュメントをスコア付けする方法 |
JP2006215998A (ja) * | 2005-02-07 | 2006-08-17 | Keyence Corp | データ収集システム |
JP2008129645A (ja) * | 2006-11-16 | 2008-06-05 | Canon Inc | 文書管理システム |
Also Published As
Publication number | Publication date |
---|---|
JP5673051B2 (ja) | 2015-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101283019B1 (ko) | SaaS 어플리케이션 생성 방법 및 이를 실행하는 어플리케이션 생성 서버 | |
JP2013008255A (ja) | 文書類似度算出装置 | |
CN109710571B (zh) | 一种文件解析方法、设备及存储介质 | |
CN110245298A (zh) | 用于推送信息的方法和装置 | |
US20220027404A1 (en) | Determining and utilizing actual purpose of user-assembled collection of electronic content items | |
JP2012178128A (ja) | 広告管理装置、広告選択装置、広告管理方法、広告管理プログラム及び広告管理プログラムを記録した記録媒体 | |
JP2011192103A (ja) | 評価装置、方法及びプログラム | |
JP5673051B2 (ja) | 文書特徴量算出装置、文書特徴量算出方法、及び、文書特徴量算出プログラム | |
JP2012123675A (ja) | システム部品の抽出方法およびシステム | |
JP5537453B2 (ja) | サーバ、及び情報処理方法 | |
CN109271224B (zh) | 用于确定位置的方法和设备 | |
WO2011148408A1 (ja) | 操作支援コンピュータプログラム、操作支援コンピュータシステム | |
JP2011044086A (ja) | 検索装置、検索方法、及びプログラム | |
JP6868062B2 (ja) | 情報を更新するための方法と装置 | |
JP5644558B2 (ja) | 文書関連度算出装置 | |
JP2010015394A (ja) | リンク先提示装置およびコンピュータプログラム | |
JP5636700B2 (ja) | 関連語辞書作成装置、関連語辞書作成方法、プログラム、及び、文書検索システム | |
JP2013054424A (ja) | 表示画面変換装置、表示画面変換システム、表示画面変換方法、およびプログラム | |
JP6075051B2 (ja) | サーバ装置、電子会議システム及びプログラム | |
JP2013210834A (ja) | 特許調査支援装置、特許調査支援方法、およびプログラム | |
JP5752630B2 (ja) | レコメンド情報生成装置およびレコメンド情報生成方法 | |
US20180088970A1 (en) | Mapping of user interfaces within applications | |
JP2018156328A (ja) | 検索支援プログラム、検索支援装置および検索支援方法 | |
JP2012141905A (ja) | 文書検索装置 | |
JP6160427B2 (ja) | 差分抽出システム及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD07 | Notification of extinguishment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7427 Effective date: 20120718 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140430 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140625 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5673051 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |