JP4173857B2 - 情報フィルタリング装置および情報フィルタリング方法 - Google Patents
情報フィルタリング装置および情報フィルタリング方法 Download PDFInfo
- Publication number
- JP4173857B2 JP4173857B2 JP2004381478A JP2004381478A JP4173857B2 JP 4173857 B2 JP4173857 B2 JP 4173857B2 JP 2004381478 A JP2004381478 A JP 2004381478A JP 2004381478 A JP2004381478 A JP 2004381478A JP 4173857 B2 JP4173857 B2 JP 4173857B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- information
- filtering
- similarity
- page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、この発明の第1の実施形態について説明する。図1に本実施形態の情報フィルタリングシステムの機器構成を示す。図1に示したように、本実施形態の情報フィルタリングシステムは、オペレーティングシステムやユーティリティを含む各種アプリケーションプログラム(フィルタリング処理を行なう各種プログラムもこれらに含まれる)を実行制御するCPU1、アプリケーションプログラムや各種データを格納する記憶装置2、および他の計算機からデータを読み込むための回線入出力装置3からなる。なお、この発明は、ソフトウェアとしての実施も可能であり、フロッピィディスクやCD−ROMなどに格納した形態で提供したり、磁気ディスクなどに格納しておいてネットワークで入手可能な形態で提供することが可能である。
次に、第2の実施形態を説明する。前述した第1の実施形態では、監視するページをすべて事前に登録しておく形態について説明した。しかしながら、Webページは、ハイパーテキストにより階層構造を形成することが可能であるため、単一のページだけを登録する形態では問題が生じる場合がある。
次に、第3の実施形態を説明する。本実施形態では、他の情報フィルタリング装置が出力する結果とのマージ機能を持つシステムについて説明する。第1および第2の実施形態では、フィルタリング対象とするページが、HTTP手順にしたがって取り込めることを前提としている。一方、利用者が入手したい情報にはWebページとして公開されていない情報も存在する。
Claims (3)
- 予め登録されたフィルタリング条件と文書中に含まれる情報との間の類似度を算出し、その算出した類似度にしたがって複数の文書の中から所定の文書を選出する情報フィルタリング装置であって、階層構造をなすHTML形式の文書をフィルタリング対象の文書に含む情報フィルタリング装置において、
新たな情報が発生したか否か監視すべき文書のアドレスを設定する第1の設定手段と、
前記第1の設定手段によって設定された文書を起点に下位層に位置する文書に対する監視すべき階層数を前記第1の設定手段により設定されたアドレス毎に設定する第2の設定手段と、
前記第1の設定手段によって設定されたアドレスから前記第2の設定手段によって設定された階層数を対象範囲として文書を読み込み、その範囲内に新たな情報が発生したか否か判定する第1の判定手段と、
前記第1の判定手段により新たな情報が発生したと判定された文書について、その文書中の箇条書きフィールドの各項目の地の文の平均長および標準偏差を求め、この求めた平均長および標準偏差を予め定められた値と比較して、前記文書が複数の情報単位を含むか否か判定する第2の判定手段と、
前記第2の判定手段によって複数の情報単位を含むと判定された文書を情報単位ごとに分割する分割手段と、
前記分割手段によって分割された情報単位それぞれに、前記フィルタリング条件との間の類似度を算出する類似度算出手段と、
を具備してなることを特徴とする情報フィルタリング装置。 - 予め登録されたフィルタリング条件と文書中に含まれる情報との間の類似度を算出し、その算出した類似度にしたがって複数の文書の中から所定の文書を選出する情報フィルタリング装置であって、階層構造をなすHTML形式の文書をフィルタリング対象の文書に含む情報フィルタリング装置の情報フィルタリング方法において、
前記情報フィルタリング装置は、
新たな情報が発生したか否か監視すべき文書のアドレスを設定し、
この設定された文書を起点に下位層に位置する文書に対する監視すべき階層数を前記設定されたアドレス毎に設定し、
前記設定されたアドレスから前記設定された階層数を対象範囲として文書を読み込み、その範囲内に新たな情報が発生したか否か判定し、
新たな情報が発生したと判定された文書について、その文書中の箇条書きフィールドの各項目の地の文の平均長および標準偏差を求め、この求めた平均長および標準偏差を予め定められた値と比較して、前記文書が複数の情報単位を含むか否か判定し、
複数の情報単位を含むと判定された文書を情報単位ごとに分割し、
この分割された情報単位それぞれに、前記フィルタリング条件との間の類似度を算出する、
ことを特徴とする情報フィルタリング方法。 - 予め登録されたフィルタリング条件と文書中に含まれる情報との間の類似度を算出し、その算出した類似度にしたがって複数の文書の中から所定の文書を選出する処理であって、階層構造をなすHTML形式の文書をフィルタリング対象の文書に含む処理をコンピュータに実行させるためのプログラムであって、
新たな情報が発生したか否か監視すべき文書のアドレスを設定し、
この設定された文書を起点に下位層に位置する文書に対する監視すべき階層数を前記設定されたアドレス毎に設定し、
前記設定されたアドレスから前記設定された階層数を対象範囲として文書を読み込み、その範囲内に新たな情報が発生したか否か判定し、
新たな情報が発生したと判定された文書について、その文書中の箇条書きフィールドの各項目の地の文の平均長および標準偏差を求め、この求めた平均長および標準偏差を予め定められた値と比較して、前記文書が複数の情報単位を含むか否か判定し、
複数の情報単位を含むと判定された文書を情報単位ごとに分割し、
この分割された情報単位それぞれに、前記フィルタリング条件との間の類似度を算出する、
ようにコンピュータを動作させるプログラムを記録したコンピュータ読み込み可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004381478A JP4173857B2 (ja) | 1996-09-13 | 2004-12-28 | 情報フィルタリング装置および情報フィルタリング方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24378596 | 1996-09-13 | ||
JP2004381478A JP4173857B2 (ja) | 1996-09-13 | 2004-12-28 | 情報フィルタリング装置および情報フィルタリング方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24910097A Division JP3683687B2 (ja) | 1996-09-13 | 1997-09-12 | 情報フィルタリング装置および情報フィルタリング方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005174358A JP2005174358A (ja) | 2005-06-30 |
JP4173857B2 true JP4173857B2 (ja) | 2008-10-29 |
Family
ID=34740838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004381478A Expired - Fee Related JP4173857B2 (ja) | 1996-09-13 | 2004-12-28 | 情報フィルタリング装置および情報フィルタリング方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4173857B2 (ja) |
-
2004
- 2004-12-28 JP JP2004381478A patent/JP4173857B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005174358A (ja) | 2005-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7496581B2 (en) | Information search system, information search method, HTML document structure analyzing method, and program product | |
JP3655714B2 (ja) | 情報フィルタリング装置及び記録媒体 | |
JP2005122295A (ja) | 関係図作成プログラム、関係図作成方法、および関係図作成装置 | |
JP2003114906A (ja) | ユーザ定義可能なパーソナリティを備えたメタ文書管理システム | |
CN110633264B (zh) | 应用专利数据库的研发辅助系统及其方法 | |
JPWO2009096523A1 (ja) | 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム | |
CN108520007B (zh) | 万维网网页信息提取方法、存储介质及计算机设备 | |
JP7171100B1 (ja) | 特許文書作成支援装置、特許文書作成支援方法、特許文書作成支援プログラム。 | |
TW201804345A (zh) | 基於結構化網路知識的自動中文本體庫建構方法、系統及電腦可讀媒體 | |
JP3683687B2 (ja) | 情報フィルタリング装置および情報フィルタリング方法 | |
KR20020075359A (ko) | 디지털 소스로부터 정보를 포착하고 관리하기 위한 시스템및 방법 | |
JP3832693B2 (ja) | 構造化文書検索表示方法及び装置 | |
JP2003271609A (ja) | 情報監視装置及び情報監視方法 | |
CN114117242A (zh) | 数据查询方法和装置、计算机设备、存储介质 | |
JP4883644B2 (ja) | リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法 | |
JP2007011973A (ja) | 情報検索装置及び情報検索プログラム | |
JP4173857B2 (ja) | 情報フィルタリング装置および情報フィルタリング方法 | |
JP2007188427A (ja) | 話題画像選出方法及び装置及プログラム | |
CN109388665B (zh) | 作者关系在线挖掘方法及系统 | |
JP4417497B2 (ja) | 情報検索装置及びプログラムを記憶した記憶媒体 | |
JP3943005B2 (ja) | 情報検索プログラム | |
Tsapatsoulis | Web image indexing using WICE and a learning-free language model | |
US8122039B2 (en) | Apparatus for multimedia integrated retrieval and storage medium storing a multimedia integrated retrieval program | |
JP2005316590A (ja) | 情報検索装置 | |
JP2008269106A (ja) | スキーマ抽出方法、情報処理装置、コンピュータプログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080205 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080404 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080507 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080704 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080729 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080814 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110822 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |