JP5125161B2 - Web情報収集装置、Web情報収集方法、Web情報収集プログラム - Google Patents
Web情報収集装置、Web情報収集方法、Web情報収集プログラム Download PDFInfo
- Publication number
- JP5125161B2 JP5125161B2 JP2007067837A JP2007067837A JP5125161B2 JP 5125161 B2 JP5125161 B2 JP 5125161B2 JP 2007067837 A JP2007067837 A JP 2007067837A JP 2007067837 A JP2007067837 A JP 2007067837A JP 5125161 B2 JP5125161 B2 JP 5125161B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- web
- web information
- meta
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 46
- 230000002776 aggregation Effects 0.000 claims description 56
- 238000003860 storage Methods 0.000 claims description 53
- 238000004220 aggregation Methods 0.000 claims description 38
- 238000004458 analytical method Methods 0.000 claims description 35
- 230000004931 aggregating effect Effects 0.000 claims description 31
- 230000004044 response Effects 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000000354 decomposition reaction Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 230000002860 competitive effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
さらに、そのWeb情報集約装置(1)において、前記属性特性ルールは、異なる属性間の制約条件を示すものであることが好ましい。
(a)Web情報と前記Web情報に付随するメタ情報とを収集するステップと、
(b)収集された前記メタ情報に基づいて前記Web情報が対象に関連する情報であるか否かを判断するステップとを具備し、前記(b)ステップが、
前記メタ情報に基づいて特定した前記Web情報の属性と前記語彙集合リストとを照合し、前記語彙集合リストに前記属性に合致する語彙集合が含まれるときに、前記属性と前記属性特性ルールとを照合し、前記属性が前記属性特性ルールに合致する場合、前記メタ情報に対応する前記Web情報が、前記対象に関連する情報であると判断するステップを含む方法によってコンピュータをWeb情報集約装置(1)として機能させることが好ましい。
(c)Web情報を公開しているWebサイトからRSS(Rich Site Summary)データを収集するステップと、
(d)前記RSSデータから、個々のWeb情報のメタ情報を抽出するステップとを具備し、前記(c)ステップは、
前記Webサイトにアクセスして、前記Webサイトから収集したRSSデータを供給するステップを含み、
前記(d)ステップは、
前記RSSデータを個々のWeb情報とメタ情報とに分解して得られた前記メタ情報を前記情報収集部(2)供給するステップと、その分解によって得られた前記Web情報を前記情報判定部(3)に供給するステップを含む方法によってコンピュータをWeb情報集約装置(1)として機能させるWeb情報集約プログラムであっても良い。
(e)Web情報の検索要求に対し、前記Web情報を取得して検索要求の送信元に供給するステップを具備し、前記(b)ステップは、
前記Web情報が、前記対象に関連する情報であると判断したときに、前記Web情報とメタ情報へのリンク情報をメタメタ情報として作成するステップを含み、
前記(e)ステップは、
前記Web情報の検索要求に対し、前記検索要求に合致するメタメタ情報のリンク情報に基づいて、前記Web情報を取得して検索要求の送信元に供給する方法によってコンピュータをWeb情報集約装置(1)として機能させるWeb情報集約プログラムであることが好ましい。
(a)Web情報と前記Web情報に付随するメタ情報とを収集するステップと、
(b)収集された前記メタ情報に基づいて前記Web情報が対象に関連する情報であるか否かを判断するステップとを具備し、
前記(b)ステップが、
前記メタ情報に基づいて特定した前記Web情報の属性と、語彙集合リスト保管部(4)から読み出した語彙集合リストとを照合するステップと、
前記語彙集合リストに前記属性に合致する語彙集合が含まれるときに、前記属性と属性特性ルール保管部(5)から読み出した属性特性ルールとを照合するステップと、
前記属性が前記属性特性ルールに合致する場合、前記メタ情報に対応する前記Web情報が、前記対象に関連する情報であると判断するステップ
を含むWeb情報集約方法であることが好ましい。
(c)Web情報を公開しているWebサイトからRSS(Rich Site Summary)データを収集するステップと、
(d)前記RSSデータから、個々のWeb情報のメタ情報を抽出するステップとを具備し、前記(c)ステップは、
前記Webサイトにアクセスして、前記Webサイトから収集したRSSデータを供給するステップを含み、
前記(d)ステップは、
前記RSSデータを個々のWeb情報とメタ情報とに分解して得られた前記メタ情報を前記情報収集部(2)供給するステップと、
その分解によって得られた前記Web情報を前記情報判定部(3)に供給するステップ
を含むWeb情報集約方法であっても良い。
また、そのWeb情報集約方法において、前記属性特性ルールが、異なる属性間の制約条件を示すことが好ましい。
(e)Web情報の検索要求に対し、前記Web情報を取得して検索要求の送信元に供給するステップを具備していても良い。この場合において、
前記(b)ステップは、
前記Web情報が、前記対象に関連する情報であると判断したときに、前記Web情報とメタ情報へのリンク情報をメタメタ情報として作成するステップを含み、
前記(e)ステップは、
前記Web情報の検索要求に対し、前記検索要求に合致するメタメタ情報のリンク情報に基づいて、前記Web情報を取得して検索要求の送信元に供給することが好ましい。
以下に、図面を参照して本発明を実施するための形態について説明する。図1は、本発明における、第1実施形態のWeb情報集約装置1の構成を例示するブロック図である。本実施形態のWeb情報集約装置1は、インターネット上に公開されるWeb情報から、ある製品のライフサイクルに関連する情報を取得するために、Web情報の属性(テーマや作成時刻など)を示すメタ情報を利用し、Web情報収集の判断に用いている。図1を参照すると、Web情報集約装置1は、情報収集部2と、情報判定部3と、語彙集合リスト保管部4と、属性特性ルール保管部5と、情報保管部6と、情報検索部7とを含んで構成されている。また、情報保管部6は、Web情報を保持するWeb情報保管部11と、メタ情報を保持するメタ情報保管部12と、メタメタ情報を保持するメタメタ情報保管部13とを含んで構成されている。
以下に、本発明の第2実施形態について説明を行う。図12は、第2実施形態のWeb情報集約装置1の構成を例示するブロック図である。第2実施形態のWeb情報集約装置1は、第1実施形態のWeb情報集約装置1の構成に、さらに、RSS情報収集部14とRSS情報解析部15とを含んでいる。RSS情報収集部14は、RSSデータが公開されているWebサイトのURLのリストを保管している。RSSデータは、あるWebサイトで公開される複数のWeb情報の要約として、Webサイト毎に公開されている。RSS情報収集部14は、保管しているURLに示されるWebサイトにアクセスし、そのWebサイトから収集したRSSデータを格納する。RSS情報解析部15は、RSS情報収集部14が保管しているRSSデータから、個々のWeb情報のメタ情報に分解する。
2…情報収集部
3…情報判定部
4…語彙集合リスト保管部
5…属性特性ルール保管部
6…情報保管部
7…情報検索部
11…Web情報保管部
12…メタ情報保管部
13…メタメタ情報保管部
14…RSS情報収集部
15…RSS情報解析部
21…語彙集合リストテーブル
22…属性特性ルールテーブル
Claims (15)
- 語彙集合リストを保持する語彙集合リスト保管部と、
属性特性ルールを保持する属性特性ルール保管部と、
Web情報と前記Web情報に付随するメタ情報とを収集する情報収集部と、
収集された前記メタ情報に基づいて前記Web情報が対象に関連する情報であるか否かを判断する情報判定部と
を具備し、
前記情報判定部は、
前記メタ情報に基づいて特定した前記Web情報の属性と前記語彙集合リストとを照合し、前記語彙集合リストに前記属性に合致する語彙集合が含まれるときに、前記属性と前記属性特性ルールとを照合し、前記属性が前記属性特性ルールに合致する場合、前記メタ情報に対応する前記Web情報が、前記対象に関連する情報であると判断し、前記語彙集合リストと合致した属性と属性値、前記属性特性ルール、前記Web情報へのリンク情報および前記メタ情報へのリンク情報を含む再構造化情報を作成する
Web情報集約装置。 - 請求項1に記載のWeb情報集約装置において、さらに、
Web情報を公開しているWebサイトからRSSデータを収集するRSS(Rich Site Summary)情報取得部と、
前記RSSデータから、個々のWeb情報のメタ情報を抽出するRSS情報解析部と
を備え、
前記RSS情報取得部は、
前記Webサイトにアクセスして、前記Webサイトから収集したRSSデータを前記RSS情報解析部に供給し、
前記RSS情報解析部は、
前記RSSデータを個々のWeb情報とメタ情報とに分解して得られた前記メタ情報を前記情報収集部に供給し、その分解によって得られた前記Web情報を情報判定部に供給する
Web情報集約装置。 - 請求項1または2に記載のWeb情報集約装置において、
前記語彙集合リストは、複数の語彙集合を含み、
前記複数の語彙集合のそれぞれは、
メタ情報に含まれる前記属性を示す文字列で、意味が同一、かつ、表記法が異なる文字列を一つのカテゴリとして集約した集合である
Web情報集約装置。 - 請求項1乃至3のいずれかに記載のWeb情報集約装置において、
前記属性特性ルールは、異なる属性間の制約条件を示す
Web情報集約装置。 - 請求項1乃至4のいずれかに記載のWeb情報集約装置において、
前記Web情報の検索要求に対し、前記検索要求に合致する前記再構造化情報に含まれるリンク情報に基づいて、前記Web情報を取得して前記検索要求の送信元に供給する情報検索部をさらに備える
Web情報集約装置。 - 語彙集合リストを保持する語彙集合リスト保管部と属性特性ルールを保持する属性特性ルール保管部とを具備するコンピュータをWeb情報集約装置として機能させるための手順を示すWeb情報集約プログラムであって、
(a)Web情報と前記Web情報に付随するメタ情報とを収集するステップと、
(b)収集された前記メタ情報に基づいて前記Web情報が対象に関連する情報であるか否かを判断するステップと
を具備し、
前記(b)ステップが、
前記メタ情報に基づいて特定した前記Web情報の属性と前記語彙集合リストとを照合し、前記語彙集合リストに前記属性に合致する語彙集合が含まれるときに、前記属性と前記属性特性ルールとを照合し、前記属性が前記属性特性ルールに合致する場合、前記メタ情報に対応する前記Web情報が、前記対象に関連する情報であると判断し、前記語彙集合リストと合致した属性と属性値、前記属性特性ルール、前記Web情報へのリンク情報およびメタ情報へのリンク情報を含む再構造化情報を作成するステップ
を含む方法によってコンピュータをWeb情報集約装置として機能させる
Web情報集約プログラム。 - 請求項6に記載のWeb情報集約プログラムにおいて、さらに、
(c)Web情報を公開しているWebサイトからRSS(Rich Site Summary)データを収集するステップと、
(d)前記RSSデータから、個々のWeb情報のメタ情報を抽出するステップと
を具備し、
前記(c)ステップは、
前記Webサイトにアクセスして、前記Webサイトから収集したRSSデータを供給するステップを含み、
前記(d)ステップは、
前記RSSデータを個々のWeb情報とメタ情報とに分解して得られた前記メタ情報を前記情報収集部に供給するステップと、
その分解によって得られた前記Web情報を前記情報判定部に供給するステップ
を含む
方法によってコンピュータをWeb情報集約装置として機能させる
Web情報集約プログラム。 - 請求項6または7に記載のWeb情報集約プログラムにおいて、
前記語彙集合リストは、複数の語彙集合を含み、
前記複数の語彙集合のそれぞれは、
メタ情報に含まれる前記属性を示す文字列で、意味が同一、かつ、表記法が異なる文字列を一つのカテゴリとして集約した集合であるときに、
コンピュータをWeb情報集約装置として機能させる
Web情報集約プログラム。 - 請求項6乃至8のいずれかに記載のWeb情報集約プログラムにおいて、
前記属性特性ルールは、異なる属性間の制約条件を示すときに
コンピュータをWeb情報集約装置として機能させる
Web情報集約プログラム。 - 請求項6乃至9のいずれかに記載のWeb情報集約プログラムにおいて、さらに、
(e)Web情報の検索要求に対し、前記検索要求に合致する前記再構造化情報に含まれるリンク情報に基づいて、前記Web情報を取得して前記検索要求の送信元に供給するステップ
を具備する方法によってコンピュータをWeb情報集約装置として機能させる
Web情報集約プログラム。 - 情報収集部と情報判定部とを備えるWeb情報集約装置でWeb情報を集約するWeb情報集約方法において、
(a)前記情報収集部が、Web情報と前記Web情報に付随するメタ情報とを収集するステップと、
(b)前記情報判定部が、収集された前記メタ情報に基づいて前記Web情報が対象に関連する情報であるか否かを判断するステップと
を具備し、
前記(b)ステップが、
前記メタ情報に基づいて特定した前記Web情報の属性と、語彙集合リスト保管部から読み出した語彙集合リストとを照合するステップと、
前記語彙集合リストに前記属性に合致する語彙集合が含まれるときに、前記属性と属性特性ルール保管部から読み出した属性特性ルールとを照合するステップと、
前記属性が前記属性特性ルールに合致する場合、前記メタ情報に対応する前記Web情報が、前記対象に関連する情報であると判断し、前記語彙集合リストと合致した属性と属性値、前記属性特性ルール、前記Web情報へのリンク情報およびメタ情報へのリンク情報を含む再構造化情報を作成するステップ
を含むWeb情報集約方法。 - 請求項11に記載のWeb情報集約方法において、前記Web情報集約装置が、RSS(Rich Site Summary)情報取得部とRSS情報解析部をさらに備え、
(c)前記RSS情報取得部が、Web情報を公開しているWebサイトからRSSデータを収集するステップと、
(d)前記RSS情報解析部が、前記RSSデータから、個々のWeb情報のメタ情報を抽出するステップと
を具備し、
前記(c)ステップは、
前記Webサイトにアクセスして、前記Webサイトから収集したRSSデータを供給するステップを含み、
前記(d)ステップは、
前記RSSデータを個々のWeb情報とメタ情報とに分解して得られた前記メタ情報を前記情報収集部に供給するステップと、
その分解によって得られた前記Web情報を前記情報判定部に供給するステップ
を含む
Web情報集約方法。 - 請求項11または12に記載のWeb情報集約方法において、
前記語彙集合リストは、複数の語彙集合を含み、
前記複数の語彙集合のそれぞれが、メタ情報に含まれる前記属性を示す文字列で、意味が同一、かつ、表記法が異なる文字列を一つのカテゴリとして集約した集合である
Web情報集約方法。 - 請求項11乃至13のいずれかに記載のWeb情報集約方法において、
前記属性特性ルールが、異なる属性間の制約条件を示す
Web情報集約方法。 - 請求項11乃至14のいずれかに記載のWeb情報集約方法において、さらに、
(e)前記Web情報集約装置が、Web情報の検索要求に対し、前記検索要求に合致する前記再構造化情報に含まれるリンク情報に基づいて、前記Web情報を取得して検索要求の送信元に供給するステップ
を具備する
Web情報集約方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007067837A JP5125161B2 (ja) | 2007-03-16 | 2007-03-16 | Web情報収集装置、Web情報収集方法、Web情報収集プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007067837A JP5125161B2 (ja) | 2007-03-16 | 2007-03-16 | Web情報収集装置、Web情報収集方法、Web情報収集プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008226204A JP2008226204A (ja) | 2008-09-25 |
JP5125161B2 true JP5125161B2 (ja) | 2013-01-23 |
Family
ID=39844679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007067837A Expired - Fee Related JP5125161B2 (ja) | 2007-03-16 | 2007-03-16 | Web情報収集装置、Web情報収集方法、Web情報収集プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5125161B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4725627B2 (ja) * | 2008-10-02 | 2011-07-13 | ブラザー工業株式会社 | 通信装置 |
JP4702434B2 (ja) | 2008-11-14 | 2011-06-15 | ブラザー工業株式会社 | 通信装置および制御プログラム |
US9020959B2 (en) * | 2009-12-07 | 2015-04-28 | International Business Machines Corporation | Contextual support for publish-subscribe systems |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4721740B2 (ja) * | 2005-03-23 | 2011-07-13 | 富士通株式会社 | 記事又は話題を管理するためのプログラム |
JP2006236381A (ja) * | 2006-05-01 | 2006-09-07 | Sony Corp | 情報処理装置、情報処理方法および記録媒体 |
-
2007
- 2007-03-16 JP JP2007067837A patent/JP5125161B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008226204A (ja) | 2008-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Genc-Nayebi et al. | A systematic literature review: Opinion mining studies from mobile app store user reviews | |
Dijkman et al. | Similarity of business process models: Metrics and evaluation | |
US8983963B2 (en) | Techniques for comparing and clustering documents | |
US8117207B2 (en) | System and methods for evaluating feature opinions for products, services, and entities | |
Segev et al. | Context-based matching and ranking of web services for composition | |
WO2009096523A1 (ja) | 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム | |
US20140180934A1 (en) | Systems and Methods for Using Non-Textual Information In Analyzing Patent Matters | |
Trappey et al. | An R&D knowledge management method for patent document summarization | |
Jeong et al. | On the functional quality of service (FQoS) to discover and compose interoperable web services | |
Wong et al. | A multi-phase correlation search framework for mining non-taxonomic relations from unstructured text | |
Navarro Bullock et al. | Accessing information with tags: search and ranking | |
US20180189380A1 (en) | Job search engine | |
Rodriguez-Prieto et al. | Discovering related scientific literature beyond semantic similarity: a new co-citation approach | |
JP5125161B2 (ja) | Web情報収集装置、Web情報収集方法、Web情報収集プログラム | |
Djuana Tjhwa et al. | Constructing tag ontology from folksonomy based on WordNet | |
AbuJarour et al. | Collecting, annotating, and classifying public web services | |
Shahid et al. | Extension of Direct Citation Model Using In-Text Citations. | |
Modoni et al. | The knowledge reuse in an industrial scenario: A case study | |
US12093222B2 (en) | Data tagging and synchronisation system | |
Bank et al. | Social networks as data source for recommendation systems | |
US20080033953A1 (en) | Method to search transactional web pages | |
US20140236940A1 (en) | System and method for organizing search results | |
Xabier Saralegi | Kimatu, a tool for cleaning non-content text parts from HTML docs | |
Yale-Loehr et al. | Discovering shared services from cross-organizational software specifications | |
Rai et al. | Multi-domain Opinion Mining: authenticity of Data Using Sentiment Mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091027 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121002 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121015 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151109 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |