JP5157865B2 - 情報収集装置、情報収集方法及びプログラム - Google Patents
情報収集装置、情報収集方法及びプログラム Download PDFInfo
- Publication number
- JP5157865B2 JP5157865B2 JP2008313366A JP2008313366A JP5157865B2 JP 5157865 B2 JP5157865 B2 JP 5157865B2 JP 2008313366 A JP2008313366 A JP 2008313366A JP 2008313366 A JP2008313366 A JP 2008313366A JP 5157865 B2 JP5157865 B2 JP 5157865B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- past
- contribution
- partial
- analysis result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
過去に複数の情報源から収集された情報である過去情報のうち、前記複数の情報源の一部である部分情報源から収集された情報である部分過去情報のそれぞれが前記過去情報の分析結果へ寄与する度合いに応じ、情報を収集する部分情報源を特定し、該特定された前記部分情報源から情報を収集する。
前記特定された前記部分情報源から情報を収集する収集処理と、を有する。
過去に複数の情報源から収集された情報である過去情報のうち、前記複数の情報源の一部である部分情報源から収集された情報である部分過去情報のそれぞれが前記過去情報の分析結果へ寄与する度合いに応じ、情報を収集する部分情報源を特定する特定機能と、
前記特定された前記部分情報源から情報を収集する収集機能と、を実現させる。
Y(t)=0.6*Y^2(t)+4.1*Y^2(t−1)+0.8ε^2(t)
Y(t)=1.3*Y^3(t)+3.4*Y^3(t−1)+1.4ε^3(t)
Y(t)=2.2*Y^4(t)+2.8*Y^4(t−1)+0.5ε^4(t)
Y(t)=1.8*Y^5(t)+0.8*Y^5(t−1)+0.1ε^5(t)
上記の各式は、上から部分集合{1}、部分集合{2}、部分集合{3}、部分集合{4}、部分集合{5}によって識別される部分情報源からの部分過去情報を用いて全分析の結果を推定する式である。
Y(t)=0.3*Y^2(t)+2.1*Y^2(t−1)+1.6*Y^5(t)+1.1*Y^5(t−1)+0.02ε^2´(t)
Y(t)=1.3*Y^3(t)+3.4*Y^3(t−1)+0.3*Y^5(t)+2.2*Y^5(t−1)+0.05ε^3´(t)
Y(t)=2.2*Y^4(t)+0.8*Y^4(t-1)+1.0*Y^5(t)+3.0*Y^5(t−1)+0.03ε^4´(t)
上記の各式は、上から部分集合{1,5}、部分集合{2,5}、部分集合{3,5}、部分集合{4,5}によって識別される部分情報源からの部分過去情報を用いて全分析の結果を推定する式である。
部分集合{2} 0.2
部分集合{3} −0.4
部分集合{4} 0.5
部分集合{5} 0.9
部分集合{1,5} 0.94
部分集合{2,5} 0.98
部分集合{3,5} 0.95
部分集合{4,5} 0.97
部分集合{1,2,5} 0.999
部分集合{3,2,5} 0.998
部分集合{4,2,5} 0.997
寄与度算出部21は、これらの寄与度と、それぞれの寄与度に対応する部分集合とを示す寄与度情報101を情報源特定部23へ出力する。
部分集合{2} 0.17
部分集合{3} −0.4
部分集合{4} 0.49
部分集合{5} 0.89
部分集合{1,5} 0.93
部分集合{2,5} 0.94
部分集合{3,5} 0.94
部分集合{4,5} 0.95
部分集合{1,2,5} 0.959
部分集合{3,2,5} 0.958
部分集合{4,2,5} 0.947
さらに、上述した「クローリングする対象の情報源の数は2以下であること」という制約条件を勘案すると、この制約条件を満たして寄与度が最大の部分集合は、部分集合{4,5}となる。この場合、情報源特定部23は、部分集合{4,5}を示す特定情報源情報102をクローリング部30へ出力する。
2 インターネット
3 入力装置
10 過去データ受付部
20 データ処理部
21 寄与度算出部
22 寄与度記憶部
23 情報源特定部
30 クローリング部
40 収集結果記憶部
101 寄与度情報
102 特定情報源情報
Claims (18)
- 過去に複数の情報源から収集された情報である過去情報のうち、前記複数の情報源の一部である部分情報源から収集された情報である部分過去情報のそれぞれが前記過去情報の分析結果へ寄与する度合いに応じ、情報を収集する部分情報源を特定し、該特定された前記部分情報源から情報を収集する情報収集装置。
- 請求項1に記載の情報収集装置において、
前記部分情報源に対応し、該部分情報源から収集された前記部分過去情報のそれぞれが前記過去情報の分析結果に寄与する度合いに応じて数値化された寄与度を算出し、該算出した寄与度と、該寄与度に対応する前記部分情報源とを示す寄与度情報を出力する寄与度算出部と、
前記寄与度算出部から出力された寄与度情報に基づいて情報を収集する前記部分情報源を特定し、該特定された前記部分情報源を示す特定情報源情報を出力する情報源特定部と、
前記情報源特定部から出力された特定情報源情報が示す前記部分情報源から情報を収集するクローリング部と、を有する情報収集装置。 - 請求項2に記載の情報収集装置において、
前記寄与度算出部は、前記部分過去情報を用いた前記過去情報の分析結果と、前記過去情報を用いた該過去情報の分析結果との類似度に基づいて前記寄与度を算出する情報収集装置。 - 請求項2に記載の情報収集装置において、
前記寄与度算出部は、前記部分過去情報を用いた前記過去情報の分析結果と、前記過去情報を用いた該過去情報の分析結果との差異に基づいて前記寄与度を算出する情報収集装置。 - 請求項2に記載の情報収集装置において、
前記寄与度算出部は、前記部分過去情報を用いて前記過去情報の分析結果を推定し、該推定された分析結果と、前記過去情報を用いた該過去情報の分析結果と、の類似度に基づいて前記寄与度を算出する情報収集装置。 - 請求項2に記載の情報収集装置において、
前記寄与度算出部は、前記部分過去情報を用いて前記過去情報の分析結果を推定し、該推定された分析結果と、前記過去情報を用いた該過去情報の分析結果と、の差異に基づいて前記寄与度を算出する情報収集装置。 - 過去に複数の情報源から収集された情報である過去情報のうち、前記複数の情報源の一部である部分情報源から収集された情報である部分過去情報のそれぞれが前記過去情報の分析結果へ寄与する度合いに応じ、情報を収集する部分情報源を特定する特定処理と、
前記特定された前記部分情報源から情報を収集する収集処理と、を有する情報収集方法。 - 請求項7に記載の情報収集方法において、
前記特定処理は、
前記部分情報源に対応し、該部分情報源から収集された前記部分過去情報のそれぞれが前記過去情報の分析結果に寄与する度合いに応じて数値化された寄与度を算出する算出処理と、
前記算出された寄与度と、該寄与度に対応する前記部分情報源とに基づいて情報を収集する前記部分情報源を特定する処理と、を含み、
前記収集処理は、前記特定された前記部分情報源から情報を収集する処理である情報収集方法。 - 請求項8に記載の情報収集方法において、
前記算出処理は、前記部分過去情報を用いた前記過去情報の分析結果と、前記過去情報を用いた該過去情報の分析結果との類似度に基づいて前記寄与度を算出する処理である情報収集方法。 - 請求項8に記載の情報収集方法において、
前記算出処理は、前記部分過去情報を用いた前記過去情報の分析結果と、前記過去情報を用いた該過去情報の分析結果との差異に基づいて前記寄与度を算出する処理である情報収集方法。 - 請求項8に記載の情報収集方法において、
前記算出処理は、前記部分過去情報を用いて前記過去情報の分析結果を推定し、該推定された分析結果と、前記過去情報を用いた該過去情報の分析結果と、の類似度に基づいて前記寄与度を算出する処理である情報収集方法。 - 請求項8に記載の情報収集方法において、
前記算出処理は、前記部分過去情報を用いて前記過去情報の分析結果を推定し、該推定された分析結果と、前記過去情報を用いた該過去情報の分析結果と、の差異に基づいて前記寄与度を算出する処理である情報収集方法。 - 情報を収集する情報収集装置に、
過去に複数の情報源から収集された情報である過去情報のうち、前記複数の情報源の一部である部分情報源から収集された情報である部分過去情報のそれぞれが前記過去情報の分析結果へ寄与する度合いに応じ、情報を収集する部分情報源を特定する特定機能と、
前記特定された前記部分情報源から情報を収集する収集機能と、を実現させるためのプログラム。 - 請求項13に記載のプログラムにおいて、
前記特定機能は、
前記部分情報源に対応し、該部分情報源から収集された前記部分過去情報のそれぞれが前記過去情報の分析結果に寄与する度合いに応じて数値化された寄与度を算出する算出機能と、
前記算出された寄与度と、該寄与度に対応する前記部分情報源とに基づいて情報を収集する前記部分情報源を特定する機能と、を含み、
前記収集機能は、前記特定された前記部分情報源から情報を収集する機能であるプログラム。 - 請求項14に記載のプログラムにおいて、
前記算出機能は、前記部分過去情報を用いた前記過去情報の分析結果と、前記過去情報を用いた該過去情報の分析結果との類似度に基づいて前記寄与度を算出する機能であるプログラム。 - 請求項14に記載のプログラムにおいて、
前記算出機能は、前記部分過去情報を用いた前記過去情報の分析結果と、前記過去情報を用いた該過去情報の分析結果との差異に基づいて前記寄与度を算出する機能であるプログラム。 - 請求項14に記載のプログラムにおいて、
前記算出機能は、前記部分過去情報を用いて前記過去情報の分析結果を推定し、該推定された分析結果と、前記過去情報を用いた該過去情報の分析結果と、の類似度に基づいて前記寄与度を算出する機能であるプログラム。 - 請求項14に記載のプログラムにおいて、
前記算出機能は、前記部分過去情報を用いて前記過去情報の分析結果を推定し、該推定された分析結果と、前記過去情報を用いた該過去情報の分析結果と、の差異に基づいて前記寄与度を算出する機能であるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008313366A JP5157865B2 (ja) | 2008-12-09 | 2008-12-09 | 情報収集装置、情報収集方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008313366A JP5157865B2 (ja) | 2008-12-09 | 2008-12-09 | 情報収集装置、情報収集方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010140087A JP2010140087A (ja) | 2010-06-24 |
JP5157865B2 true JP5157865B2 (ja) | 2013-03-06 |
Family
ID=42350207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008313366A Active JP5157865B2 (ja) | 2008-12-09 | 2008-12-09 | 情報収集装置、情報収集方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5157865B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4489994B2 (ja) * | 2001-05-11 | 2010-06-23 | 富士通株式会社 | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 |
JP2004038412A (ja) * | 2002-07-01 | 2004-02-05 | Central Res Inst Of Electric Power Ind | データマイニング方法およびデータマイニングシステム並びにデータマイニング用プログラム |
JP2004054631A (ja) * | 2002-07-19 | 2004-02-19 | Internatl Business Mach Corp <Ibm> | 情報検索システム、情報検索方法、html文書の構造解析方法及びプログラム |
JP2004280569A (ja) * | 2003-03-17 | 2004-10-07 | Mitsubishi Electric Corp | 情報監視装置 |
US7310632B2 (en) * | 2004-02-12 | 2007-12-18 | Microsoft Corporation | Decision-theoretic web-crawling and predicting web-page change |
JP4718205B2 (ja) * | 2005-02-22 | 2011-07-06 | 三菱電機株式会社 | 選択的Web情報収集装置 |
-
2008
- 2008-12-09 JP JP2008313366A patent/JP5157865B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010140087A (ja) | 2010-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10600005B2 (en) | System for automatic, simultaneous feature selection and hyperparameter tuning for a machine learning model | |
Westcott et al. | OptiClust, an improved method for assigning amplicon-based sequence data to operational taxonomic units | |
US9465713B2 (en) | Monitoring data analyzing apparatus, monitoring data analyzing method, and monitoring data analyzing program | |
CN102262647B (zh) | 信息处理装置、信息处理方法和程序 | |
JP6109037B2 (ja) | 時系列データ予測装置、時系列データ予測方法、及びプログラム | |
US9411875B2 (en) | Tag refinement strategies for social tagging systems | |
Amini et al. | Bayesian model averaging in R | |
US9111227B2 (en) | Monitoring data analyzing apparatus, monitoring data analyzing method, and monitoring data analyzing program | |
EP2991003B1 (en) | Method and apparatus for classification | |
US8849738B2 (en) | Predicting a user behavior number of a word | |
CN106030589A (zh) | 使用开源数据的疾病预测系统 | |
Ghosh et al. | Time-aware ranking in dynamic citation networks | |
Adabor et al. | SAGA: a hybrid search algorithm for Bayesian Network structure learning of transcriptional regulatory networks | |
WO2014199920A1 (ja) | 予測関数作成装置、予測関数作成方法、及びコンピュータ読み取り可能な記録媒体 | |
JP2000194745A (ja) | トレンド評価装置及びトレンド評価方法 | |
KR20210031094A (ko) | 트리 기반 이상치 탐지 장치 및 방법, 컴퓨터 프로그램 | |
Bazil et al. | A parallel algorithm for reverse engineering of biological networks | |
Zhao et al. | F-Seq2: improving the feature density based peak caller with dynamic statistics | |
JP5157865B2 (ja) | 情報収集装置、情報収集方法及びプログラム | |
JP5600693B2 (ja) | クラスタリング装置及び方法及びプログラム | |
JPWO2009116342A1 (ja) | 動的トピック分析システム、動的トピック分析方法および動的トピック分析プログラムを記録した媒体 | |
Su et al. | Hidden Markov model in multiple testing on dependent count data | |
JP5963493B2 (ja) | コスト推定システム、方法及びプログラム | |
JP6617605B2 (ja) | 需要量予測プログラム、需要量予測方法、及び情報処理装置 | |
JP2008171282A (ja) | 最適パラメータ探索プログラム、最適パラメータ探索装置および最適パラメータ探索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110905 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121107 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5157865 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |