JP5298717B2 - 特徴抽出方法及び装置 - Google Patents
特徴抽出方法及び装置 Download PDFInfo
- Publication number
- JP5298717B2 JP5298717B2 JP2008233418A JP2008233418A JP5298717B2 JP 5298717 B2 JP5298717 B2 JP 5298717B2 JP 2008233418 A JP2008233418 A JP 2008233418A JP 2008233418 A JP2008233418 A JP 2008233418A JP 5298717 B2 JP5298717 B2 JP 5298717B2
- Authority
- JP
- Japan
- Prior art keywords
- child
- parent
- log
- type identifier
- uri
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
- Debugging And Monitoring (AREA)
Description
http://hogehoge.com/ugogo.cgi?sid=1000&target=1
なお、httpはスキームを表している。
複数階層サーバシステムにおける下位階層サーバで実施される業務を区別し、上位階層のウェブサーバへのメッセージに含まれるURIの特徴部分を抽出するプログラムであって、
前記下位階層サーバへのメッセージに含まれる業務種別識別子と当該メッセージに応じて前記下位階層サーバで実施された処理の開始時刻及び終了時刻とを含む子ログを格納する子ログデータ格納部に格納されている各前記子ログについて、当該子ログに含まれる開始時刻から終了時刻までを包含する時間間隔を規定する開始時刻及び終了時刻を含む親ログである包含親ログを、前記ウェブサーバへのメッセージに含まれるURIと前記メッセージに応じて前記ウェブサーバで実施された処理の開始時刻及び終了時刻とを含む親ログを格納する親ログデータ格納部から特定し、前記子ログに含まれる業務種別識別子と前記包含親ログに含まれる前記URIのパスとを子親関係候補テーブルに登録すると共に、当該業務種別識別子と当該URIのパスとの組み合わせをカウントして前記子親関係候補テーブルに登録する登録ステップと、
前記子親関係候補テーブルから、前記業務種別識別子毎に前記カウント値が最も大きい前記組み合わせに含まれる前記URIのパスを抽出し、前記業務種別識別子と抽出された前記URIのパスとのセットを子親関係リストに登録する子親関係確定ステップと、
前記子親関係リストにおいて、前記URIのパスが、他の前記セットにおける前記URIのパスと不一致となるセットが存在するか判断するステップと、
前記URIのパスが、他の前記セットにおける前記URIのパスと不一致となるセットが存在する場合、当該セットを出力するステップと、
を、コンピュータに実行させる特徴抽出プログラム。
前記登録ステップが、
特定された前記包含親ログに、対応する前記子ログに含まれる業務種別識別子を対応付けて記憶装置に格納するステップ
を含み、
前記子親関係リストから、前記URIのパスが、他の前記セットにおける前記URIのパスと一致するセットのグループを抽出するステップと、
抽出された前記セットのグループに含まれる各前記セットについて、当該セットに含まれる前記URIのパス及び前記業務種別識別子に該当する親ログを前記記憶装置から抽出するステップと、
抽出された前記セットのグループに含まれる各前記セットについて、抽出された前記親ログに含まれる前記URIのパラメータ部分において、抽出された全ての前記親ログで共通するパラメータ及び当該パラメータの値のセットを抽出し、前記子親関係リストに登録するステップと、
をさらに前記コンピュータに実行させる付記1記載の特徴抽出プログラム。
抽出された前記セットのグループについて、前記子親関係リストにおいて登録されている前記パラメータ及び当該パラメータの値のセットのうち一致するセットを、前記子親関係リストから削除するステップと、
前記子親関係リストのデータを出力するステップと、
をさらに前記コンピュータに実行させる付記2記載の特徴抽出プログラム。
前記登録ステップが、
前記包含親ログが存在しない子ログについて、当該子ログに含まれる業務種別識別子と対応無しを表すデータとの組み合わせを前記子親関係候補テーブルに登録すると共に、当該業務種別識別子と前記対応無しを表すデータとの組み合わせをカウントして前記子親関係候補テーブルに登録するステップ
を含み、
前記子親関係確定ステップが、
特定の業務種別識別子について、最もカウント値が大きい前記組み合わせに前記対応無しを表すデータが含まれる場合に、前記子親関係リストに、当該特定の業務種別識別子と前記対応無しを表すデータとのセットを登録するステップ
を含み、
前記特定の業務種別識別子と、対応するURIが存在しないことを表すデータとを出力するステップ
をさらに前記コンピュータに実行させるための付記1乃至3のいずれか一つに記載の特徴抽出プログラム。
複数階層サーバシステムにおける下位階層サーバで実施される業務を区別し、上位階層のウェブサーバへのメッセージに含まれるURIの特徴部分を抽出する方法であって、
前記下位階層サーバへのメッセージに含まれる業務種別識別子と当該メッセージに応じて前記下位階層サーバで実施された処理の開始時刻及び終了時刻とを含む子ログを格納する子ログデータ格納部に格納されている各前記子ログについて、当該子ログに含まれる開始時刻から終了時刻までを包含する時間間隔を規定する開始時刻及び終了時刻を含む親ログである包含親ログを、前記ウェブサーバへのメッセージに含まれるURIと前記メッセージに応じて前記ウェブサーバで実施された処理の開始時刻及び終了時刻とを含む親ログを格納する親ログデータ格納部から特定し、前記子ログに含まれる業務種別識別子と前記包含親ログに含まれる前記URIのパスとを子親関係候補テーブルに登録すると共に、当該業務種別識別子と当該URIのパスとの組み合わせをカウントして前記子親関係候補テーブルに登録する登録ステップと、
前記子親関係候補テーブルから、前記業務種別識別子毎に前記カウント値が最も大きい前記組み合わせに含まれる前記URIのパスを抽出し、前記業務種別識別子と抽出された前記URIのパスとのセットを子親関係リストに登録する子親関係確定ステップと、
前記子親関係リストにおいて、前記URIのパスが、他の前記セットにおける前記URIのパスと不一致となるセットが存在するか判断するステップと、
前記URIのパスが、他の前記セットにおける前記URIのパスと不一致となるセットが存在する場合、当該セットを出力するステップと、
を含み、コンピュータにより実行される特徴抽出方法。
複数階層サーバシステムにおける下位階層サーバで実施される業務を区別し、上位階層のウェブサーバへのメッセージに含まれるURIの特徴部分を抽出する特徴抽出装置であって、
前記下位階層サーバへのメッセージに含まれる業務種別識別子と当該メッセージに応じて前記下位階層サーバで実施された処理の開始時刻及び終了時刻とを含む子ログを格納する子ログデータ格納部に格納されている各前記子ログについて、当該子ログに含まれる開始時刻から終了時刻までを包含する時間間隔を規定する開始時刻及び終了時刻を含む親ログである包含親ログを、前記ウェブサーバへのメッセージに含まれるURIと前記メッセージに応じて前記ウェブサーバで実施された処理の開始時刻及び終了時刻とを含む親ログを格納する親ログデータ格納部から特定し、前記子ログに含まれる業務種別識別子と前記包含親ログに含まれる前記URIのパスとを子親関係候補テーブルに登録すると共に、当該業務種別識別子と当該URIのパスとの組み合わせをカウントして前記子親関係候補テーブルに登録し、前記子親関係候補テーブルから、前記業務種別識別子毎に前記カウント値が最も大きい前記組み合わせに含まれる前記URIのパスを抽出し、前記業務種別識別子と抽出された前記URIのパスとのセットを子親関係リストに登録する子親関係構築手段と、
前記子親関係リストにおいて、前記URIのパスが、他の前記セットにおける前記URIのパスと不一致となるセットが存在するか判断する特徴部分抽出手段と、
前記URIのパスが、他の前記セットにおける前記URIのパスと不一致となるセットが存在する場合、当該セットを出力する出力手段と、
を有する特徴抽出装置。
71 ログ取得部 72 親ログ格納部
73 子ログ格納部 74 子親関係構築部
75 子親関係候補表格納部 76 子親関係リスト格納部
77 抽出親ログ格納部 78 特徴部分抽出部
79 出力部
Claims (6)
- 複数階層サーバシステムにおける下位階層サーバで実施される業務を区別し、上位階層のウェブサーバへのメッセージに含まれるURIの特徴部分を抽出するプログラムであって、
前記下位階層サーバへのメッセージに含まれる業務種別識別子と当該メッセージに応じて前記下位階層サーバで実施された処理の開始時刻及び終了時刻とを含む子ログを格納する子ログデータ格納部に格納されている各前記子ログについて、当該子ログに含まれる開始時刻から終了時刻までを包含する時間間隔を規定する開始時刻及び終了時刻を含む親ログである包含親ログを、前記ウェブサーバへのメッセージに含まれるURIと前記メッセージに応じて前記ウェブサーバで実施された処理の開始時刻及び終了時刻とを含む親ログを格納する親ログデータ格納部から特定し、前記子ログに含まれる業務種別識別子と前記包含親ログに含まれる前記URIのパスとを子親関係候補テーブルに登録すると共に、当該業務種別識別子と当該URIのパスとの組み合わせをカウントして前記子親関係候補テーブルに登録する登録ステップと、
前記子親関係候補テーブルから、前記業務種別識別子毎に前記カウント値が最も大きい前記組み合わせに含まれる前記URIのパスを抽出し、前記業務種別識別子と抽出された前記URIのパスとのセットを子親関係リストに登録する子親関係確定ステップと、
をコンピュータに実行させ、
前記登録ステップが、
前記包含親ログが存在しない子ログについて、当該子ログに含まれる業務種別識別子と対応無しを表すデータとの組み合わせを前記子親関係候補テーブルに登録すると共に、当該業務種別識別子と前記対応無しを表すデータとの組み合わせをカウントして前記子親関係候補テーブルに登録するステップ
を含み、
前記子親関係確定ステップが、
特定の業務種別識別子について、最もカウント値が大きい前記組み合わせに前記対応無しを表すデータが含まれる場合に、前記子親関係リストに、当該特定の業務種別識別子と前記対応無しを表すデータとのセットを登録するステップ
を含み、
さらに、
前記特定の業務種別識別子と、対応するURIが存在しないことを表すデータとを出力するステップ
を前記コンピュータに実行させる特徴抽出プログラム。 - 前記登録ステップが、
特定された前記包含親ログに、対応する前記子ログに含まれる業務種別識別子を対応付けて記憶装置に格納するステップ
を含み、
前記子親関係リストから、前記URIのパスが、他の前記セットにおける前記URIのパスと一致するセットのグループを抽出するステップと、
抽出された前記セットのグループに含まれる各前記セットについて、当該セットに含まれる前記URIのパス及び前記業務種別識別子に該当する親ログを前記記憶装置から抽出するステップと、
抽出された前記セットのグループに含まれる各前記セットについて、抽出された前記親ログに含まれる前記URIのパラメータ部分において、抽出された全ての前記親ログで共通するパラメータ及び当該パラメータの値のセットを抽出し、前記子親関係リストに登録するステップと、
をさらに前記コンピュータに実行させる請求項1記載の特徴抽出プログラム。 - 抽出された前記セットのグループについて、前記子親関係リストにおいて登録されている前記パラメータ及び当該パラメータの値のセットのうち一致するセットを、前記子親関係リストから削除するステップと、
前記子親関係リストのデータを出力するステップと、
をさらに前記コンピュータに実行させる請求項2記載の特徴抽出プログラム。 - 前記子親関係リストにおいて、前記URIのパスが、他の前記セットにおける前記URIのパスと不一致となるセットが存在するか判断するステップと、
前記URIのパスが、他の前記セットにおける前記URIのパスと不一致となるセットが存在する場合、当該セットを出力するステップと、
をさらに前記コンピュータに実行させるための請求項1乃至3のいずれか一つに記載の特徴抽出プログラム。 - 複数階層サーバシステムにおける下位階層サーバで実施される業務を区別し、上位階層のウェブサーバへのメッセージに含まれるURIの特徴部分を抽出する方法であって、
前記下位階層サーバへのメッセージに含まれる業務種別識別子と当該メッセージに応じて前記下位階層サーバで実施された処理の開始時刻及び終了時刻とを含む子ログを格納する子ログデータ格納部に格納されている各前記子ログについて、当該子ログに含まれる開始時刻から終了時刻までを包含する時間間隔を規定する開始時刻及び終了時刻を含む親ログである包含親ログを、前記ウェブサーバへのメッセージに含まれるURIと前記メッセージに応じて前記ウェブサーバで実施された処理の開始時刻及び終了時刻とを含む親ログを格納する親ログデータ格納部から特定し、前記子ログに含まれる業務種別識別子と前記包含親ログに含まれる前記URIのパスとを子親関係候補テーブルに登録すると共に、当該業務種別識別子と当該URIのパスとの組み合わせをカウントして前記子親関係候補テーブルに登録する登録ステップと、
前記子親関係候補テーブルから、前記業務種別識別子毎に前記カウント値が最も大きい前記組み合わせに含まれる前記URIのパスを抽出し、前記業務種別識別子と抽出された前記URIのパスとのセットを子親関係リストに登録する子親関係確定ステップと、
を含み、
前記登録ステップが、
前記包含親ログが存在しない子ログについて、当該子ログに含まれる業務種別識別子と対応無しを表すデータとの組み合わせを前記子親関係候補テーブルに登録すると共に、当該業務種別識別子と前記対応無しを表すデータとの組み合わせをカウントして前記子親関係候補テーブルに登録するステップ
を含み、
前記子親関係確定ステップが、
特定の業務種別識別子について、最もカウント値が大きい前記組み合わせに前記対応無しを表すデータが含まれる場合に、前記子親関係リストに、当該特定の業務種別識別子と前記対応無しを表すデータとのセットを登録するステップ
を含み、
さらに、
前記特定の業務種別識別子と、対応するURIが存在しないことを表すデータとを出力するステップ
を含み、コンピュータにより実行される特徴抽出方法。 - 複数階層サーバシステムにおける下位階層サーバで実施される業務を区別し、上位階層のウェブサーバへのメッセージに含まれるURIの特徴部分を抽出する特徴抽出装置であって、
前記下位階層サーバへのメッセージに含まれる業務種別識別子と当該メッセージに応じて前記下位階層サーバで実施された処理の開始時刻及び終了時刻とを含む子ログを格納する子ログデータ格納部に格納されている各前記子ログについて、当該子ログに含まれる開始時刻から終了時刻までを包含する時間間隔を規定する開始時刻及び終了時刻を含む親ログである包含親ログを、前記ウェブサーバへのメッセージに含まれるURIと前記メッセージに応じて前記ウェブサーバで実施された処理の開始時刻及び終了時刻とを含む親ログを格納する親ログデータ格納部から特定し、前記子ログに含まれる業務種別識別子と前記包含親ログに含まれる前記URIのパスとを子親関係候補テーブルに登録すると共に、当該業務種別識別子と当該URIのパスとの組み合わせをカウントして前記子親関係候補テーブルに登録し、前記子親関係候補テーブルから、前記業務種別識別子毎に前記カウント値が最も大きい前記組み合わせに含まれる前記URIのパスを抽出し、前記業務種別識別子と抽出された前記URIのパスとのセットを子親関係リストに登録する子親関係構築手段
を有し、
前記子親関係構築手段は、
前記包含親ログが存在しない子ログについて、当該子ログに含まれる業務種別識別子と対応無しを表すデータとの組み合わせを前記子親関係候補テーブルに登録すると共に、当該業務種別識別子と前記対応無しを表すデータとの組み合わせをカウントして前記子親関係候補テーブルに登録し、特定の業務種別識別子について、最もカウント値が大きい前記組み合わせに前記対応無しを表すデータが含まれる場合に、前記子親関係リストに、当該特定の業務種別識別子と前記対応無しを表すデータとのセットを登録し、
さらに、
前記特定の業務種別識別子と、対応するURIが存在しないことを表すデータとを出力する出力手段
を有する特徴抽出装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008233418A JP5298717B2 (ja) | 2008-09-11 | 2008-09-11 | 特徴抽出方法及び装置 |
US12/492,833 US8015147B2 (en) | 2008-09-11 | 2009-06-26 | Feature extraction method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008233418A JP5298717B2 (ja) | 2008-09-11 | 2008-09-11 | 特徴抽出方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010067047A JP2010067047A (ja) | 2010-03-25 |
JP5298717B2 true JP5298717B2 (ja) | 2013-09-25 |
Family
ID=42038749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008233418A Expired - Fee Related JP5298717B2 (ja) | 2008-09-11 | 2008-09-11 | 特徴抽出方法及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8015147B2 (ja) |
JP (1) | JP5298717B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8738656B2 (en) * | 2010-08-23 | 2014-05-27 | Hewlett-Packard Development Company, L.P. | Method and system for processing a group of resource identifiers |
US8499065B2 (en) | 2010-09-30 | 2013-07-30 | The Nielsen Company (Us), Llc | Methods and apparatus to distinguish between parent and child webpage accesses and/or browser tabs in focus |
JP5681041B2 (ja) | 2011-06-03 | 2015-03-04 | 富士通株式会社 | 名寄せ規則生成方法、装置、およびプログラム |
US9635404B2 (en) | 2013-04-24 | 2017-04-25 | The Nielsen Company (Us), Llc | Methods and apparatus to correlate census measurement data with panel data |
JP6264849B2 (ja) | 2013-11-12 | 2018-01-24 | 富士通株式会社 | 分析方法、分析装置、及び分析プログラム |
JP6273866B2 (ja) * | 2014-01-29 | 2018-02-07 | 富士通株式会社 | 制御プログラム、制御装置および制御方法 |
US9826359B2 (en) | 2015-05-01 | 2017-11-21 | The Nielsen Company (Us), Llc | Methods and apparatus to associate geographic locations with user devices |
JP6429755B2 (ja) * | 2015-09-16 | 2018-11-28 | Kddi株式会社 | 相互関連イベント抽出プログラム、装置及び方法 |
US11188941B2 (en) | 2016-06-21 | 2021-11-30 | The Nielsen Company (Us), Llc | Methods and apparatus to collect and process browsing history |
CN111090569A (zh) * | 2019-12-11 | 2020-05-01 | 深圳震有科技股份有限公司 | 一种调度系统及基于调度系统的关系日志生成方法、介质 |
JP7425691B2 (ja) | 2020-07-21 | 2024-01-31 | 株式会社日立製作所 | プロセスモデル作成システムおよびプロセスモデル作成方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4610240B2 (ja) * | 2004-06-24 | 2011-01-12 | 富士通株式会社 | 分析プログラム、分析方法及び分析装置 |
JP4549231B2 (ja) * | 2005-05-17 | 2010-09-22 | 富士通株式会社 | サービス処理状況分析プログラム、サービス処理状況分析方法、およびサービス処理状況分析装置 |
JP4616791B2 (ja) * | 2006-05-08 | 2011-01-19 | 富士通株式会社 | リクエスト種別プログラム、リクエスト種別装置およびリクエスト種別方法 |
-
2008
- 2008-09-11 JP JP2008233418A patent/JP5298717B2/ja not_active Expired - Fee Related
-
2009
- 2009-06-26 US US12/492,833 patent/US8015147B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010067047A (ja) | 2010-03-25 |
US20100077092A1 (en) | 2010-03-25 |
US8015147B2 (en) | 2011-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5298717B2 (ja) | 特徴抽出方法及び装置 | |
JP4300808B2 (ja) | 統合ログ表示方法及びシステム | |
CN106446228B (zh) | 一种web页面数据的采集分析方法及装置 | |
TWI252987B (en) | Information analyzing method and system and recording medium | |
US8671097B2 (en) | Method and system for log file analysis based on distributed computing network | |
US9300755B2 (en) | System and method for determining information reliability | |
US20100058118A1 (en) | Storage medium recording information reacquisition procedure generation program and information reacquisition procedure generation apparatus | |
JP5035068B2 (ja) | サービス処理状況分析プログラム、サービス処理状況分析装置、およびサービス処理状況分析方法 | |
CN106156126B (zh) | 处理数据任务中的数据冲突检测方法及服务器 | |
KR101054824B1 (ko) | 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템 및 그 방법 | |
JP6523799B2 (ja) | 情報分析システム、情報分析方法 | |
KR100557874B1 (ko) | 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체 | |
JP2009277023A (ja) | データ紐付けプログラム,情報処理装置およびデータ紐付け方法 | |
JP5380874B2 (ja) | 情報検索方法、プログラム及び装置 | |
JP3955069B2 (ja) | 特許出願データ分析支援システム | |
JP2009093554A (ja) | 検索支援方法、検索支援システム、アプリケーションサーバ、及び検索支援プログラム | |
JPH11306160A (ja) | サービス利用履歴からのサービス単位の抽出方法、抽出装置及び抽出プログラムを記録した記録媒体 | |
JP2015165352A (ja) | 分析候補表示装置 | |
JP5799790B2 (ja) | 分析装置、分析プログラムおよび分析方法 | |
JP2014191365A (ja) | 多階層システムに含まれる処理システムの分類装置及び多階層システムに含まれる処理システムの分類プログラム並びに多階層システムに含まれる処理システムの分類方法 | |
CN113065078B (zh) | 模拟用户行为拨测web网站多级域名的统计分析方法 | |
JP5652519B2 (ja) | 情報検索方法、プログラム及び装置 | |
CN115203057B (zh) | 低代码测试自动化方法、装置、设备及存储介质 | |
JP7464804B1 (ja) | セキュリティテストシステム | |
JP2003331089A (ja) | サービスサイト利用状況の分析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120925 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130603 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |