JP2010165141A - テキストログからの特定箇所抽出方法およびプログラム - Google Patents
テキストログからの特定箇所抽出方法およびプログラム Download PDFInfo
- Publication number
- JP2010165141A JP2010165141A JP2009006334A JP2009006334A JP2010165141A JP 2010165141 A JP2010165141 A JP 2010165141A JP 2009006334 A JP2009006334 A JP 2009006334A JP 2009006334 A JP2009006334 A JP 2009006334A JP 2010165141 A JP2010165141 A JP 2010165141A
- Authority
- JP
- Japan
- Prior art keywords
- log
- unit
- item
- extraction
- unit cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【課題】テキストログの中から指定された項目に該当する抽出項目を確実かつ迅速に抽出することのできる特定箇所抽出方法を提供する。
【解決手段】抽出項目の抽出対象となるテキスト形式で保存されたログファイルを選択し、テキスト形式で繰り返されるログの一巡の範囲を単位ログとして選択し、選択された前記単位ログを特定の区切り文字を基準に分割し、前記区切り文字により分割された各文字列は番号付けされた単位セルとして扱われ、前記単位ログを構成する複数の単位セルの中から、抽出項目を当てはめた単位セルを選択し、テキスト形式で繰り返される単位ログを順次前記単位セルに分割して各単位セルには一巡目の単位ログにおける単位セルに対応した番号を付し、抽出項目を当てはめた単位セルとして選択された単位セルに付された前記番号と一致する番号を付された単位セルに当てはめられた文字列を抽出項目としてCSV形式で出力することを特徴とする。
【選択図】図3
【解決手段】抽出項目の抽出対象となるテキスト形式で保存されたログファイルを選択し、テキスト形式で繰り返されるログの一巡の範囲を単位ログとして選択し、選択された前記単位ログを特定の区切り文字を基準に分割し、前記区切り文字により分割された各文字列は番号付けされた単位セルとして扱われ、前記単位ログを構成する複数の単位セルの中から、抽出項目を当てはめた単位セルを選択し、テキスト形式で繰り返される単位ログを順次前記単位セルに分割して各単位セルには一巡目の単位ログにおける単位セルに対応した番号を付し、抽出項目を当てはめた単位セルとして選択された単位セルに付された前記番号と一致する番号を付された単位セルに当てはめられた文字列を抽出項目としてCSV形式で出力することを特徴とする。
【選択図】図3
Description
本発明は、テキストログから特定の文字列を抽出する方法、およびそれを実行するプログラムに関する。
ルータやサーバ等通信を可能とするコンピュータシステムの接続機器やコンピュータシステム自体では、当該機器やシステムの利用状況やデータ通信の記録等がログとして記録されている。これらのログは、製品販売計画や経営戦略、あるいはインシデント対応等、種々の目的を持って利用される。こうした機器やシステムに記録されるログは、テキスト形式のファイルで保存されるもの(テキストログ)がほとんどであり、種々の解析を行うためには、解析の目的に応じて必要とする箇所をCSV形式等、表計算等に対応した形式にまとめなおす必要があった。
このようなテキストログからの特定文字列の抽出は従来、作業者が出力画面を視認しながら移し変えるといった手作業で行われていた。このような移し変え作業は、テキストログが単純で短いものであれば問題無く行うことができる。しかし、テキストログが複雑で長いものになるに従って、人為的なミスの頻度が増加することとなり、作業時間も長期に亙るものとなってしまうという問題が生じていた。
このような問題に対しては、特定の機器や特定の試験等に対応したログに特化した抽出プログラムを作成し、特定文字列の抽出を自動化する手段が採られてきた。しかし、このような手段では、試験を行う機器が変わったり、試験自体が変わる度にプログラムの作成や変更を行う必要があり、ログの抽出に取り掛かるまでの労力が大きく、時間もかかるということが問題とされてきた。
これらの問題に対し、特許文献1〜3には、特定の機器や試験、さらにはログに限らず、ある文章から特定の文字列(抽出項目)を抽出する技術について開示されている。ここで、特許文献1は、すでにCSVファイル化されたデータの中から特定の文字列を抽出する技術について開示している。また、特許文献2は、テキストログの中から特定のエラーメッセージを抽出して抜き出すという技術である。さらに特許文献3は、テキストファイルの中から特定の数値や文字列を抽出する技術である。
上記特許文献はいずれも文字列の中から特定の抽出項目を抽出する技術であるが、繰り返し記録されるテキストログから種々変化する抽出項目を抽出する場合には、それぞれ次のような問題が残る。まず特許文献1に開示されている技術の場合、抽出対象がすでにCSVファイルとされており、テキストファイルに適応することができないという問題がある。また、特許文献2に開示されている技術の場合、抽出項目(エラーメッセージ)を予め入力し、記録しておく必要があり、時々刻々と変化するログデータを抽出する事には適していないという問題がある。さらに特許文献3に開示されている技術は、抽出項目の周囲の単位表現や項目表現を学習して抽出項目の認定を行って抽出する技術である。このため、1つのログを構成するブロックの中に近似する項目表現等があった場合には、それらを分別して抽出することが困難となる。また、エラーなどによりログの形式が崩れた場合であっても、抽出項目の抽出が続いてしまうため、インシデント対応への使用は不向きとなる。
本発明では、このような問題を解決し、形式の異なるログでも汎用的に、テキストログの中から指定された項目に該当する抽出項目を確実かつ迅速に抽出することのできる特定箇所抽出方法およびプログラムを提供することを目的とする。
上記目的を達成するための本発明に係るテキストログからの特定箇所抽出方法は、抽出項目の抽出対象となるテキスト形式で保存されたログファイルを選択し、テキスト形式で繰り返されるログの一巡の範囲を単位ログとして選択し、選択された前記単位ログを特定の区切り文字を基準に分割し、前記区切り文字により分割された各文字列は番号付けされた単位セルとして扱われ、前記単位ログを構成する複数の単位セルの中から、抽出項目を当てはめた単位セルを選択し、テキスト形式で繰り返される単位ログを順次前記単位セルに分割して各単位セルには一巡目の単位ログにおける単位セルに対応した番号を付し、抽出項目を当てはめた単位セルとして選択された単位セルに付された前記番号と一致する番号を付された単位セルに当てはめられた文字列を抽出項目としてCSV形式で出力することを特徴とする。
また、上記のような特徴を有するテキストログからの特定箇所抽出方法において前記単位ログの選択は、一行完結型またはブロック型の選択肢から選択し、ブロック型を選択した場合にはブロックの開始文字列を指定するようにする。
このような方法によれば、ログ形式の選択を容易に行うことができる。また、文字列が長くなるブロック型のログであっても、ログを区切るための開始文字列を指定することにより、単位ログを構成するブロックの範囲を的確に定めることが可能となる。
さらに、上記のような特徴を有するテキストログからの特定箇所抽出方法において前記抽出項目に該当する前記単位セルの選択は、各単位セルに対応したチェックボックスを表示し、これをチェックすることにより行うようにすると良い。
このような方法であれば、抽出項目の選択を容易に行うことができる。また、チェックボックスに対するチェックの有無を視認可能となることより、抽出項目の誤選択を防止することが可能となる。
また、上記目的を達成するための本発明に係るテキストログからの特定箇所抽出プログラムは、少なくとも入力手段、出力手段、CPU、主記憶部、および補助記憶部を有するコンピュータシステムを介して動作するテキストログからの特定箇所抽出プログラムであって、前記補助記憶部に記憶され、前記入力手段からの起動命令の入力により前記主記憶部に読み出され、前記CPUを介して、前記表示手段にテキストログの形式選択項目、単位ログ範囲の指定項目、および前記単位ログを単位セルとして分割する区切り文字の選択項目を表示する処理を実行するログ形式解析処理と、前記入力手段を介して前記テキストログの形式選択項目、単位ログ範囲の指定項目、および区切り文字の選択項目の選択が行われた上で解析命令が入力されることで実行され、前記入力手段を介して選択された各項目の選択内容に従ってテキスト形式で繰り返されるログにおける一巡目の単位ログを単位セル毎に分割し、分割された単位ログの単位セルに番号を付し、番号付けされた単位セル毎に分けられた文字列を前記表示手段に表示するログ抽出項目設定処理と、前記入力手段を介して前記単位セルの中から抽出項目としての単位セルが選択された上で抽出処理の実行命令が入力されることで実行され、テキスト形式で繰り返される単位ログを順次前記単位セルに分割して前記一巡目に該当する単位ログにおける単位セルに対応した番号を付し、選択された前記抽出項目を当てはめた単位セル付された番号と一致する番号を付された単位セルに当てはめられた文字列をCSV形式で出力する処理を行うログ抽出処理とを有することを特徴とする。
また、このような特徴を有するテキストログからの特定箇所抽出プログラムにおいて前記ログ形式解析処理は、テキストログの形式選択項目、区切り文字の選択項目の選択欄にチェックボックスを表示し、当該チェックボックスに対するチェックの有無によりテキストログの形式、区切り文字を認定するようにすると良い。
ログ形式解析処理においてこのような処理形式を表示することで、テキストログの形式選択や区切り文字の選択を容易に行うことが可能となる。
さらに、上記のような特徴を有するテキストログからの特定箇所抽出プログラムにおいて前記ログ抽出項目設定処理は、文字列を当てはめられた単位セルに対応したチェックボックスを表示し、当該チェックボックスに対するチェックの有無により、単位セルに当てはめられた文字列の選択が成されたことを認定することが望ましい。
さらに、上記のような特徴を有するテキストログからの特定箇所抽出プログラムにおいて前記ログ抽出項目設定処理は、文字列を当てはめられた単位セルに対応したチェックボックスを表示し、当該チェックボックスに対するチェックの有無により、単位セルに当てはめられた文字列の選択が成されたことを認定することが望ましい。
このような処理を行うことによれば、抽出項目の選択を容易に行うことができる。また、チェックボックスに対するチェックの有無を視認可能となることより、抽出項目の誤選択を防止することが可能となる。
上記のようなテキストログからの特定箇所抽出方法によれば、テキストログの中から指定された項目に該当する抽出項目を確実かつ迅速に抽出することが可能となる。また、形式の異なるログを記録する機器や試験によって得られたログであっても、汎用的に抽出項目の抽出処理を行うことができる。
また、上記のような構成のテキストログからの特定箇所抽出プログラムによれば、上記方法を実施することが可能となる。
また、上記のような構成のテキストログからの特定箇所抽出プログラムによれば、上記方法を実施することが可能となる。
以下、本発明のテキストログからの特定箇所抽出方法およびプログラムに係る実施の形態について図面を参照しつつ詳細に説明する。
まず、本発明の特定箇所抽出方法を実施し、特定箇所抽出プログラムを実行するためのコンピュータシステムについて、図1を参照して説明する。
まず、本発明の特定箇所抽出方法を実施し、特定箇所抽出プログラムを実行するためのコンピュータシステムについて、図1を参照して説明する。
本発明を実施するためのコンピュータシステム10は、システム本体20と入力手段40、および出力手段50を有する。システム本体20は、CPU22、主記憶部24、補助記憶部26、およびインターフェース28を有する。
CPU(Central Processing Unit)22は、詳細を後述する主記憶部24に一時記憶されたプログラムの制御・演算処理を行う手段である。具体的には、主記憶部24に一時記憶されて展開されたプログラムを読み出し、与えられた演算を実行し、演算によって得られた結果を主記憶部24へ戻すといった処理を繰り返す。
主記憶部24は、いわゆるメモリと言われる一時記憶部であり、CPU22との直接的な連携を図る。具体的には、詳細を後述する補助記憶部26に記憶されたデータやプログラム等を実行する際に、実行プログラムとして読み出されたデータやプログラムを展開しておく箇所である。
補助記憶部26は、基本ソフト30やアプリケーションソフト、および各種データを記憶する大容量の記憶手段である。基本ソフト30はOS(Operating System)と呼ばれ、キーボードやマウス等の入力手段40によるデータの入力やディスプレイ等の出力手段50への出力といった入出力機能や、主記憶部24や補助記憶部26の管理等、多くのアプリケーションソフトから共通して利用される基本的な機能を提供し、コンピュータシステム10全体を管理するプログラムである。アプリケーションソフトは、OSの機能を補助し、OS上で展開されるプログラムであり、特定の処理を実行するのに適したプログラムである。
インターフェース28は、システム本体20や詳細を後述する入力手段40、および出力手段50間における接続、通信規約を定める役割を担う。
このような構成要素を有するシステム本体20は、各構成要素間におけるデータの授受を行うためのバス36を有し、CPU22、主記憶部24、補助記憶部26、およびインターフェース28は、バス36を介してデータとしての電気信号の授受を行う。
このような構成要素を有するシステム本体20は、各構成要素間におけるデータの授受を行うためのバス36を有し、CPU22、主記憶部24、補助記憶部26、およびインターフェース28は、バス36を介してデータとしての電気信号の授受を行う。
入力手段40は、インターフェース28を介してプログラムの実行値等の指令値を入力する手段である。入力手段40の具体例としては、キーボードやマウスを挙げることができる。
出力手段50は、インターフェース28を介してシステム本体20によるプログラム等の実行結果等を知覚により認識可能に表示、あるいは紙面等へ出力する手段である。出力手段50の具体例としては、ディスプレイやスピーカー、プリンター等を挙げることができる。
本発明に係るテキストログからの特定箇所抽出プログラム(以下、単にプログラムと称す)32は、アプリケーションソフトの1つとして補助記憶部26に記憶される。
プログラム32は、ログ形式解析処理とログ抽出項目設定処理、およびログ抽出処理を順次実行するように構成される。ログ形式解析処理は、抽出項目の選択を行う対象となるログファイル(テキストログ)の選択や、テキストログとして繰り返される一巡のログ(単位ログ)を構成するログの形式、およびテキストログを分割するための区切り文字の指定を行うためのログ抽出ツール(図5または図10参照)を表示するための処理を行う。
テキストログの形式としては、例えば一行完結型やブロック型を挙げることができる。一行完結型のログは、一行毎に繰り返されるログであり、改行により1つの単位ログが終了することを認識することができる。一方ブロック型のログは、複数行に亙って展開されるログである。このため、テキストログの形式としてブロック型が選択された場合、単位ログを構成するブロックの最初に当たる文字列(開始文字)や、ブロックの最後に当たる文字列(終了文字)を指定する必要がある。指定された文字列により、1つのブロックの範囲を認識するからである。また、区切り文字とは、テキストログを構成する文字列を分割するのに適した文字であり、例えば「スペース」や「カンマ」、「スラッシュ」、「カッコ」等を挙げることができる。
ログ形式解析処理が実行されると、図5や図10に示すようなログ抽出ツールウィンドウが表示される。ログ抽出ツールウィンドウには、特定文字列(抽出項目)の抽出を行う対象となるログファイルの名称を指定する「ファイル名の指定」項目、ログ形式の選択を行う「ログ形式の選択」項目、区切り文字の選択を行う「区切り文字選択」項目や、各種選択項目に従って解析を行う解析命令を入力するための「解析」ボタンが表示される。なお、「ファイル名の指定」項目には、ファイルの保管場所を見つけるための「参照」ボタンを設け、ファイル選択の容易化を図るようにすると良い。また、「ログ形式の選択」項目には、ログ形式についての詳細を説明する「ログ形式について」ボタンを設け、ログ形式の判別の明確化を図るようにすると良い。また、「区切り文字の選択」項目には、指定可能な区切り文字等を示すための「区切り文字について」ボタンを設け、区切り文字として指定可能な文字の明確化を図るようにすると良い。
ログ抽出項目設定処理は、ログ形式解析処理により選択された項目に従って補助記憶部に記憶されたログファイルを読み出し、テキスト形式で記録された単位ログの一巡目を抽出し、抽出した一巡目の単位ログを区切り文字に従って文字列単位で分割し、分割した文字列を単位セルとして当てはめ、各単位セルに対して通し番号を付すと共に対応したチェックボックスを付けて出力手段50に表示する処理を行う。
ログ抽出項目設定処理が実行されると、図6や図11に示すようなログ抽出ウィンドウが表示される。ログ抽出ウィンドウには、ログ形式解析処理で選択されたログファイルの一巡目にあたる単位ログが、指定された区切り文字毎にチェックボックスが付されて表示される。なおログ抽出ウィンドウには、文字列とその文字列毎に設けられたチェックボックスの他、全てのチェックボックスを選択する「すべてチェック」ボタンや、全てのチェックボックスのチェックを外す「すべてクリア」ボタン、列名設定ボタン、および指定されたチェック項目に従って抽出処理を実行する実行命令を入力するための「実行」ボタンを設けるようにすると良い。
なお、列名設定ボタンは、抽出項目としてチェックボックスをチェックした文字列CSV形式で項目毎に出力する際に、項目別の列(カラム)の名称を同時に出力したい場合に選択するボタンである。ログ抽出ウィンドウにおいて図6に示すようなチェックが成された場合、図7に示すようなウィンドウが表示される。ウィンドウ上には、ログ抽出ウィンドウにおいてチェックをした文字列と共に、各文字列に対応した空欄が表示される。空欄には、対応する各文字列が意味する項目名を任意で入力すれば良い。空欄に入力した名称が、各文字列をCSV形式で出力した際に、各項目の最上段に出力される。列名設定の確定は、ウィンドウに表示された「OK」ボタンを選択すれば良く、設定を取り止める場合には、「キャンセル」ボタンを選択すれば良い。このような処理も、ログ抽出項目設定処理の一部として実行されることとなり、「OK」ボタンまたは「キャンセル」ボタンが選択されることにより、図7に示すウィンドウが閉じられ、図6に示すログ抽出ウィンドウが表示されることとなる。
ログ抽出処理は、ログ抽出ウィンドウにおけるチェックボックスの状態、すなわちチェックの有無を判定し、チェックされた文字列が当てはめられた単位セルの番号を認定し、テキストとして繰り返される単位ログ毎に単位セルへの分割、番号付けを行い、チェックされた単位セルの番号と一致する単位セルに当てはめられた文字列を抽出項目として抽出し、CSV(Comma-Separated Values)形式で出力する処理を行う。
ログ抽出処理が実行されると、図8や図12に示すように別シートに、チェックボックスにチェックが付された単位セルに当てはめられた文字列が項目毎にCSV形式で出力される。なお、出力されたCSV形式の抽出項目は、テキストログとは別に補助記憶部26のデータ34として記憶されることとなる。
本実施形態では、抽出項目の認定処理について、以下のような手段を採ることとしている。すなわち図2に示すように、ログ抽出ウィンドウにおいて「実行」ボタンが選択された場合に、単位セルに付した番号iをi=1と設定する(S10)。次に、i番目(i=1の場合は1番目)の単位セルに対応するチェックボックスについてのチェックの有無を判定する(S20)。i番目の単位セルに対応するチェックボックスにチェックがある場合には、その番号(1番目の単位セルのチェックボックスの場合は1)を抽出項目の配列として主記憶部24に一次記憶する(S30)。i番目に該当するチェックボックスの番号を記憶した後、次段の単位セルに対応するチェックボックスについてのチェックの有無を判定するために、i=i+1の処理を行う(S40)。i=i+1の処理を行った後、処理後のiに該当する番号(処理前のiを1とした場合には、処理後のiは2となる)に対応する単位セル(チェックボックス)の有無を判定する(S50)。処理後のiに該当する単位セルが無い場合、単位ログを構成する全ての単位セルについてのチェックボックスのチェックの有無の判定が終了し、抽出項目として指定された単位セルの番号配列が完成したと認定する。
抽出項目の認定処理が終了した後は、抽出項目の配列として記憶された番号に従って、2順目、3順目、・・・の単位ログにおける単位セルに当てはめられた文字列を順次抽出する処理が成される。
ここで、S20においてi番目の単位セルに対応するチェックボックスにチェックが無い場合には、その番号については抽出項目の配列として記憶されずにS40に移行し、i=i+1の処理が成される。また、S50においてi番目に該当する番号に対応する単位セルがあると判定された場合には、S20へ戻ってi番目の単位セルに対応するチェックボックスについてのチェックの有無の判定を行う。
このような処理で抽出項目の認定を行うことによれば、チェックボックスの番号のみを配列として記憶しておけば良いため、各単位セルに対応したチェックボックスに対して1つ1つチェックの有無を示すフラグを立て、逐次それを参照するといった認定方式に比べ、抽出項目の抽出速度を速めることが可能となる。なお本実施形態の方式を採用した場合、ログファイルの容量が大きいほどメリットが多くなることとなる。
なお、上記のような処理において、ログ抽出ウィンドウにおけるチェックボックスにチェックが無いと判定された場合には、文字列の抽出処理は行われず、図6、図11のウィンドウを表示し、抽出項目等の選択を促す処理を行う。
このように構成されたコンピュータシステム10では、出力手段50に表示されたデスクトップ画面上に示された「特定箇所抽出プログラム」アイコン(不図示)をマウスやキーボード等の入力手段により選択することで起動命令が入力され、特定箇所抽出プログラムが起動する。特定箇所抽出プログラムの起動は、特定箇所抽出プログラムが補助記憶部26から主記憶部24に読み出される事で成され、最初にログ形式解析処理が実行される。
ログ形式解析処理の実行はCPU22を介して行われ、出力手段50には図5や図10に示すようなログ抽出ツールウィンドウが表示される(S110)。
ログ抽出ツールウィンドウにおいてはまず、ログファイル名の指定が行われる。ログファイル名の指定は、入力手段40を介して行う。ログファイル名の指定を行うための具体的手段としては、次のような4つの手段を挙げることができる。第1の手段は、特定文字列(抽出項目)を抽出するログファイルのファイル名を空欄に入力するというものである。第2の手段は、「ログファイル名の指定」項目上に表示されている「参照」ボタンを選択することにより表示されるファイル名の中からログファイルを選択するものである。第3の手段は、S110において、デスクトップ画面上に示された「特定箇所抽出プログラム」アイコンに、特定文字列を抽出するログファイルをドラッグ&ドロップするというものである。第4の手段としては、図5や図10に示すようなログ抽出ツールウィンドウ上に、特定文字列を抽出するログファイルをドラッグ&ドロップするというものである。なお、第1の手段から第4の手段までのいずれかを行った際の結果は同じであるため、これらの順序に関しては順不同である(S120)。
ログ抽出ツールウィンドウにおいてはまず、ログファイル名の指定が行われる。ログファイル名の指定は、入力手段40を介して行う。ログファイル名の指定を行うための具体的手段としては、次のような4つの手段を挙げることができる。第1の手段は、特定文字列(抽出項目)を抽出するログファイルのファイル名を空欄に入力するというものである。第2の手段は、「ログファイル名の指定」項目上に表示されている「参照」ボタンを選択することにより表示されるファイル名の中からログファイルを選択するものである。第3の手段は、S110において、デスクトップ画面上に示された「特定箇所抽出プログラム」アイコンに、特定文字列を抽出するログファイルをドラッグ&ドロップするというものである。第4の手段としては、図5や図10に示すようなログ抽出ツールウィンドウ上に、特定文字列を抽出するログファイルをドラッグ&ドロップするというものである。なお、第1の手段から第4の手段までのいずれかを行った際の結果は同じであるため、これらの順序に関しては順不同である(S120)。
次に、ログ形式の選択が行われる。ログ形式の選択は、ログ形式選択項目に表示された一行完結型、またはブロック型に対応して設けられたチェックボックスにチェックを入れる事で成される(S130)。
ここで、例えば図4に示すようなログから抽出項目を抽出する場合には、ログ形式としてブロック型が選択される。この場合少なくとも、ブロック(単位ログ)を判別するための最初の文字列である「ブロックの開始文字列」を指定する必要がある。なお、ブロックの開始文字列の指定は、対応して表示された空欄に対し、入力手段を介して書き込みを行えば良い。例えば図4に示されるようなログであるならば、図5に示すように、空欄に「show clock」と書き込めば良い。この指定により、「show clock」で囲まれた部分を1ブロック(単位ログ)として認識することとなる。ブロックの開始文字列と同様に空欄が設けられた「ブロックの終了文字列」については、任意で書き込みを行うようにすれば良い(S140)。
次に、単位ログを単位セルとして分割するための区切り文字の選択を行う。ここで、例えば図5に表示されている「空白(スペース、タブ)」項目に対応したチェックボックスにチェックを入れた場合、ログファイル内の文字列を「スペース」毎に分割することとなる。なお、区切り文字は、1つに限るものでは無く、複数選択することができ、選択した区切り文字毎に文字列を分割することも可能である(S150)。
ログ抽出ツールウィンドウにおいて上記項目の選択が成され、「解析」ボタンが選択されると、解析命令が入力されたと判断され、CPU22を介してログ抽出項目設定処理が実行される。ログ抽出項目設定処理では、ログファイルにおける一巡目の単位ログ(前例の場合では一巡目のブロック)を抽出し、区切り文字として選択された「スペース」毎に文字列を分割し、分割された各文字列を単位セルとして認定し、各単位セルに通し番号を付与する。通し番号を付された単位セルにはそれぞれ対応したチェックボックスを設け、当該チェックボックスがチェックされることにより対応する単位セルに当てはめられた文字列が抽出項目として選択されたものと認識するように処理が成される。なお、通し番号が付された単位セルは、テキスト形式でのログの表示形式に従って行毎に配列され、各行には行番号が付される(S160)。
上記のような処理が成された後、図6に示すようなブロック型ログ抽出ウィンドウが表示される。ブロック型ログ抽出ウィンドウには、一巡目のブロックが「スペース」毎に区切られ、各文字列にチェックボックスが付されて表示される。ここで、図6に示す例の場合、抽出項目として、3番目(2行目の一番左)の単位セルと、25番目(5行目の左から5番目)の単位セル、および33番目(6行目の左から5番目)の単位セルに対応したチェックボックスにチェックを入れたこととなる。チェックボックスにチェックを入れた後は、任意で「列名設定」ボタンを選択し、列名の設定を行う(S170)。
抽出項目の選択が成された後、ブロック型ログ抽出ウィンドウにおいて「実行」ボタンが選択されることで、抽出処理の実行命令が入力されたと判断され、CPU22を介してログ抽出処理が実行される。ログ抽出処理が実行されると、ログファイル中で繰り返される単位ログが順次単位セルに分割され、各単位セルには、一巡目の単位ログにおいて対応する単位セルと同一の番号が付される。その後、抽出項目として選択された単位セルの番号に対応する単位セルに当てはめられた文字列の抽出が成される(S180)。
ログ抽出処理によりログファイルから抽出された文字列は、図8に示すように、別ウィンドウとして開かれたシートに、単位セルの項目毎にCSV形式で出力される(S190)。
一方、抽出対象となるログが図9に示すような一行完結型のものであった場合、S130におけるログの形式として一行完結型が選択されることとなる(図10参照)。ログの形式が一行完結型の場合、単位ログは改行毎となるため、開始文字列や終了文字列の指定は不要となる。
「区切り文字の選択」項目では、ログの形式としてブロック型を選択した場合と同様、区切り文字の選択を行う。例えば区切り文字として「スペース」と「[:カッコ」を選択したい場合には、「空白(スペース、タブ)」項目のチェックボックスにチェックを入れた上で、「その他の文字」項目のチェックボックスにもチェックを入れ、表示された空欄に「[」と入力すれば良い(S200)。
ログ抽出ツールウィンドウにおいて上記のような選択が成され、「解析」ボタンが選択されると、解析命令が入力されたと判断され、CPU22を介してログ抽出項目設定処理が実行される。ログ抽出項目設定処理では、ログファイルにおける一巡目の単位ログ(前例の場合では一行目のログ)を抽出し、区切り文字として選択された「スペース」と「[」毎に文字列を分割し、各文字列を単位セルとして認定し、各単位セルに通し番号を付与する。通し番号を付された単位セルにはそれぞれ対応したチェックボックスを設け、当該チェックボックスがチェックされることにより対応する単位セルに当てはめられた文字列が抽出項目として選択されたものと認識するように処理が成される(S210)。
上記のような処理が成された後、図11に示すような一行完結型ログ抽出ウィンドウが表示される。一行完結型ログ抽出ウィンドウには、一巡目(一列目)のログとそれを「スペース」と「[」で区切った文字列がチェックボックスを付して表示される。ここで、図11に示す例の場合、抽出項目として、1番目の単位セルと、5番目の単位セル、および10番目の単位セルに対応したチェックボックスにチェックを入れたこととなる。チェックボックスにチェックを入れた後は、任意で「列名設定」ボタンを選択し、列名の設定を行う(S220)。
抽出項目の選択が成された後、一行完結型ログ抽出ウィンドウにおいて「実行」ボタンが選択されることで、抽出処理の実行命令が入力されたと判断され、CPUを介してログ抽出処理が実行される。ログ抽出処理が実行されると、ログファイル中で繰り返される単位ログが順次単位セルに分割され、各セルには一巡目の単位ログにおいて対応する単位セルに付された番号と同一の番号が付される。その後、抽出項目として選択された単位セルの番号に対応する単位セルに当てはめられた文字列を抽出する(S230)。
ログ抽出処理によりログファイルから抽出された文字列は、図12に示すように、別ウィンドウとして開かれたシートに、単位セルの項目毎にCSV形式で出力される(S230)。
上記のような方法でテキストファイルから特定箇所を抽出することで、テキストログの中から指定された抽出項目を確実に抽出することができる。また、作業者による手作業に比べ処理速度が格段に速く、人為的なミスも無くすことができる。さらに、同じ形式が繰り返し出現するログであるならば、ログを取得する対象となる機器やログの形式が異なる場合であっても汎用的に抽出処理を実行することができる。
テキストログに限らず、電話交換機や電子機器の試験装置等、同じような文字列によりデータが繰り返されるものであれば、本発明に係る特定箇所抽出方法を利用することができる。
また本発明に係るプログラム32には、CSV形式で出力した値から異常値を検出したりエラー発生を予測したりする処理を付加することもできる。この場合、異常値の検出を行うには、抽出項目の正常値としての閾値を定め、補助記憶部26にデータ34として記憶しておく必要がある。抽出した値が閾値を超えた場合には異常値として認定することができるからである。また、エラー発生の予測を行うには、予めエラー傾向についてのデータを学習させておく必要がある。抽出した値の傾向や時間によってエラー傾向に近似するか否かの判定を行うことで、エラー予測が可能となるからである。
10………コンピュータシステム、20………システム本体、22………CPU、24………主記憶部、26………補助記憶部、28………インターフェース、30………基本ソフト、32………プログラム(テキストログからの特定箇所抽出プログラム、34………データ、36………バス、40………入力手段、50………出力手段。
Claims (6)
- 抽出項目の抽出対象となるテキスト形式で保存されたログファイルを選択し、
テキスト形式で繰り返されるログの一巡の範囲を単位ログとして選択し、
選択された前記単位ログを特定の区切り文字を基準に分割し、前記区切り文字により分割された各文字列は番号付けされた単位セルとして扱われ、
前記単位ログを構成する複数の単位セルの中から、抽出項目を当てはめた単位セルを選択し、
テキスト形式で繰り返される単位ログを順次前記単位セルに分割して各単位セルには一巡目の単位ログにおける単位セルに対応した番号を付し、
抽出項目を当てはめた単位セルとして選択された単位セルに付された前記番号と一致する番号を付された単位セルに当てはめられた文字列を抽出項目としてCSV形式で出力することを特徴とするテキストログからの特定箇所抽出方法。 - 前記単位ログの選択は、一行完結型またはブロック型の選択肢から選択し、ブロック型を選択した場合にはブロックの開始文字列を指定することを特徴とする請求項1に記載のテキストログからの特定箇所抽出方法。
- 前記抽出項目に該当する前記単位セルの選択は、各単位セルに対応したチェックボックスを表示し、これをチェックすることにより行うことを特徴とする請求項1または請求項2に記載のテキストログからの特定箇所抽出方法。
- 少なくとも入力手段、出力手段、CPU、主記憶部、および補助記憶部を有するコンピュータシステムを介して動作するテキストログからの特定箇所抽出プログラムであって、
前記補助記憶部に記憶され、前記入力手段からの起動命令の入力により前記主記憶部に読み出され、前記CPUを介して、前記表示手段にテキストログの形式選択項目、単位ログ範囲の指定項目、および前記単位ログを単位セルとして分割する区切り文字の選択項目を表示する処理を実行するログ形式解析処理と、
前記入力手段を介して前記テキストログの形式選択項目、単位ログ範囲の指定項目、および区切り文字の選択項目の選択が行われた上で解析命令が入力されることで実行され、前記入力手段を介して選択された各項目の選択内容に従ってテキスト形式で繰り返されるログにおける一巡目の単位ログを単位セル毎に分割し、分割された単位ログの単位セルに番号を付し、番号付けされた単位セル毎に分けられた文字列を前記表示手段に表示するログ抽出項目設定処理と、
前記入力手段を介して前記単位セルの中から抽出項目としての単位セルが選択された上で抽出処理の実行命令が入力されることで実行され、テキスト形式で繰り返される単位ログを順次前記単位セルに分割して前記一巡目に該当する単位ログにおける単位セルに対応した番号を付し、選択された前記抽出項目を当てはめた単位セル付された番号と一致する番号を付された単位セルに当てはめられた文字列をCSV形式で出力する処理を行うログ抽出処理とを有することを特徴とするテキストログからの特定箇所抽出プログラム。 - 前記ログ形式解析処理は、テキストログの形式選択項目、区切り文字の選択項目の選択欄にチェックボックスを表示し、当該チェックボックスに対するチェックの有無によりテキストログの形式、区切り文字を認定することを特徴とする請求項4に記載のテキストログからの特定箇所抽出プログラム。
- 前記ログ抽出項目設定処理は、文字列を当てはめられた単位セルに対応したチェックボックスを表示し、当該チェックボックスに対するチェックの有無により、単位セルに当てはめられた文字列の選択が成されたことを認定することを特徴とする請求項4または請求項5に記載のテキストログからの特定箇所抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009006334A JP2010165141A (ja) | 2009-01-15 | 2009-01-15 | テキストログからの特定箇所抽出方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009006334A JP2010165141A (ja) | 2009-01-15 | 2009-01-15 | テキストログからの特定箇所抽出方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010165141A true JP2010165141A (ja) | 2010-07-29 |
Family
ID=42581254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009006334A Pending JP2010165141A (ja) | 2009-01-15 | 2009-01-15 | テキストログからの特定箇所抽出方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010165141A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015141455A (ja) * | 2014-01-27 | 2015-08-03 | 富士通株式会社 | 情報処理プログラム、情報処理方法及び情報処理装置 |
KR20210076558A (ko) * | 2019-12-16 | 2021-06-24 | 주식회사 엘지유플러스 | 인공지능 서비스 대화모델의 학습 문구 품질 검증 장치 및 방법 |
CN114328076A (zh) * | 2021-09-18 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 日志信息提取方法、装置、计算机设备和存储介质 |
WO2023162271A1 (ja) * | 2022-02-28 | 2023-08-31 | 日本電気株式会社 | 運用管理装置、システム及び方法、並びに、コンピュータ可読媒体 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004348670A (ja) * | 2003-05-26 | 2004-12-09 | Mitsubishi Electric Corp | ログ仲介システム |
JP2007249694A (ja) * | 2006-03-16 | 2007-09-27 | Nec Corp | ログフォーマット変換装置、ログフォーマット変換方法、及びログフォーマット変換プログラム |
JP2008210308A (ja) * | 2007-02-28 | 2008-09-11 | Mitsubishi Electric Corp | ログ統合管理装置、及び、ログ統合管理方法、ログ統合管理プログラム |
-
2009
- 2009-01-15 JP JP2009006334A patent/JP2010165141A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004348670A (ja) * | 2003-05-26 | 2004-12-09 | Mitsubishi Electric Corp | ログ仲介システム |
JP2007249694A (ja) * | 2006-03-16 | 2007-09-27 | Nec Corp | ログフォーマット変換装置、ログフォーマット変換方法、及びログフォーマット変換プログラム |
JP2008210308A (ja) * | 2007-02-28 | 2008-09-11 | Mitsubishi Electric Corp | ログ統合管理装置、及び、ログ統合管理方法、ログ統合管理プログラム |
Non-Patent Citations (3)
Title |
---|
LEE HOLMES, WINDOWS POWERSHELLクックブック, vol. 第1版, JPN6013023691, 21 October 2008 (2008-10-21), JP, pages 146 - 149, ISSN: 0002537270 * |
MARK DODGE, MICROSOFT OFFICE EXCEL 2003 オフィシャルマニュアル, vol. 第1版, JPN6013023689, 12 July 2004 (2004-07-12), JP, pages 785 - 789, ISSN: 0002537269 * |
尾島良司: "WPFでVista時代のUI作成", WEB+DB PRESS, vol. 第36巻, JPN6013023693, 25 January 2007 (2007-01-25), JP, pages 161 - 168, ISSN: 0002537271 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015141455A (ja) * | 2014-01-27 | 2015-08-03 | 富士通株式会社 | 情報処理プログラム、情報処理方法及び情報処理装置 |
KR20210076558A (ko) * | 2019-12-16 | 2021-06-24 | 주식회사 엘지유플러스 | 인공지능 서비스 대화모델의 학습 문구 품질 검증 장치 및 방법 |
KR102356996B1 (ko) * | 2019-12-16 | 2022-01-28 | 주식회사 엘지유플러스 | 인공지능 서비스 대화모델의 학습 문구 품질 검증 장치 및 방법 |
CN114328076A (zh) * | 2021-09-18 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 日志信息提取方法、装置、计算机设备和存储介质 |
CN114328076B (zh) * | 2021-09-18 | 2024-04-30 | 腾讯科技(深圳)有限公司 | 日志信息提取方法、装置、计算机设备和存储介质 |
WO2023162271A1 (ja) * | 2022-02-28 | 2023-08-31 | 日本電気株式会社 | 運用管理装置、システム及び方法、並びに、コンピュータ可読媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5198132B2 (ja) | 状態遷移テスト支援装置、状態遷移テスト支援プログラム、および状態遷移テスト支援方法 | |
CN102067117B (zh) | 显示和操作表的方法 | |
US20170177424A1 (en) | Specific risk toolkit | |
JP2010165141A (ja) | テキストログからの特定箇所抽出方法およびプログラム | |
US8924871B2 (en) | GUI evaluation system, GUI evaluation method, and GUI evaluation program | |
JP2007025497A (ja) | 教育支援プログラムおよび教育支援装置 | |
US20150088861A1 (en) | Comparison And Merging Of IC Design Data | |
US11650217B2 (en) | Data processing system for analytical instrument, and data processing program for analytical instrument | |
CN105051701A (zh) | 设计工具 | |
AU2017218166B2 (en) | Method of computerized presentation of a document set view for auditing information and managing sets of multiple documents and pages | |
JP4215255B2 (ja) | デグレード確認検査方法、デグレード確認検査システム、およびそのためのプログラム | |
KR102067504B1 (ko) | 임시 머리글의 생성을 통해 자동필터 기능을 실행하는 스프레드시트 문서 편집 장치 및 그 동작 방법 | |
CN116737515A (zh) | 闪存参数可视化方法、系统及存储介质 | |
JP2008250808A (ja) | 論理検証方法 | |
JP6433468B2 (ja) | プログラム作成支援方法 | |
CN110378566B (zh) | 信息核对方法、设备、存储介质及装置 | |
JP4693167B2 (ja) | 帳票検索装置、帳票検索方法、プログラム及びコンピュータ読み取り可能な記憶媒体 | |
JP4835791B2 (ja) | Gui評価システム、gui評価方法およびgui評価用プログラム | |
JP5325931B2 (ja) | 影響分析方法および影響分析プログラム | |
JP2010097262A (ja) | データベース生成装置、データベース生成方法及びコンピュータプログラム | |
CN105359111A (zh) | 用户界面检查方法、设备及程序 | |
JP5595224B2 (ja) | ラダープログラム比較方法 | |
US8976378B2 (en) | Pre-flight system for PDF/VT | |
JP7021401B1 (ja) | ロギング支援装置、ロギングシステム、ロギング支援方法及びプログラム | |
CN110298935B (zh) | 一种获取用户操作习惯信息的方法、诊断设备、及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130430 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130522 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131105 |