JP6283442B1 - 解析装置、解析方法、および解析プログラム - Google Patents

解析装置、解析方法、および解析プログラム

Info

Publication number
JP6283442B1
JP6283442B1 JP2017109142A JP2017109142A JP6283442B1 JP 6283442 B1 JP6283442 B1 JP 6283442B1 JP 2017109142 A JP2017109142 A JP 2017109142A JP 2017109142 A JP2017109142 A JP 2017109142A JP 6283442 B1 JP6283442 B1 JP 6283442B1
Authority
JP
Japan
Prior art keywords
cell
document
data
search
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017109142A
Other languages
English (en)
Other versions
JP2018205955A (ja
Inventor
雅章 近藤
雅章 近藤
暢之 二村
暢之 二村
健太 田中
健太 田中
直也 大浦
直也 大浦
翔 壷屋
翔 壷屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FUTURE CORPORATION
Original Assignee
FUTURE CORPORATION
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FUTURE CORPORATION filed Critical FUTURE CORPORATION
Priority to JP2017109142A priority Critical patent/JP6283442B1/ja
Application granted granted Critical
Publication of JP6283442B1 publication Critical patent/JP6283442B1/ja
Publication of JP2018205955A publication Critical patent/JP2018205955A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】ドキュメントを取り込み、一元的に管理する。【解決手段】ドキュメントを解析する解析装置1であって、解析対象のドキュメントと、抽出対象のデータの複数の項目検索値と、前記データの読取方向とを受け付ける受付部11と、前記ドキュメントから、前記項目検索値が設定されたセルを検索する検索部12と、前記項目検索値毎に、当該項目検索値のセルから前記読取方向の各セルに設定されたデータを取得してドキュメントデータを生成する解析部13と、を備える。解析部13は、前記読取方向の各セルが表形式か否かを判別し、表形式でない場合、前記項目検索値のデータが終了したと判別する。【選択図】図1

Description

本発明は、ドキュメントを解析する解析装置、解析方法、および解析プログラムに関する。
ドキュメントを解析する技術として、特許文献1には、ドキュメント・オブジェクト・モデル記述のコンテキストに基づいたトラバースのためのシステムが記載されている。特許文献1では、ドキュメント・オブジェクト・モデル記述として保存されたドキュメント・データを解析してドキュメント・オブジェクト・モデル・ノードを生成し、生成したドキュメント・オブジェクト・モデル・ノードに従って、ドキュメント・データをトラバースする。
特開2008−181484号公報
アプリケーションプログラムの設計および開発において、設計書などのドキュメントが成果物として作成される。大量のドキュメントが作成された場合、ドキュメントのどこに何が書かれているかを把握するのは容易でないため、仕様変更、バグなどが発生した場合など、その影響範囲を大量のドキュメントから調査することは困難である。
また、ドキュメントは、様々なフォーマットで様々な情報が記述されているため、ドキュメントを一元的に管理することは難しい。
本発明は、上記事情に鑑みてなされたものであり、ドキュメントを取り込み、一元的に管理することを目的とする。
本発明は、ドキュメントを解析する解析装置であって、解析対象のドキュメントと、抽出対象のデータの複数の項目検索値と、前記データの読取方向とを受け付ける受付部と、前記ドキュメントから、前記項目検索値が設定されたセルを検索する検索部と、前記項目検索値毎に、当該項目検索値のセルから前記読取方向の各セルに設定されたデータを取得してドキュメントデータを生成する解析部と、を備え、前記解析部は、前記読取方向の各セルが表形式か否かを判別し、表形式でない場合、前記項目検索値のデータが終了したと判別する。
本発明は、ドキュメントを解析する解析方法であって、解析対象のドキュメントと、抽出対象のデータの複数の項目検索値と、前記データの読取方向とを受け付ける受付ステップと、前記ドキュメントから、前記項目検索値が設定されたセルを検索する検索ステップと、前記項目検索値毎に、当該項目検索値のセルから前記読取方向の各セルに設定されたデータを取得してドキュメントデータを生成する解析ステップと、を行い、前記解析ステップは、前記読取方向の各セルが表形式か否かを判別し、表形式でない場合、前記項目検索値のデータが終了したと判別する。
本発明は、ドキュメントを解析する解析プログラムであって、コンピュータに、解析対象のドキュメントと、抽出対象のデータの複数の項目検索値と、前記データの読取方向とを受け付ける受付ステップ、前記ドキュメントから、前記項目検索値が設定されたセルを検索する検索ステップ、および、前記項目検索値毎に、当該項目検索値のセルから前記読取方向の各セルに設定されたデータを取得してドキュメントデータを生成する解析ステップを実行させ、前記解析ステップは、前記読取方向の各セルが表形式か否かを判別し、表形式でない場合、前記項目検索値のデータが終了したと判別する。
本発明によれば、ドキュメントを取り込み、一元的に管理することができる。
本実施形態のドキュメント解析システムの構成例を示すブロック図である。 ドキュメント解析処理の一例を示すフローチャートである。 ドキュメントと、解析結果(ドキュメントデータ)の一例を示す図である。 リポジトリ生成処理の一例を示すフローチャートである。 進捗情報の一例を示す図である。 ソースコードの一例を示す図である。 open数、close数および乖離を集計したグラフである。 予測ソースコード行数と、実績ソースコード行数の推移を示すグラフである。 EVM(Earned Value Management)の推移を示すグラフである。
以下、本発明の実施の形態について、図面を参照して説明する。
図1は、本発明の実施形態に係るドキュメント解析システムの全体を示すシステム構成図である。図示するドキュメント解析システムは、解析サーバ1と、DB(データベース)2とを備える。
解析サーバ1は、アプリケーションプログラムの設計書などのドキュメントを解析する装置であって、受付部11と、検索部12と、解析部13と、生成部14と、集計部15とを備える。
受付部11は、解析対象のドキュメントと、抽出対象のデータの複数の項目検索値と、前記データの読取方向とを受け付ける。また、受付部11は、ドキュメントの中の表の付近に設定される表検索値および検索範囲を受け付けてもよい。また、受付部11は、アプリケーションプログラムの進捗情報およびソースコードを受け付けてよい。
検索部12は、ドキュメントから、項目検索値が設定されたセルを検索する。また、検索部12は、項目検索値が設定されたセルを、表検索値が設定されたセルから検索範囲内で検索してもよい。
解析部13は、項目検索値毎に、当該項目検索値のセルから前記読取方向の各セルに設定されたデータを取得してドキュメントデータを生成する。また、解析部13は、読取方向の各セルが表形式か否かを判別し、表形式でない場合、項目検索値のデータが終了したと判別する。
生成部14は、進捗情報、ソースコードおよびドキュメントデータの各レコードを、機能IDとその他のデータとに編集して、進捗情報、ソースコードおよびドキュメントデータを統合したリポジトリ(各種のデータを一元的に纏めた、ファイルまたはデータベース)を生成する。この場合、項目検索値には、アプリケーションプログラムの機能IDを含む。集計部15は、リポジトリを、機能ID毎に集計する。
DB2には、入力された設計書などのドキュメント21と、ドキュメント21を解析して生成したドキュメントデータ22と、入力された進捗情報23およびソースコード24と、ドキュメントデータ22、進捗情報23およびソースコード24とに基づいて生成視されたリポジトリ25とが格納されている。
上記説明した解析サーバ1は、例えば、CPU(プロセッサ)と、メモリと、ハードディスク等の外部記憶装置と、入力装置と、出力装置とを備えた汎用的なコンピュータシステムを用いることができる。このコンピュータシステムにおいて、CPUがメモリ上にロードされた解析サーバ1用のプログラムを実行することにより、解析サーバ1の各機能が実現される。また、解析サーバ1用のプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD−ROMなどのコンピュータ読取り可能な記録媒体に記憶することも、ネットワークを介して配信することもできる。なお、図1に示す解析サーバ1が、DB2を備えることとしてもよい。
次に、本実施形態のドキュメント解析方法を説明する。
図2は、本実施形態のドキュメント解析方法の一例を示すフローチャートである。ユーザは、解析対象のドキュメントおよび解析に必要な設定情報を解析サーバ1に入力する。
解析サーバ1の受付部11は、解析対象のドキュメントの入力を受け付け、DB12に格納する(S11)。ドキュメントは、本実施形態では、アプリケーションプログラムの設計・開発に関するドキュメントであって、例えば設計書などである。また、ドキュメントは、一般的な表形式(例えば、エクセルなど表計算ソフト)のフォーマットで作成されていればよい。表形式のフォーマットは、データを入力するセルで構成されている。本実施形態では、ドキュメントのフォーマットに独自の制約がないため、既存の様々なドキュメントを対象とすることができる。
また、受付部11は、設定情報として表検索値Tを受け付ける(S12)。表検索値Tは、ドキュメントの中に記載された表(テーブル)を検索するための設定情報であって、後述する項目検索値C(m)が設定されたセルの検索を容易にするためのものである。具体的には、ユーザは、ドキュメントの中に記載されている表の付近のセルに設定されている所定のデータ(文字列、文字、記号など)が存在する場合、当該所定のデータを表検索値Tとして入力する。なお、表検索値Tは必須の設定情報ではない。
また、受付部11は、設定情報として複数の項目検索値C(m)を受け付ける(S13)。項目検索値Cは、表の項目名(見出し、ヘッダ)である。mは、ユーザが入力した項目検索値Cの数を示す。なお、本実施形態では、項目検索値C(m)には、アプリケーションプログラムの各機能を識別するための機能ID(機能識別情報、機能名称など)が含まれている。
また、受付部11、設定情報として読取範囲Rを受け付ける(S14)。読取範囲Rは、項目検索値C(m)の検索範囲であって、項目検索値C(m)が設定されたセルの検索を容易にするための設定情報である。検索部12は、表検索値Tが設定されたセルから読取範囲Rの範囲で、項目検索値C(m)が設定されたセルを検索する。読取範囲Rには、例えば、表検索値Tが設定されたセルを基点として所定の大きさの領域(r個のセル×s個のセル)が設定される。なお、読取範囲Rは、必須の設定情報ではない。
また、受付部11は、設定情報として読取方向Wを受け付ける(S15)。読取方向Wには、項目検索値C(m)が設定されたセルから、当該項目検索値C(m)に対応するデータを読み取る方向(上下左右のいずれか1つ)が指定される。検索部12は、項目検索値C(m)のデータを取得する際に、項目検索値C(m)が設定されたセルから、指定された読取方向W(例えば、下方向)に各セルのデータを読み込み、取得する。
そして、検索部12は、S11で入力されたドキュメント内を表検索値Tで検索することで、ドキュメントの中に記載された表を検索する(S16)。具体的には、検索部12は、表検索値Tに一致するデータが設定された全てのセルX(n)の位置を取得する。nは、表検索値Tに一致するセルの数である。この場合、ドキュメントにはn個の表が存在すると想定される。検索部12は、表検索値Tに一致するn個のセルX(n)について、以降の処理を繰り返し行う。図2では、検索部12がi(変数)に初期値「1」を設定することで(S17)、セルX(1)〜セルX(n)のn回の処理が行われる。
検索部12は、iがn+1より小さいか否か、すなわち、全てのセルX(n)について処理を終了したか否かを判定する(S18)。n+1より小さい場合(S18:YES)、検索部12は、セルX(i)の位置をY(変数)に設定し(S19)、Yの隣接セルの位置(座標)をZ(変数)に設定する(S20)。
そして、検索部12は、隣接セルZが表形式で、かつ、隣接セルZが読取範囲R内か否かを判別する(S21)。隣接セルZが表形式か否かは、隣接セルZが表の範囲内か否か、すなわち、隣接セルZが表を構成しているか否かを意味する。例えば、検索部12は、隣接セルZの周囲の罫線の有無、または、隣接セルの塗りつぶし(ハッチング)の有無により、隣接セルZが表形式か否かを判別する。具体的には、検索部12は、隣接セルZの周囲に罫線が引かれている場合、表形式であるとして判別し、隣接セルの周囲に罫線が引かれていない場合、表形式でないと判別する。また、検索部12は、隣接セルZが所定の色で塗りつぶされている場合、表形式であると判別し、隣接セルZが所定の色で塗りつぶされていない場合、表形式でないと判別する。
S21の2つの条件の少なくとも1つを満たさない場合(S21:NO)、iに1を加算し(S31)、S18に戻り、次の表検索値T(i)の処理を行う。
S21の2つの条件の両方を満たす場合(S21:YES)、検索部12は、m個の項目検索値C(m)について、以降の処理を繰り返し行う。図2では、検索部12は、j(変数)に初期値「1」を設定することで(S22)、m回の処理が行われる。
検索部12は、jがm+1より小さいか否か、すなわち、全ての項目検索値C(m)について処理を終了したか否かを判定する(S23)。m+1より小さい場合(S23:YES)、検索部12は、隣接セルZに設定されたデータが項目検索値C(j)と一致するか否かを判別する(S24)。
隣接セルZのデータが項目検索値C(j)と一致しない場合(S24:NO)、検索部12は、jに1を加算し(S32)、S23およびS24の処理を繰り返し行う。隣接セルZのデータが全ての項目検索値C(j)と一致しない場合(S23:NO)、検索部12は、隣接セルZに隣接する次の隣接セルの検索を行うために、隣接セルZの位置をYに設定し(S33)、S20に戻る。
隣接セルZのデータが項目検索値C(j)と一致する場合(S24:YES)、解析部13は、隣接セルZの位置をH(変数)に設定し(S25)、隣接セルZのデータ(すなわち、項目検索値C(j))を、ドキュメントデータとしてDB2に出力する(S26)。これにより、項目名(見出し、ヘッダー)が出力される。そして、解析部13は、Hの位置のセルから読取方向Wに隣接するセルの位置をDと設定し、セルDが表形式か否かを判別する(S28)。セルDが表形式か否かは、S21で説明したとおりである。解析部13は、セルDが表形式の場合(S28:YES)、セルDに設定されたデータを、S26で出力した項目検索値C(j)に対応付けて、ドキュメントデータとしてDB2に出力する(S29)。これにより、項目検索値C(j)の項目名に対応するデータ(項目値)が出力される。
そして、解析部13は、セルDの位置をHに設定し(S30)、S27に戻り、以降の処理をセルDが表形式でなくなるまで繰り返し行う。セルDが表形式でない場合(S28:NO)、解析部13は、項目検索値C(j)の項目名に対応する全てのセルのデータが終了したと判別する。そして、解析部13は、隣接セルZに隣接する次の隣接セルの検索を行うために、隣接セルZの位置をYに設定し(S33)、S20に戻る。
以上説明した図2の処理により、設計書などの各種のドキュメントを解析し、ユーザが指定したに項目検索値C(j)のデータを抽出したドキュメントデータ(ドキュメントのリポジトリ)を生成することができる。
図3は、図2の解析対象のドキュメントと、解析結果であるドキュメントデータの一例を示す図である。図3に示すドキュメント21は、設計書の一部であって、3つ表が設定されている。ユーザは、表検索値Tに、各表の付近に設定された記号「*」を設定する。また、ユーザは、項目検索値C(m)に、「機能ID」、「機能」、「パラメータ」、「実行区分」を設定し、読取方向Wを「下方向」に設定する。表検索値Tには正規表現やワイルドカード指定が可能で、項目検索値C(m)は複数の値を指定可能。項目検索値C(m)は完全一致、部分一致を選択可能。これらの機能で項目名の揺らぎに対応することができる。
これにより、解析サーバ1は、図2の処理を行うことで、ドキュメント21の解析結果であるドキュメントデータ22を生成し、DB2に記憶する。このように、本実施形態では、ドキュメント21の複数の表に分散して設定された各項目のデータを、1つのドキュメントデータ22に統合することができる。
次に、図2の解析結果であるドキュメントデータと、進捗情報と、ソースコートとを統合したリポジトリを生成する処理を説明する。
図4は、リポジトリ生成処理の一例を示すフローチャートである。図示する例では、解析サーバ1は、ドキュメントデータ、進捗情報、およびソースコードを、機能ID単位で集計可能なように編集する。
解析サーバ1の受付部11は、ユーザが入力した機能IDの書式FF(データ形式、桁数など)を受け付ける(S51)。そして、解析サーバ1は、進捗情報の処理(S61〜S68)、ドキュメントデータの処理(S71〜S78)、ソースコードの処理(S81〜S88)の処理をそれぞれ行う。
図5は、進捗情報の一例を示す図である。進捗情報は、アプリケーションプログラムの開発に必要に各種作業の進捗状況に関する情報である。図示する進捗情報は、機能IDと、機能と、作業項目(例えば、画面設計書作成など)、作業開始日、作業終了日、終了フラグなどを対応づけた表形式のフォーマットで記述されている。
受付部11は、ユーザが入力した進捗情報における機能IDの定義箇所FTを受け付ける(S61)。機能IDの定義箇所FTは、進捗情報の中で機能IDが設定されているセルの列、カラムなどである。図5に示す進捗情報の場合、受付部11は、機能IDの定義箇所FTとして、1列目を受け付ける。
そして、受付部14は、進捗情報の入力を受け付け、DB2に格納する(S62)。進捗情報のレコードを、ここではRt(n)とする。nは、進捗情報のレコード数を示す。
そして、生成部14は、i(変数)に初期値「1」を設定し(S63)、iがn+1より小さいか否か、すなわち、全てのレコードについての処理を終了したか否かを判定する(S64)。iがn+1より小さい場合(S64:YES)、生成部14は、Rt(i)における機能IDの定義箇所FTのセルに設定されたデータを、機能IDの書式FFで抽出し、Fとする(S65)。
また、生成部14は、Rt(i)における機能IDの定義箇所FT以外の各セルのデータをXとし(S66)、Rt(i)を機能IDのデータFと、機能ID以外のデータXとに編集して出力する(S67)。そして、生成部14は、iに1を加算し、S64に戻り以降の処理をn回繰り返し行う。これにより、進捗情報の全てのレコードについて、機能IDとその他のデータとが対応付けて、リポジトリとしてDB2に出力される。
ドキュメントデータについては、受付部11は、ユーザが入力したドキュメントデータにおける機能IDの定義箇所FDを受け付ける(S71)。そして、生成部14は、図2のドキュメント解析の解析結果であるドキュメントデータをDB2から読み込む(S72)。ドキュメントデータのレコードを、ここではRd(m)とする。mは、ドキュメントデータのレコード数を示す。
そして、生成部14は、j(変数)に初期値「1」を設定し(S73)、変数jがm+1より小さいか否か、すなわち、全てのレコードについての処理を終了したか否かを判定する(S74)。jがm+1より小さい場合(S74:YES)、生成部14は、Rd(j)における機能IDの定義箇所FDのセルのデータを機能IDの書式FFで抽出し、Fとする(S75)。
また、生成部14は、Rd(j)における機能IDの定義箇所FD以外の各セルのデータをYとし(S76)、Rd(j)を機能IDのデータFと、機能ID以外のデータYとに編集して出力する(S77)。そして、生成部14は、jに1を加算し、S74に戻り以降の処理をm回繰り返し行う。これにより、ドキュメントデータの全てのレコードについて、機能IDとその他のデータとが対応付けて、リポジトリとしてDB2に出力される。
図6は、アプリケーションプログラムのソースコード(ソースコードファイル)の一例を示す図である。受付部11は、ユーザが入力したソースコードにおける機能IDの定義箇所FSを受け付ける(S81)。また、受付部14は、ソースコードの入力を受け付け、DB2に格納する(S82)。なお、図6に示すように、機能IDが設定されていないソースコードの場合、生成部14は、ソースコードのファイル名などから機能IDを取得し、ソースコードの各行(レコード)に機能IDを補完して、表形式のフォーマットにソースコードを編集する(S82)。ソースコードのレコードを、ここではRs(l)とする。lは、ソースコードのレコード数(行数)を示す。
そして、生成部14は、変数kに初期値「1」を設定し(S83)、kがl+1より小さいか否か、すなわち、全てのレコードについての処理を終了したか否かを判定する(S84)。kがl+1より小さい場合(S84:YES)、生成部14は、Rs(k)における機能IDの定義箇所FDのセルのデータを機能IDの書式FFで抽出し、Fとする(S85)。
また、生成部14は、Rs(k)における機能IDの定義箇所FD以外の各セルのデータ(ソースコード)をZとし(S86)、Rs(k)を機能IDのデータFと、機能ID以外のデータZとに編集して出力する(S77)。そして、生成部14は、kに1を加算し、S84に戻り以降の処理をl回繰り返し行う。これにより、ソースコードの全てのレコードについて、機能IDとその他のデータとが対応付けて、リポジトリとしてDB2に出力される。
進捗情報の処理(S61〜S68)と、ドキュメントデータの処理(S71〜S78)と、ソースコードの処理(S81〜S88)とを行うことにより、DB2には、アプリケーションプログラムに関するリポジトリが生成される。すなわち、解析サーバ1は、進捗情報、ソースコードおよびドキュメントデータを統合し、機能ID毎に集計可能なリポジトリを構築する。
そして、集計部15は、リポジトリを用いてアプリケーションプログラムに関する様々な管理情報を生成する(S91)。
図7〜図9に、管理情報の例を示す。図7は、進捗情報を、機能ID毎に、openの数、closeの数、および、乖離を集計したグラフである。openの数は、進捗情報の全レコード数(進捗管理の対象となる全作業項目の数)である。closeの数は、進捗情報の中で作業が終了したレコードの数(例えば、終了フラグが設定されているレコードの数)である。乖離は、openの数からcloseの数を減算した差分であって、終了していない作業項目の数を示す。集計部15は、DB2のリポジトリから進捗情報を読み出し、openの数およびcloseの数をカウントするとともに、乖離を算出して、図7に示すグラフを生成する。これにより、機能毎の進捗状況を容易に把握することができる。
図8は、ある機能IDの予測ソースコード行数と、実績ソースコード行数の推移を示すグラフである。集計部15は、予測ソースコード行数を、DB2のリポジトリのドキュメントデータを用いて取得する。具体的には、集計部15は、指定された機能IDのドキュメントデータのレコード数を所定の期日毎に集計(累積)し、集計したレコード数をn倍した値を予測ソースコード行数とする。これは、ドキュメントデータの1レコード(設計書の表の1行)に対して、ソースコードはn行作成されると仮定したものである。また、集計部15は、実績ソースコード行数を、DB2のリポジトリのソースコードを用いて取得する。具体的には、集計部15は、指定された機能IDのソースコードのレコード数を所定の期日毎に集計(累積)した値を、実績ソースコード行数とする。
なお、リポジトリのドキュメントデータおよびソースコードの各レコードには、日付が設定されている、あるいは解析部13または生成部14により、データの更新履歴などから日付が補完されているものとする。図8に示すグラフにより、ある機能におけるソースコードの作成状況を容易に把握することができる。
図9は、ある機能IDのEVM(Earned Value Management)のグラフである。EVMは、プロジェクトマネージメントにおいて進捗状況の管理を行う手法であって、作業の到達度をコストなどの価値に換算したEV(Earned Value:出来高)の指標で把握する。PV(Planned Value:計画値)は、予定工数を所定の期日ごとに集計したものである。EVは、予定工数×進捗率の増減分を、所定の期日ごとに集計したものである。AC(Actual Cost:実績値)は、実際にかかった工数を期日ごとに集計したものである。EVMでは現在のコスト・スケジュールの両方の進捗状況を統一的な尺度で把握することができ、また、ある時点での計画とのズレの大きさから、完成までの総時間・総コストを予測することもできる。
以上説明した本実施形態では、解析対象のドキュメントと、抽出対象のデータの複数の項目検索値と、前記データの読取方向とを受け付ける受付部と、前記ドキュメントから、前記項目検索値が設定されたセルを検索する検索部と、前記項目検索値毎に、当該項目検索値のセルから前記読取方向の各セルに設定されたデータを取得してドキュメントデータを生成する解析部と、を備え、前記解析部は、前記読取方向の各セルが表形式か否かを判別し、表形式でない場合、前記項目検索値のデータが終了したと判別する。
これにより、本実施形態では、ドキュメントを取り込み、一元的に管理すること、すなわちドキュメントのリポジトリを構築することができる。具体的には、設計書などの各種のドキュメントを解析し、ユーザが指定したに項目検索値C(m)のデータを抽出したドキュメントデータを生成することができる。
このため、本実施形態では、ドキュメントが大量にある場合であっても、仕様変更、バグなどが発生した場合などに、その影響範囲の調査に要する工数を削減し、アプリケーションプログラムの生産性を向上するとともに、品質を向上することができる。
また、本実施形態のドキュメントは、一般的な表形式(例えば、エクセルなど表計算ソフト)のフォーマットで作成されていればよく、ドキュメントのフォーマットに独自の制約がないため、これから新規に作成するドキュメントだけでなく、既存のドキュメントも対象とすることができる。
また、本実施形態では、ドキュメントの中の表の付近に設定される表検索値および検索範囲を受け付け、項目検索値が設定されたセルを、表検索値が設定されたセルから検索範囲内で検索する。これにより、本実施形態では、項目検索値C(m)が設定されたセルを、容易に検索することができる。
また、本実施形態では、進捗情報、ソースコードおよびドキュメントデータの各レコードを、機能IDとその他のデータとに編集して、進捗情報、ソースコードおよびドキュメントデータを統合したリポジトリを生成する。これにより、アプリケーションプログラムに関する情報を一元管理し、全体の関連性や、品質などを見える化し、生産性および品質を向上することができる。
また、本実施形態では、リポジトリを、機能ID毎に集計することで、アプリケーションプログラムの機能毎に、定量的な進捗管理や、生産性を容易に把握することができる。
なお、本発明は上記実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
1 :解析サーバ
11:受付部
12:検索部
13:解析部
14:生成部
15:集計部
2 :DB(データベース)

Claims (3)

  1. ドキュメントを解析する解析装置であって、
    解析対象のドキュメントと、抽出対象のデータの複数の項目検索値と、前記データの読取方向とを受け付ける受付部と、
    前記ドキュメントから、前記項目検索値が設定されたセルを検索する検索部と、
    前記項目検索値毎に、当該項目検索値のセルから前記読取方向の各セルに設定されたデータを取得してドキュメントデータを生成する解析部と、を備え、
    前記解析部は、前記読取方向の各セルが表形式か否かを判別し、表形式でない場合、前記項目検索値のデータが終了したと判別し、
    前記受付部は、前記ドキュメントの中の表の付近に設定される表検索値および検索範囲を受け付け、
    前記検索部は、前記項目検索値が設定されたセルを、前記表検索値が設定されたセルから前記検索範囲内で検索すること
    を特徴とする解析装置。
  2. ドキュメントを解析する解析方法であって、
    解析対象のドキュメントと、抽出対象のデータの複数の項目検索値と、前記データの読取方向とを受け付ける受付ステップと、
    前記ドキュメントから、前記項目検索値が設定されたセルを検索する検索ステップと、
    前記項目検索値毎に、当該項目検索値のセルから前記読取方向の各セルに設定されたデータを取得してドキュメントデータを生成する解析ステップと、を行い、
    前記解析ステップは、前記読取方向の各セルが表形式か否かを判別し、表形式でない場合、前記項目検索値のデータが終了したと判別し、
    前記受付ステップは、前記ドキュメントの中の表の付近に設定される表検索値および検索範囲を受け付け、
    前記検索ステップは、前記項目検索値が設定されたセルを、前記表検索値が設定されたセルから前記検索範囲内で検索すること
    を特徴とする解析方法。
  3. ドキュメントを解析する解析プログラムであって、
    コンピュータに、
    解析対象のドキュメントと、抽出対象のデータの複数の項目検索値と、前記データの読取方向とを受け付ける受付ステップ、
    前記ドキュメントから、前記項目検索値が設定されたセルを検索する検索ステップ、および、
    前記項目検索値毎に、当該項目検索値のセルから前記読取方向の各セルに設定されたデータを取得してドキュメントデータを生成する解析ステップを実行させ、
    前記解析ステップは、前記読取方向の各セルが表形式か否かを判別し、表形式でない場合、前記項目検索値のデータが終了したと判別し、
    前記受付ステップは、前記ドキュメントの中の表の付近に設定される表検索値および検索範囲を受け付け、
    前記検索ステップは、前記項目検索値が設定されたセルを、前記表検索値が設定されたセルから前記検索範囲内で検索すること
    を特徴とする解析プログラム。
JP2017109142A 2017-06-01 2017-06-01 解析装置、解析方法、および解析プログラム Active JP6283442B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017109142A JP6283442B1 (ja) 2017-06-01 2017-06-01 解析装置、解析方法、および解析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017109142A JP6283442B1 (ja) 2017-06-01 2017-06-01 解析装置、解析方法、および解析プログラム

Publications (2)

Publication Number Publication Date
JP6283442B1 true JP6283442B1 (ja) 2018-02-21
JP2018205955A JP2018205955A (ja) 2018-12-27

Family

ID=61231493

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017109142A Active JP6283442B1 (ja) 2017-06-01 2017-06-01 解析装置、解析方法、および解析プログラム

Country Status (1)

Country Link
JP (1) JP6283442B1 (ja)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200276A (ja) * 1993-12-28 1995-08-04 Nippon Steel Corp ソフトウェア資産管理装置
JP2001154836A (ja) * 1999-11-29 2001-06-08 Nec Software Hokuriku Ltd プログラム開発段階検索システム及びプログラム開発段階検索方法
JP2004139588A (ja) * 2002-09-25 2004-05-13 Smg Kk プロジェクト管理装置、プロジェクト管理システムおよびプログラム
JP2006134105A (ja) * 2004-11-05 2006-05-25 Toshiba Corp 帳票読取装置
JP2007072882A (ja) * 2005-09-08 2007-03-22 Hitachi Computer Peripherals Co Ltd 帳票読取装置、プログラム及び帳票読取システム
JP2009099090A (ja) * 2007-10-19 2009-05-07 Pfu Ltd 帳票キーワード登録装置、帳票キーワード登録方法、および、プログラム
JP2009151676A (ja) * 2007-12-21 2009-07-09 Shinko Electric Ind Co Ltd データ処理装置、データ処理方法、プログラム
JP2010097263A (ja) * 2008-10-14 2010-04-30 Keyence Corp データベース生成装置、データベース生成方法及びコンピュータプログラム
JP2010271968A (ja) * 2009-05-22 2010-12-02 Towa System Inc リポジトリ管理サーバ
JP2011150466A (ja) * 2010-01-20 2011-08-04 Fujitsu Ltd 文字列認識装置、文字列認識プログラムおよび文字列認識方法
US20130275451A1 (en) * 2011-10-31 2013-10-17 Christopher Scott Lewis Systems And Methods For Contract Assurance

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200276A (ja) * 1993-12-28 1995-08-04 Nippon Steel Corp ソフトウェア資産管理装置
JP2001154836A (ja) * 1999-11-29 2001-06-08 Nec Software Hokuriku Ltd プログラム開発段階検索システム及びプログラム開発段階検索方法
JP2004139588A (ja) * 2002-09-25 2004-05-13 Smg Kk プロジェクト管理装置、プロジェクト管理システムおよびプログラム
JP2006134105A (ja) * 2004-11-05 2006-05-25 Toshiba Corp 帳票読取装置
JP2007072882A (ja) * 2005-09-08 2007-03-22 Hitachi Computer Peripherals Co Ltd 帳票読取装置、プログラム及び帳票読取システム
JP2009099090A (ja) * 2007-10-19 2009-05-07 Pfu Ltd 帳票キーワード登録装置、帳票キーワード登録方法、および、プログラム
JP2009151676A (ja) * 2007-12-21 2009-07-09 Shinko Electric Ind Co Ltd データ処理装置、データ処理方法、プログラム
JP2010097263A (ja) * 2008-10-14 2010-04-30 Keyence Corp データベース生成装置、データベース生成方法及びコンピュータプログラム
JP2010271968A (ja) * 2009-05-22 2010-12-02 Towa System Inc リポジトリ管理サーバ
JP2011150466A (ja) * 2010-01-20 2011-08-04 Fujitsu Ltd 文字列認識装置、文字列認識プログラムおよび文字列認識方法
US20130275451A1 (en) * 2011-10-31 2013-10-17 Christopher Scott Lewis Systems And Methods For Contract Assurance

Also Published As

Publication number Publication date
JP2018205955A (ja) 2018-12-27

Similar Documents

Publication Publication Date Title
CN110532019B (zh) 一种软件代码片段历史追溯的方法
US10089390B2 (en) System and method to extract models from semi-structured documents
CN111627552B (zh) 一种医疗流式数据血缘关系分析、存储方法及装置
US11016758B2 (en) Analysis software managing system and analysis software managing method
CN110442847B (zh) 基于代码仓库过程管理的代码相似性检测方法及装置
CN109558166B (zh) 一种面向缺陷定位的代码搜索方法
CN107148616A (zh) 用于分布式版本控制的高效注释系统
CN108563783A (zh) 一种基于大数据的财务分析管理系统及方法
CN110597796A (zh) 基于全生命周期的大数据实时建模方法及系统
Widad et al. Quality Anomaly Detection Using Predictive Techniques: An Extensive Big Data Quality Framework for Reliable Data Analysis
JP6898542B2 (ja) 情報処理装置、その制御方法、及びプログラム
US10360208B2 (en) Method and system of process reconstruction
Riva et al. An SQL-Based Declarative Process Mining Framework for Analyzing Process Data Stored in Relational Databases
CN108874395A (zh) 一种组件化流处理过程中的硬编译方法及装置
Anda et al. A Safety Data Model for data analysis and decision making
JP2013003715A (ja) トレース情報管理装置、管理方法およびプログラム
WO2024049796A1 (en) Systems and methods for legacy mbse diagram data importation using element specific ml models and schema templates
JP6283442B1 (ja) 解析装置、解析方法、および解析プログラム
CN107291749B (zh) 一种数据指标关联关系的确定方法及装置
CN104462461A (zh) 对表单进行排查空值处理的方法及装置
CN117093556A (zh) 日志分类方法、装置、计算机设备及计算机可读存储介质
CN104809145B (zh) 层次式数据分析方法
JP5690472B2 (ja) データ抽出システム
JP7022472B1 (ja) データ管理システム、データ管理方法及びデータ管理プログラム
CN113312027A (zh) 工业系统开发方法、电子设备及存储介质

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180126

R150 Certificate of patent or registration of utility model

Ref document number: 6283442

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250