JP6390085B2

JP6390085B2 - プログラム、情報処理装置、及び、情報処理方法

Info

Publication number: JP6390085B2
Application number: JP2013208574A
Authority: JP
Inventors: 崇志西谷; 高大矢和田; 誠佐々原; 志乃廣澤
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2013-10-03
Filing date: 2013-10-03
Publication date: 2018-09-19
Anticipated expiration: 2033-10-03
Also published as: JP2015072637A

Description

本発明は、コンピュータに各種処理を実行させるプログラム、情報処理装置、及び、情報処理方法に関する。

従来、文書または各種帳票に表が記載されている場合に、当該表のイメージデータから必要なデータを整理して読み取る表処理方法が提案されている（例えば、特許文献１参照）。

特開平１０−１１６３１４号公報

しかしながら、従来の技術では、データの属性について精度良く決定することができない。

一つの側面では、本発明はデータの属性を精度良く決定することが可能なプログラム等を提供することを目的とする。

本願に開示するプログラムは、コンピュータに、データ群から解析対象となる対象データを抽出し、複数方向に隣接するデータの存否を方向毎に判定し、隣接する各方向のデータの存否の組み合わせごとに、項目と数値データとを含む属性、及び、前記項目と前記数値データそれぞれの評価値を記憶した記憶部を参照し、前記対象データの属性及び評価値を読み出し、抽出した対象データの内容、位置、読み出した属性及び評価値に基づき、前記対象データの候補となる属性及び属性の評価値を決定する処理を実行させる。

一つの側面では、データの属性を精度良く決定することが可能となる。

情報処理装置のハードウェア群を示すブロック図である。帳票データのイメージを示す説明図である。帳票データの一部を示す説明図である。位置テーブルのレコードレイアウトを示す説明図である。隣接テーブルのレコードレイアウトを示す説明図である。数値テーブルのレコードレイアウトを示す説明図である。キーワードテーブルのレコードレイアウトを示す説明図である。対象データテーブルのレコードレイアウトを示す説明図である。対象データの抽出処理手順を示すフローチャートである。対象データの抽出処理手順を示すフローチャートである。位置に基づく属性及び評価値決定処理の手順を示すフローチャートである。隣接対象データの存否に基づく属性及び評価値決定処理の手順を示すフローチャートである。対象データの文字及び数字内容に基づく属性及び評価値決定処理の手順を示すフローチャートである。対象データの文字及び数字内容に基づく属性及び評価値決定処理の手順を示すフローチャートである。合計評価値の算出処理手順を示すフローチャートである。対象データ名の決定処理手順を示すフローチャートである。対象データ名の決定処理手順を示すフローチャートである。帳票データのイメージを示す説明図である。実施の形態２に係る対象データテーブルのレコードレイアウトを示す説明図である。設定タブの表示処理手順を示すフローチャートである。評価値の補正処理手順を示すフローチャートである。評価値の補正処理手順を示すフローチャートである。上述した形態のコンピュータの動作を示す機能ブロック図である。実施の形態３に係るコンピュータのハードウェア群を示すブロック図である。

実施の形態１
以下実施の形態を、図面を参照して説明する。図１は情報処理装置１のハードウェア群を示すブロック図である。情報処理装置１は例えば、パーソナルコンピュータ、サーバコンピュータ、携帯電話機、スマートフォン、ゲーム機またはＰＤＡ（Personal Digital Assistant）等である。以下では、情報処理装置１をパーソナルコンピュータ１（以下、コンピュータ１という）に適用する例を挙げて説明する。コンピュータ１は制御部としてのＣＰＵ（Central Processing Unit）１１、ＲＡＭ(Random Access Memory)１２、入力部１３、表示部１４、時計部１８、記憶部１５、及び通信部１６等を含む。ＣＰＵ１１は、バス１７を介してハードウェア各部と接続されている。ＣＰＵ１１は記憶部１５に記憶された制御プログラム１５Ｐに従いハードウェア各部を制御する。ＲＡＭ１２は例えばＳＲＡＭ（Static RAM）、ＤＲＡＭ(Dynamic RAM)、フラッシュメモリ等である。ＲＡＭ１２は、記憶部としても機能し、ＣＰＵ１１による各種プログラムの実行時に発生する種々のデータを一時的に記憶する。

入力部１３はマウスまたはキーボード、マウスまたはタッチパネル等の入力デバイスであり、受け付けた操作情報をＣＰＵ１１へ出力する。表示部１４は液晶ディスプレイまたは有機ＥＬ（electroluminescence）ディスプレイ等であり、ＣＰＵ１１の指示に従い各種情報を表示する。通信部１６は通信モジュールであり、インターネットまたは公衆回線網等の通信網を介して図示しない他のコンピュータとの間で情報の送受信を行う。

時計部１８は日時をＣＰＵ１１へ出力する。記憶部１５はハードディスクまたは大容量メモリであり、上述した制御プログラム１５Ｐの他、位置テーブル１５１、隣接テーブル１５２、数値テーブル１５３、キーワードテーブル１５４及び対象データテーブル１５５等を含む。なお、本実施形態ではコンピュータ１の記憶部１５に各種テーブルを記憶する例を挙げたがこれに限るものではない。例えば通信網を介して接続される図示しないデータベースサーバ等に上述した各種テーブルを適宜記憶しても良い。この場合、ＣＰＵ１１は、必要に応じてデータベースサーバにアクセスし、データの書き込み及び読み出しを行う。ＣＰＵ１１は、記憶部１５からデータ群を読み出し、制御プログラム１５Ｐに従い各データについて解析を行う。以下詳細を説明する。

図２は帳票データのイメージを示す説明図である。帳票データは例えばエクセル（登録商標）等の表計算ソフトウェア、文書入力ソフトウェアまたはＰＤＦ（Portable Document Format：登録商標）等のファイル閲覧ソフトウェアにより表示されるデータ群である。タイトル、項目及び数値データ等の各種データ群が表内にテキスト形式で記述されている。図２の例は企業内従業員の個人就業実績を示している。中央上部に表示されている「個人就業実績」は帳簿データのタイトルであり、タイトル左下には、職員氏名「日本花子」と、「日本花子」を特定するための固有の識別情報（以下、職員ＩＤという）と、が記述されている。

右上隅の「第２開発部」は職員の所属部署を示す。職員名の下側の表には、当該職員の出勤、退勤、所定内労働（以下、所定内という）、残業、休日出勤等の項目と、各項目に対応付けて、出勤時間、退勤時刻、所定内時間、残業時間、休日出勤時間等の数値データが記述されている。下側には項目「総計」に対応付けて、所定内時間、残業時間、休日出勤時間等の合計に係る数値データが記述されている。ＣＰＵ１１は、記憶部１５に記憶された、または、通信部１６を介して受信した帳票データを解析する。なお、本実施形態では帳票データを対象としたが、これに限るものではない。医療カルテデータ、財務データ、または各種統計データ等であっても良い。

ＣＰＵ１１は、１行分の帳票データを読み込む。１行目の場合、「個人就業実績」及び「第２開発部」が読み込まれる。ＣＰＵ１１は、１行内の単語を順次抽出する。以下では例としてＣＰＵ１１が、「個人就業実績」を抽出し、「個人就業実績」の属性及び評価値を決定する処理を説明する。なお、単語の抽出は文字間の距離が記憶部１５に記憶した所定距離以上の場合、または、文字間に罫線が存在する場合に、単語の区切りであると判断すればよい。なお、単語間の距離は、フォントサイズに応じて適宜の長さ（座標数またはピクセル数）とすればよい。以下では、ＣＰＵ１１が帳票データを読み込み、文字認識により単語間で分割されたタイトル、項目及び数値データ等の内、解析対象となるデータを対象データという。

図３は帳票データの一部を示す説明図である。項目「退勤」、「所定内」及び「残業」についてそれぞれ退勤時刻、所定内時間及び残業時間の数値データが記憶されている。例えば一列目の数値データでは、退勤時刻が17時15分、所定内時間が8時間、残業時間が０時間であることが理解できる。２つ目の対象データは数値データ一列目の残業時間「０．００」を例として説明する。ＣＰＵ１１は、数値データ「０．００」の属性及び評価値を決定する。ＣＰＵ１１は、１行分の単語を順次抽出する。ＣＰＵ１１は、17:15、8.00及び0.00を検出し、そのうち0.00を抽出し解析を行う。なお、左上の隣接する対象データ「所定内」、左で隣接する対象データ「8.00」及び上で隣接する対象データ「残業」についての属性及び評価値は既に解析済みであるものとする。

図４は位置テーブル１５１のレコードレイアウトを示す説明図である。位置テーブル１５１は座標領域フィールド、属性フィールド及び評価値フィールド等を含む。座標領域フィールドには帳票内の対象データが記述されている領域の座標が記憶されている。本実施形態では帳票のファイルの左上端を原点とし、右に向かう方向をＸ軸正方向とし、下に向かう方向をＹ軸正方向とする。また座標領域は対象データが存在する領域の左上の座標及び右下の座標を記憶しておけばよい。

属性フィールドには、座標領域に対応付けて属性が記憶されている。属性は、対象データの性質または特徴を示すものである。本実施形態では、タイトル、項目、数値データ及び所属等を一例として用いている。後述するが数値データにはさらに下位属性として時刻、電話番号、価格、職員ＩＤ、時間、日数、日付、数値、西暦等がある。評価値フィールドには、座標領域に対応付けて対象データの属性の確からしさを評価する値である評価値が記憶されている。本実施形態では値が大きいほど、属性の確からしさが向上するものとして説明する。

位置テーブル１５１の内容は適宜入力部１３から、値を設定することが可能である。例えば、上部中段付近の座標領域には、一般にタイトルが記述されることが多い。従って、当該領域に対象データが存在する場合には属性が「タイトル」、評価値は「３」と決定される。ＣＰＵ１１は、対象データの中心点または領域を求める。ＣＰＵ１１は、位置テーブル１５１を参照し、中心点が属する座標領域を抽出する。ＣＰＵ１１は、座標領域に対応する属性及び評価値を読み出す。例えば、上述した「個人就業実績」の場合、ＣＰＵ１１は、中心点及び座標領域から、属性「タイトル」及び「評価値」を読み出す。また対象データ「0.00」の場合も、中心点及び座標領域から対応する属性「数値データ」及び評価値「１」を読み出す。なお、本実施形態では対象データの中心点を用いる例を挙げたがこれに限るものではなく、対象データの任意の座標を用いても良い。またＣＰＵ１１は、対象データの座標領域と、位置テーブルの座標領域フィールドに記憶された座標領域との重複する座標数を計数し、最も計数値が多い座標領域に対応する属性及び評価値を選択するようにしても良い。

図５は隣接テーブル１５２のレコードレイアウトを示す説明図である。隣接テーブル１５２には左の隣接対象データフィールド、左上の隣接対象データフィールド、上の隣接対象データフィールド及び属性評価値フィールド等を含む。隣接する対象データ(以下、場合により隣接対象データと略す)の有無に対応付けて属性及び評価値が記憶されている。例えば、左、左上及び上のどこにも隣接対象データが存在しない場合は、タイトルである可能性が高いことから、属性「タイトル」に評価値「１．０」が記憶されている。なお、本実施形態では左、左上及び上の隣接対象データの有無を利用する形態を挙げたが、これに限るものではない。全方向の隣接対象データを利用するほか、右上の隣接対象データ等、少なくとも一つの隣接対象データを利用するものであればよい。

上述した「個人就業実績」の場合、ＣＰＵ１１は、隣接する対象データが存在しないため、属性「タイトル」及び評価値「１．０」を読み出す。また「０．００」の場合、左、左上及び上の隣接対象データが存在するため、ＣＰＵ１１は、属性「数値データ」及び評価値「１．０」が読み出される。なお、隣接テーブル１５２の内容は入力部１３から適宜変更することが可能である。

図６は数値テーブル１５３のレコードレイアウトを示す説明図である。数値テーブル１５３は、表示形式フィールド、属性フィールド、及び評価値フィールド等を含む。表示形式フィールドには、数値、記号及び条件等が記憶されている。属性フィールドには、表示形式に対応付けて、属性「数値データ」の下位属性である時刻、電話番号、価格、職員ＩＤ、時間、日数等が記憶されている。評価値フィールドには表示形式に対応付けて、評価値が記憶されている。例えば、表示形式「：」を含む対象データの場合、時刻の可能性が高いことから属性は「時刻」、評価値は「２」と記憶されている。

また、表示形式の内条件である「：の右の数値が６０以下」は例えば数値データ「２：５６」の「５６」が６０以下の条件を満たす場合、時刻2時56分である可能性が高く、属性は「時刻」、評価値は「１」と記憶されている。その他、「am」、「pm」を対象データが含む場合も属性は「時刻」と判断される。表示形式「−」を含む場合、電話番号である可能性が高いことから、属性は「電話番号」、評価値は「１」と記憶されている。また表示形式に係る条件「最初の数字が０」は、例えば数値データ「０９０−ＸＸＸ―ＸＸＸ」の場合、当該条件を満たすことから電話番号を示す可能性が高く、属性は「電話番号」、評価値は「１」と記憶されている。

表示形式「＄」または「￥」を対象データが含む場合、価格である可能性が高いことから、属性は「価格」、評価値は「３」と記憶されている。表示形式「ＩＤ」を対象データが含む場合、職員ＩＤである可能性が高いことから、属性「職員ＩＤ」、評価値「３」が記憶されている。表示形式「.」を対象データが含む場合、時間または日数である可能性が高いことから属性は「時間」または「日数」が記憶され、評価値はそれぞれ「２」、「１」と記憶されている。

ＣＰＵ１１は、対象データが数値を含むか否かを判断する。ＣＰＵ１１は、抽出した対象データを一字毎に分割する。ＣＰＵ１１は、分割した字の総数及び、数値の数を計数する。ＣＰＵ１１は、総数に対する数値の割合が６０％以上の場合、対象データは数値データであると判断する。例えば「２：５０」は数字が７５％、記号が２５％であるため、数値データとなる。一方、「平成２５年計画表」は数値の割合が２５％と低いため、数値データとは判断されない。なお、数値の割合により対象データが数値データか否かを判断する例を挙げて説明するが、これに限るものではない。数値が所定数存在する場合に、対象データが数値データと判断するようにしても良い。

上述の「個人就業実績」の場合、ＣＰＵ１１は、数値データと判断しない。上述の「０．００」の場合、ＣＰＵ１１は、数値の割合が所定値よりも高いため、数値データと判断する。そしてＣＰＵ１１は、数値テーブル１５３を参照し、表示形式に一致するデータが存在するか否かを判断する。図６の例では「.」を含むため、属性は「時刻」、評価値は「２」となる。また、属性は「日数」、評価値は「１」となる。すなわち対象データ「０．００」の属性の第１候補は時刻、第２候補は日数となる。なお、数値テーブル１５３の記憶内容は、入力部１３から適宜の値を設定することが可能である。

図７はキーワードテーブル１５４のレコードレイアウトを示す説明図である。キーワードテーブル１５４はキーワードフィールド、属性フィールド及び評価値フィールド等を含む。キーワードフィールドには、対象データ中に含まれるキーワードが記憶されている。例えば、就業実績、事業部、残業、山田等である。属性フィールドには、キーワードに対応付けてタイトル、所属、項目、氏名等の属性が記憶されている。評価値フィールドには、キーワードに対応付けて評価値が記憶されている。ＣＰＵ１１は、対象データが数値データでないと判断した場合、キーワードテーブル１５４を参照し、対象データ中にキーワードが含まれているか否かを判断する。

ＣＰＵ１１は、キーワードが含まれていると判断した場合、キーワードに対応する属性及び評価値を読み出す。例えば上述した「個人就業実績」の場合、ＣＰＵ１１は、キーワード「就業実績」に対応する属性「タイトル」及び評価値「３」を読み出す。

図８は対象データテーブル１５５のレコードレイアウトを示す説明図である。対象データＩＤフィールドには対象データを特定するための固有の識別情報(以下、対象データＩＤという)が記憶されている。抽出データフィールドには、文字認識により抽出された対象データが、対象データＩＤに対応付けて記憶されている。対象データ名フィールドにはタグＩＤに対応付けて対象データの名称（以下、対象データ名）が記憶されている。属性フィールドには対象データＩＤに対応付けて候補となる属性が記憶されている。合計評価値フィールドには、上述した処理により決定した評価値の合計値が、対象データＩＤ及び属性に対応付けて記憶されている。すなわち、対象データのデータ内容、位置及び沈設する対象データの有無に応じて決定された属性及び評価値に基づき、ＣＰＵ１１は、属性の評価値の合計値を算出する。上述した「個人就業実績」の例では、ＣＰＵ１１は、上述した処理により属性「タイトル」と決定した際の評価値の合計値を合計評価値フィールドに記憶する。またＣＰＵ１１は、同様に上述した処理により「項目」と決定した際の評価値の合計値を合計評価値フィールドに記憶する。

上述した「０．００」の例では、ＣＰＵ１１は、上述した処理により属性「時間」と決定した際の評価値の合計値を合計評価値フィールドに記憶する。同様に、ＣＰＵ１１は、上述した処理により属性「日数」と決定した際の評価値の合計値を合計評価値フィールドに記憶する。またＣＰＵ１１は、同様に上述した処理により「金額」と決定した際の評価値の合計値を合計評価値フィールドに記憶する。また、ＣＰＵ１１は、属性を「数値データ」と判断した場合、下位属性である「時刻」、「電話番号」、「価格」、「職員ＩＤ」、「時間」及び「日数」の評価値に属性「数値データ」と判断した属性値を加算する。なお、ＣＰＵ１１は、複数の属性が存在する場合、合計評価値が最も高いもの順にソートして記憶しておけばよい。

上フィールド、左フィールド及び左上フィールドには、対象データの上、左または左上で隣接する対象データの有無と、存在する場合は対応する対象データＩＤとを、対象データＩＤに対応付けて記憶している。対象データＩＤ「１」の「個人就業実績」では、隣接する対象データが存在しないため、全て「なし」と記憶されている。一方、対象データＩＤ「１８」の「０．００」では、隣接する対象データが存在するため、上フィールドには対象データＩＤ「１０」、左フィールドには対象データＩＤ「１７」、左上フィールドには対象データＩＤ「９」と記憶されている。座標領域フィールドには、対象データがファイル上で占める座標領域を対象データＩＤに対応付けて記憶している。

続いて対象データ名の決定処理について説明する。ＣＰＵ１１は、抽出した対象データの属性の内、最も合計評価値の高い属性がタイトル、項目または名前である場合、当該対象データを含む対象データ名を生成する。例えば対象データＩＤ「０１」の属性は「タイトル」である。この場合、抽出した対象データ「個人就業実績」が対象データ名「個人就業実績」として、対象データテーブル１５５に記憶される。また対象データＩＤ「９」の属性は項目であることから、抽出した対象データ「所定内」が対象データ名として記憶される。

一方、ＣＰＵ１１は、抽出した対象データの属性の内、最も合計評価値の高い属性が時間、日数、または金額である場合、隣接するデータの対象データ名に基づき、対象データ名を決定する。例えば対象データＩＤ「１８」の属性は「時間」である。この場合、上で隣接する対象データ（対象データＩＤ「１０」）の対象データ名「残業」を含む対象データ名「残業」とする。

ＣＰＵ１１は、隣接する対象データの対象データ名の内、上または左に対象データ名が存在する場合、いずれか一方の対象データ名を利用する。例えば図２において、上述した対象データＩＤ「１８」の下側の対象データ「0.00」は属性が時間であり、また上に対象データ名が存在するため、ＣＰＵ１１は、対象データ名を同様に「残業」とする。また図２の下方に存在する対象データ「総計」の右側の「119.00」は属性が時間である場合、左の対象データ名「総計」と同じ対象データ名「総計」が記憶される。なお、ＣＰＵ１１は、上及び左の両方に対象データ名が存在する場合、予め定めたいずれか一方の対象データ名を利用すれば良い。上、左及び左上の全てに対象データが存在しない場合、不明としておけばよい。本実施形態では上の対象データ名を利用する例を挙げて説明する。

以上のハードウェア群において各種ソフトウェア処理手順を、フローチャートを用いて説明する。図９及び図１０は対象データの抽出処理手順を示すフローチャートである。ＣＰＵ１１は、左上の行からスキャンを行い、対象データを抽出する（ステップＳ９１）。ＣＰＵ１１は、新たな対象データを抽出した場合、対象データＩＤを生成する（ステップＳ９２）。ＣＰＵ１１は、生成した対象データＩＤを対象データテーブル１５５に記憶する（ステップＳ９３）。ＣＰＵ１１は、抽出した対象データを対象データテーブル１５５に記憶する（ステップＳ９４）。

ＣＰＵ１１は、対象データの座標領域を対象データテーブル１５５に記憶する（ステップＳ９５）。ＣＰＵ１１は、上に隣接する対象データが存在するか否かを判断する（ステップＳ９６）。具体的には、ＣＰＵ１１は、対象データテーブル１５５の座標領域を参照し、対象となる対象データの座標領域に対し、Ｙ軸負方向の所定範囲を座標領域に含む対象データＩＤを抽出する。その他、座標領域同士が隣接する対象データＩＤを抽出し、Ｘ軸方向で隣接する対象データＩＤを最終的に上側で隣接する対象データＩＤとして抽出しても良い。ＣＰＵ１１は、上に隣接する対象データが存在すると判断した場合（ステップＳ９６でＹＥＳ）、処理をステップＳ９７へ移行させる。ＣＰＵ１１は、上に隣接する対象データの対象データＩＤを対象データテーブル１５５に記憶する（ステップＳ９７）。一方、上に隣接する対象データが存在しないと判断した場合（ステップＳ９６でＮＯ）、ステップＳ９７をスキップし、処理をステップＳ９８へ移行させる。

ＣＰＵ１１は、左に隣接する対象データが存在するか否かを判断する（ステップＳ９８）。具体的には、ＣＰＵ１１は、対象データテーブル１５５の座標領域を参照し、対象となる対象データの座標領域に対し、Ｘ軸負方向の所定範囲を座標領域に含む対象データＩＤを抽出する。ＣＰＵ１１は、左に隣接する対象データが存在すると判断した場合（ステップＳ９８でＹＥＳ）、処理をステップＳ９９へ移行させる。ＣＰＵ１１は、左に隣接する対象データの対象データＩＤを対象データテーブル１５５に記憶する（ステップＳ９９）。一方、左に隣接する対象データが存在しないと判断した場合（ステップＳ９８でＮＯ）、ステップＳ９９をスキップし、処理をステップＳ１０１へ移行させる。

ＣＰＵ１１は、左上に隣接する対象データが存在するか否かを判断する（ステップＳ１０１）。具体的には、ＣＰＵ１１は、対象データテーブル１５５の座標領域を参照し、対象となる対象データの座標領域に対し、Ｘ軸負方向及びＹ軸負方向の所定範囲を座標領域に含む対象データＩＤを抽出する。ＣＰＵ１１は、左上に隣接する対象データが存在すると判断した場合（ステップＳ１０１でＹＥＳ）、処理をステップＳ１０２へ移行させる。ＣＰＵ１１は、左上に隣接する対象データの対象データＩＤを対象データテーブル１５５に記憶する（ステップＳ１０２）。一方、左上に隣接する対象データが存在しないと判断した場合（ステップＳ１０１でＮＯ）、ステップＳ１０２をスキップし、一連の処理を終了する。ＣＰＵ１１は、以上の処理を全ての抽出した対象データに対して行う。

図１１は位置に基づく属性及び評価値決定処理の手順を示すフローチャートである。ＣＰＵ１１は、対象データテーブル１５５から座標領域を読み出す（ステップＳ１１１）。ＣＰＵ１１は、座標領域の中心点を算出する（ステップＳ１１２）。具体的には、ＣＰＵ１１は、左上のＸ座標と右下のＸ座標の平均値を中心点のＸ座標とし、左上のＹ座標と右下のＹ座標の平均値を中心点のＹ座標とすればよい。ＣＰＵ１１は、位置テーブル１５１を参照し、中心点が属する座標領域を抽出する（ステップＳ１１３）。

ＣＰＵ１１は、抽出した座標領域に対応する属性及び評価値を読み出す（ステップＳ１１４）。ＣＰＵ１１は、対象データＩＤに対応付けてＲＡＭ１２に属性及び評価値を記憶する（ステップＳ１１５）。ＣＰＵ１１は、上述した処理を対象データテーブル１５５に記憶した全ての対象データＩＤに対し、処理を終了したか否かを判断する（ステップＳ１１６）。ＣＰＵ１１は、処理を全て終えていないと判断した場合（ステップＳ１１６でＮＯ）、処理をステップＳ１１７へ移行させる。ＣＰＵ１１は、次の対象データＩＤの座標領域を対象データテーブル１５５から読み出す（ステップＳ１１７）。ＣＰＵ１１は、その後処理をステップＳ１１２に戻す。以上の処理を繰り返すことにより、全ての対象データＩＤについての属性及び評価値が決定する。ＣＰＵ１１は、全ての対象データＩＤについて処理を終了したと判断した場合（ステップＳ１１６でＹＥＳ）、一連の処理を終了する。

図１２は隣接対象データの存否に基づく属性及び評価値決定処理の手順を示すフローチャートである。ＣＰＵ１１は、対象データテーブル１５５から対象データＩＤを読み出す（ステップＳ１２１）。ＣＰＵ１１は、対象データテーブル１５５から、読み出した対象データＩＤに対応する隣接する対象データＩＤを読み出す（ステップＳ１２２）。ＣＰＵ１１は、隣接テーブル１５２を参照し、対応する属性及び評価値を読み出す（ステップＳ１２３）。具体的には、ＣＰＵ１１は、隣接対象データの存否に基づき、隣接テーブル１５２から対応する属性及び評価値を読み出す。

ＣＰＵ１１は、対象データＩＤに対応付けてＲＡＭ１２に属性及び評価値を記憶する（ステップＳ１２４）。なお、複数の属性の候補が存在する場合は、それぞれの属性及び評価値を記憶しておけばよい。例えば、左の隣接対象データ及び左上の隣接対象データが存在せず、上の隣接データのみが存在する場合、対象データＩＤに対応付けて、「属性数値データ、評価値０．７」と「属性項目、評価値０．３」と記憶される。

ＣＰＵ１１は、上述した処理を対象データテーブル１５５に記憶した全ての対象データＩＤに対し、処理を終了したか否かを判断する（ステップＳ１２５）。ＣＰＵ１１は、処理を全て終えていないと判断した場合（ステップＳ１２５でＮＯ）、処理をステップＳ１２６へ移行させる。ＣＰＵ１１は、次の対象データＩＤを対象データテーブル１５５から読み出す（ステップＳ１２６）。ＣＰＵ１１は、その後処理をステップＳ１２２に戻す。以上の処理を繰り返すことにより、全ての対象データＩＤについての属性及び評価値が決定する。ＣＰＵ１１は、全ての対象データＩＤについて処理を終了したと判断した場合（ステップＳ１２５でＹＥＳ）、一連の処理を終了する。

図１３及び図１４は対象データの文字及び数字内容に基づく属性及び評価値決定処理の手順を示すフローチャートである。ＣＰＵ１１は、対象データテーブル１５５から対象データＩＤ及び対象データを読み出す（ステップＳ１３１）。ＣＰＵ１１は、対象データの数字が占める割合を算出する（ステップＳ１３２）。ＣＰＵ１１は、記憶部１５に記憶した閾値を読み出す（ステップＳ１３３）。ＣＰＵ１１は、算出した割合が閾値以上か否かを判断する（ステップＳ１３４）。

ＣＰＵ１１は、閾値以上と判断した場合（ステップＳ１３４でＹＥＳ）、対象データは数値データであると認識し、ステップＳ１３５へ移行する。ＣＰＵ１１は、数値テーブル１５３を参照し、対象データが条件を満たす属性及び評価値を抽出する（ステップＳ１３５）。具体的には、ＣＰＵ１１は、対象データを構成する数字、記号または文字が数値テーブル１５３の表示形式フィールドに含まれているか否かを判断する。またＣＰＵ１１は、対象データを構成する数字、記号または文字が、表示形式フィールドに記述されている条件を満たすか否かを判断する。ＣＰＵ１１は、表示形式フィールドに含まれていると判断した場合、または、条件を満たすと判断した場合、対応する属性及び評価値を抽出する。

ＣＰＵ１１は、ステップＳ１３１で読み出した対象データＩＤに対応付けてＲＡＭ１２に属性及び評価値を記憶する（ステップＳ１３６）。ＣＰＵ１１は、閾値以上でないと判断した場合（ステップＳ１３４でＮＯ）、対象データは文字データと判断し、処理をステップＳ１３７へ移行する。ＣＰＵ１１は、キーワードテーブル１５４を参照し、対応する属性及び評価値を抽出する（ステップＳ１３７）。具体的にはＣＰＵ１１は、キーワードフィールドに記憶されたキーワードが、対象データに含まれているか、または一致するか否かを判断する。ＣＰＵ１１は、キーワードに一致または含まれていると判断した場合、当該キーワードに対応する属性及び評価値を読み出す。

ＣＰＵ１１は、対象データＩＤに対応付けてＲＡＭ１２に属性及び評価値を記憶する（ステップＳ１３８）。ステップＳ１３８またはステップＳ１３６の処理後、ＣＰＵ１１は、上述した処理を対象データテーブル１５５に記憶した全ての対象データＩＤに対し、処理を終了したか否かを判断する（ステップＳ１３９）。ＣＰＵ１１は、処理を全て終えていないと判断した場合（ステップＳ１３９でＮＯ）、処理をステップＳ１４１へ移行させる。ＣＰＵ１１は、次の対象データＩＤ及び対象データを対象データテーブル１５５から読み出す（ステップＳ１４１）。ＣＰＵ１１は、その後処理をステップＳ１３２に戻す。以上の処理を繰り返すことにより、全ての対象データＩＤについての属性及び評価値が決定する。ＣＰＵ１１は、全ての対象データＩＤについて処理を終了したと判断した場合（ステップＳ１３９でＹＥＳ）、一連の処理を終了する。

図１５は合計評価値の算出処理手順を示すフローチャートである。ＣＰＵ１１は、ステップＳ１１５、Ｓ１２４、Ｓ１３６、及びＳ１３８にて記憶した対象データＩＤに対応する属性及び評価値を、ＲＡＭ１２から読み出す（ステップＳ１５１）。ＣＰＵ１１は、候補となる属性毎に評価値を加算する（ステップＳ１５２）。ＣＰＵ１１は、属性「数値データ」の評価値を、属性「時刻」、「電話番号」、「価格」、「職員ＩＤ」、「時間」、「日数」の各評価値に加算する（ステップＳ１５３）。ＣＰＵ１１は、属性及び合計評価値を、対象データテーブル１５５に記憶する（ステップＳ１５４）。なお、属性「数値データ」の評価値については係数を乗じた値を加算しても良い。また、ＣＰＵ１１は、合計評価値が高い順に属性を、対象データテーブル１５５に記憶する。

ＣＰＵ１１は、上述した処理をＲＡＭ１２に記憶した全ての対象データＩＤに対し、処理を終了したか否かを判断する（ステップＳ１５５）。ＣＰＵ１１は、処理を全て終えていないと判断した場合（ステップＳ１５５でＮＯ）、処理をステップＳ１５６へ移行させる。ＣＰＵ１１は、次の対象データＩＤ、当該対象データＩＤに対応する属性及び評価値を対象データテーブル１５５から読み出す（ステップＳ１５６）。ＣＰＵ１１は、その後処理をステップＳ１５２に戻す。以上の処理を繰り返すことにより、全ての対象データＩＤについての属性及び合計評価値が決定する。ＣＰＵ１１は、全ての対象データＩＤについて処理を終了したと判断した場合（ステップＳ１５５でＹＥＳ）、一連の処理を終了する。なお、ＣＰＵ１１は、罫線の存否に基づき、属性及び評価値を決定しても良い。ＣＰＵ１１は、罫線が対象データの両辺または上下に存在すると判断した場合、属性「数値データ」、評価値「１」としても良い。

図１６及び図１７は対象データ名の決定処理手順を示すフローチャートである。ＣＰＵ１１は、対象データテーブル１５５から対象データＩＤ及び合計評価値の最も高い属性を読み出す（ステップＳ１６１）。ＣＰＵ１１は、属性はタイトル、項目、または名前であるか否かを判断する（ステップＳ１６２）。ＣＰＵ１１は、属性がタイトル、項目、または名前であると判断した場合（ステップＳ１６２でＹＥＳ）、処理をステップＳ１６３へ移行させる。ＣＰＵ１１は、抽出データフィールドのデータ、すなわち対象データを、対象データ名フィールドにコピーする（ステップＳ１６３）。

ＣＰＵ１１は、属性がタイトル、項目、または名前でないと判断した場合（ステップＳ１６２でＮＯ）、処理をステップＳ１６４へ移行させる。ＣＰＵ１１は、対象データテーブル１５５を参照し、上で隣接する対象データが存在するか否かを判断する（ステップＳ１６４）。ＣＰＵ１１は、存在すると判断した場合（ステップＳ１６４でＹＥＳ）、処理をステップＳ１６５へ移行させる。ＣＰＵ１１は、上で隣接する対象データＩＤを読み出す（ステップＳ１６５）。ＣＰＵ１１は、読み出した対象データＩＤに対応する対象データ名を読み出す（ステップＳ１６６）。ＣＰＵ１１は、読み出した対象データ名を対象データ名フィールドにコピーする（ステップＳ１６７）。すなわち、上で隣接する対象データ名と同名とする。

ＣＰＵ１１は、上に隣接する対象データが存在しないと判断した場合（ステップＳ１６４でＮＯ）、処理をステップＳ１６８へ移行させる。ＣＰＵ１１は左で隣接する対象データが存在するか否か判断する（ステップＳ１６８）。ＣＰＵ１１は存在すると判断した場合（ステップＳ１６８でＹＥＳ）、ステップＳ１６９へ移行する。ＣＰＵ１１は、左で隣接する対象データＩＤを読み出す（ステップＳ１６９）。ＣＰＵ１１は、読み出した対象データＩＤに対応する対象データ名を読み出す（ステップＳ１７１）。ＣＰＵ１１は、読み出した対象データ名を対象データ名フィールドにコピーする（ステップＳ１７２）。すなわち、左で隣接する対象データ名と同名とする。なお、本実施形態ではステップＳ１６４〜Ｓ１６７の処理を、ステップＳ１６８〜Ｓ１７２の処理よりも先に行ったか、左の隣接対象データを優先すべく、先にステップＳ１６８〜Ｓ１７２の処理を実行しても良い。

ＣＰＵ１１は、左で隣接する対象データが存在しないと判断した場合（ステップＳ１６８でＮＯ）、処理をステップＳ１７３に移行させる。ＣＰＵ１１は、対象データ名フィールドに不明と記憶する（ステップＳ１７３）。ＣＰＵ１１は、上述した処理をＲＡＭ１２に記憶した全ての対象データＩＤに対し、処理を終了したか否かを判断する（ステップＳ１７４）。ＣＰＵ１１は、処理を全て終えていないと判断した場合（ステップＳ１７４でＮＯ）、処理をステップＳ１７５へ移行させる。また、ＣＰＵ１１は、ステップＳ１６３、Ｓ１６７及びＳ１７２の後も、ステップＳ１７４へ処理を移行させる。

ＣＰＵ１１は、次の対象データＩＤ、及び、最も合計評価値の高い属性を対象データテーブル１５５から読み出す（ステップＳ１７５）。ＣＰＵ１１は、その後処理をステップＳ１６２に戻す。以上の処理を繰り返すことにより、全ての対象データＩＤについての対象データ名が決定する。ＣＰＵ１１は、全ての対象データＩＤについて処理を終了したと判断した場合（ステップＳ１７４でＹＥＳ）、一連の処理を終了する。以上の処理により、抽出した対象データの属性を高い精度で特定することが可能となる。

実施の形態２
実施の形態２はユーザの使用履歴に応じて評価値を補正する形態に関する。図１８は帳票データのイメージを示す説明図である。ＣＰＵ１１は、入力部１３から対象データの選択を受け付ける。図１８の例では、項目「残業」の残業時間が複数選択されている。なお、本実施形態では複数の対象データを選択する例を挙げて説明するが、一の対象データを選択するようにしても良い。ＣＰＵ１１は、選択された対象データについて、プロパティの表示要求を、入力部１３から受け付ける。ＣＰＵ１１は、プロパティの表示要求を受け付けた場合、図１８に示す如く、設定タブ１９１を記憶部１５から読み出し、表示部１４に表示する。

図１９は実施の形態２に係る対象データテーブル１５５のレコードレイアウトを示す説明図である。ＣＰＵ１１は、対象データテーブル１５５を参照し、選択された対象データの対象データＩＤを読み出す。ＣＰＵ１１は、対象データＩＤに対応する対象データ名を読み出す。ＣＰＵ１１は、設定タブ１９１上の対象データ名ボックス１９４に対象データ名を記述する。図１８の例では「残業」と表示されている。ＣＰＵ１１は、対象データＩＤに対応する、属性を読み出す。ＣＰＵ１１は、合計評価値の高い順に読み出した属性を属性プルダウンボックス１９２に記述する。図１８に示すように属性プルダウンボックス１９２には、最も合計評価値の高い属性「時間」を先頭に、「金額」、「職員ＩＤ」が記述されている。なお、本実施形態では選択した複数の対象データの対象データ名、属性及び属性の合計評価値に伴う順位が一致しているものとして説明する。また属性プルダウンボックス１９２には、タイトル、項目等、合計評価値がゼロの他の属性をも表示しても良い。

ユーザは入力部１３から属性プルダウンボックス１９２に表示された属性を選択する。例えば当初は属性「時間」と定義されていたが、属性「金額」に変更を希望する場合、属性「金額」を選択する。ユーザは、属性を選択した後、ＯＫボタン１９３を入力する。ＣＰＵ１１は、ＯＫボタン１９３の入力及び属性の入力を受け付ける。ＣＰＵ１１は、対象データＩＤ及び入力された属性を参照し、対象データテーブル１５５の選択回数フィールドの数をインクリメントする。

ＣＰＵ１１は、選択回数が更新された場合、または、一定時間経過後に、選択回数を合計評価値に反映させる処理を行う。ＣＰＵ１１は、属性の選択回数が更新される度に、増加した数を、合計評価値に加算する。例えば属性「時間」が１回選択された場合、属性「時間」の合計評価値を１増加させる。なお、ＣＰＵ１１は、係数を乗じ、乗算後の値を合計評価値に加算するようにしても良い。その他、一定時間経過後に、複数の属性の選択回数に基づき、加算値を算出するようにしても良い。

具体的には、ＣＰＵ１１は、合計評価値の最も高い属性の選択回数と、その他の属性の選択回数とを読み出す。ＣＰＵ１１は、その他の属性の選択回数を、合計評価値の最も高い属性の選択回数で除した値を、当該その他の属性の加算値として求める。ＣＰＵ１１は、求めた加算値を、当該その他の属性の合計評価値に加算する。ＣＰＵ１１は、その他の属性の選択回数の合計値を算出する。ＣＰＵ１１は、合計評価値の最も高い属性の選択回数から、合計値を減じ、減じた値を合計評価値の最も高い属性の選択回数で除し、当該除した値を、合計評価値の最も高い属性の加算値とする。ＣＰＵ１１は、合計評価値の最も高い属性の合計評価値に加算値を加算する。ＣＰＵ１１は、選択回数を考慮した合計表価値を求めた後に、合計評価値の高い順に属性を並び替える。

図２０は設定タブ１９１の表示処理手順を示すフローチャートである。ＣＰＵ１１は、記憶部１５から図２に示す個人就業実績ファイルを読み出す。ＣＰＵ１１は、対象データの選択を入力部１３から受け付ける（ステップＳ２０１）。ＣＰＵ１１は、選択した対象データについてのプロパティの表示要求を受け付けたか否かを判断する（ステップＳ２０２）。ＣＰＵ１１は、受け付けていないと判断した場合（ステップＳ２０２でＮＯ）、受け付けるまで待機する。ＣＰＵ１１は、受け付けたと判断した場合（ステップＳ２０２でＹＥＳ）、処理をステップＳ２０３へ移行させる。

ＣＰＵ１１は、選択された対象データの対象データＩＤを読み出す（ステップＳ２０３）。ＣＰＵ１１は、読み出した対象データＩＤに対応する対象データ名を読み出す（ステップＳ２０４）。ＣＰＵ１１は、記憶部１５から設定タブ１９１のテンプレートを読み出す。ＣＰＵ１１は、設定タブ１９１の対象データ名ボックス１９４に対象データ名を記述する（ステップＳ２０５）。ＣＰＵ１１は、対象データＩＤに対応する属性及び合計評価値を全て読み出す（ステップＳ２０６）。ＣＰＵ１１は、設定タブ１９１の属性プルダウンボックス１９２に合計評価値の最も高い順に、属性を記述する（ステップＳ２０７）。

ＣＰＵ１１は、記述を終えた設定タブ１９１を表示部１４に表示する（ステップＳ２０８）。ＣＰＵ１１は、入力部１３から属性の選択を受け付けたか否かを判断する（ステップＳ２０９）。ＣＰＵ１１は、属性の選択を受け付けていないと判断した場合（ステップＳ２０９でＮＯ）、属性を受け付けるまで待機する。ＣＰＵ１１は、属性の選択を受け付けたと判断した場合（ステップＳ２０９でＹＥＳ）、ＯＫボタン１９３の入力を条件に、ステップＳ２０３で読み出した対象データＩＤ及び受け付けた属性に対応する選択回数をインクリメントする（ステップＳ２０１０）。ＣＰＵ１１は、設定タブ１９１の表示を消去する（ステップＳ２０１１）。

図２１及び図２２は評価値の補正処理手順を示すフローチャートである。以下では、定期的（例えば３日ごと）に合計評価値を補正する例を挙げて説明する。ＣＰＵ１１は、対象データテーブル１５５を参照し、対象データＩＤを読み出す（ステップＳ２１１）。ＣＰＵ１１は、対象データＩＤに対応する属性、合計評価値及び選択回数を読み出す（ステップＳ２１２）。ＣＰＵ１１は、最も合計評価値の高い属性の選択回数（以下、最大選択回数という）を記憶部１５に記憶する（ステップＳ２１３）。ＣＰＵ１１は、最大選択回数を除く他の属性の選択回数の合計値を算出する（ステップＳ２１４）。

ＣＰＵ１１は、最大選択回数から合計値を減算する（ステップＳ２１５）。ＣＰＵ１１は、減算値を最大選択回数で除す（ステップＳ２１６）。ＣＰＵ１１は、除した値を合計評価値に加算する（ステップＳ２１７）。なお、除した値に係数をさらに乗じても良い。ＣＰＵ１１は、属性に対応付けて加算値を合計評価値フィールドに上書きする（ステップＳ２１８）。ＣＰＵ１１は、次に合計評価値の高い属性の選択回数を、最大選択回数で除す（ステップＳ２１９）。ＣＰＵ１１は、除した値を、ステップＳ２１９の属性に対応する合計評価値に加算する（ステップＳ２２１）。

ＣＰＵ１１は、属性に対応付けて加算値を合計評価値フィールドに上書きする（ステップＳ２２２）。ＣＰＵ１１は、全ての属性の合計評価値について、ステップＳ２１９〜Ｓ２２２の処理を終了したか否かを判断する（ステップＳ２２３）。ＣＰＵ１１は、処理を終了していないと判断した場合（ステップＳ２２３でＮＯ）、処理をステップＳ２１９に戻し、さらに次に合計値の高い属性の選択回数を、最大選択回数で除す処理を行う。ＣＰＵ１１は、全ての属性の合計評価値について処理を終了したと判断した場合（ステップＳ２２３でＹＥＳ）、処理をステップＳ２２４へ移行させる。

ＣＰＵ１１は、合計評価値の高い順に、対象データテーブル１５５の属性及び合計評価値を並び替える（ステップＳ２２４）。ＣＰＵ１１は、選択回数フィールドの値を消去する（ステップＳ２２５）。ＣＰＵ１１は、全ての対象ＩＤについて処理を終了したか否かを判断する（ステップＳ２２６）。ＣＰＵ１１は、処理を終えていないと判断した場合（ステップＳ２２６でＮＯ）、処理をステップＳ２２７へ移行させる。ＣＰＵ１１は、未処理の次の対象ＩＤを読み出す（ステップＳ２２７）。ＣＰＵ１１は、その後処理をステップＳ２１２に戻す。ＣＰＵ１１は、全ての対象ＩＤについて処理を終了したと判断した場合（ステップＳ２２６でＹＥＳ）、一連の処理を終了する。これにより、帳票データから特定することが可能な属性に加え、ユーザの使用実績をも反映して対象データの属性を精度良く特定することが可能となる。また例えば属性「残業」のデータが「0.00,8.00・・」のような時間の場合と、「7,500、15,000・・」のような金額の場合との複数種類の属性が考えられるところ、本実施形態では対象データの内容と選択実績に基づき精度良く属性を特定することが可能となる。

本実施の形態２は以上の如きであり、その他は実施の形態１と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。

実施の形態３
図２３は上述した形態のコンピュータ１の動作を示す機能ブロック図である。ＣＰＵ１１が制御プログラム１５Ｐを実行することにより、コンピュータ１は以下のように動作する。抽出部２３１はデータ群から解析対象となる対象データを抽出する。決定部２３２は抽出した対象データの内容、該対象データに隣接するデータ及び位置に基づき、前記対象データの候補となる属性及び属性の評価値を決定する。

図２４は実施の形態３に係るコンピュータ１のハードウェア群を示すブロック図である。コンピュータ１を動作させるためのプログラムは、ディスクドライブ等の読み取り部１０ＡにCD-ROM、DVD（Digital Versatile Disc）ディスク、メモリーカード、またはUSB(Universal Serial Bus)メモリ等の可搬型記録媒体１Ａを読み取らせて記憶部１５に記憶しても良い。また当該プログラムを記憶したフラッシュメモリ等の半導体メモリ１Ｂをコンピュータ１内に実装しても良い。さらに、当該プログラムは、インターネット等の通信網を介して接続される他のサーバコンピュータ（図示せず）からダウンロードすることも可能である。以下に、その内容を説明する。

図２４に示すコンピュータ１は、上述した各種ソフトウェア処理を実行するプログラムを、可搬型記録媒体１Ａまたは半導体メモリ１Ｂから読み取り、或いは、通信網を介して他のサーバコンピュータ（図示せず）からダウンロードする。当該プログラムは、制御プログラム１５Ｐとしてインストールされ、ＲＡＭ１２にロードして実行される。これにより、上述したコンピュータ１として機能する。

本実施の形態３は以上の如きであり、その他は実施の形態１と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。

以上の実施の形態１から３を含む実施形態に関し、さらに以下の付記を開示する。

（付記１）
コンピュータに、
データ群から解析対象となる対象データを抽出し、
抽出した対象データの内容、該対象データに隣接するデータ及び位置に基づき、前記対象データの候補となる属性及び属性の評価値を決定する
処理を実行させるプログラム。

（付記２）
対象データが配置された位置を抽出し、
データの配置される位置に対応付けて属性及び評価値を記憶した記憶部を参照し、前記対象データの属性及び評価値を読み出し、
読み出した属性及び評価値に基づき、前記対象データの候補となる属性及び属性の評価値を決定する
付記１に記載のプログラム。

（付記３）
隣接するデータの存否を判断し、
隣接するデータの存否に応じて属性及び評価値を記憶した記憶部を参照し、前記対象データの属性及び評価値を読み出し、
読み出した属性及び評価値に基づき、前記対象データの候補となる属性及び属性の評価値を決定する
付記１または２に記載のプログラム。

（付記４）
隣接するデータが存在する場合に、前記隣接するデータの属性を取得し、
取得した属性に基づき、前記対象データの候補となる属性および属性の評価値を決定する
付記１から３のいずれか一つに記載のプログラム。

（付記５）
対象データが数値を含む数値データであるか否かを判断し、
数値データであると判断した場合、対象データの表示形式に対応付けて時間、日数または金額を含む属性及び評価値を記憶した記憶部を参照し、前記対象データの属性及び評価値を読み出し、
読み出した属性及び評価値に基づき、前記対象データの候補となる属性及び属性の評価値を決定する
付記１から４のいずれか一つに記載のプログラム。

（付記６）
キーワードに対応付けてタイトル、項目または名前を含む属性及び評価値を記憶した記憶部を参照し、前記対象データの属性及び評価値を読み出し、
読み出した属性及び評価値に基づき、前記対象データの候補となる属性及び属性の評価値を決定する
付記１から５のいずれか一つに記載のプログラム。

（付記７）
決定した属性がタイトル、項目または名前である場合、前記対象データを含む対象データ名を生成する
付記１から６のいずれか一つに記載のプログラム。

（付記８）
決定した属性が時間、日数または金額である場合、隣接するデータの対象データ名に基づき前記対象データの対象データ名を生成する
付記１から７のいずれか一つに記載のプログラム。

（付記９）
決定した候補となる属性を出力し、
各属性に対する選択回数を計数し、
各属性の選択回数に応じて、各属性の評価値を補正する
付記１から８のいずれか一つに記載のプログラム。

（付記１０）
データ群から解析対象となる対象データを抽出する抽出部と、
抽出した対象データの内容、該対象データに隣接するデータ及び位置に基づき、前記対象データの候補となる属性及び属性の評価値を決定する決定部と
を備える情報処理装置。

（付記１１）
情報処理装置を用いた情報処理方法において、
データ群から解析対象となる対象データを抽出し、
抽出した対象データの内容、該対象データに隣接するデータ及び位置に基づき、前記対象データの候補となる属性及び属性の評価値を決定する
情報処理方法。

１コンピュータ
１Ａ可搬型記録媒体
１Ｂ半導体メモリ
１０Ａ読み取り部
１１ＣＰＵ
１２ＲＡＭ
１３入力部
１４表示部
１５記憶部
１５Ｐ制御プログラム
１６通信部
１８時計部
１５１位置テーブル
１５２隣接テーブル
１５３数値テーブル
１５４キーワードテーブル
１５５対象データテーブル
１９１設定タブ
１９２属性プルダウンボックス
１９３ＯＫボタン
１９４対象データ名ボックス

Claims

コンピュータに、
データ群から解析対象となる対象データを抽出し、
複数方向に隣接するデータの存否を方向毎に判定し、
隣接する各方向のデータの存否の組み合わせごとに、項目と数値データとを含む属性、及び、前記項目と前記数値データそれぞれの評価値を記憶した記憶部を参照し、前記対象データの属性及び評価値を読み出し、
抽出した対象データの内容、位置、読み出した属性及び評価値に基づき、前記対象データの候補となる属性及び属性の評価値を決定する
処理を実行させるプログラム。
対象データが配置された位置を抽出し、
データの配置される位置に対応付けて属性及び評価値を記憶した記憶部を参照し、前記対象データの属性及び評価値を読み出し、
読み出した属性及び評価値に基づき、前記対象データの候補となる属性及び属性の評価値を決定する
請求項１に記載のプログラム。
データ群から解析対象となる対象データを抽出する抽出部と、
複数方向に隣接するデータの存否を方向毎に判定する判定部と、
隣接する各方向のデータの存否の組み合わせごとに、項目と数値データとを含む属性、及び、前記項目と前記数値データそれぞれの評価値を記憶した記憶部を参照し、前記対象データの属性及び評価値を読み出す読み出し部と、
抽出した対象データの内容、位置、読み出した属性及び評価値に基づき、前記対象データの候補となる属性及び属性の評価値を決定する決定部と
を備える情報処理装置。
情報処理装置を用いた情報処理方法において、
データ群から解析対象となる対象データを抽出し、
複数方向に隣接するデータの存否を方向毎に判定し、
隣接する各方向のデータの存否の組み合わせごとに、項目と数値データとを含む属性、及び、前記項目と前記数値データそれぞれの評価値を記憶した記憶部を参照し、前記対象データの属性及び評価値を読み出し、
抽出した対象データの内容、位置、読み出した属性及び評価値に基づき、前記対象データの候補となる属性及び属性の評価値を決定する
情報処理方法。