JP4734551B2 - 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置 - Google Patents

表フォーマットデータ処理方法並びに表フォーマットデータ処理装置 Download PDF

Info

Publication number
JP4734551B2
JP4734551B2 JP2004124342A JP2004124342A JP4734551B2 JP 4734551 B2 JP4734551 B2 JP 4734551B2 JP 2004124342 A JP2004124342 A JP 2004124342A JP 2004124342 A JP2004124342 A JP 2004124342A JP 4734551 B2 JP4734551 B2 JP 4734551B2
Authority
JP
Japan
Prior art keywords
data
information
cell
item name
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004124342A
Other languages
English (en)
Other versions
JP2005309676A (ja
JP2005309676A5 (ja
Inventor
万太郎 矢島
正嗣 野田
Original Assignee
万太郎 矢島
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 万太郎 矢島 filed Critical 万太郎 矢島
Priority to JP2004124342A priority Critical patent/JP4734551B2/ja
Priority to PCT/JP2005/007558 priority patent/WO2005103993A1/ja
Publication of JP2005309676A publication Critical patent/JP2005309676A/ja
Publication of JP2005309676A5 publication Critical patent/JP2005309676A5/ja
Application granted granted Critical
Publication of JP4734551B2 publication Critical patent/JP4734551B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、帳表フォーマット上のデータ処理を行う情報処理方法および装置に関する。
後出の図9に示す表フォーマットにおいては、項目名「売上げ」のデータ記入欄(データフィールド)を構成する各セル中には、追記された記号“[ ]”により、もう一つのデータ記入域が設けられ、このデータ記入域の中には、いったん、元々の記入域とは異なる条件でデータが集計され、次に、この集計データと該当の元々の記入域上の集計データとの間でおこなわれた演算結果が記入されるようになっている。
本明細書においては、このように、1つのセルの中に新しく設けられた記入域を「派生エリア」、元々の記入条件のデータを記入する側の記入域を「主エリア」と呼び、この「派生エリア」について設けられている「主エリア」と異なる記入条件のことを、「差異条件」と呼ぶことにする。
また、この新しい記入域「派生エリア」が設けられたセルを、特に「複合セル」と呼び、これに対して、1つのデータのみが記入されるセルを「通常セル」と呼ぶ。
現行の技術と商品を用いて、図9に示す表フォーマット上に所望のデータ出力を得るには、例えば以下のような一連のユーザ作業が必要になる。先ず、表フォーマット上の項目名「売上げ」のデータフィールドを構成する各複合セルから派生エリアを取り去り、項目名「売上げ」のデータフィールドの各構成セルを通常セルとした第1の表フォーマットを作成する。
また、、第1の表フォーマットに変更を加え、最上行に記入された項目名「年度」のデータ”2001年”、”2002年”、”2003年”を、各々、その「前年」である”2000年”、”2001年”、”2002年”に置き換えた第2の表フォーマットを作成する。
第2の表フォーマットの項目名「売上げ」のデータフィールドを構成する各セルについて、表フォーマット上において同時に参照されるデータの集合である「関連データ条件」は、図9に示す表フォーマット上において、表のセル構成上、「同じ位置」にあるセル内の派生エリアの「関連データ条件」に等しい。例えば、この第2の表フォーマット上の上側から3行目、左側から3列目のセルの「関連データ条件」は、図9に示す表フォーマット上において、それと「同じ位置」にある、上側から3行目、左側から3列目のセルの派生エリアの「関連データ条件」に等しい。
次に、データ出力機能を用いることによって、第1の表フォーマットと第2の表フォーマット上に、データファイルのデータを出力集計させた上、各々、表計算アプリケーション上の第1のシートと第2のシート上にインポートする。
続いて、表計算アプリケーションの演算式定義機能を用いて、項目名「売上げ」のデータフィールドを構成する各複合セルについて、次のように演算式を定義し、それを実行させる。すなわち、第1の出力済み表フォーマットをインポートした第1のシートと第2の出力済み表フォーマットをインポートした第2のシートとの間で、「同じセル位置」にあるセルの間に、所要の計算をおこない、その計算結果によって、第2の表フォーマットの「同じセル位置」にあるセル内のデータを更新記入させる定義をおこなう。
続いて、表計算アプリケーション上において、第1の出力済み表フォーマット上において、項目名「売上げ」のデータフィールドを構成する各セルの下側に新しいセルが付加されるように「行」を挿入する。
次に、この第1の表フォーマット上において挿入された新しいセルに、第2の出力済み表フォーマットの該当位置のセルのデータをコピーする。例えば、元の第1の表フォーマットの上から3行目、左から3列目のセルの下側に挿入されたセルには、第2の表フォーマットの同じく上から3行目、左から3列目のセルのデータをコピーする。
また、後述の「他の使用例1」において示したデータ出力結果を得るには、表計算アプリケーション上において、次のユーザ作業が必要である。先ず、1つの主エリアと派生エリアに、各々1つのセルを割当てる形で、該当の表フォーマットを作成した上、表内の全合計値の記入される複合セルの主エリア側に該当するセル(下から2行目、右から1列目のセル)内に、項目名「売上げ」のデータフィールド内の主エリアに割り当てられたセルのデータを合計した値を記入する計算式を定義し、実行する。
次に、該当のデータフィールド内の各主エリアに該当するセルについて、その中のデータと上記合計値との除算をおこない、計算結果のデータを対応する派生エリア該当セル内に記入することを定義し実行する。
以上のように、現行の技術と商品を用いて、所望の表フォーマット上へのデータ出力を得ることはできるが、これらの方法はユーザに複数の工程からなる作業を強いるものであり、かつ、個々の作業は、多大な手間と時間を要するものである。また、これらの作業と操作は、特に、これらの現行商品の使用に熟達していない多数の一般ユーザには、相応な学習を要するものとして簡単にはおこなえないものである。
本発明は、かかる従来技術の問題に鑑みてなされたもので、上記にあげたような1つのセル中に元々のデータ記入域である主エリアのほかに、第2の記入域である派生エリアが設けられ、派生エリアについて指定された主エリアと異なる記入条件である差異条件が多様な形式により複雑に定義されている帳表フォーマットについても、通常の帳票フォーマットに対しておこなう指定操作と同レベルの簡単な操作により、帳票フォーマット定義をおこなえ、ユーザ操作をほとんど必要としない自動的なデータ入出力を行える情報処理方法と装置を提案することを目的としている。
本発明の別の目的は、上記にあげたような、多様な形式により複雑に定義される差異条件を持つ派生エリアが設けられた帳票フォーマットについても、誰もがおこなえ、誰もが理解できる視認性と可読性を備えた形で帳票フォーマット定義をおこなえ、ユーザ操作をほとんど必要としない自動的なデータ入出力をおこなえる情報処理方法と装置を提供することを目的とする。
本発明の別の目的は、上記にあげたような、多様な形式により複雑に定義される差異条件を持つ派生エリアが設けられた帳票フォーマットについても、多様な形式により複雑に定義される差異条件を人間間の意思伝達に日常用いる自然語表現をそのまま用いて定義ことによってユーザ親和性高くおこなえる情報処理方法と装置を提供することを目的とする。
本発明の別の目的は、上記にあげたような、多様な形式により複雑に定義される差異条件を持つ派生エリアが設けられた帳票フォーマットについても、人間間の意思伝達に日常用いる自然語表現をそのまま用いた差異条件の定義を確定的におこなえ、ユーザ親和性とユーザ指示の確定性を両立させる情報処理方法と装置を提供することを目的とする。
上記の目的を達成するために、本発明の中、請求項1に記載の情報処理装置における方法は、

構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と特定の区分情報とを対応付けた形で登録した辞書と、
表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
を備えた情報処理装置にあって、

(1)1つのデータフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルを表わすセルデータと、該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

(2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、上記の特定の区分情報を付して上記辞書に登録されている用語を、差異条件文字列と上記の特定の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合によって検出した上、
第2の項目名に属するデータに対する変更方法を指示する情報であって、検出した上記辞書登録用語、ならびに、検出した上記辞書登録用語と上記辞書において対応付けて登録されている項目名とを、各々、「変更方法情報」、「変更項目名情報」として収めた差異条件定義データを作成するステップと、

(3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

(4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

(5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側主レコードを得るステップと、

(6) 表側主レコードを構成するデータの中から、差異条件データにおいて「変更項目名情報」として登録されている第2の項目名に対応するデータを選択し、選択したデータを差異条件データ内において「変更方法情報」として登録されている上記辞書登録用語に定義されている方法に基づいて変更することによって、表側副レコードを作成するステップと、

(7) データファイルからレコードを順次取り出し、
表側主レコードを構成する各データに対応付けた各項目名について、
データファイルかた出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

(8)データファイルからレコードを順次取り出し、
表側副レコードを構成する各データに対応付けた各項目名について、上記データファイル出力レコード内の対応するデータと表側副レコード内の対応するデータとの間で、コード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第2の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第2の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコード内の第1の項目名に対応するデータ、ならびに、上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、データファイル出力レコード内の第1の項目名に対応するデータを上記第2の単位記入域に出力するステップと、
からなることを特徴とする。
また、請求項2に記載の方法は、請求項1に記載の方法であって、
1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と上記の特定の区分である第1の区分情報とを対応付けた形で登録し、2つのデータ間の特定の演算を指示する特定用語について、該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書を備え、

(1)識別した差異条件文字列から、第2の区分情報が対応付けられた上記辞書登録用語を、差異条件文字列の文字列データと第2の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合に基づき、定めた方法によって検出するステップと、

(2)データファイルから上記第1の単位データ域に出力したデータとデータファイルから上記第2の単位データ域に出力したデータとの間で、検出した第2の区分情報を付した用語に定義されている方法による演算をおこなった上、
演算によって得られたデータと上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、上記によって得られたデータを第2の単位記入域上に出力するステップとを、
おこなうことを特徴とする。
また、請求項3に記載の情報処理装置における方法は、

構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
1つの項目名に属する表上の記入データ全体に対して第1の演算を指示する特定用語について該当のコード列情報と第1の区分情報とを対応付けた形で登録し、2つのデータの間の第2の演算を指示する特定用語について該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書と、
表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
を備えた情報処理装置にあって、

(1)データフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルのセルデータと該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

(2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、
上記辞書において第1の区分情報を付して登録した用語と第2の区分情報を付して登録した用語とを、各々、差異条件文字列の文字列データのコード列情報と上記辞書登録用語のコード列情報と区分情報に基き、定めた方法に従って検出した上、
検出した第1の区分情報を付した辞書登録用語に定義された方法を表わす「演算方法情報」と第2の区分情報を付した辞書登録用語に定義された方法を表わす「全体演算情報」とを収めた差異条件定義データを作成するステップと、

(3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

(4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

(5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側レコードを得るステップと、

(6) データファイルからレコードを順次取り出し、
表側レコードを構成する各データに対応付けた各項目名について、
データファイルかた出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

(7)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、上記(3)、(4)、(5)、(6)の各ステップをおこない、各セル内の第1の単位記入域に出力したデータに対して差異条件定義データの「全体演算情報」に定められた方法に従った第1の演算をおこなうステップと、

(8)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、該当セル内の第1の単位記入域に出力したデータと第1の演算によって得られたデータとの間で差異条件定義データの「演算方法情報」に定められた方法に基く第2の演算をおこない、
第2の演算によって得られたデータを表わすコード列情報と識別した第2の単位記入域内の定められたデータ記入位置を表わす位置情報とを持つ文字列データを作成することによって、
第2の演算によって得られたデータを該当のセル内の第2の単位記入域に出力するステップと、
からなることを特徴とする。
請求項4に記載の情報処理装置は、
構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へデータ出力をおこなう情報処理装置であって、

表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と特定の区分情報とを対応付けた形で登録した辞書と、
表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、

1つのデータフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルを表わすセルデータと、該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成する手段と、

第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、上記の特定の区分情報を付して上記辞書に登録されている用語を、差異条件文字列と上記の特定の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合によって検出した上、
第2の項目名に属するデータに対する変更方法を指示する情報であって、検出した上記辞書登録用語、ならびに、検出した上記辞書登録用語と上記辞書において対応付けて登録されている項目名とを、各々、「変更方法情報」、「変更項目名情報」として収めた差異条件定義データを作成する手段と、

第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別する手段と、

識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求める手段と、

識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側主レコードを得る手段と、

表側主レコードを構成するデータの中から、差異条件データにおいて「変更項目名情報」として登録されている第2の項目名に対応するデータを選択し、選択したデータを差異条件データ内において「変更方法情報」として登録されている上記辞書登録用語に定義されている方法に基づいて変更することによって、表側副レコードを作成する手段と、

データファイルからレコードを順次取り出し、
表側主レコードを構成する各データに対応付けた各項目名について、
データファイルかた出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力する手段と、

データファイルからレコードを順次取り出し、
表側副レコードを構成する各データに対応付けた各項目名について、上記データファイル出力レコード内の対応するデータと表側副レコード内の対応するデータとの間で、コード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第2の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第2の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコード内の第1の項目名に対応するデータ、ならびに、上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、データファイル出力レコード内の第1の項目名に対応するデータを上記第2の単位記入域に出力する手段と、
からなることを特徴とする。
また、請求項5に記載の情報処理装置は、請求項4に記載の情報処理装置であって、
1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と上記の特定の区分である第1の区分情報とを対応付けた形で登録し、2つのデータ間の特定の演算を指示する特定用語について、該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書と、

識別した差異条件文字列から、第2の区分情報が対応付けられた上記辞書登録用語を、差異条件文字列の文字列データと第2の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合に基づき、定めた方法によって検出する手段と、

データファイルから上記第1の単位データ域に出力したデータとデータファイルから上記第2の単位データ域に出力したデータとの間で、検出した第2の区分情報を付した用語に定義されている方法による演算をおこなった上、
演算によって得られたデータと上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、上記によって得られたデータを第2の単位記入域上に出力する手段とを、
備えたことを特徴とする。
請求項6に記載の情報処理装置は、
構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力をおこなう情報処理装置であって、

表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
1つの項目名に属する表上の記入データ全体に対して第1の演算を指示する特定用語について該当のコード列情報と第1の区分情報とを対応付けた形で登録し、2つのデータの間の第2の演算を指示する特定用語について該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書と、
表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、

データフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルのセルデータと該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成する手段と、

第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、
上記辞書において第1の区分情報を付して登録した用語と第2の区分情報を付して登録した用語とを、各々、差異条件文字列の文字列データのコード列情報と上記辞書登録用語のコード列情報と区分情報に基き、定めた方法に従って検出した上、
検出した第1の区分情報を付した辞書登録用語に定義された方法を表わす「演算方法情報」と第2の区分情報を付した辞書登録用語に定義された方法を表わす「全体演算情報」とを収めた差異条件定義データを作成する手段と、

第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別する手段と、

識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求める手段と、

識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側レコードを得る手段と、

データファイルからレコードを順次取り出し、
表側レコードを構成する各データに対応付けた各項目名について、
データファイルかた出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力する手段と、

表上の第1の項目名に対応するデータフィールドを構成する各セルについて、上記(3)、(4)、(5)、(6)の各手段による処理をおこない、各セル内の第1の単位記入域に出力したデータに対して差異条件定義データの「全体演算情報」に定められた方法に従った第1の演算をおこなう手段と、

表上の第1の項目名に対応するデータフィールドを構成する各セルについて、該当セル内の第1の単位記入域に出力したデータと第1の演算によって得られたデータとの間で差異条件定義データの「演算方法情報」に定められた方法に基く第2の演算をおこない、
第2の演算によって得られたデータを表わすコード列情報と識別した第2の単位記入域内の定められたデータ記入位置を表わす位置情報とを持つ文字列データを作成することによって、
第2の演算によって得られたデータを該当のセル内の第2の単位記入域に出力する手段と、
からなることを特徴とする。
請求項7に記載の情報処理装置における方法をコンピュータによって実現させるための制御プログラムは、
構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と特定の区分情報とを対応付けた形で登録した辞書と、
表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
を備えた情報処理装置にあって、

(1)1つのデータフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルを表わすセルデータと、該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

(2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、上記の特定の区分情報を付して上記辞書に登録されている用語を、差異条件文字列と上記の特定の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合によって検出した上、
第2の項目名に属するデータに対する変更方法を指示する情報であって、検出した上記辞書登録用語、ならびに、検出した上記辞書登録用語と上記辞書において対応付けて登録されている項目名とを、各々、「変更方法情報」、「変更項目名情報」として収めた差異条件定義データを作成するステップと、

(3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

(4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

(5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側主レコードを得るステップと、

(6) 表側主レコードを構成するデータの中から、差異条件データにおいて「変更項目名情報」として登録されている第2の項目名に対応するデータを選択し、選択したデータを差異条件データ内において「変更方法情報」として登録されている上記辞書登録用語に定義されている方法に基づいて変更することによって、表側副レコードを作成するステップと、

(7) データファイルからレコードを順次取り出し、
表側主レコードを構成する各データに対応付けた各項目名について、
データファイルから出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

(8)データファイルからレコードを順次取り出し、
表側副レコードを構成する各データに対応付けた各項目名について、上記データファイル出力レコード内の対応するデータと表側副レコード内の対応するデータとの間で、コード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第2の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第2の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコード内の第1の項目名に対応するデータ、ならびに、上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、データファイル出力レコード内の第1の項目名に対応するデータを上記第2の単位記入域に出力するステップと、
からなることを特徴とする。
また、請求項8に記載の情報処理装置における方法をコンピュータによって実現させるための制御プログラムは、請求項7に記載の制御プログラムであって、
1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と上記の特定の区分である第1の区分情報とを対応付けた形で登録し、2つのデータ間の特定の演算を指示する特定用語について、該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書を備え、

(1)識別した差異条件文字列から、第2の区分情報が対応付けられた上記辞書登録用語を、差異条件文字列の文字列データと第2の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合に基づき、定めた方法によって検出するステップと、

(2)データファイルから上記第1の単位データ域に出力したデータとデータファイルから上記第2の単位データ域に出力したデータとの間で、検出した第2の区分情報を付した用語に定義されている方法による演算をおこなった上、
演算によって得られたデータと上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、上記によって得られたデータを第2の単位記入域上に出力するステップと、
からなることを特徴とする。
請求項9に記載の情報処理装置における方法をコンピュータによって実現させるための制御プログラムは、
構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
1つの項目名に属する表上の記入データ全体に対して第1の演算を指示する特定用語について該当のコード列情報と第1の区分情報とを対応付けた形で登録し、2つのデータの間の第2の演算を指示する特定用語について該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書と、
表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
を備えた情報処理装置にあって、

(1)データフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルのセルデータと該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

(2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、
上記辞書において第1の区分情報を付して登録した用語と第2の区分情報を付して登録した用語とを、各々、差異条件文字列の文字列データのコード列情報と上記辞書登録用語のコード列情報と区分情報に基き、定めた方法に従って検出した上、
検出した第1の区分情報を付した辞書登録用語に定義された方法を表わす「演算方法情報」と第2の区分情報を付した辞書登録用語に定義された方法を表わす「全体演算情報」とを収めた差異条件定義データを作成するステップと、

(3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

(4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

(5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側レコードを得るステップと、

(6) データファイルからレコードを順次取り出し、
表側レコードを構成する各データに対応付けた各項目名について、
データファイルから出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

(7)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、上記(3)、(4)、(5)、(6)の各ステップをおこない、各セル内の第1の単位記入域に出力したデータに対して差異条件定義データの「全体演算情報」に定められた方法に従った第1の演算をおこなうステップと、

(8)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、該当セル内の第1の単位記入域に出力したデータと第1の演算によって得られたデータとの間で差異条件定義データの「演算方法情報」に定められた方法に基く第2の演算をおこない、
第2の演算によって得られたデータを表わすコード列情報と識別した第2の単位記入域内の定められたデータ記入位置を表わす位置情報とを持つ文字列データを作成することによって、
第2の演算によって得られたデータを該当のセル内の第2の単位記入域に出力するステップと、
からなることを特徴とする。
請求項10に記載の情報処理装置における方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体は、
構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と特定の区分情報とを対応付けた形で登録した辞書と、
表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
を備えた情報処理装置にあって、

(1)1つのデータフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルを表わすセルデータと、該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

(2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、上記の特定の区分情報を付して上記辞書に登録されている用語を、差異条件文字列と上記の特定の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合によって検出した上、
第2の項目名に属するデータに対する変更方法を指示する情報であって、検出した上記辞書登録用語、ならびに、検出した上記辞書登録用語と上記辞書において対応付けて登録されている項目名とを、各々、「変更方法情報」、「変更項目名情報」として収めた差異条件定義データを作成するステップと、

(3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

(4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

(5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側主レコードを得るステップと、

(6) 表側主レコードを構成するデータの中から、差異条件データにおいて「変更項目名情報」として登録されている第2の項目名に対応するデータを選択し、選択したデータを差異条件データ内において「変更方法情報」として登録されている上記辞書登録用語に定義されている方法に基づいて変更することによって、表側副レコードを作成するステップと、

(7) データファイルからレコードを順次取り出し、
表側主レコードを構成する各データに対応付けた各項目名について、
データファイルかた出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

(8)データファイルからレコードを順次取り出し、
表側副レコードを構成する各データに対応付けた各項目名について、上記データファイル出力レコード内の対応するデータと表側副レコード内の対応するデータとの間で、コード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第2の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第2の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコード内の第1の項目名に対応するデータ、ならびに、上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、データファイル出力レコード内の第1の項目名に対応するデータを上記第2の単位記入域に出力するステップと、
からなることを特徴とする。
また、請求項11に記載の情報処理装置における方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体は、請求項10に記載の記憶媒体であって、
1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と上記の特定の区分である第1の区分情報とを対応付けた形で登録し、2つのデータ間の特定の演算を指示する特定用語について、該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書を備え、

(1)識別した差異条件文字列から、第2の区分情報が対応付けられた上記辞書登録用語を、差異条件文字列の文字列データと第2の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合に基づき、定めた方法によって検出するステップと、

(2)データファイルから上記第1の単位データ域に出力したデータとデータファイルから上記第2の単位データ域に出力したデータとの間で、検出した第2の区分情報を付した用語に定義されている方法による演算をおこなった上、
演算によって得られたデータと上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、上記によって得られたデータを第2の単位記入域上に出力するステップとを、
をおこなうことを特徴とする。
請求項12に記載の情報処理装置における方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体は、
構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
1つの項目名に属する表上の記入データ全体に対して第1の演算を指示する特定用語について該当のコード列情報と第1の区分情報とを対応付けた形で登録し、2つのデータの間の第2の演算を指示する特定用語について該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書と、
表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
を備えた情報処理装置にあって、

(1)データフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルのセルデータと該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

(2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、
上記辞書において第1の区分情報を付して登録した用語と第2の区分情報を付して登録した用語とを、各々、差異条件文字列の文字列データのコード列情報と上記辞書登録用語のコード列情報と区分情報に基き、定めた方法に従って検出した上、
検出した第1の区分情報を付した辞書登録用語に定義された方法を表わす「演算方法情報」と第2の区分情報を付した辞書登録用語に定義された方法を表わす「全体演算情報」とを収めた差異条件定義データを作成するステップと、

(3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

(4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

(5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側レコードを得るステップと、

(6) データファイルからレコードを順次取り出し、
表側レコードを構成する各データに対応付けた各項目名について、
データファイルかた出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

(7)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、上記(3)、(4)、(5)、(6)の各ステップをおこない、各セル内の第1の単位記入域に出力したデータに対して差異条件定義データの「全体演算情報」に定められた方法に従った第1の演算をおこなうステップと、

(8)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、該当セル内の第1の単位記入域に出力したデータと第1の演算によって得られたデータとの間で差異条件定義データの「演算方法情報」に定められた方法に基く第2の演算をおこない、
第2の演算によって得られたデータを表わすコード列情報と識別した第2の単位記入域内の定められたデータ記入位置を表わす位置情報とを持つ文字列データを作成することによって、
第2の演算によって得られたデータを該当のセル内の第2の単位記入域に出力するステップと、
からなることを特徴とする。
以上において説明したように、本発明によれば、1つのセル中に元々のデータ記入域である主エリアのほかに、第2の記入域である派生エリアが設けられ、「派生エリア」について指定された「主エリア」と異なる記入条件である「差異条件」が多様な形式により複雑に定義されている帳表フォーマットにおいても、単純な通常の帳表フォーマットについておこなうのと同レベルの帳表フォーマット上の簡単な指定操作によって自動的なデータ出力をおこなうための帳表定義を得ることができ、上記のような帳表フォーマットへのデータ出力を現行方法に比べて、格段の簡単さと迅速さによっておこなうことができる。
また、本発明によれば、1つのセル中に元々のデータ記入域である主エリアのほかに、第2の記入域である派生エリアが設けられ、「派生エリア」について指定された「主エリア」と異なる記入条件である「差異条件」が多様な形式により複雑に定義されている帳表フォーマットにおいて、「差異条件」を人間間の意思伝達に日常用いる自然語表現をそのまま用いる形で定義することができるので、上記帳表フォーマットへのデータ出力を簡単迅速におこなえる上、誰もが、ほとんど学習と習熟の必要無く、直ちにおこなえ、また定義内容を誰もが即座に理解できるユーザ親和性を備えた形でおこなうことができる。
また、本発明によれば、1つのセル中に元々のデータ記入域である主エリアのほかに、第2の記入域である派生エリアが設けられ、「派生エリア」について指定された「主エリア」と異なる記入条件である「差異条件」が多様な形式により複雑に定義されている帳表フォーマットにおいて、人間間の意思伝達に日常用いる自然語表現をそのまま用いた「差異条件」の定義を確定的におこなえるので、上記帳表フォーマットへのデータ出力をユーザ親和性と定義内容の確定性を両立させた形でおこなうことができる。
発明を実施実施するための最良の形態
以下、添付図を参照して本発明を説明する。
図1に、本発明の一実施例における情報処理装置のハードウェア上のシステム構成を示す。このシステムにおいて、カラーイメージ・スキャナ10、キーボード12、マウス14およびディジタイザ15が入力装置として、内部メモリ16および外部メモリ18が記憶装置として、表示装置20および印紙装置22が出力装置として、それぞれ適当なインタフエース回路(図示せず)を介してCPU24に接続されている。また、CPU24は、通信装置26を介して電話回線または通信回線27とも接続されている。
カラーイメージ・スキャナ10は、用紙上に記載された文書中の文字、記号および図形をカラー画像情報として読み取る。内部メモリ16および外部メモリ18には、CPU24の処理または制御動作を規定する各種プログラムのほか、各種電子辞書、キャラクタフォント、ファイル等が格納されている。通信装置26は、ファクシミリ通信機能を有している。
図2に、本実施例のシステムにおいて帳表の作成に関する動作モードの一覧を示す。「文書作成」、「定義」、「環境設定」等の主モードが設定されており、これらの主モードはそれぞれ「取り出し」・・・、「定義解釈」・・・、「定義情報設定」等のサブモードに分岐している。
図3に、表示装置20のディスプレイ画面20aに表示される「主モードー覧メニュー」を示す。ディスプレイ画面20aの左下隅部に常時表示されている「モード」ボタンを選択指示すると、この「主モードー覧メニュー」が画面に現れ、画面の右下部に「文書作成」、「定義」、「環境設定」などの主モード選択ボタンが表示される。
上記の「主モードー覧メニュー」で、「環境設定」ボタンをクリックすると、環境設定モードが選択される。この環境設定モードに切り替わると、ディスプレイ画面20aに図4に示すような画面が映し出され、画面の右下部に「定義区別設定」、「定義情報設定」等のサブモード選択ボタンが表示される。ここで、「定義情報設定」ボタンをクリックすると、定義情報設定モードに入り、図5に示すような「定義要素/記入情報対照表」画面に表示される。
図5において、本実施例では、「共通」、「帳表定義」、等の複数の定義系が用意され、各定義系の中に複数の定義要素が設定されている。このうち、「帳表定義」、系の各定義要素は帳表上のデータ管理上のフォーマットを設定するために用いられ、「共通」の各定義要素は、他の定義系の定義にも共用される。
図5に示すように、各定義要素には、1種類または複数種類の所定の文字(文字列)、記号または図形が対応づけられている。定義要素の中には、たとえば、定義要素「丸め方」に対応する“切上げ”のようにその記入情報だけで目的の定義内容を表すものもあれば、定義要素「項目名」に対応する“< >”のように、定義内容を構成するものとして、書面上の他の記入情報を指定するものもある。また、定義要素「登録語指定」に対応する“○”のように、これによって指定されている文字、記号等は、応用用語辞書を参照して定義内容を解釈すべきことを指示するものもある。
上記のような定義要素と記入情報との対応付けは、システムが最初から用意していてもよく、あるいはユーザが画面入力で随時設定登録できるようにしてもよい。いずれにしても、たとえば図6に示すようなデータフォーマットで、各定義要素毎に図5の対照表に相当する可変データ長の定義要素識別データが設定される。各定義要素識別データは、後述する定義情報認識部の定義要素識別データ記憶部48(図21)に保持される。
なお、図6の「定義要素識別データ」のデータフォーマットにおいて、「定義系コード」のデータ・フィールドには当該定義要素(たとえば「切上げ」)の属する定義系(帳表定義)のコードがセットされ、「定義要素種別」のデータ・フドィールドには当該定義要素(切上げ)のコードがセットされ、「構成文字列/記号列」の各データ・フィールドには当該定義要素(切上げ)に対応する文字列(切上げ、切り上げ…)のコードが所定の区切り識別データを挟んでセットされ、末尾のフィールドにはこのデータの終端を示す所定の終端識別データが付けられる。
上記のように、本実施例では、文書上で各種の定義を行うための定義要素が、通常の文書内容を表す通常記入情報としても利用可能な文字、記号または図形と対応づけられている。ただし、後述するように、定義要素として用いられるときは、当該記入情報に特別の修飾情報(たとえば色情報)を付し、文書内容を表す通常記入情報とは区別するようにしている。つまり、ユーザにあっては、普段使い慣れている記入情報を、文書内容を表すための通常記入情報としてそのまま使えるだけでなく、これに特別の修飾情報を付加することで定義内容を示すための定義情報としても使えるようになっている。
図4の「環境設定モード画面」において「定義区別設定」のサブモード選択ボタンを選択すると、ディスプレイ画面20aには図7に示すような「定義情報区別指示画面」が現われる。
図7において、[定義系]の欄こは「帳票定義」等の定義系がリストされている。ユーザは、各定義系の記入情報に用いる[色]、[線修飾]、[線太さ]、[手書き/印刷]の修飾情報または識別情報を各位置に入力すればよい。
図7の例では、たとえば、「帳表定義」の定義系には(青)を[色]の欄に入力し、「書式定義」の定義系には(赤)を指定している。「共通」の各定義要素は全ての定義系に共用されるので、「共通」固有の修飾情報を設定する必要はない。
以上の指定を終えると、「定義情報区別指示画面」上の「終了」ボタンを指示すると、以上の定義情報区別指示の入力操作に応動してシステム内では、たとえば図8に示すようなデータフォーマットで各定義系についての定義情報区別データが設定される。この定義情報区別データは、後述する定義情報認識部の定義情報区別データ記憶部50(図21)に保持される。
次に、このシステムを用いて、ユーザが用紙上に自由に作成した集計表の上に、データの集計出力をおこなう例について説明する。
ユーザは、たとえば、図9に示す表のフォーマットを用紙として持っており、このフォーマット上に他のデータファイルのデータ、または、他の表フォーマットのデータの集計出力を得ることを意図しているものとする。
図9の表中において、最上段の行上には、項目名「年度」のデータ記入欄(フィールド)が設けられ、最左列には、項目名「商品」のデータ記入欄が設けられ、表中の上から第2行から第5行、左から第2列から第5列に位置するセルのマトリクスには、項目名「売上げ」のデータ記入欄が設けられている。
また、表中の最下行には同一列の項目名「売上げ」のデータの合計値を記入する合計欄が設けられ、表中の最右列には同一行の項目名「売上げ」のデータの合計値を記入する合計欄が設けられている。
ユーザは、各項目名とそのデータ名との関連付けを記述した、何らかの辞書(たとえば、商品名マスタファイル…)を前提に、以上のことを表内の記入内容から読み取っている。例えば、項目名「年度」については、各々、その記入データの並び“2001年”、“2002年”、“2003年”から読み取り、項目名「商品」については、記入データの並び“テレビ”、“ラジオ”、“カーナビ”に加え、それに隣接した上側位置に記入されている見出し語“商品名”の助けも得て読み取っている。また、項目名「売上げ」とそのデータ記入欄(フィールド)との対応付けは表の表題から読み取っている。
また、この項目名「売上げ」のデータ記入欄内の各セルの集計条件は、該当のセルと一定の配置関係にある表上の他の記入データから読み取っている。たとえば、表中の上から見て第3行、左から見て第3列にある、項目名「売上げ」のデータ記入欄のセルの集計条件は、同じ第3行上に記入されている項目名「商品」のデータ“ラジオ”と、同じ第3列に記入されている項目名「年度」のデータ“2002年”の論理積として読み取っている。
この表フォーマット(図9)においては、項目名「売上げ」のデータ記入欄(フィールド)を構成する各セル中には、記号“[ ]”により、もう一つのデータ記入域が設けられている。
例えば、表中の上から見て第3行、左から見て第3列にある、項目名「売上げ」のデータ記入欄のセルに設けられた2つの記入域のデータ記入条件は、項目名「商品」については、互いに同一であるが(いずれも、「商品」は“ラジオ”)、項目名「年度」のデータが、元々の記入域側は、”2002”であるのに対して、記号“[ ]”により新しく設けられた記入域側には、まず、その前年度である“2001”という異なる条件でデータが集計され、さらに、その集計値と元々の記入域側の集計値との比率が記入されるようになっている。
この項目名「売上げ」のデータ記入欄(フィールド)における記入分けを、ユーザは表の表題の下に記入されている注釈文「[ ]内は対前年比」から読み取っている。
このように、あるデータ記入欄(フィールド)の各構成セル中に、さらに、もう一つの記入域が設けられ、この中に元々の記入域の記入条件とは異なる条件のデータが記入される場合、本明細書においては、このセルの中に新しく設けられた記入域を「派生エリア」、元々の記入条件のデータを記入する側の記入域を「主エリア」と呼び、この「派生エリア」について指定された「主エリア」と異なるデータ記入条件のことを、「差異条件」と呼ぶことにする。
また、この新しい記入域「派生エリア」が設けられたセルを、特に「複合セル」と呼び、これに対して、1つのデータのみが記入されるセルを「通常セル」と呼ぶ。
また、本例における記号“[ ]”のように、セル中に記入され、「派生エリア」を生成する記入要素を「派生エリア生成要素」と呼ぶ。
図9の表フォーマットにおいては、項目名「売上げ」のデータ記入欄(フィールド)の「派生エリア」には、いったん、「主エリア」とは異なる条件でデータが集計され、次に、この集計データと該当の「主エリア」内集計データとの演算がおこなわれるという2段階の処理によって得られた処理結果が記入されるようになっている。
この「派生エリア」内データを生成する処理の中、前段階である、データを集計する時に集計条件として参照される「関連データ条件」における「派生エリア」の「主エリア」に対する差異を「関連データ差異条件」、また、後段階である、その集計データに対しておこなわれる演算を「演算差異条件」と呼ぶことにする。
例えば、表中の上から見て第3行、左から見て第3列にある、項目名「売上げ」のデータ記入欄の複合セルについていえば、その派生エリアの「関連データ差異条件」は、「項目名“年度”のデータ値が、主エリアの“2001”に対して、その“前年度”である“2000”」であり、「演算差異条件」は、「派生エリア内集計データ値と該当の主エリア内集計データ値との比率演算」ということになる。
本システムでは、ユーザが上記のように認識するとおりの定義内容をシステムに多意性なく定型的に認識させるように、図10に示す「定義付け」操作をおこなう。この「定義付け」操作は、集計表の元々の記入内容である通常記入情報と区別し得る定義支援記入情報を追加記入することによっておこなう。本例の場合、定義支援記入情報は、図7に示したように「共通」と「帳表定義」の定義系に割り当てた(青)色を用いて記入することによって、通常記入情報と区別することにする。
集計表における「定義付け」の基本として、まず、集計表上の全てのデータフィールドについて、その項目名を対応付ける「項目定義」をおこなう。「項目定義」に使用する項目名(本明細書においては、以降、「対応項目名」と呼ぶ)としては、ユーザが用紙上に自由に記入したものをなるべく使用するという本システムの趣旨から、集計表上でもともと、見出し語として記入されているものがあれば、それをそのまま使用する。
「項目定義」をおこなうデータフィールド(本明細書においては、以降、「項目定義データフィールド」と呼ぶ)は、以下のように指定する。
先ず、同じ対応項目名を持ち、隣接しあうセルの集合(セル列)毎に、「フィールド指定」の定義要素記号“「 」”、または、“[ ]”を使用し、データフィールドの指定をおこなう。すなわち、「フィールド指定」の定義要素記号“「 」”、または“[ ]”の構成記号である“「”と“」”、あるいは“[”と“]”を、各々、該当セル列の両端セルの中に記入する。
なお、表の最下行上の左から見て第2列目以降のセル列、また、表の最右列上の上から見て第2行目以降のセル列は、項目名が「売上げ」のデータ記入欄(データフィールド)に属するが、この部分は表内のデータ合計値の記入欄でもあるので、システムの処理の便宜上、後述の合計欄データフィールドの定義のみをおこない、今、おこなおうとしている「項目定義」の対象のデータフィールドには含めない。
このデータフィールドに対応付ける項目名としては、データフィールドの上側、あるいは、左右の両側に隣接して、元々、見出し語として記入されているものがあれば、それを対応項目名として指定する。項目名の指定は、定義要素記号“<>”の各構成記号”<”と”>”とを、各々、該当の文字列の両側に追記することによっておこなう。本例の場合、この指定方法により、見出し語“商品“が、下側に隣接しているデータフィールドの対応項目名として定義されることになる。
対応付ける項目名が元々の記入内容―通常記入情報の見出し語として記入されていない場合は、該当データフィールド近傍の空欄に、該当の名称の文字列を(青)色の定義支援情報記入した上、項目名の指定を施し、さらに、定義要素の「結合線」“−”を用いて、該当のデータフィールドと結んでおく。本例の場合、この方法により、項目名“年度”が、該当するデータフィールドと対応付けられることになる。
なお、文字列“年度”を対応項目名として指定する時には、それが応用用語辞書52中において「年月日項目」区分として登録されていることを確認しておこなう。
複合セルからなるデータフィールド(以下、「複合フィールド」と呼ぶ)については、まず、フィールド範囲の指定は、通常のデータフィールドと同じ方法によりをおこなう。 本例の場合、項目名「売上げ」のデータフィールドについて、左上端のセルと右下端のセルに、各々、「フィールド指定」の定義要素記号の構成記号“「”と“」”とを記入する。(このフィールドは、セルのマトリクスを形成しているので、“「 」”を使用する。)
次に、該当の項目名「売上げ」を、(青)色の定義支援記入情報として、表外の空白部に記入した上、上記した項目名の指定を加え、該当のデータフィールド内の任意の主エリア部分へ結合線“−”を引き出しておく。
また、項目名「売上げ」には、「集計区分」が「集計数値」であること指定をするために、項目名文字列”売上げ”の右肩部分に、定義要素「集計数値指定」の“○”記号を(青)色の定義支援記入情報として追記しておく。
なお、仮に、表フォーマット上に項目名「単価」のように、集計されない数値データが存在するときは、「非集計数値データ」を示す定義要素記号を設け、該当項目名文字列の右肩部に付しておけばよい。
次に、書面上において、複合フィールドとその「差異条件」の定義付けをおこなう。本システムでは、この定義付けを、書面上において「差異条件」として定義した文字列を該当のデータフィールド内と特定の関係付けを与えることによりおこなう。本明細書においては、この「差異条件」を定義するために使用される文字列を、特に、「差異条件文字列」と呼ぶことにする。
本例の場合、この定義付けとして、表外に書かれた注釈文である”[ ]内は対前年比” を利用することにして、その中の部分文字列”対前年比”を「解釈指定」の定義要素”○”により囲み、該当の項目名「売上げ」のデータフィールド内の任意の派生エリア内部分と定義要素の「結合線」により結ぶ。ここで、追記する定義要素「解釈指定」と「結合線」は、(青色)の定義支援記入情報により記入する。
但し、この「解釈指定」定義要素”○”による指定は、指定された部分文字列中のさらに部分文字列である”対…比”と”前年”とが、各々、応用用語辞書52(後出図26)中において、「演算指定2」区分と「相対指定」区分として登録されている用語であることを確認した上でおこなう。
本例では、上記したように、システム中の応用用語辞書52中の登録用語”前年”を用いて、「関連データ差異条件」の内容を定めている。本明細書においては、このように、「関連データ差異条件」の定義に用いている、システムの辞書手段中に予め登録した特定の用語を、特に、「関連データ差異条件登録語」と呼ぶことにする。
本システムは、ユーザが書面上に記入されている文字列などの記入情報をそのまま使用して、システムに、ユーザが記入した時に意図した意味にしたがって解釈させて処理させることを基本的な考え方とする。この記入情報の解釈をシステムに確定的におこなわせるために、本システムでは以下のことをおこなう。
先ず、ユーザとのインターフェースとして、ユーザが日常使用している意味にしたがってシステムに解釈させたい用語を、ユーザとシステムの両者が参照できる特定の辞書手段(応用用語辞書52)に登録しておき、ユーザに書面上におけるシステムに解釈させたい部分を、特定の指定手段によって指定させる。(「解釈指定」定義要素”○”によって囲む)
なお、この辞書手段の登録用語の意味に、あいまい性、多意性が残る場合には、応用用語辞書52のユーザとのインターフェース(例えば、ユーザマニュアル)中に、語義の注釈を付けて、意味の確定をおこなっておく。
上記した指定手段によって指定される文字列は、上記辞書手段の登録用語以外に、本システムにおいてユーザに定義されている用語(例えば、「項目名」として定義された文字列)を含んでもよい。
システムは、この指定された文字列部分について、先ず、その中の上記辞書手段の登録用語は、上記辞書手段によって確定された意味にしたがって解釈し、さらに、用語間の関係を使用言語(本例の場合、日本語)の構文規則にしたがって解釈した上、文字列全体の意味を定める。
以上のようにその意味が一意に定まる文字列が、本システムが定めた「差異条件」としての形式と条件を満たした上、あるデータフィールドと特定の関係付けが与えられている場合、該当の文字列は、複合データフィールドの「差異条件文字列」として定義されることになる。
なお、指定された文字列が「差異条件」としての形式と条件を満たしている場合であっても、該当のデータフィールドに関する他の定義付けとして解釈される可能性が残る場合には、該当の文字列に対して、特定の指定手段を用いて「差異条件」であることを指定する。(例えば、該当の文字列に「差異条件指定」の定義要素”△”を付す)
本例において、「解釈指定」定義要素”○”により囲んだ文字列内の部分文字列”前年”は、ユーザがふだん使用している意味にしたがって、ある基準となる年度の”1つ前の”年度を指定する「相対指定」区分の登録用語として応用用語辞書52に登録されており、「対…比」は、ある基準となるデータとの比率を意味する「演算指定2」区分の登録用語として応用用語辞書52に登録されている。
今、例えば、後出 図52(ハ)のように、文字列”前年”を定義要素”○”により囲み、定義要素の「結合線」により、例えば、項目名「売上げ」のデータフィールドの派生エリア部分と対応付けると、該当のデータフィールドは、項目「年度」について、主エリアの年度”2001”に対して、その「前年」である年度”2000”を差異条件とする複合データフィールドあることが定義されることになる。
さらに、本例の図10のように、この文字列”前年”を応用用語辞書52の「演算指定2」区分の登録語「対…比」で挟んだ文字列”対前年比”を、定義要素”○”により囲み、定義要素の「結合線」により項目名「売上げ」のデータフィールドの派生エリア部分と対応付けると、この文字列は、上記した応用用語辞書52の登録語をもとに、日本語構文解析により解釈され、派生エリア内には、上記の場合(図(ハ)の場合)で得られた派生エリア内のデータによって該当主エリアのデータを除算したの比率を記入すべきことがシステムに対して確定的に指示されることになる。
この「差異条件文字列」の ”対前年比”は、表外の適当位置に(青)色定義支援記入情報により追加記入してもよい。また、項目定義データフィールドと定義要素「結合線」により関係付けられた、項目名指定文字列以外の文字列は、必ず、「解釈指定」定義要素”○”により指定された場合と同じ取り扱いによって解釈をされるという約束を使用者と装置の間で決めておくことにより、「解釈指定」定義要素”○”の付記を省くこともできる。
最後に、表上の最下段の行上と最右列の列上とにおいて、各データフィールドの合計値が記入される合計欄の定義をおこなう。本システムでは、先ず、同じ種類の演算(例えば、加算、あるいは、平均演算…)の結果記入欄の連続したセル列(以降、「演算結果欄データフィールド」と呼ぶ)毎に、上記した項目定義データフィールドの指定と同じように、「フィールド指定」の定義要素記号“[ ]”を用いて指定する。すなわち、各「演算結果欄データフィールド」について、その両端のセル中に、「フィールド指定」の定義要素記号“[ ]”の構成記号“[”と“]”とをそれぞれ記入する。
本例の場合、表の最下段の行と最右端の列上に指定された、この2つの連続した合計欄のセル列(以降、合計フィールドと呼ぶ)の各構成セルは、項目名「売上げ」のデータが集計されることから、項目「売上げ」のデータフィールドと同じ「差異条件」と「派生エリア」を持つ複合セルであるが、その指定方法は、通常の合計フィールドと同じようにおこなえばよい。
表の右下角のセルは、最下段の行上に定義する「合計フィールド」に含めてもよいし、最右列の列上に定義する「合計フィールド」に含めてもよい。
本システムでは、次に、各「演算結果欄データフィールド」について、その「演算結果欄指定語」を次のように定義する。各「演算結果欄データフィールド」に対して、「特定隣接位置」に記入されている文字列を、応用用語辞書52中の「演算指定1」区分の登録用語であることを確認した上、「解釈指定」の定義要素記号“○”によって囲む。ここでいう「特定隣接位置」とは、そのデータフィールドのセル列が横方向に配置されたものである場合、そのフィールドの左側に隣接する位置であり、そのデータフィールドのセル列が縦方向に配置されたものである場合、そのフィールドの上側に隣接する位置のことをいう。
本例の場合、 最下行の合計フィールド左端に隣接するセル中と、最右端列の合計フィールド上端に隣接するセル中に、記入されている”計”文字を、応用用語辞書52中に「演算指定1」区分として登録された用語であることを確認した上、「解釈指定」の定義要素記号“○”によって囲む。
仮に、図9に示した表フォーマット上の“計”文字の位置に、“平均”、“分散”などの演算を指示する用語文字列が記入されているとすると、同じく、それらについて応用用語辞書52中に「演算指定1」区分として登録された用語であることを確認した上、「解釈指定」定義要素記号“○”によって囲めばよい。
該当の応用用語辞書52の登録用語が書面の元々の記入内容―通常記入情報として「演算結果欄データフィールド」の「特定隣接位置」に記入されていない場合には、(青)色の定義支援記入情報により、該当の応用用語辞書52の登録用語を記入し、該当の「演算結果欄データフィールド」と定義要素の「結合線」により結べばよい。
本システムでは、前記したように、ユーザが帳表上で、日常(通常記入情報として)使用している特定の用語を応用用語辞書52(後出図26)に登録しておき、書面上においてこの登録用語を「解釈指定」の定義要素記号“○”によって囲むことにより、ユーザが理解するとおりの所定の意味をもつ定義情報に転化させている。
すなわち、「解釈指定」の定義要素記号“○”によって囲む”計”文字は、“[ ]”により指定されたフィールドと、一体化してデータ管理上の1つの定義情報を構成し、定義要素“[ ]”により指定した合計フィールド内の各欄(セル)は、各々、他の特定のフィールド内に記入さている数値データを合計した値を記入すべきことをを定義している。
また、「解釈指定」定義要素記号“○”によって囲まれた“平均”、“分散”などの演算を指示する用語は、同じく、隣接する「フィールド指定」の定義要素により指定されたフィールド内の各欄(セル)は、各々、他の特定のフィールド内に記入さている数値データに対して、各々、該当する演算をおこなった結果値を記入すべきことを定義することになる。
本明細書においては、また、以上のように定義された演算結果記入欄の演算対象データを格納している、特定のフィールドのことを、「演算対象フィールド」と呼ぶ。
本例の場合、ある合計欄セルについて、その「演算対象フィールド」とは、その合計欄セルを含む合計フィールドと直角方向上側、または、直角方向左側に設定され、かつ、項目名「売上げ」のデータフィールドに属するセルの集合である。たとえば、最下行の左から2列目の合計欄セルの「演算対象フィールド」は、同列の縦方向上側に定義された項目名「売上げ」のデータフィールド部分になる。
次に、以上のように、定義支援記入情報を追記するこによって定義付けをおこなった表フォーマット記入用紙を本システムに入力し、所望のデータ出力を得るための諸機能について説明する。
図11に、本実施例のシステムにおける文書入力および文書要素データ生成部の構成を示す。文書画像入力部30は、カラー・イメージスキャナ10、キーボード12およぴマウス14等の入力装置と、入力ルーチンを実施するCPU24と、入力されたカラー画面をいったん取り込む内部メモリ16または外部メモリ18とによって構成される。
文書画像記憶部32、文字/図形パターン辞書36および文書要素データ記憶部38は、内部メモリ16または外部メモリ18の記憶領域を用いている。文字・図形要素認識部34は、文字・図形認識処理プログラムを実行するCPU24によって構成される。文書画像出力部40は、主として、表示制御プログラムを実行するCPU24と、このCPU24の制御の下で文書画像の表示出力を行う表示装置20あるいは文書画像の伝送出力を行う通信装置26とによって構成される。
ユーザは、カラー・イメージスキャナ10に帳表用紙をセットし、ディスプレイ画面20a上において「文書作成」モードを選択し、「文字/図形認識」ボタンをクリックする。
このクリック操作に応動して、まず、イメージスキャナ10による読取動作が行われ、図10に示す帳表文書の画像(全記入内容)を表すカラー画像信号が入力部30の画像記憶部に取り込まれる。入力部30に取り込まれたカラー画像信号は、信号の形態で(黒)、(青)、(赤)の各色画像信号に分解され、文書画像記憶部32内では(黒)の画像信号、(青)の青像信号、(赤)の画像信号としてそれぞれ黒画像記憶部32a、青画像記憶郭32b、赤画像記憶部32cに蓄積される。
次に、文字・図形要素認識部34は、文書画像記憶部32に蓄積された各書面毎の画素データについて、各色(黒、青、赤)毎に文書中の個々の文字、図形要素を認識する。ここで、図形要素とは、線分、矩形、円形のようにその形状が容易に画像認識されえるパターン化された簡単な図形群である。
本実施例における画像認識に際しては、たとえば図12に示すようなデータフォーマットで予め設定されている「画像管理データ」が参照される。この「画像管理データ」では、図13に示すように入力画像はマトリクス上に配置された多数の画素PXによって構成されているものとして、画素PXの個数、寸法、ピッチ等を表すデータをセットしている。
文字・図形要素認識部34における文字・図形の認識は、基本的には個々の文字、図形要素を構成する線素を認識することによって行われる。線素の識別については従来公知の種々の方法を用いてよい。たとえば、まず特定の色を有するドットの集合を見いだし、次に隣接慣域または周囲をサーチ知れそのドットの集合が延長する方向を判定する。この処理を繰り返して、ドットの集合の描く軌跡をそれが消滅(終端)するまで追跡していく。その追跡の途中で、軌跡の向きが急激に変化する箇所があれば、その箇所を屈曲点または尖点として識別する。
このようにして抽出された線素は、その形状、大きさにより予め設定された線素パターンの1つとして識別され得る。本実施例では、文字/図形パターン辞書36に、個々の文字、図形毎にそれを構成する線素の種別と、構成線素間の有意な位置関係とが所定の電子辞書方式で予め記憶(設定登録)されている。文字・図形要素認識部34は、上記のようにして抽出した線素を隣接するもの同士で互いに組み合わせてこれを文字/図形パターン辞書36と照合する処理を繰り返すことで、個々の文字、記号、図形を認識する。
また、たとえば一覧表のような表を構成する罫線については、次のようにして認識処理を行う。すなわち、上記したような線素の認識において直線とみなして抽出した線素が他の線素よりも桁違いに長く、かつその直線方向が水平線(X軸)または垂直線(Y軸)に対して或る角度内の傾きに収まる場合は、この直線を水平罫線または垂直罫線とみなし、水平線または垂直線と平行になるようにその位置情報を補正する。また、抽出された2つの罫線の端点同士の距離あるいは一方の罫線の端点と他方の罫線との距離が或る値以内にあるときは、両罫線の端点同士が互いに重なり合っている、あるいは片方の罫線の端点が他方の罫線上に重なっているとみなし、両罫線がそのように重なるようにそれぞれの位置情報を補正する。
文字・図形要素認識部34は、画像入力した文書の各色(黒、青、赤)画像について上記のような文字・図形認識処理を行うことによって、各文字、各図形要素、各記号につきたとえば図14〜図19に示すようなデータフォーマットで文書要素データを生成する。
図14に、1個の文字に対応する文書要素データ(文字データ)のデータフォーマット例を示す。図示のように、当該文字のコード、書体、色、線の太さ、線修飾(実線、点線、鎖線等)、手書き/印刷(手書き文字なのか印刷文字なのかの区別)、記入位置および大きさ(文字サイズ)をそれぞれ表すデータが順次所定のデータ・フィールドにセットされ、末尾にこの文書要素データの終端を示す終端識別データが付けられる。
図15に、1つの文字列に対応する文書要素データ(文字列データ)のデータフォーマット例を示す。図示のように、当該文字列の配置位置を示す「先頭文字位置」と「末尾行位置」、当該文字列の書式を示す「行ピッチ」、「文字ピッチ」がセットされるとともに、当該文字列を構成する各文字の文字コードが配置順にセットされる。
図16、図17および図18は、それぞれ1つの図形要素または記号に対応する文書要素データ(図形要素データ)のデータフォーマット例である。図17に示すように、線分については始端位置および終端位置のデータが組み込まれる。図18に示すように、長円については中心位置(X・Y方向)と径サイズ(X,Y方向)のデータが組み込まれる。図19に示すように、矩形や“<”等については始端および終端位置に加えて屈曲点または尖点(線分の方向が急峻に変化する点)の位置を示すデータが組み込まれる。
また、罫線によって表が構成されている場合、それを構成するセルを検出し、検出した各セルについて「セルデータ」を作成する。(図19)セルとは、表内において罫線に囲まれ、データを記入する単位となっている矩形領域のことをいう。
セルの検出は、たとえば、次のようにおこなうことができる。表を構成する罫線の罫線データを順次とり出し、書面の縦横両方向について、罫線、またはその延長によって区切られる罫線位置を求める。次にこの罫線位置により生成されるマトリクスの各ますについて、その各4辺が罫線部分であるかどうかをサーチし、罫線部分であれば、それをセル境界とし、罫線部分でなければ該当方向に隣接するますを併合し、併合したますにについて同じ判定を繰り返すことにより、セルの4辺の境界を識別していく。
作成した「セルデータ」には、今の段階では、その位置情報(たとえば、左上角点、右下角点の位置)のみをセットしておく。
上記のようにして、画像入力された各書面中の全ての記入情報が個々の文字、記号、図形に分解されて文字・図形要素認識部34により文書要素データに変換される。これらの文書要素データは、各書面単位で文書要素データ記憶部38に蓄積される。なお、文字・図形認識処理を受けて文書要素データに変換された記入情報に対応する画像情報は、文書画像記憶部32から抹消されてよい。
文書画像出力部40は、文書画像記憶部32に保持されている画像信号に基づいて文書画像を出力できるだけでなく、文書要素データ記憶部38に格納されている文書要素データからもそれを文字/図形パターン辞書36を介して画像信号に変換したうえで文書画像を出力することができるように構成されている。
上記の文書入力および文書要素データの生成処理が終了するとその旨を伝えるメッセージが例えばディスプレイ画面20aを通じて、システムからユーザに与えられる。
次にユーザは、ディスプレイ20aの右下部に常時表示されている「モード」ボタンをクリックして「定義」のモードを選択し、その画面上で「定義解釈」のボタンを選択指示する。この指示に応動して、システム内では、以下の処理がおこなわれる。
図20に、本実施例のシステムにおける定義情報認識およぴフォーマット設定部の構成を示す。定義要素データ生成部42および定義データ生成部46は、定義要素データおよび定義データ生成処理を実行するCPU24によって構成される。定義情報識別データ記憶部48、定義情報区別データ記憶部50、応用用語辞書52、定義データ記憶部54およぴシートグループ定義データ記憶部56は、内部メモリ16または外部メモリ18の所定の記憶領域上に展開されている。
この定義情報認識およびフォーマット設定部においては、先ず定義要素生成部42が、定義要素識別データ記憶部48および定義情報区別データ記憶部50にそれぞれ保持されている定義要素識別データ(図6)および定義情報区別データ(図8)を参照して、文書要素データ記憶部38に格納されている文書要素データ(図14〜図19)を基に各書面に記入されている各定義要素記入情報毎のデータ(定義要素データ)を生成する。
図21に、定義要素データのデータフォーマット例を示す。当該定義要素記入情報を識別する「定義系コード」および「定義要素コード」がセットされるとともに、当該定義要素記入情報を構成する文字、図形、記号に対応する文書要素データを参照するためのポインタがセットされる。たとえば、「フィールド指定」の“[]”の場合は、その構成記号“[”、“]”に対応する文書要素データのアドレスを指定するポインタがセットされる。
定義要素記入情報の構成記号に対応するデータが、1文字分を表わす文字データでなく、複数文字を表わす文字列データ中の部分データ(たとえば、1文字分のデータ等)として検出された場合は、新たに該当する部分について、文字データ、または、文字列データを作成すると共に、該当の文字列から該当構成記号の部分を除いた残りの部分について、新たに文字列データを作成すればよい。該当部分が該当の文字列中の両端にない時は、該当部分を挟んで別の文字列データを作成すればよい。
定義要素データを生成するには、該当の定義系に割り当てた修飾情報、たとえば(青)の色情報を有する文書要素データをサーチする。文字列データについては、さらに、その中で該当文字分のデータをサーチする。定義要素が「フィールド指定」の定義要素“「 」”のように、2つの記号の対で構成される場合は、まず、1つの構成記号をサーチ検出し、それと対をなす他方の構成記号を割り出す。
1つの定義要素構成記号について、対をなす他方の構成記号が、複数個検出される場合は、その選択は、次のようにおこなえばよい。たとえば、「フィールド指定」の定義要素“「 」”の場合、両構成記号の対によって形成される矩形内に、同じ種別の定義要素構成記号“「”、または“」”を含まない組み合わせを選択すればよい。
1つの定義要素ごとに、以上の方法で、「定義系コード」と「定義要素コード」が決まり、当該定義要素記入情報を構成する記号の文書要素データ(図形要素データ)のアドレスをそれぞれ指定するポインタも決めていくことができる。
上記のようにして定義要素データ生成部42より得られた各定義要素データは定義要素データ記憶部44に格納される。
次に、定義データ生成部46が、定義情報区別データ記憶部50に保持されている定義情報区別データ(図8)を参照して、定義要素データ記憶部44に蓄積されている定義要素データ(図21)、文書要素データ記憶部38に蓄積されている文書要素データ(図14〜図19)を参照して書面に記入されている各定義情報毎に定義データを生成する。
本例における定義データ全体の作成手順を、図22に示す。先ず、集計表内の全てのデータフィールドについて、「項目定義データ」(図23)と「演算結果欄定義データ」(図24)を作成する。(ステップAl、A2)この作成にあたっては、複合セルからなるデータフィールドと合計フィールドについても通常のデータフィールド、合計フィールドといったん同じ扱いで、(派生エリアを無視した形で)作成する。
続いて、「派生エリア」が定義された複合フィールドの「項目定義データ」と「演算結果欄定義データ」について、「派生エリア」上へのデータ入出力を可能にするための定義内容を付加する「複合フィールド定義処理」をおこなう。(ステップA3)
「項目定義データ」(図23)の作成は、以下の手順にしたがっておこなわれる。 まず、定義要素データとしてすでに抽出されている「フィールド指定」の定義要素記号”[ ]”、または、“「 」”を1つづつ識別し、それがデータフィールドとして指定しているセル、またはセル列を「フィールド候補」として識別し「フィールド候補定義データ」を作成する。フィールド候補定義データは、「項目定義データ」(図23)の形式により作成するが、その中の「項目名文字列データアドレス」は、対応する項目名が未だ決まっていないので未記入のままにしておく。
フィールド候補のセル列の検出は、「フィールド指定」の定義要素記号、たとえば、”[ ]”の構成記号”[ ”と”]”を各々、含むセルを両端のセルとして検出し、つぎに、両端のセルをつなぐセルを順次、検出していくことによっておこなうことができる。
検出したセル列は、そのセルデータを先頭のセルから、順次、セルデータ中の「ポインタデータ」によりつないだ「セルデータ・チェイン」(図示せず)を作成した上、その先頭セルのセルデータアドレスを「フィールド候補定義データ」の中の「先頭セルデータアドレス」にセットする。
項目名「売上げ」のデータフィールドのように、セル構成がマトリクスをなす場合は、例えば、まず、その第1行のセルを左から順につなぎ、その最右端のセルには、次の第2行の最左端セルをつなぎ、以下、第2行のセルを順につないでいく手順を繰り返すことによっておこなえばよい。
次に、以上で検出した、各「フィールド候補」について、対応する項目名を求め、「フィールド候補定義データ」を「項目定義データ」(図23)として完成させる。
先ず、フィールド候補のセル列内、またはデータ名候補の文字列からひき出されている定義要素「結合線」“−”をサーチする。該当のセル列内から引き出された「結合線」が存在し、その他端に隣接して、「項目名指定」をされた文字列(以降、「項目名指定文字列」と呼ぶ)が存在する場合、この文字列は該当のデータフィールドの対応項目名であると判定して、すでに作成してある該当「フィールド候補定義データ」の中の「項目名文字列データアドレス」に該当文字列の文字列データアドレスをセットする。
本例の場合、項目名「年度」と表外に追記された項目名「売上げ」と項目名「年度」について、以上のようにして項目定義データが作成されることになる。
「フィールド候補」が定義要素の「結合線」によって結ばれた「項目名指定文字列」を持たない場合、「フィールド候補」に対して上記した「特定隣接位置」にあり、かつ、「項目名」として指定されている文字列を該当のデータフィールドの「対応項目名」と見なして、項目定義データを作成する。
こうして検出された項目名は、同じく、「フィールド候補定義データ」の中の「項目名文字列データアドレス」に該当文字列の文字列データアドレスをセットし、「項目定義データ」として完成することになる。本例の場合、この方法により、項目名「商品」を対応項目名とする「項目定義データ」が作成されることになる。
次に、以上作成した項目定義データについて、以下の「区分」の判定をおこなう。まず、各項目定義が 「表外」に共通条件として定義されているか、「表内」のフィールド上で定義されているかを判定をする。
ある項目定義のデータフィールドが、たがいに隣接し合う複数のセルの集合として表の上に定義されている場合、「表内」のフィールドと見なし、「項目定義データ」内の「共通区分」欄に該当のコード“0”をセットしする。 また、「表外」のフィールド、データ名について定義された「項目定義データ」には、該当のコード“1”をセットする。本例の場合、全ての項目名の「項目定義データ」において“0”をセットすることになる。
次に、表フォーマット上の各項目定義について、その項目名が「集計区分」の判定をおこなう。各項目定義の対応項目名となっている文字列について、(青)色の「集計数値指定」の定義要素記号”○” と「非集計数値指定」の定義要素記号”●”とが、その文字列の所定の位置である文字列右上隣接部に付加記入されていることを検出すればよい。また、
「集計数値指定」の定義要素記号”○”が検出され、「集計数値」と判定された場合は、該当の項目定義データの「集計区分」部に該当のコード”1”をセットする。「非集計数値区分指定」の定義要素記号”●”が検出され、「非集計数値」と判定された場合は、該当の項目定義データの「集計区分」部に該当のコード”2”をセットし、それ以外の場合は、「非集計の非数値」として「集計区分」部に該当のコード“0”をセットする。
本例の場合、項目名「売上げ」の項目定義について、この「集計数値」の該当コード(”1”)がセットされ、項目名「商品」と「年度」の項目定義について、「非集計の非数値」の該当のコード(”0”)がセットされることになる。
続いて、各項目定義データの対応項目名が、応用用語辞書52中において「年月日項目」区分として登録されていることを判定し、その判定が得られた場合、「集計区分」欄に該当のコード”3”をセットする。「年月日項目」区分の項目名は、「非集計項目」であることを含意している。
本例の場合、項目名「年度」の項目定義について、いったん、「非集計の非数値項目項目」の指定がおこなわれるが、最終的に、この「年月日項目」区分の項目名として、該当のコード”3”がセットされる。
また、「年月日項目」区分の項目名については、該当の表フォーマット上から、その項目名に所属するデータ文字列が記入されている書式を読み取り、「年月日データ書式データ」を作成し、「項目定義データ」の「年月日データ書式データポインタ部」からポイントする。
「年月日データ書式定義データ」は、「年月日項目」区分に属する登録語(「年度」、「月別」…)毎に、各々、異なるデータ形式で作成される。例えば、登録語「年度」については、「年度書式データ」、登録語「年度」、「月別」については、「月別書式データ」が作成される。
「年度書式データ」は、次のように作成することができる。先ず、該当の文字列の記入書式が「元号型」か、「西暦型」かを判別する。該当のデータフィールドから、その中に記入されているデータ名文字列を1つ取り出し、その文字列の前方から、元号名を表わす文字列である” 平成”、”H”、”昭和”、”S”…に一致する部分をサーチできれば「元号型」と判定し、サーチできなければ「西暦型」と判別する。元号名を表わす文字列”平成”、”H”、”昭和”、”S”…は、このサーチ処理に付属させた特定辞書手段中に予め登録しておく。
次に、該当の文字列の後方から後置語“年”、”年度”をサーチし、これらの後置語の有無と種別を識別する。これらの後置語を表わす文字列“年”、”年度”も、このサーチ処理に付属させた特定辞書手段中に予め登録しておく。
最後に、以上のサーチから残された文字列が数字文字列であることを確認した上、その「数字種別」と「桁数」を識別する。以上得た判別結果を、「年度書式データ」に登録する。「年度書式データ」の形式を図24に示す。
本例の場合、項目名「年度」については、対応するデータフィールドから、例えば、データ名文字列”2001年”を取り出し、「元号型/西暦型区別」は、「西暦型」”、「数字桁数」は「4」、「数字種別」は「算用数字」、「後置語区分」は「年」と判定し、「年度書式データ」に該当データがセットされることになる。
全ての「項目定義データ」の作成を終えると、続いて、「演算結果欄定義データ」の作成をおこなう。(ステップA2)
先ず、書面上において、「登録語指定」の定義要素記号“○”によって囲まれ、かつ、応用用語辞書52に「演算指定1」区分として登録されている用語を、「演算結果記入欄指定語」として1つづつ識別していく。 「演算結果記入欄指定語」の識別は、先ず、書面上において「登録語指定」の定義要素記号“○”をサーチし、続いて、それによって囲まれた文字列が応用用語辞書52中において「演算指定1」区分として登録されている用語であることを判定していけばよい。なお、応用用語辞書52の登録用語としては、下記の「代表名」の外に下記の「同義語」も含めて判定する。
図26に応用用語辞書52に収載される用語の例を示す。応用用語辞書52においては、登録用語は、「代表名」をキーとして登録され、「同義語」、「区分」などの情報が各「代表名」に関係付けられて登録されている。また、「区分」が「相対指定」の各登録語には、「所属項目名」が関係付けられて登録されている。例えば、「区分」が「相対指定」に属する登録語「前年」には、その所属項目名「年度」が関係付けられて登録されている。
図27に応用用語辞書の収載単位となっている応用用語定義データのデータフォーマットを示す。応用用語定義データは各「代表名」毎に作成される。「代表名」、「所属項目名」、「同義語」のデータフィールドには該当の文字コード列がセットされ、「区分」のデータフィールドには該当のIDデータがセットされる。
「演算結果記入欄指定語」が識別できれば、該当する演算結果記入欄を次のように識別する。先ず、すでにフィールド候補定義データが作成されているデータフィールド(フィールド候補)の中から項目定義データが作成されていないものを選択し、その中から「演算結果欄指定語」と定義要素の「結合線」によって結ばれているものをサーチする。「演算結果欄指定語」と「結合線」によって結ばれているフィールド候補が無ければ、「演算結果欄指定語」に対して上記した「特定隣接位置」にあるフィールド候補をサーチする。
「演算結果欄指定語」と以上の関係にあるフィールド候補がサーチできれば、このフィールド候補は「演算結果欄データフィールド」として判定され、「演算結果欄定義データ」が作成される。「演算結果欄定義データ」の形式を図25に示す。
「演算結果欄定義データ」の「演算区分」部には、該当の「演算結果欄指定語」の応用用語辞書52中における「代表名」をセットする。応用用語辞書52中の「演算指定1」区分においては、1つの演算種別に対応して1つの「代表名」が登録されている。
また、該当のフィールド候補定義データの「先頭セルアドレス」からポイントさているセルデータチェインの先頭セルのセルデータアドレスを「演算結果欄定義データ」内の「先頭セルデータアドレス」部にセットする。この時、該当のフィールド候補定義データの本体は削除する。
本例の場合、表の最下行と最右列上において定義された合計フィールドは、各々、その「特定隣接位置」にある(左側、または上側に隣接する)セル内に”計”が「演算結果欄指定語」として記入されていることから、「演算結果欄データフィールド」として判定され、「演算区分」部に該当の「代表名」”計”がセットされた「演算結果欄定義データ」が作成される。
仮に、図9の中の”計”文字列の記入部分に、”平均”という文字列が代わりに記入されている場合、この記入用語の”平均”は、応用用語辞書52の「演算指定1」区分の登録用語であるので、本例の場合と同様にして、「演算種別」部には、該当する「代表名」”平均”がセットされた「演算結果欄定義データ」が作成されることになる。
「演算結果欄定義データ」が作成されれば、該当の「演算結果欄データフィールド」を構成する各セル(以降、「演算結果欄セル」と呼ぶ)を順次、とり出し、各「演算結果欄セル」毎に、演算対象のデータを記入したセルの集合である「演算対象フィールド」の検出をおこなう。
「演算結果欄データフィールド」を構成する各セルが横方向に並ぶものである場合、その構成セルと同一列上の上方向に、「集計区分」が「集計項目」の項目定義データフィールドをサーチする。「演算結果欄データフィールド」を構成する各セルが縦方向に並ぶものである場合、その構成セルの同一行上の左側をサーチすればよい。
「演算結果欄データフィールド」の中において、以上のように、「演算対象フィールド」が検出された「演算結果欄セル」について、改めて、そのセルデータを順次、「ポインタデータ」でつなぎ、「セルデータチェイン」を作成し直し、その先頭セルデータのアドレスを該当「演算結果欄定義データ」の「先頭セルデータアドレス」にセットする。
本例の場合、表の最下端の行と最右端の列上の各「演算結果欄セル」(合計欄セル)は、各々、項目名「売上げ」のデータフィールド上において、自身のセルと同一列、あるいは同一列上の部分を「演算対象フィールド」としていることになる。
表フォーマット上において、全ての「項目定義データ」と「演算結果欄定義データ」を作成し終えると、「複合セル」が定義された「複合フィールド」について、「複合フィールド定義処理」をおこなう。(図28)「複合フィールド定義処理」では、すでに作成されている該当の「項目定義データ」について複合セルを定義する内容である「差異条件定義データ」と「派生エリア定義データ」を付加する形でおこなわれる。
図28は、「複合フィールド定義処理」において、個々のデータフィールドについておこなわれる処理を示したものである。先ず、「複合フィールド定義処理」では、先ず、すでに作成されている項目定義データを1つづつとり出し、「複合フィールド」の判定をおこなう。(ステップB1)
取り出した項目定義データフィールドと定義要素「結合線」により関係付けられた文字列の中、対応項目名として定義されているもの以外の文字列について、それが「差異条件文字列」としての形式と条件を満たしていることを判定する。
本システムでは、「差異条件」の形式として、図29に示す区分を取り扱う。図29において、1型、2型は、「差異条件」が「関連データ差異条件」のみからなる場合である。この場合には、派生エリア内には、該当主エリアの「関連データ条件」を「関連データ差異条件」の指示によって変更した「関連データ条件」によって出力されるデータ値が記入される。
3型は、「演算差異条件」のみからなる場合であり、派生エリア内には、該当主エリア内のデータ値と特に指示された特定値との演算結果が記入される。
4型、5型は「差異条件」が「関連データ差異条件」と「演算差異条件」の組み合わせからなる場合であり、派生エリア内には、該当主エリアの「関連データ条件」を「関連データ差異条件」の指示によって変更した「関連データ条件」によって出力されるデータ値と該当主エリア内のデータ値との演算結果が記入される。
また、1型、4型は、「関連データ差異条件」の指定方法が「直接指示」の場合であり、2型、5型は、「関連データ差異条件」指定方法が「間接指示」の場合である。
本システムでは、「演算差異条件」の指定方法がとしては、応用用語辞書52中の「演算指定2」区分の登録語による指定を取り扱うものとする。また、「関連データ差異条件」の「直接指示」による指定方法がとしては、「データ名」による指定を取り扱い、「関連データ差異条件」の「間接指示」による指定方法としては、応用用語辞書52中の「相対指定」区分の登録語による指定を取り扱うものとする。
「演算差異条件」のみからなる場合(3型の場合)は、応用用語辞書52中の「演算オペランド指定」区分の登録用語をそのオペランドとする場合を取り扱うものとする。
「差異条件文字列」の判定手順を、図30、図31、図32に示す。本手順においては、先ず、判定対象の文字列全体、または、その一部が「解釈指定」の定義要素記号”○”による指定を受けていることを判定する。(ステップD1)
本例のように、判定対象の文字列が「解釈指定」定義要素記号”○”による指定を受けている場合には、続いて、その指定を受けている文字列部分内の所定の位置に、応用用語辞書52中の「演算指定2」区分の登録用語が含まれていることを判定する。(ステップD2)
ステップD1において、判定対象の文字列が「解釈指定」定義要素記号”○”による指定を受けていないと判定された場合は、ステップD15以降の手順がおこなわれる。この手順については、後出の「他の使用例4」において説明する。
応用用語辞書52中の「演算指定2」区分の登録用語は、日本語において、通常、そのオペランドとなる他の用語と複合語を形成して使用される。
この応用用語辞書52中の「演算指定2」区分の登録用語は、複合語形成上の配置関係から見て、”対**比”、”対**割合”等のような「両挟み型」と、”**比”、””**割合”等の「後置型」がある。この複合語形成上の配置関係は、応用用語辞書52中において、オペランドとなる用語の位置を特定の文字列”**”を用いて示されている。
応用用語辞書52中の「演算指定2」区分の登録用語の検出は、上記した「両挟み型」の場合、判定対象の文字列がこの登録用語の前側文字(たとえば、”対”)と前方一致し、かつ、後側文字(たとえば、”対”)と後方一致することを判定すればよい。「演算指定2」区分の応用英語辞書登録用語が上記した「後置型」の場合、判定対象の文字列について、各登録用語の後側文字との後方一致を判定すればよい。
ステップD2において、「演算指定2」区分の応用用語辞書登録用語が検出されない場合は、ステップD12以降の手順がおこなわれる。ステップ12以降の手順については、後出の「他の使用例3」において説明する。
ステップD2において、本例のように、「演算指定2」区分の応用用語辞書登録用語が検出されると、続いて、判定対象文字列内の残りの部分文字列について、その演算オペランドとして該当するものを次の項目の中から判定していく。
(1)応用用語辞書内「相対指定」区分の登録用語 (ステップD3)
(2)応用用語辞書内「演算オペランド指定」区分の登録用語 (ステップD6)
(3)ユーザが定義した「データ名」 (ステップD8)
先ず、判定対象文字列の残りの部分文字列について、「関連データ差異条件登録語」の判定をおこなう。(ステップD3)前記したように、本システムでは、「関連データ差異条件登録語」として、応用用語辞書52中の「相対指定」区分の登録用語を取り扱う。
本例の場合、このステップD3において、該当の文字列”前年”が「相対指定」区分の登録用語として、応用用語辞書52中にサーチされる。
ステップD3の判定において、判定対象の部分文字列が、応用用語辞書52の「相対指定」区分の登録用語でない場合は、ステップ6以降の手順がおこなわれる。ステップ6以降の手順については、後出の「他の使用例1」において説明する。
本例のように、このステップD3の判定が得られる場合は、続いて、応用用語辞書52中において、該当の「関連データ差異条件登録語」と対応付けられ形で登録されている「所属項目名」を参照し、その「所属項目名」が、該当の表フォーマット上において項目定義の対応項目名として定義されていることを確認する。(ステップD4)
本例の場合、このステップD4において、この検出された「相対指定」区分の登録用語「前年」について応用用語辞書52中において、その所属項目名「年度」が参照され、その項目名「年度」は、表フォーマット上において項目定義データフィールド(データ”2001年”、” 2002年”、” 2003年が記入されている最上行のデータフィールド)の対応項目名として定義されていることが検出される。
以上の確認が得られると、それ以前の判定プロセスを経たことを併せて、この判定対象文字列は、上記した、複合フィールド定義の差異条件として、(5)型の形式と条件を満たしていることが判定される。(ステップD5)
本システムにおいては、1つのデータフィールドと定義要素の「結合線」によって関係付けられ、かつ、以上の形式と条件を満たしている文字列は、そのデータフィールドの「差異条件」の定義以外には用いないものとして、該当の文字列は、該当複合フィールドの「差異条件文字列」として確定的に解釈される。
以上のように、1つのデータータフィールドと定義要素「結合線」によって結ばれた文字列が、複合フィールドの「差異条件」として判定された場合は、該当の項目定義データ中の「複合区分」欄に「複合フィールド」であることをを示すコード“1”をセットした上、(ステップB2)、「差異条件定義データ」と「派生エリア定義データ」を作成し、各々、そのアドレスを該当の項目定義データ中の「差異条件定義データポインタ」部と「派生エリア定義データポインタ」にセットし(ステップB4、ステップB5)、続いて、「複合セル用セルデータへの置き換え」処理をおこなう。(ステップB6)
「複合フィールド」でない「通常フィールド」であると判定された場合は、該当の項目定義データの「複合区分」部に、「通常フィールド」であることを示すコード”0”をセットし(ステップB3)、図28に示す処理を抜ける。
「差異条件定義データ」の構成を図33に示す。「差異条件定義データ」は、「基本部」と「演算指定部」とからなる。「基本部」は、さらに「形式区分」記入欄、「項目名テキスト」記入欄、「データ名テキスト」記入欄、「登録語テキスト」記入欄とからなる。
「差異条件定義データ」の「形式区分」記入欄には、上記した「差異条件」の「区分」がセットされる。「項目名テキスト」記入欄と「データ名テキスト」記入欄には該当の文字列のコード列が記入される。「登録語テキスト」記入欄には、応用用語辞書52中の「代表名」のコード列が記入される。
「差異条件定義データ」の「演算指定部」内の「演算種別部」には、演算種類の該当コードが記入される。「演算指定」がない場合は、コード”0”がセットされる。
上記「演算指定部」内の「演算オペランド区分部」には、該当主エリア内データの演算対象となるデータの区別がセットされる。「関連データ差異条件」が定義され、演算が該当主エリア内データと「関連データ差異条件」に基づく派生エリア内出力データとの間に定義されている場合(「差異条件」の「区分」が3型以外の場合)は、「演算オペランド区分」は、「派生エリア内データ」であるとして、それを示すコード”0”がセットされる。
「関連データ差異条件」が定義されておらず、演算が該当主エリア内データと別に定義された特定データとの間で定義されている場合(「差異条件」の「区分」が3型の場合)は、「演算オペランド区分」には「特定指定データ」であるとして、それを示すコード”1”がセットされる。
本例の場合、先ず、上記「基本部」内の「登録語」記入欄に、応用用語辞書52中の該当の「代表名」”前年”がセットされ、「演算指定部」内の「演算種別部」には、「対**比」に対応する該当コード”1”がセットされ、「演算オペランド区分部」には、「派生エリア内データ」であることを示すコード”0”がセットされる。
また、「演算オペランド区分」が、本例のように「派生エリア内データ」である場合、「項目名テキスト」記入欄には、該当の関連データ差異条件の所属項目名がセットされる。本例の場合、関連データ差異条件は、応用用語辞書52中の「相対指定」区分の登録用語”前年”であり、その所属項目名として、ステップD4において参照した項目名「年度」が記入される。
次に、「複合フィールド」と判定されたデータフィールドについて、「複合セル」の書式フォーマットを表わす「複合セルフォーマット」の識別をおこない、それを「派生エリア定義データ」を作成する。(ステップB5)。
まず、該当の「複合フィールド」の中の任意のセルに注目して、仮定的に「複合セルフォーマット」を検出する。一般に、帳票フォーマットにおいては、1つの項目定義データフィールド内の各構成セルは同一の書式フォーマット(セルの形状/寸法…、記入文字列の記入書式…)でなければならず、また、それが「複合セル」の場合は、同一の「複合セルフォーマット」を持たなければならない。
以上のことから、1つのセルから「複合セルフォーマット」が検出できたならば、同じデータフィールド中の残りのセルについて、同じ「複合セルフォーマット」を持つことを確認した上、「複合セルフォーマット」として確定する。
「複合セル」の書式フォーマットである「複合セルフォーマット」は、次のように識別される。この「複合セルフォーマットとして、本システムでは、1組の記号の組み合わせ(「派生セル生成要素」)が1つの文字列記入域を形成し、その形成記入域がセルの下半分、または,右半分を占める場合を取り上げる。「派生セル生成要素」は、次の手順により検出することができる
システムには、予め、「派生セル生成要素」になり得る記号の組み合わせを可能な限り登録しておく。個々の記号の組み合わせ毎に、「種別」を定め、それを構成する記号コードとその間の記入順序を登録した「派生エリア生成要素データ」を定め、それをまとめて「派生エリア生成要素辞書」として登録する。(図示せず)「派生エリア生成要素辞書」の形式は、前記した「定義情報識別データ」(図6)と同じ形式になる。
まず、該当のデータフィールドの各セルをサーチして、上記「派生エリア生成要素辞書辞書」に登録されている記号の組み合わせを検出する。
「派生エリア生成要素辞書辞書」の登録記号の対が検出できた場合、つぎに、この記号の対を外接する矩形を求め、この外接矩形が、図34(a)に示すように、左右方向と下方向の3辺が該当セルの境界と一定閾値内に引かれていることが確認できれば、この記号の対は、該当のセルの下側部分に「派生エリア」を定義している「派生エリア生成要素」と判定する。
また、図34(b)に示すように、上下方向と右方向の3辺が該当セルの境界と一定閾値内に引かれていることが確認できれば、この記号の対は、該当のセルの右側部分に「派生エリア」を定義している「派生エリア生成要素」と見なす。ここで、記号の対に外接する矩形は、該当の記号の文字データを参照して、その文字としての「位置」、「高さ」、「幅」の諸元から求めることができる。
「派生エリア生成要素」が検出できた場合は、この外接矩形に適当なマージンを加え、主エリアと派生エリアを分ける「分割位置」を求め、また、「派生エリア生成要素」構成記号の「位置」と「幅」とから、派生エリアの両側のマージンを求めことができる。(図35)
以上のように、一つのセルにおいて「派生エリア生成要素」が検出できれば、該当のデータフィールドの残りのセル内に、それと重なる、異種の記号、文字が検出されないことを確認した上、「派生エリア定義データ」を作成する。「派生エリア定義データ」には、該当の「派生エリア生成要素」の種別である「派生エリア生成要素種別」と「派生エリア」がセル内に設定されている「方向区別」(下方向か右方向)と主エリアと派生エリアとを分ける「分割位置」と派生エリア記入範囲の「両側マージン」が登録される。(図36)
なお、本システムでは、ユーザによって「派生エリア生成要素」が記入されていない場合、予め定めてあるデフォールトの派生エリア生成要素を自動的に生成する。
まず、該当の複合データフィールドの構成セルの縦横の寸法比を求め、それを予め定めてある基準値と比較し、派生エリアが該当セル内において設定される方向(「方向区別」)として、「下側」か「右側」かの何れかを決定する。
「分割位置」と「両側マージン」は、各「方向区別」ごとに、「分割位置」と分割方向のセル寸法の比と「両側マージン」とセル横寸法との比の基準値を予め定めておくこととにより決定することができる。「派生エリア生成要素」の種別も、予めデフォールトで定めておき、以上のデータから「派生エリア定義データ」を作成することができる。
以上で作成した「派生エリア定義データ」のアドレスは、該当の項目定義データの「派生エリア定義データポインタ」にセットする。
最後に、「複合セル」が定義されたデータフィールドを構成する各セルのセルデータを該当の「セルデータチェイン」によって1つづつ取り出し、対応する「複合セルデータ」と置き換える。(ステップB6)「複合セルデータ」の形式を図37に示す。
まず、複合セルが定義された項目定義データフィールドを構成する各セルについて、「複合セル用セルデータ」への置き換えがおこなわれる。該当の「セルデータチェイン」上から、セルデータを順に1つずつ取り出し、対応する「複合セル用セルデータ」に置き換えていく。
新しい「複合セル用セルデータ」の位置情報とポインタ情報には、元のセルデータの該当データがコピーされる。また、「セルデータチェイン」上において、今、置き換えようとするセルデータの前後に位置するセルデータのポインタ情報(元の該当セルデータアドレスを指している)には、新しい「複合セル用セルデータ」のアドレスがセットされ直される。該当の「項目定義データ」の「先頭セルデータアドレス部」にも、この新たに作成した「セルデータチェイン」先頭の「複合セル用セルデータ」のアドレスがセットされる。
本例の場合、この「複合セル用セルデータ」への置き換えは、項目名「売上げ」のデータフィールドを構成する各セルについておこなわれることになる。
複合セルが定義された項目定義データフィールドについて、「複合フィールド定義処理」を終えると、複合セルの演算結果欄セルについて「複合フィールド定義処理」をおこなう。
複合セルの演算結果欄セルは、次のように判定することができる。「演算結果欄定義データ」を1つづつ取り出し、さらにそれを構成する各演算結果欄セルについて、その演算対象フィールドをを識別し、それが「複合フィールド」であることを判定する。演算対象フィールドは、上記したように、1つの項目定義データフィールドに属し、かつ該当の演算結果欄データフィールドと直角方向に設定されているセル列として識別することができる。
本例の項目名「売上げ」のデータフィールドように、演算対象フィールドを構成する各セルが複合セルである場合、表の持つ基本的性格から、対応する演算結果欄セルも同じ複合セル(同じ「差異条件定義データ」と「派生エリア定義データ」を持つ )でなければならない。ある演算結果欄セルについて、その演算対象フィールドが複合セルであると判定された場合、この演算結果欄セルのセルデータを「複合セル用セルデータ」に切り替える。
本例の場合、表の最下行と最右列の各合計欄セルのセルデータを、「複合セル用セルデータ」に切り替えることになる。項目名「売上げ」のデータフィールドを構成する各複合セルの場合と同様に該当の「演算結果欄定義データ」からポイントされる「セルデータチェイン」において、元のセルデータを「複合セル用セルデータ」に付けかえればよい。
全ての「複合フィールド定義処理」を終えたところで、表内の全てのセルについて、その中に記入されている文字列を識別し、その文字列データアドレスを、該当セルデータの文字列データアドレス部にセットすると共に、その文字列データを適当なデータに変換して該当セルデータのデータ格納部に格納する。(ステップA4)
複合セルの場合は、その主エリア内と派生エリア内に記入されている文字列を、各々、識別し、その文字列データアドレスを、各々、該当セルデータの主リア側文字列データアドレス部と派生エリア側文字列データアドレス部にセットすると共に、変換したデータを、各々、該当セルデータの主リア側データ格納部と派生エリア側データ格納部に格納することになる。
セル内、または、その中の主エリアまたは、派生エリアに記入されている文字列の識別は、公知の方法として、該当のセル、または、該当の主エリア、派生エリアの位置と書面上の各文字列データの位置情報との照合を繰り返すことによっておこなうことができる。複合セル中の主エリアまたは、派生エリアの書面上位置は、後述する方法によって求めることができる。
セル内、または、その中の主エリアまたは、派生エリアに記入されていることが識別された文字列の各文字列データから、先ず、該当のテキストコード列を識別する。記入されているセルが、項目名が「数値区分」(集計数値と非集計数値とを含む)の項目定義データフィールドに所属する場合は、さらに、公知の方法により数値データに変換する。以上のように得られたデータが、該当のセルデータのデータ格納部に格納される。
上記のようにして、システムに入力された定義情報入りの書面について全ての定義データを生成し終えたところで、本システムがこれまで行った処理、特に認識処理(文字/図形認識、位置/大きさ等の補正、定義内容の確定)の結果を表示出力し、ユーザ側の確認を取る。
この表示出力では、システムが認識した各書面の文書内容をたとえばトグル方式で順にディスプレイ画面20a上に表示する。この文書画像を表示するため、文書画像出力部40は、文書要素データ記憶部38に蓄積されている各書面毎の文書要素データを文字/図形パターン辞書36に照会して各文書要素のパターンを識別し、各パターンを展開プログラムによってビットマップ形式の画像データに変換して、映像信号を生成する。
なお、システムの認識処理結果に応じた帳表の文書内容がディスプレイ画面20a上に表示された時点で、ユーザはキーボード12やマウス14あるいはディジタイザ15を用いて画面上から各文書に補正を行ったり新たな記入情報を入力することができる。
キーボード12より入力された記入情報については、文字・図形認識の処理を行うことなく、文字・図形要素入力部37(図11)で文書要素データを生成することができる。マウス14またはディジタイザ15より入力された記入情報については、文字・図形要素入力部37で各記入情報を入力し、文字・図形要素認識部34で逐次(入力記入情報毎に)文字/図形認識処理を行い、文書要素データを生成する。
これら画面入力方式の入力装置12、14、15により定義情報を入力する際にも、「環境設定」の「定義情報区別」モード(図7)で各定義系の修飾情報を設定入力する。
た、所望の定義用サブモード下で画面上から記入情報を入力すれば、システムの方でその入力された記入情報にそのサブモードで指定されている定義区別修飾を付して、画面上に表示することも可能である。この場合、該定義区別修飾を付けられた記入情報から定義情報が認識されることになる。
このように画面上で記入情報が入力された場合は、記入情報が入力される度毎にその入力データに基づいて文字・図形要素入力部37(図11)が各記入情報に対応した文書要素データを生成または変更することになる。
画面上から入力された記入情報(文字列、記号、図形)は、用紙からイメージ入力された場合と同様に、システム内では文書要素データ(図14〜図19)の形態で表現される。
用紙からイメージで入力された記入情報も画面上からコマンドで入力された記入情報もシステム内では同じ文書要素データの形で管理されるため、帳表の元々の記入情報(通常記入情報)かその上に追記される定義用記入情報かに拘わりなく、イメージ入力または画面入力のどちらからでも任意の記入情報を入力することができる。
このように、ユーザは、文書内容が予め記載されている書面をイメージスキャナ10により入力した後に、上記のような確認のための出力表示の段階で、各書面の文書内容ないし定義内容を確認しながら、キーボード12、マウス14またはディジタイザ15より任意の記入情報、特に定義支援情報を追記することが可能変更や取り消し等を行うことも可能である。
以上、本実施例による、派生エリアを持つ帳表フォーマットの定義方法について説明したが、種々の変形例が可能である。たとえば、図38に、画面上から定義内容を指定する例を示す。図35に示すように、入力した帳表文書の文書内容をディスプレイ画面20aに表示し、入力した文書内容を確認しながら、キーボード12またはマウス14等より所定の指定をおこなうことにより、所望の定義情報を入力することができる。
図38において、「定義」モードの下で、「画面指定」ボタンを指示し、「画面指定」サブモードに入ると、ディスプレイ画面20a内の適当な位置に「1.フィールド」、「2.データ項目」、「3.データ名」等の各種定義項目をリストした副画面94が現れる。ここで、通常記入情報の“売上数”をしてクリック指示し、副画面94上で「2.データ項目」を選択指示すると、通常記入情報“売上数”がデータ項目の「売上数」に転化し、同時にクリック表示の部分が「2.データ項目」に割り当てた特殊表示に変わる。
同様に“売上数”の欄の下側の領域92をクリック指示して、この領域2について副画面94上で「1.フィールド」を指示すると、領域92は「売上げ」のデータを記入するフィールドとして定義され、同時にクリック部分が「1.フィールド」に割り当てた特殊表示に変わる。 ここで、データ項目、フィールド、…に割り当てた特定表示は、予め図5に示した「定義要素/記入情報対照表」に定めたものが現れる。
なお、図38では、説明の便宜上、「データ項目」の箇所90と「フィールド」の領域92が同時に選択指示されている様子を示しているが、実際には1回のクリック毎に1箇所ずつ選択指示される。
合計フィールドについても、同様に、合計欄指定語である”計”をクリック指示した後、副画面94上において「4.解釈指定」を指示し、また、該当のデータフィールド範囲をクリック指示した後、「1.フィールド」を指示すればよい。
システム内では、上記のようなユーザ操作に対し画面上のクリック位置と、文書要素データ記憶部38に保持されている文書要素データの「位置」情報との照合を繰り返して、該当する文書要素データを識別する。そして、識別した文書要素データと副画面上の指示内容とから、所要の定義データを生成する。
複合フィールドを含む帳表の場合は、ユーザは、まず、各データフィールドについて、「データ項目」と「フィールド」の指定を、以上述べた画面上の方法によりおこなった上、「差異条件」の指定は「差異条件文字列」を書面上に画面を通じて記入し、結合線を該当のデータフィールドから引き出す。この「差異条件文字列」と結合線の記入は画面上の公知の入力手段による。
次に、記入した「差異条件文字列」について、上記副画面94を用いた定義付をおこなう。前記した図9の表フォーマットの場合、記入されている「差異条件文字列」”対前年比”をクリック指示し、副画面94上で「5.解釈指定」を選択指示すればよい。結合線も上記副画面94により同様の指定をおこなう。
ここで、画面上の「定義解釈」ボタンを指示すると、以上の指示内容により、すでに作成されている各データフィールドの項目定義データに加え、差異条件定義データと派生エリア定義データとが生成される。
また、画面上から定義付けをおこなう方法として、次の方法も可能である。あるデータフィールドを画面上で指定した後、副画面上94で「1.フィールド」を指示すると、図39に示す「項目名指定メニュー」が表示される。「項目名指定メニュー」の中には、「項目名記入欄」98、「フィールド書式記入欄」104のほかに、派生エリア側の「差異条件」を入力するものとして、「項目名記入欄」110、「データ名記入欄」112、「登録語記入欄」113、「演算記入欄」115、「フィールド書式記入欄」114が設けられている。
派生エリア側の「データ名記入欄」112には、「関連データ差異条件」のデータ名が記入される。派生エリア側の「項目名記入欄」110には、「データ名記入欄」112に記入したデータ名の所属項目目が記入される。
「登録語記入欄」113には、「関連データ差異条件登録語」を指定するものとして応用用語辞書52中の「相対指定」区分の登録語が記入される。また、3型の差異条件の「演算オペランド」を指定するものとして、応用用語辞書52中の「演算オペランド」区分の登録語も記入される。
「演算記入欄」115には、「演算差異条件」を示すものとして、応用用語辞書52中の「演算指定2」区分の登録語が記入されるようになっている。
図9に示した表フォーマットの場合、「登録語記入欄」113に“前年”を記入し、「演算記入欄」115に“比”を記入すればよい。
以上の記入をおこない、「項目名指定メニュー」上の「終了ボタン」120をクリックすると、システムは、上記の各記入欄の中、「登録語記入欄」113の記入用語について、応用用語辞書52中の「相対指定」区分の登録用語と「演算オペランド」区分の登録用語をサーチし、「演算記入欄」115の記入用語については、応用用語辞書52中の「演算指定2」区分の登録用語をサーチする。
本例の場合、「登録語記入欄」113に記入した“前年”が、応用用語辞書52中の「相対指定」区分の登録用語としてサーチされ、「演算記入欄」115に記入した”比” が、応用用語辞書52中の「演算指定2」区分の登録用語としてサーチされることによって、上記した差異条件判定の基準にしたがい、以上の指定を5型の差異条件の指定と判定され、該当する「差異条件定義データ」と「派生エリア定義データ」が作成される。
ディスプレイ画面20a上において、「項目名指定メニュー」は消え、表外の適当な空白部分には、ユーザ指定内容を書面上に残すために、「差異条件文字列」が生成表示される。
この生成される「差異条件文字列」において、項目名文字列とデータ名文字列は各々、項目名指定のとデータ名指定の定義要素記号“<>”“[]”によって括られているか、あるいは、各定義項目に該当する特殊表示を施されて、該当のデータフィールドと結合線により結ばれている。
この「差異条件文字列」が生成表示は、以下のようにおこなわれる。先ず、「差異条件定義データ」の項目名とデータ名の各文字コード列の両側に該当の定義要素構成記号(項目名の場合は、“<”と“>”)のコードを添加し、項目名コード列とデータ名コード列をつなげて、適当な書面上位置情報と書式情報(文字大きさ、ピッチなど)を与えて、1つの文字列データを作成する。
続いて、この「差異条件指定文字列」と該当の複合フィールドとを関係付ける結合線を次のように生成すればよい。すなわち、「差異条件指定文字列」の外接矩形を求め、この外接矩形を構成する辺の中で該当のデータフィールド側に向き合う辺を以下のように求める。
すなわち、「差異条件指定文字列」の外接矩形が該当のデータフィールド領域に対して占める位置関係を判定し、たとえば、データフィールド領域に対して「上方」にある場合は、矩形下縁の辺として求めればよい。また、たとえば、「上方」にもあり、「左方」にもある場合は、該当の表全体の外接矩形を求め、それに対して「上方」にある場合は、矩形下縁の辺として求めればよい。他の位置関係の場合も、同様にして求めることができる。
次に、この外接矩形側の辺と平行して対向する該当データフィールド境界の辺を求め、両者の辺を結ぶ線分を表わす線分データを生成する。
画面上による「差異条件」の定義付けは、前記した「他の使用例」についても同様におこなうことができる。後述する「他の使用例1」の場合は、「登録語記入欄」113に”全体”を記入し、「演算記入欄」115に”比”を記入すればよい。
「登録語記入欄」113に記入した“全体”について、応用用語辞書52中の「演算オペランド」区分の登録用語としてサーチされ、「演算記入欄」115に記入した”比” について、応用用語辞書52中の「演算指定2」区分の登録用語がサーチされ、上記した差異条件判定の基準にしたがい、以上の指定を3型の差異条件の指定と判定される。
後述する「他の使用例2」の場合は、派生エリア側「項目名記入欄」110に”年度”を記入し、「データ名記入欄」112に”2000年”を記入し、「演算記入欄」115に”比”を記入すればよい。
「他の使用例3」の場合は、「登録語記入欄」113に”前年”を、「演算記入欄」115は無記入とすればよい。
「他の使用例4」の場合は、派生エリア側「項目名記入欄」110に”年度”を記入し、「データ名記入欄」112に”2000年”を記入し、「演算記入欄」115は無記入とすればよい。各々の場合について、該当する「差異条件定義データ」と「派生エリア定義データ」が作成される。
「項目名指定メニュー」には、上記の各記入欄の他に、「差異条件記入欄」100を併せて設け、上記した差異条件の区分が1型、4型以外の場合、差異条件文字列全体を記入させてもよい。
本例の場合、”対前年比”を記入する。「差異条件記入欄」に入力された文字列は、前記した「解釈指定」された文字列と同じく、それを構成する応用用語辞書52の登録用語は、同辞書に定める意味にしたがって解釈され、用語間の関係は日本語構文規則にしたがって解釈されるものとして、前記した「差異条件の判定手順」にしたがい、同様にして差異条件定義データが作成されることになる。
次に、以上のように、定義付けをおこなった集計表上に、実際にデータを出力集計する例について説明する。
この例では、データ出力元のデータファイルとしては、たとえば、図40に示す構成を持つファイルを考える。データファイルを構成する単位であるレコードは、図40に示すように、項目名を“支店名”、“商品区分”、“商品コード”“売上数”、“売上額”、“単価”、“利益”…とする区分フィールドに別れ、各々、該当のデータを格納している。
実施例装置では、データ出力処理は、「データ出力モード」においておこなわれる。ディスプレイ画面20a上の「モード」ボタンをクリックしてモード一覧メニューの中から「データ出力」を選択するとシステムが「データ出力」モードに切り替わり、ディスプレイ画面20a上に図41に示すような「出力元ファイル一覧」の画面が表示される。ユーザは表示された複数のデータファイルの中から所望の出力元である「1.売上ファイル」を選択し、「出力実行」ボタンをクリックすればよい。
本実施例のシステムにおいて、「データ出力処理」を担当するデータ出力部は、所定の変換または処理プログラムを実行するCPU24と上記プログラムと関連データを格納する内部メモリ16または外部メモリ18によって構成される。
出力元のデータファイルが指定されると、画面上には、「項目名対応付け画面」(図示せず)が表示される。「項目名対応付け画面」上では、出力先集計表上で定義された項目名と出力元データファイルの定義項目名が2列に並べられて表示され、ユーザは画面上で、出力先と出力元とで対応する項目名を、たとえばマウスにより両者をつなぐ操作により対応付けすることができる。
以上の項目名の対応付け操作を終えると、画面上の「終了」ボタンを指示すると、出力先と出力元の対応する項目名を並べた対の列である「項目名対応付けテーブル」がシステム内に作成され(図示せず)、「データ出力全体処理」が始まる。
「データ出力全体処理」の手順を図42のフローに示す。まず、出力先である集計表上の合計欄以外のセルに、出力元ファイルのデータを出力集計する。(「データ出力処理」―ステップF1)但し、この段階においては、複合セルの派生エリア中へのデータ出力は、差異条件の中、関連データ差異条件のみを参照しておこなわれる。差異条件が演算差異条件のみからなる場合は(上記した差異条件の区分3型の場合)、派生セル中へのデータ出力はおこなわれないことになる。
次に集計表上において、出力記入された各セル内のデータを合計欄に集計する。(表内演算処理―ステップF2)
続いて、複合セルに「演算差異条件」が定義されている場合、定義されている「演算」を実行し、派生セル内のデータをこの演算結果データで置き換える。(複合セル内演算処理―ステップF3)差異条件が演算差異条件を含まない場合は(上記した差異条件の区分1型、2型の場合)、この処理はおこなわれないことになる。
最後に、集計表上に出力記入された全てのデータを該当する文字列データに変換する。(文字列データ化処理―ステップF4)
「データ出力処理」(ステップF1)は、出力先集計表上と出力元データファイとから1つづつレコードを取り出し、たがいに突き合わせ照合することを繰り返す形でおこなわれる。なお、本実施例システムでは、このようにデータ間の突き合わせ照合をおこなうため、本実施例システム使用の前提として、データの表記は、出力先集計表上と出力元データファイルとにおいて統一されているものとする。
本明細書では、表上において、1つのレコードを構成するデータが記入されるセルの集合を、特に「レコードセル列」と呼ぶことにする。表上において、「レコードセル列」は、次のよう、抽出することができる。
先ず、表フォーマット上において、各「項目定義データフィールド」を構成するセルの中から、同一行上にあり、対応項目名を異にするセルの集合を、「レコードセル列」の母体として識別する。
次に、この識別した「レコードセル列」母体内の各セルについて、それを含む、直角方向の列上をサーチする。サーチした列上に「レコードセル列」母体の各項目名とは異なる、新しい項目名のデータフィールドに属するセルがあれば、このセルを「レコードセル列」母体のセル集合に加える。また、表の外部に共通条件として、設定されている「項目定義」があれば、その収容セルも加え「レコードセル列」を得ることができる。
本例の場合、「レコードセル列」として、表の第2行以下の行上から、対応項目名「商品」と「売上げ」のセルの組み合わせが検出され、その中の対応項目名「売上げ」のセルの直角方向の列上において項目名「年度」のセルが追加される。
本例のように、1つのセル中に派生エリアが設定されている場合は、上記のように抽出される1つの「レコードセル列」から、主エリアと派生エリアの、各々について、レコードをとり出し、出力元データファイルから取り出したレコードと突き合わせ照合をおこなうことになる。本明細書では、特に、主エリアについて得られるレコードを「主レコード」、派生エリアについて得られるレコードを「副レコード」と呼ぶことにする。
「主レコード」の内容(構成セル)は、複合セル以外は該当の「レコードセル列」そのものである。「副レコード」は、「主レコード」に対して「差異条件定義データ」が指示する変更をおこなうことによって得られる。「主レコード」の内容の中、定義されている差異条件の中の関連データ差異条件が指定している部分だけの入れ換えがおこなわれる。
本例の場合、たとえば、図43に示したレコードセル列からは、
項目名「売上「について データ“null”
項目名「商品」について”データが“ラジオ”、
項目名「年度」について”データが“2002”
という「主レコード」が得られる。
「副レコード」は、差異条件の中の「関連データ差異条件」のみを参照して、応用用語辞書52の登録語「前年」の指示により、項目名「年度」のデータとして、「主レコード」の該当データ“ 2002“をその「前年」である“2001”に入れ替えることによって得られる。すなわち、
項目名“売上”についてデータ“null”、
項目名“商品”について”データが“ラジオ”、
項目名“年度”について”データが“2001”
という副レコードが得られることになる。
「複合セル」が設定された表上への「データ出力処理」の手順を図44に示す。「データ出力処理」処理の手順は、差異条件の関連データ差異条件が含まれるか、否かによって、処理が分かれる。
「データ出力処理」に入ると、最初に、「差異条件定義データ」の「形式区分」部を参照して(ステップM1)、差異条件が関連データ差異条件を含む場合、すなわち、差異条件の形式区分が3型以外の場合には、「データ出力処理−1」(ステップM2)をおこない、差異条件が関連データ差異条件を含まない場合、すなわち、差異条件の形式区分が3型の場合、「データ出力処理−2」(ステップM3)をおこなう。
本例の場合、差異条件の形式区分は5型であることから、「データ出力処理−1」がおこなわれることになる。
「データ出力処理−1」の手順においては、「レコードセル列」の取出し位置を初期化した後、先ず、出力先の表から1つの「レコードセル列」を順に取り出し、そこから「主レコード」を取出し、その上に得られるに、出力元データファイルの全てのレコードを出力集計させる。
次に、差異条件定義データの中の「関連データ差異条件」を参照して、「主レコード」に変更を加えて「副レコード」を作成し、「副レコード」上に、出力元の全てのレコードのデータを出力集計させる。以上の手順が、表フォーマット上から取出される全ての「レコードセル列」について繰り返す形でおこなわれる。
表フォーマット上から「レコードセル列」を取り出す範囲は、たとえば、次のようにして求めることができる。表内において、行を上側から順にとり出し、2つ以上の項目定義データフィールドが設定されている行が見出せれば、さらに、次の行をとり出し、両方の行の同じ列に属するセルが、同じ項目定義データフィールドに属していることが確認する。この確認が得られれば、この行を「レコードセル列」の「取り出しスタート行」として判定する。
続いて、行を下側に向かって順に取り出し、上下に隣接する行の間で、同じ列に属するセルが、同じ項目定義データフィールドに属していることの判定を繰り返していく。こうして、同じ列に属するセルが、同じ項目の項目定義データフィールドに属する行の集合を識別し、これを、「レコードセル列取り出し範囲行」として判定する。
本例の項目名“売上”のデータフィールドのように、1行上に同じ項目名のセルが繰り返されているときは、左側のセルから順次とり出し、とり出したセルごとに、「レコードセル列」を識別していく。すなわち、とり出したセルについて、直角方向の列上をサーチを行い、新しい項目名のセルを追加して、「レコードセル列」を得ることを繰り返す。
本例の場合、たとえば、表の第2行上において、項目名が「商品」のセル(第1列上)と項目名が“売上げ”のセル集合の中、まず、第2列上のセルとからなる「レコードセル列」を取り出す。
「取り出しスタート行」以降の行についても、以上の手順くりかえし、表上の全ての「レコードセル列」を取り出していくことができる。なお、出力元データファイルからのレコード取り出しの順序も、たとえば、ファイル格納の順のように、処理の便宜により決めてよい。
「データ出力処理−1」の詳細を、図45に示す手順にしたがって説明する。
「データ出力処理」に入ると、先ず、データ出力先とデータ出力元から取出したレコードをセットし、相互の照合をおこなう集計管理テーブルを作成する(ステップG1)。集計管理テーブルの形式を図46に示す。
集計管理テーブル上の第1行の各欄には、項目名が記入される。出力先集計表上に項目定義の対応項目名として定義された項目名を記入する。記入の順序は順不同でよい。本例の場合、項目名“売上げ”、“商品名”、“年度”が記入セットされる。
集計管理テーブル上の第2行には、項目名の「集計区分」を記入する。本例の場合、項目名“売上”に対応する欄(項目名“売上”を記入された欄と同一列の欄)には、「集計数値」であることを示すコード“1”が記入される。項目名“商品”に対応する欄には、「非集計の非数値項目」であることを示すコード“0”が記入される。
また、項目名“年度”に対応する欄には、項目名が応用用語辞書52中の「年月日項目名」区分の登録用語としてコード“3”が記入される。
集計管理テーブル上の第3行には、出力先集計表から取出される「レコードセル列」を構成する各セルのセルデータアドレスが、セットされる。出力先がデータファイルである場合には、データファイルのレコード内アドレスを記入してもよい。
集計管理テーブル第4行上には、出力先集計表の各セル内の記入データとして、該当セルデータ内のデータ格納部に格納されているデータがセットされる。項目が「数値」区分(「集計数値」、または、「非集計数値」)の欄には、該当の数値データが記入され、項目が「非数値項目」の欄には、該当のテキストデータがセットされる。
複合セル内のデータは、主レコードをセットする時は、該当セルデータの主エリア側データ格納部中のデータがセットされ、副レコードをセットする時は、該当セルデータの派生エリア側データ格納部中のデータがセットされる。
また、セットされるデータの先頭には、数値データとテキストデータの区別フラグが付加される。
なお、項目名が「年度」等のように、応用用語辞書52中において「年月日項目」区分として登録されている場合(第2行の「集計区分」欄にコード“3”がセット)には、該当のデータをデータ比較照合用の標準表現形式に変換する。例えば、項目名が「年度」の場合、この標準表現形式として、「西暦表記」、「算用数字4桁」、「後置語なし」とすると、取出したデータ名文字列から”年”などの後置語部分を取り除き、残る数字文字列からなるテキストデータとしてセットする。
この標準表現形式への変換は、該当の項目名「年度」について、すでに作成されている「年度書式データ」を参照することによっておこなうことができる。
また、仮に、表から取出したデータが、例えば、”01”、”02”のように西暦2桁表記である場合は、”20”という上2桁の数字を付加する。付加する上2桁の数字は、例えば、付加される下2桁の先頭数字が”0”であれば、”20”を付加し、付加される下2桁の先頭数字が”9”であれば、”20”を付加するというように、下2桁の先頭数字に適当な閾値を設けて決めることができる。
また、該当のデータ名文字列が元号表記されている場合、予め用意した元号表記と西暦表記とを対応付けるテーブルを用いて、対応する西暦表記に変換すればよい。
集計管理テーブル上の第5行には、出力元が表である場合、それを構成する各セルのセルデータアドレスが、セットされる。本例のように、出力元表がデータファイルである場合には、データファイルのレコード内アドレスを記入してもよい。「項目名対応付けテーブル」を参照し、出力先の対応する項目名がセットされている同じ列にセットする。
集計管理テーブル上の第6行には、出力元表を構成する各セル内の記入データ、あるいは、出力元データファイルから取り出されるレコード内の各データがセットされる。第4行と同じく、同欄の先頭には数値データとテキストデータの区別フラグが付加された上、セットされる。第5行の場合と同じく、「項目名対応付けテーブル」を参照し、出力先の対応する項目名がセットされている同じ列にセットする。
集計管理テーブルは、実際には、たとえば、以下のように実装することができる。集計管理テーブル上の各記入欄ごとに、リストデータ(図示せず)を設け、各リストデータは、各記入欄に記入されたデータを格納するとともに、行方向ポインタデータ、列方向ポインタデータを持ち、行方向、または列方向に隣接する各データ記入欄のデータを、順次、辿れるようになっている。
また、集計管理テーブルには、「主副フラグ」を設け、そこに主レコードがセットされている場合は、“0にセットされ、副レコードがセットされている場合は、“1をセットし、その使用状態が判別できるようにしておいてもよい。
集計管理テーブルの作成を終えると、出力先の表から、「レコードセル列」の取出し位置をスタート位置にセットする。(ステップG2)
続いて、表フォーマット上において、先頭の「レコードセル列」から「レコードセル列」を、順次とり出し、それを構成する各セルのセルデータアドレスを、各々集計管理テーブルの第3行上の該当する欄にセットする。(ステップG3)
続いて、とり出した「レコードセル列」を構成する各セルのセルデータの「データ格納部」に格納されているデータを、各々、集計管理テーブルの第4行上の該当する欄にセットする。(ステップG4)
複合セルの場合は、今の場合、主レコードを構成するデータとして、該当セルデータの「主エリア側データ格納部」に格納されているデータをセットすることになる。
また、本例の項目「売上げ」のフィールドのように、データが未記入のセルの場合は、第4行の該当欄には集計のスタート値“0”をセットする。
次に、この出力先集計表から取り出し、集計管理テーブル上にセットした主レコードに対し、出力元データファイルの全てのデータを出力集計する。(ステップG5)以下、この手順を図47に沿って説明する。
出力元データファイルからのレコード取出し位置をスタート位置にセットし(ステップH1)、出力元データファイルからレコードを1つづつ、順に取り出して、その各区分フィールドのレコード内アドレスを集計管理テーブル上第5行上にセットする。続いて、このセットされたレコード内アドレスによって、該当のデータを読み出し、集計管理テーブル上第6行上の該当欄にセットする。(ステップH2)
取り出されたファイルレコードの各データは、その先頭に「テキストデータ」であるか「数値データ」であるかを示す「数値/テキスト区別フラグ」が付けられた上、第6行上の各欄にセットされる。
出力元データファイルからのレコード取り出しの順序は、たとえば、ファイル格納の順のように、処理の便宜により決めてよい。出力元データファイルから取り出したレコードの各構成データは、項目名対応データ(出力全体処理の最初に作成)を参照し、出力先集計表上の対応する項目名と同じ列上の記入欄にセットする。
なお、項目名が応用用語辞書52中において「年月日」区分として登録されている場合、該当のデータをデータ比較照合用の標準表現形式に変換した上、セットする。
次に、集計管理テーブル上において同じ項目名の出力先データと出力元データ間の比較照合をおこなう。(ステップH3)このデータ間の照合は、出力先データが格納される集計管理テーブル第4行上の該当欄にデータがセットされていない項目と、「集計数値」区分の項目については、おこなわない。
このデータ間の比較照合は、集計管理テーブル上の、第6行上のデータを第4行上のデータと各々該当の列上において、比較することによっておこなうことになる。
以上の比較照合において、比較した全ての項目について、出力先データと出力元データが同じであれば、次の加算処理をおこなう。すなわち、「集計区分」が「集計数値」の項目の出力元データを、出力先レコードのデータに加算する。仮に、「非集計項目」の項目であって、出力先側に、初めにデータがセットされていない場合は、出力元データ(集計管理テーブル第6行上)を出力先レコードの該当欄(集計管理テーブル第4行上)に転記する(ステップH4)
本例の場合、項目名「売上げ」以外の項目名「商品」、「年度」のデータが同じであれば、項目名「売上げ」の出力元レコードのデータを、出力先レコードのデータに加算することになる。この加算は、集計管理テーブル上の該当の列上において、第6行上のデータを第4行上のデータに加算することによっておこなわれることになる。
出力先のデータと出力元のデータの間で、比較照合した項目のデータが1つでも同じでない場合は、この加算はおこなわず、出力元ファイルから次のレコードを取り出すステップに抜ける。(ステップH5)
出力先表から取り出した1つのレコードから取り出した「主レコード」に対して、出力元データファイルの全てのレコードデータを集計し終えると、集計管理テーブル上の出力先レコード上に集計されているデータを、出力先表の該当セルの「セル内データ格納部」に転記する。(ステップG6) すなわち、集計管理テーブル第4行上のデータを、第3行のセルデータアドレスからポイントされているセルデータの「セル内データ格納部」に転記する。
該当のセルが「複合セル」である場合は、今、集計転記するデータは、「主レコード」のデータであるので、該当の「複合セルデータ」中の「主エリア記入情報部」側「セル内データ格納部」に転記することになる。この時、転記される各データは、上記した数値/テキスト区別フラグを付けたまま、「セル内データ格納部」に格納される。
以上のように、出力先表の1つのレコードセル列から得られる主レコードへの集計転記を終えると、次に、同じレコードセル列から副レコードを作成する。(ステップG7) 副レコードは、同じレコードセル列から取り出され、集計管理テーブル上にすでにセットされている主レコードの一部データを更新変更する形で作成される。
先ず、すでにセットされている主レコードの中、複合セル内のデータは、該当セルデータの「派生エリア側データ格納部」に格納されているデータにより置き換える。本例の項目名「売上げ」の複合フィールドの派生エリアのように、初めの表フォーマット上にデータが未記入の場合(該当セルデータの「派生エリア側データ格納部」にもデータは未セット)には、第4行の該当欄には集計のスタート値“0”をセットする。
次に、該当の「差異条件定義データ」の指示内容に基づいて、主レコードの該当データを変更する。
ここで参照される「差異条件定義データ」は、出力先の表フォーマットを構成する「項目定義データ」を1つづつ見て、それが「複合区分」である場合、その中の「差異条件定義データポインタ」を参照して取り出せばよい。前記したように、副レコードは、差異条件が「演算差異条件」を含む場合であっても、今の段階では、その中の「関連データ差異条件」のみを参照して作成する。
この「副レコード」の作成は、図48示す手順によっておこなわれる。先ず、主レコード内の変更対象のデータを識別する。(ステップJ1)
この主レコード内の変更対象データは、「差異条件定義データ」の「基本部」内の「項目名テキスト」部を参照し、主レコード上の同じ項目名のデータとして識別することができる。主レコードは、現在、集計管理テーブルの第4行上にセットされており、変更対象のデータは、その中の該当の項目名に対応する列上のデータである。本例の場合、項目名「年度」の対応データである数字文字列データが識別されることになる。
次に、「差異条件」の中の「関連データ差異条件」が「間接指定」であることを判定する(ステップJ2)。「差異条件定義データ」の「形式区分」部に、2型、または、5型を表わす該当コードがセットされていることを判定すればよい。
本例のように、「関連データ差異条件」が「間接指定」と判定される場合は、「関連データ差異条件」の内容を定めている「関連データ差異条件登録語」の意味にしたがって、主レコードの該当データに対して所定の変更をおこなう。(ステップJ3)
このステップJ3の処理内容は、「関連データ差異条件登録語」である、応用用語辞書52中の「相対指定」区分の登録語毎に、各々定められている。例えば、本例のように、「関連データ差異条件登録語」が「前年」である場合、ユーザがそれを通常理解する意味にしたがって、主レコードの該当するデータに対して、その「前年」である年度を表わすデータを求める処理になる。
この主レコードの該当データに対して所定の変更をおこなうステップJ3は、「関連データ差異条件登録語」が「前年」である場合、一般形として図49に示す処理になる。
この手順を、本例に即して説明すると、先ず、すでにステップJ1において取り出されている変更対象の主レコードのデータ名文字列、例えば、”2002年” から、数字文字列部分”2002”を識別する。(ステップK1)この識別は、該当の項目名「年度」について、すでに作成されている「年度書式データ」を参照することによっておこなうことができる。
なお、前記したように主レコードの該当データが、データ比較照合用の標準表現形式として、すでに数字文字列のみの表現、たとえば、”2002”になっている場合は、このステップK1は、スキップされることになる。
次に、この数字文字列部分”2002”を対応する数値”2002”に変換し(ステップK2)、続いて、該当の「関連データ差異条件登録語」である「前年」に定めた意味にしたがって、それから数値”1”を減じて、数値”2001”を得る。(ステップK3)
最後に、得られた数値を、再度、データ比較照合用の標準表現形式に変換する。この標準表現形式が数字文字列表現であれば、数値”2001”を公知の方法により数字文字列テキスト”2001”に変換する。(ステップK3)仮に、データ比較照合用の標準表現形式が後置語”年”付きであれば、該当の後置語をその末尾に付け、文字列テキスト”2001年”を得る。(ステップK4)この書式を標準表現形式に変換する処理も、「年度書式データ」を参照することによっておこなうことができる。
なお、この「関連データ差異条件登録語」の「前年」によるデータ変更処理は、仮に、変更対象の主レコードのデータ名文字列がデータ比較照合用の標準表現形式として、元号表示されており、ステップK3において、減じた結果が”0”になった場合(変更対象データが”平成1年”の場合)、元号を”昭和63年”に変更する特例処理に分岐させればよい。
この主レコードの該当データに対して所定の変更をおこなうステップJ3は、他の「関連データ差異条件登録語」の場合も、同様におこなうことができる。例えば、「関連データ差異条件登録語」が「次年」であれば、図49に示す手順中においてステップK3を、数値”1”を加える処理に置き換えることによっておこなうことができる。
また、「関連データ差異条件登録語」が「前月」である場合、通常は図49の手順と同様におこない、減じた結果が”0”になった場合(変更対象データが”1月”の場合)、「年度」のデータを”1”減じ、「月別」のデータを”12”に変更する特例処理に分岐させればよい。または、応用用語辞書52中において、「年月日項目」区分の登録語「月別」に、月名の時間順の列(例えば、”1月”、”2月”、…、または、”Jan.”,”Feb.”,…)を付属させておき、この列データを1つ前に辿ることによっておこなってもよい。
最後に、以上のように求めたデータによって、主レコード中の変更対象データを置き換え、副レコードを得る。(ステップJ4) 。
主レコードの構成データは、すでに、集計す管理テーブル上第4行にセットされているので、副レコードは、その中の変更対象のデータを、以上によって求めたデータによって置き換えればよい。
本例の場合、集計管理テーブル上第4行において、項目が「年度」のデータとして、セットされている主レコードの「変更対象データ」が、例えば、“2002”であれば、それを以上によって求めたデータ“2001”に置き換えればよいことになる
以上のように、集計管理テーブル上に取り出した「副レコード」に対して、「主レコード」の場合と同様に、出力元データファイルの全てデータを集計転記する。(ステップG8)。主レコード」の場合と同じく、出力データファイルからレコードを1つづつ、集計管理テーブル上の第6行にとり出し、その上で第4行上のデータと比較照合をおこなう処理を繰り返して、集計転記していく。
出力元ファイルの全てのレコードを出力先表の「副レコード」(集計管理テーブルの第4行上)に転記集計し終えると、集計管理テーブル上で求めた「副レコード」の中の複合セルの該当データを元の表フォーマットのセルデータ内に格納する。(ステップG9)
すなわち、集計管理テーブル第4行上のデータの中、複合データフィールドが定義されている項目(本例の場合、「売上げ」)のデータを、同じ第3行のセルデータアドレスからポイントされている「複合セルデータ」中の「派生エリア記入情報部」側「セル内データ格納部」に転記する。この時、転記される各データは、上記した「数値/テキスト区別フラグ」を付けたまま、「セル内データ格納部」に格納される。
出力先の表から取り出した1つの「レコードセル列」をについて、以上の処理を終えると、出力先表から、「次のレコードセル列」をとり出し、同じ処理を繰り返す。
出力先表において「次のレコードセル列」は、取り出されているレコードセル列の構成セルの中、同じ項目のセルが繰り返される範囲内のセル(本例の場合、項目「売上げ」のデータフィールドを構成するセル)を、この繰返し範囲内の隣接する次のセルに置き換えて得ることができる。
1つの行上において全てのレコードセル列を取り出した後は、次の行において、この繰返される項目のセルとして繰り返し範囲内の先頭のセルを選び、レコードセル列を取り出し、以下、上記と同じことを繰り返していけばよい。
出力先から取り出される全ての「レコードセル列」について、以上の集計を終えると、次に、これらの出力データを表内に定義されている合計欄に集計する「表内演算処理」をおこなう。(ステップF2)
「表内演算処理」では、上記した「演算結果欄定義データ」が施されている演算結果欄データフィールド内の各演算結果欄セルについて、各々、定まる演算対象のデータ群に対し所定の演算をおこない、その演算結果を該当セル内に記入する。
本例の場合、表の最下行と最右列に設定されている各演算結果欄セル(合計欄セル)について、各々、同一行、または、同一列上の項目名「売上げ」のデータ群に対し所定の演算である加算をおこない、加算結果をその中に記入する。
演算の種別は、該当の演算結果欄定義データ中の「演算区分」を参照すればよい。
本例の場合、演算対象のデータに対し加算演算がおこなわれる。
各演算結果欄セルは、該当の演算結果欄定義データのセルデータチェンを、順次辿ることによって取り出していくことができる。
各演算結果欄セル毎の演算対象フィールドは、前記したように、該当の演算結果欄定義データフィールドと直角方向に定義され、かつ、1つの項目定義データフィールドの中、該当の「演算結果欄欄セル」と同一列、同一行にある部分として検出される。
書面上で定義されている各項目定義データフィールドについて作成されているセルデータチェインから順次、セルデータを取出し、その位置情報から該当の演算結果欄セルと同一行、または同一列上にあるセルを検出することによって取り出していくことができる。セル中の記入データの読み出しは、該当のセルデータのセル内データ部格納部を参照すればよい。
本例のように、「演算対象フィールド」を構成する各セルが複合セルである場合、前記したように、その「演算結果欄セル」も同じ「差異条件」と「派生エリア定義データ」を持つ複合セルであり、すでに、そのセルデータは「複合用セルデータ」に切り替えられている。
先ず、該当の演算対象フィールド内の各複合セルについて、該当セルデータ内の「主エリア記入情報部」側「セル内データ格納部」に格納されているデータを読み出して演算をおこない、その結果を該当演算結果欄セルのセルデータ内の「主エリア記入情報部」側「セル内データ格納部」に格納する。
続いて、該当セルデータ内の「派生エリア記入情報部」側「セル内データ格納部」に格納されているデータを読み出して演算をおこない、その結果を該当演算結果欄セルのセルデータ内の「派生エリア記入情報部」側「セル内データ格納部」に格納することになる。
全ての「演算結果欄定義データ」について所定の処理を終えると、「表内演算処理」を終え、「複合セル内演算処理」に入る。(ステップF3)「複合セル内演算処理」の手順を図50に示す。
「複合セル内演算処理」においては、最初に、「差異条件定義データ」内の「演算指定部」を参照し、差異条件に「演算差異条件」が含まれていることを判定し(ステップN1)、差異条件に「演算差異条件」が含まれていない場合(上記「演算指定部」内「演算種別部」に”0”がセットされている場合)は、直ちに、次の「文字列データ化処理」(ステップF4)に抜ける。
差異条件に「演算差異条件」が含まれている場合には、、次に、上記「演算指定部」内「演算オペランド区分」を参照し、それが「派生エリアデータ値」であることを判定する。(ステップN2)
本例のように、この判定が得られる場合、複合フィールド内の各セルについて、主エリア内データと派生エリア内の現在のデータとの間で指定されている演算をおこない(ステップN3)、演算結果データによって派生エリア内データを更新する。すなわち、各セルの「派生エリア記入情報部」側の「セル内データ格納部」に格納するデータをこの演算結果データに置き換える。(ステップN4)
本例の場合、主エリア内データを現在、「派生エリア記入情報部」側「セル内データ格納部」にセットされている派生エリア内データによって除算し、除算結果を、改めて「派生エリア記入情報部」側「セル内データ格納部」に格納することになる。
仮に、差異条件文字列が、本例の”対前年比”の代わりに”対前年増”であれば、
応用用語辞書52の「演算指定2」区分の登録用語”対…増”が検出され、差異条件定義データの「演算種別」部には、該当のコード(”2”)がセットされる。
「データ出力処理」(ステップF1)と「表内演算処理」(ステップF2)においては、本例と全く同じ処理がおこなわれるが、この「複合セル内演算処理(ステップF3)において、主エリア内データを現在の派生エリア内データによって減算し、その減算結果を、改めて「派生エリア記入情報部」側「セル内データ格納部」に格納することになる。
また、差異条件文字列が本例の”対前年比”の代わりに”%”であれば、応用用語辞書52の「演算指定2」区分の登録用語”%”が検出され、差異条件定義データの「演算種別」部には、該当のコード(”11”)がセットされる。
「データ出力処理」(ステップF1)と「表内演算処理」(ステップF2)は、本例と全く同じ処理がおこなわれるが、この「複合セル内演算処理(ステップF3)において、主エリア内データを現在の派生エリア内データによって除算した結果に数値”100”を乗じ、その結果を、改めて「派生エリア記入情報部」側の「セル内データ格納部」に格納することになる。
「複合セル内演算処理」を終えると、出力先の表上において転記、集計されたデータについて「文字列データ化処理」をおこなう。(ステップF5)データが出力された各セルについて、該当のセルデータ内の「セル内データ格納部」に格納されているデータをとり出し、対応する文字列データを作成する。出力先の表フォーマット上に元々記入されている非集計項目のデータを除き、出力先表フォーマット上において、項目定義と演算結果欄定義が加えられた全てのデータフィールドを構成するセルのセル内データについておこなわれる。
初めからデータ文字列記入されているセルは、該当セルの位置情報と書面上の各文字列データの位置情報との照合を繰り返すことによって検出することができる。
また、仮に、初めから記入されているデータ文字列が集計数値のデータである場合は、新しく集計されたデータについて、文字列データを生成すると共に、元から記入されているデータの該当文字列データは削除する。
セル内記入データを表わす文字列データの作成は以下のようにおこなわれる。まず、セルデータ内の「セル内データ格納部」より取り出したデータが数値データであれば、公知の方法により、この数値データをテキストデータに変換する。これによって、たとえば、数値データとして単に数値「396」の大きさを表していたデータが、文字“3”“9”“6”の並びであるテキストデータに変換される。
テキストデータから該当の文字列データ(位置情報も定義されている)は次のように作成される。該当の文字列データの記入先(位置情報)は、該当のセルの位置情報とセル内配置書式から決定することができる。セル内配置書式は、該当のセルが所属する項目定義データに付属したフィールド書式情報から読み取ることができる。文字サイズ、文字ピッチ、配置位置(たとえば右詰め、センタリング等の指定)、記入文字の色等である。本例のように配置書式がユーザによって指定されていなければ装置デフォルトによって決定される。
まず、セルの書式情報中に登録されている各文字の大きさとピッチから、文字列を外接する矩形を求める。続いて、文字列のセル内配置位置情報(たとえば右詰め、センタリング等の指定)を参照して、その外接矩形のセル内位置を求める。次に、該当のセルの書面上位置(該当のセルデータにセットされている)を参照し、該当の外接矩形の書面上位置を得て、該当の文字列の書面上位置が得ることができる。こうして得られたテキストデータと位置情報から該当の文字列データが作成され、そのアドレスを該当の対応するセルデータ(図20)のセル内文字列データアドレス部にセットしておく
複合セルの場合、その中に記入されている2つのデータの文字列データへの変換作成は、次のようにおこなわれる。該当の複合セルについて定義されている「派生エリア定義データ」から取り出した「分割位置」情報と「両側マージン値」とを読み出し、それと該当複合セル全体の位置情報との両者から、主エリアと派生エリアの各々について、「データ文字列記入範囲」を求める。この主エリアと派生エリアの「データ文字列記入範囲」と「分割位置」情報と「両側マージン値」との関係は図35に示している。
合計フィールド内の複合セルについては、まず、対応する演算対象フィールドを識別し、その上に定義されている項目定義データから、該当する派生エリア定義データを識別し、同様にして、主エリアと派生エリアの各々についての「データ文字列記入範囲」を求めることができる。
主エリアと派生エリアの各々について、該当のセルデータ格納部より取り出した各エリア内記入データを取り出し、その「データ文字列記入範囲」を参照して、上記した通常セルの場合と同様に、該当文字列の位置情報を求め、文字列データを得ることができる。
その際に参照される主エリアと派生エリアについての各エリア内配置書式は、各々、該当する項目定義データと派生エリア定義データに付属させたフィールド書式情報から知ることができる。
主エリアについてのフィールド書式は、該当の「項目定義データ」内の「フィールド属性情報」にセットされ、派生エリアについてのフィールド書式は、該当の「派生エリア定義データ」内の「エリア内フィールド属性情報」にセットされる。各々、データ種別(数値、テキストなど)毎にデフォールト値をきめておいてもよい、または、公知の方法により,ユーザに指定させてもよい。
主エリアと派生エリアの各々について、その該当「データ文字列記入範囲」と該当のセルデータ格納部より取り出したデータの両者から、上記した通常セルの場合と同様に、その位置情報を求め、文字列データを得ることができる。主エリアと副エリアの各々について作成した文字列データは、通常セルの場合と同じく、各々、該当の複合セルデータ内の主エリア側「セル内文字列データアドレス格納部」と「派生エリア側セル内文字列データアドレス格納部」にそのアドレスをセットする。
なお、この時に、個々の複合セル内に派生エリア内には、それを生成する該当の「派生セル生成要素」が記入されているかチェックをおこない、記入されていない場合は該当の記号を新たに生成して記入する。
該当のデータフィールドの複合セルを一つづつとりだし、「分割位置」の派生エリア側に記入されている文字、記号等を全て取り出し、その中から該当する「種別」の「派生エリア生成要素」の組み合わせが得られるかを否かを判定する。
該当の「派生エリア生成要素」の「種別」は該当の「派生エリア定義データ」から知り、「派生エリア生成要素」を構成する記号コードとその記入順序は、今得られた「種別」から「派生エリア生成要素辞書」を介して知ることができる。
セル内に「派生エリア生成要素」が記入されていない場合には、次のように「派生エリア生成要素」を生成して記入する。上記のように、記入すべき「派生エリア生成要素」を構成する記号について、そのコードと相互の記入順序を知り、派生エリア定義データ内に登録されている「分割位置」と「両側マージン」情報を参照して、そのセル内配置位置を求めることができる。次に、セル全体の書面上位置情報(セルデータ内に登録)を参照して、この「派生エリア生成要素」の構成記号の書面上位置情報を得て、対応する文書要素データ(文字列データ)を得ることができる。
以上のように生成された文字列データは、当該帳表に元々記入されている、他の文書要素データと一緒に文書要素データ記憶部38に格納される。
したがって、文書画像出力部40が、この文書要素データ記憶部38より(黒)の通常記入情報に対応する全ての文書要素データを読みだし、それら読み出した文書要素データを文字/図形パターン辞書36に照会して各文書要素のパターンを識別し、各パターンを展開プログラムによってビットマップ形式の画像データに変換することにより、図51に示すような目的の帳表出力文書をたとえばディスプレイ画面20a上に表示することができる。また、印字装置22でプリントアウトしたり、通信装置24によりFAX送信することもできる。
(他の使用例1)
次に、図9において、表外に記入された注釈文”[ ]内は、対前年比”を”[ ]内は、対全体比”という注釈文に置き換えた表フォーマットについて、本システムがおこなう取り扱いについて説明する。
本例の場合、項目名「売上げ」の複合データフィールド内の各派生エリアには、対応する主エリア内データと該当データフィールド内の全ての主エリア内データの合計値との比率が記入されるようになっている。
この項目名「売上げ」のデータ記入欄(フィールド)における記入分けを、ユーザは表の表題の下に記入されている注釈文「[ ]内は、対全体比」から読み取っている。この注釈文中の部分文字列”全体”は、ユーザによって書面上において、特に定義されていない場合は、表を使用するユーザ間の共通の約束として、通常は、「同じ表中の同じ項目名(「売上げ」)に属する全てのデータの合計値」を指示するものとして読み取られる。
複合データフィールドに対する定義付けは、表外に書かれた注釈文の中の部分文字列”対全体比”を「解釈指定」の定義要素”○”により囲み、該当の項目名「売上げ」のデータフィールド内の任意の派生エリアと定義要素の「結合線」により結ぶことによっておこなうことができる。この差異条件の定義付けを、図52の(イ)に示す。他の定義付けについてはは、前記した図10の場合と全く同様におこなわれる。
この「解釈指定」定義要素”○”による指定は、指定した部分文字列中のさらに部分文字列である”対…比”、”全体”が、各々、応用用語辞書52中において、「演算指定2」区分と「演算オペランド指定」区分として登録されている用語であり、さらに、登録用語”全体”については、応用用語辞書52のユーザインターフェース(ユーザマニュアル等)において、注釈文「”全体”は、演算指定のオペランドとして使用し、ユーザによる特別の指定がない限り、1つの表内の同じ項目名に属するデータの合計値を意味します。」が付けられていることもも確認した上でおこなう。
今、この「解釈指定」の定義要素”○”による指定によって囲まれている文字列”対全体比”の中の部分文字列”全体”は、ユーザによる特別の指定がないことから、応用用語辞書52に登録されている意味(ユーザがふだん使用している意味)にしたがって、「該当の表内の同じ項目名に属するデータの合計値」として定まり、「対…比」も応用用語辞書52に「演算指定2」区分として登録されている意味にしたがって、その中に挟む文字列の意味するデータとの比率であることが定まる。
そして、両者によって構成される複合文字列文字列” 対全体比”は、上記のように定まった各構成語の意味をもとに、本表フォーマットの作成言語である日本語の構文規則によって解釈され、「同じ項目名に属するデータの合計値データとの比率」であることが一意に解釈される。
さらに、本システムにおいては、以上の形式が定義され、かつ、1つのデータフィールドと定義要素の「結合線」によって関係付けられている文字列は、そのデータフィールドの「差異条件」の定義以外には用いないものとして、以上の定義付けによって、項目名「売上げ」のデータフィールドは、該当の文字列を「差異条件文字列」とする複合フィールドであり、各派生エリア内には、該当主エリアのデータを表内の項目名「売上げ」に属するデータの合計値によって除算した比率を記入すべきことがシステムに対して確定的に定義されたことになる。
以上のように定義付けをおこなった用紙をシステムに入力すると、「複合フィールド定義処理」(ステップA3)までは、前記の場合と全く同じ処理がおこなわれる。
「複合フィールド定義処理」処理(ステップA3)において、図10の場合と同じく、「差異条件文字列の判定」手順(図30)中のステップD1において、該当の文字列”対全体比”について、「解釈指定」定義要素記号”○”による指定が判定され、続くステップD2において、「演算指定2」区分の応用用語辞書登録用語”対…比”が検出される。
続くステップD3の判定において、上記の検出用語”対…比”を除いた残りの部分文字列”全体”が、「相対指定」区分の応用用語辞書登録用語でないことが判定され、ステップD6の判定に分岐する。ステップD6の判定においては、上記検出用語を除いた残りの部分文字列”全体”について、応用用語辞書52中において「演算オペランド指定」区分として登録されている用語であることを判定する。
本例の場合、該当の文字列”全体”が、応用用語辞書52中において「演算オペランド指定」区分として登録されている用語であることが判定され、3型の差異条件の形式と条件を満たすものとして判定される。(ステップD7)
本システムにおいては、1つのデータフィールドと定義要素の「結合線」によって関係付けられ、かつ、以上の形式と条件を満たしている文字列は、そのデータフィールドの「差異条件」の定義以外には用いないものとして、該当の文字列は、該当複合フィールドの「差異条件文字列」として確定的に解釈される。
本例の場合、次のようにデータがセットされた「差異条件定義データ」が作成されることになる。先ず、同データの「基本部」内の「登録語」記入欄には、応用用語辞書52中の該当の「代表名」”全体”がセットされ、「演算指定部」内の「演算種別部」には、「対**比」に対応する該当コード”1”がセットされ、「演算オペランド区分部」には、「特定指定値」に対応するコード”0”がセットされる。
「派生エリア定義データ」は、前記の場合と全く同様に作成される。
「データ出力処理」(F1)においては、その先頭のステップM1において、「差異条件3型」と判定されることから、「データ出力処理−2」(図44)に分岐する。「データ出力処理−2」は、前記した「データ出力処理−1」の中、派生エリアへのデータ出力(ステップ −ステップ )をスキップした処理に相当する。
「表内演算処理」(F2)も、複合セルについては、主エリアのみについておこなわれる。
「複合セル内演算」(F3)においては、その先頭のステップN1において、差異条件定義データ内の「演算指定部」を参照して、「演算差異条件有り」と判定され、続いて、ステップN2の判定において同データの「演算オペランド区分部」が「特定指定値」であることから、ステップN5以下の処理に分岐する。
ステップN5においては、差異条件定義データの「基本部」内「登録語テキスト部」を参照してオペランドとしての「特定指定値」を求める。(ステップN5)今、「登録語テキスト部」として”全体”が登録されていることから、この「特定指定値」は、応用用語辞書52に定められて意味にしたがって、該当の複合フィールドの項目名に属する全データの合計値として求める。本例の場合、項目名「売上げ」の全ての複合セルの主エリア内データを合計した値として求めることになる。
次に、ステップN6において、各複合セルについて、主エリア内データと上記のように求めた「特定指定値」との間で指定された演算をおこなう。(ステップN6)本例の場合、項目「売上げ」の各複合セルについて、除算をおこなうことになる。
最後に、各複合セルについて、演算結果データを派生エリア内に記入する。すなわち、演算結果データを該当複合セルデータ内の「派生エリア記入情報部」側「セル内データ格納部」に格納する。(ステップN4)
以降の「文字列データ化処理」(ステップF4)は、図10の場合と全く同様におこなわれる。
(他の使用例2)
次に、図9の表において、表外に記入された”[ ]内は、対前年比”という注釈文を、”[ ]内は、対2000年比”という注釈文に置き換えた表について、本システムがおこなう取り扱いについて説明する。
本例の場合、項目名「売上げ」の複合データフィールド内の各主エリアは、各々、表フォーマットの同じ列上の最上行に記入されている「2001年」、「2002年」、「2003年」を、項目名「年度」についての関連データ条件とするが、この複合データフィールド内の各派生エリアの項目名「年度」についての関連データ条件は、全て、「2000年」である。
「年度」以外の項目名についての関連データ条件は、前記したように、該当する主エリアと全て同じである。この複合データフィールド内の各派生エリアには、先ず、以上の関連データ条件に基づいてデータが集計出力され、さらに、この出力データ値に対する該当主エリア内データの比率が記入されるようになっている。
この項目名「売上げ」のデータ記入欄(フィールド)における記入分けを、ユーザは表の表題の下に記入されている上記注釈文から読み取っている。
この複合データフィールドに対する定義付けとしては、先ず、表外に書かれた注釈文である”[ ]内は対2000年比”の中の部分文字列”対2000年比”を「解釈指定」の定義要素”○”により囲み、該当の項目名「売上げ」のデータフィールド内の任意の派生エリアと定義要素の「結合線」により結ぶ。ここで、追記する定義要素「解釈指定」と「結合線」は、(青色)の定義支援記入情報により記入する。
この「解釈指定」定義要素”○”による指定は、指定された部分文字列中のさらに部分文字列である”対…比”が、応用用語辞書52中において、「演算指定2」区分して登録されている用語であることを確認した上でおこなう。
また、該当の部分文字列から、上記の応用用語辞書登録用語を除いた部分文字列(本例の場合、”2000年”)について、同じ書面上の他の箇所において「データ名」として定義されていることを確認する。
本例のように、該当の部分文字列から、上記の応用用語辞書登録用語を除いた部分文字列が、同じ書面上の他の箇所において「データ名」として定義されていない場合には、図52の(ロ)に示すように、対応する項目名”年度”を、(青)色の定義支援記入情報により、該当の部分文字列”2000年”の近傍の適当位置に記入し、「項目名指定」の定義要素”<>”により囲んた上、定義要素の「結合線」により結ぶ。
対応する項目名を該当の部分文字列に隣接して記入する場合は、この定義要素「結合線」による関係付けは省いてもよい。他の定義付けは、図10の場合と全く同様におこなわれる。
以上の定義付けにより、上記したように、「解釈指定」を受けた文字列の中、”対…比”の意味は応用用語辞書52にしたがって定まり、また、”2000年”は項目名「年度」のデータ名として定義された上、両者を組み合わせた全体の意味は構文規則により一意に解釈され、上記したユーザが理解する意味が確定的に定義されることになる。
以上のように定義付けをおこなった用紙をシステムに入力すると、「複合フィールド定義処理」(ステップA3)までは、図10の場合と全く同じ処理がおこなわれる。
「複合フィールド定義処理」処理(ステップA3)において、図10の場合と同じく、「差異条件文字列の判定」手順(図30)中のステップD1において、該当の文字列” 対2000年比”について「解釈指定」定義要素記号”○”による指定が判定され、続くステップD2において、「演算指定2」区分の応用用語辞書登録用語” 対…比”が検出される。
続く、ステップD3の判定において、上記の検出用語”対…比”を除いた残りの部分文字列”2000年”が、応用用語辞書52中において「相対指定」区分の登録用語としてサーチされないことから、ステップD6の判定に分岐する。該当の文字列”2000年”は、ステップD6の判定においても、応用用語辞書52中において「演算オペランド指定」区分の登録用語としてサーチされないことから、ステップD8の判定に進むことになる。
ステップD8においては、先ず、判定対象の文字列”2000年”が、同じ書面上の他の箇所において「データ名」として定義されていることを判定する。 書面上において定義されている全ての項目定義データフィールドについて、その中に記入されているデータ文字列を1つづつ取り出し、照合していけばよい。
判定対象の部分文字列が、書面上において定義されている項目定義データフィールド中に「データ名」として記入されていることが検出できれば、この部分文字列はユーザが定義した「データ名」であると判定し、ステップD9以下の確認処理に進む。
以上の判定が得られない場合、「項目名指定」の定義要素”<>”により囲まれた文字列が、判定対象の文字列部分に隣接して記入されているか、または、判定対象の文字列部分と結合線により結ばれていることを判定する。
これらの文字列どうしの隣接位置関係、または、文字列と結合線との位置関係は該当する各文字列データ、または、各線分データの書面上位置情報の照合を繰り返すことによって判定することができる。文字列どうしの隣接関係の判定は、2つの文字列の外接矩形が、縦横方向の1方向から見て共通する範囲を持ち、その直角方向から見て、一定閾値内に位置することを判定することによっておこなえばよい。
本例の場合、「項目名指定」の定義要素”<>”により囲まれ、かつ、判定対象の文字列部分と結合線により結ばれている文字列”年度”が検出され、ステップD8判定が得られることになる。
ステップD8の判定が得られれば、この判定対象の部分文字列はユーザが定義した「データ名」であると判定し、ステップD9以下の確認処理に進む。以上の判定が得られない場合には、適当なメッセージをディスプレイ上に表示した上、定義データ全体の作成手順(図22)を終える。
ステップD9においては、判定対象の部分文字列の対応項目名が、書面上の他の箇所において項目定義の対応項目名として定義されていることを確認する。前記したステップD4と同じことをおこなえばよい。ステップD8において、同じ書面上の他の箇所において「データ名」として定義されている判定が得られている場合は、このステップD9は処理の重複になるので、スキップしてよい。
本例の場合、判定対象の文字列”2000年”は、その対応項目名「年度」が、表フォーマット上において項目定義データフィールド(最上行のデータ”2001年”、” 2002年”、” 2003年の記入されているデータフィールド)の対応項目名としても定義されていることが確認される。
ステップD9の確認が得られれば、ステップD10の確認処理に進む。ステップD10においては、判定対象のデータ名文字列の対応項目名が応用用語辞書52中において「年月日項目」区分として登録されている用語であることを、先ず、判定し、その判定が得られれた場合、判定対象のデータ名文字列が、書面上の他の箇所において定義されている同じ項目名の項目定義データフィールド内に記入されているデータ文字列と同じ記入書式によって記入されていることを確認する。
判定対象の部分文字列の書式を、前記した「年月日書式データ」を求めた手順と同じ手順により解析することによって求め、すでに求めてある書面上の同じ項目名の項目定義データフィールドの「年月日書式データ」と比較していけばよい。
本例の場合、判定対象の文字列”2000年”は、その対応項目名「年度」が応用用語辞書52中において「年月日項目」区分として登録されている用語であることが判定され、かつ、表フォーマット上の最上行の項目定義データフィールドの記入文字列データ”2001年”…と同じ書式によって 記入されていることが確認される。
ステップD10の確認が得られれば、該当文字列は4型の差異条件の形式と条件が満たされていると判定される。(ステップD11)
本システムにおいては、1つのデータフィールドと定義要素の「結合線」によって関係付けられ、かつ、以上の形式と条件を満たしている文字列は、そのデータフィールドの「差異条件」の定義以外には用いないものとして、該当の文字列は、該当複合フィールドの「差異条件文字列」として確定的に解釈される。
本例の場合、「差異条件定義データ」は次のように作成される。同データの「基本部」内の「項目名テキスト」記入欄と「データ名テキスト」記入欄には、各々、該当の”年度”と”2000年”がセットされる。また、「演算指定部」内の「演算種別部」には、「対**比」に対応する該当コード”1”がセットされ、「演算オペランド区分部」には、「派生エリア内データ」に対応するコード”0”がセットされる。
「データ出力処理」(F1)においては、その先頭のステップM1において、「差異条件の4型」と判定され、「データ出力処理−1」(ステップM2)がおこなわれる。「データ出力処理−1」においては、ステップG7において、図10の場合と異なる処理がおこなわれる。
すなわち、ステップG7(図48にその手順を示す)中のステップJ2「関連データ差異条件の判定」において、本例は「直接指定」の場合に当たることから、ステップJ5に分岐し、主レコード中の該当データを、「差異条件定義データ」中の「基本部」内「データ名テキスト部」のデータによって直接に置き換える。
本例の場合、集計管理テーブル第4行上の該当データ”を、データ”2000”によって置き換えることになる。以降の、「表内演算処理」(ステップF2)、「複合セル内演算処理」(ステップF3)、「文字列データ化処理」(ステップF4)は、図10の場合と同様におこなわれる。
(他の使用例3)
次に、図9の表において、表外に記入された”[ ]内は、対前年比”という注釈文を”[ ]内は、前年値”という注釈文に置き換えた表について、本システムがおこなう取り扱いについて説明する。
本例の場合、項目名「売上げ」の複合データフィールド内の各主エリアは、各々、表フォーマット上最上行の同じ列上に記入されている「2001年」、「2002年」、「2003年」を項目名「年度」についての関連データ条件とするが、同複合データフィールド内の各派生エリアの項目名「年度」についての関連データ条件は、各々、該当する主エリアの「前年」にあたる年度である。
「年度」以外の項目名についての関連データ条件は、前記したように、該当する主エリアと全て同じである。この複合データフィールド内の各派生エリアには、以上の関連データ条件に基づいてデータが出力され、記入されるようになっている。
この項目名「売上げ」のデータ記入欄(フィールド)における記入分けを、ユーザは表の表題の下に記入されている上記注釈文から読み取っている。
この複合フィールドに対する定義付けは、図52の(ハ)に示すように、表外に書かれた注釈文である”[ ]内は前年値”の中の部分文字列”前年”を「解釈指定」の定義要素”○”により囲み、該当の項目名“売上げ”のデータフィールド内の任意の派生エリアと(青)色の定義要素「結合線」により結べばよい。他の定義付けは、全く同様におこなわれる。以上の定義付けにより、上記したユーザが理解する意味が確定的に定義されることになる。
以上のように定義付けをおこなった用紙をシステムに入力すると、「複合フィールド定義処理」(ステップA3)までは、図10の場合と全く同じ処理がおこなわれる。
「複合フィールド定義処理」処理(ステップA3)においては、図10の場合と同じく、「差異条件文字列の判定」手順(図30)中のステップD1において、該当の文字列”前年”について、「解釈指定」定義要素記号”○”による指定が判定されるが、続くステップD2において、「演算指定2」区分内の応用用語辞書登録用語が検出されないことから、ステップD12に分岐する。
ステップD12においては、「解釈指定」定義要素よって指定された文字列が、応用用語辞書52中において、「相対指定」区分として登録されていることを判定する。本例では、判定対象の文字列”前年”が、応用用語辞書52中において、「相対指定」区分の登録用語としてサーチされる。
本例のように、ステップD12の判定が得られる場合は、続いて、応用用語辞書52中において、該当の登録用語と対応付けられ形で登録されている「所属項目名」を識別し、その「所属項目名」が、該当の表上において項目定義の対応項目名として定義されていることを確認する。(ステップD13)
本例の場合、このステップD13において、該当の「所属項目名」”年度”が、表フォーマット最上行に定義されている項目定義データフィールドの対応項目名として定義されていることが確認される。
ステップD13の判定が得られると、2型の差異条件の形式と条件を満たすものとして判定される。(ステップD14)本例の場合、該当文字列”前年”は、このケースにあたることが判定される。
本システムにおいては、1つのデータフィールドと定義要素の「結合線」によって関係付けられ、かつ、以上の形式と条件を満たしている文字列は、そのデータフィールドの「差異条件」の定義以外には用いないものとして、該当の文字列は、該当複合フィールドの「差異条件文字列」として確定的に解釈される。
本例の場合、「差異条件定義データ」は、次のように作成される。先ず、上記「基本部」内の「登録語」記入欄に、応用用語辞書52中の該当の「代表名」”前年”がセットされ、「演算指定部」内の「演算種別部」には、「演算指定なし」に対応する該当コード”0”がセットされ、「演算オペランド区分部」には、「派生エリア内データ」に対応するコード”0”がセットされる。
また、「演算オペランド区分」が、本例のように「派生エリア内データ」である場合、該当の派生エリア内データの所属項目名を「項目名テキスト」記入欄にセットする。
本例の場合、応用用語辞書52中の「相対指定」区分の登録用語”前年”について、ステップD4において参照した所属項目名「年度」を記入する。
「データ出力処理」(ステップF1)は、図10の場合と「関連データ差異条件」が同じであることから全く同じ処理がおこなわれる。「表内演算処理」(ステップF2)も同様におこなわれる。ただし、本例においては、続く「複合セル内演算 」(ステップF3)は、その中の最初のステップM1の判定において「差異条件定義データ」内の「演算種別部」に、「演算指定なし」の該当コードがセットされていることが参照され、それ以降の処理はスキップされることになる。以降の「文字列データ化処理」(ステップF4)は、図10の場合と全く同様におこなわれる。
(他の使用例4)
次に、図9の表において、表外に記入された”[ ]内は、対前年比”という注釈文を”[ ]内は、2000年値”という注釈文に置き換えた表について、本システムがおこなう取り扱いについて説明する。
本例の場合、項目名「売上げ」の複合データフィールド内の各主エリアは、各々、表フォーマット上最上行の同じ列上に記入されている「2001年」、「2002年」、「2003年」を項目名「年度」についての関連データ条件とするが、同複合データフィールド内の各派生エリアの項目名「年度」についての関連データ条件は、全て、「2000年」である。他の関連データ条件は、前記したように、該当する主エリアと全て同じである。
この複合データフィールド内の各派生エリアには、先ず、以上の関連データ条件に基づいてデータが出力され、記入されるようになっている。この項目名「売上げ」のデータ記入欄(フィールド)における記入分けを、ユーザは表の表題の下に記入されている注釈文「[ ]内は、2000年値」から読み取っている。
本例における複合フィールドの定義付けは、表外に書かれた注釈文である”[ ]内は2000年値”の中の部分文字列”2000年”を「データ指定」の定義要素”[ ]”により囲み、該当の項目名“売上げ”のデータフィールド内の任意の派生エリア部分と(青)色の結合線“−”により結ぶことによっておこなう。
また、該当の部分文字列”2000年”に隣接する適当位置に対応する項目名”年度”を(青)色の定義支援情報により記入し、「項目名指定」の定義要素”<>”により囲んでおく。他の定義付けは、全く同様におこなわれる。この差異条件の定義付けを、図52の(二)に示す。
以上のように定義付けをおこなった用紙をシステムに入力すると、「複合フィールド定義処理」(ステップA3)までは、図10の場合と全く同じ処理がおこなわれる。「複合フィールド定義処理」処理(ステップA3)において、「差異条件文字列の判定」手順(図30)中のステップD1において、該当の文字列について「解釈指定」定義要素記号”○”による指定が判定されないことから、ステップD15の判定に分岐する。
ステップD15においては、該当の文字列に「データ名指定」の定義要素記号”[ ]” が付せられていることを判定し、この判定が得られれば、使用例2の場合と同様に、「項目名指定」の定義要素”<>”により囲まれた文字列が、判定対象の文字列部分に隣接して記入されているか、または、判定対象の文字列部分と結合線により結ばれていることを判定する。
ステップD15において、以上の検出と判定が得られた場合、続いて、ステップD16とステップD17の確認処理をおこなう。ステップD16とステップD17の確認処理は、おのおの、前記したステップD9とステップD10の確認処理と同じ処理がおこなわれる。ステップD17の確認が得られれば、該当文字列は1型の差異条件の形式と条件が満たされていると判定される。(ステップD18)
本例の場合、判定対象の文字列”2000年”は、ステップD16の確認において、その項目名「年度」が、表フォーマット上において最上行の項目定義データフィールドの対応項目名としても定義されされていることが確認され、、また、ステップD17の確認において、この項目定義データフィールド内の記入文字列データ”2001年”…と同じ書式によって記入されていることが確認され、このケースに該当すると判定される。
本システムにおいては、1つのデータフィールドと定義要素の「結合線」によって関係付けられ、かつ、以上の形式と条件を満たしている文字列は、そのデータフィールドの「差異条件」の定義以外には用いないものとして、該当の文字列は、該当複合フィールドの「差異条件文字列」として確定的に解釈される。
本例の場合、「差異条件定義データ」内の上記「基本部」内の「項目名テキスト」記入欄と「データ名テキスト」記入欄には、各々、該当の”年度”と”2000年”がセットされる。また、同データ内の「演算指定部」内の「演算種別部」には、「演算指定無し」に対応する該当コード”0”がセットされ、「演算オペランド区分部」には、「派生エリア内データ」に対応するコード”0”がセットされる。
「データ出力処理」(ステップF1)は、前記した「他の使用例2」の場合と「関連データ差異条件」が同じであることから、全く同じ処理がおこなわれる。「表内演算処理」(ステップF2)も同様におこなわれる。
ただし、本例においては、「演算差異条件」が定義されていないことから、続く「複合セル内演算 」(ステップF3)は、その中の最初のステップM1の判定において「差異条件定義データ」内の「演算種別部」に、「演算指定なし」の該当コードがセットされていることが参照され、それ以降の処理はスキップされることになる。以降の「文字列データ化処理」(ステップF4)は、図10の場合と全く同様におこなわれる。
実施例装置に一部の拡張と変更をおこない、表フォーマット上の表内計算機能を簡易な形でおこなうこともできる。たとえば、ユーザの手により図53(黒色部分)に示す表が入力作成され、用紙の形で用意されているものとする。図53に示す表は、先に示した図10に示す表と同じフォーマットの表であるが、表外の注釈文として、”[ ]内は、対全体比”が記入され、項目名「売上げ」のデータフィールドの派生エリアには、対応する主エリア内データと項目名「売上げ」に属するデータの合計値データとの比率が記入されるようになっている。
図53に示す表フォーマットは、項目名「売上げ」のデータフィールド内の各主エリアにはデータが記入されているが、項目名「売上げ」のデータフィールド内の各派生エリアと表の右端列上の合計データフィールドと下端行上の合計データフィールドにはデータが未だ記入されていない。
本機能は、項目名「売上げ」のデータフィールド内の各主エリア内の記入データにもとづいて、項目名「売上げ」のデータフィールド内のの各派生エリア、または、合計フィールド内のデータを自動的に計算し、表上の該当欄に出力記入させようというものである。
先ず、用紙上に於いて、計算対象のデータの記入された 項目名「売上げ」のデータフィールドとその合計データを記入する合計フィールドのみについて、そのフィールド範囲を上記した場合と同様に、「フィールド指定」の定義要素記号を用いて指定する。
また、表下端の合計フィールドの左側に隣接する”計”文字と表右端の合計フィールドの上側に隣接する”計”文字とを、上記した場合と同じく、「解釈指定」の定義要素記号”○”によって括っておく。
項目名「売上げ」のデータフィールドが、派生エリアが定義された複合データフィールドであることを指示する方法として、(青)色の定義支援記入情報を用いて、表外に書かれた注釈文”[ ]内は対全体比”の中の部分文字列”対全体比”を「解釈指定」の定義要素”○”により囲んだ上、該当の項目名“売上げ”のデータフィールド内の任意の派生エリアと「結合線」により結ぶ。この表フォーマットに対する定義付けを、図53の(青色部分)に示す。
この「解釈指定」定義要素”○”による指定は、図52(イ)の場合と同様に、指定された部分文字列中のさらに部分文字列である”対…比”と”全体”が、応用用語辞書52中において、各々、「演算指定2」区分と「演算オペランド指定」区分として登録されている用語であることを確認した上でおこなう。
今、この「解釈指定」定義要素”○”による指定によって、図10の場合と同様にして、文字列” 対全体比”は、上記応用用語辞書52に登録された意味と日本語の構文規則によって解釈され、、この文字列と「結合線」により結ばれたデータフィールドの各派生エリア内には、項目名「売上げ」に属するデータの合計値データのデータによって該当主エリアのデータを除算したの比率を記入すべきことが、システムに対して確定的に定義されることになる。
以上のように定義付けをおこなった用紙を、スキャナ10を通じてシステムに入力し、所定の操作指示を与えると、システムは、前記した場合と同じ処理手順をおこない、まず、「フィールド指定」の定義要素記号を用いて指定したデータフィールドについて、該当するセルデータチェインをポイントした「フィールド候補定義データ」を作成する。
続く「項目定義データ」を作成するステップにおいて、「フィールド候補定義データ」が作成された各データフィールドについて、項目定義データを完成させる「項目名指定文字列」がサーチされない場合、「簡易表内計算」のモードであると見なして、以下の手順に分岐する。
先ず、「フィールド候補定義データ」が作成されたデータフィールドの中から、結合線により関係付けられている「解釈指定」の定義要素記号”○”によって括られた文字列について、「差異条件文字列の判定」手順をおこなう。「差異条件文字列の判定」手順において、「区分3型」の判定が得られれば、該当のデータフィールドは、上記した差異条件が定義された複合データフィールドであることが判定され、以下の処理をおこなう。
先ず、該当の「フィールド候補定義データ」について、その「データ種別」部に新たに特定IDデータをセットし、「演算対象フィールド定義データ」として完成させ、複合フィールドと判定されたデータフィールドについては、該当の「演算対象フィールド定義データ」内の「複合区分」データを、「複合フィールド」を表わす”1”にセットする。
次に、判定によって得られたデータをセットした「差異条件定義データ」を作成し、該当の「演算対象フィールド定義データ」の「差異条件定義データポインタ」からポイントする。 また、上記した場合と同様にして、「派生エリア定義データ」を作成し、該当の「演算対象フィールド定義データ」の「派生エリア定義データポインタ」からポイントする。さらに、該当の複合フィールドを構成する全てのセルのセルデータを、上記した場合と同様にして、複合セル用セルデータに置き換える。
次に、「解釈指定」の定義要素記号”○”によって括られた”計”文字との間で、結合線により関係付けられているか、または、上記した「特定隣接位置」にあるデータフィールドを識別し、上記した場合と同様にして「演算結果欄定義データ」を作成する。
続いて、合計フィールドを構成する全ての合計欄セルについて、その対応する演算対象フィールドが複合フィールドであることを判定し、複合フィールドであると判定された場合、その該当セルデータを複合セル用セルデータに置き換える。
最後に、「演算対象フィールド定義データ」と「演算結果欄定義データ」が定義されたデータフィールド内の各セル内に記入されているデータ文字列を識別した上、該当する数値データに変換し、該当セルデータ内の「セル内データ格納部」にセットする。本例のように、それが複合フィールドである場合、その中の各主エリア内に記入されているデータ文字列を識別した上、該当する数値データに変換し、該当セルデータ内の「主エリア記入情報部」側「セル内データ格納部」にセットする。
以上の処理により、「定義解釈」ボタンの指示を受けておこなわれる全ての処理を終える。続いて、ディスプレイ画面12aの常時表示の「モード」ボタンがクリック指示されると表示される「モード一覧メニュー」の中から、「計算実行」ボタンを指示すると、前記した「データ出力全体処理」の中、ステップF2以降の処理がおこなわれる。
先ず、「表内演算処理」(ステップF2)として、該当する各複合セルデータ内の「主エリア記入情報部」側「セル内データ格納部」に格納されているデータを読み出して加算し、その結果を合計欄セルのセルデータ内の「主エリア記入情報部」側「セル内データ格納部」に格納する。
続いて、「複合セル内演算処理」(ステップF3)において、前記の図52(ロ)の場合と同じく、「特定指定値」として、該当の項目名「売上げ」の項目定義データフィールドに所属する全セル内のデータの合計値を求める。(ステップN5)
続いて、各複合セルについて、主セルのデータと上記合計値との間で指定された演算である除算をおこない(ステップN6)、演算結果データを該当セルデータの「派生エリア側データ格納部」に格納する。(ステップN4) 最後に、以上のように生成されたデータについて、前記の場合と同様に「文字列データ化処理」がおこなわれる。(ステップF4)
なお、図49に示す表フォーマット上の“計”文字の代わりに、“平均”、“分散”等の演算を指示する用語文字にを入れ替え、同じ定義付け操作をおこなうと、前記した記述から明らかなように、図53の表フォーマット上の合計フィールドに相当するフィールド部分について、該当の演算種類の演算結果を記入するフィールドの「演算結果欄定義データ」が作成される。画面20a上の「計算実行」指示により、その構成各セルには、演算対象フィールド中の該当データについておこなわれた該当演算種類の演算結果が記入される。
なお、本発明は、上記した本発明の機能を実現するためのプログラムまたはソフトウェアを用いる。かかるソフトウェアは、任意の媒体を介して、たとえば蓄積媒体あるいはオンライン等により本発明のシステムにインストールされ得るものである。したがって、本発明を実施するためのソフトウェアを格納した蓄積媒体を業として譲渡する行為や、該ソフトウェアをオンラインでシステムにインストロールする行為等は本発明の実施の一形態である。
本発明の一実施例による情報処理装置のハードウェア上のシステム構成例を示すブロック図である。 実施例のシステムにおける主なモードの一覧を示す図である。 実施例のシステムにおける「主モードー覧メニュー画面」を示す図である。 実施例のシステムにおける「環境設定モード画面」を示す図である。 実施例のシステムにおける「定義要素/記入情報対照表」を示す図である。 実施例のシステムにおける「定義要素識別データ」のデータフォーマット例を示す図である。 実施例のシステムにおける「定義情報区別指示画面」を示す図である。 実施例のシステムにおける「定義情報区別データ」のデータフォーマット例を示す図である。 実施例のシステムにおける第1の帳表フォーマットを示す図である。 実施例のシステムにおける、図9の帳表フォーマットに定義支援記入情報を追加記入した一例を示す図である。 実施例のシステムにおける文書入力および文書要素データ生成部の構成を示すブロック図である。 実施例のシステムにおける「画像管理データ」のデータフォーマット例を示す図である。 実施例のシステムにおける「画像管理データ」の対象となる入力画像の構成を示す図である。 実施例のシステムにおける「文字データ」のデータフォーマット例を示す図である。 実施例のシステムにおける「文字列データ」のデータフォーマット例を示す図である。 実施例のシステムにおける線分に対応する「図形要素データ」のデータフォーマット例を示す図である。 実施例のシステムにおける長円に対応する「図形要素データ」のデータフォーマット例を示す図である。 実施例のシステムにおける矩形などに対応する「図形要素データ」のデータフォーマット例を示す図である。 実施例のシステムにおける「セルデータ」のデータフォーマット例を示す図である。 実施例のシステムにおける定義情報認識およぴフオーマット設定部および定義実行処理部の構成を示すブロック図である。 実施例のシステムにおける「定義要素データ」のデータフォーマット例を示す図である。 実施例のシステムにおける定義データ作成の全体手順の一例を示す図である。 実施例のシステムにおける「項目定義データ」のデータフォーマット例を示す図である。 実施例のシステムにおける「年度書式定義データ」のデータフォーマットを示す図である。 実施例のシステムにおける「演算結果欄定義データ」のデータフォーマットを示す図である。 実施例のシステムにおける応用用語辞書に収載されている用語の例を示す図である。 実施例のシステムにおける「応用用語定義データ」のデータフォーマット例を示す図である。 実施例のシステムにおける複合フィールド定義処理のフローチャートを示す図である。 実施例のシステムにおける「差異条件の形式区分」を示す図である。 実施例のシステムにおける「差異条件判定」のフローチャートを示す図である。 実施例のシステムにおける「差異条件判定」のフローチャートを示す図である。 実施例のシステムにおける「差異条件判定」のフローチャートを示す図である。 実施例のシステムにおける「差異条件定義データ」のデータフォーマット例を示す図である。 実施例のシステムにおける派生エリアのセル内は位置方向を示す図である。 実施例のシステムにおける派生エリアの記入範囲を示す図である。 実施例のシステムにおける「派生エリア定義データ」のデータフォーマット例を示す図である。 実施例のシステムにおける「複合セル用セルデータ」のデータフォーマット例を示す図である。 実施例のシステムにおける画面上からの指示による定義付けの画面を示す図である。 実施例のシステムにおける「項目名指定メニュー」の1例を示す図である。 実施例のシステムにおける出力元のファイルの構成例を示す図である。 実施例のシステムにおいてデータ出力モード画面の1例を示す図である。 実施例のシステムにおける「データ出力全体処理」のフローチャートを示す図である。 実施例のシステムにおける「レコードセル列」取出しのイメージを示す図である。 実施例のシステムにおける「データ出力処理」のフローチャートを示す図である。 実施例のシステムにおける「データ出力処理1」のフローチャートを示す図である。 実施例のシステムにおける「集計管理テーブル」のイメージを示す図である。 実施例のシステムにおける「主レコード(副レコード)データ出力処理」のフローチャートを示す図である。 実施例のシステムにおける「副レコード向けデータ変更処理」のフローチャートを示す図である。 実施例のシステムにおける登録語「前年」にもとづく「データ変更処理」のフローチャートを示す図である。 実施例のシステムにおける「複合セル内演算処理」のフローチャートを示す図である。 実施例のシステムにおける図9の帳表フォーマットへのデータ出力例を示す図である。 実施例のシステムにおける他の帳表フォーマットに定義支援記入情報を追加記入した一例を示す図である。 実施例のシステムにおける図9の帳表フォーマットに簡易計算機能を定義する定義支援記入情報を追加記入した一例を示す図である。
符号の説明
10 カラーイメージスキャナ
12 キーボード
14 マウス
15 ディジタイザ
16 内部メモリ
18 外部メモリ
20 表示装置
24 CPU
27 通信装置
30 文書画像入力部
32 文書画像記憶部
34 文字・図形要素認識部
36 文字/図形パターン辞書
37 文字・図形要素入力部
38 文書要素データ記憶部
40 文書画像表示出力部
42 定義要素データ生成部
44 定義要素データ記憶部
46 定義データ生成部
48 定義要素識別データ記憶部
50 定義情報区別データ記憶部
52 応用用語辞書
54 帳表定義データ記憶部
90 データ項目名
92 フィールド
94 定義要素指定副画面
95 定義解釈ボタン98 項目名記入欄
100 差異条件指定欄
104 フィールド属性指示欄
110 派生エリア項目名記入欄
112 派生エリアデータ名記入欄
113 派生エリア登録語記入欄
114 派生エリアフィールド属性指示欄
115 演算記入欄
120 終了ボタン













Claims (12)

  1. 構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
    表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
    1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と特定の区分情報とを対応付けた形で登録した辞書と、
    表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
    表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
    表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
    互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
    を備えた情報処理装置にあって、

    (1)1つのデータフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルを表わすセルデータと、該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

    (2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、上記の特定の区分情報を付して上記辞書に登録されている用語を、差異条件文字列と上記の特定の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合によって検出した上、
    第2の項目名に属するデータに対する変更方法を指示する情報であって、検出した上記辞書登録用語、ならびに、検出した上記辞書登録用語と上記辞書において対応付けて登録されている項目名とを、各々、「変更方法情報」、「変更項目名情報」として収めた差異条件定義データを作成するステップと、

    (3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
    第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
    各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

    (4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
    該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

    (5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
    識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
    対応付けたた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側主レコードを得るステップと、

    (6) 表側主レコードを構成するデータの中から、差異条件データにおいて「変更項目名情報」として登録されている第2の項目名に対応するデータを選択し、選択したデータを差異条件データ内において「変更方法情報」として登録されている上記辞書登録用語に定義されている方法に基づいて変更することによって、表側副レコードを作成するステップと、

    (7) データファイルからレコードを順次取り出し、
    表側主レコードを構成する各データに対応付けた各項目名について、
    データファイルから出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

    (8)データファイルからレコードを順次取り出し、
    表側副レコードを構成する各データに対応付けた各項目名について、上記データファイル出力レコード内の対応するデータと表側副レコード内の対応するデータとの間で、コード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第2の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第2の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコード内の第1の項目名に対応するデータ、ならびに、上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、データファイル出力レコード内の第1の項目名に対応するデータを上記第2の単位記入域に出力するステップと、
    からなる情報処理装置における方法。
  2. 1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と上記の特定の区分である第1の区分情報とを対応付けた形で登録し、2つのデータ間の特定の演算を指示する特定用語について、該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書を備え、

    (1)識別した差異条件文字列から、第2の区分情報が対応付けられた上記辞書登録用語を、差異条件文字列の文字列データと第2の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合に基づき、定めた方法によって検出するステップと、

    (2)データファイルから上記第1の単位データ域に出力したデータとデータファイルから上記第2の単位データ域に出力したデータとの間で、検出した第2の区分情報を付した用語に定義されている方法による演算をおこなった上、
    演算によって得られたデータと上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、上記によって得られたデータを第2の単位記入域上に出力するステップとを、
    おこなう請求項1に記載の方法。
  3. 構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
    表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
    1つの項目名に属する表上の記入データ全体に対して第1の演算を指示する特定用語について該当のコード列情報と第1の区分情報とを対応付けた形で登録し、2つのデータの間の第2の演算を指示する特定用語について該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書と、
    表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
    表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
    表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
    互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
    を備えた情報処理装置にあって、

    (1)データフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルのセルデータと該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

    (2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、
    上記辞書において第1の区分情報を付して登録した用語と第2の区分情報を付して登録した用語とを、各々、差異条件文字列の文字列データのコード列情報と上記辞書登録用語のコード列情報と区分情報に基き、定めた方法に従って検出した上、
    検出した第1の区分情報を付した辞書登録用語に定義された方法を表わす「演算方法情報」と第2の区分情報を付した辞書登録用語に定義された方法を表わす「全体演算情報」とを収めた差異条件定義データを作成するステップと、

    (3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
    第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
    各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

    (4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
    該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

    (5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
    識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
    対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側レコードを得るステップと、

    (6) データファイルからレコードを順次取り出し、
    表側レコードを構成する各データに対応付けた各項目名について、
    データファイルかた出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

    (7)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、上記(3)、(4)、(5)、(6)の各ステップをおこない、各セル内の第1の単位記入域に出力したデータに対して差異条件定義データの「全体演算情報」に定められた方法に従った第1の演算をおこなうステップと、

    (8)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、該当セル内の第1の単位記入域に出力したデータと第1の演算によって得られたデータとの間で差異条件定義データの「演算方法情報」に定められた方法に基く第2の演算をおこない、
    第2の演算によって得られたデータを表わすコード列情報と識別した第2の単位記入域内の定められたデータ記入位置を表わす位置情報とを持つ文字列データを作成することによって、
    第2の演算によって得られたデータを該当のセル内の第2の単位記入域に出力するステップと、
    からなる情報処理装置における方法。
  4. 構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へデータ出力をおこなう情報処理装置であって、

    表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
    1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と特定の区分情報とを対応付けた形で登録した辞書と、
    表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
    表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
    表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
    互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、

    1つのデータフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルを表わすセルデータと、該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成する手段と、

    第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、上記の特定の区分情報を付して上記辞書に登録されている用語を、差異条件文字列と上記の特定の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合によって検出した上、
    第2の項目名に属するデータに対する変更方法を指示する情報であって、検出した上記辞書登録用語、ならびに、検出した上記辞書登録用語と上記辞書において対応付けて登録されている項目名とを、各々、「変更方法情報」、「変更項目名情報」として収めた差異条件定義データを作成する手段と、

    第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
    第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
    各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別する手段と、

    識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
    該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求める手段と、

    識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
    識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
    対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側主レコードを得る手段と、

    表側主レコードを構成するデータの中から、差異条件データにおいて「変更項目名情報」として登録されている第2の項目名に対応するデータを選択し、選択したデータを差異条件データ内において「変更方法情報」として登録されている上記辞書登録用語に定義されている方法に基づいて変更することによって、表側副レコードを作成する手段と、

    データファイルからレコードを順次取り出し、
    表側主レコードを構成する各データに対応付けた各項目名について、
    データファイルかた出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力する手段と、

    データファイルからレコードを順次取り出し、
    表側副レコードを構成する各データに対応付けた各項目名について、上記データファイル出力レコード内の対応するデータと表側副レコード内の対応するデータとの間で、コード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第2の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第2の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコード内の第1の項目名に対応するデータ、ならびに、上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、データファイル出力レコード内の第1の項目名に対応するデータを上記第2の単位記入域に出力する手段と、
    からなる情報処理装置。
  5. 1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と上記の特定の区分である第1の区分情報とを対応付けた形で登録し、2つのデータ間の特定の演算を指示する特定用語について、該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書と、

    識別した差異条件文字列から、第2の区分情報が対応付けられた上記辞書登録用語を、差異条件文字列の文字列データと第2の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合に基づき、定めた方法によって検出する手段と、

    データファイルから上記第1の単位データ域に出力したデータとデータファイルから上記第2の単位データ域に出力したデータとの間で、検出した第2の区分情報を付した用語に定義されている方法による演算をおこなった上、
    演算によって得られたデータと上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、上記によって得られたデータを第2の単位記入域上に出力する手段とを、
    備えた請求項4に記載の情報処理装置。
  6. 構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力をおこなう情報処理装置であって、

    表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
    1つの項目名に属する表上の記入データ全体に対して第1の演算を指示する特定用語について該当のコード列情報と第1の区分情報とを対応付けた形で登録し、2つのデータの間の第2の演算を指示する特定用語について該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書と、
    表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
    表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
    表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
    互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、

    データフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルのセルデータと該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成する手段と、

    第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、
    上記辞書において第1の区分情報を付して登録した用語と第2の区分情報を付して登録した用語とを、各々、差異条件文字列の文字列データのコード列情報と上記辞書登録用語のコード列情報と区分情報に基き、定めた方法に従って検出した上、
    検出した第1の区分情報を付した辞書登録用語に定義された方法を表わす「演算方法情報」と第2の区分情報を付した辞書登録用語に定義された方法を表わす「全体演算情報」とを収めた差異条件定義データを作成する手段と、

    第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
    第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
    各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別する手段と、

    識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
    該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求める手段と、

    識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
    識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
    対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側レコードを得る手段と、

    データファイルからレコードを順次取り出し、
    表側レコードを構成する各データに対応付けた各項目名について、
    データファイルかた出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力する手段と、

    表上の第1の項目名に対応するデータフィールドを構成する各セルについて、上記(3)、(4)、(5)、(6)の各手段による処理をおこない、各セル内の第1の単位記入域に出力したデータに対して差異条件定義データの「全体演算情報」に定められた方法に従った第1の演算をおこなう手段と、

    表上の第1の項目名に対応するデータフィールドを構成する各セルについて、該当セル内の第1の単位記入域に出力したデータと第1の演算によって得られたデータとの間で差異条件定義データの「演算方法情報」に定められた方法に基く第2の演算をおこない、
    第2の演算によって得られたデータを表わすコード列情報と識別した第2の単位記入域内の定められたデータ記入位置を表わす位置情報とを持つ文字列データを作成することによって、
    第2の演算によって得られたデータを該当のセル内の第2の単位記入域に出力する手段と、
    からなる情報処理装置。
  7. 構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
    表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
    1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と特定の区分情報とを対応付けた形で登録した辞書と、
    表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
    表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
    表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
    互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
    を備えた情報処理装置にあって、

    (1)1つのデータフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルを表わすセルデータと、該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

    (2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、上記の特定の区分情報を付して上記辞書に登録されている用語を、差異条件文字列と上記の特定の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合によって検出した上、
    第2の項目名に属するデータに対する変更方法を指示する情報であって、検出した上記辞書登録用語、ならびに、検出した上記辞書登録用語と上記辞書において対応付けて登録されている項目名とを、各々、「変更方法情報」、「変更項目名情報」として収めた差異条件定義データを作成するステップと、

    (3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
    第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
    各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

    (4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
    該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

    (5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
    識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
    対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側主レコードを得るステップと、

    (6) 表側主レコードを構成するデータの中から、差異条件データにおいて「変更項目名情報」として登録されている第2の項目名に対応するデータを選択し、選択したデータを差異条件データ内において「変更方法情報」として登録されている上記辞書登録用語に定義されている方法に基づいて変更することによって、表側副レコードを作成するステップと、

    (7) データファイルからレコードを順次取り出し、
    表側主レコードを構成する各データに対応付けた各項目名について、
    データファイルから出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

    (8)データファイルからレコードを順次取り出し、
    表側副レコードを構成する各データに対応付けた各項目名について、上記データファイル出力レコード内の対応するデータと表側副レコード内の対応するデータとの間で、コード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第2の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第2の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコード内の第1の項目名に対応するデータ、ならびに、上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、データファイル出力レコード内の第1の項目名に対応するデータを上記第2の単位記入域に出力するステップと、
    からなる情報処理装置における方法をコンピュータによって実現させるための制御プログラム。
  8. 1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と上記の特定の区分である第1の区分情報とを対応付けた形で登録し、2つのデータ間の特定の演算を指示する特定用語について、該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書を備え、

    (1)識別した差異条件文字列から、第2の区分情報が対応付けられた上記辞書登録用語を、差異条件文字列の文字列データと第2の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合に基づき、定めた方法によって検出するステップと、

    (2)データファイルから上記第1の単位データ域に出力したデータとデータファイルから上記第2の単位データ域に出力したデータとの間で、検出した第2の区分情報を付した用語に定義されている方法による演算をおこなった上、
    演算によって得られたデータと上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、上記によって得られたデータを第2の単位記入域上に出力するステップとを、
    をおこなう請求項7に記載の方法をコンピュータによって実現させるための制御プログラム。
  9. 構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
    表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
    1つの項目名に属する表上の記入データ全体に対して第1の演算を指示する特定用語について該当のコード列情報と第1の区分情報とを対応付けた形で登録し、2つのデータの間の第2の演算を指示する特定用語について該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書と、
    表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
    表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
    表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
    互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
    を備えた情報処理装置にあって、

    (1)データフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルのセルデータと該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

    (2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、
    上記辞書において第1の区分情報を付して登録した用語と第2の区分情報を付して登録した用語とを、各々、差異条件文字列の文字列データのコード列情報と上記辞書登録用語のコード列情報と区分情報に基き、定めた方法に従って検出した上、
    検出した第1の区分情報を付した辞書登録用語に定義された方法を表わす「演算方法情報」と第2の区分情報を付した辞書登録用語に定義された方法を表わす「全体演算情報」とを収めた差異条件定義データを作成するステップと、

    (3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
    第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
    各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

    (4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
    該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

    (5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
    識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
    対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側レコードを得るステップと、

    (6) データファイルからレコードを順次取り出し、
    表側レコードを構成する各データに対応付けた各項目名について、
    データファイルかた出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

    (7)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、上記(3)、(4)、(5)、(6)の各ステップをおこない、各セル内の第1の単位記入域に出力したデータに対して差異条件定義データの「全体演算情報」に定められた方法に従った第1の演算をおこなうステップと、

    (8)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、該当セル内の第1の単位記入域に出力したデータと第1の演算によって得られたデータとの間で差異条件定義データの「演算方法情報」に定められた方法に基く第2の演算をおこない、
    第2の演算によって得られたデータを表わすコード列情報と識別した第2の単位記入域内の定められたデータ記入位置を表わす位置情報とを持つ文字列データを作成することによって、
    第2の演算によって得られたデータを該当のセル内の第2の単位記入域に出力するステップと、
    からなる情報処理装置における方法をコンピュータによって実現させるための制御プログラム。
  10. 構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
    表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
    1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と特定の区分情報とを対応付けた形で登録した辞書と、
    表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
    表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
    表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
    互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
    を備えた情報処理装置にあって、

    (1)1つのデータフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルを表わすセルデータと、該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

    (2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、上記の特定の区分情報を付して上記辞書に登録されている用語を、差異条件文字列と上記の特定の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合によって検出した上、
    第2の項目名に属するデータに対する変更方法を指示する情報であって、検出した上記辞書登録用語、ならびに、検出した上記辞書登録用語と上記辞書において対応付けて登録されている項目名とを、各々、「変更方法情報」、「変更項目名情報」として収めた差異条件定義データを作成するステップと、

    (3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
    第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
    各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

    (4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
    該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

    (5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
    識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
    対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側主レコードを得るステップと、

    (6) 表側主レコードを構成するデータの中から、差異条件データにおいて「変更項目名情報」として登録されている第2の項目名に対応するデータを選択し、選択したデータを差異条件データ内において「変更方法情報」として登録されている上記辞書登録用語に定義されている方法に基づいて変更することによって、表側副レコードを作成するステップと、

    (7) データファイルからレコードを順次取り出し、
    表側主レコードを構成する各データに対応付けた各項目名について、
    データファイルから出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

    (8)データファイルからレコードを順次取り出し、
    表側副レコードを構成する各データに対応付けた各項目名について、上記データファイル出力レコード内の対応するデータと表側副レコード内の対応するデータとの間で、コード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第2の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第2の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコード内の第1の項目名に対応するデータ、ならびに、上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、データファイル出力レコード内の第1の項目名に対応するデータを上記第2の単位記入域に出力するステップと、
    からなる情報処理装置における方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体。
  11. 1つの項目名に属するデータに対して特定の変化を与えることを示す特定用語について、該当用語のコード列情報と該当する項目名のコード列情報と上記の特定の区分である第1の区分情報とを対応付けた形で登録し、2つのデータ間の特定の演算を指示する特定用語について、該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書を備え、

    (1)識別した差異条件文字列から、第2の区分情報が対応付けられた上記辞書登録用語を、差異条件文字列の文字列データと第2の区分情報を付した上記辞書の各登録用語との間のコード列情報の照合に基づき、定めた方法によって検出するステップと、

    (2)データファイルから上記第1の単位データ域に出力したデータとデータファイルから上記第2の単位データ域に出力したデータとの間で、検出した第2の区分情報を付した用語に定義されている方法による演算をおこなった上、
    演算によって得られたデータと上記識別した第2の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、上記によって得られたデータを第2の単位記入域上に出力するステップとを、
    をおこなう請求項10に記載の方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体。
  12. 構成する行と列が罫線によって区切られる表であって、1つのデータが記入される矩形域である単位記入域が、罫線によって囲まれる矩形域であるセル内に配置され、第1の項目名以外の項目名に属するデータが記入される1つの単位記入域には1つのセル全体が割り当てられる形態をとる表上へのデータ出力方法であって、
    表上に記入された1つの文字列、または、1つの記号である1つの記入情報についてコード列情報と位置情報を持つ文字列データと、1つの罫線について種別と位置情報を持つ罫線データと、1つのセルについてセル境界の位置情報を持つセルデータとを含む表データを作成し、表示する手段と、
    1つの項目名に属する表上の記入データ全体に対して第1の演算を指示する特定用語について該当のコード列情報と第1の区分情報とを対応付けた形で登録し、2つのデータの間の第2の演算を指示する特定用語について該当のコード列情報と第2の区分情報とを対応付けた形で登録した辞書と、
    表上において、1つの項目名に属するデータが記入されるセルの集合をデータフィールドとして指定するデータフィールド指定手段と、
    表上のデータフィールドに対して該当する項目名を表わす文字列を対応付ける項目名指定手段と、
    表上のデータフィールドに対して、データフィールド上へのデータ出力方法を表わす特定文字列である差異条件文字列を対応付ける差異条件文字列指定手段と、
    互いに異なる項目名が対応付けられたデータの組合せであるレコードを収めたデータファイルと、
    を備えた情報処理装置にあって、

    (1)データフィールドを構成するセルとして、データフィールド指示手段によって指定されたセルのセルデータと該当のデータフィールドに対して項目名指定手段によって指定された項目名を表わす文字列のコード列情報とを対応付ける項目定義データを作成するステップと、

    (2)第1の項目名が対応付けられたデータフィールドに対して、差異条件文字列指定手段によって差異条件文字列として指定された文字列から、
    上記辞書において第1の区分情報を付して登録した用語と第2の区分情報を付して登録した用語とを、各々、差異条件文字列の文字列データのコード列情報と上記辞書登録用語のコード列情報と区分情報に基き、定めた方法に従って検出した上、
    検出した第1の区分情報を付した辞書登録用語に定義された方法を表わす「演算方法情報」と第2の区分情報を付した辞書登録用語に定義された方法を表わす「全体演算情報」とを収めた差異条件定義データを作成するステップと、

    (3)第1の項目名以外の項目名が対応付けられた各データフィールドから取り出した1つのセルを組合せたセルの集合に対して、
    第1の項目名が対応付けられたデータフィールドに属するセルであって、上記セルの集合を構成する各セルが位置する行上、または、列上に位置するセルを加えることによって得られるセルの集合であるレコードセル列を、
    各項目名の項目定義データから引用されるセルデータの間の位置情報の照合に基づいて識別するステップと、

    (4)識別したレコードセル列を構成し、かつ、第1の項目名が対応付けられたデータフィールドに属する1つのセルに対して特定の位置関係をもって記入され、かつ、特定のコード列情報を持つ記入情報を、該当セルのセルデータと該当のコード列情報を持つ文字列データとの間の位置情報の照合に基づいて識別した上、
    該当セルの内部において第1の単位記入域と第2の単位記入域の対を、該当セルのセルデータと識別した記入情報の文字列データの位置情報とに基いて識別し、識別した各単位記入域の境界位置を求めるステップと、

    (5)識別したレコードセル列を構成するセルの中で、第1の項目名以外の全ての項目名に対応付けられた各データフィールドに属するセルに記入されているデータを表わす文字列を、全ての文字列データと該当の項目定義データと該当の項目定義データから引用されるセルデータとに基づいて識別し、
    識別した文字列が表わすデータである該当文字列データのコード列情報を、識別した文字列の記入セルが属するデータフィールドに対応付けられている項目名のコード列情報と対応付けた上、
    対応付けた項目名とデータのコード列情報の対を、第1の項目名以外の全ての項目名について組み合わせた表側レコードを得るステップと、

    (6) データファイルからレコードを順次取り出し、
    表側レコードを構成する各データに対応付けた各項目名について、
    データファイルかた出力したレコード内の対応するデータと表側主レコード内の対応するデータの間でコード列情報の照合をおこない、コード列情報がたがいに一致すれば、
    上記第1の単位記入域内のデータ記入位置を、同単位記入域について識別した境界位置情報と第1の単位記入域について予め定めたマージン情報とに基づいて求めた上、
    データファイル出力レコードにおいて第1の項目名に対応するデータ、ならびに、上記識別した第1の単位記域内のデータ記入位置とを、各々、コード列情報、ならびに、位置情報として持つ文字列データを作成することによって、該当のデータファイル出力レコード内の第1の項目名に対応するデータを第1の単位記入域に出力するステップと、

    (7)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、上記(3)、(4)、(5)、(6)の各ステップをおこない、各セル内の第1の単位記入域に出力したデータに対して差異条件定義データの「全体演算情報」に定められた方法に従った第1の演算をおこなうステップと、

    (8)表上の第1の項目名に対応するデータフィールドを構成する各セルについて、該当セル内の第1の単位記入域に出力したデータと第1の演算によって得られたデータとの間で差異条件定義データの「演算方法情報」に定められた方法に基く第2の演算をおこない、
    第2の演算によって得られたデータを表わすコード列情報と識別した第2の単位記入域内の定められたデータ記入位置を表わす位置情報とを持つ文字列データを作成することによって、
    第2の演算によって得られたデータを該当のセル内の第2の単位記入域に出力するステップと、
    からなる情報処理装置における方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体。
JP2004124342A 2004-04-20 2004-04-20 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置 Expired - Fee Related JP4734551B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004124342A JP4734551B2 (ja) 2004-04-20 2004-04-20 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置
PCT/JP2005/007558 WO2005103993A1 (ja) 2004-04-20 2005-04-20 表フォーマットデータ処理の方法、装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004124342A JP4734551B2 (ja) 2004-04-20 2004-04-20 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置

Publications (3)

Publication Number Publication Date
JP2005309676A JP2005309676A (ja) 2005-11-04
JP2005309676A5 JP2005309676A5 (ja) 2009-07-09
JP4734551B2 true JP4734551B2 (ja) 2011-07-27

Family

ID=35197191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004124342A Expired - Fee Related JP4734551B2 (ja) 2004-04-20 2004-04-20 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置

Country Status (2)

Country Link
JP (1) JP4734551B2 (ja)
WO (1) WO2005103993A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6793177B2 (en) 2002-11-04 2004-09-21 The Bonutti 2003 Trust-A Active drag and thrust modulation system and method
US8065267B2 (en) 2005-01-12 2011-11-22 Masatsugu Noda Information processing device, file data merging method, file naming method, and file data output method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10162086A (ja) * 1996-11-29 1998-06-19 Casio Comput Co Ltd 表処理装置
JP2001357342A (ja) * 2000-06-15 2001-12-26 Mantaro Yajima 情報処理方法および装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10162086A (ja) * 1996-11-29 1998-06-19 Casio Comput Co Ltd 表処理装置
JP2001357342A (ja) * 2000-06-15 2001-12-26 Mantaro Yajima 情報処理方法および装置

Also Published As

Publication number Publication date
JP2005309676A (ja) 2005-11-04
WO2005103993A1 (ja) 2005-11-03

Similar Documents

Publication Publication Date Title
JP4356847B2 (ja) フィールド定義情報生成方法、ならびび、フィールド定義情報生成装置
US7996761B2 (en) Table format data processing method and table format data processing
US6721451B1 (en) Apparatus and method for reading a document image
CN103329122B (zh) 使用多个表示的文档存储
CN101430758B (zh) 文档识别装置和方法
CN110738037B (zh) 用于自动生成电子表格的方法、装置、设备及存储介质
US8065267B2 (en) Information processing device, file data merging method, file naming method, and file data output method
US20090049375A1 (en) Selective processing of information from a digital copy of a document for data entry
JPH11282955A (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005011340A (ja) オブジェクト上の注釈をグループ化することによりオブジェクトを選択する方法、システム、プログラム、及び、コンピュータ可読記憶媒体
JP4734551B2 (ja) 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置
JP6536214B2 (ja) 辞書端末、情報表示制御方法及び情報表示制御プログラム
JP4736089B2 (ja) 情報処理装置ならびにファイルデータマージ方法およびファイル名称付与方法
JP2006119816A (ja) 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置
CN113111881A (zh) 信息处理装置及记录媒体
JP2004127059A (ja) 情報処理方法および装置
JP4405604B2 (ja) 情報処理装置及び定義方法
TW310399B (ja)
JP4462508B2 (ja) 情報処理装置並びに定義情報生成方法
JP2001357342A (ja) 情報処理方法および装置
JP2000163271A (ja) 情報処理方法および装置
JPH11316792A (ja) 情報処理装置及び帳表作成方法
JPH11184949A (ja) 帳票処理装置及び記憶媒体
CN115759020A (zh) 表格信息提取方法、表格模板配置方法和电子设备
JP3878174B2 (ja) レコード抽出方法、レコード抽出装置、及びレコード抽出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080128

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100223

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100423

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110329

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees