JPH11316792A - 情報処理装置及び帳表作成方法 - Google Patents

情報処理装置及び帳表作成方法

Info

Publication number
JPH11316792A
JPH11316792A JP4852699A JP4852699A JPH11316792A JP H11316792 A JPH11316792 A JP H11316792A JP 4852699 A JP4852699 A JP 4852699A JP 4852699 A JP4852699 A JP 4852699A JP H11316792 A JPH11316792 A JP H11316792A
Authority
JP
Japan
Prior art keywords
definition
data
information
estimated
entry information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4852699A
Other languages
English (en)
Inventor
Mantaro Yajima
万太郎 矢島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP4852699A priority Critical patent/JPH11316792A/ja
Publication of JPH11316792A publication Critical patent/JPH11316792A/ja
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 ユーザの負担を軽減し、より簡単な作業・操
作で所望の帳表を作成できるようにすること。 【解決手段】 文書要素データ記憶部38、定義要素デ
ータ生成部42、定義要素データ記憶部44、定義内容
構成則記憶部46、定義要素識別データ記憶部48、定
義情報区別データ記憶部50、応用用語辞書52、定義
データ生成部54および定義データ記憶部56によって
定義内容認識部が構成される。また、定義要素データ記
憶部38、定義情報区別データ記憶部50、応用用語辞
書52、データ辞書62、アプリケーション・ファイル
64、サーチデータ記憶部66、定義内容推定則記憶部
68、定義データ記憶部56、推定定義データ記憶部7
0および推定定義データ生成部60によって定義内容推
定部が構成される。最初に定義内容認識の処理が実行さ
れ、次いで定義内容推定の処理が実行され、最後に両処
理の結果が画面に表示される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置にお
いて電子化された帳表を作成する技術に関する。
【0002】
【従来の技術】最近の情報処理装置は、いわゆるオブジ
ェクト指向型の考え方をとって、ユーザの負担を軽減す
るアーキテクチャとソフトウェアを搭載しており、帳表
の作成は画面入力が主流となっている。
【0003】たとえば、キーボード操作ないしマウス操
作によって画面上に任意の表罫線および文字列を入力す
ると、各々の画面入力データが帳表の定義情報とみなさ
れ、それらの定義情報に基づいて帳表のフォーマットが
設定されるようにしたものが知られている。
【0004】また、やはりマウス操作等により、画面上
に表罫線を入力してその中の所望のフィールド(領域)
を指定すると、そのフィールドに関係した各種属性また
は定義事項をリストした副画面が現れ、そのリストの中
の所望の事項を1つ選択すると、その選択した定義事項
によって当該フィールド分の1つのフォーマットが定義
(設定)されるようにしたものもある。
【0005】しかしながら、上記のような従来の情報処
理装置は、ユーザにとって覚えなくてはならない操作手
順やマニュアル事項がまだ多いうえ、設定入力可能な文
書情報や定義情報が極めて少数かつ簡単なものに限定さ
れていた。また、上記した従来例では、画面入力された
情報は全て帳表の定義情報とみなされるため、フォーマ
ットに直接関係しない情報(たとえば注釈、支店名、電
話番号等)は帳表文書の一内容として入力できないとい
う不便や、副画面による逐一的な定義設定方式では手間
がかかるだけでなく帳表全体の設定内容を一目瞭然と把
握または確認するのが難しいという不便があった。
【0006】そこで、本発明者は、オブジェクト指向性
をさらに向上させ、簡単な操作により所望の帳表を作成
できるようにした情報処理装置および帳表作成方法を先
に開発しており、これを特願平7−317319(特開
平9−134349)として開示している。
【0007】この先願技術では、帳表の文書内容を表す
通常記入情報と定義内容を示す定義用記入情報とを装置
に入力し、装置側で該定義用記入情報によって規定され
る定義内容を認識するようにしている。かかる方式によ
れば、ユーザが日常使い慣れている記入情報を使用し、
簡単な操作で所望の帳表を作成することができる。
【0008】
【発明が解決しようとする課題】ところで、帳表ニーズ
の大半を占める非定型処理(オンデマンドに帳表フォー
マットを定め、データの出力と分析を行う処理)では、
任意の帳表フォーマットを迅速に作成することが要求さ
れる。ところが、この種の処理に用いられる帳表は複雑
多岐なものが多いうえ、帳表を構成するフィールドの数
も多く(100を超えるものもある)、1つ1つ定義情
報を記入するのはユーザにとって骨の折れる作業であ
る。
【0009】本発明は、上記の問題点に鑑みてなされた
もので、ユーザの負担を軽減し、より簡単な作業・操作
で所望の帳表を作成できるようにした情報処理装置およ
び帳表作成方法を提供することを目的とする。
【0010】本発明の別の目的は、電子化された帳表を
作成するに際し、入力された帳表文書の基本項目を基に
帳表に関する定義を自動的に推定するようにした情報処
理装置および帳表作成方法を提供することにある。
【0011】本発明の他の目的は、電子化された帳表を
作成するに際し、ユーザ側からの指示と装置側の推定と
を自由に組み合わせ、帳表定義を効率良く行えるように
した情報処理装置および帳表作成方法を提供することに
ある。
【0012】本発明の他の目的は、電子化された帳表を
作成するに際し、装置側の定義推定結果をユーザが容易
に修正できるようにした情報処理装置および帳表作成方
法を提供することにある。
【0013】
【課題を解決するための手段】上記の目的を達成するた
め、本発明のうち請求項1に記載の発明は、情報処理装
置における帳表作成方法であって、文書中に文字、記
号、図形または面属性の形態で記入された記入情報を介
して帳表のフォーマットを入力する工程と、入力した前
記記入情報に基づいて前記帳表内の定義内容を推定する
工程と、推定した前記定義内容を規定する推定定義デー
タを生成する工程と、推定した前記定義内容を所定の識
別情報を有する記入情報を介して表示出力する工程と、
確定指示された前記推定定義内容を確定された定義内容
とし、前記推定定義データを確定的な定義データに変更
する工程とを有する。
【0014】また、請求項2記載の発明は、情報処理装
置における帳表作成方法であって、文書中に文字、記
号、図形または面属性の形態で記入された記入情報を介
して帳表のフォーマットを入力する工程と、入力した前
記記入情報の中で第1の識別情報を有する第1の記入情
報に基づいて前記帳表内の1つまたは複数の定義内容を
認識する工程と、認識した前記定義内容を規定する確定
的な定義データを生成する工程と、入力した前記記入情
報の中で第2の識別情報を有する第2の記入情報に基づ
いて前記帳表内の1つまたは複数の定義内容を推定する
工程と、推定した前記定義内容を規定する推定定義デー
タを生成する工程と、推定した前記定義内容を第3の識
別情報を有する記入情報を介して表示出力する工程と、
確定指示された前記推定定義内容を確定された定義内容
とし、前記推定定義データを確定的な定義データに変更
する工程とを有する。
【0015】また、請求項3に記載の発明は、請求項1
または2に記載の帳表作成方法において、前記定義内容
推定工程が、入力した前記記入情報の中から予め登録さ
れている記入情報を識別する工程と、前記識別した記入
情報の記入態様が予め登録されている定義内容推定規則
の条件を満たすか否かを判定する工程と、前記判定条件
の成立した定義内容を前記識別した記入情報に関連させ
て定義する推定定義データを生成する工程とを有する。
【0016】また、請求項4に記載の発明は、請求項1
または2に記載の帳表作成方法において、前記定義内容
推定工程が優先順位の異なる複数の推定工程を含み、優
先順位の低い推定工程はそれよりも先に行われる優先順
位の高い推定工程で推定された定義内容に抵触しない範
囲で定義内容を推定することを特徴とする。
【0017】また、請求項5に記載の発明は、請求項2
に記載の帳表作成方法において、前記定義内容推定工程
が、それよりも先に行われる前記定義内容認識工程で認
識された定義内容に抵触しない範囲で定義内容を推定す
ることを特徴とする。
【0018】また、請求項6に記載の発明は、請求項1
または2に記載の帳表作成方法において、前記表示出力
工程が、予め登録されている定義内容構成則にしたがっ
て個々の前記推定定義データを1個または複数個の単位
定義情報に分解する工程と、予め登録されている定義要
素配置則にしたがって個々の前記単位定義情報に対応す
る記入情報を生成する工程とを含むことを特徴とする。
【0019】請求項7に記載の発明は、情報処理装置に
おいて、文書中に文字、記号、図形または面属性の形態
で記入された記入情報を介して帳表のフォーマットを入
力する記入情報入力手段と、前記記入情報入力手段によ
り入力された前記記入情報に基づいて前記帳表内の定義
内容を推定し、推定した前記定義内容を規定する推定定
義データを生成する定義内容推定手段と、前記定義内容
推定手段により推定された前記定義内容を所定の識別情
報を有する記入情報を介して表示出力する定義内容表示
出力手段と、所定の確定指示に応答して前記推定定義内
容を確定された定義内容とし、前記推定定義データを確
定的な定義データに変更する定義内容確定手段とを有す
る。
【0020】また、請求項8に記載の発明は、請求項7
に記載の情報処理装置において、前記定義内容推定手段
が、推定上の拠点になり得る記入情報として予め設定さ
れた用語、データ項目名および/またはデータ名をコー
ドの形で登録して保持する記憶手段を含むことを特徴と
する。
【0021】また、請求項9に記載の発明は、請求項7
に記載の情報処理装置において、前記定義内容推定手段
が、所定の記入情報に対して所定の定義内容を推定する
ための記入態様上の規則をアルゴリズムとして設定登録
しておく記憶手段を含むことを特徴とする。
【0022】また、請求項10に記載の発明は、請求項
7に記載の情報処理装置において、前記定義内容表示出
力手段が、個々の前記推定定義データを1個または複数
個の単位定義情報に分解するための定義内容構成則をア
ルゴリズムとして設定登録しておく記憶手段を含むこと
を特徴とする。
【0023】また、請求項11に記載の発明は、請求項
7に記載の情報処理装置において、前記定義内容表示出
力手段が、個々の前記単位定義情報に対応する記入情報
を生成するための定義要素配置則をアルゴリズムとして
設定登録しておく記憶手段を含むことを特徴とする。
【0024】また、請求項12に記載の発明は、情報処
理装置において、所定のコマンドの入力に応動し、その
コマンドで指示される定義内容を規定する定義データを
生成する手段と、予め登録されている定義内容構成則に
したがって個々の前記定義データを1個または複数個の
単位定義情報に分解する手段と、予め登録されている定
義要素配置則にしたがって個々の前記単位定義情報に対
応する記入情報を生成する手段とを有する。
【0025】
【発明の実施の形態】以下、添付図を参照して本発明の
実施例を説明する。
【0026】図1に、本発明の一実施例における情報処
理装置のハードウェア上のシステム構成を示す。このシ
ステムにおいて、カラーイメージ・スキャナ10、キー
ボード12、マウス14およびタブレット(ディジタイ
ザ)15が入力装置として、内部メモリ16および外部
メモリ18が記憶装置として、表示装置20および印字
装置22が出力装置として、それぞれ適当なインタフェ
ース回路(図示せず)を介してCPU24に接続されて
いる。また、CPU24は、通信装置(I/O)26を
介して外部の装置(図示せず)とも接続されている。
【0027】カラーイメージ・スキャナ10は、用紙上
に記載された文書中の文字、記号および図形をカラー画
像情報として読み取る。内部メモリ16および外部メモ
リ18には、CPU24の処理または制御動作を規定す
る各種プログラムのほか、各種電子辞書、キャラクタフ
ォント等が格納されている。
【0028】図2に、本実施例のシステムにおいて帳表
の作成に関する動作モードの一覧を示す。「メイン」、
「定義」、「環境設定」、「データ出力」等の主モード
が設定されている。このうち、「メイン」、「定義」お
よび「環境設定」の主モードはそれぞれ「推定」…、
「定義解釈」…、「定義区別設定」等のサブモードに分
岐している。
【0029】図3に、表示装置20のディスプレイ画面
20aに表示される「主モード一覧メニュー」を示す。
このメニュー画面では、画面の右下部に「メイン」、
「定義」、「環境設定」等の主モード選択ボタンが表示
される。
【0030】上記の「主モード一覧メニュー」で、「環
境設定」ボタンをクリックすると、環境設定モードが選
択される。この環境設定モードに切り替わると、ディス
プレイ画面20aに図4に示すような画面が映し出さ
れ、画面の右下部に「定義区別設定」、「定義情報設
定」等のサブモード選択ボタンが表示される。ここで、
「定義情報設定」ボタンをクリックすると、定義情報設
定モードに入り、図5および図6に示すような「定義要
素/記入情報対照表」が画面に表示される。
【0031】図5および図6において、本実施例では、
「共通」、「データ管理」、「書式定義」、「編集校正
定義」等の複数の定義系が用意され、各定義系の中に複
数の定義要素が設定されている。これらの定義系のう
ち、「データ管理」の各定義要素は帳表のデータ管理上
のフォーマットを設定するために用いられ、「書式定
義」、「編集校正定義」の各定義要素は帳表の書式上の
フォーマットを設定するために用いられる。「共通」の
各定義要素は、「データ管理」、「書式定義」、「編集
校正定義」の各フォーマットに共用される。
【0032】図5および図6に示すように、各定義要素
には、1種類または複数種類の所定の文字(文字列)、
記号または図形が対応づけられている。定義要素の中に
は、たとえば「書式定義」系の定義要素「丸め方」に対
応する“切上げ”のように、その記入情報だけで目的の
定義内容を表すものもあれば、たとえば「共通」系の
「項目名」に対応する“< >”のように、他の記入情
報を指定し、その指定した他の記入情報に定義内容を委
ねるものもある。また、「共通」系の定義要素「応用用
語辞書サーチ」に対応する“〇”のように、この記入情
報によって指定された領域内に記入されている文字、記
号等の中で所定のもの(たとえば、計算式の記号や単位
名等)については応用用語辞書を参照したうえで定義内
容を認識すべきことを指示するものもある。
【0033】上記のような定義要素と記入情報との対応
付けは、システムが最初から用意していてもよく、ある
いはユーザが画面入力で随時設定登録できるようにして
もよい。いずれにしても、たとえば図7に示すようなデ
ータフォーマットで、各定義要素毎に図5および図6の
対照表に相当する可変データ長の定義要素識別データが
設定される。各定義要素識別データは、後述する定義情
報認識部の定義要素識別データ記憶部48(図22)に
保持される。
【0034】なお、図7において、「定義系」のデータ
・フィールドには当該定義要素(たとえば「右づめ」)
の属する定義系(書式定義)のコードがセットされ、
「定義要素種別」のデータ・フィールドには当該定義要
素(右づめ)のコードがセットされ、「構成文字列/記
号列」の各データ・フィールドには当該定義要素(右づ
め)に対応する文字(文字列)または記号(「右」,
「右づめ」,「右寄せ」,「→」)のコードが所定の区
切り識別データを挟んでセットされ、末尾のフィールド
にはこのデータの終端を示す所定の終端識別データが付
けられる。
【0035】上記のように、本実施例では、帳表の各種
定義を行うための定義要素が、通常の文書内容を表す通
常記入情報としても利用可能な文字、記号または図形と
対応づけられている。ただし、後述するように、定義要
素として用いられるときは、当該記入情報に特別の修飾
または識別情報(たとえば色情報)を付し、文書内容を
表す通常記入情報とは区別するようにしている。つま
り、ユーザにあっては、普段使い慣れている記入情報
を、文書内容を表すための通常記入情報としてそのまま
使えるだけでなく、これに特別の修飾または識別情報を
付加することで定義内容を指示するための定義専用情報
としても使えるようになっている。
【0036】図4の「環境設定モード画面」において
「定義区別設定」のサブモード選択ボタンを選択する
と、ディスプレイ画面20aには図8に示すような「定
義情報区別指示画面」が現れる。
【0037】図8において、[定義系]の欄には「デー
タ管理」、「書式定義」、「編集校正定義」等の定義系
がリストされている。ユーザは、各定義系の記入情報に
用いる[色]、[線修飾]、[線太さ」、[手書き/印
刷]の修飾情報または識別情報を各位置に入力すればよ
い。図8の例の場合は、「データ管理」には(青)、
「書式定義」、「編集校正定義」にはそれぞれ(赤)を
[色]の欄に入力している。なお、上記のように「共
通」の各定義要素は「データ管理」、「書式定義」およ
び「編集校正定義」の各フォーマットに共用されるの
で、「共通」固有の修飾情報を設定する必要はない。
【0038】この定義情報区別指示の入力操作に応動し
てシステム内では、たとえば図9に示すようなデータフ
ォーマットで各定義系についての定義情報区別データが
設定される。この定義情報区別データは、後述する定義
情報認識部の定義情報区別データ記憶部50(図22)
に保持される。
【0039】図10に、主モードの1つである「メイ
ン」モードの画面を示す。この「メイン」モード画面で
は、画面の右下部に「キャンセル」、「推定」、「確
定」、「実行」等のサブモード選択ボタンが表示され、
画面下部中央にメッセージ用の副画面が表示される。各
サブモード選択ボタンをクリックすると、各ボタンで表
示されたサブモードに切り替わるようになっている。な
お、電源投入直後のディスプレイ画面20a上には装置
デフォルトでこの「メイン」モード画面が現れ、画面の
左下隅部に常時表示されている「モード」ボタンをクリ
ックすると、上記の「主モード一覧メニュー」画面に切
り替わるようになっている。
【0040】次に、本実施例のシステムにおいて帳表を
作成する機能について説明する。
【0041】図11に、たとえば売上計算システムの売
上集計表の基本項目が予め手書きで記入されている帳表
用紙を示す。この帳表用紙に記入されている文字、記
号、図形のいずれも、帳表の文書内容を示す通常記入情
報であり、同一色たとえば黒色で記されている。
【0042】この帳表用紙において、一覧表の最上段の
行に設けられた項目名記入欄には、左端からデータ項目
名「品名」、「売上数」、「単価」、「売上高」が各セ
ル(記入欄)内に1項目名ずつ記入され、右端のセルは
空欄となっている。各データ項目名に対応する垂直方向
のセル列またはデータ記入欄は、「品名」に2つ、他の
項目名「売上数」、「単価」、「売上高」には1つずつ
割り当てられている。いずれのデータ記入欄も空欄にな
っている。
【0043】表の上には、中央部に帳表名“売上集計
表”が記載されるとともに、右隅部に注釈として“支店
名 神田”、“1997年”が記載されている。また、
表の下には、注釈として“売上高=単価×売上数”が記
載されている。
【0044】この帳表用紙に対して、ユーザは、図5お
よび図6の「定義要素/記入情報対照表」に設定されて
いる各種定義系の定義要素に対応する記入情報(定義要
素記入情報)を用いて、所望の定義専用または支援情報
をカラーの筆記具により手書きで、たとえば図12のよ
うに追記入したとする。
【0045】ここで、定義専用(支援)情報とは、通常
記入情報から区別される修飾情報を有する記入情報であ
る。各定義情報は、1つまたは複数の定義専用情報のみ
から構成されるか、あるいは定義専用情報とそれに関連
する通常記入情報とから構成される。
【0046】図12に示すように、表内の(黒)の通常
記入情報である“品名”の下に位置する左右2列の各セ
ル列において、最上段のセルおよび最下段から2つ目の
セルに(青)で「範囲指定」の定義要素記入情報“[
]”をそれぞれ記入し、これらのセル列(データ記入
欄)をフィールドと定義している。
【0047】一方、表の左上に(青)で「項目」の定義
要素“< >”付きで正式の(システムに登録されて
いる)データ項目名「分類」および「品番」を記入し、
これらのデータ項目名文字列を(青)の「結合線」
“−”を介して上記2つのフィールドにそれぞれ結んで
いる。この1組の記入情報“[ ]−<分類>”は、
一体化してデータ管理上の1つの定義情報を構成し、
『この[ ]で指定された領域(フィールド)はデー
タ項目名<分類>のデータ記入欄であること』を定義し
たことになる。また、1組の記入情報“[ ]−<品
番>”は、やはり一体化してデータ管理上の1つの定義
情報を構成し、『この[ ]で指定された領域(フィ
ールド)はデータ項目名<品番>のデータ記入欄である
こと』を定義したことになる。
【0048】また、表の右上の空欄では、(黒)の通常
記入情報“1997年”の右隣に、(青)で複合的な定
義情報“[ ]−<月別>”を記入している。この定
義情報は、「範囲指定」の定義要素記入情報“[
]”と、「項目」の定義要素記入情報“< >”と、
データ項目名文字列“月別”と、「結合線」の定義要素
記入情報“−”とから構成されており、全体で『この
“[ ]”で指定した領域をデータ項目<月別>のデ
ータ記入欄とすること』を規定している。
【0049】上記のようなユーザによる定義専用情報の
記入は、システムの定義推定処理に先立つ事前のユーザ
指定であり、システムに効率的かつ正確な推定を行わせ
るためのガイダンス的な役割を担っている。
【0050】上記のように定義専用情報が追記入された
帳表文書(図12)は、カラー・イメージスキャナ10
より本システムに入力される。
【0051】図13に、本実施例のシステムにおける文
書入力および文書要素データ生成部の構成を示す。文書
画像入力部30は、カラー・イメージスキャナ10、キ
ーボード12およびマウス14等の入力装置と、入力ル
ーチンを実行するCPU24と、入力されたカラー画像
をいったん取り込む内部メモリ16または外部メモリ1
8とによって構成される。
【0052】文書画像記憶部32、文字/図形パターン
辞書36および文書要素データ記憶部38は、内部メモ
リ16または外部メモリ18の記憶領域を用いている。
文字・図形要素認識部34は、文字・図形認識処理プロ
グラムを実行するCPU24によって構成される。文書
画像出力部40は、主として、文書出力プログラムを実
行するCPU24と、このCPU24の制御の下で文書
画像の表示、印字、伝送出力を行う表示装置20、印字
装置22あるいは通信装置26とによって構成される。
【0053】本例の帳表文書(図12)についてイメー
ジスキャナ10による読取動作が行われると、その文書
内容(全記入内容)を表すカラー画像信号が入力部30
の画像記憶部に取り込まれる。入力部30に取り込まれ
たカラー画像信号は、画像信号の形態で(黒),
(青),(赤)の各色画像信号に分解され、文書画像記
憶部32内では(黒)の画像データ,(青)の画像デー
タ,(赤)の画像データとしてそれぞれ黒画像記憶部3
2a,青画像記憶部32b,赤画像記憶部32cに蓄積
される。
【0054】次に、文字・図形要素認識部34は、文書
画像記憶部32に蓄積された画素データについて、各色
(黒,青,赤)毎に文書中の個々の文字、図形要素を認
識する。ここで、図形要素とは、線分、矩形、円形のよ
うにその形状が容易に画像認識され得るパターン化され
た簡単な図形群である。
【0055】本実施例における画像認識に際しては、た
とえば図14に示すようなデータフォーマットで予め設
定されている「画像管理データ」が参照される。この
「画像管理データ」では、図15に示すように入力画像
はマトリクス状に配置された多数の画素PXによって構
成されているものとして、画素PXの個数、寸法、ピッ
チ等を表すデータをセットしている。
【0056】文字・図形要素認識部34における文字・
図形の認識は、基本的には個々の文字、図形要素を構成
する線素を認識することによって行われる。線素の識別
については従来公知の種々の方法を用いてよい。たとえ
ば、先ず特定の色を有するドットの集合を見い出し、次
に隣接領域または周囲をサーチしてそのドットの集合が
延長する方向を判定する。この処理を繰り返して、ドッ
トの集合の描く軌跡をそれが消滅(終端)するまで追跡
していく。その追跡の途中で、軌跡の向きが急激に変化
する箇所があれば、その箇所を屈曲点または尖点として
識別する。
【0057】このようにして抽出された線素は、その形
状、大きさにより予め設定された線素パターンの1つと
して識別され得る。本実施例では、文字/図形パターン
辞書36に、個々の文字、図形毎にそれを構成する線素
の種別と、構成線素間の有意な位置関係とが所定の電子
辞書方式で予め記憶(設定登録)されている。文字・図
形要素認識部34は、上記のようにして抽出した線素を
隣接するもの同士で互いに組み合わせてこれを文字/図
形パターン辞書36と照合する処理を繰り返すことで、
個々の文字、記号、図形を認識する。
【0058】また、帳表のような表を構成する罫線につ
いては、次のようにして認識処理を行う。すなわち、上
記したような線素の認識において直線とみなして抽出し
た線素が他の線素よりも桁違いに長く、かつその直線方
向が水平線(X軸)または垂直線(Y軸)に対して或る
角度内の傾きに収まる場合は、この直線を水平罫線また
は垂直罫線とみなし、水平線または垂直線と平行になる
ようにその位置情報を補正する。また、抽出された2つ
の罫線の端点同士の距離あるいは一方の罫線の端点と他
方の罫線との距離が或る値以内にあるときは、両罫線の
端点同士が互いに重なり合っている、あるいは片方の罫
線の端点が他方の罫線上に重なっているとみなし、両罫
線がそのように重なるようにそれぞれの位置情報を補正
する。
【0059】また、帳表のように罫線によって表の個々
のデータ記入枠(欄)つまりセルが形成される場合は、
全ての表罫線をサーチする公知の方法を用いて各セルを
識別することができる。
【0060】文字・図形要素認識部34は、画像入力し
た帳表文書の各色(黒,青,赤)画像について上記のよ
うな文字・図形認識処理を行うことにより、各文字、各
文字列、各図形要素、各記号、各セルにつきたとえば図
16〜図21に示すようなデータフォーマットで文書要
素データを生成する。
【0061】図16は、1個の文字に対応する文書要素
データ(文字データ)のデータフォーマット例である。
図示のように、当該文字のコード、書体、色、線の太
さ、線修飾(実線、点線、鎖線等)、手書き/印刷(手
書き文字なのか印刷文字なのかの区別)、記入位置およ
び大きさ(文字サイズ)をそれぞれ表すデータが順次所
定のデータ・フィールドにセットされ、末尾にこの文書
要素データの終端を示す終端識別データが付けられる。
【0062】図17は、1つの文字列に対応する文書要
素データ(文字列データ)のデータフォーマット例であ
る。図示のように、当該文字列のピッチ、大きさ(文字
サイズ)等のパラメータを表す「文字列書式修飾デー
タ」がヘッダとなり、その後に続けて当該部分文字列を
構成する文字のコードが順番に並べられる。文字列の場
合、たとえば「2000KM」のように文字サイズやピッチ
等が異なる複数の部分文字列“2000”,“KM”が結合
して1つの文字列が構成されているものもある。このよ
うな複合型の文字列に対応する文字列データは、それぞ
れの部分文字列に対応する部分文字列データが連結され
たデータ構造をとる。
【0063】図18,図19および図20は、それぞれ
1つの図形要素または記号に対応する文書要素データ
(図形要素データ)のデータフォーマット例である。図
18に示すように、線分については始端位置および終端
位置のデータが組み込まれる。図19に示すように、長
円については中心位置(X,Y方向)と径サイズ(X,
Y方向)のデータが組み込まれる。図20に示すよう
に、矩形や“<”等については始端および終端位置に加
えて屈曲点または尖点(線分の方向が急峻に変化する
点)の位置を示すデータが組み込まれる。
【0064】図21は、1つのセル(データ記入枠)に
対応する文書要素データ(セルデータ)のデータフォー
マット例である。図示のように、当該セルの位置を示す
データとともに、同一の領域(フィールド)内で次の位
置(たとえば下隣)にあるセルとの繋がりをもたせるた
めのポインタがセットされる。文書要素データ記憶部3
8に蓄積される文書要素データには各々固有のアドレス
が割り付けられているので、アドレス情報をポインタに
充てることで1つの文書要素データから他の任意の文書
要素データを参照または検索することができる。もっと
も、この段階では、まだポインタはセットされず、後に
行われる定義内容認識/推定処理の中でセットされる。
【0065】上記のようにして、画像入力された帳表文
書中の全ての記入情報が個々の文字(文字列)、記号、
図形に分解されて文字・図形要素認識部34により文書
要素データに変換される。これらの文書要素データは文
書要素データ記憶部38に蓄積される。なお、文字・図
形認識処理を受けて文書要素データに変換された記入情
報に対応する画像情報は、文書画像記憶部32から抹消
されてよい。
【0066】文書画像表示出力部40は、表示装置20
のディスプレイ画面20aに、文書画像記憶部32に保
持されている画像信号に基づいて入力帳表文書の画像を
表示出力できるだけでなく、文書要素データ記憶部38
に格納されている文書要素データからもそれを画像信号
に変換したうえで入力帳表文書の画像を表示出力するこ
とができるように構成されている。
【0067】上記の文書入力および文書要素データの生
成処理が終了すると、その旨を伝える所定のメッセージ
がたとえばディスプレイ画面20aを通じてシステムか
らユーザに与えられる。
【0068】次に、ユーザは、「メインモード」画面
(図10)において「推定」のサブモードボタンを選択
指示してよい。この指示に応動してシステム内では、後
述する定義内容認識/推定部により帳表(図12)内の
定義内容について認識および推定処理が行われる。
【0069】図22に、本実施例のシステムにおける定
義内容認識/推定部の構成を示す。
【0070】定義内容認識部は、文書要素データ記憶部
38、定義要素データ生成部42、定義要素データ記憶
部44、定義内容構成則記憶部46、定義要素識別デー
タ記憶部48、定義情報区別データ記憶部50、応用用
語辞書52、定義データ生成部54および定義データ記
憶部56を含んでいる。
【0071】定義内容推定部は、定義要素データ記憶部
38、定義情報区別データ記憶部50、応用用語辞書5
2、データ辞書62、アプリケーション・ファイル6
4、サーチデータ記憶部66、定義内容推定則記憶部6
8、定義データ記憶部56、推定定義データ記憶部70
および推定定義データ生成部60を含んでいる。
【0072】定義要素データ生成部42、定義データ生
成部54および推定定義データ生成部60は、定義要素
データ、定義データおよび推定定義データの生成処理プ
ログラムを実行するCPU24によって構成される。
【0073】定義要素データ記憶部44、定義内容構成
則記憶部46、定義情報識別データ記憶部48、定義情
報区別データ記憶部50、応用用語辞書52、帳表定義
データ記憶部56、データ辞書62、アプリケーション
・ファイル64、サーチデータ記憶部66、定義内容推
定則記憶部68および推定定義データ記憶部70は、内
部メモリ16または外部メモリ18の所定の記憶領域上
に展開されている。
【0074】図23に、この定義内容認識/推定部にお
ける処理の手順を示す。「推定」ボタンの選択指示があ
ると、記入情報の入力または追加があったか否かを判断
し(ステップA1 )、あったときは最初に定義内容認識
の処理を実行し(ステップA2 )、次いで定義内容推定
の処理を実行し(ステップA3 )、最後に両処理の結果
を画面20aに表示する(ステップA5 )。また、記入
情報の入力または追加がなかったとき、たとえば「推
定」ボタンが続けて選択指示された場合は、表示出力す
べき推定定義内容を前回よりも1つ優先度の低いものに
変更する(ステップA4 )。
【0075】図24に、定義内容認識処理(ステップA
2 )の手順を示す。定義内容認識処理は、帳表文書中の
記入情報のうち定義専用情報およびそれに関連する通常
記入情報を処理対象とする。
【0076】先ず、定義要素生成部42が、定義要素識
別データ記憶部48および定義情報区別データ記憶部5
0にそれぞれ保持されている定義要素識別データ(図
7)および定義情報区別データ(図9)を参照して、文
書要素データ記憶部38に格納されている文書要素デー
タ(図16〜図21)から帳表文書に記入されている各
定義要素記入情報のデータつまり定義要素データを生成
する(ステップB1 )。
【0077】図25に、定義要素データのデータフォー
マット例を示す。当該定義要素記入情報を識別する「定
義系コード」および「定義要素コード」がセットされる
とともに、当該定義要素記入情報を構成する文字、図
形、記号に対応する文書要素データを参照するためのポ
インタがセットされる。たとえば、「範囲指定」
の“[”の場合は、その記入情報“[”に対応する文書
要素データのアドレスを指示するポインタがセットされ
る。
【0078】定義要素データを生成するには、特定の修
飾情報たとえば(青)の色情報を有する文書要素データ
をサーチする。このサーチの結果、たとえば“[”の記
入情報を抽出した場合は、それと対をなす他方の記入情
報“]”を割り出すことで、「範囲指定」の定義要素記
入情報“[ ]”を判別する。これにより、「定義系
コード」と「定義要素コード」が決まり、当該定義要素
記入情報を構成する“[”および“]”の文書要素デー
タ(図形要素データ)のアドレスをそれぞれ指示するポ
インタも決まる。
【0079】次に、定義データ生成部54が、定義情報
区別データ記憶部50に保持されている定義情報区別デ
ータ(図9)および定義内容構成則記憶部46に格納さ
れている定義内容構成則(結合則)のアルゴリズムを参
照して、文書要素データ記憶部38に蓄積されている文
書要素データ(図16〜図21)を基に各定義情報毎に
定義データを生成する(ステップB2 )。
【0080】本例の帳表文書(図12)の場合は、
(青)の「データ管理」系の定義専用記入情報で記入さ
れたデータ項目名<分類>、<品番>、<月別>につい
てそれぞれ「項目定義データ」を作成する。
【0081】図26に、「項目定義データ」のデータフ
ォーマット例を示す。「定義データ種別」のデータ・フ
ィールドには、項目定義データであることを表すコード
がセットされる。「項目文字列データへのポインタ」の
データ・フィールドには、当該項目名を表す文字または
文字列の記入情報に対応した文書要素データを参照する
ためのポインタ(アドレス情報)がセットされる。「先
頭セルデータまたは先頭データ値指示データへのポイン
タ」のデータ・フィールドには、当該記入情報“[
]”または“□”で指定される領域(フィールド)の
先頭のセルまたは先頭のデータ値に対応した文書要素デ
ータを参照するためのポインタ(アドレス情報)がセッ
トされる。
【0082】なお、多数のセル列からなるフィールドに
ついては、各セルデータ(図21)に次のセルデータと
の繋がりをもたせるためのポインタをセットし、図27
に示すように「フィールド内セルデータ・チェイン」を
作成する。
【0083】「項目定義データ」を生成する処理は次の
ようにして行われる。先ず、定義要素データ記憶部44
に蓄積されている定義要素データの中から(青)の「結
合線」の定義要素記入情報“−”に対応した定義要素デ
ータを抽出する。この抽出した「結合線」の定義要素デ
ータのポインタから、この定義要素記入情報“−”に対
応した文書要素データを検索し、この定義要素記入情報
“−”の位置を識別する。次に、「項目」と「範囲指
定」または「フィールド」の定義要素データを基に、こ
の定義要素記入情報“−”の両端付近に記入されている
定義要素記入情報“< >”と“[ ]”または
“□”とを割り出す。このような、近接する記入情報の
割出しは、それぞれ対応する文書要素データの中の「位
置」データを順次参照または照合し合うことによって行
う。
【0084】次に、上記のようにして検出した「項目」
の定義要素記入情報“< >”の位置から当該一対の記
入情報“<”と“>”との間に位置する文字または文字
列の記入情報(つまり当該項目名を表す文字または文字
列の記入情報)を割り出す。
【0085】本例の帳表文書(図12)では、“分
類”、“品番”、“月別”がこれに該当する。この記入
情報の割り出しも、それぞれ対応する文書要素データの
中の「位置」データを順次参照し合うことによって行
う。そして、この割り出した項目文字列に対応する文書
要素データ(文字または文字列データ)のアドレス情報
を「項目文字列データへのポインタ」としてセットす
る。
【0086】なお、(青)の「結合線」“−”が無くて
も、(青)の「範囲指定」“[]”で区画されたセル列
が検出され、かつ(青)の「項目」“< >”で括ら
れた文字列が該セル列(フィールド)の延長方向に隣接
している場合は、結合則にしたがって該文字列は該フィ
ールドに対応するデータ項目名であると判定し、上記と
同じフォーマットで項目定義データを作成する。
【0087】以上のようにして、定義情報で指示される
全ての定義内容が認識されたところで、生成された全て
の定義データを「帳表管理データ」(図28)でとりま
とめる。この「帳表管理データ」は、論理的にまとまっ
た1つの帳表を構成する帳表定義データ群をとりまとめ
る管理データである。本例では、定義情報“[ ]−
<分類>”、“[ ]−<品番>”、“□−<月別
>”からそれぞれ生成される項目定義データを「帳表管
理データ」でポイントしておく。
【0088】図29に、定義内容推定処理(図23のス
テップA3 )の手順を示す。定義内容推定処理は、帳表
文書中の記入情報のうち上記定義内容認識処理で認識さ
れたもの(定義専用情報およびそれに関連する通常記入
情報)以外の記入情報を処理対象とする。
【0089】先ず、推定定義データ記憶部70内の記憶
内容をクリア(リセット)してから(ステップC1 )、
推定定義データ生成部60が、前置推定処理として、帳
表文書(図12)中で(黒)の通常記入情報によって表
されている応用用語、データ項目名またはデータ名を識
別する(ステップC2 )。
【0090】この前置推定処理では、文書要素データ記
憶部38に蓄積されている文書要素データに基づいて帳
表文書(図12)中に(黒)の通常記入情報で表されて
いる記号、文字または文字列等の文書要素を識別し、そ
の識別した文書要素のコードを応用用語辞書52、デー
タ辞書62、アプリケーション・ファイル64に登録さ
れているコードと公知の方法で順次比較照合し、一致す
るものがあればその通常記入情報についてたとえば図3
0に示すようなデータ・フォーマットでサーチデータを
生成してサータデータ記憶部66に格納する。
【0091】図31に、応用用語辞書52に収載される
用語の例を示す。「単位」、「計算式」、「合計」等の
各サブ定義系毎に用語として使用可能な文字、文字列、
記号が登録されている。
【0092】図32に、応用用語辞書52に収載される
用語データのデータフォーマット例を示す。ヘッダの
「処理系種別」のデータ・フィールドには各サブ定義系
(「単位」、「計算式」、「合計」等)のコードがセッ
トされる。このヘッダに続けて「文字コード列」のデー
タ・フィールドに、当該サブ定義系に属する各文字、文
字列、記号を構成する文字コード列が羅列型式で順次セ
ットされる。「区切り識別データ」は図31で各用語を
区切っているカンマ(,)に対応している。前置推定処
理では「文字コード列」が参照(比較照合)される。
【0093】図33に、データ辞書62のソースとなる
データ定義書の一例を示す。データ定義書は、アプリケ
ーションで使用され得るデータ項目名およびその属性を
一覧表で定義したものである。データ辞書62には、こ
の一覧表の各行(レコード)に対応するデータ定義デー
タが所定のデータフォーマットで格納されている。前置
推定処理で参照されるのは主として「データ項目名」、
「同義語」の文字コード列である。
【0094】図34および図35に、アプリケーション
・ファイル64に格納されるマスタ・ファイルの例とし
て「商品管理ファイル」、「支店管理ファイル」の定義
書を示す。この定義書に対応するファイル定義データが
所定のデータフォーマットで登録されている。前置推定
処理では、全てのデータ名が参照(比較照合)の対象と
なる。
【0095】一般にマスタ・ファイルのデータ量は膨大
であり、1つのファイル内で同じ見出し語(たとえば
「商品管理ファイル」の「テレビ」、「支店管理ファイ
ル」の「神田」)が複数のレコードに存在していること
も多々ある。したがって、マスタ・ファイルそのもので
はなく、各データ項目名とそれに属する全ての見出し語
とを対応させたファイルを使用することもできる。
【0096】なお、個々の数字列も、データ名として記
入されている可能性が高いものとみなして、識別対象と
する。
【0097】本例の帳表文書(図12)の場合、この前
置推定処理(ステップC2 )では、以下のような応用用
語、データ項目名、データ名が識別される。
【0098】応用用語としては、表の外の注釈“売上高
=単価×売上数”の中から“=”、“×”が識別される
とともに、表内の最下行のセル(2箇所)の中から
“計”が識別される。
【0099】データ項目名は、表の外では注釈“支店名
神田”の中から“支店名”が識別されるとともに、表
の中では最上段の欄から“売上数”、“単価”、“売上
高”が識別される。
【0100】データ名は、上記注釈“支店名 神田”の
中から“神田“が識別される。
【0101】次に、推定定義データ生成部60は、上記
前置推定処理で識別した応用用語、データ項目名、デー
タ名を推定上の拠点として、定義内容推定則記憶部68
に格納されている定義内容推定則にしたがい探索的に帳
表に関係する各種定義内容の推定を行っていく。
【0102】この定義内容推定則は、定義内容推定ルー
チンの中に判定手順アルゴリズムとして組み込まれてい
る。たとえば、本例の帳表についてみれば、『データ記
入フィールドのデータ項目名は、記入される場合、フィ
ールドと同じ列に記入され、表の中ではフィールドの隣
接セルに記入される。』等の判定条件がアルゴリズムの
形態で定義内容推定則記憶部68に用意(蓄積)されて
いる
【0103】ユーザも、このような推定則を観念的に共
有しており、かかる規則を基に帳表上の各データをそれ
と対応するデータ項目名との対の形で(突き合わせで)
読み取っている。
【0104】なお、個々のフィールドも、データ項目名
等と同様に1つの定義要素によって指定される定義情報
の最小単位(以下「単位定義情報」と称する。)であ
る。しかし、データ項目名とは異なり、それ単独の推定
は自由度または不確定性が大きいので、データ項目名と
の対(組み合わせ)の形で推定していく。
【0105】本例の帳表については、「計算式定義」、
「項目定義」、「合計定義」を推定する(ステップC3
〜C5 )。
【0106】先ず、「計算式定義」の推定処理(ステッ
プC3 )においては、上記前置推定処理で応用用語の演
算記号“=”、“×”が識別されているので、これらの
演算記号を含む文字列“売上高=単価×売上数”につい
て定義内容推定則による「計算式判定手順」を実行す
る。
【0107】この判定手順は、たとえば当該文字列は
当該演算記号と推定データ項目名とのみからなること、
当該演算記号の中に等式記号「=」があること、上
記推定データ項目名は数値データ項目であることの3つ
の条件が全部成立するか否かを判定する。最後の条件
は、データ辞書62に照会し、当該データ項目名の「区
分」(図33)を参照することで判定できる。
【0108】本例の帳表文書において、この「計算式判
定手順」の対象である文字列“売上高=単価×売上数”
は上記判定条件,,の全てを満たす。したがっ
て、推定定義データ生成部60は、この文字列“売上高
=単価×売上数”を「計算式」であると推定し、推定計
算式定義データを生成する。
【0109】図36に、「計算式定義データ」のデータ
フォーマット例を示す。本例の場合は、“売上高”、
“単価”、“売上数”をそれぞれ表す文字コード列を各
対応する「文字コード列」のデータ・フィールドにセッ
トするとともに、“=”、“×”をそれぞれ表す演算コ
ードを各対応する「演算記号」のデータ・フィールドに
セットする。
【0110】本実施例において、「推定計算式定義デー
タ」は通常の(確定された)「計算式定義データ」とデ
ータフォーマットもデータ内容も同じである。違うの
は、両者の記憶領域(70,56)が異なる点である。
他の推定定義データについても同様のことがあてはま
る。
【0111】次に、推定定義データ生成部60は、表の
外の項目定義を推定する(ステップC4 )。
【0112】この表外項目定義推定処理では、先ず上記
前置推定処理でサーチされたデータ項目名文字列、デー
タ名文字列のうち表の外に記入されているものを識別す
る。サーチデータ記憶部66より各サーチデータを抽出
し、そのサーチデータに対応する文書要素データを検索
し、当該文書要素(データ項目名文字列またはデータ名
文字列)の位置を表内の各セルの位置と比較照合するこ
とで、表の外にあるか否かを判定できる。
【0113】次いで、上記のようにして識別した表の外
のデータ項目名文字列、データ名文字列を推定拠点とし
て、定義内容推定則アルゴリズムにしたがい、以下のよ
うな2つの条件,の中の1つが成立するか否かを判
定する。
【0114】1つの条件は、『データ項目名とデータ
名文字列との対が、たとえば「支店名」と「神田」、あ
るいは「商品名」と「テレビ」のように互いに所属関係
にあり、かつ同じ行(方向位置)で近傍にあること』で
ある。ここで、近傍とは、図37の(A)に示すよう
に、両文字列の間隔dA が所定のしきい値(たとえば文
字ピッチの2〜3倍)以下であることを意味する。
【0115】もう1つの条件は、データ項目名と同一
の行かつ近傍に書式罫線( )またはセルが記入さ
れていることである。この場合は、図37の(B),
(C)に示すように、高さ方向でデータ項目名文字列の
ベースラインと書式罫線またはセルの底辺とのギャップ
dB が所定のしきい値(たとえば文字高さの1/3)以
下であるか否かも判定する。
【0116】帳表には、その全ての構成フィールドが、
記入データ名が1つの、いわゆる「伝票」がある。この
「伝票」形式の帳票の推定は、この「表外のフィール
ド」の推定の組合せにより行うことができる。
【0117】本例の帳表文書(図12)では、表の右上
方に(黒)の通常記入情報で記入されているデータ項目
名の「支店名」とデータ名の「神田」との対(組み合わ
せ)において上記の条件が成立する。
【0118】上記の条件またはが成立したなら、当
該データ項目名と当該データ名または書式罫線との組み
合わせについて推定項目定義データを生成する。推定項
目定義データには、確定的な項目定義データ(図26)
と同じデータフォーマットを充てる。
【0119】表外の推定項目定義データを生成するに当
たっては、図38の(A),(B)に示すような当該デ
ータ名記入欄を規定するための仮想的な推定セルデータ
をも作成する。この推定セルデータには、確定セルデー
タ(図21)と同じデータフォーマットを充てる。
【0120】なお、図37の(C)の例のように、デー
タ名記入位置に通常記入情報のセルが元々記入されてい
る場合は、このセルに対応するセルデータのコピーを文
書要素データ記憶部38より取り出して、これを推定セ
ルデータとする。
【0121】そして、図39に示すように、この推定セ
ルデータを文書要素データ記憶部38内に正式の文書要
素データエリアと一緒に設けられている推定文書要素デ
ータエリアに格納する。当該推定項目定義データは、通
常記入情報の上記データ項目名文字列と上記推定セルデ
ータとをポイントする。
【0122】次に、推定定義データ生成部60は、表内
の項目定義および合計定義を推定する(ステップC5
)。
【0123】図40に、表内項目定義/合計定義推定処
理の大まかな手順を示す。表内のデータ記入欄にデータ
名が記入されているときは、先ず、それらのデータ名を
拠点とし、関連する項目定義および合計定義を推定する
(ステップD1 )。次いで、表内の残りのデータ項目名
を拠点として、関連する項目定義および合計定義を推定
する(ステップD2 )。データ名を拠点とする推定のほ
うがデータ項目名を拠点とする推定よりも推定確度(的
中率)が高いので、これを優先的に行う。そして、表内
で推定した全ての互いに平行するフィールドの端を揃え
(ステップD3)、最後に、推定した合計定義に関連す
る推定フィールド内に数値列と合計値とが記入されてい
る場合は、記入数値上の整合がとれているか否かの合計
チェックを行う(ステップD4 )。
【0124】図41に、「データ名に基づく項目定義の
推定処理」の詳細な手順を示す。本例の帳表文書(図1
2)の場合は、表内のデータ記入欄が全て空欄であっ
て、データ名は1つも記入されていない。このため、こ
の推定処理をスキップすることになる。したがって、こ
のデータ名に基づく推定フィールドに関連する「合計定
義の推定処理」(図42)もスキップする。
【0125】図43に、「残りのデータ項目名に基づく
項目定義の推定処理」の詳細な手順を示す。この推定処
理で対象となる「残りのデータ項目名」とは、この推定
処理に先立って行われた「データ名に基づく項目定義の
推定処理」で定義推定の対象にならなかった表内のデー
タ項目名である。
【0126】本例の帳表文書(図12)では、(黒)の
通常記入情報の文字列“売上数”、“単価”、“売上
高”が、そのような「残りのデータ項目名」に該当する
ものとして識別される(ステップG1 )。
【0127】次いで、識別した各々のデータ項目名につ
いて、それに対応するフィールドとなる可能性のあるも
の(フィールド候補)を全部抽出する(ステップG2
)。原理的に、表の中では1つのデータ項目名に対し
て最大4個(上下左右の4方向))のフィールドが考え
られる。しかし、本実施例では、処理を簡単にするた
め、図44に示すように、下方と右方の2方向のフィー
ルドだけを候補対象とする。
【0128】フィールド候補を抽出する際には、そのフ
ィールド(連続セル列)の範囲も推定する。本実施例で
は、当該データ項目名が記入されているセルとの境界を
一方のフィールド端とし、集計用語の「計」またはその
同義語あるいは他のデータ項目名が記入されているセル
または表の外との境界を他方のフィールド端とする。
【0129】したがって、本例の帳表文書(図12)に
おいて、データ項目名“売上数”、“単価”、“売上
高”に対する下方フィールド候補の範囲は、図45に示
すようなものとなる。
【0130】なお、抽出した各フィールド候補について
は、その推定フィールドに含まれる各セルに対応するセ
ルデータ(図21)のコピーを文書要素データ記憶部3
8より読み出してダミーセルデータとする。そして、図
46に示すように、各推定フィールド内のダミーセルデ
ータをチェインで繋いでおく。
【0131】次に、上記のようにして抽出したフィール
ド候補に対して、干渉チェックを行う(ステップG3
)。この干渉チェックは段階的に2回行われる。第1
次のチェックでは、ユーザが事前に定義専用情報で指定
したフィールド、または本システムが先の「データ名に
基づく項目定義の推定処理」(ステップD1 )で推定し
たフィールドと干渉(抵触)するようなフィールド候補
をふるい落とす。
【0132】第2次では、第1次のチェックをパスした
フィールド候補群について互いに干渉しない組み合わせ
を求める。
【0133】たとえば図47に示す組み合わせは、デー
タ項目名Aに対応する右方フィールド候補A−2が他の
データ項目名B,Cのセルに重なっており、干渉してい
る。これに対して、図48に示す組み合わせは、3つの
フィールド候補[A−1],[B−1],[C−1]が
垂直方向で互いに平行に延在しており、干渉はない。ま
た、図49に示す組み合わせも、データ項目名A,Bの
フィールド候補[A−1],[B−1]が垂直方向で互
いに平行に延びるのに対して、データ項目名Cのフィー
ルド候補[C−2]が右方向の空欄に延びており、干渉
はない。
【0134】次に、上記のような干渉チェックでパスし
た各組のフィールド候補毎に、図50に示すように推定
項目定義データ群を作成する(ステップG4 )。この
際、推定順位の高い順に第1組、第2組、…とする。推
定順位の判定基準としては、たとえば生成した順序、あ
るいは全体の総セル数等を選ぶことができる。この推定
順位は、後に推定定義内容が表示出力される際の表示順
位でもある。
【0135】なお、数字列(データ名)が記入されてい
るフィールドは、空欄とみなしてフィールド候補の1つ
とするが、推定順位の判定段階では空欄よりも優位のフ
ィールド候補として扱う。
【0136】図51に示すように、推定定義データ記憶
部70内には、各組の推定項目定義データ群に対応する
記憶領域(候補エリア)が設けられており、第1組の推
定項目定義データ群は第1候補エリアに、第2組の推定
項目定義データ群は第2候補エリアに、……とそれぞれ
格納される。また、先の「データ名に基づく項目定義の
推定処理」(ステップD1 )で得られた推定項目定義デ
ータ群は、全ての候補エリアにコピーして格納される。
同様に、図51では図示していないが、表外の全ての推
定定義データも全ての候補エリアにコピーして格納され
る。
【0137】上記の「残りのデータ項目名に基づく項目
定義の推定処理」においては、表の中で集計(合計)を
指定する集計用語(応用用語)の「計」またはこの同義
語が識別されたときは、「合計定義の推定処理」(図4
3)を行う。
【0138】そのような集計項目があるときは、定義内
容推定則にしたがい所定の判定条件たとえば『所定の位
置に全ての集計項目フィールドについて合計フィールド
が設定可能であること』が成立するか否かを検査する
(ステップF3 )。図52に、この条件を満たす所定の
位置関係の幾つかの例を示す。
【0139】1つの推定組み合わせの中の全ての集計項
目について、合計定義データが上記のように推定できる
ときは、たとえば図53に示すようなデータフォーマッ
トで推定合計定義データを生成する(ステップF4 )。
この推定合計定義データにおいてポイント(参照)され
る「項目定義データ」は推定定義データ記憶部70に格
納されている推定項目定義データであり、ポイントされ
る「セルデータ」は文書要素データ記憶部38に格納さ
れている確定セルデータである。
【0140】続いて、推定フィールドと推定合計フィー
ルドとが干渉し合う場合は、フィールド範囲を干渉部分
だけ短縮する。そして、該当の推定項目定義データのセ
ルデータチェインに変更を加える。
【0141】なお、上記条件を満たさない集計項目が1
つでもある候補組み合わせは、推定候補から除外する。
すなわち、該当する候補エリア中の推定定義データを抹
消する。
【0142】本例の帳表文書(図12)では、「売上
数」、「売上高」の各集計項目についてそのような「推
定合計定義データ」が生成される。なお、推定定義デー
タ記憶部70において、「推定合計定義データ」は当該
フィールド候補と同じ候補エリア(図51)に格納され
てよい。
【0143】上記のようにして表内の全ての推定項目定
義データを生成した後、図54に示すように、各組(候
補)毎に互いに平行するフィールド候補の範囲を揃える
(ステップD3 )。この場合、基準のフィールド範囲に
は、ユーザが定義情報で指定した範囲を最優先に選び、
それが無いときはステップD1 で推定された確度の高い
範囲を選び、これも無いときは今回のフィールド候補の
中で最も小さい範囲を選ぶ。
【0144】表内の定義推定処理で最後の「合計チェッ
ク」(ステップD4 )は、各推定候補の組単位で、推定
フィールド内に数値列と合計値とが記入されている場合
に行われる。本例の帳表文書(図12)の場合は、表内
のいずれのデータ記入欄も空欄であって、該当するよう
な数値列や合計値は記入されていない。したがって、こ
の「合計チェック」を実質的にスキップすることにな
る。なお、本実施例における「合計チェック」の処理手
順については後述する。
【0145】最後に、以上の推定によって得られた全て
の定義データ(表内項目定義、表外項目定義、計算式定
義、……)について、定義内容推定則記憶部68に蓄積
されている「帳表組み合わせ推定則」にしたがって1つ
の「帳表」を構成するものを選ぶ(ステップC6 )。
【0146】「帳表組み合わせ推定則」は、幾つかの推
定則を含んでよい。たとえば、1つの「表」内で推定さ
れた項目定義はその表に係る1つの「帳表」を構成する
ものと推定する。また、「表外の項目定義」について
は、当該「表」と一定距離以内にあり、かつ「表」内の
データ項目名と異なるデータ項目名を有するのものを、
該「表」に係る1つの「帳表」を構成する要素であると
推定する。また、「表外の計算式定義」については、当
該「表」と一定距離以内にあり、かつ「表」内のデータ
項目名を少なくとも1つ以上含むものを、当該「表」に
係る1つの「帳表」の構成要素であると推定する。以上
のような「帳表組み合わせ推定則」から外れた定義デー
タは抹消してよい。
【0147】次に、システムは、上記のようにして推定
した定義内容を記入情報の形で入力帳表文書に追記して
表示出力する(図23のステップA5 )。
【0148】図55に、このシステムにおける定義内容
表示出力部の構成を示す。単位定義情報処理部80はC
PU24およびこの処理のためのプログラムによって実
現され、定義要素配置則記憶部82および推定定義情報
区別データ記憶部84は内部メモリ16または外部メモ
リ18内に設けられる。
【0149】図56に、この定義内容表示出力部におけ
る処理の手順を示す。この処理手順の中では、推定定義
データを基に定義要素データおよび文書要素データを生
成する処理(ステップH1 〜H6 )が重要である。
【0150】先ず、単位定義情報処理部80は、推定定
義データ記憶部70内の第1候補エリアから推定定義デ
ータを1個ずつ取り出し(ステップH1 ,H2 )、定義
内容構成則アルゴリズムを参照して各推定定義データを
1つまたは複数の単位定義情報に分解する(ステップH
3 )。
【0151】単位定義情報は、記入情報または画面上の
コマンドによって指示可能な最小単位の定義情報であ
り、通常は1個または複数個の定義要素に対応してい
る。
【0152】たとえば、「項目定義」の単位定義情報は
「項目名」と「フィールド」または「範囲指定」の2つ
である。「合計定義」の単位定義情報は「集計用語」と
「フィールド」の2つである。「計算式定義」の単位定
義情報は「項目名」である。
【0153】次に、分解した各単位定義情報のうち、
「項目名」につき先の「データ名に基づく項目定義の推
定処理」(図41)の中で「推定文字列データ」(ステ
ップE4 )が生成されているか否かを調べる(ステップ
H4 )。そのような「推定文字列データ」がある場合
は、当該推定文字列の記入位置、文字大きさ、文字ピッ
チ等を決定する(ステップH5 )。本例の帳表文書(図
12)の場合は、「推定文字列データ」が生成されない
ため、この処理(ステップH5 )はスキップする。
【0154】次に、定義要素配置則記憶部82に格納さ
れている単位定義情報毎の定義要素配置則にしたがい、
各単位定義情報に対応する推定定義要素データおよび文
書要素データを生成する(ステップH6 )。
【0155】本例の帳表文書(図12)の場合は、上記
したように、表外の注釈文字列“売上高=単価×売上
高”および“支店名 神田”からそれぞれ推定計算式定
義データおよび推定項目定義データが生成されており、
表内のデータ項目名文字列“売上数”,“単価”,“売
上高”とそれぞれに対応するセル列とから推定項目定義
データが生成され、さらに集計項目「売上数」および
「売上高」の推定フィールドに関連して推定合計定義デ
ータが生成されている。
【0156】先ず、各推定項目定義データから分解され
る単位定義情報の「項目名」については、図57に示す
ように、当該項目名の文字列を両側から括るような「項
目」の定義要素記入情報“< >”を生成する。この
場合、この記入情報を構成する記号“<”,“>”の位
置、大きさ(h)、間隔(t)等は、当該文字列の位
置、大きさ(w)、文字間隔(s)等に応じた装置用意
値(近似値)となる。
【0157】また、表内の推定項目定義データを分解し
て得られる単位定義情報の「フィールド」については、
図58に示すように、フィールド両端のセル内に入るよ
うな「範囲指定」の定義要素記入情報“[ ]”を生
成する。この記入情報を構成する記号“[”,“]”の
位置、大きさ(k)、間隔(n)等も、当該セルの位
置、大きさ(m)等に一定比率を乗じて得られる装置用
意値(近似値)となる。
【0158】同様にして、表外の推定項目定義データか
ら得られる「フィールド」については、当該データ名記
入位置に設定した仮想的なセル(図38)内に一定比率
のマージン値で収まるような位置、大きさで「範囲指
定」の定義要素記入情報“[]”を生成する。
【0159】推定計算式定義データから得られる「項目
名」については、各データ項目名の文字列(たとえば
“売上高”)を両側から括るような位置、大きさで「項
目」の定義要素記入情報“< >”を生成する。
【0160】また、推定合計定義データを分解して得ら
れる「集計用語」については、当該集計用語の文字また
は文字列(たとえば“計”)を囲むような位置、大きさ
で「定義要素指定」の定義要素記入情報“〇”を生成す
る。また、推定合計定義データから分解される単位定義
情報の「フィールド」については、該当するセル内に一
定比率のマージン値で収まり、かつ集計用語と重ならな
いようにして「範囲指定」の定義要素記入情報“[
]”を生成する。
【0161】上記のようにして、個々の単位定義情報か
らこれに対応する定義要素記入情報を生成する処理は、
個々の単位定義情報からこれに対応する推定定義要素デ
ータおよび推定文書要素データを生成する処理に外なら
ない。各推定定義要素データには、正式の定義要素デー
タと同じデータフォーマット(図25)を充てる。
【0162】また、各推定文書要素データにも、各対応
する通常の文書要素データと同じデータフォーマット
(図16〜図20)を充てる。ここで、通常記入情報か
ら区別するために各推定文書要素の「色」を定義情報と
同じ色(本例では(青))にセットする。また、ユーザ
の記入した定義専用情報からも区別するために、各推定
文書要素に所定の識別情報を付ける。たとえば「線修
飾」を「点線」とする。
【0163】推定定義情報処理部80は、生成した単位
定義情報毎の推定定義要素データおよび推定文書要素デ
ータをそれぞれ定義要素データ記憶部44および文書要
素記憶部38内の推定定義要素データエリアおよび推定
文書要素データエリア(推定エリア)に格納する(ステ
ップH7 )。
【0164】定義要素データ記憶部44内の確定エリア
には、ユーザの記入した(青)の定義専用情報に基づい
て定義内容処理部が生成した確定的または正式の定義要
素データが格納されている。また、文書要素データ記憶
部38内の確定エリアには、文字・図形要素認識部34
で生成された文書要素データつまり入力帳表文書(図1
2)の文書内容に対応する確定的または正式の文書要素
データが格納されている。
【0165】文書画像出力部40は、文書要素データ記
憶部38の確定エリアに格納されている確定文書要素デ
ータおよび推定エリアに格納されている推定文書要素デ
ータを一緒にビットマップ形式の画像データに変換し
(ステップH8 )、表示装置20あるいは印字装置22
へ出力する(ステップH9 )。
【0166】これにより、本例の場合は、表示装置20
のディスプレイ画面20a上に図59に示すような定義
情報入りの帳表文書が表示される。この帳表文書におい
て、(黒)の記入情報および(青)の実線の記入情報は
入力帳表文書(図12)の全記入情報に対応するシステ
ムの文字・図形認識結果であり、(青)の点線の記入情
報はシステムによる定義内容推定処理の結果を示し、シ
ステムで生成された推定定義情報である。
【0167】ユーザは、この表示出力された帳表文書を
見て、システムが認識および推定した定義内容を肯認
し、かつ全ての定義内容を確定したいときは、画面右下
部の「確定」のサブモードボタンを選択指示すればよ
い。ユーザからの確定指示を入力すると、システムで
は、上記した定義内容認識/推定部(図22)および単
位定義情報処理部80(図55)において以下に述べる
ような定義内容確定処理が行われる。
【0168】図60に、定義内容確定処理の手順を示
す。先ず、定義内容認識部(図22)において、入力帳
表文書の定義情報およびそれに関連する通常記入情報を
対象に定義要素データおよび定義データを順次生成する
(ステップI1 ,I2 )。
【0169】そして、今回生成した定義データを定義デ
ータ記憶部56に格納されている定義データと比較し
て、新たな定義データの作成または追加があったか否か
を判定する(ステップI3 )。本例の場合は、先に「推
定」ボタンの指示操作に対して行われた定義内容認識処
理(ステップB1 ,B2 )のときと同じ定義データが生
成されるため、新たな定義データの作成・追加はない。
【0170】新たな定義データの作成・追加があった場
合は、その新たな定義データと干渉するような推定定義
データがあるか否かをチェックし、該当(干渉)する推
定定義データを抹消する(ステップI4 )。
【0171】次いで、推定定義データ記憶部70あるい
は文書要素データ記憶部38の推定エリア内の記憶内容
を基に、表示中の帳表文書(図59)に推定定義内容が
含まれているか否か、つまり(青)の点線で表示されて
いる追加の記入情報があるか否かを調べる(ステップI
5 )。推定定義内容が含まれていれば、表示出力された
推定候補に係る定義データ、定義要素データおよび文書
要素データをそれぞれ確定データに変更する(ステップ
I6 )。
【0172】この推定→確定への変更処理では、先ず文
書要素データ記憶部38において、表示出力された推定
候補に係る推定文書要素データを推定エリアから確定エ
リアに移す。ただし、ダミーセルデータは移さず、代わ
りに、確定エリア内の各対応するセルデータについてダ
ミーセルデータ・チェイン(図46)と同じセルデータ
・チェインを構築する。なお、推定文書要素データを推
定エリアから確定エリアに移すに際しては、その「線修
飾」情報を「点線」から「実線」に変更する。
【0173】次に、定義要素データ記憶部44におい
て、推定エリアに格納されていた全ての定義要素データ
を確定エリアに移す。そして、この確定エリアに移した
各定義要素データにおいては、これに対応する文書要素
データも文書要素データ記憶部38内で推定エリアから
確定エリアに移っているので、この対応文書要素データ
を参照するためのポインタを新しいアドレス情報に更新
しておく。
【0174】次に、推定定義データ記憶部70内の選択
されている候補エリアに格納されている推定定義データ
群を定義データ生成部54経由で定義データ記憶部56
に移し、新たな確定定義データとする。これらの新たな
確定定義データの各々においても、各対応する文書要素
データを参照するためのポインタを更新しておく。一方
で、帳表管理データ(図28)においては、これら追加
分の確定定義データをとりまとめるため、それぞれのポ
インタをセットする。
【0175】上記のようにして、該当する各種推定デー
タが各対応する確定データに変更される。次いで、文書
画像出力部40が、文書要素データ記憶部38内の確定
エリアに格納されている確定文書要素データを画像デー
タに変換し、表示装置20へ出力する(ステップI7
)。
【0176】これにより、表示装置20のディスプレイ
画面20a上では、図59の画像から図61に示すよう
な画像に画面が切り替わる。すなわち、推定定義内容を
表示していた(青)の点線記入情報が、確定された定義
内容を表す(青)の実線記入情報に変わる。
【0177】上記した例は、システムより表示出力され
た定義内容推定結果(図59)をユーザが肯認し、「確
定」モードを指示した場合であった。しかし、ユーザ
は、他の推定定義内容(推定候補)を選択することもで
きる。その場合は、「推定」ボタンを続けて選択指示す
ればよい。
【0178】そうすると、システムでは、それまで選択
していた推定定義データ記憶部70内の候補エリアを優
先順位の1つ低い別の候補エリアに切り換える(図23
のステップA4 )。そして、定義要素データ記憶部44
および文書要素データ記憶部38内のそれぞれの推定エ
リアをクリアしたうえで、この新たに選択した推定定義
データ記憶部70内の候補エリアに格納されている推定
定義データに基づいて定義内容表示処理(図56)を再
度実行する(ステップA5 )。
【0179】この結果、たとえば図62の例で示すよう
に、ディスプレイ画面20a上で表示出力される推定定
義内容が(A)から(B)に切り替わる。
【0180】「推定」ボタンを再度選択指示する度に、
上記の処理(ステップA1 ,A4 ,A5 )が繰り返し実
行され、推定定義内容(推定候補)が順次切り替わる。
【0181】あるいは、推定定義内容または確定定義内
容を問わず、システムより表示出力された定義内容が自
己の意に沿わないとき、ユーザは、キーボード12、マ
ウス14またはタブレット15等を用いて画面上から入
力帳表文書に補正を加えたり新たな記入情報を入力し、
その後でシステムに「推定」処理(図23)を再実行さ
せるか、「確定」処理(図60)を実行させることも可
能である。
【0182】キーボード12より入力された記入情報に
ついては、文字・図形認識の処理を行うことなく、文字
・図形要素入力部37(図13、図55)で文書要素デ
ータを生成することができる。マウス14またはタブレ
ット15より入力された記入情報については、文字・図
形要素入力部37で各記入情報を入力し、文字・図形要
素認識部34で逐次(入力記入情報毎に)文字/図形認
識処理を行い、文書要素データを生成する。
【0183】これら画面入力方式の入力装置12,1
4,15により定義情報を入力する際にも、「環境設
定」の「定義情報区別」モード(図8)で各定義系の修
飾情報を設定入力する。
【0184】画面上から入力された記入情報(文字列、
記号、図形)は、用紙からイメージ入力された場合と同
様に、システム内では文書要素データ(図16〜図2
1)の形態で表現される。
【0185】実際の使用レベルでは、このような画面入
力方式を上記したイメージ入力方式と併用する形態が便
利である。用紙からイメージで入力された記入情報も画
面上からコマンドで入力された記入情報もシステム内で
は同じ文書要素データの形で管理されるため、帳表の元
々の記入情報(通常記入情報)かその上に追記される定
義用記入情報かに拘りなく、イメージ入力または画面入
力のどちらからでも任意の記入情報を入力することがで
きる。
【0186】さらに、ユーザは、いったん表示出力され
た定義内容について、その定義内容を指示する記入情報
に画面上でワープロ機能を用いて所望の編集校正を施す
ことにより、定義情報の変更や取り消し等を行うことも
可能である。
【0187】たとえば、図63に示すような表示出力さ
れた推定定義内容において、データ項目名「分類」に対
応するフィールドの下端をセル1個分だけ詰める例をと
る。この場合は、図64に示すように、画面上で、該当
の「範囲指定」の定義要素記入情報“[ ]”を構
成する一方(下側)の記入情報“]”を削除するため
に、この記入情報“]”に上書きする形で編集校正系の
「削除」の定義要素記入情報“=”を追記入するととも
に、その1つ上のセル内に代わりの(新たな)同一記号
の記入情報“]”を追記入する。
【0188】以上の追記入は、たとえば画面上において
ペン入力によって行ってよい。以上のようなペン入力の
追記入の後に画面上の「実行」ボタンを指示すると、こ
れに応動して装置は次のような処理を行う。
【0189】先ず、削除指示された記入情報“]”に対
応する指定文書要素データを該当エリアから削除する。
この削除は、通常の文書要素と全く同じ仕方で、両記入
情報“=”、“]”のそれぞれの位置情報の照合によ
り、削除対象の“]”を求めたうえで行う。また、推定
部分も確定部分と全く同じ仕方で行う。
【0190】続いて、編集校正の対象とした文書要素が
定義要素記入情報として記入されたものであるかどうか
を調べる。このチェックは、全ての定義要素記入情報の
該当文書要素データを取り出し、比較照合することによ
って行う。
【0191】本例の場合、削除対象の“]”が「範囲指
定」の定義要素記入情報“[]”を構成していることか
ら、この定義要素記入情報に対応する定義要素データを
削除する。続いて、該当する定義データの見直しを行
う。本例の場合、元の該当するフィールド定義を示す定
義要素のみが削除されていることから、フィールド定義
のみの変更指示があるものとみなし、フィールド定義を
示す定義要素記入情報を再度サーチする。
【0192】本例の場合は、元々記入されている上側の
“[”(点線)と新しく追記された下側の“]”(実
線)とを組み合わせて新しく「範囲指定」の定義要素デ
ータを作成し、さらにこの新たな定義要素データに基づ
き該当の項目定義データの更新を行う。
【0193】編集校正指示を部分的に受けた推定定義デ
ータについては、これを確定定義データに変更する。こ
れにより、本例の場合は、図65に示すような状態(定
義内容確定/推定画面)が得られる。
【0194】図65の状態の下で「推定」ボタンが指示
されると、上記のような処理が行われて、図66の状態
(画面)に変わる。また、図65の状態の下で「確定」
ボタンが指示されたときは、同図の点線部分が実線に変
わることになる。
【0195】定義要素記入情報に対する編集校正は、画
面上からの公知の編集校正機能によっても上記と同様の
処理結果を得ることができる。
【0196】さらに、ユーザは、画面上からコマンドで
定義内容を入力することも可能である。システムでは、
画面上指示部74において、画面上から入力されたコマ
ンドを解析するとともに、そのコマンドの対象とする画
面上の位置(クリック位置)と、文書要素データ記憶部
38に保持されている文書要素データの位置情報との照
合を繰り返して、該当する文書要素データを識別する
(ピッキング処理)。そして、識別した文書要素データ
と入力コマンドの指示内容とから、所要の定義データを
生成する。
【0197】図67および図68に、画面上からのコマ
ンドによる定義情報入力操作の一例を示す。
【0198】先ず、ユーザは、図67の(A)に示すよ
うに画面上で帳表文書中の所望のフィールドをドラグ指
定する。このようなドラグ指定は公知技術であり、通常
はマウスを用いて行われる。
【0199】画面上指示部74は、上記のドラグ指定で
指定されたフィールドを構成するセルを認識し、図67
の(B)に示すような副画面を文書画像出力部40を介
してディスプレイ画面20a上に表示する。この副画面
中には、フィールドに付属する属性がリストされてい
る。
【0200】このリストの中でユーザがたとえば「デー
タ項目名」を選択(クリック)したとする。そうする
と、画面上指示部74は、図67の(C)に示すような
当該アプリケーションで使用可能なデータ項目名の一覧
を示す副画面を画面上に表示する。このデータ項目名一
覧表示に際しては、データ辞書62を参照する。
【0201】上記副画面のデータ項目名一覧からユーザ
がたとえば図67の(D)に示すように「売上高」を選
択したとする。この指示を受けて、画面上指示部74で
は、画面上で指示されたフィールドとデータ項目名「売
上高」とについて項目定義データ(図26)を作成す
る。ただし、このような画面上指示による項目定義デー
タは、所定のフラグ情報を付けて定義データ記憶部56
に格納する。
【0202】単位定義情報処理部80(図55)は、か
かるフラグ情報を基に画面上指示の項目定義データを定
義データ記憶部56から取り出し、上記と同様の処理を
行って、該項目定義データに対応する確定定義要素デー
タおよび確定文書要素データを生成する。
【0203】この結果、図68に示すように、指示され
た定義内容を示す所要の定義情報が画面上で入力帳表文
書に追記される。図68の(A)の例では、データ項目
名文字列「売上高」が通常記入情報で元々記入されてお
り、システムが(青)の定義専用情報で「項目」の定義
要素記入情報“< >”と、「範囲指定」の定義要素
記入情報“[ ]”とを追記している。図68の
(B)の例では、データ項目名文字列「売上高」が記入
されていなかったため、システムがこの文字列を生成し
て追記している。
【0204】図69および図70に、本システムにおけ
る「データ名に基づく項目定義の推定処理」(図41)
が適用される例を示す。
【0205】図69に示すような入力帳表文書に対して
この推定処理が実行されると、先ずステップE1 で表内
の左端側2列のデータ記入欄にデータ名(“テレビ”,
“ラジオ”,……“カーナビ”),(“J1020”,
“J1050”,……,“S8020”)がそれぞれ記
入されていることが判別される。続いて、該当のデータ
項目名を該当データファイルを参照して推定する。
【0206】そこで、それら2列のデータ記入欄におい
てフィールドを推定する(ステップE2 )。複数のデー
タ名が1つの空欄を挟むことなく連続して記入されてい
るときは、その連続したデータ名記入域をそのままフィ
ールド範囲とする。また、複数のデータ名が1つまたは
複数の空欄を挟んで離散的に記入されているときは、上
記「テータ項目名による推定」の場合と同じ基準でフィ
ールド範囲を決める。
【0207】次に、各データ名記入列に対応する位置
(延長上の位置)に該当データ項目名が記入されている
か否かを判定する(ステップE3 )。図69の例では、
該当データ項目名が記入されていない。このような場合
は、推定定義データ生成部60において、アプリケーシ
ョン・ファイル64およびデータ辞書62を参照して、
各データ名記入列と対応関係にある正式名称のデータ項
目名を推定し、推定したデータ項目名の文字列を表す推
定文書要素データを生成する(ステップE4 )。この場
合の推定文書要素データは、この段階では位置情報を持
たない。
【0208】次に、各推定フィールドについて干渉チェ
ックを行う(ステップE5 )。この干渉チェックでは、
ユーザ定義による項目定義のフィールドとの干渉の有無
や「データ名に基づく推定」によって得られた推定フィ
ールド相互間の干渉の有無をチェックするほか、当該推
定フィールドに別の推定データ項目名、別種のデータ名
または「計」,「平均」等の応用辞書登録用語が記入さ
れていないかどうかを判定する。そして、かかる条件を
満たせば推定項目定義データを作成し(ステップE7
)、条件が成立しないときは「異常」のメッセージを
表示出力して推定処理を中止する(ステップE8 )。
【0209】以上のようにして推定したフィールドとデ
ータ項目名とから、推定項目定義データを作成する。こ
の際、当該フィールドに隣接するセル中に該当データ項
目名(データ辞書中に登録されているデータ項目名)が
記入されていれば、その文字列データを該推定項目定義
データでポイントする。
【0210】上記のように推定データ項目名文字列を新
たに生成する場合は、該当のフィールドに近接した表外
の適当な位置を選び、該当の文書要素データの位置情報
を与える。
【0211】次に、本実施例のシステムにおいて、電子
化された帳表にデータファイルよりデータを転記して出
力するデータ出力処理の諸機能について説明する。
【0212】このデータ出力処理は、「データ出力」モ
ードの下で行われる。本例の場合、ユーザは、確定され
た定義内容が表示される画面(図61)上でペン入力等
により「月別」のデータ名記入欄[ ]の中に所望
の月たとえば“10月”を記入(入力)してからディス
プレイ画面20a上の「モード」ボタンをクリックして
(図3)、モード一覧メニューの中から「データ出力」
を選択すればよい。
【0213】そうすると、システムが「データ出力」モ
ードに切り替わり、ディスプレイ画面20a上に図71
に示すような「出力元ファイル一覧」の画面が表示され
る。本例の帳表(図11)の場合、ユーザは、画面表示
された複数の出力元ファイルの中から所望の出力元とし
て「1.1997年売上げファイル」を選択し、「出力
実行」ボタンをクリックすればよい。
【0214】図72に、本実施例のシステムにおけるデ
ータ出力部の構成を示す。データ項目変換部88、定義
実行部90およびレコード/文書要素データ変換部94
は、それぞれ所定の変換または処理プログラムを実行す
るCPU24によって構成される。入力レコード記憶部
86、データ項目対象テーブル89、出力レコード記憶
部92およびデータ/文字コード変換テーブル96は内
部メモリ16または外部メモリ18によって構成され
る。
【0215】データ出力処理が開始されると、先ず出力
元ファイルを管理する外部システムより一群の中間集計
ファイルつまりファイルレコードが「レコード管理テー
ブル」データをヘッダに付けて通信装置26に伝送され
て来て、入力レコード記憶部86に格納される。
【0216】図73に、出力元ファイルより送られてく
る売上げファイルのレコード管理テーブルおよびファイ
ルレコードのフォーマット例を示す。レコード入力部8
6に入力されるファイルレコードは、出力元ファイル側
で定義されたデータ項目「BUN」、「HIN」、……
「MON」、「BRN」、…を有している。なお、レコ
ード管理テーブルは必ずしも常にファイルレコードと一
緒に送られてくる必要はなく、出力元ファイルより一度
伝送されてきたものをシステム側でメモリに保持してい
てもよい。
【0217】データ項目変換部88は、データ項目対照
テーブル記憶部89に保持されている「データ項目対照
テーブル」(図74)を参照して、入力したファイルレ
コードの各データ項目「BUN」、「HIN」、……
「MON」、「BRN」を各対応するシステム内のデー
タ項目「分類」、「品名」、……「月」、「支店名」に
変換する(図75)。なお、出力元ファイルからのファ
イルレコードに含まれるデータ項目「MAK」は、当該
製品のメーカ名を表すコードであり、本システム内のフ
ァイルレコードでは不要である。
【0218】本例の場合、定義実行部90は、データ項
目変換部88からのファイルレコードの中から「支店名
神田」に係る1997年度の特定の月たとえば10月分
のファイルレコードだけを抽出し、抽出したファイルレ
コードに対して、定義データ記憶部56に格納され帳表
管理データによってとりまとめられている1組の定義デ
ータ(項目定義データ、合計定義データ、計算式定義デ
ータ等)にしたがって「帳表定義」を実行する。
【0219】本例の帳表(図12)の場合は、「計算式
定義データ」(図36)にしたがって、各ファィルレコ
ードについて計算式「<売上高>=<単価>×<売上数
>」を演算し、演算結果のデータをデータ項目「売上
高」にセットする。
【0220】次に、ソート指定または予め設定された基
準(たとえば売上高またはファイル格納順等)にしたが
った順序で図76に示すようにファイルレコードを並べ
換えるとともに、各ファイルレコードにおけるデータ項
目「単価」および「売上高」のデータをそれぞれ指定さ
れた桁数ないし丸め方で所定の単位(¥,K¥等)に換
算する。
【0221】こうして、図77に示すように、各ファイ
ルレコードに所要の出力データが揃う。定義実行部90
による帳表定義の実行処理を終えた各ファイルレコード
は出力レコード記憶部92に格納される。
【0222】レコード/文書要素データ変換部94は、
出力レコード記憶部92より各ファイルレコードを取り
出し、このレコード内の各データ項目のデータを文書要
素データに変換する。これにより、たとえば、ファイル
レコードでは単に「テレビ」の商品コードを表していた
データが、所定の帳表の中の所定の位置に所定の文字列
「テレビ」を表示出力するための文字列データ(図1
7)に変換される。
【0223】なお、レコード/文書要素データ変換部9
4で生成される文書要素データたとえば文字列データ
(図17)において、「文字コード」はデータ/文字コ
ード変換テーブル記憶部96に保持されている「データ
/文字コード変換テーブル」(図示せず)より得られ
る。また、「先頭文字の位置」のデータおよび「文字列
書式修飾データ」の中の「ピッチ」はデフォルト値また
は設定値にしたがって決められる。「文字列書式・修飾
データ」や「大きさ」、「線太さ」等の他のデータは予
め設定されているものに決められる。たとえば、数値デ
ータは右づめ、文字列はセンタリングで記入される。ま
た、「色」は通常記入情報と同じもの(黒)が選ばれ
る。
【0224】レコード/文書要素データ変換部94で生
成された文書要素データは、先に「文書作成」ないし
「定義モード」で生成されている文書要素データと一緒
に文書要素データ記憶部38に格納される。したがっ
て、文書画像表示出力部40が、文書要素データ記憶部
38より(黒)の通常記入情報に対応する全ての文書要
素データを読み出し、それら読み出した文書要素データ
を1コマ(帳表)分の画像信号に変換することで、ディ
スプレイ画面20a上にたとえば図78に示すような帳
表出力画面が得られる。この画面内容を印字装置22で
プリントアウトできることはもちろんである。
【0225】上記したデータ出力処理はファイルから本
実施例の帳表へデータを出力する処理であったが、反対
に本実施例の帳表からファイルへデータを入力する処理
も上記と同様にして行うことができる。
【0226】上記した例では、他の記入情報を指定して
それに定義内容を委ねるような定義要素たとえば「項
目」、「範囲指定」、「定義要素指定」にそれぞれ図形
または記号“< >”,“[ ]”,“〇”を用い
たが、面模様等の面属性で置き換えることも可能である
(図5)。
【0227】図79に、項目定義用の定義要素に面模様
を用いる例を示す。セルまたはフィールドにおける面模
様は、図示のように当該セルまたはフィールドの全領域
にわたって記入されてよい。また、図示しないが、表の
外では、指定対象となる記入情報の記入領域に対して所
定の割合だけ大きな領域を面模様の記入範囲としてよ
い。
【0228】本発明における面属性としては、面模様の
外に背景面の色や濃淡等も使用可能である。たとえば
「色」を用いる場合は、「項目」を緑、「範囲指定」を
黄、「定義要素指定」を赤のように割り当ててよい。定
義要素に用いる面属性は、「定義要素テーブル」(図
5、図6)に登録しておく。
【0229】このような面属性(模様、色、濃淡等)
も、従来公知の方法により文字図形要素認識部34で認
識され、たとえば図80に示すようなデータフォーマッ
トで該当文書要素データが生成される。
【0230】なお、面属性を定義情報に用いる場合、定
義内容の表示の処理では、推定定義内容を表す記入情報
をたとえば点滅表示することで、確定定義内容と推定定
義内容との区別ができる。
【0231】面属性の別の応用例として、データ項目間
の区別に面属性を用いることができる。たとえば図81
および図82に示すように、「品番」に黄、「分類」に
緑、単価に赤、…を割り当てることで、帳表内の各デー
タ項目エリアを区別することができる。この場合も、定
義用の面属性として指定した色は、たとえばデータ辞書
に登録しておく。
【0232】データ項目名のエリアとデータ列のエリア
とを区別するために、図81の例では背景面模様を用い
ており、図82の例では定義要素記号を用いている。あ
るいは、このような背景面模様や定義要素記号等を一切
省き、上記したような推定機能においてデータ辞書や応
用用語辞書等を用いてデータ項目名、データ列、フィー
ルドまたは応用用語(たとえば「計」)等の区別を行う
ことも可能である。
【0233】面属性の記入情報も、他の記入情報と同様
に、用紙上の記入情報としてイメージスキャナ10を通
して入力されてもよいし、あるいは画面上指示部74を
通してディスプレイ画面20a上から入力されてもよ
い。面属性の記入情報は、定義内容を表示するときにの
み(入力は別の方法で)用いることもできる。
【0234】本実施例のシステムでは、推定処理の効率
化を図るうえで、「範囲指定」または「定義情報指定
外」の定義要素は便利である。
【0235】図83に、この種の定義要素の使用例を示
す。定義専用情報を追記した図示の入力帳表文書では、
表を中心に、上は全部の注釈文、下は計算式の注釈文字
列“売上高=単価×売上数”までを含むように、(青)
で「範囲指定」の定義要素記入情報“「”,“」”を記
入している。
【0236】システムでは、定義内容認識処理(ステッ
プA2 )で、図84に示すようなデータフォーマットで
この「範囲指定」の定義要素記入情報“「 」”に対
応する「定義範囲指示データ」を作成し、帳表管理デー
タ(図28)でポイントしておく。
【0237】この「定義範囲指示データ」を受けて、定
義内容認識処理(ステップA2 )および定義内容推定処
理(ステップA3 )では、この記入情報“「 」”で
指示される範囲内の記入情報についてのみ定義認識処理
および定義推定処理をそれぞれ実行し、この範囲の外に
ある記入情報を処理の対象外とする。
【0238】また、図83の記入例では、表の上の注釈
文字列“支店名 神田”に(青)で「定義情報指定外」
の定義要素記入情報“=”を上書きしている。この定義
要素記入情報“=”に対し、システムでは、定義内容認
識処理(ステップA2 )で、図85に示すようなデータ
フォーマットで「定義外指示データ」を作成する。この
「定義外指示データ」を受け、定義内容推定処理(ステ
ップA3 )では、指示対象の文字列“支店名 神田”を
無視する。
【0239】なお、「定義情報指定外」の定義要素記入
情報として“=”の外に“{ }”も使用可能であ
る。したがって、注釈文字列“支店名 神田”を(青)
の定義要素記入情報“{ }”で括って“{支店名
神田}”としても、上記と同様に定義内容の対象外とす
ることができる。
【0240】また、図83の記入例では、「データ項目
名」の定義専用記入情報として(青)で追記された文字
列“分類”、“品番”、“年度”について「項目」の定
義要素記入情報“< >”を省略している。この場
合、システムでは、定義内容認識処理(ステップA2 )
では該当の定義データを生成することはできないが、定
義内容推定処理(ステップA3 )の方で該当の推定定義
データを生成することができる。
【0241】定義内容推定処理のフィールドの推定(ス
テップE2 )では、図86に示すように、結合線で指示
されるセルを基準として、そのセルを含む縦方向のセル
列および横方向のセル列をそれぞれ下方向フィールド候
補および右方フィールド候補と推定する。
【0242】因に、定義専用記入情報のデータ項目名文
字列が表の中に記入されているときは、図87に示すよ
うに、そのデータ項目名文字列が記入されているセルを
基準として、そのセルを含む縦方向のセル列および横方
向のセル列をそれぞれ下方向フィールド候補および右方
フィールド候補と推定する。
【0243】推定項目が少ないアプリケーションでは、
上記のような定義情報の記入の簡略化は有効である。
「推定ボタン」を省いて「確定ボタン」だけでユーザに
定義作成の操作を行わせ、システム側では上記実施例と
同様に定義内容認識処理(ステップA2 )および定義内
容推定処理(ステップA3 )を実行し、各々の処理で生
成した定義データおよび推定定義データを一律に扱う
(たとえば全て確定した定義データとして扱う)ように
してもよい。
【0244】また、システム内では、定義内容が確定し
た時点で、帳表文書上の文字・文字列の文字サイズ、太
さ、書体、ピッチ等を揃える際には、種々の基準を選択
することができる。たとえば、1つの表内のデータ項
目名文字列の大きさ、書体、文字太さ、同一データ項
目名に対応するデータ名文字列の大きさ、書体、文字太
さ等を基準とすることができる。このような場合(,
)には、例示記入文字の読み取り値に最も近い装置用
意値等を基準とすることができる。上記した例のよう
に、例示記入文字列が手書きでラフな場合は、予め設定
された標準値を基準としてもよい。
【0245】また、上記した例では、ユーザ側が予め設
定した識別情報(たとえば特定の色)を付けて定義専用
記入情報を追記したが、所定のモード(定義モード)を
指定し、そのモード下で画面上から記入することも可能
である。この場合、ユーザはメインモードにおいて「定
義」ボタンを選択指示する。この操作に応動して、シス
テムは、画面20aに「データ管理」、「書式定義」、
「編集構成定義」…等の定義系のメニューを表示する。
ユーザは、このメニューの中から所望の定義系たとえば
「データ管理」を選択し、ワープロ機能を用いて所望の
定義専用情報を記入する。システムは、入力された記入
情報を「データ管理」系の定義専用情報として処理する
とともに、画面上では予め設定してある識別情報(たと
えば青)を付けて表示する。
【0246】また、本実施例における「合計チェック」
処理(図40のステップD4 )は、たとえば図88に示
すように集計項目のフィールドおよび合計フィールドに
予めデータ数値が記入されている帳表(入力帳表等)の
場合には、次のような手順で実行される。
【0247】先ず、該当の推定フィールド中のデータ
数値を全部読み出し、それらを加算して合計値を求め
る。
【0248】次に、該当の推定合計フィールドのデー
タ数値を読み出し、この記入合計数値をの合計値と比
較する。
【0249】全てのデータ記入済み(合計フィールド
記入済み)集計項目推定フィールドについて、上記加算
合計値と推定合計フィールド記入合計数値との一致が成
立したときはOKとし、次の推定手順に進む。
【0250】上記加算合計値と記入合計数値とが一致
しない集計項目が1つでもあれば、該当の集計項目の推
定フィールドと推定合計フィールドについて再度文字認
識処理を行う。なお、装置に別アルゴリズムの文字認識
が備わっているときは、この文字認識で再度の帳表入力
を行う。
【0251】再度の文字認識でも不一致のときは、今
回の推定結果は不可とし、推定手順中の次のステップに
進む。すなわち、次の候補があれば、同候補について上
記と同様の処理を行う。次の候補がなければ、「推定不
可」のメッセージを出して処理を終了する。
【0252】このフィールド内の記入数値の合計と該当
合計フィールド内の記入数値との突き合わせチェック
は、ユーザが確定的に指定した項目定義についても行っ
てよい。すなわち、両者の突き合わせが不一致の場合、
OCR(光学文字読取)認識の誤りであるとして、該当
のメッセージを表示するとともに、該当のフィールドと
合計フィールドを特殊表示する。
【0253】なお、本発明は、上記した本発明の機能を
実現するためのプログラムまたはソフトウェアを用い
る。かかるソフトウェアは、任意の媒体を介して、たと
えば蓄積媒体あるいはオンライン等により本発明のシス
テムにインストールされ得るものである。したがって、
本発明に係るソフトウェアを格納した蓄積媒体、および
該ソフトウェアをオンラインでシステムにインストロー
ルする行為等は本発明の実施の一形態である。
【0254】
【発明の効果】以上説明したように、本発明によれば、
電子化された帳表を作成するシステムに、入力された帳
表文書の基本項目を基に帳表に関する定義を自動的に推
定する機能をもたせることにより、ユーザの負担を軽減
し、簡単なユーザ操作で所望の帳表を作成することがで
きる。
【0255】また、電子化された帳表を作成するに際
し、ユーザ側からの指示と装置側の推定とを自由に組み
合わせることができるようにし、さらには装置側の定義
推定結果をユーザが容易に修正できるようにしたので、
所望の帳表を自由に効率良く作成することができる。
【図面の簡単な説明】
【図1】本発明の一実施例による情報処理装置のハード
ウェア上のシステム構成例を示すブロック図である。
【図2】実施例のシステムにおいて帳表の作成に関する
動作モードの一覧を示す図である。
【図3】実施例のシステムにおける「主モード一覧メニ
ュー画面」を示す図である。
【図4】実施例における「環境設定モード画面」を示す
図である。
【図5】実施例における「定義要素/記入情報対照表」
(その1)を示す図である。
【図6】実施例における「定義要素/記入情報対照表」
(その2)を示す図である。
【図7】実施例における「定義要素識別データ」のデー
タフォーマット例を示す図である。
【図8】実施例における「定義情報区別指示画面」を示
す図である。
【図9】実施例における「定義情報区別データ」のデー
タフォーマット例を示す図である。
【図10】実施例における「メインモード画面」を示す
図である。
【図11】実施例において「帳表作成」で用いられる帳
表用紙の一例を示す図である。
【図12】図11の帳表に定義支援情報を追記入した例
を示す図である。
【図13】実施例における文書入力および文書要素デー
タ生成部の構成を示すブロック図である。
【図14】実施例における「画像管理データ」のデータ
フォーマット例を示す図である。
【図15】実施例における「画像管理データ」の対象と
なる入力画像の構成を示す図である。
【図16】実施例における「文字データ」のデータフォ
ーマット例を示す図である。
【図17】実施例における「文字列データ」のデータフ
ォーマット例を示す図である。
【図18】実施例における「図形要素データ」(線分)
のデータフォーマット例を示す図である。
【図19】実施例における「図形要素データ」(長円)
のデータフォーマット例を示す図である。
【図20】実施例における「図形要素データ」(矩形)
のデータフォーマット例を示す図である。
【図21】実施例における「セルデータ」のデータフォ
ーマット例を示す図である。
【図22】実施例における定義内容認識/推定部の構成
を示すブロック図である。
【図23】実施例の定義内容認識/推定部における処理
の手順を示す図である。
【図24】実施例における定義内容認識処理の手順を示
す図である。
【図25】実施例における「定義要素データ」のデータ
フォーマット例を示す図である。
【図26】実施例における「項目定義データ」のデータ
フォーマット例を示す図である。
【図27】実施例における「フィールド内セルデータ・
チェイン」の構造を概念的に示す図である。
【図28】実施例における「帳表管理データ」のデータ
フォーマット例を示す図である。
【図29】実施例における「定義内容推定処理」の手順
を示す図である。
【図30】実施例における「サーチデータ」のデータフ
ォーマット例を示す図である。
【図31】実施例における「応用用語辞書」に収載され
ている用語の例を示す図である。
【図32】実施例における「辞書用語データ」のデータ
フォーマット例を示す図である。
【図33】実施例における「データ定義書」の一例を示
す図である。
【図34】実施例における「商品管理ファイル」の定義
書(一例)を示す図である。
【図35】実施例における「支店管理ファイル」の定義
書(一例)を示す図である。
【図36】実施例における「計算式定義データ」のデー
タフォーマットの一例を示す図である。
【図37】実施例における「表外項目定義推定処理」の
作用を説明するための図である。
【図38】実施例における「表外項目定義推定処理」の
作用を説明するための図である。
【図39】実施例における「表外項目定義推定処理」の
作用を説明するための図である。
【図40】実施例における「表内項目定義/合計定義推
定処理」の手順を示す図である。
【図41】実施例における「データ名に基づく項目定義
の推定処理」の手順を示す図である。
【図42】実施例における「合計定義の推定処理」の手
順を示す図である。
【図43】実施例における「残りのデータ項目名に基づ
く項目定義の推定処理」の手順を示す図である。
【図44】実施例におけるフィールド候補の概念を示す
図である。
【図45】実施例におけるフィールド候補の範囲の概念
を示す図である。
【図46】実施例における「ダミーセルデータ」の概念
を示す図である。
【図47】実施例におけるフィールド候補の組み合わせ
の一例を示す図である。
【図48】実施例におけるフィールド候補の組み合わせ
の別の例を示す図である。
【図49】実施例におけるフィールド候補の組み合わせ
の他の例を示す図である。
【図50】実施例における「推定項目定義データ群」の
概念を示す図である。
【図51】実施例における推定定義データ記憶部内の候
補エリアの概念を示す図である。
【図52】実施例における「合計定義の推定処理」の作
用を説明するための図である。
【図53】実施例における「合計定義データ」のデータ
フォーマット例を示す図である。
【図54】実施例におけるフィールド候補の範囲の揃え
を示す図である。
【図55】実施例における定義内容表示出力部の構成を
示すブロック図である。
【図56】実施例における「定義内容表示処理」の手順
を示す図である。
【図57】実施例における「定義内容表示処理」の作用
を説明するための図である。
【図58】実施例における「定義内容表示処理」の作用
を説明するための図である。
【図59】実施例で表示出力される定義情報入り帳表文
書を示す図である。
【図60】実施例における「定義内容確定処理」の手順
を示す図である。
【図61】実施例において定義内容が確定された帳表文
書を示す図である。
【図62】実施例で表示出力される推定定義内容の一例
を示す図である。
【図63】実施例で表示出力される推定定義内容の別の
例を示す図である。
【図64】実施例における画面上の編集校正の一例を示
す図である。
【図65】実施例における画面上の編集校正の作用を示
す図である。
【図66】実施例における画面上の編集校正の作用を示
す図である。
【図67】実施例における画面上からのコマンドによる
定義情報入力操作の一例を示す図である。
【図68】実施例における画面上からのコマンドによる
定義情報入力操作の一例を示す図である。
【図69】実施例における「データ名に基づく項目定義
の推定処理」の適用可能な帳表を示す図である。
【図70】実施例における「データ名に基づく項目定義
の推定処理」の処理結果としての帳表を示す図である。
【図71】実施例における「出力元ファイル一覧」画面
を示す図である。
【図72】実施例におけるデータ出力部の構成を示す図
である。
【図73】実施例における「売上げファイル」のレコー
ド管理テーブルおよびファイルレコードのフォーマット
例を示す図である。
【図74】実施例における「データ項目対照テーブル」
を示す図である。
【図75】実施例において出力元ファイル側のデータ項
目をシステム内のデータ項目に変換する処理を示す図で
ある。
【図76】実施例におけるソート処理後のファイルレコ
ードの配列順序を示す図である。
【図77】実施例において帳表定義の実行処理を終えた
ファイルレコードの内容(一例)を示す図である。
【図78】実施例における帳表出力画面を示す図であ
る。
【図79】実施例における面模様の応用例を示す図であ
る。
【図80】実施例における「面属性データ」のデータフ
ォーマット例を示す図である。
【図81】実施例における面属性の別の応用例を示す図
である。
【図82】実施例における面属性の他の応用例を示す図
である。
【図83】実施例における「範囲指定」および「定義情
報指定外」の定義要素の使用例を示す図である。
【図84】実施例における「定義範囲指示データ」のデ
ータフォーマット例を示す図である。
【図85】実施例における「定義外指示データ」のデー
タフォーマットを示す図である。
【図86】実施例におけるフィールド推定の一例を示す
図である。
【図87】実施例におけるフィールド推定の別の例を示
す図である。
【図88】実施例における「合計チェック」処理の適用
可能な帳表を示す図である。
【符号の説明】
10 カラーイメージスキャナ 12 キーボード 14 マウス 15 タブレット 16 内部メモリ 18 外部メモリ 20 表示装置 24 CPU(マイクロプロセッサ) 26 通信装置 34 文字・図形要素認識部 37 文字・図形要素入力部 38 文書要素データ記憶部 40 文書画像表示出力部 46 定義内容構成則記憶部 48 定義要素識別データ記憶部 50 定義情報区別データ記憶部 52 応用用語辞書 54 定義要素データ生成部 54 定義データ記憶部 56 シートグルーブ定義データ記憶部 60 推定定義データ生成部 62 データ辞書 68 定義内容推定則記憶部 70 推定定義データ記憶部 74 画面上指示部 80 単位定義情報処理部 82 定義要素配置則記憶部 84 推定定義情報区別データ 90 定義実行部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 文書中に文字、記号、図形または面属性
    の形態で記入された記入情報を介して帳表のフォーマッ
    トを入力する工程と、 入力した前記記入情報に基づいて前記帳表内の定義内容
    を推定する工程と、 推定した前記定義内容を規定する推定定義データを生成
    する工程と、 推定した前記定義内容を所定の識別情報を有する記入情
    報を介して表示出力する工程と、 確定指示された前記推定定義内容を確定された定義内容
    とし、前記推定定義データを確定的な定義データに変更
    する工程とを有する情報処理装置における帳表作成方
    法。
  2. 【請求項2】 文書中に文字、記号、図形または面属性
    の形態で記入された記入情報を介して帳表のフォーマッ
    トを入力する工程と、 入力した前記記入情報の中で第1の識別情報を有する第
    1の記入情報に基づいて前記帳表内の1つまたは複数の
    定義内容を認識する工程と、 認識した前記定義内容を規定する確定的な定義データを
    生成する工程と、 入力した前記記入情報の中で第2の識別情報を有する第
    2の記入情報に基づいて前記帳表内の1つまたは複数の
    定義内容を推定する工程と、 推定した前記定義内容を規定する推定定義データを生成
    する工程と、 推定した前記定義内容を第3の識別情報を有する記入情
    報を介して表示出力する工程と、 確定指示された前記推定定義内容を確定された定義内容
    とし、前記推定定義データを確定的な定義データに変更
    する工程とを有する情報処理装置における帳表作成方
    法。
  3. 【請求項3】 前記定義内容推定工程が、入力した前記
    記入情報の中から予め登録されている記入情報を識別す
    る工程と、前記識別した記入情報の記入態様が予め登録
    されている定義内容推定規則の条件を満たすか否かを判
    定する工程と、前記判定条件の成立した定義内容を前記
    識別した記入情報に関連させて定義する推定定義データ
    を生成する工程とを有することを特徴とする請求項1ま
    たは2に記載の帳表作成方法。
  4. 【請求項4】 前記定義内容推定工程が優先順位の異な
    る複数の推定工程を含み、優先順位の低い推定工程はそ
    れよりも先に行われる優先順位の高い推定工程で推定さ
    れた定義内容に抵触しない範囲で定義内容を推定するこ
    とを特徴とする請求項1または2に記載の帳表作成方
    法。
  5. 【請求項5】 前記定義内容推定工程が、それよりも先
    に行われる前記定義内容認識工程で認識された定義内容
    に抵触しない範囲で定義内容を推定することを特徴とす
    る請求項2に記載の帳表作成方法。
  6. 【請求項6】 前記表示出力工程が、予め登録されてい
    る定義内容構成則にしたがって個々の前記推定定義デー
    タを1個または複数個の単位定義情報に分解する工程
    と、予め登録されている定義要素配置則にしたがって個
    々の前記単位定義情報に対応する記入情報を生成する工
    程とを含むことを特徴とする請求項1または2に記載の
    帳表作成方法。
  7. 【請求項7】 文書中に文字、記号、図形または面属性
    の形態で記入された記入情報を介して帳表のフォーマッ
    トを入力する記入情報入力手段と、 前記記入情報入力手段により入力された前記記入情報に
    基づいて前記帳表内の定義内容を推定し、推定した前記
    定義内容を規定する推定定義データを生成する定義内容
    推定手段と、 前記定義内容推定手段により推定された前記定義内容を
    所定の識別情報を有する記入情報を介して表示出力する
    定義内容表示出力手段と、 所定の確定指示に応答して前記推定定義内容を確定され
    た定義内容とし、前記推定定義データを確定的な定義デ
    ータに変更する定義内容確定手段とを有する情報処理装
    置。
  8. 【請求項8】 前記定義内容推定手段が、推定上の拠点
    になり得る記入情報として予め設定された用語、データ
    項目名および/またはデータ名をコードの形で登録して
    保持する記憶手段を含むことを特徴とする請求項7に記
    載の情報処理装置。
  9. 【請求項9】 前記定義内容推定手段が、所定の記入情
    報に対して所定の定義内容を推定するための記入態様上
    の規則をアルゴリズムとして設定登録しておく記憶手段
    を含むことを特徴とする請求項7に記載の情報処理装
    置。
  10. 【請求項10】 前記定義内容表示出力手段が、個々の
    前記推定定義データを1個または複数個の単位定義情報
    に分解するための定義内容構成則をアルゴリズムとして
    設定登録しておく記憶手段を含むことを特徴とする請求
    項7に記載の情報処理装置。
  11. 【請求項11】 前記定義内容表示出力手段が、個々の
    前記単位定義情報に対応する記入情報を生成するための
    定義要素配置則をアルゴリズムとして設定登録しておく
    記憶手段を含むことを特徴とする請求項7に記載の情報
    処理装置。
  12. 【請求項12】 所定のコマンドの入力に応動し、その
    コマンドで指示される定義内容を規定する定義データを
    生成する手段と、 予め登録されている定義内容構成則にしたがって個々の
    前記定義データを1個または複数個の単位定義情報に分
    解する手段と、 予め登録されている定義要素配置則にしたがって個々の
    前記単位定義情報に対応する記入情報を生成する手段と
    を有する情報処理装置。
JP4852699A 1998-02-27 1999-02-25 情報処理装置及び帳表作成方法 Pending JPH11316792A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4852699A JPH11316792A (ja) 1998-02-27 1999-02-25 情報処理装置及び帳表作成方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP6453398 1998-02-27
JP10-64533 1998-02-27
JP4852699A JPH11316792A (ja) 1998-02-27 1999-02-25 情報処理装置及び帳表作成方法

Publications (1)

Publication Number Publication Date
JPH11316792A true JPH11316792A (ja) 1999-11-16

Family

ID=26388814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4852699A Pending JPH11316792A (ja) 1998-02-27 1999-02-25 情報処理装置及び帳表作成方法

Country Status (1)

Country Link
JP (1) JPH11316792A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100407125C (zh) * 2005-03-04 2008-07-30 佳能株式会社 布局控制装置和布局控制方法
US7735004B2 (en) 2004-01-30 2010-06-08 Canon Kabushiki Kaisha Layout control method, layout control apparatus, and layout control program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7735004B2 (en) 2004-01-30 2010-06-08 Canon Kabushiki Kaisha Layout control method, layout control apparatus, and layout control program
CN100407125C (zh) * 2005-03-04 2008-07-30 佳能株式会社 布局控制装置和布局控制方法
US7900139B2 (en) 2005-03-04 2011-03-01 Canon Kabushiki Kaisha Layout control apparatus, layout control method, and layout control program

Similar Documents

Publication Publication Date Title
JP4356847B2 (ja) フィールド定義情報生成方法、ならびび、フィールド定義情報生成装置
US6289254B1 (en) Parts selection apparatus and parts selection system with CAD function
JP3425408B2 (ja) 文書読取装置
KR930009639B1 (ko) 화상데이타를 이용하는 문서데이타 처리방법 및 장치
US7996761B2 (en) Table format data processing method and table format data processing
US20010014176A1 (en) Document image processing device and method thereof
JPH07200786A (ja) ファイリング装置
US4677585A (en) Method for obtaining common mode information and common field attribute information for a plurality of card images
JPH11316792A (ja) 情報処理装置及び帳表作成方法
JP4405604B2 (ja) 情報処理装置及び定義方法
JP4462508B2 (ja) 情報処理装置並びに定義情報生成方法
JPH08180066A (ja) インデックス作成方法、文書検索方法及び文書検索装置
JP3663865B2 (ja) 帳票処理装置及び記憶媒体
WO2005103993A1 (ja) 表フォーマットデータ処理の方法、装置及びプログラム
JP2000163271A (ja) 情報処理方法および装置
JP2001357342A (ja) 情報処理方法および装置
US7302641B1 (en) Information processing method and apparatus for making document
JP2006119816A (ja) 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置
JP2004127059A (ja) 情報処理方法および装置
JP2001005904A (ja) 情報処理装置ならびに帳表作成方法
JP2000315243A (ja) 情報処理装置およびグラフ定義方法
JP3008431B2 (ja) 文書処理装置
JP2000155794A (ja) 情報処理方法および装置
JP2000268106A (ja) 帳票処理装置およびそのプログラム記録媒体
JPH03134771A (ja) 画面帳票形式の自動作成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061016

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070109