JP4462508B2 - Information processing apparatus and definition information generation method - Google Patents

Information processing apparatus and definition information generation method Download PDF

Info

Publication number
JP4462508B2
JP4462508B2 JP14347297A JP14347297A JP4462508B2 JP 4462508 B2 JP4462508 B2 JP 4462508B2 JP 14347297 A JP14347297 A JP 14347297A JP 14347297 A JP14347297 A JP 14347297A JP 4462508 B2 JP4462508 B2 JP 4462508B2
Authority
JP
Japan
Prior art keywords
information
data
definition
document
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14347297A
Other languages
Japanese (ja)
Other versions
JPH10320492A (en
Inventor
万太郎 矢島
Original Assignee
万太郎 矢島
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 万太郎 矢島 filed Critical 万太郎 矢島
Priority to JP14347297A priority Critical patent/JP4462508B2/en
Publication of JPH10320492A publication Critical patent/JPH10320492A/en
Application granted granted Critical
Publication of JP4462508B2 publication Critical patent/JP4462508B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0010】
【発明の属する技術分野】
本発明は、文書処理/管理およびデータ処理/管理を行う情報処理方法および装置に関する。
【0020】
【従来の技術】
情報処理装置(コンピュータシステム)では、応用システムを構築する際に、そのアプリケーションで使用され得るデータおよびその属性を定義し登録しておく必要がある。また、システムに個々のデータベースまたはファイルを設ける場合には、そのファイルの属性(ファイル名、フィールド名称、レコード長等)を登録しておく必要がある。
【0030】
従来より、上記のような「データ定義」、「データ定義」は、専用プログラムを使用し、この専用プログラムの提示する設定画面の所定の欄にシステム運用者が仕様書または定義書の必要事項を画面上から入力することで行われる。
【0040】
また、アプリケーションにおいて、たとえば帳表の作成は次のようにして行われている。すなわち、キーボード操作ないしマウス操作によって画面上に任意の表罫線および文字列を入力すると、各々の画面入力データが帳表の定義情報とみなされ、それらの定義情報に基づいて帳表のフォーマットが設定される。
【0050】
また、やはりマウス操作等により、画面上に表罫線を入力してその中の所望のフィールド(領域)を指定すると、そのフィールドに関係した各種属性または定義事項をリストした副画面が現れ、そのリストの中の所望の事項を1つ選択すると、その選択した定義事項によって当該フィールド分の1つのフォーマットが定義(設定)されるようにしたものもある。
【0060】
また、アプリケーションにおいて、コマンドを定義するには、キーボードや画面上のボタンから所定の言語(たとえばVisual Basic)により決められた特殊なコマンド語を設定入力するようにしている。
【0080】
【発明が解決しようとする課題】
ユーザが装置による制約なく自由に作成した文書上においてシステムに何らかの処理、動作を指示するコマンドの定義は、ユーザにとって覚えなくてはならない事項がまだ多い上、定義内容の種別も著しく制限されていた。
【0120】
本発明の目的は、ユーザが自由に作成した文書上において、ユーザにとって覚えごとが非常に少ない簡単な記入操作によって多種多様なコマンドを定義できるようにした情報処理装置並びに定義情報生成方法を提供することにある。
【0130】
【課題を解決するための手段】
上記の目的を達成するために、本発明の中、請求項1に記載の方法は、情報処理システムにおいて、システムに対してある動作または処理をおこなうべく指示するコマンド定義情報の生成方法であって、
システム内において文書上の各記号または各文字列についてコード列情報と位置情報を登録した文書データを格納する文書データ格納手段と、
特定の記号または用語についてコード列情報と上記コマンド定義上の意味情報とを対応させて登録した辞書データを格納する辞書格納手段とを備えた情報処理システムにあって、
上記辞書データ中に登録された特定の記号または用語であって、文書上において記載された他の記入情報に付加記入することによって、付加記入された当該の他の記入情報をシステムに対するコマンド定義情報に転化させる指定をおこなう第1の記入情報を、上記辞書データ中に登録した該当コード列情報と上記文書データを構成する各記号または各文字列のコード列情報との間の照合を繰り返すことによって文書上から検出するステップと、
検出した上記第1の記入情報と文書上において特定の配置関係にある記号または文字列である第2の記入情報を、当該の第1の記入情報の位置情報と、上記文書データを構成する各記号または各文字列の位置情報との間の照合を繰り返すことによって識別するステップと、
文書上において識別した上記第2の記入情報について、そのコード列情報と上記辞書データに登録された各記号または各用語のコード列情報との間の照合を繰り返すことにより、上記辞書データ中において上記第2の記入情報に対応して登録されているコマンド定義上の意味情報を識別し、該当する処理をシステムに指示するコマンド情報を生成するステップと、
を有することを特徴とする。
【0140】
また、請求項2に記載の方法は、請求項1に記載の発明において、文書上において上記コマンド定義のオペランドを指定するものとして特に定めた記号である第3の記入情報を、その該当コード列情報と上記文書データを構成する各記号または各文字列のコード列情報との間の照合を繰り返すことによって、文書上から検出するステップと、
検出した第3の記入情報と文書上において特定の配置関係にある記号または文字列である第4の記入情報を、当該第3の記入情報の位置情報と、上記文書データを構成する各記号または各文字列の位置情報との間の照合を繰り返すことによって、識別するステップと、
を有し、識別した第4の記入情報に基づいて該当のコマンド定義情報のオペランドを生成することを特徴とする。
また、請求項3に記載の方法は、請求項1ならびに請求項2に記載の発明において、文書データ格納手段に保持される文書データは、文書上の各文字または文字列について色情報を含む修飾情報を備え、
予め定めた修飾情報をもつ記入情報を、当該の修飾情報と上記文書データ中の各記号または文字列に備えた修飾情報との間の照合を繰り返すことにより文書上から検出した後、検出した当該修飾情報をもつ記号または文字列の中から上記第1の記入情報を文書上から検出することを特徴とする。
【0150】
また、請求項4に記載の情報処理装置は、装置に対してある動作、または、データ処理をおこなうべく指示するコマンド定義情報の生成をおこなう情報処理装置であって、
システム内において文書上の各記号または各文字列についてコード列情報と位置情報を登録した文書データを格納する文書データ格納手段と、
特定の記号または用語についてコード列情報と上記コマンド定義上の意味情報とを対応させて登録した辞書データを格納する辞書格納手段とを備えた情報処理装置にあって、
上記辞書データ中に登録された特定の記号または用語であって、文書上において記載された他の記入情報に付加記入することによって、付加記入された当該の他の記入情報をシステムに対するコマンド定義情報に転化させる指定をおこなう第1の記入情報を、上記辞書データ中に登録した該当コード列情報と上記文書データを構成する各記号または各文字列のコード列情報との間の照合を繰り返すことによって、文書上から検出する手段と、
検出した上記第1の記入情報と文書上において特定の配置関係にある記号または文字列である第2の記入情報を、当該第1の記入情報の位置情報と、上記文書データを構成する各記号または各文字列の位置情報との間の照合を繰り返すことによって、識別する手段と、
文書上において識別した上記第2の記入情報について、そのコード列情報と上記辞書データに登録された各記号または各用語のコード列情報との間の照合を繰り返すことにより、上記辞書データ中において上記第2の記入情報に対応して登録されているコマンド定義上の意味情報を識別し、該当する処理をシステムに指示するコマンド情報を生成する手段と、
を有することを特徴とする。
【0160】
【発明の実施の形態】
以下、添付図を参照して本発明の実施例を説明する。
【0170】
図1に、本発明の一実施例における情報処理装置のハードウェア上のシステム構成を示す。このシステムにおいて、カラーイメージ・スキャナ10、キーボード12、マウス14およびディジタイザ15が入力装置として、内部メモリ16および外部メモリ18が記憶装置として、表示装置20および印字装置22が出力装置として、それぞれ適当なインタフェース回路(図示せず)を介してCPU24に接続されている。また、CPU24は、通信装置26を介して電話回線または通信回線27とも接続されている。
【0180】
カラーイメージ・スキャナ10は、用紙上に記載された文書中の文字、記号および図形をカラー画像情報として読み取る。内部メモリ16および外部メモリ18には、CPU24の処理または制御動作を規定する各種プログラムのほか、各種電子辞書、キャラクタフォント、ファイル等が格納されている。通信装置26は、ファクシミリ通信機能を有している。
【0190】
図2に、本実施例のシステムにおいて帳表の作成に関する動作モードの一覧を示す。「メイン」、「定義」、「環境設定」等の主モードが設定されており、これらの主モードはそれぞれ「取り出し」…、「定義解釈」…、「定義区別設定」等のサブモードに分岐している。
【0200】
図3に、表示装置20のディスプレイ画面20aに表示される「主モード一覧メニュー」を示す。このメニュー画面では、画面の右下部に「メイン」、「定義」、「環境設定」等の主モード選択ボタンが表示される。
【0210】
上記の「主モード一覧メニュー」で、「環境設定」ボタンをクリックすると、環境設定モードが選択される。この環境設定モードに切り替わると、ディスプレイ画面20aに図4に示すような画面が映し出され、画面の右下部に「定義区別設定」、「定義情報設定」等のサブモード選択ボタンが表示される。ここで、「定義情報設定」ボタンをクリックすると、定義情報設定モードに入り、図5〜図8に示すような「定義要素/記入情報対照表」が画面に表示される。
【0220】
図5〜図8において、本実施例では、「共通」、「データ管理」、「データ定義」、「ファイル定義」、「コマンド/手順定義」、「書式定義」、「編集校正定義」等の複数の定義系が用意され、各定義系の中に複数の定義要素が設定されている。これらの定義系のうち、「データ管理」、「データ定義」、「ファイル定義」または「コマンド/手順定義」系の各定義要素はデータ管理上のフォーマットを設定するために用いられ、「書式定義」または「編集校正定義」系の各定義要素は文書の書式上のフォーマットを設定するために用いられる。「共通」の各定義要素は、「データ管理」、「データ定義」、「ファイル定義」、「コマンド/手順定義」、「書式定義」、「編集校正定義」系の各フォーマットに共用される。
【0230】
図5〜図8に示すように、各定義要素には、1種類または複数種類の所定の文字(文字列)、記号または図形が対応づけられている。定義要素の中には、たとえば「データ管理」系の定義要素「丸め方」に対応する“切上げ”のようにその記入情報だけで目的の定義内容を表すものもあれば、たとえば「共通」系の「項目名」に対応する“< >”のように、他の記入情報を指定し、その指定した他の記入情報に定義内容を委ねるものもある。また、「共通」系の定義要素「定義要素指定」に対応する“〇”のように、この記入情報によって指定された領域内に記入されている通常記入情報の文字、記号等を定義要素に転化させるべきことを指示するか、あるいは用語辞書を参照して特定の定義内容に解釈すべきことを指示するものもある。
【0240】
また、「データ定義」系における「区分」と「数値」,「テキスト」,「集計数値」との関係のように、互いに対の関係となるデータ項目名(区分)とデータ名(数値,テキスト,集計数値)とがそれぞれ個別的な定義要素として登録される場合は、この対の関係が対象表の中でも判るように表示される。
【0250】
上記のような定義要素と記入情報との対応付けは、システムが最初から用意していてもよく、あるいはユーザが画面入力で随時設定登録できるようにしてもよい。いずれにしても、たとえば図9に示すようなデータフォーマットで、各定義要素毎に図5〜図8の対照表に相当する可変データ長の定義要素識別データが設定される。各定義要素識別データは、後述する定義情報認識部の定義要素識別データ記憶部48(図25)に保持される。
【0260】
なお、図9の「定義要素識別データ」のデータフォーマットにおいて、「定義系コード」のデータ・フィールドには当該定義要素(たとえば「右づめ」)の属する定義系(書式定義)のコードがセットされ、「定義要素種別」のデータ・フィールドには当該定義要素(右づめ)のコードがセットされ、「構成文字列/記号列」の各データ・フィールドには当該定義要素(右づめ)に対応する文字列または記号(「右」,「右づめ」,「右寄せ」)のコードが所定の区切り識別データを挟んでセットされ、末尾のフィールドにはこのデータの終端を示す所定の終端識別データが付けられる。
【0270】
「対関係の定義要素コード」のフィールドには、上記したように「データ定義」系における「区分」と(「数値」,「テキスト」,「集計数値」)のように、対の関係を有する他の定義要素コードがある場合に、該他の定義要素コードがセットされる。したがって、「区分」の「定義要素識別データ」であれば、このフィールドには、「数値」,「テキスト」および「集計数値」の各定義要素コードがセットされる。また、「数値」,「テキスト」または「集計数値」の「定義要素識別データ」であれば、このフィールドには、「区分」の「定義要素識別データ」がセットされる。
【0280】
上記のように、本実施例では、文書上で各種の定義を行うための定義要素が、通常の文書内容を表す通常記入情報としても利用可能な文字、記号または図形と対応づけられている。ただし、後述するように、定義要素として用いられるときは、当該記入情報に特別の修飾情報(たとえば色情報)を付し、文書内容を表す通常記入情報とは区別するようにしている。つまり、ユーザにあっては、普段使い慣れている記入情報を、文書内容を表すための通常記入情報としてそのまま使えるだけでなく、これに特別の修飾情報を付加することで定義内容を示すための定義情報としても使えるようになっている。
【0290】
図4の「環境設定モード画面」において「定義区別設定」のサブモード選択ボタンを選択すると、ディスプレイ画面20aには図10に示すような「定義情報区別指示画面」が現れる。
【0300】
図10において、[定義系]の欄には「データ管理」、「書式定義」、「編集校正定義」等の定義系がリストされている。ユーザは、各定義系の記入情報に用いる[色]、[線修飾]、[線太さ」、[手書き/印刷]の修飾情報または識別情報を各位置に入力すればよい。
【0310】
図10の例では、「データ管理」、「データ定義」、「ファイル定義」、「コマンド/手順定義」にはそれぞれ(青)、「書式定義」、「編集校正定義」にはそれぞれ(赤)を[色]の欄に入力している。なお、上記のように「共通」の各定義要素は全ての定義系に共用されるので、「共通」固有の修飾情報を設定する必要はない。
【0320】
この定義情報区別指示の入力操作に応動してシステム内では、たとえば図11に示すようなデータフォーマットで各定義系についての定義情報区別データが設定される。この定義情報区別データは、後述する定義情報認識部の定義情報区別データ記憶部50(図25)に保持される。
【0330】
図10に、主モードの1つである「メイン」モードの画面を示す。この「メイン」モード画面では、画面の右下部に「取り出し」、「格納」、「次」、「実行」等のサブモード選択ボタンが表示され、各サブモード選択ボタンをクリックすると各ボタンで表示されたサブモードに切り替わるようになっている。なお、電源投入直後のディスプレイ画面20a上にはデフォルトでこの「メイン」モード画面が現れ、画面の左下隅部に常時表示されている「モード」ボタンをクリックすると、上記の「主モード一覧メニュー」画面に切り替わるようになっている。
【0340】
次に、このシステムにおいて、アプリケーションたとえば帳表作成機能の前提としてシステムに設定登録される「データ定義」および「ファイル定義」の各機能について説明する。
【0350】
本例における「データ定義」を設定するには、たとえば図13に示すようなデータ定義書を用意する。このデータ定義書は、応用システムを構築するうえで使用され得るアプリケーション上のデータ項目名とその属性データ名とをリストしたものであり、たとえばシステムエンジニアの作成した仕様書をそのまま用いたものでもよく、あるいは「データ定義」の設定のために本システムの文書作成機能によって新規に作成したものでもよい。
【0360】
なお、本例において、このデータ定義書は、たとえば地色が白の用紙上に黒色の筆記具、インク、トナー等で文書内容が記述された書面であるとする。
【0370】
このデータ定義書では、縦および横方向にそれぞれ所定間隔で引かれた複数の罫線からなる表の中に、「データ定義」のためにシステムに予め登録されている複数の基本データ項目と各対応するアプリケーション上の所望のデータ名とが一覧形式で記載されている。
【0380】
すなわち、表の最上行に設けられた項目記入欄には、各セル(記入枠)に1個(1項目)ずつ、システムに登録されている基本データ項目「データ項目名」、「区分」、「対応マスタ名」、「同義語」を表す各文字列が記入されている。
【0390】
そして、上記項目記入欄の下に設けられているデータ名記入欄の第1行には、「データ項目名」のデータ名として文字列“分類”が、「区分」のデータ名として文字列“テキスト”が、「対応マスタ名」のデータ名として文字列“商品分類スタ”が、「同義語」のデータ名として文字列“商品分類”が各セル(記入枠)に1個(1データ名)ずつ記入されている。
【0400】
この1行(レコード)分の記載は、本システムにおいて、アプリケーション上の「データ項目」の1つとして「分類」を設定し、この「分類」を「テキスト」データとして扱い、「分類」の詳細な情報を「商品分類マスタ」ファイルに登録し、「商品分類」を「分類」と同義語とみなすことを意味している。
【0410】
データ名記入欄の第2行以下でも、アプリケーション上のデータ項目名として選択した「品番」、「売上高」、「単価」、……等の各々について、「区分」、「対応マスタ名」、「同義語」の各属性データ名を記入している。
【0420】
このように、このデータ定義書(図13)は通常記入情報(文書内容を表すために通常用いられている文字、記号または図形)からなる文書であり、その記載内容は取扱い者(たとえばシステムエンジニア)にとっては一目瞭然に理解できるものである。しかし、このままの文書内容で本システムに入力されたならば、単なる文書情報として認識されるにすぎず、実質的に定義書としての意味をなさない。
【0430】
そこで、本システムでは、通常記入情報からなる文書内容に所望の定義付けを支援するための定義支援情報を記入してシステムに入力することで、取扱い者が認識する通りの定義内容をシステムに認識させるようにしている。
【0440】
本例のデータ定義書(図13)については、たとえば図14に示すように「共通」および「データ定義」系の定義支援情報を(青)で記入すればよい。
【0450】
図14において、データ項目名記入欄では、(黒)のデータ項目名文字列“データ項目名”、“区分”、“対応マスタ名”、“同義語”を(青)の「定義要素指定」の定義要素記入情報“〇”で囲むとともに、(青)の「項目」の定義要素記入情報“< >”で括る。これにより、これらの文字列“データ項目名”、“区分”、“対応マスタ名”、“同義語”を定義要素記入情報に転化させるとともに、それぞれデータ項目名であることを定義したことになる。
【0460】
また、データ名記入欄では、各データ項目名「データ項目名」、「区分」、「対応マスタ名」、「同義語」に対応する縦方向の各フィールド(セル列)において最上段および最下段のセルに「範囲指定」の定義要素記入情報“[ ]”を記入する。これにより、これら縦方向の各フィールド(セル列)は各対応するデータ項目名のデータが記入されている、または記入されるべきデータ記入欄であることを定義したことになる。
【0470】
上記のように定義支援情報を追記入されたデータ定義書(図14)は、カラー・イメージスキャナ10より本システムに入力される。
【0480】
図15に、本実施例のシステムにおける文書入力および文書要素データ生成部の構成を示す。文書画像入力部30は、カラー・イメージスキャナ10、キーボード12およびマウス14等の入力装置と、入力ルーチンを実行するCPU24と、入力されたカラー画像をいったん取り込む内部メモリ16または外部メモリ18とによって構成される。文書画像記憶部32、文字/図形パターン辞書36および文書要素データ記憶部38は、内部メモリ16または外部メモリ18の記憶領域を用いている。文字・図形要素認識部34は、文字・図形認識処理プログラムを実行するCPU24によって構成される。文書画像出力部40は、主として、表示制御プログラムを実行するCPU24と、このCPU24の制御の下で文書画像の表示出力を行う表示装置20あるいは文書画像の伝送出力を行う通信装置26とによって構成される。
【0490】
文書画像記憶部32および文書要素データ記憶部38においては、入力された各書面または各頁PAi 毎に画像データを記憶する画像データエリア32(i) および文書要素データを記憶する文書要素データエリア38(i) がそれぞれ設定される。図16および図17に示すように、各画像データエリア32(i) および各文書要素データエリア38(i) に対するメモリ管理は、入力された各書面または各頁PAi 毎にシートデータエリア管理部35に設定されるシートデータエリア管理データCD(i) を用いて行われる。
【0500】
本システムにおいて、異なる書面または頁の間で所定の処理が定義されるときは、これら複数の書面(頁)は1つのグループ(以下「シートグループ」と称する)に属するものとして扱われる。複数の書面または頁をシートグループとしてグルーピングすることをユーザからシステムに伝えるためには、種々の方法が可能である。たとえば、ユーザが所定のボタン操作を行った上でイメージスキャナ10より複数の書面または頁を連続して入力したときは、これらの書面または頁はシートグループであるとシステムが判断するようにしてよい。
【0510】
本例のデータ定義書(図14)についてイメージスキャナ10による読取動作が行われると、その文書内容(全記入内容)を表すカラー画像信号が入力部30の画像記憶部に取り込まれる。入力部30に取り込まれた各書面毎のカラー画像信号は、信号の形態で(黒),(青),(赤)の各色画像信号に分解され、文書画像記憶部32内では(黒)の画像信号,(青)の画像信号,(赤)の画像信号としてそれぞれ黒画像記憶部32a,青画像記憶部32b,赤画像記憶部32cに蓄積される。
【0520】
次に、文字・図形要素認識部34は、文書画像記憶部32に蓄積された各書面毎の画素データについて、各色(黒,青,赤)毎に文書中の個々の文字、図形要素を認識する。ここで、図形要素とは、線分、矩形、円形のようにその形状が容易に画像認識され得るパターン化された簡単な図形群である。
【0530】
本実施例における画像認識に際しては、たとえば図18に示すようなデータフォーマットで予め設定されている「画像管理データ」が参照される。この「画像管理データ」では、図19に示すように入力画像はマトリクス状に配置された多数の画素PXによって構成されているものとして、画素PXの個数、寸法、ピッチ等を表すデータをセットしている。
【0540】
文字・図形要素認識部34における文字・図形の認識は、基本的には個々の文字、図形要素を構成する線素を認識することによって行われる。線素の識別については従来公知の種々の方法を用いてよい。たとえば、先ず特定の色を有するドットの集合を見い出し、次に隣接領域または周囲をサーチしてそのドットの集合が延長する方向を判定する。この処理を繰り返して、ドットの集合の描く軌跡をそれが消滅(終端)するまで追跡していく。その追跡の途中で、軌跡の向きが急激に変化する箇所があれば、その箇所を屈曲点または尖点として識別する。
【0550】
このようにして抽出された線素は、その形状、大きさにより予め設定された線素パターンの1つとして識別され得る。本実施例では、文字/図形パターン辞書36に、個々の文字、図形毎にそれを構成する線素の種別と、構成線素間の有意な位置関係とが所定の電子辞書方式で予め記憶(設定登録)されている。文字・図形要素認識部34は、上記のようにして抽出した線素を隣接するもの同士で互いに組み合わせてこれを文字/図形パターン辞書36と照合する処理を繰り返すことで、個々の文字、記号、図形を認識する。
【0560】
また、たとえば一覧表のような表を構成する罫線については、次のようにして認識処理を行う。すなわち、上記したような線素の認識において直線とみなして抽出した線素が他の線素よりも桁違いに長く、かつその直線方向が水平線(X軸)または垂直線(Y軸)に対して或る角度内の傾きに収まる場合は、この直線を水平罫線または垂直罫線とみなし、水平線または垂直線と平行になるようにその位置情報を補正する。また、抽出された2つの罫線の端点同士の距離あるいは一方の罫線の端点と他方の罫線との距離が或る値以内にあるときは、両罫線の端点同士が互いに重なり合っている、あるいは片方の罫線の端点が他方の罫線上に重なっているとみなし、両罫線がそのように重なるようにそれぞれの位置情報を補正する。
【0570】
文字・図形要素認識部34は、画像入力した文書の各色(黒,青,赤)画像について上記のような文字・図形認識処理を行うことによって、各文字、各図形要素、各記号につきたとえば図20〜図24に示すようなデータフォーマットで文書要素データを生成する。
【0580】
図20に、1個の文字に対応する文書要素データ(文字データ)のデータフォーマット例を示す。図示のように、当該文字のコード、書体、色、線の太さ、線修飾(実線、点線、鎖線等)、手書き/印刷(手書き文字なのか印刷文字なのかの区別)、記入位置および大きさ(文字サイズ)をそれぞれ表すデータが順次所定のデータ・フィールドにセットされ、末尾にこの文書要素データの終端を示す終端識別データが付けられる。
【0590】
図21に、1つの文字列に対応する文書要素データ(文字列データ)のデータフォーマット例を示す。図示のように、当該文字列の配置位置を示す「先頭文字位置」と「末尾行位置」、当該文字列の書式を示す「行ピッチ」、「文字ピッチ」がセットされるとともに、当該文字列を構成する各文字の文字コードが配置順にセットされる。
【0600】
図22、図23および図24は、それぞれ1つの図形要素または記号に対応する文書要素データ(図形要素データ)のデータフォーマット例である。図22に示すように、線分については始端位置および終端位置のデータが組み込まれる。図23に示すように、長円については中心位置(X,Y方向)と径サイズ(X,Y方向)のデータが組み込まれる。図24に示すように、矩形や“<”等については始端および終端位置に加えて屈曲点または尖点(線分の方向が急峻に変化する点)の位置を示すデータが組み込まれる。
【0610】
上記のようにして、画像入力された各書面中の全ての記入情報が個々の文字、記号、図形に分解されて文字・図形要素認識部34により文書要素データに変換される。これらの文書要素データは、各書面単位で文書要素データ記憶部38に蓄積される。なお、文字・図形認識処理を受けて文書要素データに変換された記入情報に対応する画像情報は、文書画像記憶部32から抹消されてよい。
【0620】
文書画像出力部40は、文書画像記憶部32に保持されている画像信号に基づいて文書画像を出力できるだけでなく、文書要素データ記憶部38に格納されている文書要素データからもそれを文字/図形パターン辞書36を介して画像信号に変換したうえで文書画像を出力することができるように構成されている。
【0630】
図25に、本実施例のシステムにおける定義情報認識およびフォーマット設定部の構成を示す。定義要素データ生成部42および定義データ生成部46は、定義要素データおよび定義データ生成処理を実行するCPU24によって構成される。結合則(構成則)メモリ45、定義情報識別データ記憶部48、定義情報区別データ記憶部50、応用用語辞書52、定義データ記憶部54およびシートグループ定義データ記憶部56は、内部メモリ16または外部メモリ18の所定の記憶領域上に展開されている。
【0640】
文書要素データ記憶部44および定義データ記憶部54においては、入力された各書面または各頁PAi 毎に文書要素データを記憶する文書要素データエリア44(i) および定義データを記憶する定義データエリア54(i) がそれぞれ設定される。
【0650】
図16および図17に示すように、各文書要素データエリア44(i) および各定義データエリア54(i) に対するメモリ管理は、入力された各書面または各頁PAi 毎にシートデータエリア管理部35に設定されるシートデータエリア管理データCD(i) を用いて行われる。
【0660】
この定義情報認識およびフォーマット設定部においては、先ず定義要素生成部42が、定義要素識別データ記憶部48および定義情報区別データ記憶部50にそれぞれ保持されている定義要素識別データ(図9)および定義情報区別データ(図11)を参照して、文書要素識別データ記憶部38に格納されている文書要素識別データ(図20〜図24)を基に各書面または頁に記入されている各定義要素記入情報毎のデータ(定義要素データ)を生成する。
【0670】
図26に、定義要素データのデータフォーマット例を示す。当該定義要素記入情報を識別する「定義系コード」および「定義要素コード」がセットされるとともに、当該定義要素記入情報を構成する文字、図形、記号に対応する文書要素データを参照するためのポインタがセットされる。たとえば、「範囲指定」の“[”の場合は、その記入情報“[”に対応する文書要素データのアドレスを指定するポインタがセットされる。
【0680】
定義要素データを生成するには、特定の修飾情報たとえば(赤)の色情報を有する文書要素データをサーチする。このサーチの結果、たとえば“[”の記入情報を抽出した場合は、それと対をなす他方の記入情報“]”を割り出すことで、「範囲指定」の定義要素記入情報“[ ]”を判別する。これにより、「定義系コード」と「定義要素コード」が決まり、当該定義要素記入情報を構成する“[”および“]”の文書要素データ(図形要素データ)のアドレスをそれぞれ指定するポインタも決まる。
【0690】
上記のようにして定義要素データ生成部42より得られた各定義要素データは各書面また頁単位で定義要素データ記憶部44の該当定義要素データエリアに格納され、シートデータエリア管理部35によって管理される。
【0700】
次に、定義データ生成部46が、定義情報区別データ記憶部50に保持されている定義情報区別データ(図11)を参照して、定義要素データ記憶部44に蓄積されている定義要素データ(図26)、文書要素データ記憶部38に蓄積されている文書要素データ(図20〜図24)および結合則(構成則)メモリ45に格納されている結合則(構成則)アルゴリズムを参照して各書面または頁に、あるいは異なる書面または頁にわたって記入されている各定義情報毎に定義データを生成する。
【0710】
上記のデータ定義書(図14)については、以下に説明するように、「項目定義データ」(図27)、「項目定義データ・チェイン」(図28)、「「セルデータ」(図29)、「フィールド内セルデータ・チェイン」(図30)、「レコード内セルデータ・チェイン」(図31)および「データ定義データ」(図32)を作成する。
【0720】
先ず、「セルデータ」(図29)の作成は次のようにして行う。表の線分ないし罫線を文書要素データを介してサーチすることにより各セル(データ記入枠)を識別し、当該セルの位置を示すデータとともに、同一のフィールドおよびレコード内で次のセルとの繋がりをもたせるためのポインタをセットする。また、当該セル内に文字列が記入されているか否かを文書要素データを介して調べ、記入されていればその対応文書要素データを参照するためのポインタをセットする。
【0730】
また、(青)の範囲指定“[ ]”で区画されたセル列が検出され、かつ(青)の「項目」“< >”で括られた文字列が該セル列(フィールド)の延長方向に隣接しているか、または(青)の「結合線」“−”で該セル列に結ばれているときは、結合則にしたがって該文字列は該フィールドに対応するデータ項目名であると判定し、「項目定義データ」(図27)を作成する。併せて、「フィールド内セルデータ・チェイン」(図30)を作成する。
【0740】
また、複数のフィールドセル列がそのセル列方向に対して直角の方向に隣接し合う場合は、結合則にしたがってこれらの隣接し合うセル列を「レコード内セル列」であると判定して、「レコード内セルデータ・チェイン」(図31)を作成する。併せて、「項目定義データ・チェイン」(図28)を作成する。
【0750】
このように、本システムでは、定義データ生成部46が、結合則メモリ45に登録されている結合則アルゴリズムを参照することで、複数個の定義要素記入情報によってそれぞれ与えられる複数個の単位定義情報を組み合わせて1つの複合的な定義情報を認識し、さらには複数個の単位定義情報と複合定義情報または複合定義情報同士を組み合わせてより複合的または高度な定義情報を認識し、その認識結果に応じて各定義内容を規定する所要の定義データを作成する。
【0760】
上記のようにして「項目定義データ・チェイン」(図28)を作成したなら、図32に示す手順に入り、そのチェインを構成する各「項目定義データ」における一群のデータ項目名を識別する(ステップS1 )。
【0770】
本例においては、データ項目名文字列“データ項目名”、“区分”、“対応マスタ名”、“同義語”が(青)の「定義要素指定」“〇”で囲まれていることから、定義要素識別データ記憶部48に照会することで、「データ定義」系の登録されたテータ項目名であることが判明する。この判定結果が出たことで(ステップS2 )、「データ定義データ作成処理」(ステップS3 )に入る。
【0780】
「データ定義データ作成処理」では、「レコード内セルデータ・チェイン」を基にフィールドと直交するセル列(本例では各行のレコード)を1つずつ取り出して、各セル内のデータ名文字列がシステムに登録されているか否かを判定し、登録されているもの(本例では「区分」のデータ名「テキスト」、「数値」、「集計数値」が定義要素コードとして登録されている)については固定データ長のコードをセットし、登録されていないもの(本例では「データ項目名」、「対応マスタ名」、「同義語」の各データ名が該当する)についてはその文字列に対応する可変データ長の文字コード列をセットすることで、各行(レコード)分の「データ定義データ」(図33)を作成する。
【0790】
したがって、本例のデータ定義書(図14)からは一覧表に記入されている行数に等しい個数の「データ定義データ」(図33)が作成される。これらの「データ定義データ」群は、アプリケーションで使用可能なデータ項目名別に設定登録されたデータ名を参照するための「データ名辞書」を構成する。
【0800】
上記したように、このシステムでは、日常使い慣れている文字、記号または図形を文書に記入する作業または操作により、アプリケーションを構築するうえでの基本設定である「データ定義」を容易に行うことができる。したがって、システムエンジニア等のシステム運用者の負担が軽減するだけでなく、アプリケーション・ソフトの利用者(エンドユーザ)も「データ定義」に参画することが可能である。
【0810】
次に、「ファイル定義」について説明する。一般に、「ファイル定義」は、アプリケーション上の個々のファイルをシステムに登録または格納する度に行われる。本システムでは、たとえば「月別売上げファイル」をシステムに登録(格納)した際に、図34に示すようなファイル定義書を用いて「ファイル定義」を行う。このファイル定義書も、たとえば白色の用紙に(黒)で文書情報(内容)が記載された書面であるとする。
【0820】
このファイル定義書(図34)では、3行×5列のマトリクス状のセル(記入枠)からなる表の中に、一覧形式で、最上段の行には上記データ定義書(図14)を用いて設定登録したアプリケーション上の各データ項目名が、中段の行にはシステム内で予め登録されている各対応フィールド名称(アクセス名)が、最下段の行にはそのデータ項目名に係るデータ名に割り当てるべきフィールド長(バイト)がそれぞれ記載されている。
【0830】
すなわち、アプリケーション上のデータ項目名である「月別」、「分類」、「品番」、「単価」、「売上数」にはそれぞれシステム内フィールド名称「MON」、「BUN」、「HIN」、「TAN」、「SUU」が対応し、それぞれのデータ値フィールド長は「5(バイト)」、「20(バイト)」、「20(バイト)」、「5(バイト)」、「5(バイト)」であることが記述されている。このファイル定義書も、たとえば白色の用紙に(黒)で文書情報(内容)が記載された書面であるとする。
【0840】
このファイル定義書(図34)も、上記データ定義書(図13)と同様に通常記入情報からなる人間向きの定義書であり、このままの文書内容で本システムに入力したならば単なる文書情報として認識されるにすぎず、実質的に定義書としての意味をなさない。
【0850】
この人間向きの定義書を本システムに認識可能な定義書とするためには、図35に示すように「共通」および「ファイル定義」系の定義支援情報を(青)で記入すればよい。
【0860】
図35において、このファイル定義書の一覧表を「項目定義」として定義するために所要の定義情報を記入する。
【0870】
すなわち、表内で横方向に展開されている各行のフィールドを(青)の「範囲指定」の定義要素記入情報“[ ]”で指示する。この表には各行のフィールドの属性を示すデータ項目名が記載されていない。そこで、各フィールドの延長方向で表の外の空欄に定義支援情報として(青)のデータ項目名文字列“データ項目名”、“フィールド名称”、“フィールド長”を記入する。
【0880】
そして、これらの(青)で追記した各データ項目名文字列“データ項目名”、“フィールド名称”、“フィールド長”を(青)の「定義要素指定」の定義要素記入情報“〇”で囲むとともに、左右両側から(青)の「項目」の定義要素記入情報“< >”で括り、(青)の「結合線」の定義要素記入情報“−”を介して各対応するフィールドと結ぶ。
【0890】
また、表題の「月別売上げファイル」をファイル名として登録するため、この表題文字列“月別売上げファイル”を(青)の「範囲指定」“[ ]”で括るとともに、その隣に(青)でデータ項目名“ファイル名”を記入し、さらにこのデータ項目名文字列“ファイル名”を(青)の「定義要素指定」“〇”で囲むとともに、(青)の「項目」の定義要素記入情報“< >”で括る。
【0900】
このように定義支援情報を追記入したファイル定義書(図35)も、上記データ定義書(図13)と同様に、カラー・イメージスキャナ10より本システムに入力される。
【0910】
そうすると、本システムでは、上記と同様の処理部(図19、図28)によりこの定義情報入りのファイル定義書(図35)について▲1▼「文書要素(文字/図形等)の認識」、▲2▼「文書要素(文字/図形等)の補正」、▲3▼「定義要素記入情報の抽出・識別(定義要素データの生成)」および▲4▼「定義内容の解釈(定義データの生成)」を順次行う。
【0920】
その結果、定義データとしては、一覧表に係る定義情報からは「項目定義データ」(図27)、「項目定義データ・チェイン」(図36)、「セルデータ」(図29)、「フィールド内セルデータ・チェイン」(図30)、「レコード内セルデータ・チェイン」(図31)および「ファイル定義データ」(図32)を作成する。なお、この一覧表の場合、フィールドセル列は横方向に展開し、レコードセル列は縦方向に展開する。また、表題「月別売上げファイル」に係る定義情報から「ファイル名」をデータ項目名とする単独の「項目定義データ」(図27)を作成する。
【0930】
この「ファイル定義」でも、一覧表のデータ項目名「データ項目名」、「フィールド名称」、「フィールド長」に対応する「項目定義データ・チェイン」(図36)を作成したなら、図32に示す手順に入り、そのチェインを構成する各「項目定義データ」における一群のデータ項目名を識別する(ステップS1 )。
【0940】
本例では、データ項目名文字列“データ項目名”、“フィールド名称”、“フィールド長”が(青)の「定義要素指定」“〇”で囲まれていることから、定義要素識別データ記憶部48を参照することで、「ファイル定義」系の登録されたデータ項目名であることが判明する。この判定結果が出たことで(ステップS4 )、「ファイル定義データ作成処理」(ステップS5 )に入る。
【0950】
「ファイル定義データ作成処理」では、「レコード内セルデータ・チェイン」を基に、フィールドと直交する各セル列(本例では縦方向の各レコード)を取り出して、各セル内のデータ名文字列が本システムに登録されているか否かを判定する。
【0960】
本例では、アリケーション上の「データ項目名」のデータ名である「月別」、「分類」、「品番」、…が「データ名辞書」つまり「データ定義データ」(図33)に可変データ長の文字コード列の形態で登録されている。また、「フィールド名称」のデータ名である「MON」、「BUN」、「HIN」、…は、システム内のフィールド名称(アクセス名)として固定データ長のコードとして設定登録されている。「フィールド長」のデータ名である「5」、「20」、「20」…は、固定データ長の数値データに変換可能である。
【0970】
上記のようにして1レコードずつ「データ項目名」、「フィールド名」、「フィールド長」のデータ名文字列に各対応する文字コード列または固定データまたはコードを識別し、一覧表内の全部のレコードについて「ファイル定義データ」にセットする。
【0980】
また、表題「月別売上げファイル」に係る項目定義データに基づいて「ファイル名」を文字コード列でセットするとともに、システム内のいずれかの記憶エリアに格納されているこの「月別売上げファイル」にアクセスするためのファイル名称(アクセス名)をもセットしておく(図37)。ここで、「ファイル名称(アクセス名)」は、ユーザの入力した「ファイル名」に対応するシステム内のファイル識別データであり、システムの方で自動的に割り付ける。
【0990】
図38に、本システムにおけるファイル管理部の構成例を示す。内部メモリ16または外部メモリ18に設けられたファイル格納エリア内に、システムに登録されているファイルA,B,C.…が任意の記憶位置に格納されるとともに、各ファイルを検索するためのインデクスデータ(ファイル管理データ)が所定記憶位置に格納される。ファイルマネージャ(ファイル管理プログラム)はインデクスデータを参照して各ファイルにアクセスする。外部からは、上記「ファイル名称(アクセス名)」でファイルマネージャにアクセスすればよい。
【1000】
上記したように、このシステムでは、日常使い慣れている文字、記号または図形を文書に記入する作業または操作により、ファイルの登録時に必要となる「ファイル定義」を容易に行うことができる。したがって、システム運用者の負担が軽減するだけでなく、エンドユーザも「ファイル定義」に参画することが可能である。
【1010】
次に、本実施例のシステムにおいて帳表を作成する機能について説明する。本システムでは、特にエンドユーザにおいて所望の帳表を容易に作成することができるようになっている。
【1020】
図39に、一例として「月別売上げ台帳」の基本項目が予め手書きで記入されている帳表用紙を示す。この帳表用紙に記入されている文字、記号、図形のいずれも、帳表の文書内容を示す通常記入情報であり、同一色たとえば黒色で記されている。
【1030】
この帳表用紙において、一覧表の最上段の行に設けられた項目名記入欄には、データ項目名「品名」、「売上数」、「単価」、「売上高」が各セル(記入欄)内に1項目名ずつ記入されている。各データ項目名に対するデータ記入欄(フィールド)は、「品名」に2つ、他の項目名「売上数」、「単価」、「売上高」には1つずつ割り当てられている。「品名」のフィールドには「分類」および「品番」の各データ名(たとえば“テレビ”、“J1020”)が記入されており、他のフイールドは空欄になっている。
【1040】
表の上には、中央部に帳表名“月別売上げ台帳”が記載されるとともに、右隅部に注釈として“神田支店”、“1995年”が記載されている。また、表の下には、左右に2つの注釈“(注)月別売上げファイルから出力”および“売上高=単価×売上数”が記載されている。
【1050】
この帳表用紙に対して、ユーザは、図5〜図8の「定義要素/記入情報対照表」を参照して、たとえば図40に示すように定義支援情報をカラー筆記具等で記入してよい。
【1060】
この場合も、各定義系の定義要素記入情報および追加記入情報には、修飾情報として特定の色を割り当てる。この例では、「共通」、「コマンド/手順」定義系の定義支援情報を(青)で記入している。
【1070】
図40の帳表において、縦方向のセル列の最上段および最下段のセルに(青)で「範囲指定」の定義要素記入情報“[ ]”を記入し、これらのセル列(データ記入欄)をフィールドとして定義している。
【1080】
一覧表の左端部の上の空欄に(青)で定義支援情報“<分類>”および“<品番>”を記入し、これらの項目名文字列を(青)の「結合線」“−”を介して「品名」に対応する2つのフィールドにそれぞれ結んでいる。(黒)のデータ項目名文字列“品名”はそのままで、何の(青)の定義支援情報も付けていない。これにより、“品名”の下に位置する左右2列のフィールドを、元(黒)のデータ項目名「品名」にではなく、(青)で追記入したデータ項目名「分類」、「品番」にそれぞれ対応させることを定義したことになる。
【1090】
「品名」の欄の右隣の各欄では、(黒)の各データ項目名文字列“売上数”、“単価”、“売上高”の左右両側に(青)で「項目」の定義要素記入情報“< >”を記入し、“<売上数>”、“<単価>”、“<売上高>”としている。これにより、「売上数」、「単価」、「売上高」をそれぞれデータ項目名として定義したことになる。
【1100】
また、これらのデータ項目名“<売上数>”、“<単価>”、“<売上高>”の下に隣接して、上記のように(青)の「範囲指定」“[ ]”によってフィールドが定義されている。これにより、両者の間に(青)の結合線“−”を省略していても、これらの各データ項目名と各フィールドとを対応づける「項目定義」のための定義情報を記入したことになる。
【1110】
表の外の注釈に関して、右上部の(黒)の注釈“神田支店”を(青)の「範囲指定外」の定義要素記入情報“{ }”で括っている。これにより、この注釈情報は定義情報から除外することを明示的に定義したことになる。
【1120】
また、その下隣では、(黒)の通常記入情報“1995年”の右隣に、(青)で複合的な定義支援情報“□−<月別>”を記入している。この定義情報は、「フィールド(データ記入欄)」の定義要素記入情報と、「項目」の定義要素記入情報“< >”と、データ項目名文字列“月別”と、「結合線」の定義要素記入情報“−”とから構成されている。これにより、この“□”で指定した領域(フィールド)をデータ項目<月別>のデータ記入欄とすることを規定している。
【1130】
帳表の下側では、(黒)の通常記入情報で記載された注釈“売上高=単価×売上数”において、各データ項目名文字列“売上高”、“単価”、“売上数”を(青)の「項目」の定義要素記入情報“< >”で括っている。これによって、この注釈の計算式(通常記入情報)をデータ管理上の計算式とすることを定義したことになる。
【1140】
また、別の注釈“(注)月別売上げファイルから出力“においては、ファイル名の“月別売上げファイル”を(青)の「範囲指定」の定義要素記入情報“[ ]”で括るとともに、述語部分の“から”および“出力”をそれぞれ(青)の「定義要素指定」の定義要素記入情報“〇”で囲んでいる。
【1150】
そして、(青)の「範囲指定“[ ]”で指示したファイル名文字列“月別売上げファイル”と近傍に(青)で記入したデータ項目名“<ファイル名>”とを(青)の「結合線」“−”を介して結んでいる。これにより、ファイル名「月別売上げファイル」について「項目定義」を行うとともに、通常記入情報の“から”および“出力”をそれぞれ「コマンド/手順定義」系の定義要素「送り元」および「出力」を表す定義要素記入情報に転化したことになり、ひいては「月別売上げファイル」(出力元オペランド)よりこの帳表にデータ出力を行うべきこと(コマンド)を定義したことになる。
【1160】
上記のようにして定義支援情報を追記入された帳表文書(図40)は、カラー・イメージスキャナ10より本システムに入力される。
【1170】
そうすると、本システムでは、上記と同様の処理部(図19、図28)によりこの定義情報入りのファイル定義書(図35)について▲1▼「文書要素(文字/図形等)の認識」、▲2▼「文書要素(文字/図形等)の補正」、▲3▼「定義要素記入情報の抽出・識別(定義要素データの生成)」および▲4▼「定義内容の解釈(定義データの生成)」を順次行う。
【1180】
その結果、定義データとしては、一覧表に係る定義情報から「項目定義データ」(図27)、「項目定義データ・チェイン」(図41)、「セルデータ」(図29)、「フィールド内セルデータ・チェイン」(図30)、「レコード内セルデータ・チェイン」(図31)を作成する。なお、この一覧表の場合、フィールドセル列は縦方向に展開し、レコードセル列は横方向に展開する。
【1190】
また、表の上の右隅部に記入された定義情報“□−<月別>”から「月別」をデータ項目名とする単独の「項目定義データ」(図27)を作成する。
【1200】
また、表の下の空欄の右側部分に記載の注釈“売上高=単価×売上数”に係る定義情報から「計算式定義データ」(図42)を作成する。
【1210】
上記のような帳表関係の各種定義データ(「項目定義データ」、「項目定義データ・チェイン」、「計算式定義データ」等)を一括して管理するための「帳表管理データ」(図45)を作成する。
【1220】
また、表の下の空欄の左側部分に記載の注釈“(注)月別売上げファイルから出力”に係る定義情報に対しては「データ出力コマンド定義データ」(図46)を作成する。
【1230】
この場合も、一覧表のデータ項目名「分類」、「品番」、「売上数」、「単価」、「売上高」に対応する「項目定義データ・チェイン」(図41)を作成したなら、図32に示す手順に入り、そのチェインを構成する各「項目定義データ」における一群のデータ項目名を識別する(ステップS1 )。
【1240】
本例においては、データ項目名文字列“分類”、“品番”、“売上数”、“単価”、“売上高”が「データ名辞書」または「データ定義データ」(図33)に登録されていことから、この一覧表はアプリケーション上の定義書(帳表)であることが判明する。この判定結果が出たことで(ステップS6 )、「帳表定義データ作成処理」(ステップS7 )に入る。
【1250】
「帳表定義データ作成処理」では、この一覧表に係る定義データつまり「項目定義データ」、「項目定義データ・チェイン」、「セルデータ」、「フィールド内セルデータ・チェイン」、「レコード内セルデータ・チェイン」だけでなく、結合線“−”で表に結合されている定義情報、あるいは結合線“−”がない場合でも同一の書面または頁内に記入されている所定の定義情報から生成される定義データをも同一帳表に係る構成情報と認識し、これらの定義データを総体的に「帳表定義データ」として「帳表管理データ」(図45)でとりまとめる。すなわち、「帳表管理データ」は、論理的にまとまった1つの帳表を構成する「帳表定義データ」群をとりまとめる管理データである。
【1260】
本例では、一覧表の上の定義情報“□−<月別>”から生成される単独の「項目定義データ」も帳表関連定義データ(構成情報)であると判定し、「帳表管理データ」(図45)でポイントしておく。
【1270】
また、表の下の注釈“<売上高>=<単価>×<売上数>”については、▲1▼(青)の「項目」“< >”で括られた複数の文字列<売上高>、<単価>、<売上数>の間に挟まれている文字または記号(“=”、“×”)が存在し、かつ▲2▼これらの挟まれた文字(文字列)または記号が定義要素識別データ記憶部48または応用用語辞書メモリ52に登録されていることの2条件が成立するので、これらの文字(文字列)または記号を登録内容の通りに(本例では演算記号“=”、“×”の意味に)認識する。
【1280】
この認識結果から、この注釈の計算式「<売上高>=<単価>×<売上数>」を規定する「計算式定義データ」(図42)を作成する。そして、この「計算式定義データ」もこの帳表に係る「帳表定義データ」であるから、「帳表管理データ」(図45)でポイントしておく。
【1290】
図43に、応用用語辞書52に収載される用語の例を示す。「単位」、「計算式」、「合計」等の各サプ定義系毎に用語として使用可能な文字、文字列、記号が登録されている。
【1300】
図44に、応用用語辞書52に収載される用語データのデータフォーマット例を示す。ヘッダの「処理系種別」のデータ・フィールドには各サブ定義系(「単位」、「計算式」、「合計」等)のコードがセットされる。このヘッダに続けて「文字コード列」のデータ・フィールドに、当該サブ定義系に属する各文字、文字列、記号を構成する文字コード列が羅列型式で順次セットされる。「区切り識別データ」は図43で各用語を区切っているカンマ(,)に対応している。
【1310】
表の下の別の注釈“(注)月別売上げファイルから出力”に係る定義情報については、「定義要素指定」“〇”で囲まれた文字列“から”、“出力”が「コマンド/手順定義」系の「送り元」、「データ出力」を意味する定義要素として登録されていることから、あるデータ出力元からの「データ出力」を指示するコマンド定義情報であると判定し、「データ出力コマンド定義データ」(図46)の作成処理にとりかかる。
【1320】
この「データ出力コマンド定義データ」作成処理では、出力元オペランドと出力先オペランドとを割り出す。本例では、結合則(構成則)メモリ45に登録されている結合則にしたがい、項目定義を構成する“<ファイル名>−[月別売上げファイル]”を、「コマンド/手順定義」系の定義要素記入情報“から”が指示する出力元オペランドであるとみなす。
【1330】
また、出力先オペランドについては、これを明示的に指示する定義情報が存在しないことから、装置デフォルトで、同一書面または頁上の他の定義情報から作成されている定義データを参照する。そうすると、本例では、上記のような「帳表定義データ」ないし「帳表管理データ」(図45)が作成されているので、これらの定義データによって指示される帳表のフィールドまたはレコード(データ記入欄)を出力先オペランドと判定する。
【1340】
上記のようにして識別した出力元オペランドおよび出力先オペランドを「データ出力コマンド定義データ」(図46)でポイントしておく。なお、本例では省略しているが、一定の文書範囲(たとえば同一書類またはシートグループ)内で複数のコマンドが定義されている場合は、それらに対応する複数の「コマンド定義データ」間の実行順序(シーケンス)を決定し、各「コマンド定義データ」で前後に実行されるべき他の「コマンド定義データ」をポイントしておく。
【1350】
上記のようにして、システムに入力された定義情報入りの帳表(図40)について全ての定義データを生成し終えたところで、本システムがこれまで行った処理、特に認識処理(文字/図形認識、位置/大きさ等の補正、定義内容の確定)の結果を表示出力し、ユーザ側の確認を取る。
【1360】
この表示出力では、システムが認識した各書面の文書内容をたとえばトグル方式で順にディスプレイ画面20a上に表示する。この文書画像を表示するため、文書画像出力部40は、文書要素データ記憶部38に蓄積されている各書面毎の文書要素データを文字/図形パターン辞書36に照会して各文書要素のパターンを識別し、各パターンを展開プログラムによってビットマップ形式の画像データに変換して、映像信号を生成する。
【1370】
このようにして、システムの認識処理結果に応じた帳表の文書内容がディスプレイ画面20a上に表示された時点で、ユーザはキーボード12やマウス14あるいはディジタイザ15を用いて画面上から各文書に補正を行ったり新たな記入情報を入力することができる。
【1380】
キーボード12より入力された記入情報については、文字・図形認識の処理を行うことなく、文字・図形要素入力部37(図19)で文書要素データを生成することができる。マウス14またはディジタイザ15より入力された記入情報については、文字・図形要素入力部37で各記入情報を入力し、文字・図形要素認識部34で逐次(入力記入情報毎に)文字/図形認識処理を行い、文書要素データを生成する。
【1390】
これら画面入力方式の入力装置12,14,15により定義情報を入力する際にも、「環境設定」の「定義情報区別」モード(図8)で各定義系の修飾情報を設定入力する。
【1400】
画面入力方式を用いると、記入情報に対する着色の指示を、記入情報の入力前だけでなく、入力の後に行うことも可能である。つまり、色メニューの使い方としては、文字列等の入力や罫線引きの操作に先立って「色メニュー」の中の所望の「色」ボタンを選択指示してもよく、あるいは標準色で入力したものの中で所望の部分を画面上で指示(特定)し、続けて所望の「色」ボタンを選択指示する方法を採ることもできる。
【1410】
また、所定の定義用サブモード下で画面上から記入情報を入力すれば、システムの方でその入力された記入情報にそのサブモードで指定されている定義区別修飾を付して、画面上に表示することも可能である。この場合、該定義区別修飾を付けられた記入情報から定義情報が認識されることになる。
【1420】
このように画面上で記入情報が入力された場合は、記入情報が入力される度毎にその入力データに基づいて文字・図形要素入力部37(図15)が各記入情報に対応した文書要素データを生成または変更することになる。
【1430】
画面上から入力された記入情報(文字列、記号、図形)は、用紙からイメージ入力された場合と同様に、システム内では文書要素データ(図20〜図24)の形態で表現される。
【1440】
実際の使用レベルでは、このような画面入力方式を上記したイメージ入力方式と併用する形態が便利である。用紙からイメージで入力された記入情報も画面上からコマンドで入力された記入情報もシステム内では同じ文書要素データの形で管理されるため、帳表の元々の記入情報(通常記入情報)かその上に追記される定義用記入情報かに拘りなく、イメージ入力または画面入力のどちらからでも任意の記入情報を入力することができる。
【1450】
このように、ユーザは、文書内容が予め記載されている書面をイメージスキャナ10により入力した後に、上記のような確認のための出力表示の段階で、各書面の文書内容ないし定義内容を確認しながら、キーボード12、マウス14またはディジタイザ15より任意の記入情報、特に定義支援情報を追記することが可能であり、さらには画面上からコマンドで所望の定義情報を入力することも可能である。
【1460】
さらに、ユーザは、いったん入力された定義情報について、その定義情報を形成する記入情報に画面上で所望の編集校正機能を実行することにより、定義情報の変更や取り消し等を行うことも可能である。
【1470】
上記のような画面入力方式においてコマンドによる定義情報の設定入力を可能とするために、本システムでは、図47に示すようにコマンド入力部60およびコマンド認識・実行処理部62を設けている。コマンド入力部60は、キーボード12、マウス14またはディジタイザ15より入力されたコマンドを受け付ける。コマンド認識・実行処理部62は、上記したような入力コマンドの解析とピッキング処理を行い、所要の定義データを生成、変更または削除する。コマンド入力部60およびコマンド認識・実行処理部62は、内部メモリ16に保持されているコマンド入力プログラムおよび文書作成プログラムと、それらのプログラムを実行するCPU24により構成される。
【1480】
なお、このような画面入力方式は、上記した「データ定義」および「ファイル定義」でも行えることはもちろんである。
【1490】
次に、本実施例のシステムにおいて、電子化された帳表にデータファイルよりデータを転記して出力するデータ出力処理の諸機能について説明する。
【1500】
本例では、メインモード下で「実行ボタン」が選択指示されると、定義実行処理部74(図49)において、システムに何らかの処理を求めるコマンド系の定義データについてそれぞれの定義内容を実行する。この際、定義実行処理部74は、定義データ記憶部54およびシートグループ定義データ記憶部56を検索して「定義データ種別」を基にコマンド系の定義データを抽出し、定義実行順序則メモリ59に蓄積されている「定義実行順序則手順(プログラム)またはデータ」にしたがってそれらの定義データの実行順序を決定する。図48に、「定義実行順序則データ」のデータフォーマット例を示す。
【1510】
本例では、先ず「データ出力コマンド定義データ」の定義内容を実行する。この場合、このコマンド内容(データ出力)を「定義データ種別」から識別し、出力元オペランド(月別売上げファイル)を「出力元オペランド」でポイントされる「項目定義データ」の「ファイル名」から「ファイル定義データ」を介して識別し、出力先オペランド(月別売上げ台帳)を「出力先オペランド」でポイントされる「帳表管理データ」ないし「帳表定義データ」を介して識別する。
【1520】
図45に、本システムにおいて帳表関係のデータ出力処理を行うデータ出力部の構成を示す。データ項目変換部72、定義実行処理部74およびレコード/文書要素データ変換部78は、それぞれ所定の変換または処理プログラムを実行するCPU24によって構成される。入力レコード記憶部70、ファイル定義データ記憶部80、帳表定義データ記憶部82、出力レコード記憶部76、およびデータ/文字コード変換テーブル84は内部メモリ16または外部メモリ18によって構成される。
【1530】
データ出力処理が開始されると、先ず「ファイルマネージャ」(図38)を介して出力元ファイル(月別売上げファイル)よりファイルレコードが1レコードずつまたは所定のブロック単位で入力レコード記憶部70に格納される。
【1540】
図50に、出力元ファイルより送られてくる売上げファイルのレコード管理テーブルおよびファイルレコードのフォーマット例を示す。レコード入力部70に入力されるファイルレコードは、出力元ファイル側で定義されたデータ項目「BUN」、「HIN」、「TAN」、……を有している。
【1550】
データ項目変換部72は、ファイル定義データ記憶部80に保持されている「ファイル定義データ」(図37)を参照して、入力したファイルレコードの各データ項目「BUN」、「HIN」、「TAN」、……を各対応するシステム内のデータ項目「分類」、「品番」、「単価」、…に変換する(図50)。
【1560】
定義実行処理部74は、データ項目変換部72からのファイルレコードの中から、先ず特定の月たとえば10月分のファイルレコードだけを抽出する。これはファイルレコードの「月」のデータフィールドから判別できる。
【1570】
次に、10月分のファイルレコードのうち、出力先(月別売上げ台帳)に記入されている「分類」、「品番」のデータ名(商品)と一致するものだけを抽出する(図51)。
【1580】
この抽出を行うには、「帳表定義データ」の「項目定義データ」によってポイントされる文書要素データ(文字列データ)から「分類」、「品番」に対応する各データ名の文字列(“テレビ”,“J1020”,…)を識別し、識別した文字列データをデータ/文字コード変換テーブルを参照してレコード上のデータ(コード)に変換する。そして、当該帳表の各レコードと各入力ファイルレコードとの間で集計項目(「売上数」,「売上高」)以外のデータ名を比較し、全部一致するか否か判定する。この場合、比較項目の中で一方のレコードに無記入のもの(本例では帳表側の「単価」)があれば判定条件から除外する。
【1590】
このようにして抽出したファイルレコードに対して、帳表定義データ記憶部82に格納されている「帳表定義データ」(計算式定義データ等)にしたがって「帳表定義」を実行する。
【1600】
図9の帳表の場合、「計算式定義データ」(図42)にしたがって、各ファィルレコードについて計算式「<売上高>=<単価>×<売上数>」を演算し、演算結果のデータをデータ項目「売上高」にセットする。この結果、図50に示すように各ファイルレコードに所要の出力データが揃う。定義実行処理部74による帳表定義の実行処理を終えた各ファイルレコードは出力レコード記憶部76に格納される。
【1610】
レコード/文書要素データ変換部78は、出力レコード記憶部76より各ファイルレコードを取り出し、データ/文字コード変換テーブル84を参照して、このレコード内の各データ項目のデータを文書要素データに変換する。これによって、たとえば、ファイルレコードでは単に数値「396」の大きさを表していたデータが、所定の帳表の中の所定の位置に所定の文字列“396”を表示出力するための文字列データに変換される。
【1620】
ここで、変換された文書要素データの記入先は、「帳表定義データ」の各項目定義データから識別することができる。その際、配置書式が定義されていればその配置書式にしたがって、本例のように配置書式が定義されていなければ装置デフォルトで文字サイズ、文字ピッチ、配置位置(たとえば数字は右詰め、文字列はセンタリング)等も決める。なお、記入文字の色は、他の通常記入情報と同じ色(黒)としてよい。また、各データ記入欄に対応するセルデータ(図29)に当該文書要素データ(文字列データ)へのポインタをセットしておく。
【1630】
レコード/文書要素データ変換部78で生成された文書要素データは、当該帳表に元々記入されている文書要素データと一緒に文書要素データ記憶部38(より詳細には対応文書要素データエリア38(i) )に格納される。
【1640】
したがって、文書画像出力部40が、この文書要素データエリア38(i) より(黒)の通常記入情報に対応する全ての文書要素データを読み出し、それら読み出した文書要素データを文字/図形パータン辞書36に照会して各文書要素のパターンを識別し、各パターンを展開プログラムによってビットマップ形式の画像データに変換することにより、図52に示すような目的の帳表出力文書をたとえばディスプレイ画面20a上に表示することができる。また、印字装置22でプリントアウトしたり、通信装置24によりFAX送信することもできる。
【1650】
このように、帳表定義においても、ユーザは、所望の帳表用紙に日常見慣れた文字、記号、図形からなる所定の定義支援情報を追記入して所定の結合則(構成則)の下で思い通りに定義することができるため、覚えごとが非常に少なく、簡単な作業または操作で済む。
【1660】
特に、本システムでは、共通の「項目定義」機能を使用することにより、「データ定義」、「ファイル定義」、「帳表定義」のいずれも同様(共通)の覚えごと、共通の操作で行うことができる。これにより、システム運用者からエンドユーザまで任意の関係者が「データ定義」、「ファイル定義」、「帳表定義」に容易に参画することが可能である。
【1670】
上記したデータ出力処理はファイルから帳表へデータを出力する処理であったが、反対に帳表からファイルへデータを入力する処理や異なる帳表の間でデータを転記する処理も上記と同様にして行うことができる。
【1680】
上記した帳表における「データ出力コマンド定義」も一例にすぎず、「共通」および「コマンド/手順定義」系の定義要素記入情報等を利用して種々のコマンドを定義することが可能である。
【1690】
以上、本実施例によるシステムの主な機能について説明したが、種々の変形例が可能である。たとえば、図53に、画面上からコマンドで定義情報を入力する例を示す。図53に示すように、入力した帳表文書の文書内容をディスプレイ画面20aに表示し、入力した文書内容を確認しながら、キーボード12またはマウス14等より所定のコマンドを入力することにより、所望の定義情報を入力することができる。
【1700】
図53において、たとえば「定義」モードの下で通常記入情報の“売上数”を指示してクリックすると、この指示された箇所90が特定表示(たとえば反転表示)されると同時に、ディスプレイ画面20a内の適当な位置に「1.フィールド」、「2.データ項目」、「3.単位名」等の各種定義項目をリストした副画面94が現れる。ここで、「2.データ項目」を選択指示すると、通常記入情報“売上数”がデータ項目の「売上数」に転化する。同様にして、“売上数”の欄の下の領域92を指示してクリックし、この領域92について「1.フィールド」を指定すると、領域92は「売上数」のデータを記入するフィールドとして定義される。
【1710】
なお、図53では、説明の便宜上、データ項目の箇所90とフィールドの領域92が同時に選択指示されている様子を示しているが、実際には1回のクリック毎に1箇所ずつ選択指示される。
【1720】
システム内では、上記のようなユーザ操作に対し、コマンド認識・実行処理部62において、入力されたコマンドを解析するとともに、そのコマンドの対象とする画面上の位置(クリック位置)と、文書要素データ記憶部38に保持されている文書要素データの「位置」情報との照合を繰り返して、該当する文書要素データを識別する(ピッキング処理)。そして、識別した文書要素データと入力コマンドの指示内容とから、所要の定義データを生成する。
【1730】
なお、本発明は、上記した本発明の機能を実現するためのプログラムまたはソフトウェアを用いる。かかるソフトウェアは、任意の媒体を介して、たとえば蓄積媒体あるいはオンライン等により本発明のシステムにインストールされ得るものである。したがって、本発明を実施するためのソフトウェアを格納した蓄積媒体を業として譲渡する行為や、該ソフトウェアをオンラインでシステムにインストロールする行為等は本発明の実施の一形態である。
【1740】
【発明の効果】
以上説明したように、本発明によれば、1種類の簡単な記号を追記によって、ユーザが自由に作成した文書上において、文書の元々の記入内容、または、使い馴染んだ簡単な記号に1種類の簡単な記号を追記付加するによって、システムに多様な処理を指示するコマンド定義をおこなうことができる。
【1750】
また、さらに少数種類の記号の追記によって、オペランドを備えたいっそう多様なコマンドの定義をおこなうことができる。
【1760】
また、以上のコマンド転化指定の記号に特定の色などの修飾情報を与えることにより、いっそうユーザ視認性とユーザ自由度を増した形で多様なコマンドの定義をおこなうことができる。
【図面の簡単な説明】
【図1】本発明の一実施例による情報処理装置のハードウェア上のシステム構成例を示すブロック図である。
【図2】実施例のシステムにおける主なモードの一覧を示す図である。
【図3】実施例のシステムにおける「主モード一覧メニュー画面」を示す図である。
【図4】実施例のシステムにおける「環境設定モード画面」を示す図である。
【図5】実施例のシステムにおける「定義要素/記入情報対照表」を示す図である。
【図6】実施例のシステムにおける「定義要素/記入情報対照表」を示す図である。
【図7】実施例のシステムにおける「定義要素/記入情報対照表」を示す図である。
【図8】実施例のシステムにおける「定義要素/記入情報対照表」を示す図である。
【図9】実施例のシステムにおける「定義要素識別データ」のデータフォーマット例を示す図である。
【図10】実施例のシステムにおける「定義情報区別指示画面」を示す図である。
【図11】実施例のシステムにおける「定義情報区別データ」のデータフォーマット例を示す図である。
【図12】実施例のシステムにおける「メインモード画面」を示す図である。
【図13】実施例のシステムにおいて「データ定義」で用いられる定義書の一例を示す図である。
【図14】図13のデータ定義書に定義支援情報を追記入した例を示す図である。
【図15】実施例のシステムにおける文書入力および文書要素データ生成部の構成を示すブロック図である。
【図16】実施例のシステムにおけるシートデータ管理機能を模式的に示す図である。
【図17】実施例のシステムにおける「シートデータエリア管理データ」のデータフォーマット例を示す図である。
【図18】実施例のシステムにおける「画像管理データ」のデータフォーマット例を示す図である。
【図19】実施例のシステムにおける「画像管理データ」の対象となる入力画像の構成を示す図である。
【図20】実施例のシステムにおける「文字データ」のデータフォーマット例を示す図である。
【図21】実施例のシステムにおける「文字列データ」のデータフォーマット例を示す図である。
【図22】実施例のシステムにおける線分に対応する「図形要素データ」のデータフォーマット例を示す図である。
【図23】実施例のシステムにおける長円に対応する「図形要素データ」のデータフォーマット例を示す図である。
【図24】実施例のシステムにおける矩形等に対応する「図形要素データ」のデータフォーマット例を示す図である。
【図25】実施例のシステムにおける定義情報認識およびフォーマット設定部および定義実行処理部の構成を示すブロック図である。
【図26】実施例のシステムにおける「定義要素データ」のデータフォーマット例を示す図である。
【図27】実施例のシステムにおける「項目定義データ」のデータフォーマット例を示す図である。
【図28】実施例のシステムにおいて「データ定義」で作成される「項目定義データ・チェイン」の構造を模式的に示す図である。
【図29】実施例のシステムにおける「セルデータ」のデータフォーマット例を示す図である。
【図30】実施例のシステムにおける「フィールド内セルデータ・チェイン」の構造を示す図である。
【図31】実施例のシステムにおける「レコード内セルデータ・チェイン」の構造を示す図である。
【図32】実施例のシステムにおいて「項目定義データ・チェイン」に基づいて「データ定義データ」、「ファイル定義データ」、「帳表定義データ」の各定義データ作成処理に分岐する全体手順を示すフローチャートである。
【図33】実施例のシステムにおける「データ定義データ」のデータフォーマット例を示す図である。
【図34】実施例のシステムにおいて「ファイル定義」で用いられる定義書の一例を示す図てある。
【図35】図35のファイル定義書に定義支援情報を追記入した例を示す図である。
【図36】実施例のシステムにおいて「ファイル定義」で作成される「項目定義データ・チェイン」の構造を模式的に示す図である。
【図37】実施例のシステムにおける「ファイル定義データ」のデータフォーマット例を示す図である。
【図38】実施例のシステムにおけるファイル管理部の構成を示す図である。
【図39】実施例のシステムにおいて「帳表作成」で用いられる帳表用紙の一例を示す図である。
【図40】図39の帳表に定義支援情報を追記入した例を示す図である。
【図41】実施例のシステムにおいて「帳表作成」で作成される「項目定義データ・チェイン」の構造を模式的に示す図である。
【図42】実施例のシステムにおける「計算式定義データ」のデータフォーマット例を示す図である。
【図43】実施例のシステムにおける応用用語辞書に収載されている用語の例を示す図である。
【図44】実施例のシステムにおける「辞書用語データ」のデータフォーマット例を示す図である。
【図45】実施例のシステムにおける「帳表管理データ」のデータフォーマット例を示す図である。
【図46】実施例のシステムにおける「データ出力コマンド定義データ」のデータフォーマット例を示す図である。
【図47】実施例のシステムにおいて画面入力方式による文書の記入情報および定義情報の処理を行うための構成を示すブロック図である。
【図48】実施例のシステムにおける「定義実行順序則データ」のデータフォーマット例を示す図である。
【図49】実施例のシステムにおいて帳表関係のデータ出力処理を行うデータ出力部の構成を示す図である。
【図50】実施例のシステムにおいてファイルレコードのフォーマット変換を示す図である。
【図51】実施例のシステムにおいてファイルレコードの抽出処理を示す示す図である。
【図52】実施例のシステムにおける帳表出力文書の一例を示す図である。
【図53】実施例のシステムにおいてコマンドを用いて画面上から定義情報を入力する例を示す図である。
【符号の説明】
10 カラーイメージスキャナ
12 キーボード
14 マウス
15 ディジタイザ
16 内部メモリ
18 外部メモリ
20 表示装置
24 CPU(マイクロプロセッサ)
27 通信装置
34 文字・図形要素認識部
35 シートデータエリア管理部
37 文字・図形要素入力部
38 文書要素データ記憶部
40 文書画像表示出力部
42 定義要素データ生成部
46 定義データ生成部
48 定義要素識別データ記憶部
50 定義情報区別データ記憶部
52 応用用語辞書
54 定義データ記憶部
56 シートグルーブ定義データ記憶部
60 コマンド入力部
62 コマンド認識実行処理部
73 定義実行処理部
[0010]
BACKGROUND OF THE INVENTION
The present invention relates to an information processing method and apparatus for document processing / management and data processing / management.
[0020]
[Prior art]
In an information processing apparatus (computer system), when an application system is constructed, it is necessary to define and register data and attributes that can be used in the application. In addition, when an individual database or file is provided in the system, it is necessary to register the attributes of the file (file name, field name, record length, etc.).
[0030]
Conventionally, the “data definition” and “data definition” as described above use a dedicated program, and the system operator fills out the required items in the specification or definition document in the specified column of the setting screen presented by this dedicated program. This is done by inputting from the screen.
[0040]
In the application, for example, a book table is created as follows. In other words, if any table ruled line and character string are entered on the screen by keyboard operation or mouse operation, each screen input data is regarded as definition information of the book table, and the format of the book table is set based on the definition information Is done.
[0050]
When a table ruled line is entered on the screen by a mouse operation or the like and a desired field (area) is specified, a sub-screen listing various attributes or definition items related to the field appears. In some cases, when one desired item is selected, one format for the field is defined (set) by the selected definition item.
[0060]
In order to define a command in an application, a special command word determined by a predetermined language (for example, Visual Basic) is set and inputted from a keyboard or a button on the screen.
[0080]
[Problems to be solved by the invention]
There are still many items that must be remembered by the user in the definition of commands that direct the system to some processing or operation on a document that is freely created by the user without restrictions by the device, and the type of definition content is also significantly limited. .
[0120]
SUMMARY OF THE INVENTION An object of the present invention is to provide an information processing apparatus and definition information generation method that can define a variety of commands by a simple entry operation with very little memory for a user on a document that is freely created by the user. There is.
[0130]
[Means for Solving the Problems]
In order to achieve the above object, a method according to claim 1 of the present invention is a method of generating command definition information that instructs a system to perform a certain operation or process in an information processing system. ,
Document data storage means for storing document data in which code string information and position information are registered for each symbol or each character string on the document in the system;
In an information processing system comprising dictionary storage means for storing dictionary data registered by associating code string information with semantic information on the command definition for a specific symbol or term,
The command definition information for the system is a specific symbol or term registered in the above dictionary data, and is added to the other entry information described on the document to add the other entry information to the system. By repeating the collation between the corresponding code string information registered in the dictionary data and the code string information of each symbol or each character string constituting the document data, the first entry information that designates conversion to Detecting from the document;
The detected first entry information and the second entry information which is a symbol or character string having a specific arrangement relationship on the document, the position information of the first entry information, and each of the document data Identifying by repeating matching between symbols or position information of each string;
For the second entry information identified on the document, by repeating collation between the code string information and the code string information of each symbol or each term registered in the dictionary data, Identifying semantic information on the command definition registered corresponding to the second entry information, and generating command information for instructing the system to perform the corresponding processing;
It is characterized by having.
[0140]
According to a second aspect of the present invention, in the first aspect of the present invention, the third entry information, which is a symbol specifically defined as designating the operand of the command definition on the document, is represented by the corresponding code string. Detecting from the document by repeating collation between the information and the code string information of each symbol or each character string constituting the document data;
The detected third entry information and the fourth entry information which is a symbol or character string in a specific arrangement relationship on the document, the position information of the third entry information, and each symbol constituting the document data or Identifying by repeating matching between the position information of each character string;
And an operand of the corresponding command definition information is generated based on the identified fourth entry information.
According to a third aspect of the present invention, in the inventions according to the first and second aspects, the document data held in the document data storage means is a modification that includes color information for each character or character string on the document. With information,
The entry information having predetermined modification information is detected from the document by repeating the matching between the modification information and the modification information provided for each symbol or character string in the document data, and then the detected information is detected. The first entry information is detected from a document from symbols or character strings having modification information.
[0150]
An information processing apparatus according to claim 4 is an information processing apparatus that generates command definition information that instructs a device to perform a certain operation or data processing.
Document data storage means for storing document data in which code string information and position information are registered for each symbol or each character string on the document in the system;
An information processing apparatus comprising dictionary storage means for storing dictionary data registered by associating code string information with semantic information on the command definition for a specific symbol or term,
The command definition information for the system is a specific symbol or term registered in the above dictionary data, and is added to the other entry information described on the document to add the other entry information to the system. By repeating the collation between the corresponding code string information registered in the dictionary data and the code string information of each symbol or each character string constituting the document data, the first entry information that designates conversion to Means for detecting from the document;
The detected first entry information and the second entry information which is a symbol or character string in a specific arrangement relationship on the document, the position information of the first entry information, and each symbol constituting the document data Or a means for identifying by repeating matching between the position information of each character string,
For the second entry information identified on the document, by repeating collation between the code string information and the code string information of each symbol or each term registered in the dictionary data, Means for identifying command definition semantic information registered corresponding to the second entry information, and generating command information for instructing the system to perform the corresponding processing;
It is characterized by having.
[0160]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the accompanying drawings.
[0170]
FIG. 1 shows a hardware system configuration of an information processing apparatus according to an embodiment of the present invention. In this system, the color image scanner 10, the keyboard 12, the mouse 14 and the digitizer 15 are suitable as input devices, the internal memory 16 and the external memory 18 as storage devices, and the display device 20 and the printing device 22 as appropriate output devices. It is connected to the CPU 24 via an interface circuit (not shown). The CPU 24 is also connected to a telephone line or a communication line 27 via the communication device 26.
[0180]
The color image scanner 10 reads characters, symbols, and figures in a document written on a sheet as color image information. The internal memory 16 and the external memory 18 store various electronic dictionaries, character fonts, files, and the like in addition to various programs that define processing or control operations of the CPU 24. The communication device 26 has a facsimile communication function.
[0190]
FIG. 2 shows a list of operation modes related to creation of a book table in the system of the present embodiment. Main modes such as “Main”, “Definition”, “Environment setting” are set, and these main modes branch to sub-modes such as “Retrieve”…, “Definition interpretation”, “Definition distinction setting”, etc. is doing.
[0200]
FIG. 3 shows a “main mode list menu” displayed on the display screen 20 a of the display device 20. In this menu screen, main mode selection buttons such as “main”, “definition”, “environment setting”, and the like are displayed in the lower right part of the screen.
[0210]
When the “environment setting” button is clicked in the “main mode list menu”, the environment setting mode is selected. When switched to the environment setting mode, a screen as shown in FIG. 4 is displayed on the display screen 20a, and sub-mode selection buttons such as “definition distinction setting” and “definition information setting” are displayed in the lower right portion of the screen. When the “definition information setting” button is clicked here, the definition information setting mode is entered, and a “definition element / entry information comparison table” as shown in FIGS. 5 to 8 is displayed on the screen.
[0220]
5 to 8, in this embodiment, "common", "data management", "data definition", "file definition", "command / procedure definition", "format definition", "editing proofreading definition", etc. A plurality of definition systems are prepared, and a plurality of definition elements are set in each definition system. Among these definition systems, each definition element of the "data management", "data definition", "file definition" or "command / procedure definition" system is used to set the format for data management, Each definition element of the “Edit / Proof Definition” system is used to set the format of the document. Each definition element of “common” is shared by each format of “data management”, “data definition”, “file definition”, “command / procedure definition”, “format definition”, and “edit proofreading definition”.
[0230]
As shown in FIGS. 5 to 8, each definition element is associated with one or more types of predetermined characters (character strings), symbols, or figures. Some definition elements, for example, “round up” corresponding to the definition element “rounding” of the “data management” system, express the target definition content only by the entry information, for example, “common” system In other cases, other entry information is designated, such as “<>” corresponding to “item name”, and the definition content is entrusted to the designated entry information. In addition, the character, symbol, etc. of the normal entry information entered in the area specified by this entry information, such as “◯” corresponding to the “common” definition element “definition element designation”, is used as the definition element. Some indicate that it should be converted, or refer to a term dictionary to indicate that it should be interpreted into a specific definition.
[0240]
In addition, the data item name (category) and data name (numeric value, text) that are paired with each other, such as the relationship between "category" and "numeric value", "text", and "aggregated numeric value" in the "data definition" system , Aggregated numerical value) are registered as individual definition elements, the relationship of this pair is displayed so as to be understood in the target table.
[0250]
The association between the definition element and the entry information as described above may be prepared from the beginning by the system, or the user may be able to set and register at any time by screen input. In any case, for example, in the data format as shown in FIG. 9, definition element identification data having a variable data length corresponding to the comparison tables of FIGS. 5 to 8 is set for each definition element. Each definition element identification data is held in a definition element identification data storage section 48 (FIG. 25) of a definition information recognition section described later.
[0260]
In the data format of “definition element identification data” in FIG. 9, the code of the definition system (format definition) to which the definition element (for example, “right-handed”) belongs is set in the data field of “definition system code”. , The code of the definition element (right) is set in the data field of “definition element type”, and each data field of “configuration character string / symbol string” corresponds to the definition element (right). A character string or a symbol (“right”, “right-justified”, “right-justified”) code is set with predetermined delimiter identification data in between, and the end field is given predetermined end identification data indicating the end of this data. It is done.
[0270]
The field of “definition element code of pair relationship” has a pair relationship as described above in “data definition” system, such as “category” and (“number”, “text”, “total number”). When there is another definition element code, the other definition element code is set. Therefore, in the case of “definition element identification data” of “category”, definition element codes of “numerical value”, “text” and “total numerical value” are set in this field. Further, in the case of “definition element identification data” of “numerical value”, “text”, or “total numerical value”, “definition element identification data” of “classification” is set in this field.
[0280]
As described above, in this embodiment, definition elements for performing various definitions on a document are associated with characters, symbols, or figures that can be used as normal entry information representing normal document contents. However, as will be described later, when used as a definition element, special modification information (for example, color information) is attached to the entry information so as to distinguish it from normal entry information representing the document contents. In other words, the user can use the entry information that he / she is familiar with as normal entry information to represent the document contents as it is, but also add a special modification information to the definition to show the definition contents. It can be used as information.
[0290]
When the “definition distinction setting” sub-mode selection button is selected on the “environment setting mode screen” in FIG. 4, a “definition information distinction instruction screen” as shown in FIG. 10 appears on the display screen 20a.
[0300]
In FIG. 10, definition systems such as “data management”, “format definition”, and “editing proof definition” are listed in the [definition system] column. The user only has to input the modification information or identification information of [color], [line modification], [line thickness], and [handwriting / printing] used for the entry information of each definition system at each position.
[0310]
In the example of FIG. 10, “data management”, “data definition”, “file definition”, and “command / procedure definition” are respectively (blue), and “format definition” and “editing proofreading definition” are each (red). Is entered in the [Color] field. Since each definition element of “common” is shared by all definition systems as described above, there is no need to set decoration information unique to “common”.
[0320]
In response to the input operation of the definition information distinction instruction, definition information distinction data for each definition system is set in the data format as shown in FIG. 11, for example. This definition information distinction data is held in the definition information distinction data storage unit 50 (FIG. 25) of the definition information recognition unit described later.
[0330]
FIG. 10 shows a “main” mode screen, which is one of the main modes. In this "Main" mode screen, sub-mode selection buttons such as "Eject", "Store", "Next", and "Execute" are displayed at the bottom right of the screen. It is designed to switch to the selected sub mode. The “main” mode screen appears by default on the display screen 20a immediately after the power is turned on, and when the “mode” button that is always displayed in the lower left corner of the screen is clicked, the “main mode list menu” described above is displayed. Switch to the screen.
[0340]
Next, each function of “data definition” and “file definition” set and registered in the system as a premise of an application, for example, a book table creation function in this system will be described.
[0350]
In order to set “data definition” in this example, a data definition document as shown in FIG. 13 is prepared. This data definition is a list of application data item names and their attribute data names that can be used to build an application system. For example, specifications created by system engineers may be used as they are. Alternatively, it may be newly created by the document creation function of this system for setting “data definition”.
[0360]
In this example, it is assumed that the data definition document is, for example, a document in which the document content is described with a black writing instrument, ink, toner, etc. on a sheet of white ground color.
[0370]
In this data definition document, each table corresponds to a plurality of basic data items registered in advance in the system for "data definition" in a table consisting of a plurality of ruled lines drawn at predetermined intervals in the vertical and horizontal directions. The desired data name on the application to be executed is described in a list format.
[0380]
In other words, in the item entry column provided in the top row of the table, one (one item) for each cell (entry box), the basic data items “data item name”, “category” registered in the system, Character strings representing “corresponding master name” and “synonyms” are entered.
[0390]
In the first row of the data name entry field provided below the item entry field, the character string “classification” is used as the data name of “data item name”, and the character string “ “Text” is the data name of “Corresponding Master Name” as a character string “Product Classification Star”, and the data name of “Synonym” is one character string “Product Classification” in each cell (entry box) (one data name). ) Are filled in one by one.
[0400]
This line (record) is described in this system by setting “classification” as one of the “data items” on the application and treating this “classification” as “text” data. Is registered in the “product classification master” file, and “product classification” is regarded as a synonym for “classification”.
[0410]
Even in the second and lower lines of the data name entry column, for each of “product number”, “sales”, “unit price”,... Selected as the data item name on the application, “classification”, “corresponding master name”, Each attribute data name of “synonym” is entered.
[0420]
As described above, this data definition document (FIG. 13) is a document composed of normal entry information (characters, symbols or figures normally used to represent the document content), and the description content is handled by a handler (for example, a system engineer). ) Is understandable at a glance. However, if the document contents are input as they are to the system, they are merely recognized as document information, and do not substantially make sense as a definition document.
[0430]
Therefore, in this system, the definition content as recognized by the operator is recognized in the system by entering the definition support information for supporting the desired definition in the document content consisting of normal entry information and inputting it into the system. I try to let them.
[0440]
For the data definition document of this example (FIG. 13), for example, as shown in FIG. 14, “common” and “data definition” type definition support information may be entered in (blue).
[0450]
In FIG. 14, in the data item name entry column, the (black) data item name character strings “data item name”, “classification”, “corresponding master name”, and “synonym” are indicated by “blue” “definition element designation”. Enclosed in the definition element entry information “◯”, and in (blue) “entry” definition element entry information “<>”. As a result, these character strings “data item name”, “category”, “corresponding master name”, “synonym” are converted into definition element entry information, and each is defined as a data item name. .
[0460]
Also, in the data name entry column, the top and bottom rows in each vertical field (cell column) corresponding to each data item name “data item name”, “category”, “corresponding master name”, “synonym” Enter the definition information “[]” of “Range specification” in the cell of “”. Thus, it is defined that each vertical field (cell column) is a data entry column in which data of each corresponding data item name is entered or should be entered.
[0470]
The data definition document (FIG. 14) additionally filled with the definition support information as described above is input from the color image scanner 10 to the present system.
[0480]
FIG. 15 shows the configuration of the document input and document element data generation unit in the system of this embodiment. The document image input unit 30 includes an input device such as a color image scanner 10, a keyboard 12, and a mouse 14, a CPU 24 that executes an input routine, and an internal memory 16 or an external memory 18 that once captures an input color image. Is done. The document image storage unit 32, the character / graphic pattern dictionary 36, and the document element data storage unit 38 use storage areas of the internal memory 16 or the external memory 18. The character / graphic element recognition unit 34 includes a CPU 24 that executes a character / graphic recognition processing program. The document image output unit 40 is mainly configured by a CPU 24 that executes a display control program, and a display device 20 that performs display output of a document image under the control of the CPU 24 or a communication device 26 that performs transmission output of a document image. The
[0490]
In the document image storage unit 32 and the document element data storage unit 38, an image data area 32 (i) for storing image data for each input document or page PAi and a document element data area 38 for storing document element data. (i) is set for each. As shown in FIGS. 16 and 17, memory management for each image data area 32 (i) and each document element data area 38 (i) is performed for each input document or page PAi. Is performed using the sheet data area management data CD (i) set in (1).
[0500]
In this system, when a predetermined process is defined between different documents or pages, these plural documents (pages) are treated as belonging to one group (hereinafter referred to as “sheet group”). Various methods can be used to inform the system from the user that a plurality of documents or pages are grouped as a sheet group. For example, when a user inputs a plurality of documents or pages continuously from the image scanner 10 after performing a predetermined button operation, the system may determine that these documents or pages are a sheet group. .
[0510]
When a reading operation by the image scanner 10 is performed on the data definition document (FIG. 14) of this example, a color image signal representing the document contents (all entry contents) is taken into the image storage unit of the input unit 30. The color image signal for each document captured by the input unit 30 is decomposed into (black), (blue), and (red) color image signals in the form of signals, and (black) in the document image storage unit 32. The image signal, the (blue) image signal, and the (red) image signal are accumulated in the black image storage unit 32a, the blue image storage unit 32b, and the red image storage unit 32c, respectively.
[0520]
Next, the character / graphic element recognition unit 34 recognizes individual characters and graphic elements in the document for each color (black, blue, red) with respect to the pixel data for each document stored in the document image storage unit 32. To do. Here, the graphic element is a group of simple patterned figures whose shapes can be easily recognized as lines, rectangles, and circles.
[0530]
For image recognition in this embodiment, for example, “image management data” set in advance in a data format as shown in FIG. 18 is referred to. In this “image management data”, as shown in FIG. 19, assuming that the input image is composed of a large number of pixels PX arranged in a matrix, data representing the number, dimensions, pitch, etc. of the pixels PX is set. ing.
[0540]
Character / graphic recognition in the character / graphic element recognition unit 34 is basically performed by recognizing line elements constituting individual characters and graphic elements. For the identification of line elements, various conventionally known methods may be used. For example, first, a set of dots having a specific color is found, and then an adjacent region or a surrounding area is searched to determine a direction in which the set of dots extends. This process is repeated, and the trace drawn by the set of dots is traced until it disappears (ends). If there is a location where the direction of the trajectory changes abruptly during the tracking, the location is identified as a bending point or cusp.
[0550]
The line element extracted in this way can be identified as one of the line element patterns set in advance by its shape and size. In the present embodiment, the character / graphic pattern dictionary 36 stores in advance the type of line elements constituting each character and figure and the significant positional relationship between the constituent line elements in a predetermined electronic dictionary system ( Registered). The character / graphic element recognition unit 34 combines the adjacent line elements extracted as described above with each other, and repeats the process of collating this with the character / graphic pattern dictionary 36, whereby individual characters, symbols, Recognize shapes.
[0560]
For example, a ruled line constituting a table such as a list is recognized as follows. That is, a line element extracted as a straight line in the recognition of a line element as described above is an order of magnitude longer than other line elements, and the straight line direction is relative to a horizontal line (X axis) or a vertical line (Y axis). If the inclination falls within a certain angle, the straight line is regarded as a horizontal ruled line or a vertical ruled line, and the position information is corrected so as to be parallel to the horizontal line or the vertical line. Also, when the distance between the end points of two extracted ruled lines or the distance between the end point of one ruled line and the other ruled line is within a certain value, the end points of both ruled lines overlap each other, It is considered that the end point of the ruled line is overlapped with the other ruled line, and the respective position information is corrected so that both ruled lines overlap in this way.
[0570]
The character / graphic element recognition unit 34 performs character / graphic recognition processing as described above on each color (black, blue, red) image of a document inputted as an image, so that, for example, a character / graphic element recognition unit 34 Document element data is generated in a data format as shown in FIGS.
[0580]
FIG. 20 shows a data format example of document element data (character data) corresponding to one character. As shown in the figure, the character code, typeface, color, line thickness, line modification (solid line, dotted line, chain line, etc.), handwriting / printing (distinguishing whether it is handwritten or printed), entry position and size Data representing character length (character size) is sequentially set in a predetermined data field, and end identification data indicating the end of the document element data is added at the end.
[0590]
FIG. 21 shows a data format example of document element data (character string data) corresponding to one character string. As shown in the figure, "first character position" and "end line position" indicating the arrangement position of the character string, "line pitch" and "character pitch" indicating the format of the character string are set, and the character string Are set in the order of arrangement.
[0600]
22, FIG. 23, and FIG. 24 are data format examples of document element data (graphic element data) corresponding to one graphic element or symbol, respectively. As shown in FIG. 22, the data of the start position and the end position is incorporated for the line segment. As shown in FIG. 23, data on the center position (X and Y directions) and the diameter size (X and Y directions) are incorporated for the ellipse. As shown in FIG. 24, for rectangles, “<”, and the like, data indicating the positions of bending points or cusps (points where the direction of the line segment changes sharply) is incorporated in addition to the start and end positions.
[0610]
As described above, all entry information in each document inputted as an image is decomposed into individual characters, symbols, and figures and converted into document element data by the character / graphic element recognition unit 34. These document element data are stored in the document element data storage unit 38 for each document. Note that the image information corresponding to the entry information that has been subjected to the character / graphic recognition process and converted into the document element data may be deleted from the document image storage unit 32.
[0620]
The document image output unit 40 not only outputs a document image based on the image signal held in the document image storage unit 32 but also outputs it from the document element data stored in the document element data storage unit 38. The document image is output after being converted into an image signal via the graphic pattern dictionary 36.
[0630]
FIG. 25 shows the configuration of the definition information recognition and format setting unit in the system of this embodiment. The definition element data generation unit 42 and the definition data generation unit 46 are configured by the CPU 24 that executes definition element data and definition data generation processing. The combination rule memory 45, the definition information identification data storage unit 48, the definition information distinction data storage unit 50, the application term dictionary 52, the definition data storage unit 54, and the sheet group definition data storage unit 56 may be the internal memory 16 or the external It is expanded on a predetermined storage area of the memory 18.
[0640]
In the document element data storage unit 44 and the definition data storage unit 54, a document element data area 44 (i) for storing document element data for each input document or page PAi and a definition data area 54 for storing definition data. (i) is set for each.
[0650]
As shown in FIGS. 16 and 17, the memory management for each document element data area 44 (i) and each definition data area 54 (i) is performed for each input document or page PAi. Is performed using the sheet data area management data CD (i) set in (1).
[0660]
In this definition information recognition and format setting unit, first, the definition element generation unit 42 defines definition element identification data (FIG. 9) and definition held in the definition element identification data storage unit 48 and the definition information distinction data storage unit 50, respectively. Each definition element entered in each document or page based on the document element identification data (FIGS. 20 to 24) stored in the document element identification data storage unit 38 with reference to the information distinction data (FIG. 11) Data for each entry information (definition element data) is generated.
[0670]
FIG. 26 shows a data format example of the definition element data. A “definition code” and “definition element code” for identifying the definition element entry information are set, and a pointer for referring to the document element data corresponding to the characters, graphics, and symbols constituting the definition element entry information Is set. For example, in the case of “[” of “range specification”, a pointer for specifying the address of the document element data corresponding to the entry information “[” is set.
[0680]
In order to generate the definition element data, document element data having specific modification information, for example, (red) color information is searched. As a result of this search, for example, when the entry information of “[” is extracted, the other entry information “]” paired with it is determined, and the definition element entry information “[]” of “range specification” is determined. . As a result, the “definition code” and “definition element code” are determined, and the pointers that respectively specify the addresses of the document element data (graphic element data) of “[” and “]” that constitute the definition element entry information are also determined. .
[0690]
Each definition element data obtained from the definition element data generation unit 42 as described above is stored in the corresponding definition element data area of the definition element data storage unit 44 for each document or page, and is managed by the sheet data area management unit 35. Is done.
[0700]
Next, the definition data generation unit 46 refers to the definition information distinction data (FIG. 11) held in the definition information distinction data storage unit 50, and defines the definition element data ( 26), the document element data (FIGS. 20 to 24) accumulated in the document element data storage unit 38, and the combination rule (construction rule) algorithm stored in the combination rule (construction rule) memory 45. Definition data is generated for each definition information written on each document or page or across different documents or pages.
[0710]
Regarding the above data definition document (FIG. 14), as will be described below, “item definition data” (FIG. 27), “item definition data chain” (FIG. 28), ““ cell data ”(FIG. 29). “In-field cell data chain” (FIG. 30), “In-record cell data chain” (FIG. 31) and “Data definition data” (FIG. 32) are created.
[0720]
First, “cell data” (FIG. 29) is created as follows. Each cell (data entry frame) is identified by searching the line segment or ruled line of the table through the document element data, and the connection to the next cell in the same field and record, together with the data indicating the position of the cell. Set the pointer to give Further, whether or not a character string is entered in the cell is checked through the document element data, and if it is entered, a pointer for referring to the corresponding document element data is set.
[0730]
In addition, a cell string partitioned by (blue) range specification “[]” is detected, and a character string enclosed by “items” “<>” in (blue) is the extension direction of the cell string (field). Or is connected to the cell column by a (blue) “join line” “−”, the character string is determined to be a data item name corresponding to the field according to the join rule. Then, “item definition data” (FIG. 27) is created. In addition, an “in-field cell data chain” (FIG. 30) is created.
[0740]
In addition, when a plurality of field cell columns are adjacent to each other in a direction perpendicular to the cell column direction, these adjacent cell columns are determined to be “in-record cell columns” according to a combining rule, The “cell data chain in record” (FIG. 31) is created. In addition, an “item definition data chain” (FIG. 28) is created.
[0750]
As described above, in the present system, the definition data generation unit 46 refers to the combination rule algorithm registered in the combination rule memory 45, and thereby a plurality of unit definition information respectively given by a plurality of definition element entry information. To recognize one compound definition information, and further combine multiple unit definition information and compound definition information or compound definition information to recognize more complex or advanced definition information. Accordingly, necessary definition data for defining each definition content is created.
[0760]
When the “item definition data chain” (FIG. 28) is created as described above, the procedure shown in FIG. 32 is entered, and a group of data item names in each “item definition data” constituting the chain is identified ( Step S1).
[0770]
In this example, the data item name string “data item name”, “category”, “corresponding master name”, and “synonym” are enclosed in “blue” “definition element specification” “◯”. By querying the definition element identification data storage unit 48, it is found that the data item name is registered in the “data definition” system. When this determination result is obtained (step S2), the "data definition data creation process" (step S3) is entered.
[0780]
In the “data definition data creation process”, a cell string (record in each row in this example) orthogonal to the field is taken out one by one based on the “cell data chain in record”, and the data name character string in each cell is Judgment whether or not it is registered in the system, and what is registered (in this example, the data name "text", "numeric value", "aggregated numeric value" of "category" is registered as the definition element code) Sets a fixed data length code and corresponds to the character string of unregistered data (in this example, "data item name", "corresponding master name", and "synonym" data names correspond) By setting a character code string of variable data length to be generated, “data definition data” (FIG. 33) for each row (record) is created.
[0790]
Therefore, the number of “data definition data” (FIG. 33) equal to the number of rows entered in the list is created from the data definition document (FIG. 14) of this example. These “data definition data” groups constitute a “data name dictionary” for referring to data names set and registered for each data item name usable in the application.
[0800]
As mentioned above, with this system, you can easily perform “data definition”, which is the basic setting for building an application, by performing operations or operations to write characters, symbols, or figures that you are used to on a daily basis. . Therefore, not only the burden on the system operator such as a system engineer is reduced, but also the user (end user) of the application software can participate in “data definition”.
[0810]
Next, “file definition” will be described. In general, “file definition” is performed each time an individual file on an application is registered or stored in the system. In this system, for example, when “monthly sales file” is registered (stored) in the system, “file definition” is performed using a file definition document as shown in FIG. It is assumed that this file definition document is also a document in which document information (contents) is written in black on white paper.
[0820]
In this file definition document (FIG. 34), the above data definition document (FIG. 14) is displayed in a list form in a table composed of 3 rows by 5 columns of matrix cells (entry boxes). The name of each data item on the application that is set and registered using, the corresponding row name (access name) registered in advance in the system in the middle row, and the data related to the data item name in the lower row Each field length (byte) to be assigned to the name is described.
[0830]
That is, the data item names “Monthly”, “Classification”, “Part Number”, “Unit Price”, and “Number of Sales” on the application are field names “MON”, “BUN”, “HIN”, “ TAN "and" SUU "correspond, and the data value field lengths are" 5 (bytes) "," 20 (bytes) "," 20 (bytes) "," 5 (bytes) "," 5 (bytes) " Is described. It is assumed that this file definition document is also a document in which document information (contents) is written in black on white paper.
[0840]
This file definition document (FIG. 34) is also a human-oriented definition document consisting of normal entry information like the above data definition document (FIG. 13). It is only recognized and essentially does not make sense as a definition.
[0850]
In order to make this human-oriented definition book a definition book that can be recognized by this system, as shown in FIG. 35, “common” and “file definition” type definition support information may be entered in (blue).
[0860]
In FIG. 35, necessary definition information is entered to define the list of file definition documents as “item definition”.
[0870]
That is, the field of each row expanded in the horizontal direction in the table is designated by definition element entry information “[]” of “range specification” in (blue). This table does not include data item names indicating the attributes of the fields in each row. Therefore, (blue) data item name character strings “data item name”, “field name”, and “field length” are entered as definition support information in the blank space outside the table in the extension direction of each field.
[0880]
Then, each data item name character string “data item name”, “field name”, and “field length” added in (blue) is the definition element entry information “◯” in “definition element designation” in (blue). Enclose and enclose the definition item entry information “<>” for “item” in (blue) from both the left and right sides, and connect to each corresponding field via definition element entry information “-” for “join line” in (blue) .
[0890]
In addition, in order to register the title “Monthly Sales File” as the file name, this title string “Monthly Sales File” is enclosed in (blue) “range specification” “[]” and next to it in (blue) Enter the data item name “file name”, and enclose this data item name string “file name” in (blue) with “definition element specification” “〇”, and enter the definition element for “item” in (blue) Enclose with information “<>”.
[0900]
The file definition document (FIG. 35) additionally including the definition support information as described above is also input to the system from the color / image scanner 10 in the same manner as the data definition document (FIG. 13).
[0910]
Then, in this system, the same processing unit (FIGS. 19 and 28) as described above is used for the file definition document containing this definition information (FIG. 35) (1) “Recognition of document elements (characters / graphics etc.)”, 2) “Correction of document elements (characters / graphics, etc.)”, (3) “Extraction / identification of definition element entry information (generation of definition element data)” and (4) “Interpretation of definition contents (generation of definition data)” Are performed sequentially.
[0920]
As a result, the definition data includes “item definition data” (FIG. 27), “item definition data chain” (FIG. 36), “cell data” (FIG. 29), “in-field” “Cell data chain” (FIG. 30), “In-record cell data chain” (FIG. 31) and “File definition data” (FIG. 32) are created. In the case of this list, field cell columns are expanded in the horizontal direction, and record cell columns are expanded in the vertical direction. Also, single “item definition data” (FIG. 27) having “file name” as the data item name is created from the definition information related to the title “monthly sales file”.
[0930]
If “item definition data chain” (FIG. 36) corresponding to the data item names “data item name”, “field name”, and “field length” of the list is created in this “file definition” as well, FIG. Then, a group of data item names in each “item definition data” constituting the chain is identified (step S1).
[0940]
In this example, since the data item name character strings “data item name”, “field name”, and “field length” are surrounded by “blue” “definition element designation” “◯”, definition element identification data storage By referring to the section 48, it is found that the data item name is registered in the “file definition” system. When this determination result is obtained (step S4), the "file definition data creation process" (step S5) is entered.
[0950]
In "File definition data creation process", each cell column orthogonal to the field (in this example, each vertical record) is extracted based on "In-record cell data chain", and the data name character string in each cell Is registered in this system.
[0960]
In this example, “Monthly”, “Classification”, “Part No.”, etc., which are the data names of “Data Item Name” on the aliquot, are variable data in “Data Name Dictionary”, that is, “Data Definition Data” (FIG. 33). It is registered in the form of a long character code string. In addition, “MON”, “BUN”, “HIN”,..., Which are data names of “field names”, are set and registered as fixed data length codes as field names (access names) in the system. The data names “5”, “20”, “20”,... Of “Field length” can be converted into numerical data having a fixed data length.
[0970]
As described above, each character code string or fixed data or code corresponding to the data name character string of “data item name”, “field name”, and “field length” is identified one record at a time, and all records in the list are recorded. Set the record in “File definition data”.
[0980]
Also, based on the item definition data for the title “Monthly Sales File”, set “File Name” as a character code string and access this “Monthly Sales File” stored in any storage area in the system. A file name (access name) is also set (FIG. 37). Here, “file name (access name)” is file identification data in the system corresponding to the “file name” input by the user, and is automatically assigned by the system.
[0990]
FIG. 38 shows a configuration example of the file management unit in this system. In the file storage area provided in the internal memory 16 or the external memory 18, the files A, B, C. Are stored in arbitrary storage locations, and index data (file management data) for searching for each file is stored in predetermined storage locations. A file manager (file management program) accesses each file by referring to the index data. From the outside, the file manager may be accessed with the “file name (access name)”.
[1000]
As described above, in this system, a “file definition” required for registering a file can be easily performed by an operation or operation for entering characters, symbols, or figures that are familiar to everyday use in a document. Therefore, not only the burden on the system operator is reduced, but also the end user can participate in the “file definition”.
[1010]
Next, a function for creating a book table in the system of this embodiment will be described. In this system, a desired book table can be easily created especially by an end user.
[1020]
FIG. 39 shows, as an example, a book cover sheet in which the basic items of “Monthly Sales Ledger” are entered in advance by handwriting. All of the characters, symbols, and figures entered on the book table sheet are normal entry information indicating the document contents of the book table, and are written in the same color, for example, black.
[1030]
In this booklet sheet, the data item name “product name”, “number of sales”, “unit price”, “sales” is displayed in each cell (entry field) in the item name entry field provided in the top row of the list. ) Each item name is filled in. Two data entry fields (fields) for each data item name are assigned to “product name”, and one is assigned to the other item names “number of sales”, “unit price”, and “sales”. In the “product name” field, data names of “classification” and “product number” (for example, “TV”, “J1020”) are entered, and the other fields are blank.
[1040]
Above the table, a book table name “Monthly Sales Ledger” is written in the center, and “Kanda Branch” and “1995” are written as annotations in the right corner. Below the table, two annotations “(Note) Output from monthly sales file” and “Sales = unit price × number of sales” are written on the left and right.
[1050]
The user may enter the definition support information with a color writing instrument as shown in FIG. 40 with reference to the “definition element / entry information comparison table” of FIGS. .
[1060]
Also in this case, a specific color is assigned as the modification information to the definition element entry information and the additional entry information of each definition system. In this example, definition support information for the “common” and “command / procedure” definition systems is entered in (blue).
[1070]
In the book table of FIG. 40, the definition information entry information “[]” of “range specification” is entered in (blue) in the uppermost cell and the lowermost cell of the vertical cell row, and these cell rows (data entry fields) ) As a field.
[1080]
Enter the definition support information “<Classification>” and “<Part No.>” in blue in the space above the left end of the list, and replace these item name character strings with “Blue” “joining line” “-”. Are connected to two fields corresponding to the “product name”. The (black) data item name character string “product name” remains as it is, and no (blue) definition support information is attached. As a result, the left and right two columns of fields located under “Product Name” are not added to the original (black) data item name “Product Name”, but the data item names “Classification” and “Product Number” added in (blue). It is defined to correspond to each.
[1090]
In each column to the right of the “Product Name” column, each data item name character string “Black” “Number of sales”, “Unit price”, “Sales” “blue” on both sides of the “Item” definition element The entry information “<>” is entered, and “<number of sales>”, “<unit price>”, “<sales>”. As a result, “number of sales”, “unit price”, and “sales” are defined as data item names.
[1100]
Also, adjacent to these data item names “<number of sales>”, “<unit price>”, and “<sales>”, as indicated above by (range) “[]” in (blue) The field is defined. As a result, even though the (blue) connecting line “-” is omitted between them, definition information for “item definition” that associates each data item name with each field is entered. Become.
[1110]
Regarding the annotations outside the table, the (black) annotation “Kanda Branch” in the upper right part is enclosed in the definition information “{}” of “out of range designation” in (blue). This explicitly defines that the annotation information is excluded from the definition information.
[1120]
On the lower side, the composite definition support information “□-<monthly>” is entered in (blue) to the right of the normal entry information “1995” in (black). This definition information includes the definition information for “field (data entry field)”, the definition information for “item” definition “<>”, the data item name string “by month”, and the definition of “join line”. It consists of element entry information “-”. As a result, the area (field) designated by “□” is defined as a data entry column for the data item <monthly>.
[1130]
At the bottom of the book table, in the comment “sales = unit price × number of sales” written in the normal entry information in (black), each data item name string “sales”, “unit price”, “number of sales” (Blue) “Item” definition element entry information “<>”. Thus, it is defined that the calculation formula (ordinary entry information) of this annotation is a calculation formula for data management.
[1140]
In another comment "(Note) Output from monthly sales file", the file name "Monthly sales file" is enclosed in the definition information "[]" of "Range specification" in (blue) and the predicate part “From” and “Output” are respectively enclosed in definition element entry information “◯” of “definition element designation” in (blue).
[1150]
Then, the file name character string “Monthly sales file” indicated by “range specification“ [] ”in (blue) and the data item name“ <file name> ”entered in (blue) in the vicinity are displayed in“ blue ” They are connected via a "-" connecting line. As a result, “item definition” is performed for the file name “monthly sales file”, and “from” and “output” of the normal entry information are defined as “command / procedure definition” system definition elements “source” and “output”, respectively. This means that the definition element entry information indicating the data has been converted, and as a result, “monthly sales file” (output source operand) defines that data should be output to this book (command).
[1160]
The book table document (FIG. 40) to which the definition support information has been additionally entered as described above is input from the color image scanner 10 to the present system.
[1170]
Then, in this system, the same processing unit (FIGS. 19 and 28) as described above is used for the file definition document containing this definition information (FIG. 35) (1) “Recognition of document elements (characters / graphics etc.)”, 2) “Correction of document elements (characters / graphics, etc.)”, (3) “Extraction / identification of definition element entry information (generation of definition element data)” and (4) “Interpretation of definition contents (generation of definition data)” Are performed sequentially.
[1180]
As a result, as the definition data, “item definition data” (FIG. 27), “item definition data chain” (FIG. 41), “cell data” (FIG. 29), “cell in field” “Data chain” (FIG. 30) and “In-record cell data chain” (FIG. 31) are created. In the case of this list, field cell columns are expanded in the vertical direction, and record cell columns are expanded in the horizontal direction.
[1190]
Also, single “item definition data” (FIG. 27) having “monthly” as the data item name is created from the definition information “□-<monthly>” entered in the right corner of the table.
[1200]
Further, “calculation formula definition data” (FIG. 42) is created from the definition information related to the annotation “sales amount = unit price × number of sales” described in the right side of the blank below the table.
[1210]
“Book table management data” (Figure) for managing various types of book table related definition data (“item definition data”, “item definition data chain”, “calculation formula definition data”, etc.) 45).
[1220]
In addition, “data output command definition data” (FIG. 46) is created for the definition information related to the annotation “(Note) Output from monthly sales file” described in the left part of the blank below the table.
[1230]
Also in this case, if the “item definition data chain” (FIG. 41) corresponding to the data item names “classification”, “part number”, “number of sales”, “unit price”, “sales” of the list is created, The procedure shown in FIG. 32 is entered, and a group of data item names in each “item definition data” constituting the chain is identified (step S1).
[1240]
In this example, the data item name character strings “classification”, “product number”, “number of sales”, “unit price”, and “sales” are registered in the “data name dictionary” or “data definition data” (FIG. 33). Therefore, it is found that this list is a definition document (book table) on the application. When this determination result is obtained (step S6), the “book table definition data creation process” (step S7) is entered.
[1250]
In the “book table definition data creation process”, the definition data related to this list, that is, “item definition data”, “item definition data chain”, “cell data”, “cell data field in field”, “cell in record” Generated from not only the “data chain” but also the definition information connected to the table with the bond line “-”, or the specified definition information entered in the same document or page even if there is no bond line “-” The definition data is also recognized as the configuration information relating to the same book table, and these definition data are collectively organized as “book table definition data” in “book table management data” (FIG. 45). In other words, the “book table management data” is management data that collects a group of “book table definition data” that make up one logical book table.
[1260]
In this example, it is determined that the single “item definition data” generated from the definition information “□-<monthly>” on the list is also book table related definition data (configuration information). "(Fig. 45).
[1270]
In addition, for the note “<Sales> = <Unit Price> × <Number of Sales>” below the table, a plurality of character strings <Sales] enclosed in “Items” “<>” in (1) (blue) >, <Unit price>, <number of sales> between characters or symbols (“=”, “×”), and (2) these sandwiched characters (character strings) or symbols Since two conditions of being registered in the definition element identification data storage unit 48 or the application term dictionary memory 52 are satisfied, these characters (character strings) or symbols are set according to the registered contents (in this example, the operation symbol “= "And" x "meaning).
[1280]
From this recognition result, “calculation formula definition data” (FIG. 42) that defines the calculation formula “<sales> = <unit price> × <number of sales>” of this annotation is created. Since this “calculation formula definition data” is also “book table definition data” related to this book table, it is pointed out in “book table management data” (FIG. 45).
[1290]
FIG. 43 shows examples of terms included in the applied term dictionary 52. Characters, character strings, and symbols that can be used as terms are registered for each sub-definition system such as “unit”, “calculation formula”, and “total”.
[1300]
FIG. 44 shows a data format example of the term data included in the applied term dictionary 52. A code of each sub-definition system (“unit”, “calculation formula”, “total”, etc.) is set in the data field of “processing system type” in the header. Subsequent to this header, a character code string constituting each character, character string, and symbol belonging to the sub-definition system is sequentially set in a data format of “character code string” in a list format. “Delimiter identification data” corresponds to the comma (,) that separates the terms in FIG.
[1310]
For the definition information related to another note “(Note) Output from monthly sales file” below the table, the character string “From” and “Output” enclosed in “Define element specification” “◯” are “Command / Procedure” Since it is registered as definition elements that mean “source” and “data output” in the “definition” system, it is determined that the command definition information indicates “data output” from a certain data output source, and “data” The process of creating the “output command definition data” (FIG. 46) is started.
[1320]
In this “data output command definition data” creation process, an output source operand and an output destination operand are determined. In this example, according to the combination rule registered in the combination rule (configuration rule) memory 45, “<file name>-[monthly sales file]” constituting the item definition is defined in the “command / procedure definition” system. The element entry information “From” is regarded as the output source operand indicated.
[1330]
Further, since there is no definition information that explicitly indicates this for the output destination operand, the definition data created from other definition information on the same document or page is referred to as the device default. Then, in this example, since “book table definition data” or “book table management data” (FIG. 45) as described above is created, fields or records (data of the book table indicated by these definition data) (Entry column) is determined as the output destination operand.
[1340]
The output source operand and output destination operand identified as described above are pointed to by “data output command definition data” (FIG. 46). Although omitted in this example, if multiple commands are defined within a certain document range (for example, the same document or sheet group), execution between multiple corresponding "command definition data" The order (sequence) is determined, and other “command definition data” to be executed before and after each “command definition data” is pointed out.
[1350]
As described above, when all definition data has been generated for the book table with definition information input to the system (FIG. 40), the processing performed by the system so far, particularly recognition processing (character / graphic recognition) , Correction of position / size, etc., definition of definition) is displayed and output, and the user side confirms.
[1360]
In this display output, the document contents of each document recognized by the system are sequentially displayed on the display screen 20a in a toggle manner, for example. In order to display this document image, the document image output unit 40 queries the character / graphic pattern dictionary 36 for the document element data for each document stored in the document element data storage unit 38 and determines the pattern of each document element. Each pattern is identified, and each pattern is converted into image data in a bitmap format by a development program to generate a video signal.
[1370]
In this way, when the document contents of the book according to the recognition processing result of the system are displayed on the display screen 20a, the user corrects each document from the screen using the keyboard 12, the mouse 14, or the digitizer 15. Or enter new information.
[1380]
For the entry information input from the keyboard 12, the character / graphic element input unit 37 (FIG. 19) can generate document element data without performing character / graphic recognition processing. For entry information input from the mouse 14 or the digitizer 15, each entry information is input by the character / graphic element input unit 37, and the character / graphic element recognition unit 34 sequentially (for each input entry information) performs character / graphic recognition processing. To generate document element data.
[1390]
Even when definition information is input using the input devices 12, 14, and 15 of these screen input methods, the modification information for each definition system is set and input in the “definition information distinction” mode (FIG. 8) of “environment setting”.
[1400]
When the screen input method is used, it is possible to give an instruction for coloring the entry information not only before the entry information but also after the entry. In other words, the color menu can be used by selecting a desired “color” button in the “color menu” prior to entering a character string or ruled line operation, or using standard colors. Among them, a method of instructing (specifying) a desired portion on the screen and subsequently selecting and instructing a desired “color” button can be adopted.
[1410]
Also, if entry information is entered from the screen under a predetermined definition submode, the system will add the definition distinction modification specified in the submode to the entered entry information and display it on the screen. It is also possible to display. In this case, the definition information is recognized from the entry information with the definition distinction modification.
[1420]
When entry information is input on the screen in this way, each time entry information is input, the character / graphic element input unit 37 (FIG. 15) corresponds to each entry information based on the input data. Data will be generated or modified.
[1430]
The entry information (character string, symbol, figure) input from the screen is expressed in the form of document element data (FIGS. 20 to 24) in the system, as in the case of image input from paper.
[1440]
In an actual usage level, it is convenient to use such a screen input method together with the image input method described above. The information entered in the form of an image from the form and the information entered by the command on the screen are managed in the form of the same document element data in the system, so the original entry information (normal entry information) of the book table or its Regardless of the definition entry information added above, any entry information can be input from either image input or screen input.
[1450]
As described above, the user confirms the document content or the definition content of each document at the stage of the output display for confirmation after inputting the document in which the document content is described in advance by the image scanner 10. However, it is possible to add arbitrary entry information, particularly definition support information, from the keyboard 12, mouse 14 or digitizer 15, and it is also possible to input desired definition information with commands from the screen.
[1460]
Further, the user can change or cancel the definition information by executing a desired editing / proofreading function on the screen for the entry information forming the definition information once the definition information is input. .
[1470]
In order to enable setting input of definition information by a command in the screen input method as described above, the system includes a command input unit 60 and a command recognition / execution processing unit 62 as shown in FIG. The command input unit 60 receives commands input from the keyboard 12, mouse 14, or digitizer 15. The command recognition / execution processing unit 62 performs input command analysis and picking processing as described above, and generates, changes, or deletes necessary definition data. The command input unit 60 and the command recognition / execution processing unit 62 include a command input program and a document creation program held in the internal memory 16 and a CPU 24 that executes these programs.
[1480]
Of course, such a screen input method can be performed by the above-described “data definition” and “file definition”.
[1490]
Next, in the system of this embodiment, various functions of data output processing for transferring data from a data file to an electronic book table and outputting the data will be described.
[1500]
In this example, when the “execution button” is selected and instructed in the main mode, the definition execution processing unit 74 (FIG. 49) executes the definition contents of the command system definition data for requesting the system to perform some processing. At this time, the definition execution processing unit 74 searches the definition data storage unit 54 and the sheet group definition data storage unit 56 to extract command-based definition data based on the “definition data type”, and the definition execution order rule memory 59. The execution order of the definition data is determined in accordance with the “definition execution order rule procedure (program) or data” stored in FIG. FIG. 48 shows a data format example of “definition execution order rule data”.
[1510]
In this example, first, the definition content of “data output command definition data” is executed. In this case, this command content (data output) is identified from “definition data type”, and the output source operand (monthly sales file) is pointed to by “output source operand” from “file name” of “item definition data” The file destination is identified through “file definition data”, and the output destination operand (monthly sales ledger) is identified through “book table management data” or “book table definition data” pointed to by “output destination operand”.
[1520]
FIG. 45 shows the configuration of a data output unit that performs book table-related data output processing in this system. The data item conversion unit 72, the definition execution processing unit 74, and the record / document element data conversion unit 78 are each configured by the CPU 24 that executes a predetermined conversion or processing program. The input record storage unit 70, file definition data storage unit 80, book table definition data storage unit 82, output record storage unit 76, and data / character code conversion table 84 are configured by the internal memory 16 or the external memory 18.
[1530]
When the data output processing is started, first, a file record is stored in the input record storage unit 70 from the output source file (monthly sales file) one record at a time or in a predetermined block unit via the “file manager” (FIG. 38). The
[1540]
FIG. 50 shows a record management table of the sales file sent from the output source file and a format example of the file record. The file record input to the record input unit 70 has data items “BUN”, “HIN”, “TAN”,... Defined on the output source file side.
[1550]
The data item conversion unit 72 refers to the “file definition data” (FIG. 37) held in the file definition data storage unit 80, and each data item “BUN”, “HIN”, “TAN” of the input file record. ,... Are converted into data items “classification”, “product number”, “unit price”,... In each corresponding system (FIG. 50).
[1560]
The definition execution processing unit 74 first extracts only the file records for a specific month, for example, October, from the file records from the data item conversion unit 72. This can be determined from the “month” data field of the file record.
[1570]
Next, from the file records for October, only those that match the data name (product) of “classification” and “product number” entered in the output destination (monthly sales ledger) are extracted (FIG. 51).
[1580]
In order to perform this extraction, the character string of each data name corresponding to “classification” and “part number” from the document element data (character string data) pointed to by “item definition data” of “table definition data” (“ TV ”,“ J1020 ”,...), And the identified character string data is converted into data (code) on the record with reference to the data / character code conversion table. Then, the data names other than the tabulation items (“sales number”, “sales amount”) are compared between each record of the book table and each input file record, and it is determined whether or not they all match. In this case, if there is a blank entry in one of the comparison items (in this example, “unit price” on the book table side), it is excluded from the judgment condition.
[1590]
The “book table definition” is executed on the file record extracted in this way according to “book table definition data” (calculation formula definition data, etc.) stored in the book table definition data storage unit 82.
[1600]
In the case of the book table of FIG. 9, the calculation formula “<sales> = <unit price> × <number of sales>” is calculated for each file record in accordance with “calculation formula definition data” (FIG. 42), and the calculation result data Is set in the data item “Sales”. As a result, as shown in FIG. 50, required output data is prepared for each file record. Each file record that has been subjected to the book table definition execution process by the definition execution processing unit 74 is stored in the output record storage unit 76.
[1610]
The record / document element data conversion unit 78 takes out each file record from the output record storage unit 76 and refers to the data / character code conversion table 84 to convert the data of each data item in this record into document element data. . As a result, for example, data representing the size of the numerical value “396” in the file record is character string data for displaying and outputting a predetermined character string “396” at a predetermined position in a predetermined book table. Is converted to
[1620]
Here, the entry destination of the converted document element data can be identified from each item definition data of “book table definition data”. At that time, if the layout format is defined, according to the layout format, if the layout format is not defined as shown in this example, the device size, character pitch, and layout position (for example, numbers are right-justified Determine centering). It should be noted that the color of the entry character may be the same color (black) as other normal entry information. In addition, a pointer to the document element data (character string data) is set in the cell data (FIG. 29) corresponding to each data entry column.
[1630]
The document element data generated by the record / document element data conversion unit 78 is stored together with the document element data originally written in the book table in the document element data storage unit 38 (more specifically, the corresponding document element data area 38 ( i) stored in).
[1640]
Accordingly, the document image output unit 40 reads out all the document element data corresponding to the normal entry information in (black) from the document element data area 38 (i), and reads the read document element data into the character / graphic pattern dictionary 36. 52, the pattern of each document element is identified, and each pattern is converted into bitmap format image data by a development program, whereby a target book output document as shown in FIG. 52 is displayed on, for example, the display screen 20a. Can be displayed. Further, it can be printed out by the printing device 22 or can be faxed by the communication device 24.
[1650]
As described above, even in the book table definition, the user adds the predetermined definition support information composed of characters, symbols, and figures that are familiar to everyday life to the desired book table paper, and follows the predetermined combination rule (construction rule). Since it can be defined as desired, there is very little to remember and simple tasks or operations are required.
[1660]
In particular, in this system, by using the common “item definition” function, all of the “data definition”, “file definition”, and “book table definition” are performed with the same (common) memories in a common operation. be able to. As a result, arbitrary parties from the system operator to the end user can easily participate in “data definition”, “file definition”, and “book table definition”.
[1670]
The data output process described above was a process of outputting data from a file to a book table. Conversely, the process of inputting data from a book table to a file and the process of transferring data between different book tables are the same as described above. Can be done.
[1680]
The “data output command definition” in the above-described book table is merely an example, and various commands can be defined by using definition element entry information of “common” and “command / procedure definition” systems.
[1690]
Although the main functions of the system according to this embodiment have been described above, various modifications are possible. For example, FIG. 53 shows an example in which definition information is input by a command from the screen. As shown in FIG. 53, the document content of the input book table document is displayed on the display screen 20a, and a predetermined command is input from the keyboard 12 or the mouse 14 while confirming the input document content. Definition information can be entered.
[1700]
In FIG. 53, for example, when the “sales number” of the normal entry information is designated and clicked in the “definition” mode, the designated location 90 is specified (for example, highlighted) and simultaneously displayed in the display screen 20a. A sub-screen 94 listing various definition items such as “1. field”, “2. data item”, “3. unit name” appears. Here, when “2. Data item” is selected and instructed, the normal entry information “Number of sales” is converted to “Number of sales” of the data item. Similarly, when an area 92 under the “sales number” column is pointed and clicked, and “1. field” is designated for this area 92, the area 92 is defined as a field for entering the “sales number” data. Is done.
[1710]
In FIG. 53, for convenience of explanation, a state in which the data item location 90 and the field area 92 are selected and instructed at the same time is shown. .
[1720]
In the system, in response to the user operation as described above, the command recognition / execution processing unit 62 analyzes the input command, and the position (click position) on the screen targeted by the command and the document element data The matching with the “position” information of the document element data held in the storage unit 38 is repeated to identify the corresponding document element data (picking process). Then, necessary definition data is generated from the identified document element data and the instruction content of the input command.
[1730]
The present invention uses a program or software for realizing the functions of the present invention described above. Such software can be installed in the system of the present invention via an arbitrary medium, for example, by a storage medium or online. Therefore, an act of transferring a storage medium storing software for implementing the present invention as a business, an act of installing the software in a system online, and the like are one embodiment of the present invention.
[1740]
【The invention's effect】
As described above, according to the present invention, one type of simple symbol is added to the original entry contents of a document or a simple symbol familiar to the user on a document freely created by a user by adding one type of simple symbol. By adding and adding simple symbols, it is possible to define commands that instruct the system to perform various processes.
[1750]
Furthermore, by adding a small number of types of symbols, it is possible to define more various commands with operands.
[1760]
In addition, by giving modification information such as a specific color to the above-mentioned command conversion designation symbol, various commands can be defined in a form that further increases user visibility and user flexibility.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating an example of a system configuration on hardware of an information processing apparatus according to an embodiment of the present invention.
FIG. 2 is a diagram showing a list of main modes in the system of the embodiment.
FIG. 3 is a diagram illustrating a “main mode list menu screen” in the system of the embodiment.
FIG. 4 is a diagram illustrating an “environment setting mode screen” in the system of the embodiment.
FIG. 5 is a diagram showing a “definition element / entry information comparison table” in the system of the embodiment.
FIG. 6 is a diagram showing a “definition element / entry information comparison table” in the system of the embodiment.
FIG. 7 is a diagram showing a “definition element / entry information comparison table” in the system of the embodiment.
FIG. 8 is a diagram showing a “definition element / entry information comparison table” in the system of the embodiment.
FIG. 9 is a diagram illustrating a data format example of “definition element identification data” in the system of the embodiment.
FIG. 10 is a diagram illustrating a “definition information distinction instruction screen” in the system of the embodiment.
FIG. 11 is a diagram illustrating a data format example of “definition information distinction data” in the system of the embodiment.
FIG. 12 is a diagram illustrating a “main mode screen” in the system of the embodiment.
FIG. 13 is a diagram illustrating an example of a definition document used in “data definition” in the system of the embodiment.
14 is a diagram showing an example in which definition support information is additionally entered in the data definition document of FIG. 13;
FIG. 15 is a block diagram illustrating a configuration of a document input and document element data generation unit in the system of the embodiment.
FIG. 16 is a diagram schematically illustrating a sheet data management function in the system according to the embodiment.
FIG. 17 is a diagram illustrating a data format example of “sheet data area management data” in the system of the embodiment;
FIG. 18 is a diagram illustrating a data format example of “image management data” in the system of the embodiment.
FIG. 19 is a diagram illustrating a configuration of an input image that is a target of “image management data” in the system of the embodiment.
FIG. 20 is a diagram illustrating a data format example of “character data” in the system of the embodiment.
FIG. 21 is a diagram illustrating a data format example of “character string data” in the system of the embodiment;
FIG. 22 is a diagram illustrating a data format example of “graphic element data” corresponding to a line segment in the system of the embodiment;
FIG. 23 is a diagram illustrating a data format example of “graphic element data” corresponding to an ellipse in the system of the embodiment;
FIG. 24 is a diagram illustrating a data format example of “graphic element data” corresponding to a rectangle or the like in the system of the embodiment.
FIG. 25 is a block diagram illustrating a configuration of a definition information recognition and format setting unit and a definition execution processing unit in the system of the embodiment.
FIG. 26 is a diagram illustrating a data format example of “definition element data” in the system of the embodiment;
FIG. 27 is a diagram illustrating a data format example of “item definition data” in the system of the embodiment;
FIG. 28 is a diagram schematically illustrating a structure of an “item definition data chain” created by “data definition” in the system of the embodiment.
FIG. 29 is a diagram illustrating a data format example of “cell data” in the system of the embodiment;
FIG. 30 is a diagram illustrating a structure of “in-field cell data chain” in the system of the embodiment;
FIG. 31 is a diagram illustrating a structure of “cell data chain in record” in the system of the embodiment;
FIG. 32 shows an overall procedure for branching to each definition data creation process of “data definition data”, “file definition data”, and “book definition data” based on “item definition data chain” in the system of the embodiment. It is a flowchart.
FIG. 33 is a diagram illustrating an example of a data format of “data definition data” in the system of the embodiment.
FIG. 34 is a diagram illustrating an example of a definition document used in “file definition” in the system of the embodiment.
35 is a diagram showing an example in which definition support information is additionally entered in the file definition document in FIG. 35. FIG.
FIG. 36 is a diagram schematically illustrating the structure of an “item definition data chain” created by “file definition” in the system of the embodiment.
FIG. 37 is a diagram illustrating a data format example of “file definition data” in the system of the embodiment;
FIG. 38 is a diagram illustrating a configuration of a file management unit in the system of the embodiment.
FIG. 39 is a diagram illustrating an example of a book table sheet used in “book table creation” in the system of the embodiment.
40 is a diagram showing an example in which definition support information is additionally entered in the book table of FIG. 39. FIG.
FIG. 41 is a diagram schematically illustrating a structure of an “item definition data chain” created by “create book table” in the system of the embodiment.
FIG. 42 is a diagram illustrating a data format example of “calculation formula definition data” in the system of the embodiment;
FIG. 43 is a diagram illustrating examples of terms included in an applied term dictionary in the system of the embodiment.
44 is a diagram showing a data format example of “dictionary term data” in the system of the embodiment. FIG.
45 is a diagram showing a data format example of “book table management data” in the system of the embodiment; FIG.
FIG. 46 is a diagram illustrating a data format example of “data output command definition data” in the system of the embodiment;
FIG. 47 is a block diagram showing a configuration for processing document entry information and definition information by a screen input method in the system of the embodiment.
FIG. 48 is a diagram illustrating a data format example of “definition execution order rule data” in the system of the embodiment;
FIG. 49 is a diagram illustrating a configuration of a data output unit that performs book table-related data output processing in the system according to the embodiment;
FIG. 50 is a diagram illustrating format conversion of a file record in the system according to the embodiment.
FIG. 51 is a diagram illustrating file record extraction processing in the system of the example;
FIG. 52 is a diagram illustrating an example of a book table output document in the system according to the embodiment.
FIG. 53 is a diagram illustrating an example in which definition information is input from the screen using a command in the system according to the embodiment.
[Explanation of symbols]
10 Color image scanner
12 Keyboard
14 mouse
15 Digitizer
16 Internal memory
18 External memory
20 Display device
24 CPU (microprocessor)
27 Communication device
34 Character / graphic element recognition part
35 Sheet Data Area Management Department
37 Character / graphic element input section
38 Document element data storage
40 Document image display output section
42 Definition element data generator
46 Definition data generator
48 Definition Element Identification Data Storage Unit
50 Definition information distinction data storage unit
52 Application Term Dictionary
54 Definition data storage
56 Sheet groove definition data storage
60 Command input part
62 Command recognition execution processing unit
73 Definition Execution Processing Unit

Claims (4)

情報処理システムにおいて、システムに対してある動作または処理をおこなうべく指示するコマンド定義情報の生成方法であって、
システム内において文書上の各記号または各文字列についてコード列情報と位置情報を登録した文書データを格納する文書データ格納手段と、
特定の記号または用語についてコード列情報と上記コマンド定義上の意味情報とを対応させて登録した辞書データを格納する辞書格納手段とを備えた情報処理システムにおいて、 上記辞書データ中に登録された特定の記号または用語であって、文書上において記載された他の記入情報に付加記入することによって、付加記入された当該の他の記入情報をシステムに対するコマンド定義情報に転化させる指定をおこなう第1の記入情報を、上記辞書データ中に登録した該当コード列情報と上記文書データを構成する各記号または各文字列のコード列情報との間の照合を繰り返すことによって文書上から検出するステップと、 検出した上記第1の記入情報と文書上において特定の配置関係にある記号または文字列である第2の記入情報を、当該の第1の記入情報の位置情報と、上記文書データを構成する各記号または各文字列の位置情報との間の照合を繰り返すことによって識別するステップと、
文書上において識別した上記第2の記入情報について、そのコード列情報と上記辞書データに登録された各記号または各用語のコード列情報との間の照合を繰り返すことにより、上記辞書データ中において上記第2の記入情報に対応して登録されているコマンド定義上の意味情報を識別し、該当する処理をシステムに指示するコマンド情報を生成するステップと、
を有する情報処理システムにおける方法。
In an information processing system, a method for generating command definition information that instructs a system to perform a certain operation or process,
Document data storage means for storing document data in which code string information and position information are registered for each symbol or each character string on the document in the system;
Oite information processing system comprising a dictionary storage means for storing the dictionary data registered in correspondence with the code string information and semantic information on the command definition for a particular symbol or term and is registered in the dictionary data Specific symbols or terms that are added to other entry information described in the document, so that the other entry information added to the document is converted into command definition information for the system. Detecting one entry information from the document by repeatedly collating the corresponding code string information registered in the dictionary data and the code string information of each symbol or each character string constituting the document data; The second entry information which is a symbol or character string having a specific arrangement relationship on the document with the detected first entry information, Identifying by repeating the position information of the first entry information, the matching between the position information of each symbol or each string constituting the document data,
For the second entry information identified on the document, by repeating collation between the code string information and the code string information of each symbol or each term registered in the dictionary data, Identifying semantic information on the command definition registered corresponding to the second entry information, and generating command information for instructing the system to perform the corresponding processing;
A method in an information processing system comprising:
文書上において上記コマンド定義のオペランドを指定するものとして特に定めた記号である第3の記入情報を、その該当コード列情報と上記文書データを構成する各記号または各文字列のコード列情報との間の照合を繰り返すことによって、文書上から検出するステップと、
検出した第3の記入情報と文書上において特定の配置関係にある記号または文字列である第4の記入情報を、当該第3の記入情報の位置情報と、上記文書データを構成する各記号または各文字列の位置情報との間の照合を繰り返すことによって、識別するステップと、
を有し、識別した第4の記入情報に基づいて該当のコマンド定義情報のオペランドを生成する請求項1に記載の方法。
The third entry information, which is a symbol specifically designated as an operand of the command definition on the document, includes the corresponding code string information and the code string information of each symbol or each character string constituting the document data. Detecting from the document by repeating the matching between,
The detected third entry information and the fourth entry information which is a symbol or character string in a specific arrangement relationship on the document, the position information of the third entry information, and each symbol constituting the document data or Identifying by repeating matching between the position information of each character string;
The method according to claim 1, further comprising: generating an operand of corresponding command definition information based on the identified fourth entry information.
上記文書データ格納手段に保持される文書データは、文書上の各記号または文字列について色情報を含む修飾情報を備え、
予め定めた修飾情報をもつ記入情報を、当該の修飾情報と上記文書データ中の各記号または文字列に備えた修飾情報との間の照合を繰り返すことにより文書上から検出した後、検出した当該修飾情報をもつ記号または文字列の中から上記第1の記入情報を文書上から検出する請求項1または請求項2に記載の方法。
The document data held in the document data storage means includes decoration information including color information for each symbol or each character string on the document,
Entry information having predetermined modification information is detected after it is detected from the document by repeatedly comparing the modification information with the modification information provided for each symbol or each character string in the document data. the method as claimed from a symbol or string with the modified information to claim 1 or 2 for detecting the first entry information from the document.
装置に対してある動作、または、データ処理をおこなうべく指示するコマンド定義情報の生成をおこなう情報処理装置であって、
システム内において文書上の各記号または各文字列についてコード列情報と位置情報を登録した文書データを格納する文書データ格納手段と、
特定の記号または用語についてコード列情報と上記コマンド定義上の意味情報とを対応させて登録した辞書データを格納する辞書格納手段と
上記辞書データ中に登録された特定の記号または用語であって、文書上において記載された他の記入情報に付加記入することによって、付加記入された当該の他の記入情報をシステムに対するコマンド定義情報に転化させる指定をおこなう第1の記入情報を、上記辞書データ中に登録した該当コード列情報と上記文書データを構成する各記号または各文字列のコード列情報との間の照合を繰り返すことによって、文書上から検出する手段と、
検出した上記第1の記入情報と文書上において特定の配置関係にある記号または文字列である第2の記入情報を、当該第1の記入情報の位置情報と、上記文書データを構成する各記号または各文字列の位置情報との間の照合を繰り返すことによって、識別する手段と、
文書上において識別した上記第2の記入情報について、そのコード列情報と上記辞書データに登録された各記号または各用語のコード列情報との間の照合を繰り返すことにより、上記辞書データ中において上記第2の記入情報に対応して登録されているコマンド定義上の意味情報を識別し、該当する処理をシステムに指示するコマンド情報を生成する手段と、
を有する情報処理装置。
An information processing device that generates command definition information that instructs a device to perform certain operations or data processing,
Document data storage means for storing document data in which code string information and position information are registered for each symbol or each character string on the document in the system;
Dictionary storage means for storing dictionary data registered in association with code string information and semantic information on the command definition for a specific symbol or term ;
The command definition information for the system is a specific symbol or term registered in the above dictionary data, and is added to the other entry information described on the document to add the other entry information to the system. By repeating the collation between the corresponding code string information registered in the dictionary data and the code string information of each symbol or each character string constituting the document data, the first entry information that designates conversion to Means for detecting from the document;
The detected first entry information and the second entry information which is a symbol or character string in a specific arrangement relationship on the document, the position information of the first entry information, and each symbol constituting the document data Or a means for identifying by repeating matching between the position information of each character string,
For the second entry information identified on the document, by repeating collation between the code string information and the code string information of each symbol or each term registered in the dictionary data, Means for identifying command definition semantic information registered corresponding to the second entry information, and generating command information for instructing the system to perform the corresponding processing;
An information processing apparatus.
JP14347297A 1997-05-17 1997-05-17 Information processing apparatus and definition information generation method Expired - Fee Related JP4462508B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14347297A JP4462508B2 (en) 1997-05-17 1997-05-17 Information processing apparatus and definition information generation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14347297A JP4462508B2 (en) 1997-05-17 1997-05-17 Information processing apparatus and definition information generation method

Publications (2)

Publication Number Publication Date
JPH10320492A JPH10320492A (en) 1998-12-04
JP4462508B2 true JP4462508B2 (en) 2010-05-12

Family

ID=15339501

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14347297A Expired - Fee Related JP4462508B2 (en) 1997-05-17 1997-05-17 Information processing apparatus and definition information generation method

Country Status (1)

Country Link
JP (1) JP4462508B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075667A1 (en) 2005-01-12 2006-07-20 Masatsugu Noda Information processing device, file data merging method, file naming method, and file data output method

Also Published As

Publication number Publication date
JPH10320492A (en) 1998-12-04

Similar Documents

Publication Publication Date Title
JP4356847B2 (en) Field definition information generation method, line and field definition information generation device
US6289254B1 (en) Parts selection apparatus and parts selection system with CAD function
JP4907715B2 (en) Method and apparatus for synchronizing, displaying, and manipulating text and image documents
JP3425408B2 (en) Document reading device
US8015203B2 (en) Document recognizing apparatus and method
US20070098263A1 (en) Data entry apparatus and program therefor
US7149967B2 (en) Method and system for creating a table version of a document
JPH07200786A (en) Filing device
US5887088A (en) Inputting device and inputting method for information processing system
JPH0128980B2 (en)
JP2005216203A (en) Table format data processing method and table format data processing apparatus
JP2000322417A (en) Device and method for filing image and storage medium
JP4462508B2 (en) Information processing apparatus and definition information generation method
JP2005234790A (en) Handwritten slip processing system and method
JP4405604B2 (en) Information processing apparatus and definition method
JP3032225B2 (en) Document editing device using three-dimensional display
JPH0635987A (en) Device and mehtod for preparing circuit diagram
JPH11316792A (en) Information processor and slip creating method
JP2000163271A (en) Method and apparatus for information processing
JP5233424B2 (en) Search device and program
JP2001357342A (en) Information processing method and information processor
JP4734551B2 (en) Table format data processing method and table format data processing apparatus
US7302641B1 (en) Information processing method and apparatus for making document
JP2000155794A (en) Information processor and method for information processing
JP2001005904A (en) Information processor and form preparing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040514

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050511

A072 Dismissal of procedure

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20060104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060718

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060919

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061010

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061109

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070202

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091113

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees