JPH06149894A - スキーマ定義情報作成方法 - Google Patents

スキーマ定義情報作成方法

Info

Publication number
JPH06149894A
JPH06149894A JP4298626A JP29862692A JPH06149894A JP H06149894 A JPH06149894 A JP H06149894A JP 4298626 A JP4298626 A JP 4298626A JP 29862692 A JP29862692 A JP 29862692A JP H06149894 A JPH06149894 A JP H06149894A
Authority
JP
Japan
Prior art keywords
data
schema definition
definition information
database
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4298626A
Other languages
English (en)
Inventor
Haruo Hayamizu
治夫 速水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4298626A priority Critical patent/JPH06149894A/ja
Publication of JPH06149894A publication Critical patent/JPH06149894A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 帳票に記述された内容のコードデータによる
データベース化を簡易に行なえるようにした。 【構成】 ワードプロセッサ等で作成された帳票のサン
プルを入力し、サンプルに記述されている所定の記号を
データベースの各データ項目名、データ属性およびデー
タ長を定義するスキーマ定義情報に変換することで、従
来、帳票のフォーム作成とは別に行っていたデータベー
スのスキーマ定義情報の作成を省略するようにした。 【効果】 一般的な操作者が使用可能なワードプロセッ
サを端末としたテキストデータのデータベース格納シス
テムを容易に構築可能とすることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ワードプロセッサ等で
作成される複数のデータ項目からなる固定フォームの書
類(以下「帳票」と略す)のサンプルに記述されている
情報に基づいてデータベースのスキーマ定義情報を作成
する方法に関する。
【0002】
【従来の技術】多数の帳票の内容をデータベース化する
には、帳票そのものをイメージリーダあるいはイメージ
スキャナで読み取りイメージデータとして光ファイルに
格納する方法がある。この方法は、データの蓄積は容易
であるが、蓄積されたデータはコードデータでなく、計
算機による各種のデータ処理に不向きである。このた
め、蓄積されたデータを直接計算機で検索や統計処理す
ることができるようにするため、帳票の内容をデータ項
目毎にコードデータでデータベース化することが考えら
れる。
【0003】この場合、データベースを使用するユーザ
はデータを格納するデータベースの論理的な構造(スキ
ーマ)を定義することが必要である。すなわち、使用す
るデータベースのスキーマ定義言語を使用してデータベ
ースの格納単位毎にデータ項目名、データ属性およびデ
ータ長を定義するのである。
【0004】以下、リレーショナルデータベースのスキ
ーマ定義言語(原 潔著、「標準SQLプログラミン
グ」、啓学出版;参考)を使用したテーブル(格納単
位)の論理的な構造の定義情報例を以下に示す。
【0005】 この例は「クレーム情報」というテーブルの論理的な構
造の定義情報例である。このテーブルは、データ項目が
「表題」、「クレーム内容」、「処置状況」、「受付組
織名」、「受付番号」、「受付年月日」、「処置組織
名」、「処置年月日」からなり、それぞれのデータ属性
およびデータ長は「可変長文字列、最大32文字」、
「可変長文字列、最大432文字」、「可変長文字列、
最大504文字」、「可変長文字列、最大9文字」、
「固定長文字列、8文字」、「十進数、6桁」、「可変
長文字列、最大9文字」、「十進数、6桁」であること
を定義している。スキーマ定義情報からデータベースの
実際の格納領域を用意する操作はデータベース管理シス
テムが実行する。この様にテーブルのスキーマ定義は、
帳票フォームのデザインとは別途行う必要があり、使用
するデータベース専用のスキーマ定義言語を使用する必
要がある。
【0006】
【発明が解決しようとする課題】以上のように、帳票に
記述された内容をコードデータでデータベース化するに
は、帳票フォームの定義とは別に使用するデータベース
のスキーマ定義言語を使用して、データベースの論理的
な構造を定義する必要があり、同じような定義を二重に
しなければならず、手間を要するという問題があった。
【0007】本発明は上記に鑑みてなされたもので、そ
の目的としては、帳票に記述された内容のコードデータ
によるデータベース化を簡易に行なえるようにしたスキ
ーマ定義情報作成方法を提供することにある。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、複数のデータをあらかじめ定めた様式で表わしてい
る帳票を格納するデータベース装置において、本発明
は、前記帳票に記載されるデータ項目毎の記載開始位置
および記載終了位置と該データ項目のデータ属性および
データ長を所定の記号で記述した帳票のサンプルを走査
してこの所定の記号を判読し、判読した結果をデータベ
ースのスキーマ定義言語に変換して、データベースのス
キーマ定義情報を作成することを要旨とする。
【0009】
【作用】本発明のスキーマ定義情報作成方法は、ワード
プロセッサ等で作成された帳票のサンプルを入力し、サ
ンプルに記述されている所定の記号をデータベースの各
データ項目名、データ属性およびデータ長を定義するス
キーマ定義情報に変換することで、従来、帳票のフォー
ム作成とは別に行っていたデータベースのスキーマ定義
情報の作成を省略している。
【0010】
【実施例】以下、図面を用いて本発明の実施例を説明す
る。
【0011】図1は本発明の一実施例のシステム構成例
を示すものである。同図において、1はデータベース装
置であり、2は帳票のサンプルおよび帳票を作成するワ
ードプロセッサであり、3はデータベース装置1とワー
ドプロセッサ2を接続する通信路である。なお、ここで
ワードプロセッサ2は専用のワードプロセッサに限ら
ず、パーソナルコンピュータ等のソフトウェアで構成さ
れるワードプロセッサであってもよく、また、通信路3
は交換回線やLANであってもよい。
【0012】図2は本実施例に使用する帳票サンプルの
1例を示す。図2において、100は帳票サンプルのフ
ォーム(以下、単に「帳票サンプル」と呼ぶ)を示す。
101は本帳票例に固定的に記述されている文字であ
り、データベースのスキーマ定義においてデータ項目名
となる。以下、図2において、便宜的にアンダーライン
を付与している文字が固定的に記述されている文字であ
ることを示している。102は直前のデータ項目名に対
応するテキストデータが記述される開始位置を示す記号
である。103は前記テキストデータが記述される終了
位置を示す記号である。104は前記テキストデータを
固定長データとしてテーブルへ格納するデータ項目のデ
ータ属性とデータ長を示す。記号「C」はデータ属性が
固定長文字列であることを示し、「C」の数に2を加え
た数がデータ長を示す。記号「D」はデータ属性が十進
数であることを示し、「D」の数に2を加えた数がデー
タ長を示す。また、記号「『」102と記号「』」10
3の間がスペースの場合は、データ属性が可変長文字列
であることを示し、スペースの数に2を加えた数がデー
タ長を示す。ここで、データ長に2を加えるのは、記号
「『」102と記号「』」103の位置にもテキストデ
ータの文字が入ることを想定しているからである。10
5は帳票に固定的に記述されている罫線である。
【0013】次に、本実施例の作用を図2の帳票サンプ
ル100を例に、図3に示す処理フローチャートを用い
て説明する。データベースのスキーマ定義情報を作成す
るに際しては、まず、ワードプロセッサ2により図2に
示す帳票のサンプルを作成する必要がある。すなわち、
まず、帳票フォームそのものの定義として、図2におけ
る符号102,103,104で示した記号を除いたも
のを設計する(以後、データベースの元データとなる帳
票は前記フォームを用いて記述する)。次に、データベ
ースのスキーマ定義情報を作成するための入力データと
して、図2における符号102,103,104で示す
記号を追加した帳票サンプル100を作成する。
【0014】次に、ワードプロセッサ2から、スキーマ
定義情報作成開始指令とその開始パラメータである表名
「クレーム情報」をデータベース装置1へ転送すること
によりスキーマ定義情報作成動作が開始される。
【0015】開始パラメータとして転送された表名「ク
レーム情報」は“表名”に保存されており、これに基づ
き次のスキーマ定義情報の2行を作成する(ステップ2
00,210)。
【0016】 次に、帳票サンプル100を受け取り、その走査を開始
する(ステップ220)
【外1】 ‘『’を検出したところで、直前の(スペース、罫線以
外の)文字‘表’、‘題’を“列名”に保存する(ステ
ップ230〜250)。更に、‘『’の次の文字を入手
すると‘スペース’であり、次に‘』’が検出されるま
で‘スペース’の数をカウントする。本例では30文字
であり、“カウント数+2”は32となる。これに基づ
き次のスキーマ定義情報の1行を作成する(ステップ2
60〜310)。
【0017】 次に、‘『’を検出するまで走査を続ける(ステップ4
00,410)。そして同様に、直前の‘クレーム内
容’を“列名”に保存する(ステップ250)。更に、
‘『’の次の文字を入手すると、‘スペース’であり、
次に‘』’が検出されるまで、罫線をスキップして‘ス
ペース’の数をカウントする。本例では430文字であ
り、“カウント数+2”は432となる。これに基づき
次のスキーマ定義情報の1行を作成する(ステップ26
0〜310)。
【0018】 次に、上記と同様な操作により、次のスキーマ定義情報
の1行を作成する(ステップ400,410,250〜
310)。
【0019】 次に、再び‘『’を検出するまで走査を続け、同様に、
直前の‘受付番号’を“列名”に保存する(ステップ4
00,410,250)。ここで、‘『’の次の文字を
入手すると‘C’であり、次に‘』’が検出されるま
で、‘C’の数をカウントする。本例では6文字であ
り、“カウント+2”は8となる。これに基づき次のス
キーマ定義情報の1行を作成する(ステップ260,2
70,320〜350)。
【0020】 以下、同様な操作により、以下のスキーマ定義情報を作
成する(ステップ400,410,250〜310,3
60〜390)。
【0021】 更に、走査を続け、ファイル修正を検出したときに、一
時格納されているスキーマ定義情報の最後の行を修正
し、以下の2行のスキーマ定義情報を作成する(ステッ
プ400,410,250〜270,360〜39
0)。
【0022】 以上の操作により作成され、一時格納されているスキー
マ定義情報を以下のように並べて、スキーマ定義情報フ
ァイルに格納する(ステップ420〜440)。
【0023】 以上のスキーマ定義情報をデータベース管理システムに
与えると、データベース管理システムはスキーマ定義情
報に従って、格納データベースの論理的な構造を定義
し、更に物理的な格納領域を用意することになるのであ
る。
【0024】したがって、本実施例によれば、ワードプ
ロセッサ等で作成した帳票サンプルにより、以後入力す
る帳票に記述されているテキストデータを格納するデー
タベースのスキーマ定義情報を作成するため、データベ
ースに非熟練の一般的な操作者にでもデータベースのス
キーマ定義が容易に実行できる。また、帳票フォームの
デザインとデータベースのスキーマ設計を兼ねることが
できるため、設計の省力化となる。
【0025】なお、本発明は、上述した実施例で用いた
帳票フォームおよび記述記号に限られるものではないこ
とは言うまでもない。
【0026】
【発明の効果】以上説明したように、本発明によれば、
ワードプロセッサ等で作成された帳票のサンプルを入力
し、サンプルに記述されている所定の記号をデータベー
スの各データ項目名、データ属性およびデータ長を定義
するスキーマ定義情報に変換することで、従来、帳票の
フォーム作成とは別に行っていたデータベースのスキー
マ定義情報の作成を省略するようにしたので、帳票に記
述された内容のコードデータによるデータベース化を簡
易に行なうことができ、もって一般的な操作者が使用可
能なワードプロセッサを端末としたテキストデータのデ
ータベース格納システムを容易に構築可能とすることが
できる。
【図面の簡単な説明】
【図1】本発明の一実施例のシステム構成図である。
【図2】当該一実施例を説明するための帳票サンプルを
示す図である。
【図3】当該一実施例の処理フローチャートを示す図で
ある。
【符号の説明】
1 データベース装置 2 ワードプロセッサ 3 通信路 100 帳票サンプル

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 複数のデータをあらかじめ定めた様式で
    表わしている帳票を格納するデータベース装置におい
    て、前記帳票に記載されるデータ項目毎の記載開始位置
    および記載終了位置と該データ項目のデータ属性および
    データ長を所定の記号で記述した帳票のサンプルを走査
    してこの所定の記号を判読し、判読した結果をデータベ
    ースのスキーマ定義言語に変換して、データベースのス
    キーマ定義情報を作成することを特徴とするスキーマ定
    義情報作成方法。
JP4298626A 1992-11-09 1992-11-09 スキーマ定義情報作成方法 Pending JPH06149894A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4298626A JPH06149894A (ja) 1992-11-09 1992-11-09 スキーマ定義情報作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4298626A JPH06149894A (ja) 1992-11-09 1992-11-09 スキーマ定義情報作成方法

Publications (1)

Publication Number Publication Date
JPH06149894A true JPH06149894A (ja) 1994-05-31

Family

ID=17862172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4298626A Pending JPH06149894A (ja) 1992-11-09 1992-11-09 スキーマ定義情報作成方法

Country Status (1)

Country Link
JP (1) JPH06149894A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092851A (ja) * 1999-09-08 2001-04-06 Koto Gijutsu Kenkyuin Kenkyu Kumiai 特許分析用データ加工および特許マップ自動生成方法とこれのためのプログラムを貯蔵するための記録媒体
JP2008046796A (ja) * 2006-08-14 2008-02-28 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及びプログラム
WO2013038508A1 (ja) * 2011-09-13 2013-03-21 株式会社日立製作所 計算機、計算機システム及びデータベースの構築支援方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092851A (ja) * 1999-09-08 2001-04-06 Koto Gijutsu Kenkyuin Kenkyu Kumiai 特許分析用データ加工および特許マップ自動生成方法とこれのためのプログラムを貯蔵するための記録媒体
JP2008046796A (ja) * 2006-08-14 2008-02-28 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及びプログラム
WO2013038508A1 (ja) * 2011-09-13 2013-03-21 株式会社日立製作所 計算機、計算機システム及びデータベースの構築支援方法
JPWO2013038508A1 (ja) * 2011-09-13 2015-03-23 株式会社日立製作所 計算機、計算機システム及びデータベースの構築支援方法

Similar Documents

Publication Publication Date Title
US7343385B2 (en) System for processing objects for storage in a document or other storage system
US20050234843A1 (en) Computer program for storing electronic files and associated attachments in a single searchable database
JPH03161873A (ja) データベース構築機能を有する電子フアイリング装置
JPH0776958B2 (ja) 文書整形装置
US5588149A (en) Document classification and retrieval with title-based on-the-fly class merge
JPH06149894A (ja) スキーマ定義情報作成方法
US5339409A (en) Image storage/search apparatus for merging image and related key codes when match found between key code and specific character code of image
CN112149679B (zh) 一种基于ocr文字识别提取公文要素的方法及装置
JP2718836B2 (ja) データベースシステム
JP4480109B2 (ja) 画像管理装置および画像管理方法
JPH0236478A (ja) 情報処理システム
Gribomont OCR with Google Vision API and Tesseract
JPH05108794A (ja) 電子フアイリング装置
JP2002342350A (ja) イメージデータのxmlドキュメント作成装置、作成方法および作成プログラム
JP2558692B2 (ja) 書画ファイル装置
JPS62109127A (ja) 表示画面の出力制御方式
JP2701601B2 (ja) 部品データ処理方法
JPH08263512A (ja) 文書検索装置
JP2002342695A (ja) 情報入力システムの構築支援装置および構築支援方法
JPH05298368A (ja) 電子ファイリングシステムの検索語入力方法
JPS62134765A (ja) 漢和辞書の電子検索方法
JPH08147329A (ja) 読み取りイメージ処理装置
JPH05128169A (ja) 画像検索装置
JPH01302592A (ja) 情報処理装置
JPH09218868A (ja) 漢字指定方法及び装置