JPS63163586A - 文書認識システム - Google Patents

文書認識システム

Info

Publication number
JPS63163586A
JPS63163586A JP61310643A JP31064386A JPS63163586A JP S63163586 A JPS63163586 A JP S63163586A JP 61310643 A JP61310643 A JP 61310643A JP 31064386 A JP31064386 A JP 31064386A JP S63163586 A JPS63163586 A JP S63163586A
Authority
JP
Japan
Prior art keywords
character
document
item
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61310643A
Other languages
English (en)
Inventor
Hiromichi Takahashi
弘道 高橋
Takashi Ishikawa
孝 石川
Toshihiro Takimoto
利宏 瀧本
Yuji Kozasa
小篠 裕司
Akihiro Oka
昭宏 岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pentel Co Ltd
Original Assignee
Pentel Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pentel Co Ltd filed Critical Pentel Co Ltd
Priority to JP61310643A priority Critical patent/JPS63163586A/ja
Publication of JPS63163586A publication Critical patent/JPS63163586A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明はイメージ形式の文書をフンピユータ処理に適し
たコード化文書に変換する文書認識システムに関するも
ので、特に文書画像データを入力として2文書項目の値
を出力する文書認識システムに関するものである。
(従来の技術と問題点) 文書情報をコンピュータに入力するため、従−:2原稿
用紙に書かれた文章や定形様式の伝票等の乙“、\ 一部・人力において一部実用化が進んでいる。現在知)
j’−、+”・。
−られている光学式文書読取り装置は1文書における文
書項目の配置と文字の位置や大きさについて厳しい制限
があるため、極めて限られた文書についてしか適用され
ていない状況である。
(問題点を解決するための手段) 本発明は如上の問題点を解決するために2文書画像信号
を受信し2画像データと文字配置データとを出力する文
字切出しユニットと、該文字切出しユニットの文字画像
データを受信し文字コードを出力する文字認識ユニット
と、前記文字切出しユニットの文字配置データと文字認
識ユニットの文字コードとを受信し文書項目の値を出力
する項目認識ユニットとからなる文書認識システムを提
案するものである。
(作用) 本発明の文書認識システムは、記載されている文書項目
が一定しており2文書項目の相対的配置に規則性のある
文書を1文書画像信号として入力し1文字信号を自動的
にフンピユータに入力するものである。
(実施例) 本発明を添付図面を参照して説明すると2第1図は電気
的ブロック図、第2図は実施例で説明する名刺の文書項
目の代表的な配置パターン1Bである。電気的プロ、り
図について説明すると文字を記録した文書(本実施例で
は説明)を光藝、・5之 冗変換でデジタルデータに変換するイメージスキャナ2
で読取り、この読取った文書画像信号を文字切出しユニ
ット3に印加する。この文字切出しユニット3は2文書
画像信号から1文字毎に切出した文字画像データを文字
認識ユニ。
ト4に印加し、切出した文字についての文字配置データ
を項目認識ユニット5に印加する。項目認識ユニット5
は文字認識ユニット4の出力信号としての文字コードと
2文字切出しユニ。
ト3の出力信号としての文字配置データとを入力信号と
して文書項目の値を外部のコンピュータ6へ出力する。
上述した文字切出しユニットされている。
次に2本発明を名刺の認識に適用した実施例を説明する
。通常の名刺7は第2図に示すように基本的な文書項目
として身分81氏名9および所在地10が表示されてい
る。この名刺7をイメージスキャナ2にて光学的に読取
り2文字切出しユニット3へ印加する。文字切出しユニ
ット3は2文字切出しのため入力でれた名刺7の文書画
像信号から行切出しと1文字切出しを行なうもので2行
切出しは画像データの配列方向性を抽出し、この配列方
向性により行を認識する。更に、1文字切出しは1行方
向性の画像の分布のピンチに相当する並進方向性から各
項目内の1文字を認識する。文字認識ユニット4は文字
切出しユニット3からの文字画像データから1文字画像
を細線化して得られる画像における各点の隣接点との連
結方向である連結方向性等の特徴点を抽出し、蓄積され
ている文字の標準パターン(図示せず)と比較演算して
、一致度から該当するJIS等の文字コードを項目認識
ユニット5へ印加する。
文字切出しユニット3では、更にイメージスキャナ2か
らの文書画像データから切出した1文字毎の画像データ
の4隅の座標値と1文字画像データを識別する連番等の
文字ラベルとを対応づけた文字配置データを項目認識ユ
ニ、ト5へ印加する。
項目認識ユニット5は1文字切出しユニット3からの文
字配置データから配置パターンを抽出し、蓄積された標
準配置パターン(図示せず)と比較演算して、一致度か
ら文書項目としての身分81氏名9および所在地10を
識別する。
次に2文字認識ユニット4からの文字コードを。
文字ラベルと文字配置データとの対応によって文書項目
毎に文字列として再配置し1文書項目の値として外部の
コンピュータ6へ出力する。
本発明の文書認識システムでは、各ユニットを入力デー
タによって処理が開始されるデータ駆動型データ処理装
置を採用することによって。
各ユニットの処理を非同期に処理することで。
を−意であるとしたが1例えば1文字切出しに複数の可
能性がある場合には、複数℃切出し処理結果を文字認識
し、一致度の高い方を選択することによって認識率を向
上することができる。
また2文字配置パターンについて複数の可能性がある場
合には1項目認識結果の文書項目の値を辞書データと照
合することによって認識率を向上することができる。更
に1文字認識の結果に複数の可能性がある場合にも1項
目値の辞書データと照合することによって認識率を向上
することができる。これ等の複数の可能性に対する対処
がパイプラインの後段で行なえるので。
前段だけの処理速度を上げることによって全体の処理速
度を殆んど一定とすることができる。
また、各処理ユニットの入出力待ちを無くし非同期処理
を効率よく実現するには、各処理ユニットには適当な大
きさの入出力データバッファを配置されていることが望
ましい。
(発明の効果) 本発明は如上のような構成となしたので、記載されてい
る文書項目が一定しており1文書項目の相対的配置に規
則性のある文書を自動的かつ高速にコンピュータに入力
できるものである。
【図面の簡単な説明】
図面は本発明の一実施例であり、第1図は電気的プロ、
り図、第2図は名刺の配置パターン図である。 1・・・・・・・文書認識システム、2・・・・・・・
・イメージスキャナ、3・・・・・・・・・文字切出し
ユニット。 4・・・・・・・・・文字認識ユニ、)、5・・・・・
・・・・項目認識ユニ、ト、6・・・・・・・・・コン
ピュータ、7・・・・・・・・・名刺特許出頓人 ぺん
てる株式会社

Claims (1)

    【特許請求の範囲】
  1. 文書画像信号を受信し、画像データと文字配置データと
    を出力する文字切出しユニットと、該文字切出しユニッ
    トの文字画像データを受信し文字コードを出力する文字
    認識ユニットと、前記文字切出しユニットの文字配置デ
    ータと文字認識ユニットの文字コードとを受信し文書項
    目の値を出力する項目認識ユニットとからなることを特
    徴とする文書認識システム。
JP61310643A 1986-12-25 1986-12-25 文書認識システム Pending JPS63163586A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61310643A JPS63163586A (ja) 1986-12-25 1986-12-25 文書認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61310643A JPS63163586A (ja) 1986-12-25 1986-12-25 文書認識システム

Publications (1)

Publication Number Publication Date
JPS63163586A true JPS63163586A (ja) 1988-07-07

Family

ID=18007715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61310643A Pending JPS63163586A (ja) 1986-12-25 1986-12-25 文書認識システム

Country Status (1)

Country Link
JP (1) JPS63163586A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5439134A (en) * 1993-04-06 1995-08-08 Fuji Electric Co., Ltd. Food storage and delivery device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59148983A (ja) * 1983-02-14 1984-08-25 Hitachi Ltd 漢字認識辞書選択方式
JPS6118080A (ja) * 1984-07-05 1986-01-25 Fujitsu Ltd 文字認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59148983A (ja) * 1983-02-14 1984-08-25 Hitachi Ltd 漢字認識辞書選択方式
JPS6118080A (ja) * 1984-07-05 1986-01-25 Fujitsu Ltd 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5439134A (en) * 1993-04-06 1995-08-08 Fuji Electric Co., Ltd. Food storage and delivery device

Similar Documents

Publication Publication Date Title
CN1761976A (zh) 利用重排位图改善可读性
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPS63163586A (ja) 文書認識システム
US5854860A (en) Image filing apparatus having a character recognition function
JPS581821B2 (ja) 日本語デ−タ投入装置
Sakai A history and evolution of document information processing
JPS6190282A (ja) 光学文字読取装置を使つた入力装置
JPH03212779A (ja) 文字認識装置
JPH0772978A (ja) 電子黒板
JPH0646217A (ja) ファクシミリ装置
JPH01169665A (ja) イメージデータ読取機能付posシステム
JPS63293690A (ja) 文字認識システム
JP2917396B2 (ja) 文字認識方式
Shuto et al. Integrated Document Editing And Organizing System (IDEOS)
JPH0612403A (ja) 入力装置
JPS6154578A (ja) 文字読取装置
JPH03134784A (ja) 光学読取装置
JPH02280289A (ja) 帳票読取処理装置
JPS63167991A (ja) 文字認識装置
JPS5860383A (ja) 計算機入力装置
JPS61267883A (ja) オンライン連続文字認識装置
JPH03252894A (ja) 文字認識装置
JPH06243285A (ja) 文字認識方法
JPH06138990A (ja) データ処理システム
JPS6334679A (ja) 光学文字読取装置