JPS63163586A - 文書認識システム - Google Patents
文書認識システムInfo
- Publication number
- JPS63163586A JPS63163586A JP61310643A JP31064386A JPS63163586A JP S63163586 A JPS63163586 A JP S63163586A JP 61310643 A JP61310643 A JP 61310643A JP 31064386 A JP31064386 A JP 31064386A JP S63163586 A JPS63163586 A JP S63163586A
- Authority
- JP
- Japan
- Prior art keywords
- character
- document
- item
- data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明はイメージ形式の文書をフンピユータ処理に適し
たコード化文書に変換する文書認識システムに関するも
ので、特に文書画像データを入力として2文書項目の値
を出力する文書認識システムに関するものである。
たコード化文書に変換する文書認識システムに関するも
ので、特に文書画像データを入力として2文書項目の値
を出力する文書認識システムに関するものである。
(従来の技術と問題点)
文書情報をコンピュータに入力するため、従−:2原稿
用紙に書かれた文章や定形様式の伝票等の乙“、\ 一部・人力において一部実用化が進んでいる。現在知)
j’−、+”・。
用紙に書かれた文章や定形様式の伝票等の乙“、\ 一部・人力において一部実用化が進んでいる。現在知)
j’−、+”・。
−られている光学式文書読取り装置は1文書における文
書項目の配置と文字の位置や大きさについて厳しい制限
があるため、極めて限られた文書についてしか適用され
ていない状況である。
書項目の配置と文字の位置や大きさについて厳しい制限
があるため、極めて限られた文書についてしか適用され
ていない状況である。
(問題点を解決するための手段)
本発明は如上の問題点を解決するために2文書画像信号
を受信し2画像データと文字配置データとを出力する文
字切出しユニットと、該文字切出しユニットの文字画像
データを受信し文字コードを出力する文字認識ユニット
と、前記文字切出しユニットの文字配置データと文字認
識ユニットの文字コードとを受信し文書項目の値を出力
する項目認識ユニットとからなる文書認識システムを提
案するものである。
を受信し2画像データと文字配置データとを出力する文
字切出しユニットと、該文字切出しユニットの文字画像
データを受信し文字コードを出力する文字認識ユニット
と、前記文字切出しユニットの文字配置データと文字認
識ユニットの文字コードとを受信し文書項目の値を出力
する項目認識ユニットとからなる文書認識システムを提
案するものである。
(作用)
本発明の文書認識システムは、記載されている文書項目
が一定しており2文書項目の相対的配置に規則性のある
文書を1文書画像信号として入力し1文字信号を自動的
にフンピユータに入力するものである。
が一定しており2文書項目の相対的配置に規則性のある
文書を1文書画像信号として入力し1文字信号を自動的
にフンピユータに入力するものである。
(実施例)
本発明を添付図面を参照して説明すると2第1図は電気
的ブロック図、第2図は実施例で説明する名刺の文書項
目の代表的な配置パターン1Bである。電気的プロ、り
図について説明すると文字を記録した文書(本実施例で
は説明)を光藝、・5之 冗変換でデジタルデータに変換するイメージスキャナ2
で読取り、この読取った文書画像信号を文字切出しユニ
ット3に印加する。この文字切出しユニット3は2文書
画像信号から1文字毎に切出した文字画像データを文字
認識ユニ。
的ブロック図、第2図は実施例で説明する名刺の文書項
目の代表的な配置パターン1Bである。電気的プロ、り
図について説明すると文字を記録した文書(本実施例で
は説明)を光藝、・5之 冗変換でデジタルデータに変換するイメージスキャナ2
で読取り、この読取った文書画像信号を文字切出しユニ
ット3に印加する。この文字切出しユニット3は2文書
画像信号から1文字毎に切出した文字画像データを文字
認識ユニ。
ト4に印加し、切出した文字についての文字配置データ
を項目認識ユニット5に印加する。項目認識ユニット5
は文字認識ユニット4の出力信号としての文字コードと
2文字切出しユニ。
を項目認識ユニット5に印加する。項目認識ユニット5
は文字認識ユニット4の出力信号としての文字コードと
2文字切出しユニ。
ト3の出力信号としての文字配置データとを入力信号と
して文書項目の値を外部のコンピュータ6へ出力する。
して文書項目の値を外部のコンピュータ6へ出力する。
上述した文字切出しユニットされている。
次に2本発明を名刺の認識に適用した実施例を説明する
。通常の名刺7は第2図に示すように基本的な文書項目
として身分81氏名9および所在地10が表示されてい
る。この名刺7をイメージスキャナ2にて光学的に読取
り2文字切出しユニット3へ印加する。文字切出しユニ
ット3は2文字切出しのため入力でれた名刺7の文書画
像信号から行切出しと1文字切出しを行なうもので2行
切出しは画像データの配列方向性を抽出し、この配列方
向性により行を認識する。更に、1文字切出しは1行方
向性の画像の分布のピンチに相当する並進方向性から各
項目内の1文字を認識する。文字認識ユニット4は文字
切出しユニット3からの文字画像データから1文字画像
を細線化して得られる画像における各点の隣接点との連
結方向である連結方向性等の特徴点を抽出し、蓄積され
ている文字の標準パターン(図示せず)と比較演算して
、一致度から該当するJIS等の文字コードを項目認識
ユニット5へ印加する。
。通常の名刺7は第2図に示すように基本的な文書項目
として身分81氏名9および所在地10が表示されてい
る。この名刺7をイメージスキャナ2にて光学的に読取
り2文字切出しユニット3へ印加する。文字切出しユニ
ット3は2文字切出しのため入力でれた名刺7の文書画
像信号から行切出しと1文字切出しを行なうもので2行
切出しは画像データの配列方向性を抽出し、この配列方
向性により行を認識する。更に、1文字切出しは1行方
向性の画像の分布のピンチに相当する並進方向性から各
項目内の1文字を認識する。文字認識ユニット4は文字
切出しユニット3からの文字画像データから1文字画像
を細線化して得られる画像における各点の隣接点との連
結方向である連結方向性等の特徴点を抽出し、蓄積され
ている文字の標準パターン(図示せず)と比較演算して
、一致度から該当するJIS等の文字コードを項目認識
ユニット5へ印加する。
文字切出しユニット3では、更にイメージスキャナ2か
らの文書画像データから切出した1文字毎の画像データ
の4隅の座標値と1文字画像データを識別する連番等の
文字ラベルとを対応づけた文字配置データを項目認識ユ
ニ、ト5へ印加する。
らの文書画像データから切出した1文字毎の画像データ
の4隅の座標値と1文字画像データを識別する連番等の
文字ラベルとを対応づけた文字配置データを項目認識ユ
ニ、ト5へ印加する。
項目認識ユニット5は1文字切出しユニット3からの文
字配置データから配置パターンを抽出し、蓄積された標
準配置パターン(図示せず)と比較演算して、一致度か
ら文書項目としての身分81氏名9および所在地10を
識別する。
字配置データから配置パターンを抽出し、蓄積された標
準配置パターン(図示せず)と比較演算して、一致度か
ら文書項目としての身分81氏名9および所在地10を
識別する。
次に2文字認識ユニット4からの文字コードを。
文字ラベルと文字配置データとの対応によって文書項目
毎に文字列として再配置し1文書項目の値として外部の
コンピュータ6へ出力する。
毎に文字列として再配置し1文書項目の値として外部の
コンピュータ6へ出力する。
本発明の文書認識システムでは、各ユニットを入力デー
タによって処理が開始されるデータ駆動型データ処理装
置を採用することによって。
タによって処理が開始されるデータ駆動型データ処理装
置を採用することによって。
各ユニットの処理を非同期に処理することで。
を−意であるとしたが1例えば1文字切出しに複数の可
能性がある場合には、複数℃切出し処理結果を文字認識
し、一致度の高い方を選択することによって認識率を向
上することができる。
能性がある場合には、複数℃切出し処理結果を文字認識
し、一致度の高い方を選択することによって認識率を向
上することができる。
また2文字配置パターンについて複数の可能性がある場
合には1項目認識結果の文書項目の値を辞書データと照
合することによって認識率を向上することができる。更
に1文字認識の結果に複数の可能性がある場合にも1項
目値の辞書データと照合することによって認識率を向上
することができる。これ等の複数の可能性に対する対処
がパイプラインの後段で行なえるので。
合には1項目認識結果の文書項目の値を辞書データと照
合することによって認識率を向上することができる。更
に1文字認識の結果に複数の可能性がある場合にも1項
目値の辞書データと照合することによって認識率を向上
することができる。これ等の複数の可能性に対する対処
がパイプラインの後段で行なえるので。
前段だけの処理速度を上げることによって全体の処理速
度を殆んど一定とすることができる。
度を殆んど一定とすることができる。
また、各処理ユニットの入出力待ちを無くし非同期処理
を効率よく実現するには、各処理ユニットには適当な大
きさの入出力データバッファを配置されていることが望
ましい。
を効率よく実現するには、各処理ユニットには適当な大
きさの入出力データバッファを配置されていることが望
ましい。
(発明の効果)
本発明は如上のような構成となしたので、記載されてい
る文書項目が一定しており1文書項目の相対的配置に規
則性のある文書を自動的かつ高速にコンピュータに入力
できるものである。
る文書項目が一定しており1文書項目の相対的配置に規
則性のある文書を自動的かつ高速にコンピュータに入力
できるものである。
図面は本発明の一実施例であり、第1図は電気的プロ、
り図、第2図は名刺の配置パターン図である。 1・・・・・・・文書認識システム、2・・・・・・・
・イメージスキャナ、3・・・・・・・・・文字切出し
ユニット。 4・・・・・・・・・文字認識ユニ、)、5・・・・・
・・・・項目認識ユニ、ト、6・・・・・・・・・コン
ピュータ、7・・・・・・・・・名刺特許出頓人 ぺん
てる株式会社
り図、第2図は名刺の配置パターン図である。 1・・・・・・・文書認識システム、2・・・・・・・
・イメージスキャナ、3・・・・・・・・・文字切出し
ユニット。 4・・・・・・・・・文字認識ユニ、)、5・・・・・
・・・・項目認識ユニ、ト、6・・・・・・・・・コン
ピュータ、7・・・・・・・・・名刺特許出頓人 ぺん
てる株式会社
Claims (1)
- 文書画像信号を受信し、画像データと文字配置データと
を出力する文字切出しユニットと、該文字切出しユニッ
トの文字画像データを受信し文字コードを出力する文字
認識ユニットと、前記文字切出しユニットの文字配置デ
ータと文字認識ユニットの文字コードとを受信し文書項
目の値を出力する項目認識ユニットとからなることを特
徴とする文書認識システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61310643A JPS63163586A (ja) | 1986-12-25 | 1986-12-25 | 文書認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61310643A JPS63163586A (ja) | 1986-12-25 | 1986-12-25 | 文書認識システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63163586A true JPS63163586A (ja) | 1988-07-07 |
Family
ID=18007715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61310643A Pending JPS63163586A (ja) | 1986-12-25 | 1986-12-25 | 文書認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63163586A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5439134A (en) * | 1993-04-06 | 1995-08-08 | Fuji Electric Co., Ltd. | Food storage and delivery device |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59148983A (ja) * | 1983-02-14 | 1984-08-25 | Hitachi Ltd | 漢字認識辞書選択方式 |
JPS6118080A (ja) * | 1984-07-05 | 1986-01-25 | Fujitsu Ltd | 文字認識装置 |
-
1986
- 1986-12-25 JP JP61310643A patent/JPS63163586A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59148983A (ja) * | 1983-02-14 | 1984-08-25 | Hitachi Ltd | 漢字認識辞書選択方式 |
JPS6118080A (ja) * | 1984-07-05 | 1986-01-25 | Fujitsu Ltd | 文字認識装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5439134A (en) * | 1993-04-06 | 1995-08-08 | Fuji Electric Co., Ltd. | Food storage and delivery device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1761976A (zh) | 利用重排位图改善可读性 | |
JP2000322417A (ja) | 画像ファイリング装置及び方法及び記憶媒体 | |
JPS63163586A (ja) | 文書認識システム | |
US5854860A (en) | Image filing apparatus having a character recognition function | |
JPS581821B2 (ja) | 日本語デ−タ投入装置 | |
Sakai | A history and evolution of document information processing | |
JPS6190282A (ja) | 光学文字読取装置を使つた入力装置 | |
JPH03212779A (ja) | 文字認識装置 | |
JPH0772978A (ja) | 電子黒板 | |
JPH0646217A (ja) | ファクシミリ装置 | |
JPH01169665A (ja) | イメージデータ読取機能付posシステム | |
JPS63293690A (ja) | 文字認識システム | |
JP2917396B2 (ja) | 文字認識方式 | |
Shuto et al. | Integrated Document Editing And Organizing System (IDEOS) | |
JPH0612403A (ja) | 入力装置 | |
JPS6154578A (ja) | 文字読取装置 | |
JPH03134784A (ja) | 光学読取装置 | |
JPH02280289A (ja) | 帳票読取処理装置 | |
JPS63167991A (ja) | 文字認識装置 | |
JPS5860383A (ja) | 計算機入力装置 | |
JPS61267883A (ja) | オンライン連続文字認識装置 | |
JPH03252894A (ja) | 文字認識装置 | |
JPH06243285A (ja) | 文字認識方法 | |
JPH06138990A (ja) | データ処理システム | |
JPS6334679A (ja) | 光学文字読取装置 |