JPH03224079A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH03224079A
JPH03224079A JP1994690A JP1994690A JPH03224079A JP H03224079 A JPH03224079 A JP H03224079A JP 1994690 A JP1994690 A JP 1994690A JP 1994690 A JP1994690 A JP 1994690A JP H03224079 A JPH03224079 A JP H03224079A
Authority
JP
Japan
Prior art keywords
character
attribute
line
pattern
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1994690A
Other languages
English (en)
Inventor
Toshiyuki Itezono
射手園 敏行
Koji Ito
伊東 晃治
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1994690A priority Critical patent/JPH03224079A/ja
Publication of JPH03224079A publication Critical patent/JPH03224079A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は文字認識装置、特に文書構成要素の属性判定
を行なえるものに関する。
(従来の技術) 文書テータヘースの作成では、文書画像データ中の文字
をコート化することに加え、文字行、段落等の文書構成
要素の項目を属性判定により特定し所定の項目に関する
データ蓄積を行なうことも重要である。従来、このよう
な文字のコード化と属性判定とを行なうようにした文字
認識技術としで、例えば文献■:電子通信情報学会技術
研究報告 PRU87−88に開示されでいるものがあ
る。
文献■の従来技術では、名刺に関するレイアウト情報を
記述した名刺モテルを用いて名刺画像の構造を解析する
ことにより、文1構成要素の項目を推定する。そして、
推定した項目を仮説として扱い、この項目仮説を名刺画
像認識システムの文字切出し、文字認識、単語処理(知
識処理)でそれぞれ用いたのち、項目毎に固有なキーワ
ード(例えば項目か社名ならばキーワードは「株式会社
」等となる)か存在するが否かを調べで項目仮説を検証
する。この検証には切出し文字(文字パタン)の位置及
び認識結果として得た文字コートを用いる。
(発明か解決しようとする課題) しかしなから文書特に名刺のフォーマットが多様化し1
ご今日において、上述の従来技術で用いる文字パタンの
位置、文字コート等の属性判定情報のみては文書構成要
素の項目を特定できないことも多い。例えば従来技術で
は株式会社、有限会社等のキーワードを含む文字行を項
目か社名となる文字行として検出するか これらキーワ
ードを用いていない文書では社名の項目の文字行を検出
てきない。
この発明の目的は上述した従来の問題点を解決するため
、文字特徴を含めた属性判定情報を用いて属′1刊定を
行なう文字認識装Mを提供することこある。
(課題を解決するための手段) この目的の達成を図るため、この発明の文字認識装置は
、 文書の画像データから文字パタンを切吊す切出し手段と
、文字パタンの認識を行なう認識手段と、画像データか
ら抽出される属性判定情報を用いて文書構成要素の属性
を判定する属性判定手段とを具えて成る文字認識装置に
あいで、文字パタンの文字特徴を抽出する特徴抽出手段
を設け、 属性判定手段を、文字時mを含めた属性判定情報を用い
て属性を判定する手段としたことを特徴とする。
(作用) このような構成の文字認識装置によれば、文字パタンの
文字特徴を抽出し、この文字特徴を含めた属性判定情報
を用いて属性を判定する。属性判定情報に文字特徴を加
えること(こまって従来属・注を特定できなかった場合
にも属性を特定できるようになる。
例えば、「株式会社」といったキーワードがない名刺や
、社名の位置が特定しにくい名刺特に横書きの名刺等で
は、社名の項目の文字とそれ以外の項目の文字と1こ関
して文字の大きさや文字ピッチはほとんど差がない。し
かしながら−船釣な名刺では、文字特徴特に文字形状に
差をっけ社名とそれ以外の項目とを区別するよう配慮が
なされていることか非常に多い。従って文字の大きさや
文字ピッチを用いたたけては属性を特定できない場合で
も、文字特徴を利用することによって属性を特定できる
(実施例) 以下、図面を参照し、この発明の実施例につき説明する
。尚、図面はこの発明か理解できる程度に各構成成分の
入出力信号の流れ、接続関係、形状、配設位置及び寸法
を概略的に示しであるにすぎず、従ってこの発明を図示
例に限定するものではない。
第1図はこの発明の実施例の構成例の説明に供する機能
ブロック図である。同図にも示すように、この実施例の
文字認識装置10は、文書の画像データから文字パタン
を切出す切出し手段12と、文字パタンの認識を行なう
認識手段14と、画像データから抽出されるR牲判定情
報を用いて文書構成要素の属性を判定する属性判定手段
16とを具えるものにおいて、文字パタンの文字特徴を
抽出する特徴抽出手段18を設け、属性判定手段]6を
、文字特徴を含めた属性判定情報を用いて属性を判定す
る手段とした構成を有する。
以下、より詳細にこの実施例につき説明する。
この実施例は、名刺を入力帳票(入力文M)とするデー
タヘースの入力システムに文字認識装置]○を適用した
例であって、データヘース作成のため、画像入力部20
は名刺を走査し名刺からの光信号を画素分解して電気信
号に変換し、この電気信号を白黒2値に量子化する。こ
の量子化信号は文字線部を黒ビット及び文字背景部を白
ビットで表す画像データであり、画像データは走査順次
に画像メモリ22に格納される。
第2図は画像データの例を表す図である。同図にも示す
ように、画像メモリ22上にはx−y座標系を設定し、
○≦X≦XEがつO≦y≦Y、の範囲を画像データの処
理対象領域とする。処理対象領域は通常の名刺の広さよ
りも若干広く設定されるが、処理対象領域の名刺か存在
しない部分は文字背景部となるようになしでいる。尚、
好ましくは、名刺の左上角点かメモリ22上の座標系の
原点○に一敗しかつ名刺の行方向かX軸方向と一敗する
よう、名刺を画像入力部20にセットし画像入力部20
による名刺の読取りを行なう。
文字認識装置1oは処理対象領域内の画像データ24を
走査して属性判定を行ない、この判定結果に基づいて名
刺に関するデータをデータベース24(第1図参照)に
蓄積する。以下、この装置10の各手段の動作につき説
明する。
(切出(〕手段) 切出し手段12は画像メモリ22の画像データ24を走
査Lノで一単位の文書構成要素として文字行1行を検出
する。この文字行検出は通常の切出し処理で行なわれる
如く行なわれ、この検出(こより行方向(X軸方向)に
あける文字行の始端位置XL及び終端位[XRと、列方
向(y軸方向)における文字行の始端位iYT及び終端
位置YBとを検出する。
第3図に第2図の画像データ24がらの文字行検出結果
の例を示す。図にも示すようにXL≦X≦XRかつYT
≦y≦YBの範囲の領域(点線の矩形枠で囲む領域)か
文字行の領域であり、図においで各文字行領域にそれぞ
れ符号f;!1〜f25を付しで示し1と。
好ましくは、項目の異なる文字は含ます同し項目に属す
るとみなせる文字のみを含む領域を一単位の文書構成要
素とし、この−単位毎に属性判定を行なうようにする。
また切出し手段]2は通常行なわれる如く文字切出しを
行なう。すなわち画像データ24を走査して一文字分の
文字か存在するとみなぜる領域Cを検出し、この領域C
内の画像データ24を文字パタンとしで切出しパタンレ
ジスタ26に格納する。領域Cの検出ては、行方向にお
ける領域Cの始端位置にし及び終端位置KRと、列方向
における領域Cの始端位MKT及び終端位1111KB
とを検出する。検出した領1或CはKL≦X≦KRかつ
KT≦y≦にBの範囲の領域となる。第3図においで、
この領域Cの一例を一点鎖線の矩形枠で囲む領域で示し
た。
ざらに切出lノ手段]2は切出した文字パタンの位N(
領域Cの位N)及び又は行位1データを属性判定手段1
6へ出力する。尚、文字パタンかどの文字行に属するか
を表すため、例えば文字パタンか属する文字行を表す行
ラベル情報を当該文字パタンの位置に付す。
(認識手段) 認識手段14はパタンレジスタ26の文字パタンを走査
しこの文字パタンに関して認識処理のための特徴を抽出
する。そして、この文字パタンの特徴と、図示しない辞
書に格納された標準文字の特徴とのマツチングを行なっ
て文字認識を行ない、認識結果としての文字コードを属
性判定手段16へ出力する。
(特徴抽出手段) 特徴抽出手段18はパタンレジスタ26の文字パタンを
走査しこのパタンの形状を反映する文字特徴として文字
線幅WLを抽出し、この特徴を属性判定手段]6へ出力
する。
この文字特徴抽出ては、パタンレジスタ26から画像デ
ータ(デジタル信号)を1画素ずつ線順次に入力し、例
えば2×2の窓の全ての点が黒ビットとなった回数Qと
、パタンレジスタ26の文字パタン中の黒ビツト総個数
Aとを計数し、従来周知の次式(1)に従って線幅WL
を算出する。
WL =A/ (A−Q)    ・・・・・・(1)
(属性判定手段) 属性判定手段]6は、文字パタンの位置、文字コート及
び文字特y1ヲ属牲判定情報として用いて各文字行領域
の属性を判定し、所定の属性(例えば氏名や企業名)の
文字行の認識結果列(文字コード列)を次段の装置例え
ばデータベースに登録する。
属性判定手段16は第一判定手段16a及び第二判定手
段16bがら成り、第一判定手段16aは、文字コート
と文字行領域の位置及び文字パタンの位置とを含む属性
判定情報を用いで、氏名の文字行及び企業名の文字行を
検出するための第一属性判定を通常行なわれる如く行な
う。
また第二判定手段16bは、第一属性判定においで企業
名の文字行を検出できなかった場合に、文字特徴を含む
属性判定手段を用いて企業名の文字行を検出するための
第二属性判定を行なう。
*第一判定手段 第一判定手段16aは、切出し手段12から文字パタン
の位置及び文字行領域の位置を入力し、これら入力した
位置より各文字行の属性判定に用いる特徴(以下、被判
定付特徴と称す)、例えば文字の位置、文字ピッチ、文
字の大きさ、文字間長等を得る。
そして被判定付特徴を名刺氏名の文字行に間する一般的
な特徴(以下、氏名付特徴と称す)、例えば氏名の文字
行は名刺の中央付近に存在しその文字ピッチか他の属性
の文字行の文字ピッチと比較して広いという特徴と比較
し、氏名行特黴と等価な被判定付特徴を有する文字行を
属性が氏名となる文字行(氏名行)として検出する。
次に第一判定手段16aは氏名行を除く残りの各文字行
毎に、文字行を構成する文字列Nの認識結果列(文字コ
ード列)を参照し、次に示すキーワードa)〜d)のな
かの少なくともひとつを含む文字列Nの文字行を属性が
企業名である文字行(企業名付)としで検出する。
a)株式 b)会社 C)商事 d)有限氏名行及び企
業名神泡検出したら、これら行の認識結果列をそれぞれ
データヘース24に蓄積する。尚、データヘース24は
各名刺毎に、氏名及び企業名を抽出し保存する。また、
通常は、文字に対し−又は複数の候補文字(文字コード
)か認識結果として得られるので、文字行を構成する各
文字の候補文字i9照し、キーワードを構成する候補文
字列を有する文字行を企業名付とする。企業名付のキー
ワード以外の候補文字についでは第1位の候補文字を選
択し、これらキーワトと第1位の候補文字列とから成る
認識結果列を企業名付の認識結果列としてデータヘース
24に保存すればよい。
氏名行を除く残りの文字行すべてかキーワードa)〜d
)のいずれも含まない場合には企業名不明と判定する。
*第二判定手段 第二判定手段16bは第−判定手段16aが企業名不明
と判定すると、氏名行を除く残りの各文字行毎に、文字
の平均線幅を求める。平均線幅は一単位の文字行か含む
各文字の線幅の総和をこの文字行か含む文字の総個数で
除して得たものである。
そして名刺の企業名の文字は他の属性の文字よりも線幅
が太いという一般的な特徴を利用し、平均線幅が最大と
なる文字行を企業名付としで検出する。
企業名付を検出したら、氏名行及び企業名付の認識結果
列をそれぞれデータヘース24に蓄積する。
第3図に示す行検出結果の例では、まず第一判定手段1
6aか文字行β1をこのl]の配置位置、文字ピッチ等
から氏名行と判定する。
次いで第一判定手段16aは残りの文字行β2〜ρ5に
関しキーワードa)〜d)を探索するかいずれの文字行
にもキーワードか存在しないので、企業名不明と判定す
る。
第一判定手段16aか企業名不明と判定したので、次い
て第二判定手段161)は残りの文字行!2〜β5の各
文字行に関し平均線幅を求め、最大の平均線幅を得た文
字行β3を企業名付と判定する。
この発明は上述した実施例にのみ限定するものではなく
、従って各構成成分の動作、動作条件及び動作の流れを
任意好適に変更できる。
例えば、上述した実施例では特徴抽出手段は文字線幅の
みを抽出するようにしたが、文字特徴として文字線幅、
文字複雑度そのほかの文字形状を反映する特徴を用いる
ことかできる。好ましくは特徴抽出手段を文字線幅及び
又は文字複雑度を抽出する手段とするのかよい。
文字複雑度は一文字分の文字パタン中の黒ビツト総個数
を白ビツト総個数で除して得た比、或は黒ビツト総個数
で表せ、この複雑度を例えば上述の実施例の場合と同様
にして企業名付を検出するために用いたり、電話番号の
文字行を検出するのに用いたりすることかできる。電話
番号の文字行は数字等の比較的単純な文字から成るとい
う特徴に着目すれば、この電話番号行においでは複雑度
か小さい文字か出現する頻度か高くなる。従って、所定
の閾値以下の複雑度を得た文字か所定個数以上存在する
文字行を電話番号行と推定するようになしてもよい。
また上述した実施例では、線幅を企業名付の検出に用い
るようになしたか、これに限定するものではなくこのほ
か文字線幅に差をつけて文字行の属′荘の区別を行なっ
ている場合に広く適用でき、例えば氏名を他の属性の文
字よりも太くするようになした帳票や社員証等において
氏名行を検出するために線@を用いることもてきる。
また上述の実施例では企業名付のキーワードを除く候補
文字については第1位の候補文字を選択するようにした
か、必すしも候補順位によって選択するのではなく、デ
ータヘースと属性判定手段との間に知識処理手段を設け
、社名に間する知識処理を行なって、企業名付のキーワ
ードを除く候補文字の中から正しいと思われる候補文字
を選択するようにしてもよい。
またこの発明は名刺そのほかの任意好適な文書における
属を判定に適用できるものであり、また1単位の文書構
成要素を1行の文字行のみならす複数の文字行とするよ
うにしてもよい。
(発明の効果) 上述した説明からも明らかなように、この発明の文字認
識装置によれば、文字パタンの文字特徴を抽出し、この
文字特徴を含めた属性判定情報を用いて属・iを判定す
る。属性判定手段に文字特徴を加えることによって従来
、属性を特定できなかった場合にも属性を特定できるよ
うになり、従って属性不明となる機会を減らせまた属性
判定を精度良く行なえる。
従って文書構成要素の属性に応じた知識辞書を用いた単
語処理(知識処理)にこの発明装M%応用した場合、単
語処理結果の精度をよくすることかできる。またこの発
明装置を名刺等のデータベース入力手段として用いれば
、文書構成要素の属性に応して正確にデータ入力を行な
え、これかためオペレータかデータ入力の修正処理を行
なう機会を減らせデータベース入力処理の効率を高める
ことかできる。
【図面の簡単な説明】
第1図はこの発明の一笑施例の構成の説明に供する機能
ブロック図、 第2図は画像データの一例を示す図、 第3図は行検出結果例を示す図である。 ]○・・・文字認識装置、]2・・・切出し手段14・
・・認識手段、   ]6・・・属性判定手段a・・・
第一判定手段 b・・・第二判定手段 ・・・特徴抽出手段。 許 出 願 人 沖電気工業株式会社 画像データ例 @2 図 行検出結果例 第3 図

Claims (2)

    【特許請求の範囲】
  1. (1)文書の画像データから文字パタンを切出す切出し
    手段と、前記文字パタンの認識を行なう認識手段と、前
    記画像データから抽出される属性判定情報を用いて文書
    構成要素の属性を判定する属性判定手段とを具えて成る
    文字認識装置において、 前記文字パタンの文字特徴を抽出する特徴抽出手段を設
    け、 前記属性判定手段を、前記文字特徴を含めた属性判定情
    報を用いて前記属性を判定する手段としたことを特徴と
    する文字認識装置。
  2. (2)前記特徴抽出手段は文字線幅及び文字複雑度の双
    方又はいずれか一方を文字特徴として抽出する手段であ
    ることを特徴とする請求項1に記載の文字認識装置。
JP1994690A 1990-01-30 1990-01-30 文字認識装置 Pending JPH03224079A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1994690A JPH03224079A (ja) 1990-01-30 1990-01-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1994690A JPH03224079A (ja) 1990-01-30 1990-01-30 文字認識装置

Publications (1)

Publication Number Publication Date
JPH03224079A true JPH03224079A (ja) 1991-10-03

Family

ID=12013373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1994690A Pending JPH03224079A (ja) 1990-01-30 1990-01-30 文字認識装置

Country Status (1)

Country Link
JP (1) JPH03224079A (ja)

Similar Documents

Publication Publication Date Title
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
US5539841A (en) Method for comparing image sections to determine similarity therebetween
JP2973944B2 (ja) 文書処理装置および文書処理方法
JP3452774B2 (ja) 文字認識方法
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
JPH03224079A (ja) 文字認識装置
JPH0728935A (ja) 文書画像処理装置
JPH07271921A (ja) 文字認識装置および文字認識方法
JPH08161432A (ja) 文字切り出し方法および文字切り出し装置
JP3151866B2 (ja) 英文字認識方法
JP2851102B2 (ja) 文字切出し方法
JP2746345B2 (ja) 文字認識の後処理方法
JPS62281082A (ja) 文字認識装置
JP2931485B2 (ja) 文字切出し装置及び方法
JP3100786B2 (ja) 文字認識後処理方式
JP2972443B2 (ja) 文字認識装置
JP2963474B2 (ja) 類似文字識別方法
JPH0436885A (ja) 光学式文字読取装置
JPS60138689A (ja) 文字認識方法
JP2000207491A (ja) 文字列読取方法及び装置
JP2000057315A (ja) 文書ファイリング装置及び文書ファイリング方法
JPH06162266A (ja) オンライン手書き文字認識の方法及びその装置
JPH01191992A (ja) 文字認識装置
JPH01171080A (ja) 誤り自動訂正文字認識装置
JPH05233877A (ja) 単語読み取り方法