JPH0431987A - 文字方向判定装置及び文字方向判定方法 - Google Patents

文字方向判定装置及び文字方向判定方法

Info

Publication number
JPH0431987A
JPH0431987A JP2138982A JP13898290A JPH0431987A JP H0431987 A JPH0431987 A JP H0431987A JP 2138982 A JP2138982 A JP 2138982A JP 13898290 A JP13898290 A JP 13898290A JP H0431987 A JPH0431987 A JP H0431987A
Authority
JP
Japan
Prior art keywords
character
business card
characters
recognition
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2138982A
Other languages
English (en)
Other versions
JP2987462B2 (ja
Inventor
Hidehiro Watanabe
渡辺 英裕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2138982A priority Critical patent/JP2987462B2/ja
Publication of JPH0431987A publication Critical patent/JPH0431987A/ja
Application granted granted Critical
Publication of JP2987462B2 publication Critical patent/JP2987462B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 名刺を読取り内容をコード化する名刺読取装置における
名刺上の文字方向を判定する文字方向判定装置に関する
[従来の技術] 従来の名刺読取装置において名刺に書かれている文字の
方向を判定する際には、名刺モデルを用いて住所部分の
文字列を推定した後、住所部分の文字の認識を2方向で
実行し、認識結果のなかに「県都市区郡町村」なとの住
所キーワードか多く発見された方向を文字の方向である
と判定していた。例えば、 「第37回電子情報通信学
会講演論文集J(6W−5名刺OCRにおける文字方向
の自動判定方法、嶺脇隆邦、立川道義、1654頁)の
中で、この方法が述べられている。
[発明が解決しようとする課題] しかし名刺モデルがすべての形式の名刺を網羅するとは
限らず、住所部分の発見に時間がかかる場合があり、さ
らに住所部分の認識を2回実行する必要があるため処理
時間がかかるという問題があった。また住所は漢字が多
いため認識結果の不良で方向判定に失敗する場合もあっ
た。
[課題を解決するための手段] 本発明の文字方向判定装置は、文字列の行の方向を判定
し行が水平になるよう画像データを変換する行方向判定
手段と、名刺上の文字の中で半角文字を抽出する半角文
字判定手段と、与えられた文字画像の認識を行い文字コ
ードと類似度を示す距離を出力する文字認識装置と、認
識結果から文字の方向を判断する基準となる方向判定指
数を計算する方向判定指数計算手段と、名刺上の文字の
偏り状態を示す文字重心位置を計算する文字重心計算手
段と、方向判定指数と文字重心位置から名刺上の文字の
方向を判定する方向判定手段とを有することを特徴とし
ている。
[作用コ 本発明においては、読み取ろうとする名刺は画像入力手
段で電気信号に変換され記憶装置に記憶される。記憶さ
れた名刺画像データは文字切り出し手段により個々の文
字枠が抽出され、行方向判定手段により文字行が水平に
なるように画像データが変換される。この段階で横形横
書きの名刺(第4図(a)の41で示す名刺)と縦形横
書きの名刺(第4図(c)の43で示す名刺)について
は文字が上向きか下向きかを判定すればよく、縦形縦書
きの名刺(第4図(b)の42で示す名刺)は文字が右
向きか左向きかを判定すればよいことになる。
そこで文字が上向きか下向きか横向きかを判定するため
に文字認識装置で文字を認識してその結果から判定する
のであるが、すべての文字を認識すると処理時間がかか
るため半角文字判定手段により判定した半角文字に限定
して認識処理を行う。
認識結果における平均距離と、半角文字のなかで「1」
と認識された文字の割合から、方向判定指数計算手段に
より方向判定指数が算出される。これは平均距離の値に
より正しい方向で認識が行なわれたかが推定でき、また
「1」と認識された文字の割合によって縦形縦書きの名
刺であるかどうかが判定できるためである。すなわち縦
形縦書きの名刺であれば文字が横向であり、そうでなけ
れば平均距離から文字が上下どちらを向いているかが確
定できる。また文字枠の分布から文字重心計算手段は文
字重心位置を算出する。これは縦形縦書きの名刺の場合
、文字重心位置から文字方向か確定できるからである。
このようにして方向判定指数と文字重心位置より方向判
定手段は文字方向を判定することになる。
[実施例コ 以下、本発明の実施例を示す図面に基づき詳述する。第
1図は実施例を示すブロック図である。
第2図の20は本発明を実現するにあたり用いたハード
ウェアを示す構成図である。第1図において入力名刺画
像は画像入力手段1で電気信号に変換され、画像データ
として記憶装置に記憶される。
文字切り出し手段2は画像データから文字の外接枠であ
る文字枠を抽出することにより1文字ごとの画像データ
に分離する。行方向判定手段3は縦方向、横方向の文字
の射影を取ることによって文字行の方向を判定し、行の
方向が一定の方向を向くように画像データの方向を変換
する。行方向の判定処理については「パターン認識」 
(森健−監鋒、コロナ社、103頁)に説明がある。半
角文字判定手段4は文字枠の縦横比より半角文字と推定
される文字枠を抽出する。抽出された半角文字は文字認
識手段5で認識が行なわれ文字コードと距離が求められ
る。ここで得られた半角文字の個数、平均距離、認識結
果をもとにして方向判定指数計算手段6により方向判定
指数が算出される。
最後に方向判定手段7により方向判定指数と文字重心計
算手段8で計算された文字枠の分布状態から文字の向き
が決定される。
次に実施例における処理手順を第3図に示すフローチャ
ート図をもとに説明する。ステップFOにおいて方向判
定結果を示すVFフラグとHFフラグをクリアする。ス
テップF1で名刺画像データが読み込まれ記憶装置に記
憶される。ステップF2て文字切り出しが行なわれた後
、ステップF3て行方向が判定され、行が水平になるよ
うに画像データを変換する。この結果、名刺画像は名刺
の型に応じて第4図(a)、  (b)、  (c)の
41〜43に示すような向きにセットされることになる
次にステップF4で名刺画像の文字枠の中から半角文字
と推定される文字枠を抽出する。半角文字の推定は次の
手順で行う。まず名刺画像中の文字枠の縦横比の分布を
求める。すると−船釣に縦横比は第5図の54で示され
るような分布をする。
第5図においてXは縦横比を表しXが大きいほど横長で
あるものとする。Yは文字枠の数を表す。
つまり全角文字を中心とする53て示される山と半角文
字を中心とする51て示される山を持つ分布となる。そ
こで2つの山の間の谷52を境界にして52て示される
文字枠より縦長である文字枠を半角文字枠と判定する。
半角文字枠は第6図の斜線部分の領域で示される文字枠
である。
半角文字枠が推定されるとステップF5で半角文字枠に
対してのみ認識処理が実行される。このとき文字認識装
置内の標準辞書には次の14種の文字のみ登録されてい
る。
0123456789 ()<> よって認識結果は必ず14種の文字のどれかになる。文
字認識装置では標準辞書に登録されている文字データと
の距離を計算し、距離の最も小さなカテゴリの文字コー
ドとの距離の値を記憶装置に書き込む。距離は文字の類
似度を表す尺度で距離がOてあれば2つのデータが完全
に同じものであることを示し・距離が大きければ大きい
ほど似ていないことを示す。
認識結果をもとにしてステップF6て方向判定指数の計
算を行う。方向判定指数はSl、S2の2種類あり、そ
れぞれ以下の式で定義される。
51=DI  +  D2・α 52=N/ (2・M  +  N) ここで、 Dlは「1」と認識された文字の距離の平均てあり、 D2は「1」以外の文字カテゴリであると認識された文
字の距離の平均であり、 Mは「1」と認識された文字の個数であり、Nは「1」
以外の文字カテゴリであると認識された文字の個数であ
り、 αは定数である。
Slは半角文字と推定された文字の距離の平均値である
からSlの値が小さければ小さいほど正しく認識された
文字が多い(方向が正しい)ことを示す。そこでステッ
プF7でSlの値がしきい値により小さいかどうかを調
べ、もし小さければ文字が下向きの可能性はないと判断
しステップ13に進む。もしKよりも大きい場合は上下
が逆である可能性があるためステップF8において文字
が下を向いていると仮定して認識を行う。この時認識さ
れるのはステップF4で判定された半角文字のみである
。さらに認識結果をもとにステップF9て新しい方向判
定指数T1を計算する。T1の計算式はSlの場合と同
様である。ステップF10てT1がSlより小さいかど
うか調べ、もしT1が小さければ上下が逆であると判断
し、ステップFilでSlの値をT1の値と置き換え、
ステップF12てVFフラグを1にセットして、ステッ
プF13に進む。ステップFIOてT1がSlより大き
い場合には文字が下向きの可能性はないと判断しステッ
プF13に進む。
ここまでの処理では名刺の文字の向きは上か下であると
仮定してきた。しかし第4図(b)の42で示される名
刺のように文字の向きが左右方向を向いている可能性が
残っている。42で示される名刺は縦形縦書きの名刺で
あり、電話番号や住所で使用されている数字は算用数字
よりも漢数字か圧倒的に多い。漢数字の中て「−」、 
「二」・「三」はステップF5、ステップF8の認識処
理において数字の「1」と認識されるため(「二」は「
11」、 「三」はrl 11J )縦形縦書きの名刺
は「1」と認識される文字が多くなる。方向判定指数8
2は「1」と認識された文字の割合を示すためS2の値
が小さいほど縦形縦書きである可能性が高いことになる
。また文字方向が左右を向いているならば正しい認識結
果が得られないため、Slの値が大きいほど文字が左右
を向いてぃる可能性が高いことになる。そこで関数H(
S2)を定義し、Slが関数H(S2)より小さい場合
に文字が上下方向を向いていると判定できるように間数
H(S2)の値を決めることにすると、関数H(S2)
の値は名刺が縦形縦書きである可能性が高ければ高いほ
ど小さな値をとればよいことになる。すなわちS2の値
に応じて関数H(S2)の値を決定すればよい。S2と
関数H(S2)の関係は非線形であるため経験的に82
から間数H(S2)の値を求めている。第6図の61で
経験的に求めたS2に対応する関数H(S2)の値の一
例を示す。ステップ13て81と関数H(S2)を比較
し、Slが間数H(S2)より小さけれは、ステップF
15でHFフラグを1にセットして終了する。Slが間
数H(S2)より大きい場合は文字が左右方向を向いて
いることになるため、ステップF12までの処理で求め
たVFフラグの値は意味が無くなるのでステップF14
てVFフラグをクリアする。
次に文字が左右どちらの方向を向いているかを判定する
。ここで判定の対象になるのは第4図(b)の42で示
されるタイプの名刺である。このタイプの名刺は100
%に近い確率で住所や電話番号が名刺の左半分(42で
示す名刺では下半分にあたる)にある。住所や電話番号
は構成する文字の数が一般的に多いため、文字の数が名
刺のどちら側の部分に多いか調へることによって文字の
向きを判定することができる。文字がどちらに偏ってい
るかを表すためにステップFI6で文字重心の計算を行
う。文字重心G Yは次式で定義される。
GY= (Y1+Y2+・・・+YN)/NここてNは
名刺画像中にある文字枠の個数であり、Ylは名刺の下
辺からの1番目の文字枠の中心までの幅を表している。
第7図の71は名刺でありm1〜m12までは文字枠を
示す。Yは名刺の高さ方向の幅であり、Ylはml、Y
l2はm12で示される文字枠の中心までの幅を示す。
第7図においてはNは12てあり、この例におけるGY
はY/2よりも小さな値となる。
ステップF17でGYがY/2より小さいが調べ、小さ
い場合は住所などが下半分にあり、文字は左向きである
ためそのまま終了する。大きい場合は右向きであるため
、ステップF18てVFフラグを1にセットして終了す
る。
方向判定結果はVFフラグとHFフラグの値を読むこと
によって得られる。以下にフラグの値と文字の方向を示
す。
(1)HF=1、VF=0:上向き (2)HF=1、VF=1:下向き (3)HF=O1VF=O:左向き (4)HF=0.VF=1:右向き [発明の効果コ 本発明によれは、方向判定のために必要な認識処理にお
いて、文字枠の縦横比から半角文字を推定し半角文字の
み認識することから、認識する文字数を少なくてき、さ
らに認識辞書は14文字しか登録していないため極めて
高速に認識処理ができ、このため全体の処理時間を大幅
に少なくすることを可能とした。また、縦形縦書きの名
刺における特有の性質を利用することで認識率の悪い名
刺でも正確な方向判定を可能とした。
【図面の簡単な説明】
第1図は本発明となる名刺方向判定装置の構成を示すブ
ロック図である。 第2図は本発明の実施例である名刺方向判定装置のハー
ドウェア構成図である。 第3図は本発明の実施例である名刺方向判定装置におけ
るフローチャートである。 第4図は名刺の型と行方向判定処理で画像データ変換後
の向きを示す図である。 第5図は文字枠の縦横比の分布と半角文字枠の推定範囲
を示す図である。 第6図は間数H(S2)の82に対する値を示す図であ
る。 第7図は名刺と名刺上の文字枠を示した図である。 1:画像入力手段、 2:文字切り出し手段、 行方向判定手段、 半角文字判定手段、 文字認識装置、 方向判定指数計算手段、 方向判定手段、 文字重心計算手段、 以上 出願人 セイコーエプソン株式会社 代理人 弁理士 鈴木喜三部 他−名 第2図 (a) 第4 図 /l 第7図

Claims (1)

    【特許請求の範囲】
  1. 名刺の読取り内容をコード化する名刺読取装置において
    、文字列の行の方向を判定し行が水平になるよう画像デ
    ータを変換する行方向判定手段と、前記名刺上の文字の
    中で半角文字を抽出する半角文字判定手段と、与えられ
    た文字画像の認識を行い文字コードと類似度を示す距離
    を出力する文字認識装置と、認識結果から文字の方向を
    判断する基準となる方向判定指数を計算する方向判定指
    数計算手段と、前記名刺上の文字の偏り状態を示す文字
    重心位置を計算する文字重心計算手段と、前記方向判定
    指数と前記文字重心位置とから前記名刺上の文字の方向
    を判定する方向判定手段とを有することを特徴とする文
    字方向判定装置。
JP2138982A 1990-05-29 1990-05-29 文字方向判定装置及び文字方向判定方法 Expired - Fee Related JP2987462B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2138982A JP2987462B2 (ja) 1990-05-29 1990-05-29 文字方向判定装置及び文字方向判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2138982A JP2987462B2 (ja) 1990-05-29 1990-05-29 文字方向判定装置及び文字方向判定方法

Publications (2)

Publication Number Publication Date
JPH0431987A true JPH0431987A (ja) 1992-02-04
JP2987462B2 JP2987462B2 (ja) 1999-12-06

Family

ID=15234714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2138982A Expired - Fee Related JP2987462B2 (ja) 1990-05-29 1990-05-29 文字方向判定装置及び文字方向判定方法

Country Status (1)

Country Link
JP (1) JP2987462B2 (ja)

Also Published As

Publication number Publication date
JP2987462B2 (ja) 1999-12-06

Similar Documents

Publication Publication Date Title
Shi et al. Line separation for complex document images using fuzzy runlength
Mishra et al. Top-down and bottom-up cues for scene text recognition
CN107093172B (zh) 文字检测方法及系统
JP3302147B2 (ja) 文書画像処理方法
US9053361B2 (en) Identifying regions of text to merge in a natural image or video frame
Arai et al. Method for automatic e-comic scene frame extraction for reading comic on mobile devices
CN110399878A (zh) 表格版式恢复方法,计算机可读介质以及计算机
US11132576B2 (en) Text recognition method and apparatus, electronic device, and storage medium
CN112200117A (zh) 表格识别方法及装置
JP2002042143A (ja) 枠認識装置及び記録媒体
CN105184294B (zh) 一种基于像素追踪的倾斜文字判断识别方法
CN105590112B (zh) 一种图像识别中倾斜文字判断方法
JP3411472B2 (ja) パターン抽出装置
CN111144411A (zh) 一种基于显著图的不规则文本修正与识别方法及系统
CN109409363B (zh) 基于内容的文本图像颠倒判断及校正方法
CN101814141A (zh) 存储介质、字符识别方法以及字符识别设备
CN109948598B (zh) 文档版面智能化分析方法及装置
US20160307033A1 (en) Chinese, Japanese, or Korean Language Detection
Song et al. A robust statistic method for classifying color polarity of video text
Nguyen et al. Enhanced character segmentation for format-free Japanese text recognition
JPH0431987A (ja) 文字方向判定装置及び文字方向判定方法
Wang et al. Improvement of zone content classification by using background analysis
Nakagawa et al. A formalization of on-line handwritten Japanese text recognition free from line direction constraint
JP3344062B2 (ja) カタカナ手書き文字切り出し回路
CN115082919B (zh) 一种地址识别方法、电子设备及存储介质

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081008

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091008

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees