JPS6254380A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS6254380A JPS6254380A JP60182014A JP18201485A JPS6254380A JP S6254380 A JPS6254380 A JP S6254380A JP 60182014 A JP60182014 A JP 60182014A JP 18201485 A JP18201485 A JP 18201485A JP S6254380 A JPS6254380 A JP S6254380A
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- histogram
- picture
- vertical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、新聞・雑誌等の活字および手書き文字を認識
し、たとえばJISコード等の情報量に変換する文字認
識装置に関するものである。
し、たとえばJISコード等の情報量に変換する文字認
識装置に関するものである。
従来の技術
従来の文字認識装置では、縦書き、横書きおよび行間隔
・文字間隔等の書式が明確な文書、つまり読み取る文字
の用紙上の絶対的な位置があらかじめ判明している文書
を対象に文字認識を行ってきた。このことは、文字認識
装置が対象とする文書に制限を与えており、この問題を
解決するために、入力画像の2次元フーリエ変換を用い
て行間を検出して縦書き・横書き等の行方向を抽出し、
書式が未知の文書に対しても、文章の意味が理解できる
ように認識候補文字の順序を決定する方法がとられてい
た。(例えば、畏谷・星野“印刷文字列の周期的特徴”
信学論中)、 J66−D 、 2 。
・文字間隔等の書式が明確な文書、つまり読み取る文字
の用紙上の絶対的な位置があらかじめ判明している文書
を対象に文字認識を行ってきた。このことは、文字認識
装置が対象とする文書に制限を与えており、この問題を
解決するために、入力画像の2次元フーリエ変換を用い
て行間を検出して縦書き・横書き等の行方向を抽出し、
書式が未知の文書に対しても、文章の意味が理解できる
ように認識候補文字の順序を決定する方法がとられてい
た。(例えば、畏谷・星野“印刷文字列の周期的特徴”
信学論中)、 J66−D 、 2 。
PP、298〜299)
発明が解決しようとする問題点
しかしながら、入力画像の2次元フーリエ変換により入
力文書の行方向を検出する従来の技術では、2次フーリ
エ変換という多大な計算量を必要とする方法を用いてい
るために処理に時間がかかる。
力文書の行方向を検出する従来の技術では、2次フーリ
エ変換という多大な計算量を必要とする方法を用いてい
るために処理に時間がかかる。
本発明はかかる点に鑑みてなされたものであり、簡易な
方法で入力画像の行方向を検出し、書式が未知の文書に
対しても、文章の意味が理解できるように認識候補文字
を編集することができる文字認識装置を提供することを
目的としている。
方法で入力画像の行方向を検出し、書式が未知の文書に
対しても、文章の意味が理解できるように認識候補文字
を編集することができる文字認識装置を提供することを
目的としている。
問題点を解決するための手段
本発明は前記問題点を解決するため、入力画像の内、疑
似正方形の領域を縦方向・横方向に走査して文字部を形
成する画素のヒストグラムを求め、ヒストグラムから求
めた縦方向・横方向それぞれの文字間隔長の平均値を比
較することにより、文書の行方向を判定する手段を備え
てい゛る。
似正方形の領域を縦方向・横方向に走査して文字部を形
成する画素のヒストグラムを求め、ヒストグラムから求
めた縦方向・横方向それぞれの文字間隔長の平均値を比
較することにより、文書の行方向を判定する手段を備え
てい゛る。
作用
本発明は前記した技術的手段により、書式が未知の文書
に対して、高速に行方向を抽出して認識候補文字を文章
の意味が理解できるように編集することが可能とガる。
に対して、高速に行方向を抽出して認識候補文字を文章
の意味が理解できるように編集することが可能とガる。
実施例
以下、本発明の実施例について図面を参照しながら説明
する。
する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であシ、認識対象文字を含む
画像を走査し2値信号で画像を入力し画像メモリ2に格
納する。3は行方向判定部であシ、画像メモリ2に格納
されている入力画像に対して正方形の領域を設定し、そ
の領域を走査して入力画像の縦書き・横書き判定を行う
。4は文字切り出し部であり、行方向判定部3で検出し
た行方向を用いて画像メモリ2を走査して行アドレスを
検出し、行アドレスを用いて画像メモリ2を行単位で走
査し、行単位の画像の射影を用いて1字ずつ認識対象文
字画像を切り出し、各文字の入力画像上の文字アドレス
を検出する。Sは認識部であシ、文字切り出し部4で切
り出した認識対象文字のストローク等の特徴量を求め、
あらかじめ辞書6に登録されている文字の特徴量と照合
し、最も似た文字を認識候補文字とする。アは編集部で
あり、行方向判定部3で求めた行方向及び文字切り出し
部4で求めた行アドレスと文字アドレスを用いて、認識
部5で抽出した認識候補文字を文章の意味が理解できる
順序に編集し、文章メモリ8に文字コードで格納する。
図である。1は画像入力部であシ、認識対象文字を含む
画像を走査し2値信号で画像を入力し画像メモリ2に格
納する。3は行方向判定部であシ、画像メモリ2に格納
されている入力画像に対して正方形の領域を設定し、そ
の領域を走査して入力画像の縦書き・横書き判定を行う
。4は文字切り出し部であり、行方向判定部3で検出し
た行方向を用いて画像メモリ2を走査して行アドレスを
検出し、行アドレスを用いて画像メモリ2を行単位で走
査し、行単位の画像の射影を用いて1字ずつ認識対象文
字画像を切り出し、各文字の入力画像上の文字アドレス
を検出する。Sは認識部であシ、文字切り出し部4で切
り出した認識対象文字のストローク等の特徴量を求め、
あらかじめ辞書6に登録されている文字の特徴量と照合
し、最も似た文字を認識候補文字とする。アは編集部で
あり、行方向判定部3で求めた行方向及び文字切り出し
部4で求めた行アドレスと文字アドレスを用いて、認識
部5で抽出した認識候補文字を文章の意味が理解できる
順序に編集し、文章メモリ8に文字コードで格納する。
以上のように構成された文字認識装置について、第2図
に示す入力画像Pを例に説明する。
に示す入力画像Pを例に説明する。
画像入力部1から入力された画像Pは文字部1、白部0
の2値データで画像メモリ2に蓄えられる。
の2値データで画像メモリ2に蓄えられる。
まず行方向判定部3で画像メモリ2に蓄えられている入
力画像Pを左上から横方向にm画素、縦方向にm画素走
査して、入力画像の内の正方形領域P′における文字部
を形成する画素の縦方向ヒストグラムaVと横方向ヒス
トグラムHhを求めると第2図に示す様になる。文字部
と文字間部を分けるために、ヒストグラムHマと)Il
lそれぞれに対してヒストグラムの値が0画素以下であ
る文字間部分と0画素より太い画素数の文字部分に分け
、各部分の先頭アドレスを求める。第2図中のysl・
ysz・・・・・・ff5i・・・・・・及びxsl・
、Zsz・・・・・・Jsi・・・・・・は文字部分の
先頭アドレスであり、yel・yel・・・ ・・・・
yei・・・・・・及びxel・xez・・・・・・x
ei・・・・・・は文字間部分の先頭アドレスである。
力画像Pを左上から横方向にm画素、縦方向にm画素走
査して、入力画像の内の正方形領域P′における文字部
を形成する画素の縦方向ヒストグラムaVと横方向ヒス
トグラムHhを求めると第2図に示す様になる。文字部
と文字間部を分けるために、ヒストグラムHマと)Il
lそれぞれに対してヒストグラムの値が0画素以下であ
る文字間部分と0画素より太い画素数の文字部分に分け
、各部分の先頭アドレスを求める。第2図中のysl・
ysz・・・・・・ff5i・・・・・・及びxsl・
、Zsz・・・・・・Jsi・・・・・・は文字部分の
先頭アドレスであり、yel・yel・・・ ・・・・
yei・・・・・・及びxel・xez・・・・・・x
ei・・・・・・は文字間部分の先頭アドレスである。
このアドレスから正方形領域P′における縦方向の文字
間隔長(!/si++Yei )の平均値(ysi+t
−!/ei )と横方向の文字間隔長(xsi+1−
xei )の平均値(zsi++−xei )とを比
較すると縦方向の値が横方向の値に対して大となり、正
方形領域P′ひいては人力画像Pの行方向は横書きであ
ることがわかる。
間隔長(!/si++Yei )の平均値(ysi+t
−!/ei )と横方向の文字間隔長(xsi+1−
xei )の平均値(zsi++−xei )とを比
較すると縦方向の値が横方向の値に対して大となり、正
方形領域P′ひいては人力画像Pの行方向は横書きであ
ることがわかる。
次に文字切り出し部4では、入力画像Pの行方向が横書
きと決定したことから、入力画像全体における文字部を
形成する画素の縦方向のヒストグラムH2を求めて、入
力画像Pの行アドレスC1s+ + let )−(J
si 、 lei )−を求める。第2図に結果を示す
。行アドレスを用いて画像メモリ2から第3図に示す行
画像りを抽出する。抽出した行画像りを射影してヒスト
グラムHcを求めると第3図に示す様になる。ヒストグ
ラムHcがら1字1字の横方向のアドレス(Os1.0
a1)・・・(Csi 、 Cei )・・・を求め、
認識対象文字画像を1字ずつ切り出し、さらに、行アド
レスと組合せて文字アドレスを決定する。
きと決定したことから、入力画像全体における文字部を
形成する画素の縦方向のヒストグラムH2を求めて、入
力画像Pの行アドレスC1s+ + let )−(J
si 、 lei )−を求める。第2図に結果を示す
。行アドレスを用いて画像メモリ2から第3図に示す行
画像りを抽出する。抽出した行画像りを射影してヒスト
グラムHcを求めると第3図に示す様になる。ヒストグ
ラムHcがら1字1字の横方向のアドレス(Os1.0
a1)・・・(Csi 、 Cei )・・・を求め、
認識対象文字画像を1字ずつ切り出し、さらに、行アド
レスと組合せて文字アドレスを決定する。
認識部5には切り出された認識対象文字の矩形Rが順次
入力される。第4図e)に切り出された認識対象文字「
松」を示す。切り出したr松」の各画素について、第4
図(b)の矢印が示す方向に着目画素を含んでM個以上
(Mはあらかじめ設定)連っているか否かを調べ方向コ
ードを設定する。方向コード毎に各画素の連結性を調べ
てストロークを抽出し、ストロークの数・位置・長さ等
の特徴量を抽出する。第4図e)に認識対象文字「松」
のストローク抽出結果を示す。抽出した特徴量を辞書6
に登録されている文字の特徴量と照合し、最も似た文字
「松」を認識候補文字とする。
入力される。第4図e)に切り出された認識対象文字「
松」を示す。切り出したr松」の各画素について、第4
図(b)の矢印が示す方向に着目画素を含んでM個以上
(Mはあらかじめ設定)連っているか否かを調べ方向コ
ードを設定する。方向コード毎に各画素の連結性を調べ
てストロークを抽出し、ストロークの数・位置・長さ等
の特徴量を抽出する。第4図e)に認識対象文字「松」
のストローク抽出結果を示す。抽出した特徴量を辞書6
に登録されている文字の特徴量と照合し、最も似た文字
「松」を認識候補文字とする。
認識部6から順次抽出される入力画像Pから切り出され
た認識対象文字の認識候補文字は、入力画像Pが横書き
であること及びそれぞれの文字アドレスから、編集部7
で「松J rxJ r電」[×]・・・と横方向に
左上から右下へ文字をならべて、文章の意味が理解でき
るように編集され文章メモリ8に文字コードで蓄えられ
る。
た認識対象文字の認識候補文字は、入力画像Pが横書き
であること及びそれぞれの文字アドレスから、編集部7
で「松J rxJ r電」[×]・・・と横方向に
左上から右下へ文字をならべて、文章の意味が理解でき
るように編集され文章メモリ8に文字コードで蓄えられ
る。
以上のように構成された文字認識装置では、簡易な方法
で求めた行方向及び行アドレスを用いて、認識対象文字
の切り出し、さらに認識候補文字の編集を行うことによ
り、文章の意味が理解できる文字列を作成することがで
きる。さらに、文章メモリを文書処理装置等に接続する
ことにより、新たな文書編集が可能となる。
で求めた行方向及び行アドレスを用いて、認識対象文字
の切り出し、さらに認識候補文字の編集を行うことによ
り、文章の意味が理解できる文字列を作成することがで
きる。さらに、文章メモリを文書処理装置等に接続する
ことにより、新たな文書編集が可能となる。
尚、本実施例では入力画像の内、mxm画素の正方形領
域を走査して行方向を判定したが、数画素の差である疑
似正方形の領域を走査して、行方向を判定しても問題は
ない。
域を走査して行方向を判定したが、数画素の差である疑
似正方形の領域を走査して、行方向を判定しても問題は
ない。
発明の効果
本発明によれば、入力画像の内、疑似正方形の領域を縦
方向・横方向に走査して文字部を形成する画素のヒスト
グラムを求め、ヒストグラムから求めた縦方向・横方向
の文字間隔長の平均値を比較するという簡易な方法で高
速に入力画像の行方向を抽出する・ことにより、書式が
未知の文書に対して文章の意味が理解できるように認識
候補文字を編集することが可能となる。
方向・横方向に走査して文字部を形成する画素のヒスト
グラムを求め、ヒストグラムから求めた縦方向・横方向
の文字間隔長の平均値を比較するという簡易な方法で高
速に入力画像の行方向を抽出する・ことにより、書式が
未知の文書に対して文章の意味が理解できるように認識
候補文字を編集することが可能となる。
第1図は本発明における一実施例による文字認識装置の
構成図、第2図は入力画像及び入力画像の行方向と行ア
ドレスの判定方法の説明図、第3図は入力画像内の認識
候補文字切り出し方法の説明図、第4図は文字認識方法
の説明図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
、3・・・・・・行方向判定部、4・・・・・・文字切
り出し部、6・・・・・・認識部、6・・・・・・辞書
、7・・・・・・編集部、8・川・・文章メモリ。 代理人の氏名 弁理士 中 尾 敏 男 はが1名第1
図 第2図 第 3 因 り 第4図 Cst C”6.゛ (b)
構成図、第2図は入力画像及び入力画像の行方向と行ア
ドレスの判定方法の説明図、第3図は入力画像内の認識
候補文字切り出し方法の説明図、第4図は文字認識方法
の説明図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
、3・・・・・・行方向判定部、4・・・・・・文字切
り出し部、6・・・・・・認識部、6・・・・・・辞書
、7・・・・・・編集部、8・川・・文章メモリ。 代理人の氏名 弁理士 中 尾 敏 男 はが1名第1
図 第2図 第 3 因 り 第4図 Cst C”6.゛ (b)
Claims (1)
- 認識対象文字を含む画像を入力する画像入力部と、前記
画像入力部で入力された画像の内、疑似正方形(正方形
も含む)の領域を縦方向・横方向に走査して文字部を形
成する画素のヒストグラムを求め、このヒストグラムの
値がN画素以下である文字間隔の連続する走査線の数で
定義される文字間隔長の平均値を縦方向と横方向で比較
することにより縦書き・横書きを判定する行方向判定部
と、入力画像から認識対象文字を切り出す文字切り出し
部と、前記認識対象文字を辞書と照合することにより認
識候補文字を抽出する認識部と、前記認識候補文字群を
編集する編集部を有することを特徴とする文字認識装置
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60182014A JPH0797390B2 (ja) | 1985-08-20 | 1985-08-20 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60182014A JPH0797390B2 (ja) | 1985-08-20 | 1985-08-20 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6254380A true JPS6254380A (ja) | 1987-03-10 |
JPH0797390B2 JPH0797390B2 (ja) | 1995-10-18 |
Family
ID=16110824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60182014A Expired - Lifetime JPH0797390B2 (ja) | 1985-08-20 | 1985-08-20 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0797390B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04352295A (ja) * | 1991-05-30 | 1992-12-07 | Toshiba Corp | 文字列方向判別装置 |
JPH1011542A (ja) * | 1996-06-20 | 1998-01-16 | Fujitsu Ltd | 文字認識装置 |
JP2012256160A (ja) * | 2011-06-08 | 2012-12-27 | Internatl Business Mach Corp <Ibm> | 文字の読み順を決定するための読み順決定装置、方法及びプログラム |
JP2018116647A (ja) * | 2017-01-20 | 2018-07-26 | リード テクノロジーズ,インコーポレイティド | テキストの回転角を決定する装置、方法及びコンピュータ可読記憶媒体 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55127678A (en) * | 1979-03-22 | 1980-10-02 | Nec Corp | Character array direction detector |
JPS55135972A (en) * | 1979-04-10 | 1980-10-23 | Toshiba Corp | Character line direction discrimination circuit |
-
1985
- 1985-08-20 JP JP60182014A patent/JPH0797390B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55127678A (en) * | 1979-03-22 | 1980-10-02 | Nec Corp | Character array direction detector |
JPS55135972A (en) * | 1979-04-10 | 1980-10-23 | Toshiba Corp | Character line direction discrimination circuit |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04352295A (ja) * | 1991-05-30 | 1992-12-07 | Toshiba Corp | 文字列方向判別装置 |
JPH1011542A (ja) * | 1996-06-20 | 1998-01-16 | Fujitsu Ltd | 文字認識装置 |
JP2012256160A (ja) * | 2011-06-08 | 2012-12-27 | Internatl Business Mach Corp <Ibm> | 文字の読み順を決定するための読み順決定装置、方法及びプログラム |
JP2018116647A (ja) * | 2017-01-20 | 2018-07-26 | リード テクノロジーズ,インコーポレイティド | テキストの回転角を決定する装置、方法及びコンピュータ可読記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JPH0797390B2 (ja) | 1995-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3139521B2 (ja) | 自動言語決定装置 | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
JP2004272798A (ja) | 画像読み取り装置 | |
IL98293A (en) | A method for distinguishing between text and graphics | |
JPS6254380A (ja) | 文字認識装置 | |
JPH0430070B2 (ja) | ||
JPH07230525A (ja) | 罫線認識方法及び表処理方法 | |
JP2000029983A (ja) | 文書読取装置 | |
CN112861794A (zh) | 一种光学印刷文本和场景文本的通用检测算法 | |
JPH0548510B2 (ja) | ||
JPH0564396B2 (ja) | ||
JPS61235990A (ja) | 文字認識装置 | |
JPH0728935A (ja) | 文書画像処理装置 | |
JPS6227887A (ja) | 文字種分離方式 | |
JPH10171924A (ja) | 文字認識装置 | |
JPH07160810A (ja) | 文字認識装置 | |
JPH02230484A (ja) | 文字認識装置 | |
JPH01137385A (ja) | 文字認識装置 | |
JP3199033B2 (ja) | 光学式文字読取方法、及び光学式文字読取装置 | |
JPS62169287A (ja) | 記載文字形態判別方式 | |
JPH0436432B2 (ja) | ||
JPH0728934A (ja) | 文書画像処理装置 | |
JPH05282487A (ja) | 文字認識装置 | |
JP2002230481A (ja) | 光学式文字読取装置 | |
Rait et al. | Automatic Language-Independent Indexing of Documents Using Image Processing |