JPH0646421B2 - 文字読取方式 - Google Patents
文字読取方式Info
- Publication number
- JPH0646421B2 JPH0646421B2 JP61181611A JP18161186A JPH0646421B2 JP H0646421 B2 JPH0646421 B2 JP H0646421B2 JP 61181611 A JP61181611 A JP 61181611A JP 18161186 A JP18161186 A JP 18161186A JP H0646421 B2 JPH0646421 B2 JP H0646421B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- standard pattern
- characters
- read
- reading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は文字読取方式、特に住所読取等の特定分野にお
いて、文字読取速度及び文字読取精度を向上させること
を目的とする文字読取方式に係わる。
いて、文字読取速度及び文字読取精度を向上させること
を目的とする文字読取方式に係わる。
(従来の技術) 従来、印字あるいは手書き文字を光学的に読取る装置
(以下、OCRと呼ぶ)において、英数字及びカタカナ
を対象とするものはすでに実用化されており、最近で
は、手書き漢字を読取ることも実用化されつつある。従
来のOCRを用いて文字を読取る場合、文字読取対象文
字数が増加すると、各文字毎に文字読取りのための標準
パタンを用意する必要があり、文字読取り速度が低下す
る問題点がある。また、手書き漢字のような複雑な字形
で且つ字形の変動が大きい場合には、入力文字イメージ
からの特微量抽出処理、更には読取対象文字毎に用意さ
れる標準パタンの量が増加するため、1文字当りの処理
時間が増加する。次に、手書き漢字のように複雑な字形
を有し且つ字形の変動が大きく、文字数が多い場合に
は、一般に文字読取りが通常の英数字に比べて容易では
なく、文字読取率が低下する傾向を示す。そこで、文字
読取率の向上を目的として、例えば、第31回情報処理
学会全国大会(2N−7,pp.1091〜1092)
に示されているように単語辞書を用いて文字読取結果を
修正する方式や、例えば、電子通信学会パタン認識と学
習研究会(PRL81−105)に示されているよう
に、文字の連接情報を用いて文字読取り結果を修正する
方式が提案されている。しかし、このような従来の文脈
処理方式は、文字読取りが終了した段階で、新たに後処
理方式として追加されるため、文字読取速度の向上を期
待することが困難となる。
(以下、OCRと呼ぶ)において、英数字及びカタカナ
を対象とするものはすでに実用化されており、最近で
は、手書き漢字を読取ることも実用化されつつある。従
来のOCRを用いて文字を読取る場合、文字読取対象文
字数が増加すると、各文字毎に文字読取りのための標準
パタンを用意する必要があり、文字読取り速度が低下す
る問題点がある。また、手書き漢字のような複雑な字形
で且つ字形の変動が大きい場合には、入力文字イメージ
からの特微量抽出処理、更には読取対象文字毎に用意さ
れる標準パタンの量が増加するため、1文字当りの処理
時間が増加する。次に、手書き漢字のように複雑な字形
を有し且つ字形の変動が大きく、文字数が多い場合に
は、一般に文字読取りが通常の英数字に比べて容易では
なく、文字読取率が低下する傾向を示す。そこで、文字
読取率の向上を目的として、例えば、第31回情報処理
学会全国大会(2N−7,pp.1091〜1092)
に示されているように単語辞書を用いて文字読取結果を
修正する方式や、例えば、電子通信学会パタン認識と学
習研究会(PRL81−105)に示されているよう
に、文字の連接情報を用いて文字読取り結果を修正する
方式が提案されている。しかし、このような従来の文脈
処理方式は、文字読取りが終了した段階で、新たに後処
理方式として追加されるため、文字読取速度の向上を期
待することが困難となる。
(発明が解決しようとする問題点) 従来のOCR技術を用いて手書き漢字まで含めて文字読
取りを行う場合、文字読取り速度が低下する問題点があ
つた。また、従来、文字読取率を向上させることを目的
とし、住所等の特定分野では、文脈情報を利用する文字
読取りの後処理方式があるが、文字読取り終了後に追加
されるため、文字読取り速度を向上させることが困難で
あつた。
取りを行う場合、文字読取り速度が低下する問題点があ
つた。また、従来、文字読取率を向上させることを目的
とし、住所等の特定分野では、文脈情報を利用する文字
読取りの後処理方式があるが、文字読取り終了後に追加
されるため、文字読取り速度を向上させることが困難で
あつた。
本発明の目的は、上記従来の問題点を解決すべく、予め
定められた所定方向の文脈情報を文字読取実行以前に利
用できるようにすることによつて、文字読取り速度及び
文字読取精度の向上をはかるようにした文字読取方式を
提供することにある。
定められた所定方向の文脈情報を文字読取実行以前に利
用できるようにすることによつて、文字読取り速度及び
文字読取精度の向上をはかるようにした文字読取方式を
提供することにある。
(問題点を解決するための手段) 前述の問題点を解決するために本発明が提供する手段
は、紙面上に記載された文字行を走査し、1文字毎に切
り出された文字イメージを予め記憶された読取対象文字
の標準パタンと照合し、文字イメージを所定の文字に識
別する文字読取方式であつて、読取対象文字の所定方向
に隣接可能な複数個の文字及びその標準パタン格納位置
を記憶する標準パタン索引テーブルと、選択された標準
パタン群と文字イメージとを照合し、複数個の候補文字
を得る文字識別手段と、この文字識別手段より得られる
複数個の候補文字を検索キーとして標準パタン索引テー
ブルを参照し、次に読取るべき文字イメージと照合可能
な標準パタン群を選択する標準パタン選択手段とを具備
することを特徴とするものである。
は、紙面上に記載された文字行を走査し、1文字毎に切
り出された文字イメージを予め記憶された読取対象文字
の標準パタンと照合し、文字イメージを所定の文字に識
別する文字読取方式であつて、読取対象文字の所定方向
に隣接可能な複数個の文字及びその標準パタン格納位置
を記憶する標準パタン索引テーブルと、選択された標準
パタン群と文字イメージとを照合し、複数個の候補文字
を得る文字識別手段と、この文字識別手段より得られる
複数個の候補文字を検索キーとして標準パタン索引テー
ブルを参照し、次に読取るべき文字イメージと照合可能
な標準パタン群を選択する標準パタン選択手段とを具備
することを特徴とするものである。
(作用) 本発明において、読取文字の所定方向(順方向あるいは
逆方向)に隣接可能な複数個の文字及びそれぞれの文字
の標準パタン格納位置を記憶した標準パタン索引テーブ
ルを用いることにより、文字読取りの実行以前に文脈情
報を用いて照合すべき文字数を制限することが可能とな
る。
逆方向)に隣接可能な複数個の文字及びそれぞれの文字
の標準パタン格納位置を記憶した標準パタン索引テーブ
ルを用いることにより、文字読取りの実行以前に文脈情
報を用いて照合すべき文字数を制限することが可能とな
る。
(実施例) 以下本発明における実施例について図面を参照しつつ説
明する。
明する。
図1は、住所読取を対象とし、文字読取動作を行う以前
に隣接文字間の連接情報を用いる本発明方式を説明する
ための一例を示す図である。図において、図1(a)は手
書きで書かれた文字行イメージであり、図中実線で通常
の文字分離装置を用いて1文字単位に切り出されること
を示している。図1(b)は、図1(a)で示した文字行イメ
ージに対する文字読取結果を示している。図1(c)は、
標準パタン索引テーブルの一例を示しており、図中左端
の文字は検査キーを示し、更に検索キーに対して文字行
の順方向に見て連接可能な複数個の文字及びその文字に
対する文字読取りのための標準パタンが格納された認識
用辞書へのポインタを示している。
に隣接文字間の連接情報を用いる本発明方式を説明する
ための一例を示す図である。図において、図1(a)は手
書きで書かれた文字行イメージであり、図中実線で通常
の文字分離装置を用いて1文字単位に切り出されること
を示している。図1(b)は、図1(a)で示した文字行イメ
ージに対する文字読取結果を示している。図1(c)は、
標準パタン索引テーブルの一例を示しており、図中左端
の文字は検査キーを示し、更に検索キーに対して文字行
の順方向に見て連接可能な複数個の文字及びその文字に
対する文字読取りのための標準パタンが格納された認識
用辞書へのポインタを示している。
尚、本実施例では、図1(c)で示した標準パタン索引テ
ーブルの構成として、文字行の順方向から見た場合につ
いて説明するが、文字行の逆方向に見て連接可能な前述
した情報を用い、文字行を逆方向から順次認識すること
も可能であることは言うまでもない。また、文字行を順
方向及び逆方向の両方向から順次認識することも可能で
あることは言うまでもない。
ーブルの構成として、文字行の順方向から見た場合につ
いて説明するが、文字行の逆方向に見て連接可能な前述
した情報を用い、文字行を逆方向から順次認識すること
も可能であることは言うまでもない。また、文字行を順
方向及び逆方向の両方向から順次認識することも可能で
あることは言うまでもない。
図1(d)は、文字読取を行うために予め用意される認識
辞書の一例を示しており、認識辞書は、読取対象となる
文字とそのエントリーアドレスPi(但し、i=1,
2,3…)に対して標準パタンi(但し、i=1,2
…)を記憶する。標準パタンは、通常の文字認識装置で
使用されるものであり、図1(a)で示したような文字イ
メージから特徴抽出処理を施し、読取対象文字について
予め、特徴抽出処理によつて得られる特微量を標準パタ
ンとして記憶される。尚、標準パタンの生成は公知の技
術である。
辞書の一例を示しており、認識辞書は、読取対象となる
文字とそのエントリーアドレスPi(但し、i=1,
2,3…)に対して標準パタンi(但し、i=1,2
…)を記憶する。標準パタンは、通常の文字認識装置で
使用されるものであり、図1(a)で示したような文字イ
メージから特徴抽出処理を施し、読取対象文字について
予め、特徴抽出処理によつて得られる特微量を標準パタ
ンとして記憶される。尚、標準パタンの生成は公知の技
術である。
最初に、文字イメージ“川”に対して文字読取が実行さ
れる。そこで、文字イメージ“川”を読取る以前に文字
読取が行われていないため、認識辞書の読取対象すべて
の文字と照合される。そこで、例えば、図1(b)で示し
たように、文字“川”,“小”の2つの候補が従来の文
字識別手段によつて得られたとする。次に、文字イメー
ジ“崎”について文字読取が行われる。この時、文字イ
メージ“崎”の1つの前の文字イメージ“川”に対して
2つの候補文字“川”,“小”が得られているため、候
補文字“川”,“小”を検索キーとして標準パタン索引
テーブルにより読取対象文字“田”,“和”,“崎”,
…が選択され、ポインターp1,p2,p3…を用いて標
準パタン1,2,3…のみと文字イメージ“崎”が照合
される。即ち、不必要な文字との照合を回避し、照合回
数を減少させることができる。ここで、文字イメージ
“崎”に対して、文字識別の結果、文字読取不能(図中
?)と判定されたとすると、次に、読取るべき文字イメ
ージ“市”に対しては、検索キーとして“?”が与えら
れるため、すべての読取対象文字との照合が行われるこ
とになる。以下、同様にして、文字イメージ“官”に対
しては、文字“宮”,“菅”…の標準パタン4,5,…
のみが、文字イメージ“前”に対しては、文字“前”,
“崎”,…の標準パタン7,3…のみが、文字イメージ
“区”に対しては、文字“区”,“通”…の標準パタン
8,9…のみが照合されることになる。
れる。そこで、文字イメージ“川”を読取る以前に文字
読取が行われていないため、認識辞書の読取対象すべて
の文字と照合される。そこで、例えば、図1(b)で示し
たように、文字“川”,“小”の2つの候補が従来の文
字識別手段によつて得られたとする。次に、文字イメー
ジ“崎”について文字読取が行われる。この時、文字イ
メージ“崎”の1つの前の文字イメージ“川”に対して
2つの候補文字“川”,“小”が得られているため、候
補文字“川”,“小”を検索キーとして標準パタン索引
テーブルにより読取対象文字“田”,“和”,“崎”,
…が選択され、ポインターp1,p2,p3…を用いて標
準パタン1,2,3…のみと文字イメージ“崎”が照合
される。即ち、不必要な文字との照合を回避し、照合回
数を減少させることができる。ここで、文字イメージ
“崎”に対して、文字識別の結果、文字読取不能(図中
?)と判定されたとすると、次に、読取るべき文字イメ
ージ“市”に対しては、検索キーとして“?”が与えら
れるため、すべての読取対象文字との照合が行われるこ
とになる。以下、同様にして、文字イメージ“官”に対
しては、文字“宮”,“菅”…の標準パタン4,5,…
のみが、文字イメージ“前”に対しては、文字“前”,
“崎”,…の標準パタン7,3…のみが、文字イメージ
“区”に対しては、文字“区”,“通”…の標準パタン
8,9…のみが照合されることになる。
図2は本発明の一実施例を示す論理ブロツク図である。
図において、1は行イメージ記憶部であり、図1(a)で
示した文字行イメージを記憶する。尚、紙面上から前述
した文字行イメージを検出する技術は公知の技術を用い
て行うことができる。2は、文字分離部であり、文字行
イメージを1文字毎に切り出し、順次文字イメージ記憶
部3に格納される。4は、特徴抽出部であり、文字イメ
ージ記憶部3より読取るべき文字イメージを読出し、特
徴抽出処理が行われる。5は、文字識別部であり、特徴
抽出部4において読取るべき文字イメージの特徴量と、
認識辞書10より順次読出した読取り対象文字の標準パ
タンと照合し、読取るべき文字イメージの読取り結果を
出力する。尚、文字分離部2、特徴抽出部4、文字識別
部5は公知の技術を用いて実現することができる。
図において、1は行イメージ記憶部であり、図1(a)で
示した文字行イメージを記憶する。尚、紙面上から前述
した文字行イメージを検出する技術は公知の技術を用い
て行うことができる。2は、文字分離部であり、文字行
イメージを1文字毎に切り出し、順次文字イメージ記憶
部3に格納される。4は、特徴抽出部であり、文字イメ
ージ記憶部3より読取るべき文字イメージを読出し、特
徴抽出処理が行われる。5は、文字識別部であり、特徴
抽出部4において読取るべき文字イメージの特徴量と、
認識辞書10より順次読出した読取り対象文字の標準パ
タンと照合し、読取るべき文字イメージの読取り結果を
出力する。尚、文字分離部2、特徴抽出部4、文字識別
部5は公知の技術を用いて実現することができる。
7は、検索キー記憶部であり、初期値として読取不能文
字?が検索キーとして記憶されているとする。最初に、
制御部(図中省略)は、文字イメージ記憶部3から読取
るべき文字イメージを特徴抽出部4に転送すると、検索
キー記憶部7に格納されている複数個の検査キーを用い
て標準パタン索引テーブル8から図1で示したように、
文字イメージ記憶部3から読出した文字イメージに対
し、照合すべき文字群を照合文字記憶部9に格納する。
次に、照合文字記憶部9より照合すべき文字群における
複数個の標準パタンが取り出され、文字識別部5へ転送
される。尚、標準パタン索引テーブル8において検索キ
ーが読取り不能文字?であれば、文字識別部6へは、認
識辞書10から照合すべき可能な標準パタンがすべて送
られる。
字?が検索キーとして記憶されているとする。最初に、
制御部(図中省略)は、文字イメージ記憶部3から読取
るべき文字イメージを特徴抽出部4に転送すると、検索
キー記憶部7に格納されている複数個の検査キーを用い
て標準パタン索引テーブル8から図1で示したように、
文字イメージ記憶部3から読出した文字イメージに対
し、照合すべき文字群を照合文字記憶部9に格納する。
次に、照合文字記憶部9より照合すべき文字群における
複数個の標準パタンが取り出され、文字識別部5へ転送
される。尚、標準パタン索引テーブル8において検索キ
ーが読取り不能文字?であれば、文字識別部6へは、認
識辞書10から照合すべき可能な標準パタンがすべて送
られる。
次に、文字識別部5において、特徴抽出部4より転送さ
れた読取るべき文字イメージの特徴量と認識辞書10よ
り転送された複数個の標準パタンと照合される。その結
果、文字イメージの読取り結果として、1個ないし複数
個の候補文字が出力され、読取結果記憶部6及び検索キ
ー記憶部7にそれぞれ格納される。以上の動作が文字イ
メージ記憶部3に格納されたすべての文字イメージに対
して行われ、読取結果記憶部6に順次格納される。
れた読取るべき文字イメージの特徴量と認識辞書10よ
り転送された複数個の標準パタンと照合される。その結
果、文字イメージの読取り結果として、1個ないし複数
個の候補文字が出力され、読取結果記憶部6及び検索キ
ー記憶部7にそれぞれ格納される。以上の動作が文字イ
メージ記憶部3に格納されたすべての文字イメージに対
して行われ、読取結果記憶部6に順次格納される。
(発明の効果) 以上説明したように、本発明を適用することにより、文
字読取速度を向上させ、しかも文字読取精度を向上する
ことができる文字読取方式を提供することが可能とな
る。本発明方式を採用すれば、郵便物の宛名のように文
字行内の名文字がわかち書きされていない場合にも、精
度よく高速に文字を読み取ることができる。
字読取速度を向上させ、しかも文字読取精度を向上する
ことができる文字読取方式を提供することが可能とな
る。本発明方式を採用すれば、郵便物の宛名のように文
字行内の名文字がわかち書きされていない場合にも、精
度よく高速に文字を読み取ることができる。
図1は文字読取動作を行う以前に文字間の連接情報を用
いる本発明方式の原理を説明する図である。図2は本発
明の一実施例を示す論理ブロツク図である。図におい
て、1は行イメージ記憶部、2は文字分離部、3は文字
イメージ記憶部、4は特徴抽出部、5は文字識別部、6
は読取結果記憶部、7は検索キー記憶部、8は標準パタ
ン索引テーブル、9は照合文字記憶部、10は認識辞書
である。
いる本発明方式の原理を説明する図である。図2は本発
明の一実施例を示す論理ブロツク図である。図におい
て、1は行イメージ記憶部、2は文字分離部、3は文字
イメージ記憶部、4は特徴抽出部、5は文字識別部、6
は読取結果記憶部、7は検索キー記憶部、8は標準パタ
ン索引テーブル、9は照合文字記憶部、10は認識辞書
である。
Claims (1)
- 【請求項1】紙面上に記載された文字行を走査し、1文
字毎に切り出された文字イメージを予め記憶された読取
対象文字の標準パタンと照合し、前記文字イメージを所
定の文字に識別する文字読取方式において、読取対象文
字の所定方向に隣接可能な複数個の文字及びこれら複数
個の文字の標準パタン格納位置を記憶する標準パタン索
引テーブルと、選択された標準パタン群と前記文字イメ
ージとを照合し、前記文字イメージの複数個の候補文字
を得る文字識別手段と、この文字識別手段より得られる
複数個の候補文字を検索キーとして前記標準パタン索引
テーブルを参照し、次に読取るべき前記文字イメージと
照合可能な前記標準パタン群を選択する標準パタン選択
手段とを具備することを特徴とする文字読取方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61181611A JPH0646421B2 (ja) | 1986-07-31 | 1986-07-31 | 文字読取方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61181611A JPH0646421B2 (ja) | 1986-07-31 | 1986-07-31 | 文字読取方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6336487A JPS6336487A (ja) | 1988-02-17 |
JPH0646421B2 true JPH0646421B2 (ja) | 1994-06-15 |
Family
ID=16103829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61181611A Expired - Lifetime JPH0646421B2 (ja) | 1986-07-31 | 1986-07-31 | 文字読取方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0646421B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60181742A (ja) * | 1984-02-29 | 1985-09-17 | Konishiroku Photo Ind Co Ltd | 熱現像カラ−感光材料 |
JP3579157B2 (ja) * | 1995-11-30 | 2004-10-20 | 富士写真フイルム株式会社 | カラー拡散転写型ハロゲン化銀写真感光材料および画像形成方法 |
-
1986
- 1986-07-31 JP JP61181611A patent/JPH0646421B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS6336487A (ja) | 1988-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100292098B1 (ko) | 문자 인식 장치 및 방법 | |
JP3842006B2 (ja) | 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Clausner et al. | Icfhr 2018 competition on recognition of historical arabic scientific manuscripts–rasm2018 | |
JPH03161891A (ja) | 表形式文書読取装置 | |
Romeo-Pakker et al. | A new approach for Latin/Arabic character segmentation | |
JPS63182793A (ja) | 文字切り出し方式 | |
JP2008225695A (ja) | 文字認識誤り修正装置およびプログラム | |
JPH0821057B2 (ja) | 文書画像解析方式 | |
JPH0646421B2 (ja) | 文字読取方式 | |
JPH09161013A (ja) | 文字読取り方法及び住所読取り方法 | |
JPH0991371A (ja) | 文字表示装置 | |
JPH0247788B2 (ja) | ||
JPH0149998B2 (ja) | ||
JP2746345B2 (ja) | 文字認識の後処理方法 | |
JPH06274551A (ja) | 画像ファイリング装置 | |
JP2570703B2 (ja) | 文字読取装置 | |
JPH0646422B2 (ja) | 文字読取方式 | |
JP3151866B2 (ja) | 英文字認識方法 | |
JP2685257B2 (ja) | 認識方法 | |
JPH06111079A (ja) | 単語読み取り装置 | |
JPH05189606A (ja) | 文字列領域検出方法 | |
JPH05324610A (ja) | 住所表記漢字入力装置 | |
JP2000099631A (ja) | パターン認識装置及びパターン認識方法 | |
JPS63188284A (ja) | 文字読取装置 | |
JPH10105645A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |