JPH06208649A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH06208649A JPH06208649A JP5019268A JP1926893A JPH06208649A JP H06208649 A JPH06208649 A JP H06208649A JP 5019268 A JP5019268 A JP 5019268A JP 1926893 A JP1926893 A JP 1926893A JP H06208649 A JPH06208649 A JP H06208649A
- Authority
- JP
- Japan
- Prior art keywords
- character
- typeface
- processing
- pattern
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 画像である文字パターンを効率良く正確にそ
の書体を識別することを可能にする文字認識装置を提供
することを目的とする。 【構成】 本発明である文字認識装置は、認識すべき画
像である文字パターンを認識する文字認識処理部6と、
前記文字パターンの文字線の幅を2方向以上から推定す
る文字線幅推定処理部7と前記文字線幅推定処理部7に
より推定された文字線の幅を比較する文字線幅比較処理
部8とからなり前記文字線幅比較処理部8により比較さ
れた結果を用いて前記文字パターンの書体を識別する書
体識別処理部9とから構成される。
の書体を識別することを可能にする文字認識装置を提供
することを目的とする。 【構成】 本発明である文字認識装置は、認識すべき画
像である文字パターンを認識する文字認識処理部6と、
前記文字パターンの文字線の幅を2方向以上から推定す
る文字線幅推定処理部7と前記文字線幅推定処理部7に
より推定された文字線の幅を比較する文字線幅比較処理
部8とからなり前記文字線幅比較処理部8により比較さ
れた結果を用いて前記文字パターンの書体を識別する書
体識別処理部9とから構成される。
Description
【0001】
【産業上の利用分野】本発明は、文字パターンを認識す
る文字認識装置に係り、特に入力文字の書体を識別し
て、その識別結果を出力する文字認識装置に関する。
る文字認識装置に係り、特に入力文字の書体を識別し
て、その識別結果を出力する文字認識装置に関する。
【0002】
【従来の技術】従来、文字認識装置は入力画像中の文字
パターンを認識して、その文字コードを出力することは
可能であるが、文字属性のひとつである書体を識別し
て、その結果を出力することは困難であった。
パターンを認識して、その文字コードを出力することは
可能であるが、文字属性のひとつである書体を識別し
て、その結果を出力することは困難であった。
【0003】英文文字のイタリック体とイタリック体以
外である明朝体やゴシック体とを識別する手法が特開平
03−278290に記載されているが、その手法でア
ルファベット、数字、記号以外の文字、つまり、ひらが
な。カタカナ、漢字等(以下、和文文字ともいう)の明
朝体とゴシック体とを正確に識別することは難しい。
外である明朝体やゴシック体とを識別する手法が特開平
03−278290に記載されているが、その手法でア
ルファベット、数字、記号以外の文字、つまり、ひらが
な。カタカナ、漢字等(以下、和文文字ともいう)の明
朝体とゴシック体とを正確に識別することは難しい。
【0004】また、書体の識別を自動化する際に、全て
の文字について書体の識別処理を行うと、従来の文字認
識装置と比較して、処理時間が増大することが予想され
る。
の文字について書体の識別処理を行うと、従来の文字認
識装置と比較して、処理時間が増大することが予想され
る。
【0005】
【発明が解決しようとする課題】しかし、従来の装置で
は、特に和文文字において、入力した文字パターンと、
文字コード及び書体が同じ文字を得たい場合には、認識
結果として出力された文字に対し、操作者が書体を指定
し、変更する作業を行う必要があるため、操作者に負担
がかかるという問題点があった。
は、特に和文文字において、入力した文字パターンと、
文字コード及び書体が同じ文字を得たい場合には、認識
結果として出力された文字に対し、操作者が書体を指定
し、変更する作業を行う必要があるため、操作者に負担
がかかるという問題点があった。
【0006】また、書体の識別を自動化する際に、全て
の文字について書体の識別処理を行うと、従来の文字認
識装置と比較して、処理時間が増大するという問題点が
あった。
の文字について書体の識別処理を行うと、従来の文字認
識装置と比較して、処理時間が増大するという問題点が
あった。
【0007】本発明は、上記の問題点を解決し、和文文
字が入力された場合でも効率良く画像である文字パター
ンの書体を識別して出力することを可能にする文字認識
装置を提供することを課題とする。
字が入力された場合でも効率良く画像である文字パター
ンの書体を識別して出力することを可能にする文字認識
装置を提供することを課題とする。
【0008】
【課題を解決するための手段】本発明は、請求項1に記
載の発明においては、認識すべき画像である文字パター
ンを認識する文字認識手段と、前記文字パターンの文字
線の幅を2方向以上から推定する文字線幅推定手段と、
前記文字線幅推定手段により推定された文字線の幅によ
り前記文字パターンの書体を識別する書体識別処理手段
とを有することを特徴とするものである。
載の発明においては、認識すべき画像である文字パター
ンを認識する文字認識手段と、前記文字パターンの文字
線の幅を2方向以上から推定する文字線幅推定手段と、
前記文字線幅推定手段により推定された文字線の幅によ
り前記文字パターンの書体を識別する書体識別処理手段
とを有することを特徴とするものである。
【0009】本発明は、請求項2に記載の発明において
は、認識すべき画像である文字パターンを認識する文字
認識手段と、前記文字パターンの書体を識別し書体を識
別できなかった前記文字パターンに対しては不定とする
第1の書体識別処理手段と、前記第1の書体識別処理手
段により不定となった前記文字パターンの書体を既に書
体を識別できた文字パターンの書体を用いて識別する第
2の書体識別処理手段とを有することを特徴とするもの
である。
は、認識すべき画像である文字パターンを認識する文字
認識手段と、前記文字パターンの書体を識別し書体を識
別できなかった前記文字パターンに対しては不定とする
第1の書体識別処理手段と、前記第1の書体識別処理手
段により不定となった前記文字パターンの書体を既に書
体を識別できた文字パターンの書体を用いて識別する第
2の書体識別処理手段とを有することを特徴とするもの
である。
【0010】本発明は、請求項3に記載の発明において
は、認識すべき画像である文字パターンを認識する文字
認識手段と、前記文字認識手段により認識された結果に
基づいて書体識別を行う書体識別手段とを有することを
特徴とするものである。
は、認識すべき画像である文字パターンを認識する文字
認識手段と、前記文字認識手段により認識された結果に
基づいて書体識別を行う書体識別手段とを有することを
特徴とするものである。
【0011】本発明は、請求項4に記載の発明において
は、認識すべき画像である文字パターンを認識する文字
認識処理手段と、予め書体を識別する処理対象となる文
字を登録している処理対象登録手段と、前記文字認識処
理手段により認識された文字を前記処理対象登録手段に
登録されている文字から検索し登録されている場合は書
体の識別を行う書体識別処理手段とを有することを特徴
とするものである。
は、認識すべき画像である文字パターンを認識する文字
認識処理手段と、予め書体を識別する処理対象となる文
字を登録している処理対象登録手段と、前記文字認識処
理手段により認識された文字を前記処理対象登録手段に
登録されている文字から検索し登録されている場合は書
体の識別を行う書体識別処理手段とを有することを特徴
とするものである。
【0012】本発明は、請求項5に記載の発明において
は、認識すべき画像である文字パターンを認識する文字
認識処理手段と、予め書体を識別する処理対象となる文
字とその文字に対する書体を識別するための処理方法を
登録している処理対象/処理登録手段と、前記文字認識
処理手段により認識された文字を前記処理対象登録手段
に登録されている文字から検索し登録されている場合は
その文字に対する前記処理対象登録手段に登録されてい
る書体を識別するための処理方法により書体の識別を行
う書体識別処理手段とを有することを特徴とするもので
ある。
は、認識すべき画像である文字パターンを認識する文字
認識処理手段と、予め書体を識別する処理対象となる文
字とその文字に対する書体を識別するための処理方法を
登録している処理対象/処理登録手段と、前記文字認識
処理手段により認識された文字を前記処理対象登録手段
に登録されている文字から検索し登録されている場合は
その文字に対する前記処理対象登録手段に登録されてい
る書体を識別するための処理方法により書体の識別を行
う書体識別処理手段とを有することを特徴とするもので
ある。
【0013】
【作用】請求項1に記載の発明によれば、明朝体の文字
は縦方向の文字線の幅よりも横方向の文字線の幅の方が
細く、ゴシック体はほぼ同じ幅である、という書体特有
の特徴があることを利用しており、この特徴の違いに着
目し、文字パターンの縦方向の文字線の幅と横方向の文
字線の幅を各々推定して比較することにより、文字の書
体である明朝体とゴシック体等を識別することを可能と
する。
は縦方向の文字線の幅よりも横方向の文字線の幅の方が
細く、ゴシック体はほぼ同じ幅である、という書体特有
の特徴があることを利用しており、この特徴の違いに着
目し、文字パターンの縦方向の文字線の幅と横方向の文
字線の幅を各々推定して比較することにより、文字の書
体である明朝体とゴシック体等を識別することを可能と
する。
【0014】請求項2に記載の発明によれば、第1の書
体識別手段により対象文字の書体を識別する際に、その
書体の特徴が明確でないためその文字の書体が識別でき
なかった場合でも、第2の書体識別手段により既に書体
を識別できた文字の書体を用いて識別するので、第1の
書体識別手段により識別できなかった文字の書体も識別
することが可能となる。
体識別手段により対象文字の書体を識別する際に、その
書体の特徴が明確でないためその文字の書体が識別でき
なかった場合でも、第2の書体識別手段により既に書体
を識別できた文字の書体を用いて識別するので、第1の
書体識別手段により識別できなかった文字の書体も識別
することが可能となる。
【0015】請求項3に記載の発明によれば、文字認識
を行った後、その文字認識結果を利用して書体の識別を
行うので、効率良く文字の書体を識別することが可能と
なる。
を行った後、その文字認識結果を利用して書体の識別を
行うので、効率良く文字の書体を識別することが可能と
なる。
【0016】請求項4に記載の発明によれば、文字認識
手段により文字認識を行い、その文字認識結果が処理対
象登録手段により登録されている場合に、その文字に対
してのみ書体識別を行うので、対象としている全ての文
字について書体識別を行うことがなくなり、効率良く文
字の書体を識別することが可能となる。
手段により文字認識を行い、その文字認識結果が処理対
象登録手段により登録されている場合に、その文字に対
してのみ書体識別を行うので、対象としている全ての文
字について書体識別を行うことがなくなり、効率良く文
字の書体を識別することが可能となる。
【0017】請求項5に記載の発明によれば、文字認識
手段により文字認識を行い、その文字認識結果が処理対
象/処理登録手段により登録されている処理対象文字の
場合に、その文字に対して前記処理対象/処理登録手段
に登録されている処理方法により書体識別を行うので、
対象としている全ての文字について書体識別を行うこと
がなくなり、また、文字に合わせた処理方法により書体
識別を行うことによって、効率良く正確に文字の書体を
識別することが可能となる。また、請求項4、5に記載
の発明は、文書の一部分のみが、他の大部分と異なった
書体を使用することがあり、この場合、他の大部分と異
なった書体とする文字は、ある程度の文字種に限られて
いることが多いことを利用している。
手段により文字認識を行い、その文字認識結果が処理対
象/処理登録手段により登録されている処理対象文字の
場合に、その文字に対して前記処理対象/処理登録手段
に登録されている処理方法により書体識別を行うので、
対象としている全ての文字について書体識別を行うこと
がなくなり、また、文字に合わせた処理方法により書体
識別を行うことによって、効率良く正確に文字の書体を
識別することが可能となる。また、請求項4、5に記載
の発明は、文書の一部分のみが、他の大部分と異なった
書体を使用することがあり、この場合、他の大部分と異
なった書体とする文字は、ある程度の文字種に限られて
いることが多いことを利用している。
【0018】
【実施例】図1は本発明の1実施例による文字認識装置
の構成を示すブロック図である。この文字認識装置は、
文書を2値画像として読み込む画像入力装置1と、文字
認識装置全体の制御を行う制御装置2と、画像入力装置
1が入力した画像及び文字認識処理部6で行われた認識
の結果等を記憶するメモリ3と、コマンド等を操作者が
入力する入力装置4と、文書画像中から文字列及び文字
パターンを切り出す文字列/文字切り出し処理部5と、
前記文字列/文字切り出し処理部5により切り出された
文字パターンを認識する文字認識処理部6と、前記文字
列/文字切り出し処理部5により切り出された文字パタ
ーンの縦方向及び横方向の文字線の幅を推定する文字線
幅推定処理部7と前記文字線幅推定処理部7により推定
された縦方向の文字線の幅と横方向の文字線の幅を比較
する文字線幅比較処理部8とからなる書体識別処理部9
と、書体識別処理を実行する文字を予め登録しておき、
前記文字認識処理部6に認識された結果である文字と比
較してどのような書体識別処理を実行するかを予め登録
している処理対象/処理登録部10とから構成される。
画像入力装置1は、具体的には、紙の文書を入力するた
めのスキャナー、文書を画像として記憶している記憶装
置から読み出す装置、又は通信回線を通して遠隔地から
でも画像の通信ができる装置等が含まれる。入力装置4
は、具体的には、キーボード、マウス、デジタイザなど
があり、操作者の意思を文字認識装置に伝えるための装
置である。
の構成を示すブロック図である。この文字認識装置は、
文書を2値画像として読み込む画像入力装置1と、文字
認識装置全体の制御を行う制御装置2と、画像入力装置
1が入力した画像及び文字認識処理部6で行われた認識
の結果等を記憶するメモリ3と、コマンド等を操作者が
入力する入力装置4と、文書画像中から文字列及び文字
パターンを切り出す文字列/文字切り出し処理部5と、
前記文字列/文字切り出し処理部5により切り出された
文字パターンを認識する文字認識処理部6と、前記文字
列/文字切り出し処理部5により切り出された文字パタ
ーンの縦方向及び横方向の文字線の幅を推定する文字線
幅推定処理部7と前記文字線幅推定処理部7により推定
された縦方向の文字線の幅と横方向の文字線の幅を比較
する文字線幅比較処理部8とからなる書体識別処理部9
と、書体識別処理を実行する文字を予め登録しておき、
前記文字認識処理部6に認識された結果である文字と比
較してどのような書体識別処理を実行するかを予め登録
している処理対象/処理登録部10とから構成される。
画像入力装置1は、具体的には、紙の文書を入力するた
めのスキャナー、文書を画像として記憶している記憶装
置から読み出す装置、又は通信回線を通して遠隔地から
でも画像の通信ができる装置等が含まれる。入力装置4
は、具体的には、キーボード、マウス、デジタイザなど
があり、操作者の意思を文字認識装置に伝えるための装
置である。
【0019】図1に示した文字認識装置は、操作者が入
力装置4から書体識別の指示を与えない場合には、従来
のように文字の認識だけを行い、文字認識結果である文
字コードを出力する。操作者が入力装置4から書体識別
の指示を与えた場合には、文字の認識と書体の識別を行
い、文字認識結果である文字コードと書体識別結果であ
る書体情報とを出力する。また、操作者の書体識別の指
示によらず、常に文字認識結果である文字コードと書体
識別結果である書体情報とを出力することも可能であ
る。
力装置4から書体識別の指示を与えない場合には、従来
のように文字の認識だけを行い、文字認識結果である文
字コードを出力する。操作者が入力装置4から書体識別
の指示を与えた場合には、文字の認識と書体の識別を行
い、文字認識結果である文字コードと書体識別結果であ
る書体情報とを出力する。また、操作者の書体識別の指
示によらず、常に文字認識結果である文字コードと書体
識別結果である書体情報とを出力することも可能であ
る。
【0020】本実施例では、第1に、全ての文字につい
て同一の処理で書体を識別する手法を図2のフローチャ
ートを用いて説明する。第2に、基調となる書体を推定
し、書体の識別が困難な文字については基調と推定した
書体を識別結果とする手法を図3のフローチャートを用
いて説明する。第3に、基調となる書体を推定し、処理
対象/処理登録部10に登録した文字が出現した場合は
その文字に対する書体識別方法により書体を識別し、そ
の際に基調と推定した書体をも識別結果とする手法を図
4のフローチャートを用いて説明する。
て同一の処理で書体を識別する手法を図2のフローチャ
ートを用いて説明する。第2に、基調となる書体を推定
し、書体の識別が困難な文字については基調と推定した
書体を識別結果とする手法を図3のフローチャートを用
いて説明する。第3に、基調となる書体を推定し、処理
対象/処理登録部10に登録した文字が出現した場合は
その文字に対する書体識別方法により書体を識別し、そ
の際に基調と推定した書体をも識別結果とする手法を図
4のフローチャートを用いて説明する。
【0021】まず、図2を用いて、全ての文字について
同一の処理で書体を識別する手法について述べる。
同一の処理で書体を識別する手法について述べる。
【0022】図2の処理ステップS201では、画像入
力装置1により、認識対象である原稿を画像情報として
本装置内のメモリ3に取り込む。
力装置1により、認識対象である原稿を画像情報として
本装置内のメモリ3に取り込む。
【0023】処理ステップS202、S203では、文
字列/文字切り出し処理部5及び文字認識処理部6によ
り、処理ステップS201で取り込んだ画像中の文字の
位置とその文字のコード情報を出力する。文字の位置を
得るための手法は「パターン認識」(64、65ペー
ジ、森健一監修、電子情報通信学会発行、1988年1
1月1日初版発行)に、文字コードを得るための手法は
特開平03−180989に記載されている。
字列/文字切り出し処理部5及び文字認識処理部6によ
り、処理ステップS201で取り込んだ画像中の文字の
位置とその文字のコード情報を出力する。文字の位置を
得るための手法は「パターン認識」(64、65ペー
ジ、森健一監修、電子情報通信学会発行、1988年1
1月1日初版発行)に、文字コードを得るための手法は
特開平03−180989に記載されている。
【0024】処理ステップS204では、ひとつの文字
列を特定するための変数iに1を設定する。文字列は昇
順に1番目、2番目と表し、各文字列について、以下の
処理ステップS205〜S213を1文書内の文字全て
について繰り返し行う。
列を特定するための変数iに1を設定する。文字列は昇
順に1番目、2番目と表し、各文字列について、以下の
処理ステップS205〜S213を1文書内の文字全て
について繰り返し行う。
【0025】処理ステップS205では、i番目の文字
列を取り出し、以降の処理対象とする。
列を取り出し、以降の処理対象とする。
【0026】処理ステップS206では、i番目の文字
列中の1つの文字を特定するための変数jに1を設定す
る。文字は、i番目の文字列中で昇順に1番目、2番目
と表し、各文字について、以下の処理ステップS207
〜S211を1文字列内の文字全てについて繰り返し行
う。
列中の1つの文字を特定するための変数jに1を設定す
る。文字は、i番目の文字列中で昇順に1番目、2番目
と表し、各文字について、以下の処理ステップS207
〜S211を1文字列内の文字全てについて繰り返し行
う。
【0027】処理ステップS207では、i番目の文字
列中のj番目の文字を取り出し、以降の処理対象とす
る。
列中のj番目の文字を取り出し、以降の処理対象とす
る。
【0028】処理ステップS208では、文字線幅推定
処理部7により、i番目の文字列中のj番目の文字の縦
方向及び横方向の文字線の幅を推定する。文字線の幅の
推定方法を、画素とその線幅を模式的に表した図5と、
文字画像の線幅の分布を模式的に表した図6を用いて、
述べる。文字画像の文字部を黒画素、背景部を白画素と
すると、図5において、水平方向に走査した場合の線幅
は、上段から順に、2、3、2となる。例えば、明朝体
の文字「中」に、このような操作を水平方向及び垂直方
向に対して行う。そして、各々水平方向及び垂直方向に
対して行った処理結果を、横軸を線幅、縦軸を頻度とし
たグラフに作成すると図6のようになる。同図におい
て、垂直方向に走査した場合の線幅のピーク値の最小の
値は文字の横方向の線幅を、水平方向に走査した場合の
線幅のピーク値の最小の値は縦方向の線幅をほぼ表して
いる。そこで、経験的に定めた文字線の幅の最大値を閾
値とし、垂直方向に走査した場合及び水平方向に走査し
た場合の、その閾値以下の線幅の各々の平均値をWv、
Whとする。つまり、Wvを文字の横方向の線幅、Wh
を文字の縦方向の線幅と推定する。
処理部7により、i番目の文字列中のj番目の文字の縦
方向及び横方向の文字線の幅を推定する。文字線の幅の
推定方法を、画素とその線幅を模式的に表した図5と、
文字画像の線幅の分布を模式的に表した図6を用いて、
述べる。文字画像の文字部を黒画素、背景部を白画素と
すると、図5において、水平方向に走査した場合の線幅
は、上段から順に、2、3、2となる。例えば、明朝体
の文字「中」に、このような操作を水平方向及び垂直方
向に対して行う。そして、各々水平方向及び垂直方向に
対して行った処理結果を、横軸を線幅、縦軸を頻度とし
たグラフに作成すると図6のようになる。同図におい
て、垂直方向に走査した場合の線幅のピーク値の最小の
値は文字の横方向の線幅を、水平方向に走査した場合の
線幅のピーク値の最小の値は縦方向の線幅をほぼ表して
いる。そこで、経験的に定めた文字線の幅の最大値を閾
値とし、垂直方向に走査した場合及び水平方向に走査し
た場合の、その閾値以下の線幅の各々の平均値をWv、
Whとする。つまり、Wvを文字の横方向の線幅、Wh
を文字の縦方向の線幅と推定する。
【0029】処理ステップS209では、文字線幅比較
処理部8により、着目した文字の書体が明朝体であるか
否かを次のように識別する。もし、 Wv×a<Wh (ただしaは経験的に求めた1以
上の定数) が成立すれば、文字の縦線の幅が横線の幅に比べて、あ
る程度太いことになり、この文字の書体は明朝体である
と識別できる。他の場合は、ゴシック体の書体であると
識別する。また、上記明朝体識別方法の他に、着目した
文字の書体がゴシック体であるか否かを次のように識別
することも可能である。もし、 |Wv−Wh|<b (ただしbは経験的に求めた
定数) が成立すれば、文字の縦線の幅と横線の幅とがほぼ同程
度であるので、この文字の書体はゴシック体であると識
別できる。他の場合は、明朝体の書体であると識別す
る。
処理部8により、着目した文字の書体が明朝体であるか
否かを次のように識別する。もし、 Wv×a<Wh (ただしaは経験的に求めた1以
上の定数) が成立すれば、文字の縦線の幅が横線の幅に比べて、あ
る程度太いことになり、この文字の書体は明朝体である
と識別できる。他の場合は、ゴシック体の書体であると
識別する。また、上記明朝体識別方法の他に、着目した
文字の書体がゴシック体であるか否かを次のように識別
することも可能である。もし、 |Wv−Wh|<b (ただしbは経験的に求めた
定数) が成立すれば、文字の縦線の幅と横線の幅とがほぼ同程
度であるので、この文字の書体はゴシック体であると識
別できる。他の場合は、明朝体の書体であると識別す
る。
【0030】処理ステップS210、S211では、i
番目の文字列内で、次の文字があれば、その次の文字に
対して同様の処理を行い、次の文字がなければ、i番目
の文字列内の文字に対しては全ての処理が終了したの
で、次の文字列(i+1番目の文字列)に対して同様の
処理を行うようにする。
番目の文字列内で、次の文字があれば、その次の文字に
対して同様の処理を行い、次の文字がなければ、i番目
の文字列内の文字に対しては全ての処理が終了したの
で、次の文字列(i+1番目の文字列)に対して同様の
処理を行うようにする。
【0031】処理ステップS212、S213では、次
の文字列があれば、次の文字列に対して同様の処理を行
い、次の文字列がなければ、対象としている文書内の全
ての文字に対して書体識別の処理が完了したことになる
ので、文字の認識結果と書体識別の結果をメモリ3に記
憶して、文字認識装置全体の処理を終了する。
の文字列があれば、次の文字列に対して同様の処理を行
い、次の文字列がなければ、対象としている文書内の全
ての文字に対して書体識別の処理が完了したことになる
ので、文字の認識結果と書体識別の結果をメモリ3に記
憶して、文字認識装置全体の処理を終了する。
【0032】次に、図3を用いて、基調となる書体を推
定し、書体の識別が困難な文字については基調と推定し
た書体を識別結果とする手法について述べる。多くの処
理は、前述の、全ての文字について同じように書体を識
別する手法の場合と同様であるので、主に、異なる部分
について述べる。
定し、書体の識別が困難な文字については基調と推定し
た書体を識別結果とする手法について述べる。多くの処
理は、前述の、全ての文字について同じように書体を識
別する手法の場合と同様であるので、主に、異なる部分
について述べる。
【0033】図3の処理ステップS301〜S303
は、図2の処理ステップS201〜S203と同様であ
り、認識対象である原稿を画像とし装置内に取り込ん
で、文字を切り出し、その文字に対して文字認識を行
う。
は、図2の処理ステップS201〜S203と同様であ
り、認識対象である原稿を画像とし装置内に取り込ん
で、文字を切り出し、その文字に対して文字認識を行
う。
【0034】処理ステップS304、S306、S31
0、S311、S314、S315で、変数i、jに値
を設定しループの制御を行っている。これは前述の場合
(図2の処理ステップS204、S206、S210、
S211、S212、S213)と同様に、順に、i番
目の文字列中のj番目の文字について処理を行うためで
ある。
0、S311、S314、S315で、変数i、jに値
を設定しループの制御を行っている。これは前述の場合
(図2の処理ステップS204、S206、S210、
S211、S212、S213)と同様に、順に、i番
目の文字列中のj番目の文字について処理を行うためで
ある。
【0035】処理ステップS307は、図2の処理ステ
ップS207に対応する。
ップS207に対応する。
【0036】処理ステップS308は、図2の処理ステ
ップS208に対応する。
ップS208に対応する。
【0037】処理ステップS309は、図2の処理ステ
ップS209に対応する。ただし、次に示すように、文
字の書体が不定となる場合があることが、図2の処理ス
テップS209と異なる。例えば、明朝体の文字「一」
の文字画像の線幅の分布を示した図7のように、縦方向
の線のみ又は横方向の線のみから成る文字等について
は、閾値以下の分布数が少なくなり、書体の識別が困難
となる。同図においては、水平方向に走査した場合の線
幅の分布が少なくなる。このような場合は、この時点に
おいては、書体が不定であると判定しておく。つまり、
閾値以下の分布数がある一定値以下である場合には、不
定と判定する。
ップS209に対応する。ただし、次に示すように、文
字の書体が不定となる場合があることが、図2の処理ス
テップS209と異なる。例えば、明朝体の文字「一」
の文字画像の線幅の分布を示した図7のように、縦方向
の線のみ又は横方向の線のみから成る文字等について
は、閾値以下の分布数が少なくなり、書体の識別が困難
となる。同図においては、水平方向に走査した場合の線
幅の分布が少なくなる。このような場合は、この時点に
おいては、書体が不定であると判定しておく。つまり、
閾値以下の分布数がある一定値以下である場合には、不
定と判定する。
【0038】j番目の文字列中の文字について、処理ス
テップS308、S309の処理を完了したら、処理ス
テップS312において、j番目の文字列中の文字の書
体で最も多かった書体をj番目の文字列の基調となる書
体(以下、「基調書体」と略記する。)であると推定す
る。1つの文字列を対象としているので、他の文字列の
影響を受けることなく、基調書体を推定できる。これ
は、その対象としている1文字列内に他の文字列には存
在しない特異な書体が多い場合に有効である。また、基
調書体の他の推定方法として、j番目の文字列までの文
字の書体で最も多かった書体を基調書体であると推定す
る方法がある。この場合は、それまでの全ての文字の書
体が対象となるので、不定となった文字が多い文字列の
場合(又は、対象となっている1文字列内の全ての文字
の書体が不定となった場合も含めて)、基調書体の推定
が可能である。もちろん、2つの方法を選択的に行うこ
とも可能である。つまり、1文字列内で最も多い書体で
ある文字数がある閾値以上ならば、前者の方法(1文字
列内のみを対象とする方法)を用い、未満ならば、後者
の方法(それまでの全ての文字を対象とする方法)を用
いることができる。基調書体を決定するための文字数の
閾値は、単に文字数のみの場合、あるいは1文字列内の
文字の総数に対する同一書体である文字数の割合で決定
する場合がある。
テップS308、S309の処理を完了したら、処理ス
テップS312において、j番目の文字列中の文字の書
体で最も多かった書体をj番目の文字列の基調となる書
体(以下、「基調書体」と略記する。)であると推定す
る。1つの文字列を対象としているので、他の文字列の
影響を受けることなく、基調書体を推定できる。これ
は、その対象としている1文字列内に他の文字列には存
在しない特異な書体が多い場合に有効である。また、基
調書体の他の推定方法として、j番目の文字列までの文
字の書体で最も多かった書体を基調書体であると推定す
る方法がある。この場合は、それまでの全ての文字の書
体が対象となるので、不定となった文字が多い文字列の
場合(又は、対象となっている1文字列内の全ての文字
の書体が不定となった場合も含めて)、基調書体の推定
が可能である。もちろん、2つの方法を選択的に行うこ
とも可能である。つまり、1文字列内で最も多い書体で
ある文字数がある閾値以上ならば、前者の方法(1文字
列内のみを対象とする方法)を用い、未満ならば、後者
の方法(それまでの全ての文字を対象とする方法)を用
いることができる。基調書体を決定するための文字数の
閾値は、単に文字数のみの場合、あるいは1文字列内の
文字の総数に対する同一書体である文字数の割合で決定
する場合がある。
【0039】処理ステップS313では、処理ステップ
S309で、書体が不定であると判定した文字の書体を
基調書体であるとみなし、書体識別の最終結果とする。
S309で、書体が不定であると判定した文字の書体を
基調書体であるとみなし、書体識別の最終結果とする。
【0040】処理ステップS312、S313の処理の
変形として、処理ステップS309で書体が不定である
と判定した文字が、同一の書体で確定している文字に囲
まれている場合は、書体が不定の文字の書体をその書体
が確定している文字の書体とみなすことも可能である。
この場合の書体が不定の文字は1文字の場合、及び数文
字からなる文字列の場合も同様に処理可能である。この
方法では、書体を確定することができない場合にのみ、
処理ステップS312、S313の処理を行うことも可
能である。
変形として、処理ステップS309で書体が不定である
と判定した文字が、同一の書体で確定している文字に囲
まれている場合は、書体が不定の文字の書体をその書体
が確定している文字の書体とみなすことも可能である。
この場合の書体が不定の文字は1文字の場合、及び数文
字からなる文字列の場合も同様に処理可能である。この
方法では、書体を確定することができない場合にのみ、
処理ステップS312、S313の処理を行うことも可
能である。
【0041】このようにして、文字の認識結果と書体の
識別結果をメモリ3に記憶して、文字認識装置全体の処
理を終了する。
識別結果をメモリ3に記憶して、文字認識装置全体の処
理を終了する。
【0042】最後に、図4を用いて、基調書体を推定
し、予め登録した文字が出現した場合はその書体を識別
し、他の場合は基調書体を識別結果とする手法を述べ
る。多くの処理は前述の、全ての文字について同じよう
に書体を識別する手法と同様であるので、主に、異なる
部分について述べる。
し、予め登録した文字が出現した場合はその書体を識別
し、他の場合は基調書体を識別結果とする手法を述べ
る。多くの処理は前述の、全ての文字について同じよう
に書体を識別する手法と同様であるので、主に、異なる
部分について述べる。
【0043】図4の処理ステップS401〜S403
は、図2の処理ステップS201〜S203と同様であ
り、認識対象である原稿を画像として装置内に取り込ん
で、文字を切り出し、その文字に対して文字認識を行
う。
は、図2の処理ステップS201〜S203と同様であ
り、認識対象である原稿を画像として装置内に取り込ん
で、文字を切り出し、その文字に対して文字認識を行
う。
【0044】処理ステップS404では、1番目の文字
列に着目する。ここで、説明上、1番目の文字列と特定
しているが、任意の文字列を対象としてよい。特に、基
調書体を推定するための文字列の特定であるので、その
文書内で最も一般的な文字列、つまり、文字列の高さが
平均的な文字列、又は文字列の長さが1番長い文字列を
選択することも可能である。1つの文字列が充分な長さ
を持っていない場合、2つ以上の文字列を結合し、1つ
の文字列とみなして処理することも可能である。
列に着目する。ここで、説明上、1番目の文字列と特定
しているが、任意の文字列を対象としてよい。特に、基
調書体を推定するための文字列の特定であるので、その
文書内で最も一般的な文字列、つまり、文字列の高さが
平均的な文字列、又は文字列の長さが1番長い文字列を
選択することも可能である。1つの文字列が充分な長さ
を持っていない場合、2つ以上の文字列を結合し、1つ
の文字列とみなして処理することも可能である。
【0045】処理ステップS405、S408で、変数
jに値を設定しているが、前述の場合(図2の処理ステ
ップS206、S210)と同様に、順に、j番目の文
字について処理を行うためである。これは、一部の文字
から基調書体を推定しようとするもので、本実施例で
は、1行目の文字列中の文字から基調書体を推定するも
のとした。
jに値を設定しているが、前述の場合(図2の処理ステ
ップS206、S210)と同様に、順に、j番目の文
字について処理を行うためである。これは、一部の文字
から基調書体を推定しようとするもので、本実施例で
は、1行目の文字列中の文字から基調書体を推定するも
のとした。
【0046】処理ステップS406、S407では、前
述の場合(図2の処理ステップS207、S208)と
同様に着目した文字の垂直方向及び水平方向に走査した
場合の各々の線幅の分布を計算する。
述の場合(図2の処理ステップS207、S208)と
同様に着目した文字の垂直方向及び水平方向に走査した
場合の各々の線幅の分布を計算する。
【0047】処理ステップS409では、処理対象とし
た1番目の1文字列内の全ての文字について処理ステッ
プS407を完了したか否かを判定し、完了した場合は
処理ステップS410に移り、他の場合は処理ステップ
S406へ戻り、対象としている文字列内の次の文字の
処理を行う。
た1番目の1文字列内の全ての文字について処理ステッ
プS407を完了したか否かを判定し、完了した場合は
処理ステップS410に移り、他の場合は処理ステップ
S406へ戻り、対象としている文字列内の次の文字の
処理を行う。
【0048】処理ステップS410では、基調書体を推
定する。各文字の書体を推定した後に図3の処理ステッ
プS312のように基調書体を推定することもできる
が、ここでは、次のように推定することもできる。各文
字について計算した線幅の分布を全文字に対象として集
計し、その集計した分布から、図2の処理ステップS2
08と同様にして、文字の縦方向の線及び横方向の線の
幅を推定し、図2の処理ステップS209と同様にし
て、書体を識別し、その識別結果を基調書体であると推
定する。ここで、1文字列内を1文字毎に処理している
が、1文字列を1つの文字とみなして、線幅の推定、書
体の識別を行うこともできる。
定する。各文字の書体を推定した後に図3の処理ステッ
プS312のように基調書体を推定することもできる
が、ここでは、次のように推定することもできる。各文
字について計算した線幅の分布を全文字に対象として集
計し、その集計した分布から、図2の処理ステップS2
08と同様にして、文字の縦方向の線及び横方向の線の
幅を推定し、図2の処理ステップS209と同様にし
て、書体を識別し、その識別結果を基調書体であると推
定する。ここで、1文字列内を1文字毎に処理している
が、1文字列を1つの文字とみなして、線幅の推定、書
体の識別を行うこともできる。
【0049】処理ステップS411〜S420では、認
識した全ての文字について、処理ステップS415、S
416を行う。
識した全ての文字について、処理ステップS415、S
416を行う。
【0050】処理ステップS415では、着目した文字
が、処理対象/処理登録部10に予め登録されているか
検索し、登録されていればその文字に対する書体を識別
すべく処理ステップS416へ進み、他であれば基調書
体をそのまま識別結果とみなし次の文字の処理、つまり
処理ステップS417に進む。
が、処理対象/処理登録部10に予め登録されているか
検索し、登録されていればその文字に対する書体を識別
すべく処理ステップS416へ進み、他であれば基調書
体をそのまま識別結果とみなし次の文字の処理、つまり
処理ステップS417に進む。
【0051】処理ステップS416では、処理対象/処
理登録部10に登録された処理内容に従い、着目した文
字の書体を識別する。処理対象/処理登録部10に登録
する対象文字とその処理内容の1例を表1に示す。一般
に文書において、ほとんどの文字の書体が明朝体である
場合、表1の対象文字の欄に示したように、「図」や
「表」及びそれに続く英数・記号がゴシック体になって
いることがある。このように、基調書体とは違う書体を
使用する文字が限定される場合は、その文字とその文字
に対する処理方法を処理対象/処理登録部10に登録し
ておけば、効率良く書体を識別できる。表1の例では、
着目した文字が「図」又は「表」であれば、例えば、図
2の処理ステップS208、S209で示した方法と同
様に書体を識別し、着目した文字が「図」又は「表」に
続く英数・記号であれば、その「図」又は「表」と同じ
書体を識別結果とする。特に英数・記号の場合には文字
線の数が少ないので、図2の処理ステップS208、S
209で示した方法で書体を識別すると誤ることが多い
が、比較的文字線の多い「図」又は「表」の文字の書体
を識別することによって文字線の少ない文字に対しても
確実な書体識別が可能となる。また、処理対象/処理登
録部10に登録された処理で書体を識別する処理は、全
ての対象文字の文字線幅を推定すること(画像に対する
処理になる)と比較すると、格段に処理速度が向上す
る。処理ステップS416の他の処理方法として、処理
対象/処理登録部10に登録された対象文字ならば全て
書体識別の処理(具体的には、例えば、図2の処理ステ
ップS208、S209で示した方法)を行うようにす
ることも可能である。
理登録部10に登録された処理内容に従い、着目した文
字の書体を識別する。処理対象/処理登録部10に登録
する対象文字とその処理内容の1例を表1に示す。一般
に文書において、ほとんどの文字の書体が明朝体である
場合、表1の対象文字の欄に示したように、「図」や
「表」及びそれに続く英数・記号がゴシック体になって
いることがある。このように、基調書体とは違う書体を
使用する文字が限定される場合は、その文字とその文字
に対する処理方法を処理対象/処理登録部10に登録し
ておけば、効率良く書体を識別できる。表1の例では、
着目した文字が「図」又は「表」であれば、例えば、図
2の処理ステップS208、S209で示した方法と同
様に書体を識別し、着目した文字が「図」又は「表」に
続く英数・記号であれば、その「図」又は「表」と同じ
書体を識別結果とする。特に英数・記号の場合には文字
線の数が少ないので、図2の処理ステップS208、S
209で示した方法で書体を識別すると誤ることが多い
が、比較的文字線の多い「図」又は「表」の文字の書体
を識別することによって文字線の少ない文字に対しても
確実な書体識別が可能となる。また、処理対象/処理登
録部10に登録された処理で書体を識別する処理は、全
ての対象文字の文字線幅を推定すること(画像に対する
処理になる)と比較すると、格段に処理速度が向上す
る。処理ステップS416の他の処理方法として、処理
対象/処理登録部10に登録された対象文字ならば全て
書体識別の処理(具体的には、例えば、図2の処理ステ
ップS208、S209で示した方法)を行うようにす
ることも可能である。
【0052】
【表1】
【0053】このようにして、文字の認識結果と書体の
識別結果をメモリ3に記憶して、文字認識装置全体の処
理を終了する。
識別結果をメモリ3に記憶して、文字認識装置全体の処
理を終了する。
【0054】
【発明の効果】本発明によれば、文字を認識するだけで
なく、文字の書体を識別することができる。したがっ
て、認識対象の原稿中の文字を認識する場合に、原稿と
同じ書体で出力できるため、本認識装置の使用者に対し
て、文字のみでなくその文字の外観が原稿と同様な認識
結果を提供することができる。また、文字認識を行った
後に書体認識を行い、その文字認識結果が処理対象登録
手段により登録されている場合に、その文字に対しての
み書体識別を行うので、対象としている全ての文字につ
いて書体識別を行うことがなくなり、つまり書体識別処
理の実行回数を減少させることができ、効率良く文字の
書体を識別することが可能となる。また、文字認識を行
った後に書体認識を行い、その文字認識結果が処理対象
/処理登録手段により登録されている処理対象文字の場
合に、その文字に対して前記処理対象/処理登録手段に
登録されている処理方法により書体識別を行うので、対
象としている全ての文字について書体識別を行うことが
なくなり、また、文字に合わせた処理方法により書体識
別を行うことによって、効率良く正確に文字の書体を識
別することが可能となる。
なく、文字の書体を識別することができる。したがっ
て、認識対象の原稿中の文字を認識する場合に、原稿と
同じ書体で出力できるため、本認識装置の使用者に対し
て、文字のみでなくその文字の外観が原稿と同様な認識
結果を提供することができる。また、文字認識を行った
後に書体認識を行い、その文字認識結果が処理対象登録
手段により登録されている場合に、その文字に対しての
み書体識別を行うので、対象としている全ての文字につ
いて書体識別を行うことがなくなり、つまり書体識別処
理の実行回数を減少させることができ、効率良く文字の
書体を識別することが可能となる。また、文字認識を行
った後に書体認識を行い、その文字認識結果が処理対象
/処理登録手段により登録されている処理対象文字の場
合に、その文字に対して前記処理対象/処理登録手段に
登録されている処理方法により書体識別を行うので、対
象としている全ての文字について書体識別を行うことが
なくなり、また、文字に合わせた処理方法により書体識
別を行うことによって、効率良く正確に文字の書体を識
別することが可能となる。
【図1】本発明の文字認識装置の構成を示すブロック図
である。
である。
【図2】全ての文字について同一の処理で書体を識別す
る処理のフローチャートである。
る処理のフローチャートである。
【図3】書体の識別が困難な文字は予め推定した基調と
なる書体を識別結果とする書体識別処理のフローチャー
トである。
なる書体を識別結果とする書体識別処理のフローチャー
トである。
【図4】予め登録した文字は各々書体を識別し、他の文
字は予め推定した基調となる書体を識別結果とする書体
識別処理のフローチャートである。
字は予め推定した基調となる書体を識別結果とする書体
識別処理のフローチャートである。
【図5】画素とその線幅を模式的に表した図である。
【図6】明朝体の文字「中」文字画像の線幅の分布を模
式的に表した図である。
式的に表した図である。
【図7】明朝体の文字「一」文字画像の線幅の分布を模
式的に表した図である。
式的に表した図である。
1 画像入力装置 2 制御装置 3 メモリ 4 入力装置 5 文字列/文字切り出し処理部 6 文字認識処理部 7 文字線幅推定処理部 8 文字線幅比較処理部 9 書体識別処理部 10 処理対象/処理登録部
Claims (5)
- 【請求項1】 認識すべき画像である文字パターンを認
識する文字認識手段と、前記文字パターンの文字線の幅
を少なくとも2方向から推定する文字線幅推定手段と、
前記文字線幅推定手段により推定された文字線の幅によ
り前記文字パターンの書体を識別する書体識別処理手段
とを有することを特徴とする文字認識装置。 - 【請求項2】 認識すべき画像である文字パターンを認
識する文字認識手段と、前記文字パターンの書体を識別
し書体を識別できなかった前記文字パターンに対しては
不定とする第1の書体識別処理手段と、前記第1の書体
識別処理手段により不定となった前記文字パターンの書
体を既に書体を識別できた文字パターンの書体を用いて
識別する第2の書体識別処理手段とを有することを特徴
とする文字認識装置。 - 【請求項3】 認識すべき画像である文字パターンを認
識する文字認識手段と、前記文字認識手段により認識さ
れた結果に基づいて書体識別を行う書体識別手段とを有
することを特徴とする文字認識装置。 - 【請求項4】 認識すべき画像である文字パターンを認
識する文字認識処理手段と、予め書体を識別する処理対
象となる文字を登録している処理対象登録手段と、前記
文字認識処理手段により認識された文字を前記処理対象
登録手段に登録されている文字から検索し登録されてい
る場合は書体の識別を行う書体識別処理手段とを有する
ことを特徴とする文字認識装置。 - 【請求項5】 認識すべき画像である文字パターンを認
識する文字認識処理手段と、予め書体を識別する処理対
象となる文字とその文字に対する書体を識別するための
処理方法を登録している処理対象/処理登録手段と、前
記文字認識処理手段により認識された文字を前記処理対
象登録手段に登録されている文字から検索し登録されて
いる場合はその文字に対する前記処理対象登録手段に登
録されている書体を識別するための処理方法により書体
の識別を行う書体識別処理手段とを有することを特徴と
する文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5019268A JPH06208649A (ja) | 1993-01-11 | 1993-01-11 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5019268A JPH06208649A (ja) | 1993-01-11 | 1993-01-11 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06208649A true JPH06208649A (ja) | 1994-07-26 |
Family
ID=11994705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5019268A Pending JPH06208649A (ja) | 1993-01-11 | 1993-01-11 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06208649A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1099068C (zh) * | 1997-07-15 | 2003-01-15 | 株式会社理光 | 字体识别装置和方法 |
JP2010003320A (ja) * | 2009-10-06 | 2010-01-07 | Seiko Epson Corp | 文字列の読み易さの判定方法、判定装置、判定プログラム |
-
1993
- 1993-01-11 JP JP5019268A patent/JPH06208649A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1099068C (zh) * | 1997-07-15 | 2003-01-15 | 株式会社理光 | 字体识别装置和方法 |
JP2010003320A (ja) * | 2009-10-06 | 2010-01-07 | Seiko Epson Corp | 文字列の読み易さの判定方法、判定装置、判定プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7162086B2 (en) | Character recognition apparatus and method | |
JPS63155386A (ja) | 帳票デ−タ読取装置 | |
JP2991779B2 (ja) | 文字認識方法及び装置 | |
JP2001167131A (ja) | 文書シグネチュアを使用する文書の自動分類方法 | |
JP4300098B2 (ja) | オブジェクト識別方法とその装置、プログラム及び記録媒体 | |
US5621818A (en) | Document recognition apparatus | |
JPH09293082A (ja) | 画像検索装置及び画像検索方法 | |
US6327382B1 (en) | Image processing method and apparatus and storage medium therefor | |
JPH06208649A (ja) | 文字認識装置 | |
US7016535B2 (en) | Pattern identification apparatus, pattern identification method, and pattern identification program | |
JPH07129713A (ja) | 文字認識装置 | |
JPH05182014A (ja) | 文字認識方法 | |
JP2006277149A (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
CN115131806B (zh) | 一种基于深度学习的各类证件ocr图像信息识别方法、系统 | |
JPH10134141A (ja) | 文書照合装置および方法 | |
JP3115139B2 (ja) | 文字切り出し方法 | |
JP2592756B2 (ja) | 文字切り出し装置およびこれを用いた文字認識装置 | |
JP2006343797A (ja) | 文字認識装置、文字認識方法およびコンピュータプログラム | |
JPH03150690A (ja) | 文字認識装置 | |
CN116489284A (zh) | 一种多页文件的扫描方法 | |
JP2002157550A (ja) | 文字認識装置、文字認識方法、および記録媒体 | |
JPS62281082A (ja) | 文字認識装置 | |
JP2022051199A (ja) | 画像判定装置、画像判定方法、及びプログラム | |
JP2974396B2 (ja) | 画像処理方法及び装置 | |
JPH03172982A (ja) | 文字認識装置 |