JPH05166009A - 文字切出し・認識方法及び装置 - Google Patents

文字切出し・認識方法及び装置

Info

Publication number
JPH05166009A
JPH05166009A JP3330710A JP33071091A JPH05166009A JP H05166009 A JPH05166009 A JP H05166009A JP 3330710 A JP3330710 A JP 3330710A JP 33071091 A JP33071091 A JP 33071091A JP H05166009 A JPH05166009 A JP H05166009A
Authority
JP
Japan
Prior art keywords
character
recognition
segments
string
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3330710A
Other languages
English (en)
Inventor
Yoshinori Takenami
佳則 武並
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP3330710A priority Critical patent/JPH05166009A/ja
Publication of JPH05166009A publication Critical patent/JPH05166009A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【構成】文字切出し対象であるセグメント列(b) につい
て、全角文字幅Wmaxを用いて通常最も出現頻度が高い
全角文字の認識を試みることによって全角文字の切出し
を確定する()。残った未確定文字セグメント列
に対して、1セグメントずつ半角文字認識用辞書を用い
て半角文字(例えば英数字)の認識を試み、認識できれ
ばその文字の切出しを確定する()。最後には、
前記の方法では切り出されなかった未確定文字セグメン
ト列に対してのみ、前記以外のすべてのセグメントの組
合せを作り文字認識を試みる。 【効果】文字切出しをするときの文字認識対象数を減少
させることができ、その結果文字切出し・認識処理時間
の短縮化を図ることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像入力装置又はファ
クシミリなどの通信媒体を通して文字、記号等(以下代
表して「文字」という)を表す画像信号を取得し、1文
字ごとに切り出して文字認識することができる文字切出
し・認識方法及び装置に関するものである。
【0002】
【従来の技術】文字を自動的に文字認識する場合、二値
化された画像メモリ上の文書画像から文字列を抽出し、
1文字ごとに切り出して文字認識を行う必要がある。そ
のための文字切出し技術として、まず文字列を最も細か
いパターン(セグメント)に分割し、分割して得た各基
本パターン領域について、切出し候補位置のあらゆる可
能な組合せを求め、各々の切出し候補位置の組合せにつ
いて文字認識を行い、その結果に基づいて切出し位置を
決定するものが開示されている(特開昭62−190574号
公報参照)。
【0003】なお、文字認識処理は、文字認識用辞書に
予め記憶された文字パターンの特徴量との差計算などに
よって行われ、その差(相違度)がしきい値以下であれ
ばその文字が決定されるものである。
【0004】
【発明が解決しようとする課題】ところが、前記技術を
採用すると、通常最も処理時間を費やす文字認識処理を
未確定セグメント列の全ての組合せについて行う必要が
あるため、正確性は期待できても、処理速度は非常に遅
くなるという問題がある。そこで、本発明の目的は、上
述の技術的課題を解決し、文字認識をすることにより正
確な切出しを維持しつつ、文字認識の対象を減らすこと
によって切出し時間を高速化できる文字切出し・認識方
法及び装置を提供することである。
【0005】
【課題を解決するための手段】上記の目的を達成するた
めの請求項1記載の文字切出し・認識方法は、切り出し
位置が未確定の文字セグメント列に対して、全角文字幅
を超えない範囲で最大幅を有する文字セグメントの組合
せについて認識用辞書を用いて文字認識を試み、認識文
字との相違度がしきい値未満であればその文字の切出し
を確定し、切出し位置が確定された部分を除く残りの文
字セグメント列があればその未確定文字セグメント列に
対して、前記以外のすべてのセグメントの組合せを作り
認識用辞書を用いて文字認識を試みる方法である。
【0006】請求項2記載の文字切出し・認識装置は、
前記文字切出し・認識方法を実現する諸手段を備えるも
のである。請求項3記載の文字切出し・認識方法は、切
り出し位置が未確定の文字セグメント列に対して、1セ
グメントずつ半角文字認識用辞書を用いて半角文字の認
識を試み、認識文字との相違度がしきい値未満であれば
その文字の切出しを確定し、切出し位置が確定された部
分を除く残りの文字セグメント列があればその未確定文
字セグメント列に対して、前記以外のすべてのセグメン
トの組合せを作り認識用辞書を用いて文字認識を試みる
方法である。
【0007】請求項4記載の文字切出し・認識装置は、
前記文字切出し・認識方法を実現する諸手段を備えるも
のである。請求項5記載の文字切出し・認識方法は、切
り出し位置が未確定の文字セグメント列に対して、全角
文字幅を超えない範囲で最大幅を有する文字セグメント
の組合せについて認識用辞書を用いて文字認識を試み、
認識文字との相違度がしきい値未満であればその文字の
切出しを確定し、切出し位置が確定された部分を除く残
りの文字セグメント列があればその未確定文字セグメン
ト列に対して、1セグメントずつ半角文字認識用辞書を
用いて半角文字の認識を試み、認識文字との相違度がし
きい値未満であればその文字の切出しを確定し、切出し
位置が確定された部分を除く残りの文字セグメント列が
あればその未確定文字セグメント列に対して、前記以外
のすべてのセグメントの組合せを作り認識用辞書を用い
て文字認識を試みる方法である。
【0008】請求項6記載の文字切出し・認識装置は、
前記文字切出し・認識方法を実現する諸手段を備えるも
のである。
【0009】
【作用】前記請求項1及び2の文字切出し・認識方法及
び装置によれば、文字切出し位置が未確定な文字セグメ
ント列に対して、まず、全角文字幅を超えない範囲で最
大幅を有する文字セグメントの各組合せを全角分離文字
とみなし、認識用辞書を用いて文字認識を試み、認識文
字との相違度がしきい値未満であればその全角文字の切
出しを確定してしまう。したがって、残りの文字につい
て、切出し位置が確定された部分を除く残りの未確定文
字セグメント列に対して、確定された組合せを崩さない
で前記以外のすべてのセグメントの組合せを作り認識を
することになる。
【0010】前記請求項3及び4の文字切出し・認識方
法及び装置によれば、1セグメントずつ半角文字認識用
辞書を用いて半角文字(例えば英数字)の認識を試み、
認識文字との相違度がしきい値未満であればその文字の
切出しを確定する。最後には、前記の方法では切り出さ
れなかった未確定文字セグメント列に対して、前記以外
のすべてのセグメントの組合せを作り文字認識をする。
【0011】前記請求項5及び6の文字切出し・認識方
法及び装置によれば、全角文字幅を超えない範囲で最大
幅を有する文字セグメントの各組合せに対して認識用辞
書を用いて文字認識を試み、認識文字との相違度がしき
い値未満であればその全角文字の切出しを確定してしま
い、残りの文字について、1セグメントずつ半角文字認
識用辞書を用いて半角文字(例えば英数字)の認識を試
み、認識文字との相違度がしきい値未満であればその文
字の切出しを確定する。最後には、前記の方法では切り
出されなかった未確定文字セグメント列に対して、前記
以外のすべてのセグメントの組合せを作り文字認識をす
る。
【0012】
【実施例】以下実施例を示す添付図面によって詳細に説
明する。図2は、本発明の文字切出し・認識方法を実施
する文字認識装置の基本的な構成を示すブロック図であ
る。この文字認識装置は、読取対象である文字を記載し
た原稿面を照明し、その反射光により形成された光学像
をビジコンや固体撮像素子などを用いて電気信号に変換
するスキャナ4を備えている。スキャナ4は、画像信号
を原稿面の濃淡に対応した二値化信号に変換する二値化
回路(図示せず)を備えている。
【0013】スキャナ4からの二値化信号は、ラインを
介して本体処理部8に与えられる。この本体処理部8は
ラインからの信号を、画像メモリ81に一時記憶する。
画像メモリ81に記憶された画像は、文字列抽出回路8
2において文字列の抽出が行われる。文字列の抽出は、
与えられた二値データに対して、黒画素数を水平方向に
カウントして(横書きの場合)、縦方向のヒストグラム
を作り、その形状に基づいて行う。
【0014】セグメント分割回路83においてこのよう
に抽出された文字列に対して、黒画素数を縦方向にカウ
ントして行方向のヒストグラムを作り、連続した黒画素
の塊であるセグメントに分割する。次に算出回路84に
おいて、全角文字幅Wmax の算出を行う。算出の方法
は、各行の高さの最大値を求め、これを文字サイズWma
x としてもよく(行の高さを文字サイズに等しいとする
のは、日本語文字はほぼ正方形となっているからであ
る。)、セグメント幅の分布を調べてその度数分布が急
激に下がる値を求めて、これを文字サイズWmax として
もよい。文字サイズWmax を用いて、以下、各々のセグ
メントが全角非分離文字であるのか、分離文字(日本語
文書において漢字・かなに特有の左右又は上下に分離さ
れた文字をいう。横書きの場合「川」「い」等の文字が
これにあたり、縦書きの場合「京」等の文字がこれにあ
たる。)の一部若しくは半角文字であるのか、あるいは
接触文字(他の図形と接触しているので、当該他の図形
と一緒に切り出してしまった図形)であるかの判定が容
易にできる。
【0015】文字切出し及び認識回路85においては、
このように分割された各セグメントに対して文字の切出
し及び確定処理が行われる。以上の一連の処理につい
て、フローチャート(図1)を参照しながら詳細に説明
する。画像メモリ81に記憶された画像データに対し
て、前記文字列の抽出(ステップS1)及びセグメント
分割(ステップS2)を行うと、セグメントの横幅のデ
ータ分布を調べて全角文字幅Wmax を算出する(ステッ
プS3)。
【0016】つぎに、各セグメントについて、全角文字
幅Wmax を用いて文字切出しを行う(ステップS4)。
切出しの方法は、図3に示すように各セグメントに対
し、そのセグメントとその前又は後の隣接セグメントを
結合したものの幅を全角文字幅Wmax と比較し、いずれ
も全角文字幅Wmax を超えていれば、そのセグメントを
全角非分離文字であるとし、切出しを確定する(図3
(a) 参照)。なぜならWmax は全角文字の最大幅と仮定
されているので、これを超える文字は存在しないはずだ
からである。
【0017】さらに未確定セグメント列の抽出を行う
(ステップS6)。前のセグメントを結合したものの幅
のみが全角文字幅Wmax を超えていれば、それは未確定
セグメント列の先頭ということになり(図3(b) 参
照)、後ろのセグメントを結合したものの幅のみが全角
文字幅Wmax を超えていれば、それは未確定セグメント
列の後尾ということになり(図3(c) 参照)、前後のセ
グメントを結合したものの幅が全角文字幅Wmax 以内で
あれば、それは未確定セグメント列の内部ということに
なる(図3(d) 参照)。
【0018】これらの処理により、各行に対して、全角
非分離文字(図3(a) )を抽出して切出しを確定し、残
りを未確定セグメント列(図3(b) 〜(d) )として抽出
することができる。なお、実際には全角非分離文字だけ
でなく、前後にある程度の空白の存在する半角文字の切
出しも確定することができる。
【0019】次に、未確定セグメント列に対して、切出
し確定の処理を行う。1つの未確定セグメント列を構成
するセグメント数をnとし、構成セグメント間の切出し
候補位置を「ノード」ということにする。セグメントと
ノードとの関係を図4に示す。第i番目のノードと、第
j(j>i)番目のノードに注目し、i,j間にあるセ
グメントを結合してできる文字を、セグメントの組合せ
(i,j)で表す。セグメントの組合せ(i,j)を文
字認識した結果得られる相違度に基づいて決定される評
価値をT(i,j) で表す。例えば、 T(i,j) =「相違度」×(j−i) とする。すべてのセグメントの組合せ(i,j)に対す
る評価値をT(i,j) を格納するテーブルを評価値テーブ
ルという。
【0020】従来の方法では、差(j−i)が予め定め
られた上限幅Umax 以下であるすべてのセグメントの組
合せ(i,j)について、文字認識を行っていた。本実
施例では、このセグメントの組合せの文字認識を以下の
ように行う。 (1) 全角分離文字認識(ステップS7) 未確定セグメント列中で、全角文字幅Wmax を用いて全
角分離文字と想像されるセグメントの組合せ(i,j)
(jは、iに全角文字幅Wmax に相当するノード数wを
加えたもの)を抽出して優先的に文字認識する。
【0021】もし、文字認識結果が確実、いいかえれば
相違度がしきい値以下ならば、そのセグメントの組合せ
に対応する切出し位置を部分的に確定しT(i,j) =0と
おき(ステップS8)、このセグメントの組合せを崩す
ような他のセグメントの組合せの文字認識を省略する。
具体的には、(i,j)が確定すれば、次の全角分離文
字認識処理は、i=jとおいて,組合せ(j,j+w)
からスタートする。そして、このセグメントの組合せに
触れる他のセグメントの組合せの評価値を無限大に設定
する。数式で表現すると、 0≦k1 <j,かつi+1≦k2 <n(k1 <i+1の
とき)または、 0≦k1 <j,かつk1 +1≦k2 <n(i+1≦k1
<jのとき)を満たすセグメントの組合せ(k1
2 )に対して文字認識を省略し、T(k1,k2) =無限大
とおく。
【0022】もし、文字認識の結果,未確定ならば、次
の全角分離文字認識処理は、組合せ(i+1,j+1)
からスタートする。 (2) 半角英数字・半角文字認識(ステップS9) 上の方法で文字認識できなかった未確定のセグメント列
を構成する各セグメント(i,i+1)、すなわち、個
々のセグメントの1つ1つを半角英数字又は記号とみな
して文字認識する。このようにするのは、(1) の処理を
しても確定されない場合は、未確定セグメントは英単語
など半角文字からなる可能性が高いからである。したが
って、文字認識用辞書86の識別範囲も英数字及び記号
のみとする。部分的に確定すれば全角分離文字認識と同
様、切り出し部分確定処理(T(i,i+1) =0)を行う
(ステップS10)、確定できなければ、 T(i,j) =「相違度」×1 とおき、次の組合せ(i+1,i+2)の認識を始め
る。 (3) 残りのセグメントの組合せの文字認識(ステップS
11) 未確定セグメント列の中で、前記(1) (2) の方法で未確
定のすべてのセグメントの組合せについて、文字認識を
行う。
【0023】以上のようにして、評価値T(i,j) を求
め、格納する評価値テーブルを作成するとともに、いま
まで部分的に確定した切り出し位置を含めて全体の切り
出し位置を統一的に確定し(ステップS13)、切出し
位置決定用評価値の和として定義される評価関数J J=ΣT(i,j) を最小にする最適経路を、動的計画法を用いて探索する
ことにより、未確定セグメント列全体の最適な切出し位
置を求めることができ、その切出し位置に相当する文字
分の認識結果を出力することができる。
【0024】以上のように、この実施例によればセグメ
ントの組合せの際の文字認識処理順序を効率的に組むこ
とにより、切出し位置を部分的に確定することができ、
確定された切出し位置を尊重して他の未確定な切出し位
置についてのみ次の文字認識処理を行うことになり、処
理速度の大幅な向上を図ることができる。前記実施例の
手法を具体例を用いて説明する。
【0025】図5(a) は、「大雨で川幅が15mになっ
た」という切出し対象文字列を示し、全角文字幅Wmax
を用いて文字切出しを行った結果、「大」「雨」「で」
「な」「っ」「た」の6つのセグメントが、前又は後の
セグメントを結合したものの幅が全角文字幅Wmax を超
えている文字、すなわち全角非分離文字と判定されたも
のとする。したがって、未確定セグメント列は図5(b)
に示されるように「川幅が15mに」の10個のセグメ
ントから構成される。
【0026】この未確定セグメント列に対して、前記
(1) の「全角分離文字認識」処理を行う。まずi=0と
おき、W(0,j)<Wmax を満足する最大のjを求め
るとj=3となる。そこで、セグメントの組合せ(0,
3)に対して文字認識処理をする(図5(c) )。この
結果、「川」と文字認識できたので、T(0,3)=0
とし、切出しを確定する。次の処理はi=3から始め
る。前記と同じ処理をすると、セグメントの組合せ
(3,5)が「幅」と文字認識できたので(図5(c)
)、T(3,5)=0とし、切出しを確定する。
【0027】次の処理はi=5から始める。前記と同じ
処理をすると、セグメントの組合せ(5,7)に対して
文字認識処理をすることになる(図5(c) )。この結
果、はっきりと文字認識できないので、T(5,7)=
「相違度」×(7−5)とし、次の処理は、ノードを1
つずらして行う。すなわちセグメントの組合せ(6,
8)に対して文字認識処理をする(図5(c) )。この
場合も正確に文字認識できないので、T(6,8)=
「相違度」×(8−6)とし、次のセグメントの組合せ
(7,9)に対して文字認識処理をする(図5(c)
)。この場合も正確に文字認識できないので、T
(7,9)=「相違度」×(9−7)とし、次のセグメ
ントの組合せ(8,10)に対して文字認識処理をする
(図5(c) )。セグメントの組合せ(8,10)は
「に」と文字認識できるので、T(8,10)=0と
し、切出しを確定する。
【0028】以上の結果、ノード0から5までと、8か
ら10までのセグメントの切出しを確定できたことにな
る。次に、未確定セグメント列5から8について、前記
(2)の半角英数字・半角記号文字認識処理を行う。ま
ず、i=5,j=i+1=6とおいて、半角英数字の文
字認識用辞書を用いてセグメントの組合せ(5,6)の
文字認識を行う(図5(c) )。「1 」と文字認識でき
たので、ノード6を切出し位置として確定し、次のセグ
メントの組合せ(6,7)の文字認識を行う(図5(c)
)。「5 」と文字認識できたので、ノード7を切出し
位置として確定し、次のセグメントの組合せ(7,8)
の文字認識を行う(図5(c) )。「m 」と文字認識で
きたので、ノード8を切出し位置として確定する。
【0029】以上のようにして、すべての切出し位置を
確定することができる。図6は、縦軸に前ノード、横軸
に後ろノードをとり、どのようなセグメントの組合せが
あるかを分かりやすく図示したものである。右上がりの
斜線で示した部分は 前ノード≧後ろノード を満たす領域であり、理論的には存在しない。右下がり
の斜線で示した部分は 前ノード+全角文字幅Wmax に相当するノード数<後ろ
ノード を満たす領域であり、全角文字幅を超える文字は存在し
ないと仮定したのでここに文字は存在しない。
【0030】例えば、前記セグメントの組合せ(0,
3)は、のように文字認識され、切出し位置を部分的
に確定するので、から縦線が引かれ、この縦線をまた
ぐセグメントの組合せ例えば(2,4)は文字認識が省
略されると考えればよい。のセグメントの組合せ
(3,5)も文字認識されたことを示し、から縦線が
引かれる。は文字認識できず、は文字認識され
たので縦線が引かれる。そして、残りのについて
半角文字認識が行われる。
【0031】このように処理を行うので、文字認識回数
は、からまで9回で済む。ところが、従来の手法で
は、21回(図6の白い矩形の数に相当)も処理を行う
ことになり、実施例では文字認識回数は大幅に減少して
いる。なお、前記図5の実施例では前記(1) の「全角分
離文字認識」処理と、前記(2) の「半角英数字・半角記
号文字認識」処理とですべてのセグメントを確定するこ
とができた。しかし、前記(1) 及び(2) の処理だけで
は、まだ未確定のセグメント列が存在するときは、残っ
たすべての組合せについて文字認識処理を行う必要があ
る。例えば図5の例でいえば、仮に(1) の処理では組合
せ(0,3)が確定せず、(2) の処理では組合せ(0,
1)、(1,2)、(2,3)が確定しなかったときに
は、残りの組合せ(0,2)、(1,3)についても文
字認識を試みる。
【0032】なお、本発明は前記実施例に限定されるも
のではない。前記実施例では、(1)の「全角分離文字認
識」処理と、前記(2) の「半角英数字・半角記号文字認
識」処理と、(3) の「他の全ての組合せの文字認識」処
理を行うものであったが、文字列が半角文字を含まない
ことが分かっている場合は(2) の処理を省略してもよ
い。
【0033】また、文字列が英数字のみを含む場合は
(1) の処理を省略してもよい。例えば未確定セグメント
列の抽出(図1ステップS6)をした時点で、プロポー
ショナルピッチによって各セグメント間の空白の間隔と
ほぼ等しいと分かった場合、この未確定セグメント列は
英数字列である可能性が高い。また、(1) の「全角分離
文字認識」処理をしていって一度も確定されない場合
も、半角文字列である可能性は高い。
【0034】さらに、スキャナ4により画像信号を取得
するのに代えて、ファクシミリなどの回線を通して画像
信号を取得してもよい。
【0035】
【発明の効果】以上のように請求項1及び2の文字切出
し・認識方法及び装置によれば、まず、通常最も出現頻
度が高い全角文字の認識を試みることによって全角文字
の切出しを確定するので、残った未確定文字セグメント
列に対してのみ認識をすればよいことになり、認識対象
数を減少させることができ、その結果処理時間の短縮化
を図ることができる。
【0036】請求項3及び4の文字切出し・認識方法及
び装置によれば、1セグメントずつ半角文字認識用辞書
を用いて半角文字(例えば英数字)の認識を試み、認識
文字との相違度がしきい値未満であればその文字の切出
しを確定するので、前記の方法では切り出されなかった
未確定文字セグメント列、特に半角文字からなる文字列
に対して、前記以外のすべてのセグメントの組合せを作
り文字認識を試みるだけでよくなるので、認識対象数を
減少させることができ、その結果処理時間の短縮化を図
ることができる。
【0037】請求項5及び6の文字切出し・認識方法及
び装置によれば、全角文字の切出しを確定した後、半角
文字(例えば英数字)を確定するので、最後には、前記
の方法では切り出されなかった未確定文字セグメント列
に対して、前記以外のすべてのセグメントの組合せを作
り文字認識を試みるだけでよくなるので、認識対象数を
さらに減少させることができその結果処理時間の短縮化
を図ることができる。
【図面の簡単な説明】
【図1】本発明の手順を説明する流れ図である。
【図2】本発明の文字切出し・認識方法を実施する文字
認識装置の基本的な構成を示すブロック図である。
【図3】全角文字幅Wmax を用いて文字切出しを行う方
法を説明する図であり、(a) は全角非分離文字の抽出、
(b) 〜(d) は未確定セグメント列の抽出を示す。
【図4】セグメントとノードとの関係を説明する図であ
る。
【図5】切出し対象文字列について、発明の手法を適用
した図であり、(a) は切出し対象セグメント列、(b) は
未確定セグメント列、(c) は文字切出し順序を示す図で
ある。
【図6】縦軸に前ノード、横軸に後ろノードをとり、ど
のようなセグメントの組合せがあるかを示した図であ
る。
【符号の説明】
83 セグメント分割回路 84 算出回路 85 文字切出し及び認識回路 86 文字認識用辞書

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】文字を含む被読取対象を表わす画像信号を
    取得し、取得された画像信号に含まれる文字列を抽出
    し、抽出された文字列を連続した画素の集まりであるセ
    グメントに分割し、分割された文字セグメントから構成
    される文字の切出しを行う文字切出し・認識方法におい
    て、 切り出し位置が未確定の文字セグメント列に対して、全
    角文字幅を超えない範囲で最大幅を有する文字セグメン
    トの組合せについて認識用辞書を用いて文字認識を試
    み、 認識文字との相違度がしきい値未満であればその文字の
    切出しを確定し、 切出し位置が確定された部分を除く残りの文字セグメン
    ト列があればその未確定文字セグメント列に対して、前
    記以外のすべてのセグメントの組合せを作り認識用辞書
    を用いて文字認識を試みることを特徴とする文字切出し
    ・認識方法。
  2. 【請求項2】文字を含む被読取対象を表わす画像信号を
    取得し、取得された画像信号に含まれる文字列を抽出
    し、抽出された文字列を連続した画素の集まりであるセ
    グメントに分割し、分割された文字セグメントから構成
    される文字の切出しを行う装置において、 抽出された文字列画像データから、全角文字幅を算出す
    る手段と、 切り出されなかった未確定文字セグメント列に対して、
    全角文字幅を超えない範囲で最大幅を有する文字セグメ
    ントの組合せに対して認識用辞書を用いて文字認識を試
    みる手段と、 認識文字との相違度がしきい値未満であればその文字の
    切出しを確定する手段と、 切出し位置が確定された部分を除く残りの未確定文字セ
    グメント列に対して、前記以外のすべてのセグメントの
    組合せを作り文字認識を試みる手段とを備えることを特
    徴とする文字切出し・認識装置。
  3. 【請求項3】文字を含む被読取対象を表わす画像信号を
    取得し、取得された画像信号に含まれる文字列を抽出
    し、抽出された文字列を連続した画素の集まりであるセ
    グメントに分割し、分割された文字セグメントから構成
    される文字の切出しを行う文字切出し・認識方法におい
    て、 切り出し位置が未確定の文字セグメント列に対して、1
    セグメントずつ半角文字認識用辞書を用いて文字認識を
    試み、 認識文字との相違度がしきい値未満であればその文字の
    切出しを確定し、 切出し位置が確定された部分を除く残りの文字セグメン
    ト列があればその未確定文字セグメント列に対して、前
    記以外のすべてのセグメントの組合せを作り認識用辞書
    を用いて文字認識を試みることを特徴とする文字切出し
    ・認識方法。
  4. 【請求項4】文字を含む被読取対象を表わす画像信号を
    取得し、取得された画像信号に含まれる文字列を抽出
    し、抽出された文字列を連続した画素の集まりであるセ
    グメントに分割し、分割された文字セグメントから構成
    される文字の切出しを行う装置において、 抽出された文字列画像データから、全角文字幅を算出す
    る手段と、 切り出されなかった未確定文字セグメント列に対して、
    1セグメントずつ半角文字認識用辞書を用いて文字認識
    を試みる手段と、 認識文字との相違度がしきい値未満であればその文字の
    切出しを確定する手段と、 切出し位置が確定された部分を除く残りの文字セグメン
    ト列があればその未確定文字セグメント列に対して、前
    記以外のすべてのセグメントの組合せを作り認識用辞書
    を用いて文字認識を試みる手段とを備えることを特徴と
    する文字切出し・認識装置。
  5. 【請求項5】文字を含む被読取対象を表わす画像信号を
    取得し、取得された画像信号に含まれる文字列を抽出
    し、抽出された文字列を連続した画素の集まりであるセ
    グメントに分割し、分割された文字セグメントから構成
    される文字の切出しを行う文字切出し・認識方法におい
    て、 切り出し位置が未確定の文字セグメント列に対して、全
    角文字幅を超えない範囲で最大幅を有する文字セグメン
    トの組合せについて認識用辞書を用いて文字認識を試
    み、 認識文字との相違度がしきい値未満であればその文字の
    切出しを確定し、 切出し位置が確定された部分を除く残りの文字セグメン
    ト列があればその未確定文字セグメント列に対して、1
    セグメントずつ半角文字認識用辞書を用いて文字認識を
    試み、 認識文字との相違度がしきい値未満であればその文字の
    切出しを確定し、 切出し位置が確定された部分を除く残りの文字セグメン
    ト列があればその未確定文字セグメント列に対して、前
    記以外のすべてのセグメントの組合せを作り認識用辞書
    を用いて文字認識を試みることを特徴とする文字切出し
    ・認識方法。
  6. 【請求項6】文字を含む被読取対象を表わす画像信号を
    取得し、取得された画像信号に含まれる文字列を抽出
    し、抽出された文字列を連続した画素の集まりであるセ
    グメントに分割し、分割された文字セグメントから構成
    される文字の切出しを行う装置において、 抽出された文字列画像データから、全角文字幅を算出す
    る手段と、 切り出されなかった未確定文字セグメント列に対して、
    全角文字幅を超えない範囲で最大幅を有する文字セグメ
    ントの組合せに対して認識用辞書を用いて文字認識を試
    みる手段と、 認識文字との相違度がしきい値未満であればその文字の
    切出しを確定する手段と、 切出し位置が確定された部分を除く残りの未確定文字セ
    グメント列に対して、1セグメントずつ半角文字認識用
    辞書を用いて文字認識を試みる手段と、 認識文字との相違度がしきい値未満であればその文字の
    切出しを確定する手段と、 切出し位置が確定された部分を除く未確定文字セグメン
    ト列に対して、前記以外のすべてのセグメントの組合せ
    を作り文字認識を試みる手段とを備えることを特徴とす
    る文字切出し・認識装置。
JP3330710A 1991-12-13 1991-12-13 文字切出し・認識方法及び装置 Pending JPH05166009A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3330710A JPH05166009A (ja) 1991-12-13 1991-12-13 文字切出し・認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3330710A JPH05166009A (ja) 1991-12-13 1991-12-13 文字切出し・認識方法及び装置

Publications (1)

Publication Number Publication Date
JPH05166009A true JPH05166009A (ja) 1993-07-02

Family

ID=18235702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3330710A Pending JPH05166009A (ja) 1991-12-13 1991-12-13 文字切出し・認識方法及び装置

Country Status (1)

Country Link
JP (1) JPH05166009A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002007965A (ja) * 2000-05-12 2002-01-11 Xerox Corp テキスト行イメージデコーディングのためのスキップモードによるダイナミックプログラミングオペレーション
JP2002007966A (ja) * 2000-05-12 2002-01-11 Xerox Corp 文書画像復号方法
JP2010044485A (ja) * 2008-08-11 2010-02-25 Omron Corp 文字認識装置、文字認識プログラム、および文字認識方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002007965A (ja) * 2000-05-12 2002-01-11 Xerox Corp テキスト行イメージデコーディングのためのスキップモードによるダイナミックプログラミングオペレーション
JP2002007966A (ja) * 2000-05-12 2002-01-11 Xerox Corp 文書画像復号方法
JP4624592B2 (ja) * 2000-05-12 2011-02-02 ゼロックス コーポレイション テキスト行イメージデコーディングのためのスキップモードによるダイナミックプログラミングオペレーション
JP2010044485A (ja) * 2008-08-11 2010-02-25 Omron Corp 文字認識装置、文字認識プログラム、および文字認識方法

Similar Documents

Publication Publication Date Title
EP1146478B1 (en) A method for extracting titles from digital images
US6754385B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP3748164B2 (ja) パターン抽出装置
JP2802036B2 (ja) 文書処理のためのイメージ・セグメント化およびイメージ要素分類の方法
KR20030010530A (ko) 이미지 처리 방법, 장치 및 시스템
EP0045803A1 (en) System and method for processing horizontal line characteristics in an image
JPH05225378A (ja) 文書画像の領域分割システム
JPH05166009A (ja) 文字切出し・認識方法及び装置
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
JP3106080B2 (ja) 画像処理装置及びその方法
JP2943303B2 (ja) 画像の2値化方式
JP3277977B2 (ja) 文字認識方法
Messelodi et al. Detection of polygonal frames in complex document images
JPH0581477A (ja) 文字切出し方法
JPH09297817A (ja) 文字切り出し方法
JPH08202823A (ja) パターン認識装置
JPH10233930A (ja) 画像処理装置
JPH0685186B2 (ja) 写真領域識別装置
JPH06187490A (ja) 領域分割方法
JPH04149699A (ja) ナンバープレート文字認識装置
JPH0520488A (ja) ナンバープレート文字認識装置
JPH05182025A (ja) 文字認識装置
JPH06301814A (ja) 文字読取装置
JPH04316183A (ja) 文字認識装置
JPH02242391A (ja) 文字認識方式