JPH05166009A

JPH05166009A - 文字切出し・認識方法及び装置

Info

Publication number: JPH05166009A
Application number: JP3330710A
Authority: JP
Inventors: Yoshinori Takenami; 佳則武並
Original assignee: Sumitomo Electric Industries Ltd
Current assignee: Sumitomo Electric Industries Ltd
Priority date: 1991-12-13
Filing date: 1991-12-13
Publication date: 1993-07-02

Abstract

(57)【要約】【構成】文字切出し対象であるセグメント列(b) につい
て、全角文字幅Ｗmaxを用いて通常最も出現頻度が高い
全角文字の認識を試みることによって全角文字の切出し
を確定する（）。残った未確定文字セグメント列
に対して、１セグメントずつ半角文字認識用辞書を用い
て半角文字（例えば英数字）の認識を試み、認識できれ
ばその文字の切出しを確定する（）。最後には、
前記の方法では切り出されなかった未確定文字セグメン
ト列に対してのみ、前記以外のすべてのセグメントの組
合せを作り文字認識を試みる。【効果】文字切出しをするときの文字認識対象数を減少
させることができ、その結果文字切出し・認識処理時間
の短縮化を図ることができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、画像入力装置又はファ
クシミリなどの通信媒体を通して文字、記号等（以下代
表して「文字」という）を表す画像信号を取得し、１文
字ごとに切り出して文字認識することができる文字切出
し・認識方法及び装置に関するものである。

【０００２】

【従来の技術】文字を自動的に文字認識する場合、二値
化された画像メモリ上の文書画像から文字列を抽出し、
１文字ごとに切り出して文字認識を行う必要がある。そ
のための文字切出し技術として、まず文字列を最も細か
いパターン（セグメント）に分割し、分割して得た各基
本パターン領域について、切出し候補位置のあらゆる可
能な組合せを求め、各々の切出し候補位置の組合せにつ
いて文字認識を行い、その結果に基づいて切出し位置を
決定するものが開示されている（特開昭６２−190574号
公報参照）。

【０００３】なお、文字認識処理は、文字認識用辞書に
予め記憶された文字パターンの特徴量との差計算などに
よって行われ、その差（相違度）がしきい値以下であれ
ばその文字が決定されるものである。

【０００４】

【発明が解決しようとする課題】ところが、前記技術を
採用すると、通常最も処理時間を費やす文字認識処理を
未確定セグメント列の全ての組合せについて行う必要が
あるため、正確性は期待できても、処理速度は非常に遅
くなるという問題がある。そこで、本発明の目的は、上
述の技術的課題を解決し、文字認識をすることにより正
確な切出しを維持しつつ、文字認識の対象を減らすこと
によって切出し時間を高速化できる文字切出し・認識方
法及び装置を提供することである。

【０００５】

【課題を解決するための手段】上記の目的を達成するた
めの請求項１記載の文字切出し・認識方法は、切り出し
位置が未確定の文字セグメント列に対して、全角文字幅
を超えない範囲で最大幅を有する文字セグメントの組合
せについて認識用辞書を用いて文字認識を試み、認識文
字との相違度がしきい値未満であればその文字の切出し
を確定し、切出し位置が確定された部分を除く残りの文
字セグメント列があればその未確定文字セグメント列に
対して、前記以外のすべてのセグメントの組合せを作り
認識用辞書を用いて文字認識を試みる方法である。

【０００６】請求項２記載の文字切出し・認識装置は、
前記文字切出し・認識方法を実現する諸手段を備えるも
のである。請求項３記載の文字切出し・認識方法は、切
り出し位置が未確定の文字セグメント列に対して、１セ
グメントずつ半角文字認識用辞書を用いて半角文字の認
識を試み、認識文字との相違度がしきい値未満であれば
その文字の切出しを確定し、切出し位置が確定された部
分を除く残りの文字セグメント列があればその未確定文
字セグメント列に対して、前記以外のすべてのセグメン
トの組合せを作り認識用辞書を用いて文字認識を試みる
方法である。

【０００７】請求項４記載の文字切出し・認識装置は、
前記文字切出し・認識方法を実現する諸手段を備えるも
のである。請求項５記載の文字切出し・認識方法は、切
り出し位置が未確定の文字セグメント列に対して、全角
文字幅を超えない範囲で最大幅を有する文字セグメント
の組合せについて認識用辞書を用いて文字認識を試み、
認識文字との相違度がしきい値未満であればその文字の
切出しを確定し、切出し位置が確定された部分を除く残
りの文字セグメント列があればその未確定文字セグメン
ト列に対して、１セグメントずつ半角文字認識用辞書を
用いて半角文字の認識を試み、認識文字との相違度がし
きい値未満であればその文字の切出しを確定し、切出し
位置が確定された部分を除く残りの文字セグメント列が
あればその未確定文字セグメント列に対して、前記以外
のすべてのセグメントの組合せを作り認識用辞書を用い
て文字認識を試みる方法である。

【０００８】請求項６記載の文字切出し・認識装置は、
前記文字切出し・認識方法を実現する諸手段を備えるも
のである。

【０００９】

【作用】前記請求項１及び２の文字切出し・認識方法及
び装置によれば、文字切出し位置が未確定な文字セグメ
ント列に対して、まず、全角文字幅を超えない範囲で最
大幅を有する文字セグメントの各組合せを全角分離文字
とみなし、認識用辞書を用いて文字認識を試み、認識文
字との相違度がしきい値未満であればその全角文字の切
出しを確定してしまう。したがって、残りの文字につい
て、切出し位置が確定された部分を除く残りの未確定文
字セグメント列に対して、確定された組合せを崩さない
で前記以外のすべてのセグメントの組合せを作り認識を
することになる。

【００１０】前記請求項３及び４の文字切出し・認識方
法及び装置によれば、１セグメントずつ半角文字認識用
辞書を用いて半角文字（例えば英数字）の認識を試み、
認識文字との相違度がしきい値未満であればその文字の
切出しを確定する。最後には、前記の方法では切り出さ
れなかった未確定文字セグメント列に対して、前記以外
のすべてのセグメントの組合せを作り文字認識をする。

【００１１】前記請求項５及び６の文字切出し・認識方
法及び装置によれば、全角文字幅を超えない範囲で最大
幅を有する文字セグメントの各組合せに対して認識用辞
書を用いて文字認識を試み、認識文字との相違度がしき
い値未満であればその全角文字の切出しを確定してしま
い、残りの文字について、１セグメントずつ半角文字認
識用辞書を用いて半角文字（例えば英数字）の認識を試
み、認識文字との相違度がしきい値未満であればその文
字の切出しを確定する。最後には、前記の方法では切り
出されなかった未確定文字セグメント列に対して、前記
以外のすべてのセグメントの組合せを作り文字認識をす
る。

【００１２】

【実施例】以下実施例を示す添付図面によって詳細に説
明する。図２は、本発明の文字切出し・認識方法を実施
する文字認識装置の基本的な構成を示すブロック図であ
る。この文字認識装置は、読取対象である文字を記載し
た原稿面を照明し、その反射光により形成された光学像
をビジコンや固体撮像素子などを用いて電気信号に変換
するスキャナ４を備えている。スキャナ４は、画像信号
を原稿面の濃淡に対応した二値化信号に変換する二値化
回路（図示せず）を備えている。

【００１３】スキャナ４からの二値化信号は、ラインを
介して本体処理部８に与えられる。この本体処理部８は
ラインからの信号を、画像メモリ８１に一時記憶する。
画像メモリ８１に記憶された画像は、文字列抽出回路８
２において文字列の抽出が行われる。文字列の抽出は、
与えられた二値データに対して、黒画素数を水平方向に
カウントして（横書きの場合）、縦方向のヒストグラム
を作り、その形状に基づいて行う。

【００１４】セグメント分割回路８３においてこのよう
に抽出された文字列に対して、黒画素数を縦方向にカウ
ントして行方向のヒストグラムを作り、連続した黒画素
の塊であるセグメントに分割する。次に算出回路８４に
おいて、全角文字幅Ｗmax の算出を行う。算出の方法
は、各行の高さの最大値を求め、これを文字サイズＷma
x としてもよく（行の高さを文字サイズに等しいとする
のは、日本語文字はほぼ正方形となっているからであ
る。）、セグメント幅の分布を調べてその度数分布が急
激に下がる値を求めて、これを文字サイズＷmax として
もよい。文字サイズＷmax を用いて、以下、各々のセグ
メントが全角非分離文字であるのか、分離文字（日本語
文書において漢字・かなに特有の左右又は上下に分離さ
れた文字をいう。横書きの場合「川」「い」等の文字が
これにあたり、縦書きの場合「京」等の文字がこれにあ
たる。）の一部若しくは半角文字であるのか、あるいは
接触文字（他の図形と接触しているので、当該他の図形
と一緒に切り出してしまった図形）であるかの判定が容
易にできる。

【００１５】文字切出し及び認識回路８５においては、
このように分割された各セグメントに対して文字の切出
し及び確定処理が行われる。以上の一連の処理につい
て、フローチャート（図１）を参照しながら詳細に説明
する。画像メモリ８１に記憶された画像データに対し
て、前記文字列の抽出（ステップＳ１）及びセグメント
分割（ステップＳ２）を行うと、セグメントの横幅のデ
ータ分布を調べて全角文字幅Ｗmax を算出する（ステッ
プＳ３）。

【００１６】つぎに、各セグメントについて、全角文字
幅Ｗmax を用いて文字切出しを行う（ステップＳ４）。
切出しの方法は、図３に示すように各セグメントに対
し、そのセグメントとその前又は後の隣接セグメントを
結合したものの幅を全角文字幅Ｗmax と比較し、いずれ
も全角文字幅Ｗmax を超えていれば、そのセグメントを
全角非分離文字であるとし、切出しを確定する（図３
(a) 参照）。なぜならＷmax は全角文字の最大幅と仮定
されているので、これを超える文字は存在しないはずだ
からである。

【００１７】さらに未確定セグメント列の抽出を行う
（ステップＳ６）。前のセグメントを結合したものの幅
のみが全角文字幅Ｗmax を超えていれば、それは未確定
セグメント列の先頭ということになり（図３(b) 参
照）、後ろのセグメントを結合したものの幅のみが全角
文字幅Ｗmax を超えていれば、それは未確定セグメント
列の後尾ということになり（図３(c) 参照）、前後のセ
グメントを結合したものの幅が全角文字幅Ｗmax 以内で
あれば、それは未確定セグメント列の内部ということに
なる（図３(d) 参照）。

【００１８】これらの処理により、各行に対して、全角
非分離文字（図３(a) ）を抽出して切出しを確定し、残
りを未確定セグメント列（図３(b) 〜(d) ）として抽出
することができる。なお、実際には全角非分離文字だけ
でなく、前後にある程度の空白の存在する半角文字の切
出しも確定することができる。

【００１９】次に、未確定セグメント列に対して、切出
し確定の処理を行う。１つの未確定セグメント列を構成
するセグメント数をｎとし、構成セグメント間の切出し
候補位置を「ノード」ということにする。セグメントと
ノードとの関係を図４に示す。第ｉ番目のノードと、第
ｊ（ｊ＞ｉ）番目のノードに注目し、ｉ，ｊ間にあるセ
グメントを結合してできる文字を、セグメントの組合せ
（ｉ，ｊ）で表す。セグメントの組合せ（ｉ，ｊ）を文
字認識した結果得られる相違度に基づいて決定される評
価値をＴ(i,j) で表す。例えば、Ｔ(i,j) ＝「相違度」×（ｊ−ｉ）とする。すべてのセグメントの組合せ（ｉ，ｊ）に対す
る評価値をＴ(i,j) を格納するテーブルを評価値テーブ
ルという。

【００２０】従来の方法では、差（ｊ−ｉ）が予め定め
られた上限幅Ｕ_max以下であるすべてのセグメントの組
合せ（ｉ，ｊ）について、文字認識を行っていた。本実
施例では、このセグメントの組合せの文字認識を以下の
ように行う。 (1) 全角分離文字認識（ステップＳ７）未確定セグメント列中で、全角文字幅Ｗmax を用いて全
角分離文字と想像されるセグメントの組合せ（ｉ，ｊ）
（ｊは、ｉに全角文字幅Ｗmax に相当するノード数ｗを
加えたもの）を抽出して優先的に文字認識する。

【００２１】もし、文字認識結果が確実、いいかえれば
相違度がしきい値以下ならば、そのセグメントの組合せ
に対応する切出し位置を部分的に確定しＴ(i,j) ＝０と
おき（ステップＳ８）、このセグメントの組合せを崩す
ような他のセグメントの組合せの文字認識を省略する。
具体的には、（ｉ，ｊ）が確定すれば、次の全角分離文
字認識処理は、ｉ＝ｊとおいて，組合せ（ｊ，ｊ＋ｗ）
からスタートする。そして、このセグメントの組合せに
触れる他のセグメントの組合せの評価値を無限大に設定
する。数式で表現すると、０≦ｋ₁＜ｊ，かつｉ＋１≦ｋ₂＜ｎ（ｋ₁＜ｉ＋１の
とき）または、０≦ｋ₁＜ｊ，かつｋ₁＋１≦ｋ₂＜ｎ（ｉ＋１≦ｋ₁
＜ｊのとき）を満たすセグメントの組合せ（ｋ₁，
ｋ₂）に対して文字認識を省略し、Ｔ(k_1,k₂) ＝無限大
とおく。

【００２２】もし、文字認識の結果，未確定ならば、次
の全角分離文字認識処理は、組合せ（ｉ＋１，ｊ＋１）
からスタートする。 (2) 半角英数字・半角文字認識（ステップＳ９）上の方法で文字認識できなかった未確定のセグメント列
を構成する各セグメント（ｉ，ｉ＋１）、すなわち、個
々のセグメントの１つ１つを半角英数字又は記号とみな
して文字認識する。このようにするのは、(1) の処理を
しても確定されない場合は、未確定セグメントは英単語
など半角文字からなる可能性が高いからである。したが
って、文字認識用辞書８６の識別範囲も英数字及び記号
のみとする。部分的に確定すれば全角分離文字認識と同
様、切り出し部分確定処理（Ｔ(i,i+1) ＝０）を行う
（ステップＳ１０）、確定できなければ、Ｔ(i,j) ＝「相違度」×１とおき、次の組合せ（ｉ＋１，ｉ＋２）の認識を始め
る。 (3) 残りのセグメントの組合せの文字認識（ステップＳ
１１）未確定セグメント列の中で、前記(1) (2) の方法で未確
定のすべてのセグメントの組合せについて、文字認識を
行う。

【００２３】以上のようにして、評価値Ｔ(i,j) を求
め、格納する評価値テーブルを作成するとともに、いま
まで部分的に確定した切り出し位置を含めて全体の切り
出し位置を統一的に確定し（ステップＳ１３）、切出し
位置決定用評価値の和として定義される評価関数ＪＪ＝ΣＴ(i,j) を最小にする最適経路を、動的計画法を用いて探索する
ことにより、未確定セグメント列全体の最適な切出し位
置を求めることができ、その切出し位置に相当する文字
分の認識結果を出力することができる。

【００２４】以上のように、この実施例によればセグメ
ントの組合せの際の文字認識処理順序を効率的に組むこ
とにより、切出し位置を部分的に確定することができ、
確定された切出し位置を尊重して他の未確定な切出し位
置についてのみ次の文字認識処理を行うことになり、処
理速度の大幅な向上を図ることができる。前記実施例の
手法を具体例を用いて説明する。

【００２５】図５(a) は、「大雨で川幅が１５ｍになっ
た」という切出し対象文字列を示し、全角文字幅Ｗmax
を用いて文字切出しを行った結果、「大」「雨」「で」
「な」「っ」「た」の６つのセグメントが、前又は後の
セグメントを結合したものの幅が全角文字幅Ｗmax を超
えている文字、すなわち全角非分離文字と判定されたも
のとする。したがって、未確定セグメント列は図５(b)
に示されるように「川幅が１５ｍに」の１０個のセグメ
ントから構成される。

【００２６】この未確定セグメント列に対して、前記
(1) の「全角分離文字認識」処理を行う。まずｉ＝０と
おき、Ｗ（０，ｊ）＜Ｗmax を満足する最大のｊを求め
るとｊ＝３となる。そこで、セグメントの組合せ（０，
３）に対して文字認識処理をする（図５(c) ）。この
結果、「川」と文字認識できたので、Ｔ（０，３）＝０
とし、切出しを確定する。次の処理はｉ＝３から始め
る。前記と同じ処理をすると、セグメントの組合せ
（３，５）が「幅」と文字認識できたので（図５(c)
）、Ｔ（３，５）＝０とし、切出しを確定する。

【００２７】次の処理はｉ＝５から始める。前記と同じ
処理をすると、セグメントの組合せ（５，７）に対して
文字認識処理をすることになる（図５(c) ）。この結
果、はっきりと文字認識できないので、Ｔ（５，７）＝
「相違度」×（７−５）とし、次の処理は、ノードを１
つずらして行う。すなわちセグメントの組合せ（６，
８）に対して文字認識処理をする（図５(c) ）。この
場合も正確に文字認識できないので、Ｔ（６，８）＝
「相違度」×（８−６）とし、次のセグメントの組合せ
（７，９）に対して文字認識処理をする（図５(c)
）。この場合も正確に文字認識できないので、Ｔ
（７，９）＝「相違度」×（９−７）とし、次のセグメ
ントの組合せ（８，１０）に対して文字認識処理をする
（図５(c) ）。セグメントの組合せ（８，１０）は
「に」と文字認識できるので、Ｔ（８，１０）＝０と
し、切出しを確定する。

【００２８】以上の結果、ノード０から５までと、８か
ら１０までのセグメントの切出しを確定できたことにな
る。次に、未確定セグメント列５から８について、前記
(2)の半角英数字・半角記号文字認識処理を行う。ま
ず、ｉ＝５，ｊ＝ｉ＋１＝６とおいて、半角英数字の文
字認識用辞書を用いてセグメントの組合せ（５，６）の
文字認識を行う（図５(c) ）。「1 」と文字認識でき
たので、ノード６を切出し位置として確定し、次のセグ
メントの組合せ（６，７）の文字認識を行う（図５(c)
）。「5 」と文字認識できたので、ノード７を切出し
位置として確定し、次のセグメントの組合せ（７，８）
の文字認識を行う（図５(c) ）。「m 」と文字認識で
きたので、ノード８を切出し位置として確定する。

【００２９】以上のようにして、すべての切出し位置を
確定することができる。図６は、縦軸に前ノード、横軸
に後ろノードをとり、どのようなセグメントの組合せが
あるかを分かりやすく図示したものである。右上がりの
斜線で示した部分は前ノード≧後ろノードを満たす領域であり、理論的には存在しない。右下がり
の斜線で示した部分は前ノード＋全角文字幅Ｗmax に相当するノード数＜後ろ
ノードを満たす領域であり、全角文字幅を超える文字は存在し
ないと仮定したのでここに文字は存在しない。

【００３０】例えば、前記セグメントの組合せ（０，
３）は、のように文字認識され、切出し位置を部分的
に確定するので、から縦線が引かれ、この縦線をまた
ぐセグメントの組合せ例えば（２，４）は文字認識が省
略されると考えればよい。のセグメントの組合せ
（３，５）も文字認識されたことを示し、から縦線が
引かれる。は文字認識できず、は文字認識され
たので縦線が引かれる。そして、残りのについて
半角文字認識が行われる。

【００３１】このように処理を行うので、文字認識回数
は、からまで９回で済む。ところが、従来の手法で
は、２１回（図６の白い矩形の数に相当）も処理を行う
ことになり、実施例では文字認識回数は大幅に減少して
いる。なお、前記図５の実施例では前記(1) の「全角分
離文字認識」処理と、前記(2) の「半角英数字・半角記
号文字認識」処理とですべてのセグメントを確定するこ
とができた。しかし、前記(1) 及び(2) の処理だけで
は、まだ未確定のセグメント列が存在するときは、残っ
たすべての組合せについて文字認識処理を行う必要があ
る。例えば図５の例でいえば、仮に(1) の処理では組合
せ（０，３）が確定せず、(2) の処理では組合せ（０，
１）、（１，２）、（２，３）が確定しなかったときに
は、残りの組合せ（０，２）、（１，３）についても文
字認識を試みる。

【００３２】なお、本発明は前記実施例に限定されるも
のではない。前記実施例では、(1)の「全角分離文字認
識」処理と、前記(2) の「半角英数字・半角記号文字認
識」処理と、(3) の「他の全ての組合せの文字認識」処
理を行うものであったが、文字列が半角文字を含まない
ことが分かっている場合は(2) の処理を省略してもよ
い。

【００３３】また、文字列が英数字のみを含む場合は
(1) の処理を省略してもよい。例えば未確定セグメント
列の抽出（図１ステップＳ６）をした時点で、プロポー
ショナルピッチによって各セグメント間の空白の間隔と
ほぼ等しいと分かった場合、この未確定セグメント列は
英数字列である可能性が高い。また、(1) の「全角分離
文字認識」処理をしていって一度も確定されない場合
も、半角文字列である可能性は高い。

【００３４】さらに、スキャナ４により画像信号を取得
するのに代えて、ファクシミリなどの回線を通して画像
信号を取得してもよい。

【００３５】

【発明の効果】以上のように請求項１及び２の文字切出
し・認識方法及び装置によれば、まず、通常最も出現頻
度が高い全角文字の認識を試みることによって全角文字
の切出しを確定するので、残った未確定文字セグメント
列に対してのみ認識をすればよいことになり、認識対象
数を減少させることができ、その結果処理時間の短縮化
を図ることができる。

【００３６】請求項３及び４の文字切出し・認識方法及
び装置によれば、１セグメントずつ半角文字認識用辞書
を用いて半角文字（例えば英数字）の認識を試み、認識
文字との相違度がしきい値未満であればその文字の切出
しを確定するので、前記の方法では切り出されなかった
未確定文字セグメント列、特に半角文字からなる文字列
に対して、前記以外のすべてのセグメントの組合せを作
り文字認識を試みるだけでよくなるので、認識対象数を
減少させることができ、その結果処理時間の短縮化を図
ることができる。

【００３７】請求項５及び６の文字切出し・認識方法及
び装置によれば、全角文字の切出しを確定した後、半角
文字（例えば英数字）を確定するので、最後には、前記
の方法では切り出されなかった未確定文字セグメント列
に対して、前記以外のすべてのセグメントの組合せを作
り文字認識を試みるだけでよくなるので、認識対象数を
さらに減少させることができその結果処理時間の短縮化
を図ることができる。

【図面の簡単な説明】

【図１】本発明の手順を説明する流れ図である。

【図２】本発明の文字切出し・認識方法を実施する文字
認識装置の基本的な構成を示すブロック図である。

【図３】全角文字幅Ｗmax を用いて文字切出しを行う方
法を説明する図であり、(a) は全角非分離文字の抽出、
(b) 〜(d) は未確定セグメント列の抽出を示す。

【図４】セグメントとノードとの関係を説明する図であ
る。

【図５】切出し対象文字列について、発明の手法を適用
した図であり、(a) は切出し対象セグメント列、(b) は
未確定セグメント列、(c) は文字切出し順序を示す図で
ある。

【図６】縦軸に前ノード、横軸に後ろノードをとり、ど
のようなセグメントの組合せがあるかを示した図であ
る。

【符号の説明】

８３セグメント分割回路８４算出回路８５文字切出し及び認識回路８６文字認識用辞書

Claims

【特許請求の範囲】

【請求項１】文字を含む被読取対象を表わす画像信号を
取得し、取得された画像信号に含まれる文字列を抽出
し、抽出された文字列を連続した画素の集まりであるセ
グメントに分割し、分割された文字セグメントから構成
される文字の切出しを行う文字切出し・認識方法におい
て、切り出し位置が未確定の文字セグメント列に対して、全
角文字幅を超えない範囲で最大幅を有する文字セグメン
トの組合せについて認識用辞書を用いて文字認識を試
み、認識文字との相違度がしきい値未満であればその文字の
切出しを確定し、切出し位置が確定された部分を除く残りの文字セグメン
ト列があればその未確定文字セグメント列に対して、前
記以外のすべてのセグメントの組合せを作り認識用辞書
を用いて文字認識を試みることを特徴とする文字切出し
・認識方法。
【請求項２】文字を含む被読取対象を表わす画像信号を
取得し、取得された画像信号に含まれる文字列を抽出
し、抽出された文字列を連続した画素の集まりであるセ
グメントに分割し、分割された文字セグメントから構成
される文字の切出しを行う装置において、抽出された文字列画像データから、全角文字幅を算出す
る手段と、切り出されなかった未確定文字セグメント列に対して、
全角文字幅を超えない範囲で最大幅を有する文字セグメ
ントの組合せに対して認識用辞書を用いて文字認識を試
みる手段と、認識文字との相違度がしきい値未満であればその文字の
切出しを確定する手段と、切出し位置が確定された部分を除く残りの未確定文字セ
グメント列に対して、前記以外のすべてのセグメントの
組合せを作り文字認識を試みる手段とを備えることを特
徴とする文字切出し・認識装置。
【請求項３】文字を含む被読取対象を表わす画像信号を
取得し、取得された画像信号に含まれる文字列を抽出
し、抽出された文字列を連続した画素の集まりであるセ
グメントに分割し、分割された文字セグメントから構成
される文字の切出しを行う文字切出し・認識方法におい
て、切り出し位置が未確定の文字セグメント列に対して、１
セグメントずつ半角文字認識用辞書を用いて文字認識を
試み、認識文字との相違度がしきい値未満であればその文字の
切出しを確定し、切出し位置が確定された部分を除く残りの文字セグメン
ト列があればその未確定文字セグメント列に対して、前
記以外のすべてのセグメントの組合せを作り認識用辞書
を用いて文字認識を試みることを特徴とする文字切出し
・認識方法。
【請求項４】文字を含む被読取対象を表わす画像信号を
取得し、取得された画像信号に含まれる文字列を抽出
し、抽出された文字列を連続した画素の集まりであるセ
グメントに分割し、分割された文字セグメントから構成
される文字の切出しを行う装置において、抽出された文字列画像データから、全角文字幅を算出す
る手段と、切り出されなかった未確定文字セグメント列に対して、
１セグメントずつ半角文字認識用辞書を用いて文字認識
を試みる手段と、認識文字との相違度がしきい値未満であればその文字の
切出しを確定する手段と、切出し位置が確定された部分を除く残りの文字セグメン
ト列があればその未確定文字セグメント列に対して、前
記以外のすべてのセグメントの組合せを作り認識用辞書
を用いて文字認識を試みる手段とを備えることを特徴と
する文字切出し・認識装置。
【請求項５】文字を含む被読取対象を表わす画像信号を
取得し、取得された画像信号に含まれる文字列を抽出
し、抽出された文字列を連続した画素の集まりであるセ
グメントに分割し、分割された文字セグメントから構成
される文字の切出しを行う文字切出し・認識方法におい
て、切り出し位置が未確定の文字セグメント列に対して、全
角文字幅を超えない範囲で最大幅を有する文字セグメン
トの組合せについて認識用辞書を用いて文字認識を試
み、認識文字との相違度がしきい値未満であればその文字の
切出しを確定し、切出し位置が確定された部分を除く残りの文字セグメン
ト列があればその未確定文字セグメント列に対して、１
セグメントずつ半角文字認識用辞書を用いて文字認識を
試み、認識文字との相違度がしきい値未満であればその文字の
切出しを確定し、切出し位置が確定された部分を除く残りの文字セグメン
ト列があればその未確定文字セグメント列に対して、前
記以外のすべてのセグメントの組合せを作り認識用辞書
を用いて文字認識を試みることを特徴とする文字切出し
・認識方法。
【請求項６】文字を含む被読取対象を表わす画像信号を
取得し、取得された画像信号に含まれる文字列を抽出
し、抽出された文字列を連続した画素の集まりであるセ
グメントに分割し、分割された文字セグメントから構成
される文字の切出しを行う装置において、抽出された文字列画像データから、全角文字幅を算出す
る手段と、切り出されなかった未確定文字セグメント列に対して、
全角文字幅を超えない範囲で最大幅を有する文字セグメ
ントの組合せに対して認識用辞書を用いて文字認識を試
みる手段と、認識文字との相違度がしきい値未満であればその文字の
切出しを確定する手段と、切出し位置が確定された部分を除く残りの未確定文字セ
グメント列に対して、１セグメントずつ半角文字認識用
辞書を用いて文字認識を試みる手段と、認識文字との相違度がしきい値未満であればその文字の
切出しを確定する手段と、切出し位置が確定された部分を除く未確定文字セグメン
ト列に対して、前記以外のすべてのセグメントの組合せ
を作り文字認識を試みる手段とを備えることを特徴とす
る文字切出し・認識装置。