JPH10154207A

JPH10154207A - 文字切出し方法および文字切出し装置

Info

Publication number: JPH10154207A
Application number: JP8311079A
Authority: JP
Inventors: Hiroshi Sasaki; 佐々木　　寛; Hirohisa Goto; 裕久後藤
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1996-11-21
Filing date: 1996-11-21
Publication date: 1998-06-09

Abstract

(57)【要約】【課題】文字列の連接関係を利用して文字切出しを行
うに当たって、文字列の比較を、文字コードの類似度を
直接的に用いずに行う。【解決手段】入力文字列を取得するための画像入力部
１０と、取得した入力文字列から候補文字を抽出するた
めの候補文字抽出手段１２と、抽出した候補文字を配列
させ候補文字列を作成する候補文字列作成手段１４と、
作成した候補文字列から最良文字列を選択するための最
良文字列選択手段１６とを具えている。最良文字列選択
手段１６は、作成した候補文字から、最も文字種が統一
されている候補文字列を最良文字列として選択するよう
に構成されている。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、手書き文字の認
識を行うに当たって入力文字列から文字の切出しを行う
装置および方法に関する。

【０００２】

【従来の技術】手書き文字は、文字間隔や文字形状の標
準文字との相違の度合いが大きいため、「一定間隔で文
字を切り出す」といった従来手法では十分な文字切出し
精度が得られない。この問題に対して、文献１「電子通
信学会論文誌 '86/9 Vol.J69-DNo.9 pp1292-1301 」に
開示されているように、候補文字ラティスの手法を用い
た文字切出し方法が提案されている。この文献１に開示
されている方法によれば、入力文字列から要素矩形を抽
出し、隣接する要素矩形同士の網羅的な組合せ（以下、
候補文字と称する。）を生成してそれらの認識処理を行
い、全候補文字の認識結果を評価して最適な文字パタン
（文字列）を選択することにより、入力文字列の文字切
出しを行う。

【０００３】ところで、上述した文献１に開示されてい
る従来手法によれば、全候補文字の認識処理と文字パタ
ンの評価とを行わなければならないから、入力文字列が
長くなると探索空間が非常に大きくなり、このため膨大
な演算量を必要とする。そこで、文献２「特開平６−１
９５５０８」に開示されているように、最初に入力文字
列から形状的知識に基づき文字切出しを行い、次に単語
の連接関係を利用して不当な文字切出し部分を抽出し、
その部分だけを要素矩形に分離して網羅的な文字切出し
を行うことにより、探索空間の削減を図っている。

【０００４】

【発明が解決しようとする課題】しかしながら、上述し
た文献１および文献２に開示の手法においては、候補文
字の特徴と標準文字の特徴との類似度（文字らしさのこ
と。あるいは、相違度、距離、確信度、尤度のこと。）
を求め、その類似度が最も高くなる候補文字の組合せを
文字パタンとして求めている。従って、各類似度が同一
の尺度に基づいて求められていない場合には、これら類
似度の比較を行うことができず、文字パタンの評価が正
確に行えない。

【０００５】パタンの特徴は、例えば特徴ベクトルによ
り定量的に捉えることが可能である。そして、パタンの
類似度は、「特徴ベクトルの近さ」で表現することがで
きる。特徴ベクトルの近さの尺度としては、例えば「距
離」がある。パタン間の類似性を検討する場合、特徴ベ
クトル間の距離が小さいときに両パタンの類似度が高い
といえる。また、別の尺度として特徴ベクトル間の「角
度」を用いる方式がある。尺度として距離を用いる場合
には特徴ベクトルの大きさに基づいて類似度を決めてい
たのに対し、尺度として角度を用いる場合には特徴ベク
トルの方向性を問題にする。従って、大きさの違う相似
形のパタンの認識に適した尺度となっている。

【０００６】このように認識方式によって尺度が異なっ
ている場合があり、このような場合には上述したように
類似度の比較を行うことができなかった。よって、候補
文字の文字らしさを評価に取り入れることができず、こ
のため文字切出し精度が低下してしまっていた。従っ
て、従来より、認識尺度が異なっていたとしても、文字
切出し精度を低下させることなく候補文字の評価を行い
最適文字パタンを得ることのできる文字切出し方法およ
び文字切出し装置の出現が望まれていた。

【０００７】

【課題を解決するための手段】そこで、この発明の文字
切出し方法によれば、文字認識対象である入力文字列か
ら連続した複数個の候補文字を抽出し、これら候補文字
の配列からなる複数の候補文字列を作成し、前記抽出し
た各候補文字の認識結果に基づき前記候補文字列の中か
ら最良文字列を選択することにより、前記入力文字列の
文字切出し位置を決定する文字切出し方法において、前
記最良文字列として、複数の前記候補文字列の中で最も
文字種が統一されている候補文字列を選択することを特
徴とする。

【０００８】例えば、入力文字列として、姓名や住所の
ような文字列を例に取ると、１文字目が漢字であれば途
中で数字や英字に変化することは、統計的に見て、ほと
んど皆無である。従って、このような文字列では、文字
列を構成する文字の文字種が統一されていると仮定する
ことができる。よって、文字種が最も統一されるような
候補文字の組合せを選択するこの発明の方法によれば、
高い文字切出し精度を実現できる。

【０００９】また、この発明の文字切出し方法の好適な
実施例によれば、前記候補文字の抽出を、（ａ）前記入
力文字列の各黒ブロック領域をセグメントＳ_i （ｐを整
数とするとき、ｉは０≦ｉ≦ｐを満たす整数）として抽
出し、その位置情報をメモリ手段に記録するステップ
と、（ｂ）前記記録したセグメントＳ_i の位置情報に基
づきセグメント同士を統合して新たなセグメントＳ_j
（ｑを整数とするとき、ｊはｐ＋１≦ｊ≦ｐ＋ｑを満た
す整数）を生成し、このセグメントＳ_j の位置情報を前
記メモリ手段に追加記録することにより、このメモリ手
段に記録されている全てのセグメントＳ_i およびＳ_j を
前記候補文字Ｓ_k （但し、ｋは０≦ｋ≦ｐ＋ｑを満たす
整数）として取得するステップとを以て行い、前記候補
文字列の作成を、（ｃ）前記記録した候補文字Ｓ_k の位
置情報に基づき各候補文字を前記入力文字列を再現せし
めるように配列した情報を、前記候補文字列Ｐ_r （ｒは
整数）として作成することにより行い、前記最良文字列
の選択を、（ｄ）前記記録した候補文字Ｓ_k の位置情報
を前記メモリ手段から読み出し、この位置情報に基づい
て前記入力文字列から各候補文字に対応する文字画像を
切り出し、この切り出した文字画像の文字認識を行って
類似度の高い順に上位Ｍ位（Ｍは整数）までの文字コー
ドを取得するステップと、（ｅ）各候補文字Ｓ_k ごとに
前記取得した上位Ｍ位の文字コードをＮ種類（Ｎは整
数）の文字種に分類し、第ｈ番目（ｈは１≦ｈ≦Ｎを満
たす整数）の文字種に属する前記文字コードの個数Ｉ_kh
を計数するステップと、（ｆ）前記計数結果である文字
コードの個数Ｉ_khを前記文字コード数Ｍで除算して値Ｉ
_kh／Ｍを算出し、さらにこの値Ｉ_kh／Ｍに認識対象の候
補文字Ｓ_k を構成するセグメント数Ｗ_k を積算したもの
を文字評価値Ｗ_k ・Ｉ_kh／Ｍとして算出するステップ
と、（ｇ）第ｈ番目の文字種につき第ｒ番目の候補文字
列Ｐ_r に従い前記算出した文字評価値Ｗ_k ・Ｉ_kh／Ｍを
選択して計数した結果を、第ｒ番目の候補文字列Ｐ_r の
文字列評価値Σ_r Ｗ_k ・Ｉ_kh／Ｍとして算出するステッ
プと、（ｈ）前記算出した文字列評価値Σ_r Ｗ_k ・Ｉ_kh
／Ｍが最大のときに第ｒ番目の候補文字列Ｐ_r を前記最
良文字列として選択するステップとを以て行うことを特
徴とする。

【００１０】このように、各候補文字の文字認識処理を
行って、類似度に基づいてＭ個の文字コードを取得し
（ステップ（ｄ））、候補文字ごとに取得した文字コー
ドを文字種に従って分類し、各分類の文字コード数を計
数し（ステップ（ｅ））、その個数を１つの候補文字に
対して求める文字コードの個数Ｍで除算することにより
（ステップ（ｆ））、ある候補文字から取得した各文字
コードの文字種ごとの割合を求めることができる。な
お、上述したステップ（ｆ）においてセグメント数を積
算するのは、文字数が多い候補文字列ほど文字列評価値
が大きくなってしまうから、これを文字数で正規化する
ためである。そして、各候補文字に対して求めた「割
合」を文字種ごとに候補文字列に従って加算することに
より（ステップ（ｇ））、その候補文字列をその文字種
が占める割合（文字列評価値）を求めることができる。
よって、求めた各文字列評価値の中から最大の文字列評
価値の候補文字列を、最良文字列として選択して出力す
ることができる（ステップ（ｈ））。

【００１１】また、この発明の文字切出し方法の好適な
実施例によれば、前記（ｂ）ステップにおける前記セグ
メントＳ_j の生成は、（ｂ１）入力文字列方向に順次に
整列するように番号付けされて前記メモリ手段に記録さ
れたセグメントＳ_n （ｎは、０≦ｎ≦ｐ−１を満たす整
数）の位置情報を、このメモリ手段から読み出すステッ
プと、（ｂ２）このセグメントＳ_n に隣接するセグメン
トＳ_n+1 の位置情報を、前記メモリ手段から読み出すス
テップと、（ｂ３）セグメントＳ_n とセグメントＳ_n+1
との間の距離Ｄ_n を前記読み出した各々の位置情報から
求めるステップと、（ｂ４）前記入力文字列の行高さＬ
の定数ｅ（ｅは正の実数）倍と前記求めた距離Ｄ_n とを
比較するステップと、（ｂ５）この比較結果がＤ_n ≦ｅ
・ＬのときにセグメントＳ_n とセグメントＳ_n+1 とを統
合して新たなセグメントＳ_j とするステップとを以て行
うことを特徴とする。

【００１２】このように、隣接するセグメント間の距離
に基づいて、この距離と行高さとを比較することによ
り、セグメントの組を統合するか否かを判定することが
できる。ここで、セグメント間の距離とは、例えば、各
セグメントの始端位置同士を結ぶ入力文字列方向の直線
距離のことである。また、行高さとは、入力文字列方向
に垂直な方向の黒ブロック領域（セグメント）の長さの
うち、最大のもののことである。また、好ましくは、前
述の定数ｅの値を１．２に設定するのが良い。この値
は、繰り返しテストを行って経験的に定めた値であり、
予め読み出し自在の状態でメモリ手段に記憶させてお
く。

【００１３】また、この発明の文字切出し方法の好適な
実施例によれば、前記（ｃ）ステップにおける候補文字
列Ｐ_r の作成を、入力文字列方向に順次に整列するよう
に番号付けされて前記メモリ手段に記録された候補文字
Ｓ_n （ｎは、０≦ｎ≦ｐ−１を満たす整数）の位置情報
を、このメモリ手段から読み出し、前記入力文字列の両
端位置と、候補文字Ｓ_n およびＳ_n+1 間の境界位置と
を、前記読み出した位置情報に基づき前記入力文字列方
向に順次に切出し候補位置Ｃ_m （ｍは、０≦ｍ≦ｐ＋１
を満たす整数）として求め、この切出し候補位置Ｃ_m を
前記候補文字の位置情報と対応付けてテーブルメモリ部
に記憶し、前記候補文字列を作成するための作成関数Ｆ
（Ｃ_m ，Ｐ_r ）を用いた処理を行う処理回路と、前記候
補文字の配列情報を記録するための候補文字記録部と、
前記配列情報を前記候補文字列として格納するための文
字列格納部とを具えた手段により、前記入力文字列を再
現せしめる候補文字の配列情報を求めることにより行う
ことを特徴とする。

【００１４】但し、切出し候補位置Ｃ_a （ａは、０≦ａ
≦ｐ＋１を満たす整数）および候補文字列Ｐ_r を引き数
とする作成関数Ｆ（Ｃ_a ，Ｐ_r ）は、（ｃ１）前記ａが
（ｐ＋１）であることを判定する処理と、（ｃ２）前記
判定結果がａ≠ｐ＋１の場合、切出し始点位置として前
記切出し候補位置Ｃ_a を、前記テーブルメモリ部から読
み出し、切出し終点位置として切出し候補位置Ｃ_b （ｂ
は、０≦ｂ≦ｐ＋１、ｂ＞ａを満たす整数）を、前記テ
ーブルメモリ部から読み出し、前記読み出した各切出し
候補位置Ｃ_a およびＣ_b 間の候補文字Ｓ_k を、前記候補
文字記録部に順次に配列情報として格納し、全候補文字
が前記候補文字記録部に格納された場合には、処理を終
了し、全候補文字が前記候補文字記録部に格納されてい
ない場合には、前記ａおよびｂにそれぞれ１を加えて、
次に、作成関数Ｆ（Ｃ_a+1 ，Ｐ_r）を呼び出す処理と、
（ｃ３）前記判定結果がａ＝ｐ＋１の場合、前記候補文
字記録部に格納されている配列情報を前記候補文字列Ｐ
_r として前記文字列格納部に格納し、全候補文字が前記
候補文字記録部に格納された場合には、処理を終了し、
全候補文字が前記候補文字記録部に格納されていない場
合には、前記ｒおよび差（ｂ−ａ）のそれぞれに１を加
えて、前記格納されている配列情報を初期化し、前記ａ
を初期化し（ａ＝０）、次に、作成関数Ｆ（Ｃ₀ ，Ｐ
_r+1 ）を呼び出す処理とを実行する関数である。

【００１５】このように、ある候補文字から、これとは
別の全ての候補文字を、切出し候補位置を指定すること
により辿り、その候補文字を配列情報としてグループ化
する上述の方法によれば、これら配列情報のそれぞれを
候補文字列として得ることができる。

【００１６】次に、この発明の文字切出し装置によれ
ば、文字認識対象である入力文字列を含む原画像を読み
取り、この読み取られた原画像を格納する画像メモリを
具えた画像入力部と、この画像メモリから前記入力文字
列を読み出し、この入力文字列から連続した複数個の候
補文字を抽出する候補文字抽出手段と、これら抽出され
た候補文字の配列からなる複数の候補文字列を作成する
候補文字列作成手段と、前記抽出された候補文字の認識
結果に基づき前記候補文字列の中から最良文字列を選択
することにより、前記入力文字列の文字切出し位置を決
定する最良文字列選択手段とを具える文字切出し装置に
おいて、前記最良文字列選択手段は、前記認識結果で最
も文字種が統一されている前記候補文字列を前記最良文
字列として選択する手段であることを特徴とする。

【００１７】このように、文字種が最も統一される候補
文字の組合せを選択して出力するこの発明の装置によれ
ば、高い文字切出し精度で文字を切り出すことができ
る。

【００１８】また、この発明の文字切出し装置の好適な
構成例によれば、前記候補文字抽出手段は、前記読み取
られた入力文字列を構成する各黒ブロック領域をセグメ
ントＳ_i （ｐを整数とするとき、ｉは０≦ｉ≦ｐを満た
す整数）として抽出し、これらセグメントＳ_i の位置情
報を記録するためのメモリ手段を具えたセグメント抽出
部と、前記メモリ手段に記録された位置情報を読み出
し、この位置情報に基づき前記抽出されたセグメント同
士を統合して新たなセグメントＳ_j （ｑを整数とすると
き、ｊはｐ＋１≦ｊ≦ｐ＋ｑを満たす整数）を生成し、
このセグメントＳ_j の位置情報を前記メモリ手段に追加
記録することにより、このメモリ手段に記録されている
全てのセグメントＳ_i およびＳ_j を前記候補文字Ｓ_k
（但し、ｋは０≦ｋ≦ｐ＋ｑを満たす整数）として取得
するセグメント統合部とを具えており、前記候補文字列
作成手段は、前記メモリ手段に記録された候補文字Ｓ_k
の位置情報を読み出し、この位置情報に基づいて候補文
字Ｓ_k を、前記入力文字列を再現せしめるように配列さ
せ、この配列情報を前記候補文字列Ｐ_r （ｒは整数）と
して記憶する手段であり、前記最良文字列選択手段は、
前記メモリ手段に記録されている候補文字Ｓ_k の位置情
報を読み出し、この位置情報に基づき前記画像メモリに
格納されている入力文字列から候補文字Ｓ_k の文字画像
を切り出し、この候補文字Ｓ_k の文字認識を行って類似
度の高い順に上位Ｍ位（Ｍは整数）までの文字コードを
取得し、この文字コードを格納するための文字コード格
納部を具えた文字認識部と、各候補文字Ｓ_k ごとに前記
文字コード格納部に格納されている上位Ｍ位の文字コー
ドを読み出し、これらをＮ種類（Ｎは整数）の文字種に
分類して第ｈ番目（ｈは１≦ｈ≦Ｎを満たす整数）の文
字種に属する文字コードの個数Ｉ_khを計数する文字種分
類部と、前記計数結果である文字コードの個数Ｉ_khを前
記文字コード数Ｍで除算して値Ｉ_kh／Ｍを算出し、さら
にこの値Ｉ_kh／Ｍに認識対象の候補文字Ｓ_k を構成する
セグメント数Ｗ_k を積算したものを文字評価値Ｗ_k ・Ｉ
_kh／Ｍとして算出する文字評価値算出部と、第ｈ番目の
文字種につき第ｒ番目の候補文字列Ｐ_r に従い文字評価
値Ｗ_k ・Ｉ_kh／Ｍを選択して計数し、第ｒ番目の候補文
字列Ｐ_r の文字列評価値Σ_r Ｗ_k ・Ｉ_kh／Ｍを算出する
文字列評価値算出部と、前記算出した各文字列評価値を
比較して、文字列評価値Σ_r Ｗ_k・Ｉ_kh／Ｍが最大であ
るときに第ｒ番目の候補文字列Ｐ_r を前記最良文字列と
して選択する文字列評価値比較部とを具えることを特徴
とする。

【００１９】このように、文字認識部は各候補文字の文
字認識処理を行って、類似度に基づいてＭ個の文字コー
ドを取得し、文字種分類部は候補文字ごとに取得した文
字コードを文字種に従って分類し、各分類の文字コード
数を計数し、文字評価値算出部はその個数を全文字コー
ド数Ｍで除算することにより、ある候補文字から取得し
た各文字コードの文字種ごとの割合を求める。また、文
字列評価値算出部は各候補文字に対して求めた「割合」
を文字種ごとに候補文字列に従って加算することによ
り、その候補文字列をその文字種が占める割合（文字列
評価値）を求める。従って、文字列評価値比較部は、求
められた文字列評価値の中から最大の文字評価値の候補
文字列を最良文字列として、選択して出力することがで
きる。

【００２０】また、この発明の好適な構成例によれば、
前記セグメント統合部は、入力文字列方向に順次に番号
付けされて前記メモリ手段に記録されたセグメントＳ_n
（ｎは、０≦ｎ≦ｐ−１を満たす整数）の位置情報を、
このメモリ手段から読み出す第１読出部と、セグメント
Ｓ_n に隣接するセグメントＳ_n+1 の位置情報を前記メモ
リ手段から読み出す第２読出部と、セグメントＳ_n とセ
グメントＳ_n+1 との間の距離Ｄ_n を前記読み出された各
々の位置情報から求める距離検出部と、前記検出された
距離Ｄ_n と前記入力文字列の行高さＬの定数ｅ（ｅは正
の実数）倍とを比較する比較部と、前記比較部の処理結
果がＤ_n ≦ｅ・Ｌのときに、セグメントＳ_n とセグメン
トＳ_n+1 とを統合して新たなセグメントＳ_j を生成する
セグメント生成部と、前記生成されたセグメントＳ_j の
位置情報を前記メモリ手段に追加記録する書込部とを具
えることを特徴とする。

【００２１】このように、隣接するセグメント間の距離
に基づいて、この距離と行高さとを比較することによ
り、セグメントの組を統合するか否かを判定することが
できる構成としてある。また、この構成において、好ま
しくは、前述の定数ｅの値が１．２に設定されているの
が良い。

【００２２】また、この発明の文字切出し装置の好適な
構成例によれば、前記候補文字列作成手段は、入力文字
列方向に順次に整列するように番号付けされて前記メモ
リ手段に記録された候補文字Ｓ_n （ｎは、０≦ｎ≦ｐ−
１を満たす整数）の位置情報を、このメモリ手段から読
み出し、前記入力文字列の両端位置と、候補文字Ｓ_nお
よびＳ_n+1 間の境界位置とを、前記読み出した位置情報
に基づき前記入力文字列方向に順次に切出し候補位置Ｃ
_m （ｍは、０≦ｍ≦ｐ＋１を満たす整数）として求め、
この切出し候補位置Ｃ_m を前記候補文字の位置情報と対
応付けてテーブルメモリ部に記憶するテーブル作成部
と、前記候補文字列Ｐ_r を作成するための作成関数Ｆ
（Ｃ_m ，Ｐ_r ）を用いた処理を行う処理回路と、前記候
補文字の配列情報を記録するための候補文字記録部と、
前記配列情報を前記候補文字列として格納するための文
字列格納部とを具えることを特徴とする。

【００２３】但し、切出し候補位置Ｃ_a （ａは、０≦ａ
≦ｐ＋１を満たす整数）および候補文字列Ｐ_r を引き数
とする作成関数Ｆ（Ｃ_a ，Ｐ_r ）は、（ｃ１）前記ａが
（ｐ＋１）であることを判定する処理と、（ｃ２）前記
判定結果がａ≠ｐ＋１の場合、切出し始点位置として前
記切出し候補位置Ｃ_a を、前記テーブルメモリ部から読
み出し、切出し終点位置として切出し候補位置Ｃ_b （ｂ
は、０≦ｂ≦ｐ＋１、ｂ＞ａを満たす整数）を、前記テ
ーブルメモリ部から読み出し、前記読み出した各切出し
候補位置Ｃ_a およびＣ_b 間の候補文字Ｓ_k を、前記候補
文字記録部に順次に配列情報として格納し、全候補文字
が前記候補文字記録部に格納された場合には、処理を終
了し、全候補文字が前記候補文字記録部に格納されてい
ない場合には、前記ａおよびｂにそれぞれ１を加えて、
次に、作成関数Ｆ（Ｃ_a+1 ，Ｐ_r）を呼び出す処理と、
（ｃ３）前記判定結果がａ＝ｐ＋１の場合、前記候補文
字記録部に格納されている配列情報を前記候補文字列Ｐ
_r として前記文字列格納部に格納し、全候補文字が前記
候補文字記録部に格納された場合には、処理を終了し、
全候補文字が前記候補文字記録部に格納されていない場
合には、前記ｒおよび差（ｂ−ａ）のそれぞれに１を加
えて、前記格納されている配列情報を初期化し、前記ａ
を初期化し（ａ＝０）、次に、作成関数Ｆ（Ｃ₀ ，Ｐ
_r+1 ）を呼び出す処理とを実行する関数である。

【００２４】このように、ある候補文字から、これとは
別の全ての候補文字を、切出し候補位置を指定すること
により辿り、その候補文字を配列情報としてグループ化
する上述した候補文字列作成手段の構成によれば、これ
ら配列情報のそれぞれを候補文字列として得ることがで
きる。

【００２５】

【発明の実施の形態】以下、図を参照して、この発明の
実施の形態につき説明する。尚、図は、この発明の構
成、配置関係および動作が理解できる程度に概略的に示
してあるに過ぎず、また、以下に記載する数値条件等は
単なる一例であり、従って、この発明は、この実施の形
態に何ら限定されることがない。

【００２６】［装置構成］最初に、この実施の形態の文
字切出し装置の構成につき主として説明する。図１は、
この実施の形態の文字切出し装置の構成を示すブロック
図である。この実施の形態の文字切出し装置は、画像入
力部１０、候補文字抽出手段１２、候補文字列作成手段
１４、最良文字列選択手段１６および制御部１８を具え
ている。以下、各構成要素につき順次に説明する。

【００２７】先ず、画像入力部１０には、２値画像また
は多値画像が入力される。この実施の形態では、画像入
力部１０を、原稿や帳票等の情報媒体上を走査するため
の走査機構（図示せず。）と情報媒体上からの光信号を
検出して電気信号に変換する光電変換部２０とを具える
読取部と、読み取った画像データ（原画像）を格納する
画像メモリ２２と、帳票や原稿等に記載された文字図形
パタンの記載位置情報に基づき通常行われる如く画像デ
ータから文書領域（入力文字列）を切り出す切出部２４
とを以て構成している。従って、例えば、上述の走査機
構および光電変換部でもって、文字列に沿った方向に走
査および画像検出を行い、次に、切出部でもって所望の
文書領域を入力文字列として切り出せる。

【００２８】＜候補文字抽出手段の構成＞そして、候補
文字抽出手段１２は、画像メモリ２２から文字認識対象
である入力文字列を読み出し、この入力文字列から連続
した複数個の候補文字を抽出する。このため、この候補
文字抽出手段１２は、セグメント抽出部２６とセグメン
ト統合部２８とを具えている。セグメント抽出部２６
は、画像メモリ２２から切出部２４を介して入力文字列
を読み出し、この入力文字列を構成する各黒ブロック領
域をセグメントとして抽出する手段である。そして、セ
グメント抽出部２６は、抽出したセグメントの位置情報
を記録するためのメモリ手段として座標メモリ３０を具
えている。

【００２９】図２に、入力文字列の一例を示す。この図
には、入力文字列３２として、手書きの「弘三」という
文字パタン（文字画像）が示されている。尚、この実施
の形態では、入力文字列が横書きである場合を想定して
いるが、これに限らず、縦書きであっても構わない。入
力文字列方向は、図中のＸ方向（主走査方向）である。
上述した黒ブロック領域とは、各文字パタンに外接する
矩形領域（セグメントと称する。）のことである。例え
ば、図２の図中で、文字パタン「弓」（「弘」の偏）を
含むセグメントＳ₀ 、文字パタン「ム」（「弘」の旁）
を含むセグメントＳ₁ 、文字パタン「三」を含むセグメ
ントＳ₂ が、それぞれセグメント抽出部２６により抽出
される。これらセグメントの抽出は、入力文字列をＸ方
向に走査して、入力文字列をＸ方向に投影した射影分布
すなわち黒点のヒストグラムを求め、このヒストグラム
の極小点をＸ軸上の切出し位置とし、同様に、入力文字
列をＸ軸に垂直なＹ方向に走査してヒストグラムを求
め、このヒストグラムの極小点をＹ軸上の切出し位置と
し、これら切出し位置で囲まれる矩形領域をセグメント
として抽出するといった公知の方法で行える。

【００３０】セグメントの抽出は、求められた切出し位
置同士の交点である四点（セグメントの各頂点に相当す
る。）の座標を検出することにより行われる。抽出され
たセグメントの座標は、座標メモリ３０にセグメント座
標テーブルとして格納される。図３に座標メモリ３０の
記憶状態（内部状態）すなわちセグメント座標テーブル
の一例を示す。図中左側に、文字パタン「ム」すなわち
セグメントＳ₁ を示し、図中右側に、セグメントＳ₀ 、
Ｓ₁ およびＳ₂ のそれぞれの座標（図３の図中のＸ_s 、
Ｘ_e 、Ｙ_s 、Ｙ_e の各成分値の組で表される。）が記載
されたセグメント座標テーブルを示す。このように、座
標メモリ３０には、セグメントに応じた所定の格納場所
に、そのセグメントの四頂点の座標が記録されている。

【００３１】次に、セグメント統合部２８は、セグメン
ト抽出部２６により座標メモリ３０に記録された位置情
報を読み出し、この位置情報に基づき抽出されたセグメ
ント同士を統合して新たなセグメントを生成し、この新
たなセグメントの位置情報を座標メモリ３０に追加記録
する。例えば、図２に示した入力文字列３２において
は、セグメントＳ₀ とセグメントＳ₁ とが統合されて新
たなセグメントＳ₃ が作成される。図４のブロック図に
示すように、この実施の形態では、セグメント統合部２
８は、第１読出部３４、第２読出部３６、距離検出部３
８、比較部４０、セグメント生成部４２および書込部４
４を具えている。以下、図２に示す入力文字列３２を処
理対象とする場合の、セグメント統合部２８の各構成要
素の動作につき説明する。

【００３２】先ず、第１読出部３４は、入力文字列方向
に順次に番号付けされて座標メモリ３０に記録されたセ
グメントＳ₀ およびＳ₁ の位置情報を、この座標メモリ
３０から順次に読み出す。今、第１読出部３４がセグメ
ントＳ₀ の位置情報を読み込んだとすると、このとき、
第２読出部３６は、セグメントＳ₀ に隣接するセグメン
トＳ₁ の位置情報を座標メモリ３０から読み出す。ま
た、第１読出部３４がセグメントＳ₁ の位置情報を読み
込んだときには、第２読出部３６は、セグメントＳ₁ に
隣接するセグメントＳ₂ の位置情報を座標メモリ３０か
ら読み出す。

【００３３】第１および第２読出部３４および３６に読
み出された各位置情報は、次に、距離検出部３８に送ら
れる。この距離検出部３８では、入力されたセグメント
Ｓ₀およびＳ₁ の位置情報からこれらセグメントＳ₀ お
よびＳ₁ 間の距離Ｄ₀ を検出し、また、これとは別のタ
イミングで入力されるセグメントＳ₁ およびＳ₂ の位置
情報からは、これらセグメントＳ₁ およびＳ₂ 間の距離
Ｄ₁ を検出する。ここで、セグメント間の距離Ｄ₀ は、
例えば、図５に示すように、各セグメントＳ₀およびＳ₁
の始端位置（図３の図中左側に示すＸ_s の位置に相当
する。）同士を結ぶ入力文字列方向の直線距離で定義さ
れる。従って、距離検出部３８は、各セグメントの始端
位置のＸ座標成分同士の差を検出することにより距離を
検出する構成としてある。例えば、距離検出部３８は、
このための差演算回路を具えている。

【００３４】距離検出部３８で検出された距離Ｄ₀ およ
びＤ₁ は、比較部４０に送られる。比較部４０では、検
出された距離と入力文字列の行高さＬの定数倍とが比較
される。ここで、行高さとは、各セグメントの、入力文
字列方向（図２のＸ方向）に垂直な方向（図２のＹ方
向）の長さのことであり、ここでは、入力文字列を構成
するセグメントのうち、この長さが最大のものを選んで
入力文字列の行高さＬとしている。この実施の形態で
は、距離検出部３８は、行高さＬの１．２倍の値とセグ
メント間の距離値とを比較する構成としてある。この
「１．２」という値は、繰り返しテストを行って、経験
的に定めた値である。この値は、比較部４０が具える読
み出し自在のメモリ手段に予め設定されており、距離情
報の入力タイミングとともに読み出されるように構成さ
れている。このようにして、比較部４０では、入力され
る距離値と値１．２Ｌとの大小関係が求められる。そし
て、比較部４０は、求めた大小関係に応じた信号をセグ
メント生成部４２に出力する。

【００３５】比較部４０の出力信号がＤ₀ ≦１．２Ｌの
場合に応じた信号であるときに、セグメント生成部４２
は、第１読出部３４および第２読出部３６からそれぞれ
セグメントＳ₀ およびＳ₁ を入力して、これらセグメン
トを統合して新たなセグメントＳ₃ を生成する。ここ
で、セグメントＳ₀ とセグメントＳ₁ との統合は、これ
ら各セグメントＳ₀ およびＳ₁ の両者を含む領域を新た
なセグメントＳ₃ として設定することにより行われる。
例えば、図６に示す統合後のセグメント座標テーブルに
あっては、セグメントＳ₀ とセグメントＳ₁ の対応する
成分値同士を比較したとき、大きい値の成分値が選択さ
れてセグメントＳ₃ の座標成分となっている。また、比
較部４０の出力信号がＤ₁ ＞１．２Ｌの場合に応じた信
号であるときには、セグメント生成部４２は、セグメン
トＳ₁ とセグメントＳ₂ とを統合しない。

【００３６】そして、セグメント生成部４２で生成され
た新たなセグメントＳ₃ の位置情報は、書込部４４によ
って座標メモリ３０に追加記録される。この新規セグメ
ントＳ₃ は、セグメント番号順になるように、この例で
は、座標メモリ３０のセグメントＳ₂ が格納されている
格納場所の隣の格納場所に格納される（但し、この新規
セグメントＳ₃ と始めに抽出したセグメントＳ₀ 、Ｓ₁
およびＳ₂ とは、区別された情報種として記憶され
る。）。この結果、図６に示すように、座標メモリ３０
の内部状態を表すセグメント座標テーブルが変更され
る。ここで、座標メモリ３０に記録されている全てのセ
グメントの各々を候補文字と称することにする。この統
合後のセグメント座標テーブルに位置情報が記録されて
いるセグメントが、候補文字として、次に説明する候補
文字列作成手段１４で処理される。

【００３７】＜候補文字列作成手段の構成＞次に、候補
文字列作成手段１４は、座標メモリ３０に記録された候
補文字の位置情報を読み出し、この位置情報に基づい
て、候補文字を、入力文字列を再現せしめるように配列
させ、この配列情報を候補文字列として記憶する手段で
ある。この実施の形態の候補文字列作成手段１４は、テ
ーブル作成部４６、処理回路４８、候補文字記録部５
０、文字列格納部５２およびテーブルメモリ部５４を具
えている。図７に、候補文字列作成手段１４の構成をブ
ロック図で示す。

【００３８】先ず、テーブル作成部４６は、入力文字列
方向に順次に整列するように番号付けされて座標メモリ
３０に記録された候補文字の位置情報を、座標メモリ３
０から読み出す。そして、テーブル作成部４６は、入力
文字列の両端位置と、互いに隣接する候補文字間の境界
位置とを、読み出した位置情報に基づき入力文字列方向
に順次に切出し候補位置として求める。例えば、図２に
示す入力文字列３２を処理対象とした場合、テーブル作
成部４６は、座標メモリ３０に記録されている候補文字
Ｓ₀ 、Ｓ₁ およびＳ₂ の各位置情報を読み出し、次に、
その位置情報に基づいて、切出し候補位置を求める。こ
の実施の形態では、各候補文字の始端位置（図３の図中
左側に示すＸ_s の位置に相当する。）と、入力文字列に
おける最後尾の候補文字の終端位置（図３の図中左側に
示すＸ_e の位置に相当する。）とを自動的に切出し候補
位置として検出するように、テーブル作成部４６が構成
されている。従って、この場合には、候補文字Ｓ₀ 、Ｓ
₁ およびＳ₂ の各始端位置をそれぞれ切出し候補位置Ｃ
₀ 、Ｃ₁ およびＣ₂ として検出し、また、候補文字Ｓ₂
の終端位置を切出し候補位置Ｃ₃ として検出する。

【００３９】次に、テーブル作成部４６は、検出した切
出し候補位置と各候補文字の位置情報との対応付けを行
い、この対応関係をセグメントテーブルとして、テーブ
ルメモリ部５４に格納する。図８は、セグメントテーブ
ルの一例を示す図である。図中の表の項目枠には、行欄
に始点位置としての切出し候補位置を取って示し、列欄
に終点位置としての切出し候補位置を取って示してい
る。そして、表のそれぞれのデータ枠には、始点位置と
終点位置とに挟まれる候補文字が記載されている。例え
ば、始点位置としての切出し候補位置Ｃ₀ の行欄と、終
点位置としての切出し候補位置Ｃ₁ の列欄とが交わる位
置には、候補文字Ｓ₀ が記録されたデータ枠がある。図
８のセグメントテーブルにおいて、セグメント記号が記
載されてない空白の枠には、「ＮＵＬＬ（空白文字）」
が記録されている。このように、セグメントテーブル
は、各候補文字の始点位置と終点位置との対応関係が記
述されている表である（このような対応関係を、グラフ
理論では隣接行列と称している。）。

【００４０】上述した処理回路４８は、候補文字列を作
成するための作成関数を用いた処理を行う回路であり、
テーブルメモリ部５４に記憶されている内容を参照し
て、候補文字の選択および配列を行う。候補文字記録部
５０は、処理回路４８による処理過程で作成される候補
文字の配列情報を記録するために用いられるメモリ手段
である。また、文字列格納部５２は、候補文字記録部５
０に一時的に記録されている配列情報を、処理回路４８
の指示に応じて、候補文字列として格納するためのメモ
リ手段である。これら各手段４８、５０および５２が相
俟って作動することにより、文字列格納部５２に候補文
字列が記録される。この候補文字列は、入力文字列を構
成する各候補文字が、入力文字列中における同位置に重
ならないように、かつ、入力文字列を再現せしめるよう
に、これら候補文字を配列させる情報である。例えば、
図２に示した入力文字列３２を構成する候補文字Ｓ₀ 、
Ｓ₁、Ｓ₂ およびＳ₃ を、上述した要件を満たすように
配列する仕方は２通りある。すなわち、候補文字列Ｐ₀
（Ｓ₀ 、Ｓ₁ 、Ｓ₂ という配列）と候補文字列Ｐ₁ （Ｓ
₃ 、Ｓ₂ という配列）とである（各候補文字列Ｐ₀ およ
びＰ₁ を、図２の図中の下側部分に２端子有向グラフの
形で示す。）。これら候補文字列Ｐ₀ およびＰ₁ は、文
字列格納部５２に、図９に示すテーブルの形で、最良文
字列選択手段１６に対して読み出し自在に記憶される。
図９に示す候補文字列テーブルは、候補文字列Ｐ₀ およ
びＰ₁ ごとに、候補文字の配列が記述された表である。
尚、テーブルの空白部分は、「ＮＵＬＬ」を表す。この
文字列格納部５２に格納されている候補文字列のいずれ
か一つが、最良文字列選択手段１６により、最良文字列
として選択される。このことは、別の表現で言い換えれ
ば、入力文字列の切出し候補位置が決定されるというこ
とである。尚、作成関数と処理回路４８の動作について
は［文字切出し方法］の項で詳述する。

【００４１】＜最良文字列選択手段の構成＞そして、こ
の実施の形態の最良文字列選択手段１６は、図１のブロ
ック図に示すように、文字認識部５６、文字種分類部５
８、文字評価値算出部６０、文字列評価値算出部６２お
よび文字列評価値比較部６４を具えている。候補文字抽
出手段１２で検出されて、座標メモリ３０に格納されて
いる候補文字の位置情報は、文字認識部５６により読み
出される。そして、文字認識部５６は、この位置情報に
基づき、画像メモリ２２に格納されている入力文字列
（入力文字列を含む原画像）から文字画像を切り出す。
この構成例では、先ず、文字認識部５６の指示の下に、
切出部２４が原画像から候補文字ごとの領域の文字画像
を切り出す。あるいは、これに限らず、文字認識部５６
に文字画像を切り出すための切出手段を別に具えてもよ
い。そして、この切り出された文字画像が文字認識部５
６に取り込まれて、そこで各文字画像に対して通常の文
字認識処理が施される。このため、文字認識部５６に
は、図示せずも、切り出された文字画像から特徴を抽出
するための手段と、標準文字の特徴を予め格納した辞書
とが具えられており、また、切り出された文字画像の特
徴と標準文字特徴とを比較するためのマッチング手段が
具えられている。この実施の形態では、両者の特徴の比
較を行うための手法については特に問わないし、また、
特徴ベクトルの近さを決定するための尺度についても特
に問わない。この文字認識処理の結果、各文字画像に対
して、いくつかの文字コードがそれぞれ取得される。こ
の実施の形態では、文字認識部５６を、１つの文字画像
（候補文字）に対して、類似度の高い順に上位５位まで
の文字コードを取得するように構成してある。

【００４２】例えば、図２に示す入力文字列３２を構成
する各候補文字Ｓ₀ 、Ｓ₁ 、Ｓ₂ およびＳ₃ の文字認識
結果を、図１０の図中の上側部分に示す。各候補文字Ｓ
₀ 、Ｓ₁ 、Ｓ₂ およびＳ₃ のそれぞれの文字認識結果６
６ａ、６６ｂ、６６ｃおよび６６ｄには、類似度の高い
順に図中の上側から下側に向けて文字コードが並べられ
ている（各文字コードの左側に付された数字は、類似度
の順位を示している。尚、この実施の形態の処理には、
順位を必要としないので、これを記録しておかなくとも
よい。）。例えば、候補文字Ｓ₃ の文字認識結果６６ｄ
である文字コードが表す文字は、類似度の高い順に順番
を付して示すと、「１：弘、２：私、３：払、４：松、
５：玄」となる。これら検出した文字コードは、候補文
字の位置情報と対応付けられて、文字認識部５６が具え
るメモリ手段である文字コード格納部６８に格納され
る。

【００４３】次に、文字種分類部５８では、各候補文字
ごとに文字コード格納部６８に格納されている上位５位
の文字コードを読み出す。そして、読み出した文字コー
ドを、各候補文字ごとに、この実施の形態では４種類の
文字種すなわち数字・記号、カタカナ、平仮名および漢
字に分類する。従って、文字種分類部５８は、図示せず
もこのためのソート手段を具えている。この分類作業
は、例えば、各文字コードが有している文字種を識別す
るための情報を利用すれば行える。また、文字種分類部
５８は、各文字種ごとの文字コード数を計数するための
計数手段を具えている。

【００４４】図１０の図中の中央部分に各候補文字の文
字種ごとの計数結果を示す。各候補文字Ｓ₀ 、Ｓ₁ 、Ｓ
₂ およびＳ₃ の文字種ごとの計数結果７０ａ、７０ｂ、
７０ｃおよび７０ｄを、（数字・記号，カタカナ，平仮
名，漢字）の様式で示す。例えば、文字認識部５６で得
られた文字コードの全てが漢字である候補文字Ｓ₃ の文
字種ごとの計数結果７０ｄは、（０，０，０，５）とな
っている。得られた各計数結果は、文字評価値算出部６
０に出力される。

【００４５】この文字評価値算出部６０は、文字種分類
部５８の計数結果である各候補文字の文字種ごとの文字
コード数を、全文字コード数で除算する。そして、各除
算結果に、認識対象の候補文字を構成するセグメント数
を積算する。つまり、候補文字が２つのセグメントを統
合して生成されたものである場合には、この候補文字に
対応する除算結果に２を積算することになる。このよう
にして演算された結果を、この実施の形態では、文字評
価値と称している。この文字評価値は、各候補文字に対
して得られた文字コードの、文字種ごとの割合を示す値
である。従って、ある候補文字の文字評価値が大きい
程、その候補文字がその文字評価値に対応する文字種と
なる可能性が高いということを意味する。この文字評価
値算出部６０は、通常の演算回路でもって構成できる。

【００４６】例えば、図１０の中央部分に各候補文字の
文字種ごとに算出した文字評価値を示す。各候補文字Ｓ
₀ 、Ｓ₁ 、Ｓ₂ およびＳ₃ の文字評価値７２ａ、７２
ｂ、７２ｃおよび７２ｄは、文字種ごとに、（数字・記
号，カタカナ，平仮名，漢字）の様式で示されている。
候補文字Ｓ₃ を例に取ると、候補文字Ｓ₃ の計数結果７
０ｄは（０，０，０，５）であったが、この結果に対し
て、文字評価値算出部６０では、先ず、各文字種ごとの
文字コード数を１つの候補文字に対して求められる文字
コード数５で除算するという処理を施す。次に、候補文
字Ｓ₃ は、セグメントＳ₀ とセグメントＳ₁ とを統合し
たものであるから２個のセグメントから構成されてお
り、従って、先の演算結果（０，０，０，１）のそれぞ
れの要素に２を掛ける。この結果、候補文字Ｓ₃ の文字
評価値７２ｄは（０，０，０，２）と算出される。各演
算結果は、文字列評価値算出部６２に出力される。

【００４７】次に、文字列評価値算出部６２は、候補文
字列作成手段１４の文字列格納部５２を参照して、これ
に格納されている候補文字列に従い、文字評価値算出部
６０で算出された文字評価値を文字種ごとに選択して読
み出し、加算（計数）を行う手段である。この文字列評
価値算出部６２も、文字評価値算出部６０と同様に、通
常の演算回路例えば加算回路で構成される。図１０の図
中の下側部分に模式的に示すように、この文字列評価値
算出部６２で行われる演算は、文字評価値７２ａ、７２
ｂ、７２ｃおよび７２ｄを、それぞれ候補文字列Ｐ₀ ま
たはＰ₁ のいずれか一方に従って、各文字種ごとに加算
するといったものである。この計数結果を、文字列評価
値と称する。ある候補文字列の文字列評価値が大きいと
いうことは、その文字列評価値が算出された文字種が入
力文字列を占める割合が高いということを意味する。図
１０には、候補文字列Ｐ₀ およびＰ₁ の各文字列評価値
を、候補文字列ごとにまとめて、（数字・記号，カタカ
ナ，平仮名，漢字）の様式で以て、それぞれ記号７４ａ
および７４ｂを付して示してある。

【００４８】例えば、文字列評価値算出部６２は、文字
列格納部５２から読み出した候補文字列Ｐ₀ に従い、候
補文字Ｓ₀ の文字評価値７２ａ：（０．２，０．４，
０，０．４）と、候補文字Ｓ₁ の文字評価値７２ｂ：
（０，０．２，０．４，０．４）と、候補文字Ｓ₂ の文
字評価値７２ｃ：（０，０．２，０．４，０．４）とを
読み出して、文字種ごとに加算を行い、文字列評価値７
４ａ：（０．２，０．８，０．８，１．２）を算出す
る。また、例えば、文字列評価値算出部６２は、文字列
格納部５２から読み出した候補文字列Ｐ₁ に従い、候補
文字Ｓ₃ の文字評価値７２ｄ：（０，０，０，０．２）
と、候補文字Ｓ₂ の文字評価値７２ｃ：（０，０．２，
０．４，０．４）とを読み出して、文字種ごとに加算を
行い、文字列評価値７４ｂ：（０，０．２，０．４，
２．４）を算出する。これら算出結果は、文字列評価値
比較部６４に出力される。

【００４９】次に、文字列評価値比較部６４は、算出し
た各文字列評価値の中で、最大値の文字列評価値を含む
候補文字列を、最良文字列として選択する手段である。
従って、文字列評価値比較部６４は、文字列評価値算出
部６２から入力される各文字列評価値を大きい順にソー
トするためのソート手段を具えている。そして、このソ
ート結果により得られた最も大きな値の文字列評価値が
属する候補文字列が、自動的に最良文字列として選出さ
れる構成となっている。上述したように、文字列評価値
が大きいということは、その文字列評価値が算出された
文字種がその候補文字列を占める割合が高いということ
を意味する。よって、最大の文字列評価値が属する候補
文字列を最良文字列として選択するということは、最も
文字種が統一されている候補文字列を最良文字列として
選択するということである。図１０に示した文字列評価
値７４ａおよび７４ｂの例では、最大値は２．４であ
り、この値が属する候補文字列はＰ₁ である。よって、
この例では、候補文字列Ｐ₁が最良文字列として選択さ
れる。すなわち、入力文字列３２の切出し位置が、Ｃ
₀ 、Ｃ₂ およびＣ₃ に決定される。

【００５０】この文字列評価値比較部６４の出力は、例
えばいわゆるコンピュータ装置の入力端子に接続され、
文字認識情報として活用される。そのような外部手段に
おいては、上述のように決定した文字切出し位置に基づ
いて、そして、例えば単語辞書を参照して照合を行うこ
とにより、入力文字列を（上述した例では「弘三」とい
う具合に）文字認識することができる。また、この実施
の形態の文字切出し装置の各構成要素は、制御部１８か
らの制御信号に応じて、動作タイミングが制御されてい
る。尚、上述した文字切出し装置は、中央演算素子（Ｃ
ＰＵ）、メモリおよび入出力部で構成されるコンピュー
タでもって、各要素のハードウエアを構成してもよい。
従って、例えば、上述した文字切出し装置の各メモリ手
段を、それぞれ互いに共有させて用いる構成としてもよ
いし、また、制御部１８等の制御手段を一つの中央演算
素子としてまとめて構成してもよい。

【００５１】［文字切出し方法］次に、この実施の形態
の文字切出し方法および文字切出し装置の動作につき説
明する。図１１は、この実施の形態の文字切出しフロー
を示すフローチャートである。以下、この文字切出しフ
ローをステップごとに説明する。尚、［装置構成］の項
の説明と重複する説明は省略する場合がある。

【００５２】＜候補文字の抽出＞先ず、文字認識対象で
ある入力文字列から連続した複数個の候補文字を上述し
た候補文字抽出手段１２により抽出する。この抽出は、
次の２つのステップ（ａ）および（ｂ）により行う。

【００５３】最初に、ステップ（ａ）：入力文字列の各
黒ブロック領域をセグメントＳ_i （ｐを整数とすると
き、ｉは０≦ｉ≦ｐを満たす整数）として抽出し、その
位置情報をメモリ手段に記録する（図１１のＳ１）。こ
こで、整数（ｐ＋１）は、入力文字列を構成するセグメ
ントの個数を表す。図２に示す入力文字列３２の場合に
は、これを構成するセグメントはＳ₀ 、Ｓ₁ およびＳ₂
の３個であり、すなわちｐ＝２である。このステップ
（ａ）では、上述したセグメント抽出部２６により、主
走査方向に入力文字列を走査して、この場合には順次に
セグメントＳ₀ 、Ｓ₁ およびＳ₂ を抽出する。メモリ手
段としては、例えば、［装置構成］の項で説明した座標
メモリ３０を用いる。そして、この座標メモリ３０に各
セグメントＳ₀ 、Ｓ₁ およびＳ₂ の位置情報を、それぞ
れ対応した格納場所に記録する。

【００５４】次に、ステップ（ｂ）：記録したセグメン
トＳ_i の位置情報に基づきセグメント同士を統合して新
たなセグメントＳ_j （ｑを整数とするとき、ｊはｐ＋１
≦ｊ≦ｐ＋ｑを満たす整数）を生成し、このセグメント
Ｓ_j の位置情報を例えば座標メモリ３０に追加記録する
（図１１のＳ２）。図２の例では、セグメントＳ₀ とセ
グメントＳ₁ とを統合して、セグメントＳ₃ を生成して
いる。この場合、整数ｑは１となる。このステップの処
理の結果、座標メモリ３０に記録されているすべてのセ
グメントＳ_i およびＳ_j を候補文字Ｓ_k （但し、ｋは０
≦ｋ≦ｐ＋ｑを満たす整数）として取得する（図２の例
では、Ｓ_i はＳ₀ 、Ｓ₁ 、Ｓ₂ であり、Ｓ_j はＳ₃ 、Ｓ
_k はＳ₀ 、Ｓ₁ 、Ｓ₂ 、Ｓ₃ となる。）。図１２のフロ
ーチャートに、この（ｂ）ステップで行うセグメント統
合処理をステップごとに示す。

【００５５】＜セグメント統合処理の説明＞先ず、初期
値としてｎに０を設定する（図１２のＳ９）。ここで、
ｎは、０≦ｎ≦ｐ−１を満たす整数である。そして、副
ステップ（ｂ１）：入力文字列方向に順次に整列するよ
うに番号付けされて座標メモリ３０に記録されたセグメ
ントＳ_n の位置情報を、この座標メモリ３０から読み出
す（図１２のＳ１０）。例えば、図２に示した入力文字
列３２では、整数ｎの小さい順に、図中の左側から右側
に順次にセグメントＳ₀ 、Ｓ₁ 、Ｓ₂ が配列している。
そして、例えば、座標メモリ３０には、記号Ｓ_n に対応
したアドレス（格納場所）に各セグメントＳ_nの位置情
報が格納されている。この副ステップ（ｂ１）では、特
定の記号Ｓ_n に対応した座標メモリ３０のアドレスが付
された格納場所に格納されている位置情報を、上述した
第１読出部３４で読み出す。

【００５６】次に、副ステップ（ｂ２）：セグメントＳ
_n に隣接するセグメントＳ_n+1 の位置情報を、座標メモ
リ３０から読み出す（図１２のＳ１１）。この副ステッ
プ（ｂ２）は、副ステップ（ｂ１）で説明したのと同様
に、特定の記号Ｓ_n+1 に対応した座標メモリ３０のアド
レスが付された格納場所に格納されている位置情報を、
上述した第２読出部３６で読み出すことにより行う。

【００５７】次に、副ステップ（ｂ３）：セグメントＳ
_n とセグメントＳ_n+1 との間の距離Ｄ_n を、副ステップ
（ｂ２）で読み出した各々の位置情報から求める（図１
２のＳ１２）。距離Ｄ_n は［装置構成］の項で説明した
ように、互いに隣接する各セグメントの始端位置の差を
検出することにより求められる。上述したように、距離
検出部３８は、第１読出部３４および第２読出部３６で
読み出した位置情報から距離Ｄ_n を検出する。

【００５８】次に、副ステップ（ｂ４）：入力文字列の
行高さＬの定数ｅ（ｅは正の実数）倍と、副ステップ
（ｂ３）で求めた距離Ｄ_n とを比較する（図１２のＳ１
３）。この比較処理は、上述した比較部４０で行われ
る。定数ｅの値は、上述した理由から、１．２に設定し
てある。

【００５９】Ｄ_n ≦ｅ・Ｌの場合副ステップ（ｂ５）：副ステップ（ｂ４）の比較結果が
Ｄ_n ≦ｅ・ＬのときにセグメントＳ_n とセグメントＳ
_n+1 とを統合して新たなセグメントＳ_j とする（図１２
のＳ１４）。このセグメントＳ_j の生成は、上述したセ
グメント生成部４２で行われる。セグメント生成部４２
は、生成したセグメントＳ_j の位置情報を書込部４４を
介して、座標メモリ３０に追加記録する（図１２のＳ１
５）。この実施の形態では、１つのセグメントを生成す
る度にメモリへの書き込みを行っているが、これに限ら
ず、セグメントの生成処理を終了するまでこのセグメン
トの位置情報を順序づけて記憶しておくためのメモリ手
段をセグメント生成部４２に設けておき、セグメント生
成処理の終了した時点で、１度に全ての新規セグメント
の書き込みを行うようにしてもよい。そして、セグメン
ト生成部４２は、入力文字列を構成しているセグメント
が全て読み出されたかどうかの判定を行う（図１２のＳ
１６）。このため、セグメント生成部４２には、第１読
出部３４または第２読出部３６で読み込んだセグメント
数を計数する手段を設けておき、セグメント数が（ｐ−
１）個になったことを判定できる構成としてある。すな
わち、この実施の形態では、整数ｎの小さい順にセグメ
ントＳ_n を読み出してゆくから、読み出したセグメント
の番号が（ｐ−１）になったことを検出するように設定
しておけばよい。そして、セグメント生成部４２は、読
み出したセグメントの番号ｎが（ｐ−１）になった場合
には、このセグメント統合処理を終了するように、制御
部１８に指示を出す。また、読み出したセグメントの番
号ｎが（ｐ−１）ではない場合には、番号ｎに１を加え
て（図１２のＳ１７）、次の番号のセグメントの読み出
しを行うように第１読出部３４および第２読出部３６に
指示を与える（図１２のＳ１０）。

【００６０】Ｄ_n ＞ｅ・Ｌの場合副ステップ（ｂ４）の比較結果が、Ｄ_n ＞ｅ・Ｌのとき
には、読み出したセグメントの統合を行わない。そし
て、読み出したセグメントの番号ｎが（ｐ−１）である
か否かを判定し（図１２のＳ１６）、その判定結果に基
づいて上述した処理を行う。

【００６１】以上説明したセグメント統合処理により、
座標メモリ３０には、入力文字列から直接抽出されたセ
グメントＳ_i と、これらセグメントＳ_i から生成した新
規セグメントＳ_j とが記録される。これらセグメントを
合わせて、番号および記号はそのままにして、候補文字
Ｓ_k （ｋは０≦ｋ≦ｐ＋ｑを満たす整数）と称してい
る。

【００６２】＜候補文字列の作成＞次に、ステップ
（ｃ）：座標メモリ３０に記録した候補文字Ｓ_k の位置
情報に基づき各候補文字を入力文字列を再現せしめるよ
うに配列した情報を、候補文字列Ｐ_r （ｒは整数）とし
て作成する（図１１のＳ３）。この候補文字列の作成
は、公知のグラフ理論に基づくグラフ探索のアルゴリズ
ムを用いて行える。この実施の形態では、上述したよう
に、この候補文字列の作成を、候補文字列作成手段１４
で作成する。上述したように、候補文字列作成手段１４
は、テーブル作成部４６、処理回路４８、候補文字記録
部５０、文字列格納部５２およびテーブルメモリ部５４
を具えている（図７）。テーブル作成部４６により、先
ず、座標メモリ３０から位置情報を読み出して、上述し
たセグメントテーブルを作成する。これは、座標メモリ
３０からセグメント番号順に候補文字抽出手段１２で抽
出した各セグメントＳ_i の位置情報を読み出してゆき、
その位置情報から、各セグメントの始端位置と入力文字
列の最後尾のセグメントＳ_p+1 の終端位置とを検出する
ことにより行える。そして、これら検出した位置情報に
基づいて、各位置を切出し候補位置Ｃ_m （ｍは、０≦ｍ
≦ｐ＋１を満たす整数）として、入力文字列の主走査方
向に順次に番号付けられた位置としてテーブルメモリ部
５４に格納する。そして、テーブルメモリ部５４には、
各候補文字Ｓ_k が、切出し候補位置Ｃ_m と対応付けられ
て、始点位置と終点位置とを指定すれば対応する候補文
字の位置情報が座標メモリ３０から読み出しできるよう
に記憶される。そして、このテーブルメモリ部５４に記
憶されている情報を参照して、処理回路４８は、作成関
数Ｆ（Ｃ_m ，Ｐ_r ）を用いた処理を行って、候補文字列
を作成する。次に、この作成関数Ｆ（Ｃ_m ，Ｐ_r ）の処
理手順につき、図１３のフローチャートを参照して、説
明する。

【００６３】＜作成関数の説明＞ここでは、切出し候補
位置Ｃ_a （ａは、０≦ａ≦ｐ＋１を満たす整数）および
候補文字列Ｐ_r を引き数とする作成関数Ｆ（Ｃ_a ，Ｐ
_r ）の処理につき説明する。始めに、整数δ（δはδ＝
ｂ−ａを満たす整数。但し、ｂは、０≦ａ≦ｐ＋１、ｂ
＞ａを満たす整数。）に１を、整数ｒには０をそれぞれ
初期値として設定する（図１３のＳ１８）。また、候補
文字記録部５０の内部状態すなわち配列情報を初期化し
ておく（図１３のＳ１９）。また、整数ａには０を代入
して、初期化する（図１３のＳ２０）。

【００６４】先ず、副ステップ（ｃ１）：番号ａが（ｐ
＋１）であることを判定する（図１３のＳ２１）。この
判定は、処理回路４８で行う。

【００６５】次に、副ステップ（ｃ２）：処理回路４８
の判定結果がａ≠ｐ＋１の場合には、切出し始点位置と
して切出し候補位置Ｃ_a を、テーブルメモリ部５４から
読み出す（図１３のＳ２２）。続いて、切出し終点位置
として切出し候補位置Ｃ_b を、テーブルメモリ部５４か
ら読み出す（図１３のＳ２３）。切出し候補位置Ｃ
_ｂは、切出し候補位置Ｃ_ａよりも、常に番号が大きく
なるように呼び出される（すなわちｂ＞ａである。図２
の入力文字列の例では、図中の右側の位置の方が番号が
大きくなるように、切出し候補位置が番号付けされてい
る。）。そして、読み出した切出し候補位置Ｃ_a および
Ｃ_b 間の候補文字Ｓ_k を、上述した候補文字記録部５０
に順序付けて配列情報Ｐ_r として格納する（図１３のＳ
２４）。例えば、候補文字記録部５０には、読み出した
候補文字Ｓ_k の順に、テーブルメモリ部５４に記録され
ているその候補文字Ｓ_k のアドレス番号（格納場所を指
定する情報）が記録されてゆく。この後、この候補文字
記録部５０に全ての候補文字Ｓ_kが格納されたかどうか
の判定を行う（図１３のＳ２５）。この判定は、例え
ば、処理回路４８に、テーブルメモリ部５４から全ての
候補文字が読み出されたかどうかを計数しておく手段を
設けておけばよい。

【００６６】全候補文字が格納された場合この場合には、作成関数の処理は終了する。

【００６７】全候補文字が格納されていない場合この場合には、番号ａおよびｂのそれぞれに１を加え
て、作成関数Ｆ（Ｃ_a+1，Ｐ_r ）を呼び出す。つまり、
次に、作成関数Ｆ（Ｃ_a+1 ，Ｐ_r ）の処理が始まる。そ
して、再び、番号ａが（ｐ＋１）であるか否かを判定す
るステップ（図１３のＳ２１）に戻って、上述したステ
ップを繰り返し行う。このように、番号ａが（ｐ＋１）
になるまで、再帰的に作成関数を呼び出すことにより、
配列情報Ｐ_r を完成させる。ここで、配列情報Ｐ_r の完
成とは、選択されて格納された候補文字でもって、処理
対象としている入力文字列を再現できることをいう。次
に、この配列情報Ｐ_r が完成した場合すなわち番号ａが
（ｐ＋１）になった場合の、作成関数の処理につき説明
する。

【００６８】副ステップ（ｃ３）：処理回路４８の判定
結果がａ＝ｐ＋１の場合には、候補文字記録部５０に格
納されている配列情報Ｐ_r を、候補文字列Ｐ_r として上
述した文字列格納部５２に格納する（図１３のＳ２
７）。そして、先程と同様に、候補文字記録部５０に全
ての候補文字Ｓ_k が格納されたかどうかの判定を行う
（図１３のＳ２８）。

【００６９】全候補文字が格納された場合この場合には、作成関数の処理は終了する。

【００７０】全候補文字が格納されていない場合この場合には、整数δ（＝ｂ−ａ）およびｒ（候補文字
列番号ｒ）のそれぞれに１を加え（図１３のＳ２９）、
候補文字記録部５０に格納されている配列情報を初期化
し（図１３のＳ１９）、番号ａをａ＝０に初期化するこ
とにより（図１３のＳ２０）、次に、作成関数Ｆ（Ｃ
₀ ，Ｐ_r+1 ）を呼び出す。つまり、今度は、作成関数Ｆ
（Ｃ₀ ，Ｐ_r+1 ）の処理が始まる。そして、再び、切出
し候補位置Ｃ_a の添字を表す番号ａが（ｐ＋１）である
か否かを判定するステップ（図１３のＳ２１）に戻っ
て、上述したステップを繰り返し行う。このように、番
号ａが（ｐ＋１）になるまで、再帰的に作成関数を呼び
出すことにより、今度は、配列情報Ｐ_r+1 を完成させる
処理を行う。

【００７１】＜最良文字列の選択＞以下、ステップ
（ｄ）〜（ｈ）により、最良文字列の選択を行う処理に
つき説明する。この実施の形態の文字切出し方法は、最
良文字列として、複数の候補文字列の中で最も文字種が
統一されている候補文字列を選択するところに特色があ
る。

【００７２】先ず、ステップ（ｄ）：記録した候補文字
Ｓ_k の位置情報を座標メモリ３０から読み出し、この位
置情報に基づいて入力文字列から各候補文字に対応する
文字画像を切り出し、この切り出した文字画像の文字認
識を行って類似度の高い順に上位Ｍ位（Ｍは整数）まで
の文字コードを取得する（図１１のＳ４）。この文字認
識処理は、上述したように、文字認識部５６で行う。こ
の実施の形態では、上述した整数Ｍを５に設定してい
る。従って、各候補文字に対して、類似度の高い順に順
序付けられた５個の文字コードが得られる。検出した文
字コードは、候補文字Ｓ_k の位置情報と対応付けて、つ
まり、候補文字Ｓ_k の位置情報が格納されている座標メ
モリ３０中のアドレス番号と対応付けて、文字コード格
納部６８に記憶しておく。

【００７３】次に、ステップ（ｅ）：各候補文字Ｓ_k ご
とに取得した上位Ｍ位の文字コードをＮ種類（Ｎは整
数）の文字種に分類し、第ｈ番目（ｈは１≦ｈ≦Ｎを満
たす整数）の文字種に属する検出した文字コードの個数
Ｉ_khを計数する（図１１のＳ５）。上述したように、こ
のステップの処理は、文字種分類部５８が、座標メモリ
３０を参照して文字コード格納部６８から例えば候補文
字番号順に呼び出すことにより行う。この実施の形態で
は、上述した文字種（すなわち、数字・記号、カタカ
ナ、平仮名および漢字の４種類の文字種）を設定してあ
るから、整数Ｎとして４が設定してある。そして、ここ
では、例えば、数字・記号を第１番目の文字種とし、カ
タカナを第２番目の文字種とし、平仮名を第３番目の文
字種とし、漢字を第４番目の文字種としている。従っ
て、例えば、候補文字Ｓ₀ の文字種が漢字である文字コ
ードの個数は、記号Ｉ₀₄で表される。図２に例示の入力
文字列の場合には、Ｉ₀₄＝２である（図１０の計数結果
７０ａ参照）。このステップの計数結果は、次のステッ
プ（ｆ）の処理を行う文字評価値算出部６０に、順次に
出力される。

【００７４】次に、ステップ（ｆ）：ステップ（ｅ）の
計数結果である文字コードの個数Ｉ_khを前述の文字コー
ド数Ｍで除算して値Ｉ_kh／Ｍを算出し、さらにこの値Ｉ
_kh／Ｍに認識対象の候補文字Ｓ_k を構成するセグメント
数Ｗ_k を積算したものを文字評価値Ｗ_k ・Ｉ_kh／Ｍとし
て算出する（図１１のＳ６）。この文字評価値の算出を
行う処理は、上述した文字評価値算出部６０で行われ
る。例えば、図２に例示の入力文字列を処理対象とする
場合、候補文字Ｓ₀ の文字種が漢字である文字コード数
Ｉ₀₄は２であり、この候補文字を構成するセグメント数
Ｗ₀ は１である。そして、１つの候補文字に対して求め
られる文字コード数Ｍが５であるから、従って、この候
補文字Ｓ₀ に対する文字評価値は、０．４と計算され
る。このステップの計数結果は、次のステップ（ｇ）の
処理を行う文字列評価値算出部６２に順次に出力され
る。

【００７５】次に、ステップ（ｇ）：第ｈ番目の文字種
につき第ｒ番目の候補文字列Ｐ_r に従い算出した文字評
価値Ｗ_k ・Ｉ_kh／Ｍを選択して計数した結果を、第ｒ番
目の候補文字列Ｐ_r の文字列評価値Σ_r Ｗ_k ・Ｉ_kh／Ｍ
として算出する（図１１のＳ７）。このステップの処理
は、上述した文字列評価値算出部６２で行われる。文字
列評価値算出部６２は、ステップ（ｃ）で作成して文字
列格納部５２に記憶されている候補文字列を参照して、
この候補文字列に記載されている配列順序に従った振分
けを、文字評価値算出部６０から入力される文字評価値
に対して行い、順次に文字列評価値を算出してゆく。こ
の実施の形態では、文字評価値は、文字評価値算出部６
０から、候補文字番号順および文字種番号順に、順次に
文字列評価値算出部６２に入力される。従って、文字列
評価値算出部６２は、これら文字評価値を、この文字列
評価値算出部６２に設けられたメモリ手段の候補文字番
号および文字種番号に対応させた格納場所に格納するこ
とができる。よって、文字列評価値算出部６２は、文字
列格納部５２から入力される配列情報（候補文字列）に
基づいて、文字評価値を格納したメモリ手段から、この
配列情報に対応した文字評価値を選別して読み出すこと
ができる。この実施の形態では、この文字評価値の読み
出し先は、［装置構成］の項で説明した加算回路であ
る。この加算回路で、それぞれ候補文字列および文字種
ごとに計数（加算）が行われて、文字列評価値Σ_r Ｗ_k
・Ｉ_kh／Ｍが算出される。ここで、Σ_r は、第ｒ番目の
候補文字列に亘って、文字評価値Ｗ_k ・Ｉ_kh／Ｍを加算
することを表している。例えば、図２に例示の入力文字
列の場合、候補文字列Ｐ₁ の文字種が漢字である文字列
評価値の算出は、各文字評価値がＷ₂ ・Ｉ₂₄／Ｍ＝０．４（図１０の文字評価値７２ｃ）Ｗ₃ ・Ｉ₃₄／Ｍ＝２（図１０の文字評価値７２ｄ）であるから、これらを加算した２．４という値が、第１
番目の候補文字列Ｐ₁ の漢字の文字列評価値となる（図
１０の文字列評価値７４ｂ）。このように、文字列評価
値算出部６２で算出された文字列評価値は、候補文字列
および文字種ごとに算出されて、次に説明するステップ
（ｈ）の処理を行う文字列評価値比較部６４に出力され
る。

【００７６】次に、ステップ（ｈ）：ステップ（ｇ）で
算出した文字列評価値Σ_r Ｗ_k ・Ｉ_kh／Ｍが最大のとき
に、第ｒ番目の候補文字列Ｐ_r を最良文字列として選択
する（図１１のＳ８）。このステップ（ｈ）の処理は、
上述した文字列評価値比較部６４で行われる。この文字
列評価値比較部６４は、上述した通り、ソート手段を具
えており、文字列評価値算出部６２から入力される文字
列評価値を大きい順に順位を付して格納する。そして、
文字列評価値の最大値を検出する。また、この最大とな
る文字列評価値が算出された候補文字列を、最良文字列
として選択する。この文字列評価値比較部６４は、文字
列格納部５２に格納されている候補文字列の中から最良
文字列を識別するための信号を、外部手段に出力する。
その信号を受けた外部手段は、例えば、その信号に基づ
いて、文字列格納部５２から最良文字列を選択して読み
出すことができる。そして、その情報に基づいて、この
外部手段は、画像メモリ２２と座標メモリ３０に対し
て、原画像から最良文字列で表される切出し位置で文字
画像を切り出すように指示するといった、文字認識情報
の活用が行えるようになる。

【００７７】以上説明したように、この実施の形態の文
字切出し方法は、最も大きな値の文字列評価値を有する
候補文字列を、最良文字列として選択する方法である。
つまり、前述したように、最も文字種が統一されている
候補文字列を最良文字列として選択する方法である。こ
のように、この文字切出し方法は、候補文字列を構成す
る文字種の割合を、切出し位置の選択基準とするもので
ある。従って、従来のように、文字コードの類似度を直
接の選択基準とするものではない。よって、従来のよう
に、類似度を求める際の尺度の違いにより、候補文字列
の選択基準があいまいになってしまい、その結果、正確
な候補文字列の選択を行うことができないといったこと
がなくなる。よって、この実施の形態の方法によれば、
文字切出し精度が向上する。

【００７８】

【発明の効果】この発明の文字切出し方法によれば、文
字種が最も統一されるような候補文字の組合せを選択す
ることにより、高い文字切出し精度を実現できる。

【００７９】また、この発明の文字切出し方法の好適な
実施例によれば、各候補文字の文字認識処理を行って、
類似度に基づいてＭ個の文字コードを取得し、候補文字
ごとに取得した文字コードを文字種に従って分類し、各
分類の文字コード数を計数し、その個数を全文字コード
数で除算することにより、ある候補文字から取得した各
文字コードの文字種ごとの割合を求めることができる。
そして、各候補文字に対して求めた「割合」を文字種ご
とに候補文字列に従って加算することにより、その候補
文字列をその文字種が占める割合（文字列評価値）を求
めることができる。この求めた文字列評価値の中から最
大の文字列評価値の候補文字列を、最良文字列として選
択して出力することができる。

【００８０】また、この発明の文字切出し方法の好適な
実施例によれば、隣接するセグメント間の距離に基づい
て、この距離と行高さとを比較することにより、セグメ
ントの組を統合するか否かを判定することができる。

【００８１】また、この発明の文字切出し方法の好適な
実施例によれば、ある候補文字から、これとは別の全て
の候補文字を、切出し候補位置を指定することにより辿
り、その候補文字を配列情報としてグループ化すること
により、これら配列情報のそれぞれを候補文字列として
得ることができる。

【００８２】また、この発明の文字切出し装置によれ
ば、文字種が最も統一される候補文字の組合せを選択し
て出力するように構成することにより、高い文字切出し
精度で文字を切り出すことができる。

【００８３】また、この発明の文字切出し装置の好適な
構成例によれば、文字認識部は各候補文字の文字認識処
理を行って、類似度に基づいてＭ個の文字コードを取得
し、文字種分類部は候補文字ごとに取得した文字コード
を文字種に従って分類し、各分類の文字コード数を計数
し、文字評価値算出部はその個数を全文字コード数で除
算することにより、ある候補文字から取得した各文字コ
ードの文字種ごとの割合を求める。また、文字列評価値
算出部は各候補文字に対して求めた「割合」を文字種ご
とに候補文字列に従って加算することにより、その候補
文字列をその文字種が占める割合（文字列評価値）を求
める。そして、文字列評価値比較部は、この求められた
文字列評価値の中から最大の文字列評価値の候補文字列
を、最良文字列として選択して出力することができる。

【００８４】また、この発明の文字切出し装置の好適な
構成例によれば、隣接するセグメント間の距離に基づい
て、この距離と行高さとを比較することにより、セグメ
ントの組を統合するか否かを判定することができる構成
としてある。

【００８５】また、この発明の文字切出し装置の好適な
構成例によれば、ある候補文字から、これとは別の全て
の候補文字を、切出し候補位置を指定することにより辿
り、その候補文字を配列情報としてグループ化する上述
した候補文字列作成手段の構成によれば、これら配列情
報のそれぞれを候補文字列として得ることができる。

【図面の簡単な説明】

【図１】実施の形態の文字切出し装置の構成を示す図で
ある。

【図２】入力文字列と候補文字列の一例を示す図であ
る。

【図３】統合前のセグメント座標テーブルの一例を示す
図である。

【図４】実施の形態のセグメント統合部の構成を示す図
である。

【図５】セグメント間距離の定義の一例を示す図であ
る。

【図６】統合後のセグメント座標テーブルの一例を示す
図である。

【図７】実施の形態の候補文字列作成手段の構成を示す
図である。

【図８】セグメントテーブルの一例を示す図である。

【図９】候補文字列テーブルの一例を示す図である。

【図１０】実施の形態の最良文字列の選択の説明に供す
る図である。

【図１１】実施の形態の文字切出しフローを示す図であ
る。

【図１２】実施の形態のセグメント統合処理を示す図で
ある。

【図１３】実施の形態の作成関数の処理を示す図であ
る。

【符号の説明】

１０：画像入力部１２：候補文字抽出手段１４：候補文字列作成手段１６：最良文字列選択手段１８：制御部２０：光電変換部２２：画像メモリ２４：切出部２６：セグメント抽出部２８：セグメント統合部３０：座標メモリ３２：入力文字列３４：第１読出部３６：第２読出部３８：距離検出部４０：比較部４２：セグメント生成部４４：書込部４６：テーブル作成部４８：処理回路５０：候補文字記録部５２：文字列格納部５４：テーブルメモリ部５６：文字認識部５８：文字種分類部６０：文字評価値算出部６２：文字列評価値算出部６４：文字列評価値比較部６６ａ，６６ｂ，６６ｃ，６６ｄ：文字認識結果６８：文字コード格納部７０ａ，７０ｂ，７０ｃ，７０ｄ：計数結果７２ａ，７２ｂ，７２ｃ，７２ｄ：文字評価値７４ａ，７４ｂ：文字列評価値

Claims

【特許請求の範囲】

【請求項１】文字認識対象である入力文字列から連続
した複数個の候補文字を抽出し、該候補文字の配列から
なる複数の候補文字列を作成し、前記抽出した各候補文
字の認識結果に基づき前記候補文字列の中から最良文字
列を選択することにより、前記入力文字列の文字切出し
位置を決定する文字切出し方法において、前記最良文字列として、複数の前記候補文字列の中で最
も文字種が統一されている候補文字列を選択することを
特徴とする文字切出し方法。
【請求項２】請求項１に記載の文字切出し方法におい
て、前記候補文字の抽出を、（ａ）前記入力文字列の各黒ブロック領域をセグメント
Ｓ_i （ｐを整数とするとき、ｉは０≦ｉ≦ｐを満たす整
数）として抽出し、その位置情報をメモリ手段に記録す
るステップと、（ｂ）前記記録したセグメントＳ_i の位置情報に基づき
セグメント同士を統合して新たなセグメントＳ_j （ｑを
整数とするとき、ｊはｐ＋１≦ｊ≦ｐ＋ｑを満たす整
数）を生成し、該セグメントＳ_j の位置情報を前記メモ
リ手段に追加記録することにより、該メモリ手段に記録
されている全てのセグメントＳ_i およびＳ_j を前記候補
文字Ｓ_k （但し、ｋは０≦ｋ≦ｐ＋ｑを満たす整数）と
して取得するステップとを以て行い、前記候補文字列の作成を、（ｃ）前記記録した候補文字Ｓ_k の位置情報に基づき各
候補文字を前記入力文字列を再現せしめるように配列し
た情報を、前記候補文字列Ｐ_r （ｒは整数）として作成
することにより行い、前記最良文字列の選択を、（ｄ）前記記録した候補文字Ｓ_k の位置情報を前記メモ
リ手段から読み出し、該位置情報に基づいて前記入力文
字列から各候補文字に対応する文字画像を切り出し、該
切り出した文字画像の文字認識を行って類似度の高い順
に上位Ｍ位（Ｍは整数）までの文字コードを取得するス
テップと、（ｅ）各候補文字Ｓ_k ごとに前記取得した上位Ｍ位の文
字コードをＮ種類（Ｎは整数）の文字種に分類し、第ｈ
番目（ｈは１≦ｈ≦Ｎを満たす整数）の文字種に属する
前記文字コードの個数Ｉ_khを計数するステップと、（ｆ）前記計数結果である文字コードの個数Ｉ_khを前記
文字コード数Ｍで除算して値Ｉ_kh／Ｍを算出し、さらに
該値Ｉ_kh／Ｍに認識対象の候補文字Ｓ_k を構成するセグ
メント数Ｗ_k を積算したものを文字評価値Ｗ_k ・Ｉ_kh／
Ｍとして算出するステップと、（ｇ）第ｈ番目の文字種につき第ｒ番目の候補文字列Ｐ
_r に従い前記算出した文字評価値Ｗ_k ・Ｉ_kh／Ｍを選択
して計数した結果を、第ｒ番目の候補文字列Ｐ_r の文字
列評価値Σ_r Ｗ_k ・Ｉ_kh／Ｍとして算出するステップ
と、（ｈ）前記算出した文字列評価値Σ_r Ｗ_k ・Ｉ_kh／Ｍが
最大のときに第ｒ番目の候補文字列Ｐ_r を前記最良文字
列として選択するステップとを以て行うことを特徴とす
る文字切出し方法。
【請求項３】請求項２に記載の文字切出し方法におい
て、前記（ｂ）ステップにおける前記セグメントＳ_j の生成
は、（ｂ１）入力文字列方向に順次に整列するように番号付
けされて前記メモリ手段に記録されたセグメントＳ_n
（ｎは、０≦ｎ≦ｐ−１を満たす整数）の位置情報を、
該メモリ手段から読み出すステップと、（ｂ２）該セグメントＳ_n に隣接するセグメントＳ_n+1
の位置情報を、前記メモリ手段から読み出すステップ
と、（ｂ３）セグメントＳ_n とセグメントＳ_n+1 との間の距
離Ｄ_n を前記読み出した各々の位置情報から求めるステ
ップと、（ｂ４）前記入力文字列の行高さＬの定数ｅ（ｅは正の
実数）倍と前記求めた距離Ｄ_n とを比較するステップ
と、（ｂ５）該比較結果がＤ_n ≦ｅ・Ｌのときにセグメント
Ｓ_n とセグメントＳ_n+1 とを統合して新たなセグメント
Ｓ_j とするステップとを以て行うことを特徴とする文字
切出し方法。
【請求項４】請求項３に記載の文字切出し方法におい
て、前記定数ｅの値を１．２に設定したことを特徴とす
る文字切出し方法。
【請求項５】請求項２に記載の文字切出し方法におい
て、前記（ｃ）ステップにおける候補文字列Ｐ_r の作成を、入力文字列方向に順次に整列するように番号付けされて
前記メモリ手段に記録された候補文字Ｓ_n （ｎは、０≦
ｎ≦ｐ−１を満たす整数）の位置情報を、該メモリ手段
から読み出し、前記入力文字列の両端位置と、候補文字Ｓ_n およびＳ
_n+1 間の境界位置とを、前記読み出した位置情報に基づ
き前記入力文字列方向に順次に切出し候補位置Ｃ_m （ｍ
は、０≦ｍ≦ｐ＋１を満たす整数）として求め、該切出
し候補位置Ｃ_m を前記候補文字の位置情報と対応付けて
テーブルメモリ部に記憶し、前記候補文字列を作成するための作成関数Ｆ（Ｃ_m ，Ｐ
_r ）を用いた処理を行う処理回路と、前記候補文字の配
列情報を記録するための候補文字記録部と、前記配列情
報を前記候補文字列として格納するための文字列格納部
とを具えた手段により、前記入力文字列を再現せしめる
候補文字の配列情報を求めることにより行うことを特徴
とする文字切出し方法。但し、切出し候補位置Ｃ_a （ａ
は、０≦ａ≦ｐ＋１を満たす整数）および候補文字列Ｐ
_r を引き数とする作成関数Ｆ（Ｃ_a ，Ｐ_r ）は、（ｃ１）前記ａが（ｐ＋１）であることを判定する処理
と、（ｃ２）前記判定結果がａ≠ｐ＋１の場合、切出し始点位置として前記切出し候補位置Ｃ_a を、前記
テーブルメモリ部から読み出し、切出し終点位置として切出し候補位置Ｃ_b （ｂは、０≦
ｂ≦ｐ＋１、ｂ＞ａを満たす整数）を、前記テーブルメ
モリ部から読み出し、前記読み出した各切出し候補位置Ｃ_a およびＣ_b 間の候
補文字Ｓ_k を、前記候補文字記録部に順次に配列情報と
して格納し、全候補文字が前記候補文字記録部に格納された場合に
は、処理を終了し、全候補文字が前記候補文字記録部に格納されていない場
合には、前記ａおよびｂにそれぞれ１を加えて、次に、
作成関数Ｆ（Ｃ_a+1 ，Ｐ_r ）を呼び出す処理と、（ｃ３）前記判定結果がａ＝ｐ＋１の場合、前記候補文字記録部に格納されている配列情報を前記候
補文字列Ｐ_r として前記文字列格納部に格納し、全候補文字が前記候補文字記録部に格納された場合に
は、処理を終了し、全候補文字が前記候補文字記録部に格納されていない場
合には、前記ｒおよび差（ｂ−ａ）のそれぞれに１を加
えて、前記格納されている配列情報を初期化し、前記ａ
を初期化し（ａ＝０）、次に、作成関数Ｆ（Ｃ₀ ，Ｐ
_r+1 ）を呼び出す処理とを実行する関数である。
【請求項６】文字認識対象である入力文字列を含む原
画像を読み取り、該読み取られた原画像を格納する画像
メモリを具えた画像入力部と、該画像メモリから前記入
力文字列を読み出し、該入力文字列から連続した複数個
の候補文字を抽出する候補文字抽出手段と、該抽出され
た候補文字の配列からなる複数の候補文字列を作成する
候補文字列作成手段と、前記抽出された候補文字の認識
結果に基づき前記候補文字列の中から最良文字列を選択
することにより、前記入力文字列の文字切出し位置を決
定する最良文字列選択手段とを具える文字切出し装置に
おいて、前記最良文字列選択手段は、前記認識結果で最も文字種
が統一されている前記候補文字列を前記最良文字列とし
て選択する手段であることを特徴とする文字切出し装
置。
【請求項７】請求項６に記載の文字切出し装置におい
て、前記候補文字抽出手段は、前記読み取られた入力文字列を構成する各黒ブロック領
域をセグメントＳ_i （ｐを整数とするとき、ｉは０≦ｉ
≦ｐを満たす整数）として抽出し、該セグメントＳ_i の
位置情報を記録するためのメモリ手段を具えたセグメン
ト抽出部と、前記メモリ手段に記録された位置情報を読み出し、該位
置情報に基づき前記抽出されたセグメント同士を統合し
て新たなセグメントＳ_j （ｑを整数とするとき、ｊはｐ
＋１≦ｊ≦ｐ＋ｑを満たす整数）を生成し、該セグメン
トＳ_j の位置情報を前記メモリ手段に追加記録すること
により、該メモリ手段に記録されている全てのセグメン
トＳ_i およびＳ_j を前記候補文字Ｓ_k （但し、ｋは０≦
ｋ≦ｐ＋ｑを満たす整数）として取得するセグメント統
合部とを具えており、前記候補文字列作成手段は、前記メモリ手段に記録された候補文字Ｓ_k の位置情報を
読み出し、該位置情報に基づいて候補文字Ｓ_k を、前記
入力文字列を再現せしめるように配列させ、該配列情報
を前記候補文字列Ｐ_r （ｒは整数）として記憶する手段
であり、前記最良文字列選択手段は、前記メモリ手段に記録されている候補文字Ｓ_k の位置情
報を読み出し、該位置情報に基づき前記画像メモリに格
納されている入力文字列から候補文字Ｓ_k の文字画像を
切り出し、該候補文字Ｓ_k の文字認識を行って類似度の
高い順に上位Ｍ位（Ｍは整数）までの文字コードを取得
し、該文字コードを格納するための文字コード格納部を
具えた文字認識部と、各候補文字Ｓ_k ごとに前記文字コード格納部に格納され
ている上位Ｍ位の文字コードを読み出し、これらをＮ種
類（Ｎは整数）の文字種に分類して第ｈ番目（ｈは１≦
ｈ≦Ｎを満たす整数）の文字種に属する文字コードの個
数Ｉ_khを計数する文字種分類部と、前記計数結果である文字コードの個数Ｉ_khを前記文字コ
ード数Ｍで除算して値Ｉ_kh／Ｍを算出し、さらに該値Ｉ
_kh／Ｍに認識対象の候補文字Ｓ_k を構成するセグメント
数Ｗ_k を積算したものを文字評価値Ｗ_k ・Ｉ_kh／Ｍとし
て算出する文字評価値算出部と、第ｈ番目の文字種につき第ｒ番目の候補文字列Ｐ_r に従
い文字評価値Ｗ_k ・Ｉ_kh／Ｍを選択して計数し、第ｒ番
目の候補文字列Ｐ_r の文字列評価値Σ_r Ｗ_k ・Ｉ_kh／Ｍ
を算出する文字列評価値算出部と、前記算出した各文字列評価値を比較して、文字列評価値
Σ_r Ｗ_k ・Ｉ_kh／Ｍが最大であるときに第ｒ番目の候補
文字列Ｐ_r を前記最良文字列として選択する文字列評価
値比較部とを具えることを特徴とする文字切出し装置。
【請求項８】請求項７に記載の文字切出し装置におい
て、前記セグメント統合部は、入力文字列方向に順次に番号付けされて前記メモリ手段
に記録されたセグメントＳ_n （ｎは、０≦ｎ≦ｐ−１を
満たす整数）の位置情報を、該メモリ手段から読み出す
第１読出部と、セグメントＳ_n に隣接するセグメントＳ_n+1 の位置情報
を前記メモリ手段から読み出す第２読出部と、セグメントＳ_n とセグメントＳ_n+1 との間の距離Ｄ_n を
前記読み出された各々の位置情報から求める距離検出部
と、前記検出された距離Ｄ_n と前記入力文字列の行高さＬの
定数ｅ（ｅは正の実数）倍とを比較する比較部と、前記比較部の処理結果がＤ_n ≦ｅ・Ｌのときに、セグメ
ントＳ_n とセグメントＳ_n+1 とを統合して新たなセグメ
ントＳ_j を生成するセグメント生成部と、前記生成されたセグメントＳ_j の位置情報を前記メモリ
手段に追加記録する書込部とを具えることを特徴とする
文字切出し装置。
【請求項９】請求項８に記載の文字切出し装置におい
て、前記定数ｅの値が１．２に設定されていることを特
徴とする文字切出し装置。
【請求項１０】請求項７に記載の文字切出し装置にお
いて、前記候補文字列作成手段は、入力文字列方向に順次に整列するように番号付けされて
前記メモリ手段に記録された候補文字Ｓ_n （ｎは、０≦
ｎ≦ｐ−１を満たす整数）の位置情報を、該メモリ手段
から読み出し、前記入力文字列の両端位置と、候補文字Ｓ_n およびＳ
_n+1 間の境界位置とを、前記読み出した位置情報に基づ
き前記入力文字列方向に順次に切出し候補位置Ｃ_m （ｍ
は、０≦ｍ≦ｐ＋１を満たす整数）として求め、該切出
し候補位置Ｃ_m を前記候補文字の位置情報と対応付けて
テーブルメモリ部に記憶するテーブル作成部と、前記候補文字列Ｐ_r を作成するための作成関数Ｆ（Ｃ
_m ，Ｐ_r ）を用いた処理を行う処理回路と、前記候補文字の配列情報を記録するための候補文字記録
部と、前記配列情報を前記候補文字列として格納するための文
字列格納部とを具えることを特徴とする文字切出し装
置。但し、切出し候補位置Ｃ_a （ａは、０≦ａ≦ｐ＋１
を満たす整数）および候補文字列Ｐ_r を引き数とする作
成関数Ｆ（Ｃ_a ，Ｐ_r ）は、（ｃ１）前記ａが（ｐ＋１）であることを判定する処理
と、（ｃ２）前記判定結果がａ≠ｐ＋１の場合、切出し始点位置として前記切出し候補位置Ｃ_a を、前記
テーブルメモリ部から読み出し、切出し終点位置として切出し候補位置Ｃ_b （ｂは、０≦
ｂ≦ｐ＋１、ｂ＞ａを満たす整数）を、前記テーブルメ
モリ部から読み出し、前記読み出した各切出し候補位置Ｃ_a およびＣ_b 間の候
補文字Ｓ_k を、前記候補文字記録部に順次に配列情報と
して格納し、全候補文字が前記候補文字記録部に格納された場合に
は、処理を終了し、全候補文字が前記候補文字記録部に格納されていない場
合には、前記ａおよびｂにそれぞれ１を加えて、次に、
作成関数Ｆ（Ｃ_a+1 ，Ｐ_r ）を呼び出す処理と、（ｃ３）前記判定結果がａ＝ｐ＋１の場合、前記候補文字記録部に格納されている配列情報を前記候
補文字列Ｐ_r として前記文字列格納部に格納し、全候補文字が前記候補文字記録部に格納された場合に
は、処理を終了し、全候補文字が前記候補文字記録部に格納されていない場
合には、前記ｒおよび差（ｂ−ａ）のそれぞれに１を加
えて、前記格納されている配列情報を初期化し、前記ａ
を初期化し（ａ＝０）、次に、作成関数Ｆ（Ｃ₀ ，Ｐ
_r+1 ）を呼び出す処理とを実行する関数である。