JPH10154207A - 文字切出し方法および文字切出し装置 - Google Patents

文字切出し方法および文字切出し装置

Info

Publication number
JPH10154207A
JPH10154207A JP8311079A JP31107996A JPH10154207A JP H10154207 A JPH10154207 A JP H10154207A JP 8311079 A JP8311079 A JP 8311079A JP 31107996 A JP31107996 A JP 31107996A JP H10154207 A JPH10154207 A JP H10154207A
Authority
JP
Japan
Prior art keywords
character
candidate
character string
unit
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8311079A
Other languages
English (en)
Inventor
Hiroshi Sasaki
佐々木  寛
Hirohisa Goto
裕久 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8311079A priority Critical patent/JPH10154207A/ja
Publication of JPH10154207A publication Critical patent/JPH10154207A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字列の連接関係を利用して文字切出しを行
うに当たって、文字列の比較を、文字コードの類似度を
直接的に用いずに行う。 【解決手段】 入力文字列を取得するための画像入力部
10と、取得した入力文字列から候補文字を抽出するた
めの候補文字抽出手段12と、抽出した候補文字を配列
させ候補文字列を作成する候補文字列作成手段14と、
作成した候補文字列から最良文字列を選択するための最
良文字列選択手段16とを具えている。最良文字列選択
手段16は、作成した候補文字から、最も文字種が統一
されている候補文字列を最良文字列として選択するよう
に構成されている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、手書き文字の認
識を行うに当たって入力文字列から文字の切出しを行う
装置および方法に関する。
【0002】
【従来の技術】手書き文字は、文字間隔や文字形状の標
準文字との相違の度合いが大きいため、「一定間隔で文
字を切り出す」といった従来手法では十分な文字切出し
精度が得られない。この問題に対して、文献1「電子通
信学会論文誌 '86/9 Vol.J69-DNo.9 pp1292-1301 」に
開示されているように、候補文字ラティスの手法を用い
た文字切出し方法が提案されている。この文献1に開示
されている方法によれば、入力文字列から要素矩形を抽
出し、隣接する要素矩形同士の網羅的な組合せ(以下、
候補文字と称する。)を生成してそれらの認識処理を行
い、全候補文字の認識結果を評価して最適な文字パタン
(文字列)を選択することにより、入力文字列の文字切
出しを行う。
【0003】ところで、上述した文献1に開示されてい
る従来手法によれば、全候補文字の認識処理と文字パタ
ンの評価とを行わなければならないから、入力文字列が
長くなると探索空間が非常に大きくなり、このため膨大
な演算量を必要とする。そこで、文献2「特開平6−1
95508」に開示されているように、最初に入力文字
列から形状的知識に基づき文字切出しを行い、次に単語
の連接関係を利用して不当な文字切出し部分を抽出し、
その部分だけを要素矩形に分離して網羅的な文字切出し
を行うことにより、探索空間の削減を図っている。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た文献1および文献2に開示の手法においては、候補文
字の特徴と標準文字の特徴との類似度(文字らしさのこ
と。あるいは、相違度、距離、確信度、尤度のこと。)
を求め、その類似度が最も高くなる候補文字の組合せを
文字パタンとして求めている。従って、各類似度が同一
の尺度に基づいて求められていない場合には、これら類
似度の比較を行うことができず、文字パタンの評価が正
確に行えない。
【0005】パタンの特徴は、例えば特徴ベクトルによ
り定量的に捉えることが可能である。そして、パタンの
類似度は、「特徴ベクトルの近さ」で表現することがで
きる。特徴ベクトルの近さの尺度としては、例えば「距
離」がある。パタン間の類似性を検討する場合、特徴ベ
クトル間の距離が小さいときに両パタンの類似度が高い
といえる。また、別の尺度として特徴ベクトル間の「角
度」を用いる方式がある。尺度として距離を用いる場合
には特徴ベクトルの大きさに基づいて類似度を決めてい
たのに対し、尺度として角度を用いる場合には特徴ベク
トルの方向性を問題にする。従って、大きさの違う相似
形のパタンの認識に適した尺度となっている。
【0006】このように認識方式によって尺度が異なっ
ている場合があり、このような場合には上述したように
類似度の比較を行うことができなかった。よって、候補
文字の文字らしさを評価に取り入れることができず、こ
のため文字切出し精度が低下してしまっていた。従っ
て、従来より、認識尺度が異なっていたとしても、文字
切出し精度を低下させることなく候補文字の評価を行い
最適文字パタンを得ることのできる文字切出し方法およ
び文字切出し装置の出現が望まれていた。
【0007】
【課題を解決するための手段】そこで、この発明の文字
切出し方法によれば、文字認識対象である入力文字列か
ら連続した複数個の候補文字を抽出し、これら候補文字
の配列からなる複数の候補文字列を作成し、前記抽出し
た各候補文字の認識結果に基づき前記候補文字列の中か
ら最良文字列を選択することにより、前記入力文字列の
文字切出し位置を決定する文字切出し方法において、前
記最良文字列として、複数の前記候補文字列の中で最も
文字種が統一されている候補文字列を選択することを特
徴とする。
【0008】例えば、入力文字列として、姓名や住所の
ような文字列を例に取ると、1文字目が漢字であれば途
中で数字や英字に変化することは、統計的に見て、ほと
んど皆無である。従って、このような文字列では、文字
列を構成する文字の文字種が統一されていると仮定する
ことができる。よって、文字種が最も統一されるような
候補文字の組合せを選択するこの発明の方法によれば、
高い文字切出し精度を実現できる。
【0009】また、この発明の文字切出し方法の好適な
実施例によれば、前記候補文字の抽出を、(a)前記入
力文字列の各黒ブロック領域をセグメントSi (pを整
数とするとき、iは0≦i≦pを満たす整数)として抽
出し、その位置情報をメモリ手段に記録するステップ
と、(b)前記記録したセグメントSi の位置情報に基
づきセグメント同士を統合して新たなセグメントSj
(qを整数とするとき、jはp+1≦j≦p+qを満た
す整数)を生成し、このセグメントSj の位置情報を前
記メモリ手段に追加記録することにより、このメモリ手
段に記録されている全てのセグメントSi およびSj
前記候補文字Sk (但し、kは0≦k≦p+qを満たす
整数)として取得するステップとを以て行い、前記候補
文字列の作成を、(c)前記記録した候補文字Sk の位
置情報に基づき各候補文字を前記入力文字列を再現せし
めるように配列した情報を、前記候補文字列Pr (rは
整数)として作成することにより行い、前記最良文字列
の選択を、(d)前記記録した候補文字Sk の位置情報
を前記メモリ手段から読み出し、この位置情報に基づい
て前記入力文字列から各候補文字に対応する文字画像を
切り出し、この切り出した文字画像の文字認識を行って
類似度の高い順に上位M位(Mは整数)までの文字コー
ドを取得するステップと、(e)各候補文字Sk ごとに
前記取得した上位M位の文字コードをN種類(Nは整
数)の文字種に分類し、第h番目(hは1≦h≦Nを満
たす整数)の文字種に属する前記文字コードの個数Ikh
を計数するステップと、(f)前記計数結果である文字
コードの個数Ikhを前記文字コード数Mで除算して値I
kh/Mを算出し、さらにこの値Ikh/Mに認識対象の候
補文字Sk を構成するセグメント数Wk を積算したもの
を文字評価値Wk ・Ikh/Mとして算出するステップ
と、(g)第h番目の文字種につき第r番目の候補文字
列Pr に従い前記算出した文字評価値Wk ・Ikh/Mを
選択して計数した結果を、第r番目の候補文字列Pr
文字列評価値Σrk ・Ikh/Mとして算出するステッ
プと、(h)前記算出した文字列評価値Σrk ・Ikh
/Mが最大のときに第r番目の候補文字列Pr を前記最
良文字列として選択するステップとを以て行うことを特
徴とする。
【0010】このように、各候補文字の文字認識処理を
行って、類似度に基づいてM個の文字コードを取得し
(ステップ(d))、候補文字ごとに取得した文字コー
ドを文字種に従って分類し、各分類の文字コード数を計
数し(ステップ(e))、その個数を1つの候補文字に
対して求める文字コードの個数Mで除算することにより
(ステップ(f))、ある候補文字から取得した各文字
コードの文字種ごとの割合を求めることができる。な
お、上述したステップ(f)においてセグメント数を積
算するのは、文字数が多い候補文字列ほど文字列評価値
が大きくなってしまうから、これを文字数で正規化する
ためである。そして、各候補文字に対して求めた「割
合」を文字種ごとに候補文字列に従って加算することに
より(ステップ(g))、その候補文字列をその文字種
が占める割合(文字列評価値)を求めることができる。
よって、求めた各文字列評価値の中から最大の文字列評
価値の候補文字列を、最良文字列として選択して出力す
ることができる(ステップ(h))。
【0011】また、この発明の文字切出し方法の好適な
実施例によれば、前記(b)ステップにおける前記セグ
メントSj の生成は、(b1)入力文字列方向に順次に
整列するように番号付けされて前記メモリ手段に記録さ
れたセグメントSn (nは、0≦n≦p−1を満たす整
数)の位置情報を、このメモリ手段から読み出すステッ
プと、(b2)このセグメントSn に隣接するセグメン
トSn+1 の位置情報を、前記メモリ手段から読み出すス
テップと、(b3)セグメントSn とセグメントSn+1
との間の距離Dn を前記読み出した各々の位置情報から
求めるステップと、(b4)前記入力文字列の行高さL
の定数e(eは正の実数)倍と前記求めた距離Dn とを
比較するステップと、(b5)この比較結果がDn ≦e
・LのときにセグメントSn とセグメントSn+1 とを統
合して新たなセグメントSj とするステップとを以て行
うことを特徴とする。
【0012】このように、隣接するセグメント間の距離
に基づいて、この距離と行高さとを比較することによ
り、セグメントの組を統合するか否かを判定することが
できる。ここで、セグメント間の距離とは、例えば、各
セグメントの始端位置同士を結ぶ入力文字列方向の直線
距離のことである。また、行高さとは、入力文字列方向
に垂直な方向の黒ブロック領域(セグメント)の長さの
うち、最大のもののことである。また、好ましくは、前
述の定数eの値を1.2に設定するのが良い。この値
は、繰り返しテストを行って経験的に定めた値であり、
予め読み出し自在の状態でメモリ手段に記憶させてお
く。
【0013】また、この発明の文字切出し方法の好適な
実施例によれば、前記(c)ステップにおける候補文字
列Pr の作成を、入力文字列方向に順次に整列するよう
に番号付けされて前記メモリ手段に記録された候補文字
n (nは、0≦n≦p−1を満たす整数)の位置情報
を、このメモリ手段から読み出し、前記入力文字列の両
端位置と、候補文字Sn およびSn+1 間の境界位置と
を、前記読み出した位置情報に基づき前記入力文字列方
向に順次に切出し候補位置Cm (mは、0≦m≦p+1
を満たす整数)として求め、この切出し候補位置Cm
前記候補文字の位置情報と対応付けてテーブルメモリ部
に記憶し、前記候補文字列を作成するための作成関数F
(Cm ,Pr )を用いた処理を行う処理回路と、前記候
補文字の配列情報を記録するための候補文字記録部と、
前記配列情報を前記候補文字列として格納するための文
字列格納部とを具えた手段により、前記入力文字列を再
現せしめる候補文字の配列情報を求めることにより行う
ことを特徴とする。
【0014】但し、切出し候補位置Ca (aは、0≦a
≦p+1を満たす整数)および候補文字列Pr を引き数
とする作成関数F(Ca ,Pr )は、(c1)前記aが
(p+1)であることを判定する処理と、(c2)前記
判定結果がa≠p+1の場合、切出し始点位置として前
記切出し候補位置Ca を、前記テーブルメモリ部から読
み出し、切出し終点位置として切出し候補位置Cb (b
は、0≦b≦p+1、b>aを満たす整数)を、前記テ
ーブルメモリ部から読み出し、前記読み出した各切出し
候補位置Ca およびCb 間の候補文字Sk を、前記候補
文字記録部に順次に配列情報として格納し、全候補文字
が前記候補文字記録部に格納された場合には、処理を終
了し、全候補文字が前記候補文字記録部に格納されてい
ない場合には、前記aおよびbにそれぞれ1を加えて、
次に、作成関数F(Ca+1 ,Pr)を呼び出す処理と、
(c3)前記判定結果がa=p+1の場合、前記候補文
字記録部に格納されている配列情報を前記候補文字列P
r として前記文字列格納部に格納し、全候補文字が前記
候補文字記録部に格納された場合には、処理を終了し、
全候補文字が前記候補文字記録部に格納されていない場
合には、前記rおよび差(b−a)のそれぞれに1を加
えて、前記格納されている配列情報を初期化し、前記a
を初期化し(a=0)、次に、作成関数F(C0 ,P
r+1 )を呼び出す処理とを実行する関数である。
【0015】このように、ある候補文字から、これとは
別の全ての候補文字を、切出し候補位置を指定すること
により辿り、その候補文字を配列情報としてグループ化
する上述の方法によれば、これら配列情報のそれぞれを
候補文字列として得ることができる。
【0016】次に、この発明の文字切出し装置によれ
ば、文字認識対象である入力文字列を含む原画像を読み
取り、この読み取られた原画像を格納する画像メモリを
具えた画像入力部と、この画像メモリから前記入力文字
列を読み出し、この入力文字列から連続した複数個の候
補文字を抽出する候補文字抽出手段と、これら抽出され
た候補文字の配列からなる複数の候補文字列を作成する
候補文字列作成手段と、前記抽出された候補文字の認識
結果に基づき前記候補文字列の中から最良文字列を選択
することにより、前記入力文字列の文字切出し位置を決
定する最良文字列選択手段とを具える文字切出し装置に
おいて、前記最良文字列選択手段は、前記認識結果で最
も文字種が統一されている前記候補文字列を前記最良文
字列として選択する手段であることを特徴とする。
【0017】このように、文字種が最も統一される候補
文字の組合せを選択して出力するこの発明の装置によれ
ば、高い文字切出し精度で文字を切り出すことができ
る。
【0018】また、この発明の文字切出し装置の好適な
構成例によれば、前記候補文字抽出手段は、前記読み取
られた入力文字列を構成する各黒ブロック領域をセグメ
ントSi (pを整数とするとき、iは0≦i≦pを満た
す整数)として抽出し、これらセグメントSi の位置情
報を記録するためのメモリ手段を具えたセグメント抽出
部と、前記メモリ手段に記録された位置情報を読み出
し、この位置情報に基づき前記抽出されたセグメント同
士を統合して新たなセグメントSj (qを整数とすると
き、jはp+1≦j≦p+qを満たす整数)を生成し、
このセグメントSj の位置情報を前記メモリ手段に追加
記録することにより、このメモリ手段に記録されている
全てのセグメントSi およびSj を前記候補文字Sk
(但し、kは0≦k≦p+qを満たす整数)として取得
するセグメント統合部とを具えており、前記候補文字列
作成手段は、前記メモリ手段に記録された候補文字Sk
の位置情報を読み出し、この位置情報に基づいて候補文
字Sk を、前記入力文字列を再現せしめるように配列さ
せ、この配列情報を前記候補文字列Pr (rは整数)と
して記憶する手段であり、前記最良文字列選択手段は、
前記メモリ手段に記録されている候補文字Sk の位置情
報を読み出し、この位置情報に基づき前記画像メモリに
格納されている入力文字列から候補文字Sk の文字画像
を切り出し、この候補文字Sk の文字認識を行って類似
度の高い順に上位M位(Mは整数)までの文字コードを
取得し、この文字コードを格納するための文字コード格
納部を具えた文字認識部と、各候補文字Sk ごとに前記
文字コード格納部に格納されている上位M位の文字コー
ドを読み出し、これらをN種類(Nは整数)の文字種に
分類して第h番目(hは1≦h≦Nを満たす整数)の文
字種に属する文字コードの個数Ikhを計数する文字種分
類部と、前記計数結果である文字コードの個数Ikhを前
記文字コード数Mで除算して値Ikh/Mを算出し、さら
にこの値Ikh/Mに認識対象の候補文字Sk を構成する
セグメント数Wk を積算したものを文字評価値Wk ・I
kh/Mとして算出する文字評価値算出部と、第h番目の
文字種につき第r番目の候補文字列Pr に従い文字評価
値Wk ・Ikh/Mを選択して計数し、第r番目の候補文
字列Pr の文字列評価値Σrk ・Ikh/Mを算出する
文字列評価値算出部と、前記算出した各文字列評価値を
比較して、文字列評価値Σrk・Ikh/Mが最大であ
るときに第r番目の候補文字列Pr を前記最良文字列と
して選択する文字列評価値比較部とを具えることを特徴
とする。
【0019】このように、文字認識部は各候補文字の文
字認識処理を行って、類似度に基づいてM個の文字コー
ドを取得し、文字種分類部は候補文字ごとに取得した文
字コードを文字種に従って分類し、各分類の文字コード
数を計数し、文字評価値算出部はその個数を全文字コー
ド数Mで除算することにより、ある候補文字から取得し
た各文字コードの文字種ごとの割合を求める。また、文
字列評価値算出部は各候補文字に対して求めた「割合」
を文字種ごとに候補文字列に従って加算することによ
り、その候補文字列をその文字種が占める割合(文字列
評価値)を求める。従って、文字列評価値比較部は、求
められた文字列評価値の中から最大の文字評価値の候補
文字列を最良文字列として、選択して出力することがで
きる。
【0020】また、この発明の好適な構成例によれば、
前記セグメント統合部は、入力文字列方向に順次に番号
付けされて前記メモリ手段に記録されたセグメントSn
(nは、0≦n≦p−1を満たす整数)の位置情報を、
このメモリ手段から読み出す第1読出部と、セグメント
n に隣接するセグメントSn+1 の位置情報を前記メモ
リ手段から読み出す第2読出部と、セグメントSn とセ
グメントSn+1 との間の距離Dn を前記読み出された各
々の位置情報から求める距離検出部と、前記検出された
距離Dn と前記入力文字列の行高さLの定数e(eは正
の実数)倍とを比較する比較部と、前記比較部の処理結
果がDn ≦e・Lのときに、セグメントSn とセグメン
トSn+1 とを統合して新たなセグメントSj を生成する
セグメント生成部と、前記生成されたセグメントSj
位置情報を前記メモリ手段に追加記録する書込部とを具
えることを特徴とする。
【0021】このように、隣接するセグメント間の距離
に基づいて、この距離と行高さとを比較することによ
り、セグメントの組を統合するか否かを判定することが
できる構成としてある。また、この構成において、好ま
しくは、前述の定数eの値が1.2に設定されているの
が良い。
【0022】また、この発明の文字切出し装置の好適な
構成例によれば、前記候補文字列作成手段は、入力文字
列方向に順次に整列するように番号付けされて前記メモ
リ手段に記録された候補文字Sn (nは、0≦n≦p−
1を満たす整数)の位置情報を、このメモリ手段から読
み出し、前記入力文字列の両端位置と、候補文字Sn
よびSn+1 間の境界位置とを、前記読み出した位置情報
に基づき前記入力文字列方向に順次に切出し候補位置C
m (mは、0≦m≦p+1を満たす整数)として求め、
この切出し候補位置Cm を前記候補文字の位置情報と対
応付けてテーブルメモリ部に記憶するテーブル作成部
と、前記候補文字列Pr を作成するための作成関数F
(Cm ,Pr )を用いた処理を行う処理回路と、前記候
補文字の配列情報を記録するための候補文字記録部と、
前記配列情報を前記候補文字列として格納するための文
字列格納部とを具えることを特徴とする。
【0023】但し、切出し候補位置Ca (aは、0≦a
≦p+1を満たす整数)および候補文字列Pr を引き数
とする作成関数F(Ca ,Pr )は、(c1)前記aが
(p+1)であることを判定する処理と、(c2)前記
判定結果がa≠p+1の場合、切出し始点位置として前
記切出し候補位置Ca を、前記テーブルメモリ部から読
み出し、切出し終点位置として切出し候補位置Cb (b
は、0≦b≦p+1、b>aを満たす整数)を、前記テ
ーブルメモリ部から読み出し、前記読み出した各切出し
候補位置Ca およびCb 間の候補文字Sk を、前記候補
文字記録部に順次に配列情報として格納し、全候補文字
が前記候補文字記録部に格納された場合には、処理を終
了し、全候補文字が前記候補文字記録部に格納されてい
ない場合には、前記aおよびbにそれぞれ1を加えて、
次に、作成関数F(Ca+1 ,Pr)を呼び出す処理と、
(c3)前記判定結果がa=p+1の場合、前記候補文
字記録部に格納されている配列情報を前記候補文字列P
r として前記文字列格納部に格納し、全候補文字が前記
候補文字記録部に格納された場合には、処理を終了し、
全候補文字が前記候補文字記録部に格納されていない場
合には、前記rおよび差(b−a)のそれぞれに1を加
えて、前記格納されている配列情報を初期化し、前記a
を初期化し(a=0)、次に、作成関数F(C0 ,P
r+1 )を呼び出す処理とを実行する関数である。
【0024】このように、ある候補文字から、これとは
別の全ての候補文字を、切出し候補位置を指定すること
により辿り、その候補文字を配列情報としてグループ化
する上述した候補文字列作成手段の構成によれば、これ
ら配列情報のそれぞれを候補文字列として得ることがで
きる。
【0025】
【発明の実施の形態】以下、図を参照して、この発明の
実施の形態につき説明する。尚、図は、この発明の構
成、配置関係および動作が理解できる程度に概略的に示
してあるに過ぎず、また、以下に記載する数値条件等は
単なる一例であり、従って、この発明は、この実施の形
態に何ら限定されることがない。
【0026】[装置構成]最初に、この実施の形態の文
字切出し装置の構成につき主として説明する。図1は、
この実施の形態の文字切出し装置の構成を示すブロック
図である。この実施の形態の文字切出し装置は、画像入
力部10、候補文字抽出手段12、候補文字列作成手段
14、最良文字列選択手段16および制御部18を具え
ている。以下、各構成要素につき順次に説明する。
【0027】先ず、画像入力部10には、2値画像また
は多値画像が入力される。この実施の形態では、画像入
力部10を、原稿や帳票等の情報媒体上を走査するため
の走査機構(図示せず。)と情報媒体上からの光信号を
検出して電気信号に変換する光電変換部20とを具える
読取部と、読み取った画像データ(原画像)を格納する
画像メモリ22と、帳票や原稿等に記載された文字図形
パタンの記載位置情報に基づき通常行われる如く画像デ
ータから文書領域(入力文字列)を切り出す切出部24
とを以て構成している。従って、例えば、上述の走査機
構および光電変換部でもって、文字列に沿った方向に走
査および画像検出を行い、次に、切出部でもって所望の
文書領域を入力文字列として切り出せる。
【0028】<候補文字抽出手段の構成>そして、候補
文字抽出手段12は、画像メモリ22から文字認識対象
である入力文字列を読み出し、この入力文字列から連続
した複数個の候補文字を抽出する。このため、この候補
文字抽出手段12は、セグメント抽出部26とセグメン
ト統合部28とを具えている。セグメント抽出部26
は、画像メモリ22から切出部24を介して入力文字列
を読み出し、この入力文字列を構成する各黒ブロック領
域をセグメントとして抽出する手段である。そして、セ
グメント抽出部26は、抽出したセグメントの位置情報
を記録するためのメモリ手段として座標メモリ30を具
えている。
【0029】図2に、入力文字列の一例を示す。この図
には、入力文字列32として、手書きの「弘三」という
文字パタン(文字画像)が示されている。尚、この実施
の形態では、入力文字列が横書きである場合を想定して
いるが、これに限らず、縦書きであっても構わない。入
力文字列方向は、図中のX方向(主走査方向)である。
上述した黒ブロック領域とは、各文字パタンに外接する
矩形領域(セグメントと称する。)のことである。例え
ば、図2の図中で、文字パタン「弓」(「弘」の偏)を
含むセグメントS0 、文字パタン「ム」(「弘」の旁)
を含むセグメントS1 、文字パタン「三」を含むセグメ
ントS2 が、それぞれセグメント抽出部26により抽出
される。これらセグメントの抽出は、入力文字列をX方
向に走査して、入力文字列をX方向に投影した射影分布
すなわち黒点のヒストグラムを求め、このヒストグラム
の極小点をX軸上の切出し位置とし、同様に、入力文字
列をX軸に垂直なY方向に走査してヒストグラムを求
め、このヒストグラムの極小点をY軸上の切出し位置と
し、これら切出し位置で囲まれる矩形領域をセグメント
として抽出するといった公知の方法で行える。
【0030】セグメントの抽出は、求められた切出し位
置同士の交点である四点(セグメントの各頂点に相当す
る。)の座標を検出することにより行われる。抽出され
たセグメントの座標は、座標メモリ30にセグメント座
標テーブルとして格納される。図3に座標メモリ30の
記憶状態(内部状態)すなわちセグメント座標テーブル
の一例を示す。図中左側に、文字パタン「ム」すなわち
セグメントS1 を示し、図中右側に、セグメントS0
1 およびS2 のそれぞれの座標(図3の図中のXs
e 、Ys 、Ye の各成分値の組で表される。)が記載
されたセグメント座標テーブルを示す。このように、座
標メモリ30には、セグメントに応じた所定の格納場所
に、そのセグメントの四頂点の座標が記録されている。
【0031】次に、セグメント統合部28は、セグメン
ト抽出部26により座標メモリ30に記録された位置情
報を読み出し、この位置情報に基づき抽出されたセグメ
ント同士を統合して新たなセグメントを生成し、この新
たなセグメントの位置情報を座標メモリ30に追加記録
する。例えば、図2に示した入力文字列32において
は、セグメントS0 とセグメントS1 とが統合されて新
たなセグメントS3 が作成される。図4のブロック図に
示すように、この実施の形態では、セグメント統合部2
8は、第1読出部34、第2読出部36、距離検出部3
8、比較部40、セグメント生成部42および書込部4
4を具えている。以下、図2に示す入力文字列32を処
理対象とする場合の、セグメント統合部28の各構成要
素の動作につき説明する。
【0032】先ず、第1読出部34は、入力文字列方向
に順次に番号付けされて座標メモリ30に記録されたセ
グメントS0 およびS1 の位置情報を、この座標メモリ
30から順次に読み出す。今、第1読出部34がセグメ
ントS0 の位置情報を読み込んだとすると、このとき、
第2読出部36は、セグメントS0 に隣接するセグメン
トS1 の位置情報を座標メモリ30から読み出す。ま
た、第1読出部34がセグメントS1 の位置情報を読み
込んだときには、第2読出部36は、セグメントS1
隣接するセグメントS2 の位置情報を座標メモリ30か
ら読み出す。
【0033】第1および第2読出部34および36に読
み出された各位置情報は、次に、距離検出部38に送ら
れる。この距離検出部38では、入力されたセグメント
0およびS1 の位置情報からこれらセグメントS0
よびS1 間の距離D0 を検出し、また、これとは別のタ
イミングで入力されるセグメントS1 およびS2 の位置
情報からは、これらセグメントS1 およびS2 間の距離
1 を検出する。ここで、セグメント間の距離D0 は、
例えば、図5に示すように、各セグメントS0およびS1
の始端位置(図3の図中左側に示すXs の位置に相当
する。)同士を結ぶ入力文字列方向の直線距離で定義さ
れる。従って、距離検出部38は、各セグメントの始端
位置のX座標成分同士の差を検出することにより距離を
検出する構成としてある。例えば、距離検出部38は、
このための差演算回路を具えている。
【0034】距離検出部38で検出された距離D0 およ
びD1 は、比較部40に送られる。比較部40では、検
出された距離と入力文字列の行高さLの定数倍とが比較
される。ここで、行高さとは、各セグメントの、入力文
字列方向(図2のX方向)に垂直な方向(図2のY方
向)の長さのことであり、ここでは、入力文字列を構成
するセグメントのうち、この長さが最大のものを選んで
入力文字列の行高さLとしている。この実施の形態で
は、距離検出部38は、行高さLの1.2倍の値とセグ
メント間の距離値とを比較する構成としてある。この
「1.2」という値は、繰り返しテストを行って、経験
的に定めた値である。この値は、比較部40が具える読
み出し自在のメモリ手段に予め設定されており、距離情
報の入力タイミングとともに読み出されるように構成さ
れている。このようにして、比較部40では、入力され
る距離値と値1.2Lとの大小関係が求められる。そし
て、比較部40は、求めた大小関係に応じた信号をセグ
メント生成部42に出力する。
【0035】比較部40の出力信号がD0 ≦1.2Lの
場合に応じた信号であるときに、セグメント生成部42
は、第1読出部34および第2読出部36からそれぞれ
セグメントS0 およびS1 を入力して、これらセグメン
トを統合して新たなセグメントS3 を生成する。ここ
で、セグメントS0 とセグメントS1 との統合は、これ
ら各セグメントS0 およびS1 の両者を含む領域を新た
なセグメントS3 として設定することにより行われる。
例えば、図6に示す統合後のセグメント座標テーブルに
あっては、セグメントS0 とセグメントS1 の対応する
成分値同士を比較したとき、大きい値の成分値が選択さ
れてセグメントS3 の座標成分となっている。また、比
較部40の出力信号がD1 >1.2Lの場合に応じた信
号であるときには、セグメント生成部42は、セグメン
トS1 とセグメントS2 とを統合しない。
【0036】そして、セグメント生成部42で生成され
た新たなセグメントS3 の位置情報は、書込部44によ
って座標メモリ30に追加記録される。この新規セグメ
ントS3 は、セグメント番号順になるように、この例で
は、座標メモリ30のセグメントS2 が格納されている
格納場所の隣の格納場所に格納される(但し、この新規
セグメントS3 と始めに抽出したセグメントS0 、S1
およびS2 とは、区別された情報種として記憶され
る。)。この結果、図6に示すように、座標メモリ30
の内部状態を表すセグメント座標テーブルが変更され
る。ここで、座標メモリ30に記録されている全てのセ
グメントの各々を候補文字と称することにする。この統
合後のセグメント座標テーブルに位置情報が記録されて
いるセグメントが、候補文字として、次に説明する候補
文字列作成手段14で処理される。
【0037】<候補文字列作成手段の構成>次に、候補
文字列作成手段14は、座標メモリ30に記録された候
補文字の位置情報を読み出し、この位置情報に基づい
て、候補文字を、入力文字列を再現せしめるように配列
させ、この配列情報を候補文字列として記憶する手段で
ある。この実施の形態の候補文字列作成手段14は、テ
ーブル作成部46、処理回路48、候補文字記録部5
0、文字列格納部52およびテーブルメモリ部54を具
えている。図7に、候補文字列作成手段14の構成をブ
ロック図で示す。
【0038】先ず、テーブル作成部46は、入力文字列
方向に順次に整列するように番号付けされて座標メモリ
30に記録された候補文字の位置情報を、座標メモリ3
0から読み出す。そして、テーブル作成部46は、入力
文字列の両端位置と、互いに隣接する候補文字間の境界
位置とを、読み出した位置情報に基づき入力文字列方向
に順次に切出し候補位置として求める。例えば、図2に
示す入力文字列32を処理対象とした場合、テーブル作
成部46は、座標メモリ30に記録されている候補文字
0 、S1 およびS2 の各位置情報を読み出し、次に、
その位置情報に基づいて、切出し候補位置を求める。こ
の実施の形態では、各候補文字の始端位置(図3の図中
左側に示すXs の位置に相当する。)と、入力文字列に
おける最後尾の候補文字の終端位置(図3の図中左側に
示すXe の位置に相当する。)とを自動的に切出し候補
位置として検出するように、テーブル作成部46が構成
されている。従って、この場合には、候補文字S0 、S
1 およびS2 の各始端位置をそれぞれ切出し候補位置C
0 、C1 およびC2 として検出し、また、候補文字S2
の終端位置を切出し候補位置C3 として検出する。
【0039】次に、テーブル作成部46は、検出した切
出し候補位置と各候補文字の位置情報との対応付けを行
い、この対応関係をセグメントテーブルとして、テーブ
ルメモリ部54に格納する。図8は、セグメントテーブ
ルの一例を示す図である。図中の表の項目枠には、行欄
に始点位置としての切出し候補位置を取って示し、列欄
に終点位置としての切出し候補位置を取って示してい
る。そして、表のそれぞれのデータ枠には、始点位置と
終点位置とに挟まれる候補文字が記載されている。例え
ば、始点位置としての切出し候補位置C0 の行欄と、終
点位置としての切出し候補位置C1 の列欄とが交わる位
置には、候補文字S0 が記録されたデータ枠がある。図
8のセグメントテーブルにおいて、セグメント記号が記
載されてない空白の枠には、「NULL(空白文字)」
が記録されている。このように、セグメントテーブル
は、各候補文字の始点位置と終点位置との対応関係が記
述されている表である(このような対応関係を、グラフ
理論では隣接行列と称している。)。
【0040】上述した処理回路48は、候補文字列を作
成するための作成関数を用いた処理を行う回路であり、
テーブルメモリ部54に記憶されている内容を参照し
て、候補文字の選択および配列を行う。候補文字記録部
50は、処理回路48による処理過程で作成される候補
文字の配列情報を記録するために用いられるメモリ手段
である。また、文字列格納部52は、候補文字記録部5
0に一時的に記録されている配列情報を、処理回路48
の指示に応じて、候補文字列として格納するためのメモ
リ手段である。これら各手段48、50および52が相
俟って作動することにより、文字列格納部52に候補文
字列が記録される。この候補文字列は、入力文字列を構
成する各候補文字が、入力文字列中における同位置に重
ならないように、かつ、入力文字列を再現せしめるよう
に、これら候補文字を配列させる情報である。例えば、
図2に示した入力文字列32を構成する候補文字S0
1、S2 およびS3 を、上述した要件を満たすように
配列する仕方は2通りある。すなわち、候補文字列P0
(S0 、S1 、S2 という配列)と候補文字列P1 (S
3 、S2 という配列)とである(各候補文字列P0 およ
びP1 を、図2の図中の下側部分に2端子有向グラフの
形で示す。)。これら候補文字列P0 およびP1 は、文
字列格納部52に、図9に示すテーブルの形で、最良文
字列選択手段16に対して読み出し自在に記憶される。
図9に示す候補文字列テーブルは、候補文字列P0 およ
びP1 ごとに、候補文字の配列が記述された表である。
尚、テーブルの空白部分は、「NULL」を表す。この
文字列格納部52に格納されている候補文字列のいずれ
か一つが、最良文字列選択手段16により、最良文字列
として選択される。このことは、別の表現で言い換えれ
ば、入力文字列の切出し候補位置が決定されるというこ
とである。尚、作成関数と処理回路48の動作について
は[文字切出し方法]の項で詳述する。
【0041】<最良文字列選択手段の構成>そして、こ
の実施の形態の最良文字列選択手段16は、図1のブロ
ック図に示すように、文字認識部56、文字種分類部5
8、文字評価値算出部60、文字列評価値算出部62お
よび文字列評価値比較部64を具えている。候補文字抽
出手段12で検出されて、座標メモリ30に格納されて
いる候補文字の位置情報は、文字認識部56により読み
出される。そして、文字認識部56は、この位置情報に
基づき、画像メモリ22に格納されている入力文字列
(入力文字列を含む原画像)から文字画像を切り出す。
この構成例では、先ず、文字認識部56の指示の下に、
切出部24が原画像から候補文字ごとの領域の文字画像
を切り出す。あるいは、これに限らず、文字認識部56
に文字画像を切り出すための切出手段を別に具えてもよ
い。そして、この切り出された文字画像が文字認識部5
6に取り込まれて、そこで各文字画像に対して通常の文
字認識処理が施される。このため、文字認識部56に
は、図示せずも、切り出された文字画像から特徴を抽出
するための手段と、標準文字の特徴を予め格納した辞書
とが具えられており、また、切り出された文字画像の特
徴と標準文字特徴とを比較するためのマッチング手段が
具えられている。この実施の形態では、両者の特徴の比
較を行うための手法については特に問わないし、また、
特徴ベクトルの近さを決定するための尺度についても特
に問わない。この文字認識処理の結果、各文字画像に対
して、いくつかの文字コードがそれぞれ取得される。こ
の実施の形態では、文字認識部56を、1つの文字画像
(候補文字)に対して、類似度の高い順に上位5位まで
の文字コードを取得するように構成してある。
【0042】例えば、図2に示す入力文字列32を構成
する各候補文字S0 、S1 、S2 およびS3 の文字認識
結果を、図10の図中の上側部分に示す。各候補文字S
0 、S1 、S2 およびS3 のそれぞれの文字認識結果6
6a、66b、66cおよび66dには、類似度の高い
順に図中の上側から下側に向けて文字コードが並べられ
ている(各文字コードの左側に付された数字は、類似度
の順位を示している。尚、この実施の形態の処理には、
順位を必要としないので、これを記録しておかなくとも
よい。)。例えば、候補文字S3 の文字認識結果66d
である文字コードが表す文字は、類似度の高い順に順番
を付して示すと、「1:弘、2:私、3:払、4:松、
5:玄」となる。これら検出した文字コードは、候補文
字の位置情報と対応付けられて、文字認識部56が具え
るメモリ手段である文字コード格納部68に格納され
る。
【0043】次に、文字種分類部58では、各候補文字
ごとに文字コード格納部68に格納されている上位5位
の文字コードを読み出す。そして、読み出した文字コー
ドを、各候補文字ごとに、この実施の形態では4種類の
文字種すなわち数字・記号、カタカナ、平仮名および漢
字に分類する。従って、文字種分類部58は、図示せず
もこのためのソート手段を具えている。この分類作業
は、例えば、各文字コードが有している文字種を識別す
るための情報を利用すれば行える。また、文字種分類部
58は、各文字種ごとの文字コード数を計数するための
計数手段を具えている。
【0044】図10の図中の中央部分に各候補文字の文
字種ごとの計数結果を示す。各候補文字S0 、S1 、S
2 およびS3 の文字種ごとの計数結果70a、70b、
70cおよび70dを、(数字・記号,カタカナ,平仮
名,漢字)の様式で示す。例えば、文字認識部56で得
られた文字コードの全てが漢字である候補文字S3 の文
字種ごとの計数結果70dは、(0,0,0,5)とな
っている。得られた各計数結果は、文字評価値算出部6
0に出力される。
【0045】この文字評価値算出部60は、文字種分類
部58の計数結果である各候補文字の文字種ごとの文字
コード数を、全文字コード数で除算する。そして、各除
算結果に、認識対象の候補文字を構成するセグメント数
を積算する。つまり、候補文字が2つのセグメントを統
合して生成されたものである場合には、この候補文字に
対応する除算結果に2を積算することになる。このよう
にして演算された結果を、この実施の形態では、文字評
価値と称している。この文字評価値は、各候補文字に対
して得られた文字コードの、文字種ごとの割合を示す値
である。従って、ある候補文字の文字評価値が大きい
程、その候補文字がその文字評価値に対応する文字種と
なる可能性が高いということを意味する。この文字評価
値算出部60は、通常の演算回路でもって構成できる。
【0046】例えば、図10の中央部分に各候補文字の
文字種ごとに算出した文字評価値を示す。各候補文字S
0 、S1 、S2 およびS3 の文字評価値72a、72
b、72cおよび72dは、文字種ごとに、(数字・記
号,カタカナ,平仮名,漢字)の様式で示されている。
候補文字S3 を例に取ると、候補文字S3 の計数結果7
0dは(0,0,0,5)であったが、この結果に対し
て、文字評価値算出部60では、先ず、各文字種ごとの
文字コード数を1つの候補文字に対して求められる文字
コード数5で除算するという処理を施す。次に、候補文
字S3 は、セグメントS0 とセグメントS1 とを統合し
たものであるから2個のセグメントから構成されてお
り、従って、先の演算結果(0,0,0,1)のそれぞ
れの要素に2を掛ける。この結果、候補文字S3 の文字
評価値72dは(0,0,0,2)と算出される。各演
算結果は、文字列評価値算出部62に出力される。
【0047】次に、文字列評価値算出部62は、候補文
字列作成手段14の文字列格納部52を参照して、これ
に格納されている候補文字列に従い、文字評価値算出部
60で算出された文字評価値を文字種ごとに選択して読
み出し、加算(計数)を行う手段である。この文字列評
価値算出部62も、文字評価値算出部60と同様に、通
常の演算回路例えば加算回路で構成される。図10の図
中の下側部分に模式的に示すように、この文字列評価値
算出部62で行われる演算は、文字評価値72a、72
b、72cおよび72dを、それぞれ候補文字列P0
たはP1 のいずれか一方に従って、各文字種ごとに加算
するといったものである。この計数結果を、文字列評価
値と称する。ある候補文字列の文字列評価値が大きいと
いうことは、その文字列評価値が算出された文字種が入
力文字列を占める割合が高いということを意味する。図
10には、候補文字列P0 およびP1 の各文字列評価値
を、候補文字列ごとにまとめて、(数字・記号,カタカ
ナ,平仮名,漢字)の様式で以て、それぞれ記号74a
および74bを付して示してある。
【0048】例えば、文字列評価値算出部62は、文字
列格納部52から読み出した候補文字列P0 に従い、候
補文字S0 の文字評価値72a:(0.2,0.4,
0,0.4)と、候補文字S1 の文字評価値72b:
(0,0.2,0.4,0.4)と、候補文字S2 の文
字評価値72c:(0,0.2,0.4,0.4)とを
読み出して、文字種ごとに加算を行い、文字列評価値7
4a:(0.2,0.8,0.8,1.2)を算出す
る。また、例えば、文字列評価値算出部62は、文字列
格納部52から読み出した候補文字列P1 に従い、候補
文字S3 の文字評価値72d:(0,0,0,0.2)
と、候補文字S2 の文字評価値72c:(0,0.2,
0.4,0.4)とを読み出して、文字種ごとに加算を
行い、文字列評価値74b:(0,0.2,0.4,
2.4)を算出する。これら算出結果は、文字列評価値
比較部64に出力される。
【0049】次に、文字列評価値比較部64は、算出し
た各文字列評価値の中で、最大値の文字列評価値を含む
候補文字列を、最良文字列として選択する手段である。
従って、文字列評価値比較部64は、文字列評価値算出
部62から入力される各文字列評価値を大きい順にソー
トするためのソート手段を具えている。そして、このソ
ート結果により得られた最も大きな値の文字列評価値が
属する候補文字列が、自動的に最良文字列として選出さ
れる構成となっている。上述したように、文字列評価値
が大きいということは、その文字列評価値が算出された
文字種がその候補文字列を占める割合が高いということ
を意味する。よって、最大の文字列評価値が属する候補
文字列を最良文字列として選択するということは、最も
文字種が統一されている候補文字列を最良文字列として
選択するということである。図10に示した文字列評価
値74aおよび74bの例では、最大値は2.4であ
り、この値が属する候補文字列はP1 である。よって、
この例では、候補文字列P1が最良文字列として選択さ
れる。すなわち、入力文字列32の切出し位置が、C
0 、C2 およびC3 に決定される。
【0050】この文字列評価値比較部64の出力は、例
えばいわゆるコンピュータ装置の入力端子に接続され、
文字認識情報として活用される。そのような外部手段に
おいては、上述のように決定した文字切出し位置に基づ
いて、そして、例えば単語辞書を参照して照合を行うこ
とにより、入力文字列を(上述した例では「弘三」とい
う具合に)文字認識することができる。また、この実施
の形態の文字切出し装置の各構成要素は、制御部18か
らの制御信号に応じて、動作タイミングが制御されてい
る。尚、上述した文字切出し装置は、中央演算素子(C
PU)、メモリおよび入出力部で構成されるコンピュー
タでもって、各要素のハードウエアを構成してもよい。
従って、例えば、上述した文字切出し装置の各メモリ手
段を、それぞれ互いに共有させて用いる構成としてもよ
いし、また、制御部18等の制御手段を一つの中央演算
素子としてまとめて構成してもよい。
【0051】[文字切出し方法]次に、この実施の形態
の文字切出し方法および文字切出し装置の動作につき説
明する。図11は、この実施の形態の文字切出しフロー
を示すフローチャートである。以下、この文字切出しフ
ローをステップごとに説明する。尚、[装置構成]の項
の説明と重複する説明は省略する場合がある。
【0052】<候補文字の抽出>先ず、文字認識対象で
ある入力文字列から連続した複数個の候補文字を上述し
た候補文字抽出手段12により抽出する。この抽出は、
次の2つのステップ(a)および(b)により行う。
【0053】最初に、ステップ(a):入力文字列の各
黒ブロック領域をセグメントSi (pを整数とすると
き、iは0≦i≦pを満たす整数)として抽出し、その
位置情報をメモリ手段に記録する(図11のS1)。こ
こで、整数(p+1)は、入力文字列を構成するセグメ
ントの個数を表す。図2に示す入力文字列32の場合に
は、これを構成するセグメントはS0 、S1 およびS2
の3個であり、すなわちp=2である。このステップ
(a)では、上述したセグメント抽出部26により、主
走査方向に入力文字列を走査して、この場合には順次に
セグメントS0 、S1 およびS2 を抽出する。メモリ手
段としては、例えば、[装置構成]の項で説明した座標
メモリ30を用いる。そして、この座標メモリ30に各
セグメントS0 、S1 およびS2 の位置情報を、それぞ
れ対応した格納場所に記録する。
【0054】次に、ステップ(b):記録したセグメン
トSi の位置情報に基づきセグメント同士を統合して新
たなセグメントSj (qを整数とするとき、jはp+1
≦j≦p+qを満たす整数)を生成し、このセグメント
j の位置情報を例えば座標メモリ30に追加記録する
(図11のS2)。図2の例では、セグメントS0 とセ
グメントS1 とを統合して、セグメントS3 を生成して
いる。この場合、整数qは1となる。このステップの処
理の結果、座標メモリ30に記録されているすべてのセ
グメントSi およびSj を候補文字Sk (但し、kは0
≦k≦p+qを満たす整数)として取得する(図2の例
では、Si はS0 、S1 、S2 であり、Sj はS3 、S
k はS0 、S1 、S2 、S3 となる。)。図12のフロ
ーチャートに、この(b)ステップで行うセグメント統
合処理をステップごとに示す。
【0055】<セグメント統合処理の説明>先ず、初期
値としてnに0を設定する(図12のS9)。ここで、
nは、0≦n≦p−1を満たす整数である。そして、副
ステップ(b1):入力文字列方向に順次に整列するよ
うに番号付けされて座標メモリ30に記録されたセグメ
ントSn の位置情報を、この座標メモリ30から読み出
す(図12のS10)。例えば、図2に示した入力文字
列32では、整数nの小さい順に、図中の左側から右側
に順次にセグメントS0 、S1 、S2 が配列している。
そして、例えば、座標メモリ30には、記号Sn に対応
したアドレス(格納場所)に各セグメントSnの位置情
報が格納されている。この副ステップ(b1)では、特
定の記号Sn に対応した座標メモリ30のアドレスが付
された格納場所に格納されている位置情報を、上述した
第1読出部34で読み出す。
【0056】次に、副ステップ(b2):セグメントS
n に隣接するセグメントSn+1 の位置情報を、座標メモ
リ30から読み出す(図12のS11)。この副ステッ
プ(b2)は、副ステップ(b1)で説明したのと同様
に、特定の記号Sn+1 に対応した座標メモリ30のアド
レスが付された格納場所に格納されている位置情報を、
上述した第2読出部36で読み出すことにより行う。
【0057】次に、副ステップ(b3):セグメントS
n とセグメントSn+1 との間の距離Dn を、副ステップ
(b2)で読み出した各々の位置情報から求める(図1
2のS12)。距離Dn は[装置構成]の項で説明した
ように、互いに隣接する各セグメントの始端位置の差を
検出することにより求められる。上述したように、距離
検出部38は、第1読出部34および第2読出部36で
読み出した位置情報から距離Dn を検出する。
【0058】次に、副ステップ(b4):入力文字列の
行高さLの定数e(eは正の実数)倍と、副ステップ
(b3)で求めた距離Dn とを比較する(図12のS1
3)。この比較処理は、上述した比較部40で行われ
る。定数eの値は、上述した理由から、1.2に設定し
てある。
【0059】Dn ≦e・Lの場合 副ステップ(b5):副ステップ(b4)の比較結果が
n ≦e・LのときにセグメントSn とセグメントS
n+1 とを統合して新たなセグメントSj とする(図12
のS14)。このセグメントSj の生成は、上述したセ
グメント生成部42で行われる。セグメント生成部42
は、生成したセグメントSj の位置情報を書込部44を
介して、座標メモリ30に追加記録する(図12のS1
5)。この実施の形態では、1つのセグメントを生成す
る度にメモリへの書き込みを行っているが、これに限ら
ず、セグメントの生成処理を終了するまでこのセグメン
トの位置情報を順序づけて記憶しておくためのメモリ手
段をセグメント生成部42に設けておき、セグメント生
成処理の終了した時点で、1度に全ての新規セグメント
の書き込みを行うようにしてもよい。そして、セグメン
ト生成部42は、入力文字列を構成しているセグメント
が全て読み出されたかどうかの判定を行う(図12のS
16)。このため、セグメント生成部42には、第1読
出部34または第2読出部36で読み込んだセグメント
数を計数する手段を設けておき、セグメント数が(p−
1)個になったことを判定できる構成としてある。すな
わち、この実施の形態では、整数nの小さい順にセグメ
ントSn を読み出してゆくから、読み出したセグメント
の番号が(p−1)になったことを検出するように設定
しておけばよい。そして、セグメント生成部42は、読
み出したセグメントの番号nが(p−1)になった場合
には、このセグメント統合処理を終了するように、制御
部18に指示を出す。また、読み出したセグメントの番
号nが(p−1)ではない場合には、番号nに1を加え
て(図12のS17)、次の番号のセグメントの読み出
しを行うように第1読出部34および第2読出部36に
指示を与える(図12のS10)。
【0060】Dn >e・Lの場合 副ステップ(b4)の比較結果が、Dn >e・Lのとき
には、読み出したセグメントの統合を行わない。そし
て、読み出したセグメントの番号nが(p−1)である
か否かを判定し(図12のS16)、その判定結果に基
づいて上述した処理を行う。
【0061】以上説明したセグメント統合処理により、
座標メモリ30には、入力文字列から直接抽出されたセ
グメントSi と、これらセグメントSi から生成した新
規セグメントSj とが記録される。これらセグメントを
合わせて、番号および記号はそのままにして、候補文字
k (kは0≦k≦p+qを満たす整数)と称してい
る。
【0062】<候補文字列の作成>次に、ステップ
(c):座標メモリ30に記録した候補文字Sk の位置
情報に基づき各候補文字を入力文字列を再現せしめるよ
うに配列した情報を、候補文字列Pr (rは整数)とし
て作成する(図11のS3)。この候補文字列の作成
は、公知のグラフ理論に基づくグラフ探索のアルゴリズ
ムを用いて行える。この実施の形態では、上述したよう
に、この候補文字列の作成を、候補文字列作成手段14
で作成する。上述したように、候補文字列作成手段14
は、テーブル作成部46、処理回路48、候補文字記録
部50、文字列格納部52およびテーブルメモリ部54
を具えている(図7)。テーブル作成部46により、先
ず、座標メモリ30から位置情報を読み出して、上述し
たセグメントテーブルを作成する。これは、座標メモリ
30からセグメント番号順に候補文字抽出手段12で抽
出した各セグメントSi の位置情報を読み出してゆき、
その位置情報から、各セグメントの始端位置と入力文字
列の最後尾のセグメントSp+1 の終端位置とを検出する
ことにより行える。そして、これら検出した位置情報に
基づいて、各位置を切出し候補位置Cm (mは、0≦m
≦p+1を満たす整数)として、入力文字列の主走査方
向に順次に番号付けられた位置としてテーブルメモリ部
54に格納する。そして、テーブルメモリ部54には、
各候補文字Sk が、切出し候補位置Cm と対応付けられ
て、始点位置と終点位置とを指定すれば対応する候補文
字の位置情報が座標メモリ30から読み出しできるよう
に記憶される。そして、このテーブルメモリ部54に記
憶されている情報を参照して、処理回路48は、作成関
数F(Cm ,Pr )を用いた処理を行って、候補文字列
を作成する。次に、この作成関数F(Cm ,Pr )の処
理手順につき、図13のフローチャートを参照して、説
明する。
【0063】<作成関数の説明>ここでは、切出し候補
位置Ca (aは、0≦a≦p+1を満たす整数)および
候補文字列Pr を引き数とする作成関数F(Ca ,P
r )の処理につき説明する。始めに、整数δ(δはδ=
b−aを満たす整数。但し、bは、0≦a≦p+1、b
>aを満たす整数。)に1を、整数rには0をそれぞれ
初期値として設定する(図13のS18)。また、候補
文字記録部50の内部状態すなわち配列情報を初期化し
ておく(図13のS19)。また、整数aには0を代入
して、初期化する(図13のS20)。
【0064】先ず、副ステップ(c1):番号aが(p
+1)であることを判定する(図13のS21)。この
判定は、処理回路48で行う。
【0065】次に、副ステップ(c2):処理回路48
の判定結果がa≠p+1の場合には、切出し始点位置と
して切出し候補位置Ca を、テーブルメモリ部54から
読み出す(図13のS22)。続いて、切出し終点位置
として切出し候補位置Cb を、テーブルメモリ部54か
ら読み出す(図13のS23)。切出し候補位置C
は、切出し候補位置C よりも、常に番号が大きく
なるように呼び出される(すなわちb>aである。図2
の入力文字列の例では、図中の右側の位置の方が番号が
大きくなるように、切出し候補位置が番号付けされてい
る。)。そして、読み出した切出し候補位置Ca および
b 間の候補文字Sk を、上述した候補文字記録部50
に順序付けて配列情報Pr として格納する(図13のS
24)。例えば、候補文字記録部50には、読み出した
候補文字Sk の順に、テーブルメモリ部54に記録され
ているその候補文字Sk のアドレス番号(格納場所を指
定する情報)が記録されてゆく。この後、この候補文字
記録部50に全ての候補文字Skが格納されたかどうか
の判定を行う(図13のS25)。この判定は、例え
ば、処理回路48に、テーブルメモリ部54から全ての
候補文字が読み出されたかどうかを計数しておく手段を
設けておけばよい。
【0066】全候補文字が格納された場合 この場合には、作成関数の処理は終了する。
【0067】全候補文字が格納されていない場合 この場合には、番号aおよびbのそれぞれに1を加え
て、作成関数F(Ca+1,Pr )を呼び出す。つまり、
次に、作成関数F(Ca+1 ,Pr )の処理が始まる。そ
して、再び、番号aが(p+1)であるか否かを判定す
るステップ(図13のS21)に戻って、上述したステ
ップを繰り返し行う。このように、番号aが(p+1)
になるまで、再帰的に作成関数を呼び出すことにより、
配列情報Pr を完成させる。ここで、配列情報Pr の完
成とは、選択されて格納された候補文字でもって、処理
対象としている入力文字列を再現できることをいう。次
に、この配列情報Pr が完成した場合すなわち番号aが
(p+1)になった場合の、作成関数の処理につき説明
する。
【0068】副ステップ(c3):処理回路48の判定
結果がa=p+1の場合には、候補文字記録部50に格
納されている配列情報Pr を、候補文字列Pr として上
述した文字列格納部52に格納する(図13のS2
7)。そして、先程と同様に、候補文字記録部50に全
ての候補文字Sk が格納されたかどうかの判定を行う
(図13のS28)。
【0069】全候補文字が格納された場合 この場合には、作成関数の処理は終了する。
【0070】全候補文字が格納されていない場合 この場合には、整数δ(=b−a)およびr(候補文字
列番号r)のそれぞれに1を加え(図13のS29)、
候補文字記録部50に格納されている配列情報を初期化
し(図13のS19)、番号aをa=0に初期化するこ
とにより(図13のS20)、次に、作成関数F(C
0 ,Pr+1 )を呼び出す。つまり、今度は、作成関数F
(C0 ,Pr+1 )の処理が始まる。そして、再び、切出
し候補位置Ca の添字を表す番号aが(p+1)である
か否かを判定するステップ(図13のS21)に戻っ
て、上述したステップを繰り返し行う。このように、番
号aが(p+1)になるまで、再帰的に作成関数を呼び
出すことにより、今度は、配列情報Pr+1 を完成させる
処理を行う。
【0071】<最良文字列の選択>以下、ステップ
(d)〜(h)により、最良文字列の選択を行う処理に
つき説明する。この実施の形態の文字切出し方法は、最
良文字列として、複数の候補文字列の中で最も文字種が
統一されている候補文字列を選択するところに特色があ
る。
【0072】先ず、ステップ(d):記録した候補文字
k の位置情報を座標メモリ30から読み出し、この位
置情報に基づいて入力文字列から各候補文字に対応する
文字画像を切り出し、この切り出した文字画像の文字認
識を行って類似度の高い順に上位M位(Mは整数)まで
の文字コードを取得する(図11のS4)。この文字認
識処理は、上述したように、文字認識部56で行う。こ
の実施の形態では、上述した整数Mを5に設定してい
る。従って、各候補文字に対して、類似度の高い順に順
序付けられた5個の文字コードが得られる。検出した文
字コードは、候補文字Sk の位置情報と対応付けて、つ
まり、候補文字Sk の位置情報が格納されている座標メ
モリ30中のアドレス番号と対応付けて、文字コード格
納部68に記憶しておく。
【0073】次に、ステップ(e):各候補文字Sk
とに取得した上位M位の文字コードをN種類(Nは整
数)の文字種に分類し、第h番目(hは1≦h≦Nを満
たす整数)の文字種に属する検出した文字コードの個数
khを計数する(図11のS5)。上述したように、こ
のステップの処理は、文字種分類部58が、座標メモリ
30を参照して文字コード格納部68から例えば候補文
字番号順に呼び出すことにより行う。この実施の形態で
は、上述した文字種(すなわち、数字・記号、カタカ
ナ、平仮名および漢字の4種類の文字種)を設定してあ
るから、整数Nとして4が設定してある。そして、ここ
では、例えば、数字・記号を第1番目の文字種とし、カ
タカナを第2番目の文字種とし、平仮名を第3番目の文
字種とし、漢字を第4番目の文字種としている。従っ
て、例えば、候補文字S0 の文字種が漢字である文字コ
ードの個数は、記号I04で表される。図2に例示の入力
文字列の場合には、I04=2である(図10の計数結果
70a参照)。このステップの計数結果は、次のステッ
プ(f)の処理を行う文字評価値算出部60に、順次に
出力される。
【0074】次に、ステップ(f):ステップ(e)の
計数結果である文字コードの個数Ikhを前述の文字コー
ド数Mで除算して値Ikh/Mを算出し、さらにこの値I
kh/Mに認識対象の候補文字Sk を構成するセグメント
数Wk を積算したものを文字評価値Wk ・Ikh/Mとし
て算出する(図11のS6)。この文字評価値の算出を
行う処理は、上述した文字評価値算出部60で行われ
る。例えば、図2に例示の入力文字列を処理対象とする
場合、候補文字S0 の文字種が漢字である文字コード数
04は2であり、この候補文字を構成するセグメント数
0 は1である。そして、1つの候補文字に対して求め
られる文字コード数Mが5であるから、従って、この候
補文字S0 に対する文字評価値は、0.4と計算され
る。このステップの計数結果は、次のステップ(g)の
処理を行う文字列評価値算出部62に順次に出力され
る。
【0075】次に、ステップ(g):第h番目の文字種
につき第r番目の候補文字列Pr に従い算出した文字評
価値Wk ・Ikh/Mを選択して計数した結果を、第r番
目の候補文字列Pr の文字列評価値Σrk ・Ikh/M
として算出する(図11のS7)。このステップの処理
は、上述した文字列評価値算出部62で行われる。文字
列評価値算出部62は、ステップ(c)で作成して文字
列格納部52に記憶されている候補文字列を参照して、
この候補文字列に記載されている配列順序に従った振分
けを、文字評価値算出部60から入力される文字評価値
に対して行い、順次に文字列評価値を算出してゆく。こ
の実施の形態では、文字評価値は、文字評価値算出部6
0から、候補文字番号順および文字種番号順に、順次に
文字列評価値算出部62に入力される。従って、文字列
評価値算出部62は、これら文字評価値を、この文字列
評価値算出部62に設けられたメモリ手段の候補文字番
号および文字種番号に対応させた格納場所に格納するこ
とができる。よって、文字列評価値算出部62は、文字
列格納部52から入力される配列情報(候補文字列)に
基づいて、文字評価値を格納したメモリ手段から、この
配列情報に対応した文字評価値を選別して読み出すこと
ができる。この実施の形態では、この文字評価値の読み
出し先は、[装置構成]の項で説明した加算回路であ
る。この加算回路で、それぞれ候補文字列および文字種
ごとに計数(加算)が行われて、文字列評価値Σrk
・Ikh/Mが算出される。ここで、Σr は、第r番目の
候補文字列に亘って、文字評価値Wk ・Ikh/Mを加算
することを表している。例えば、図2に例示の入力文字
列の場合、候補文字列P1 の文字種が漢字である文字列
評価値の算出は、各文字評価値が W2 ・I24/M=0.4(図10の文字評価値72c) W3 ・I34/M=2 (図10の文字評価値72d) であるから、これらを加算した2.4という値が、第1
番目の候補文字列P1 の漢字の文字列評価値となる(図
10の文字列評価値74b)。このように、文字列評価
値算出部62で算出された文字列評価値は、候補文字列
および文字種ごとに算出されて、次に説明するステップ
(h)の処理を行う文字列評価値比較部64に出力され
る。
【0076】次に、ステップ(h):ステップ(g)で
算出した文字列評価値Σrk ・Ikh/Mが最大のとき
に、第r番目の候補文字列Pr を最良文字列として選択
する(図11のS8)。このステップ(h)の処理は、
上述した文字列評価値比較部64で行われる。この文字
列評価値比較部64は、上述した通り、ソート手段を具
えており、文字列評価値算出部62から入力される文字
列評価値を大きい順に順位を付して格納する。そして、
文字列評価値の最大値を検出する。また、この最大とな
る文字列評価値が算出された候補文字列を、最良文字列
として選択する。この文字列評価値比較部64は、文字
列格納部52に格納されている候補文字列の中から最良
文字列を識別するための信号を、外部手段に出力する。
その信号を受けた外部手段は、例えば、その信号に基づ
いて、文字列格納部52から最良文字列を選択して読み
出すことができる。そして、その情報に基づいて、この
外部手段は、画像メモリ22と座標メモリ30に対し
て、原画像から最良文字列で表される切出し位置で文字
画像を切り出すように指示するといった、文字認識情報
の活用が行えるようになる。
【0077】以上説明したように、この実施の形態の文
字切出し方法は、最も大きな値の文字列評価値を有する
候補文字列を、最良文字列として選択する方法である。
つまり、前述したように、最も文字種が統一されている
候補文字列を最良文字列として選択する方法である。こ
のように、この文字切出し方法は、候補文字列を構成す
る文字種の割合を、切出し位置の選択基準とするもので
ある。従って、従来のように、文字コードの類似度を直
接の選択基準とするものではない。よって、従来のよう
に、類似度を求める際の尺度の違いにより、候補文字列
の選択基準があいまいになってしまい、その結果、正確
な候補文字列の選択を行うことができないといったこと
がなくなる。よって、この実施の形態の方法によれば、
文字切出し精度が向上する。
【0078】
【発明の効果】この発明の文字切出し方法によれば、文
字種が最も統一されるような候補文字の組合せを選択す
ることにより、高い文字切出し精度を実現できる。
【0079】また、この発明の文字切出し方法の好適な
実施例によれば、各候補文字の文字認識処理を行って、
類似度に基づいてM個の文字コードを取得し、候補文字
ごとに取得した文字コードを文字種に従って分類し、各
分類の文字コード数を計数し、その個数を全文字コード
数で除算することにより、ある候補文字から取得した各
文字コードの文字種ごとの割合を求めることができる。
そして、各候補文字に対して求めた「割合」を文字種ご
とに候補文字列に従って加算することにより、その候補
文字列をその文字種が占める割合(文字列評価値)を求
めることができる。この求めた文字列評価値の中から最
大の文字列評価値の候補文字列を、最良文字列として選
択して出力することができる。
【0080】また、この発明の文字切出し方法の好適な
実施例によれば、隣接するセグメント間の距離に基づい
て、この距離と行高さとを比較することにより、セグメ
ントの組を統合するか否かを判定することができる。
【0081】また、この発明の文字切出し方法の好適な
実施例によれば、ある候補文字から、これとは別の全て
の候補文字を、切出し候補位置を指定することにより辿
り、その候補文字を配列情報としてグループ化すること
により、これら配列情報のそれぞれを候補文字列として
得ることができる。
【0082】また、この発明の文字切出し装置によれ
ば、文字種が最も統一される候補文字の組合せを選択し
て出力するように構成することにより、高い文字切出し
精度で文字を切り出すことができる。
【0083】また、この発明の文字切出し装置の好適な
構成例によれば、文字認識部は各候補文字の文字認識処
理を行って、類似度に基づいてM個の文字コードを取得
し、文字種分類部は候補文字ごとに取得した文字コード
を文字種に従って分類し、各分類の文字コード数を計数
し、文字評価値算出部はその個数を全文字コード数で除
算することにより、ある候補文字から取得した各文字コ
ードの文字種ごとの割合を求める。また、文字列評価値
算出部は各候補文字に対して求めた「割合」を文字種ご
とに候補文字列に従って加算することにより、その候補
文字列をその文字種が占める割合(文字列評価値)を求
める。そして、文字列評価値比較部は、この求められた
文字列評価値の中から最大の文字列評価値の候補文字列
を、最良文字列として選択して出力することができる。
【0084】また、この発明の文字切出し装置の好適な
構成例によれば、隣接するセグメント間の距離に基づい
て、この距離と行高さとを比較することにより、セグメ
ントの組を統合するか否かを判定することができる構成
としてある。
【0085】また、この発明の文字切出し装置の好適な
構成例によれば、ある候補文字から、これとは別の全て
の候補文字を、切出し候補位置を指定することにより辿
り、その候補文字を配列情報としてグループ化する上述
した候補文字列作成手段の構成によれば、これら配列情
報のそれぞれを候補文字列として得ることができる。
【図面の簡単な説明】
【図1】実施の形態の文字切出し装置の構成を示す図で
ある。
【図2】入力文字列と候補文字列の一例を示す図であ
る。
【図3】統合前のセグメント座標テーブルの一例を示す
図である。
【図4】実施の形態のセグメント統合部の構成を示す図
である。
【図5】セグメント間距離の定義の一例を示す図であ
る。
【図6】統合後のセグメント座標テーブルの一例を示す
図である。
【図7】実施の形態の候補文字列作成手段の構成を示す
図である。
【図8】セグメントテーブルの一例を示す図である。
【図9】候補文字列テーブルの一例を示す図である。
【図10】実施の形態の最良文字列の選択の説明に供す
る図である。
【図11】実施の形態の文字切出しフローを示す図であ
る。
【図12】実施の形態のセグメント統合処理を示す図で
ある。
【図13】実施の形態の作成関数の処理を示す図であ
る。
【符号の説明】
10:画像入力部 12:候補文字抽出手段 14:候補文字列作成手段 16:最良文字列選択手段 18:制御部 20:光電変換部 22:画像メモリ 24:切出部 26:セグメント抽出部 28:セグメント統合部 30:座標メモリ 32:入力文字列 34:第1読出部 36:第2読出部 38:距離検出部 40:比較部 42:セグメント生成部 44:書込部 46:テーブル作成部 48:処理回路 50:候補文字記録部 52:文字列格納部 54:テーブルメモリ部 56:文字認識部 58:文字種分類部 60:文字評価値算出部 62:文字列評価値算出部 64:文字列評価値比較部 66a,66b,66c,66d:文字認識結果 68:文字コード格納部 70a,70b,70c,70d:計数結果 72a,72b,72c,72d:文字評価値 74a,74b:文字列評価値

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 文字認識対象である入力文字列から連続
    した複数個の候補文字を抽出し、該候補文字の配列から
    なる複数の候補文字列を作成し、前記抽出した各候補文
    字の認識結果に基づき前記候補文字列の中から最良文字
    列を選択することにより、前記入力文字列の文字切出し
    位置を決定する文字切出し方法において、 前記最良文字列として、複数の前記候補文字列の中で最
    も文字種が統一されている候補文字列を選択することを
    特徴とする文字切出し方法。
  2. 【請求項2】 請求項1に記載の文字切出し方法におい
    て、 前記候補文字の抽出を、 (a)前記入力文字列の各黒ブロック領域をセグメント
    i (pを整数とするとき、iは0≦i≦pを満たす整
    数)として抽出し、その位置情報をメモリ手段に記録す
    るステップと、 (b)前記記録したセグメントSi の位置情報に基づき
    セグメント同士を統合して新たなセグメントSj (qを
    整数とするとき、jはp+1≦j≦p+qを満たす整
    数)を生成し、該セグメントSj の位置情報を前記メモ
    リ手段に追加記録することにより、該メモリ手段に記録
    されている全てのセグメントSi およびSj を前記候補
    文字Sk (但し、kは0≦k≦p+qを満たす整数)と
    して取得するステップとを以て行い、 前記候補文字列の作成を、 (c)前記記録した候補文字Sk の位置情報に基づき各
    候補文字を前記入力文字列を再現せしめるように配列し
    た情報を、前記候補文字列Pr (rは整数)として作成
    することにより行い、 前記最良文字列の選択を、 (d)前記記録した候補文字Sk の位置情報を前記メモ
    リ手段から読み出し、該位置情報に基づいて前記入力文
    字列から各候補文字に対応する文字画像を切り出し、該
    切り出した文字画像の文字認識を行って類似度の高い順
    に上位M位(Mは整数)までの文字コードを取得するス
    テップと、 (e)各候補文字Sk ごとに前記取得した上位M位の文
    字コードをN種類(Nは整数)の文字種に分類し、第h
    番目(hは1≦h≦Nを満たす整数)の文字種に属する
    前記文字コードの個数Ikhを計数するステップと、 (f)前記計数結果である文字コードの個数Ikhを前記
    文字コード数Mで除算して値Ikh/Mを算出し、さらに
    該値Ikh/Mに認識対象の候補文字Sk を構成するセグ
    メント数Wk を積算したものを文字評価値Wk ・Ikh
    Mとして算出するステップと、 (g)第h番目の文字種につき第r番目の候補文字列P
    r に従い前記算出した文字評価値Wk ・Ikh/Mを選択
    して計数した結果を、第r番目の候補文字列Pr の文字
    列評価値Σrk ・Ikh/Mとして算出するステップ
    と、 (h)前記算出した文字列評価値Σrk ・Ikh/Mが
    最大のときに第r番目の候補文字列Pr を前記最良文字
    列として選択するステップとを以て行うことを特徴とす
    る文字切出し方法。
  3. 【請求項3】 請求項2に記載の文字切出し方法におい
    て、 前記(b)ステップにおける前記セグメントSj の生成
    は、 (b1)入力文字列方向に順次に整列するように番号付
    けされて前記メモリ手段に記録されたセグメントSn
    (nは、0≦n≦p−1を満たす整数)の位置情報を、
    該メモリ手段から読み出すステップと、 (b2)該セグメントSn に隣接するセグメントSn+1
    の位置情報を、前記メモリ手段から読み出すステップ
    と、 (b3)セグメントSn とセグメントSn+1 との間の距
    離Dn を前記読み出した各々の位置情報から求めるステ
    ップと、 (b4)前記入力文字列の行高さLの定数e(eは正の
    実数)倍と前記求めた距離Dn とを比較するステップ
    と、 (b5)該比較結果がDn ≦e・Lのときにセグメント
    n とセグメントSn+1 とを統合して新たなセグメント
    j とするステップとを以て行うことを特徴とする文字
    切出し方法。
  4. 【請求項4】 請求項3に記載の文字切出し方法におい
    て、前記定数eの値を1.2に設定したことを特徴とす
    る文字切出し方法。
  5. 【請求項5】 請求項2に記載の文字切出し方法におい
    て、 前記(c)ステップにおける候補文字列Pr の作成を、 入力文字列方向に順次に整列するように番号付けされて
    前記メモリ手段に記録された候補文字Sn (nは、0≦
    n≦p−1を満たす整数)の位置情報を、該メモリ手段
    から読み出し、 前記入力文字列の両端位置と、候補文字Sn およびS
    n+1 間の境界位置とを、前記読み出した位置情報に基づ
    き前記入力文字列方向に順次に切出し候補位置Cm (m
    は、0≦m≦p+1を満たす整数)として求め、該切出
    し候補位置Cm を前記候補文字の位置情報と対応付けて
    テーブルメモリ部に記憶し、 前記候補文字列を作成するための作成関数F(Cm ,P
    r )を用いた処理を行う処理回路と、前記候補文字の配
    列情報を記録するための候補文字記録部と、前記配列情
    報を前記候補文字列として格納するための文字列格納部
    とを具えた手段により、前記入力文字列を再現せしめる
    候補文字の配列情報を求めることにより行うことを特徴
    とする文字切出し方法。但し、切出し候補位置Ca (a
    は、0≦a≦p+1を満たす整数)および候補文字列P
    r を引き数とする作成関数F(Ca ,Pr )は、 (c1)前記aが(p+1)であることを判定する処理
    と、 (c2)前記判定結果がa≠p+1の場合、 切出し始点位置として前記切出し候補位置Ca を、前記
    テーブルメモリ部から読み出し、 切出し終点位置として切出し候補位置Cb (bは、0≦
    b≦p+1、b>aを満たす整数)を、前記テーブルメ
    モリ部から読み出し、 前記読み出した各切出し候補位置Ca およびCb 間の候
    補文字Sk を、前記候補文字記録部に順次に配列情報と
    して格納し、 全候補文字が前記候補文字記録部に格納された場合に
    は、処理を終了し、 全候補文字が前記候補文字記録部に格納されていない場
    合には、前記aおよびbにそれぞれ1を加えて、次に、
    作成関数F(Ca+1 ,Pr )を呼び出す処理と、 (c3)前記判定結果がa=p+1の場合、 前記候補文字記録部に格納されている配列情報を前記候
    補文字列Pr として前記文字列格納部に格納し、 全候補文字が前記候補文字記録部に格納された場合に
    は、処理を終了し、 全候補文字が前記候補文字記録部に格納されていない場
    合には、前記rおよび差(b−a)のそれぞれに1を加
    えて、前記格納されている配列情報を初期化し、前記a
    を初期化し(a=0)、次に、作成関数F(C0 ,P
    r+1 )を呼び出す処理とを実行する関数である。
  6. 【請求項6】 文字認識対象である入力文字列を含む原
    画像を読み取り、該読み取られた原画像を格納する画像
    メモリを具えた画像入力部と、該画像メモリから前記入
    力文字列を読み出し、該入力文字列から連続した複数個
    の候補文字を抽出する候補文字抽出手段と、該抽出され
    た候補文字の配列からなる複数の候補文字列を作成する
    候補文字列作成手段と、前記抽出された候補文字の認識
    結果に基づき前記候補文字列の中から最良文字列を選択
    することにより、前記入力文字列の文字切出し位置を決
    定する最良文字列選択手段とを具える文字切出し装置に
    おいて、 前記最良文字列選択手段は、前記認識結果で最も文字種
    が統一されている前記候補文字列を前記最良文字列とし
    て選択する手段であることを特徴とする文字切出し装
    置。
  7. 【請求項7】 請求項6に記載の文字切出し装置におい
    て、 前記候補文字抽出手段は、 前記読み取られた入力文字列を構成する各黒ブロック領
    域をセグメントSi (pを整数とするとき、iは0≦i
    ≦pを満たす整数)として抽出し、該セグメントSi
    位置情報を記録するためのメモリ手段を具えたセグメン
    ト抽出部と、 前記メモリ手段に記録された位置情報を読み出し、該位
    置情報に基づき前記抽出されたセグメント同士を統合し
    て新たなセグメントSj (qを整数とするとき、jはp
    +1≦j≦p+qを満たす整数)を生成し、該セグメン
    トSj の位置情報を前記メモリ手段に追加記録すること
    により、該メモリ手段に記録されている全てのセグメン
    トSi およびSj を前記候補文字Sk (但し、kは0≦
    k≦p+qを満たす整数)として取得するセグメント統
    合部とを具えており、 前記候補文字列作成手段は、 前記メモリ手段に記録された候補文字Sk の位置情報を
    読み出し、該位置情報に基づいて候補文字Sk を、前記
    入力文字列を再現せしめるように配列させ、該配列情報
    を前記候補文字列Pr (rは整数)として記憶する手段
    であり、 前記最良文字列選択手段は、 前記メモリ手段に記録されている候補文字Sk の位置情
    報を読み出し、該位置情報に基づき前記画像メモリに格
    納されている入力文字列から候補文字Sk の文字画像を
    切り出し、該候補文字Sk の文字認識を行って類似度の
    高い順に上位M位(Mは整数)までの文字コードを取得
    し、該文字コードを格納するための文字コード格納部を
    具えた文字認識部と、 各候補文字Sk ごとに前記文字コード格納部に格納され
    ている上位M位の文字コードを読み出し、これらをN種
    類(Nは整数)の文字種に分類して第h番目(hは1≦
    h≦Nを満たす整数)の文字種に属する文字コードの個
    数Ikhを計数する文字種分類部と、 前記計数結果である文字コードの個数Ikhを前記文字コ
    ード数Mで除算して値Ikh/Mを算出し、さらに該値I
    kh/Mに認識対象の候補文字Sk を構成するセグメント
    数Wk を積算したものを文字評価値Wk ・Ikh/Mとし
    て算出する文字評価値算出部と、 第h番目の文字種につき第r番目の候補文字列Pr に従
    い文字評価値Wk ・Ikh/Mを選択して計数し、第r番
    目の候補文字列Pr の文字列評価値Σrk ・Ikh/M
    を算出する文字列評価値算出部と、 前記算出した各文字列評価値を比較して、文字列評価値
    Σrk ・Ikh/Mが最大であるときに第r番目の候補
    文字列Pr を前記最良文字列として選択する文字列評価
    値比較部とを具えることを特徴とする文字切出し装置。
  8. 【請求項8】 請求項7に記載の文字切出し装置におい
    て、 前記セグメント統合部は、 入力文字列方向に順次に番号付けされて前記メモリ手段
    に記録されたセグメントSn (nは、0≦n≦p−1を
    満たす整数)の位置情報を、該メモリ手段から読み出す
    第1読出部と、 セグメントSn に隣接するセグメントSn+1 の位置情報
    を前記メモリ手段から読み出す第2読出部と、 セグメントSn とセグメントSn+1 との間の距離Dn
    前記読み出された各々の位置情報から求める距離検出部
    と、 前記検出された距離Dn と前記入力文字列の行高さLの
    定数e(eは正の実数)倍とを比較する比較部と、 前記比較部の処理結果がDn ≦e・Lのときに、セグメ
    ントSn とセグメントSn+1 とを統合して新たなセグメ
    ントSj を生成するセグメント生成部と、 前記生成されたセグメントSj の位置情報を前記メモリ
    手段に追加記録する書込部とを具えることを特徴とする
    文字切出し装置。
  9. 【請求項9】 請求項8に記載の文字切出し装置におい
    て、前記定数eの値が1.2に設定されていることを特
    徴とする文字切出し装置。
  10. 【請求項10】 請求項7に記載の文字切出し装置にお
    いて、 前記候補文字列作成手段は、 入力文字列方向に順次に整列するように番号付けされて
    前記メモリ手段に記録された候補文字Sn (nは、0≦
    n≦p−1を満たす整数)の位置情報を、該メモリ手段
    から読み出し、 前記入力文字列の両端位置と、候補文字Sn およびS
    n+1 間の境界位置とを、前記読み出した位置情報に基づ
    き前記入力文字列方向に順次に切出し候補位置Cm (m
    は、0≦m≦p+1を満たす整数)として求め、該切出
    し候補位置Cm を前記候補文字の位置情報と対応付けて
    テーブルメモリ部に記憶するテーブル作成部と、 前記候補文字列Pr を作成するための作成関数F(C
    m ,Pr )を用いた処理を行う処理回路と、 前記候補文字の配列情報を記録するための候補文字記録
    部と、 前記配列情報を前記候補文字列として格納するための文
    字列格納部とを具えることを特徴とする文字切出し装
    置。但し、切出し候補位置Ca (aは、0≦a≦p+1
    を満たす整数)および候補文字列Pr を引き数とする作
    成関数F(Ca ,Pr )は、 (c1)前記aが(p+1)であることを判定する処理
    と、 (c2)前記判定結果がa≠p+1の場合、 切出し始点位置として前記切出し候補位置Ca を、前記
    テーブルメモリ部から読み出し、 切出し終点位置として切出し候補位置Cb (bは、0≦
    b≦p+1、b>aを満たす整数)を、前記テーブルメ
    モリ部から読み出し、 前記読み出した各切出し候補位置Ca およびCb 間の候
    補文字Sk を、前記候補文字記録部に順次に配列情報と
    して格納し、 全候補文字が前記候補文字記録部に格納された場合に
    は、処理を終了し、 全候補文字が前記候補文字記録部に格納されていない場
    合には、前記aおよびbにそれぞれ1を加えて、次に、
    作成関数F(Ca+1 ,Pr )を呼び出す処理と、 (c3)前記判定結果がa=p+1の場合、 前記候補文字記録部に格納されている配列情報を前記候
    補文字列Pr として前記文字列格納部に格納し、 全候補文字が前記候補文字記録部に格納された場合に
    は、処理を終了し、 全候補文字が前記候補文字記録部に格納されていない場
    合には、前記rおよび差(b−a)のそれぞれに1を加
    えて、前記格納されている配列情報を初期化し、前記a
    を初期化し(a=0)、次に、作成関数F(C0 ,P
    r+1 )を呼び出す処理とを実行する関数である。
JP8311079A 1996-11-21 1996-11-21 文字切出し方法および文字切出し装置 Withdrawn JPH10154207A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8311079A JPH10154207A (ja) 1996-11-21 1996-11-21 文字切出し方法および文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8311079A JPH10154207A (ja) 1996-11-21 1996-11-21 文字切出し方法および文字切出し装置

Publications (1)

Publication Number Publication Date
JPH10154207A true JPH10154207A (ja) 1998-06-09

Family

ID=18012874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8311079A Withdrawn JPH10154207A (ja) 1996-11-21 1996-11-21 文字切出し方法および文字切出し装置

Country Status (1)

Country Link
JP (1) JPH10154207A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9280725B2 (en) 2013-02-14 2016-03-08 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9280725B2 (en) 2013-02-14 2016-03-08 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
JP2973944B2 (ja) 文書処理装置および文書処理方法
US6151423A (en) Character recognition with document orientation determination
US5438628A (en) Method for matching text images and documents using character shape codes
EP0355748A2 (en) A pattern recognition apparatus and method for doing the same
JPH08166970A (ja) コード化したワードトークンを使用して文書画像をハイライトで強調する方法
JPH05242292A (ja) 分離方法
JPH0664631B2 (ja) 文字認識装置
JPH0721320A (ja) 自動スクリプト決定装置
JPH076206A (ja) 自動文字分類装置
US6560359B2 (en) Data processing method and apparatus
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
US6567545B1 (en) Format recognition method, apparatus and storage medium
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
JPS62254282A (ja) 重畳するパタ−ンを分離する方法及び装置
JPH0430070B2 (ja)
US5119441A (en) Optical character recognition apparatus and method using masks operation
JPH09161013A (ja) 文字読取り方法及び住所読取り方法
JPH10154207A (ja) 文字切出し方法および文字切出し装置
JP3157530B2 (ja) 文字切り出し方法
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JP3661774B2 (ja) 文字列認識方法、文字認識装置およびプログラム
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JPH10198761A (ja) 文字認識方法および文字認識装置
JP3710164B2 (ja) 画像処理装置及び方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040203