JP3833867B2 - Concatenated character separation device, concatenated character separation method, and computer-readable recording medium recording a program for causing a computer to execute the method - Google Patents

Concatenated character separation device, concatenated character separation method, and computer-readable recording medium recording a program for causing a computer to execute the method Download PDF

Info

Publication number
JP3833867B2
JP3833867B2 JP2000095513A JP2000095513A JP3833867B2 JP 3833867 B2 JP3833867 B2 JP 3833867B2 JP 2000095513 A JP2000095513 A JP 2000095513A JP 2000095513 A JP2000095513 A JP 2000095513A JP 3833867 B2 JP3833867 B2 JP 3833867B2
Authority
JP
Japan
Prior art keywords
character
calculating
calculated
separation
line density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000095513A
Other languages
Japanese (ja)
Other versions
JP2001283154A (en
Inventor
昌利 大西
佳洋 入江
博史 亀山
Original Assignee
グローリー工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グローリー工業株式会社 filed Critical グローリー工業株式会社
Priority to JP2000095513A priority Critical patent/JP3833867B2/en
Publication of JP2001283154A publication Critical patent/JP2001283154A/en
Application granted granted Critical
Publication of JP3833867B2 publication Critical patent/JP3833867B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
この発明は、文書画像中で複数の文字が連結した連結文字の分離位置を決定し、該決定した分離位置により連結文字を分離する連結文字分離技術に関し、特に、文字分離範囲を設定することなく、直接的かつ正確に連結文字を分離することができる連結文字分離装置、連結文字分離方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
従来、文字認識装置においては、文字認識率の向上を図るために、スキャナなどで読み取った文書画像中の連結文字(1文字を形成する黒画素と他の1文字を形成する黒画素とが連結した文字)を1文字ごとに分離する連結文字分離技術が知られている。
【0003】
たとえば、特開平4−248688号公報には、連結文字から求めた周辺分布および線密度に基づいて各走査位置の特性値を算出し、予め設定された走査位置範囲内において特性値が最小となる走査位置を分離位置として決定し、この分離位置により連結文字を分離する技術が開示されている。
【0004】
具体的には、横書き文字の文書画像に対して、先ず、連結文字を縦方向に走査し、走査位置ごとに黒画素数を計数することによって周辺分布を求めるとともに、走査位置ごとに白画素から黒画素への反転回数を計数することによって線密度を求める。次に、走査位置ごとに周辺分布と線密度とを積算することによって各走査位置の特性値を算出する。そして、連結した文字イメージの先頭から文字幅(別途に求められた平均の文字幅)の0.75倍〜1.25倍の走査位置範囲を文字分離範囲とし、その範囲内において特性値が最小となる走査位置を分離位置として決定する。
【0005】
図11は、この従来技術における連結文字の分離位置の決定例を示す説明図である。同図に示すように、連結文字「龍野」について走査位置ごとの特性値を算出する。そして、文字幅から文字分離範囲として仮に、範囲Bが設定された場合には、連結文字「龍野」を「龍」および「野」に分離できることになる。
【0006】
【発明が解決しようとする課題】
しかしながら、文字分離範囲は別途求められた文字幅に基づいて得られるものであり、手書き文字等では文字幅が不均一であり、また、2文字以上の複数文字が連結している場合には文字幅が適切に得られない。その結果、文字分離範囲を正確に設定することが困難となり、図11において、分離位置が範囲Bに設定されずに、例えば範囲Aに設定されることもあり得るので、特性値が最小となる走査位置がYとなり、連結文字を正確に分離することができないという問題点があった。
また、この従来技術において、連結文字の全範囲における特性値の最小値を分離位置に設定するということも考えられるが、その場合、図11において示すように、Yで示す位置で分離されてしまうことになり、連結文字を正確に分離することができないという問題点があった。この従来技術では、連結文字の1方向(走査位置方向)の文字の複雑度のみを計数して求めた線密度を用いて特性値を算出しているので、この特性値は文字の複雑さを表すには不十分である為である。
【0007】
そこで、この発明は、上述した従来技術による問題点を解決するため、文字分離範囲を設定することなく、直接的かつ正確に連結文字を分離することができる連結文字分離装置、連結文字分離方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、請求項1の発明に係る連結文字分離装置は、文書画像中で複数の文字が連結した連結文字を検出し、該検出した連結文字を走査して連結文字の分離位置を決定し、該決定した分離位置により連結文字を分離する連結文字分離装置において、前記連結文字の走査位置ごとに文字の画素を計数して周辺分布を算出する周辺分布算出手段と、前記連結文字の走査位置ごとに両端の文字の画素の間隔を求めて外接幅を算出する外接幅算出手段と、前記連結文字の走査位置ごとに各画素のXY方向に隣接する、文字線エッジの間隔に基づいて局所的線密度を算出する局所的線密度算出手段と、前記周辺分布、外接幅および局所的線密度を走査位置ごとに加算して特性値を算出する特性値算出手段と、前記特性値算出手段によって算出された特性値のうちで最小の極小値をとる走査位置を分離位置として決定する分離位置決定手段と、を備えたことを特徴とする。
【0009】
また、請求項2の発明に係る連結文字分離装置は、請求項1の発明において、前記局所的線密度算出手段は、各画素のX方向に隣接する、文字線エッジの間隔およびY方向に隣接する、文字線エッジの間隔を線間隔として算出し、該算出した線間隔の逆数のうちで大きな方を画素線密度値として算出し、該算出した画素線密度値を走査位置ごとに加算して局所的線密度を算出することを特徴とする。
【0010】
また、請求項3の発明に係る連結文字分離方法は、文書画像中で複数の文字が連結した連結文字を検出し、該検出した連結文字を走査して連結文字の分離位置を決定し、該決定した分離位置により連結文字を分離する連結文字分離方法において、前記連結文字の走査位置ごとに文字の画素を計数して周辺分布を算出する周辺分布算出工程と、前記連結文字の走査位置ごとに両端の文字の画素の間隔を求めて外接幅を算出する外接幅算出工程と、前記連結文字の走査位置ごとに各画素のXY方向に隣接する、文字線エッジの間隔に基づいて局所的線密度を算出する局所的線密度算出工程と、前記周辺分布、外接幅および局所的線密度を走査位置ごとに加算して特性値を算出する特性値算出工程と、前記特性値算出工程によって算出された特性値のうちで最小の極小値をとる走査位置を分離位置として決定する分離位置決定工程と、を含んだことを特徴とする。
【0011】
また、請求項4の発明に係る連結文字分離方法は、請求項3の発明において、前記局所的線密度算出工程は、各画素のX方向に隣接する、文字線エッジの間隔およびY方向に隣接する、文字線エッジの間隔を線間隔として算出し、該算出した線間隔の逆数のうちで大きな方を画素線密度値として算出し、該算出した画素線密度値を走査位置ごとに加算して局所的線密度を算出することを特徴とする。
【0012】
また、請求項5の発明に係る記録媒体は、請求項3または4に記載された方法をコンピュータに実行させるプログラムを記録したことで、そのプログラムを機械読み取り可能となり、これによって、請求項3または4の動作をコンピュータによって実行することができる。
【0013】
【発明の実施の形態】
以下に添付図面を参照して、この発明に係る連結文字分離装置、連結文字分離方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体の好適な実施の形態を詳細に説明する。なお、本実施の形態では、本発明を文字認識装置に適用した場合を示すこととする。
【0014】
まず最初に、本実施の形態に用いる文字認識装置の構成について説明する。図1は、本実施の形態に用いる文字認識装置の構成を示すブロック図である。同図に示すように、本実施の形態に用いる文字認識装置1は、画像入力部2と、文字列切出部3と、文字ブロック切出部4と、文字ブロック格納部5と、連結文字ブロック分離部6と、文字候補セグメント作成部7と、文字認識部8と、知識処理部9とを備えて構成される。なお、連結文字ブロック分離部6は、請求項1または2に記載の連結文字分離装置に対応する。
【0015】
図1において、画像入力部2は、紙などに記載された手書き文字からなる文書画像を読み込むスキャナである。なお、本実施の形態では、画像入力部2において、横書きの文書を2値の文書画像(白画素と黒画素からなる画像)として入力する場合について説明する。
【0016】
文字列切出部3は、画像入力部2によって入力された横書きの文書画像から文字列を切り出す処理部である。たとえば、横書きの文書画像に対しては、水平方向の射影(垂直軸に対する射影)を測定し、射影の値が特定の数値を超える範囲を文字列として切り出す方法などを適用することができる。
【0017】
文字ブロック切出部4は、文字列切出部3によって切り出された文字列から文字ブロックを切り出す処理部である。たとえば、横書きの文字列に対しては、垂直方向の射影(水平軸に対する射影)を測定し、射影の値がゼロを越える範囲を文字ブロックとして切り出す方法などを適用することができる。
【0018】
文字ブロック格納部5は、文字ブロック切出部4によって切り出された文字ブロックおよび連結文字ブロック分離部6によって分離された文字ブロックを記憶するメモリである。
【0019】
連結文字ブロック分離部6は、文字ブロック格納部5に格納された文字ブロックから連結文字ブロック(2文字以上が連結している文字ブロック)を検出し、この連結文字ブロックの分離位置を決定し、決定した分離位置で連結文字ブロックを分離する処理部である。
【0020】
ここで、文字ブロック格納部5に格納された文字ブロックから連結文字ブロックを検出する方法としては、たとえば、文字ブロックのアスペクト比(文字ブロックの横幅/文字ブロックの縦幅)を測定し、アスペクト比が特定の値(たとえば2)を越える文字ブロックを連結文字ブロックとして検出する方法などを適用することができる。
【0021】
また、連結文字ブロックの分離位置の決定は、連結文字ブロック内の黒画素に係る特性値(連結文字ブロック内の縦方向および横方向における文字の複雑度を反映した値)を走査位置ごとに算出し、算出した特性値のうちで最小の極小値をとる走査位置を分離位置として決定する。
【0022】
この特性値の算出方法としては、たとえば、後述する周辺分布、外接幅および局所的線密度を走査位置ごとに加算する方法がある。なお、局所的線密度を特性値とすることや、局所的線密度および周辺分布を加算または積算したものを特性値とすること、局所的線密度および外接幅を加算または積算したものを特性値とすることも可能である。
【0023】
なお、連結文字ブロック分離部6によって分離された文字ブロックは文字ブロック格納部5に再登録され、再登録された文字ブロックが未だ連結文字ブロックである場合には、連結文字ブロック分離部6によってさらに分離される。
【0024】
文字候補セグメント作成部7は、文字ブロック格納部5に格納された各文字ブロックを合成して文字候補セグメントを作成する処理部である。たとえば、偏(へん)と旁(つくり)からなる漢字について偏と旁が別々の文字ブロックとして格納されている場合には、この文字ブロックを合成し、偏と旁を合成した文字候補セグメントを作成する。
【0025】
文字認識部8は、文字候補セグメント作成部7によって作成された文字候補セグメントに対して文字認識をおこなう処理部であり、知識処理部9は、文字認識部8の認識結果を用いて、文字候補セグメントの組み合わせと単語辞書に予め登録されている単語とを照合する処理部である。
【0026】
次に、本実施の形態に用いる文字認識装置1における各部の処理の例についてついて説明する。図2は、図1に示した文字ブロック切出部4における文字ブロックの切り出し例を示す説明図であり、図3は、図1に示した文字ブロック格納部5における文字ブロックの格納例を示す説明図であり、図4は、図1に示した文字候補セグメント作成部7における文字候補セグメントの作成例を示す説明図である。
【0027】
文字列切出部3によって図2(a)に示す「兵庫県龍野市誉田町片吹」の文字列が切り出された場合、文字ブロック切出部4においては、垂直方向の射影の値がゼロを超える範囲を文字ブロックとして切り出す結果、同図(b)に示すように「兵」、「庫県」、「龍野」、「市」、「誉」、「田」、「町」、「片」および「吹」の各文字ブロックが切り出される。
【0028】
文字ブロック格納部5においては、連結文字ブロック分離部6によって連結文字ブロックである「庫県」および「龍野」が「庫」、「県」、「龍」および「野」の各文字ブロックに分離される結果、図3に示すように、「兵」、「庫」、「県」、「龍」、「野」、「市」、「誉」、「田」、「町」、「片」および「吹」の各文字ブロックが格納される。
【0029】
文字候補セグメント作成部7においては、文字ブロック格納部5に格納された各文字ブロックを合成して文字候補セグメントを作成する結果、図4に示すように、「兵」、「庫」、「県」、「龍」、「野」、「市」、「誉」、「田」、「町」、「片」、「吹」、「兵庫」、「庫県」、「龍野」、「野市」および「片吹」の各文字候補セグメントが作成される。
【0030】
2文字のものも文字候補セグメントになる訳は、偏(へん)と旁(つくり)からなる漢字について偏と旁が別々の文字ブロックとして格納されている場合も考慮した結果である。つまり、ある条件を満たした場合には、2つのブロックを合成するようにした結果、「兵庫」、「庫県」のようなものも文字候補セグメントとなるのである。
【0031】
次に、図1に示した連結文字ブロック分離部6の構成について説明する。図5は、図1に示した連結文字ブロック分離部6の構成を示すブロック図である。同図に示すように、この連結文字ブロック分離部6は、分離制御部10と、周辺分布算出部11と、外接幅算出部12と、局所的線密度算出部13と、特性値算出部14とを備えて構成される。
【0032】
なお、分離制御部10は、請求項1に記載の分離位置決定手段に対応し、周辺分布算出部11は、請求項1に記載の周辺分布算出手段に対応し、外接幅算出部12は、請求項1に記載の外接幅算出手段に対応し、局所的線密度算出部13は、請求項1または2に記載の局所的線密度算出手段に対応し、特性値算出部14は、請求項1に記載の特性値算出手段に対応する。
【0033】
周辺分布算出部11は、連結文字ブロック(2文字以上が連結している文字ブロック)の周辺分布を算出する算出部であり、具体的には、横書きの連結文字ブロックを垂直方向に走査して走査位置ごとに黒画素数を計数し、連結文字ブロック内の最大計数値で各走査位置の計数値を割った値を周辺分布として算出する。
【0034】
ここで、周辺分布算出部11における周辺分布の算出例について説明する。図6は、図5に示した周辺分布算出部11における周辺分布の算出例を示す説明図である。同図に示す連結文字ブロックについて周辺分布を算出する場合、まず、各走査位置の計数値が、以下のように求められる。
走査位置Aの計数値=T1+T2=3
走査位置Bの計数値=T1=1
なお、走査位置としてA、Bの2箇所のみを示したが、これは説明用であり、連結文字ブロックの左端から右端まで、1画素ごとに走査している。
【0035】
そして、各走査位置の周辺分布が、以下のように算出される。
走査位置Aの周辺分布=3÷3=1
走査位置Bの周辺分布=1÷3=0.34
【0036】
図5に示す外接幅算出部12は、連結文字ブロックの外接幅を算出する算出部であり、具体的には、横書きの連結文字ブロックを垂直方向に走査して各走査位置で最下部に位置する黒画素と最上部に位置する黒画素との幅を測定し、連結文字ブロック内の最大測定幅で各走査位置の測定幅を割った値を外接幅として算出する。
【0037】
ここで、外接幅算出部12における外接幅の算出例について説明する。図7は、図5に示した外接幅算出部12における外接幅の算出例を示す説明図である。同図に示す連結文字ブロックについて外接幅を算出する場合、まず、各走査位置の測定幅が、以下のように求められる。
走査位置Aの測定幅=T3=4
走査位置Bの測定幅=T4=1
なお、走査位置としてA、Bの2箇所のみを示したが、これは説明用であり、連結文字ブロックの左端から右端まで、1画素ごとに走査している。
【0038】
そして、各走査位置の外接幅が、以下のように算出される。
走査位置Aの外接幅=4÷4=1
走査位置Bの外接幅=1÷4=0.25
【0039】
図5に示した局所的線密度算出部13は、連結文字ブロックの局所的線密度を算出する算出部である。具体的には、各画素において水平方向に隣接する文字線エッジの間隔と垂直方向に隣接する文字線エッジの間隔とを算出し、これらの線間隔の逆数のうち大きい方の逆数を当該画素の線密度値として算出する。そして、各画素の線密度を走査位置ごとに加算した値を求め、連結文字ブロック内の最大加算値で各走査位置の加算値を割った値を局所的線密度として算出する。
【0040】
なお、局所的線密度算出部13における線間隔の算出式としては、水平方向の片側に黒画素がない場合、水平方向の両側に黒画素がない場合、垂直方向の片側に黒画素がない場合など、それぞれの状況に応じて予め決められた算出式が用いられる。
【0041】
ここで、局所的線密度算出部13における線密度値の算出例について説明する。図8は、図5に示した局所的線密度算出部13における線密度値の算出例を示す説明図である。同図に示す連結文字ブロックについて走査位置A上の注目画素における線密度値を算出する場合、まず、水平方向の線間隔(Lx)および垂直方向の線間隔(Ly)が、以下のように算出される。
Lx=(L2−L1+L4−L3)/2=9
Ly=(L2−L1+L4−L3)/2=3
なお、L1〜L4は、注目画素の上下左右それぞれの方向で最も近くに位置する文字線エッジの座標である。
【0042】
すなわち、X方向については、
L1:注目画素から左方向に見て、画素が白から黒に変わる最近傍の座標
L3:注目画素から左方向に見て、画素が黒から白に変わる最近傍の座標
L2:注目画素から右方向に見て、画素が黒から白に変わる最近傍の座標
L4:注目画素から右方向に見て、画素が白から黒に変わる最近傍の座標
であり、同様に、Y方向については、
L1:注目画素から下方向に見て、画素が白から黒に変わる最近傍の座標
L3:注目画素から下方向に見て、画素が黒から白に変わる最近傍の座標
L2:注目画素から上方向に見て、画素が黒から白に変わる最近傍の座標
L4:注目画素から上方向に見て、画素が白から黒に変わる最近傍の座標
である。なお、図8においては、1画素あたり5mmである。
【0043】
そして、この注目画素の線密度値が、以下のように求められる。
線密度値=max(Wx/Lx,Wy/Ly)
=max(19/9,6/3)=2.1
なお、Wxは連結文字ブロックの横幅であり、Wyは連結文字ブロックの縦幅である。
【0044】
このようにして各画素の線密度値を求め、この線密度を走査位置ごとに加算する。そして、連結文字ブロック内の最大加算値で各走査位置の加算値を割った値を局所的線密度として算出する。
【0045】
図5に示す特性値算出部14は、周辺分布算出部11によって算出された周辺分布と、外接幅算出部12によって算出された外接幅と、局所的線密度算出部13によって算出された局所的線密度とを走査位置ごとに加算して各走査位置の特性値を算出する算出部である。
【0046】
なお、本実施の形態では、特性値算出部14において周辺分布、外接幅および局所的線密度を単純に加算することによって特性値を算出することとしたが、それぞれに所定の重み付けをおこなって加算することによって特性値を算出することもできる。
【0047】
分離制御部10は、連結文字ブロック分離部6の各部の制御などをおこなう処理部である。具体的には、文字ブロック格納部5から入力された文字ブロックが連結文字ブロックであるか否かの判定、特性値算出部14によって算出された特性値に基づく連結文字ブロックの分離位置の決定、分離位置で分離された各文字ブロックの文字ブロック格納部5への再登録などの処理をおこなう。
【0048】
連結文字ブロックの分離位置の決定は、特性値算出部14によって算出された特性値のうちで、最小の極小値をとる特性値の走査位置を連結文字ブロックの分離位置として決定する。
【0049】
ここで、分離制御部10における連結文字ブロックの分離位置の決定の例を説明する。図9は、図5に示した分離制御部10における連結文字ブロックの分離位置の決定例を示す説明図である。図9に示すように、連結文字ブロック「龍野」に対して、特性値算出部14において周辺分布(a)、外接幅(b)および局所的線密度(c)を加算することによって特性値(d)が算出される。
【0050】
そして、分離制御部10においては、同図(d)に示すように、特性値が極小値をとる走査位置A,BおよびCを分離位置の候補とし、このA,BおよびCの候補のうちで特性値が最小の値をとる走査位置Bを連結文字ブロック「龍野」の分離位置として決定する。その結果、連結文字ブロック「龍野」は「龍」および「野」に分離される。
【0051】
次に、上記構成を有する連結文字ブロック分離部6の連結文字分離手順について説明する。図10は、図1および図5に示した連結文字ブロック分離部6における連結文字分離手順を示すフローチャートである。同図に示すように、この連結文字ブロック分離部6は、まず、分離制御部10において、文字ブロック格納部5に格納された文字ブロックを入力し(ステップS1001)、入力した文字ブロックが連結文字ブロックであるか否かを判定する(ステップS1002)。
【0052】
ステップS1002において、文字ブロックが連結文字ブロックではないと判定された場合には(ステップS1002否定)、全ての文字ブロックを入力したか否かを判定する(ステップS1009)。そして、全ての文字ブロックを入力したと判定した場合には(ステップS1009肯定)、連結文字分離の処理を終了し、一方、全ての文字ブロックを入力していないと判定した場合には(ステップS1009否定)、次の文字ブロックを入力する(ステップS1001)。
【0053】
ステップS1002において、文字ブロックが連結文字ブロックであると判定された場合には(ステップS1002肯定)、周辺分布算出部11において、周辺分布を算出し(ステップS1003)、外接幅算出部12において、外接幅を算出し(ステップS1004)、局所的線密度算出部13において、局所的線密度を算出する(ステップS1005)。なお、周辺分布の算出(ステップS1003)、外接幅の算出(ステップS1004)および局所的線密度の算出(ステップS1005)は、いずれの順序で処理しても良く、また、並列的に処理しても良い。
【0054】
そして、特性値算出部14において、周辺分布、外接幅および局所的線密度を加算することによって特性値を算出し(ステップS1006)、分離制御部10において、特性値が最小の値をとる走査位置を分離位置として決定し(ステップS1007)、この分離位置で連結文字ブロックを分離し、分離した各文字ブロックを文字ブロック格納部5に再登録する(ステップS1008)。
【0055】
そして、分離制御部10において、全ての文字ブロックを入力したか否かを判定し(ステップS1009)、全ての文字ブロックを入力したと判定した場合には(ステップS1009肯定)、連結文字分離の処理を終了し、一方、全ての文字ブロックを入力していないと判定した場合には(ステップS1009否定)、次の文字ブロックを入力する(ステップS1001)。
【0056】
上述してきたように、本実施の形態では、連結文字ブロック分離部6において、周辺分布算出部11が、走査位置ごとに黒画素を計数して周辺分布を算出し、外接幅算出部12が、走査位置ごとに両端の黒画素の間隔を求めて外接幅を算出し、局所的線密度算出部13が、走査位置ごとに各画素の縦横両方向に隣接する文字線エッジの間隔に基づいて局所的線密度を算出し、特性値算出部14が、周辺分布、外接幅および局所的線密度を走査位置ごとに加算して特性値を算出し、分離制御部10が、特性値のうちで最小の極小値をとる走査位置を分離位置として決定するよう構成したので、文字分離範囲を設定することなく、直接的かつ正確に連結文字を分離することができる。
【0057】
また、本実施の形態では、局所的線密度算出部13が、各画素の縦方向に隣接する文字線エッジの間隔および横方向に隣接する文字線エッジの間隔を線間隔として算出し、この線間隔の逆数うちで大きな方を画素線密度値として算出し、この画素線密度値を走査位置ごとに加算して局所的線密度を算出するよう構成したので、文字の複雑さを適切に現した特性値を算出することによって、連結文字の分離位置を直接的かつ正確に決定することができる。
【0058】
なお、本実施の形態で説明した連結文字分離方法は、あらかじめ用意されたプログラムをパーソナル・コンピューターやワークステーション等のコンピュータで実行することによって実現することができる。このプログラムは、ハードディスク、フロッピーディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、上記記録媒体を介して、インターネット等のネットワークを介して配布することができる。
【0059】
【発明の効果】
以上説明したように、請求項1の発明によれば、周辺分布算出手段が、前記連結文字の走査位置ごとに文字の画素を計数して周辺分布を算出し、外接幅算出手段が、前記連結文字の走査位置ごとに両端の文字の画素の間隔を求めて外接幅を算出し、局所的線密度算出手段が、前記連結文字の走査位置ごとに各画素のXY方向に隣接する、文字線エッジの間隔に基づいて局所的線密度を算出し、特性値算出手段が、前記周辺分布、外接幅および局所的線密度を走査位置ごとに加算して特性値を算出し、分離位置決定手段が、前記特性値算出手段によって算出された特性値のうちで最小の極小値をとる走査位置を分離位置として決定することとしたので、文字分離範囲を設定することなく、直接的かつ正確に連結文字を分離することが可能な連結文字分離装置が得られるという効果を奏する。
【0060】
また、請求項2の発明によれば、前記局所的線密度算出手段は、各画素のX方向に隣接する、文字線エッジの間隔およびY方向に隣接する、文字線エッジの間隔を線間隔として算出し、該算出した線間隔の逆数のうちで大きな方を画素線密度値として算出し、該算出した画素線密度値を走査位置ごとに加算して局所的線密度を算出することとしたので、文字の複雑さを適切に現した特性値を算出することによって、連結文字の分離位置を直接的かつ正確に決定することが可能な連結文字分離装置が得られるという効果を奏する。
【0061】
また、請求項3の発明によれば、周辺分布算出工程が、前記連結文字の走査位置ごとに文字の画素を計数して周辺分布を算出し、外接幅算出工程が、前記連結文字の走査位置ごとに両端の文字の画素の間隔を求めて外接幅を算出し、局所的線密度算出工程が、前記連結文字の走査位置ごとに各画素のXY方向に隣接する、文字線エッジの間隔に基づいて局所的線密度を算出し、特性値算出工程が、前記周辺分布、外接幅および局所的線密度を走査位置ごとに加算して特性値を算出し、分離位置決定工程が、前記特性値算出工程によって算出された特性値のうちで最小の極小値をとる走査位置を分離位置として決定することとしたので、文字分離範囲を設定することなく、直接的かつ正確に連結文字を分離することが可能な連結文字分離方法が得られるという効果を奏する。
【0062】
また、請求項4の発明によれば、前記局所的線密度算出工程は、各画素のX方向に隣接する、文字線エッジの間隔およびY方向に隣接する、文字線エッジの間隔を線間隔として算出し、該算出した線間隔の逆数のうちで大きな方を画素線密度値として算出し、該算出した画素線密度値を走査位置ごとに加算して局所的線密度を算出することとしたので、文字の複雑さを適切に現した特性値を算出することによって、連結文字の分離位置を直接的かつ正確に決定することが可能な連結文字分離方法が得られるという効果を奏する。
【0063】
また、請求項5の発明によれば、請求項3または4に記載された方法をコンピュータに実行させるプログラムを記録したことで、そのプログラムを機械読み取り可能となり、これによって、請求項3または4の動作をコンピュータによって実現することが可能な記録媒体が得られるという効果を奏する。
【図面の簡単な説明】
【図1】本実施の形態に用いる文字認識装置の構成を示すブロック図である。
【図2】図1に示した文字ブロック切出部における文字ブロックの切り出し例を示す説明図である。
【図3】図1に示した文字ブロック格納部における文字ブロックの格納例を示す説明図である。
【図4】図1に示した文字候補セグメント作成部における文字候補セグメントの作成例を示す説明図である。
【図5】図1に示した連結文字ブロック分離部の構成を示すブロック図である。
【図6】図5に示した周辺分布算出部における周辺分布の算出例を示す説明図である。
【図7】図5に示した外接幅算出部における外接幅の算出例を示す説明図である。
【図8】図5に示した局所的線密度算出部における線密度値の算出例を示す説明図である。
【図9】図5に示した分離制御部における連結文字ブロックの分離位置の決定例を示す説明図である。
【図10】図1および図5に示した連結文字ブロック分離部6における連結文字分離手順を示すフローチャートである。
【図11】従来技術における連結文字の分離位置の決定例を示す説明図である。
【符号の説明】
1 文字認識装置
2 画像入力部
3 文字列切出部
4 文字ブロック切出部
5 文字ブロック格納部
6 連結文字ブロック分離部
7 文字候補セグメント作成部
8 文字認識部
9 知識処理部
10 分離制御部
11 周辺分布算出部
12 外接幅算出部
13 局所的線密度算出部
14 特性値算出部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a connected character separation technique for determining a separation position of a connected character in which a plurality of characters are connected in a document image, and separating the connected character based on the determined separation position, and in particular, without setting a character separation range. The present invention relates to a connected character separating apparatus, a connected character separating method, and a computer-readable recording medium on which a program for causing a computer to execute the method is recorded.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, in a character recognition device, in order to improve a character recognition rate, a connected character (a black pixel forming one character and a black pixel forming another character are connected in a document image read by a scanner or the like). A connected character separation technique for separating each character) is known.
[0003]
For example, in Japanese Patent Laid-Open No. 4-248688, the characteristic value of each scanning position is calculated based on the peripheral distribution and the line density obtained from the connected characters, and the characteristic value is minimized within a preset scanning position range. A technique is disclosed in which a scanning position is determined as a separation position, and concatenated characters are separated based on the separation position.
[0004]
Specifically, for a horizontally written document image, first, a connected character is scanned in the vertical direction, and the peripheral distribution is obtained by counting the number of black pixels for each scanning position, and from the white pixels for each scanning position. The line density is obtained by counting the number of inversions to black pixels. Next, the characteristic value of each scanning position is calculated by integrating the peripheral distribution and the line density for each scanning position. Then, a scanning position range of 0.75 to 1.25 times the character width (average character width obtained separately) from the beginning of the connected character image is set as the character separation range, and the characteristic value is minimum within the range. Is determined as the separation position.
[0005]
FIG. 11 is an explanatory diagram showing an example of determining a separation position of connected characters in this prior art. As shown in the figure, a characteristic value for each scanning position is calculated for the connected character “Tatsuno”. If the range B is set as the character separation range from the character width, the connected character “Tatsuno” can be separated into “dragon” and “field”.
[0006]
[Problems to be solved by the invention]
However, the character separation range is obtained on the basis of the separately obtained character width, the character width is not uniform for handwritten characters, etc., and when two or more characters are connected, the character The width cannot be obtained properly. As a result, it is difficult to set the character separation range accurately. In FIG. 11, the separation position is not set to the range B, and may be set to the range A, for example, so that the characteristic value is minimized. The scanning position is Y, and there is a problem that the connected characters cannot be separated accurately.
In this prior art, it is conceivable that the minimum value of the characteristic value in the entire range of the connected character is set as the separation position. In this case, however, separation is performed at the position indicated by Y as shown in FIG. As a result, there is a problem that the connected characters cannot be accurately separated. In this prior art, since the characteristic value is calculated using the line density obtained by counting only the complexity of the character in one direction (scanning position direction) of the connected character, this characteristic value indicates the complexity of the character. This is because it is insufficient to represent.
[0007]
Therefore, in order to solve the above-described problems caused by the prior art, the present invention provides a connected character separating apparatus, a connected character separating method, and a connected character separating method that can separate connected characters directly and accurately without setting a character separation range. An object of the present invention is to provide a computer-readable recording medium on which a program for causing a computer to execute the method is recorded.
[0008]
[Means for Solving the Problems]
In order to solve the above-described problems and achieve the object, a connected character separation apparatus according to claim 1 detects a connected character in which a plurality of characters are connected in a document image, and scans the detected connected character. In the connected character separation device that determines the separation position of the connected character and separates the connected character based on the determined separation position, the peripheral distribution calculation that calculates the peripheral distribution by counting the pixel of the character for each scanning position of the connected character A circumscribing width calculating unit that calculates a circumscribing width by calculating an interval between character pixels at both ends for each scanning position of the connected character; and a character adjacent to each pixel in the XY direction for each scanning position of the connecting character. A local line density calculating unit that calculates a local line density based on a line edge interval; and a characteristic value calculating unit that calculates the characteristic value by adding the peripheral distribution, circumscribed width, and local line density for each scanning position. And the special Characterized by comprising a separation position determining means for determining the separating position the scanning position to take the lowest minimum value among the characteristic values calculated by the value calculating means.
[0009]
According to a second aspect of the present invention, there is provided the connected character separation device according to the first aspect of the invention, wherein the local line density calculating means is adjacent to the interval between the character line edges and the Y direction adjacent to each other in the X direction. The character line edge interval is calculated as a line interval, the larger of the calculated line intervals is calculated as a pixel line density value, and the calculated pixel line density value is added for each scanning position. A local linear density is calculated.
[0010]
According to a third aspect of the present invention, there is provided a connected character separation method that detects a connected character in which a plurality of characters are connected in a document image, scans the detected connected character, determines a separation position of the connected character, and In a connected character separation method for separating connected characters based on a determined separation position, a peripheral distribution calculating step for calculating a peripheral distribution by counting character pixels for each connected character scanning position, and for each connected character scanning position A circumscribing width calculation step of calculating a circumscribing width by calculating a spacing between character pixels at both ends, and a local line density based on a spacing between character line edges adjacent to each pixel in the XY direction for each scanning position of the connected character Calculated by a local line density calculating step, a characteristic value calculating step of calculating the characteristic value by adding the peripheral distribution, circumscribed width and local linear density for each scanning position, and the characteristic value calculating step Characteristic value Minimum separation position determining step of determining the scanning position as a separated position which takes a minimum value in out, characterized in that it contains.
[0011]
According to a fourth aspect of the invention, there is provided the connected character separation method according to the third aspect of the invention, wherein the local line density calculation step is adjacent to each pixel in the X direction, adjacent to the character line edge interval and in the Y direction. The character line edge interval is calculated as a line interval, the larger of the calculated line intervals is calculated as a pixel line density value, and the calculated pixel line density value is added for each scanning position. A local linear density is calculated.
[0012]
Further, the recording medium according to the invention of claim 5 records the program for causing the computer to execute the method described in claim 3 or 4 so that the program can be read by a machine. The operation of 4 can be executed by a computer.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
Exemplary embodiments of a concatenated character separation device, a concatenated character separation method, and a computer-readable recording medium storing a program for causing a computer to execute the method will be described in detail below with reference to the accompanying drawings. explain. In the present embodiment, the case where the present invention is applied to a character recognition device is shown.
[0014]
First, the configuration of the character recognition device used in this embodiment will be described. FIG. 1 is a block diagram showing a configuration of a character recognition device used in the present embodiment. As shown in the figure, the character recognition device 1 used in the present embodiment includes an image input unit 2, a character string cutout unit 3, a character block cutout unit 4, a character block storage unit 5, a connected character. The block separation unit 6, the character candidate segment creation unit 7, the character recognition unit 8, and the knowledge processing unit 9 are configured. The connected character block separation unit 6 corresponds to the connected character separation device according to claim 1 or 2.
[0015]
In FIG. 1, an image input unit 2 is a scanner that reads a document image composed of handwritten characters written on paper or the like. In the present embodiment, a case where a horizontally written document is input as a binary document image (an image composed of white pixels and black pixels) in the image input unit 2 will be described.
[0016]
The character string cutout unit 3 is a processing unit that cuts out a character string from a horizontally written document image input by the image input unit 2. For example, for a horizontally written document image, a method of measuring a horizontal projection (projection with respect to a vertical axis) and cutting out a range in which the projection value exceeds a specific numerical value can be applied.
[0017]
The character block cutout unit 4 is a processing unit that cuts out a character block from the character string cut out by the character string cutout unit 3. For example, a method of measuring a vertical projection (projection with respect to a horizontal axis) and cutting out a range where the projection value exceeds zero as a character block can be applied to a horizontally written character string.
[0018]
The character block storage unit 5 is a memory that stores the character blocks cut out by the character block cutout unit 4 and the character blocks separated by the connected character block separation unit 6.
[0019]
The concatenated character block separation unit 6 detects a concatenated character block (a character block in which two or more characters are concatenated) from the character blocks stored in the character block storage unit 5, determines a separation position of the concatenated character block, A processing unit that separates the connected character blocks at the determined separation position.
[0020]
Here, as a method of detecting a concatenated character block from character blocks stored in the character block storage unit 5, for example, an aspect ratio of the character block (width of the character block / width of the character block) is measured, and the aspect ratio is measured. For example, a method of detecting a character block having a specific value (for example, 2) as a concatenated character block can be applied.
[0021]
In addition, the determination of the separation position of the connected character block is performed by calculating, for each scanning position, a characteristic value relating to black pixels in the connected character block (a value reflecting the complexity of characters in the vertical and horizontal directions in the connected character block). Then, the scanning position having the minimum minimum value among the calculated characteristic values is determined as the separation position.
[0022]
As a method of calculating the characteristic value, for example, there is a method of adding a peripheral distribution, a circumscribed width, and a local line density to be described later for each scanning position. Note that the characteristic value is the local linear density, the characteristic value is obtained by adding or integrating the local linear density and the peripheral distribution, and the characteristic value is obtained by adding or integrating the local linear density and the circumscribed width. It is also possible.
[0023]
Note that the character block separated by the connected character block separation unit 6 is re-registered in the character block storage unit 5, and if the re-registered character block is still a connected character block, the connected character block separation unit 6 further To be separated.
[0024]
The character candidate segment creation unit 7 is a processing unit that creates a character candidate segment by synthesizing each character block stored in the character block storage unit 5. For example, if Kanji characters that consist of Hen and Tsukuri are stored as separate character blocks, a character candidate segment is created by synthesizing this character block. To do.
[0025]
The character recognition unit 8 is a processing unit that performs character recognition on the character candidate segment created by the character candidate segment creation unit 7, and the knowledge processing unit 9 uses the recognition result of the character recognition unit 8 to perform character candidates. It is a processing unit that collates a combination of segments with a word registered in advance in the word dictionary.
[0026]
Next, an example of processing of each unit in the character recognition device 1 used in the present embodiment will be described. FIG. 2 is an explanatory diagram showing an example of character block extraction in the character block extraction unit 4 shown in FIG. 1, and FIG. 3 shows an example of character block storage in the character block storage unit 5 shown in FIG. FIG. 4 is an explanatory diagram showing an example of creating character candidate segments in the character candidate segment creating unit 7 shown in FIG.
[0027]
When the character string cut-out unit 3 cuts out the character string of “Katsubuki Hondacho, Tatsuno-shi, Hyogo” shown in FIG. 2A, the character block cut-out unit 4 sets the vertical projection value to zero. As a result of cutting out the exceeding range as a character block, as shown in the figure (b), "Hyo", "Kou-ken", "Tatsuno", "City", "Honor", "Ta", "Town", "Fragment" And each character block of “Blow” is cut out.
[0028]
In the character block storage unit 5, the concatenated character block separation unit 6 separates the concatenated character blocks “Ku Prefecture” and “Tatsuno” into character blocks “Ku”, “Prefecture”, “Ryu”, and “Field”. As a result, as shown in FIG. 3, “Soldier”, “Warehouse”, “Prefecture”, “Ryu”, “Field”, “City”, “Honor”, “Ta”, “Town”, “Fragment” And each character block of “Blow” is stored.
[0029]
In the character candidate segment creation unit 7, as a result of synthesizing each character block stored in the character block storage unit 5 to create a character candidate segment, as shown in FIG. ”,“ Dragon ”,“ field ”,“ city ”,“ honor ”,“ field ”,“ town ”,“ strip ”,“ buki ”,“ Hyogo ”,“ Kyo prefecture ”,“ Tatsuno ”,“ field city ” And each character candidate segment of “Kabuki” is created.
[0030]
The reason why two characters are also used as character candidate segments is a result of considering the case in which bias and 旁 are stored as separate character blocks for kanji characters consisting of bias and 旁. In other words, when a certain condition is satisfied, as a result of combining two blocks, things such as “Hyogo” and “Hyogo Prefecture” are also character candidate segments.
[0031]
Next, the configuration of the connected character block separation unit 6 shown in FIG. 1 will be described. FIG. 5 is a block diagram showing the configuration of the connected character block separation unit 6 shown in FIG. As shown in the figure, the connected character block separation unit 6 includes a separation control unit 10, a peripheral distribution calculation unit 11, a circumscribed width calculation unit 12, a local line density calculation unit 13, and a characteristic value calculation unit 14. And is configured.
[0032]
The separation control unit 10 corresponds to the separation position determination unit described in claim 1, the peripheral distribution calculation unit 11 corresponds to the peripheral distribution calculation unit described in claim 1, and the circumscribed width calculation unit 12 includes The local line density calculating unit 13 corresponds to the local line density calculating unit according to claim 1, and the characteristic value calculating unit 14 corresponds to the circumscribed width calculating unit according to claim 1. 1 corresponds to the characteristic value calculating means described in 1.
[0033]
The peripheral distribution calculation unit 11 is a calculation unit that calculates the peripheral distribution of a concatenated character block (a character block in which two or more characters are concatenated), and specifically scans a horizontally-written concatenated character block in the vertical direction. The number of black pixels is counted for each scanning position, and a value obtained by dividing the count value at each scanning position by the maximum count value in the connected character block is calculated as the peripheral distribution.
[0034]
Here, a calculation example of the peripheral distribution in the peripheral distribution calculation unit 11 will be described. FIG. 6 is an explanatory diagram illustrating a calculation example of the peripheral distribution in the peripheral distribution calculation unit 11 illustrated in FIG. When calculating the peripheral distribution for the concatenated character block shown in the figure, first, the count value at each scanning position is obtained as follows.
Count value of scanning position A = T1 + T2 = 3
Count value of scanning position B = T1 = 1
Although only two positions A and B are shown as scanning positions, this is for explanation, and scanning is performed pixel by pixel from the left end to the right end of the connected character block.
[0035]
Then, the peripheral distribution at each scanning position is calculated as follows.
Peripheral distribution of scanning position A = 3 ÷ 3 = 1
Peripheral distribution of scanning position B = 1 ÷ 3 = 0.34
[0036]
The circumscribing width calculation unit 12 shown in FIG. 5 is a calculation unit that calculates the circumscribing width of the concatenated character block. Specifically, the horizontal concatenated character block is scanned in the vertical direction and positioned at the lowest position at each scanning position. The width of the black pixel to be measured and the black pixel located at the top is measured, and a value obtained by dividing the measurement width at each scanning position by the maximum measurement width in the connected character block is calculated as the circumscribed width.
[0037]
Here, an example of calculating the circumscribed width in the circumscribed width calculating unit 12 will be described. FIG. 7 is an explanatory diagram illustrating an example of calculating the circumscribed width in the circumscribed width calculating unit 12 illustrated in FIG. 5. When calculating the circumscribing width for the concatenated character block shown in the figure, first, the measurement width at each scanning position is obtained as follows.
Measurement width at scanning position A = T3 = 4
Measurement width at scanning position B = T4 = 1
Although only two positions A and B are shown as scanning positions, this is for explanation, and scanning is performed pixel by pixel from the left end to the right end of the connected character block.
[0038]
Then, the circumscribed width of each scanning position is calculated as follows.
Circumscribed width of scanning position A = 4 ÷ 4 = 1
Circumscribed width of scanning position B = 1 ÷ 4 = 0.25
[0039]
The local line density calculation unit 13 illustrated in FIG. 5 is a calculation unit that calculates the local line density of a connected character block. Specifically, in each pixel, the interval between the character line edges adjacent in the horizontal direction and the interval between the character line edges adjacent in the vertical direction are calculated, and the larger reciprocal of the reciprocal of these line intervals is calculated for the pixel. Calculated as a linear density value. Then, a value obtained by adding the line density of each pixel to each scanning position is obtained, and a value obtained by dividing the added value of each scanning position by the maximum added value in the connected character block is calculated as the local line density.
[0040]
In addition, as a calculation formula of the line interval in the local line density calculation unit 13, when there is no black pixel on one side in the horizontal direction, when there is no black pixel on both sides in the horizontal direction, or when there is no black pixel on one side in the vertical direction For example, a predetermined calculation formula is used according to each situation.
[0041]
Here, a calculation example of the linear density value in the local linear density calculation unit 13 will be described. FIG. 8 is an explanatory diagram illustrating a calculation example of the line density value in the local line density calculation unit 13 illustrated in FIG. 5. When calculating the line density value at the pixel of interest on the scanning position A for the connected character block shown in the figure, first, the horizontal line interval (Lx) and the vertical line interval (Ly) are calculated as follows. Is done.
Lx = (L2-L1 + L4-L3) / 2 = 9
Ly = (L2-L1 + L4-L3) / 2 = 3
Note that L1 to L4 are the coordinates of the character line edge located closest in the vertical and horizontal directions of the target pixel.
[0042]
That is, for the X direction,
L1: The nearest coordinates where the pixel changes from white to black when viewed from the target pixel to the left
L3: nearest coordinates where the pixel changes from black to white when viewed from the target pixel to the left
L2: nearest coordinates where the pixel changes from black to white when viewed from the target pixel in the right direction
L4: nearest coordinates where the pixel changes from white to black when viewed from the target pixel in the right direction
Similarly, for the Y direction,
L1: The nearest coordinates where the pixel changes from white to black when viewed downward from the target pixel
L3: the nearest coordinates where the pixel changes from black to white when viewed downward from the target pixel
L2: nearest coordinates where the pixel changes from black to white when viewed upward from the target pixel
L4: nearest coordinates where the pixel changes from white to black when viewed upward from the target pixel
It is. In FIG. 8, it is 5 mm per pixel.
[0043]
Then, the linear density value of the target pixel is obtained as follows.
Linear density value = max (Wx / Lx, Wy / Ly)
= Max (19 / 9,6 / 3) = 2.1
Wx is the horizontal width of the connected character block, and Wy is the vertical width of the connected character block.
[0044]
In this way, the line density value of each pixel is obtained, and this line density is added for each scanning position. Then, a value obtained by dividing the added value at each scanning position by the maximum added value in the connected character block is calculated as the local linear density.
[0045]
The characteristic value calculation unit 14 illustrated in FIG. 5 includes the peripheral distribution calculated by the peripheral distribution calculation unit 11, the circumscribed width calculated by the circumscribing width calculation unit 12, and the local line density calculated by the local line density calculation unit 13. It is a calculation unit that calculates the characteristic value of each scanning position by adding the line density for each scanning position.
[0046]
In the present embodiment, the characteristic value is calculated by simply adding the marginal distribution, circumscribing width, and local line density in the characteristic value calculation unit 14. By doing so, the characteristic value can also be calculated.
[0047]
The separation control unit 10 is a processing unit that controls each part of the connected character block separation unit 6. Specifically, it is determined whether or not the character block input from the character block storage unit 5 is a connected character block, the determination of the separation position of the connected character block based on the characteristic value calculated by the characteristic value calculation unit 14, Processing such as re-registration of each character block separated at the separation position in the character block storage unit 5 is performed.
[0048]
The separation position of the concatenated character block is determined as the separation position of the concatenated character block, among the characteristic values calculated by the characteristic value calculation unit 14, the scanning position of the characteristic value that takes the minimum minimum value.
[0049]
Here, an example of determination of the separation position of the connected character block in the separation control unit 10 will be described. FIG. 9 is an explanatory diagram showing an example of determining the separation position of the connected character block in the separation control unit 10 shown in FIG. As shown in FIG. 9, for the connected character block “Tatsuno”, the characteristic value calculation unit 14 adds the peripheral distribution (a), the circumscribed width (b), and the local line density (c) to obtain the characteristic value ( d) is calculated.
[0050]
Then, in the separation control unit 10, as shown in FIG. 4D, the scanning positions A, B, and C at which the characteristic values are minimum values are set as separation position candidates, and among these A, B, and C candidates, The scanning position B having the minimum characteristic value is determined as the separation position of the connected character block “Tatsuno”. As a result, the connected character block “Tatsuno” is separated into “dragon” and “field”.
[0051]
Next, the connected character separation procedure of the connected character block separation unit 6 having the above configuration will be described. FIG. 10 is a flowchart showing a concatenated character separation procedure in the concatenated character block separation unit 6 shown in FIGS. 1 and 5. As shown in the figure, the concatenated character block separation unit 6 first inputs a character block stored in the character block storage unit 5 in the separation control unit 10 (step S1001), and the input character block is a concatenated character. It is determined whether it is a block (step S1002).
[0052]
If it is determined in step S1002 that the character block is not a concatenated character block (No in step S1002), it is determined whether all character blocks have been input (step S1009). If it is determined that all character blocks have been input (Yes at step S1009), the connected character separation process is terminated. On the other hand, if it is determined that all character blocks have not been input (step S1009). No), the next character block is input (step S1001).
[0053]
If it is determined in step S1002 that the character block is a connected character block (Yes in step S1002), the peripheral distribution calculation unit 11 calculates the peripheral distribution (step S1003), and the circumscribing width calculation unit 12 The width is calculated (step S1004), and the local linear density calculation unit 13 calculates the local linear density (step S1005). The calculation of the peripheral distribution (step S1003), the circumscribed width (step S1004), and the local linear density (step S1005) may be processed in any order, or may be processed in parallel. Also good.
[0054]
The characteristic value calculation unit 14 calculates the characteristic value by adding the peripheral distribution, the circumscribed width, and the local line density (step S1006). In the separation control unit 10, the scanning position at which the characteristic value takes the minimum value is calculated. Is determined as the separation position (step S1007), the connected character blocks are separated at this separation position, and each separated character block is re-registered in the character block storage unit 5 (step S1008).
[0055]
Then, the separation control unit 10 determines whether or not all character blocks have been input (step S1009). If it is determined that all character blocks have been input (Yes in step S1009), the process of separating connected characters is performed. On the other hand, if it is determined that not all character blocks have been input (No at step S1009), the next character block is input (step S1001).
[0056]
As described above, in the present embodiment, in the connected character block separating unit 6, the peripheral distribution calculating unit 11 calculates the peripheral distribution by counting the black pixels for each scanning position, and the circumscribing width calculating unit 12 The circumscribing width is calculated by obtaining the interval between the black pixels at both ends for each scanning position, and the local line density calculation unit 13 performs local detection based on the spacing between the character line edges adjacent to each other in the vertical and horizontal directions for each scanning position. The line density is calculated, the characteristic value calculation unit 14 adds the peripheral distribution, the circumscribed width, and the local line density for each scanning position to calculate the characteristic value, and the separation control unit 10 calculates the smallest of the characteristic values. Since the scanning position having the minimum value is determined as the separation position, it is possible to separate the connected characters directly and accurately without setting the character separation range.
[0057]
In the present embodiment, the local line density calculation unit 13 calculates the interval between the character line edges adjacent to each pixel in the vertical direction and the interval between the character line edges adjacent in the horizontal direction as a line interval. The larger of the reciprocal of the interval is calculated as the pixel line density value, and this pixel line density value is added for each scanning position to calculate the local line density, so that the complexity of the characters is properly expressed. By calculating the characteristic value, it is possible to determine the separation position of the connected character directly and accurately.
[0058]
The concatenated character separation method described in this embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, floppy disk, CD-ROM, MO, and DVD, and is executed by being read from the recording medium by the computer. The program can be distributed via the recording medium and a network such as the Internet.
[0059]
【The invention's effect】
As described above, according to the first aspect of the present invention, the peripheral distribution calculating unit calculates the peripheral distribution by counting the pixel of the character for each scan position of the connected character, and the circumscribing width calculating unit is configured to connect the connected character. A character line edge that calculates a circumscribing width by obtaining an interval between character pixels at both ends for each character scanning position, and the local line density calculating means is adjacent to each pixel in the XY direction for each connected character scanning position. The local line density is calculated based on the interval, and the characteristic value calculating means calculates the characteristic value by adding the peripheral distribution, circumscribed width and local linear density for each scanning position, and the separation position determining means, Since the scanning position that takes the minimum minimum value among the characteristic values calculated by the characteristic value calculating means is determined as the separation position, the connected characters can be directly and accurately set without setting the character separation range. Can be separated An effect that shaped separation device is obtained.
[0060]
According to a second aspect of the present invention, the local line density calculation means uses the interval between the character line edges adjacent to each other in the X direction and the interval between the character line edges adjacent to the Y direction as a line interval. Since the larger of the reciprocal of the calculated line spacing is calculated as the pixel line density value, and the calculated pixel line density value is added for each scanning position, the local line density is calculated. By calculating the characteristic value that appropriately represents the complexity of the characters, it is possible to obtain a connected character separation device that can determine the separation position of the connected characters directly and accurately.
[0061]
According to a third aspect of the present invention, the peripheral distribution calculating step calculates the peripheral distribution by counting character pixels for each scan position of the connected characters, and the circumscribed width calculating step includes the scan position of the connected characters. The circumscribing width is calculated by obtaining the spacing between the pixels of the characters at each end, and the local line density calculation step is based on the spacing between the character line edges adjacent to each other in the XY direction of each pixel at each scanning position of the connected characters. The local line density is calculated, and the characteristic value calculating step calculates the characteristic value by adding the peripheral distribution, circumscribed width and local line density for each scanning position, and the separation position determining step calculates the characteristic value. Since the scanning position having the smallest minimum value among the characteristic values calculated in the process is determined as the separation position, it is possible to separate the connected characters directly and accurately without setting the character separation range. Possible concatenated character separation methods An effect that is.
[0062]
According to a fourth aspect of the present invention, the local line density calculation step uses the interval between the character line edges adjacent to each pixel in the X direction and the interval between the character line edges adjacent to the Y direction as a line interval. Since the larger of the reciprocal of the calculated line spacing is calculated as the pixel line density value, and the calculated pixel line density value is added for each scanning position, the local line density is calculated. By calculating the characteristic value that appropriately represents the complexity of the characters, it is possible to obtain a connected character separation method capable of directly and accurately determining the separation position of the connected characters.
[0063]
According to the invention of claim 5, by recording a program for causing a computer to execute the method described in claim 3 or 4, the program can be machine-readable. There is an effect that a recording medium whose operation can be realized by a computer can be obtained.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a character recognition device used in the present embodiment.
FIG. 2 is an explanatory diagram illustrating an example of character block extraction in the character block extraction unit illustrated in FIG. 1;
FIG. 3 is an explanatory diagram showing an example of storing character blocks in the character block storage unit shown in FIG. 1;
FIG. 4 is an explanatory diagram showing an example of creating character candidate segments in the character candidate segment creating unit shown in FIG. 1;
FIG. 5 is a block diagram illustrating a configuration of a connected character block separation unit illustrated in FIG. 1;
6 is an explanatory diagram illustrating an example of calculating a peripheral distribution in the peripheral distribution calculating unit illustrated in FIG. 5;
7 is an explanatory diagram illustrating an example of calculating a circumscribed width in the circumscribed width calculating unit illustrated in FIG. 5;
8 is an explanatory diagram illustrating an example of calculating a line density value in the local line density calculating unit illustrated in FIG. 5;
9 is an explanatory diagram illustrating an example of determining a separation position of a connected character block in the separation control unit illustrated in FIG. 5;
10 is a flowchart showing a concatenated character separation procedure in the concatenated character block separation unit 6 shown in FIGS. 1 and 5. FIG.
FIG. 11 is an explanatory diagram illustrating an example of determining a separation position of connected characters in the prior art.
[Explanation of symbols]
1 Character recognition device
2 Image input section
3 Character string extraction part
4 Character block cutout
5 Character block storage
6 Concatenated character block separator
7 Character candidate segment creation part
8 Character recognition part
9 Knowledge Processing Department
10 Separation control unit
11 Peripheral distribution calculator
12 circumscribed width calculation part
13 Local linear density calculator
14 Characteristic value calculator

Claims (5)

文書画像中で複数の文字が連結した連結文字を検出し、該検出した連結文字を走査して連結文字の分離位置を決定し、該決定した分離位置により連結文字を分離する連結文字分離装置において、
前記連結文字の走査位置ごとに文字の画素を計数して周辺分布を算出する周辺分布算出手段と、
前記連結文字の走査位置ごとに両端の文字の画素の間隔を求めて外接幅を算出する外接幅算出手段と、
前記連結文字の走査位置ごとに各画素のXY方向に隣接する、文字線エッジの間隔に基づいて局所的線密度を算出する局所的線密度算出手段と、
前記周辺分布、外接幅および局所的線密度を走査位置ごとに加算して特性値を算出する特性値算出手段と、
前記特性値算出手段によって算出された特性値のうちで最小の極小値をとる走査位置を分離位置として決定する分離位置決定手段と、
を備えたことを特徴とする連結文字分離装置。
In a connected character separation device that detects a connected character in which a plurality of characters are connected in a document image, scans the detected connected character, determines a connected character separation position, and separates the connected character according to the determined separated position ,
Peripheral distribution calculation means for calculating the peripheral distribution by counting character pixels for each scan position of the connected character;
Circumscribing width calculating means for calculating a circumscribing width by obtaining an interval between character pixels at both ends for each scanning position of the connected character;
Local line density calculating means for calculating a local line density based on an interval between character line edges adjacent in the XY direction of each pixel for each scanning position of the connected character;
Characteristic value calculation means for calculating the characteristic value by adding the peripheral distribution, circumscribed width and local line density for each scanning position;
A separation position determining means for determining, as a separation position, a scanning position that takes a minimum minimum value among the characteristic values calculated by the characteristic value calculating means;
A connected character separating apparatus comprising:
前記局所的線密度算出手段は、各画素のX方向に隣接する、文字線エッジの間隔およびY方向に隣接する、文字線エッジの間隔を線間隔として算出し、該算出した線間隔の逆数のうちで大きな方を画素線密度値として算出し、該算出した画素線密度値を走査位置ごとに加算して局所的線密度を算出することを特徴とする請求項1に記載の連結文字分離装置。The local line density calculation means calculates the interval between the character line edges adjacent to each pixel in the X direction and the interval between the character line edges adjacent to the Y direction as a line interval, and the reciprocal of the calculated line interval. 2. The connected character separation device according to claim 1, wherein a larger one of the calculated values is calculated as a pixel line density value, and the calculated pixel line density value is added for each scanning position to calculate a local line density. . 文書画像中で複数の文字が連結した連結文字を検出し、該検出した連結文字を走査して連結文字の分離位置を決定し、該決定した分離位置により連結文字を分離する連結文字分離方法において、
前記連結文字の走査位置ごとに文字の画素を計数して周辺分布を算出する周辺分布算出工程と、
前記連結文字の走査位置ごとに両端の文字の画素の間隔を求めて外接幅を算出する外接幅算出工程と、
前記連結文字の走査位置ごとに各画素のXY方向に隣接する、文字線エッジの間隔に基づいて局所的線密度を算出する局所的線密度算出工程と、
前記周辺分布、外接幅および局所的線密度を走査位置ごとに加算して特性値を算出する特性値算出工程と、
前記特性値算出工程によって算出された特性値のうちで最小の極小値をとる走査位置を分離位置として決定する分離位置決定工程と、
を含んだことを特徴とする連結文字分離方法。
In a connected character separation method for detecting a connected character in which a plurality of characters are connected in a document image, scanning the detected connected character to determine a connected character separation position, and separating the connected character by the determined separated position ,
A peripheral distribution calculating step of calculating a peripheral distribution by counting the pixels of the character for each scanning position of the connected character;
A circumscribing width calculating step of calculating a circumscribing width by calculating an interval between character pixels at both ends for each scanning position of the connected character;
A local line density calculating step for calculating a local line density based on an interval between character line edges adjacent to each pixel in the XY direction for each scanning position of the connected character;
A characteristic value calculating step of calculating the characteristic value by adding the peripheral distribution, circumscribed width and local line density for each scanning position;
A separation position determination step for determining a scanning position that takes a minimum minimum value among the characteristic values calculated by the characteristic value calculation step as a separation position;
Concatenated character separation method characterized by including.
前記局所的線密度算出工程は、各画素のX方向に隣接する、文字線エッジの間隔およびY方向に隣接する、文字線エッジの間隔を線間隔として算出し、該算出した線間隔の逆数のうちで大きな方を画素線密度値として算出し、該算出した画素線密度値を走査位置ごとに加算して局所的線密度を算出することを特徴とする請求項3に記載の連結文字分離方法。In the local line density calculation step, the interval between the character line edges adjacent to the X direction of each pixel and the interval between the character line edges adjacent to the Y direction are calculated as line intervals, and the reciprocal of the calculated line interval is calculated. 4. The method of separating connected characters according to claim 3, wherein a larger one of them is calculated as a pixel line density value, and the calculated pixel line density value is added for each scanning position to calculate a local line density. . 前記請求項3または4に記載された方法をコンピュータに実行させるプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。5. A computer-readable recording medium on which a program for causing a computer to execute the method according to claim 3 or 4 is recorded.
JP2000095513A 2000-03-30 2000-03-30 Concatenated character separation device, concatenated character separation method, and computer-readable recording medium recording a program for causing a computer to execute the method Expired - Fee Related JP3833867B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000095513A JP3833867B2 (en) 2000-03-30 2000-03-30 Concatenated character separation device, concatenated character separation method, and computer-readable recording medium recording a program for causing a computer to execute the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000095513A JP3833867B2 (en) 2000-03-30 2000-03-30 Concatenated character separation device, concatenated character separation method, and computer-readable recording medium recording a program for causing a computer to execute the method

Publications (2)

Publication Number Publication Date
JP2001283154A JP2001283154A (en) 2001-10-12
JP3833867B2 true JP3833867B2 (en) 2006-10-18

Family

ID=18610409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000095513A Expired - Fee Related JP3833867B2 (en) 2000-03-30 2000-03-30 Concatenated character separation device, concatenated character separation method, and computer-readable recording medium recording a program for causing a computer to execute the method

Country Status (1)

Country Link
JP (1) JP3833867B2 (en)

Also Published As

Publication number Publication date
JP2001283154A (en) 2001-10-12

Similar Documents

Publication Publication Date Title
JP3950777B2 (en) Image processing method, image processing apparatus, and image processing program
US7680329B2 (en) Character recognition apparatus and character recognition method
JP5322517B2 (en) Image processing apparatus and method
JP3774690B2 (en) Method and apparatus for dividing an image into character image lines, and character image recognition method and apparatus
JPH0535924A (en) Automatic musical score recognizing device
JP3615333B2 (en) Ruled line eraser
JP2001043313A (en) Character segmenting method
JP3833867B2 (en) Concatenated character separation device, concatenated character separation method, and computer-readable recording medium recording a program for causing a computer to execute the method
JP3607753B2 (en) Document image region dividing method and apparatus, and column type discrimination method and apparatus
JP2003208568A (en) Image processor, image processing method and program used in the method
JP3153439B2 (en) Document image tilt detection method
JPS58197581A (en) Method and device for recognizing character and figure
JP2963508B2 (en) Character extraction device
JP3848792B2 (en) Character string recognition method and recording medium
JP5248074B2 (en) Music score recognition apparatus, music score recognition method, and computer program
JP3024234B2 (en) Document image ruled line extraction device
JP2728086B2 (en) Character extraction method
JP2003256772A (en) Character recognizing device and recording medium
JP3653156B2 (en) Document image area extraction method
JPH0535913A (en) Character row segmenting device and character recognition device
JPH04241074A (en) Automatic document clean copying device
JP4580520B2 (en) Character recognition method and character recognition apparatus
JPH0934992A (en) On-line handwritten character string segmenting device
JPH07120392B2 (en) Character pattern cutting device
JPH0728934A (en) Document image processor

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20051212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060718

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060720

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110728

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110728

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120728

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120728

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130728

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130728

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees