JP4136257B2 - 文字認識装置、文字認識方法および記憶媒体 - Google Patents
文字認識装置、文字認識方法および記憶媒体 Download PDFInfo
- Publication number
- JP4136257B2 JP4136257B2 JP2000076508A JP2000076508A JP4136257B2 JP 4136257 B2 JP4136257 B2 JP 4136257B2 JP 2000076508 A JP2000076508 A JP 2000076508A JP 2000076508 A JP2000076508 A JP 2000076508A JP 4136257 B2 JP4136257 B2 JP 4136257B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- contact
- line
- characters
- cut out
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
【発明の属する技術分野】
本発明は、文字認識装置および文字認識方法と、文字認識プログラムを記憶した記憶媒体に関し、特に文字切り出し方法を改良した文字認識装置および文字認識方法ならびに記憶媒体に関する。
【0002】
【従来の技術】
文字データを読み取って入力する装置として、文字認識装置がある。文字認識装置での文字認識に際して、帳票など、文字の種類や大きさ、文字の位置などが予め定まっている場合は、比較的容易に文字を切り出して認識することができる。しかし、一般の印刷文書などから文字を認識して入力する場合には、文字の種類や大きさ、文字位置などを予め予測することができないために認識作業に困難が生まれる。
例えば、漢字においては、構成要素が分離している場合があるため、どの部分を一文字として認識するかが問題になる。また、文字サイズの異なる文字が混在したり、漢字、仮名混じり文に英数字が挿入されたり、文字が相互に接触していたり、文字の印刷がかすれていたりする場合などにおいては、認識に先立って一文字ずつを切り出すことに困難を伴う場合が多い。
【0003】
今、図3に示すような文字画像が入力された場合を考える。この図に示すように、1行内の文字の大半(この場合は全て)が、接触している場合には、1文字、1文字を切り出すことは大変難しかった。たとえば、行高さを基に1文字幅とするという方法もあるが、半角文字である場合など、縦横比が1対1でない場合は、行高さを基に切り出すことも不可能になる。
接触している文字を正しく切り出して認識する方法として、特開平5−128307号公報では、平均的な文字幅や文字ピッチを算出し、これらの値から、文字切り出しを行っている。しかしこの方法でも、英数字などで、行内の文字の大半が接触している場合に、平均文字幅や平均文字ピッチを正しく算出することができないという間題があった。
【0004】
【発明が解決しようとする課題】
上述のごとく、従来の文字認識装置および文字認識方法では、一般の文書から文字を切り出して認識するに際し、文字の切り出しに困難を伴い、これらが解決できないために文字の切り出しが正確に行われず、文字が正しく認識できないという問題があった。ことに、英数字などで文字が相互に接触している場合は問題が多い。
本発明は、比較的簡単な方法でこの問題を解決して、文字切り出しで殊に問題となる文字間の接触の多い入力文書から、正しく文字を切り出して認識することができる文字認識装置および文字認識方法の実現を課題とする。
【0005】
【課題を解決するための手段】
上記課題を達成するために、請求項1記載の発明は、文書画像から文字行を切り出し、この切り出された文字行から文字を切り出して文字認識を行う際に、前記文字行の方向に平行に行の高さの1/nの複数の領域に分割して抽出し、該分割された文字行の複数の領域の各々から求められた切り出し位置の候補に基づいて、文字の切り出し位置を決定する文字認識装置において、
前記分割された文字行の複数の領域の各々には、隣り合う文字同士が接触した箇所と接触していない箇所とがある場合に、
前記隣り合う文字同士が接触していない箇所を検出する非接触箇所検出手段を備え、
該非接触箇所検出手段が検出した文字同士の非接触箇所に基づいて文字の切り出し位置を決定することを特徴とする。
また、請求項2記載の発明は、請求項1記載の文字認識装置において、前記文字の切り出し位置を決定する際に、前記隣り合う文字の非接触箇所における、先の文字の最後端と次の文字の最先端との間隔を求め、該求めた間隔の中間値を文字切り出しの位置とすることを特徴とする。
また、請求項3記載の発明は、請求項1記載の文字認識装置において、
前記文字の切り出し位置を決定する際に、前記隣り合う文字の非接触箇所における、先の文字の最後端を文字切り出しの位置とすることを特徴とする。
また、請求項4記載の発明は、請求項1記載の文字認識装置において、
前記文字の切り出し位置を決定する際に、前記隣り合う文字の非接触箇所における、先の文字に続く次の文字の最先端を文字切り出しの位置とすることを特徴とする。
【0006】
また、請求項5記載の発明は、文書画像から文字行を切り出し、この切り出された文字行から文字を切り出して文字認識を行う際に、前記文字行の方向に平行に行の高さの1/nの複数の領域に分割して抽出し、該分割された文字行の複数の領域の各々から求められた切り出し位置の候補に基づいて、文字の切り出し位置を決定する文字認識方法において、
前記分割された文字行の複数の領域の各々には、隣り合う文字同士が接触した箇所と接触していない箇所とがある場合に、
前記隣り合う文字同士が接触していない箇所を検出する非接触箇所検出過程と、
該非接触箇所検出過程で検出した文字同士の非接触箇所に基づいて文字の切り出し位置を決定する文字位置決定過程と
を備えたことを特徴とする。
【0007】
さらにまた、請求項6記載の発明は、文書画像から文字行を切り出し、この切り出された文字行から文字を切り出して文字認識を行う際に、前記文字行の方向に平行に行の高さの1/nの複数の領域に分割して抽出し、該分割された文字行の複数の領域の各々から求められた切り出し位置の候補に基づいて、文字の切り出し位置を決定する文字認識方法を、コンピュータに実行させるプログラムを記憶し、該コンピュータから読取り可能な記憶媒体であって、
前記分割された文字行の複数の領域の各々には、隣り合う文字同士が接触した箇所と接触していない箇所とがある場合に、
前記隣り合う文字同士が接触していない箇所を検出する非接触箇所検出過程と、
該非接触箇所検出過程で検出した文字同士の非接触箇所に基づいて文字の切り出し位置を決定する文字位置決定過程とを備えたプログラムを記憶することを特徴とする。
【0008】
【発明の実施の形態】
以下、本発明にかかる文字認識装置を添付図面を参照にして詳細に説明することにする。
【0009】
図1は、本発明の文字認識装置をソフトウェアで実現する場合の回路構成を示すブロック図である。図1において、符号1はCPU、符号2はメモリ、符号3は通信装置、符号4は表示装置、符号5はハードディスク、符号6はキーボード、符号7はCD−ROMドライブ、符号8はFDドライブである。
【0010】
図1に沿って、この装置の動作を説明する。図示しないスキャナなどの走査入力装置で、原稿の文字画像を読み取って得られた画像信号データが、例えば、通信装置3を介して装置に入力されると、一旦、ハードディスク5などに記憶された後、CPU1によりメモリ2に記憶されているソフトウェアによって認識作業が行われる。
認識作業は、まず、文字行を切り出し、次に切り出した文字行中の各文字を切り出し、切り出した各文字についてハードディスク5などに記憶された辞書と比較して文字認識が行われる。認識結果は、例えば、FDドライブ8などを介してFDなどに記録されて出力されるか、または通信装置3を介して出力される。
【0011】
図2は、文字認識装置を通信回線を介して構成する場合のブロック図である。図2において、符号11、符号12、符号13はそれぞれ装置1、装置2、装置3であり、符号14はインターネットなどの通信回線である。装置1(11)、装置2(12)、装置3(13)はいずれかが原稿の文字画像を読み取る操作入力装置であって、他のものが図1に示したような装置であっても、いずれもが相互に協同して文字認識を行う図1に示した装置であって、画像信号データの入力が別な方法で行われてもよい。
【0012】
次に、このような装置内で行われる処理について説明する。
今、図3に示すような文字画像が切り出されて入力される場合を考える。この図に示すように、この文字行では1行内の文字の大半が接触している。このような文字行を、図4に示すように行方向に平行(水平)に文字高さをn(ここでは3)分割する。nの値は任意で、あまり多くならない範囲で2分割でも4分割でもよい。
【0013】
このように分割することによって、図5に示すように、ある領域では分割された文字が接触しているが、他の領域では、文字が接触せず分離されているということが起こる。すなわち、図の例では、3分割することによって、「2」と「0」との間では上部と中央部分とで接触が残っているが下部では分離され、「0」と「0」との接触は中央部分では残っているが、上下の部分ではなくなって分離されている。
【0014】
これを基にして、図6に示すように接触部分の切り出し位置を求める。
すなわち、分離された文字行部分の、1つめの連結成分のX座標の最大値をX1e、2つめの連結成分のX座標の最小値をX2sとすると、切り出し候補位置のX座標として、この中間値であるX1mをとる。
【0015】
X1m=(X1e+X2s)/2
【0016】
ここでは、切り出し候補位置のX座標として、隣り合う黒連結成分のX座標の中間値を用いたが、黒連結成分のX座標のどちらか(すなわちX1eかX2sのいずれか)をそのまま用いても構わないし、黒連結成分の座標値から計算して求めても構わない。
【0017】
さらに、複数の分割部分からそれぞれに切り出し候補位置のX座標を求めて、それらの平均を最終的に切り出し候補のX座標とすることでさらに精度をあげることもできる。
これにより、文字間に接触部分があるような場合においても、文字の切り出しを精度よく行うことができ、それにともなって、文字の認識精度を向上することができる。
【0018】
なお、以上の説明は、文字認識装置について行ったが、この文字認識装置に用いられた文字認識方法、およびこの文字認識方法を実行するプログラムを記憶した記憶媒体をも本発明の対象とするものである。
【0019】
【発明の効果】
以上説明したように本発明の請求項1の発明は、文書画像から文字行を切り出し、この切り出された文字行から文字を切り出して文字認識を行う際に、前記文字行の方向に平行に行の高さの1/nの複数の領域に分割して抽出し、該分割された文字行の複数の領域の各々から求められた切り出し位置の候補に基づいて、文字の切り出し位置を決定する文字認識装置において、
前記分割された文字行の複数の領域の各々には、隣り合う文字同士が接触した箇所と接触していない箇所とがある場合に、
前記隣り合う文字同士が接触していない箇所を検出する非接触箇所検出手段を備え、
該非接触箇所検出手段が検出した文字同士の非接触箇所に基づいて文字の切り出し位置を決定することを特徴とする。
このように、文字間に接触があっても、n分割のいずれかの部分で分離が見られるので、これを基に精度の高い文字切り出しを行うことができる。
【0020】
本発明の請求項2の発明は、請求項1記載の文字認識装置において、前記文字の切り出し位置を決定する際に、前記隣り合う文字の非接触箇所における、先の文字の最後端と次の文字の最先端との間隔を求め、該求めた間隔の中間値を文字切り出しの位置とすることを特徴とする。
これにより、簡単な演算で、精度の高い文字切り出しを行うことができる。
【0021】
本発明の請求項3の発明は、請求項1記載の文字認識装置において、前記文字の切り出し位置を決定する際に、前記隣り合う文字の非接触箇所における、先の文字の最後端を文字切り出しの位置とすることを特徴とする。
これにより、簡単に切り出し位置を決めることができ、精度の高い文字切り出しを行うことができる。
【0022】
本発明の請求項4の発明は、請求項1記載の文字認識装置において、前記文字の切り出し位置を決定する際に、前記隣り合う文字の非接触箇所における、先の文字に続く次の文字の最先端を文字切り出しの位置とすることを特徴とする。
これにより、簡単に切り出し位置を決めることができ、精度の高い文字切り出しを行うことができる。
【0023】
本発明の請求項5の発明は、文書画像から文字行を切り出し、この切り出された文字行から文字を切り出して文字認識を行う際に、前記文字行の方向に平行に行の高さの1/nの複数の領域に分割して抽出し、該分割された文字行の複数の領域の各々から求められた切り出し位置の候補に基づいて、文字の切り出し位置を決定する文字認識方法において、
前記分割された文字行の複数の領域の各々には、隣り合う文字同士が接触した箇所と接触していない箇所とがある場合に、
前記隣り合う文字同士が接触していない箇所を検出する非接触箇所検出過程と、
該非接触箇所検出過程で検出した文字同士の非接触箇所に基づいて文字の切り出し位置を決定する文字位置決定過程とを備えたことを特徴とする。
これにより、文字間に接触があっても、n分割のいずれかの部分で分離が見られるので、これを基に精度の高い文字切り出しを行うことができる。
また、本発明の請求項6記載の発明は、文書画像から文字行を切り出し、この切り出された文字行から文字を切り出して文字認識を行う際に、前記文字行の方向に平行に行の高さの1/nの複数の領域に分割して抽出し、該分割された文字行の複数の領域の各々から求められた切り出し位置の候補に基づいて、文字の切り出し位置を決定する文字認識方法を、コンピュータに実行させるプログラムを記憶し、該コンピュータから読取り可能な記憶媒体であって、
前記分割された文字行の複数の領域の各々には、隣り合う文字同士が接触した箇所と接触していない箇所とがある場合に、
前記隣り合う文字同士が接触していない箇所を検出する非接触箇所検出過程と、
該非接触箇所検出過程で検出した文字同士の非接触箇所に基づいて文字の切り出し位置を決定する文字位置決定過程とを備えたプログラムを記憶することを特徴とする。
これにより、文字間に接触があっても、n分割のいずれかの部分で分離が見られるので、より精度の高い文字切り出しを行えるプログラムを記憶した記憶媒体が得られる。
【図面の簡単な説明】
【図1】本発明の文字認識装置をソフトウェアで実現する場合の回路構成を示すブロック図。
【図2】文字認識装置を通信回線を介して構成する場合のブロック図。
【図3】入力文字画像の一例。
【図4】図3に示す入力文字画像の分割例。
【図5】図4の分割例にしたがった分離位置の検出の説明図。
【図6】図4の分割例にしたがった切り出し候補位置の求め方の説明図。
【符号の説明】
1 CPU
2 メモリ
3 通信装置
4 表示装置
5 ハードディスク
6 キーボード
7 CD−ROMドライブ
8 FDドライブ
11 装置1
12 装置2
13 装置3
14 通信回線
Claims (6)
- 文書画像から文字行を切り出し、この切り出された文字行から文字を切り出して文字認識を行う際に、前記文字行の方向に平行に行の高さの1/nの複数の領域に分割して抽出し、該分割された文字行の複数の領域の各々から求められた切り出し位置の候補に基づいて、文字の切り出し位置を決定する文字認識装置において、
前記分割された文字行の複数の領域の各々には、隣り合う文字同士が接触した箇所と接触していない箇所とがある場合に、
前記隣り合う文字同士が接触していない箇所を検出する非接触箇所検出手段を備え、
該非接触箇所検出手段が検出した文字同士の非接触箇所に基づいて文字の切り出し位置を決定することを特徴とする文字認識装置。 - 前記文字の切り出し位置を決定する際に、前記隣り合う文字の非接触箇所における、先の文字の最後端と次の文字の最先端との間隔を求め、該求めた間隔の中間値を文字切り出しの位置とすることを特徴とする請求項1記載の文字認識装置。
- 前記文字の切り出し位置を決定する際に、前記隣り合う文字の非接触箇所における、先の文字の最後端を文字切り出しの位置とすることを特徴とする請求項1記載の文字認識装置。
- 前記文字の切り出し位置を決定する際に、前記隣り合う文字の非接触箇所における、先の文字に続く次の文字の最先端を文字切り出しの位置とすることを特徴とする請求項1記載の文字認識装置。
- 文書画像から文字行を切り出し、この切り出された文字行から文字を切り出して文字認識を行う際に、前記文字行の方向に平行に行の高さの1/nの複数の領域に分割して抽出し、該分割された文字行の複数の領域の各々から求められた切り出し位置の候補に基づいて、文字の切り出し位置を決定する文字認識方法において、
前記分割された文字行の複数の領域の各々には、隣り合う文字同士が接触した箇所と接触していない箇所とがある場合に、
前記隣り合う文字同士が接触していない箇所を検出する非接触箇所検出過程と、
該非接触箇所検出過程で検出した文字同士の非接触箇所に基づいて文字の切り出し位置を決定する文字位置決定過程と
を備えたことを特徴とする文字認識方法。 - 文書画像から文字行を切り出し、この切り出された文字行から文字を切り出して文字認識を行う際に、前記文字行の方向に平行に行の高さの1/nの複数の領域に分割して抽出し、該分割された文字行の複数の領域の各々から求められた切り出し位置の候補に基づいて、文字の切り出し位置を決定する文字認識方法を、コンピュータに実行させるプログラムを記憶し、該コンピュータから読取り可能な記憶媒体であって、
前記分割された文字行の複数の領域の各々には、隣り合う文字同士が接触した箇所と接触していない箇所とがある場合に、
前記隣り合う文字同士が接触していない箇所を検出する非接触箇所検出過程と、
該非接触箇所検出過程で検出した文字同士の非接触箇所に基づいて文字の切り出し位置を決定する文字位置決定過程とを備えたプログラムを記憶することを特徴とする記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000076508A JP4136257B2 (ja) | 2000-03-17 | 2000-03-17 | 文字認識装置、文字認識方法および記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000076508A JP4136257B2 (ja) | 2000-03-17 | 2000-03-17 | 文字認識装置、文字認識方法および記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001266070A JP2001266070A (ja) | 2001-09-28 |
JP4136257B2 true JP4136257B2 (ja) | 2008-08-20 |
Family
ID=18594235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000076508A Expired - Fee Related JP4136257B2 (ja) | 2000-03-17 | 2000-03-17 | 文字認識装置、文字認識方法および記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4136257B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107437294B (zh) * | 2017-08-01 | 2020-05-01 | 深圳怡化电脑股份有限公司 | 一种字符分割方法、装置、设备及存储介质 |
CN108510636B (zh) * | 2018-03-27 | 2020-01-14 | 深圳怡化电脑股份有限公司 | 图像分割方法、图像分割装置及终端设备 |
CN108717744B (zh) * | 2018-04-27 | 2020-08-18 | 深圳怡化电脑股份有限公司 | 识别金融单据上的印章序号的方法、装置及终端设备 |
-
2000
- 2000-03-17 JP JP2000076508A patent/JP4136257B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001266070A (ja) | 2001-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4607633B2 (ja) | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 | |
JP4031210B2 (ja) | 文字認識装置、文字認識方法、及び記録媒体 | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
US7796817B2 (en) | Character recognition method, character recognition device, and computer product | |
JPH09179937A (ja) | 文書画像のセンテンスの境界の自動識別方法 | |
JP2006031546A (ja) | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 | |
JP4280355B2 (ja) | 文字認識装置 | |
JPH04195692A (ja) | 文書読取装置 | |
US20060078204A1 (en) | Image processing apparatus and method generating binary image from a multilevel image | |
KR100383858B1 (ko) | 문자인식장치의 문자추출방법 및 장치 | |
Bhagvati et al. | On developing high accuracy OCR systems for Telugu and other Indian scripts | |
JP4136257B2 (ja) | 文字認識装置、文字認識方法および記憶媒体 | |
JPH0410087A (ja) | 基本ライン抽出方法 | |
JP3457094B2 (ja) | 文字認識装置及び文字認識方法 | |
JP7417116B2 (ja) | 情報処理システム、情報処理方法、プログラム | |
JP2630261B2 (ja) | 文字認識装置 | |
JP2982221B2 (ja) | 文字読み取り装置 | |
JP3133797B2 (ja) | 文字認識方法及びその装置 | |
JPH07160810A (ja) | 文字認識装置 | |
JP3197441B2 (ja) | 文字認識装置 | |
JP3880091B2 (ja) | 情報処理装置及び方法 | |
JP2715930B2 (ja) | 線分検出方法 | |
JPH09288714A (ja) | 表認識方法および装置 | |
JPH09106437A (ja) | 文字切出し装置および文字切出し方法 | |
KR100317653B1 (ko) | 대용량인쇄체문자인식을위한특징추출방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050121 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080317 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080520 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080603 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130613 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |