JP4087911B2 - 罫線作成装置および罫線作成方法 - Google Patents

罫線作成装置および罫線作成方法 Download PDF

Info

Publication number
JP4087911B2
JP4087911B2 JP05670596A JP5670596A JP4087911B2 JP 4087911 B2 JP4087911 B2 JP 4087911B2 JP 05670596 A JP05670596 A JP 05670596A JP 5670596 A JP5670596 A JP 5670596A JP 4087911 B2 JP4087911 B2 JP 4087911B2
Authority
JP
Japan
Prior art keywords
ruled line
image data
matrix
area
projection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP05670596A
Other languages
English (en)
Other versions
JPH09223181A (ja
Inventor
雄二 中島
和男 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP05670596A priority Critical patent/JP4087911B2/ja
Publication of JPH09223181A publication Critical patent/JPH09223181A/ja
Application granted granted Critical
Publication of JP4087911B2 publication Critical patent/JP4087911B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、罫線作成装置および罫線作成方法に関し、詳しくは、入力された画像におけるマトリックス状に配置された画像データに対して罫線を作成する罫線作成装置およびその方法に関する。
【0002】
【従来の技術】
従来、この種の文字認識装置としては、罫線枠に囲まれた文字の画像データに対し、文字の画像データをコード化された文字として認識すると共に罫線を区切り文字(例えば、「,」等)に置き換えてテキスト出力するものが提案されている。この装置では、罫線を区切り文字に置き換えることによって、罫線枠付きの画像データをコード化された文字のマトリックスデータあるいは帳票データとすることができる。こうして出力されたマトリックスデータあるいは帳票データは、表計算装置やグラフ作成装置などで読み込まれ、データの解析や集計、またはグラフ化等に用いられるようになる。
【0003】
【発明が解決しようとする課題】
しかしながら、上記装置は、マトリックス状に文字の画像データが配置されているが罫線がないときには、この画像データをマトリックスデータあるいは帳票データとして取り扱わないといった問題があった。マトリックスデータあるいは帳票データのデータ区切りの発生は、罫線の検出によってなされるから、罫線がないマトリックス状の画像データに対しては、データ区切りを発生させることができない。したがって、こうした罫線のないマトリックス状の画像データをマトリックスデータあるいは帳票データとしてテキスト出力するには、手動操作により罫線を付加した後に、罫線枠付きの画像データとして取り扱わなければならなかった。
【0004】
本発明の罫線作成装置は、罫線のないマトリックス状の画像データに対して、その領域を指定するだけで罫線を自動的に作成して罫線付きの画像データとすることを目的とする。
【0005】
また、本発明のマトリックスデータ認識装置は、罫線のないマトリックス状の画像データを、罫線を作成することなしにマトリックスデータとして認識することを目的とする。
【0006】
そして、本発明の文字認識装置は、罫線のないマトリック状の画像データを、マトリックスデータあるいは帳票データとしてデータ区切りを付してテキスト出力することを目的とする。
【0007】
【課題を解決するための手段およびその作用・効果】
本発明の罫線作成装置は、
マトリックス状に配置された画像データに対して罫線を作成する罫線作成装置であって、
前記マトリックス状に配置された画像データの領域を設定する領域設定手段と、
該設定された領域内の画像データの画素値の所定方向への積算値を求める積算値生成手段と、
該求められた所定方向への前記積算値に基づいて、前記領域内にマトリックス状に配置された画像データにおける隣接する行および/または列の間隔、および前記設定された領域の外縁と画像データにおける行および/または列との間隔を認識する間隔認識手段と、
該認識された間隔の中央または該間隔の端部から所定の位置に罫線を生成する罫線作成手段と
を備えることを要旨とする。
【0008】
この罫線作成装置は、領域設定手段が、入力された画像におけるマトリックス状に配置された画像データの領域を設定し、積算値生成手段が、この設定された領域内の画像データの画素値の所定方向への積算値を求める。そして、こうして求めた積算値に基づいて前記領域内にマトリックス状に配置された画像データにおける行および/または列の間隔を認識し、認識された間隔に罫線を作成する。
【0009】
この罫線作成装置によれば、マトリックス状に配置された画像データに対してその領域を指定するだけで罫線を作成することができる。
【0010】
こうした本発明の罫線作成装置において、前記所定方向は、前記入力された画像に対して水平方向および/または垂直方向であるものとすることもできる。
【0011】
なお、前記領域内の画像データの画素値の前記所定方向への積算値を求める場合において、画素値とは、2値データの場合は値1または値0を意味し、階調データの場合はその階調の値または2値化処理されたあとの2値データとしての値を意味する。こうすれば、重み付きの積算値を生成することができ、より適切な位置に罫線を作成することができる。
【0014】
画像データの画素値を積算する積算値生成装置を備える罫線作成装置において、
前記間隔認識手段は、前記積算値生成手段により積算される積算値が連続して所定範囲に亘って所定値以下のとき、該所定値以下の範囲を前記領域内にマトリックス状に配置された画像データにおける行および/または列の間隔として認識する手段とすることもできる。
【0015】
この態様の罫線作成装置は、罫線作成手段が備える間隔認識手段が、積算値生成手段により積算された積算値が連続して所定範囲に亘って所定値以下のとき、この所定値以下の範囲を領域内にマトリックス状に配置された画像データにおける行および/または列の間隔として認識する。そして、罫線作成手段は、この認識された間隔に罫線を作成する。この態様の罫線作成装置とすれば、より適切な位置に罫線を作成することができる。
【0016】
これらの罫線作成装置において、
前記領域設定手段に設定された領域内の前記画像データが文字の画像データのとき、該画像データに対して文字枠を設定する文字枠設定手段を備え、
前記積算値生成手段は、前記文字枠設定手段により設定された文字枠により前記積算値を求める手段であるものとすることもできる。
【0017】
こうすれば、文字部分と空間部分とがより明瞭とすることができ、より適切な位置に罫線を作成することができる。
【0018】
本発明の第1の文字認識装置は、
入力された画像における文字の画像データをコード化された文字として認識し、該認識した文字からなるテキストを作成する文字認識装置であって、
前述の本発明のいずれかの罫線作成装置と、
罫線を伴う領域の画像データの文字の認識の際、少なくとも垂直方向の罫線に代えて所定の文字または記号による区切りを出力する区切り出力手段と
を備えることを要旨とする。
【0019】
この第1の文字認識装置は、前述の本発明のいずれかの罫線作成装置が、マトリックス状に配置された画像データに対して罫線を作成し、区切り出力手段が、こうして罫線の作成された領域を含めて、罫線を伴う領域の画像データの文字の認識の際、少なくとも垂直方向の罫線に代えて所定の文字または記号による区切りを出力する。
【0020】
この第1の文字認識装置によれば、罫線のないマトリックス状の画像データを、容易に区切り付きのマトリックスデータあるいは帳票データとすることができる。
【0023】
このマトリックスデータ認識装置によれば、マトリックス状に配置された画像データに対してその領域を指定するだけで、これらのデータをマトリックスデータとして認識することができる。
【0024】
こうした本発明のマトリックスデータ認識装置において、前記所定方向は、前記入力された画像に対して、水平方向および垂直方向であるものとすることもできる。
【0030】
本発明の罫線作成方法は、
入力された画像の設定された領域内にマトリックス状に配置された画像データに対して、コンピュータによって罫線を作成する罫線作成方法であって、
前記設定された領域内の画像データの画素値を、スキャナを用いて読み取り、
該画素値の所定方向への積算値を演算してメモリに保存し、
該積算値に基づいて、前記領域内にマトリックス状に配置された画像データにおける空白を認識することにより、隣接する行および/または列間の間隔、および前記設定された領域の外縁と画像データにおける行および/または列の間隔を認識し、、
該認識された間隔の中央または該間隔の端部から所定の位置に罫線を生成すること
を要旨とする。
【0031】
この罫線作成方法によれば、マトリックス状に配置された画像データに対してその領域を指定するだけで罫線を作成することができる。
【0033】
このマトリックスデータ認識方法によれば、マトリックス状に配置された画像データに対してその領域を指定するだけで、これらのデータをマトリックスデータとして認識することができる。
【0034】
【発明の他の態様】
本発明は、以下のような他の態様をとることも可能である。
【0035】
本発明の他の態様としての第1の態様は、プログラムを記憶した記憶媒体であって、該プログラムは、画像の取扱いが可能なコンピュータに読み込まれたとき、該コンピュータを本発明の前記罫線作成装置として動作させるものであることを要旨とする。この第1の態様の記憶媒体では、記憶媒体に記憶したプログラムを、画像の取扱いが可能なコンピュータに読み込ませれば、前述した本発明の罫線作成装置として動作させることができる。
【0036】
第2の態様は、プログラムを記憶した記憶媒体であって、該プログラムは、画像の取扱いが可能なコンピュータに読み込まれたとき、該コンピュータを本発明の前記マトリックスデータ認識装置として動作させるものであることを要旨とする。この第2の態様の記憶媒体では、記憶媒体に記憶したプログラムを、画像の取扱いが可能なコンピュータに読み込ませれば、前述した本発明のマトリックスデータ認識装置として動作させることができる。
【0037】
第3の態様は、プログラムを記憶した記憶媒体であって、該プログラムは、画像の取扱いが可能なコンピュータに読み込まれたとき、該コンピュータを本発明の前記第1または第2の文字認識装置として動作させるものであることを要旨とする。この第3の態様の記憶媒体では、記憶媒体に記憶したプログラムを、画像の取扱いが可能なコンピュータに読み込ませれば、前述した本発明の第1または第2の文字認識装置として動作させることができる。
【0038】
【発明の実施の形態】
次に、本発明の実施の形態を実施例に基づき説明する。図1は本発明の一実施例である罫線作成装置を備える文字認識装置の概略構成図、図2はこの文字認識装置が実現されるコンピュータの概略構成図である。まず、説明の都合上、図2に従って、全体構成について説明する。
【0039】
図2に示すように、このコンピュータ10は、ローカルバス22に接続された演算処理部20、ローカルバス22を外部バスの一つであるPCIバス32に接続するPCIブリッジ30、PCIバス32を介して演算処理部20のCPU21等によりアクセスを受けるコントローラ部40、各種のI/O装置等を制御する機器が低速の外部バスであるISAバス42に接続されたI/O部60、および周辺機器であるキーボード72,スピーカ74,カラーCRT76,スキャナ94などから構成されている。
【0040】
演算処理部20は、中央演算処理装置としてのCPU21(本実施例ではインテル社製PentiumTMを使用)、キャッシュメモリ23,そのキャッシュコントローラ24およびメインメモリ25から構成されている。PCIブリッジ30は、高速のPCIバス32を制御する機能を備えたコントローラである。CPU21が扱うメモリ空間は、CPU21の内部に用意された各種レジスタにより、実際の物理アドレスより広い論理アドレスに拡張されている。
【0041】
コントローラ部40は、モニタ(カラーCRT)76への画像の表示を司るグラフィックスコントローラ(以下、CRTCと呼ぶ)44、接続されるSCSI機器とのデータ転送を司るSCSIコントローラ46、PCIバス32と下位のISAバスとのインタフェースを司るPCI−ISAブリッジ48から構成されている。CRTC44は、カラーCRT76に対して、640×480ドット、16色表示が可能である。なお、表示用のフォントを記憶したキャラクタジェネレータや所定のコマンドを受け取って所定の図形を描画するグラフィックコントローラ、更には描画画像を記憶するビデオメモリ等は、このCRTC44に実装されているが、これらの構成は周知のものなので、図2では図示を省略した。
【0042】
PCI−ISAブリッジ48を介して接続されたISAバス42は、各種のI/O機器が接続される入出力制御用のバスであり、DMAコントローラ(以下単にDMAと呼ぶ)50、リアルタイムクロック(RTC)52、複合I/Oポート54、サウンドI/O56、キーボード72および2ボタンマウス73とのインタフェースを司るキーボードインタフェース(以下KEYと呼ぶ)64、優先順位を有する割り込み制御を行なう割り込みコントローラ(以下PICと呼ぶ)66、各種の時間カウントやビープ音を発生するタイマ68等から構成されている。なお、ISAバス42には、拡張ボードが実装可能なISAスロット62が接続されている。実施例では、このISAスロット62の1つのスロットにスキャナインタフェース93が装着されており、このスキャナインタフェース93を介してスキャナ94が接続されている。
【0043】
複合I/Oポート54には、パラレル出力,シリアル出力の他、フロッピディスク装置82やハードディスク84を制御する信号を入出力するポートが用意されている。また、パラレル入出力には、パラレルポート86を介してプリンタ88が、シリアル入出力には、シリアルポート90を介してモデム92が、各々接続されている。また、サウンドI/O56には、上述したスピーカ74の他、マイクロフォン96が接続可能とされている。
【0044】
このコンピュータ10のハードディスク84には、DOSおよびそのDOSに組み込まれる種々のデバイスドライバが記憶されており、コンピュータ10は、立ち上げ時にDOSを読み込み、更にDOSが参照するファイルの内容に従って、必要なデバイスドライバを組み込む。デバイスドライバとして、複合I/Oポート54を介してのプリンタ88への印字を可能にするプリンタドライバなどがある。
【0045】
ハードディスク84には、「WINDOWS」というGUIを備えたオペレーティングシステムが記憶されており(「WINDOWS」はマイクロソフト社の商標)、コンピュータ10は、このオペレーティングシステムを読み込み、その後アプリケーションプログラムを、このオペレーティングシステム上で動作するよう主記憶上に読み込んで実行する。
【0046】
次に、図1に従って本実施例の文字認識装置について説明する。この文字認識装置は、上述したコンピュータ10において、そのハードウェアとソフトウェアが一体となって実現するものであり、図1は、ソフトウェアにより実現される部分も含めてブロック図として表わしたものである。この文字認識装置は、制御部ECUを中心として、キーボード72や2ボタンマウス73,スキャナ94からの入力をオペレーティングシステムを介して受け付ける入力部IPB、入力された文書や画像をファイルとして保存すると共に辞書や文字認識装置を構成するのに必要なソフトウエア(アプリケーションプログラム)を保存するハードディスク84、入力部IPB等により入力された画像データをメモリ上に格納する画像データ格納部GDM、マトリックス状に配置された画像データに対して所定の指示に基づいて罫線を作成する罫線作成部LPM、入力された画像における文字の画像データをコード化された文字として認識する文字認識部CCM、指定された領域の画像データのx軸およびy軸への射影を生成する射影生成部SPM、文書や画像および認識結果等をカラーCRT76に表示する表示部DPL等を備える。
【0047】
罫線作成部LPMは、画像中の罫線を作成する領域を設定する領域設定部L1と、領域設定部L1により設定された領域内の画像データのx軸およびy軸への射影を生成するよう射影生成部SPMに指示を出す射影生成指示部L2と、射影生成部SPMにより作成された射影から画像データ間の空白を判定する空白判定部L3と、空白判定部L3により判定された空白における罫線を作成する位置を設定する罫線位置設定部L4と、罫線位置設定部L4により設定された位置に罫線を作成するべく罫線データを出力する罫線出力部L5とを備える。
【0048】
文字認識部CCMは、文字を認識する領域を設定する領域設定部C1と、領域設定部C1により設定された領域内の画像データのx軸およびy軸への射影を生成するよう射影生成部SPMに指示を出す射影生成指示部C2と、射影生成部SPMにより作成された射影から罫線を判定する罫線判定部C3と、画像における文字の画像データをコード化された文字として認識処理する文字認識処理部C4と、文字認識処理部C4による文字の認識の際に文字間の罫線に対して区切り文字を発生させる区切り文字生成部C5と、認識結果を一時的に格納する認識結果格納部C6とを備える。
【0049】
そして、射影生成部SPMは、設定された領域のx軸への射影(水平軸への射影)を生成するx軸射影生成部S1と、同じく設定された領域のy軸への射影(垂直軸への射影)を生成するy軸射影生成部S2と、x軸への射影およびy軸への射影を一時的に格納する射影格納部S3とを備える。
【0050】
図1に示した各ブロックは、既述したように、ハードウェアにより実現されている部分とソフトウェアにより実現されている部分とを含む。例えば、表示部DPLは、ハードウェアとしては図2に示したCRTC44が存在するが、現実には、入力された文字列のテキストの表示や変換候補の表示および変換操作のガイダンスの表示などを含めて、表示を制御するソフトウェアがあって初めて動作する。従って、図1における表示部DPLなどは、両者を含めたものである。なお、実施例の文字認識装置は、そのソフトウエア部分についてはハードディスク84に記憶されており、キーボード72等の入力部IPBからの起動の指示がなされると、上述のオペレーティングシステムにより主記憶に読み込まれて動作する。
【0051】
実施例の文字認識装置は、通常、スキャナ94やハードディスク84から入力され画像データ格納部GDMに格納された画像の文字としてのデータを文字認識部CCMの文字認識処理部C4によってコード化された文字として認識し、この認識結果を文書ファイルとして出力する。文字認識部CCMの文字認識処理部C4による文字の認識処理は、画像中の黒ドットをスキャニングして連続した黒ドットを矩形の枠で切り出し文字枠を生成する切出処理、切り出された文字枠の画像のy軸への射影(垂直軸への射影)を生成しこの射影から行を抽出する行抽出処理、切り出された文字枠のx軸への射影(水平軸への射影)を生成しこの射影と行抽出処理により抽出された行とから文字を抽出する文字抽出処理、抽出された文字の枠内の黒ドットの分布や黒ドットの連続の仕方などの解析により確からしいコード化された文字を候補として出力する認識処理、認識された文字の確からしさを判定したり候補の修正などを行なう認識後処理等からなる。
【0052】
次に、こうした認識処理を行なう実施例の文字認識装置により入力された画像に罫線はないがマトリックス状に配置された文字などの画像データが読み込まれたときの動作、すなわちマトリックス状に配置された画像データに罫線を自動作成する動作と、罫線の作成された画像の文字の認識の動作について説明する。まず、マトリックス状に配置された画像データに罫線を自動作成する動作について図3の罫線作成処理ルーチンに基づき説明する。本ルーチンは、例えば、図示しないメニューバーから「罫線の自動作成」のコマンドを選択したときや、機能バーの「罫線の自動作成」を示すアイコンを2ボタンマウス73でクリックしたときに実行される。なお、このルーチンが実行されることにより罫線が作成される様子を図4に示す。
【0053】
本ルーチンが実行されると、CPU21は、まず画像中に罫線を作成する矩形の領域(罫線作成領域)W1の設定処理を行なう(ステップS100)。この処理は、具体的には、操作者に対して画像中に罫線作成領域W1を設定するようカラーCRT76の最下欄に図示しないメッセージボックスを表示する処理と、操作者が画像中に設定すべき罫線作成領域W1の対角の2点を2ボタンマウス73やキーボード72により画像中に指定することで指定された2点によって特定される矩形の領域を罫線作成領域W1として設定する処理とからなる。
【0054】
罫線作成領域W1が設定されると、設定された領域のx軸への射影(x軸射影)SXとy軸への射影(y軸射影)SYとを生成する処理を行なう(ステップS102)。ここで、x軸射影SXは、罫線作成領域W1内の画像データの黒ドットをy軸に沿ってカウントした数値に基づいて作成されるヒストグラムとして表わされ、y軸射影SYは、画像データの黒ドットをx軸に沿ってカウントした数値に基づいて作成されるヒストグラムとして表わされる。したがって、射影される文字数が同じでも、文字によってx軸方向およびy軸方向の黒ドットが異なるから、同じ射影にならない。例えば、図4のx軸射影SXの左端から1番目ないし3番目の射影のように、黒ドットがカウントされる文字数は、同じ4文字であるがカウントされる黒ドットの数が異なることによりヒストグラムとして表わされる射影の高さが異なることになる。
【0055】
x軸射影SXおよびy軸射影SYが生成されると、この射影に基づいて文字部分と空白部分とを認識する処理がなされる(ステップS104)。具体的には、例えば、x軸射影SXに対しては、黒ドットが1mm以上連続してカウントされない部分を空白部分と判定し、それ以外の部分を文字部分として判定することにより認識するのである。また、y軸射影SYに対しては、2ドット以上連続して黒ドットがカウントされない部分を空白部分と判定し、それ以外の部分を文字部分として判定することにより認識する。
【0056】
こうしてx軸射影SXおよびy軸射影SYに対して空白部分を認識すると、空白部分の中央点を罫線位置kx1〜kx5,ky1〜ky5として設定し(ステップS106)、画像の設定された位置に罫線データを出力して罫線を作成する処理を実行する(ステップS108)。なお、この罫線の作成処理では、各軸の両端の罫線位置kx1,kx5,ky1,ky5より外側の罫線は削除されるようになっている。したがって、作成される罫線は、図5に示すように、各軸の両端の罫線位置kx1,kx5,ky1,ky5により囲まれた矩形領域内とその外縁に作成されることになる。
【0057】
次に、こうして罫線が作成された領域における文字の認識処理について図6の文字認識処理ルーチンに基づいて説明する。本ルーチンは、例えば、図示しないメニューバーから「文字の認識」のコマンドを選択したときや、機能バーの「文字の認識」を示すアイコンを2ボタンマウス73でクリックしたときに実行される。
【0058】
本ルーチンが設定されると、CPU21は、まず画像中に文字の認識処理を行なう領域(文字認識領域)W2の設定処理を行なう(ステップS110)。この処理は、図3の罫線作成処理のステップS100における罫線作成領域W1の設定処理と同様に、操作者に対して画像中に文字認識領域W2を設定するようカラーCRT76の最下欄に図示しないメッセージボックスを表示する処理と、操作者が画像中に設定すべき文字認識領域W2の対角の2点を2ボタンマウス73やキーボード72により画像中に指定することで指定された2点によって特定される矩形の領域を文字認識領域W2として設定する処理とからなる。なお、ここでは、文字認識領域W2を画像中から設定するものとしたが、画像に予め複数の認識領域が設定されている場合には、その何れか1つを或いは2以上を指定する処理としてもよい。なお2以上の指定の場合には、指定された順に文字の認識処理を連続して行なうものとすればよい。
【0059】
こうして文字認識領域W2が設定されると、設定された領域のx軸射影SXとy軸射影SYとを生成する処理を行なう(ステップS112)。ここでのx軸射影SXおよびy軸射影SYは、図3のステップS102で説明した射影の生成処理と同様である。続いて、生成されたx軸射影SXおよびy軸射影SYにおけるピークを走査し(ステップS114)、検出したピークの大きさと形状とに基づいて罫線を判定する(ステップS116)。図5に例示した罫線付きの画像を文字認識領域W2として設定した際のx軸射影SXを図7に、y軸射影SYを図8に例示する。前述したように、x軸射影SXおよびy軸射影SYは、y軸またはx軸に沿って黒ドットをカウントした数値に基づいて作成されるヒストグラムとして表わされるから、そのスケールを黒ドットと同じとすれば、図7および図8に示すように、罫線はそのまま表わされることになり鋭いピークを形成する。したがって、こうしたピークを走査し、その形状を判定することにより罫線を正確に判断することができる。
【0060】
次に、文字認識領域W2内の画像データに対して前述の切出処理,行抽出処理,文字抽出処理,認識処理および認識後処理などからなる文字の認識処理を行なうと共に(ステップS118)、文字間にある垂直方向の罫線を区切り文字「,」に置換して認識する(ステップS120)。なお、図示の都合上、文字の認識と罫線の区切り文字「,」への置換とを異なるステップとして記載したが、この罫線の区切り文字「,」への置換は、文字の認識処理の最中に垂直方向の罫線が現われたときに行なわれるものである。
【0061】
こうして文字の認識がなされると、その認識結果、すなわちコード化された文字により形成される文書ファイルをカラーCRT76などに出力して本ルーチンを終了する。なお、図5に例示した罫線付きの画像を文字認識領域W2として認識した結果出力される文書ファイルの一例を図9に示す。実施例では、図示するように、文字間にある罫線を区切り文字「,」により置き換え、空白は左に詰めて出力するものとした。
【0062】
以上説明した実施例の文字認識装置によれば、マトリックス状に配置された画像データに対して容易に罫線を作成することができる。しかも、マトリックス状に配置された画像データに対してx軸射影SXおよびy軸射影SYを生成し、この射影に基づいて罫線を作成するから、文字データ上に罫線を作成することがない。
【0063】
また、実施例の文字認識装置によれば、罫線付きの画像を認識する際、文字間の罫線を区切り文字「,」に置き換えて文字を認識することができるから、罫線作成処理と文字の認識処理とを組み合わせることにより、罫線がなくマトリックス状に配置された画像データを区切り文字「,」により区切られたコード化された文字として認識することができる。この結果、罫線がなくマトリックス状に配置された画像データを、表計算ソフトやグラフ作成ソフト等によって入力しやすいデータとすることができ、画像として表示された文字資源をより有効に用いることができる。
【0064】
実施例の文字認識装置では、x軸射影SXに対しては黒ドットが1mm以上連続してカウントされない部分を空白部分と判定し、y軸射影SYに対しては2ドット以上連続して黒ドットがカウントされない部分を空白部分と判定したが、空白と判定する閾値は、どんな値としてもよい。この場合、操作者が画像の状態に応じて任意の値を設定するものとしてもよく、あるいは、x軸射影SXやy軸射影SYから1文字の大きさを判定し、この1文字の大きさから、空白部分と判定する閾値を設定するものとしてもよい。実施例の文字認識装置では、黒ドットがカウントされない部分に対して空白部分の判定を行なったが、所定値未満の黒ドットがカウントされた部分に対して空白部分の判定を行なうものとしてもよい。この場合の所定値は、予め設定したものとしてもよく、x軸射影SXやy軸射影SYから1文字の大きさを判定し、この1文字の大きさに基づいて設定するものとしてもよい。
【0065】
実施例の文字認識装置では、認識した空白部分の中央点を罫線位置として設定したが、x軸射影SXにより認識された空白部分に基づいて罫線位置を設定するときには、空白部分の右端からみた所定位置あるいは左端からみた所定位置に設定し、y軸射影SYにより認識された空白部分に基づいて罫線位置を設定するときには、空白部分の上端からみた所定位置あるいは下端からみた所定位置に設定するものとしてもよい。また、実施例の文字認識装置では、各軸の両端の罫線位置(上述の例ではkx1,kx5,ky1,ky5)により囲まれた矩形領域の外縁を枠として罫線を作成するものとしたが、罫線作成領域W1の外縁に罫線を作成し、両端には罫線位置の設定を行なわないものとしてもよい。
【0066】
実施例の文字認識装置では、罫線作成処理と文字の認識処理とを個々に行なうものとしたが、罫線作成処理に続けて文字の認識処理を行なう一連の処理としてもよい。この場合、文字認識領域W2を罫線作成領域W1として動作させると共に、図6の文字の認識処理ルーチンにおけるステップS112ないしS116の処理を省くことができる。こうすれば、容易に文字の認識まで行なうことができる。なお、このように、罫線作成処理と文字の認識処理とを一連の処理とする場合には、罫線位置を設定した段階で文字認識および区切り文字の発生を行ない得るから、実際に罫線を作成しなくてもよい。
【0067】
実施例の文字認識装置では、罫線作成領域W1内の画像データの黒ドットをy軸あるいはx軸に沿ってカウントした数値に基づいて作成されるヒストグラムをx軸射影SXあるいはy軸射影SYとしたが、罫線作成領域W1内の画像データの単なるx軸あるいはy軸への射影をx軸射影SXおよびy軸射影SYとしてもよい。すなわち、x軸あるいはy軸に沿ったライン上に1以上の黒ドットがあるか否かによる射影をx軸射影SXおよびy軸射影SYとするのである。こうして作成されたx軸射影SXおよびy軸射影SYの一例を図10に示す。図示するように、x軸射影SXおよびy軸射影SYは、その軸に対して垂直なライン上に黒ドットがあるか否かの2つの状態(例えばハイレベルとローレベル)とにより表わされる。こうすれば、ライン上の黒ドットの数に拘わらず射影を生成するから、例えば、漢字の「一」のようにy軸に沿ってカウントされる黒ドットが僅かしかなく空白部分との判定が困難なものでも、容易に空白部分との判定をすることができる。
【0068】
実施例の文字認識装置では、罫線作成領域W1内の画像データの黒ドットをy軸あるいはx軸に沿ってカウントしたが、罫線作成領域W1内の画像データに対して文字の認識処理で説明した切出処理を行ない、切り出された枠全体を黒ドットとしてy軸あるいはx軸に沿ってカウントし、このカウントされた数値に基づいて作成されるヒストグラムをx軸射影SXあるいはy軸射影SYとするものとしてもよい。この場合、図3の罫線作成処理ルーチンに代えて図11の罫線作成処理ルーチンを実行すればよい。この図11の罫線作成処理ルーチンでは、図3のルーチンのステップS102の射影の作成処理に代えて、連続する黒ドットの矩形の切り出し枠の作成処理(ステップS101)と、作成された切り出し枠による射影の生成処理(ステップS103)を行なう。このルーチンにより作成されるx軸射影SXおよびy軸射影SYの一例を図12に示す。このように切り出し枠により射影を生成すれば、射影のコントラストがより明確になるから、文字部分と空白部分との判定をより適切に行なうことができる。
【0069】
次に、本発明の第2の実施例である文字認識装置について説明する。図13は、第2実施例の文字認識装置の概略構成図である。図示するように、第2実施例の文字認識装置は、第1実施例の文字認識装置(図1参照)の構成と比して、罫線作成部LPMに代えてマトリックスデータ認識部MDJを備える点および文字認識部CCMが罫線判定部C3に代えてマトリックス認識結果読出部C7を備える点を除いて同一の構成をしている。したがって、同一の構成については同一の符号を付しその説明は省略する。なお、構成部材および機能などに付した符号は、特筆しない限り同じ意味として用いる。
【0070】
第2実施例の文字認識装置が備えるマトリックスデータ認識部MDJは、マトリックス状の配置された画像データを行と列とにより配列されたマトリックスデータとして認識する領域を設定する領域設定部M1と、領域設定部M1により設定された領域内の画像データのx軸およびy軸への射影を生成するよう射影生成部SPMに指示を出す射影生成指示部M2と、射影生成部SPMにより作成された射影から画像データ間の空白を判定する空白判定部M3と、空白判定部M3により判定された空白の基づいて領域内に行と列とを設定する行列設定部M4と、行列設定部M4により設定された行および列のデータと画像データとの関連付けを一時的に格納する認識結果格納部M5とを備える。
【0071】
第2実施例の文字認識装置が備える文字認識部CCMは、前述の領域設定部C1,射影生成指示部C2,文字認識処理部C4,区切り文字生成部C5および認識結果格納部C6の他、マトリックスデータ認識部MDJにより認識されたマトリックスの結果を読み出すマトリックス認識結果読出部C7を備える。なお、第2実施例の区切り文字生成部C5は、マトリックス認識結果読出部C7により読み出したマトリックス認識結果に基づいて、文字認識処理部C4による文字の認識の際に列の異なる文字間に区切り文字を発生させる。
【0072】
次に、こうして構成された第2実施例の文字認識装置におけるマトリックスデータの認識処理について、図14のマトリックスデータ認識処理ルーチンに基づき説明する。本ルーチンは、例えば、図示しないメニューバーから「マトリックスデータの認識」のコマンドを選択したときや、機能バーの「マトリックスデータの認識」を示すアイコンを2ボタンマウス73でクリックしたときに実行される。
【0073】
本ルーチンが実行されると、CPU21は、まず画像中にマトリックスデータとして認識する矩形の領域(マトリックスデータ認識領域)W3を設定する処理を行なう(ステップS200)。この処理は、具体的には、操作者に対して画像中にマトリックスデータ認識領域W3を設定するようカラーCRT76の最下欄に図示しないメッセージボックスを表示する処理と、操作者が画像中に設定すべきマトリックスデータ認識領域W3の対角の2点を2ボタンマウス73やキーボード72により画像中に指定することで指定された2点によって特定される矩形の領域をマトリックスデータ認識領域W3として設定する処理とからなる。
【0074】
マトリックスデータ認識領域W3が設定されると、設定された領域のx軸射影SXとy軸射影SYとを生成する処理を行ない(ステップS202)、生成されたx軸射影SXおよびy軸射影SYに基づいてx軸方向およびy軸方向の文字部分と空白部分とを認識する処理を行なう(ステップS204)。そして、x軸方向およびy軸方向の認識された文字部分と空白部分に基づいてマトリックスデータ認識領域W3内の画像データの文字部分に対して行と列とを設定する(ステップS206)。この様子を図15に例示する。図示するように、x軸射影SXに基づく文字部分に対しては左から順に列c1〜c4を設定し、y軸射影SYに基づく文字部分に対しては上から順に行r1〜r4を設定するのである。
【0075】
行および列の設定を行なうと、画像データの位置と設定された行および列のデータとの関連を認識結果として認識結果格納部M5に格納して本ルーチンを終了する。
【0076】
次に、こうしてマトリックスデータとして認識された領域における文字の認識処理について図16の文字認識処理ルーチンに基づいて説明する。本ルーチンは、例えば、図示しないメニューバーから「文字の認識」のコマンドを選択したときや、機能バーの「文字の認識」を示すアイコンを2ボタンマウス73でクリックしたときに実行される。
【0077】
本ルーチンが設定されると、CPU21は、図6の文字認識処理ルーチンのステップS110およびS112と同様の処理である画像中に文字の認識処理を行なう領域(文字認識領域)W2の設定処理(ステップS210)および設定された領域のx軸射影SXとy軸射影SYとを生成する処理を行なう(ステップS212)。続いて、マトリックスデータ認識処理により認識した結果を認識結果格納部M5から読み込む処理を行なう(ステップS214)。そして、文字認識領域W2内の画像データに対して前述の切出処理,行抽出処理,文字抽出処理,認識処理および認識後処理などからなる文字の認識処理を行なうと共に(ステップS216)、列の異なる文字間に区切り文字「,」を付加する(ステップS218)。なお、図示の都合上、文字の認識と区切り文字「,」の付加とを異なるステップとして記載したが、この区切り文字「,」の付加は、文字の認識処理の最中に列の異なる文字が現われる毎に行なわれるものである。
【0078】
こうして文字の認識がなされると、その認識結果、すなわちコード化された文字により形成される文書ファイルをカラーCRT76などに出力して本ルーチンを終了する。なお、こうして出力される文書ファイルは、図9に例示した文書ファイルと同様に、列の異なる文字間に区切り文字「,」が付加され、空白は左に詰めて出力される。
【0079】
以上説明した第2実施例の文字認識装置によれば、マトリックス状に配置された画像データを行と列とを概念とするマトリックスデータとして認識することができる。また、第2実施例の文字認識装置によれば、罫線がなくマトリックス状に配置された画像データを区切り文字「,」により区切られたコード化された文字として認識することができる。この結果、罫線がなくマトリックス状に配置された画像データを、表計算ソフトやグラフ作成ソフト等によって入力しやすいデータとすることができ、画像として表示された文字資源をより有効に用いることができる。
【0080】
第2実施例の文字認識装置では、マトリックスデータの認識処理と文字の認識処理とを別々に行なうものとしたが、マトリックスデータの認識処理に続けて文字の認識処理を行なう一連の処理としてもよい。この場合、文字認識領域W2をマトリックスデータ認識領域W3として動作させればよい。この場合、図16の文字の認識処理ルーチンにおけるステップS210ないしS214の処理を省くことができる。こうすれば、マトリックス状に配置された画像データを容易に区切り文字を含む文字として認識することができる。
【0081】
また、第2実施例の文字認識装置でも第1実施例の文字認識装置と同様に、画像データの黒ドットをy軸あるいはx軸に沿ってカウントした数値に基づいて作成されるヒストグラムをx軸射影SXおよびy軸射影SYとしたが、画像データの単なるx軸あるいはy軸への射影をx軸射影SXおよびy軸射影SYとしてもよく、あるいは、画像データに対して文字の認識処理で説明した切出処理を行ない、切り出された枠全体を黒ドットとしてy軸あるいはx軸に沿ってカウントし、このカウントされた数値に基づいて作成されるヒストグラムをx軸射影SXあるいはy軸射影SYとするものとしてもよい。
【0082】
第1実施例および第2実施例の文字認識装置では、前述したように、ハードウェアにより実現されている部分とソフトウェアにより実現されている部分とを含み、そのソフトウェアのうちハードウェアに依存しない部分についてはアプリケーションソフトとしてハードディスク84に記憶しており、必要に応じて読み込まれるが、記憶する媒体は、ハードディスク84に限られず、フレキシブルディスクや光磁気ディスク,CDROM等、コンピュータ10に接続可能な入出力機器に使用可能な記憶媒体であればいかなる記憶媒体であってもかまわない。この場合、記憶媒体に記憶されるアプリケーションソフトを、コンピュータ10が直接記憶媒体(CDROMやフレキシブルディスク等)から読み込むことができず、所定の方法によりハードディスク84にインストールした後にのみ読み込むことできるものとしてもよい。
【0083】
第1実施例および第2実施例の文字認識装置では、「WINDOWS」というオペレーションシステム上で動作するものとして説明したが、他のオペレーションシステムに読み込まれて文字認識装置として動作するものとしてもよい。
【0084】
以上、本発明の実施の形態について説明したが、本発明はこうした実施の形態に何等限定されるものではなく、例えば、罫線作成装置やマトリックスデータ認識装置を文字認識装置に組み込まず単独で用いる構成や、画像データを扱う文字認識装置以外の装置に罫線作成装置やマトリックスデータ認識装置を組み込む構成、文字以外の画像データに対して罫線を作成する罫線作成装置に適用する構成、文字以外の画像データをマトリックスデータとして認識するマトリックスデータ認識装置に適用する構成など、本発明の要旨を逸脱しない範囲内において、種々なる形態で実施し得ることは勿論である。
【図面の簡単な説明】
【図1】本発明の一実施例である罫線作成装置を備える文字認識装置の概略構成図である。
【図2】実施例の文字認識装置が実現されるコンピュータの概略構成図である。
【図3】実施例のCPU21により実行される罫線作成処理ルーチンを例示するフローチャートである。
【図4】マトリックス状に配置された画像データのx軸射影SXおよびy軸射影SYが生成された際の状態を例示する説明図である。
【図5】マトリックス状に配置された画像データに罫線が作成された際の状態を例示する説明図である。
【図6】実施例のCPU21により実行される文字認識処理ルーチンを例示するフローチャートである。
【図7】罫線付きの画像を文字認識領域W2として設定した際のx軸射影SXの一例を示す説明図である。
【図8】罫線付きの画像を文字認識領域W2として設定した際のy軸射影SYの一例を示す説明図である。
【図9】罫線付きの画像を文字認識領域W2として認識した結果出力される文書ファイルの一例を示す説明図である。
【図10】x軸射影SXおよびy軸射影SYの変形例を示す説明図である。
【図11】罫線作成処理ルーチンの変形例の一部を例示するフローチャートである。
【図12】x軸射影SXおよびy軸射影SYの変形例を示す説明図である。
【図13】第2実施例の文字認識装置の概略構成図である。
【図14】第2実施例のCPU21により実行されるマトリックスデータ認識処理ルーチンを例示するフローチャートである。
【図15】マトリックス状に配置された画像データのx軸射影SXおよびy軸射影SYが生成された際の状態を例示する説明図である。
【図16】第2実施例のCPU21により実行される文字認識処理ルーチンを例示するフローチャートである。
【符号の説明】
10…コンピュータ
20…演算処理部
21…CPU
22…ローカルバス
23…キャッシュメモリ
24…キャッシュコントローラ
25…メインメモリ
30…PCIブリッジ
32…PCIバス
40…コントローラ部
42…ISAバス
44…CRTC
46…SCSIコントローラ
48…ISAブリッジ
54…複合I/Oポート
56…サウンドI/O
60…I/O部
62…ISAスロット
68…タイマ
72…キーボード
74…スピーカ
76…カラーCRT
82…フロッピディスク装置
84…ハードディスク
86…パラレルポート
88…プリンタ
90…シリアルポート
92…モデム
93…スキャナインタフェース
94…スキャナ
96…マイクロフォン
CCM…文字認識部
C1…領域設定部
C2…射影生成指示部
C3…罫線判定部
C4…文字認識処理部
C5…文字生成部
C6…認識結果格納部
C7…マトリックス認識結果読出部
DPL…表示部
ECU…制御部
GDM…画像データ格納部
IPB…入力部
LPM…罫線作成部
L1…領域設定部
L2…射影生成指示部
L3…空白判定部
L4…罫線位置設定部
L5…罫線出力部
MDJ…マトリックスデータ認識部
M1…領域設定部
M2…射影生成指示部
M3…空白判定部
M4…行列設定部
M5…認識結果格納部
SPM…射影生成部
S1…x軸射影生成部
S2…y軸射影生成部
S3…射影格納部

Claims (5)

  1. マトリックス状に配置された画像データに対して罫線を作成する罫線作成装置であって、
    前記マトリックス状に配置された画像データの領域を設定する領域設定手段と、
    該設定された領域内の画像データの画素値の所定方向への積算値を求める積算値生成手段と、
    該求められた所定方向への前記積算値に基づいて、前記領域内にマトリックス状に配置された画像データにおける隣接する行および/または列の間隔、および前記設定された領域の外縁と画像データにおける行および/または列との間隔を認識する間隔認識手段と、
    該認識された間隔の中央または該間隔の端部から所定の位置に罫線を生成する罫線作成手段と
    を備える罫線作成装置。
  2. 前記所定方向は、前記入力された画像に対して、水平方向および/または垂直方向である請求項1記載の罫線作成装置。
  3. 請求項1記載の罫線作成装置であって、
    前記間隔認識手段は、
    前記積算された積算値が連続して所定範囲に亘って所定値以下のとき、該所定値以下の範囲を前記領域内にマトリックス状に配置された画像データにおける前記間隔として認識する手段である
    罫線作成装置。
  4. 請求項1記載の罫線作成装置であって、
    前記罫線作成手段は、前記設定された画像データの領域の外縁と画像データにおける行および/または列との間隔については、前記外縁側の端部に罫線を生成する手段である罫線作成装置。
  5. 入力された画像の設定された領域内にマトリックス状に配置された画像データに対して、コンピュータによって罫線を作成する罫線作成方法であって、
    前記設定された領域内の画像データの画素値を、スキャナを用いて読み取り、
    該画素値の所定方向への積算値を演算してメモリに保存し、
    該積算値に基づいて、前記領域内にマトリックス状に配置された画像データにおける空白を認識することにより、隣接する行および/または列間の間隔、および前記設定された領域の外縁と画像データにおける行および/または列の間隔を認識し、、
    該認識された間隔の中央または該間隔の端部から所定の位置に罫線を生成する
    罫線作成方法。
JP05670596A 1996-02-19 1996-02-19 罫線作成装置および罫線作成方法 Expired - Lifetime JP4087911B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05670596A JP4087911B2 (ja) 1996-02-19 1996-02-19 罫線作成装置および罫線作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05670596A JP4087911B2 (ja) 1996-02-19 1996-02-19 罫線作成装置および罫線作成方法

Publications (2)

Publication Number Publication Date
JPH09223181A JPH09223181A (ja) 1997-08-26
JP4087911B2 true JP4087911B2 (ja) 2008-05-21

Family

ID=13034898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05670596A Expired - Lifetime JP4087911B2 (ja) 1996-02-19 1996-02-19 罫線作成装置および罫線作成方法

Country Status (1)

Country Link
JP (1) JP4087911B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1881859B1 (en) 2005-05-10 2011-01-19 Novo Nordisk A/S Injection device comprising an optical sensor
US8994382B2 (en) 2006-04-12 2015-03-31 Novo Nordisk A/S Absolute position determination of movably mounted member in medication delivery device
JP5061696B2 (ja) * 2007-04-10 2012-10-31 カシオ計算機株式会社 投影装置、投影制御方法及びプログラム
CN102316917B (zh) 2009-02-13 2014-09-10 诺沃—诺迪斯克有限公司 医疗设备和筒
JP2011130316A (ja) * 2009-12-21 2011-06-30 Seiko Epson Corp プロジェクター及び画像投射方法

Also Published As

Publication number Publication date
JPH09223181A (ja) 1997-08-26

Similar Documents

Publication Publication Date Title
JP3950498B2 (ja) イメージ処理方法及び装置
US5509092A (en) Method and apparatus for generating information on recognized characters
JP4443576B2 (ja) パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
JP4655335B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4087911B2 (ja) 罫線作成装置および罫線作成方法
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JPH10312407A (ja) 図面表示装置
JPH0916582A (ja) 文書作成装置及び同装置に用いられる認識結果出力方法
JPH11109943A (ja) フォント処理装置およびフォント処理用プログラムを記録した記録媒体
JPH0916713A (ja) 画像領域分割方法
JPH117493A (ja) 文字認識処理装置
JPH0560876B2 (ja)
JPH0830725A (ja) 画像処理装置及び方法
JP2962525B2 (ja) テキストブロック認識方法
JPH0844333A (ja) 図形入力装置
JP2937607B2 (ja) レイアウト作成装置
JPH08297718A (ja) 文字切り出し装置及び文字認識装置
JP3594625B2 (ja) 文字入力装置
JP3138546B2 (ja) 利用者文字の作成方法
JPH0728951A (ja) オンライン文字図形認識装置
JP3033731B2 (ja) 罫線処理装置、罫線処理方法、およびプログラムを記録する記録媒体
JP4322999B2 (ja) 連結領域抽出装置及び記録媒体
JPH07109610B2 (ja) 文書処理装置
JPH08185473A (ja) 文字認識装置
JPH0728930A (ja) 文字認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040426

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040726

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040729

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20041015

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080222

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110228

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110228

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120229

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130228

Year of fee payment: 5

EXPY Cancellation because of completion of term