JP2005043995A - 情報処理装置、文字認識プログラム及び記録媒体 - Google Patents
情報処理装置、文字認識プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2005043995A JP2005043995A JP2003200493A JP2003200493A JP2005043995A JP 2005043995 A JP2005043995 A JP 2005043995A JP 2003200493 A JP2003200493 A JP 2003200493A JP 2003200493 A JP2003200493 A JP 2003200493A JP 2005043995 A JP2005043995 A JP 2005043995A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- character recognition
- character string
- area
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【課題】文字認識を行う領域を指定するための雛形としての画像データと実際に文字認識の対象とする画像データとの間に画像のずれがある場合でも、適切に文字認識を行うことができる情報処理装置の提供を目的とする。
【解決手段】文字認識の対象である第一の画像データに対し、雛形としての第二の画像データ上において文字認識を実行する領域として指定された文字認識領域について文字認識を実行する情報処理装置であって、
第一の画像データに対し、第二の画像データ上において所定の文字列が配置されている領域として指定された文字列領域について文字認識を実行することにより抽出した抽出文字列の位置と、前記所定の文字列の位置との差分に基づいて、文字認識領域の位置を補正する位置補正手段と、
第一の画像データに対し、位置を補正した文字認識領域について文字認識を実行する文字認識実行手段とを有することを特徴とすることにより上記課題を解決する。
【選択図】 図3
【解決手段】文字認識の対象である第一の画像データに対し、雛形としての第二の画像データ上において文字認識を実行する領域として指定された文字認識領域について文字認識を実行する情報処理装置であって、
第一の画像データに対し、第二の画像データ上において所定の文字列が配置されている領域として指定された文字列領域について文字認識を実行することにより抽出した抽出文字列の位置と、前記所定の文字列の位置との差分に基づいて、文字認識領域の位置を補正する位置補正手段と、
第一の画像データに対し、位置を補正した文字認識領域について文字認識を実行する文字認識実行手段とを有することを特徴とすることにより上記課題を解決する。
【選択図】 図3
Description
【0001】
【発明の属する技術分野】
本発明は、情報処理装置、文字認識プログラム及び記録媒体に関し、特に画像データに対して文字認識を実行する情報処理装置、文字認識プログラム及び記録媒体に関する。
【0002】
【従来の技術】
スキャナ等で画像データとして読み取った文字を解析し、テキストの文字データ(テキストデータ)として抽出するためのソフトウェアとしてOCRソフトが知られている。一般的なOCRソフトは、解析対象とする画像データを表示するGUIを備えている。ユーザは、GUI上に表示された画像データ上でテキストデータを抽出する領域(OCR領域)を指定することにより、OCR領域に含まれる文字列を抽出することができる。
【0003】
また、雛形となる画像データ(以下、「雛形データ」という。)を用いて、あらかじめ文字列を抽出する範囲を定めて登録しておくことにより(以下、登録された情報を「フォーム情報」という。)、定型的な文書を効率的に処理することもできる。
【0004】
図1は、フォーム情報を説明するための図である。図1において、矩形501は、雛形データを示す。雛形データ501における領域502は、テキストデータの抽出対象とする領域(すなわち、OCR領域)を示す。ユーザは、OCRソフトのGUI上に表示させた雛形データ上おいて、マウス等の操作により一つ以上のOCR領域を指定することができる。雛形データ上において指定されたOCR領域の座標情報等は、フォーム情報として保存される。
【0005】
例えば、画像データ503に対し、雛形データ501に基づいて生成されたフォーム情報を適用して文字認識を実行することにより、OCR領域502に配置されていた文字列「AAA」を抽出することができる。同様に、画像データ503、504、505からは、それぞれ文字列「BBB」、「CCC」、「DDD」を抽出することができる。
【0006】
このようにフォーム情報を用いることによって、画像データごとにOCR領域を指定する必要はなく、効率的にテキストデータの抽出を実行することができる。
【0007】
【発明が解決しようとする課題】
しかしながら、定型的な文書であっても、スキャナ等によって文書を読み込む際等に生じる位置ずれ等によって、雛形データ501において指定したOCR領域502が、画像データ503等においてOCRの対象としたい位置に一致しない場合がある。この場合、ユーザが意図した位置における文字列が正確に抽出されないという問題がある。
【0008】
かかるずれを補正するために、罫線を有する文書については、その罫線を目印としてOCR領域を補正する方法がある。すなわち、雛形データとして予め罫線を有する画像データを用い、雛形データ上において補正のための目印とする位置として罫線の交点等を指定し、当該交点等の座標情報をフォーム情報として登録しておく。
【0009】
図2は、罫線を有する文書の画像データの例を示す図である。図2の画像データ510において、罫線の交点となる位置511、512、及び513等が補正のための目印として登録される。
【0010】
実際にOCRの対象とする画像データについても、当該画像データにおける罫線の交点等の座標を求め、予め目印として登録されている座標との差分を算出する。当該差分をフォーム情報として登録されているOCR領域に適用すれば、OCRの対象とする画像データに対して適正なOCR領域を算出することができる。
【0011】
しかし、このような方法は、罫線等の線図を有する文書については有効であるが、かかる線図のない文書、すなわち、文章だけによって構成されている文書については適用できない。
【0012】
本発明は、上記の点に鑑みてなされたものであって、文字認識を行う領域を指定するための雛形としての画像データと実際に文字認識の対象とする画像データとの間に画像のずれがある場合でも、適切に文字認識を行うことができる情報処理装置の提供を目的とする。
【0013】
【課題を解決するための手段】
そこで上記課題を解決するため、本発明は、請求項1に記載されるように、文字認識の対象として指定された第一の画像データに対し、雛形としての第二の画像データ上において文字認識を実行する領域として指定された文字認識領域について文字認識を実行する情報処理装置であって、前記第一の画像データに対し、前記第二の画像データ上において所定の文字列が配置されている領域として指定された文字列領域について文字認識を実行することにより抽出した抽出文字列の前記第一の画像データ上における位置と、前記第二の画像データ上における前記所定の文字列の位置との差分に基づいて、前記文字認識領域の位置を補正する位置補正手段と、前記第一の画像データに対し、前記位置補正手段が位置を補正した前記文字認識領域について文字認識を実行することにより、前記第一の画像データより文字列を抽出する文字認識実行手段とを有することを特徴とする。
【0014】
このような情報処理装置では、文字認識の対象とされた第一の画像データと雛形とされた第二の画像データとの画像のずれ(差分)を算出することができ、当該ずれに基づいて文字認識を実行する領域の位置を補正することができる。よって、第一の画像データと第二の画像データとの間に画像のずれがある場合でも適切に文字認識を実行することができる。
【0015】
また上記課題を解決するため、本発明は、上記情報処理装置に実行させるための文字認識プログラム及び文字認識プログラムを記録した記録媒体としてもよい。
【0016】
【発明の実施の形態】
以下、図面に基づいて本発明の実施の形態を説明する。図3は、本発明の実施の形態における文書配信システムの構成例を示す図である。図3に示されるように、文書配信システム1は、文書配信サーバ10、画像処理装置20、文書管理アプリケーション30、文書管理サーバ40、メールサーバ50、ファイルシステム60等から構成されている。
【0017】
文書配信サーバ10は、画像処理装置20又は文書管理アプリケーション30から送信された画像データ(TIFF、JPEG、BITMAP等のイメージデータ)を、文書管理サーバ40、メールサーバ50又はファイルシステム60に対して配信するための機能(以下、「配信機能」という。)が実装されているコンピュータである。
【0018】
文書配信サーバ10は、画像データを配信する際に、当該画像データに対して文字認識を実行し、その結果として抽出した文字列も一緒に配信する。文字認識によって抽出された文字列は、配信先によって様々な用途に利用される。例えば、文書管理サーバ40は、当該文字列を画像データに対する属性情報として登録する。また、メールサーバ50は、当該文字列を、画像データをメール送信する際の表題として利用する。また、ファイルシステム60は、当該文字列を、画像データを保存するファイルのファイル名として利用する。
【0019】
図3に示されるように、文書配信サーバ10は、配信手段11、OCR管理手段12、位置補正手段13、OCR実行手段14及び設定ファイル15等から構成されている。
【0020】
配信手段11は、上述した画像データの配信機能を担うモジュールである。OCR管理手段12は、配信手段11からの要求により配信対象となっている画像データに対する文字認識処理の全体を制御するモジュールである。位置補正手段13は、雛形としての画像データに基づいて、予め文字認識を実行する対象として指定されている領域(以下、「OCR領域」という。)の位置を、実際にOCRの対象となっている画像データに適合するように補正するための機能が実装されているモジュールである。OCR実行手段14は、画像データに対して文字認識を実行することにより、当該画像データより文字列を抽出する機能が実装されているモジュールである。設定ファイル15は、OCR領域の位置及び範囲に関する情報等(フォーム情報)が保持されているファイルである。
【0021】
画像処理装置20は、スキャナ機能等を備えた装置であり、ユーザによる指示に基づいて、当該スキャナ機能によって読み取った画像データの配信を文書配信サーバ10に対して要求する。
【0022】
文書管理アプリケーション30は、スキャナ等によって画像データとして読み取られた文書を管理するアプリケーションであり、ユーザによる指示に基づいて管理している画像データの配信を文書配信サーバ10に対して要求する。
【0023】
文書管理サーバ40、メールサーバ50、及びファイルシステム60等は、画像処理装置20又は文書管理アプリケーション30によって配信を要求された画像データの配信先となる対象である。
【0024】
文書管理サーバ40は、文書配信サーバ10から配信された画像データをデータベースに格納する。メールサーバ50は、文書配信サーバ10から配信された画像データを電子メールとして所定のユーザに送信する。ファイルシステム60は、文書配信サーバ10から配信され画像データをファイルとして保存する。
【0025】
次に、文書配信サーバ10のハードウェア構成について説明する。図4は、本発明の実施の形態における文書配信サーバのハードウェア構成例を示す図である。図4の文書配信サーバ10は、それぞれバスBで相互に接続されているドライブ装置100と、補助記憶装置102と、メモリ装置103と、演算処理装置104と、インタフェース装置105とを有するように構成される。
【0026】
文書配信サーバ10での処理を実現する文書配信プログラムは、CD―ROM等の記録媒体101によって提供される。文書配信プログラムを記録した記録媒体101がドライブ装置100にセットされると、文書配信プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。
【0027】
補助記憶装置102は、インストールされた文書配信プログラムを格納すると共に、必要なファイルやデータ等を格納する。
【0028】
メモリ装置103は、文書配信プログラムの起動指示があった場合に、補助記憶装置102から文書配信プログラムを読み出して格納する。演算処理装置104は、メモリ装置103に格納された文書配信プログラムに従って文書配信サーバ10に係る機能を実行する。インタフェース装置105は例えばモデム、ルータ等で構成され、ネットワークに接続するために用いられる。
【0029】
以下、図3の文書配信サーバ10の処理手順について説明する。まず、文書配信サーバ10が画像データの配信を実行する前段階として予め実行しておく処理について説明する。図5は、フォーム情報登録時の文書配信サーバの処理を説明するためのフローチャートである。ここで、フォーム情報とは、図1において説明したように、OCR領域を特定するための情報をいう。
【0030】
ステップS11において、文書配信サーバ10のOCR管理手段12は、ユーザからの指示に基づいて、フォーム情報の生成のために雛形として利用する画像データ(以下、「雛形データ」という。)を格納したファイル(画像ファイル)を読み込み、当該雛形データを表示して、フォーム情報を登録するための画面(以下、「フォーム登録画面」という。)を表示させる。
【0031】
ステップS11に続いてS12に進み、ユーザが、フォーム登録画面に表示された雛形データ上において、フォーム情報として一つ以上のOCR領域を指定する。ここで、ユーザは、それぞれのOCR領域について、各OCR領域を一意に識別するための名前(以下、「領域名」という。)、当該OCR領域に含まれる文字列の種別(文字なのか数字なのか)、当該OCR領域に含まれる文字列は縦書きであるのか横書きであるのか等の属性を設定することができる。
【0032】
また、OCR領域に対する属性の一つとして、当該OCR領域が、後述する位置補正のための基準となる文字列(以下、「基準文字列」という。)を含む領域(以下、「基準文字列領域」という。)であるか否かを指定することができる。
【0033】
図6は、基準文字列領域及びOCR領域を指定した様子を示す図である。図6に示されるように、本実施の形態における雛形データ210は、報告書フォーマットによる文書を対象としている。本実施の形態においては、雛形データ210において「報告書」というタイトルが配置された領域211が基準文字列領域、報告書の作成日付及び作成者の氏名が配置された領域212及び領域213がOCR領域として指定されたものとする。
【0034】
ステップS12に続いてステップS13に進み、ユーザが雛形データ210に指定したフォーム情報(基準文字列領域211及びOCR領域212の位置及び範囲等)の登録を要求すると、OCR管理手段12は、当該フォーム情報を設定ファイル15に保存する(S14)。なお、フォーム情報は、複数のバリエーションを定義することができる。すなわち、本実施の形態におけるフォーム情報は、複数のバリエーションの一つの例であり、「報告書」用のフォーム情報といえる。したがって、ステップS14において、フォーム情報は、当該フォーム情報を他のフォーム情報から識別するためのID(以下、「フォームID」という。)と関連づけられて保存される。
【0035】
ステップS14に続いてステップS15に進み、OCR管理手段12は、基準文字列領域が指定されているか否かを判断する。基準文字列領域が指定されていなかった場合は、OCR管理手段12は、処理を終了する。
【0036】
基準文字列領域が指定されている場合は、ステップS16に進み、OCR実行手段14は、雛形データ210における基準文字列領域211の座標値を設定ファイル15より取得し、基準文字列領域211内の文字認識を実行する(S17)。
【0037】
ステップS17に続いてステップS18に進み、OCR管理手段12は、OCR実行手段14による文字認識の結果として抽出された基準文字列と、当該基準文字列の先頭の文字の左上の座標(以下、「基準座標」という。)とを設定ファイル15に保存する。
【0038】
図7は、基準座標を説明するための図である。図7において、符号220によって示される位置の座標が基準座標に該当する。すなわち、基準座標とは、基準文字列の先頭の文字を囲む矩形領域の左上の頂点の座標を意味する。
【0039】
また、図8は、設定ファイルに保存されたフォーム情報の構成例を示す図である。図8に示されるように、設定ファイル15には、領域(基準文字列領域又はOCR領域)ごとに、領域名、領域座標、文字種別、文字方向、領域種別、基準文字列、及び基準座標等の情報が、フォーム情報として保存される。
【0040】
領域名は、領域に一意に付けられた名前である。領域座標は、領域の左上及び右下の頂点の座標である。領域座標によって、各領域の位置及び範囲が特定される。文字種別は、領域内における文字の種別(文字、数字、アルファベット等の別)である。文字方向は、領域内における文字が縦書きであるか横書きであるかの別である。領域種別は、領域が基準文字列領域であるのかOCR領域であるのかの別である。図中、領域種別が「基準」という値になっている領域は、基準文字列領域に該当する。基準文字列及び基準座標は、領域種別が基準文字列領域である領域に対してのみ有効な属性であり、その意味については上述した通りである。
【0041】
次に、文書配信サーバ10に対して、画像処理装置20又は文書管理アプリケーション30より画像データの配信要求があった場合の処理について説明する。図9及び図10は、画像データの配信時の文書配信サーバの処理を説明するためのフローチャートである。
【0042】
ステップS21において、文書配信サーバ10の配信手段11は、画像処理装置20又は文書管理アプリケーション30より画像データの配信要求を受信する。画像データの配信要求は、配信対象とする画像データ(以下、「配信データ」という。)、当該配信データに対して適用するフォーム情報のフォームID、及び配信先を識別するための情報等を含む。ここでは、配信データとして、雛形データ210と同様の報告書フォーマットによる文書をスキャニングした画像データが指定され、フォームIDとして、図6に示されるOCR領域等を有するフォーム情報に対するフォームIDが指定されたものとする。
【0043】
なお、画像処理装置20又は文書管理アプリケーション30による画像データの配信要求は、それぞれにおけるユーザの入力に基づいて送信される。
【0044】
ステップS21に続いてステップS22に進み、配信手段11がOCR管理手段12に対し、配信データに対する文字認識の実行を要求すると、OCR管理手段12は、配信要求に含まれていたフォームIDによって特定されるフォーム情報を設定ファイル15より取得する。
【0045】
ステップS22に続いてステップS23に進み、OCR管理手段12は、取得したフォーム情報に基準文字列の指定があるか、すなわち、基準文字列領域として指定されているOCR領域が存在するか否かを判断する。基準文字列の指定がない場合はステップS31(図10)に進む。
【0046】
基準文字列の指定がある場合は、ステップS24に進み、OCR管理手段12からの要求に基づいて、位置補正手段13が、基準文字列領域の領域座標(図8)をフォーム情報より取得する。
【0047】
ステップS24に続いてステップS25に進み、位置補正手段13が、基準文字列領域を所定の分量だけ四方に拡張する。
【0048】
ステップS25に続いてステップS26に進み、OCR実行手段14は、配信データに対し、拡張された基準文字列領域について文字認識を実行することにより、当該基準文字列領域における文字列を抽出する。なお、ここで抽出された文字列を以下、「抽出文字列」という。
【0049】
ここで、配信データから基準文字列領域における文字列(抽出文字列)を抽出するのは、詳細については後述するが、配信データにおける抽出文字列の位置と雛形データ210における基準文字列の位置とのずれを検出し、検出したずれに基づいて配信データに対するOCR領域の位置を補正するためのである。
【0050】
また、ステップS25において基準文字列領域を四方に拡張するのは、より高い確率で配信データから基準文字列を抽出するためである。図を用いて説明する。
【0051】
図11は、雛形データに対してずれのある配信データの例を示す図である。図11は、配信データ230と、雛形データ210における当初の(拡張されていない)基準文字列領域211、OCR領域212及び213とを重ね合わせて表示している。図11から明らかなように、配信データ230における「報告書」という文字列は、基準文字列領域211に収まっていない。配信データ230は、雛形データ210に対して多少のずれを有しているからである。かかるずれは、配信データ230をスキャナ等で読み込む際等に発生する。
【0052】
このような状態において、当初の基準文字列領域211に対して文字認識を実行すると、「報告書」という文字列が正しく抽出されない可能性が高い。
【0053】
そこで、基準文字列領域211を所定の分量だけ拡張しておくことにより、より高い確率で基準文字列を抽出できるようにしようというのである。なお、拡張する分量は、発生するずれの量の経験値等に基づいて定めればよい。
【0054】
図12は、基準文字列領域を拡張した例を示す図である。図12中、図11と同一部分には同一符号を付している。図12において、符号214で示される領域が拡張された基準文字列領域(以下、「拡張基準文字列領域214」という。)である。拡張されることにより、文字列「報告書」が拡張基準文字列領域214に完全に収まるようになり、より高い確率で文字列の抽出が可能となる。
【0055】
ステップS26に続いてステップS27に進み、OCR管理手段12は、抽出文字列が基準文字列(「報告書」)と同一であるか否かを判断する。両者が同一でなかった場合は、ステップS31に進む。
【0056】
両者が同一であった場合は、抽出文字列は、配信データ230における基準文字列であるということになる。従って、ステップS28(図10)に進み、OCR管理手段12は、抽出文字列の基準座標を算出する。
【0057】
基準文字列と抽出文字列が同一か否かを判断することにより、抽出文字列が配信データ230における基準文字列でないのに基準文字列として扱われることがなくなり、後述するOCR領域の位置の補正処理の際に、誤った補正が行われるのを防止することができる。
【0058】
ステップS28に続いてステップS29に進み、OCR管理手段12は、配信データ230における抽出文字列の基準座標(以下、「カレント基準座標」という。)と、雛形データ210における基準文字列の基準座標(以下、「雛形基準座標」という。)との差分(ずれ)を算出する。
【0059】
ステップS29に続いてステップS30に進み、OCR管理手段12は、算出した差分に基づいて、他のOCR領域の位置を補正する。すなわち、設定ファイル15に保持されている各OCR領域の領域座標に当該差分を適用することにより、配信データ230に適合したOCR領域を算出する。
【0060】
図13は、位置が補正されたOCR領域の例を示す図である。図13中、図12と同一部分には同一符号を付している。図13は、カレント基準座標234と雛形基準座標220との差分235だけOCR領域212及びOCR領域213が移動し、OCR領域232及びOCR領域233として補正されている様子を示している。このように、各OCR領域が、配信データ230にとって適正な位置に補正される。
【0061】
ステップS30に続いてステップS31に進み、OCR実行手段14は、補正されたOCR領域に対して文字認識を実行し、各OCR領域に配置された文字列を抽出する。ここでは、補正により各OCR領域が適正な位置に配置されているため、意図した箇所の文字列を抽出できる可能性が高い。
【0062】
ステップS31に続いてステップS32に進み、OCR管理手段12が、OCR実行手段14によって抽出された文字列を伴って、OCRの完了を配信手段11に通知すると、配信手段11は、当該文字列を伴って配信データを指定された配信先に配信する。
【0063】
上述したように、本実施の形態における文書配信サーバ10によれば、OCRの対象とする画像データ(配信データ230)について、雛形データ210との画像のずれを算出し、算出したずれに基づいて、OCR領域を補正するため、かかるずれがある場合であっても、精度の高い文字認識を実行することができる。
【0064】
また、本実施の形態における補正方法は、罫線等の線図ではなく、通常の文字列(基準文字列)をずれの補正をするための目印として用いているため、罫線等のない文書に対しても有効に適用することができる。
【0065】
以上、本発明の好ましい実施例について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【0066】
【発明の効果】
上述の如く、本発明によれば、文字認識を行う領域を指定するための雛形としての画像データと実際に文字認識の対象とする画像データとの間に画像のずれがある場合でも、適切に文字認識を行うことができる情報処理装置を提供することができる。
【図面の簡単な説明】
【図1】フォーム情報を説明するための図である。
【図2】罫線を有する文書の画像データの例を示す図である。
【図3】本発明の実施の形態における文書配信システムの構成例を示す図である。
【図4】本発明の実施の形態における文書配信サーバのハードウェア構成例を示す図である。
【図5】フォーム情報登録時の文書配信サーバの処理を説明するためのフローチャートである。
【図6】基準文字列領域及びOCR領域を指定した様子を示す図である。
【図7】基準座標を説明するための図である。
【図8】設定ファイルに保存されたフォーム情報の構成例を示す図である。
【図9】画像データの配信時の文書配信サーバの処理を説明するためのフローチャートである。
【図10】画像データの配信時の文書配信サーバの処理を説明するためのフローチャートである。
【図11】雛形データに対してずれのある配信データの例を示す図である。
【図12】基準文字列領域を拡張した例を示す図である。
【図13】位置が補正されたOCR領域の例を示す図である。
【符号の説明】
1 文書配信システム
10 文書配信サーバ
11 配信手段
12 OCR管理手段
13 位置補正手段
14 OCR実行手段
15 設定ファイル
20 画像処理装置
30 文書管理アプリケーション
40 文書管理サーバ
50 メールサーバ
60 ファイルシステム
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 演算処理装置
105 インタフェース装置
B バス
【発明の属する技術分野】
本発明は、情報処理装置、文字認識プログラム及び記録媒体に関し、特に画像データに対して文字認識を実行する情報処理装置、文字認識プログラム及び記録媒体に関する。
【0002】
【従来の技術】
スキャナ等で画像データとして読み取った文字を解析し、テキストの文字データ(テキストデータ)として抽出するためのソフトウェアとしてOCRソフトが知られている。一般的なOCRソフトは、解析対象とする画像データを表示するGUIを備えている。ユーザは、GUI上に表示された画像データ上でテキストデータを抽出する領域(OCR領域)を指定することにより、OCR領域に含まれる文字列を抽出することができる。
【0003】
また、雛形となる画像データ(以下、「雛形データ」という。)を用いて、あらかじめ文字列を抽出する範囲を定めて登録しておくことにより(以下、登録された情報を「フォーム情報」という。)、定型的な文書を効率的に処理することもできる。
【0004】
図1は、フォーム情報を説明するための図である。図1において、矩形501は、雛形データを示す。雛形データ501における領域502は、テキストデータの抽出対象とする領域(すなわち、OCR領域)を示す。ユーザは、OCRソフトのGUI上に表示させた雛形データ上おいて、マウス等の操作により一つ以上のOCR領域を指定することができる。雛形データ上において指定されたOCR領域の座標情報等は、フォーム情報として保存される。
【0005】
例えば、画像データ503に対し、雛形データ501に基づいて生成されたフォーム情報を適用して文字認識を実行することにより、OCR領域502に配置されていた文字列「AAA」を抽出することができる。同様に、画像データ503、504、505からは、それぞれ文字列「BBB」、「CCC」、「DDD」を抽出することができる。
【0006】
このようにフォーム情報を用いることによって、画像データごとにOCR領域を指定する必要はなく、効率的にテキストデータの抽出を実行することができる。
【0007】
【発明が解決しようとする課題】
しかしながら、定型的な文書であっても、スキャナ等によって文書を読み込む際等に生じる位置ずれ等によって、雛形データ501において指定したOCR領域502が、画像データ503等においてOCRの対象としたい位置に一致しない場合がある。この場合、ユーザが意図した位置における文字列が正確に抽出されないという問題がある。
【0008】
かかるずれを補正するために、罫線を有する文書については、その罫線を目印としてOCR領域を補正する方法がある。すなわち、雛形データとして予め罫線を有する画像データを用い、雛形データ上において補正のための目印とする位置として罫線の交点等を指定し、当該交点等の座標情報をフォーム情報として登録しておく。
【0009】
図2は、罫線を有する文書の画像データの例を示す図である。図2の画像データ510において、罫線の交点となる位置511、512、及び513等が補正のための目印として登録される。
【0010】
実際にOCRの対象とする画像データについても、当該画像データにおける罫線の交点等の座標を求め、予め目印として登録されている座標との差分を算出する。当該差分をフォーム情報として登録されているOCR領域に適用すれば、OCRの対象とする画像データに対して適正なOCR領域を算出することができる。
【0011】
しかし、このような方法は、罫線等の線図を有する文書については有効であるが、かかる線図のない文書、すなわち、文章だけによって構成されている文書については適用できない。
【0012】
本発明は、上記の点に鑑みてなされたものであって、文字認識を行う領域を指定するための雛形としての画像データと実際に文字認識の対象とする画像データとの間に画像のずれがある場合でも、適切に文字認識を行うことができる情報処理装置の提供を目的とする。
【0013】
【課題を解決するための手段】
そこで上記課題を解決するため、本発明は、請求項1に記載されるように、文字認識の対象として指定された第一の画像データに対し、雛形としての第二の画像データ上において文字認識を実行する領域として指定された文字認識領域について文字認識を実行する情報処理装置であって、前記第一の画像データに対し、前記第二の画像データ上において所定の文字列が配置されている領域として指定された文字列領域について文字認識を実行することにより抽出した抽出文字列の前記第一の画像データ上における位置と、前記第二の画像データ上における前記所定の文字列の位置との差分に基づいて、前記文字認識領域の位置を補正する位置補正手段と、前記第一の画像データに対し、前記位置補正手段が位置を補正した前記文字認識領域について文字認識を実行することにより、前記第一の画像データより文字列を抽出する文字認識実行手段とを有することを特徴とする。
【0014】
このような情報処理装置では、文字認識の対象とされた第一の画像データと雛形とされた第二の画像データとの画像のずれ(差分)を算出することができ、当該ずれに基づいて文字認識を実行する領域の位置を補正することができる。よって、第一の画像データと第二の画像データとの間に画像のずれがある場合でも適切に文字認識を実行することができる。
【0015】
また上記課題を解決するため、本発明は、上記情報処理装置に実行させるための文字認識プログラム及び文字認識プログラムを記録した記録媒体としてもよい。
【0016】
【発明の実施の形態】
以下、図面に基づいて本発明の実施の形態を説明する。図3は、本発明の実施の形態における文書配信システムの構成例を示す図である。図3に示されるように、文書配信システム1は、文書配信サーバ10、画像処理装置20、文書管理アプリケーション30、文書管理サーバ40、メールサーバ50、ファイルシステム60等から構成されている。
【0017】
文書配信サーバ10は、画像処理装置20又は文書管理アプリケーション30から送信された画像データ(TIFF、JPEG、BITMAP等のイメージデータ)を、文書管理サーバ40、メールサーバ50又はファイルシステム60に対して配信するための機能(以下、「配信機能」という。)が実装されているコンピュータである。
【0018】
文書配信サーバ10は、画像データを配信する際に、当該画像データに対して文字認識を実行し、その結果として抽出した文字列も一緒に配信する。文字認識によって抽出された文字列は、配信先によって様々な用途に利用される。例えば、文書管理サーバ40は、当該文字列を画像データに対する属性情報として登録する。また、メールサーバ50は、当該文字列を、画像データをメール送信する際の表題として利用する。また、ファイルシステム60は、当該文字列を、画像データを保存するファイルのファイル名として利用する。
【0019】
図3に示されるように、文書配信サーバ10は、配信手段11、OCR管理手段12、位置補正手段13、OCR実行手段14及び設定ファイル15等から構成されている。
【0020】
配信手段11は、上述した画像データの配信機能を担うモジュールである。OCR管理手段12は、配信手段11からの要求により配信対象となっている画像データに対する文字認識処理の全体を制御するモジュールである。位置補正手段13は、雛形としての画像データに基づいて、予め文字認識を実行する対象として指定されている領域(以下、「OCR領域」という。)の位置を、実際にOCRの対象となっている画像データに適合するように補正するための機能が実装されているモジュールである。OCR実行手段14は、画像データに対して文字認識を実行することにより、当該画像データより文字列を抽出する機能が実装されているモジュールである。設定ファイル15は、OCR領域の位置及び範囲に関する情報等(フォーム情報)が保持されているファイルである。
【0021】
画像処理装置20は、スキャナ機能等を備えた装置であり、ユーザによる指示に基づいて、当該スキャナ機能によって読み取った画像データの配信を文書配信サーバ10に対して要求する。
【0022】
文書管理アプリケーション30は、スキャナ等によって画像データとして読み取られた文書を管理するアプリケーションであり、ユーザによる指示に基づいて管理している画像データの配信を文書配信サーバ10に対して要求する。
【0023】
文書管理サーバ40、メールサーバ50、及びファイルシステム60等は、画像処理装置20又は文書管理アプリケーション30によって配信を要求された画像データの配信先となる対象である。
【0024】
文書管理サーバ40は、文書配信サーバ10から配信された画像データをデータベースに格納する。メールサーバ50は、文書配信サーバ10から配信された画像データを電子メールとして所定のユーザに送信する。ファイルシステム60は、文書配信サーバ10から配信され画像データをファイルとして保存する。
【0025】
次に、文書配信サーバ10のハードウェア構成について説明する。図4は、本発明の実施の形態における文書配信サーバのハードウェア構成例を示す図である。図4の文書配信サーバ10は、それぞれバスBで相互に接続されているドライブ装置100と、補助記憶装置102と、メモリ装置103と、演算処理装置104と、インタフェース装置105とを有するように構成される。
【0026】
文書配信サーバ10での処理を実現する文書配信プログラムは、CD―ROM等の記録媒体101によって提供される。文書配信プログラムを記録した記録媒体101がドライブ装置100にセットされると、文書配信プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。
【0027】
補助記憶装置102は、インストールされた文書配信プログラムを格納すると共に、必要なファイルやデータ等を格納する。
【0028】
メモリ装置103は、文書配信プログラムの起動指示があった場合に、補助記憶装置102から文書配信プログラムを読み出して格納する。演算処理装置104は、メモリ装置103に格納された文書配信プログラムに従って文書配信サーバ10に係る機能を実行する。インタフェース装置105は例えばモデム、ルータ等で構成され、ネットワークに接続するために用いられる。
【0029】
以下、図3の文書配信サーバ10の処理手順について説明する。まず、文書配信サーバ10が画像データの配信を実行する前段階として予め実行しておく処理について説明する。図5は、フォーム情報登録時の文書配信サーバの処理を説明するためのフローチャートである。ここで、フォーム情報とは、図1において説明したように、OCR領域を特定するための情報をいう。
【0030】
ステップS11において、文書配信サーバ10のOCR管理手段12は、ユーザからの指示に基づいて、フォーム情報の生成のために雛形として利用する画像データ(以下、「雛形データ」という。)を格納したファイル(画像ファイル)を読み込み、当該雛形データを表示して、フォーム情報を登録するための画面(以下、「フォーム登録画面」という。)を表示させる。
【0031】
ステップS11に続いてS12に進み、ユーザが、フォーム登録画面に表示された雛形データ上において、フォーム情報として一つ以上のOCR領域を指定する。ここで、ユーザは、それぞれのOCR領域について、各OCR領域を一意に識別するための名前(以下、「領域名」という。)、当該OCR領域に含まれる文字列の種別(文字なのか数字なのか)、当該OCR領域に含まれる文字列は縦書きであるのか横書きであるのか等の属性を設定することができる。
【0032】
また、OCR領域に対する属性の一つとして、当該OCR領域が、後述する位置補正のための基準となる文字列(以下、「基準文字列」という。)を含む領域(以下、「基準文字列領域」という。)であるか否かを指定することができる。
【0033】
図6は、基準文字列領域及びOCR領域を指定した様子を示す図である。図6に示されるように、本実施の形態における雛形データ210は、報告書フォーマットによる文書を対象としている。本実施の形態においては、雛形データ210において「報告書」というタイトルが配置された領域211が基準文字列領域、報告書の作成日付及び作成者の氏名が配置された領域212及び領域213がOCR領域として指定されたものとする。
【0034】
ステップS12に続いてステップS13に進み、ユーザが雛形データ210に指定したフォーム情報(基準文字列領域211及びOCR領域212の位置及び範囲等)の登録を要求すると、OCR管理手段12は、当該フォーム情報を設定ファイル15に保存する(S14)。なお、フォーム情報は、複数のバリエーションを定義することができる。すなわち、本実施の形態におけるフォーム情報は、複数のバリエーションの一つの例であり、「報告書」用のフォーム情報といえる。したがって、ステップS14において、フォーム情報は、当該フォーム情報を他のフォーム情報から識別するためのID(以下、「フォームID」という。)と関連づけられて保存される。
【0035】
ステップS14に続いてステップS15に進み、OCR管理手段12は、基準文字列領域が指定されているか否かを判断する。基準文字列領域が指定されていなかった場合は、OCR管理手段12は、処理を終了する。
【0036】
基準文字列領域が指定されている場合は、ステップS16に進み、OCR実行手段14は、雛形データ210における基準文字列領域211の座標値を設定ファイル15より取得し、基準文字列領域211内の文字認識を実行する(S17)。
【0037】
ステップS17に続いてステップS18に進み、OCR管理手段12は、OCR実行手段14による文字認識の結果として抽出された基準文字列と、当該基準文字列の先頭の文字の左上の座標(以下、「基準座標」という。)とを設定ファイル15に保存する。
【0038】
図7は、基準座標を説明するための図である。図7において、符号220によって示される位置の座標が基準座標に該当する。すなわち、基準座標とは、基準文字列の先頭の文字を囲む矩形領域の左上の頂点の座標を意味する。
【0039】
また、図8は、設定ファイルに保存されたフォーム情報の構成例を示す図である。図8に示されるように、設定ファイル15には、領域(基準文字列領域又はOCR領域)ごとに、領域名、領域座標、文字種別、文字方向、領域種別、基準文字列、及び基準座標等の情報が、フォーム情報として保存される。
【0040】
領域名は、領域に一意に付けられた名前である。領域座標は、領域の左上及び右下の頂点の座標である。領域座標によって、各領域の位置及び範囲が特定される。文字種別は、領域内における文字の種別(文字、数字、アルファベット等の別)である。文字方向は、領域内における文字が縦書きであるか横書きであるかの別である。領域種別は、領域が基準文字列領域であるのかOCR領域であるのかの別である。図中、領域種別が「基準」という値になっている領域は、基準文字列領域に該当する。基準文字列及び基準座標は、領域種別が基準文字列領域である領域に対してのみ有効な属性であり、その意味については上述した通りである。
【0041】
次に、文書配信サーバ10に対して、画像処理装置20又は文書管理アプリケーション30より画像データの配信要求があった場合の処理について説明する。図9及び図10は、画像データの配信時の文書配信サーバの処理を説明するためのフローチャートである。
【0042】
ステップS21において、文書配信サーバ10の配信手段11は、画像処理装置20又は文書管理アプリケーション30より画像データの配信要求を受信する。画像データの配信要求は、配信対象とする画像データ(以下、「配信データ」という。)、当該配信データに対して適用するフォーム情報のフォームID、及び配信先を識別するための情報等を含む。ここでは、配信データとして、雛形データ210と同様の報告書フォーマットによる文書をスキャニングした画像データが指定され、フォームIDとして、図6に示されるOCR領域等を有するフォーム情報に対するフォームIDが指定されたものとする。
【0043】
なお、画像処理装置20又は文書管理アプリケーション30による画像データの配信要求は、それぞれにおけるユーザの入力に基づいて送信される。
【0044】
ステップS21に続いてステップS22に進み、配信手段11がOCR管理手段12に対し、配信データに対する文字認識の実行を要求すると、OCR管理手段12は、配信要求に含まれていたフォームIDによって特定されるフォーム情報を設定ファイル15より取得する。
【0045】
ステップS22に続いてステップS23に進み、OCR管理手段12は、取得したフォーム情報に基準文字列の指定があるか、すなわち、基準文字列領域として指定されているOCR領域が存在するか否かを判断する。基準文字列の指定がない場合はステップS31(図10)に進む。
【0046】
基準文字列の指定がある場合は、ステップS24に進み、OCR管理手段12からの要求に基づいて、位置補正手段13が、基準文字列領域の領域座標(図8)をフォーム情報より取得する。
【0047】
ステップS24に続いてステップS25に進み、位置補正手段13が、基準文字列領域を所定の分量だけ四方に拡張する。
【0048】
ステップS25に続いてステップS26に進み、OCR実行手段14は、配信データに対し、拡張された基準文字列領域について文字認識を実行することにより、当該基準文字列領域における文字列を抽出する。なお、ここで抽出された文字列を以下、「抽出文字列」という。
【0049】
ここで、配信データから基準文字列領域における文字列(抽出文字列)を抽出するのは、詳細については後述するが、配信データにおける抽出文字列の位置と雛形データ210における基準文字列の位置とのずれを検出し、検出したずれに基づいて配信データに対するOCR領域の位置を補正するためのである。
【0050】
また、ステップS25において基準文字列領域を四方に拡張するのは、より高い確率で配信データから基準文字列を抽出するためである。図を用いて説明する。
【0051】
図11は、雛形データに対してずれのある配信データの例を示す図である。図11は、配信データ230と、雛形データ210における当初の(拡張されていない)基準文字列領域211、OCR領域212及び213とを重ね合わせて表示している。図11から明らかなように、配信データ230における「報告書」という文字列は、基準文字列領域211に収まっていない。配信データ230は、雛形データ210に対して多少のずれを有しているからである。かかるずれは、配信データ230をスキャナ等で読み込む際等に発生する。
【0052】
このような状態において、当初の基準文字列領域211に対して文字認識を実行すると、「報告書」という文字列が正しく抽出されない可能性が高い。
【0053】
そこで、基準文字列領域211を所定の分量だけ拡張しておくことにより、より高い確率で基準文字列を抽出できるようにしようというのである。なお、拡張する分量は、発生するずれの量の経験値等に基づいて定めればよい。
【0054】
図12は、基準文字列領域を拡張した例を示す図である。図12中、図11と同一部分には同一符号を付している。図12において、符号214で示される領域が拡張された基準文字列領域(以下、「拡張基準文字列領域214」という。)である。拡張されることにより、文字列「報告書」が拡張基準文字列領域214に完全に収まるようになり、より高い確率で文字列の抽出が可能となる。
【0055】
ステップS26に続いてステップS27に進み、OCR管理手段12は、抽出文字列が基準文字列(「報告書」)と同一であるか否かを判断する。両者が同一でなかった場合は、ステップS31に進む。
【0056】
両者が同一であった場合は、抽出文字列は、配信データ230における基準文字列であるということになる。従って、ステップS28(図10)に進み、OCR管理手段12は、抽出文字列の基準座標を算出する。
【0057】
基準文字列と抽出文字列が同一か否かを判断することにより、抽出文字列が配信データ230における基準文字列でないのに基準文字列として扱われることがなくなり、後述するOCR領域の位置の補正処理の際に、誤った補正が行われるのを防止することができる。
【0058】
ステップS28に続いてステップS29に進み、OCR管理手段12は、配信データ230における抽出文字列の基準座標(以下、「カレント基準座標」という。)と、雛形データ210における基準文字列の基準座標(以下、「雛形基準座標」という。)との差分(ずれ)を算出する。
【0059】
ステップS29に続いてステップS30に進み、OCR管理手段12は、算出した差分に基づいて、他のOCR領域の位置を補正する。すなわち、設定ファイル15に保持されている各OCR領域の領域座標に当該差分を適用することにより、配信データ230に適合したOCR領域を算出する。
【0060】
図13は、位置が補正されたOCR領域の例を示す図である。図13中、図12と同一部分には同一符号を付している。図13は、カレント基準座標234と雛形基準座標220との差分235だけOCR領域212及びOCR領域213が移動し、OCR領域232及びOCR領域233として補正されている様子を示している。このように、各OCR領域が、配信データ230にとって適正な位置に補正される。
【0061】
ステップS30に続いてステップS31に進み、OCR実行手段14は、補正されたOCR領域に対して文字認識を実行し、各OCR領域に配置された文字列を抽出する。ここでは、補正により各OCR領域が適正な位置に配置されているため、意図した箇所の文字列を抽出できる可能性が高い。
【0062】
ステップS31に続いてステップS32に進み、OCR管理手段12が、OCR実行手段14によって抽出された文字列を伴って、OCRの完了を配信手段11に通知すると、配信手段11は、当該文字列を伴って配信データを指定された配信先に配信する。
【0063】
上述したように、本実施の形態における文書配信サーバ10によれば、OCRの対象とする画像データ(配信データ230)について、雛形データ210との画像のずれを算出し、算出したずれに基づいて、OCR領域を補正するため、かかるずれがある場合であっても、精度の高い文字認識を実行することができる。
【0064】
また、本実施の形態における補正方法は、罫線等の線図ではなく、通常の文字列(基準文字列)をずれの補正をするための目印として用いているため、罫線等のない文書に対しても有効に適用することができる。
【0065】
以上、本発明の好ましい実施例について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【0066】
【発明の効果】
上述の如く、本発明によれば、文字認識を行う領域を指定するための雛形としての画像データと実際に文字認識の対象とする画像データとの間に画像のずれがある場合でも、適切に文字認識を行うことができる情報処理装置を提供することができる。
【図面の簡単な説明】
【図1】フォーム情報を説明するための図である。
【図2】罫線を有する文書の画像データの例を示す図である。
【図3】本発明の実施の形態における文書配信システムの構成例を示す図である。
【図4】本発明の実施の形態における文書配信サーバのハードウェア構成例を示す図である。
【図5】フォーム情報登録時の文書配信サーバの処理を説明するためのフローチャートである。
【図6】基準文字列領域及びOCR領域を指定した様子を示す図である。
【図7】基準座標を説明するための図である。
【図8】設定ファイルに保存されたフォーム情報の構成例を示す図である。
【図9】画像データの配信時の文書配信サーバの処理を説明するためのフローチャートである。
【図10】画像データの配信時の文書配信サーバの処理を説明するためのフローチャートである。
【図11】雛形データに対してずれのある配信データの例を示す図である。
【図12】基準文字列領域を拡張した例を示す図である。
【図13】位置が補正されたOCR領域の例を示す図である。
【符号の説明】
1 文書配信システム
10 文書配信サーバ
11 配信手段
12 OCR管理手段
13 位置補正手段
14 OCR実行手段
15 設定ファイル
20 画像処理装置
30 文書管理アプリケーション
40 文書管理サーバ
50 メールサーバ
60 ファイルシステム
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 演算処理装置
105 インタフェース装置
B バス
Claims (8)
- 文字認識の対象として指定された第一の画像データに対し、雛形としての第二の画像データ上において文字認識を実行する領域として指定された文字認識領域について文字認識を実行する情報処理装置であって、
前記第一の画像データに対し、前記第二の画像データ上において所定の文字列が配置されている領域として指定された文字列領域について文字認識を実行することにより抽出した抽出文字列の前記第一の画像データ上における位置と、前記第二の画像データ上における前記所定の文字列の位置との差分に基づいて、前記文字認識領域の位置を補正する位置補正手段と、
前記第一の画像データに対し、前記位置補正手段が位置を補正した前記文字認識領域について文字認識を実行することにより、前記第一の画像データより文字列を抽出する文字認識実行手段とを有することを特徴とする情報処理装置。 - 前記文字認識領域の位置及び範囲に関する情報と、前記文字列領域の位置及び範囲に関する情報と、前記所定の文字列の位置に関する情報とを保持する雛形情報保持手段を更に有し、
前記位置補正手段は、前記雛形情報保持手段に保持されている情報に基づいて、前記文字認識領域、前記文字列領域、及び前記所定の文字列の位置を識別することを特徴とする請求項1記載の情報処理装置。 - 前記所定の文字列の位置は、前記所定の文字列の先頭の文字を囲む矩形領域における左上の頂点の位置であることを特徴とする請求項1又は2記載の情報処理装置。
- 前記抽出文字列が前記所定の文字列と同一の文字列かを判断し、
前記位置補正手段は、前記抽出文字列が前記所定の文字列と同一の文字列である場合に前記文字認識領域の位置を補正することを特徴とする請求項1乃至3いずれか一項記載の情報処理装置。 - 前記文字列領域を拡張した領域について文字認識を実行することにより前記抽出文字列を抽出することを特徴とする請求項1乃至4いずれか一項記載の情報処理装置。
- ネットワークを介して接続しているクライアント装置からの前記第一の画像データの配信要求に基づいて、前記第一の画像データを前記配信要求において指定された配信先に配信する配信手段を更に有し、
前記配信手段は、前記文字認識実行手段が前記第一の画像データより抽出した文字列を伴って、前記第一の画像データを配信することを特徴とする請求項1乃至5いずれか一項記載の情報処理装置。 - 文字認識の対象として指定された第一の画像データに対し、雛形としての第二の画像データ上において文字認識を実行する領域として指定された文字認識領域について文字認識を実行する情報処理装置に、
前記第一の画像データに対し、前記第二の画像データ上において所定の文字列が配置されている領域として指定された文字列領域について文字認識を実行することにより抽出した抽出文字列の前記第一の画像データ上における位置と、前記第二の画像データ上における前記所定の文字列の位置との差分に基づいて、前記文字認識領域の位置を補正する位置補正手順と、
前記第一の画像データに対し、前記位置補正手順において位置が補正された前記文字認識領域について文字認識を実行することにより、前記第一の画像データより文字列を抽出する文字認識実行手順とを実行させるための文字認識プログラム。 - 文字認識の対象として指定された第一の画像データに対し、雛形としての第二の画像データ上において文字認識を実行する領域として指定された文字認識領域について文字認識を実行する情報処理装置に、
前記第一の画像データに対し、前記第二の画像データ上において所定の文字列が配置されている領域として指定された文字列領域について文字認識を実行することにより抽出した抽出文字列の前記第一の画像データ上における位置と、前記第二の画像データ上における前記所定の文字列の位置との差分に基づいて、前記文字認識領域の位置を補正する位置補正手順と、
前記第一の画像データに対し、前記位置補正手順において位置が補正された前記文字認識領域について文字認識を実行することにより、前記第一の画像データより文字列を抽出する文字認識実行手順とを実行させるための文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003200493A JP2005043995A (ja) | 2003-07-23 | 2003-07-23 | 情報処理装置、文字認識プログラム及び記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003200493A JP2005043995A (ja) | 2003-07-23 | 2003-07-23 | 情報処理装置、文字認識プログラム及び記録媒体 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2005043995A true JP2005043995A (ja) | 2005-02-17 |
Family
ID=34260886
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003200493A Pending JP2005043995A (ja) | 2003-07-23 | 2003-07-23 | 情報処理装置、文字認識プログラム及び記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2005043995A (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2007029625A1 (ja) * | 2005-09-06 | 2007-03-15 | Tosho Inc. | 処方箋受付装置 |
| JP2007140632A (ja) * | 2005-11-15 | 2007-06-07 | Tosho Inc | 処方箋受付装置 |
| JP2014170452A (ja) * | 2013-03-05 | 2014-09-18 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
| JP2017091419A (ja) * | 2015-11-16 | 2017-05-25 | 富士ゼロックス株式会社 | 情報処理装置、画像読み取り装置及びプログラム |
| CN111523359A (zh) * | 2019-02-05 | 2020-08-11 | 富士施乐株式会社 | 信息处理装置、记录媒体及信息处理方法 |
| CN114861624A (zh) * | 2022-05-31 | 2022-08-05 | 苏州浪潮智能科技有限公司 | 一种服务器测试报告填写方法、系统、装置及存储介质 |
| JP7824544B1 (ja) * | 2024-11-14 | 2026-03-05 | キヤノンマーケティングジャパン株式会社 | 情報処理システム及びその制御方法、プログラム |
-
2003
- 2003-07-23 JP JP2003200493A patent/JP2005043995A/ja active Pending
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2007029625A1 (ja) * | 2005-09-06 | 2007-03-15 | Tosho Inc. | 処方箋受付装置 |
| JP2007140632A (ja) * | 2005-11-15 | 2007-06-07 | Tosho Inc | 処方箋受付装置 |
| JP2014170452A (ja) * | 2013-03-05 | 2014-09-18 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
| JP2017091419A (ja) * | 2015-11-16 | 2017-05-25 | 富士ゼロックス株式会社 | 情報処理装置、画像読み取り装置及びプログラム |
| CN111523359A (zh) * | 2019-02-05 | 2020-08-11 | 富士施乐株式会社 | 信息处理装置、记录媒体及信息处理方法 |
| CN114861624A (zh) * | 2022-05-31 | 2022-08-05 | 苏州浪潮智能科技有限公司 | 一种服务器测试报告填写方法、系统、装置及存储介质 |
| JP7824544B1 (ja) * | 2024-11-14 | 2026-03-05 | キヤノンマーケティングジャパン株式会社 | 情報処理システム及びその制御方法、プログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4100746B2 (ja) | 画像処理装置及び方法 | |
| CN110532811B (zh) | 一种pdf签章方法及pdf签章系统 | |
| JP6050843B2 (ja) | 情報処理装置、方法およびプログラム | |
| US20170004122A1 (en) | Handwritten character correction apparatus, handwritten character correction method, and non-transitory computer-readable recording medium | |
| JP2012203491A (ja) | 文書処理装置及び文書処理プログラム | |
| JP2005043995A (ja) | 情報処理装置、文字認識プログラム及び記録媒体 | |
| US9883071B2 (en) | Image processing apparatus, terminal device, and non-transitory data recording medium recording control program | |
| JP3733310B2 (ja) | 文書書式識別装置および識別方法 | |
| JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
| US20080150940A1 (en) | Image processing apparatus and method thereof | |
| JP2000181988A (ja) | 光学文字読取装置 | |
| JP2009031937A (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
| JP4591229B2 (ja) | 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム | |
| JP4804433B2 (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
| JP5673277B2 (ja) | 画像処理装置およびプログラム | |
| JP2008122788A (ja) | 画像処理装置、画像処理方法、該方法を実行するためのプログラム及び記憶媒体 | |
| JP4754236B2 (ja) | 情報処理装置、取得方法、及び取得プログラム | |
| CN110390323B (zh) | 信息处理装置以及计算机可读介质 | |
| JP4043431B2 (ja) | スタンプ処理装置、プログラム、及び記録媒体 | |
| JP7574489B1 (ja) | 学習用データ作成方法および学習データ作成装置 | |
| JP2009141525A (ja) | 画像処理装置及び画像処理方法 | |
| JP4692315B2 (ja) | 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム | |
| JP5343584B2 (ja) | 情報処理装置及びプログラム | |
| JP2009053827A (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
| JP2006072524A (ja) | 情報処理装置および情報処理方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060419 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090106 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090306 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090407 |