JP2009200622A - 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 - Google Patents

電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 Download PDF

Info

Publication number
JP2009200622A
JP2009200622A JP2008037774A JP2008037774A JP2009200622A JP 2009200622 A JP2009200622 A JP 2009200622A JP 2008037774 A JP2008037774 A JP 2008037774A JP 2008037774 A JP2008037774 A JP 2008037774A JP 2009200622 A JP2009200622 A JP 2009200622A
Authority
JP
Japan
Prior art keywords
image
character
electronic document
correction
baseline
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008037774A
Other languages
English (en)
Other versions
JP4902568B2 (ja
JP2009200622A5 (ja
Inventor
Ichiro Umeda
一郎 梅田
Tetsuomi Tanaka
哲臣 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008037774A priority Critical patent/JP4902568B2/ja
Priority to KR1020090010901A priority patent/KR101018310B1/ko
Priority to EP09152544.4A priority patent/EP2093994B1/en
Priority to US12/388,417 priority patent/US8532386B2/en
Priority to CN2009100065630A priority patent/CN101515984B/zh
Publication of JP2009200622A publication Critical patent/JP2009200622A/ja
Publication of JP2009200622A5 publication Critical patent/JP2009200622A5/ja
Application granted granted Critical
Publication of JP4902568B2 publication Critical patent/JP4902568B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】本発明の課題は、電子文書において検索したときに、歪みを補正しない画像上で検索結果の表示を可能とすることである。
【解決手段】上記課題を解決するために、本発明は、画像の歪みを補正することにより補正画像を得て、前記補正画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る。次に、前記補正前の画像における各文字行のベースラインを求める。そして、前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求めて、前記補正前の画像上における前記テキストデータの位置を、前記ベースラインからの相対位置で記述した電子文書を生成する。
【選択図】図3

Description

本発明は歪みを持つ画像から検索可能な電子文書を生成する電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体に関する。
従来から、スキャンした画像の補正に関する各種手法が提案されている。特許文献1では、本の綴じ込み部分における湾曲歪みを補正する方法が開示されている。また、特許文献2では、撮影対象面の高さが一様でないために生じる撮影画像の歪みを、原稿の上下端、札臓器から原稿までの距離、撮像器の相対位置を用いて、画像の補正を行う方法が開示されている。
また、特許文献3では、文書画像に対して文字認識処理を行い、その文字認識結果のテキストデータと、テキストデータの文書画像上における対応位置を示す座標情報とを関連付けておく。そして、テキスト検索したとき、検索されたテキストに対応する部分を含む文書画像ページを表示することが開示されている。また、特許文献4では、文書画像に対して文字認識処理を行った結果のテキストデータと、解像度を下げた文書画像とを対応付けて登録しておき、検索可能な文書を作成することが開示されている。
特開昭60−65668号公報 特開2002−77578号公報 特開平7−93374号公報 特開平8−63583号公報
しかしながら、特許文献1,2による画像補正手法では、歪み補正変換の推測誤差により、補正後の画像には補正誤差による更なる歪みが生じ、更に画質劣化が発生することがある。すなわち、歪み補正処理を行った際に推測誤差等により更なる歪みが発生している可能性があるので、ユーザにとって、その歪み補正後の画像は補正前の画像よりも判読しにくくなっている可能性がありうる。
一方で、歪みを含んだままの文書画像に対して文字認識処理を行うと、文書画像からの文字の抽出精度が低下し、結果的に、文書画像全体の文字認識精度が低下してしまうという問題がある。
本発明では、ユーザにとって判読しやすい画像を表示でき、かつ文字認識精度を保った電子文書を提供することを目的とする。また、PDF(Portable Document Format)などのフォーマット形式で文字認識結果を埋め込んだ場合でも、テキスト検索できるようにすることを目的とする。
上記課題を解決するために、本発明に係る電子文書生成装置は、画像の歪みを補正することにより補正画像を得る補正手段と、前記補正画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る文字認識手段と、前記補正前の画像における各文字行のベースラインを求める手段と、前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求める手段と、前記補正前の画像上における前記テキストデータの位置を、前記ベースラインからの相対位置で記述した電子文書を生成する生成手段と、を備えることを特徴とする。
本発明によれば、本発明に基づき生成した電子文書において検索したときに、歪みを補正しない画像上で検索結果の表示が可能になる。また、歪み補正された画像を用いて文字認識を行うので、文書画像全体の文字認識率(文字認識精度)を向上させることができる。また、表示に用いる画像は歪み補正前の画像を使用するので、ユーザに不自然さを感じさせるような、歪み補正誤差による画質劣化が起きた画像の表示を防ぐことができる。また、文字行に属する各テキストデータを、ベースラインからの相対位置を用いて記述するので、各テキストデータが属する文字行が明確になり、検索時やコピー時の精度がよくなる。
<実施形態1>
図1は、実施形態1に係る電子文書生成装置の概略を示すブロック図である。
CPU101は、ROM102に格納されている制御プログラムを実行することにより、本装置全体の制御を行う。ROM102は、CPU101が実行するコンピュータプログラムや各種パラメータデータを格納する。コンピュータプログラムは、CPU101で実行されることにより、後述するフローチャートに示す各処理を実行するための各種手段(各処理部)として、当該装置(コンピュータ)を機能させる。なお、本実施形態では、後述するフローチャートの各ステップに対応する処理を、コンピュータ(CPU)を用いてソフトウェアで実現されるが、その処理の一部または全部を電子回路などのハードウェアで実現するようにしても良い。また、本発明の電子文書生成装置は、汎用パソコンを用いて実現しても良いし、電子文書生成専用装置として実現するようにしても良い。
RAM103は、画像や各種情報を記憶する。また、RAM103は、CPUのワークエリアやデータの一時待避領域として機能する。
外部記憶装置104は、辞書などの各種データを記憶する。外部記憶装置104は、例えば、ハードディスクやCD−ROM等を含む。なお、本発明の装置をコンピュータに実現させるためのコンピュータプログラムは、このコンピュータ読取可能な外部記憶媒体に格納されていても良いし、ネットワークを介して供給されるようにしても良い。ディスプレイ105は、例えば、LCDやCRTである。
入力装置106は、例えば、デジカメやスキャナ等の画像入力装置を接続するためのインターフェースであっても良いし、デジカメ等の画像入力装置そのものであっても良い。また、デジタルカメラやスキャナの機能の1つとして実現するために、デジタルカメラやスキャナの内部に本発明の装置を組み込んで実現しても良い。
ネットワークインターフェース(I/F)107は、ネットワーク上に接続されている外部装置(例えば、サーバ、外部記憶装置、画像入力装置等)と通信し、プログラムやデータを読み込んだり、書き込んだりする。尚、ネットワークは、典型的にはインターネットやLANやWANや電話回線などのいわゆる通信ネットワークであり、データの送受信が可能であれば良い。また、ディスプレイ105や入力装置106は、ネットワークインターフェース107を介して接続されていても良い。
このような電子文書生成装置は、例えば、図2に示すシステムにおいて実現される。図2は、実施形態1において採用可能なコンピュータシステムの例を示す図である。コンピュータ装置201は、スキャナ202で撮影した画像データを受信して、電子文書生成のための処理を実行する。なお、本発明の電子文書生成装置は、この構成に限るものではなく、スキャナを内蔵するデバイス(例えば、複合機(MFP)など)において電子文書を生成することができるようにしても良い。また、デジタルカメラ等で撮影した画像を用いて電子文書を生成するようにしてもよい。
次に、実施形態1の電子文書生成処理を行う際の各処理部と各処理部で入出力される各データとを示すブロック図を図3に示す。
画像回転部301は、入力画像に含まれる文字画像がほぼ直立するように該入力画像全体を回転することによって、直立画像を得る。これは、後述する図4におけるステップS401の処理によって実行される。
画像歪み補正部302は、直立画像に歪み補正変換を実行することにより、歪み補正画像を得る。これは、後述する図4におけるステップS402〜ステップS404の処理によって実行される。
文字認識部303は、歪み補正画像に対して文字認識処理を行うことにより、文字認識結果のテキストデータと、各テキストの歪み補正画像上における座標とを得る。これは、後述する図4におけるステップS405によって実行される。
座標変換部304は、文字認識部303で得られた文字認識結果のテキストの歪み補正画像上における座標を、歪み補正を行う前の直立画像上における座標に変換する。これは、後述する図4におけるステップS406によって実行される。
電子文書生成部305は、画像歪み補正部302で得られた直立画像と文字認識部303で得られた文字認識結果のテキストデータとから電子文書を生成する。ここでは、直立画像内における各テキスト領域に配置されるテキストデータが決定される。これは、後述する図4におけるステップS407〜ステップS409によって実行される。
テキスト歪み再現部306は、電子文書生成部305で得られた電子文書と座標変換部304で得られた座標から、電子文書に重ねる透明文字のベースラインを求め、文字幅比および相対位置を調整することにより、テキストの歪みを再現する。これは、後述する図4におけるステップS410〜415によって実行される。
次に、実施形態1のフローチャートの例を図4に示す。
ステップS401で、CPU101は、入力画像を直立させるべく回転し直立画像を得る。実施形態1が対象とする入力画像の例の一部を図5に示す。この入力画像は画像全体(全ての文字画像)が大きく傾いているので、このままの状態では文字認識処理を行えない。そこで、本の綴じ込み部分における文字列以外の文字列がほぼ直立するように入力画像全体を回転させる。図5の画像を回転変換して得た直立画像の一部を図6に示す。なお、画像の回転はほぼ誤差の発生しないビットマップ変換を用いることとする。この回転角はユーザが指定しても良いし自動で求めてもよい。自動で求める場合、例えば、図5を小区画ごとに区切り、それぞれの小区画に含まれる文字列の傾斜角を公知の技術を用いて求め、各小区画から得た傾斜角のうち最頻の角度を画像全体の傾き角度として求める。
ステップS401で得た直立画像には、本の綴じ込み部分における歪みなどは残ったままになっているので、ステップS402で、CPU101は、上記の直立画像に対する歪み補正変換(補正時に用いる補正式や係数・変数など)を求める。この歪み補正変換は画像中の歪み部分を補正し正対させるものであって、この求め方は、特許文献1〜2に記載されているような方法でもよいし、あるいは他の歪み補正変換方法でもよい。但し、逆変換を求められる必要がある。
ステップS403で、CPU101は、上記の歪み補正変換(歪み補正計算式など)から歪み補正逆変換(逆変換用の計算式など)を求める。
ステップS404で、CPU101は、S401で得た直立画像(歪み補正前の画像)にS402で求めた歪み補正変換を施し、歪み補正画像(歪み補正後の画像)を得る。図6の画像に歪み補正変換を施した場合、図7のような歪み補正画像が得られたものとする。歪みの計測には計測誤差が発生する為、歪み補正画像には計測誤差に基づく歪みが発生しやすい。図8は、この補正後の歪みの例を示す。図8に示したように、計測誤差等により補正時に生じる歪みは、不自然な歪みであるので、ユーザにとっては、不自然さが顕著に感じられ、判読しにくい画像となりやすい。すなわち、ユーザにとっては、不自然な歪みが生じている図8のような歪み補正画像よりも、図6のような自然な歪み(本の綴じ込み部分など)が残っている直立画像の方が見易いことがある。一方、文字認識処理を行う際には、図6のような歪みが残っている状態の方が綴じ込み部分の文字抽出処理に失敗したりして、文書全体の文字認識精度が低下しやすい。すなわち、文字認識処理にとっては、図6のような歪みが残っている直立画像よりも、図7(図8)のような歪み補正画像の方が適していることが多い。
ステップS405で、CPU101は、歪み補正画像に対して文字認識処理を実行することにより、文字認識結果のテキスト及び歪み補正画像上の座標を求める。図7に示されている歪み補正画像上のテキスト領域701を図9に示し、そこから得られたテキストの例を、図10に示す。なお、文字認識処理には公知の文字認識技術が使用可能である。以降、実施形態1では歪み補正画像上の座標は、複数の文字画像で構成されるテキスト領域の位置座標と、各文字画像の位置座標とについて得るものとするが、これに限るものではない。
ステップS406で、CPU101は、ステップS403で得られた歪み補正逆変換(逆変換式)と、ステップS405で得られた歪み補正画像上の座標とに基づいて、歪み補正前の直立画像上の座標を得る。例えば、図7に示されているテキスト領域701の各頂点座標の逆変換を行い、その逆変換後の頂点座標を囲む外接矩形を求めると、図6に示されている領域601が得られる。また、図9に示されている文字901を囲む矩形の各頂点の座標に対して逆変換を行うと、逆変換結果の頂点座標を囲む矩形は、図6に示されているように文字602の座標が得られる。
ステップS407で、CPU101は、電子文書を生成する。なお、この電子文書は少なくとも画像オブジェクトと文字オブジェクトが同一座標上に重ねて存在でき、かつ、文字オブジェクトが検索可能かつ非表示(透明)として扱うことができるような文書である。本実施形態1ではPDF文書を生成するものとする。
ステップS408で、CPU101は、電子文書に直立画像を画像オブジェクトとして配置する。例えば、図6のような直立画像が配置される。
ステップS409で、CPU101は、ステップS406で得られた各テキスト領域の座標内に配置するテキストオブジェクト(文字認識結果のテキストデータ)を決定する。例えば、図6において、テキスト領域601に配置されるテキストオブジェクトが決定される。そして、各テキスト領域内に配置されるテキストデータは、ステップS408で配置した画像オブジェクト上に透明文字として重ねてレンダリングされるように、PDF文書内に記述される。
ステップS410で、CPU101は、ステップS409で配置決定されたテキストオブジェクトについて、各文字行のデフォルトベースライン及びデフォルト文字幅を求める。そして、このデフォルトベースラインとデフォルト文字幅の情報を、電子文書に記述する。このデフォルトベースラインは、例えば、同一行において最も多くの文字が持つベースラインと等しい。また、このデフォルト文字幅は、例えば、同一行において最も多くの文字が持つ文字幅と等しい。例えば、図6に示されている領域601において、図11に示されているように、ベースラインは、ベースライン1101〜1104、デフォルト文字幅は、例えば、デフォルト文字幅1105となる。ステップS409で配置が決定されたテキストオブジェクトに、ベースライン1101〜1104及びデフォルト文字幅1105を設定した場合、テキストオブジェクトのPDF記述の一部は図13のようになる。なお、図13は、図示を簡単にするため、文書記述例内の一部分を抜き出して例示したものであり、また、<...>で囲まれる部分は文字コードを示している。もし、図13のようなPDF記述をレンダリングした場合、図14のようにレンダリングされることになる。図14では、図11で決定されたデフォルトベースラインとデフォルト文字幅でレンダリングされているので、各文字行は直線状に配置されることになる。
ステップS411は、テキストオブジェクト中の各文字について、CPU101がステップS412〜415の処理を繰り返すためのループ端である。ステップS412〜415のループ処理が終了すると、実施形態1の電子文書が生成されることになる。
ステップS412で、CPU101は、各文字画像オブジェクトの文字幅と当該テキスト領域のデフォルト文字幅との比を求める。図11に示されている領域1106の拡大図を図12に示す。ステップS412では、例えば、文字1201の文字幅1202とテキストオブジェクトのデフォルト文字幅1105の比が求められる。
ステップS413で、CPU101は、テキストオブジェクト中の各文字に対して、ステップS412で得られた文字幅比を設定する。図13に示されているテキストオブジェクト中の文字のそれぞれに文字幅の比を設定したテキストオブジェクトのPDF記述の一部を図15に示す。また、図15の例をレンダリングした場合、図16のようになる。PDF記述例を示す図15において、各文字に設定された文字幅比は、記述子Tj に続く値である。なお、デフォルト文字幅と同じ幅の文字に対しては、文字幅比の記述が省略されている。
ステップS414で、CPU101は、テキストオブジェクト中のベースラインから各文字画像の位置座標への相対位置(ズレ量)を求める。例えば、図12に示されている文字1201について、ステップS410で得られたベースライン1102からの相対位置1203が求められる。
ステップS415で、CPU101は、テキストオブジェクト中の文字のテキストライズとして、ステップS414で求められた相対位置を指定する。図15のようなテキストオブジェクトのPDF記述例に対して、テキストライズを設定すると、図17のようになる。図17のようなテキストオブジェクト記述をレンダリングした場合、図18のようになる。なお、PDF記述例を示す図17において、設定されたテキストライズは、記述子Ts に続く値である。
上記のようにして生成された電子文書は、図19のような画像オブジェクト上に、図18のようなテキストオブジェクトが透明文字として重ねて配置されるように記述されたPDF文書となる。この生成された文書では、テキストオブジェクトの各文字の描画位置は、テキストライズの記述を用いて、ベースラインに対する相対位置として記述されている。
また、このようにして生成された電子文書を表示するソフトウェア(例えば、Adobe社のAcrobat Readerなど)において、単語“センサ”を検索した場合の出力を、図20に示す。以上により、実施形態1では、電子文書を検索した場合に、直立画像上に重ねられた透明文字の文字コードが検索されるので、あたかも直立画像の該当箇所2001が検索されたかのように表示される。
上述したように、本実施形態では、歪み補正された画像を用いて文字認識を行うので、文書画像全体の文字認識率(文字認識精度)を向上させることができる。その一方、表示に用いる画像は歪み補正前の画像(画質劣化のほぼ発生しない回転のみを施した画像)を使用するので、ユーザに不自然さを感じさせるような画質劣化が起きている画像の表示を防ぐことができる。また、テキスト検索時には、歪み補正前の画像上の対応する位置が反転表示されるので、あたかも画像をテキスト検索したかのように扱える。
また、図12の文字1201の位置をそのまま絶対座標で記述してしまうと、当該文字1201はベースライン1102と1103の間にあるので、どちらの文字行に属するのか明確でない。一方、本実施形態では、テキストライズの記述を利用して、文字1201の文字はベースラインからの相対位置で記述しているので、文字1201はベースライン1102の文字行に属する文字であることが明確になっている。すなわち、画像上で同一行に所属する文字列を、電子文書記述上でも一行に所属させるように構成している。よって、別の文字行と判断されて、検索時にヒットしなくなるのを防ぐことができ、また、電子文書内のテキストのコピーと貼り付けのときに正確な改行情報を保持する事ができる。
また、実施形態1ではPDF文書生成の例を示したが、本発明は、PDF以外のフォーマットの電子文書(例えば、XPS(XML Paper Specification)文書)の生成にも適用できる。
また、実施形態1において、文字間隔(水平方向の文字スペーシング量)を、ステップS410で各文字の水平方向の位置座標から求め、電子文書に記述するようにしてもよい。また、この文字間隔は、文字間ごとに求めて記述しても良いし、その平均をデフォルト文字間隔として求めてデフォルト文字間隔を用いて記述するようにしてもよい。
実施形態1に係る電子文書生成装置の概略を示すブロック図である。 実施形態1に係る電子文書生成装置の概略を示すシステム図である。 電子文書生成処理を示すブロック図である。 電子文書生成処理を示すフローチャートの例を示す図である。 入力画像の例の一部を示す図である。 入力画像を回転して得た直立画像の一部を示す図である。 直立画像に歪み補正変換を施して得た歪み補正画像の例の一部を示す図である。 歪み補正画像における計測誤差に基づく歪みの例を示す図である。 歪み補正画像上のテキスト領域の例を示す図である。 図9に示されているテキスト領域から得られたテキストの例を示す図である。 図6の領域601の拡大したものを示す図である。 図11の領域1106の拡大したものを示す図である。 ベースライン及びデフォルト文字幅を設定したテキストオブジェクトのPDF記述例を示す図である。 図13のレンダリング例を示す図である。 図13中の文字のそれぞれに文字幅の比を設定したテキストオブジェクトのPDF記述例を示す図である。 図15のレンダリング例を示す図である。 図15中の文字のそれぞれにテキストライズを設定したテキストオブジェクトのPDF記述例を示す図である。 図17のレンダリング例を示す図である。 生成された電子文書の画像オブジェクトの一部を示す図である。 電子文書を表示するソフトウェアで単語“センサ”を検索した場合の出力を示す図である。
符号の説明
101 CPU
102 ROM
103 RAM
104 外部記憶装置
105 ディスプレイ
106 入力装置
107 ネットワークインターフェース(I/F)

Claims (10)

  1. 画像の歪みを補正することにより補正画像を得る補正手段と、
    前記補正画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る文字認識手段と、
    補正前の画像における各文字行のベースラインを求める手段と、
    前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求める手段と、
    前記補正前の画像上における前記テキストデータの位置を、前記ベースラインからの相対位置で記述した電子文書を生成する生成手段と、
    を備えることを特徴とする電子文書生成装置。
  2. 更に、入力画像を回転させることにより、直立画像を得る回転手段を備え、
    前記補正前の画像は、前記回転手段で得た直立画像であることを特徴とする請求項1に記載の電子文書生成装置。
  3. 前記生成手段は、前記ベースラインからの相対位置で記述されたテキストデータを、前記補正前の画像の上に透明文字として重ねて配置するように記述した電子文書を生成することを特徴とする請求項1または2に記載の電子文書生成装置。
  4. 前記生成手段は、テキストライズの記述を用いて前記ベースラインからの相対位置を記述したテキストデータを含む電子文書を生成することを特徴とする請求項1乃至3のいずれかに記載の電子文書生成装置。
  5. 前記補正画像に含まれる各文字画像の位置座標を歪み補正逆変換することにより、前記補正前の画像における各文字画像の位置座標を求める逆変換手段を、更に備え、
    前記逆変換手段で求めた前記補正前の画像における各文字画像の位置座標に基づいて、前記ベースラインからの相対位置を求めることを特徴とする請求項1乃至4のいずれかに記載の電子文書生成装置。
  6. 前記文字画像のデフォルト文字幅を求める手段と、
    前記補正前の画像における各文字画像の文字幅と前記デフォルト文字幅との比を求める手段と、を更に備え、
    前記生成手段は、前記補正前の画像上におけるテキストデータの位置を、前記ベースラインからの相対位置で記述し、更に、前記デフォルト文字幅との比を用いて文字幅を記述したテキストデータを含む電子文書を生成することを特徴とする請求項1乃至5のいずれかに記載の電子文書生成装置。
  7. 前記生成手段で生成される電子文書は、PDF文書であることを特徴とする請求項1乃至6のいずれかに記載の電子文書生成装置。
  8. 補正手段が、画像の歪みを補正することにより補正画像を得る補正ステップと、
    文字認識手段が、前記補正画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る文字認識ステップと、
    生成手段が、補正前の画像における各文字行のベースラインを求め、
    前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求め、
    前記補正前の画像上における前記テキストデータの位置を、前記ベースラインからの相対位置で記述した電子文書を生成する生成ステップと、
    を備えることを特徴とする電子文書生成方法。
  9. コンピュータを、請求項1乃至7のいずれかに記載されている各手段として機能させるためのコンピュータプログラム。
  10. コンピュータを、請求項1乃至7のいずれかに記載されている各手段として機能させるためのコンピュータプログラムを格納したコンピュータ読取可能な記憶媒体。
JP2008037774A 2008-02-19 2008-02-19 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 Expired - Fee Related JP4902568B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2008037774A JP4902568B2 (ja) 2008-02-19 2008-02-19 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体
KR1020090010901A KR101018310B1 (ko) 2008-02-19 2009-02-11 전자 문서 생성장치, 전자 문서 생성방법, 및 기억매체
EP09152544.4A EP2093994B1 (en) 2008-02-19 2009-02-11 Electronic document producing device, electronic document producing method and storage medium
US12/388,417 US8532386B2 (en) 2008-02-19 2009-02-18 Electronic document producing device, electronic document producing method and storage medium
CN2009100065630A CN101515984B (zh) 2008-02-19 2009-02-19 电子文档生成设备及电子文档生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008037774A JP4902568B2 (ja) 2008-02-19 2008-02-19 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体

Publications (3)

Publication Number Publication Date
JP2009200622A true JP2009200622A (ja) 2009-09-03
JP2009200622A5 JP2009200622A5 (ja) 2011-04-07
JP4902568B2 JP4902568B2 (ja) 2012-03-21

Family

ID=40405096

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008037774A Expired - Fee Related JP4902568B2 (ja) 2008-02-19 2008-02-19 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体

Country Status (5)

Country Link
US (1) US8532386B2 (ja)
EP (1) EP2093994B1 (ja)
JP (1) JP4902568B2 (ja)
KR (1) KR101018310B1 (ja)
CN (1) CN101515984B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201053A (zh) * 2010-12-10 2011-09-28 上海合合信息科技发展有限公司 一种文本图像的切边方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010109448A (ja) 2008-10-28 2010-05-13 Canon Inc 画像処理方法及び画像読取装置
JP5195882B2 (ja) * 2010-12-01 2013-05-15 コニカミノルタビジネステクノロジーズ株式会社 電子文書生成システム、電子文書生成方法およびプログラム
KR101294306B1 (ko) * 2011-06-09 2013-08-08 엘지전자 주식회사 휴대 전자기기 및 이의 제어방법
CN105225218B (zh) * 2014-06-24 2018-12-21 佳能株式会社 用于文档图像的畸变校正方法和设备
CN105654082B (zh) * 2014-11-12 2019-04-12 佳能株式会社 字符识别后处理方法、设备及包括该设备的图像拾取设备
CN106156766B (zh) 2015-03-25 2020-02-18 阿里巴巴集团控股有限公司 文本行分类器的生成方法及装置
CN105302626B (zh) * 2015-11-09 2021-07-23 深圳市巨鼎医疗股份有限公司 Xps结构化数据的解析方法
JP2017187988A (ja) * 2016-04-07 2017-10-12 東芝テック株式会社 コード認識装置
CN110807454B (zh) * 2019-09-19 2024-05-14 平安科技(深圳)有限公司 基于图像分割的文字定位方法、装置、设备及存储介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4251799A (en) * 1979-03-30 1981-02-17 International Business Machines Corporation Optical character recognition using baseline information
JPS6065668A (ja) 1983-09-20 1985-04-15 Ricoh Co Ltd 画像処理方式
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
JP3186246B2 (ja) 1992-09-24 2001-07-11 株式会社日立製作所 文書読取装置
EP0625757B1 (en) 1993-05-07 2000-08-23 Canon Kabushiki Kaisha Selective document retrieval method and system
EP0677812B1 (en) 1994-04-15 2001-11-21 Canon Kabushiki Kaisha Document storage and retrieval system
EP0710003B1 (en) * 1994-10-25 2001-08-16 Canon Kabushiki Kaisha Copier apparatus capable of rotating an image
JP3113814B2 (ja) * 1996-04-17 2000-12-04 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 情報検索方法及び情報検索装置
JP2000322417A (ja) 1999-05-06 2000-11-24 Canon Inc 画像ファイリング装置及び方法及び記憶媒体
JP2002077578A (ja) 2000-08-30 2002-03-15 Minolta Co Ltd 歪み補正装置およびその方法ならびに歪み補正プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002108940A (ja) 2000-09-29 2002-04-12 Toshiba Corp 情報検索方法及び情報検索装置
JP2002358514A (ja) * 2000-12-14 2002-12-13 Ricoh Co Ltd 画像歪み補正装置、プログラム、記憶媒体、画像歪み補正方法、画像読取装置および画像形成装置
GB0104664D0 (en) * 2001-02-23 2001-04-11 Hewlett Packard Co Improvements relating to document capture
US6996290B2 (en) * 2002-01-31 2006-02-07 Hewlett-Packard Development Company, L.P. Binding curvature correction
US20050129333A1 (en) * 2002-09-30 2005-06-16 Yoshiyuki Matsuyama Image correction device and image correction method
JP4136860B2 (ja) 2003-02-20 2008-08-20 株式会社リコー 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム
US7602995B2 (en) 2004-02-10 2009-10-13 Ricoh Company, Ltd. Correcting image distortion caused by scanning
JP4760362B2 (ja) * 2005-12-21 2011-08-31 三菱電機株式会社 文字読取装置
US7903876B2 (en) * 2007-02-27 2011-03-08 Seiko Epson Corporation Distortion correction of a captured image

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201053A (zh) * 2010-12-10 2011-09-28 上海合合信息科技发展有限公司 一种文本图像的切边方法
CN102201053B (zh) * 2010-12-10 2013-07-24 上海合合信息科技发展有限公司 一种文本图像的切边方法
US9082192B2 (en) 2010-12-10 2015-07-14 Intsig Information Co., Ltd Text image trimming method

Also Published As

Publication number Publication date
US8532386B2 (en) 2013-09-10
EP2093994B1 (en) 2016-05-04
KR20090089793A (ko) 2009-08-24
KR101018310B1 (ko) 2011-03-04
US20090297027A1 (en) 2009-12-03
CN101515984B (zh) 2011-08-17
CN101515984A (zh) 2009-08-26
EP2093994A1 (en) 2009-08-26
JP4902568B2 (ja) 2012-03-21

Similar Documents

Publication Publication Date Title
JP4902568B2 (ja) 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体
JP6119992B2 (ja) 画像処理装置およびコンピュータプログラム
JP5789719B2 (ja) 電子文書の表示モードを確定するための方法と装置
JP4631900B2 (ja) 情報処理装置、情報処理システム、および情報処理プログラム
JP2004192307A (ja) 類似画像抽出装置、類似画像抽出方法および類似画像抽出プログラム
CN109658334B (zh) 一种古籍图像拼接方法及装置
JP5927942B2 (ja) 画面生成装置、画面生成システム及び画面生成プログラム
US8712111B2 (en) Image processing apparatus
JP4177325B2 (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP2010066865A (ja) 差分抽出装置及び差分抽出プログラム
JP6194781B2 (ja) 画像処理装置及びプログラム
CN113157275B (zh) 帧动画的渲染方法、装置、电子设备及存储介质
JP2006237858A (ja) 画像処理装置、画像処理方法、その方法をコンピュータに実行させるプログラム、および記録媒体
JP2007011529A (ja) Ocr処理における文字認識位置の決定方法
JP2004054898A (ja) 印刷データ生成装置、印刷データ生成方法およびそのプログラム
JP6414475B2 (ja) コンピュータプログラム及び制御装置
JP5208043B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2021141497A (ja) 画像処理システム
JP6413450B2 (ja) 画像処理装置、画像形成装置およびプログラム
US20100104131A1 (en) Document processing apparatus and document processing method
KR20210066426A (ko) 소정 형식의 데이터 및 데이터가 나타내는 정보를 포함하는 인쇄물의 수정 및 출력
JP2007213325A (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
WO2000075869A1 (en) Image processing method
JP2004272415A (ja) 光学読取装置
JP2021005753A (ja) 画像処理装置及び方法、並びに画像表示装置

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20101106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111228

R151 Written notification of patent or utility model registration

Ref document number: 4902568

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150113

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees